ES2204730T3 - Procedimiento y dispositivo para la determinacion de la calidad de una señal. - Google Patents

Procedimiento y dispositivo para la determinacion de la calidad de una señal.

Info

Publication number
ES2204730T3
ES2204730T3 ES00983281T ES00983281T ES2204730T3 ES 2204730 T3 ES2204730 T3 ES 2204730T3 ES 00983281 T ES00983281 T ES 00983281T ES 00983281 T ES00983281 T ES 00983281T ES 2204730 T3 ES2204730 T3 ES 2204730T3
Authority
ES
Spain
Prior art keywords
signal
function
quality
time
formation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00983281T
Other languages
English (en)
Inventor
Andries Pieter Hekstra
John Gerard Beerends
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke KPN NV
Original Assignee
Koninklijke KPN NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke KPN NV filed Critical Koninklijke KPN NV
Application granted granted Critical
Publication of ES2204730T3 publication Critical patent/ES2204730T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Otolaryngology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

Procedimiento para determinar, de conformidad con una técnica de medida objetiva, la calidad de una señal de salida (X(t)) de un sistema de tratamiento de señales con respecto a una señal de referencia (Y(t)), cuyo procedimiento comprende las etapas principales siguientes que consiste en: - tratar la señal de salida (X(t)) y generar una primera señal de representación (R(X)), - tratar la señal de referencia (Y(t)) y producir una segunda señal de representación (R(Y)) y - combinar la primera señal de representación (R(X)) y la segunda señal de representación (R(Y)) para formar una señal de calidad (Q) independiente en el tiempo, comprendiendo la etapa principal de la combinación las siguientes etapas que consisten en: - determinar una señal diferencial (D(t)) en función del tiempo y - promediar la señal diferencial (D(t)) en el tiempo y obtener la señal de calidad (Q) independiente del tiempo, caracterizado porque la etapa de formación de la media en el tiempo comprende: - una primera subetapa para determinar, durante cada intervalo (Ti) de una serie de intervalos de tiempos sucesivos (T1-Tn) en la duración (Ttot) de la señal diferencial (D(t)) de las primeras medias (Lp1(D)) de la señal (D(t)) de conformidad con una primera función de formación de la media y - una segunda subetapa que consiste en determinar en el período de duración (Ttot) un segundo valor medio de la señal a partir de los primeros valores medios (Lp1(D) de la señal de conformidad con una segunda función de formación de la media diferente de la primera función de formación de la media, incluyendo la señal de calidad (Q) la segunda media de la señal.

Description

Procedimiento y dispositivo para la determinación de la calidad de una señal.
A. Antecedentes de la invención
La invención está dentro del ámbito de la medición de calidad de señales acústicas, tales como señales de audio y voz. Más concretamente se refiere a un procedimiento y un dispositivo para determinar, de acuerdo con una técnica de medición objetiva, la calidad de una señal de salida a partir de un sistema de tratamiento de la señal, con respecto a una señal de referencia de conformidad con el preámbulo de la reivindicación 1 y reivindicación 7, respectivamente. Un procedimiento y un dispositivo de dicho tipo se conocen, por ejemplo, de las referencias [1 - 6] (para más detalles bibliográficos sobre las referencias, véase a continuación el apartado C, Referencias). Según la presente técnica conocida, una señal de salida procedente de un sistema de tratamiento y/o transporte de señales de audio o voz, cuya calidad de la señal tiene que determinarse, y una señal de referencia, son objeto de correlación en señales de representación de conformidad con un modelo de percepción física del oído humano. Como señal de referencia, puede utilizarse una señal de entrada del sistema aplicada con la señal de salida obtenida, como se indica en las referencias [1 - 5]. No obstante, como una señal de referencia tal como, por ejemplo, se indica en la referencia [6], puede aplicarse también una estimación de la señal de entrada original, reconstruida a partir de la señal de salida. Posteriormente, se determina una señal diferencial como una función del tiempo a partir de dichas señales de representación que, según el modelo utilizado, es representativa de una perturbación sostenida en el sistema presente en la señal de salida. La señal diferencial dependiente del tiempo, en lo sucesivo referida también como una señal de perturbación, puede ser una señal de diferencia o una señal de ratio o también una combinación de ambas, y constituye una expresión dependiente del tiempo para la magnitud en la que, según el modelo de representación, la señal de salida se desvía respecto a la señal de referencia. Por último, la señal de perturbación se promedia en el tiempo, obteniéndose una señal de calidad independiente del tiempo, que es una medida de la calidad de la percepción auditiva de la señal de salida.
Es un fenómeno conocido que, cuando se escucha una señal de audio, una perturbación corta tiene ya una influencia significativa sobre la percepción de la calidad de la señal completa. Esto se aplica no solamente a las palabras habladas y a la música, sino también, en general, para la reproducción de señales acústicas. A la aplicación de la promediación en tiempo lineal habitual, en tales casos existe una correlación deficiente entre la percepción de la calidad humana y la señal de calidad obtenida por medio de la técnica de medición. La aplicación del "media cuadrática" como una función de promediación en el tiempo proporciona supuestamente alguna mejora, pero también aquí la correlación es todavía demasiado baja para un buen funcionamiento del procedimiento objetivo.
B. Resumen de la invención
El objeto de la invención es, entre otras cosas, proporcionar un procedimiento y un dispositivo del tipo anterior, con el que pueda conseguirse una alta correlación entre la percepción de la calidad humana de una señal de salida y una señal de calidad obtenida por medio de la técnica de medición, especialmente en casos en donde se produzca el anterior fenómeno. Consideraciones sobre las que se basan la invención son las siguientes. La promediación en el tiempo lineal a la que se hizo referencia con anterioridad y la "media cuadrática" son realmente casos especiales de la función de p-promediación de Lebesgue o Lebesgue p-norm (norma Lp) para p=1 y p=2, respectivamente. Para esta función norma se aplica que para una p creciente el valor de la norma se aproxima todavía más al máximo de la función f dentro del intervalo. El efecto de aplicar la norma Lp como una función de promediación sobre la señal de perturbación es, por lo tanto, que, en el caso de una p creciente, los más altos valores de la señal de perturbación durante el intervalo de promediación se consideran todavía de manera más dominante en el resultado de la promediación.
En la presente técnica de la medición de la calidad, es habitual utilizar señales de prueba de sentencias habladas que comprenden dos sentencias o partes de sentencias y que tarda unos 10 segundos. En este caso, puede reconocerse que, en el supuesto de palabras habladas, una sílaba (que tenga una duración media de aproximadamente 0,3 s) no es inteligible cuando, en la señal de voz, se perturba parte de la sílaba. Esto significa que, en una señal de perturbación que comprende una parte de señal que forma una representación de una señal de perturbación de dicha sílaba perturbada, dicha fracción de señal puede ser localmente sustituida por un valor de señal promediado que supere un valor de señal obtenido mediante una promediación lineal, con el objeto de extraer información importante para la determinación de la calidad. Dicho valor de señal medio más alto puede obtenerse, por ejemplo, aplicando una norma Lp que tenga un valor p relativamente alto en dicha fracción de la señal. Sin embargo, al nivel de sentencia, una segunda sentencia o parte de ella sigue siendo inteligible, si solamente la inteligibilidad de una primera sentencia precedente (o parte de ella, es aceptada por la perturbación, de tal manera que para la promediación en el tiempo puede aplicarse una función de promediación en correspondencia con, o al menos desviarse menos de, la promediación lineal, tal como, por ejemplo, una norma Lp que tenga una p relativamente baja, por ejemplo, p=1 o p=2.
La propia idea de la invención, que es también aplicable más en general a señales de audio arbitrarias, incluye ahora la aplicación, en lugar de la promediación en el tiempo singular conocida, de una promediación en el tiempo de 2 etapas o dual. Dicha promediación en el tiempo de 2 etapas comprende dos subetapas: una primera en donde la señal de perturbación dependiente del tiempo obtenida en la fase de combinación se somete, primero al nivel local, por ejemplo, durante intervalos de tiempo relativamente pequeños, a una primera función de promediación, obteniéndose un valor medio para el primer intervalo de tiempo y una segunda subetapa en la que los valores medios obtenidos e la primera subetapa se someten a una segunda función de promediación en la duración completa de la señal. La primera función de promediación difiere de la segunda función de promediación y se desvía más con respecto a la promediación lineal que a la segunda función de promediación.
Según la función, el procedimiento y el dispositivo de la clase anterior tienen la característica de la reivindicación 1 y la característica de la reivindicación 6, respectivamente.
En primeras realizaciones preferentes del procedimiento y el dispositivo, se aplican funciones de promediación que están basadas en una norma Lp, a saber, en la primera subetapa una norma Lp que tiene un valor p relativamente alto y en la segunda subetapa, una norma Lp que tiene un valor p relativamente bajo. Para esta finalidad, el procedimiento y el dispositivo están preferentemente caracterizados según las reivindicaciones 3 y 7, respectivamente.
En las reivindicaciones subordinadas se resumen otras realizaciones preferentes del procedimiento y el dispositivo según la invención.
C. Referencias
[1] Beerends J.G., Stemerdink J.A., "Una medida de la calidad de audio perceptual basada en una representación del sonido psicoacústica", J. Audio Eng. Soc., Vol. 40, Nº12, dic. 1992, páginas 963-978;
[2] WO-A-96/28950;
[3] WO-A-96/28952;
[4] WO-A-96/28953;
[5] WO-A-97/44779;
[6] WO-A-96/06496.
D. Breve descripción de los dibujos
La invención se describirá a continuación con más detalle a través de una descripción de una realización a modo de ejemplo, haciendo referencia a un dibujo que comprende las figuras siguientes:
la Figura 1 ilustra, de manera esquemática, un dispositivo conocido para determinar la calidad de una señal acústica;
la Figura 2 ilustra, en las partes (a), (b) y (c), representaciones gráficas para una mejor explicación de la etapa de promediación en el tiempo en el procedimiento según la invención: en la parte (a), una representación gráfica que tiene un ejemplo de una señal de perturbación como una función del tiempo, descompuesta en subseñales por intervalo; en la parte (b), una representación gráfica de valores de señales medias de las subseñales por intervalo obtenido en una primera subetapa de la etapa de promediación en el tiempo y en la parte (c), una representación gráfica de varios valores de la señal de calidad obtenidos en una segunda subetapa de la etapa de promediación en el tiempo;
la Figura 3 ilustra, de manera esquemática, un dispositivo de promediación en el tiempo modificado según la invención para su aplicación en un dispositivo según se ilustra en la FIGURA 1.
E. Descripción de una realización a modo de ejemplo
La Figura 1 ilustra, de manera esquemática, un dispositivo de medición conocido para determinar la calidad de una señal acústica. El dispositivo de medición comprende un procesador de señales 10 que tiene entradas de señales 11 y 12 y que tiene salidas de señal acopladas, a modo de acoplamiento de señales 13 y 14, para las entradas de señal de un dispositivo combinador 15. El dispositivo combinador 15 está provisto de una salida de señal que, a través de un acoplamiento de señales 16, se acopla a una entrada de señal de un dispositivo de promediación en el tiempo 17. Este dispositivo de promediación en el tiempo 17 está provisto de una salida de señal 18 que constituye, además, la salida del dispositivo de medición.
Dicho dispositivo de medición conocido funciona, en términos generales, como sigue. En las entradas de señales 11 y 12 del procesador de señal 10, se ofrecen una señal de entrada X(t), de la cual se va a determinar la calidad de la señal y una señal de referencia Y (t), respectivamente. La señal de entrada X(t) es una señal de salida de un sistema de procesamiento y/o transporte de señales de audio o voz (no ilustrado), cuya calidad de tratamiento y transporte de las señales se va a investigar. El procesador de señales 10 procesa las señales X(t) e Y(t) y genera señales de representación R(X) y R(Y), que forman representaciones de las señales ofrecidas X(t) e Y(t) según el modelo de percepción del oído humano existente en (el hardware y/o software de) el procesador de señales. En la mayoría de los casos, las señales de representación son funciones del tiempo y la frecuencia (escala de Hz o escala Bark). Las señales de representación R(X) y R(Y) se hacen pasar a través, por el procesador de señales 10 por medio de los acoplamientos de señales 13 y 14, respectivamente, al dispositivo combinador 15. En el dispositivo combinador 15, bajo la ejecución de varias operaciones sobre las señales de representación, tal como comparación, puesta en escala, determinación de una señal de relación o una señal diferencia absoluta y la integración sobre la frecuencia, se genera una señal de perturbación dependiente del tiempo D(t), que se ofrece al dispositivo de promediación en el tiempo 17 a través del acoplamiento de señales 16. En el dispositivo de promediación en el tiempo, la señal de perturbación D(t) se promedia en el tiempo realizando una integración de conformidad con el tiempo de duración de la señal, estando disponible el resultado de dicha combinación en el tiempo, como una señal de calidad Q, en la salida de la señal 18 del dispositivo de promediación en el tiempo. La señal de calidad independiente del tiempo Q constituye una medida para la calidad de la percepción auditiva de la señal X(t). Puesto que una promediación en el tiempo, siendo habitual la promediación en el tiempo lineal, es decir, la integración de la señal de perturbación D(t) en el tiempo, dividida por la duración del tiempo total de la señal (véase, por ejemplo, Apéndice F de la Referencia [1], páginas 977/8). Sin embargo, mediante dicha promediación en el tiempo son promediadas breves perturbaciones en una señal acústica, que pueden tener un efecto significativo sobre la percepción de la calidad de la señal completa. En casos en que tenga lugar, puede establecer una correlación deficiente entre la percepción de la calidad humana y la señal de calidad obtenida a través de la técnica de medición. En el supuesto de aplicar la "media cuadrática" como una función de promediación en el tiempo, se obtiene una correlación, que es todavía demasiado baja para una segunda operación del procedimiento objetivo.
La promediación en el tiempo lineal y la "media cuadrática" son realmente casos concretos de la función de
\hbox{p-promediación}
de Lebesgue o norma p de Lebesgue (norma Lp):
(1)L_{p}(f)=||f||_{p}=\left(_{(a.b)}\int|f(\mu)|^{p}d\mu] \right)^{1/p}
para una función f integrable durante un intervalo concreto (a, b) que tiene una medida \mu y:
(2)L_{p} (f) =||f||_{p}=\left( _{(a.b)}\sum\limits^{n}_{i=1}\frac{1}{n}|f(x_{i})| ^{p} \right)^{1/p}
para una función f definida en n puntos discretos x_{i} (i=1,-,n) en el intervalo (a, b) para p=1 y p=2, respectivamente. Para dicha norma, se aplica que para una p creciente, el valor de la norma se aproxima todavía más al máximo f_{máx} de la función f dentro del intervalo y que en el límite para p\rightarrow\infty, se aplica que L_{\infty}(f)=f_{máx}. El efecto de aplicar dicha función norma como una función de promediación en (parte de) una señal de perturbación por lo tanto es que, para una p creciente, los valores más altos de la señal de perturbación durante el intervalo de promediación se consideran todavía más dominantes en el resultado de la promediación. En la norma Lp se suele aplicar que p \in R. Sin embargo, dentro del contexto de la presente invención p \in R_{(+)} es más sensible.
Para evitar promediar la influencia de perturbaciones relativamente cortas en la señal de calidad final, la etapa de promediación en el tiempo se realiza en dos subetapas, que se explican con referencia a la Figura 2. En dichas dos subetapas, se aplican dos funciones de promediación diferentes a la señal de perturbación una tras otra, que se eligen de manera que la primera función de promediación, en la primera subetapa, dé lugar a la segunda función de promediación. En general, dichos pares de funciones de promediación se aplican a la señal de perturbación una tras otra, que se eligen de tal manera que la primera función de promediación, en la primera subetapa, tenga valores (señal) más altos de la señal de perturbación a través de un intervalo de promediación más dominantemente considerado en el resultado de la promediación que la segunda función de promediación. En general, dichos pares de funciones de promediación pueden determinarse mediante una selección individual, por ejemplo, utilizando la simulación. Cuando se aplica la norma Lp como una función de promediación puede determinarse mediante selección individual, por ejemplo, utilizando la simulación. Cuando se aplica la norma Lp como una función de promediación, solamente se requiere en la primera subetapa para elegir una norma Lp que tenga un valor p que sea, por ejemplo, varias veces mayor que el valor p de la norma Lp aplicada en la segunda subetapa. Puesto que la norma Lp está basada en una forma concreta de funciones convexas, a saber, la función g(x)=|x|^{p} para p=1, 2,…, que tenga como su función inversa g^{1}(x)=|x|^{1/p}, puede esperarse que, en el caso general de funciones convexas, puedan encontrarse otros pares adecuados. A continuación se asocian más formas generales de las fórmulas (1) y (2) para la norma o función de promediación:
(1a)L_{g}(f)=||f||_{g}=g^{-1}\left(_{(a.b)}\int g(|f(\mu)|)d\mu\right)
y
(2a)L_{g}(f)=||f||_{g}=g^{-1}\left(_{(a.b)}\sum\limits^{n}_{i=1}\frac{1}{n} g(|f(x_{i})|)\right)
Funciones adecuadas, sobre las que pueden basarse las funciones de promediación en la primera y segunda etapas de promediación son, p.e., g_{1}(x) = exp(px) con p=1, 2,…, que tiene como su función inversa g^{1}_{-1} (x)=p^{-1}|n(x) en la primera etapa, en combinación con en la segunda etapa g_{2}(x)=|x| de g_{2}(x)=|x|^{2} . Por lo tanto, debe señalarse que, aunque en la descripción adicional para mayor claridad se utiliza solamente la norma Lp como una función de promediación, esto no significa que la invención esté limitada a esta finalidad.
En la parte (a) de la Figura 2, se ofrece un ejemplo de una señal de perturbación D(t) como una función del tiempo, siendo el tiempo representado a lo largo del eje horizontal y (la intensidad de) la señal D(t) se representa a lo largo del eje vertical. En una primera subetapa, la duración de tiempo total T_{tot} de la señal D(t) se descompone primero en n intervalos T_{i} (i=1-n) de duraciones preferentemente iguales T_{int} y la señal D(t) adecuadamente descompuesta en partes de señales que tienen una parte de señal D_{i}(t) por intervalo T_{i}. Posteriormente, en cada intervalo T_{i} (i=1-n), se determina una media en el tiempo de conformidad con la norma Lp (véase fórmula {1}) de la parte de señal
D_{i}(t) en un primer valor p relativamente alto p_{1} (p.e., p_{1} = 6). A este efecto, debe resaltarse que solamente, a modo de ejemplo se ha representado la señal de perturbación D(t) como una función continua. Es habitual que la señal D(t) se haga disponible como una función discreta en el tiempo a la salida del dispositivo combinador 15 en la forma de una hilera de valores secuenciales en el tiempo, por ejemplo, doce por intervalo de tiempo, que puede interpretarse como puntos de muestreo de una función continua. En este caso, la norma Lp se determina utilizando la fórmula {2}. Los valores de las medias en el tiempo, L_{p1}(D_{i}) para i=1-n, se representan para cada intervalo T_{i} en la parte (b) de la Figura 2, designada por un guión horizontal corto 21. Con miras a las comparaciones, en cada intervalo están también representados valores de las medias en el tiempo para p_{1}=1 y p_{1}=\infty, p.e., L_{1}(D_{i}) y L_{\infty}(D_{i}), respectivamente, designada por un guión horizontal largo 22 y por un punto 23.
En una segunda subetapa, la norma L_{p} de los valores L_{p1}(D_{i}) determinados por intervalo T_{i} durante el período de tiempo total de duración T_{tot} según la fórmula {2} con un segundo valor p relativamente bajo p_{2}<p_{1} (p.e., p_{2}=1 ó 2) que da lugar a la señal de calidad Q. La parte (c) de la Figura 2 ilustra el valor medio a través de los n intervalos de conformidad con la norma L_{p2} para p_{2}=1 de los valores L_{p1}(D_{i}), L_{1}(D_{i}) y L_{\infty}(D_{i}), respectivamente designados por un guión horizontal corto 24, por un guión horizontal largo 25 y por un punto 26. El valor de Q según se designa por el guión 25, y por lo tanto obtenido a través de una promediación de 2 etapas con valores de p tales que p_{1}=p_{2}=1, corresponde prácticamente al valor obtenido por medio de la promediación en el tiempo singular conocida, en donde se aplica la norma L_{1}. Esto significa que la mejora de la correlación considerada por la invención puede conseguirse solamente si se cumple p_{1}>p_{2}.
Si es simple, en la primera subetapa, determinar el máximo de las partes de señal D_{i}(t) en cada intervalo T_{i}, por ejemplo, se elige p_{i}=_{-}. En la segunda subetapa, la elección de p_{2}=1 es la más simple.
Debe entenderse que, cuando se utiliza dicha promediación en el tiempo de 2 etapas, el efecto de breves perturbaciones sobre la señal de calidad sigue siendo significativo. Para las señales de prueba sobre palabras habladas, una duración total T_{tot} de aproximadamente 10 segundos es significativa, siendo posible suponer para T_{int}, la duración media de una sílaba hablada, es decir, aproximadamente 0,3 segundos.
Aparte de la variación del valor de p, particularmente en la primera subetapa, el efecto de breves perturbaciones puede manipularse también por una elección adecuada de la duración del intervalo de tiempo T_{i}, por ejemplo, como una función de la clase de señal, por ejemplo, palabras habladas o música, o de la clase de señal, lenta o rápida, pero también como una función del tipo de sistema de procesamiento y/o transporte de señales de audio o voz del que X(t) es la señal de salida. Se ha mencionado ya anteriormente que, en el caso de una señal de prueba con palabras habladas, la duración media de una sílaba es aproximadamente 0,3 segundos. Dicha media, sin embargo, puede variar considerablemente en el caso de frases pronunciadas deliberadamente lentas o rápidas, según pueda ser el caso. Algo similar puede aplicarse a las señales musicales que tengan un ritmo lento o rápido, según pueda ser el caso.
Otra opción de manipular el efecto de breves perturbaciones es eligiendo los intervalos solapantes, como resultado de los cuales el efecto de perturbaciones breves, que están presentes exactamente en los límites de los intervalos, son mejor tenidas en cuenta. Dicho solapamiento es, por ejemplo, del 10%, comenzando el siguiente intervalo T_{i+1} en 0,9 del intervalo T_{i} o también 50%, comenzando ya el siguiente intervalo T_{i+1} a mitad de camino del intervalo T_{i}.
Cuando se escucha una señal acústica, la parte de la señal acústica más recientemente oída suele tener un mayor efecto sobre la percepción de la calidad que la primera parte oída de la misma. Para expresar mejor dicho efecto en la señal de calidad también, en la segunda subetapa puede aplicarse una media ponderada haciendo uso de una función de ponderación w(t), discreta o no, tal como una función de crecimiento monótono, a cualquier régimen no decreciente, que tenga valores comprendidos entre 0 y 1 durante el período de la señal total T_{tot} para la cual, por ejemplo, se aplica:
0 \leq w(t)\leq \ ^{1}/_{2} \ para \ 1 \leq \ ^{1}/_{2} \ T_{tot},
y
^{1}/_{2} \leq w(t)\leq 1 \ para \ ^{1}/_{2} \ T_{tot} \leq t\leq T_{tot},
asignándose a cada intervalo T_{1} un peso de ponderación w_{i} que es igual a, por ejemplo, el máximo de w(t) en el intervalo T_{i}. A este respecto, la función norma de la fórmula {2} se ajusta a:
(2')L_{p}(f)=||f||_{p}=\left(\frac{\sum\limits^{n}_{i=1}|f(x_{i})|^{p}w_{i}}{\sum\limits^{n}_{i=1}w_{i}}\right)^{1/p}
El dispositivo de promediación en el tiempo 17, tal como se ilustra de manera esquemática en la Figura 3, según la invención, consiste en dos elementos de promediación 31 y 32. Un primer elemento de promediación 21 recibe, a través del acoplamiento de señales 16, la señal de perturbación D(t) desde el dispositivo combinador 15 y procesa dicha señal recibida de conformidad con la primera subetapa anteriormente descrita. En ella, la señal D(t) se descompone primero durante n intervalos T_{i} con i=1-n de la duración total de la señal T_{tot} de la señal D(t) en n subseñales D_{i}(t), que son posteriormente convertidas en una hilera secuencial en el tiempo de valores de la señal promediados en el tiempo L_{p1}(D_{i}), determinado por el intervalo de tiempo Ti utilizando una norma Lp que tenga el valor p_{1} relativamente alto. Dicha hilera de valores de señal L_{p1}(D_{i}) se hace pasar, a través de un acoplamiento de señales 33, al segundo elemento de promediación 32. El segundo elemento de promediación determina, a partir de dicha hilera de valores de señal medios L_{p1}(D_{i}), un valor de señal promedio L_{p2}(L_{p1}(D)) según una norma Lp que tenga un valor p relativamente bajo p_{2} según la fórmula {2} ó {2'}. El valor de la señal promedio L_{p2}(L_{p1}(D)) es posteriormente entregado, mediante el segundo elemento de promediación 32, como determine la señal de calidad Q, a la salida de señal 18 del dispositivo de promediación en el tiempo.

Claims (9)

1. Procedimiento para determinar, de conformidad con una técnica de medida objetiva, la calidad de una señal de salida (X(t)) de un sistema de tratamiento de señales con respecto a una señal de referencia (Y(t)), cuyo procedimiento comprende las etapas principales siguientes que consiste en:
-
tratar la señal de salida (X(t)) y generar una primera señal de representación (R(X)),
-
tratar la señal de referencia (Y(t)) y producir una segunda señal de representación (R(Y)) y
-
combinar la primera señal de representación (R(X)) y la segunda señal de representación (R(Y)) para formar una señal de calidad (Q) independiente en el tiempo,
comprendiendo la etapa principal de la combinación las siguientes etapas que consisten en:
-
determinar una señal diferencial (D(t)) en función del tiempo y
-
promediar la señal diferencial (D(t)) en el tiempo y obtener la señal de calidad (Q) independiente del tiempo,
caracterizado porque
la etapa de formación de la media en el tiempo comprende:
-
una primera subetapa para determinar, durante cada intervalo (T_{i}) de una serie de intervalos de tiempos sucesivos (T_{1}-T_{n}) en la duración (T_{tot}) de la señal diferencial (D(t)) de las primeras medias (L_{p1}(D)) de la señal (D(t)) de conformidad con una primera función de formación de la media y
-
una segunda subetapa que consiste en determinar en el período de duración (T_{tot}) un segundo valor medio de la señal a partir de los primeros valores medios (L_{p1}(D) de la señal de conformidad con una segunda función de formación de la media diferente de la primera función de formación de la media, incluyendo la señal de calidad (Q) la segunda media de la señal.
2. Procedimiento según la reivindicación 1, caracterizado porque la primera función de formación de la media es una función de formación de la media en la cual valores más elevados de señales están presentes, de una manera más dominante, en el resultado de formación de la media que en la segunda función de formación de la media.
3. Procedimiento según la reivindicación 2, caracterizado porque las primera y segunda funciones de formación de la media son funciones de conformidad con la media sobre p de Lebesgue, que tiene valores Lp respectivos p1 y p2 que difieren uno del otro, con p1>p2.
4. Procedimiento según la reivindicación 3, caracterizado porque se tiene p1 =\infty y p2=1.
5. Procedimiento según una cualquiera de las reivindicaciones precedentes 1 a 4, caracterizado porque los intervalos de tiempo (T_{1}-T_{n}), en el momento de la primera subetapa, son intervalos que se solapan.
6. Procedimiento según una cualquiera de las reivindicaciones precedentes 1 a 5, caracterizado porque la función de formación de la media de la segunda subetapa comprende una formación de media ponderada.
7. Dispositivo para determinar, de conformidad con una técnica de medida objetiva, la calidad de una señal de salida (X(t)) en un sistema de tratamiento de señales en relación con una señal de referencia (Y(t)), cuyo dispositivo comprende:
-
un primer dispositivo de tratamiento de señales (10) para tratar la señal de salida (X(t)) y generar una primera señal de representación (R(X));
-
un segundo dispositivo de tratamiento de señales (10) para tratar la señal de referencia (Y(t)) y producir una segunda señal de representación (R(Y)) y
-
un circuito de combinación (15, 17) que sirve para combinar la primera señal de representación (R(X)) y la segunda señal de representación (R(Y)) y obtener una señal de calidad (Q) independiente del tiempo,
cuyo circuito de combinación (15, 17) comprende un dispositivo diferencial (15) que sirve para determinar una señal diferencial (D(t)) en función del tiempo y un dispositivo de formación de la media (17) para obtener la señal de calidad (Q) independiente del tiempo,
\newpage
caracterizado porque
el dispositivo de formación de la media (17) comprende un primer elemento de formación de la media (31) para determinar, durante cada intervalo de tiempo (T_{i}) de una serie de intervalos de tiempos sucesivos (T_{1}-T_{n}) con respecto a la duración (T_{tot}) de la señal diferencial (D(t)) de las primeras medias (L_{p1}(D)) de la señal (D(t)) de conformidad con una función de formación de valor medio y un segundo elemento de formación de la media (32) para determinar, en el intervalo de dicha duración (T_{tot}), una segunda media de la señal a partir de las primeras medias (L_{p1}(D)) de la señal de conformidad con una segunda función de formación de la media que difiere de la primera función de formación de la media, incluyendo la señal de calidad (Q) a la segunda media de la señal.
8. Dispositivo según la reivindicación 7, caracterizado porque el primer elemento de formación de la media (31) y el segundo elemento de formación de la media (32) están acondicionados de manera que realicen las funciones de formación de la media de conformidad con una media p de Lebesgue Lp que posee potencias respectivas p1 y p2 diferentes una de la otra, con p1>p2.
9. Dispositivo según la reivindicación 8, caracterizado porque se tiene p1=\infty y p2=1.
ES00983281T 2000-01-13 2000-12-11 Procedimiento y dispositivo para la determinacion de la calidad de una señal. Expired - Lifetime ES2204730T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL1014075 2000-01-13
NL1014075A NL1014075C2 (nl) 2000-01-13 2000-01-13 Methode en inrichting voor het bepalen van de kwaliteit van een signaal.

Publications (1)

Publication Number Publication Date
ES2204730T3 true ES2204730T3 (es) 2004-05-01

Family

ID=19770596

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00983281T Expired - Lifetime ES2204730T3 (es) 2000-01-13 2000-12-11 Procedimiento y dispositivo para la determinacion de la calidad de una señal.

Country Status (11)

Country Link
US (1) US7016814B2 (es)
EP (1) EP1250830B1 (es)
JP (1) JP3982797B2 (es)
AT (1) ATE246868T1 (es)
AU (1) AU2001220080A1 (es)
CA (1) CA2396455C (es)
DE (1) DE60004403T2 (es)
DK (1) DK1250830T3 (es)
ES (1) ES2204730T3 (es)
NL (1) NL1014075C2 (es)
WO (1) WO2001052600A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2273239C (en) * 1996-12-13 2003-06-10 John Gerard Beerends Device and method for signal quality determination
NL1014075C2 (nl) * 2000-01-13 2001-07-16 Koninkl Kpn Nv Methode en inrichting voor het bepalen van de kwaliteit van een signaal.
EP1241663A1 (en) * 2001-03-13 2002-09-18 Koninklijke KPN N.V. Method and device for determining the quality of speech signal
EP1298646B1 (en) * 2001-10-01 2006-01-11 Koninklijke KPN N.V. Improved method for determining the quality of a speech signal
FR2835125B1 (fr) 2002-01-24 2004-06-18 Telediffusion De France Tdf Procede d'evaluation d'un signal audio numerique
US8098908B2 (en) * 2004-09-21 2012-01-17 Imedos Gmbh Method and device for analyzing the retinal vessels by means of digital images
US20070112563A1 (en) * 2005-11-17 2007-05-17 Microsoft Corporation Determination of audio device quality
US8374234B2 (en) * 2006-09-29 2013-02-12 Francis S. J. Munoz Digital scaling
EP2438591B1 (en) * 2009-06-04 2013-08-21 Telefonaktiebolaget LM Ericsson (publ) A method and arrangement for estimating the quality degradation of a processed signal
JP2013500498A (ja) * 2009-07-24 2013-01-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声品質の評価のための方法、コンピュータ、コンピュータプログラム、およびコンピュータプログラム製品
JP5606764B2 (ja) 2010-03-31 2014-10-15 クラリオン株式会社 音質評価装置およびそのためのプログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4662222A (en) * 1984-12-21 1987-05-05 Johnson Steven A Apparatus and method for acoustic imaging using inverse scattering techniques
US5268834A (en) * 1991-06-24 1993-12-07 Massachusetts Institute Of Technology Stable adaptive neural network controller
US5991459A (en) * 1992-01-22 1999-11-23 Eastman Kodak Company Method of modifying a time-varying image sequence by estimation of velocity vector fields
US5862262A (en) * 1992-03-30 1999-01-19 The United States Of America As Represented By The Secretary Of The Navy Method of encoding a digital image using adaptive partitioning in an iterated transformation system
GB9213459D0 (en) * 1992-06-24 1992-08-05 British Telecomm Characterisation of communications systems using a speech-like test stimulus
JP3701671B2 (ja) * 1993-06-21 2005-10-05 ブリテイッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 冗長性の減少された試験信号を使用する通信装置の試験方法および装置
JPH10505718A (ja) * 1994-08-18 1998-06-02 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー オーディオ品質の解析
NL9500512A (nl) * 1995-03-15 1996-10-01 Nederland Ptt Inrichting voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal, alsmede werkwijze voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal.
DE69614829T2 (de) * 1996-05-21 2002-04-04 Koninklijke Kpn N.V., Groningen Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll
DE19647399C1 (de) * 1996-11-15 1998-07-02 Fraunhofer Ges Forschung Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen
EP0869685A3 (en) * 1997-04-04 1998-11-18 Tektronix, Inc. Automatic measurement of subjective video quality
US5914685A (en) * 1997-04-25 1999-06-22 Magellan Corporation Relative position measuring techniques using both GPS and GLONASS carrier phase measurements
DE69803830T2 (de) * 1998-03-02 2002-09-12 Koninklijke Kpn N.V., Groningen Verfahren, Vorrichtung, ASIC und deren Benutzung zur objektiven Videoqualitätbewertung
AUPP686598A0 (en) * 1998-10-30 1998-11-26 Canon Kabushiki Kaisha A method and apparatus for representing a digital image to provide a coded representation
US6349309B1 (en) * 1999-05-24 2002-02-19 International Business Machines Corporation System and method for detecting clusters of information with application to e-commerce
US6499009B1 (en) * 1999-10-29 2002-12-24 Telefonaktiebolaget Lm Ericsson Handling variable delay in objective speech quality assessment
GB2356455A (en) * 1999-11-16 2001-05-23 Geco Prakla Determination of fast and slow shear wave polarisation directions
US6609092B1 (en) * 1999-12-16 2003-08-19 Lucent Technologies Inc. Method and apparatus for estimating subjective audio signal quality from objective distortion measures
NL1014075C2 (nl) * 2000-01-13 2001-07-16 Koninkl Kpn Nv Methode en inrichting voor het bepalen van de kwaliteit van een signaal.

Also Published As

Publication number Publication date
AU2001220080A1 (en) 2001-07-24
JP2003519816A (ja) 2003-06-24
DE60004403D1 (de) 2003-09-11
CA2396455A1 (en) 2001-07-19
WO2001052600A1 (en) 2001-07-19
NL1014075C2 (nl) 2001-07-16
US7016814B2 (en) 2006-03-21
DK1250830T3 (da) 2003-12-01
EP1250830B1 (en) 2003-08-06
EP1250830A1 (en) 2002-10-23
CA2396455C (en) 2006-10-17
JP3982797B2 (ja) 2007-09-26
US20030055608A1 (en) 2003-03-20
DE60004403T2 (de) 2004-06-24
ATE246868T1 (de) 2003-08-15

Similar Documents

Publication Publication Date Title
ES2204730T3 (es) Procedimiento y dispositivo para la determinacion de la calidad de una señal.
Maslowski et al. How the tracking of habitual rate influences speech perception.
Wong Acoustic characteristics of three-year-olds' correct and incorrect monosyllabic Mandarin lexical tone productions
Tremblay et al. Dutch listeners' perception of English lexical stress: A cue-weighting approach
Dohen et al. Visual perception of contrastive focus in reiterant French speech
Bieber et al. Adaptation to novel foreign-accented speech and retention of benefit following training: Influence of aging and hearing loss
Roberts et al. The intelligibility of noise-vocoded speech: spectral information available from across-channel comparison of amplitude envelopes
Ferguson et al. Within-talker and within-session stability of acoustic characteristics of conversational and clear speaking styles
Zheng et al. Text-dependent speaker identification using circular hidden Markov models
Maassen et al. The effect of correcting fundamental frequency on the intelligibility of deaf speech and its interaction with temporal aspects
Pinet et al. Talker-listener accent interactions in speech-in-noise recognition: Effects of prosodic manipulation as a function of language experience
Pucher et al. Influence of speaker familiarity on blind and visually impaired children’s and young adults’ perception of synthetic voices
Roberts et al. The perceptual organization of sine-wave speech under competitive conditions
Friedrichs et al. The phonological function of vowels is maintained at fundamental frequencies up to 880 Hz
Ruthan et al. Temporal coordination and sonority of Jazani Arabic word-initial clusters
Simmons et al. Cross-modal transfer of talker-identity learning
Khan et al. Multidimensionality of tone in Pahari
ES2449476T3 (es) Aparato, procedimiento y programa de ordenador para procesar una señal de audio
Wu et al. Adding irrelevant information to the content prime reduces the prime-induced unmasking effect on speech recognition
Chan et al. The effect of tone language background on cue integration in pitch perception
JPH03273280A (ja) 発声練習用音声合成方式
Koffi Differential analysis of lexical pitch in accent and tone languages
Li et al. The Effect of L1 Prosody in the Perception and Production of Non-native Lexical Stress
Kang et al. Tense/lax distinctions of English [s] in intervocalic position by Korean speakers: consonant/vowel ratio as a possible universal cue for consonant distinctions
Jeyalakshmi et al. Development of speech recognition system in native language for hearing impaired