ES2204730T3 - Procedimiento y dispositivo para la determinacion de la calidad de una señal. - Google Patents
Procedimiento y dispositivo para la determinacion de la calidad de una señal.Info
- Publication number
- ES2204730T3 ES2204730T3 ES00983281T ES00983281T ES2204730T3 ES 2204730 T3 ES2204730 T3 ES 2204730T3 ES 00983281 T ES00983281 T ES 00983281T ES 00983281 T ES00983281 T ES 00983281T ES 2204730 T3 ES2204730 T3 ES 2204730T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- function
- quality
- time
- formation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2236—Quality of speech transmission monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Otolaryngology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Stereo-Broadcasting Methods (AREA)
- Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
Procedimiento para determinar, de conformidad con una técnica de medida objetiva, la calidad de una señal de salida (X(t)) de un sistema de tratamiento de señales con respecto a una señal de referencia (Y(t)), cuyo procedimiento comprende las etapas principales siguientes que consiste en: - tratar la señal de salida (X(t)) y generar una primera señal de representación (R(X)), - tratar la señal de referencia (Y(t)) y producir una segunda señal de representación (R(Y)) y - combinar la primera señal de representación (R(X)) y la segunda señal de representación (R(Y)) para formar una señal de calidad (Q) independiente en el tiempo, comprendiendo la etapa principal de la combinación las siguientes etapas que consisten en: - determinar una señal diferencial (D(t)) en función del tiempo y - promediar la señal diferencial (D(t)) en el tiempo y obtener la señal de calidad (Q) independiente del tiempo, caracterizado porque la etapa de formación de la media en el tiempo comprende: - una primera subetapa para determinar, durante cada intervalo (Ti) de una serie de intervalos de tiempos sucesivos (T1-Tn) en la duración (Ttot) de la señal diferencial (D(t)) de las primeras medias (Lp1(D)) de la señal (D(t)) de conformidad con una primera función de formación de la media y - una segunda subetapa que consiste en determinar en el período de duración (Ttot) un segundo valor medio de la señal a partir de los primeros valores medios (Lp1(D) de la señal de conformidad con una segunda función de formación de la media diferente de la primera función de formación de la media, incluyendo la señal de calidad (Q) la segunda media de la señal.
Description
Procedimiento y dispositivo para la determinación
de la calidad de una señal.
La invención está dentro del ámbito de la
medición de calidad de señales acústicas, tales como señales de
audio y voz. Más concretamente se refiere a un procedimiento y un
dispositivo para determinar, de acuerdo con una técnica de medición
objetiva, la calidad de una señal de salida a partir de un sistema
de tratamiento de la señal, con respecto a una señal de referencia
de conformidad con el preámbulo de la reivindicación 1 y
reivindicación 7, respectivamente. Un procedimiento y un
dispositivo de dicho tipo se conocen, por ejemplo, de las
referencias [1 - 6] (para más detalles bibliográficos sobre las
referencias, véase a continuación el apartado C, Referencias).
Según la presente técnica conocida, una señal de salida procedente
de un sistema de tratamiento y/o transporte de señales de audio o
voz, cuya calidad de la señal tiene que determinarse, y una señal
de referencia, son objeto de correlación en señales de
representación de conformidad con un modelo de percepción física del
oído humano. Como señal de referencia, puede utilizarse una señal
de entrada del sistema aplicada con la señal de salida obtenida,
como se indica en las referencias [1 - 5]. No obstante, como una
señal de referencia tal como, por ejemplo, se indica en la
referencia [6], puede aplicarse también una estimación de la señal
de entrada original, reconstruida a partir de la señal de salida.
Posteriormente, se determina una señal diferencial como una función
del tiempo a partir de dichas señales de representación que, según
el modelo utilizado, es representativa de una perturbación
sostenida en el sistema presente en la señal de salida. La señal
diferencial dependiente del tiempo, en lo sucesivo referida también
como una señal de perturbación, puede ser una señal de diferencia o
una señal de ratio o también una combinación de ambas, y constituye
una expresión dependiente del tiempo para la magnitud en la que,
según el modelo de representación, la señal de salida se desvía
respecto a la señal de referencia. Por último, la señal de
perturbación se promedia en el tiempo, obteniéndose una señal de
calidad independiente del tiempo, que es una medida de la calidad
de la percepción auditiva de la señal de salida.
Es un fenómeno conocido que, cuando se escucha
una señal de audio, una perturbación corta tiene ya una influencia
significativa sobre la percepción de la calidad de la señal
completa. Esto se aplica no solamente a las palabras habladas y a la
música, sino también, en general, para la reproducción de señales
acústicas. A la aplicación de la promediación en tiempo lineal
habitual, en tales casos existe una correlación deficiente entre la
percepción de la calidad humana y la señal de calidad obtenida por
medio de la técnica de medición. La aplicación del "media
cuadrática" como una función de promediación en el tiempo
proporciona supuestamente alguna mejora, pero también aquí la
correlación es todavía demasiado baja para un buen funcionamiento
del procedimiento objetivo.
El objeto de la invención es, entre otras cosas,
proporcionar un procedimiento y un dispositivo del tipo anterior,
con el que pueda conseguirse una alta correlación entre la
percepción de la calidad humana de una señal de salida y una señal
de calidad obtenida por medio de la técnica de medición,
especialmente en casos en donde se produzca el anterior fenómeno.
Consideraciones sobre las que se basan la invención son las
siguientes. La promediación en el tiempo lineal a la que se hizo
referencia con anterioridad y la "media cuadrática" son
realmente casos especiales de la función de
p-promediación de Lebesgue o Lebesgue
p-norm (norma Lp) para p=1 y p=2, respectivamente.
Para esta función norma se aplica que para una p creciente el valor
de la norma se aproxima todavía más al máximo de la función f dentro
del intervalo. El efecto de aplicar la norma Lp como una función de
promediación sobre la señal de perturbación es, por lo tanto, que,
en el caso de una p creciente, los más altos valores de la señal de
perturbación durante el intervalo de promediación se consideran
todavía de manera más dominante en el resultado de la
promediación.
En la presente técnica de la medición de la
calidad, es habitual utilizar señales de prueba de sentencias
habladas que comprenden dos sentencias o partes de sentencias y que
tarda unos 10 segundos. En este caso, puede reconocerse que, en el
supuesto de palabras habladas, una sílaba (que tenga una duración
media de aproximadamente 0,3 s) no es inteligible cuando, en la
señal de voz, se perturba parte de la sílaba. Esto significa que,
en una señal de perturbación que comprende una parte de señal que
forma una representación de una señal de perturbación de dicha
sílaba perturbada, dicha fracción de señal puede ser localmente
sustituida por un valor de señal promediado que supere un valor de
señal obtenido mediante una promediación lineal, con el objeto de
extraer información importante para la determinación de la calidad.
Dicho valor de señal medio más alto puede obtenerse, por ejemplo,
aplicando una norma Lp que tenga un valor p relativamente alto en
dicha fracción de la señal. Sin embargo, al nivel de sentencia, una
segunda sentencia o parte de ella sigue siendo inteligible, si
solamente la inteligibilidad de una primera sentencia precedente (o
parte de ella, es aceptada por la perturbación, de tal manera que
para la promediación en el tiempo puede aplicarse una función de
promediación en correspondencia con, o al menos desviarse menos de,
la promediación lineal, tal como, por ejemplo, una norma Lp que
tenga una p relativamente baja, por ejemplo, p=1 o p=2.
La propia idea de la invención, que es también
aplicable más en general a señales de audio arbitrarias, incluye
ahora la aplicación, en lugar de la promediación en el tiempo
singular conocida, de una promediación en el tiempo de 2 etapas o
dual. Dicha promediación en el tiempo de 2 etapas comprende dos
subetapas: una primera en donde la señal de perturbación
dependiente del tiempo obtenida en la fase de combinación se
somete, primero al nivel local, por ejemplo, durante intervalos de
tiempo relativamente pequeños, a una primera función de
promediación, obteniéndose un valor medio para el primer intervalo
de tiempo y una segunda subetapa en la que los valores medios
obtenidos e la primera subetapa se someten a una segunda función de
promediación en la duración completa de la señal. La primera
función de promediación difiere de la segunda función de
promediación y se desvía más con respecto a la promediación lineal
que a la segunda función de promediación.
Según la función, el procedimiento y el
dispositivo de la clase anterior tienen la característica de la
reivindicación 1 y la característica de la reivindicación 6,
respectivamente.
En primeras realizaciones preferentes del
procedimiento y el dispositivo, se aplican funciones de
promediación que están basadas en una norma Lp, a saber, en la
primera subetapa una norma Lp que tiene un valor p relativamente
alto y en la segunda subetapa, una norma Lp que tiene un valor p
relativamente bajo. Para esta finalidad, el procedimiento y el
dispositivo están preferentemente caracterizados según las
reivindicaciones 3 y 7, respectivamente.
En las reivindicaciones subordinadas se resumen
otras realizaciones preferentes del procedimiento y el dispositivo
según la invención.
[1] Beerends J.G., Stemerdink J.A., "Una medida
de la calidad de audio perceptual basada en una representación del
sonido psicoacústica", J. Audio Eng. Soc., Vol. 40, Nº12, dic.
1992, páginas 963-978;
[2]
WO-A-96/28950;
[3]
WO-A-96/28952;
[4]
WO-A-96/28953;
[5]
WO-A-97/44779;
[6]
WO-A-96/06496.
La invención se describirá a continuación con más
detalle a través de una descripción de una realización a modo de
ejemplo, haciendo referencia a un dibujo que comprende las figuras
siguientes:
la Figura 1 ilustra, de manera esquemática, un
dispositivo conocido para determinar la calidad de una señal
acústica;
la Figura 2 ilustra, en las partes (a), (b) y
(c), representaciones gráficas para una mejor explicación de la
etapa de promediación en el tiempo en el procedimiento según la
invención: en la parte (a), una representación gráfica que tiene un
ejemplo de una señal de perturbación como una función del tiempo,
descompuesta en subseñales por intervalo; en la parte (b), una
representación gráfica de valores de señales medias de las
subseñales por intervalo obtenido en una primera subetapa de la
etapa de promediación en el tiempo y en la parte (c), una
representación gráfica de varios valores de la señal de calidad
obtenidos en una segunda subetapa de la etapa de promediación en el
tiempo;
la Figura 3 ilustra, de manera esquemática, un
dispositivo de promediación en el tiempo modificado según la
invención para su aplicación en un dispositivo según se ilustra en
la FIGURA 1.
La Figura 1 ilustra, de manera esquemática, un
dispositivo de medición conocido para determinar la calidad de una
señal acústica. El dispositivo de medición comprende un procesador
de señales 10 que tiene entradas de señales 11 y 12 y que tiene
salidas de señal acopladas, a modo de acoplamiento de señales 13 y
14, para las entradas de señal de un dispositivo combinador 15. El
dispositivo combinador 15 está provisto de una salida de señal que,
a través de un acoplamiento de señales 16, se acopla a una entrada
de señal de un dispositivo de promediación en el tiempo 17. Este
dispositivo de promediación en el tiempo 17 está provisto de una
salida de señal 18 que constituye, además, la salida del
dispositivo de medición.
Dicho dispositivo de medición conocido funciona,
en términos generales, como sigue. En las entradas de señales 11 y
12 del procesador de señal 10, se ofrecen una señal de entrada
X(t), de la cual se va a determinar la calidad de la señal y
una señal de referencia Y (t), respectivamente. La señal de entrada
X(t) es una señal de salida de un sistema de procesamiento
y/o transporte de señales de audio o voz (no ilustrado), cuya
calidad de tratamiento y transporte de las señales se va a
investigar. El procesador de señales 10 procesa las señales
X(t) e Y(t) y genera señales de representación
R(X) y R(Y), que forman representaciones de las
señales ofrecidas X(t) e Y(t) según el modelo de
percepción del oído humano existente en (el hardware y/o software
de) el procesador de señales. En la mayoría de los casos, las
señales de representación son funciones del tiempo y la frecuencia
(escala de Hz o escala Bark). Las señales de representación
R(X) y R(Y) se hacen pasar a través, por el procesador
de señales 10 por medio de los acoplamientos de señales 13 y 14,
respectivamente, al dispositivo combinador 15. En el dispositivo
combinador 15, bajo la ejecución de varias operaciones sobre las
señales de representación, tal como comparación, puesta en escala,
determinación de una señal de relación o una señal diferencia
absoluta y la integración sobre la frecuencia, se genera una señal
de perturbación dependiente del tiempo D(t), que se ofrece al
dispositivo de promediación en el tiempo 17 a través del
acoplamiento de señales 16. En el dispositivo de promediación en el
tiempo, la señal de perturbación D(t) se promedia en el
tiempo realizando una integración de conformidad con el tiempo de
duración de la señal, estando disponible el resultado de dicha
combinación en el tiempo, como una señal de calidad Q, en la salida
de la señal 18 del dispositivo de promediación en el tiempo. La
señal de calidad independiente del tiempo Q constituye una medida
para la calidad de la percepción auditiva de la señal X(t).
Puesto que una promediación en el tiempo, siendo habitual la
promediación en el tiempo lineal, es decir, la integración de la
señal de perturbación D(t) en el tiempo, dividida por la
duración del tiempo total de la señal (véase, por ejemplo, Apéndice
F de la Referencia [1], páginas 977/8). Sin embargo, mediante dicha
promediación en el tiempo son promediadas breves perturbaciones en
una señal acústica, que pueden tener un efecto significativo sobre
la percepción de la calidad de la señal completa. En casos en que
tenga lugar, puede establecer una correlación deficiente entre la
percepción de la calidad humana y la señal de calidad obtenida a
través de la técnica de medición. En el supuesto de aplicar la
"media cuadrática" como una función de promediación en el
tiempo, se obtiene una correlación, que es todavía demasiado baja
para una segunda operación del procedimiento objetivo.
La promediación en el tiempo lineal y la "media
cuadrática" son realmente casos concretos de la función de
\hbox{p-promediación} de Lebesgue o norma
p de Lebesgue (norma Lp):
(1)L_{p}(f)=||f||_{p}=\left(_{(a.b)}\int|f(\mu)|^{p}d\mu]
\right)^{1/p}
para una función f integrable durante un
intervalo concreto (a, b) que tiene una medida \mu
y:
(2)L_{p} (f)
=||f||_{p}=\left(
_{(a.b)}\sum\limits^{n}_{i=1}\frac{1}{n}|f(x_{i})| ^{p}
\right)^{1/p}
para una función f definida en n puntos discretos
x_{i} (i=1,-,n) en el intervalo (a, b) para p=1 y p=2,
respectivamente. Para dicha norma, se aplica que para una p
creciente, el valor de la norma se aproxima todavía más al máximo
f_{máx} de la función f dentro del intervalo y que en el límite
para p\rightarrow\infty, se aplica que
L_{\infty}(f)=f_{máx}. El efecto de aplicar dicha función
norma como una función de promediación en (parte de) una señal de
perturbación por lo tanto es que, para una p creciente, los valores
más altos de la señal de perturbación durante el intervalo de
promediación se consideran todavía más dominantes en el resultado de
la promediación. En la norma Lp se suele aplicar que p \in R. Sin
embargo, dentro del contexto de la presente invención p \in
R_{(+)} es más
sensible.
Para evitar promediar la influencia de
perturbaciones relativamente cortas en la señal de calidad final,
la etapa de promediación en el tiempo se realiza en dos subetapas,
que se explican con referencia a la Figura 2. En dichas dos
subetapas, se aplican dos funciones de promediación diferentes a la
señal de perturbación una tras otra, que se eligen de manera que la
primera función de promediación, en la primera subetapa, dé lugar a
la segunda función de promediación. En general, dichos pares de
funciones de promediación se aplican a la señal de perturbación una
tras otra, que se eligen de tal manera que la primera función de
promediación, en la primera subetapa, tenga valores (señal) más
altos de la señal de perturbación a través de un intervalo de
promediación más dominantemente considerado en el resultado de la
promediación que la segunda función de promediación. En general,
dichos pares de funciones de promediación pueden determinarse
mediante una selección individual, por ejemplo, utilizando la
simulación. Cuando se aplica la norma Lp como una función de
promediación puede determinarse mediante selección individual, por
ejemplo, utilizando la simulación. Cuando se aplica la norma Lp
como una función de promediación, solamente se requiere en la
primera subetapa para elegir una norma Lp que tenga un valor p que
sea, por ejemplo, varias veces mayor que el valor p de la norma Lp
aplicada en la segunda subetapa. Puesto que la norma Lp está basada
en una forma concreta de funciones convexas, a saber, la función
g(x)=|x|^{p} para p=1, 2,…, que tenga como su función
inversa g^{1}(x)=|x|^{1/p}, puede esperarse que, en el
caso general de funciones convexas, puedan encontrarse otros pares
adecuados. A continuación se asocian más formas generales de las
fórmulas (1) y (2) para la norma o función de promediación:
(1a)L_{g}(f)=||f||_{g}=g^{-1}\left(_{(a.b)}\int
g(|f(\mu)|)d\mu\right)
y
(2a)L_{g}(f)=||f||_{g}=g^{-1}\left(_{(a.b)}\sum\limits^{n}_{i=1}\frac{1}{n}
g(|f(x_{i})|)\right)
Funciones adecuadas, sobre las que pueden basarse
las funciones de promediación en la primera y segunda etapas de
promediación son, p.e., g_{1}(x) = exp(px) con p=1,
2,…, que tiene como su función inversa g^{1}_{-1}
(x)=p^{-1}|n(x) en la primera etapa, en combinación con en
la segunda etapa g_{2}(x)=|x| de
g_{2}(x)=|x|^{2} . Por lo tanto, debe señalarse que,
aunque en la descripción adicional para mayor claridad se utiliza
solamente la norma Lp como una función de promediación, esto no
significa que la invención esté limitada a esta finalidad.
En la parte (a) de la Figura 2, se ofrece un
ejemplo de una señal de perturbación D(t) como una función
del tiempo, siendo el tiempo representado a lo largo del eje
horizontal y (la intensidad de) la señal D(t) se representa a
lo largo del eje vertical. En una primera subetapa, la duración de
tiempo total T_{tot} de la señal D(t) se descompone
primero en n intervalos T_{i} (i=1-n) de
duraciones preferentemente iguales T_{int} y la señal D(t)
adecuadamente descompuesta en partes de señales que tienen una
parte de señal D_{i}(t) por intervalo T_{i}.
Posteriormente, en cada intervalo T_{i} (i=1-n),
se determina una media en el tiempo de conformidad con la norma Lp
(véase fórmula {1}) de la parte de señal
D_{i}(t) en un primer valor p relativamente alto p_{1} (p.e., p_{1} = 6). A este efecto, debe resaltarse que solamente, a modo de ejemplo se ha representado la señal de perturbación D(t) como una función continua. Es habitual que la señal D(t) se haga disponible como una función discreta en el tiempo a la salida del dispositivo combinador 15 en la forma de una hilera de valores secuenciales en el tiempo, por ejemplo, doce por intervalo de tiempo, que puede interpretarse como puntos de muestreo de una función continua. En este caso, la norma Lp se determina utilizando la fórmula {2}. Los valores de las medias en el tiempo, L_{p1}(D_{i}) para i=1-n, se representan para cada intervalo T_{i} en la parte (b) de la Figura 2, designada por un guión horizontal corto 21. Con miras a las comparaciones, en cada intervalo están también representados valores de las medias en el tiempo para p_{1}=1 y p_{1}=\infty, p.e., L_{1}(D_{i}) y L_{\infty}(D_{i}), respectivamente, designada por un guión horizontal largo 22 y por un punto 23.
D_{i}(t) en un primer valor p relativamente alto p_{1} (p.e., p_{1} = 6). A este efecto, debe resaltarse que solamente, a modo de ejemplo se ha representado la señal de perturbación D(t) como una función continua. Es habitual que la señal D(t) se haga disponible como una función discreta en el tiempo a la salida del dispositivo combinador 15 en la forma de una hilera de valores secuenciales en el tiempo, por ejemplo, doce por intervalo de tiempo, que puede interpretarse como puntos de muestreo de una función continua. En este caso, la norma Lp se determina utilizando la fórmula {2}. Los valores de las medias en el tiempo, L_{p1}(D_{i}) para i=1-n, se representan para cada intervalo T_{i} en la parte (b) de la Figura 2, designada por un guión horizontal corto 21. Con miras a las comparaciones, en cada intervalo están también representados valores de las medias en el tiempo para p_{1}=1 y p_{1}=\infty, p.e., L_{1}(D_{i}) y L_{\infty}(D_{i}), respectivamente, designada por un guión horizontal largo 22 y por un punto 23.
En una segunda subetapa, la norma L_{p} de los
valores L_{p1}(D_{i}) determinados por intervalo T_{i}
durante el período de tiempo total de duración T_{tot} según la
fórmula {2} con un segundo valor p relativamente bajo
p_{2}<p_{1} (p.e., p_{2}=1 ó 2) que da lugar a la señal de
calidad Q. La parte (c) de la Figura 2 ilustra el valor medio a
través de los n intervalos de conformidad con la norma L_{p2} para
p_{2}=1 de los valores L_{p1}(D_{i}),
L_{1}(D_{i}) y L_{\infty}(D_{i}),
respectivamente designados por un guión horizontal corto 24, por un
guión horizontal largo 25 y por un punto 26. El valor de Q según se
designa por el guión 25, y por lo tanto obtenido a través de una
promediación de 2 etapas con valores de p tales que
p_{1}=p_{2}=1, corresponde prácticamente al valor obtenido por
medio de la promediación en el tiempo singular conocida, en donde
se aplica la norma L_{1}. Esto significa que la mejora de la
correlación considerada por la invención puede conseguirse
solamente si se cumple p_{1}>p_{2}.
Si es simple, en la primera subetapa, determinar
el máximo de las partes de señal D_{i}(t) en cada
intervalo T_{i}, por ejemplo, se elige p_{i}=_{-}. En la
segunda subetapa, la elección de p_{2}=1 es la más simple.
Debe entenderse que, cuando se utiliza dicha
promediación en el tiempo de 2 etapas, el efecto de breves
perturbaciones sobre la señal de calidad sigue siendo
significativo. Para las señales de prueba sobre palabras habladas,
una duración total T_{tot} de aproximadamente 10 segundos es
significativa, siendo posible suponer para T_{int}, la duración
media de una sílaba hablada, es decir, aproximadamente 0,3
segundos.
Aparte de la variación del valor de p,
particularmente en la primera subetapa, el efecto de breves
perturbaciones puede manipularse también por una elección adecuada
de la duración del intervalo de tiempo T_{i}, por ejemplo, como
una función de la clase de señal, por ejemplo, palabras habladas o
música, o de la clase de señal, lenta o rápida, pero también como
una función del tipo de sistema de procesamiento y/o transporte de
señales de audio o voz del que X(t) es la señal de salida. Se
ha mencionado ya anteriormente que, en el caso de una señal de
prueba con palabras habladas, la duración media de una sílaba es
aproximadamente 0,3 segundos. Dicha media, sin embargo, puede variar
considerablemente en el caso de frases pronunciadas deliberadamente
lentas o rápidas, según pueda ser el caso. Algo similar puede
aplicarse a las señales musicales que tengan un ritmo lento o
rápido, según pueda ser el caso.
Otra opción de manipular el efecto de breves
perturbaciones es eligiendo los intervalos solapantes, como
resultado de los cuales el efecto de perturbaciones breves, que
están presentes exactamente en los límites de los intervalos, son
mejor tenidas en cuenta. Dicho solapamiento es, por ejemplo, del
10%, comenzando el siguiente intervalo T_{i+1} en 0,9 del
intervalo T_{i} o también 50%, comenzando ya el siguiente
intervalo T_{i+1} a mitad de camino del intervalo T_{i}.
Cuando se escucha una señal acústica, la parte de
la señal acústica más recientemente oída suele tener un mayor efecto
sobre la percepción de la calidad que la primera parte oída de la
misma. Para expresar mejor dicho efecto en la señal de calidad
también, en la segunda subetapa puede aplicarse una media ponderada
haciendo uso de una función de ponderación w(t), discreta o
no, tal como una función de crecimiento monótono, a cualquier
régimen no decreciente, que tenga valores comprendidos entre 0 y 1
durante el período de la señal total T_{tot} para la cual, por
ejemplo, se aplica:
0 \leq w(t)\leq \
^{1}/_{2} \ para \ 1 \leq \ ^{1}/_{2} \
T_{tot},
y
^{1}/_{2} \leq
w(t)\leq 1 \ para \ ^{1}/_{2} \ T_{tot} \leq t\leq
T_{tot},
asignándose a cada intervalo T_{1} un peso de
ponderación w_{i} que es igual a, por ejemplo, el máximo de
w(t) en el intervalo T_{i}. A este respecto, la función
norma de la fórmula {2} se ajusta
a:
(2')L_{p}(f)=||f||_{p}=\left(\frac{\sum\limits^{n}_{i=1}|f(x_{i})|^{p}w_{i}}{\sum\limits^{n}_{i=1}w_{i}}\right)^{1/p}
El dispositivo de promediación en el tiempo 17,
tal como se ilustra de manera esquemática en la Figura 3, según la
invención, consiste en dos elementos de promediación 31 y 32. Un
primer elemento de promediación 21 recibe, a través del acoplamiento
de señales 16, la señal de perturbación D(t) desde el
dispositivo combinador 15 y procesa dicha señal recibida de
conformidad con la primera subetapa anteriormente descrita. En
ella, la señal D(t) se descompone primero durante n
intervalos T_{i} con i=1-n de la duración total de
la señal T_{tot} de la señal D(t) en n subseñales
D_{i}(t), que son posteriormente convertidas en una hilera
secuencial en el tiempo de valores de la señal promediados en el
tiempo L_{p1}(D_{i}), determinado por el intervalo de
tiempo Ti utilizando una norma Lp que tenga el valor p_{1}
relativamente alto. Dicha hilera de valores de señal
L_{p1}(D_{i}) se hace pasar, a través de un acoplamiento
de señales 33, al segundo elemento de promediación 32. El segundo
elemento de promediación determina, a partir de dicha hilera de
valores de señal medios L_{p1}(D_{i}), un valor de señal
promedio L_{p2}(L_{p1}(D)) según una norma Lp que
tenga un valor p relativamente bajo p_{2} según la fórmula {2} ó
{2'}. El valor de la señal promedio
L_{p2}(L_{p1}(D)) es posteriormente entregado,
mediante el segundo elemento de promediación 32, como determine la
señal de calidad Q, a la salida de señal 18 del dispositivo de
promediación en el tiempo.
Claims (9)
1. Procedimiento para determinar, de conformidad
con una técnica de medida objetiva, la calidad de una señal de
salida (X(t)) de un sistema de tratamiento de señales con
respecto a una señal de referencia (Y(t)), cuyo procedimiento
comprende las etapas principales siguientes que consiste en:
- -
- tratar la señal de salida (X(t)) y generar una primera señal de representación (R(X)),
- -
- tratar la señal de referencia (Y(t)) y producir una segunda señal de representación (R(Y)) y
- -
- combinar la primera señal de representación (R(X)) y la segunda señal de representación (R(Y)) para formar una señal de calidad (Q) independiente en el tiempo,
comprendiendo la etapa principal de la
combinación las siguientes etapas que consisten en:
- -
- determinar una señal diferencial (D(t)) en función del tiempo y
- -
- promediar la señal diferencial (D(t)) en el tiempo y obtener la señal de calidad (Q) independiente del tiempo,
caracterizado porque
la etapa de formación de la media en el tiempo
comprende:
- -
- una primera subetapa para determinar, durante cada intervalo (T_{i}) de una serie de intervalos de tiempos sucesivos (T_{1}-T_{n}) en la duración (T_{tot}) de la señal diferencial (D(t)) de las primeras medias (L_{p1}(D)) de la señal (D(t)) de conformidad con una primera función de formación de la media y
- -
- una segunda subetapa que consiste en determinar en el período de duración (T_{tot}) un segundo valor medio de la señal a partir de los primeros valores medios (L_{p1}(D) de la señal de conformidad con una segunda función de formación de la media diferente de la primera función de formación de la media, incluyendo la señal de calidad (Q) la segunda media de la señal.
2. Procedimiento según la reivindicación 1,
caracterizado porque la primera función de formación de la
media es una función de formación de la media en la cual valores
más elevados de señales están presentes, de una manera más
dominante, en el resultado de formación de la media que en la
segunda función de formación de la media.
3. Procedimiento según la reivindicación 2,
caracterizado porque las primera y segunda funciones de
formación de la media son funciones de conformidad con la media
sobre p de Lebesgue, que tiene valores Lp respectivos p1 y p2 que
difieren uno del otro, con p1>p2.
4. Procedimiento según la reivindicación 3,
caracterizado porque se tiene p1 =\infty y p2=1.
5. Procedimiento según una cualquiera de las
reivindicaciones precedentes 1 a 4, caracterizado porque los
intervalos de tiempo (T_{1}-T_{n}), en el
momento de la primera subetapa, son intervalos que se solapan.
6. Procedimiento según una cualquiera de las
reivindicaciones precedentes 1 a 5, caracterizado porque la
función de formación de la media de la segunda subetapa comprende
una formación de media ponderada.
7. Dispositivo para determinar, de conformidad
con una técnica de medida objetiva, la calidad de una señal de
salida (X(t)) en un sistema de tratamiento de señales en
relación con una señal de referencia (Y(t)), cuyo dispositivo
comprende:
- -
- un primer dispositivo de tratamiento de señales (10) para tratar la señal de salida (X(t)) y generar una primera señal de representación (R(X));
- -
- un segundo dispositivo de tratamiento de señales (10) para tratar la señal de referencia (Y(t)) y producir una segunda señal de representación (R(Y)) y
- -
- un circuito de combinación (15, 17) que sirve para combinar la primera señal de representación (R(X)) y la segunda señal de representación (R(Y)) y obtener una señal de calidad (Q) independiente del tiempo,
cuyo circuito de combinación (15, 17) comprende
un dispositivo diferencial (15) que sirve para determinar una señal
diferencial (D(t)) en función del tiempo y un dispositivo de
formación de la media (17) para obtener la señal de calidad (Q)
independiente del tiempo,
\newpage
caracterizado porque
el dispositivo de formación de la media (17)
comprende un primer elemento de formación de la media (31) para
determinar, durante cada intervalo de tiempo (T_{i}) de una serie
de intervalos de tiempos sucesivos (T_{1}-T_{n})
con respecto a la duración (T_{tot}) de la señal diferencial
(D(t)) de las primeras medias (L_{p1}(D)) de la
señal (D(t)) de conformidad con una función de formación de
valor medio y un segundo elemento de formación de la media (32) para
determinar, en el intervalo de dicha duración (T_{tot}), una
segunda media de la señal a partir de las primeras medias
(L_{p1}(D)) de la señal de conformidad con una segunda
función de formación de la media que difiere de la primera función
de formación de la media, incluyendo la señal de calidad (Q) a la
segunda media de la señal.
8. Dispositivo según la reivindicación 7,
caracterizado porque el primer elemento de formación de la
media (31) y el segundo elemento de formación de la media (32) están
acondicionados de manera que realicen las funciones de formación de
la media de conformidad con una media p de Lebesgue Lp que posee
potencias respectivas p1 y p2 diferentes una de la otra, con
p1>p2.
9. Dispositivo según la reivindicación 8,
caracterizado porque se tiene p1=\infty y p2=1.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| NL1014075 | 2000-01-13 | ||
| NL1014075A NL1014075C2 (nl) | 2000-01-13 | 2000-01-13 | Methode en inrichting voor het bepalen van de kwaliteit van een signaal. |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2204730T3 true ES2204730T3 (es) | 2004-05-01 |
Family
ID=19770596
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES00983281T Expired - Lifetime ES2204730T3 (es) | 2000-01-13 | 2000-12-11 | Procedimiento y dispositivo para la determinacion de la calidad de una señal. |
Country Status (11)
| Country | Link |
|---|---|
| US (1) | US7016814B2 (es) |
| EP (1) | EP1250830B1 (es) |
| JP (1) | JP3982797B2 (es) |
| AT (1) | ATE246868T1 (es) |
| AU (1) | AU2001220080A1 (es) |
| CA (1) | CA2396455C (es) |
| DE (1) | DE60004403T2 (es) |
| DK (1) | DK1250830T3 (es) |
| ES (1) | ES2204730T3 (es) |
| NL (1) | NL1014075C2 (es) |
| WO (1) | WO2001052600A1 (es) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2273239C (en) * | 1996-12-13 | 2003-06-10 | John Gerard Beerends | Device and method for signal quality determination |
| NL1014075C2 (nl) * | 2000-01-13 | 2001-07-16 | Koninkl Kpn Nv | Methode en inrichting voor het bepalen van de kwaliteit van een signaal. |
| EP1241663A1 (en) * | 2001-03-13 | 2002-09-18 | Koninklijke KPN N.V. | Method and device for determining the quality of speech signal |
| EP1298646B1 (en) * | 2001-10-01 | 2006-01-11 | Koninklijke KPN N.V. | Improved method for determining the quality of a speech signal |
| FR2835125B1 (fr) | 2002-01-24 | 2004-06-18 | Telediffusion De France Tdf | Procede d'evaluation d'un signal audio numerique |
| US8098908B2 (en) * | 2004-09-21 | 2012-01-17 | Imedos Gmbh | Method and device for analyzing the retinal vessels by means of digital images |
| US20070112563A1 (en) * | 2005-11-17 | 2007-05-17 | Microsoft Corporation | Determination of audio device quality |
| US8374234B2 (en) * | 2006-09-29 | 2013-02-12 | Francis S. J. Munoz | Digital scaling |
| EP2438591B1 (en) * | 2009-06-04 | 2013-08-21 | Telefonaktiebolaget LM Ericsson (publ) | A method and arrangement for estimating the quality degradation of a processed signal |
| JP2013500498A (ja) * | 2009-07-24 | 2013-01-07 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声品質の評価のための方法、コンピュータ、コンピュータプログラム、およびコンピュータプログラム製品 |
| JP5606764B2 (ja) | 2010-03-31 | 2014-10-15 | クラリオン株式会社 | 音質評価装置およびそのためのプログラム |
Family Cites Families (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4662222A (en) * | 1984-12-21 | 1987-05-05 | Johnson Steven A | Apparatus and method for acoustic imaging using inverse scattering techniques |
| US5268834A (en) * | 1991-06-24 | 1993-12-07 | Massachusetts Institute Of Technology | Stable adaptive neural network controller |
| US5991459A (en) * | 1992-01-22 | 1999-11-23 | Eastman Kodak Company | Method of modifying a time-varying image sequence by estimation of velocity vector fields |
| US5862262A (en) * | 1992-03-30 | 1999-01-19 | The United States Of America As Represented By The Secretary Of The Navy | Method of encoding a digital image using adaptive partitioning in an iterated transformation system |
| GB9213459D0 (en) * | 1992-06-24 | 1992-08-05 | British Telecomm | Characterisation of communications systems using a speech-like test stimulus |
| JP3701671B2 (ja) * | 1993-06-21 | 2005-10-05 | ブリテイッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 冗長性の減少された試験信号を使用する通信装置の試験方法および装置 |
| JPH10505718A (ja) * | 1994-08-18 | 1998-06-02 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | オーディオ品質の解析 |
| NL9500512A (nl) * | 1995-03-15 | 1996-10-01 | Nederland Ptt | Inrichting voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal, alsmede werkwijze voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal. |
| DE69614829T2 (de) * | 1996-05-21 | 2002-04-04 | Koninklijke Kpn N.V., Groningen | Vorrichtung und Verfahren zur Bestimmung der Qualität eines Ausgangssignals, das von einem Signalverarbeitungsschaltkreis erzeugt werden soll |
| DE19647399C1 (de) * | 1996-11-15 | 1998-07-02 | Fraunhofer Ges Forschung | Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen |
| EP0869685A3 (en) * | 1997-04-04 | 1998-11-18 | Tektronix, Inc. | Automatic measurement of subjective video quality |
| US5914685A (en) * | 1997-04-25 | 1999-06-22 | Magellan Corporation | Relative position measuring techniques using both GPS and GLONASS carrier phase measurements |
| DE69803830T2 (de) * | 1998-03-02 | 2002-09-12 | Koninklijke Kpn N.V., Groningen | Verfahren, Vorrichtung, ASIC und deren Benutzung zur objektiven Videoqualitätbewertung |
| AUPP686598A0 (en) * | 1998-10-30 | 1998-11-26 | Canon Kabushiki Kaisha | A method and apparatus for representing a digital image to provide a coded representation |
| US6349309B1 (en) * | 1999-05-24 | 2002-02-19 | International Business Machines Corporation | System and method for detecting clusters of information with application to e-commerce |
| US6499009B1 (en) * | 1999-10-29 | 2002-12-24 | Telefonaktiebolaget Lm Ericsson | Handling variable delay in objective speech quality assessment |
| GB2356455A (en) * | 1999-11-16 | 2001-05-23 | Geco Prakla | Determination of fast and slow shear wave polarisation directions |
| US6609092B1 (en) * | 1999-12-16 | 2003-08-19 | Lucent Technologies Inc. | Method and apparatus for estimating subjective audio signal quality from objective distortion measures |
| NL1014075C2 (nl) * | 2000-01-13 | 2001-07-16 | Koninkl Kpn Nv | Methode en inrichting voor het bepalen van de kwaliteit van een signaal. |
-
2000
- 2000-01-13 NL NL1014075A patent/NL1014075C2/nl not_active IP Right Cessation
- 2000-12-11 EP EP00983281A patent/EP1250830B1/en not_active Expired - Lifetime
- 2000-12-11 CA CA002396455A patent/CA2396455C/en not_active Expired - Lifetime
- 2000-12-11 ES ES00983281T patent/ES2204730T3/es not_active Expired - Lifetime
- 2000-12-11 DK DK00983281T patent/DK1250830T3/da active
- 2000-12-11 AU AU2001220080A patent/AU2001220080A1/en not_active Abandoned
- 2000-12-11 WO PCT/EP2000/012535 patent/WO2001052600A1/en not_active Ceased
- 2000-12-11 US US10/130,593 patent/US7016814B2/en not_active Expired - Lifetime
- 2000-12-11 JP JP2001551876A patent/JP3982797B2/ja not_active Expired - Lifetime
- 2000-12-11 AT AT00983281T patent/ATE246868T1/de active
- 2000-12-11 DE DE60004403T patent/DE60004403T2/de not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| AU2001220080A1 (en) | 2001-07-24 |
| JP2003519816A (ja) | 2003-06-24 |
| DE60004403D1 (de) | 2003-09-11 |
| CA2396455A1 (en) | 2001-07-19 |
| WO2001052600A1 (en) | 2001-07-19 |
| NL1014075C2 (nl) | 2001-07-16 |
| US7016814B2 (en) | 2006-03-21 |
| DK1250830T3 (da) | 2003-12-01 |
| EP1250830B1 (en) | 2003-08-06 |
| EP1250830A1 (en) | 2002-10-23 |
| CA2396455C (en) | 2006-10-17 |
| JP3982797B2 (ja) | 2007-09-26 |
| US20030055608A1 (en) | 2003-03-20 |
| DE60004403T2 (de) | 2004-06-24 |
| ATE246868T1 (de) | 2003-08-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2204730T3 (es) | Procedimiento y dispositivo para la determinacion de la calidad de una señal. | |
| Maslowski et al. | How the tracking of habitual rate influences speech perception. | |
| Wong | Acoustic characteristics of three-year-olds' correct and incorrect monosyllabic Mandarin lexical tone productions | |
| Tremblay et al. | Dutch listeners' perception of English lexical stress: A cue-weighting approach | |
| Dohen et al. | Visual perception of contrastive focus in reiterant French speech | |
| Bieber et al. | Adaptation to novel foreign-accented speech and retention of benefit following training: Influence of aging and hearing loss | |
| Roberts et al. | The intelligibility of noise-vocoded speech: spectral information available from across-channel comparison of amplitude envelopes | |
| Ferguson et al. | Within-talker and within-session stability of acoustic characteristics of conversational and clear speaking styles | |
| Zheng et al. | Text-dependent speaker identification using circular hidden Markov models | |
| Maassen et al. | The effect of correcting fundamental frequency on the intelligibility of deaf speech and its interaction with temporal aspects | |
| Pinet et al. | Talker-listener accent interactions in speech-in-noise recognition: Effects of prosodic manipulation as a function of language experience | |
| Pucher et al. | Influence of speaker familiarity on blind and visually impaired children’s and young adults’ perception of synthetic voices | |
| Roberts et al. | The perceptual organization of sine-wave speech under competitive conditions | |
| Friedrichs et al. | The phonological function of vowels is maintained at fundamental frequencies up to 880 Hz | |
| Ruthan et al. | Temporal coordination and sonority of Jazani Arabic word-initial clusters | |
| Simmons et al. | Cross-modal transfer of talker-identity learning | |
| Khan et al. | Multidimensionality of tone in Pahari | |
| ES2449476T3 (es) | Aparato, procedimiento y programa de ordenador para procesar una señal de audio | |
| Wu et al. | Adding irrelevant information to the content prime reduces the prime-induced unmasking effect on speech recognition | |
| Chan et al. | The effect of tone language background on cue integration in pitch perception | |
| JPH03273280A (ja) | 発声練習用音声合成方式 | |
| Koffi | Differential analysis of lexical pitch in accent and tone languages | |
| Li et al. | The Effect of L1 Prosody in the Perception and Production of Non-native Lexical Stress | |
| Kang et al. | Tense/lax distinctions of English [s] in intervocalic position by Korean speakers: consonant/vowel ratio as a possible universal cue for consonant distinctions | |
| Jeyalakshmi et al. | Development of speech recognition system in native language for hearing impaired |