ES2300975T3 - Codificacion de audio. - Google Patents
Codificacion de audio. Download PDFInfo
- Publication number
- ES2300975T3 ES2300975T3 ES05701396T ES05701396T ES2300975T3 ES 2300975 T3 ES2300975 T3 ES 2300975T3 ES 05701396 T ES05701396 T ES 05701396T ES 05701396 T ES05701396 T ES 05701396T ES 2300975 T3 ES2300975 T3 ES 2300975T3
- Authority
- ES
- Spain
- Prior art keywords
- audio
- parameterization
- block
- values
- version
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Cereal-Derived Products (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Dispositivo para codificar una señal de audio de una secuencia (54) de valores (56) de audio, en una señal (130) codificada, con un medio (20) para determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia (54) de valores (56) de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia (54) de valores (56) de audio; un medio (24) para calcular una versión de una parametrización de un filtro (30) parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del primer umbral de escucha y una versión de una segunda parametrización del filtro parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del segundo umbral de escucha; un medio (22) para determinar un primer límite de potencia de ruido en función del primer umbral de enmascaramiento y un segundo límite de potencia de ruido en función del segundo umbral de enmascaramiento; un medio (30) para filtrar de manera parametrizable y ajustar a escala un bloque predeterminado de valores de audio de la secuencia (54) de valores (56) de audio, para obtener un bloque de valores de audio filtrados, ajustados a escala, que corresponde al bloque predeterminado, presentando éste la siguiente característica: un medio (88) para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque predeterminado de valores de audio, un medio (90) para interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para el valor de audio predeterminado; un medio (92) para determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y un medio (94) para aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio filtrados, ajustados a escala; un medio (28) para cuantificar los valores de audio filtrados, ajustados a escala, según la regla de cuantificación, para obtener un bloque de valores de audio filtrados, ajustados a escala, cuantificados; y un medio (18) para integrar la información en la señal codificada, a partir de la cual pueden derivarse el bloque de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido.
Description
Codificación de audio.
La presente invención se refiere a la
codificación de audio, en general, y, en particular a la
codificación de audio que permite que las señales de audio sean
codificadas con un tiempo corto de retardo.
El procedimiento de compresión de audio más
conocido en la actualidad es el MPEG-1 Layer III. En
este procedimiento de compresión, los valores de muestreo o de
audio de una señal de audio se codifican con pérdida en una señal
codificada. En otras palabras, en la compresión la irrelevancia y
redundancia de la señal de audio original se reduce o, en el caso
ideal, se suprime. Para conseguir esto, se detectan enmascaramientos
simultáneos y temporales mediante un modelo psicoacústico, es
decir, se calcula o determina un umbral de enmascaramiento, que
cambia en el tiempo y que depende de la señal de audio, que indica a
partir de qué volumen los tonos de una frecuencia determinada
empiezan a ser perceptibles para el oído humano. Esta información se
utiliza a su vez para codificar la señal cuantificando los valores
espectrales de la señal de audio en función del umbral de
enmascaramiento de una manera más exacta, menos exacta o no
cuantificándolos, e integrándolos en la señal codificada.
Los procedimientos de compresión de audio, tal
como, por ejemplo, el formato MP3, experimentan un límite en su
aplicabilidad, cuando se trata de transmitir datos de audio por un
canal de transmisión con limitación de tasa de bits, por un lado,
comprimidos, pero, por otro lado, con un tiempo de retardo lo más
reducido posible. En algunas aplicaciones, el tiempo de retardo no
es importante, tal como, por ejemplo, en el archivado de
información de audio. Los codificadores de audio con un retardo
bajo, algunas veces denominados también "Codificadores de retardo
ultra bajo" (Ultra Low Delay Coder), sin embargo, son
necesarios cuando se trata de transmisiones de señales de audio
críticas en cuanto al tiempo, tal como, por ejemplo, en
tele-conferencias, en micrófonos o altavoces
inalámbricos. Para estos campos de aplicación, en el artículo de
Schuller G. et al. "Perceptual Audio Coding using Adaptive
Pre- and Post-Filters and Lossless Compression",
IEEE Transactions on Speech and Audio Processing, Vol. 10, No. 6,
septiembre de 2002, páginas 379-390, se propone una
codificación de audio en la que la reducción de irrelevancia y la
reducción de redundancia no se realizan basándose en una única
transformación, sino en dos transformaciones separadas.
El principio se explica a continuación con
referencia a las figuras 12 y 13. La codificación parte de una
señal 902 de audio que ya se ha muestreado y ya está por tanto
presente como una secuencia 904 de valores 906 de muestreo o de
audio, indicándose mediante una flecha 908 el orden temporal de los
valores 906 de audio. Se calcula el umbral de escucha por medio de
un modelo psicoacústico para bloques sucesivos de valores 906 de
audio, caracterizados por una numeración ascendente con "nº de
bloque". La figura 13 muestra, por ejemplo, un diagrama en el
que, por la frecuencia f con una curva a se ha dibujado el
espectro de un bloque de señales de 128 valores de audio 906, y en
b el umbral de enmascaramiento, tal como se ha calculado por
un modelo psicoacústico, en unidades logarítmicas. El umbral de
enmascaramiento de indica, como ya se ha mencionado, hasta qué
intensidad son inaudibles las frecuencias para el oído humano,
concretamente todos los tonos por debajo del umbral b de
enmascaramiento. Basándose en los umbrales de escucha calculados
para cada bloque, se logra ahora una reducción de irrelevancia
mediante el control de un filtro parametrizable seguido por un
cuantificador. Para un filtro parametrizable se calcula una
parametrización de modo que su frecuencia de respuesta corresponda a
la inversa de la magnitud del umbral de enmascaramiento. Esta
parametrización se indica en la figura 12 mediante x#(i).
Después de filtrar los valores 906 de audio, se
produce una cuantificación con un incremento constante, por
ejemplo, una operación de redondeo al siguiente entero. El ruido de
cuantificación causado de este modo es ruido blanco. En el lado del
descodificador, la señal filtrada se "transforma inversamente"
de nuevo con un filtro parametrizable, cuya función de transmisión
se ajusta a la magnitud del propio umbral de enmascaramiento. De
este modo, no sólo se codifica de nuevo la señal filtrada, sino que
el ruido de cuantificación en el lado del descodificador también se
ajusta a la forma del umbral de enmascaramiento. Para que el ruido
de cuantificación corresponda de una manera lo más exacta posible
al umbral de enmascaramiento, un valor a_{#} de amplificación que
se aplica a la señal filtrada antes de la cuantificación, se calcula
además en el lado del codificador para cada conjunto de parámetros
o para cada parametrización. Para que pueda realizarse la
transformación inversa en el lado del descodificador, el valor a de
amplificación y la parametrización x se transmiten al
codificador como información 910 secundaria junto con los datos
principales reales, concretamente los valores 912 de audio
filtrados cuantificados. Para la reducción 914 de redundancia, estos
datos, es decir, la información 910 secundaria y los datos 912
principales, se someten todavía a una compresión sin pérdidas,
concretamente a una codificación de entropía, mediante la que se
obtiene la señal codificada.
El artículo mencionado anteriormente propone un
tamaño de 128 valores 906 de muestreo como tamaño del bloque. Esto
permite un retardo relativamente corto de 8 ms con una tasa de
muestreo de 32 kHz. Con referencia a la implementación detallada,
en el artículo también se describe que, para aumentar la eficacia de
la codificación de información secundaria, esta información
secundaria, concretamente los coeficientes x_{#} y a_{#} sólo se
transmiten si hay suficiente variación en comparación con un
conjunto de parámetros transmitido anteriormente, es decir, si la
variación sobrepasa un valor umbral determinado. Además, se describe
que la implementación se lleva a cabo preferiblemente de modo que
un conjunto de parámetros actual no se aplica directamente a todos
los valores de muestreo que pertenecen al bloque respectivo, sino
que se utiliza una interpolación lineal de los coeficientes x_{#}
de filtrado para evitar artefactos audibles. Con el fin de ejecutar
la interpolación lineal de los coeficientes de filtrado, se propone
una estructura de rejilla para el filtro, para impedir que ocurran
inestabilidades. Para el caso en el que se desee una señal
codificada con una tasa de bits controlada, el artículo también
propone multiplicar o atenuar selectivamente la señal filtrada y
ajustada a escala con el factor a de amplificación dependiente del
tiempo, por un factor diferente de 1, de modo que si bien se
producen interferencias audibles, sin embargo la tasa de bits puede
reducirse en puntos de la señal de audio que sean complicados de
codificar.
Aunque el esquema de codificación de audio
descrito en el artículo mencionado anteriormente ya reduce el
tiempo de retardo para muchas aplicaciones de manera suficiente, un
problema en el esquema anterior es que, debido al requisito de
tener que transmitir el umbral de enmascaramiento o la función de
transmisión del filtro en el lado del codificador, en lo sucesivo
denominado prefiltro, el canal de transmisión se carga de una
manera relativamente elevada, a pesar de que los coeficientes de
filtrado solamente se transmiten cuando se sobrepasa un umbral
predeterminado.
Otra desventaja del esquema codificador anterior
es que, debido al hecho de que el umbral de enmascaramiento o su
inversa, tiene que hacerse disponible en el lado del descodificador
por el conjunto x_{#} de parámetros que va a transmitirse, tiene
que lograrse un compromiso entre una tasa de bits lo más baja
posible o una relación de compresión alta, por un lado, y una
aproximación o parametrización lo más precisa posible del umbral de
enmascaramiento o su inversa, por otro lado. Por tanto, es
inevitable que, mediante el esquema de codificación de audio
anterior, el ruido de cuantificación adaptado al umbral de
enmascaramiento sobrepase el umbral de enmascaramiento en algunos
intervalos de frecuencia y así lleve a interferencias de audio
audibles para el oyente. La Figura 13 muestra, por ejemplo, con la
curva c la respuesta de frecuencia parametrizada del filtro
parametrizable en el lado del descodificador. Como puede observarse,
hay zonas en las que la función de transmisión del filtro en el
lado del descodificador, denominado en lo sucesivo como postfiltro,
sobrepasa el umbral b de enmascaramiento. El problema se agrava
ahora por el hecho de que la parametrización sólo se transmite
intermitentemente en caso de una variación suficiente entre las
parametrizaciones y se interpola entremedias. Una interpolación de
los coeficientes x_{#} de filtrado, como se propone en el
artículo, solo lleva a interferencias audibles, cuando el valor a
de amplificación se mantiene constante de un nodo a otro o de una
nueva parametrización a otra nueva parametrización. Incluso si la
interpolación propuesta en el artículo se aplica también al valor
a_{#} de información secundaria, es decir a los valores de
amplificación transmitidos, los artefactos de audio audibles pueden
permanecer en la señal de audio entrante en el lado del
descodificador.
Otro problema con el esquema de codificación de
audio según las Figuras 12 ó 13, es que la señal filtrada puede,
debido a la filtración selectiva en frecuencia, adoptar una forma no
predecible, en la que particularmente debido a una superposición
aleatoria de muchas onda armónicas individuales, uno o varios
valores de audio individuales de la señal codificada se suman para
dar valores muy altos, que, a su vez, llevan a una relación de
compresión peor en la reducción de redundancia subsiguiente, debido
a su aparición poco frecuente.
El objetivo de la presente invención consiste en
crear un esquema de codificación de audio, que permita una
codificación que produce menores artefactos audibles.
Este objetivo se logra mediante un
procedimiento, según las reivindicaciones 13 ó 15, y un dispositivo
según las reivindicaciones 1 ó 14.
La codificación según la invención de una señal
de audio de una secuencia de valores de audio en una señal
codificada incluye determinar un primer umbral de escucha para un
primer bloque de valores de audio de la secuencia de valores de
audio y un segundo umbral de escucha para un segundo bloque de
valores de audio de la secuencia de valores de audio; calcular una
versión de una primera parametrización de un filtro parametrizable,
de modo que su función de transmisión corresponda aproximadamente a
la inversa de la magnitud del primer umbral de escucha y una
versión de una segunda parametrización del filtro parametrizable, de
modo que su función de transmisión corresponda aproximadamente a la
inversa de la magnitud del segundo umbral de escucha; determinar un
primer límite de potencia de ruido en función del primer umbral de
enmascaramiento y un segundo límite de potencia de ruido en función
del segundo umbral de enmascaramiento; así como filtrar de manera
parametrizable y ajustar a escala o amplificar un bloque
predeterminado de valores de audio de la secuencia (54) de valores
de audio, para obtener un bloque de valores de audio filtrados
ajustados a escala, que corresponde al bloque predeterminado,
comprendiendo la última etapa las siguientes etapas secundarias:
interpolar entre la versión de la primera parametrización y la
versión de la segunda parametrización, para obtener una versión de
una parametrización interpolada para un valor de audio
predeterminado en el bloque predeterminado de valores de audio;
interpolar entre el primer límite de potencia de ruido y el segundo
límite de potencia de ruido para obtener un límite de potencia de
ruido interpolado para el valor de audio predeterminado; determinar
un valor de escala intermedio en función del límite de potencia de
ruido interpolado; y aplicar el filtro parametrizable con la
versión de la parametrización interpolada y el valor de escala
intermedio al valor de audio predeterminado, para obtener uno de
los valores de audio filtros, ajustados a escala. Finalmente se
produce también una cuantificación de los valores de audio
filtrados, ajustados a escala, para obtener un bloque de valores de
audio filtrados, ajustados a escala, cuantificados; y una
integración de la información en la señal codificada a partir de la
cual puede derivarse el bloque de valores de audio filtrados,
ajustados a escala, cuantificados, la versión de la primera
parametrización, la versión de la segunda parametrización, el primer
límite de potencia de ruido y el segundo límite de potencia de
ruido.
La idea central de la presente invención es que
debe dependerse del modo de proceder anterior, es decir la
interpolación en los coeficientes de filtrado y el valor de
amplificación, para obtener partiendo de los nodos valores
interpolados para los valores de audio intermedios. Una codificación
que contiene menos artefacto audibles puede obtenerse sin
interpolar por ejemplo el valor de amplificación, sino más bien
tomando el límite de potencia derivado del umbral de
enmascaramiento, preferiblemente como el área por debajo del
cuadrado de la magnitud del umbral de enmascaramiento, para cada
nodo, es decir, para cada parametrización que se va a transmitir, y
luego realizando la interpolación entre estos límites de potencia de
nodos vecinos, tal como, por ejemplo, una interpolación lineal.
Tanto en el lado del codificador como del descodificador, puede
calcularse entonces un valor de amplificación a partir del valor
límite de potencia intermedio determinado, de modo que el ruido de
cuantificación causado por la cuantificación, que tiene una
frecuencia constante antes del postfiltrado que tiene lugar en el
lado del descodificador, está por debajo del límite de potencia o
corresponde al mismo, después del postfiltrado.
Se explicarán a continuación ejemplos de
realización preferidos de la presente invención en forma detallada,
con referencia a los dibujos adjuntos. Muestran:
la figura 1, un diagrama de bloques de un
codificador de audio, según un ejemplo de realización de la
presente invención;
la figura 2, un diagrama de flujo para ilustrar
el funcionamiento del codificador de audio de la Figura 1, en la
entrada de datos;
la figura 3, un diagrama de flujo para ilustrar
el funcionamiento del codificador de audio de la Figura 1, con
respecto a la evaluación de la señal de audio entrante, por un
modelo psicoacústico;
la figura 4, un diagrama de flujo para ilustrar
el funcionamiento del codificador de audio de la Figura 1, con
respecto a la aplicación de los parámetros obtenidos por el modelo
psicoacústico a la señal de audio entrante;
la figura 5a, un diagrama esquemático para
ilustrar la señal de audio entrante, la secuencia de valores de
audio de los que se compone la misma, y las etapas de funcionamiento
de la Figura 4, en relación a los valores de audio;
la figura 5b, un diagrama esquemático para
ilustrar la estructura de la señal codificada;
la figura 6, un diagrama de flujo para ilustrar
el modo de funcionamiento del codificador de audio de la Figura 1,
con respecto al procesamiento final hasta la señal codificada;
la figura 7a, un diagrama en el que se muestra
un ejemplo de realización de una función escalonada de
cuantificación;
la figura 7b, un diagrama en el que se muestra
otro ejemplo de realización de una función escalonada de
cuantificación;
la figura 8, un diagrama de bloques de un
descodificador de audio, que puede descodificar una señal de audio
codificada por el codificador de audio de la Figura 1, según un
ejemplo de realización de la presente invención;
la figura 9, un diagrama de flujo para ilustrar
el funcionamiento del descodificador de la Figura 8 en la entrada
de datos;
la figura 10, un diagrama de flujo para ilustrar
el funcionamiento del descodificador de la Figura 8 con respecto al
almacenamiento intermedio de los datos de audio filtrados,
cuantificados, predescodificados, y el procesamiento de los bloques
de audio, sin información secundaria correspondiente;
la figura 11, un diagrama de flujo para ilustrar
el funcionamiento del descodificador de la Figura 8, con respecto a
la filtración inversa real;
la figura 12, un diagrama esquemático para
ilustrar un esquema de codificación de audio convencional, con un
tiempo de retardo corto; y
la figura 13, un diagrama en el que se muestra a
modo de ejemplo un espectro de una señal de audio, su umbral de
escucha y la función de transmisión del postfiltro en el
descodificador.
La figura 1 muestra un codificador de audio
según un ejemplo de realización de la presente invención. Este
codificador de audio, que se indica generalmente por 10, comprende
en primer lugar una entrada 12 de datos, en la que recibe la señal
de audio que se va a codificar, la cual, como se explicará en mayor
detalle más adelante haciendo referencia a la figura 5a, consiste
en una secuencia de valores de audio o de muestreo, y una salida de
datos, en la que emite la señal codificada, cuyo contenido de
información se explicará en mayor detalle haciendo referencia a la
figura 5b.
El codificador 10 de audio de la figura 1 se
divide en una parte 16 de reducción de irrelevancia y una parte 18
de reducción de redundancia. La parte 16 de reducción de
irrelevancia comprende un medio 20 para establecer un valor de
escucha, un medio 22 para calcular un valor de amplificación, un
medio 24 para calcular una parametrización, un medio 26 de
comparación de nodos, un cuantificador 28 y un prefiltro 30
parametrizable así como un memoria intermedia FIFO
(first-in-first-out)
de entrada, una memoria intermedia o memoria 38 y un multiplicador
o un medio 40 de multiplicación. La parte 18 de reducción de
redundancia incluye un compresor 34 y un control 36 de la tasa de
bits.
La parte 16 de reducción de irrelevancia y la
parte 18 de reducción de redundancia están conectadas en serie en
este orden entre la entrada 12 de datos y la salida 14 de datos. En
particular, la entrada 12 de datos está unida con una entrada de
datos del medio 20 para determinar un umbral de entrada 12. Una
salida de datos del medio 20 para determinar un umbral de escucha
está unida a una entrada del medio 24 para calcular una
parametrización así como a una entrada de datos del medio 22 para
calcular un valor de amplificación, para transmitir a los mismos un
umbral de escucha determinado. Los medios 22 y 24 calculan una
parametrización o un valor de amplificación, basándose en el umbral
de escucha y están unidos con el medio 26 de comparación de nodos,
para transmitir al mismo estos resultados. El medio 26 de
comparación de nodos transmite, según un resultado de comparación,
tal como aún se explicará a continuación, los resultados calculados
por los medios 22 y 24 como parámetro de entrada o parametrización
al prefiltro 30 parametrizable. El prefiltro 30 parametrizable está
conectado entre una salida de datos de la memoria 32 intermedia de
entrada y una entrada de datos de la memoria 38 intermedia. Entre
una salida de datos de la memoria 38 intermedia y el cuantificador
28 está conectado el multiplicador 40. El cuantificador 28
transmite a la parte 18 de reducción de redundancia valores de
audio, dado el caso multiplicados o ajustados a escala, aunque en
cualquier caso filtrados, cuantificados, y concretamente de manera
exacta, a una entrada de datos del compresor 34. El medio 26 de
comparación de nodos transmite a la parte 18 de reducción de
redundancia información, a partir de la cual pueden derivarse los
parámetros de entrada transmitidos al prefiltro 30 parametrizable, y
concretamente de manera exacta a una entrada de datos adicional del
compresor 34. El control de la tasa de bits está unido mediante una
unión de control con una entrada de control del multiplicador 40,
para encargarse de que los valores de audio filtrados,
cuantificados, tal como se obtienen del prefiltro 30, se
multipliquen mediante el multiplicador 40 por un multiplicador
adecuado, tal como se explicará aún con más detalle a continuación.
El control 36 de la tasa de bits está conectado entre una salida de
datos del compresor 34 y la salida 14 de datos del codificador 10
de audio, para determinar adecuadamente el multiplicador para el
multiplicador 40. En la primera pasada de cada valor de audio por
el cuantificador 40, el multiplicador está ajustado en primer lugar
a un factor de escala adecuado, como por ejemplo 1. La memoria 38
intermedia almacena sin embargo además cada valor de audio
filtrado, para dar al control 36 de la tasa de bits la posibilidad,
tal como se describe a continuación, de cambiar el multiplicador
para una pasada adicional de un bloque de valores de audio. En caso
de no indicarse un cambio de este tipo mediante el control 36 de la
tasa de bits, entonces la memoria 38 intermedia puede liberar la
memoria ocupada por este bloque.
Después de haber descrito anteriormente la
estructura del codificador de audio de la figura 1, a continuación
se describirá su funcionamiento con referencia a las figuras 2 a
7b.
Tal como puede deducirse de la figura 2, la
señal de audio, cuando alcanza la entrada 12 de datos, ya se ha
obtenido mediante muestreo 50 de señales de audio a partir de una
señal de audio analógica. El muestreo de señales de audio se
realiza con una frecuencia de muestreo predeterminada, que
habitualmente se encuentra entre 32 - 48 kHz. En consecuencia, en
la entrada 12 de datos se encuentra una señal de audio, que se
compone de una secuencia de valores de muestreo o de audio. Aunque,
tal como resultará evidente a partir de la siguiente descripción,
la codificación de la señal de audio no tiene lugar basándose en
bloques, los valores de audio se agrupan en la entrada 12 de datos
en primer lugar, en una etapa 52, en bloques de audio. La agrupación
en bloques de audio se produce, tal como resulta evidente a partir
de la siguiente descripción, únicamente con el fin de determinar el
umbral de escucha y tiene lugar en una etapa de entrada del medio 20
para determinar un umbral de escucha. En el presente ejemplo de
realización se parte, a modo de ejemplo, de que en cada caso 128
valores de audio sucesivos se agrupan en bloques de audio, y que la
agrupación tiene lugar de tal manera que los bloques de audio
sucesivos por un lado no se superponen y, por otro lado, son
directamente adyacentes entre sí. Esto se explica de nuevo brevemente a modo de ejemplo mediante la figura 5a.
directamente adyacentes entre sí. Esto se explica de nuevo brevemente a modo de ejemplo mediante la figura 5a.
La figura 5a muestra con 54 la secuencia de
valores de muestreo, estando ilustrado cada valor de muestreo
mediante un rectángulo 56. Los valores de muestreo están numerados
para la ilustración, estando mostrados a su vez sólo algunos de los
valores de muestreo de la secuencia 54 por motivos de claridad. Tal
como se muestra mediante corchetes por encima de la secuencia 54,
según el presente ejemplo de realización en cada caso 128 valores
de muestreo sucesivos están agrupados en un bloque, formando los 128
valores de muestreo directamente siguientes el siguiente bloque.
Sólo por precaución se indica que la agrupación en bloques también
podría realizarse de otra manera, por ejemplo mediante bloques que
se superponen o bloques distanciados y bloques con otro tamaño de
bloque, aunque de nuevo se prefiere el tamaño de bloque de 128,
porque proporciona un buen compromiso entre por un lado una calidad
de audio elevada y, por otro lado, un tiempo de retardo lo más bajo
posible.
Mientras que los bloques de audio agrupados en
la etapa 52 en el medio 20 se procesan por bloques en el medio 20
para determinar un umbral de escucha, en la memoria 32 intermedia de
entrada los valores de audio entrantes se almacenan 54 de manera
intermedia hasta que el prefiltro 30 parametrizable haya obtenido
del medio 26 de comparación de nodos parámetros de entrada, para
efectuar un prefiltrado, tal como aún se describirá a
continuación.
Tal como se deduce de la figura 3, el medio 20
para determinar un umbral de escucha comienza su procesamiento
directamente después de que hayan entrado suficientes valores de
audio en la entrada 12 de datos, para formar un bloque de audio o
formar el bloque de audio siguiente, lo que supervisa el medio 20
mediante una comprobación en la etapa 60. En caso de no existir aún
un bloque de audio completo que pueda procesarse, entonces el medio
20 espera. En caso de existir un bloque de audio completo para
procesarse, entonces el medio 20 para determinar un umbral de
escucha calcula en una etapa 62, basándose en un modelo
psicoacústico adecuado, en una etapa 62 un umbral de escucha. Para
ilustrar el umbral de escucha de nuevo se hace referencia a la
figura 12 y especialmente a la curva b, que se ha obtenido
basándose en un modelo psicoacústico por ejemplo con referencia a un
bloque de audio actual con un espectro a. El umbral de
enmascaramiento, que se determina en la etapa 62, es una función
dependiente de la frecuencia, que puede variar para bloques de audio
sucesivos, y también puede variar claramente de una señal de audio
a otra, como por ejemplo de composiciones de música rock a
composiciones de música clásica. El umbral de escucha indica para
cada frecuencia un valor umbral, por debajo del que el oído humano
no puede percibir interferencias.
En una etapa 64 posterior, el medio 24 y el
medio 22 calculan a partir del umbral M(f) de escucha
calculado (indicando f la frecuencia) un valor a de amplificación o
un conjunto de parámetros de N parámetros x(i) (i=1, ...,
N). La parametrización x(i), que calcula el medio 24 en la
etapa 64, está prevista para el prefiltro 30 parametrizable, que
por ejemplo se realiza en una estructura coeficientes de filtrado
adaptativo, tal como se utiliza en la codificación LPC (LPC =
linear predictive coding = codificación predictiva lineal).
Sean por ejemplo s(n), con n=0, ... 127, los 128 valores de
audio del bloque de audio en ese momento y s'(n) los 128 valores de
audio filtrados que se obtienen, entonces el filtro se realiza por
ejemplo de tal manera que se cumple la siguiente ecuación:
siendo K el orden del filtro y
a^{t}_{k} con k = 1, ..., K, los coeficientes de filtrado e
ilustrando el índice t que los coeficientes de filtrado varían en
bloques de audio sucesivos. El medio 24 calcula ahora la
parametrización a^{t}_{k} de tal manera, que la función
H(f) de transmisión del prefiltro 30 parametrizable es
aproximadamente igual a la inversa de la magnitud del umbral
M(f) de enmascaramiento, es decir de manera que es
válido:
ilustrando a su vez la dependencia
de t que, para diferentes bloques de audio, el umbral M(f) de
enmascaramiento varía. En la implementación del prefiltro 30 como
el filtro adaptativo explicado anteriormente, los coeficientes
a^{t}_{k} coeficientes de filtrado se obtienen de la siguiente
manera: la transformada de Fourier discreta inversa de
|M(f, t)|^{2} con respecto a la frecuencia para
el bloque en el instante t da lugar a la función de autocorrelación
objetivo r^{t}_{mm}(i). Entonces se obtienen los
a^{t}_{k} resolviéndose el sistema de ecuaciones
lineal:
Sin embargo, para que en la interpolación lineal
descrita aún con más detalle a continuación, entre las
parametrizaciones no aparezcan inestabilidades, se utiliza
preferiblemente para el filtro 30 una estructura reticular,
reparametrizándose los coeficientes de filtrado para la estructura
reticular en coeficientes de reflexión. Con respecto a detalles más
exactos en relación a la configuración del prefiltro, el cálculo de
los coeficientes y la reparametrización se hace referencia al
artículo de Schuller, etc. mencionado en la introducción de la
descripción y especialmente a la página 381, apartado III, que por
la presente se incluye como referencia a este respecto.
Mientras que a continuación el medio 24 calcula
una parametrización para el prefiltro 30 parametrizable de tal
manera que su función de transmisión es igual a la inversa del
umbral de enmascaramiento, el medio 22 calcula basándose en el
umbral de escucha un límite de potencia de ruido, concretamente un
límite que indica qué potencia de ruido puede introducir el
cuantificador 28 en la señal de audio filtrada mediante el prefiltro
30, para que el ruido de cuantificación se encuentre, tras el
filtrado inverso o postfiltrado en el lado del descodificador, por
debajo del umbral M(f) de escucha o exactamente sobre el
mismo. El medio 22 calcula este límite de potencia de ruido como el
área por debajo del cuadrado de la magnitud del umbral M de escucha,
es decir como \Sigma|(M(f)|^{2}. El
medio 22 calcula el valor a de amplificación a partir del límite de
potencia de ruido, calculando la raíz a partir de la fracción de
potencia de ruido de cuantificación entre límite de potencia de
ruido. El ruido de cuantificación es el ruido provocado por el
cuantificador 28. El ruido provocado por el cuantificador 28, tal
como aún se describirá, es ruido blanco y por tanto dependiente de
la frecuencia. La potencia de ruido de cuantificación es la
potencia del ruido de cuantificación.
Tal como resultó evidente a partir de la
descripción anterior, el medio 22 calcula, además del valor a de
amplificación, también el límite de potencia de ruido. Aunque es
posible que el medio 26 de comparación de nodos calcule de nuevo el
límite de potencia de ruido a partir del valor a de amplificación
obtenido por el medio 22, es además posible, que el medio 22,
además del valor a de amplificación del medio 26 de comparación de
nodos, transmita también simultáneamente el límite de potencia de
ruido determinado.
Tras el cálculo del valor de amplificación así
como de la parametrización, el medio 26 de comparación de nodos
comprueba a continuación en una etapa 66, si la parametrización
recién calculada se diferencia de la parametrización actual,
transmitida por último al prefiltro parametrizable, en más de un
umbral predeterminado. En caso de que la comprobación en la etapa
66 lleve a que la parametrización recién calculada se diferencia en
más del umbral predeterminado de la actual, entonces en el medio 26
de comparación de nodos los coeficientes de filtrado recién
calculados y el límite de potencia de ruido o el valor de
amplificación recién calculado se almacenan de manera intermedia
para una interpolación que aún se explicará y el medio 26 de
comparación de nodos transmite en una etapa 68 los coeficientes de
filtrado recién calculados y en una etapa 70 el valor de
amplificación recién calculado al prefiltro 30. Sin embargo, si este
no es el caso, y la parametrización recién calculada no se
diferencia en más del umbral predeterminado de la actual, entonces
el medio 26 de comparación de nodos transmite al prefiltro 30 en la
etapa 72, en lugar de la parametrización recién calculada, sólo la
parametrización de nodos actual, es decir aquella parametrización
que la última vez llevó en la etapa 66 a un resultado positivo, por
tanto, que se diferenció en más de un umbral predeterminado de una
parametrización de nodos anterior. Tras las etapas 70 y 72 el
proceso de la figura 3 vuelve al procesamiento del siguiente bloque
de audio, es decir a la consulta 60.
En caso de que la parametrización recién
calculada no se diferencie de la parametrización de nodos actual y
por tanto, el prefiltro 30 en la etapa 72 vuelva a obtener la
parametrización de nodos ya obtenida anteriormente para al menos el
último bloque de audio, entonces el prefiltro 30 aplica esta
parametrización de nodos a todos los valores de muestreo de este
bloque de audio situado en la FIFO 32, tal como se describirá aún a
continuación con más detalle, por lo que este bloque actual se toma
de la FIFO 32 y el cuantificador 28 recibe un bloque de audio de
valores de audio prefiltrados resultante.
La figura 4 representa el modo de funcionamiento
del prefiltro 30 parametrizable con más detalle para el caso en el
que éste obtiene la parametrización recién calculada y el valor de
amplificación recién calculado, porque los mismos se diferencian lo
suficiente de la parametrización de nodos actual. Por tanto, tal
como se ha descrito haciendo referencia a la figura 3, para cada uno
de los bloques de audio sucesivos no se produce un procesamiento
según la figura 4, sino sólo para bloques de audio, en los que la
parametrización correspondiente se diferenció lo suficiente de la
parametrización de nodos actual. Los otros bloques de audio, tal
como acaba de describirse, se prefiltran aplicándose la
parametrización de nodos actual en cada caso y el valor de
amplificación actual en cada caso correspondiente, a todos los
valores de muestreo de estos bloques de audio. En una etapa 80 el
prefiltro 30 parametrizable supervisa ahora si ha tenido lugar una
transmisión de los coeficientes de filtrado recién calculados del
medio 26 de comparación de nodos o de parametrizaciones de nodos
anteriores. El prefiltro 30 realiza la supervisión 80 hasta que haya
tenido lugar una transmisión de este tipo.
Una vez que ha tenido lugar una transmisión de
este tipo, el prefiltro 30 parametrizable comienza con el
procesamiento del bloque de audio actual de valores de audio, que
ahora se encuentra en la memoria 32 intermedia, es decir aquél para
el que acaba de calcularse la parametrización. En la figura 5a se ha
ilustrado por ejemplo que todos los valores 56 de audio ya se han
procesado antes del valor de audio con el número 0 y por ello, ya
han pasado por la memoria 32. El procesamiento del bloque de valores
de audio antes del valor de audio con el número 0 se activó en
aquel momento, porque la parametrización, que se había calculado
para el bloque de audio antes del bloque 0, concretamente
x_{0}(i), se diferenció en más del umbral predeterminado
de la parametrización de nodos transmitida anteriormente al
prefiltro 30. La parametrización x_{0}(i) es por tanto
una parametrización de nodos, tal como se denomina en la presente
invención. El procesamiento de los valores de audio en el bloque de
audio antes del valor de audio 0 se realizó basándose en el conjunto
a_{0}, x_{0}(i) de parámetros.
En la figura 5a se parte de que la
parametrización, que se ha calculado para el bloque 0 con los
valores de audio 0-127, se diferenció en menos del
umbral predeterminado de la parametrización x_{0}(i), que
se refería al bloque anterior. Por tanto, este bloque 0 también se
tomó ya por el prefiltro 30 de la FIFO 32, se procesó de la misma
manera con respecto a todos sus valores de muestreo
0-127 por medio de la parametrización
x_{0}(i) añadida en la etapa 72, como se indica mediante la
flecha 81 descrita con "aplicación directa" y luego se
transmitió al cuantificador 28.
La parametrización calculada para el bloque 1
que todavía se encuentra en la FIFO 32 se diferenció sin embargo,
según el ejemplo ilustrativo de la figura 5a, en cambio en más del
umbral predeterminado de la parametrización x_{0}(i) y por
tanto se transmitió al prefiltro 30 en la etapa 68 como
parametrización x_{1}(i) junto con el valor a_{1} de
amplificación (etapa 70) y, dado el caso, el límite de potencia de
ruido correspondiente, debiendo ser los índices de a y x en la
figura 5a un índice para los nodos, tal como se utilizan en la
interpolación que posteriormente se explicará, que se realiza con
respecto a los valores de muestreo 128-255 en el
bloque 1, se simboliza mediante una flecha 82 y se realiza mediante
las etapas que siguen a partir de la etapa 80 en la figura 4. Con
la aparición del bloque de audio con el número 1 comenzaría en
consecuencia el procesamiento en la etapa 80.
En el momento de la transmisión del conjunto
a_{1}, x_{1} de parámetros, en la memoria 32 sólo se encuentran
todavía en consecuencia los valores 128-255 de
audio, es decir el bloque de audio actual después del bloque 0 de
audio procesado en último lugar por el prefiltro 30. Después de que
ahora se haya determinado la transmisión de parámetros
x_{1}(i) de nodos en la etapa 80, el prefiltro 30 determina
en la etapa 84 el límite q_{1} de potencia de ruido
correspondiente al valor a_{1} de amplificación. Esto puede
producirse porque el medio 26 de comparación de nodos transmite
este valor al prefiltro 30, o mediante un nuevo cálculo de este
valor por el prefiltro 30, tal como se ha descrito anteriormente
con referencia a la etapa 64.
Después, en una etapa 86, se inicializa un
índice j a un valor de muestreo, para indicar el valor de muestreo
más antiguo que queda en la memoria 32 FIFO o el primer valor de
muestreo del bloque de audio actual "bloque 1", es decir en el
presente ejemplo de la figura 5a, el valor de muestreo 128. En una
etapa 88 el prefiltro parametrizable realiza una interpolación
entre los coeficientes x_{0} y x_{1} de filtrado, valiendo a
este respecto la parametrización x_{0} como valor de nodo en el
nodo con el número de valor de audio 127 del bloque 0 anterior y la
parametrización x_{1} como valor de nodo en el nodo con el número
de valor de audio 255 del bloque 1 actual. Estas posiciones 127 y
255 de valor de audio se designan a continuación también como nodo
0 y nodo 1, estando indicadas en la figura 5a las parametrizaciones
de nodo referentes a los nodos mediante las flechas 90 y 92.
El prefiltro 30 parametrizable realiza en la
etapa 88 la interpolación de los coeficientes x_{0}, x_{1} de
filtrado entre los dos nodos en forma de una interpolación lineal,
para obtener el coeficiente de filtrado interpolado en la posición
j de muestreo, es decir x(t_{j})(i) con i=1 ... N.
Después, concretamente en la etapa 90, el
prefiltro 30 parametrizable realiza una interpolación entre el
limite q_{1} y q_{0} de potencia de ruido, para obtener un
límite de potencia de ruido interpolado en la posición j de
muestreo, es decir q(t_{j}).
En una etapa 92 el prefiltro parametrizable
calcula a continuación el valor de amplificación para la posición j
de muestreo basándose en el límite de potencia de ruido interpolado
y en la potencia de ruido de cuantificación así como
preferiblemente también en el coeficiente de filtrado interpolado,
concretamente por ejemplo en función de la raíz de
{}\hskip17cm \frac{Potencia \ de \ ruido \ de \ cuantificación}{q(t_{j})}, remitiéndose para ello a las realizaciones con respecto a la etapa 64 de la
figura 3.
{}\hskip17cm \frac{Potencia \ de \ ruido \ de \ cuantificación}{q(t_{j})}, remitiéndose para ello a las realizaciones con respecto a la etapa 64 de la
figura 3.
En una etapa 94, a continuación el prefiltro 30
parametrizable aplica el valor de amplificación calculado así como
los coeficientes de filtrado interpolados al valor de muestreo en la
posición j de muestreo, para obtener un valor de muestreo filtrado
para esta posición de muestreo, concretamente s'(t_{j}).
En una etapa 96 el prefiltro 30 parametrizable
comprueba a continuación si la posición j de muestreo ha alcanzado
el nodo actual, es decir el nodo 1, en el caso de la figura 5a, la
posición 255 de muestreo, es decir el valor de muestreo, para el
que debe valer directamente, es decir sin interpolación, la
parametrización transmitida al prefiltro 30 parametrizable junto
con el valor de amplificación. Si este no es el caso, entonces el
prefiltro 30 parametrizable aumenta o incrementa el índice j en 1,
repitiéndose de nuevo las etapas 88-96. Sin
embargo, en caso de que la comprobación en la etapa 96 resulte
positiva, entonces en la etapa 100 el prefiltro parametrizable
aplica el valor de amplificación transmitido en último lugar por el
medio 26 de comparación de nodos y los coeficientes de filtrado
transmitidos en último lugar por el medio 26 de comparación de nodos
directamente sin interpolación al valor de muestreo en el nuevo
nodo, tras lo que el bloque actual, es decir, en el presente caso,
el bloque 1, se ha terminado de procesar, y el proceso se realiza de
nuevo en la etapa 80 con respecto al bloque siguiente que va a
procesarse que, en función de que la parametrización del siguiente
bloque de audio, bloque 2, se distinga lo suficiente de la
parametrización x_{1}(i), dado el caso por tanto puede ser
este bloque de audio siguiente, bloque 2, o sin embargo un bloque de
audio
posterior.
posterior.
Antes de que con respecto a la figura 5 se
describa el procedimiento adicional en el procesamiento de los
valores s' de muestreo filtrados, a continuación se describen el fin
y el trasfondo de la manera de proceder según las figuras 3 y 4. El
sentido y el fin del filtrado consisten en filtrar la señal de audio
en la entrada 12 con un filtro adaptativo, cuya función de
transmisión está adaptada continuamente de la manera más óptima
posible a la inversa del umbral de escucha, que también varía en el
tiempo. El motivo de ello se basa en que, en el lado del
descodificador, el filtrado inverso mediante un filtro adaptativo,
cuya función de transmisión está adaptada por consiguiente
continuamente al umbral de escucha, forma el ruido de cuantificación
blanco introducido mediante una cuantificación de la señal de audio
filtrada, es decir el ruido de cuantificación constante en
frecuencia, concretamente adaptado a la forma del umbral de
escucha.
La aplicación del valor de amplificación en las
etapas 94 y 100 en el prefiltro 30 consiste en una multiplicación
de la señal de audio o de la señal de audio filtrada, es decir, de
los valores s de muestreo o de los valores s' de muestreo
filtrados, por el factor de amplificación. El fin consiste en de
este modo ajustar lo más alto posible el ruido de cuantificación,
que se introduce en la señal de audio filtrada mediante la
cuantificación descrita detalladamente a continuación, y que se
adapta mediante el filtrado inverso en el lado del descodificador a
la forma del umbral de escucha, de manera que, aún así, no sobrepase
el umbral de escucha. Esto puede ejemplificarse mediante la fórmula
de Parseval, según la cual el cuadrado de la magnitud de una
función es igual al cuadrado de la magnitud de la transformada de
Fourier. Cuando por tanto en el lado del descodificador vuelve a
realizarse la multiplicación de la señal de audio en el prefiltro
por el valor de amplificación en sentido inverso, dividiéndose la
señal de audio filtrada entre el valor de amplificación, se reduce
por tanto igualmente la potencia de ruido de cuantificación,
concretamente por el factor a^{-2}, siendo a el valor de
amplificación. En consecuencia, mediante la aplicación del valor de
amplificación en el prefiltro 30 puede ajustarse la potencia de
ruido de cuantificación a la altura óptima, lo que es lo mismo que
aumentar el incremento de cuantificación y por tanto reducir el
número de los escalones de cuantificación que deben codificarse, lo
que a su vez aumenta la compresión en la parte de reducción de
redundancia subsiguiente.
Expresado de otro modo, el efecto del prefiltro
puede considerarse como una normalización de la señal en su umbral
de enmascaramiento, de manera que el nivel de las interferencias de
cuantificación o del ruido de cuantificación puede mantenerse
constante tanto en tiempo como en frecuencia. Puesto que la señal de
audio se encuentra en el dominio temporal, la cuantificación puede
por tanto realizarse gradualmente con una cuantificación constante
uniforme, tal como aún se describirá a continuación. De esta manera
se elimina de manera ideal cualquier irrelevancia de la señal de
audio, y puede emplearse un esquema de compresión sin pérdida para
eliminar también la redundancia que queda en la señal de audio
prefiltrada y cuantificada, tal como aún se describirá a
continuación.
Con ayuda de la figura 5a se destacará
adicionalmente una vez más claramente que, naturalmente, los
coeficientes de filtrado y los valores a_{0}, a_{1}, x_{0},
x_{1} de amplificación empleados deben estar a disposición en el
lado del descodificador como información secundaria, pero que el
esfuerzo de transmisión se reduce a este respecto porque no se
emplean de nuevo nuevos coeficientes de filtrado y nuevos valores de
amplificación simplemente para cada bloque. Más bien tiene lugar
una comprobación 66 del valor umbral para transmitir las
parametrizaciones como información secundaria sólo en caso de
variación de parametrización suficiente y, en caso contrario, no se
transmiten la información secundaria o las parametrizaciones. En los
bloques de audio, para los que se transmitieron las
parametrizaciones, tiene lugar por la zona de estos bloques una
interpolación de la parametrización antigua con respecto a la
nueva. La interpolación de los coeficientes de filtrado tiene lugar
de la manera descrita anteriormente con referencia a la etapa 88. La
interpolación, con respecto a la amplificación, tiene lugar dando
un rodeo, concretamente a través de una interpolación 90 lineal del
límite q_{0}, q_{1} de potencia de ruido. En comparación con
una interpolación directa a través del valor de amplificación, la
interpolación lineal conduce, con respecto al límite de potencia de
ruido, a un mejor resultado de escucha o a menos artefactos
audibles.
A continuación se describe ahora con ayuda de la
figura 6 el procesamiento posterior de la señal prefiltrada o
filtrada previamente, que comprende esencialmente una cuantificación
y una reducción de redundancia. En primer lugar se almacenan los
valores de muestreo filtrados proporcionados por el prefiltro 30
parametrizable en la memoria 38 intermedia y, al mismo tiempo, se
pasan desde la memoria 38 intermedia al multiplicador 40, en el
que, a su vez, puesto que se trata de su primera pasada, se reenvían
en primer lugar sin modificar, concretamente con un factor de
escala de uno, a través del multiplicador 40 al cuantificador 28.
Allí los valores de audio filtrados se cortan por encima de un
límite superior en una etapa 110 y a continuación se cuantifican en
una etapa 112. Las dos etapas 110 y 112 se realizan por el
cuantificador 28. Especialmente las dos etapas 110 y 112 se
realizan por el cuantificador 28 preferiblemente en una etapa,
cuantificando los valores s' de audio filtrados con una función
escalonada de cuantificación, que representa los valores s'
muestreados filtrados presentes por ejemplo en una representación de
coma flotante con respecto a una pluralidad de valores o índices
escalonados de cuantificación de número entero y que transcurre de
manera plana a partir de un cierto valor umbral para los valores de
muestreo filtrados, de manera que los valores de muestreo filtrados
que son superiores al valor umbral se cuantifican en el mismo
escalón de cuantificación. Un ejemplo de una función escalonada de
cuantificación de este tipo está representado en la figura 7a.
Los valores de muestreo filtrados cuantificados
se indican en la figura 7a con \sigma'. La función escalonada de
cuantificación es preferiblemente una función escalonada de
cuantificación con incrementos constantes por debajo del valor
umbral, es decir, el salto al siguiente escalón de cuantificación
siempre tiene lugar después de un intervalo constante a lo largo de
los valores S' de entrada. En la implementación se ajusta el
incremento al valor umbral de tal manera que el número de escalones
de cuantificación corresponde preferiblemente a una potencia de 2.
En comparación con la representación de coma flotante de los valores
s' de muestreo filtrados entrantes, el valor umbral es más pequeño
de manera que un valor máximo de la zona representable de la
representación de coma flotante sobrepasa el valor umbral.
El motivo para el valor umbral consiste en que
se ha observado que la señal de audio filtrada, producida por el
prefiltro 30, presenta valores de audio aislados que se suman,
debido a una acumulación no favorable de armónicos, para dar
valores muy grandes. Además se ha observado que un corte de estos
valores, tal como se logra mediante la función escalonada de
cuantificación mostrada en la figura 7a, lleva a una reducción de
datos alta, pero sólo a un perjuicio mínimo de la calidad de audio.
Más bien, estos puntos aislados aparecen en la señal de audio
filtrada de manera artificial mediante el filtrado selectivo en
frecuencia en el filtro 30 parametrizable, de manera que un corte
de los mismos perjudica la calidad de audio sólo mínimamente.
Un ejemplo algo más concreto para la función
escalonada de cuantificación mostrada en la figura 7a sería una que
hasta el valor umbral redondea todos los valores s' de muestreo
filtrados hacia el siguiente número entero, y a partir de entonces
cuantifica todos los valores de muestreo filtrados situados por
encima en el escalón de cuantificación más alto, como por ejemplo
256. Este caso se representa en la figura 7a.
Otro ejemplo de una posible función escalonada
de cuantificación sería el mostrado en la figura 7b. Hasta el valor
umbral, la función escalonada de cuantificación de la figura 7b
corresponde a la de la figura 7a. Sin embargo, en lugar de
transcurrir abruptamente plana para valores s' de muestreo por
encima del valor umbral, la función escalonada de cuantificación
sigue transcurriendo con una pendiente, que es más pequeña que la
pendiente en la zona por debajo del valor umbral. Expresado de otro
modo, por encima del valor umbral, el incremento de cuantificación
es mayor. De este modo se logra un efecto similar que con la función
de cuantificación de la figura 7a, pero por un lado con más
esfuerzo debido a los diferentes incrementos de la función
escalonada de cuantificación por encima y por debajo del valor
umbral y, por otro lado, una mejor calidad de audio, porque no se
cortan totalmente valores s' de audio filtrados muy altos, sino que
únicamente se cuantifican con un incremento de cuantificación
mayor.
Tal como ya se ha descrito anteriormente, en el
lado del descodificador no sólo deben estar disponibles los valores
\sigma' de audio cuantificados y filtrados, sino además también
los parámetros de entrada para el prefiltro 30, en los que se ha
basado el filtrado de estos valores, concretamente la
parametrización de nodos incluyendo una indicación del valor de
amplificación correspondiente. En una etapa 114, el compresor 34
emprende por tanto un primer intento de compresión y comprime con
esto información secundaria que contiene los valores a_{0} y
a_{1} de amplificación en los nodos, como por ejemplo 127 y 255,
así como los coeficientes x_{0} y x_{1} de filtrado en los
nodos y los valores \sigma' de muestreo filtrados, cuantificados
en una señal filtrada provisional. El compresor 34 es a este
respecto un codificador que funciona sin pérdida, como por ejemplo
un codificador Huffman o aritmético con o sin predicción y/o
adaptación.
La memoria 38, por la que pasan los valores
\sigma' de audio muestreados, sirve como memoria intermedia para
un tamaño adecuado de bloque con el que el compresor 34 procesa los
valores \sigma' de audio filtrados, cuantificados producidos por
el cuantificador 28 y, ajustados a escala dado el caso tal como se
describen a continuación. El tamaño de bloque puede diferenciarse
del tamaño de bloque de los bloques de audio, tal como los empleados
por el medio 20.
Tal como ya se ha mencionado para el primer
intento de compresión, el control 36 de la tasa de bits activa el
multiplicador 40 con un multiplicador de 1, de manera que los
valores de audio filtrados por el prefiltro 30 llegan sin modificar
al cuantificador 28 y desde allí, como valores de audio filtrados,
cuantificados, al compresor 34. El compresor 34 supervisa, en una
etapa 116, si un cierto tamaño de bloque de compresión, es decir,
un cierto número de valores de audio muestreados, cuantificados, se
ha codificado en la señal codificada provisional, o si deben
codificarse otros valores \sigma' de audio filtrados,
cuantificados en la señal codificada provisional actual. Si no se
llega al tamaño del bloque de compresión, el compresor 34 sigue
realizando la compresión 114 actual. Sin embargo, si se llega al
tamaño del bloque de compresión, en una etapa 118 el control 36 de
la tasa de bits comprueba si la cantidad de bits necesaria para la
compresión es mayor que una cantidad de bits preestablecida por una
tasa de bits deseada. Si este no es el caso, el control 36 de la
tasa de bits comprueba en una etapa 120, si la cantidad de bits
necesaria es más pequeña que la cantidad de bits preestablecida por
la tasa de bits deseada. Si este es el caso, el control 36 de la
tasa de bits añade bits de relleno a la señal codificada en la
etapa 122, hasta que se consigue la cantidad de bits preestablecida
por la tasa de bits deseada. A continuación, en la etapa 124 se
produce la salida de la señal codificada. Alternativamente a la
etapa 122, el control 36 de la tasa de bits podría transmitir el
bloque de compresión de valores \sigma' de audio filtrados
todavía almacenado en la memoria 38, que en última instancia es la
base de la compresión, en forma multiplicada por un multiplicador
superior a 1 por el multiplicador 40, al cuantificador 28 para
realizar de nuevo las etapas 110 a 118, hasta que se logra la
cantidad de bits preestablecida por la tasa de bits deseada, tal
como se muestra por una etapa 125 en línea discontinua.
Sin embargo, si la comprobación en la etapa 118
da como resultado que la cantidad de bits necesaria es mayor que la
preestablecida por la tasa de bits deseada, el control 36 de la tasa
de bits modifica el multiplicador para el multiplicador 40 hasta un
factor entre 0 y 1 exclusivamente. Esto se realiza en la etapa 126.
Tras la etapa 126, el control 36 de la tasa de bits se encarga de
que la memoria 38 produzca de nuevo el último bloque de compresión
de valores \sigma' de audio filtrados en el que se basa la
compresión, multiplicándose los mismos a continuación por el factor
ajustado en la etapa 126 y alimentándose de nuevo al cuantificador
28, después de lo cual vuelven a realizarse las etapas 110 a 118 y
se desecha la señal codificada hasta entonces de manera
provisional.
Se indica a este respecto que, en la realización
repetida de las etapas 110 a 116 en la etapa 114 se integra
naturalmente también el factor empleado en la etapa 126 (o en la
etapa 125) en la señal codificada.
El fin del modo de proceder según la etapa 126
consiste en que, mediante el factor, se aumenta el incremento
efectivo del cuantificador 28. Esto significa que el ruido de
cuantificación resultante se encuentra de manera uniforme por
encima del umbral de enmascaramiento, lo que lleva a interferencias
audibles o a ruido audible, pero que sin embargo produce una tasa
de bits reducida. Si tras la realización repetida de las etapas 110
a 116, en la etapa 118 se determina de nuevo que la cantidad de bits
necesaria es superior a la preestablecida por la tasa de bits
deseada, el factor en la etapa 126 se reduce adicionalmente,
etc.
Cuando los datos se proporcionan finalmente en
la etapa 124 como señal codificada, se realiza el siguiente bloque
de compresión de los valores \sigma' de audio filtrados,
cuantificados subsiguientes.
Se indica a este respecto además que también
podría emplearse otro valor preinicializado para el factor de
multiplicación distinto de 1, concretamente por ejemplo 1. Entonces,
en cualquier caso tendría lugar previamente, es decir arriba del
todo en la figura 6, un ajuste a escala.
La figura 5b ilustra de nuevo la señal
codificada producida, que se indica en general con 130. La señal
codificada comprende información secundaria y datos principales
intermedios. La información secundaria comprende, tal como se ya se
ha mencionado, información a partir de la cual puede derivarse el
valor del valor de amplificación y el valor de los coeficientes de
filtrado para bloques de audio especiales, concretamente bloques de
audio en los que se ha producido en la secuencia de bloques de audio
una variación importante en los coeficientes de filtrado. Dado el
caso, la información secundaria comprende además otra información
que se refiere al valor de amplificación empleado para el control
de bits. Debido a la dependencia mutua entre valor de amplificación
y límite q de potencia de ruido, la información secundaria puede
comprender opcionalmente, además del valor a_{#} de amplificación
para un nodo # también el límite q_{#} de potencia de ruido, o
también sólo este último. Dentro de la señal codificada está
dispuesta la información secundaria preferiblemente de tal manera
que la información secundaria para los coeficientes de filtrado y el
valor de amplificación correspondiente o el límite de potencia de
ruido correspondiente está dispuesta antes de los datos principales
para el bloque de audio de valores \sigma' de audio filtrados,
cuantificados, a partir del que se han derivado estos coeficientes
de filtrado con el valor de amplificación correspondiente o el
límite de potencia de ruido correspondiente, es decir, la
información a_{0}, x_{0}(i) secundaria después del bloque
-1 y la información a_{1}, x_{1}(i) secundaria después
del bloque 1. Expresado de otro modo, los datos principales, es
decir, los valores \sigma' de audio filtrados, cuantificados
desde exclusivamente un bloque de audio del tipo en el que se ha
producido una variación importante en la secuencia de bloques de
audio en los coeficientes de filtrado, hasta inclusive el siguiente
bloque de audio de este tipo, en la figura 5b por ejemplo los
valores \sigma'(t_{0}) - \sigma'(t_{255}) de audio, siempre
están dispuestos entre el bloque 132 de información secundaria para
el primero de estos dos bloques de audio (bloque -1) y el otro
bloque 134 de información secundaria para el segundo de estos dos
bloques de audio (bloque 1). Los valores \sigma'(t_{0}) -
\sigma'(t_{127}) de audio se han obtenido o pueden
descodificarse tal como se mencionó anteriormente en referencia a
la figura 5a, únicamente mediante la información 132 secundaria,
mientras que los valores \sigma'(t_{128}) -
\sigma'(t_{255}) de audio se han obtenido mediante interpolación
mediante la información 132 secundaria como valores de nodo en el
nodo con el número 127 de valor de muestreo y mediante la
información 134 secundaria como valores de nodo en el nodo con el
número 255 de valor de muestreo y, por tanto, sólo pueden
descodificarse mediante ambas informaciones secundarias.
Además, la información secundaria relativa al
valor de amplificación o al límite de potencia de ruido y los
coeficientes de filtrado no se integran siempre independientemente
unas de otras en cada bloque 132 y 134 de información secundaria.
Más bien, esta información secundaria se transmite en diferencias al
bloque de información secundaria precedente. En la figura 5b, el
bloque 132 de información secundaria contiene a modo de ejemplo el
valor a_{0} de amplificación y el coeficiente x_{0} de filtrado
relativos al nodo para el instante t_{-1}. En el bloque 132 de
información secundaria pueden derivarse estos valores a partir del
propio bloque. Sin embargo, a partir del bloque 134 de información
secundaria ya no puede derivarse la información secundaria relativa
a los nodos en el instante t_{255} únicamente a partir de este
bloque. Más bien, el bloque 134 de información secundaria comprende
únicamente información sobre diferencias del valor a_{1} de
amplificación del nodo en el instante t_{255} con respecto al
valor de amplificación del nodo en el instante t_{0} y las
diferencias de los coeficientes x_{1} de filtrado con respecto a
los coeficientes x_{0} de filtrado. El bloque 134 de información
secundaria contiene por consiguiente únicamente la información para
a_{1} - a_{0} y x_{1}(i) - x_{0}(i). Sin
embargo, para los instantes intermitentes los coeficientes de
filtrado y el valor de amplificación o el límite de potencia de
ruido deberían transmitirse completamente y no sólo como diferencia
al nodo precedente, como por ejemplo cada segundo para permitir a
un receptor o descodificador unirse a un flujo en curso de datos de
codificación, tal como aún se expondrá a continuación.
Este tipo de integración de la información
secundaria en los bloques 132 y 134 de información secundaria
ofrece la ventaja de la posibilidad de una tasa de compresión
superior. El motivo de esto es que, aunque la información
secundaria sólo se transmite en la medida de lo posible cuando se ha
producido una variación suficiente de los coeficientes de filtrado
con respecto a los coeficientes de filtrado de un nodo precedente,
merece la pena el esfuerzo de la formación de la diferencia en el
lado del codificador o la formación de la suma en el lado del
descodificador, porque las diferencias producidas son pequeñas a
pesar de la consulta en la etapa 66, para así permitir ventajas en
la codificación de entropía.
Después de haber descrito anteriormente un
ejemplo de realización para un codificador de audio, a continuación
se describirá un ejemplo de realización para un descodificador de
audio adecuado para descodificar la señal codificada creada por el
codificador 10 de audio de la figura 1 en una señal de audio
descodificada, reproducible o que puede procesarse
adicionalmente.
La estructura de este descodificador se muestra
en la figura 8. El descodificador que se indica en general con 210,
comprende un descompresor 212, una memoria 214 FIFO, un
multiplicador 216 y un postfiltro 218 parametrizable. El
descompresor 212, la memoria 214 FIFO, el multiplicador 216 y el
postfiltro 218 parametrizable están conectados en este orden entre
una entrada 220 de datos y una salida 222 de datos del
descodificador 210, obteniéndose en la entrada 220 de datos la
señal codificada y produciéndose en la salida 222 de datos la señal
de audio descodificada, que únicamente se diferencia de la señal de
audio original en la entrada 12 de datos del codificador 10 de
audio por el ruido de cuantificación generado por el cuantificador
28 en el codificador 10 de audio. El descompresor 212 está unido en
una salida de datos adicional con una entrada de control del
multiplicador 216, para transmitir al mismo un multiplicador, y a
través de otra salida de datos con una entrada de parametrización
del postfiltro 218 parametrizable.
Tal como se muestra en la figura 9, el
descompresor 212 descomprime en una etapa 224, en primer lugar, la
señal comprimida situada en la entrada 220 de datos, para llegar a
los datos de audio filtrados, cuantificados, concretamente los
valores \sigma' de muestreo, así como la información secundaria
correspondiente en los bloques 132, 134 de información secundaria,
que indican justamente los coeficientes de filtrado y los valores de
amplificación o, en lugar de los valores de amplificación, los
límites de potencia de ruido, en los nodos.
Tal como se muestra en la figura 10, el
descompresor 212 comprueba en una etapa 226 la señal descomprimida
en el orden de su llegada, si la información secundaria en el mismo
está contenida con coeficientes de filtrado, y concretamente en
forma cerrada en sí misma sin tener en cuenta diferencias con un
bloque de información secundaria precedente. Expresado de otro
modo, el descompresor 212 solicita el primer bloque 132 de
información secundaria. En cuanto el descompresor 212 lo ha
encontrado, los valores \sigma' de audio filtrados, cuantificados
se almacenan en memoria intermedia en una etapa 228 en la memoria
214 FIFO. Si durante la etapa 228 se ha almacenado un bloque de
audio completo de valores \sigma' de audio filtrados,
cuantificados, sin que inmediatamente siga un bloque de información
secundaria, entonces éste se postfiltra dentro de la etapa 228 en
primer lugar mediante la información contenida en la información
secundaria recibida en la etapa 226 mediante parametrización y
valor de amplificación en el postfiltro y se amplifica en el
multiplicador 216, con lo cual se descodifica y por tanto se
obtiene el bloque de audio descodificado correspondiente.
En una etapa 230, el descompresor 212 supervisa
la señal descomprimida por si aparece un bloque de información
secundaria de cualquier tipo, concretamente con coeficientes de
filtrado absolutos o diferencias de coeficientes de filtrado para
un bloque de información secundaria precedente. En el ejemplo de la
figura 5b, el descompresor 212 reconocería por ejemplo, en el
reconocimiento del bloque 132 de información secundaria en la etapa
226, en la etapa 230 la aparición del bloque 134 de información
secundaria. A este respecto, en la etapa 228 ya se habría
descodificado el bloque de valores \sigma'(t_{0}) -
\sigma'(t_{127}) de audio filtrados, cuantificados, y
concretamente empleando la información 132 secundaria. Por tanto,
mientras no aparezca todavía el bloque 134 de información
secundaria en la señal descomprimida, en la etapa 228 se continúa el
almacenamiento en memoria intermedia y la eventual descodificación
de bloques por medio de la información secundaria de la etapa 226,
tal como se describió anteriormente.
En cuanto aparece el bloque 134 de información
secundaria, el descompresor 212 calcula en la etapa 232, mediante
la suma de los valores de diferencia en el bloque 134 de información
secundaria para los valores de parámetro en el bloque 132 de
información secundaria, los valores de parámetro en el nodo 1, es
decir a_{1}, x_{1}(i). Naturalmente se suprime la etapa
232 en caso de que el bloque de información secundaria actual sea
un bloque de información secundaria cerrado sin diferencias, lo que,
como se ha descrito anteriormente, puede ser el caso por ejemplo
todos los segundos. Para que el tiempo de espera para el
descodificador 210 no sea demasiado largo, los bloques 132 de
información secundaria, en los que pueden derivarse los valores de
parámetro de manera absoluta, es decir sin relación con otro bloque
de información secundaria, se disponen con separaciones
suficientemente pequeñas, de manera que el tiempo de encendido o el
tiempo muerto durante el encendido del codificador 210 de audio por
ejemplo en el caso de una retransmisión o una radiodifusión no sea
demasiado grande. Preferiblemente, el número de los bloques 134 de
información secundaria dispuestos entremedias con los valores de
diferencia también están dispuestos en un número predeterminado fijo
entre los bloques 132 de información secundaria, de manera que el
descodificador sabe cuándo se espera de nuevo un bloque de
información secundaria de tipo 132 en la señal codificada.
Alternativamente, los diferentes tipos de bloques de información
secundaria se indican mediante indicadores correspondientes.
Tal como se muestra ahora en la figura 11,
después de que haya llegado ahora un bloque de información
secundaria para un nuevo nodo, y concretamente, especialmente
después de la etapa 226 ó 232, en primer lugar se inicializa un
índice j de valor de muestreo a 0 en la etapa 234. Este valor
corresponde a la posición de muestreo del primer valor de muestreo
en el bloque de audio que se mantiene actualmente en la FIFO 214, al
que hace referencia la información secundaria actual. Se realiza la
etapa 234 por el postfiltro 218 parametrizable. El postfiltro 218
realiza después en una etapa 236 un cálculo del límite de potencia
de ruido en el nuevo nodo, correspondiendo esta etapa a la etapa 84
de la figura 4 y pudiendo suprimirse en su caso cuando, por
ejemplo, el límite de potencia de ruido se transmite en los nodos
adicionalmente a los valores de amplificación. En las siguientes
etapas 238 y 240, el postfiltro 218 realiza además interpolaciones
con respecto a los coeficientes de filtrado y los límites de
potencia de ruido, que corresponden a las interpolaciones 88 y 90 de
la figura 4. El siguiente cálculo del valor de amplificación para
la posición j de muestreo en la etapa 242 sobre la base del límite
de potencia de ruido interpolado y los coeficientes de filtrado
interpolados a partir de las etapas 238 y 240, corresponde a la
etapa 92 de la figura 4. En una etapa 244, el postfiltro 218 aplica
entonces el valor de amplificación así como los coeficientes de
filtrado interpolados calculados en la etapa 242 al valor de
muestreo en la posición j de muestreo. Esta etapa se diferencia de
la etapa 94 de la figura 4 porque los coeficientes de filtrado
interpolados se aplican a los valores \sigma' de muestreo
filtrados, cuantificados, de tal manera que la función de
transmisión del postfiltro parametrizable no corresponde a la
inversa del umbral de escucha, sino al propio umbral de escucha.
Además, el postfiltro no realiza una multiplicación por el valor de
amplificación, sino una división entre el valor de amplificación en
el valor \sigma' de muestreo filtrado, cuantificado, o el valor
de muestreo filtrado, cuantificado y ya filtrado de manera inversa
en la posición j.
Si el postfiltro 218 todavía no ha alcanzado el
nodo actual con la posición j de muestreo, lo que comprueba en la
etapa 246, en la etapa 248 incrementa el índice j de posición de
muestreo y vuelve a empezar las etapas 238 a 246. Sólo cuando se
alcanza el nodo, aplica el valor de amplificación y los coeficientes
de filtrado del nuevo nodo al valor de muestreo en el nodo,
concretamente en la etapa 250. De nuevo la aplicación comprende,
como en la etapa 218, en lugar de una multiplicación, una división
mediante el valor de amplificación y un filtrado con una función de
transmisión igual al umbral de escucha y no a la inversa de este
último. Después de la etapa 250, el bloque de audio actual está
descodificado mediante interpolación entre dos parametrizaciones de
nodos.
Tal como ya se ha mencionado, mediante el
filtrado y la aplicación del valor de amplificación en las etapas
218 y 224, el ruido añadido mediante la cuantificación en la
codificación en la etapa 110 ó 112 se adapta tanto en forma como en
altura al umbral de escucha.
Además se indica que en el caso de que los
valores de audio filtrados, cuantificados, debido al control de la
tasa de bits se hayan sometido antes de la codificación en la señal
codificada todavía a una multiplicación adicional en la etapa 126,
este factor puede tenerse en cuenta igualmente en las etapas 218 y
224. De manera alternativa, los valores de audio obtenidos mediante
el proceso de la figura 11 pueden someterse naturalmente a una
multiplicación adicional, para volver a amplificar de manera
correspondiente los valores de audio atenuados debido a una tasa de
bits
reducida.
reducida.
Con respecto a las figuras 3, 4, 6 y 9 a 11 se
indica que éstas muestran diagramas de flujo que ilustran el modo
de funcionamiento del codificador de la figura 1 o del
descodificador de la figura 8, y que cada una de las etapas
representadas en estos diagramas de flujo por un bloque están
implementadas como se describen en un medio correspondiente, tal
como se describió anteriormente. La implementación de las etapas
individuales puede realizarse en este sentido en hardware, como
parte de un circuito ASIC, o en software, como rutinas secundarias.
Especialmente, en estas figuras las explicaciones inscritas en los
bloques indican básicamente a qué operación se refiere la etapa
respectiva a la que corresponde el bloque respectivo, mientras que
las flechas entre los bloques ilustran el orden de las etapas en el
funcionamiento del codificador o del descodificador.
Teniendo en cuenta la descripción anterior se
indica además que el esquema de codificación representado
anteriormente puede variarse en diferentes aspectos. Por ejemplo no
es necesario que una parametrización y un valor de amplificación o
un límite de potencia de ruido, tal como se han determinado para un
bloque de audio determinado, deban considerarse directamente como
válidos para un valor de audio determinado, como en el ejemplo de
realización anterior el último valor de audio en cada caso de cada
bloque de audio, es decir, del valor 128 en este bloque de audio,
de manera que para este valor de audio pueda omitirse la
interpolación. Más bien es posible relacionar estos valores de
parámetro de nodos con un nodo que se encuentra temporalmente entre
los instantes t_{n} de muestreo con n=0, ..., 127 de los valores
de audio de este bloque de audio, de manera que para cada valor de
audio sería necesaria una interpolación. Especialmente, la
parametrización determinada para un bloque de audio o el valor de
amplificación determinado para este bloque de audio, también puede
aplicarse directamente a otro valor como por ejemplo el valor de
audio en el centro del bloque de audio, como por ejemplo el valor
de audio 64 en el caso del tamaño de bloque anterior de 128 valores
de audio.
Además se indica que el ejemplo de realización
anterior se refirió a un esquema de codificación de audio que se
diseñó para crear una señal codificada con una tasa de bits
controlada. Sin embargo, el control de la tasa de bits no es
necesario en todos los casos de aplicación. Por tanto las etapas 116
a 122 y 126 ó 125 correspondientes también pueden suprimirse.
Con respecto al esquema de compresión mencionado
con referencia a la etapa 114, también se remite, para completar,
al documento de Schuller et al. descrito en la introducción
de la descripción, y especialmente al apartado IV cuyo contenido se
toma por la presente con respecto a la reducción de redundancia
mediante codificación sin pérdida como referencia.
Además en referencia al ejemplo de realización
anterior se indica todavía lo siguiente. Aunque anteriormente se ha
descrito que el valor umbral en la cuantificación siempre se
mantiene constante o también que la función escalonada de
cuantificación siempre permanece constante, es decir, se cuantifican
o cortan siempre los artefactos generados en la señal de audio
filtrada con una cuantificación más aproximada, con lo cual la
calidad de audio, dado el caso, podría empeorarse de manera
audible, es posible además emplear estas medidas sólo cuando las
requiere la complejidad de la señal de audio, concretamente cuando
la tasa de bits necesaria para la codificación sobrepasa una tasa
de bits deseada. En este caso, adicionalmente a las funciones
escalonadas de cuantificación mostradas en las figuras 7a y 7b,
podría emplearse por ejemplo una con un incremento de cuantificación
constante a través de todo el margen de valores posible en la
salida del prefiltro y el cuantificador respondería por ejemplo a
una señal para utilizar o la función escalonada de cuantificación
con siempre un incremento de cuantificación constante o una de las
funciones escalonadas de cuantificación según las figuras 7a ó 7b,
de manera que mediante la señal podría comunicarse al
cuantificador, que realizara en caso de un empeoramiento mínimo de
la calidad de audio la reducción de escalones de cuantificación por
encima del valor umbral o el corte por encima del valor umbral.
Alternativamente, podría reducirse también gradualmente el valor
umbral de manera paulatina. En este caso podría realizarse la
reducción del valor umbral, en lugar de la reducción de factor de la
etapa 126. Después de un primer intento de compresión sin la etapa
110, la señal comprimida provisionalmente también podría someterse
a una cuantificación de valor umbral selectiva en una etapa 126
modificada únicamente, cuando la tasa de bits siga siendo demasiado
alta (118). En una nueva pasada se cuantificarían entonces los
valores de audio filtrados con la función escalonada de
cuantificación que presenta una evolución más plana por encima del
umbral de audio. Aún podrían realizarse reducciones de la tasa de
bits adicionales en la etapa 126 modificada mediante la reducción
del valor umbral y con ello una modificación adicional de la función
escalonada de cuantificación.
Además se indica que la integración de los
parámetros a y x en los bloques de información secundaria, descrita
anteriormente, puede también tener lugar de modo que no se forme
ninguna diferencia, sino que los parámetros correspondientes puedan
derivarse de cada bloque de información secundaria solo. Además, no
es necesario realizar la cuantificación de modo que, como ya se ha
explicado con referencia a la etapa 110, el incremento de la
cuantificación varíe desde un cierto límite superior para que sea
mayor que por debajo del umbral superior. Más bien, también son
posibles otras reglas de cuantificación distintas de las mostradas
en las Figuras 7a y 7b.
En resumen, los ejemplos de realización
anteriores empleaban una atenuación cruzada de los coeficientes en
el marco de un esquema de codificación de audio con un tiempo de
retardo muy pequeño. En la codificación, la información secundaria
se transmite a intervalos determinados. Los coeficientes se
interpolaban entre los instantes de transmisión. Un coeficiente que
indica la potencia de ruido posible o el área por debajo del umbral
de enmascaramiento, o un valor a partir del cual puede derivarse, se
usaba para la interpolación, preferiblemente, también se
transmitía, porque presenta características favorables en la
interpolación. Así, por un lado, la información secundaria del
prefiltro, cuyos coeficientes deben transmitirse de tal manera que
el postfiltro en el descodificador tenga la función de transmisión
inversa, de manera que en el descodificador la señal de audio pueda
volver a reconstruirse apropiadamente, puede transmitirse con una
tasa de bits baja, transmitiendo por ejemplo la información sólo a
determinados intervalos y, por otro lado, la calidad de audio puede
mantenerse en un nivel relativamente bueno, puesto que la
interpolación de la potencia de ruido posible como el área por
debajo del umbral de enmascaramiento es una buena aproximación para
los instantes entre los nodos.
Especialmente se indica que en función de las
circunstancias, el esquema de cuantificación según la invención
también puede implementarse en software. La implementación puede
realizarse en un medio de almacenamiento digital, especialmente un
disquete o un CD con señales de control legibles electrónicamente,
que pueden cooperar con un sistema informático programable de
manera que se realiza el procedimiento correspondiente. En general,
la invención consiste por tanto también en un producto de programa
informático con un código de programa almacenado en un soporte
legible por ordenador para la realización del procedimiento según la
invención, cuando el producto de programa informático se ejecuta en
un ordenador. Expresado con otras palabras, la invención puede
realizarse por tanto como un programa informático con un código de
programa para la realización del procedimiento cuando el programa
informático se ejecuta en un ordenador.
Especialmente pueden implementarse las etapas de
procedimiento anteriores en los bloques de los diagramas de flujo
individualmente o en varias rutinas de programas secundarias.
Alternativamente, también es posible naturalmente una
implementación de un dispositivo según la invención en forma de un
circuito integrado, en el que se implementan estos bloques por
ejemplo como partes de circuito individuales de un ASIC.
Especialmente se indica que en función de las
circunstancias, el esquema según la invención también puede
implementarse en software. La implementación puede realizarse en un
medio de almacenamiento digital, especialmente en un disquete o en
un CD con señales de control legibles electrónicamente, que pueden
cooperar con un sistema informático programable de manera que se
realiza el procedimiento correspondiente. En general la invención
consiste por tanto también en un producto de programa informático
con un código de programa almacenado en un soporte legible por
ordenador para la realización del procedimiento según la invención,
cuando el producto de programa informático se ejecuta en un
ordenador. Expresado con otras palabras, la invención puede
realizarse por tanto como un programa informático con un código de
programa para la realización del procedimiento cuando el programa
informático se ejecuta en un ordenador.
Claims (16)
-
\global\parskip0.950000\baselineskip
1. Dispositivo para codificar una señal de audio de una secuencia (54) de valores (56) de audio, en una señal (130) codificada, con un medio (20) para determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia (54) de valores (56) de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia (54) de valores (56) de audio;un medio (24) para calcular una versión de una parametrización de un filtro (30) parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del primer umbral de escucha y una versión de una segunda parametrización del filtro parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del segundo umbral de escucha;un medio (22) para determinar un primer límite de potencia de ruido en función del primer umbral de enmascaramiento y un segundo límite de potencia de ruido en función del segundo umbral de enmascaramiento;un medio (30) para filtrar de manera parametrizable y ajustar a escala un bloque predeterminado de valores de audio de la secuencia (54) de valores (56) de audio, para obtener un bloque de valores de audio filtrados, ajustados a escala, que corresponde al bloque predeterminado, presentando éste la siguiente característica:- un medio (88) para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque predeterminado de valores de audio,
- un medio (90) para interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para el valor de audio predeterminado;
- un medio (92) para determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y
- un medio (94) para aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio filtrados, ajustados a escala;
- un medio (28) para cuantificar los valores de audio filtrados, ajustados a escala, según la regla de cuantificación, para obtener un bloque de valores de audio filtrados, ajustados a escala, cuantificados; y
- un medio (18) para integrar la información en la señal codificada, a partir de la cual pueden derivarse el bloque de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido.
- 2. Dispositivo según la reivindicación 1, en el que el medio (84) para determinar el primer y el segundo límite de potencia de ruido está configurado para determinar el primer límite de potencia de ruido como un área por debajo del cuadrado de la magnitud del primer umbral de escucha y el segundo límite de potencia de ruido, como un área por debajo del cuadrado de la magnitud del segundo umbral de escucha.
- 3. Dispositivo según las reivindicaciones 1 ó 2, en el que el medio (92) para determinar un valor de escala intermedio está configurado para realizar la determinación además en función de una potencia de ruido de cuantificación provocada por una regla de cuantificación predeterminada.
- 4. Dispositivo según una de las reivindicaciones 1 a 3, que además presenta un medio (84) para determinar un segundo valor de escala en función de la potencia de ruido de cuantificación y el segundo límite de potencia de ruido, presentando además el medio para filtrar y ajustar a escala un medio (94) para aplicar el filtro parametrizable con la versión de la segunda parametrización y el segundo valor de escala a un valor de audio asociado al bloque predeterminado, para obtener uno de los valores de audio filtrados, ajustados a escala.
- 5. Dispositivo según la reivindicación 4, en el que el medio (84) para determinar el primer y el segundo valor de escala presenta un medio para formar la raíz a partir del cociente del ruido de cuantificación dividido entre el primer límite de potencia de ruido y la raíz a partir del cociente del ruido de cuantificación dividido entre el segundo límite de potencia de ruido.
- 6. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (92) para determinar el valor de escala intermedio presenta un medio para formar la raíz a partir del cociente de la potencia de ruido de cuantificación dividido entre el límite de potencia de ruido interpolado.
- 7. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (88) para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización está configurado para realizar una interpolación lineal.
\global\parskip1.000000\baselineskip
- 8. Dispositivo según una de las reivindicaciones anteriores, en que el medio (90) para interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido está configurado para realizar una interpolación lineal.
- 9. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (28) de cuantificación está configurado para realizar la cuantificación basándose en la función escalonada de cuantificación, que presenta un incremento aproximadamente constante hasta un valor umbral.
- 10. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (18) de integración incluye un codificador de entropía.
- 11. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (18) de integración está configurado de manera que la información representa el primer o el segundo límite de potencia de ruido, o el primer o el segundo valor de escala.
- 12. Dispositivo según una de las reivindicaciones anteriores, que además presenta la siguiente característica:
- un medio (66) para comprobar las parametrizaciones que siguen a la primera parametrización, a través del medio de cálculo, una después de otra, para ver si difieren de la primera parametrización en más de una medida predeterminada, y para seleccionar de entre las parametrizaciones, como la segunda parametrización, aquella en la que este sea el caso por primera vez.
- 13. Procedimiento para codificar una señal de audio de una secuencia (54) de valores (56) de audio, en una señal (130) codificada, con las siguientes etapas:
- determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia (54) de valores (56) de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia (54) de valores (56) de audio;
- calcular una versión de una primera parametrización de un filtro (30) parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del primer umbral de escucha, y una versión de una segunda parametrización del filtro parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del segundo umbral de escucha;
- determinar un primer límite de potencia de ruido dependen función del primer umbral de enmascaramiento y un segundo límite de potencia de ruido en función del segundo umbral de enmascaramiento;
- filtrar de manera parametrizable y ajustar a escala un bloque predeterminado de valores de audio de la secuencia (54) de valores (56) de audio, para obtener un bloque de valores de audio filtrados, ajustados a escala, que corresponde al bloque predeterminado, presentando la etapa las siguientes etapas secundarias:
- interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque predeterminado de valores de audio;
- interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para el valor de audio predeterminado;
- determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y
- aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio filtrados, ajustados a escala;
- cuantificar los valores de audio filtrados, ajustados a escala, para obtener un bloque de valores de audio filtrados, ajustados a escala, cuantificados; e
- integrar información en la señal codificada, a partir de la cual puede derivarse el bloque de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido.
- 14. Dispositivo para descodificar una señal (130) codificada en una señal de audio descodificada, en el que la señal (130) codificada contiene información a partir la cual puede derivarse un bloque predeterminado de valores de audio, filtrados, ajustados a escala, cuantificados, una versión de una primera parametrización, una versión de una segunda parametrización, un primer límite de potencia de ruido y un segundo límite de potencia de ruido, con las siguientes características:
\newpage
- un medio (212) para derivar el bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido a partir de la señal (130) codificada;
- un medio (30) para filtrar de manera parametrizable y ajustar a escala el bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, para obtener un bloque correspondiente de valores de audio descodificados, presentando la siguiente característica:
- un medio (88) para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque de valores de audio filtrados, ajustados a escala, cuantificados;
- un medio (90) para interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para los valores de audio predeterminados;
- un medio (92) para determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y
- un medio (94) para aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio descodificados.
- 15. Procedimiento para descodificar una señal (130) codificada en una señal de audio descodificada, conteniendo la señal codificada información a partir de la cual puede derivarse un bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, una versión de una primera parametrización, una versión de una segunda parametrización, un primer límite de potencia de ruido y un segundo límite de potencia de ruido, con las siguientes características:
- derivar el bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido a partir de la señal (130) codificada;
- filtrar de manera parametrizable y ajustar a escala el bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, para obtener un bloque correspondiente de valores de audio descodificados, presentando la etapa las siguientes etapas secundarias:
- interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque de valores de audio filtrados, ajustados a escala, cuantificados;
- interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para el valor de audio predeterminado.
- determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y
- aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio descodificados.
- 16. Programa informático con un código de programa adaptado para realizar el procedimiento según las reivindicaciones 13 ó 15, cuando el programa informático se ejecuta en un ordenador.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102004007200A DE102004007200B3 (de) | 2004-02-13 | 2004-02-13 | Audiocodierung |
| DE102004007200 | 2004-02-13 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2300975T3 true ES2300975T3 (es) | 2008-06-16 |
Family
ID=34745238
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES05701396T Expired - Lifetime ES2300975T3 (es) | 2004-02-13 | 2005-02-10 | Codificacion de audio. |
Country Status (15)
| Country | Link |
|---|---|
| US (1) | US7729903B2 (es) |
| EP (1) | EP1687808B1 (es) |
| JP (1) | JP4444296B2 (es) |
| KR (1) | KR100814673B1 (es) |
| CN (1) | CN1918632B (es) |
| AT (1) | ATE383641T1 (es) |
| AU (1) | AU2005213768B2 (es) |
| BR (1) | BRPI0506623B1 (es) |
| CA (1) | CA2556099C (es) |
| DE (2) | DE102004007200B3 (es) |
| ES (1) | ES2300975T3 (es) |
| IL (1) | IL176857A0 (es) |
| NO (1) | NO338918B1 (es) |
| RU (1) | RU2335809C2 (es) |
| WO (1) | WO2005078704A1 (es) |
Families Citing this family (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102004009955B3 (de) * | 2004-03-01 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite |
| DE102006022346B4 (de) | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
| KR101346771B1 (ko) * | 2007-08-16 | 2013-12-31 | 삼성전자주식회사 | 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치 |
| EP4372744B1 (en) | 2008-07-11 | 2025-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for audio decoding and corresponding computer program |
| PL4376306T3 (pl) | 2008-07-11 | 2025-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enkoder audio oraz dekoder audio |
| RU2591663C2 (ru) | 2009-10-20 | 2016-07-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая обнаружение группы ранее декодированных спектральных значений |
| BR122021008576B1 (pt) | 2010-01-12 | 2022-04-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo |
| BR112013020587B1 (pt) | 2011-02-14 | 2021-03-09 | Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. | esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral |
| ES2715191T3 (es) | 2011-02-14 | 2019-06-03 | Fraunhofer Ges Forschung | Codificación y decodificación de posiciones de impulso de pistas de una señal de audio |
| JP5712288B2 (ja) * | 2011-02-14 | 2015-05-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
| ES2529025T3 (es) | 2011-02-14 | 2015-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio decodificada en un dominio espectral |
| AR085218A1 (es) * | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio |
| MX2013009304A (es) | 2011-02-14 | 2013-10-03 | Fraunhofer Ges Forschung | Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad. |
| CN110517700B (zh) | 2013-01-29 | 2023-06-09 | 弗劳恩霍夫应用研究促进协会 | 用于选择第一编码算法与第二编码算法中的一个的装置 |
| US9060223B2 (en) | 2013-03-07 | 2015-06-16 | Aphex, Llc | Method and circuitry for processing audio signals |
| BR112015025022B1 (pt) | 2013-04-05 | 2022-03-29 | Dolby International Ab | Método de decodificação, decodificador em um sistema de processamento de áudio, método de codificação, e codificador em um sistema de processamento de áudio |
| EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
| US9277421B1 (en) * | 2013-12-03 | 2016-03-01 | Marvell International Ltd. | System and method for estimating noise in a wireless signal using order statistics in the time domain |
| CN105096957B (zh) | 2014-04-29 | 2016-09-14 | 华为技术有限公司 | 处理信号的方法及设备 |
| PL3723086T3 (pl) * | 2014-07-25 | 2025-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie do kodowania sygnałów audio, urządzenie do dekodowania sygnałów audio i ich sposoby |
| WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Family Cites Families (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE3820038A1 (de) | 1988-06-13 | 1989-12-14 | Ant Nachrichtentech | Verfahren zur aufbereitung und uebertragung einer bildsequenz |
| DE3820037A1 (de) | 1988-06-13 | 1989-12-14 | Ant Nachrichtentech | Bildcodierverfahren und einrichtung |
| US5581653A (en) * | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
| KR970005131B1 (ko) * | 1994-01-18 | 1997-04-12 | 대우전자 주식회사 | 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치 |
| DE19537338C2 (de) * | 1995-10-06 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren von Audiosignalen |
| US5819215A (en) * | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
| GB2307833B (en) * | 1995-12-01 | 2000-06-07 | Geco As | A data compression method and apparatus for seismic data |
| US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| JP2000514207A (ja) | 1996-07-05 | 2000-10-24 | ザ・ビクトリア・ユニバーシティ・オブ・マンチェスター | 音声合成システム |
| US6370477B1 (en) * | 1996-11-22 | 2002-04-09 | Schlumberger Technology Corporation | Compression method and apparatus for seismic data |
| US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
| EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
| KR100893281B1 (ko) | 1999-04-16 | 2009-04-17 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 코딩을 위해 이득-적응형 양자화 및 비균일 심볼길이를 사용하는 방법 및 장치 |
| EP1228569A1 (en) | 1999-10-30 | 2002-08-07 | STMicroelectronics Asia Pacific Pte Ltd. | A method of encoding frequency coefficients in an ac-3 encoder |
| US7110953B1 (en) * | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
| KR100711989B1 (ko) * | 2002-03-12 | 2007-05-02 | 노키아 코포레이션 | 효율적으로 개선된 스케일러블 오디오 부호화 |
| DE10217297A1 (de) * | 2002-04-18 | 2003-11-06 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten |
| CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
| US7620545B2 (en) * | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
| KR100636145B1 (ko) * | 2004-06-04 | 2006-10-18 | 삼성전자주식회사 | 확장된 고해상도 오디오 신호 부호화 및 복호화 장치 |
| JP2007099007A (ja) * | 2005-09-30 | 2007-04-19 | Auto Network Gijutsu Kenkyusho:Kk | ワイヤハーネスの配索構造 |
-
2004
- 2004-02-13 DE DE102004007200A patent/DE102004007200B3/de not_active Expired - Lifetime
-
2005
- 2005-02-10 AT AT05701396T patent/ATE383641T1/de active
- 2005-02-10 WO PCT/EP2005/001350 patent/WO2005078704A1/de not_active Ceased
- 2005-02-10 ES ES05701396T patent/ES2300975T3/es not_active Expired - Lifetime
- 2005-02-10 CA CA2556099A patent/CA2556099C/en not_active Expired - Lifetime
- 2005-02-10 EP EP05701396A patent/EP1687808B1/de not_active Expired - Lifetime
- 2005-02-10 CN CN2005800047543A patent/CN1918632B/zh not_active Expired - Lifetime
- 2005-02-10 JP JP2006552547A patent/JP4444296B2/ja not_active Expired - Lifetime
- 2005-02-10 DE DE502005002489T patent/DE502005002489D1/de not_active Expired - Lifetime
- 2005-02-10 RU RU2006132734/09A patent/RU2335809C2/ru active
- 2005-02-10 AU AU2005213768A patent/AU2005213768B2/en not_active Expired
- 2005-02-10 KR KR1020067015854A patent/KR100814673B1/ko not_active Expired - Lifetime
- 2005-02-10 BR BRPI0506623A patent/BRPI0506623B1/pt active IP Right Grant
-
2006
- 2006-07-13 IL IL176857A patent/IL176857A0/en active IP Right Grant
- 2006-07-27 US US11/460,425 patent/US7729903B2/en active Active
- 2006-09-12 NO NO20064093A patent/NO338918B1/no unknown
Also Published As
| Publication number | Publication date |
|---|---|
| CA2556099C (en) | 2010-06-01 |
| IL176857A0 (en) | 2006-10-31 |
| NO338918B1 (no) | 2016-10-31 |
| RU2006132734A (ru) | 2008-03-20 |
| NO20064093L (no) | 2006-10-26 |
| AU2005213768B2 (en) | 2009-11-19 |
| BRPI0506623A (pt) | 2007-05-02 |
| JP2007522510A (ja) | 2007-08-09 |
| BRPI0506623B1 (pt) | 2018-12-18 |
| DE502005002489D1 (de) | 2008-02-21 |
| CN1918632B (zh) | 2010-05-05 |
| RU2335809C2 (ru) | 2008-10-10 |
| DE102004007200B3 (de) | 2005-08-11 |
| CN1918632A (zh) | 2007-02-21 |
| AU2005213768A1 (en) | 2005-08-25 |
| EP1687808A1 (de) | 2006-08-09 |
| US7729903B2 (en) | 2010-06-01 |
| KR20060113998A (ko) | 2006-11-03 |
| ATE383641T1 (de) | 2008-01-15 |
| CA2556099A1 (en) | 2005-08-25 |
| EP1687808B1 (de) | 2008-01-09 |
| JP4444296B2 (ja) | 2010-03-31 |
| KR100814673B1 (ko) | 2008-03-18 |
| WO2005078704A1 (de) | 2005-08-25 |
| US20070016403A1 (en) | 2007-01-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2300975T3 (es) | Codificacion de audio. | |
| ES2884133T3 (es) | Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC | |
| ES2373741T3 (es) | Medición económica de la intensidad de una señal de audio codificada. | |
| ES2294685T3 (es) | Procedimiento y dispositivo para cuantificar una señal de informacion. | |
| ES2899781T3 (es) | Aparato y procedimiento para generar una señal de refuerzo de frecuencia mediante la configuración de la señal de refuerzo | |
| CN116665683A (zh) | 用于参数化多声道编码的方法 | |
| JP2015522847A (ja) | デジタル音声信号における効果的なプレエコー減衰 | |
| ES2331889T3 (es) | Codificacion de audio. | |
| MXPA06009144A (es) | Codificacion de audio | |
| JP4993992B2 (ja) | 信号処理方法、信号処理装置及びプログラム | |
| MXPA06009146A (es) | Codificacion de audio | |
| HK1094079B (en) | Audio encoding | |
| HK1093814B (en) | Method and device for quantizing a data signal |