ES2300975T3

ES2300975T3 - Codificacion de audio.

Info

Publication number: ES2300975T3
Application number: ES05701396T
Authority: ES
Inventors: Gerald Schuller; Stefan Wabnik; Marc Gayer
Original assignee: Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date: 2004-02-13
Filing date: 2005-02-10
Publication date: 2008-06-16
Anticipated expiration: 2025-02-10
Also published as: CA2556099C; NO20064093L; US7729903B2; IL176857A0; BRPI0506623B1; ATE383641T1; AU2005213768B2; KR100814673B1; KR20060113998A; JP4444296B2; EP1687808B1; DE102004007200B3; BRPI0506623A; JP2007522510A; RU2335809C2; EP1687808A1; CA2556099A1; CN1918632B; RU2006132734A; US20070016403A1

Abstract

Dispositivo para codificar una señal de audio de una secuencia (54) de valores (56) de audio, en una señal (130) codificada, con un medio (20) para determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia (54) de valores (56) de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia (54) de valores (56) de audio; un medio (24) para calcular una versión de una parametrización de un filtro (30) parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del primer umbral de escucha y una versión de una segunda parametrización del filtro parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del segundo umbral de escucha; un medio (22) para determinar un primer límite de potencia de ruido en función del primer umbral de enmascaramiento y un segundo límite de potencia de ruido en función del segundo umbral de enmascaramiento; un medio (30) para filtrar de manera parametrizable y ajustar a escala un bloque predeterminado de valores de audio de la secuencia (54) de valores (56) de audio, para obtener un bloque de valores de audio filtrados, ajustados a escala, que corresponde al bloque predeterminado, presentando éste la siguiente característica: un medio (88) para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque predeterminado de valores de audio, un medio (90) para interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para el valor de audio predeterminado; un medio (92) para determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y un medio (94) para aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio filtrados, ajustados a escala; un medio (28) para cuantificar los valores de audio filtrados, ajustados a escala, según la regla de cuantificación, para obtener un bloque de valores de audio filtrados, ajustados a escala, cuantificados; y un medio (18) para integrar la información en la señal codificada, a partir de la cual pueden derivarse el bloque de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido.

Description

Codificación de audio.

La presente invención se refiere a la codificación de audio, en general, y, en particular a la codificación de audio que permite que las señales de audio sean codificadas con un tiempo corto de retardo.

El procedimiento de compresión de audio más conocido en la actualidad es el MPEG-1 Layer III. En este procedimiento de compresión, los valores de muestreo o de audio de una señal de audio se codifican con pérdida en una señal codificada. En otras palabras, en la compresión la irrelevancia y redundancia de la señal de audio original se reduce o, en el caso ideal, se suprime. Para conseguir esto, se detectan enmascaramientos simultáneos y temporales mediante un modelo psicoacústico, es decir, se calcula o determina un umbral de enmascaramiento, que cambia en el tiempo y que depende de la señal de audio, que indica a partir de qué volumen los tonos de una frecuencia determinada empiezan a ser perceptibles para el oído humano. Esta información se utiliza a su vez para codificar la señal cuantificando los valores espectrales de la señal de audio en función del umbral de enmascaramiento de una manera más exacta, menos exacta o no cuantificándolos, e integrándolos en la señal codificada.

Los procedimientos de compresión de audio, tal como, por ejemplo, el formato MP3, experimentan un límite en su aplicabilidad, cuando se trata de transmitir datos de audio por un canal de transmisión con limitación de tasa de bits, por un lado, comprimidos, pero, por otro lado, con un tiempo de retardo lo más reducido posible. En algunas aplicaciones, el tiempo de retardo no es importante, tal como, por ejemplo, en el archivado de información de audio. Los codificadores de audio con un retardo bajo, algunas veces denominados también "Codificadores de retardo ultra bajo" (Ultra Low Delay Coder), sin embargo, son necesarios cuando se trata de transmisiones de señales de audio críticas en cuanto al tiempo, tal como, por ejemplo, en tele-conferencias, en micrófonos o altavoces inalámbricos. Para estos campos de aplicación, en el artículo de Schuller G. et al. "Perceptual Audio Coding using Adaptive Pre- and Post-Filters and Lossless Compression", IEEE Transactions on Speech and Audio Processing, Vol. 10, No. 6, septiembre de 2002, páginas 379-390, se propone una codificación de audio en la que la reducción de irrelevancia y la reducción de redundancia no se realizan basándose en una única transformación, sino en dos transformaciones separadas.

El principio se explica a continuación con referencia a las figuras 12 y 13. La codificación parte de una señal 902 de audio que ya se ha muestreado y ya está por tanto presente como una secuencia 904 de valores 906 de muestreo o de audio, indicándose mediante una flecha 908 el orden temporal de los valores 906 de audio. Se calcula el umbral de escucha por medio de un modelo psicoacústico para bloques sucesivos de valores 906 de audio, caracterizados por una numeración ascendente con "nº de bloque". La figura 13 muestra, por ejemplo, un diagrama en el que, por la frecuencia f con una curva a se ha dibujado el espectro de un bloque de señales de 128 valores de audio 906, y en b el umbral de enmascaramiento, tal como se ha calculado por un modelo psicoacústico, en unidades logarítmicas. El umbral de enmascaramiento de indica, como ya se ha mencionado, hasta qué intensidad son inaudibles las frecuencias para el oído humano, concretamente todos los tonos por debajo del umbral b de enmascaramiento. Basándose en los umbrales de escucha calculados para cada bloque, se logra ahora una reducción de irrelevancia mediante el control de un filtro parametrizable seguido por un cuantificador. Para un filtro parametrizable se calcula una parametrización de modo que su frecuencia de respuesta corresponda a la inversa de la magnitud del umbral de enmascaramiento. Esta parametrización se indica en la figura 12 mediante x#(i).

Después de filtrar los valores 906 de audio, se produce una cuantificación con un incremento constante, por ejemplo, una operación de redondeo al siguiente entero. El ruido de cuantificación causado de este modo es ruido blanco. En el lado del descodificador, la señal filtrada se "transforma inversamente" de nuevo con un filtro parametrizable, cuya función de transmisión se ajusta a la magnitud del propio umbral de enmascaramiento. De este modo, no sólo se codifica de nuevo la señal filtrada, sino que el ruido de cuantificación en el lado del descodificador también se ajusta a la forma del umbral de enmascaramiento. Para que el ruido de cuantificación corresponda de una manera lo más exacta posible al umbral de enmascaramiento, un valor a_{#} de amplificación que se aplica a la señal filtrada antes de la cuantificación, se calcula además en el lado del codificador para cada conjunto de parámetros o para cada parametrización. Para que pueda realizarse la transformación inversa en el lado del descodificador, el valor a de amplificación y la parametrización x se transmiten al codificador como información 910 secundaria junto con los datos principales reales, concretamente los valores 912 de audio filtrados cuantificados. Para la reducción 914 de redundancia, estos datos, es decir, la información 910 secundaria y los datos 912 principales, se someten todavía a una compresión sin pérdidas, concretamente a una codificación de entropía, mediante la que se obtiene la señal codificada.

El artículo mencionado anteriormente propone un tamaño de 128 valores 906 de muestreo como tamaño del bloque. Esto permite un retardo relativamente corto de 8 ms con una tasa de muestreo de 32 kHz. Con referencia a la implementación detallada, en el artículo también se describe que, para aumentar la eficacia de la codificación de información secundaria, esta información secundaria, concretamente los coeficientes x_{#} y a_{#} sólo se transmiten si hay suficiente variación en comparación con un conjunto de parámetros transmitido anteriormente, es decir, si la variación sobrepasa un valor umbral determinado. Además, se describe que la implementación se lleva a cabo preferiblemente de modo que un conjunto de parámetros actual no se aplica directamente a todos los valores de muestreo que pertenecen al bloque respectivo, sino que se utiliza una interpolación lineal de los coeficientes x_{#} de filtrado para evitar artefactos audibles. Con el fin de ejecutar la interpolación lineal de los coeficientes de filtrado, se propone una estructura de rejilla para el filtro, para impedir que ocurran inestabilidades. Para el caso en el que se desee una señal codificada con una tasa de bits controlada, el artículo también propone multiplicar o atenuar selectivamente la señal filtrada y ajustada a escala con el factor a de amplificación dependiente del tiempo, por un factor diferente de 1, de modo que si bien se producen interferencias audibles, sin embargo la tasa de bits puede reducirse en puntos de la señal de audio que sean complicados de codificar.

Aunque el esquema de codificación de audio descrito en el artículo mencionado anteriormente ya reduce el tiempo de retardo para muchas aplicaciones de manera suficiente, un problema en el esquema anterior es que, debido al requisito de tener que transmitir el umbral de enmascaramiento o la función de transmisión del filtro en el lado del codificador, en lo sucesivo denominado prefiltro, el canal de transmisión se carga de una manera relativamente elevada, a pesar de que los coeficientes de filtrado solamente se transmiten cuando se sobrepasa un umbral predeterminado.

Otra desventaja del esquema codificador anterior es que, debido al hecho de que el umbral de enmascaramiento o su inversa, tiene que hacerse disponible en el lado del descodificador por el conjunto x_{#} de parámetros que va a transmitirse, tiene que lograrse un compromiso entre una tasa de bits lo más baja posible o una relación de compresión alta, por un lado, y una aproximación o parametrización lo más precisa posible del umbral de enmascaramiento o su inversa, por otro lado. Por tanto, es inevitable que, mediante el esquema de codificación de audio anterior, el ruido de cuantificación adaptado al umbral de enmascaramiento sobrepase el umbral de enmascaramiento en algunos intervalos de frecuencia y así lleve a interferencias de audio audibles para el oyente. La Figura 13 muestra, por ejemplo, con la curva c la respuesta de frecuencia parametrizada del filtro parametrizable en el lado del descodificador. Como puede observarse, hay zonas en las que la función de transmisión del filtro en el lado del descodificador, denominado en lo sucesivo como postfiltro, sobrepasa el umbral b de enmascaramiento. El problema se agrava ahora por el hecho de que la parametrización sólo se transmite intermitentemente en caso de una variación suficiente entre las parametrizaciones y se interpola entremedias. Una interpolación de los coeficientes x_{#} de filtrado, como se propone en el artículo, solo lleva a interferencias audibles, cuando el valor a de amplificación se mantiene constante de un nodo a otro o de una nueva parametrización a otra nueva parametrización. Incluso si la interpolación propuesta en el artículo se aplica también al valor a_{#} de información secundaria, es decir a los valores de amplificación transmitidos, los artefactos de audio audibles pueden permanecer en la señal de audio entrante en el lado del descodificador.

Otro problema con el esquema de codificación de audio según las Figuras 12 ó 13, es que la señal filtrada puede, debido a la filtración selectiva en frecuencia, adoptar una forma no predecible, en la que particularmente debido a una superposición aleatoria de muchas onda armónicas individuales, uno o varios valores de audio individuales de la señal codificada se suman para dar valores muy altos, que, a su vez, llevan a una relación de compresión peor en la reducción de redundancia subsiguiente, debido a su aparición poco frecuente.

El objetivo de la presente invención consiste en crear un esquema de codificación de audio, que permita una codificación que produce menores artefactos audibles.

Este objetivo se logra mediante un procedimiento, según las reivindicaciones 13 ó 15, y un dispositivo según las reivindicaciones 1 ó 14.

La codificación según la invención de una señal de audio de una secuencia de valores de audio en una señal codificada incluye determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia de valores de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia de valores de audio; calcular una versión de una primera parametrización de un filtro parametrizable, de modo que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del primer umbral de escucha y una versión de una segunda parametrización del filtro parametrizable, de modo que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del segundo umbral de escucha; determinar un primer límite de potencia de ruido en función del primer umbral de enmascaramiento y un segundo límite de potencia de ruido en función del segundo umbral de enmascaramiento; así como filtrar de manera parametrizable y ajustar a escala o amplificar un bloque predeterminado de valores de audio de la secuencia (54) de valores de audio, para obtener un bloque de valores de audio filtrados ajustados a escala, que corresponde al bloque predeterminado, comprendiendo la última etapa las siguientes etapas secundarias: interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque predeterminado de valores de audio; interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido para obtener un límite de potencia de ruido interpolado para el valor de audio predeterminado; determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio filtros, ajustados a escala. Finalmente se produce también una cuantificación de los valores de audio filtrados, ajustados a escala, para obtener un bloque de valores de audio filtrados, ajustados a escala, cuantificados; y una integración de la información en la señal codificada a partir de la cual puede derivarse el bloque de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido.

La idea central de la presente invención es que debe dependerse del modo de proceder anterior, es decir la interpolación en los coeficientes de filtrado y el valor de amplificación, para obtener partiendo de los nodos valores interpolados para los valores de audio intermedios. Una codificación que contiene menos artefacto audibles puede obtenerse sin interpolar por ejemplo el valor de amplificación, sino más bien tomando el límite de potencia derivado del umbral de enmascaramiento, preferiblemente como el área por debajo del cuadrado de la magnitud del umbral de enmascaramiento, para cada nodo, es decir, para cada parametrización que se va a transmitir, y luego realizando la interpolación entre estos límites de potencia de nodos vecinos, tal como, por ejemplo, una interpolación lineal. Tanto en el lado del codificador como del descodificador, puede calcularse entonces un valor de amplificación a partir del valor límite de potencia intermedio determinado, de modo que el ruido de cuantificación causado por la cuantificación, que tiene una frecuencia constante antes del postfiltrado que tiene lugar en el lado del descodificador, está por debajo del límite de potencia o corresponde al mismo, después del postfiltrado.

Se explicarán a continuación ejemplos de realización preferidos de la presente invención en forma detallada, con referencia a los dibujos adjuntos. Muestran:

la figura 1, un diagrama de bloques de un codificador de audio, según un ejemplo de realización de la presente invención;

la figura 2, un diagrama de flujo para ilustrar el funcionamiento del codificador de audio de la Figura 1, en la entrada de datos;

la figura 3, un diagrama de flujo para ilustrar el funcionamiento del codificador de audio de la Figura 1, con respecto a la evaluación de la señal de audio entrante, por un modelo psicoacústico;

la figura 4, un diagrama de flujo para ilustrar el funcionamiento del codificador de audio de la Figura 1, con respecto a la aplicación de los parámetros obtenidos por el modelo psicoacústico a la señal de audio entrante;

la figura 5a, un diagrama esquemático para ilustrar la señal de audio entrante, la secuencia de valores de audio de los que se compone la misma, y las etapas de funcionamiento de la Figura 4, en relación a los valores de audio;

la figura 5b, un diagrama esquemático para ilustrar la estructura de la señal codificada;

la figura 6, un diagrama de flujo para ilustrar el modo de funcionamiento del codificador de audio de la Figura 1, con respecto al procesamiento final hasta la señal codificada;

la figura 7a, un diagrama en el que se muestra un ejemplo de realización de una función escalonada de cuantificación;

la figura 7b, un diagrama en el que se muestra otro ejemplo de realización de una función escalonada de cuantificación;

la figura 8, un diagrama de bloques de un descodificador de audio, que puede descodificar una señal de audio codificada por el codificador de audio de la Figura 1, según un ejemplo de realización de la presente invención;

la figura 9, un diagrama de flujo para ilustrar el funcionamiento del descodificador de la Figura 8 en la entrada de datos;

la figura 10, un diagrama de flujo para ilustrar el funcionamiento del descodificador de la Figura 8 con respecto al almacenamiento intermedio de los datos de audio filtrados, cuantificados, predescodificados, y el procesamiento de los bloques de audio, sin información secundaria correspondiente;

la figura 11, un diagrama de flujo para ilustrar el funcionamiento del descodificador de la Figura 8, con respecto a la filtración inversa real;

la figura 12, un diagrama esquemático para ilustrar un esquema de codificación de audio convencional, con un tiempo de retardo corto; y

la figura 13, un diagrama en el que se muestra a modo de ejemplo un espectro de una señal de audio, su umbral de escucha y la función de transmisión del postfiltro en el descodificador.

La figura 1 muestra un codificador de audio según un ejemplo de realización de la presente invención. Este codificador de audio, que se indica generalmente por 10, comprende en primer lugar una entrada 12 de datos, en la que recibe la señal de audio que se va a codificar, la cual, como se explicará en mayor detalle más adelante haciendo referencia a la figura 5a, consiste en una secuencia de valores de audio o de muestreo, y una salida de datos, en la que emite la señal codificada, cuyo contenido de información se explicará en mayor detalle haciendo referencia a la figura 5b.

El codificador 10 de audio de la figura 1 se divide en una parte 16 de reducción de irrelevancia y una parte 18 de reducción de redundancia. La parte 16 de reducción de irrelevancia comprende un medio 20 para establecer un valor de escucha, un medio 22 para calcular un valor de amplificación, un medio 24 para calcular una parametrización, un medio 26 de comparación de nodos, un cuantificador 28 y un prefiltro 30 parametrizable así como un memoria intermedia FIFO (first-in-first-out) de entrada, una memoria intermedia o memoria 38 y un multiplicador o un medio 40 de multiplicación. La parte 18 de reducción de redundancia incluye un compresor 34 y un control 36 de la tasa de bits.

La parte 16 de reducción de irrelevancia y la parte 18 de reducción de redundancia están conectadas en serie en este orden entre la entrada 12 de datos y la salida 14 de datos. En particular, la entrada 12 de datos está unida con una entrada de datos del medio 20 para determinar un umbral de entrada 12. Una salida de datos del medio 20 para determinar un umbral de escucha está unida a una entrada del medio 24 para calcular una parametrización así como a una entrada de datos del medio 22 para calcular un valor de amplificación, para transmitir a los mismos un umbral de escucha determinado. Los medios 22 y 24 calculan una parametrización o un valor de amplificación, basándose en el umbral de escucha y están unidos con el medio 26 de comparación de nodos, para transmitir al mismo estos resultados. El medio 26 de comparación de nodos transmite, según un resultado de comparación, tal como aún se explicará a continuación, los resultados calculados por los medios 22 y 24 como parámetro de entrada o parametrización al prefiltro 30 parametrizable. El prefiltro 30 parametrizable está conectado entre una salida de datos de la memoria 32 intermedia de entrada y una entrada de datos de la memoria 38 intermedia. Entre una salida de datos de la memoria 38 intermedia y el cuantificador 28 está conectado el multiplicador 40. El cuantificador 28 transmite a la parte 18 de reducción de redundancia valores de audio, dado el caso multiplicados o ajustados a escala, aunque en cualquier caso filtrados, cuantificados, y concretamente de manera exacta, a una entrada de datos del compresor 34. El medio 26 de comparación de nodos transmite a la parte 18 de reducción de redundancia información, a partir de la cual pueden derivarse los parámetros de entrada transmitidos al prefiltro 30 parametrizable, y concretamente de manera exacta a una entrada de datos adicional del compresor 34. El control de la tasa de bits está unido mediante una unión de control con una entrada de control del multiplicador 40, para encargarse de que los valores de audio filtrados, cuantificados, tal como se obtienen del prefiltro 30, se multipliquen mediante el multiplicador 40 por un multiplicador adecuado, tal como se explicará aún con más detalle a continuación. El control 36 de la tasa de bits está conectado entre una salida de datos del compresor 34 y la salida 14 de datos del codificador 10 de audio, para determinar adecuadamente el multiplicador para el multiplicador 40. En la primera pasada de cada valor de audio por el cuantificador 40, el multiplicador está ajustado en primer lugar a un factor de escala adecuado, como por ejemplo 1. La memoria 38 intermedia almacena sin embargo además cada valor de audio filtrado, para dar al control 36 de la tasa de bits la posibilidad, tal como se describe a continuación, de cambiar el multiplicador para una pasada adicional de un bloque de valores de audio. En caso de no indicarse un cambio de este tipo mediante el control 36 de la tasa de bits, entonces la memoria 38 intermedia puede liberar la memoria ocupada por este bloque.

Después de haber descrito anteriormente la estructura del codificador de audio de la figura 1, a continuación se describirá su funcionamiento con referencia a las figuras 2 a 7b.

Tal como puede deducirse de la figura 2, la señal de audio, cuando alcanza la entrada 12 de datos, ya se ha obtenido mediante muestreo 50 de señales de audio a partir de una señal de audio analógica. El muestreo de señales de audio se realiza con una frecuencia de muestreo predeterminada, que habitualmente se encuentra entre 32 - 48 kHz. En consecuencia, en la entrada 12 de datos se encuentra una señal de audio, que se compone de una secuencia de valores de muestreo o de audio. Aunque, tal como resultará evidente a partir de la siguiente descripción, la codificación de la señal de audio no tiene lugar basándose en bloques, los valores de audio se agrupan en la entrada 12 de datos en primer lugar, en una etapa 52, en bloques de audio. La agrupación en bloques de audio se produce, tal como resulta evidente a partir de la siguiente descripción, únicamente con el fin de determinar el umbral de escucha y tiene lugar en una etapa de entrada del medio 20 para determinar un umbral de escucha. En el presente ejemplo de realización se parte, a modo de ejemplo, de que en cada caso 128 valores de audio sucesivos se agrupan en bloques de audio, y que la agrupación tiene lugar de tal manera que los bloques de audio sucesivos por un lado no se superponen y, por otro lado, son
directamente adyacentes entre sí. Esto se explica de nuevo brevemente a modo de ejemplo mediante la figura 5a.

La figura 5a muestra con 54 la secuencia de valores de muestreo, estando ilustrado cada valor de muestreo mediante un rectángulo 56. Los valores de muestreo están numerados para la ilustración, estando mostrados a su vez sólo algunos de los valores de muestreo de la secuencia 54 por motivos de claridad. Tal como se muestra mediante corchetes por encima de la secuencia 54, según el presente ejemplo de realización en cada caso 128 valores de muestreo sucesivos están agrupados en un bloque, formando los 128 valores de muestreo directamente siguientes el siguiente bloque. Sólo por precaución se indica que la agrupación en bloques también podría realizarse de otra manera, por ejemplo mediante bloques que se superponen o bloques distanciados y bloques con otro tamaño de bloque, aunque de nuevo se prefiere el tamaño de bloque de 128, porque proporciona un buen compromiso entre por un lado una calidad de audio elevada y, por otro lado, un tiempo de retardo lo más bajo posible.

Mientras que los bloques de audio agrupados en la etapa 52 en el medio 20 se procesan por bloques en el medio 20 para determinar un umbral de escucha, en la memoria 32 intermedia de entrada los valores de audio entrantes se almacenan 54 de manera intermedia hasta que el prefiltro 30 parametrizable haya obtenido del medio 26 de comparación de nodos parámetros de entrada, para efectuar un prefiltrado, tal como aún se describirá a continuación.

Tal como se deduce de la figura 3, el medio 20 para determinar un umbral de escucha comienza su procesamiento directamente después de que hayan entrado suficientes valores de audio en la entrada 12 de datos, para formar un bloque de audio o formar el bloque de audio siguiente, lo que supervisa el medio 20 mediante una comprobación en la etapa 60. En caso de no existir aún un bloque de audio completo que pueda procesarse, entonces el medio 20 espera. En caso de existir un bloque de audio completo para procesarse, entonces el medio 20 para determinar un umbral de escucha calcula en una etapa 62, basándose en un modelo psicoacústico adecuado, en una etapa 62 un umbral de escucha. Para ilustrar el umbral de escucha de nuevo se hace referencia a la figura 12 y especialmente a la curva b, que se ha obtenido basándose en un modelo psicoacústico por ejemplo con referencia a un bloque de audio actual con un espectro a. El umbral de enmascaramiento, que se determina en la etapa 62, es una función dependiente de la frecuencia, que puede variar para bloques de audio sucesivos, y también puede variar claramente de una señal de audio a otra, como por ejemplo de composiciones de música rock a composiciones de música clásica. El umbral de escucha indica para cada frecuencia un valor umbral, por debajo del que el oído humano no puede percibir interferencias.

En una etapa 64 posterior, el medio 24 y el medio 22 calculan a partir del umbral M(f) de escucha calculado (indicando f la frecuencia) un valor a de amplificación o un conjunto de parámetros de N parámetros x(i) (i=1, ..., N). La parametrización x(i), que calcula el medio 24 en la etapa 64, está prevista para el prefiltro 30 parametrizable, que por ejemplo se realiza en una estructura coeficientes de filtrado adaptativo, tal como se utiliza en la codificación LPC (LPC = linear predictive coding = codificación predictiva lineal). Sean por ejemplo s(n), con n=0, ... 127, los 128 valores de audio del bloque de audio en ese momento y s'(n) los 128 valores de audio filtrados que se obtienen, entonces el filtro se realiza por ejemplo de tal manera que se cumple la siguiente ecuación:

100

siendo K el orden del filtro y a^{t}_{k} con k = 1, ..., K, los coeficientes de filtrado e ilustrando el índice t que los coeficientes de filtrado varían en bloques de audio sucesivos. El medio 24 calcula ahora la parametrización a^{t}_{k} de tal manera, que la función H(f) de transmisión del prefiltro 30 parametrizable es aproximadamente igual a la inversa de la magnitud del umbral M(f) de enmascaramiento, es decir de manera que es válido:

101

ilustrando a su vez la dependencia de t que, para diferentes bloques de audio, el umbral M(f) de enmascaramiento varía. En la implementación del prefiltro 30 como el filtro adaptativo explicado anteriormente, los coeficientes a^{t}_{k} coeficientes de filtrado se obtienen de la siguiente manera: la transformada de Fourier discreta inversa de |M(f, t)|^{2} con respecto a la frecuencia para el bloque en el instante t da lugar a la función de autocorrelación objetivo r^{t}_{mm}(i). Entonces se obtienen los a^{t}_{k} resolviéndose el sistema de ecuaciones lineal:

102

Sin embargo, para que en la interpolación lineal descrita aún con más detalle a continuación, entre las parametrizaciones no aparezcan inestabilidades, se utiliza preferiblemente para el filtro 30 una estructura reticular, reparametrizándose los coeficientes de filtrado para la estructura reticular en coeficientes de reflexión. Con respecto a detalles más exactos en relación a la configuración del prefiltro, el cálculo de los coeficientes y la reparametrización se hace referencia al artículo de Schuller, etc. mencionado en la introducción de la descripción y especialmente a la página 381, apartado III, que por la presente se incluye como referencia a este respecto.

Mientras que a continuación el medio 24 calcula una parametrización para el prefiltro 30 parametrizable de tal manera que su función de transmisión es igual a la inversa del umbral de enmascaramiento, el medio 22 calcula basándose en el umbral de escucha un límite de potencia de ruido, concretamente un límite que indica qué potencia de ruido puede introducir el cuantificador 28 en la señal de audio filtrada mediante el prefiltro 30, para que el ruido de cuantificación se encuentre, tras el filtrado inverso o postfiltrado en el lado del descodificador, por debajo del umbral M(f) de escucha o exactamente sobre el mismo. El medio 22 calcula este límite de potencia de ruido como el área por debajo del cuadrado de la magnitud del umbral M de escucha, es decir como \Sigma|(M(f)|^{2}. El medio 22 calcula el valor a de amplificación a partir del límite de potencia de ruido, calculando la raíz a partir de la fracción de potencia de ruido de cuantificación entre límite de potencia de ruido. El ruido de cuantificación es el ruido provocado por el cuantificador 28. El ruido provocado por el cuantificador 28, tal como aún se describirá, es ruido blanco y por tanto dependiente de la frecuencia. La potencia de ruido de cuantificación es la potencia del ruido de cuantificación.

Tal como resultó evidente a partir de la descripción anterior, el medio 22 calcula, además del valor a de amplificación, también el límite de potencia de ruido. Aunque es posible que el medio 26 de comparación de nodos calcule de nuevo el límite de potencia de ruido a partir del valor a de amplificación obtenido por el medio 22, es además posible, que el medio 22, además del valor a de amplificación del medio 26 de comparación de nodos, transmita también simultáneamente el límite de potencia de ruido determinado.

Tras el cálculo del valor de amplificación así como de la parametrización, el medio 26 de comparación de nodos comprueba a continuación en una etapa 66, si la parametrización recién calculada se diferencia de la parametrización actual, transmitida por último al prefiltro parametrizable, en más de un umbral predeterminado. En caso de que la comprobación en la etapa 66 lleve a que la parametrización recién calculada se diferencia en más del umbral predeterminado de la actual, entonces en el medio 26 de comparación de nodos los coeficientes de filtrado recién calculados y el límite de potencia de ruido o el valor de amplificación recién calculado se almacenan de manera intermedia para una interpolación que aún se explicará y el medio 26 de comparación de nodos transmite en una etapa 68 los coeficientes de filtrado recién calculados y en una etapa 70 el valor de amplificación recién calculado al prefiltro 30. Sin embargo, si este no es el caso, y la parametrización recién calculada no se diferencia en más del umbral predeterminado de la actual, entonces el medio 26 de comparación de nodos transmite al prefiltro 30 en la etapa 72, en lugar de la parametrización recién calculada, sólo la parametrización de nodos actual, es decir aquella parametrización que la última vez llevó en la etapa 66 a un resultado positivo, por tanto, que se diferenció en más de un umbral predeterminado de una parametrización de nodos anterior. Tras las etapas 70 y 72 el proceso de la figura 3 vuelve al procesamiento del siguiente bloque de audio, es decir a la consulta 60.

En caso de que la parametrización recién calculada no se diferencie de la parametrización de nodos actual y por tanto, el prefiltro 30 en la etapa 72 vuelva a obtener la parametrización de nodos ya obtenida anteriormente para al menos el último bloque de audio, entonces el prefiltro 30 aplica esta parametrización de nodos a todos los valores de muestreo de este bloque de audio situado en la FIFO 32, tal como se describirá aún a continuación con más detalle, por lo que este bloque actual se toma de la FIFO 32 y el cuantificador 28 recibe un bloque de audio de valores de audio prefiltrados resultante.

La figura 4 representa el modo de funcionamiento del prefiltro 30 parametrizable con más detalle para el caso en el que éste obtiene la parametrización recién calculada y el valor de amplificación recién calculado, porque los mismos se diferencian lo suficiente de la parametrización de nodos actual. Por tanto, tal como se ha descrito haciendo referencia a la figura 3, para cada uno de los bloques de audio sucesivos no se produce un procesamiento según la figura 4, sino sólo para bloques de audio, en los que la parametrización correspondiente se diferenció lo suficiente de la parametrización de nodos actual. Los otros bloques de audio, tal como acaba de describirse, se prefiltran aplicándose la parametrización de nodos actual en cada caso y el valor de amplificación actual en cada caso correspondiente, a todos los valores de muestreo de estos bloques de audio. En una etapa 80 el prefiltro 30 parametrizable supervisa ahora si ha tenido lugar una transmisión de los coeficientes de filtrado recién calculados del medio 26 de comparación de nodos o de parametrizaciones de nodos anteriores. El prefiltro 30 realiza la supervisión 80 hasta que haya tenido lugar una transmisión de este tipo.

Una vez que ha tenido lugar una transmisión de este tipo, el prefiltro 30 parametrizable comienza con el procesamiento del bloque de audio actual de valores de audio, que ahora se encuentra en la memoria 32 intermedia, es decir aquél para el que acaba de calcularse la parametrización. En la figura 5a se ha ilustrado por ejemplo que todos los valores 56 de audio ya se han procesado antes del valor de audio con el número 0 y por ello, ya han pasado por la memoria 32. El procesamiento del bloque de valores de audio antes del valor de audio con el número 0 se activó en aquel momento, porque la parametrización, que se había calculado para el bloque de audio antes del bloque 0, concretamente x_{0}(i), se diferenció en más del umbral predeterminado de la parametrización de nodos transmitida anteriormente al prefiltro 30. La parametrización x_{0}(i) es por tanto una parametrización de nodos, tal como se denomina en la presente invención. El procesamiento de los valores de audio en el bloque de audio antes del valor de audio 0 se realizó basándose en el conjunto a_{0}, x_{0}(i) de parámetros.

En la figura 5a se parte de que la parametrización, que se ha calculado para el bloque 0 con los valores de audio 0-127, se diferenció en menos del umbral predeterminado de la parametrización x_{0}(i), que se refería al bloque anterior. Por tanto, este bloque 0 también se tomó ya por el prefiltro 30 de la FIFO 32, se procesó de la misma manera con respecto a todos sus valores de muestreo 0-127 por medio de la parametrización x_{0}(i) añadida en la etapa 72, como se indica mediante la flecha 81 descrita con "aplicación directa" y luego se transmitió al cuantificador 28.

La parametrización calculada para el bloque 1 que todavía se encuentra en la FIFO 32 se diferenció sin embargo, según el ejemplo ilustrativo de la figura 5a, en cambio en más del umbral predeterminado de la parametrización x_{0}(i) y por tanto se transmitió al prefiltro 30 en la etapa 68 como parametrización x_{1}(i) junto con el valor a_{1} de amplificación (etapa 70) y, dado el caso, el límite de potencia de ruido correspondiente, debiendo ser los índices de a y x en la figura 5a un índice para los nodos, tal como se utilizan en la interpolación que posteriormente se explicará, que se realiza con respecto a los valores de muestreo 128-255 en el bloque 1, se simboliza mediante una flecha 82 y se realiza mediante las etapas que siguen a partir de la etapa 80 en la figura 4. Con la aparición del bloque de audio con el número 1 comenzaría en consecuencia el procesamiento en la etapa 80.

En el momento de la transmisión del conjunto a_{1}, x_{1} de parámetros, en la memoria 32 sólo se encuentran todavía en consecuencia los valores 128-255 de audio, es decir el bloque de audio actual después del bloque 0 de audio procesado en último lugar por el prefiltro 30. Después de que ahora se haya determinado la transmisión de parámetros x_{1}(i) de nodos en la etapa 80, el prefiltro 30 determina en la etapa 84 el límite q_{1} de potencia de ruido correspondiente al valor a_{1} de amplificación. Esto puede producirse porque el medio 26 de comparación de nodos transmite este valor al prefiltro 30, o mediante un nuevo cálculo de este valor por el prefiltro 30, tal como se ha descrito anteriormente con referencia a la etapa 64.

Después, en una etapa 86, se inicializa un índice j a un valor de muestreo, para indicar el valor de muestreo más antiguo que queda en la memoria 32 FIFO o el primer valor de muestreo del bloque de audio actual "bloque 1", es decir en el presente ejemplo de la figura 5a, el valor de muestreo 128. En una etapa 88 el prefiltro parametrizable realiza una interpolación entre los coeficientes x_{0} y x_{1} de filtrado, valiendo a este respecto la parametrización x_{0} como valor de nodo en el nodo con el número de valor de audio 127 del bloque 0 anterior y la parametrización x_{1} como valor de nodo en el nodo con el número de valor de audio 255 del bloque 1 actual. Estas posiciones 127 y 255 de valor de audio se designan a continuación también como nodo 0 y nodo 1, estando indicadas en la figura 5a las parametrizaciones de nodo referentes a los nodos mediante las flechas 90 y 92.

El prefiltro 30 parametrizable realiza en la etapa 88 la interpolación de los coeficientes x_{0}, x_{1} de filtrado entre los dos nodos en forma de una interpolación lineal, para obtener el coeficiente de filtrado interpolado en la posición j de muestreo, es decir x(t_{j})(i) con i=1 ... N.

Después, concretamente en la etapa 90, el prefiltro 30 parametrizable realiza una interpolación entre el limite q_{1} y q_{0} de potencia de ruido, para obtener un límite de potencia de ruido interpolado en la posición j de muestreo, es decir q(t_{j}).

En una etapa 92 el prefiltro parametrizable calcula a continuación el valor de amplificación para la posición j de muestreo basándose en el límite de potencia de ruido interpolado y en la potencia de ruido de cuantificación así como preferiblemente también en el coeficiente de filtrado interpolado, concretamente por ejemplo en función de la raíz de
{}\hskip17cm \frac{Potencia \ de \ ruido \ de \ cuantificación}{q(t_{j})}, remitiéndose para ello a las realizaciones con respecto a la etapa 64 de la
figura 3.

En una etapa 94, a continuación el prefiltro 30 parametrizable aplica el valor de amplificación calculado así como los coeficientes de filtrado interpolados al valor de muestreo en la posición j de muestreo, para obtener un valor de muestreo filtrado para esta posición de muestreo, concretamente s'(t_{j}).

En una etapa 96 el prefiltro 30 parametrizable comprueba a continuación si la posición j de muestreo ha alcanzado el nodo actual, es decir el nodo 1, en el caso de la figura 5a, la posición 255 de muestreo, es decir el valor de muestreo, para el que debe valer directamente, es decir sin interpolación, la parametrización transmitida al prefiltro 30 parametrizable junto con el valor de amplificación. Si este no es el caso, entonces el prefiltro 30 parametrizable aumenta o incrementa el índice j en 1, repitiéndose de nuevo las etapas 88-96. Sin embargo, en caso de que la comprobación en la etapa 96 resulte positiva, entonces en la etapa 100 el prefiltro parametrizable aplica el valor de amplificación transmitido en último lugar por el medio 26 de comparación de nodos y los coeficientes de filtrado transmitidos en último lugar por el medio 26 de comparación de nodos directamente sin interpolación al valor de muestreo en el nuevo nodo, tras lo que el bloque actual, es decir, en el presente caso, el bloque 1, se ha terminado de procesar, y el proceso se realiza de nuevo en la etapa 80 con respecto al bloque siguiente que va a procesarse que, en función de que la parametrización del siguiente bloque de audio, bloque 2, se distinga lo suficiente de la parametrización x_{1}(i), dado el caso por tanto puede ser este bloque de audio siguiente, bloque 2, o sin embargo un bloque de audio
posterior.

Antes de que con respecto a la figura 5 se describa el procedimiento adicional en el procesamiento de los valores s' de muestreo filtrados, a continuación se describen el fin y el trasfondo de la manera de proceder según las figuras 3 y 4. El sentido y el fin del filtrado consisten en filtrar la señal de audio en la entrada 12 con un filtro adaptativo, cuya función de transmisión está adaptada continuamente de la manera más óptima posible a la inversa del umbral de escucha, que también varía en el tiempo. El motivo de ello se basa en que, en el lado del descodificador, el filtrado inverso mediante un filtro adaptativo, cuya función de transmisión está adaptada por consiguiente continuamente al umbral de escucha, forma el ruido de cuantificación blanco introducido mediante una cuantificación de la señal de audio filtrada, es decir el ruido de cuantificación constante en frecuencia, concretamente adaptado a la forma del umbral de escucha.

La aplicación del valor de amplificación en las etapas 94 y 100 en el prefiltro 30 consiste en una multiplicación de la señal de audio o de la señal de audio filtrada, es decir, de los valores s de muestreo o de los valores s' de muestreo filtrados, por el factor de amplificación. El fin consiste en de este modo ajustar lo más alto posible el ruido de cuantificación, que se introduce en la señal de audio filtrada mediante la cuantificación descrita detalladamente a continuación, y que se adapta mediante el filtrado inverso en el lado del descodificador a la forma del umbral de escucha, de manera que, aún así, no sobrepase el umbral de escucha. Esto puede ejemplificarse mediante la fórmula de Parseval, según la cual el cuadrado de la magnitud de una función es igual al cuadrado de la magnitud de la transformada de Fourier. Cuando por tanto en el lado del descodificador vuelve a realizarse la multiplicación de la señal de audio en el prefiltro por el valor de amplificación en sentido inverso, dividiéndose la señal de audio filtrada entre el valor de amplificación, se reduce por tanto igualmente la potencia de ruido de cuantificación, concretamente por el factor a^{-2}, siendo a el valor de amplificación. En consecuencia, mediante la aplicación del valor de amplificación en el prefiltro 30 puede ajustarse la potencia de ruido de cuantificación a la altura óptima, lo que es lo mismo que aumentar el incremento de cuantificación y por tanto reducir el número de los escalones de cuantificación que deben codificarse, lo que a su vez aumenta la compresión en la parte de reducción de redundancia subsiguiente.

Expresado de otro modo, el efecto del prefiltro puede considerarse como una normalización de la señal en su umbral de enmascaramiento, de manera que el nivel de las interferencias de cuantificación o del ruido de cuantificación puede mantenerse constante tanto en tiempo como en frecuencia. Puesto que la señal de audio se encuentra en el dominio temporal, la cuantificación puede por tanto realizarse gradualmente con una cuantificación constante uniforme, tal como aún se describirá a continuación. De esta manera se elimina de manera ideal cualquier irrelevancia de la señal de audio, y puede emplearse un esquema de compresión sin pérdida para eliminar también la redundancia que queda en la señal de audio prefiltrada y cuantificada, tal como aún se describirá a continuación.

Con ayuda de la figura 5a se destacará adicionalmente una vez más claramente que, naturalmente, los coeficientes de filtrado y los valores a_{0}, a_{1}, x_{0}, x_{1} de amplificación empleados deben estar a disposición en el lado del descodificador como información secundaria, pero que el esfuerzo de transmisión se reduce a este respecto porque no se emplean de nuevo nuevos coeficientes de filtrado y nuevos valores de amplificación simplemente para cada bloque. Más bien tiene lugar una comprobación 66 del valor umbral para transmitir las parametrizaciones como información secundaria sólo en caso de variación de parametrización suficiente y, en caso contrario, no se transmiten la información secundaria o las parametrizaciones. En los bloques de audio, para los que se transmitieron las parametrizaciones, tiene lugar por la zona de estos bloques una interpolación de la parametrización antigua con respecto a la nueva. La interpolación de los coeficientes de filtrado tiene lugar de la manera descrita anteriormente con referencia a la etapa 88. La interpolación, con respecto a la amplificación, tiene lugar dando un rodeo, concretamente a través de una interpolación 90 lineal del límite q_{0}, q_{1} de potencia de ruido. En comparación con una interpolación directa a través del valor de amplificación, la interpolación lineal conduce, con respecto al límite de potencia de ruido, a un mejor resultado de escucha o a menos artefactos audibles.

A continuación se describe ahora con ayuda de la figura 6 el procesamiento posterior de la señal prefiltrada o filtrada previamente, que comprende esencialmente una cuantificación y una reducción de redundancia. En primer lugar se almacenan los valores de muestreo filtrados proporcionados por el prefiltro 30 parametrizable en la memoria 38 intermedia y, al mismo tiempo, se pasan desde la memoria 38 intermedia al multiplicador 40, en el que, a su vez, puesto que se trata de su primera pasada, se reenvían en primer lugar sin modificar, concretamente con un factor de escala de uno, a través del multiplicador 40 al cuantificador 28. Allí los valores de audio filtrados se cortan por encima de un límite superior en una etapa 110 y a continuación se cuantifican en una etapa 112. Las dos etapas 110 y 112 se realizan por el cuantificador 28. Especialmente las dos etapas 110 y 112 se realizan por el cuantificador 28 preferiblemente en una etapa, cuantificando los valores s' de audio filtrados con una función escalonada de cuantificación, que representa los valores s' muestreados filtrados presentes por ejemplo en una representación de coma flotante con respecto a una pluralidad de valores o índices escalonados de cuantificación de número entero y que transcurre de manera plana a partir de un cierto valor umbral para los valores de muestreo filtrados, de manera que los valores de muestreo filtrados que son superiores al valor umbral se cuantifican en el mismo escalón de cuantificación. Un ejemplo de una función escalonada de cuantificación de este tipo está representado en la figura 7a.

Los valores de muestreo filtrados cuantificados se indican en la figura 7a con \sigma'. La función escalonada de cuantificación es preferiblemente una función escalonada de cuantificación con incrementos constantes por debajo del valor umbral, es decir, el salto al siguiente escalón de cuantificación siempre tiene lugar después de un intervalo constante a lo largo de los valores S' de entrada. En la implementación se ajusta el incremento al valor umbral de tal manera que el número de escalones de cuantificación corresponde preferiblemente a una potencia de 2. En comparación con la representación de coma flotante de los valores s' de muestreo filtrados entrantes, el valor umbral es más pequeño de manera que un valor máximo de la zona representable de la representación de coma flotante sobrepasa el valor umbral.

El motivo para el valor umbral consiste en que se ha observado que la señal de audio filtrada, producida por el prefiltro 30, presenta valores de audio aislados que se suman, debido a una acumulación no favorable de armónicos, para dar valores muy grandes. Además se ha observado que un corte de estos valores, tal como se logra mediante la función escalonada de cuantificación mostrada en la figura 7a, lleva a una reducción de datos alta, pero sólo a un perjuicio mínimo de la calidad de audio. Más bien, estos puntos aislados aparecen en la señal de audio filtrada de manera artificial mediante el filtrado selectivo en frecuencia en el filtro 30 parametrizable, de manera que un corte de los mismos perjudica la calidad de audio sólo mínimamente.

Un ejemplo algo más concreto para la función escalonada de cuantificación mostrada en la figura 7a sería una que hasta el valor umbral redondea todos los valores s' de muestreo filtrados hacia el siguiente número entero, y a partir de entonces cuantifica todos los valores de muestreo filtrados situados por encima en el escalón de cuantificación más alto, como por ejemplo 256. Este caso se representa en la figura 7a.

Otro ejemplo de una posible función escalonada de cuantificación sería el mostrado en la figura 7b. Hasta el valor umbral, la función escalonada de cuantificación de la figura 7b corresponde a la de la figura 7a. Sin embargo, en lugar de transcurrir abruptamente plana para valores s' de muestreo por encima del valor umbral, la función escalonada de cuantificación sigue transcurriendo con una pendiente, que es más pequeña que la pendiente en la zona por debajo del valor umbral. Expresado de otro modo, por encima del valor umbral, el incremento de cuantificación es mayor. De este modo se logra un efecto similar que con la función de cuantificación de la figura 7a, pero por un lado con más esfuerzo debido a los diferentes incrementos de la función escalonada de cuantificación por encima y por debajo del valor umbral y, por otro lado, una mejor calidad de audio, porque no se cortan totalmente valores s' de audio filtrados muy altos, sino que únicamente se cuantifican con un incremento de cuantificación mayor.

Tal como ya se ha descrito anteriormente, en el lado del descodificador no sólo deben estar disponibles los valores \sigma' de audio cuantificados y filtrados, sino además también los parámetros de entrada para el prefiltro 30, en los que se ha basado el filtrado de estos valores, concretamente la parametrización de nodos incluyendo una indicación del valor de amplificación correspondiente. En una etapa 114, el compresor 34 emprende por tanto un primer intento de compresión y comprime con esto información secundaria que contiene los valores a_{0} y a_{1} de amplificación en los nodos, como por ejemplo 127 y 255, así como los coeficientes x_{0} y x_{1} de filtrado en los nodos y los valores \sigma' de muestreo filtrados, cuantificados en una señal filtrada provisional. El compresor 34 es a este respecto un codificador que funciona sin pérdida, como por ejemplo un codificador Huffman o aritmético con o sin predicción y/o adaptación.

La memoria 38, por la que pasan los valores \sigma' de audio muestreados, sirve como memoria intermedia para un tamaño adecuado de bloque con el que el compresor 34 procesa los valores \sigma' de audio filtrados, cuantificados producidos por el cuantificador 28 y, ajustados a escala dado el caso tal como se describen a continuación. El tamaño de bloque puede diferenciarse del tamaño de bloque de los bloques de audio, tal como los empleados por el medio 20.

Tal como ya se ha mencionado para el primer intento de compresión, el control 36 de la tasa de bits activa el multiplicador 40 con un multiplicador de 1, de manera que los valores de audio filtrados por el prefiltro 30 llegan sin modificar al cuantificador 28 y desde allí, como valores de audio filtrados, cuantificados, al compresor 34. El compresor 34 supervisa, en una etapa 116, si un cierto tamaño de bloque de compresión, es decir, un cierto número de valores de audio muestreados, cuantificados, se ha codificado en la señal codificada provisional, o si deben codificarse otros valores \sigma' de audio filtrados, cuantificados en la señal codificada provisional actual. Si no se llega al tamaño del bloque de compresión, el compresor 34 sigue realizando la compresión 114 actual. Sin embargo, si se llega al tamaño del bloque de compresión, en una etapa 118 el control 36 de la tasa de bits comprueba si la cantidad de bits necesaria para la compresión es mayor que una cantidad de bits preestablecida por una tasa de bits deseada. Si este no es el caso, el control 36 de la tasa de bits comprueba en una etapa 120, si la cantidad de bits necesaria es más pequeña que la cantidad de bits preestablecida por la tasa de bits deseada. Si este es el caso, el control 36 de la tasa de bits añade bits de relleno a la señal codificada en la etapa 122, hasta que se consigue la cantidad de bits preestablecida por la tasa de bits deseada. A continuación, en la etapa 124 se produce la salida de la señal codificada. Alternativamente a la etapa 122, el control 36 de la tasa de bits podría transmitir el bloque de compresión de valores \sigma' de audio filtrados todavía almacenado en la memoria 38, que en última instancia es la base de la compresión, en forma multiplicada por un multiplicador superior a 1 por el multiplicador 40, al cuantificador 28 para realizar de nuevo las etapas 110 a 118, hasta que se logra la cantidad de bits preestablecida por la tasa de bits deseada, tal como se muestra por una etapa 125 en línea discontinua.

Sin embargo, si la comprobación en la etapa 118 da como resultado que la cantidad de bits necesaria es mayor que la preestablecida por la tasa de bits deseada, el control 36 de la tasa de bits modifica el multiplicador para el multiplicador 40 hasta un factor entre 0 y 1 exclusivamente. Esto se realiza en la etapa 126. Tras la etapa 126, el control 36 de la tasa de bits se encarga de que la memoria 38 produzca de nuevo el último bloque de compresión de valores \sigma' de audio filtrados en el que se basa la compresión, multiplicándose los mismos a continuación por el factor ajustado en la etapa 126 y alimentándose de nuevo al cuantificador 28, después de lo cual vuelven a realizarse las etapas 110 a 118 y se desecha la señal codificada hasta entonces de manera provisional.

Se indica a este respecto que, en la realización repetida de las etapas 110 a 116 en la etapa 114 se integra naturalmente también el factor empleado en la etapa 126 (o en la etapa 125) en la señal codificada.

El fin del modo de proceder según la etapa 126 consiste en que, mediante el factor, se aumenta el incremento efectivo del cuantificador 28. Esto significa que el ruido de cuantificación resultante se encuentra de manera uniforme por encima del umbral de enmascaramiento, lo que lleva a interferencias audibles o a ruido audible, pero que sin embargo produce una tasa de bits reducida. Si tras la realización repetida de las etapas 110 a 116, en la etapa 118 se determina de nuevo que la cantidad de bits necesaria es superior a la preestablecida por la tasa de bits deseada, el factor en la etapa 126 se reduce adicionalmente, etc.

Cuando los datos se proporcionan finalmente en la etapa 124 como señal codificada, se realiza el siguiente bloque de compresión de los valores \sigma' de audio filtrados, cuantificados subsiguientes.

Se indica a este respecto además que también podría emplearse otro valor preinicializado para el factor de multiplicación distinto de 1, concretamente por ejemplo 1. Entonces, en cualquier caso tendría lugar previamente, es decir arriba del todo en la figura 6, un ajuste a escala.

La figura 5b ilustra de nuevo la señal codificada producida, que se indica en general con 130. La señal codificada comprende información secundaria y datos principales intermedios. La información secundaria comprende, tal como se ya se ha mencionado, información a partir de la cual puede derivarse el valor del valor de amplificación y el valor de los coeficientes de filtrado para bloques de audio especiales, concretamente bloques de audio en los que se ha producido en la secuencia de bloques de audio una variación importante en los coeficientes de filtrado. Dado el caso, la información secundaria comprende además otra información que se refiere al valor de amplificación empleado para el control de bits. Debido a la dependencia mutua entre valor de amplificación y límite q de potencia de ruido, la información secundaria puede comprender opcionalmente, además del valor a_{#} de amplificación para un nodo # también el límite q_{#} de potencia de ruido, o también sólo este último. Dentro de la señal codificada está dispuesta la información secundaria preferiblemente de tal manera que la información secundaria para los coeficientes de filtrado y el valor de amplificación correspondiente o el límite de potencia de ruido correspondiente está dispuesta antes de los datos principales para el bloque de audio de valores \sigma' de audio filtrados, cuantificados, a partir del que se han derivado estos coeficientes de filtrado con el valor de amplificación correspondiente o el límite de potencia de ruido correspondiente, es decir, la información a_{0}, x_{0}(i) secundaria después del bloque -1 y la información a_{1}, x_{1}(i) secundaria después del bloque 1. Expresado de otro modo, los datos principales, es decir, los valores \sigma' de audio filtrados, cuantificados desde exclusivamente un bloque de audio del tipo en el que se ha producido una variación importante en la secuencia de bloques de audio en los coeficientes de filtrado, hasta inclusive el siguiente bloque de audio de este tipo, en la figura 5b por ejemplo los valores \sigma'(t_{0}) - \sigma'(t_{255}) de audio, siempre están dispuestos entre el bloque 132 de información secundaria para el primero de estos dos bloques de audio (bloque -1) y el otro bloque 134 de información secundaria para el segundo de estos dos bloques de audio (bloque 1). Los valores \sigma'(t_{0}) - \sigma'(t_{127}) de audio se han obtenido o pueden descodificarse tal como se mencionó anteriormente en referencia a la figura 5a, únicamente mediante la información 132 secundaria, mientras que los valores \sigma'(t_{128}) - \sigma'(t_{255}) de audio se han obtenido mediante interpolación mediante la información 132 secundaria como valores de nodo en el nodo con el número 127 de valor de muestreo y mediante la información 134 secundaria como valores de nodo en el nodo con el número 255 de valor de muestreo y, por tanto, sólo pueden descodificarse mediante ambas informaciones secundarias.

Además, la información secundaria relativa al valor de amplificación o al límite de potencia de ruido y los coeficientes de filtrado no se integran siempre independientemente unas de otras en cada bloque 132 y 134 de información secundaria. Más bien, esta información secundaria se transmite en diferencias al bloque de información secundaria precedente. En la figura 5b, el bloque 132 de información secundaria contiene a modo de ejemplo el valor a_{0} de amplificación y el coeficiente x_{0} de filtrado relativos al nodo para el instante t_{-1}. En el bloque 132 de información secundaria pueden derivarse estos valores a partir del propio bloque. Sin embargo, a partir del bloque 134 de información secundaria ya no puede derivarse la información secundaria relativa a los nodos en el instante t_{255} únicamente a partir de este bloque. Más bien, el bloque 134 de información secundaria comprende únicamente información sobre diferencias del valor a_{1} de amplificación del nodo en el instante t_{255} con respecto al valor de amplificación del nodo en el instante t_{0} y las diferencias de los coeficientes x_{1} de filtrado con respecto a los coeficientes x_{0} de filtrado. El bloque 134 de información secundaria contiene por consiguiente únicamente la información para a_{1} - a_{0} y x_{1}(i) - x_{0}(i). Sin embargo, para los instantes intermitentes los coeficientes de filtrado y el valor de amplificación o el límite de potencia de ruido deberían transmitirse completamente y no sólo como diferencia al nodo precedente, como por ejemplo cada segundo para permitir a un receptor o descodificador unirse a un flujo en curso de datos de codificación, tal como aún se expondrá a continuación.

Este tipo de integración de la información secundaria en los bloques 132 y 134 de información secundaria ofrece la ventaja de la posibilidad de una tasa de compresión superior. El motivo de esto es que, aunque la información secundaria sólo se transmite en la medida de lo posible cuando se ha producido una variación suficiente de los coeficientes de filtrado con respecto a los coeficientes de filtrado de un nodo precedente, merece la pena el esfuerzo de la formación de la diferencia en el lado del codificador o la formación de la suma en el lado del descodificador, porque las diferencias producidas son pequeñas a pesar de la consulta en la etapa 66, para así permitir ventajas en la codificación de entropía.

Después de haber descrito anteriormente un ejemplo de realización para un codificador de audio, a continuación se describirá un ejemplo de realización para un descodificador de audio adecuado para descodificar la señal codificada creada por el codificador 10 de audio de la figura 1 en una señal de audio descodificada, reproducible o que puede procesarse adicionalmente.

La estructura de este descodificador se muestra en la figura 8. El descodificador que se indica en general con 210, comprende un descompresor 212, una memoria 214 FIFO, un multiplicador 216 y un postfiltro 218 parametrizable. El descompresor 212, la memoria 214 FIFO, el multiplicador 216 y el postfiltro 218 parametrizable están conectados en este orden entre una entrada 220 de datos y una salida 222 de datos del descodificador 210, obteniéndose en la entrada 220 de datos la señal codificada y produciéndose en la salida 222 de datos la señal de audio descodificada, que únicamente se diferencia de la señal de audio original en la entrada 12 de datos del codificador 10 de audio por el ruido de cuantificación generado por el cuantificador 28 en el codificador 10 de audio. El descompresor 212 está unido en una salida de datos adicional con una entrada de control del multiplicador 216, para transmitir al mismo un multiplicador, y a través de otra salida de datos con una entrada de parametrización del postfiltro 218 parametrizable.

Tal como se muestra en la figura 9, el descompresor 212 descomprime en una etapa 224, en primer lugar, la señal comprimida situada en la entrada 220 de datos, para llegar a los datos de audio filtrados, cuantificados, concretamente los valores \sigma' de muestreo, así como la información secundaria correspondiente en los bloques 132, 134 de información secundaria, que indican justamente los coeficientes de filtrado y los valores de amplificación o, en lugar de los valores de amplificación, los límites de potencia de ruido, en los nodos.

Tal como se muestra en la figura 10, el descompresor 212 comprueba en una etapa 226 la señal descomprimida en el orden de su llegada, si la información secundaria en el mismo está contenida con coeficientes de filtrado, y concretamente en forma cerrada en sí misma sin tener en cuenta diferencias con un bloque de información secundaria precedente. Expresado de otro modo, el descompresor 212 solicita el primer bloque 132 de información secundaria. En cuanto el descompresor 212 lo ha encontrado, los valores \sigma' de audio filtrados, cuantificados se almacenan en memoria intermedia en una etapa 228 en la memoria 214 FIFO. Si durante la etapa 228 se ha almacenado un bloque de audio completo de valores \sigma' de audio filtrados, cuantificados, sin que inmediatamente siga un bloque de información secundaria, entonces éste se postfiltra dentro de la etapa 228 en primer lugar mediante la información contenida en la información secundaria recibida en la etapa 226 mediante parametrización y valor de amplificación en el postfiltro y se amplifica en el multiplicador 216, con lo cual se descodifica y por tanto se obtiene el bloque de audio descodificado correspondiente.

En una etapa 230, el descompresor 212 supervisa la señal descomprimida por si aparece un bloque de información secundaria de cualquier tipo, concretamente con coeficientes de filtrado absolutos o diferencias de coeficientes de filtrado para un bloque de información secundaria precedente. En el ejemplo de la figura 5b, el descompresor 212 reconocería por ejemplo, en el reconocimiento del bloque 132 de información secundaria en la etapa 226, en la etapa 230 la aparición del bloque 134 de información secundaria. A este respecto, en la etapa 228 ya se habría descodificado el bloque de valores \sigma'(t_{0}) - \sigma'(t_{127}) de audio filtrados, cuantificados, y concretamente empleando la información 132 secundaria. Por tanto, mientras no aparezca todavía el bloque 134 de información secundaria en la señal descomprimida, en la etapa 228 se continúa el almacenamiento en memoria intermedia y la eventual descodificación de bloques por medio de la información secundaria de la etapa 226, tal como se describió anteriormente.

En cuanto aparece el bloque 134 de información secundaria, el descompresor 212 calcula en la etapa 232, mediante la suma de los valores de diferencia en el bloque 134 de información secundaria para los valores de parámetro en el bloque 132 de información secundaria, los valores de parámetro en el nodo 1, es decir a_{1}, x_{1}(i). Naturalmente se suprime la etapa 232 en caso de que el bloque de información secundaria actual sea un bloque de información secundaria cerrado sin diferencias, lo que, como se ha descrito anteriormente, puede ser el caso por ejemplo todos los segundos. Para que el tiempo de espera para el descodificador 210 no sea demasiado largo, los bloques 132 de información secundaria, en los que pueden derivarse los valores de parámetro de manera absoluta, es decir sin relación con otro bloque de información secundaria, se disponen con separaciones suficientemente pequeñas, de manera que el tiempo de encendido o el tiempo muerto durante el encendido del codificador 210 de audio por ejemplo en el caso de una retransmisión o una radiodifusión no sea demasiado grande. Preferiblemente, el número de los bloques 134 de información secundaria dispuestos entremedias con los valores de diferencia también están dispuestos en un número predeterminado fijo entre los bloques 132 de información secundaria, de manera que el descodificador sabe cuándo se espera de nuevo un bloque de información secundaria de tipo 132 en la señal codificada. Alternativamente, los diferentes tipos de bloques de información secundaria se indican mediante indicadores correspondientes.

Tal como se muestra ahora en la figura 11, después de que haya llegado ahora un bloque de información secundaria para un nuevo nodo, y concretamente, especialmente después de la etapa 226 ó 232, en primer lugar se inicializa un índice j de valor de muestreo a 0 en la etapa 234. Este valor corresponde a la posición de muestreo del primer valor de muestreo en el bloque de audio que se mantiene actualmente en la FIFO 214, al que hace referencia la información secundaria actual. Se realiza la etapa 234 por el postfiltro 218 parametrizable. El postfiltro 218 realiza después en una etapa 236 un cálculo del límite de potencia de ruido en el nuevo nodo, correspondiendo esta etapa a la etapa 84 de la figura 4 y pudiendo suprimirse en su caso cuando, por ejemplo, el límite de potencia de ruido se transmite en los nodos adicionalmente a los valores de amplificación. En las siguientes etapas 238 y 240, el postfiltro 218 realiza además interpolaciones con respecto a los coeficientes de filtrado y los límites de potencia de ruido, que corresponden a las interpolaciones 88 y 90 de la figura 4. El siguiente cálculo del valor de amplificación para la posición j de muestreo en la etapa 242 sobre la base del límite de potencia de ruido interpolado y los coeficientes de filtrado interpolados a partir de las etapas 238 y 240, corresponde a la etapa 92 de la figura 4. En una etapa 244, el postfiltro 218 aplica entonces el valor de amplificación así como los coeficientes de filtrado interpolados calculados en la etapa 242 al valor de muestreo en la posición j de muestreo. Esta etapa se diferencia de la etapa 94 de la figura 4 porque los coeficientes de filtrado interpolados se aplican a los valores \sigma' de muestreo filtrados, cuantificados, de tal manera que la función de transmisión del postfiltro parametrizable no corresponde a la inversa del umbral de escucha, sino al propio umbral de escucha. Además, el postfiltro no realiza una multiplicación por el valor de amplificación, sino una división entre el valor de amplificación en el valor \sigma' de muestreo filtrado, cuantificado, o el valor de muestreo filtrado, cuantificado y ya filtrado de manera inversa en la posición j.

Si el postfiltro 218 todavía no ha alcanzado el nodo actual con la posición j de muestreo, lo que comprueba en la etapa 246, en la etapa 248 incrementa el índice j de posición de muestreo y vuelve a empezar las etapas 238 a 246. Sólo cuando se alcanza el nodo, aplica el valor de amplificación y los coeficientes de filtrado del nuevo nodo al valor de muestreo en el nodo, concretamente en la etapa 250. De nuevo la aplicación comprende, como en la etapa 218, en lugar de una multiplicación, una división mediante el valor de amplificación y un filtrado con una función de transmisión igual al umbral de escucha y no a la inversa de este último. Después de la etapa 250, el bloque de audio actual está descodificado mediante interpolación entre dos parametrizaciones de nodos.

Tal como ya se ha mencionado, mediante el filtrado y la aplicación del valor de amplificación en las etapas 218 y 224, el ruido añadido mediante la cuantificación en la codificación en la etapa 110 ó 112 se adapta tanto en forma como en altura al umbral de escucha.

Además se indica que en el caso de que los valores de audio filtrados, cuantificados, debido al control de la tasa de bits se hayan sometido antes de la codificación en la señal codificada todavía a una multiplicación adicional en la etapa 126, este factor puede tenerse en cuenta igualmente en las etapas 218 y 224. De manera alternativa, los valores de audio obtenidos mediante el proceso de la figura 11 pueden someterse naturalmente a una multiplicación adicional, para volver a amplificar de manera correspondiente los valores de audio atenuados debido a una tasa de bits
reducida.

Con respecto a las figuras 3, 4, 6 y 9 a 11 se indica que éstas muestran diagramas de flujo que ilustran el modo de funcionamiento del codificador de la figura 1 o del descodificador de la figura 8, y que cada una de las etapas representadas en estos diagramas de flujo por un bloque están implementadas como se describen en un medio correspondiente, tal como se describió anteriormente. La implementación de las etapas individuales puede realizarse en este sentido en hardware, como parte de un circuito ASIC, o en software, como rutinas secundarias. Especialmente, en estas figuras las explicaciones inscritas en los bloques indican básicamente a qué operación se refiere la etapa respectiva a la que corresponde el bloque respectivo, mientras que las flechas entre los bloques ilustran el orden de las etapas en el funcionamiento del codificador o del descodificador.

Teniendo en cuenta la descripción anterior se indica además que el esquema de codificación representado anteriormente puede variarse en diferentes aspectos. Por ejemplo no es necesario que una parametrización y un valor de amplificación o un límite de potencia de ruido, tal como se han determinado para un bloque de audio determinado, deban considerarse directamente como válidos para un valor de audio determinado, como en el ejemplo de realización anterior el último valor de audio en cada caso de cada bloque de audio, es decir, del valor 128 en este bloque de audio, de manera que para este valor de audio pueda omitirse la interpolación. Más bien es posible relacionar estos valores de parámetro de nodos con un nodo que se encuentra temporalmente entre los instantes t_{n} de muestreo con n=0, ..., 127 de los valores de audio de este bloque de audio, de manera que para cada valor de audio sería necesaria una interpolación. Especialmente, la parametrización determinada para un bloque de audio o el valor de amplificación determinado para este bloque de audio, también puede aplicarse directamente a otro valor como por ejemplo el valor de audio en el centro del bloque de audio, como por ejemplo el valor de audio 64 en el caso del tamaño de bloque anterior de 128 valores de audio.

Además se indica que el ejemplo de realización anterior se refirió a un esquema de codificación de audio que se diseñó para crear una señal codificada con una tasa de bits controlada. Sin embargo, el control de la tasa de bits no es necesario en todos los casos de aplicación. Por tanto las etapas 116 a 122 y 126 ó 125 correspondientes también pueden suprimirse.

Con respecto al esquema de compresión mencionado con referencia a la etapa 114, también se remite, para completar, al documento de Schuller et al. descrito en la introducción de la descripción, y especialmente al apartado IV cuyo contenido se toma por la presente con respecto a la reducción de redundancia mediante codificación sin pérdida como referencia.

Además en referencia al ejemplo de realización anterior se indica todavía lo siguiente. Aunque anteriormente se ha descrito que el valor umbral en la cuantificación siempre se mantiene constante o también que la función escalonada de cuantificación siempre permanece constante, es decir, se cuantifican o cortan siempre los artefactos generados en la señal de audio filtrada con una cuantificación más aproximada, con lo cual la calidad de audio, dado el caso, podría empeorarse de manera audible, es posible además emplear estas medidas sólo cuando las requiere la complejidad de la señal de audio, concretamente cuando la tasa de bits necesaria para la codificación sobrepasa una tasa de bits deseada. En este caso, adicionalmente a las funciones escalonadas de cuantificación mostradas en las figuras 7a y 7b, podría emplearse por ejemplo una con un incremento de cuantificación constante a través de todo el margen de valores posible en la salida del prefiltro y el cuantificador respondería por ejemplo a una señal para utilizar o la función escalonada de cuantificación con siempre un incremento de cuantificación constante o una de las funciones escalonadas de cuantificación según las figuras 7a ó 7b, de manera que mediante la señal podría comunicarse al cuantificador, que realizara en caso de un empeoramiento mínimo de la calidad de audio la reducción de escalones de cuantificación por encima del valor umbral o el corte por encima del valor umbral. Alternativamente, podría reducirse también gradualmente el valor umbral de manera paulatina. En este caso podría realizarse la reducción del valor umbral, en lugar de la reducción de factor de la etapa 126. Después de un primer intento de compresión sin la etapa 110, la señal comprimida provisionalmente también podría someterse a una cuantificación de valor umbral selectiva en una etapa 126 modificada únicamente, cuando la tasa de bits siga siendo demasiado alta (118). En una nueva pasada se cuantificarían entonces los valores de audio filtrados con la función escalonada de cuantificación que presenta una evolución más plana por encima del umbral de audio. Aún podrían realizarse reducciones de la tasa de bits adicionales en la etapa 126 modificada mediante la reducción del valor umbral y con ello una modificación adicional de la función escalonada de cuantificación.

Además se indica que la integración de los parámetros a y x en los bloques de información secundaria, descrita anteriormente, puede también tener lugar de modo que no se forme ninguna diferencia, sino que los parámetros correspondientes puedan derivarse de cada bloque de información secundaria solo. Además, no es necesario realizar la cuantificación de modo que, como ya se ha explicado con referencia a la etapa 110, el incremento de la cuantificación varíe desde un cierto límite superior para que sea mayor que por debajo del umbral superior. Más bien, también son posibles otras reglas de cuantificación distintas de las mostradas en las Figuras 7a y 7b.

En resumen, los ejemplos de realización anteriores empleaban una atenuación cruzada de los coeficientes en el marco de un esquema de codificación de audio con un tiempo de retardo muy pequeño. En la codificación, la información secundaria se transmite a intervalos determinados. Los coeficientes se interpolaban entre los instantes de transmisión. Un coeficiente que indica la potencia de ruido posible o el área por debajo del umbral de enmascaramiento, o un valor a partir del cual puede derivarse, se usaba para la interpolación, preferiblemente, también se transmitía, porque presenta características favorables en la interpolación. Así, por un lado, la información secundaria del prefiltro, cuyos coeficientes deben transmitirse de tal manera que el postfiltro en el descodificador tenga la función de transmisión inversa, de manera que en el descodificador la señal de audio pueda volver a reconstruirse apropiadamente, puede transmitirse con una tasa de bits baja, transmitiendo por ejemplo la información sólo a determinados intervalos y, por otro lado, la calidad de audio puede mantenerse en un nivel relativamente bueno, puesto que la interpolación de la potencia de ruido posible como el área por debajo del umbral de enmascaramiento es una buena aproximación para los instantes entre los nodos.

Especialmente se indica que en función de las circunstancias, el esquema de cuantificación según la invención también puede implementarse en software. La implementación puede realizarse en un medio de almacenamiento digital, especialmente un disquete o un CD con señales de control legibles electrónicamente, que pueden cooperar con un sistema informático programable de manera que se realiza el procedimiento correspondiente. En general, la invención consiste por tanto también en un producto de programa informático con un código de programa almacenado en un soporte legible por ordenador para la realización del procedimiento según la invención, cuando el producto de programa informático se ejecuta en un ordenador. Expresado con otras palabras, la invención puede realizarse por tanto como un programa informático con un código de programa para la realización del procedimiento cuando el programa informático se ejecuta en un ordenador.

Especialmente pueden implementarse las etapas de procedimiento anteriores en los bloques de los diagramas de flujo individualmente o en varias rutinas de programas secundarias. Alternativamente, también es posible naturalmente una implementación de un dispositivo según la invención en forma de un circuito integrado, en el que se implementan estos bloques por ejemplo como partes de circuito individuales de un ASIC.

Especialmente se indica que en función de las circunstancias, el esquema según la invención también puede implementarse en software. La implementación puede realizarse en un medio de almacenamiento digital, especialmente en un disquete o en un CD con señales de control legibles electrónicamente, que pueden cooperar con un sistema informático programable de manera que se realiza el procedimiento correspondiente. En general la invención consiste por tanto también en un producto de programa informático con un código de programa almacenado en un soporte legible por ordenador para la realización del procedimiento según la invención, cuando el producto de programa informático se ejecuta en un ordenador. Expresado con otras palabras, la invención puede realizarse por tanto como un programa informático con un código de programa para la realización del procedimiento cuando el programa informático se ejecuta en un ordenador.

Claims

```
\global\parskip0.950000\baselineskip
```
1. Dispositivo para codificar una señal de audio de una secuencia (54) de valores (56) de audio, en una señal (130) codificada, con un medio (20) para determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia (54) de valores (56) de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia (54) de valores (56) de audio;

un medio (24) para calcular una versión de una parametrización de un filtro (30) parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del primer umbral de escucha y una versión de una segunda parametrización del filtro parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del segundo umbral de escucha;

un medio (22) para determinar un primer límite de potencia de ruido en función del primer umbral de enmascaramiento y un segundo límite de potencia de ruido en función del segundo umbral de enmascaramiento;

un medio (30) para filtrar de manera parametrizable y ajustar a escala un bloque predeterminado de valores de audio de la secuencia (54) de valores (56) de audio, para obtener un bloque de valores de audio filtrados, ajustados a escala, que corresponde al bloque predeterminado, presentando éste la siguiente característica:

un medio (88) para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque predeterminado de valores de audio,

un medio (90) para interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para el valor de audio predeterminado;

un medio (92) para determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y

un medio (94) para aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio filtrados, ajustados a escala;

un medio (28) para cuantificar los valores de audio filtrados, ajustados a escala, según la regla de cuantificación, para obtener un bloque de valores de audio filtrados, ajustados a escala, cuantificados; y

un medio (18) para integrar la información en la señal codificada, a partir de la cual pueden derivarse el bloque de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido.
2. Dispositivo según la reivindicación 1, en el que el medio (84) para determinar el primer y el segundo límite de potencia de ruido está configurado para determinar el primer límite de potencia de ruido como un área por debajo del cuadrado de la magnitud del primer umbral de escucha y el segundo límite de potencia de ruido, como un área por debajo del cuadrado de la magnitud del segundo umbral de escucha.
3. Dispositivo según las reivindicaciones 1 ó 2, en el que el medio (92) para determinar un valor de escala intermedio está configurado para realizar la determinación además en función de una potencia de ruido de cuantificación provocada por una regla de cuantificación predeterminada.
4. Dispositivo según una de las reivindicaciones 1 a 3, que además presenta un medio (84) para determinar un segundo valor de escala en función de la potencia de ruido de cuantificación y el segundo límite de potencia de ruido, presentando además el medio para filtrar y ajustar a escala un medio (94) para aplicar el filtro parametrizable con la versión de la segunda parametrización y el segundo valor de escala a un valor de audio asociado al bloque predeterminado, para obtener uno de los valores de audio filtrados, ajustados a escala.
5. Dispositivo según la reivindicación 4, en el que el medio (84) para determinar el primer y el segundo valor de escala presenta un medio para formar la raíz a partir del cociente del ruido de cuantificación dividido entre el primer límite de potencia de ruido y la raíz a partir del cociente del ruido de cuantificación dividido entre el segundo límite de potencia de ruido.
6. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (92) para determinar el valor de escala intermedio presenta un medio para formar la raíz a partir del cociente de la potencia de ruido de cuantificación dividido entre el límite de potencia de ruido interpolado.
7. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (88) para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización está configurado para realizar una interpolación lineal.
```
\global\parskip1.000000\baselineskip
```
8. Dispositivo según una de las reivindicaciones anteriores, en que el medio (90) para interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido está configurado para realizar una interpolación lineal.
9. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (28) de cuantificación está configurado para realizar la cuantificación basándose en la función escalonada de cuantificación, que presenta un incremento aproximadamente constante hasta un valor umbral.
10. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (18) de integración incluye un codificador de entropía.
11. Dispositivo según una de las reivindicaciones anteriores, en el que el medio (18) de integración está configurado de manera que la información representa el primer o el segundo límite de potencia de ruido, o el primer o el segundo valor de escala.
12. Dispositivo según una de las reivindicaciones anteriores, que además presenta la siguiente característica:

un medio (66) para comprobar las parametrizaciones que siguen a la primera parametrización, a través del medio de cálculo, una después de otra, para ver si difieren de la primera parametrización en más de una medida predeterminada, y para seleccionar de entre las parametrizaciones, como la segunda parametrización, aquella en la que este sea el caso por primera vez.
13. Procedimiento para codificar una señal de audio de una secuencia (54) de valores (56) de audio, en una señal (130) codificada, con las siguientes etapas:

determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia (54) de valores (56) de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia (54) de valores (56) de audio;

calcular una versión de una primera parametrización de un filtro (30) parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del primer umbral de escucha, y una versión de una segunda parametrización del filtro parametrizable, de manera que su función de transmisión corresponda aproximadamente a la inversa de la magnitud del segundo umbral de escucha;

determinar un primer límite de potencia de ruido dependen función del primer umbral de enmascaramiento y un segundo límite de potencia de ruido en función del segundo umbral de enmascaramiento;

filtrar de manera parametrizable y ajustar a escala un bloque predeterminado de valores de audio de la secuencia (54) de valores (56) de audio, para obtener un bloque de valores de audio filtrados, ajustados a escala, que corresponde al bloque predeterminado, presentando la etapa las siguientes etapas secundarias:

interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque predeterminado de valores de audio;

interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para el valor de audio predeterminado;

determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y

aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio filtrados, ajustados a escala;

cuantificar los valores de audio filtrados, ajustados a escala, para obtener un bloque de valores de audio filtrados, ajustados a escala, cuantificados; e

integrar información en la señal codificada, a partir de la cual puede derivarse el bloque de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido.
14. Dispositivo para descodificar una señal (130) codificada en una señal de audio descodificada, en el que la señal (130) codificada contiene información a partir la cual puede derivarse un bloque predeterminado de valores de audio, filtrados, ajustados a escala, cuantificados, una versión de una primera parametrización, una versión de una segunda parametrización, un primer límite de potencia de ruido y un segundo límite de potencia de ruido, con las siguientes características:
```
\newpage
```
un medio (212) para derivar el bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido a partir de la señal (130) codificada;

un medio (30) para filtrar de manera parametrizable y ajustar a escala el bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, para obtener un bloque correspondiente de valores de audio descodificados, presentando la siguiente característica:

un medio (88) para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque de valores de audio filtrados, ajustados a escala, cuantificados;

un medio (90) para interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para los valores de audio predeterminados;

un medio (92) para determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y

un medio (94) para aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio descodificados.
15. Procedimiento para descodificar una señal (130) codificada en una señal de audio descodificada, conteniendo la señal codificada información a partir de la cual puede derivarse un bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, una versión de una primera parametrización, una versión de una segunda parametrización, un primer límite de potencia de ruido y un segundo límite de potencia de ruido, con las siguientes características:

derivar el bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, la versión de la primera parametrización, la versión de la segunda parametrización, el primer límite de potencia de ruido y el segundo límite de potencia de ruido a partir de la señal (130) codificada;

filtrar de manera parametrizable y ajustar a escala el bloque predeterminado de valores de audio filtrados, ajustados a escala, cuantificados, para obtener un bloque correspondiente de valores de audio descodificados, presentando la etapa las siguientes etapas secundarias:

interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado en el bloque de valores de audio filtrados, ajustados a escala, cuantificados;

interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para el valor de audio predeterminado.

determinar un valor de escala intermedio en función del límite de potencia de ruido interpolado; y

aplicar el filtro parametrizable con la versión de la parametrización interpolada y el valor de escala intermedio al valor de audio predeterminado, para obtener uno de los valores de audio descodificados.
16. Programa informático con un código de programa adaptado para realizar el procedimiento según las reivindicaciones 13 ó 15, cuando el programa informático se ejecuta en un ordenador.