ES2363190T3 - Codificación de señales audio-digitales. - Google Patents

Codificación de señales audio-digitales. Download PDF

Info

Publication number
ES2363190T3
ES2363190T3 ES08805994T ES08805994T ES2363190T3 ES 2363190 T3 ES2363190 T3 ES 2363190T3 ES 08805994 T ES08805994 T ES 08805994T ES 08805994 T ES08805994 T ES 08805994T ES 2363190 T3 ES2363190 T3 ES 2363190T3
Authority
ES
Spain
Prior art keywords
signal
quantification
transmission
reconstructed
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08805994T
Other languages
English (en)
Inventor
Balazs Kovesi
Alain Le Guyader
Stéphane RAGOT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Application granted granted Critical
Publication of ES2363190T3 publication Critical patent/ES2363190T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Dental Preparations (AREA)

Abstract

Método de codificación de una señal de audio de entrada en donde dicha señal de audio de entrada está combinada con una señal intermedia de contra-reacción que forma una señal de entrada modificada y que comprende una etapa de cuantificación escalable en caudal de transmisión (91) de dicha señal de entrada modificada, proporcionando una trama binaria de índices de cuantificación (IE) de un caudal de transmisión predeterminado, que comprende, además, las etapas siguientes: - cuantificación inversa (93) de una parte de los índices de cuantificación de la trama binaria correspondiente a los índices de un caudal de transmisión inferior (IMIC) al caudal predeterminado, para determinar así una señal reconstruida - determinación (94) de un ruido de cuantificación (QMIC(z)) generado al menos por la sucesión de la etapa de cuantificación y de cuantificación inversa; - determinación (111) de una función de filtrado del ruido de cuantificación a partir de dicha señal reconstruida ; - aplicación (33) de dicha función de filtrado a dicho ruido de cuantificación para obtener dicha señal intermedia de contra-reacción.

Description

imagen1
La presente invención se refiere a un procesamiento de datos acústicos.
Este procesamiento está adaptado, en particular, para la transmisión y/o el almacenamiento de señales digitales, tales como señales de audiofrecuencias (voz, música u otras).
La presente invención se refiere, más en particular, a la codificación de formas de onda tal como la codificación MIC (Modulación por Impulsos Codificados) al que corresponde el acrónimo inglés PCM (Pulse Code Modulation).
El principio general de codificación/decodificación MIC, especificado por la recomendación UIT-T G.711, es tal como se describe haciendo referencia a la Figura 1.
El codificador MIC 13 comprende un módulo de cuantificación QMIC 10 que recibe, a la entrada, la señal de entrada S(z). El índice de cuantificación IMIC, a la salida del módulo de cuantificación 10, se transmite por intermedio del canal de transmisión 11 al decodificador 14.
El decodificador MIC 14 recibe, a la entrada, los índices I’MIC procedentes del canal de transmisión, versión posiblemente perturbada por errores binarios de IMIC y realiza una cuantificación inversa por el módulo de cuantificación inversa Q-1 MIC
12 para obtener la señal codificada
La codificación MIC normalizada UIT-T G.711 (en adelante, denominada G.711) realiza una compresión de la amplitud de las señales – que se definen con un ancho de banda mínimo de [300–3400 Hz] y muestreadas a 8 kHz – mediante una curva logarítmica que permite obtener una relación de señal a ruido casi constante para una gran dinámica de señales. El paso de cuantificación, en el dominio de la señal original, es proporcional a la amplitud de las señales.
La señal comprimida está cuantificada en 8 bits, o sea, 256 niveles. En la red telefónica conmutada (RTC) denominada Public Switched Telephone Network (PSTN) en inglés, estos 8 bits se transmiten a una frecuencia de 8 kHz para proporcionar un caudal de transmisión de 64 kbits/s.
Una trama de señal cuantificada, según la norma G.711, está constituida por índices de cuantificación codificados en 8 bits. Así, si la cuantificación inversa es implantada por tabla, consiste simplemente en un apuntamiento por el índice de uno de los 256 valores decodificados posibles.
En la norma G.711 según la “Ley A” en Europa o la “Ley mu (µ)” en América del Norte y Japón, los 8 bits están distribuidos de la forma siguiente, tal como se representa en 15 en la Figura 1:
1 bit de signo S, 3 bits para indicar el segmento y 4 bits para indicar el emplazamiento en el segmento.
La etapa de cuantificación del codificador genera un ruido de cuantificación que es la diferencia entre la señal original y la señal decodificada.
Con un gran número de niveles de cuantificación (256), el ruido de cuantificación presenta un espectro relativamente plano, tal como se puede observar en la Figura 2 bajo la referencia 20. El espectro de la señal está representado en 22 en la Figura 2 (en esta representación, un bloque de señal vocalizada) que presenta una gran dinámica (40 dB). Se puede ver que, en las zonas de energía débil, el ruido es muy próximo a la señal y por lo tanto, ya no está forzosamente enmascarado. Puede, entonces, hacerse audible en estas zonas (de 2300 a 3500 Hz).
En el caso de los codificadores predictivos adaptativos de voz, técnicas de conformación del ruido de cuantificación se han puesto en práctica para enmascarar este ruido y en la medida de lo posible, hacerlo inaudible. En efecto, debido a las propiedades de enmascaramiento frecuencial simultáneo del oído humano, es posible inyectar más ruido de cuantificación en las zonas en donde la señal es más energética. La conformación del ruido consiste en distribuir mejor, desde el punto de vista espectral, el ruido de cuantificación disminuyendo el nivel de ruido de cuantificación en las zonas poco energéticas para redistribuirlo en las zonas más energéticas.
Dicha técnica se describe, por ejemplo, en el documento “Adaptive noise spectral shaping and entropy coding in predictive coding of speech” de J. Makhoul, M. Berouti en IEEE ASSP, Vol. 27-3, junio 1979.
Este documento describe la utilización de filtros lineales teniendo en cuenta la señal reconstruida. El filtro de conformación del ruido de cuantificación se deriva del filtro de predicción lineal de síntesis, denominado filtro de síntesis de codificación predictiva lineal (LPC). De este modo, la trama obtenida a la salida de este tipo de codificador contiene índices de coeficientes de predicción lineal de los filtros, un índice de factor de normalización de ganancia y los índices de cuantificación.
Otros ejemplos de métodos de conformación del ruido en un codificador predictivo se describen en los documentos EP0331405, EP0466190 y EP0632597.
Además, en la referencia precedente, el filtro de conformación del ruido se calcula a partir del filtro de síntesis reconstruido a partir de los índices de coeficientes de predicción lineal. El filtro de conformación del ruido estará, por lo tanto, viciado con el ruido de codificación de los coeficientes de predicción lineal. Además, en la referencia citada, la función de transferencia del filtro de conformación solamente posee coeficientes en el numerador, calculados mediante dos predicciones lineales en cascada. Las dos predicciones lineales en cascada, que aportan cada una su parte de imprecisión, dan lugar, según se indica claramente en la referencia citada, a que la conformación del ruido solamente sea efectiva para un número de coeficientes como máximo igual a 2.
El artículo de Makhoul y Berouti demuestra que la conformación del ruido de cuantificación es posible en los sistemas predictivos adaptativos caracterizados por un modelo de síntesis constituido por un cuantificador inverso y por un filtro predictor a corto plazo. Los filtros de síntesis se utilizan en la estructura de codificación para obtener la conformación adecuada.
Por lo tanto, esta técnica no está adaptada a los codificadores no predictivos que no presentan filtros de síntesis como el codificador MIC (en particular G.711). En efecto, la cuantificación que incluye una conformación, tal como se describe en el artículo de Makhoul y Berouti, se realiza en el dominio del residuo de predicción lineal (o excitación), es decir, después del filtrado de la señal original por un filtro predictor A(z). Los coeficientes del filtro A(z) deben, por lo tanto, transmitirse al
decodificador para realizar un filtrado de síntesis 1/A(z) después de la cuantificación inversa. Además, la conformación del ruido se realiza mediante una función B(z) reducida al orden 2 y deducida de la función A(z) transmitida.
La observación precedente se aplica en el artículo de J.H. Chen “Nuevas estructuras codec para la codificación de realimentación de ruido de la voz”. Proc Of ICASSP, 2006, PP.I-681:I-684, que hace referencia al artículo de Makhoul y Berouti incorporando un predictor a largo plazo y una conformación del ruido de cuantificación por un filtro de conformación a largo plazo. Además, en el artículo de Chen et al, la cuantificación puesta en práctica es del tipo vectorial.
La presente invención ofrece una solución que no presenta los inconvenientes de la técnica anterior.
A este efecto, la invención da a conocer un método de codificación de una señal de audio de entrada en donde dicha señal de audio de entrada está combinada con una señal intermedia de contra-reacción, que forma una señal de entrada modificada y que presenta una etapa de cuantificación escalable en caudal de transmisión de dicha señal de entrada modificada, proporcionando una trama binaria de índices de cuantificación de un caudal de transmisión predeterminado, tal que comprende, además, las etapas siguientes:
-cuantificación inversa de una parte de los índices de cuantificación de la trama binaria correspondiente a los índices de un caudal de transmisión inferior al caudal predeterminado, para determinar una señal reconstruida;
-determinación de un ruido de cuantificación generado al menos por la sucesión de la etapa de cuantificación y de cuantificación inversa;
-determinación de una función de filtrado del ruido de cuantificación a partir de dicha señal reconstruida;
-aplicación de dicha función de filtrado a dicho ruido de cuantificación para obtener dicha señal intermedia de contra-reacción.
De este modo, el método según la invención permite obtener una trama de índices de cuantificación susceptible de ser decodificada por decodificadores existentes de tipo MIC G.711. El método, según la invención, permite aumentar la calidad de escucha de la trama así obtenida teniendo en cuenta el ruido de cuantificación, conservando la interoperabilidad con los decodificadores existentes.
Una conformación del ruido de cuantificación se obtiene así mediante la determinación de una función de filtrado adecuado.
La trama binaria está constituida solamente por índices de cuantificación escalar que representa, individualmente, cada muestra de la señal, sin tener que transmitir coeficientes de predicción lineales.
Esta conformación no necesita, por lo tanto, la transmisión de coeficientes al decodificador y se puede poner en práctica por un codificador de tipo MIC sin filtro de síntesis.
La presente invención permite poner en práctica la conformación del ruido de cuantificación solamente en una cuantificación de caudal de transmisión mínimo (caudal base), preferiblemente un cuantificador MIC G.711, en el caso, por ejemplo, de un codificador con códigos imbricados. Así, en la decodificación, en función del caudal de transmisión asignado, es posible decodificar solamente una parte de la señal mediante una cuantificación inversa del caudal de transmisión base beneficiándose de la mejora de la calidad de la señal mediante la conformación del ruido de cuantificación.
En una forma de realización particular, la etapa de cuantificación escalable en caudal de transmisión proporciona, como mínimo, índices de cuantificación de caudal de transmisión base que corresponden a una codificación base de tipo codificación MIC interoperable con la norma UIT-T G.711 Ley A o Ley mu.
En una forma de realización de la invención, la función de filtrado se determina por la disposición operativa de dos filtros de predicción lineal, cuyos coeficientes se determinan a partir de la señal reconstruida.
Así, mediante esta puesta en práctica, es posible introducir un perfeccionamiento del lado del decodificador aplicando el cálculo de filtros a partir de la señal reconstruida de la misma forma que en el codificador. En este caso, no es necesario transmitir informaciones suplementarias para el cálculo de los filtros.
En otra forma de realización de la invención, la función de filtrado se determina por la disposición operativa de dos filtros de predicción lineal, cuyos coeficientes se determinan a partir de la señal de entrada.
De este modo, los coeficientes tomados en consideración para el cálculo de la función de filtrado del ruido de cuantificación no dependen de los filtros de síntesis codificados, y por lo tanto degradados, que modelizan la señal, pero que dependen directamente de la señal de entrada. La conformación del ruido estará, por lo tanto, más adaptada.
En una forma de realización particular, dicha señal intermedia de contra-reacción se calcula a partir de una predicción del ruido de cuantificación y de una predicción del ruido de cuantificación filtrado, obteniéndose el ruido de cuantificación filtrado mediante la adición de la señal intermedia y del ruido de cuantificación.
En una forma de realización particular, la función de filtrado del ruido de cuantificación es un filtro Autoregresivo de Media Ajustada (ARMA).
Al estar esta función de ponderación bajo la forma de un filtro con coeficientes en el numerador así como en el denominador sin limitación de número de coeficientes del numerador en 2, permite mejorar la conformación del ruido.
En una forma de realización de la invención, la función de ponderación del ruido de cuantificación se calcula, además, a partir de características de periodicidad de la señal de entrada.
Una función de ponderación, que tiene en cuenta las características de periodicidad de la señal, permite aportar una modulación suplementaria sobre el ruido en los lugares en donde el ruido es más importante, por ejemplo, entre los armónicos de la señal.
La invención está particularmente adaptada en el caso en que la trama de índices de cuantificación está conforme a la norma UIT G.711, Ley A o Ley mu.
En una forma de realización de secuencia de bits aleatorios, la etapa de cuantificación escalable de un caudal de transmisión predeterminado es una cuantificación escalar MIC interoperable con la norma UIT-T G.711, Ley A o Ley mu, la etapa de cuantificación inversa de los índices de caudal de transmisión inferior al caudal predeterminado se aplica sobre 8-K bits de la trama binaria para determinar una señal reconstruida y caracterizada porque se efectúa, además, una etapa de inserción de K bits de datos.
La invención se refiere, además, a un codificador de señal de audio de entrada que comprende un módulo de combinación, que combina la señal de audio de entrada con una señal intermedia de contra-reacción, que forma una señal de entrada modificada y un módulo de cuantificación escalable, en caudal de transmisión, de dicha señal de entrada modificada, proporcionando una trama binaria de índices de cuantificación de un caudal de transmisión predeterminado. Este codificador es tal que comprende, además:
-un módulo de cuantificación inversa de una parte de los índices de cuantificación de la trama binaria correspondiente a los índices de un caudal de transmisión inferior al caudal predeterminado, para determinar una señal reconstruida;
-un módulo de determinación de un ruido de cuantificación (QMIC(z)) procedente al menos de los módulos de cuantificación y de cuantificación inversa dispuestos en cascada;
-un módulo de determinación de una función de filtrado del ruido de cuantificación a partir de dicha señal reconstruida y
-un módulo de filtrado adecuado para aplicar dicha función de filtrado a dicho ruido de cuantificación para obtener dicha señal intermedia de contra-reacción.
Preferentemente, en el caso del codificador imbricado, el módulo de cuantificación inversa de caudal de transmisión inferior es de tipo MIC normalizado UIT-T G.711.
La invención se refiere, además, a un método de decodificación escalable de una señal de audio que comprende:
-una primera etapa de cuantificación inversa que decodifica índices de cuantificación de un primer caudal de transmisión denominado caudal base, para conformar una señal reconstruida;
-una segunda etapa de cuantificación inversa que decodifica índices de cuantificación de un segundo caudal superior al caudal base, puesta en práctica en función del caudal de transmisión recibido para la decodificación, con el fin de conformar una señal reconstruida de caudal de transmisión superior. El método comprende, además:
-una etapa de obtención de una señal diferencia entre dicha señal reconstruida de caudal base y dicha señal reconstruida de caudal superior;
-una etapa de determinación de una función de filtrado de corrección a partir de la señal reconstruida de caudal base;
-una etapa de aplicación de dicha función de filtrado de corrección a dicha señal de diferencia para obtener un término correctivo;
-una etapa de síntesis de una señal corregida reconstruida a caudal superior combinando dicho término correctivo y una de las señales reconstruidas.
De este modo, en la decodificación, en función del caudal asignado, es posible solamente decodificar una parte de la señal mediante una cuantificación inversa del caudal base beneficiándose de la mejora de la calidad de la señal mediante conformación del ruido de cuantificación.
En una forma de realización de la invención, dicho término correctivo se aplica a dicha señal reconstruida de caudal base.
En otra forma de realización, dicho término correctivo se aplica a dicha señal reconstruida de caudal superior.
La invención se refiere a un decodificador de una señal de audio que comprende:
-un primer módulo de cuantificación inversa que decodifica índices de cuantificación de un primer caudal denominado caudal base, para conformar una señal reconstruida;
-un segundo módulo de cuantificación inversa que decodifica índices de cuantificación de un segundo caudal superior al caudal base, puesto en práctica en función del caudal recibido en la decodificación, para conformar una señal reconstruida de caudal superior. El decodificador comprende, además:
-un módulo de obtención de una señal diferencia entre dicha señal reconstruida de caudal base y dicha señal reconstruida de caudal superior;
-un módulo de determinación de una función de filtrado de corrección a partir de la señal reconstruida de caudal base;
-un módulo de filtrado adecuado para aplicar dicha función de filtrado de corrección a dicha señal de diferencia para obtener un término correctivo;
-un módulo de síntesis de una señal corregida reconstruida de caudal superior adecuado para combinar dicho término correctivo y una de las señales reconstruidas.
Por último, la invención se refiere a un programa de ordenador destinado a almacenarse en una memoria de un codificador o de un decodificador y/o sobre un soporte de memoria adecuado para cooperar con un lector del codificador
o del decodificador, que comprende instrucciones de código para la puesta en práctica de las etapas del método de codificación según una de las reivindicaciones 1 a 5 y/o del método de decodificación según una de las reivindicaciones 6 a 8, cuando dicho programa se ejecuta por un procesador del codificador o del decodificador.
Otras características y ventajas de la invención aparecerán más evidentes a partir de la lectura de la descripción siguiente, dada únicamente a título de ejemplo no limitativo y realizada haciendo referencia a los dibujos adjuntos, en donde:
-la Figura 1 ilustra un sistema de codificación/decodificación MIC G.711 clásico de la técnica anterior;
-la Figura 2 representa un espectro de un bloque de señal con respecto al espectro de un ruido de cuantificación presente en un codificador que no pone en práctica la presente invención;
-la Figura 2b representa un espectro de un bloque de señal con respecto al espectro de un ruido de cuantificación presente en un codificador según la invención;
-la Figura 3 representa un esquema bloque general de un codificador según la invención y de un decodificador adaptado;
-la Figura 4 representa un esquema bloque de una primera forma de realización de un codificador según la invención y de un decodificador adaptado;
-la Figura 5 representa un esquema bloque de una segunda forma de realización de un codificador según la invención y de un decodificador adaptado;
-la Figura 6 representa un organigrama que ilustra las etapas de un primer modo de cálculo de un filtro de conformación del ruido de cuantificación, según la invención;
-la Figura 7 representa un organigrama que ilustra las etapas de un segundo modo de cálculo de un filtro de conformación del ruido de cuantificación, según la invención;
-la Figura 8 representa un organigrama que ilustra las etapas de un tercer modo de cálculo de un filtro de conformación del ruido de cuantificación, según la invención;
-la Figura 9 representa un esquema bloque de un codificador según la invención con un cuantificador de estructura imbricada y de un decodificador adaptado;
-la Figura 10 representa un esquema bloque de una variante de realización de un codificador según la invención, con un cuantificador de estructura imbricada y de un decodificador adaptado;
-la Figura 11 representa un esquema bloque de otra forma de realización de un codificador según la invención y de un decodificador adaptado y
-la Figura 12 representa un esquema bloque de otra forma de realización de un codificador según la invención y de un decodificador adaptado en situación de secuencia de bits aleatorios.
Con referencia a la Figura 3, un codificador 30, según la invención, se describirá a continuación. El decodificador 14 correspondiente es un decodificador clásico tal como se describe haciendo referencia a la Figura 1 que comprende un módulo de cuantificación inversa 12 que, en una forma de realización preferida, es un cuantificador MIC inverso.
El codificador 30 comprende un módulo de cuantificación 31, en una forma de realización preferida, con un cuantificador MIC. Además, comprende un módulo de cuantificación inversa 32, preferentemente de tipo MIC.
Un bucle de contra-reacción comprende, según la invención, un módulo 33 de conformación del ruido de cuantificación. imagen2
Para ello, este módulo recibe a la entrada, a la vez, la señal en la entrada del cuantificador y la señal
procedente del módulo de cuantificación inversa para obtener el ruido de cuantificación. Este módulo determina una función de ponderación a aplicar al ruido de cuantificación. Conviene señalar que no se transmite ningún coeficiente de filtro ni otro parámetro que sirva para la conformación del ruido de cuantificación.
Esta función de ponderación puede ser constante y fijada de una sola vez, con independencia de la señal de entrada.
Como una opción, se puede adaptar por un módulo de adaptación 34 que recibe, a la entrada, la señal de entrada a codificar y/o la señal a la salida del cuantificador inverso. Los cálculos puestos en práctica por este módulo de adaptación son del tipo de predicción lineal. Se describirán, con más detalle, haciendo referencia a las Figuras 6, 7 y 8.
El ruido de cuantificación así ponderado es, a continuación combinado con la señal de entrada en la referencia 35. La señal combinada se proporciona a la entrada del cuantificador 31 que proporciona, al canal de transmisión 11, una trama de índices de cuantificación del tipo de trama G.711, tal como se define haciendo referencia a la Figura 1, es decir, 8 bits (signo, número de segmento y posición en el segmento).
Esta Figura 3 es, asimismo, una ilustración de las principales etapas del método según la invención puestas en práctica por el codificador.
Así, el codificador pone en práctica el método según la invención que comprende las etapas de:
-cuantificación escalar de las muestras de la señal de entrada combinada con una señal intermedia de contra-reacción para obtener índices de cuantificación que constituyen una trama binaria de índices de cuantificación;
-determinación de una señal reconstruida a partir de los índices de cuantificación mediante una etapa de cuantificación escalar inversa;
-determinación de un ruido de cuantificación generado por la sucesión de la etapa de cuantificación y de cuantificación inversa;
-determinación de una función de ponderación del ruido de cuantificación;
-aplicación de dicha función de ponderación al ruido de cuantificación para obtener dicha señal intermedia de contra-reacción correspondiente al ruido de cuantificación ponderado.
Un programa de ordenador destinado a almacenarse en una memoria del codificador y/o sobre un soporte de memoria adecuado para cooperar con un lector del codificador, que comprende instrucciones de código para la puesta en práctica de las etapas del método según la invención, cuando dicho programa se ejecuta por un procesador del codificador.
Así, el decodificador clásico 14 puede, sin modificaciones, decodificar la señal I’MIC recibida beneficiándose de la mejora de la calidad obtenida por medios de la conformación del ruido que se pone en práctica en el codificador 30.
En otra aplicación posible, es posible, en el momento de la transmisión entre el codificador y el decodificador, no tener en cuenta uno o varios bits o incluso utilizar uno o varios bits para transmitir otros datos distintos a los procedentes de la codificación. En este caso, la presente invención, que mejora la calidad de la codificación, permite proporcionar una calidad de señal equivalente a la calidad obtenida actualmente por los codificadores clásicos MIC G.711 pero con un número de bits reducido.
En otra aplicación posible en la que el cuantificador es escalable en caudal de transmisión, es posible extender un cuantificador MIC de 9, 10 bits, o más, conservando como trama binaria a la salida del codificador, el bit de signo, el dígito de segmento y añadiendo emplazamientos suplementarios en los segmentos con la estructura de trama correspondiente. Cuando se dobla el número de emplazamientos para cada segmento, se necesita un bit suplementario para la transmisión. En este caso, además, la presente invención mejora la calidad de decodificación cualquiera que sea el número de bits de mejora opcionales decodificados por el decodificador.
Una primera forma de realización de la invención se describe ahora haciendo referencia a la Figura 4.
El codificador 40, aquí descrito, comprende los mismos módulos 31, 32, 34 y 35 que los que fueron objeto de referencia y descritos con respecto a la Figura 3. El decodificador 14 es un decodificador clásico tal como se describe haciendo referencia a la Figura 1.
El funcionamiento del módulo de conformación del ruido de cuantificación 33 se detalla a continuación.
En un primer momento, el ruido de cuantificación QMIC (Z) se obtiene en 41 efectuando la diferencia entre la entrada del cuantificador 31 y la salida del cuantificador inverso 32.
En adelante, utilizaremos, de forma indistinta, la notación de muestras temporales n o la transformada en z según que una u otra sea la más práctica. Por ejemplo s(n) será la muestra temporal de la transformada en z S(z).
Una disposición operativa de dos filtros Ag1P(z) en 42 y Ag2P(z) en 44 está prevista para obtener una función de ponderación del ruido de cuantificación.
Esta disposición operativa funciona del modo siguiente:
Una primera suma parcial de las muestras se efectúa por el filtro Ag1P(z) en 42, que es de la forma:
imagen2
para proporcionar a la salida del filtro 42:
imagen2
en donde qMIC (n) es el ruido de cuantificación.
Un ruido de cuantificación filtrado qfMIC (n) se obtiene en 43 añadiendo el ruido de cuantificación qMIC(n) a la señal –sg1P(n) y a la señal sg2P(n) obtenida por el segundo filtro Ag2P(z) en 44. Este segundo filtro Ag2P(z) viene dado por:
imagen2
siendo qf MIC (n), por lo tanto, tal como:
imagen3
imagen2
Los coeficientes de los filtros Ag1P(z) y Ag2P(z) se calculan mediante métodos de predicción lineal por el módulo de adaptación 34. Estos cálculos se detallarán posteriormente haciendo referencia a las Figuras 6, 7 y 8.
La diferencia efectuada en 45 de las señales sg1P(n) – sg2P(n) que constituyen una señal intermedia de contra-reacción se elimina luego en 35 a partir de la señal de entrada para proporcionar la señal de entrada del cuantificador 31.
A continuación, la señal se cuantifica y el ruido de cuantificación se obtiene, en el instante n, por diferencia entre la entrada del cuantificador y la salida del cuantificador inverso.
La expresión de la señal restituida en función de la señal a codificar y del ruido de cuantificación vendrá dada por:
imagen2
imagen4
Según imagen2 se describe a continuación, el numerador y el denominador se suelen calcular a partir de un filtro asignando coeficientes g1 y g2 de la forma siguiente:
imagen2
Este tipo de función de ponderación que comprende un valor en el numerador y un valor en el denominador presenta la ventaja por el valor en el denominador de tener en cuenta los picos de señal y por el valor en el numerador de atenuar estos picos aportando, de este modo, una conformación óptima del ruido de cuantificación. Los valores de g1 y g2 son tales que:
1>g2 > g1 > 0.
Se puede hacer constar que el esquema representado en la Figura 4 puede ser generalizado para filtros ARMA dispuestos en cascada con el fin de modelizar, todavía mejor, el ruido para señales de entrada de muy fuerte dinámica.
Una segunda forma de realización se describe ahora haciendo referencia a la Figura 5. El codificador 50 comprende los mismos módulos 31, 32, 34 que los descritos haciendo referencia a las Figuras 3 y 4. Asimismo, el decodificador 14 es idéntico al descrito haciendo referencia a las Figuras 3 y 4.
El módulo de conformación del ruido 33 se detalla a continuación.
En este módulo, se encuentra la misma disposición operativa 41, 43, 45 y los filtros 42, 44 descritos haciendo referencia a la Figura 4. Otros filtros Pp1(z) y Pp2(z) con sus referencias 51 y 56 respectivas están previstos en este módulo.
En efecto, en el caso de las señales vocalizadas y en el de las señales audiodigitales de alta fidelidad, una ligera conformación a partir de la estructura fina de la señal que revela las periodicidades de la señal, reduce el ruido de cuantificación percibido entre los armónicos de la señal. La mejora es especialmente significativa en el caso de las señales de frecuencia fundamental o pitch (tono) relativamente elevada, por ejemplo superior a 200 Hz.
El filtro 51 de conformación de la función de la estructura fina del espectro viene dado por:
imagen2
en donde Pp1(z) es un filtro parcial dado por:
imagen2
en donde Pitch es el número de muestras de un periodo de señal, 2Mp+1 es el número de coeficiente de filtro parcial y P1Mp(k) k= -MP,…. Mp son los coeficientes del filtro.
El filtro 56 de conformación de la función en el denominador viene dado por:
P2(z) = 1-Pp2(z) en donde Pp2(z) es un filtro parcial dado por:
imagen2
La disposición operativa 52, 54, 55 y 53 de los filtros 51 y 56 con los filtros 42 y 44 es tal que la señal decodificada imagen2 viene dada en función de la señal a codificar y de los filtros de conformación por:
imagen2
El filtro 1-Pp1(z) posee 2Mp ceros en el interior del círculo unidad, complejos conjugados de modo que, cuando la variable z recorre el círculo unidad, la respuesta en frecuencia de 1-Pp1(z) presentará Mp máximos característicos de la estructura fina del espectro y correspondiente a la periodicidad de la señal.
Los predictores parciales Pp1(z) y Pp2(z) se calculan a partir de la señal de entrada mediante técnicas de predicción lineal.
La Figura 2b representa el espectro del mismo bloque de señal vocalizada que en la Figura 2, pero, contrariamente a la Figura 2, el ruido de cuantificación ha sido conformado aplicando la variante de la invención según se representa en la Figura 5. Se puede constatar que el ruido sigue, a la vez, los elementos de conformación y los armónicos; se sitúa siempre por debajo del nivel de la señal, lo que implica que el ruido se hace así inaudible.
Con referencia a la Figura 6, se describirá ahora un primer modo de cálculo de los filtros de conformación por predicción lineal, tal como los filtros con referencias 42 y 44 en las Figuras 4 y 5.
Este primer ejemplo de puesta en práctica se describe bajo la forma de un algoritmo a poner en práctica por el módulo de adaptación 34 descrito haciendo referencia a las Figuras 3, 4 y 5.
En E60, el módulo 34 recibe, a la entrada, un bloque de señal que corresponde al bloque corriente si la cuantificación MIC se efectúa por bloque de señal o bien, la señal del bloque precedente si la cuantificación MIC se efectúa muestra por muestra.
El bloque de la señal se pondera, a continuación, mediante una ventana de Hanning en E61. Otras ventanas son posibles tales como, por ejemplo, la ventana de Kaiser.
Los K+1 coeficientes de correlación se calculan, a continuación, en E62 por:
imagen2
Los coeficientes del filtro AR (abreviatura de AutoRegresivo), que modeliza la envolvente de la señal vienen dados en E63 por el algoritmo de Levinson-Durbin:
imagen5
Se obtiene, por lo tanto, un filtro Ag (z) en E64, modelizando el filtro de función de transferencia envolvente de la señal de entrada.
Cuando se pone en práctica este cálculo para los dos filtros Ag1 y Ag2, 42 y 44 del codificador según la invención, se obtiene así, en E65, un filtro de conformación dado por:
imagen2
Un segundo modo de cálculo de los filtros se describe ahora haciendo referencia a la Figura 7.
25 En E70, se toma, a la entrada, un bloque de señal que corresponde bien sea al bloque corriente si la cuantificación MIC se efectúa por un bloque de señal, bien sea la señal del bloque precedente si la cuantificación MIC se efectúa muestra por muestra.
El bloque de señal se pondera, a continuación, en E71 por una ventana de ponderación y luego, una curva de enmascaramiento se calcula en E72. Esta curva representa el nivel máximo de ruido aceptable desde un punto de vista de la inaudibilidad. Un ejemplo de cálculo eficaz viene dado por la codificación de audio en la referencia Y. Mahieux, J.P. Petit, “Codificación de transformada de audio de alta calidad a 64 kbits/s”, IEEE Trans. on Com., Vol. 42-11, noviembre 1994.
35 Los coeficientes de la curva de enmascaramiento representan una densidad espectral de potencia. Esta densidad de imagen2
potencia está aproximada por un filtro AutoRegresivo . Para ello, se efectúa, en primer lugar, en E73, una transformación de Fourier inversa de la curva de enmascaramiento M(z) para obtener los coeficientes de correlación representativos.
Los coeficientes del filtro AR que modeliza la curva de enmascaramiento vienen dados por el algoritmo de Levinson-Durbin en E74 para proporcionar el filtro AutoRegresivo de conformación en E75:
imagen2
En este caso, el filtro ARMA de enmascaramiento se reduce a un filtro utoregresivo (sin numerador) que modeliza la curva de enmascaramiento. Esta forma de proceder puede ser de interés porque el codificador MIC puede, asimismo, codificar música (por ejemplo: música de fondo de espera) en banda reducida [0-4 kHz] y en este caso, es más preciso utilizar las curvas de enmascaramiento.
Este modo de cálculo se puede aplicar así al filtro Ag2 de la Figura 4, estando el filtro Ag1 puesto a 0.
Un tercer modo de cálculo de filtro de puesta en práctica se describe ahora haciendo referencia a la Figura 8. En E80, se toma, a la entrada, un bloque de señal que corresponde bien sea al bloque corriente si la cuantificación MIC se efectúa por bloque de señal, bien sea la señal del bloque precedente, si la cuantificación MIC se efectúa muestra por muestra.
El bloque de la señal se pondera, a continuación, en E81 mediante una ventana de ponderación y luego la curva de enmascaramiento se calcula en E82 como en el caso precedente descrito en la Figura 7. Los coeficientes de la curva de enmascaramiento representan una densidad espectral de potencia que es aproximada, en el caso presente, por un filtro de media ajustada Ag (z). Para ello, se toma en E83 la inversa de la curva de enmascaramiento teniendo cuidado en
limitar las amplitudes procedentes de los pequeños valores de imagen2 M(z) y se efectúa, en E84, una transformación de Fourier
inversa de que proporciona los coeficientes de correlación representativos.
Los coeficientes del filtro AR, que modeliza la inversa de la curva de enmascaramiento, vienen dados en E85 por el algoritmo de Levinson-Durbin:
imagen2
El filtro de media ajustada 1-Ag (z), así definido, no contiene coeficientes en el denominador y será el filtro MA el que modelice la curva de enmascaramiento.
Este modo de cálculo puede aplicarse, así, al filtro Ag1 de la Figura 4, estando el filtro Ag2 puesto a 0.
Un cuarto modo de cálculo de los filtros de conformación es posible. Presenta la ventaja de no necesitar almacenar la señal por bloques y da lugar, por lo tanto, a un sistema de codificación con retardo mínimo. En este modo, se adaptarán los coeficientes del filtro ARMA de conformación a cada muestra mediante un algoritmo del gradiente. Se calculará, en primer lugar, los coeficientes del filtro ARMA que modelizan la señal de entrada s(n) según se describe, por ejemplo, en la Figura 6.
La señal de error será dada en función de la señal s(n) por:
imagen2
Tomando el gradiente de e2(n) se deduce el algoritmo de adaptación de los coeficientes del filtro ARMA:
imagen2
A partir de los coeficientes que modelizan la señal s(n), se calculará el filtro de conformación asignando una ponderación g1 y g2 al filtro ARMA que modeliza s(n) para obtener:
imagen2
Haciendo referencia a la Figura 9, se describe ahora otra forma de realización de un codificador según la invención.
En esta forma de realización, el cuantificador MIC de 8 bits se extiende a un cuantificador MIC de 9, 10 bits o más conservando, como trama binaria a la salida del codificador, el bit de signo, el dígito de segmento y añadiendo emplazamientos suplementarios en los segmentos como se ilustra en la Figura 9, con la estructura de trama 116 correspondiente. Cuando se dobla el número de emplazamientos para cada segmento, un bit suplementario es necesario para la transmisión.
La Figura 9 proporciona un ejemplo de puesta en práctica de cuantificación MIC imbricada, en donde el módulo de conformación del ruido 33, tal como se describe en las formas de realización de las Figuras 3, 4 o 5 se conserva así como el módulo de adaptación 34.
El cuantificador MIC imbricado QE, con la referencia 91, se encuentra en un bucle de contra-reacción de conformación del ruido de cuantificación. Genera un código IE a la salida del cuantificador implicado QE de más fuerte caudal de transmisión de E bits. La conformación del ruido de cuantificación se efectúa a partir de la salida del cuantificador MIC inverso 93 de 8 bits base, que corresponde, por ejemplo, al cuantificador MIC G.711. Este último debe alimentarse, por lo tanto, por un índice IMIC obtenido a partir de IE eliminando los F bits de mejora de peso débil por el módulo 92, es decir que F es tal que:
E=8+F
Este módulo de cuantificación inversa de 8 bits base puede denominarse módulo de cuantificación inversa base que tiene el caudal de transmisión mínimo base de 8 bits.
La función de ponderación del ruido de cuantificación aplicado por el módulo 33, según la invención, se aplica al ruido de cuantificación procedente de este módulo de cuantificación inversa base.
En el decodificador, la trama de índices de cuantificación I’E recibido se decodifica por el cuantificador inverso QE, con
referencia 101, para proporcionar la señal decodificada de más alto caudal de transmisión
Cuando un funcionamiento con un caudal de E-1 bits es señalizado (caso Sd en el decodificador, es decir, señalización del caudal), el bit de mejora de peso débil del I’E está enmascarado, lo que proporciona un índice I’E-1 de E-1 bits. Esta operación se señaliza en 102 por el operador S1.
La salida de E-1 bits
imagen2 se obtiene a la salida del cuantificador inverso QE -1 103 alimentado por el índice I’E-1 y así sucesivamente hasta SF, en donde imagen2 E-8 bits de mejora son suprimidos por la operación SF en 104 para proporcionar el
índice I’MIC que genera la salida
del cuantificador MIC de 8 bits inverso. Si en cualquier lugar de la transmisión solamente se conservan los 8 bits MIC, el índice resultante podrá decodificarse por un decodificador MIC estándar. De este modo, se puede demostrar, por medio de la transformada en z, que la conformación del ruido de cuantificación imagen2 es efectiva. En efecto, la expresión de la señal
viene dada por:
imagen1
imagen2
en donde Mask(z) viene dado por:
imagen2
en el caso de que se opte por la estructura de conformación representada en la Figura 4. La señal de alto caudal de transmisión
imagen2 vendrá dada por:
imagen2
en donde QF (z) es igual a la diferencia de las señales de salida de los cuantificadores QMIC y QE tal que:
imagen2
Para mejorar el modo de realización descrito con referencia a la Figura 9 se describirá, a continuación, con referencia a la Figura 10, una variante de realización.
En la estructura de la Figura 9, se puede constatar, examinando la ecuación (19), que la señal
imagen2 contiene un término parásito ParE(z) respecto al cuantificador no imbricado y óptimo:
imagen2
Conviene señalar que, para el bajo caudal de transmisión del MIC, se encuentra en la configuración óptima y no hay ningún término parásito en la ecuación (17). Para ser capaz de reconstituir el término parásito en el decodificador, es necesario efectuar la adaptación de los filtros imagen2 por el módulo 111 a partir de una de las señales reconstituidas. Como
está siempre presente, es natural elegir esta señal para la adaptación de los filtros de conformación. La única diferencia entre el codificador de la Figura 9 y el de la Figura 10 es que, para el codificador 110, la adaptación imagen2 de los filtros de conformación en 111 se efectúa a partir de la señal , estando esta señal presente en el decodificador en todos los casos. En el decodificador, la adaptación de los filtros de conformación se realiza, asimismo, por el módulo 108 a partir de la imagen2 señal , estando esta señal disponible en todas las configuraciones de caudal de transmisión. En la ausencia de errores de transmisión, la adaptación de los filtros será idéntica para el codificador y para el decodificador. La parte imbricada del decodificador se obtiene a partir del decodificador descrito en la Figura 9 modificando las salidas de los cuantificadores inversos por un término correctivo procedente de la salida del filtro Corkimagen2 (z) alimentado por la diferencia entre
imagen2 y imagen2 , siendo k el número de bits del cuantificador afectado y
la salida del cuantificador inverso k. Los términos correctivos se introducen, por lo tanto, en el decodificador en 106 para CorE(z), en 107 para CorE-1(z), etc.
El filtro de corrección viene dado por:
imagen2
Otro modo de realización de la invención, para un codificador de estructura imbricada, se describe a continuación haciendo referencia a la Figura 11.
En este caso presente, la conformación del ruido se efectúa para la cuantificación de alto caudal de transmisión. En esta figura, el cuantificador QE imbricado 121 del codificador 120 se encuentra en un bucle de contra-reacción de conformación del ruido de cuantificación. Genera un código IE a la salida del cuantificador imbricado QE de más elevado caudal de transmisión de E bits. La conformación del ruido de cuantificación se efectúa a partir de la salida del cuantificador QE -1 inverso 122 de 9, 10 bits o más, alimentado por el índice IE.
En el decodificador, el índice I’E recibido se decodifica por el cuantificador inverso (tabla) imagen2 QE 101 para proporcionar la
señal decodificada de más alto caudal de transmisión .
Cuando se señaliza un funcionamiento a un caudal de E-1 bits (caso de Sd en el decodificador, es decir, señalización del caudal de transmisión), el bit de peso débil de I’E se enmascara por la operación S1 en 102, lo que proporciona un índice I’E-1 de E-1 bits.
La salida a E-1 bits
imagen2 se obtiene a la salida del cuantificador inverso QE -1 103 alimentado por el índice I’E-1 y así sucesivamente, hasta imagen2 SF, en donde E-8 bits son suprimidos para proporcionar el índice I’MIC que genera la salida
del cuantificador MIC de 8 bits inverso.
Por medio de la transformada en z, se puede demostrar que la señal
imagen2 viene dada por:
imagen2
La señal, a la salida del cuantificador MIC, vendrá dada por:
imagen2
en donde QF (z) es la diferencia, en el emisor, entre la salida del cuantificador inverso
imagen2 y del cuantificador MIC inverso
imagen2 .
En el caso presente, a la salida del cuantificador MIC no se conoce, en general, el término QF (z) puesto que los bits de pesos débiles de IE fueron eliminados y por lo tanto, no es posible eliminar este término. El ruido generado en configuración de cuantificación MIC inversa será, por lo tanto, parcialmente conformado por la suma de una componente de ruido QF(z) (casi blanco) y de una componente de ruido conformada [1-Bp(z)] QE (z).
Resulta evidente que la conformación del ruido de cuantificación se puede efectuar, asimismo, para un caudal de transmisión intermedio entre el caudal base y el caudal más alto.
La Figura 12 proporciona un ejemplo de puesta en práctica de la cuantificación MIC imbricada con secuencias de bits aleatorios. El módulo de conformación del ruido 33, tal como se describe en las formas de realización de las Figuras 3, 4
o 5 se conserva así como el módulo de adaptación 34.
El cuantificador MIC imbricado QMIC con referencia 91, se encuentra en un bucle de contra-reacción de conformación del ruido de cuantificación. Genera un código IMIC a la salida del cuantificador imbricado QMIC de caudal de transmisión de 8 bits. En realidad, el código MIC G.711 es un código naturalmente imbricado. Es posible “aleatorizar” 1, 2 o 3 bits de posición en el segmento. Por lo tanto, se utilizarán estos bits para transmitir información auxiliar, por ejemplo, bits de mejora de calidad mediante una codificación de la banda suplementaria de 4 a 6 kHz o más. Los K = 1, 2 o 3 bits de peso débil de IMIC serán, por lo tanto, sustituidos por bits de datos para proporcionar un índice I8. La conformación del
ruido de cuantificación se efectúa a partir de la salida del cuantificador MIC inverso QMIC-K 93 de 8–K bits alimentado por el índice IMIC-K obtenido a partir de IMIC enmascarando los K bits de peso débil.
Este módulo de cuantificación inversa de 8-K bits puede ser denominado, asimismo, módulo de cuantificación inversa base que tiene el caudal de transmisión mínimo base de 8-K bits.
La función de ponderación del ruido de cuantificación aplicado por el módulo 33, según la invención, se aplica al ruido de cuantificación procedente de este módulo de cuantificación inversa base.
En una variante de realización, la secuencia de bits aleatorios se puede efectuar en un módulo 92 fuera del codificador. La conformación del ruido de cuantificación se efectúa, entonces, para la salida del G.711 QMIC.
En el decodificador, cuando el decodificador se encuentra que es un decodificador MIC estándar, la trama de índices de imagen2
cuantificación I’8, que se recibe, se decodifica por el cuantificador inverso imagen2 con referencia 101, para proporcionar la
señal decodificada . El índice I’8 se decodifica, a ciegas, por el decodificador MIC estándar. Los bits de datos de peso débil, si existen, se traducen por un ruido de codificación suplementario (se pierde 6 dB por bit utilizado para los datos) pero la calidad permanece aceptable gracias a la conformación del ruido según la presente invención y se conserva la compatibilidad “backward” (hacia atrás) con los antiguos sistemas.
Además, si se dispone de un nuevo decodificador y cuando la información de caudal de transmisión Sv ha podido ser transmitida por la red, se podrá recuperar los bits de datos, por ejemplo, para utilización de una capa de mejora de calidad de banda ancha.
De forma accesoria, se podrá enmascarar los k bits de peso débil del índice I’8 antes de efectuar la decodificación MIC, lo que tendrá, por efecto, reducir ligeramente el ruido. Se puede señalar que las aplicaciones de la secuencia de bits aleatorios del MIC son numerosas y se hacen de tanto mayor interés por cuanto que la conformación del ruido de cuantificación mejora la calidad de restitución de la señal de 8-K bits.

Claims (12)

  1. REIVINDICACIONES
    1. Método de codificación de una señal de audio de entrada en donde dicha señal de audio de entrada está combinada con una señal intermedia de contra-reacción que forma una señal de entrada modificada y que comprende una etapa de cuantificación escalable en caudal de transmisión (91) de dicha señal de entrada modificada, proporcionando una trama binaria de índices de cuantificación (IE) de un caudal de transmisión predeterminado, que comprende, además, las etapas siguientes:
    -cuantificación inversa (93) de una parte de los índices de cuantificación de la trama binaria correspondiente a los índices de un caudal de transmisión inferior (IMIC) al caudal predeterminado, para determinar así una señal
    reconstruida
    -determinación (94) de un ruido de cuantificación (QMIC(z)) generado al menos por la sucesión de la etapa de cuantificación y de cuantificación inversa;
    determinación (111) de una función de filtrado del ruido de cuantificación a partir de dicha señal reconstruida
    ;
    - aplicación (33) de dicha función de filtrado a dicho ruido de cuantificación para obtener dicha señal intermedia de contra-reacción.
  2. 2.
    Método según la reivindicación 1, caracterizado porque la etapa de cuantificación escalable, en caudal de transmisión, proporciona como mínimo índices de cuantificación de caudal de transmisión base que corresponde a una codificación base de tipo codificación MIC interoperable con la norma UIT-T G.711 Ley A o Ley mu.
  3. 3.
    Método, según la reivindicación 1 o 2, caracterizado porque dicha señal intermedia de contra-reacción se calcula a partir de una predicción (42) del ruido de cuantificación (QMIC) y de una predicción (44) del ruido de cuantificación filtrado (QfMIC), obteniéndose el ruido de cuantificación filtrado mediante la adición (43) de la señal intermedia y del ruido de cuantificación (QMIC).
  4. 4.
    Método, según una cualquiera de las reivindicaciones 1 a 3 caracterizado porque la función de filtrado del ruido de cuantificación se calcula, además, a partir de características de periodicidad de la señal de entrada.
  5. 5.
    Método de codificación, según la reivindicación 1, caracterizado porque la etapa de cuantificación escalable de un caudal de transmisión predeterminado es una cuantificación escalar MIC interoperable con la norma UIT-T G.711 Ley A
    o Ley mu, la etapa de cuantificación inversa de los índices de caudal de transmisión inferior al caudal de transmisión imagen1 predeterminado se aplica sobre 8-K bits de la trama binaria para determinar una señal reconstruida
    y porque se efectúa, además, una etapa de inserción de K bits de datos.
  6. 6. Método de decodificación escalable de una señal de audio que comprende: -una primera etapa de cuantificación inversa (105) que decodifica índices de cuantificación de un primer caudal imagen1 de transmisión denominado caudal base de transmisión, para formar una señal reconstruida ; -una segunda etapa de cuantificación inversa (101) que decodifica índices de cuantificación de un segundo
    caudal de transmisión superior al caudal base de transmisión, puesta en práctica en función del caudal de imagen1 transmisión recibido en la decodificación, para formar una señal reconstruida
    de caudal superior, que comprende, además:
    imagen2
    imagen3
    -una etapa de obtención de una señal diferencia entre dicha señal imagen1
    imagen1 reconstruida de caudal de
    transmisión base y dicha señal
    reconstruida de caudal de transmisión superior;
    -una etapa de determinación (108) de una función de filtrado de corrección a partir de la señal reconstruida de caudal de transmisión base;
    imagen1
    -una etapa de aplicación (106) de dicha función de filtrado de corrección a dicha señal de diferencia para obtener un término correctivo;
    -una etapa de síntesis de una señal corregida reconstruida de caudal de transmisión superior combinando dicho imagen1 término correctivo y una de las señales reconstruida
  7. 7.
    Método, según la reivindicación 6, caracterizado porque dicho término correctivo se aplica a dicha señal reconstruida de caudal base de transmisión.
  8. 8.
    Método, según la reivindicación 6, caracterizado porque dicho término correctivo se aplica a dicha señal reconstruida de caudal de transmisión superior.
  9. 9.
    Método de decodificación, según la reivindicación 6, caracterizado porque comprende una etapa de recepción de información de inserción de bits en la codificación y porque, en caso de información de inserción de K bits, se efectúa una etapa de enmascaramiento de los K bits insertados antes de la primera etapa de cuantificación inversa de caudal base de transmisión.
  10. 10.
    Codificador de señal de audio de entrada (S(z)) que comprende un módulo de combinación que combina la señal de audio de entrada con una señal intermedia de contra-reacción que forma una señal de entrada modificada y un módulo de cuantificación escalable en caudal de transmisión (91) de dicha señal de entrada modificada, proporcionando una trama binaria de índices de cuantificación de un caudal de transmisión predeterminado que comprende, además:
    -un módulo de cuantificación inversa (93) de una parte de los índices de cuantificación de la trama binaria correspondiente a los índices de un caudal de transmisión inferior al caudal de transmisión predeterminado, imagen1
    para determinar una señal
    reconstruida; -un módulo de determinación (94) de un ruido de cuantificación (QMIC(z)) procedente al menos de los módulos de cuantificación y de cuantificación inversa dispuestos en cascada; -un módulo de determinación (111) de una función de filtrado del ruido de cuantificación a partir de dicha señal imagen1 reconstruida
    y
    -un módulo de filtrado adecuado para aplicar (33) dicha función de filtrado a dicho ruido de cuantificación para obtener dicha señal intermedia de contra-reacción.
  11. 11. Decodificador de una señal de audio que comprende:
    - un primer módulo de cuantificación inversa (105) que decodifica índices de cuantificación de un primer caudal imagen1 de transmisión denominado caudal base de transmisión, para formar una señal
    reconstruida;
    -un segundo módulo de cuantificación inversa que decodifica índices de cuantificación de un segundo caudal superior de transmisión al caudal base de transmisión, puesto en práctica en función del caudal de transmisión recibido en la decodificación, para formar una señal reconstruida de caudal de transmisión superior,
    que comprende, además:
    - un módulo de obtención de una señal diferencia (QF(z)) entre dicha señal reconstruida
    imagen1 de caudal base de transmisión y dicha señal reconstruida
    imagen1 de caudal superior de transmisión;
    -un módulo de determinación (108) de una función de filtrado de corrección a partir de la señal reconstruida de caudal base de transmisión;
    imagen1
    -un módulo de filtrado adecuado para aplicar (106) dicha función de filtrado de corrección a dicha señal de diferencia para obtener un término correctivo;
    -un módulo de síntesis de una señal corregida reconstruida con caudal superior de transmisión adecuado para imagen1 combinar dicho término correctivo y una de las señales reconstruidas .
  12. 12. Programa de ordenador destinado a almacenarse en una memoria de un codificador o de un decodificador y/o sobre un soporte de memoria adecuado para cooperar con un lector del codificador o del decodificador, que comprende instrucciones de código adaptadas para la puesta en práctica de las etapas del método de codificación según una de las reivindicaciones 1 a 5 y/o del método de decodificación, según una de las reivindicaciones 6 a 8, cuando dicho programa se ejecuta por un procesador del codificador o del decodificador.
ES08805994T 2007-06-15 2008-06-13 Codificación de señales audio-digitales. Active ES2363190T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
WOFR2007/557792 2007-06-15
FR0755792 2007-06-15

Publications (1)

Publication Number Publication Date
ES2363190T3 true ES2363190T3 (es) 2011-07-26

Family

ID=38577930

Family Applications (1)

Application Number Title Priority Date Filing Date
ES08805994T Active ES2363190T3 (es) 2007-06-15 2008-06-13 Codificación de señales audio-digitales.

Country Status (9)

Country Link
US (1) US8719012B2 (es)
EP (1) EP2171713B1 (es)
JP (1) JP5451603B2 (es)
AT (1) ATE502377T1 (es)
BR (1) BRPI0813178B1 (es)
DE (1) DE602008005593D1 (es)
ES (1) ES2363190T3 (es)
PL (1) PL2171713T3 (es)
WO (1) WO2009004227A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique
EP3139382B1 (en) 2014-05-01 2019-06-26 Nippon Telegraph and Telephone Corporation Sound signal coding device, sound signal coding method, program and recording medium
CN115691536B (zh) * 2022-11-15 2025-08-22 湖南联智科技股份有限公司 一种应用于工业音频处理的音频消噪方法、设备及介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0331405B1 (en) * 1988-02-29 1996-11-27 Sony Corporation Method and apparatus for processing a digital signal
JP2551147B2 (ja) * 1989-05-19 1996-11-06 国際電信電話株式会社 音声符号化方式
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
JPH0472909A (ja) * 1990-07-13 1992-03-06 Sony Corp オーディオ信号の量子化誤差低減装置
DE69431223T2 (de) * 1993-06-29 2006-03-02 Sony Corp. Gerät und Verfahren zur Tonsignalübertragung
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
JP3559488B2 (ja) * 2000-02-16 2004-09-02 日本電信電話株式会社 音響信号の階層符号化方法及び復号化方法
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
FR2859566B1 (fr) * 2003-09-05 2010-11-05 Eads Telecom Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre
US7930176B2 (en) * 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
EP2165328B1 (en) * 2007-06-11 2018-01-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of an audio signal having an impulse-like portion and a stationary portion

Also Published As

Publication number Publication date
BRPI0813178B1 (pt) 2020-05-12
EP2171713A1 (fr) 2010-04-07
JP5451603B2 (ja) 2014-03-26
BRPI0813178A2 (pt) 2014-12-23
ATE502377T1 (de) 2011-04-15
DE602008005593D1 (de) 2011-04-28
EP2171713B1 (fr) 2011-03-16
PL2171713T3 (pl) 2011-08-31
WO2009004227A1 (fr) 2009-01-08
US8719012B2 (en) 2014-05-06
US20100145712A1 (en) 2010-06-10
JP2010532489A (ja) 2010-10-07

Similar Documents

Publication Publication Date Title
ES2380591T3 (es) Codificación de señal de información
ES2453098T3 (es) Códec multimodo de audio
ES2599007T3 (es) Aparato y método para codificar y decodificar una señal de audio codificada utilizando modelado de ruido/parche temporal
ES2358213T3 (es) Flujo redundante de bits de audio y métodos de procesamiento de flujo de bits de audio.
ES2628127T3 (es) Cuantificador avanzado
ES3031957T3 (en) Audio signal decoder, corresponding method and computer program
ES2531568T3 (es) Banco de filtro de análisis, banco de filtro de síntesis, codificador, decodificador, mezclador y sistema de conferencia
JP5161212B2 (ja) Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法
ES2732952T3 (es) Decodificador de audio y procedimiento para proporcionar una información de audio decodificada usando un ocultamiento de error basado en una señal de excitación en el dominio del tiempo
ES2644730T3 (es) Postfiltro de código de audio
ES2700139T3 (es) Códec de audio multicanal sin pérdida que usa segmentación adaptativa con capacidad de punto de acceso aleatorio (RAP)
KR101339857B1 (ko) 계층적 코더 내에 잡음 성형을 구비한 코딩
ES2356492T3 (es) Método de conmutación de tasa de transmisión en decodificación de audio escalable en tasa de transmisión y ancho de banda.
ES2797525T3 (es) Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC
ES2604983T3 (es) Ajuste de nivel en el dominio del tiempo para decodificación o codificación de señales de audio
ES2266312T3 (es) Indexacion de posiciones y señales de pulso en codigos de cifrado y descifrado algebraicos para la codificacion de señales de banda ancha.
ES2982183T3 (es) Codificador y descodificador de audio
ES2704286T3 (es) Método y dispositivo para la descodificación espectral perceptual de una señal de audio, que incluyen el llenado de huecos espectrales
ES2266003T3 (es) Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha.
ES2354743T3 (es) Dispositivo y método para el procesamiento posterior de valores espectrales y codificador y decodificador para señales de audio.
ES2827278T3 (es) Método, dispositivo y memoria no transitoria legible por ordenador para codificación y decodificación predictiva linealde señales sonoras en la transición entre tramas que tienen diferentes tasas de muestreo
ES2703873T3 (es) Codificación/descodificación de la transformada de señales armónicas de audio
ES2145737T5 (es) Codificador digital de voz con predictor a largo plazo mejorado por resolucion de submuestreos.
WO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
ES2741559T3 (es) Compartición adaptativa de la velocidad de ganancia-forma