ES2539174T3

ES2539174T3 - Aparato y método para ocultamiento de error en voz unificada con bajo retardo y codificación de audio (USAC)

Info

Publication number: ES2539174T3
Application number: ES12705999.6T
Authority: ES
Inventors: Jérémie Lecomte; Martin Dietz; Michael Schnabel; Ralph Sperschneider
Original assignee: Technische Universitaet Ilmenau; Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Current assignee: Technische Universitaet Ilmenau; Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date: 2011-02-14
Filing date: 2012-02-13
Publication date: 2015-06-26
Anticipated expiration: 2032-02-13
Also published as: HK1191130A1; US20130332152A1; BR112013020324B1; RU2630390C2; MX2013009301A; US9384739B2; TW201248616A; JP5849106B2; EP2661745A1; AU2012217215B2; TWI484479B; BR112013020324B8; CA2827000C; CA2827000A1; KR101551046B1; AU2012217215A1; CN103620672B; WO2012110447A1; SG192734A1; PL2661745T3

Abstract

Un aparato (100) para generar valores de reemplazo espectrales para una señal de audio que comprende: una unidad (110) de búfer para almacenar valores espectrales anteriores relacionados con una trama de señal de audio libre de errores recibida anteriormente, y un generador (120) de trama de ocultación para generar los valores de reemplazo espectrales cuando no se ha recibido o es errónea una trama de señal de audio actual, en el que la trama de señal de audio libre de errores recibida anteriormente comprende una información del filtro, teniendo la información de filtro asociada un valor de estabilidad del filtro que indica una estabilidad de un filtro de predicción definida por la información del filtro, y en el que el generador (120) de trama de ocultamiento se adapta para generar los valores de reemplazo espectrales en base a los valores espectrales anteriores y en base al valor de estabilidad del filtro.

Description

DESCRIPCIÓN

Aparato y método para ocultamiento de error en voz unificada con bajo retardo y codificación de audio (USAC)

La presente invención se refiere al procesamiento de señal de audio y, en particular, a un aparato y método para el 5 ocultamiento de error en voz unificada con bajo retardo y codificación de audio (LD-USAC).

El procesamiento de señal de audio ha avanzado en gran medida y ha crecido en importancia. En el procesamiento de señal de audio, la voz unificada con bajo retardo y codificación de audio tiene por objetivo proveer técnicas de codificación adecuadas para voz, audio y mezclas de voz y audio. Además, LD-USAC tiene por objetivo garantizar 10 una alta calidad para señales de audio codificadas. Comparado con USAC (voz unificada y codificación de audio), el retardo en LD-USAC se reduce.

Al codificar los datos de audio, un codificador LD-USAC examina la señal de audio a codificar. El codificador LD-USAC codifica la señal de audio codificada codificando los coeficientes del filtro de predicción lineal de un filtro de 15 predicción. Dependiendo de los datos de audio a codificar por una trama de audio particular, el codificador LD-USAC decide, si ACELP (predicción lineal por excitación de código avanzada) se usa para codificar, o si los datos de audio se codifican usando TCX (excitación codificada por transformada). Si bien ACELP usa coeficientes del filtro LP (coeficientes del filtro de predicción lineal), índices de libro de código adaptativo e índices de libro de código algebraico y ganancias de libro de código algebraicas y adaptativas, TCX usa coeficientes del filtro LP, parámetros 20 de energía e índices de cuantización relacionados con la transformada de coseno discreta modificada (MDCT).

Del lado del decodificador, el decodificador LD-USAC determina si se ha empleado ACELP o TCX para codificar datos de audio de una trama de señal de audio actual. El decodificador, a continuación, decodifica el cuadro de señal de audio en consecuencia. 25

Periódicamente, la transmisión de datos falla. Por ejemplo, una trama de señal de audio transmitida por un emisor llega con errores al receptor o no llega del todo o la trama se demora.

En estos casos, el ocultamiento de error es necesario para garantizar que pueden reemplazarse los datos de audio 30 perdidos o erróneos. Esto es particularmente verdadero para aplicaciones que tengan requisitos en tiempo real, ya que la solicitud de una retransmisión de la trama perdida o errónea podría infringir los requisitos de bajo retardo.

Las técnicas de ocultamiento se divulgan por el documento WO 2007/073604 A1 y por Lauber et al. “Error Concealment for Compressed Digital Audio”, AES Convention, Septiembre de 2001, páginas 1-8. 35

Sin embargo, las técnicas existentes de ocultamiento usadas para otras aplicaciones de audio crean a menudo un sonido artificial provocado por artefactos sintéticos.

Por lo tanto el objetivo de la presente invención es proporcionar unos conceptos mejorados para el ocultamiento de 40 error para una trama de señal de audio. El objetivo de la presente invención se soluciona mediante un aparato de acuerdo con la reivindicación 1, mediante un método de acuerdo con la reivindicación independiente 12 y mediante un programa de computación de acuerdo con la reivindicación independiente 13.

La presente invención se basa en el hallazgo de que, mientras que los valores espectrales anteriores de una trama 45 libre de error recibida anteriormente pueden usarse para la ocultación de errores, debería realizarse una atenuación en estos valores, y la atenuación debería depender de la estabilidad de la señal. Mientras menos estable sea una señal, más rápido debería realizarse la atenuación.

Las realizaciones preferidas se proporcionarán en las reivindicaciones dependientes. 50

Las siguientes realizaciones preferidas de la presente invención se describirán con respecto a las figuras, en las que

La figura 1 ilustra un aparato para obtener valores de reemplazo espectrales para una señal de audio de acuerdo con una realización, 55

La figura 2 ilustra un aparato para obtener valores de reemplazo espectrales para una señal de audio de acuerdo con otra realización,

Las figuras 3a-c ilustran la multiplicación de un factor de ganancia y los valores espectrales anteriores de acuerdo con una realización,

La figura 4a ilustra la repetición de una parte de señal que comprende un inicio en un dominio de tiempo, 60

La figura 4b ilustra la repetición de una parte de señal estable en un dominio de tiempo,

Las figuras 5a-b ilustran ejemplos, en los que los factores de ganancia generados se aplican en los valores espectrales de la figura 3a, de acuerdo con una realización,

La figura 6 ilustra un decodificador de señal de audio de acuerdo con una realización,

La figura 7 ilustra un decodificador de señal de audio de acuerdo con otra realización, y

La figura 8 ilustra un decodificador de señal de audio de acuerdo con una realización adicional.

La figura 1 ilustra un aparato 100 para generar valores de reemplazo espectrales para una señal de audio. El aparato 100 comprende una unidad 110 de búfer para almacenar valores espectrales anteriores relacionados con una trama de audio libre de error recibida anteriormente. Además, el aparato 100 comprende un generador 120 de 5 trama de ocultamiento para generar valores de reemplazo espectrales, cuando no se ha recibido una trama de audio actual o es errónea. La trama de audio libre de error recibida anteriormente comprende una información del filtro, teniendo la información del filtro asociada un valor de estabilidad del filtro que indica una estabilidad de un filtro de predicción. El generador 120 de trama de ocultamiento se adapta para generar valores de reemplazo espectrales basados en los valores espectrales anteriores y en base al valor de estabilidad del filtro. 10

La trama de audio libre de errores recibida anteriormente puede, por ejemplo, comprender valores espectrales anteriores. Por ejemplo, los valores espectrales anteriores pueden estar comprendidos en la trama de audio libre de errores recibida anteriormente en una forma codificada.

15

O, los valores espectrales anteriores pueden, por ejemplo, ser valores que pueden haberse generado modificando los valores comprendidos en la trama de audio libre de errores recibida anteriormente, por ejemplo, los valores espectrales de la señal de audio. Por ejemplo, los valores comprendidos en la trama de audio libre de errores recibida anteriormente pueden haberse modificado multiplicando cada uno de ellos con un factor de ganancia para obtener los valores espectrales anteriores. 20

O, los valores espectrales anteriores pueden, por ejemplo, ser valores que pueden haberse generado en base a los valores comprendidos en la trama de audio libre de errores recibida anteriormente. Por ejemplo, cada uno de los valores espectrales anteriores puede haberse generado empleando al menos algunos de los valores comprendidos en la trama de audio libre de errores recibida anteriormente, de tal manera que cada uno de los valores espectrales 25 anteriores depende de al menos algunos de los valores comprendidos en la trama de audio libre de errores recibida anteriormente. Por ejemplo, los valores comprendidos en la trama de audio libre de errores recibida anteriormente pueden haberse usado para generar una señal intermedia. Por ejemplo, los valores espectrales de la señal intermedia generada pueden, a continuación, considerarse como valores espectrales anteriores relacionados con la trama de audio libre de errores recibida anteriormente. 30

La flecha 105 indica que los valores espectrales anteriores se almacenan en la unidad 110 de búfer.

El generador 120 de trama de ocultamiento puede generar los valores de reemplazo espectrales, cuando una trama de audio actual no se ha recibido en tiempo o es errónea. Por ejemplo, un transmisor puede transmitir una trama de 35 audio actual a un receptor, en la que, por ejemplo, puede estar localizado el aparato 100 para obtener los valores de reemplazo espectrales. Sin embargo, la trama de audio actual no llega al receptor, por ejemplo, a causa de cualquier tipo de error de transmisión. O bien, la trama de audio actual transmitida se recibe por el receptor, pero, por ejemplo, a causa de una perturbación, por ejemplo, durante la transmisión, la trama de audio actual es errónea. En estos y otros casos, se necesita el generador 120 de trama de ocultamiento para el ocultamiento del error. 40

Para esto, el generador 120 de trama de ocultamiento se adapta para generar los valores de reemplazo espectrales en base a al menos algunos de los valores espectrales anteriores, cuando no se ha recibido una trama de audio actual o es errónea. De acuerdo con las realizaciones, se supone que la trama de audio libre de errores recibida anteriormente comprende una información del filtro, teniendo la información del filtro asociada un valor de estabilidad 45 del filtro que indica la estabilidad de un filtro de predicción definida por la información del filtro. Por ejemplo, la trama de audio puede comprender coeficientes del filtro de predicción, por ejemplo, los coeficientes del filtro de predicción lineal, como la información del filtro.

Además, el generador 120 de trama de ocultamiento se adapta para generar los valores de reemplazo espectrales 50 en base a los valores espectrales anteriores y en base al valor de estabilidad del filtro.

Por ejemplo, los valores de reemplazo espectrales pueden generarse en base a los valores espectrales anteriores y en base al valor de estabilidad del filtro de modo que cada uno de los valores espectrales anteriores se multiplica por un factor de ganancia, en los que el valor del factor de ganancia depende del valor de estabilidad del filtro. Por 55 ejemplo, el factor de ganancia puede ser menor en un segundo caso que en un primer caso, cuando el valor de estabilidad del filtro en el segundo caso es menor que en el primer caso.

De acuerdo con otra realización, los valores de reemplazo espectrales pueden generarse en base a los valores espectrales anteriores y en base al valor de estabilidad del filtro. Los valores intermedios pueden generarse 60 modificando los valores espectrales anteriores, por ejemplo, invirtiendo de forma aleatoria el signo de los valores espectrales anteriores, y multiplicando cada uno de los valores intermedios por un factor de ganancia, en el que el valor del factor de ganancia depende del valor de estabilidad del filtro. Por ejemplo, el factor de ganancia puede ser menor en un segundo caso que en un primer caso, cuando el valor de estabilidad del filtro en el segundo caso es

menor que en el primer caso.

De acuerdo con otra realización, los valores espectrales anteriores pueden emplearse para generar una señal intermedia, y una señal de síntesis en el dominio espectral puede generarse aplicando un filtro de predicción lineal en la señal intermedia. A continuación, cada valor espectral de la señal de síntesis generada puede multiplicarse por 5 un factor de ganancia, en el que el valor del factor de ganancia depende del valor de estabilidad del filtro. Como se ha mencionado anteriormente, el factor de ganancia puede, por ejemplo, ser menor en un segundo caso que en un primer caso, si el valor de estabilidad del filtro en el segundo caso es menor que en el primer caso.

A continuación, se explica en detalle una realización específica ilustrada en la figura 2. Una primera trama 101 llega 10 del lado del receptor, en la que puede localizarse un aparato 100 para obtener los valores de reemplazo espectrales. Del lado del receptor, se verifica si la trama de audio está libre de errores o no. Por ejemplo, una trama de audio libre de errores es una trama de audio en la que los datos de audio comprendidos en la trama de audio están libres de errores. Para tal fin, se pueden emplear medios (no mostrados) del lado del receptor, que determinen, si una trama recibida está libre de errores o no. Para este fin, pueden emplearse técnicas de reconocimiento de errores de última 15 generación, tal como medios que verifican, si los datos de audio recibidos son consistentes con un bit de verificación recibido o con una suma de verificación recibida. O, los medios de detección de errores pueden emplear una verificación de redundancia cíclica (CRC) para verificar si los datos de audio recibidos son consistentes con el valor CRC recibido. También puede emplearse cualquier otra técnica para verificar si una trama de audio recibida está libre de errores o no. 20

La primera trama 101 de audio comprende datos 102 de audio. Además, la primera trama de audio comprende datos 103 de verificación. Por ejemplo, los datos de verificación pueden ser un bit de verificación, unas sumas de verificación o un valor CRC, que pueden emplearse del lado del receptor para verificar si la trama 101 de audio recibida está libre de errores (es una trama libre de errores) o no. 25

Si se determina que la trama 101 de audio está libre de errores, entonces, los valores relacionados con la trama de audio libre de errores, por ejemplo, para los datos 102 de audio, se almacenarán en la unidad 110 de búfer como “valores espectrales anteriores”. Estos valores pueden, por ejemplo, ser valores espectrales de la señal de audio codificada en la trama de audio. O, los valores que se almacenan en la unidad de búfer pueden, por ejemplo, ser 30 valores intermedios que resultan del procesamiento y/o la modificación de los valores codificados almacenados en la trama de audio. Como alternativa, una señal, por ejemplo, la señal de síntesis en el dominio espectral, puede generarse en base a los valores codificados de la trama de audio, y los valores espectrales de la señal generada pueden almacenarse en la unidad 110 de búfer. El almacenamiento de los valores espectrales anteriores en la unidad 110 de búfer se indica con la flecha 105. 35

Por otra parte, los datos 102 de audio de la trama 101 de audio se usan del lado del receptor para decodificar la señal de audio codificada (no mostrado). La parte de la señal de audio que se ha decodificado puede reproducirse nuevamente del lado del receptor.

40

Posteriormente al procesamiento de la trama 101 de audio, el lado del receptor espera la próxima trama 111 de audio (comprendiendo además los datos 112 de audio y los datos 113 de verificación) para que llegue al lado del receptor. Sin embargo, por ejemplo, mientras que se transmite la trama 111 de audio (como se muestra en 115), algo inesperado sucede. Esto se ilustra en 116. Por ejemplo, una conexión puede alterarse de modo que los bits de la trama 111 de audio pueden modificarse sin intención durante la transmisión, o, por ejemplo, la trama 111 de audio 45 puede no llegar en absoluto al lado del receptor.

En tal situación, se necesita ocultamiento. Cuando, por ejemplo, una señal de audio se reproduce del lado del receptor, es decir, generada en base a una trama de audio recibida, deberían emplearse técnicas para enmascarar una trama perdida. Por ejemplo, los conceptos deberían definir qué hacer, cuando una trama de audio actual de una 50 señal de audio, es decir, necesaria para su reproducción, no llega al lado del receptor o es errónea.

El generador 120 de trama de ocultamiento está adaptado para proporcionar ocultamiento de errores. En la figura 2, se informa al generador 120 de trama de ocultamiento acerca de que no se ha recibido una trama actual o es errónea. Del lado del receptor, pueden emplearse medios (no mostrados) para indicar al generador 120 de trama de 55 ocultamiento que el ocultamiento es necesario (esto se muestra con la flecha 117 de guiones).

Para realizar el ocultamiento de errores, el generador 120 de trama de ocultamiento puede solicitar algunos o todos los valores espectrales anteriores, por ejemplo, los valores de audio anteriores, relacionados con la trama 101 libre de errores anteriormente recibida desde la unidad 110 de búfer. Esta solicitud se ilustra por la flecha 118. Como en 60 el ejemplo de la figura 2, la trama libre de errores anteriormente recibida puede, por ejemplo, ser la última trama libre de errores recibida, por ejemplo, la trama 101 de audio. Sin embargo, puede emplearse una trama libre de errores diferente del lado del receptor como la trama libre de errores anteriormente recibida.

A continuación, el generador de trama de ocultamiento recibe (algunos o todos) los valores espectrales anteriores relacionados con la trama de audio libre de errores recibida anteriormente (por ejemplo, la trama 101 de audio) desde la unidad 110 de búfer, como se muestra en 119. Por ejemplo, en el caso de una pérdida múltiple de tramas, el búfer se actualiza, o completa o parcialmente. En una realización, las etapas ilustradas por las flechas 118 y 119 pueden realizarse de modo que el generador 120 de trama de ocultamiento cargue los valores espectrales 5 anteriores desde la unidad 110 de búfer.

A continuación, el generador 120 de trama de ocultamiento genera los valores de reemplazo espectrales en base a al menos algunos de los valores espectrales anteriores. De este modo, el oyente no se entera de que se han perdido una o más tramas de audio, de tal manera que la impresión de sonido creada por la reproducción no se ve alterada.

10

Una manera sencilla de lograr el ocultamiento sería, usar simplemente los valores, por ejemplo, los valores espectrales de la última trama libre de errores como valores espectrales de reemplazo para la trama actual perdida o errónea.

Sin embargo, existen problemas específicos especialmente en el caso de inicios, por ejemplo, cuando el volumen de 15 sonido cambia de repente de forma significante. Por ejemplo, en el caso de una ráfaga de ruido, simplemente repitiendo los valores espectrales anteriores de la última trama, la ráfaga de ruido se repetirá también.

En contraste, si la señal de audio es bastante estable, por ejemplo su volumen no cambia significativamente, o, por ejemplo, sus valores espectrales no cambian significativamente, entonces el efecto de generar de forma artificial la 20 parte de señal de audio actual en base a los datos de audio recibidos anteriormente, por ejemplo, repetir la parte de señal de audio recibida anteriormente, sería menos perturbador para un oyente.

Las realizaciones se basan en este hallazgo. El generador 120 de trama de ocultamiento genera valores de reemplazo espectrales en base a al menos algunos de los valores espectrales anteriores y en base al valor de 25 estabilidad del filtro que indica una estabilidad de un filtro de predicción relacionado con la señal de audio. Por lo tanto, el generador 120 de trama de ocultamiento toma en cuenta la estabilidad de la señal de audio, por ejemplo, la estabilidad de la señal de audio relacionada con la trama libre de errores recibida anteriormente.

Para ello, el generador 120 de trama de ocultamiento puede cambiar el valor de un factor de ganancia que se aplica 30 en los valores espectrales anteriores. Por ejemplo, cada uno de los valores espectrales anteriores se multiplica por el factor de ganancia. Esto se ilustra con respecto a las figuras 3a - 3c.

En la figura 3a, algunas de las líneas espectrales de una señal de audio relacionada con una trama libre de errores recibida anteriormente se ilustran antes de que se aplique un factor de ganancia original. Por ejemplo, el factor de 35 ganancia original puede ser un factor de ganancia transmitido en la trama de audio. Del lado del receptor, si la trama recibida está libre de errores, el decodificador puede, por ejemplo, configurarse para multiplicar cada uno de los valores espectrales de la señal de audio por el factor g de ganancia original para obtener un espectro modificado. Esto se muestra en la figura 3b.

40

En la figura 3b, se representan las líneas espectrales que resultan de multiplicar las líneas espectrales de la figura 3a por un factor de ganancia original. Para simplificar, se supone que el factor g de ganancia original es 2,0. (g = 2,0). Las figuras 3a y 3b ilustran un escenario, en el que no es necesario un ocultamiento.

En la figura 3c, se supone un escenario, en el que no se ha recibido una trama actual o es errónea. En tal caso, 45 deben generarse vectores de reemplazo. Para esto, los valores espectrales anteriores relacionados con la trama libre de errores recibida anteriormente, que se han almacenado en una unidad de búfer, pueden usarse para generar los valores de reemplazo espectrales.

En el ejemplo de la figura 3c, se supone que los valores de reemplazo espectrales se generan en base a los valores 50 recibidos, pero se modifica el factor de ganancia original.

Se usa un factor de ganancia para generar los valores de reemplazo espectrales diferente, más pequeño que el factor de ganancia que se usa para amplificar los valores recibidos en el caso de la figura 3b. Se logra así una atenuación. 55

Por ejemplo, el factor de ganancia modificado usado en el escenario ilustrado en la figura 3c puede ser un 75 % del factor de ganancia original, por ejemplo 0,75 ∙ 2,0 = 1,5. Multiplicando cada uno de los valores espectrales por el factor de ganancia modificado (reducido), se realiza una atenuación, ya que el factor de ganancia modificado gact=1,5 que se usa por la multiplicación de cada uno de los valores espectrales es menor que el factor de ganancia 60 original (factor de ganancia gant=2,0) usado por la multiplicación de los valores espectrales en el caso libre de errores.

La presente invención se basa, entre otros, en el hallazgo de que repetir los valores de una trama libre de errores

recibida anteriormente se percibe como más alterado, cuando la parte de señal de audio respectiva es inestable, que en el caso cuando la parte de señal de audio respectiva es estable. Esto se ilustra en las figuras 4a y 4b.

Por ejemplo, si la trama libre de errores recibida anteriormente comprende un inicio, entonces es probable que el inicio se reproduzca. La figura 4a ilustra una parte de señal de audio, en la que ocurre un transitorio en la parte de 5 señal de audio asociada con la última trama libre de errores recibida. En las figuras 4a y 4b, la abscisa indica el tiempo, la ordenada indica un valor de amplitud de la señal de audio.

La parte de señal especificada en 410 se relaciona con la parte de señal de audio relacionada con la última trama libre de errores recibida. La línea de guiones en el área 420 indica una posible continuación de la curva en el 10 dominio de tiempo, si los valores relacionados con la trama libre de errores recibida anteriormente se copian y se usan simplemente como valores de reemplazo espectrales de una trama de reemplazo. Como puede verse, el transitorio puede repetirse y percibirse como una alteración para el oyente.

En contraste, la figura 4b ilustra un ejemplo, en el que la señal es bastante estable. En la figura 4b, se ilustra una 15 parte de señal de audio relacionada con la última trama libre de errores recibida. En la parte de señal de la figura 4b, no ocurre un transitorio. Nuevamente, la abscisa indica el tiempo, la ordenada indica una amplitud de la señal de audio. El área 430 se relaciona con la parte de señal asociada con la última trama libre de errores recibida. La línea de guiones en el área 440 indica una posible continuación de la curva en el dominio de tiempo, si los valores de la trama libre de errores recibida anteriormente se copian y se usan como valores de reemplazo espectrales de una 20 trama de reemplazo. En tales situaciones en las que la señal de audio es bastante estable, repetir la última parte de señal resulta ser más aceptable para el oyente que en la situación en la que se repite un inicio como se ilustra en la figura 4a.

La presente invención se basa en el hallazgo de que los valores de reemplazo espectrales pueden generarse en 25 base a los valores recibidos anteriormente de una trama de audio anterior, pero que también debería considerarse la estabilidad de un filtro de predicción que depende de la estabilidad de una parte de señal de audio. Para esto, debería tomarse en cuenta un valor de estabilidad del filtro. El valor de estabilidad del filtro puede, por ejemplo, indicar la estabilidad del filtro de predicción.

30

En LD-USAC, los coeficientes del filtro de predicción, por ejemplo, los coeficientes del filtro de predicción lineal, pueden determinarse del lado del codificador y pueden transmitirse al receptor dentro de la trama de audio.

Del lado del decodificador, el decodificador recibe entonces los coeficientes del filtro de predicción, por ejemplo, los coeficientes del filtro de predicción de la trama libre de errores recibida anteriormente. Además, el decodificador 35 puede haber recibido ya los coeficientes del filtro de predicción de la trama predecesora de la trama recibida anteriormente, y puede, por ejemplo, haber almacenado estos coeficientes del filtro de predicción. La trama predecesora de la trama libre de errores recibida anteriormente es la trama que inmediatamente precede a la trama libre de errores recibida anteriormente. El generador de trama de ocultamiento puede determinar, a continuación, el valor de estabilidad del filtro en base a los coeficientes del filtro de predicción de la trama libre de errores recibida 40 anteriormente y en base a los coeficientes del filtro de predicción de la trama predecesora de la trama libre de errores recibida anteriormente.

A continuación, se presenta la determinación del valor de estabilidad del filtro de acuerdo con una realización, que es específicamente adecuada para LD-USAC. El valor de estabilidad considerado depende de los coeficientes del 45 filtro de predicción, por ejemplo, 10 coeficientes fi del filtro de predicción en caso de banda estrecha o, por ejemplo, 16 coeficientes fi del filtro de predicción en caso de banda ancha que pueden haberse transmitido en una trama libre de errores recibida anteriormente. Además, también se consideran los coeficientes del filtro de predicción de la trama predecesora de la trama libre de errores recibida anteriormente, por ejemplo, 10 coeficientes fi(p) del filtro de predicción adicionales en caso de banda estrecha (o, por ejemplo, 16 coeficientes fi(p) del filtro de predicción 50 adicionales en caso de banda ancha).

Por ejemplo, el k-ésimo filtro fk de predicción puede haberse calculado del lado del codificador computando una autocorrelación, de manera que:

55

tknknsnsf)(')('k

en la que s’ es una señal de voz sometida a partición de ventanas, por ejemplo, la señal de voz que debería codificarse, después de que se haya aplicado una ventana en la señal de voz. t puede ser, por ejemplo, 383. Como alternativa, t puede tener otros valores, tales como 191 o 95. 60

En otras realizaciones, en lugar de computar una autocorrelación, puede emplearse como alternativa el algoritmo de

Levinson-Durbin, conocido como de última generación, véase, por ejemplo,

[3]: 3GPP, “Speech codec speech processing functions; Adaptive Multi-Rate - Wideband (AMR-WB) speech codec; Transcoding functions”, 2009, V9.0.0, 3GPP TS 26.190.

5

Como ya se ha tratado, los coeficientes fi y fi(p) del filtro de predicción pueden haberse transmitido al receptor dentro de la trama libre de errores recibida anteriormente y de la predecesora de la trama libre de errores recibida anteriormente, respectivamente.

Del lado del decodificador, puede calcularse una medición de distancia de la frecuencia espectral lineal (medición de 10 distancia LSF) LSFdist empleando la fórmula:

uipiidistffLSF02)()(

u puede ser el número de filtros de predicción en la trama libre de errores recibida anteriormente menos 1. Por 15 ejemplo, si la trama libre de errores recibida anteriormente tenía 10 coeficientes del filtro de predicción, por ejemplo, u=9. El número de coeficientes del filtro de predicción en la trama libre de errores recibida anteriormente es normalmente idéntico al número de coeficientes del filtro de predicción en la trama predecesora de la trama libre de errores recibida anteriormente.

20

El valor de estabilidad valor puede calcularse de acuerdo con la fórmula:

θ = 0 si (1,25 – LSFdist / v) < 0

θ = 1 si (1,25 – LSFdist / v) > 1

θ = 1.25 – LSFdist / v 0 ≤ (1,25 – LSFdist / v) ≤ 1 25

v puede ser un número entero. Por ejemplo, v puede ser 156250 en caso de banda estrecha. En otra realización, v puede ser 400000 en caso de banda ancha.

θ se considera para indicar un filtro de predicción muy estable, si θ es 1 o cercano a 1. 30

θ se considera para indicar un filtro de predicción muy inestable, si θ es 0 o cercano a 0.

El generador de trama de ocultamiento puede adaptarse para generar los valores de reemplazo espectrales en base a los valores espectrales anteriores de una trama libre de errores recibida anteriormente, cuando una trama de audio 35 actual no se ha recibido o es errónea. Además, el generador de trama de ocultamiento puede adaptarse para calcular un valor θ de estabilidad en base a los coeficientes fi del filtro de predicción de la trama libre de errores recibida anteriormente y en base a los coeficientes fi(p) del filtro de predicción de la trama libre de errores recibida anteriormente, como se ha descrito anteriormente.

40

En una realización, el generador de trama de ocultamiento puede adaptarse para usar el valor de estabilidad del filtro para generar un factor de ganancia generado, por ejemplo, modificando un factor de ganancia original, y para aplicar el factor de ganancia generado en los valores espectrales anteriores relacionados con la trama de audio para obtener los valores de reemplazo espectrales. En otras realizaciones, el generador de trama de ocultamiento se adapta para aplicar el factor de ganancia generado en los valores derivados de los valores espectrales anteriores. 45

Por ejemplo, el generador de trama de ocultamiento puede generar el factor de ganancia modificado multiplicando un factor de ganancia recibido por un factor de atenuación, en el que el factor de atenuación depende del valor de estabilidad del filtro.

50

Por ejemplo, se supone que un factor de ganancia recibido en una trama de señal de audio tiene, por ejemplo, el valor 2,0. El factor de ganancia se usa normalmente para multiplicar los valores espectrales anteriores para obtener los valores espectrales modificados. Para aplicar una atenuación, se genera un factor de ganancia modificado que depende del valor θ de estabilidad.

55

Por ejemplo, si el valor de estabilidad es θ = 1, entonces el filtro de predicción se considera muy estable. El factor de atenuación puede establecerse en 0,85, si la trama a reconstruir es la primera trama perdida. Por lo tanto, el factor de ganancia modificado es 0,85 ∙ 2,0 = 1,7. Cada uno de los valores espectrales recibidos de la trama recibida anteriormente se multiplica por un factor de ganancia modificado de 1,7 en lugar de por 2,0 (el factor de ganancia recibido) para generar los valores de reemplazo espectrales. 60

La figura 5a ilustra un ejemplo, en el que se aplica un factor de ganancia generado de 1,7 a los valores espectrales

de la figura 3a.

Sin embargo, si, por ejemplo, el valor de estabilidad es θ = 0, entonces el filtro de predicción es considerado muy inestable. El factor de atenuación puede establecerse en 0,65, si la trama a reconstruir es la primera trama perdida. Por lo tanto, el factor de ganancia modificado es 0,65 ∙ 2,0 = 1,3. Cada uno de los valores espectrales recibidos de la 5 trama recibida anteriormente se multiplica por un factor de ganancia modificado de 1,3 en lugar de por 2,0 (el factor de ganancia recibido) para generar los valores de reemplazo espectrales.

La figura 5b ilustra un ejemplo, en el que se aplica un factor de ganancia generado de 1,3 a los valores espectrales de la figura 3a. Como el factor de ganancia en el ejemplo de la figura 5b es menor que el del ejemplo de la figura 5a, 10 las magnitudes en la figura 5b son menores también que las del ejemplo de la figura 5a.

Pueden aplicarse diferentes estrategias dependiendo del valor de θ, donde θ puede ser un valor entre 0 y 1.

Por ejemplo, un valor de θ ≥ 0,5 puede interpretarse como 1 de tal manera que el factor de atenuación tiene el 15 mismo valor como si θ fuera 1, por ejemplo, el factor de atenuación es 0,85. Un valor de θ < 0,5 puede interpretarse como 0 de tal manera que el factor de atenuación tiene el mismo valor como si θ fuera 0, por ejemplo, el factor de atenuación es 0,65.

De acuerdo con otra realización, el valor del factor de atenuación puede, como alternativa, interpolarse, si el valor de 20 θ está entre 0 y 1. Por ejemplo, suponiendo que el valor del factor de atenuación es 0,85 si θ es 1, y 0,65 si θ es 0, entonces el factor de atenuación puede calcularse de acuerdo con la fórmula:

factor de atenuación = 0,65 + θ ∙ 0,2; para 0 < θ < 1.

25

En otra realización, el generador de trama de ocultamiento está adaptado para generar los valores de reemplazo espectrales adicionalmente en base a la información de la clase de trama relacionada con la trama libre de errores recibida anteriormente. La información acerca de la clase puede determinarse por un codificador. El codificador puede codificar la información de la clase de trama en la trama de audio. Entonces, el decodificador puede decodificar la información de la clase de trama cuando se decodifica la trama libre de errores recibida anteriormente. 30

Como alternativa, el decodificador puede por sí solo determinar la información de la clase de trama examinando la trama de audio.

Por otra parte, el decodificador puede configurarse para determinar la información de la clase de trama en base a la 35 información del codificador y en base a una examinación de los datos de audio recibidos, realizándose la examinación por el decodificador, por sí solo.

La clase de trama puede, por ejemplo, indicar si la trama se clasifica en “inicio artificial”, “inicio”, “transición con voz”, “transición sin voz”, “sin voz” y “con voz”. 40

Por ejemplo, “inicio” puede indicar que la trama de audio recibida anteriormente comprende un inicio. Por ejemplo, “con voz” puede indicar que la trama de audio recibida anteriormente comprende datos de voz. Por ejemplo, “sin voz” puede indicar que la trama de audio recibida anteriormente comprende datos sin voz. Por ejemplo, “transición con voz” puede indicar que la trama de audio recibida anteriormente comprende datos de voz, pero que, comparado 45 con la predecesora de la trama de audio recibida anteriormente, el tono no ha cambiado. Por ejemplo, “inicio artificial” puede indicar que ha mejorado la energía de la trama de audio recibida anteriormente (por lo tanto, por ejemplo, creando un inicio artificial). Por ejemplo “transición sin voz” puede indicar que la trama de audio recibida anteriormente comprende datos sin voz pero que el sonido sin voz está a punto de cambiar.

50

Dependiendo de la trama de audio recibida anteriormente, el valor θ de estabilidad y el número de tramas sucesivas borradas, la ganancia de atenuación, por ejemplo, el factor de atenuación, pueden, por ejemplo, definirse de la siguiente manera:

Última trama bien recibida: Número de tramas sucesivas borradas Ganancia de atenuación (por ejemplo, factor de atenuación)

INICIO ARTIFICIAL: 0,6

INICIO: ≤ 3 0,2 ∙ θ + 0,8

INICIO: > 3 0,5

TRANSICIÓN CON VOZ: 0,4

TRANSICIÓN SIN VOZ: > 1 0,8

TRANSICIÓN SIN VOZ: = 1 0,2 ∙ θ + 0,75

SIN VOZ: = 2 0,2 ∙ θ + 0,6

SIN VOZ: > 2 0,2 ∙ θ + 0,4

SIN VOZ: = 1 0,2 ∙ θ + 0,8

CON VOZ: = 2 0,2 ∙ θ + 0,65

CON VOZ: > 2 0,2 ∙ θ + 0,5

De acuerdo con una realización, el generador de trama de ocultamiento puede generar un factor de ganancia modificado multiplicando un factor de ganancia recibido por el factor de atenuación determinado en base al valor de estabilidad del filtro y la clase de trama. A continuación, los valores espectrales anteriores pueden, por ejemplo, multiplicarse por el factor de ganancia modificado para obtener los valores de reemplazo espectrales. 5

El generador de trama de ocultamiento puede nuevamente adaptarse para generar adicionalmente los valores de reemplazo espectrales en base a la información de clase de trama.

De acuerdo con una realización, el generador de trama de ocultamiento puede adaptarse para generar 10 adicionalmente los valores de reemplazo espectrales dependiendo del número de tramas consecutivas que no han llegado al receptor o son erróneas.

En una realización, el generador de trama de ocultamiento puede adaptarse para calcular un factor de atenuación en base al valor de estabilidad del filtro y en base al número de tramas consecutivas que no han llegado al receptor o 15 son erróneas.

El generador de trama de ocultamiento puede además adaptarse para generar los valores de reemplazo espectrales multiplicando el factor de atenuación por al menos algunos de los valores espectrales anteriores.

20

Como alternativa, el generador de trama de ocultamiento puede adaptarse para generar los valores de reemplazo espectrales multiplicando el factor de atenuación por al menos algunos de los valores de un grupo de valores intermedios. Cada uno de los valores intermedios depende de al menos uno de los valores espectrales anteriores. Por ejemplo, el grupo de valores intermedios puede haberse generado modificando los valores espectrales anteriores. O, puede haberse generado una señal de síntesis en dominio espectral en base a los valores espectrales 25 anteriores, y los valores espectrales de la señal de síntesis pueden formar el grupo de los valores intermedios.

En otra realización, el factor de atenuación puede multiplicarse por un factor de ganancia original para obtener un factor de ganancia generado. El factor de ganancia generado se multiplica por al menos algunos de los valores espectrales anteriores, o por al menos algunos valores del grupo de los valores intermedios anteriormente 30 mencionado, para obtener los valores de reemplazo espectrales.

El valor del factor de atenuación depende del valor de estabilidad del filtro y del número de tramas perdidas o erróneas consecutivas, y puede, por ejemplo, tener los valores:

35

Valor de estabilidad del filtro: Número de tramas perdidas o erróneas consecutivas Factor de atenuación

0: 1 0,8

0: 2 0,8 ∙ 0,65 = 0,52

0: 3 0,52 ∙ 0,55 = 0,29

0: 4 0,29 ∙ 0,55 = 0,16

0: 5 0,16 ∙ 0,55 = 0,09

…
…
…

En el presente documento, el “número de tramas consecutivas perdidas o erróneas = 1” indica que la predecesora inmediata de la trama perdida o errónea estaba libre de errores.

Como puede observarse, en el ejemplo anterior, el factor de atenuación puede actualizarse cada vez que una trama 5 no llega o es errónea en base al último factor de atenuación. Por ejemplo, si la predecesora inmediata de la trama perdida o errónea está libre de errores, entonces, en el ejemplo anterior, el factor de atenuación es 0,8. Si la trama posterior también se pierde o es errónea, el factor de atenuación se actualiza en base al factor de atenuación anterior multiplicando el factor de atenuación anterior por un factor actualizado 0,65: factor de atenuación = 0,8 ∙ 0,65 = 0,52, y así sucesivamente. 10

Algunos o todos los valores espectrales anteriores pueden multiplicarse por el propio factor de atenuación.

Como alternativa, el factor de atenuación puede multiplicarse por un factor de ganancia original para obtener un factor de ganancia generado. El factor de ganancia generado puede multiplicarse por cada uno (o algunos) de los 15 valores espectrales anteriores (o valores intermedios derivados de los valores espectrales anteriores) para obtener los valores de reemplazo espectrales.

Debería observarse, que el factor de atenuación puede depender del valor de estabilidad del filtro. Por ejemplo, la tabla anterior puede comprender también definiciones para el factor de atenuación, si el valor de estabilidad del filtro 20 es 1,0, 0,5 u otro valor, por ejemplo:

1,0: 1
1,0

1,0: 2 1,0 ∙ 0,85 = 0,85

1,0: 3 0,85 ∙ 0,75 = 0,64

1,0: 4 0,64 ∙ 0,75 = 0,48

1,0: 5 0,48 ∙ 0,75 = 0,36

…
…
…

Los valores del factor de atenuación para los valores de estabilidad del filtro inmediatos pueden ser aproximados.

25

En otra realización, el factor de atenuación puede determinarse empleando una fórmula que calcule el factor de atenuación en base al valor de estabilidad del filtro y en base al número de tramas consecutivas que no han llegado al receptor o son erróneas.

Como se ha descrito anteriormente, los valores espectrales anteriores almacenados en la unidad de búfer pueden 30 ser valores espectrales. Para evitar que se generen artefactos alteradores, el generador de trama de ocultamiento puede, como se ha explicado anteriormente, generar los valores de reemplazo espectrales en base a un valor de estabilidad del filtro.

Sin embargo, el reemplazo de tal parte de señal generada puede aún tener un carácter de repetición. Por lo tanto, 35 de acuerdo con una realización, se propone además modificar los valores espectrales anteriores, por ejemplo, los valores espectrales de la trama recibida anteriormente invirtiendo de forma aleatoria el signo de los valores espectrales. Por ejemplo, el generador de trama de ocultamiento decide de forma aleatoria para cada uno de los valor espectrales anteriores, si el signo del valor espectral se invierte o no, por ejemplo, si el valor espectral se multiplica por -1 o no. De esta manera, se reduce el carácter de repetición de la trama de señal de audio 40 reemplazada con respecto a su trama predecesora.

A continuación, se describe un ocultamiento en un decodificador LD-USAC de acuerdo con una realización. En esta realización, el ocultamiento está trabajando en los datos espectrales antes de que el decodificador LD-USAC realice la frecuencia final a conversión de tiempo. 45

En tal realización, los valores de una trama de audio llegante se usan para decodificar la señal de audio codificada generando una señal de síntesis en el dominio espectral. Para esto, se genera una señal intermedia en el dominio espectral en base a los valores de la trama de audio llegante. El relleno de ruido se realiza en los valores cuantificados a cero.

5

Los coeficientes del filtro de predicción codificados definen un filtro de predicción que se aplica a continuación, a la señal intermedia para generar la señal de síntesis que representa la señal de audio reconstruida / decodificada en el dominio de frecuencia.

La figura 6 ilustra un decodificador de señal de audio de acuerdo con una realización. El decodificador de señal de 10 audio comprende un aparato para decodificar los valores 610 de señal de audio espectrales, y un aparato para generar los valores 620 de reemplazo espectrales de acuerdo con una de las realizaciones anteriores.

El aparato para decodificar valores 610 de señal de audio espectrales genera los valores espectrales de la señal de audio decodificada como se acaba de describir, cuando llega una trama de audio libre de errores. 15

En la realización de la figura 6, los valores espectrales de la señal de síntesis pueden entonces almacenarse en una unidad de búfer del aparato 620 para generar los valores de reemplazo espectrales. Estos valores espectrales de la señal de audio decodificada se han decodificado en base a la trama de audio libre de errores recibida, y por lo tanto, se relacionan con la trama de audio libre de errores recibida anteriormente.

20

Cuando una trama actual se pierde o es errónea, se informa al aparato 620 para generar valores de reemplazo espectrales de que se necesitan los valores de reemplazo espectrales. Para generar los valores de reemplazo espectrales, el generador de trama de ocultamiento del aparato 620 genera valores de reemplazo espectrales de acuerdo con una de las realizaciones descritas anteriormente.

25

Por ejemplo, los valores espectrales de la última trama buena se modifican ligeramente en el generador de trama de ocultamiento invirtiendo su signo de forma aleatoria. A continuación, se aplica una atenuación en estos valores espectrales. La atenuación puede depender de la estabilidad del filtro de predicción anterior y del número de tramas perdidas consecutivas. Los valores de reemplazo espectrales generados se usan a continuación como valores de reemplazo espectrales para la señal de audio, y a continuación se realiza una transformación de frecuencia a tiempo 30 para obtener una señal de audio en el dominio de tiempo.

En LD-USAC, así como en USAC y MPEG-4 (MPEG = grupo de expertos de imágenes en movimiento), puede emplearse un modelado temporal del ruido (TNS). Mediante el modelado temporal del ruido, se controla la estructura fina de tiempo del ruido. Del lado del decodificador, se aplica una operación de filtrado en los datos espectrales en 35 base a la información de modelado del ruido. Por ejemplo, puede encontrarse más información acerca del modelado temporal del ruido en:

[4]: ISO/IEC 14496-3:2005: Information technology - Coding of audio-visual objects - Part 3: Audio, 2005

40

Las realizaciones se basan en el hallazgo de que en caso de un inicio/transitorio, el TNS es extremadamente activo. Por lo tanto, determinando si el TNS es extremadamente activo o no, se puede estimar, si se encuentra presente un inicio/transitorio.

De acuerdo con una realización, se calcula del lado del receptor una ganancia de predicción que tiene el TNS. Del 45 lado del receptor, al principio, los valores espectrales recibidos de una trama de audio libre de errores recibida se procesan para obtener un primer valor ai espectral intermedio. A continuación, se realiza el TNS y mediante el mismo, se obtiene un segundo valor bi espectral intermedio. Se calcula un primer valor E1 de energía para el primer valor espectral intermedio y se calcula un segundo valor E2 de energía para el segundo valor espectral intermedio. Para obtener la ganancia gTNS de predicción del TNS, puede dividirse el segundo valor de energía por el primer valor 50 de energía.

Por ejemplo, gTNS puede definirse como:

gTNS = E2 / E1 55

22221122...nniibbbbE

22221121...nniiaaaaE

(n = número de valores espectrales considerados)

De acuerdo con una realización, el generador de trama de ocultamiento está adaptado para generar los valores de reemplazo espectrales en base a los valores espectrales anteriores, en base al valor de estabilidad del filtro y en base a una ganancia de predicción de un modelado temporal del ruido, cuando se realiza un modelado temporal del ruido en una trama libre de errores recibida anteriormente. De acuerdo con otra realización, el generador de trama 5 de ocultamiento está adaptado para generar los valores de reemplazo espectrales adicionalmente en base al número de tramas perdidas o erróneas consecutivas.

Cuanto mayor sea la ganancia de predicción, más rápida será la atenuación. Por ejemplo, se considera un valor de estabilidad del filtro de 0,5 y se supone que la ganancia de predicción es alta, por ejemplo gTNS = 6; entonces un 10 factor de atenuación, puede ser, por ejemplo, 0,65 (= atenuación rápida). En contraste, nuevamente, se considera un valor de estabilidad del filtro de 0,5, pero se supone que la ganancia de predicción es baja, por ejemplo, 1,5; entonces un factor de atenuación puede, por ejemplo, ser 0,95 (= atenuación lenta).

La ganancia de predicción del TNS puede influenciar también en los valores que deberían almacenarse en la unidad 15 de búfer de un aparato para generar valores de reemplazo espectrales.

Si la ganancia gTNS de predicción es menor que cierto valor umbral (por ejemplo un valor umbral = 5,0), entonces los valores espectrales, después de que se haya aplicado el TNS, se almacenan en la unidad de búfer como valores espectrales anteriores. En el caso de tramas perdidas o erróneas, se generan los valores de reemplazo espectrales 20 en base a estos valores espectrales anteriores.

De lo contrario, si la ganancia de predicción gTNS es mayor que o igual al valor umbral, los valores espectrales, antes de que se haya aplicado el TNS, se almacenan en la unidad de búfer como valores espectrales anteriores. En el caso de tramas perdidas o erróneas, se generan los valores de reemplazo espectrales en base a estos valores 25 espectrales anteriores.

El TNS no se aplica en ningún caso en estos valores espectrales anteriores.

Por consiguiente, la figura 7 ilustra un decodificador de señal de audio de acuerdo con una realización 30 correspondiente. El decodificador de señal de audio comprende una unidad 710 de decodificación para generar un primer valor espectral intermedio en base a una trama libre de errores recibida. Además, el decodificador de señal de audio comprende una unidad 720 modeladora temporal del ruido para realizar el modelado temporal del ruido en el primer valor espectral intermedio para obtener un segundo valor espectral intermedio. Adicionalmente, el decodificador de señal de audio comprende un calculador 730 de ganancia de predicción para calcular una ganancia 35 de predicción del modelado temporal del ruido dependiendo del primer valor espectral intermedio y del segundo valor espectral intermedio. Además, el decodificador de señal de audio comprende un aparato 740 de acuerdo con una de las realizaciones descritas anteriormente para generar los valores de reemplazo espectrales cuando una trama de audio actual no se ha recibido o es errónea. Adicionalmente, el decodificador de señal de audio comprende un selector 750 de valores para almacenar el primer valor espectral intermedio en la unidad 745 de búfer del aparato 40 740 para generar los valores de reemplazo espectrales, si la ganancia de predicción es mayor que o igual al valor umbral, o para almacenar el segundo valor espectral intermedio en la unidad 745 de búfer del aparato 740 para generar los valores de reemplazo espectrales, si la ganancia de predicción es menor que el valor umbral.

El valor umbral puede, por ejemplo, ser un valor predefinido. Por ejemplo el valor umbral puede predefinirse en el 45 decodificador de señal de audio.

De acuerdo con otra realización, el ocultamiento se realiza en los datos espectrales justo después de la primera etapa de decodificación y antes de que se realce el relleno de ruido, la ganancia global y/o el TNS.

50

Tal realización se representa en la figura 8. La figura 8 ilustra un decodificador de acuerdo con otra realización adicional. El decodificador comprende un primer módulo 810 de decodificación. El primer módulo 810 de decodificación está adaptado para generar valores espectrales generados en base a una trama de audio libre de errores recibida. A continuación, los valores espectrales generados se almacenan en la unidad de búfer de un aparato 820 para generar los valores de reemplazo espectrales. Además, los valores espectrales generados se 55 introducen en un módulo 830 de procesamiento, que procesa los valores espectrales generados realizando el TNS, aplicando el relleno de ruido y/o aplicando la ganancia global para obtener los valores de audio espectrales de la señal de audio decodificada. Si se pierde o es errónea una trama actual, el aparato 820 para generar valores de reemplazo espectrales genera los valores de reemplazo espectrales y los suministra al módulo 830 de procesamiento. 60

De acuerdo con la realización de la figura 8, en caso de ocultamiento, el módulo de decodificación o módulo de procesamiento realiza algunas o todas las etapas siguientes:

Los valores espectrales, por ejemplo, de la última trama buena, se modifican ligeramente invirtiendo el signo de forma aleatoria. En otra etapa, se realiza el relleno de ruido en base al ruido aleatorio en los contenedores espectrales cuantificados a cero. En otra etapa, el factor de ruido se adapta levemente comparado con un trama libre de errores recibida anteriormente.

5

En una etapa adicional, se logra el modelado del ruido espectral al aplicar la envolvente espectral ponderada codificada por LPC (LPC = codificación de predicción lineal) en el dominio de frecuencia. Por ejemplo, pueden usarse los coeficientes LPC de la última trama libre de errores recibida. En otra realización, pueden usarse los coeficientes LPC promedio. Por ejemplo, puede generarse un promedio de los últimos tres valores de un coeficiente LPC considerado de las últimas tres tramas libres de error recibidas para cada coeficiente LPC de un filtro, y pueden 10 aplicarse a los coeficientes LPC promediados.

En una etapa posterior, puede aplicarse una atenuación en estos valores espectrales. La atenuación puede depender del número de tramas perdidas o erróneas consecutivas y de la estabilidad del filtro LP anterior. Además, la información de ganancia de predicción puede usarse para influir en la atenuación. Cuanto mayor sea la ganancia 15 de predicción, más rápida puede ser la atenuación. La realización de la figura 8 es ligeramente más compleja que la realización de la figura 6, pero proporciona mejor calidad de audio.

Aunque se han descrito algunos aspectos en el contexto de un aparato, resulta claro que estos aspectos representan también una descripción del método correspondiente, en el que un bloque o dispositivo corresponde a 20 una etapa o característica del método de la etapa del método. De forma análoga, los aspectos descritos en el contexto de una etapa del método representan también una descripción de un bloque correspondiente o ítem o característica de un aparato correspondiente.

Dependiendo de ciertas necesidades de implementación, las realizaciones de la invención pueden implementarse en 25 hardware o en software. La implementación puede realizarse usando un medio de almacenamiento digital, por ejemplo un disco blando, un DVD, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tienen señales de control legibles de forma electrónica almacenadas en los mismos, que realizan (o son capaces de realizar) con un sistema de computación programable de tal manera que se realice el método respectivo.

30

Algunas realizaciones de acuerdo con la invención comprenden un portador de datos que tiene señales de control legibles de forma electrónica que son capaces de funcionar conjuntamente con un sistema de computación programable de tal manera que se realice uno de los métodos descritos en el presente documento.

En general, las realizaciones de la presente invención pueden implementarse como un producto de programa de 35 computación con un código de programa, siendo el código de programa operativo para realizar uno de los métodos cuando el producto de programa de computación funciona en una computadora. Por ejemplo, el código de programa puede almacenarse en un portador legible por máquina.

Otras realizaciones comprenden el programa de computación para realizar uno de los métodos descritos en el 40 presente documento, almacenado en un portador legible por máquina o en un medio de almacenamiento no transitorio.

En otras palabras, una realización del método de invención es, por lo tanto, un programa de computación que tiene un código de programa para aplicar uno de los métodos descritos en el presente documento, cuando el producto de 45 programa de computación se ejecuta en una computadora.

Una realización adicional de los métodos de la invención es, por lo tanto, un portador de datos (o un medio de almacenamiento digital o un medio legible por computadora) que comprende, grabado en el mismo, el programa de computación para realizar uno de los métodos descritos en el presente documento. 50

Una realización adicional del método de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que representan el programa de computación para realizar uno de los métodos descritos en el presente documento. El flujo de datos o la secuencia de señales pueden, por ejemplo, configurarse para transferirse a través de una conexión de comunicaciones de datos, por ejemplo, a través de Internet o sobre un canal de radio. 55

Una realización adicional comprende un medio de procesamiento, por ejemplo, una computadora, o dispositivo lógico programable, configurado para o adaptado para realizar uno de los métodos descritos en el presente documento.

60

Una realización comprende una computadora con un programa de computación instalado en la misma para realizar uno de los métodos descritos en el presente documento.

En algunas realizaciones, un dispositivo lógico programable (por ejemplo, una matriz de puertas programable en

campo) puede usarse para realizar algunas o todas de las funcionalidades de los métodos descritos en el presente documento. En algunas realizaciones, una matriz de puertas programable en campo puede funcionar conjuntamente con un microprocesador con el fin de realizar uno de los métodos descritos en el presente documento. En general, los métodos se realizan preferentemente mediante un aparato de hardware.

5

Las realizaciones descritas anteriormente son simplemente ilustrativas de los principios de la presente invención. Se entiende que, modificaciones y variaciones de las disposiciones y los detalles descritos en el presente documento resultarán evidentes para los expertos en la materia. Se intenta, por lo tanto, limitarse solo por el alcance de las reivindicaciones independientes de la patente y no por los detalles específicos presentados por medio de la descripción y la explicación de las realizaciones del presente documento. 10

Literatura:

[1]: 3GPP, “Audio codec processing functions; Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions”, 2009, 3GPP TS 26.290. 15

[2]: USAC codec (Unified Speech and Audio Codec), ISO/IEC CD 23003-3 fechado el 24 de septiembre de 2010

[3]: 3GPP, “Speech codec speech processing functions; Adaptive Multi-Rate - Wideband (AMR-WB) speech codec; Transcoding functions”, 2009, V9.0.0, 3GPP TS 26.190. 20

[5]: ITU-T G.718 (06-2008) specification

25

Claims

REIVINDICACIONES

1. Un aparato (100) para generar valores de reemplazo espectrales para una señal de audio que comprende:

una unidad (110) de búfer para almacenar valores espectrales anteriores relacionados con una trama de señal 5 de audio libre de errores recibida anteriormente, y

un generador (120) de trama de ocultación para generar los valores de reemplazo espectrales cuando no se ha recibido o es errónea una trama de señal de audio actual, en el que la trama de señal de audio libre de errores recibida anteriormente comprende una información del filtro, teniendo la información de filtro asociada un valor de estabilidad del filtro que indica una estabilidad de un filtro de predicción definida por la información del filtro, y en 10 el que el generador (120) de trama de ocultamiento se adapta para generar los valores de reemplazo espectrales en base a los valores espectrales anteriores y en base al valor de estabilidad del filtro.
2. Un aparato (100) de acuerdo con la reivindicación 1, en el que el generador (120) de trama de ocultamiento está adaptado para generar los valores de reemplazo espectrales invirtiendo de forma aleatoria el signo de los valores 15 espectrales anteriores.
3. Un aparato (100) de acuerdo con la reivindicación 1 o 2, en el que el generador (120) de trama de ocultamiento está configurado para generar los valores de reemplazo espectrales multiplicando cada uno de los valores espectrales anteriores por un primer factor de ganancia cuando el valor de estabilidad del filtro tiene un primer valor, 20 y multiplicando cada uno de los valores espectrales anteriores por un segundo factor de ganancia, que es más pequeño que el primer factor de ganancia, cuando el valor de estabilidad del filtro tiene un segundo valor que es más pequeño que el primer valor.
4. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que la trama de señal de audio libre de 25 errores recibida anteriormente comprende unos primeros coeficientes de filtro predictivos del filtro de predicción, en el que una trama predecesora de la trama de señal de audio libre de errores recibida anteriormente comprende unos segundos coeficientes de filtro predictivos, y en el que el valor de estabilidad del filtro depende de los primeros coeficientes de filtro predictivos y de los segundos coeficientes de filtro predictivos.

30
5. Un aparato de acuerdo con la reivindicación 4, en el que el valor de estabilidad del filtro depende de una medida LSFdist de distancia, y en el que la medida LSFdist de distancia se define por la fórmula:

uipiidistffLSF02)()(

35

en la que u+1 especifica un número total de los primeros coeficientes de filtro de predicción de la trama de señal de audio libre de errores recibida anteriormente, y en la que u+1 también especifica un número total de los segundos coeficientes de filtro de predicción de la trama predecesora de la trama de señal de audio libre de errores recibida anteriormente, en la que fi especifica el i-ésimo coeficiente de filtro de los primeros coeficientes de filtro de predicción y en la que fi(p) especifica el i-ésimo coeficiente de filtro de los segundos coeficientes de filtro de predicción. 40
6. Un aparato (100) de acuerdo con una de las reivindicaciones anteriores, en el que el generador (120) de trama de ocultamiento está adaptado para generar adicionalmente los valores de reemplazo espectrales en base a la información de clase de trama relacionada con la trama de señal de audio libre de errores recibida anteriormente, en el que la información de clase de trama indica que la trama de señal de audio libre de errores recibida anteriormente 45 se clasifica como “inicio artificial”, “inicio”, “transición con voz”, “transición sin voz”, “sin voz” o “con voz”.
7. Un aparato (100) de acuerdo con una de las reivindicaciones anteriores, en el que el generador (120) de trama de ocultamiento está adaptado para generar adicionalmente los valores de reemplazo espectrales en base a un número de tramas consecutivas que son erróneas, desde que ha llegado una última trama de señal de audio libre de errores 50 al receptor, en el que no han llegado otras tramas de señal de audio libres de errores al receptor desde que ha llegado la última trama de señal de audio libre de errores al receptor.
8. Un aparato (100) de acuerdo con la reivindicación 7,

en el que el generador (120) de trama de ocultamiento está adaptado para calcular un factor de atenuación, en base 55 al valor de estabilidad del filtro y en base al número de tramas consecutivas que son erróneas, y

en el que el generador (120) de trama de ocultamiento está adaptado para generar los valores de reemplazo espectrales multiplicando el factor de atenuación por al menos algunos de los valores espectrales anteriores, o por al menos algunos valores de un grupo de valores intermedios, en el que cada uno de los valores intermedios depende de al menos uno de los valores espectrales anteriores. 60
9. Un decodificador de señal de audio que comprende:

un aparato (610, 710, 810) para decodificar los valores de señal de audio espectrales, y

un aparato (620, 740, 820) para generar valores de reemplazo espectrales de acuerdo con una de las reivindicaciones 1 a 8,

en el que el aparato (610, 710, 810) para decodificar los valores de señal de audio espectrales está adaptado 5 para decodificar los valores espectrales de una trama de señal de audio libre de errores recibida anteriormente de una señal de audio como los valores de señal de audio espectrales, en el que el aparato (610, 710, 810) para decodificar los valores de señal de audio espectrales está adaptado además para almacenar los valores espectrales de la trama de señal de audio libre de errores recibida anteriormente en una unidad de búfer del aparato (620, 740, 820) para generar los valores de reemplazo espectrales, y 10

en el que el aparato (620, 740, 820) para generar valores de reemplazo espectrales está adaptado para generar los valores de reemplazo espectrales en base a los valores espectrales almacenados en la unidad de búfer, cuando no se ha recibido o es errónea una trama de señal de audio actual.
10. Un decodificador de señal de audio de acuerdo con la reivindicación 9, 15

en el que el aparato para decodificar es una unidad (710) de decodificación para generar, como valores espectrales de la trama de señal de audio libre de errores recibida anteriormente, unos primeros valores espectrales intermedios en base a una trama de señal de audio libre de errores recibida,

en el que el aparato (740) de acuerdo con una de las reivindicaciones 1 a 8 está adaptado para generar los valores de reemplazo espectrales cuando no se ha recibido o es errónea una trama de señal de audio actual, y 20

en el que el decodificador de señal de audio comprende además:

una unidad (720) de modelado temporal del ruido para realizar un modelado temporal del ruido en los primeros valores espectrales intermedios para obtener unos segundos valores espectrales intermedios,

un calculador (730) de ganancia de predicción para calcular una ganancia de predicción del modelado temporal 25 del ruido que depende de los primeros valores espectrales intermedios y que depende de los segundos valores espectrales intermedios, y

un selector (750) de valores para almacenar los primeros valores espectrales intermedios en la unidad (745) de búfer del aparato (740) para generar los valores de reemplazo espectrales, si la ganancia de predicción es mayor que o igual a un valor umbral, o para almacenar los segundos valores espectrales intermedios en la unidad de 30 búfer del aparato para generar los valores de reemplazo espectrales, si la ganancia de predicción es menor que el valor umbral.
11. Un decodificador de señal de audio que depende de la reivindicación 9,

en el que el decodificador de señal de audio comprende además un módulo (830) de procesamiento para procesar 35 los valores de señal de audio espectrales realizando el modelado temporal del ruido, que aplica el relleno de ruido o que aplica una ganancia global, para obtener los valores de audio espectrales de la señal de audio decodificada, y

en el que el aparato (820) para generar los valores de reemplazo espectrales está adaptado para generar los valores de reemplazo espectrales y para suministrarlos en el módulo (830) de procesamiento, cuando no se ha recibido o es errónea una trama actual. 40
12. Un método para generar valores de reemplazo espectrales para una señal de audio que comprende:

almacenar los valores espectrales anteriores relacionados con una trama de señal de audio libre de errores recibida anteriormente, y 45

generar los valores de reemplazo espectrales cuando no se ha recibido o es errónea una trama de señal de audio actual, en el que la trama de señal de audio libre de errores recibida anteriormente comprende una información de filtro, teniendo la información de filtro asociada un valor de estabilidad del filtro que indica una estabilidad de un filtro de predicción definida por la información de filtro, en el que los valores de reemplazo espectrales se generan en base a los valores espectrales anteriores y en base al valor de estabilidad del filtro. 50
13. Un programa de computación para implementar el método de la reivindicación 12, cuando el programa de computación se ejecuta por un procesador de computadora o de señal.