ES2396481T3 - Método y aparato para codificación selectiva de señales en base al rendimiento del codificador de núcleo - Google Patents
Método y aparato para codificación selectiva de señales en base al rendimiento del codificador de núcleo Download PDFInfo
- Publication number
- ES2396481T3 ES2396481T3 ES09730909T ES09730909T ES2396481T3 ES 2396481 T3 ES2396481 T3 ES 2396481T3 ES 09730909 T ES09730909 T ES 09730909T ES 09730909 T ES09730909 T ES 09730909T ES 2396481 T3 ES2396481 T3 ES 2396481T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- energy
- reconstructed
- encoder
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 239000010410 layer Substances 0.000 claims abstract description 94
- 239000012792 core layer Substances 0.000 claims abstract description 49
- 230000006872 improvement Effects 0.000 claims abstract description 34
- 230000005236 sound signal Effects 0.000 claims abstract description 7
- 238000007906 compression Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
Abstract
Un método (300) para codificar una señal de entrada incluyendo una señal audio, incluyendo el método:codificar la señal de entrada (102) usando un codificador de capa de núcleo (104) para producir una señal codificadade capa de núcleo (106); decodificar la señal codificada de capa de núcleo para producir una señal reconstruida (110); comparar (308, 316) la señal reconstruida con la señal de entrada donde la comparación incluye estimar una energíaE_tot como una suma de energías en un conjunto seleccionado de componentes de la señal reconstruida o la señalde entrada y estimar una energía E_err como una suma de energías de los componentes Sc(k) de la señalreconstruida para los que la relación S(k)/Sc(k) del componente S(k) de la señal de entrada al componente Sc (k) dela señal reconstruida excede de un valor umbral y donde la comparación incluye además comparar la energía E_totcon la energía E_err; seleccionar (318, 320) un codificador de capa de mejora (206) de una pluralidad de codificadores de capa de mejoradependiendo de la comparación entre el componente de la señal reconstruida y el componente correspondiente de laseñal de entrada; y generar una señal codificada de capa de mejora (208) usando el codificador de capa de mejora seleccionado,dependiendo la señal codificada de capa de mejora de la señal de entrada
Description
Método y aparato para codificación selectiva de señales en base al rendimiento del codificador de núcleo
Antecedentes
La transmisión de señales de texto, imágenes, voz y habla a través de canales de comunicación, incluyendo Internet, está aumentando rápidamente, como también la provisión de servicios multimedia capaces de acomodar varios tipos de información, tales como texto, imágenes y música. Las señales multimedia, incluyendo señales de voz y música, requieren una anchura de banda amplia al tiempo de la transmisión. Por lo tanto, para transmitir datos multimedia, incluyendo texto, imágenes y audio, es altamente deseable que los datos estén comprimidos.
La compresión de señales digitales de voz y audio es bien conocida. Generalmente se requiere compresión para transmitir eficientemente señales por un canal de comunicaciones, o para almacenar señales comprimidas en un dispositivo de medios digitales, tal como un dispositivo de memoria de estado sólido o disco duro de ordenador.
Un principio fundamental de la compresión de datos es la eliminación de datos redundantes. Los datos pueden ser comprimidos eliminando información temporal redundante tal como donde un sonido se repite, es predecible o es perceptivamente redundante. Esto tiene en cuenta la insensibilidad humana a altas frecuencias.
En general, la compresión da lugar a degradación de la señal, dando lugar a tasas de compresión más altas a mayor degradación. Se dice que un flujo de bits es escalable cuando se puede quitar partes del flujo de una forma que el flujo secundario resultante forme otro flujo de bits válido para algún decodificador deseado, y el flujo secundario representa el contenido de la fuente con una calidad de reconstrucción que es menor que la del flujo de bits completo original, pero es alta cuando se considera la cantidad inferior de los datos restantes. Los flujos de bits que no proporcionan esta propiedad se denominan flujos de bits monocapa. Los modos de escalabilidad usuales son escalabilidad temporal, espacial y de calidad. La escalabilidad permite que la señal comprimida sea ajustada para rendimiento óptimo por un canal de banda limitada.
La escalabilidad puede ser implementada de tal forma que se faciliten múltiples capas de codificación, incluyendo una capa base y al menos una capa de mejora, y las respectivas capas se forman de manera que tengan resoluciones diferentes.
Aunque muchos esquemas de codificación son genéricos, algunos esquemas de codificación incorporan modelos de la señal. En general, se logra una mejor compresión de la señal cuando el modelo es representativo de la señal que es codificada. Así, es conocido elegir el esquema de codificación en base a una clasificación del tipo de señal. Por ejemplo, una señal de voz puede ser modelada y codificada de una forma diferente a una señal de música. Sin embargo, por lo general, la clasificación de la señal es un problema difícil.
Un ejemplo de una técnica de compresión (o “codificación”) que ha sido muy popular para codificación de voz digital es conocida como predicción lineal excitada por código (CELP), que es uno de una familia de algoritmos de codificación de “análisis por síntesis”. Análisis por síntesis se refiere en general a un proceso de codificación por el que se usan múltiples parámetros de un modelo digital para sintetizar un conjunto de señales candidato que se comparan con una señal de entrada y analizan para ver si hay distorsión. Un conjunto de parámetros que produce la distorsión más baja es transmitido o almacenado posteriormente, y eventualmente se usa para reconstruir una estimación de la señal de entrada original. CELP es un método concreto de análisis por síntesis que usa uno o más libros de código, cada uno de los cuales incluye esencialmente conjuntos de vectores de código que son recuperados del libro de código en respuesta a un índice de libro de código.
En los codificadores CELP modernos, existe el problema de mantener reproducción de voz y audio de alta calidad a tasas de datos razonablemente bajas. Esto es especialmente verdadero con respecto a la música u otras señales audio genéricas que no encajan muy bien en el modelo de voz CELP. En este caso, la incongruencia del modelo puede producir una calidad audio severamente degradada que puede ser inaceptable para un usuario final del equipo que emplea tales métodos.
La Publicación de la Solicitud de Patente PCT número WO 97/15983 describe un método y aparato que permite la codificación, manipulación y decodificación de señales audio independientemente del contenido de señal específico. Un codificador (AC) lleva a cabo una codificación orientada a objeto y genera una señal codificada, con tasa de bits y anchura de banda variables, incluyendo una capa base y una o más capas de mejora para cada objeto. Las capas de mejora se seleccionan en base a la relación de señal a ruido SNR. El codificador (AC) es capaz de operar según algoritmos ad hoc y cualquier algoritmo estandarizado y selecciona el algoritmo más conveniente dependiendo del objeto a codificar.
La Publicación de la Solicitud de Patente PCT número WO 03/073741 describe cuantificadores escalables para audio caracterizados por una métrica de distorsión basada en percepción, no uniforme, que operan en un dominio comprimido-expandido común que incluye tanto capa base como una o más capas de mejora. El dominio
comprimido-expandido común está diseñado para permitir el uso de la misma métrica MSE no ponderada para selección óptima del parámetro de cuantificación en múltiples capas, explotando la dependencia estadística de la señal de capa de mejora en los parámetros de cuantificación usados en la capa precedente.
Un artículo de Ramprashad, S. A., titulado “Embedded coding using a mixed speech and audio coding paradigm”, International Journal of Speech Technology, Kluwer, Dordrecht, NL, vol. 2, nº 4, 1 Mayo 1999, páginas 359-372, propone un algoritmo y estructura de codificación de voz/audio incorporados híbridos de dos etapas. La primera etapa de la estructura consta de un codificador de voz de núcleo que proporciona una tasa de bits de salida mínima y un rendimiento aceptable en entradas de voz limpias. La segunda etapa es un codificador basado en percepción/transformada que proporciona un flujo de bits opcional separado para la mejora de la salida de etapa de núcleo. La estructura de dos etapas puede ser usada para mejorar la calidad de un codec existente sin modificación del algoritmo de codificación original.
Breve descripción de las figuras
Las figuras acompañantes, en las que números de referencia análogos se refieren a elementos idénticos o funcionalmente similares en todas las vistas separadas y que conjuntamente con la descripción detallada siguiente se incorporan y forman parte de la memoria descriptiva, sirven para ilustrar mejor varias realizaciones y para explicar varios principios y ventajas según la presente invención.
La figura 1 es un diagrama de bloques de un sistema de codificación y un sistema de decodificación de la técnica anterior.
La figura 2 es un diagrama de bloques de un sistema de codificación y un sistema de decodificación según algunas realizaciones de la invención.
La figura 3 es un diagrama de flujo del método para seleccionar un sistema de codificación según algunas realizaciones de la invención.
Las figuras 4-6 son una serie de gráficos que representan señales ejemplares en un comparador/selector según algunas realizaciones de la invención cuando se introduce una señal de voz.
Las figuras 7-9 son una serie de gráficos que representan señales ejemplares en un comparador/selector según algunas realizaciones de la invención cuando se introduce una señal de música.
La figura 10 es un diagrama de flujo de un método para codificación selectiva de señales según algunas realizaciones de la invención.
Los expertos apreciarán que los elementos de las figuras se ilustran a efectos de simplicidad y claridad y no se representan necesariamente a escala. Por ejemplo, las dimensiones de algunos elementos de las figuras pueden haberse exagerado con relación a otros elementos para ayudar a mejorar la comprensión de realizaciones de la presente invención.
Descripción detallada
Antes de describir en detalle realizaciones según la presente invención, se deberá observar que las realizaciones residen primariamente en combinaciones de pasos del método y componentes del aparato relacionados con la codificación selectiva de señales en base al encaje de modelo. Consiguientemente, los componentes de aparato y los pasos del método se han representado, donde sea apropiado, por símbolos convencionales en los dibujos, que representan solamente los detalles específicos que son pertinentes para la comprensión de las realizaciones de la presente invención definida en las reivindicaciones independientes así como para no oscurecer la descripción con detalles que serán fácilmente evidentes para los expertos en la técnica que conozcan la presente descripción.
En este documento, términos relacionales tal como primero y segundo, superior e inferior, y análogos pueden ser usados únicamente para distinguir una entidad o acción de otra entidad o acción sin requerir o implicar necesariamente ninguna relación u orden real entre tales entidades o acciones. Se pretende que los términos “incluye”, “incluyendo” o cualquier otra variación de los mismos, cubra una inclusión no exclusiva, de tal manera que un proceso, método, artículo o aparato que incluya una lista de elementos no incluya solamente dichos elementos, sino que pueda incluir otros elementos no expresamente enumerados o inherentes a tal proceso, método, artículo o aparato. Un elemento precedido por “incluye … un” no excluye, sin más limitaciones, la existencia de elementos idénticos adicionales en el proceso, método, elemento o aparato que incluya el elemento.
Se apreciará que las realizaciones de la invención aquí descrita pueden incluir uno o más procesadores convencionales e instrucciones de programa almacenadas únicas que controlen el único o más procesadores para implementar, en unión con algunos circuitos no de procesador, algunas, la mayoría o todas las funciones de codificación selectiva de señales en base al encaje de modelo aquí descrito. Alternativamente, algunas o todas las
funciones podrían ser implementadas por una máquina de estado que no tenga instrucciones de programa almacenadas, o en uno o más circuitos integrados específicos de aplicación (ASICs), en los que cada función o algunas combinaciones de algunas de las funciones se implementan como lógica personalizada. Naturalmente, se podría usar una combinación de los dos métodos. Así, aquí se describen los métodos y los medios para estas funciones. Además, se espera que los expertos, a pesar del esfuerzo posiblemente significativo y muchas opciones de diseño motivadas, por ejemplo, por el tiempo disponible, la tecnología actual, y consideraciones económicas, cuando se dejen guiar por los conceptos y principios aquí descritos, serán fácilmente capaces de generar tales instrucciones de software y programas y CIs con experimentación mínima.
La figura 1 es un diagrama de bloques de un sistema de codificación y decodificación incorporado 100 de la técnica anterior. En la figura 1, se introduce una señal original s(n) 102 en un codificador de capa de núcleo 104 de un sistema de codificación. El codificador de capa de núcleo 104 codifica la señal 102 y produce una señal codificada de capa de núcleo 106. Además, se introduce una señal original 102 en un codificador de capa de mejora 108 del sistema de codificación. El codificador de capa de mejora 108 también recibe una primera señal reconstruida sc(n) 110 como una entrada. La primera señal reconstruida 110 es producida pasando la señal codificada de capa de núcleo 106 a través de un primer decodificador de capa de núcleo 112. El codificador de capa de mejora 108 se usa para codificar información adicional en base a alguna comparación de las señales s(n) (102) y sc(n) (110), y puede usar opcionalmente parámetros del codificador de capa de núcleo 104. En una realización, el codificador de capa de mejora 108 codifica una señal de error que es la diferencia entre la señal reconstruida 110 y la señal de entrada 102. El codificador de capa de mejora 108 produce una señal codificada de capa de mejora 114. Tanto la señal codificada de capa de núcleo 106 como la señal codificada de capa de mejora 114 son pasadas a un canal 116. El canal representa un medio, tal como un canal de comunicación y/o medio de almacenamiento.
Después de pasar a través del canal, se produce una segunda señal reconstruida 118 pasando la señal codificada de capa de núcleo recibida 106' a través de un segundo decodificador de capa de núcleo 120. El segundo decodificador de capa de núcleo 120 realiza la misma función que el primer decodificador de capa de núcleo 112. Si la señal codificada de capa de mejora 114 también se pasa a través del canal 116 y es recibida como señal 114', se puede pasar a un decodificador de capa de mejora 122. El decodificador de capa de mejora 122 también recibe la segunda señal reconstruida 118 como una entrada y produce una tercera señal reconstruida 124 como salida. La tercera señal reconstruida 124 concuerda con la señal original 102 más estrechamente que la segunda señal reconstruida 118.
La señal codificada de capa de mejora 114 incluye información adicional que permite que la señal 102 sea reconstruida más exactamente que la segunda señal reconstruida 118. Es decir, es una reconstrucción mejorada.
Una ventaja de dicho sistema de codificación incorporado es que un canal particular 116 puede no ser capaz de soportar sistemáticamente el requisito de anchura de banda asociado con algoritmos de codificación audio de alta calidad. Sin embargo, un codificador incorporado permite recibir un flujo de bits parcial (por ejemplo, solamente el flujo de bits de la capa de núcleo) del canal 116 para producir, por ejemplo, solamente la salida audio de núcleo cuando el flujo de bits de capa de mejora se pierde o corrompe. Sin embargo, hay compromisos de calidad entre codificadores incorporados frente a no incorporados, y también entre diferentes objetivos de optimización de codificación incorporada. Es decir, la codificación de capa de mejora de calidad más alta puede ayudar a lograr un mejor equilibrio entre capas de núcleo y de mejora, y también reduce la tasa general de datos para mejores características de transmisión (por ejemplo, congestión reducida), que puede dar lugar a menores tasas de error de paquete para las capas de mejora.
Aunque muchos esquemas de codificación son genéricos, algunos esquemas de codificación incorporan modelos de la señal. En general, se logra una mejor compresión de señal cuando el modelo es representativo de la señal que se codifica. Así, es conocido elegir el esquema de codificación en base a una clasificación del tipo de señal. Por ejemplo, una señal de voz puede ser modelada y codificada de forma diferente a una señal de música. Sin embargo, la clasificación de la señal es un problema difícil en general.
La figura 2 es un diagrama de bloques de un sistema de codificación y decodificación 200 según algunas realizaciones de la invención. Con referencia a la figura 2, una señal original 102 es introducida en un codificador de capa de núcleo 104 de un sistema de codificación. La señal original 102 puede ser una señal de voz/audio u otro tipo de señal. El codificador de capa de núcleo 104 codifica la señal 102 y produce una señal codificada de capa de núcleo 106. Se produce una primera señal reconstruida 110 pasando la señal codificada de capa de núcleo 106 a través de un primer decodificador de capa de núcleo 112. La señal original 102 y la primera señal reconstruida 110 son comparadas en un módulo comparador/selector 202. El módulo comparador/selector 202 compara la señal original 102 con la primera señal reconstruida 110 y, en base a la comparación, produce una señal de selección 204 que selecciona cuál de los codificadores de capa de mejora 206 usar. Aunque solamente se representan en la figura dos codificadores de capa de mejora, se deberá entender que se puede usar múltiples codificadores de capa de mejora. El módulo comparador/selector 202 puede seleccionar el codificador de capa de mejora que más probablemente genere la mejor señal reconstruida.
Aunque se representa el decodificador de capa de núcleo 112 para recibir la señal codificada de capa de núcleo 106
que es enviada correspondientemente al canal 116, la conexión física entre elementos 104 y 106 puede permitir una implementación más eficiente de tal manera que los elementos y/o estados de procesado comunes puedan ser compartidos y así no requerirían regeneración o duplicación.
Cada codificador de capa de mejora 206 recibe la señal original 102 y la primera señal reconstruida como entradas (o una señal, tal como una señal de diferencia, derivada de estas señales), y el codificador seleccionado produce una señal codificada de capa de mejora 208. En una realización, el codificador de capa de mejora 206 codifica una señal de error que es la diferencia entre la señal reconstruida 110 y la señal de entrada 102. La señal codificada de capa de mejora 208 contiene información adicional en base a una comparación de las señales s(n) (102) y sc(n) (110). Opcionalmente, puede usar parámetros del decodificador de capa de núcleo 104. La señal codificada de capa de núcleo 106, la señal codificada de capa de mejora 208 y la señal de selección 204 son pasadas al canal 116. El canal representa un medio, tal como un canal de comunicación y/o un medio de almacenamiento.
Después de pasar a través del canal, se produce una segunda señal reconstruida 118 pasando la señal codificada de capa de núcleo recibida 106' a través de un segundo decodificador de capa de núcleo 120. El segundo decodificador de capa de núcleo 120 realiza la misma función que el primer decodificador de capa de núcleo 112. Si la señal codificada de capa de mejora 208 también se pasa a través del canal 116 y es recibida como señal 208', se puede pasar a un decodificador de capa de mejora 210. El decodificador de capa de mejora 210 también recibe la segunda señal reconstruida 118 y la señal de selección recibida 204' como entradas y produce una tercera señal reconstruida 212 como salida. La operación del decodificador de capa de mejora 210 depende de la señal de selección recibida 204'. La tercera señal reconstruida 212 concuerda con la señal original 102 más estrechamente que la segunda señal reconstruida 118.
La señal codificada de capa de mejora 208 incluye información adicional, así la tercera señal reconstruida 212 concuerda con la señal 102 más exactamente que la segunda señal reconstruida 118.
La figura 3 es un diagrama de flujo del método para seleccionar un sistema de codificación según algunas realizaciones de la invención. En particular, la figura 3 describe la operación de un módulo comparador/selector en una realización de la invención. Después del bloque de inicio 302, la señal de entrada (102 en la figura 2) y la señal reconstruida (110 en la figura 2) son transformadas, si se desea, a un dominio de señal seleccionado. Las señales de dominio de tiempo pueden ser usadas sin transformación o, en el bloque 304, las señales pueden ser transformadas a un dominio espectral, tal como el dominio de frecuencia, un dominio de transformada de coseno discreta modificada (MDCT), o un dominio de ondita, por ejemplo, y también pueden ser procesadas por otros elementos opcionales, tales como ponderación perceptible de algunas características de frecuencia o temporales de las señales. La señal de entrada transformada (o dominio de tiempo) se denota como S(k) para el componente espectral k, y la señal reconstruida transformada (o dominio de tiempo) se denota como Sc(k) para el componente espectral k. Para cada componente k en un conjunto seleccionado de componentes (que pueden ser todos o solamente algunos de los componentes), la energía, E_tot, en todos los componentes Sc(k) de la señal reconstruida es comparada con la energía, E_err, en los componentes que son mayores (en algún factor, por ejemplo) que el componente S(k) correspondiente de la señal de entrada original.
Aunque los componentes de señal de entrada y reconstruida pueden diferir de forma significativa en amplitud, un aumento significativo de la amplitud de un componente de señal reconstruida es indicativo de una señal de entrada pobremente modelada. Como tal, un componente de señal reconstruida de amplitud más baja puede ser compensado por un método dado de codificación de capa de mejora, mientras que un componente de señal reconstruida de amplitud más alta (es decir, pobremente modelado) puede ser más adecuado para un método alternativo de codificación de capa de mejora. Dicho método alternativo de codificación de capa de mejora puede implicar reducir la energía de algunos componentes de la señal reconstruida antes de la codificación de capa de mejora, de tal manera que se reduzca el ruido audible o la distorsión producidos como resultado de la incongruencia del modelo de señal de capa de núcleo.
Con referencia de nuevo a la figura 3, un bucle de componentes es inicializado en el bloque 306, donde el componente k es inicializado y las medidas de energía E_tot y E_err son inicializadas a cero. En el bloque de decisión 308, se realiza una comprobación para determinar si el valor absoluto del componente de la señal reconstruida es significativamente mayor que el componente correspondiente de la señal de entrada. Si es significativamente mayor, como ilustra la bifurcación positiva a partir del bloque de decisión 308, el componente es añadido a la energía de error E_err en el bloque 310 y el flujo continúa al bloque 312. En el bloque 312, el componente de las señales reconstruidas es añadido al valor de energía total, E_tot. En el bloque de decisión 314, el valor de componente se incrementa y se lleva a cabo una comprobación para determinar si todos los componentes han sido procesados. En caso negativo, como ilustra la bifurcación negativa a partir del bloque de decisión 314, el flujo vuelve al bloque 308. De otro modo, como ilustra la bifurcación positiva a partir del bloque de decisión 316, el bucle es completado y las energías acumuladas totales son comparadas en el bloque de decisión 316. Si la energía de error E_err es muy inferior al error total E_tot, como ilustra la bifurcación negativa a partir del bloque de decisión 316, se selecciona la capa de mejora tipo 1 en el bloque 318. De otro modo, como ilustra la bifurcación positiva a partir del bloque de decisión 316, se selecciona la capa de mejora tipo 2 en el bloque 320. El procesado de este bloque de señal de entrada termina en el bloque 322.
Será evidente a los expertos en la técnica que se puede usar otras medidas de energía de señal, tal como el valor absoluto del componente elevado a alguna potencia. Por ejemplo, la energía de un componente Sc(k) puede ser estimada como |Sc(k)|P, y la energía de un componente S(k) puede ser estimada como |Sc(k)|P, donde P es un número mayor que cero.
Será evidente a los expertos en la técnica que la energía de error E_err puede ser comparada con la energía total en la señal de entrada más bien que la energía total en la señal reconstruida.
El codificador puede ser implementado en un procesador programado. A continuación se ofrece un listado de código ejemplar correspondiente a la figura 3. Las variables energy_tot y energy_err son denotadas por E_tot y E_err, respectivamente, en la figura.
En este ejemplo los valores umbral Thresh1 y Thresh2 se ponen a 0,49 y 0,264, respectivamente. Se puede usar otros valores dependiendo de los tipos de codificadores de capa de mejora usados y dependiendo también de qué dominio de transformada se use.
Se puede añadir una etapa de histéresis, de modo que el tipo de capa de mejora solamente se cambie si un número especificado de bloques de señal es del mismo tipo. Por ejemplo, si se está usando un codificador de tipo 1, no se seleccionará el tipo 2 a no ser que dos bloques consecutivos indiquen el uso del tipo 2.
Las figuras 4-6 son una serie de gráficos que muestran resultados ejemplares para una señal de voz. La gráfica 402 en la figura 4 representa la energía E_tot de la señal reconstruida. La energía es calculada en tramas de 20 milisegundos, de modo que la gráfica representa la variación en la energía de señal en un intervalo de 10 segundos. La gráfica 502 en la figura 5 representa la relación de la energía de error E_err a la energía total E_tot en el mismo período de tiempo. El valor umbral Thresh2 se representa como la línea discontinua 504. La señal de voz en tramas donde la relación excede del umbral no está bien modelada por el codificador. Sin embargo, en la mayoría de las tramas no se supera el umbral. La gráfica 602 en la figura 6 representa la señal de selección o decisión en el mismo período de tiempo. En este ejemplo, el valor 0 indica que se selecciona el codificador de capa de mejora tipo 1 y un valor 1 indica que se selecciona el codificador de capa de mejora tipo 2. Se ignoran las tramas aisladas donde la relación es más alta que el umbral y la selección solamente se cambia cuando dos tramas consecutivas indican la misma selección. Así, por ejemplo, el codificador de capa de mejora tipo 1 se selecciona para la trama 141 aunque la relación exceda del umbral.
Las figuras 7-9 muestran una serie correspondiente de gráficos de una señal de música. La gráfica 702 en la figura 7 representa la energía E_tot de la señal de entrada. De nuevo, la energía es calculada en tramas de 20 milisegundos, así la gráfica representa la variación en energía de entrada en un intervalo de 10 segundos. La gráfica 802 en la figura 8 representa la relación de la energía de error E_err a la energía total E_tot en el mismo período de tiempo. El valor umbral Thresh2 se representa como la línea discontinua 504. La señal de música en las tramas donde la relación excede del umbral no está bien modelada por el codificador. Éste es el caso de la mayoría de las tramas, dado que el codificador de núcleo está diseñado para señales de voz. La gráfica 902 en la figura 9 representa la señal de selección o decisión en el mismo período de tiempo. De nuevo, el valor 0 indica que el codificador de capa de mejora de tipo 1 se selecciona y un valor 1 indica que se selecciona el codificador de capa de mejora de tipo 2. Así, el codificador de capa de mejora de tipo 2 se selecciona la mayor parte del tiempo. Sin embargo, en las tramas donde el codificador de núcleo opera bien para música, se selecciona el codificador de capa de mejora de tipo 1.
En una prueba con 22.803 tramas de una señal de voz, se seleccionó el codificador de capa de mejora de tipo 2 solamente en 227 tramas, es decir, solamente 1% del tiempo. En una prueba con 29.644 tramas de música, se
seleccionó el codificador de capa de mejora de tipo 2 en 16.145 tramas, es decir, 54% del tiempo. En las otras tramas el núcleo codificador opera bien para la música y se seleccionó el codificador de capa de mejora para voz. Así, el comparador/selector no es un clasificador de voz/música. Esto contrasta con los esquemas anteriores que pretenden clasificar la señal de entrada como voz o música y luego seleccionar consiguientemente el esquema de codificación. El acercamiento de la invención es seleccionar el codificador de capa de mejora dependiendo del rendimiento del codificador de capa de núcleo.
La figura 10 es un diagrama de flujo que representa la operación de un codificador incorporado según algunas realizaciones de la invención. El diagrama de flujo representa un método usado para codificar una trama de datos de señal. La longitud de la trama se selecciona en base a una característica temporal de la señal. Por ejemplo, una trama de 20 ms puede ser usada para señales de voz. Después del bloque de inicio 1002 en la figura 10, la señal de entrada es codificada en el bloque 1004 usando un codificador de capa de núcleo para producir una señal codificada de capa de núcleo. En el bloque 1006 la señal codificada de capa de núcleo es decodificada para producir una señal reconstruida. En esta realización, se genera una señal de error, en el bloque 1008, como la diferencia entre la señal reconstruida y la señal de entrada. La señal reconstruida es comparada con la señal de entrada en el bloque 1010 y en el bloque de decisión 1012 se determina si la señal reconstruida es una buena concordancia para la señal de entrada. Si la concordancia es buena, como ilustra la bifurcación positiva a partir del bloque de decisión 1012, se usa el codificador de capa de mejora de tipo 1 para codificar la señal de error en el bloque 1014. Si la concordancia no es buena, como ilustra la bifurcación negativa a partir del bloque de decisión 1012, se usa el codificador de capa de mejora de tipo 2 para codificar la señal de error en el bloque 1016. En el bloque 1018, la señal codificada de capa de núcleo, la señal codificada de capa de mejora y el indicador de selección son enviadas al canal (para transmisión o almacenamiento, por ejemplo). El procesado de la trama termina en el bloque 1020.
En esta realización, el codificador de capa de mejora es sensible a una señal de error; sin embargo, en una realización alternativa, el codificador de capa de mejora es sensible a la señal de entrada y, opcionalmente, una o más señales del codificador de capa de núcleo y/o el decodificador de capa de núcleo. En otra realización, se usa una señal de error alternativa, tal como una diferencia ponderada entre la señal de entrada y la señal reconstruida. Por ejemplo, algunas frecuencias de la señal reconstruida pueden ser atenuadas antes de la formación de la señal de error. La señal de error resultante se puede denominar una señal de error ponderada.
En otra realización alternativa, el codificador y el decodificador de capa de núcleo también pueden incluir otras capas de mejora, y el comparador de la presente invención puede recibir como entrada la salida de una de las capas de mejora previas como la señal reconstruida. Adicionalmente, puede haber capas de mejora posteriores a dichas capas de mejora que pueden ser o no conmutadas como resultado de la comparación. Por ejemplo, un sistema de codificación incorporada puede incluir cinco capas. La capa de núcleo (L1) y la segunda capa (L2) pueden producir la señal reconstruida Sc(k). La señal reconstruida Sc(k) y la señal de entrada S(k) se pueden usar luego para seleccionar los métodos de codificación de capa de mejora en las capas tres y cuatro (L3, L4). Finalmente, la capa cinco (L5) puede incluir solamente un solo método de codificación de capa de mejora.
El codificador puede seleccionar entre dos o más codificadores de capa de mejora dependiendo de la comparación entre la señal reconstruida y la señal de entrada.
El codificador y el decodificador pueden ser implementados en un procesador programado, en un procesador reconfigurable o en un circuito integrado específico de aplicación, por ejemplo.
En la memoria descriptiva anterior se ha descrito realizaciones específicas de la presente invención. Sin embargo, los expertos en la técnica observarán que se puede hacer varias modificaciones y cambios sin apartarse del alcance de la presente invención expuesto en las reivindicaciones siguientes. Consiguientemente, la memoria descriptiva y las figuras se han de considerar como ilustrativas más bien que en sentido restrictivo, y se ha previsto que tales modificaciones queden incluidas dentro del alcance de la presente invención. Los beneficios, las ventajas, las soluciones a problemas y cualquier elemento(s) que puedan producir cualquier beneficio, ventaja o solución o que sea más pronunciado, no se han de interpretar como unas características o elementos críticos, requeridos o esenciales de alguna o de todas las reivindicaciones. La invención se define únicamente por las reivindicaciones anexas incluyendo cualesquiera modificaciones realizadas durante la tramitación de esta solicitud y todos los equivalentes de las reivindicaciones concedidas.
Claims (12)
- REIVINDICACIONES1. Un método (300) para codificar una señal de entrada incluyendo una señal audio, incluyendo el método:codificar la señal de entrada (102) usando un codificador de capa de núcleo (104) para producir una señal codificada de capa de núcleo (106);decodificar la señal codificada de capa de núcleo para producir una señal reconstruida (110);comparar (308, 316) la señal reconstruida con la señal de entrada donde la comparación incluye estimar una energía E_tot como una suma de energías en un conjunto seleccionado de componentes de la señal reconstruida o la señal de entrada y estimar una energía E_err como una suma de energías de los componentes Sc(k) de la señal reconstruida para los que la relación S(k)/Sc(k) del componente S(k) de la señal de entrada al componente Sc (k) de la señal reconstruida excede de un valor umbral y donde la comparación incluye además comparar la energía E_tot con la energía E_err;seleccionar (318, 320) un codificador de capa de mejora (206) de una pluralidad de codificadores de capa de mejora dependiendo de la comparación entre el componente de la señal reconstruida y el componente correspondiente de la señal de entrada; ygenerar una señal codificada de capa de mejora (208) usando el codificador de capa de mejora seleccionado, dependiendo la señal codificada de capa de mejora de la señal de entrada.
-
- 2.
- Un método según la reivindicación 1, incluyendo además:
generar una señal de error como la diferencia entre la señal reconstruida y la señal de entrada, donde generar la señal codificada de capa de mejora incluye codificar la señal de error. -
- 3.
- Un método según la reivindicación 2, donde la señal de error incluye una diferencia ponderada entre la señal reconstruida y la señal de entrada.
-
- 4.
- Un método según la reivindicación 1, incluyendo además: transformar la señal reconstruida para producir los componentes de la señal reconstruida; y transformar la señal de entrada para producir los componentes de la señal de entrada, donde la transformada se selecciona del grupo de transformadas que consta de una transformada Fourier, una
transformada de coseno discreta modificada (MDCT) y una transformada de ondita. -
- 5.
- Un método según la reivindicación 1, donde la energía de un componente Sc(k) se estima como |Sc(k)|P, y donde la energía de un componente S(k) se estima como |Sc(k)|P donde P es un número mayor que cero.
-
- 6.
- Un método según la reivindicación 1, donde comparar la energía E_tot con la energía E_err incluye: comparar la relación de energías E_err/E_tot con un valor umbral.
-
- 7.
- Un método según la reivindicación 1, donde la capa de núcleo codificada incluye un codificador de voz.
-
- 8.
- Un método según la reivindicación 1, incluyendo además enviar la señal codificada de capa de núcleo, la señal codificada de capa de mejora y un indicador del codificador de capa de mejora seleccionado a un canal.
-
- 9.
- Un codificador de señal selectivo (200) incluyendo:
un codificador de capa de núcleo (104) para recibir una señal de entrada (102) incluyendo una señal audio a codificar y para producir una señal codificada de capa de núcleo (106);un decodificador de capa de núcleo (112) para recibir la señal codificada de capa de núcleo como entrada y para producir una señal reconstruida (110);estando dispuesto cada uno de una pluralidad de codificadores de capa de mejora (206) de manera que sea seleccionable para codificar una señal de error para producir una señal codificada de capa mejorada (208), incluyendo la señal de error una diferencia entre la señal de entrada y la señal reconstruida; yun módulo comparador/selector (202) para seleccionar un codificador de capa de mejora de la pluralidad de codificadores de capa de mejora dependiendo de una comparación de la señal reconstruida con la señal de entrada, donde el módulo comparador/selector está configurado para estimar una energía E_tot como una suma de energías en un conjunto seleccionado de componentes de la señal reconstruida o la señal de entrada y para estimar una energía E_err como una suma de energías en componentes de la señal reconstruida sumando las energías de dichos componentes Sc(k) de la señal reconstruida para que la relación S(k)/Sc(k) del componente S(k) de la señal5 de entrada al componente Sc(k) de la señal reconstruida exceda de un valor umbral y donde el módulo comparador/selector está configurado además para comparar la energía E_tot con la energía E_err, y además,donde la señal de entrada es codificada como la señal codificada de capa de núcleo, la señal codificada de capa mejorada y un indicador del codificador de capa mejorada seleccionado. -
- 10.
- Un codificador de señal selectivo según la reivindicación 9, donde el codificador de capa de núcleo incluye un codificador de voz.
-
- 11.
- Un codificador de señal selectivo según la reivindicación 9, donde el módulo comparador/selector está dispuesto
15 para comparar la energía E_tot con la energía E_err comparando la relación de energías E_err/E_tot con un valor umbral. - 12. Un codificador de señal selectivo según la reivindicación 9, donde los componentes de la señal reconstruida y los componentes de la señal de entrada son calculados mediante una transformada seleccionada del grupo de20 transformadas que consta de una transformada Fourier, una transformada de coseno discreta modificada (MDCT) y una transformada de ondita.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US99842 | 2008-04-09 | ||
| US12/099,842 US8639519B2 (en) | 2008-04-09 | 2008-04-09 | Method and apparatus for selective signal coding based on core encoder performance |
| PCT/US2009/039984 WO2009126759A1 (en) | 2008-04-09 | 2009-04-09 | Method and apparatus for selective signal coding based on core encoder performance |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2396481T3 true ES2396481T3 (es) | 2013-02-21 |
Family
ID=40909774
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES09730909T Active ES2396481T3 (es) | 2008-04-09 | 2009-04-09 | Método y aparato para codificación selectiva de señales en base al rendimiento del codificador de núcleo |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US8639519B2 (es) |
| EP (1) | EP2272063B1 (es) |
| KR (1) | KR101317530B1 (es) |
| CN (1) | CN102047325A (es) |
| BR (1) | BRPI0909487A8 (es) |
| ES (1) | ES2396481T3 (es) |
| MX (1) | MX2010011111A (es) |
| RU (1) | RU2504026C2 (es) |
| WO (1) | WO2009126759A1 (es) |
Families Citing this family (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7461106B2 (en) | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
| US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
| US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
| US7889103B2 (en) * | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
| US20090234642A1 (en) * | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
| US8200496B2 (en) * | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
| US8140342B2 (en) * | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
| US8219408B2 (en) * | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
| US8175888B2 (en) * | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
| CN101771417B (zh) | 2008-12-30 | 2012-04-18 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
| EP2348504B1 (en) * | 2009-03-27 | 2014-01-08 | Huawei Technologies Co., Ltd. | Encoding and decoding method and device |
| US8442837B2 (en) | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
| US8149144B2 (en) * | 2009-12-31 | 2012-04-03 | Motorola Mobility, Inc. | Hybrid arithmetic-combinatorial encoder |
| US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
| US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
| CN101964188B (zh) * | 2010-04-09 | 2012-09-05 | 华为技术有限公司 | 语音信号编码、解码方法、装置及编解码系统 |
| TWI581250B (zh) | 2010-12-03 | 2017-05-01 | 杜比實驗室特許公司 | 利用多媒體處理節點之適應性處理技術 |
| US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
| US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
| JP6205000B2 (ja) * | 2013-03-11 | 2017-09-27 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 階層符号化を用いたマルチフォーマットハイダイナミックレンジビデオの配信 |
| US9953660B2 (en) * | 2014-08-19 | 2018-04-24 | Nuance Communications, Inc. | System and method for reducing tandeming effects in a communication system |
| US11929085B2 (en) | 2018-08-30 | 2024-03-12 | Dolby International Ab | Method and apparatus for controlling enhancement of low-bitrate coded audio |
Family Cites Families (84)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4560977A (en) | 1982-06-11 | 1985-12-24 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
| US4670851A (en) | 1984-01-09 | 1987-06-02 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
| US4727354A (en) | 1987-01-07 | 1988-02-23 | Unisys Corporation | System for selecting best fit vector code in vector quantization encoding |
| JP2527351B2 (ja) | 1987-02-25 | 1996-08-21 | 富士写真フイルム株式会社 | 画像デ―タの圧縮方法 |
| US5067152A (en) | 1989-01-30 | 1991-11-19 | Information Technologies Research, Inc. | Method and apparatus for vector quantization |
| DE68922610T2 (de) | 1989-09-25 | 1996-02-22 | Rai Radiotelevisione Italiana | Umfassendes System zur Codierung und Übertragung von Videosignalen mit Bewegungsvektoren. |
| CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
| WO1993018505A1 (en) | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
| IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
| US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| US6263312B1 (en) | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
| ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
| US6253185B1 (en) | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
| US6904174B1 (en) | 1998-12-11 | 2005-06-07 | Intel Corporation | Simplified predictive video encoder |
| US6480822B2 (en) | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
| JP4249821B2 (ja) | 1998-08-31 | 2009-04-08 | 富士通株式会社 | ディジタルオーディオ再生装置 |
| CA2246532A1 (en) | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
| US6453287B1 (en) | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
| US6493664B1 (en) | 1999-04-05 | 2002-12-10 | Hughes Electronics Corporation | Spectral magnitude modeling and quantization in a frequency domain interpolative speech codec system |
| US6691092B1 (en) | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
| US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
| US6504877B1 (en) | 1999-12-14 | 2003-01-07 | Agere Systems Inc. | Successively refinable Trellis-Based Scalar Vector quantizers |
| JP4149637B2 (ja) | 2000-05-25 | 2008-09-10 | 株式会社東芝 | 半導体装置 |
| US6304196B1 (en) | 2000-10-19 | 2001-10-16 | Integrated Device Technology, Inc. | Disparity and transition density control system and method |
| AUPR105000A0 (en) | 2000-10-27 | 2000-11-23 | Canon Kabushiki Kaisha | Method for generating and detecting marks |
| JP3404024B2 (ja) | 2001-02-27 | 2003-05-06 | 三菱電機株式会社 | 音声符号化方法および音声符号化装置 |
| JP3636094B2 (ja) | 2001-05-07 | 2005-04-06 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
| JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
| US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
| US6662154B2 (en) | 2001-12-12 | 2003-12-09 | Motorola, Inc. | Method and system for information signal coding using combinatorial and huffman codes |
| WO2003073741A2 (en) | 2002-02-21 | 2003-09-04 | The Regents Of The University Of California | Scalable compression of audio and other signals |
| KR100711989B1 (ko) * | 2002-03-12 | 2007-05-02 | 노키아 코포레이션 | 효율적으로 개선된 스케일러블 오디오 부호화 |
| JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
| FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
| AU2003208517A1 (en) * | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
| EP1619664B1 (en) | 2003-04-30 | 2012-01-25 | Panasonic Corporation | Speech coding apparatus, speech decoding apparatus and methods thereof |
| JP2005005844A (ja) | 2003-06-10 | 2005-01-06 | Hitachi Ltd | 計算装置及び符号化処理プログラム |
| JP4123109B2 (ja) | 2003-08-29 | 2008-07-23 | 日本ビクター株式会社 | 変調装置及び変調方法並びに復調装置及び復調方法 |
| SE527670C2 (sv) | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
| KR100629997B1 (ko) * | 2004-02-26 | 2006-09-27 | 엘지전자 주식회사 | 오디오 신호의 인코딩 방법 |
| KR101135726B1 (ko) * | 2004-04-05 | 2012-04-16 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체 |
| US7596486B2 (en) * | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
| US20060022374A1 (en) | 2004-07-28 | 2006-02-02 | Sun Turn Industrial Co., Ltd. | Processing method for making column-shaped foam |
| US6975253B1 (en) | 2004-08-06 | 2005-12-13 | Analog Devices, Inc. | System and method for static Huffman decoding |
| US7161507B2 (en) | 2004-08-20 | 2007-01-09 | 1St Works Corporation | Fast, practically optimal entropy coding |
| US20060047522A1 (en) | 2004-08-26 | 2006-03-02 | Nokia Corporation | Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system |
| JP4771674B2 (ja) * | 2004-09-02 | 2011-09-14 | パナソニック株式会社 | 音声符号化装置、音声復号化装置及びこれらの方法 |
| WO2006070751A1 (ja) | 2004-12-27 | 2006-07-06 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
| US20060190246A1 (en) * | 2005-02-23 | 2006-08-24 | Via Telecom Co., Ltd. | Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC |
| JP4846712B2 (ja) * | 2005-03-14 | 2011-12-28 | パナソニック株式会社 | スケーラブル復号化装置およびスケーラブル復号化方法 |
| KR100707186B1 (ko) * | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
| EP1866913B1 (en) * | 2005-03-30 | 2008-08-27 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
| US7885809B2 (en) | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
| DE602006011600D1 (de) * | 2005-04-28 | 2010-02-25 | Panasonic Corp | Audiocodierungseinrichtung und audiocodierungsverfahren |
| US7831421B2 (en) | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
| US8315863B2 (en) * | 2005-06-17 | 2012-11-20 | Panasonic Corporation | Post filter, decoder, and post filtering method |
| FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
| KR101295729B1 (ko) * | 2005-07-22 | 2013-08-12 | 프랑스 텔레콤 | 비트 레이트규모 가변적 및 대역폭규모 가변적 오디오디코딩에서 비트 레이트 스위칭 방법 |
| CN101253557B (zh) | 2005-08-31 | 2012-06-20 | 松下电器产业株式会社 | 立体声编码装置及立体声编码方法 |
| CN101273403B (zh) * | 2005-10-14 | 2012-01-18 | 松下电器产业株式会社 | 可扩展编码装置、可扩展解码装置以及其方法 |
| DE602006015097D1 (de) * | 2005-11-30 | 2010-08-05 | Panasonic Corp | Skalierbare codierungsvorrichtung und skalierbares codierungsverfahren |
| KR101366124B1 (ko) | 2006-02-14 | 2014-02-21 | 오렌지 | 오디오 인코딩/디코딩에서의 인지 가중 장치 |
| WO2007105586A1 (ja) * | 2006-03-10 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | 符号化装置および符号化方法 |
| US20070239294A1 (en) | 2006-03-29 | 2007-10-11 | Andrea Brueckner | Hearing instrument having audio feedback capability |
| US7230550B1 (en) | 2006-05-16 | 2007-06-12 | Motorola, Inc. | Low-complexity bit-robust method and system for combining codewords to form a single codeword |
| US7414549B1 (en) | 2006-08-04 | 2008-08-19 | The Texas A&M University System | Wyner-Ziv coding based on TCQ and LDPC codes |
| US7461106B2 (en) | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
| US8285555B2 (en) * | 2006-11-21 | 2012-10-09 | Samsung Electronics Co., Ltd. | Method, medium, and system scalably encoding/decoding audio/speech |
| JP5394931B2 (ja) | 2006-11-24 | 2014-01-22 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の復号化方法及びその装置 |
| US8060363B2 (en) * | 2007-02-13 | 2011-11-15 | Nokia Corporation | Audio signal encoding |
| US8195454B2 (en) | 2007-02-26 | 2012-06-05 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
| US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
| US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
| US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
| US8209190B2 (en) | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
| US7889103B2 (en) | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
| US20090234642A1 (en) | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
| CN102105930B (zh) | 2008-07-11 | 2012-10-03 | 弗朗霍夫应用科学研究促进协会 | 用于编码采样音频信号的帧的音频编码器和解码器 |
| US20100088090A1 (en) | 2008-10-08 | 2010-04-08 | Motorola, Inc. | Arithmetic encoding for celp speech encoders |
| US8140342B2 (en) | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
| US8200496B2 (en) | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
| US8175888B2 (en) | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
| US8219408B2 (en) | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
| US8442837B2 (en) | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
-
2008
- 2008-04-09 US US12/099,842 patent/US8639519B2/en not_active Expired - Fee Related
-
2009
- 2009-04-09 CN CN2009801125660A patent/CN102047325A/zh active Pending
- 2009-04-09 KR KR1020107025140A patent/KR101317530B1/ko active Active
- 2009-04-09 RU RU2010145274/08A patent/RU2504026C2/ru active
- 2009-04-09 WO PCT/US2009/039984 patent/WO2009126759A1/en not_active Ceased
- 2009-04-09 EP EP09730909A patent/EP2272063B1/en active Active
- 2009-04-09 BR BRPI0909487A patent/BRPI0909487A8/pt not_active IP Right Cessation
- 2009-04-09 ES ES09730909T patent/ES2396481T3/es active Active
- 2009-04-09 MX MX2010011111A patent/MX2010011111A/es active IP Right Grant
Also Published As
| Publication number | Publication date |
|---|---|
| RU2504026C2 (ru) | 2014-01-10 |
| EP2272063A1 (en) | 2011-01-12 |
| BRPI0909487A8 (pt) | 2018-04-03 |
| BRPI0909487A2 (pt) | 2017-10-17 |
| MX2010011111A (es) | 2011-02-23 |
| US8639519B2 (en) | 2014-01-28 |
| CN102047325A (zh) | 2011-05-04 |
| WO2009126759A1 (en) | 2009-10-15 |
| EP2272063B1 (en) | 2012-11-28 |
| KR20110002088A (ko) | 2011-01-06 |
| KR101317530B1 (ko) | 2013-10-15 |
| US20090259477A1 (en) | 2009-10-15 |
| RU2010145274A (ru) | 2012-05-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2396481T3 (es) | Método y aparato para codificación selectiva de señales en base al rendimiento del codificador de núcleo | |
| ES2403410T3 (es) | Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda | |
| JP6937877B2 (ja) | 信号符号化及び復号化方法及び装置 | |
| KR101125429B1 (ko) | 오디오 코딩 시스템내에서 향상 계층을 발생시키는 방법 및 장치 | |
| KR101180202B1 (ko) | 다중채널 오디오 코딩 시스템 내에 인핸스먼트 레이어를 생성하기 위한 방법 및 장치 | |
| ES2704286T3 (es) | Método y dispositivo para la descodificación espectral perceptual de una señal de audio, que incluyen el llenado de huecos espectrales | |
| ES2539174T3 (es) | Aparato y método para ocultamiento de error en voz unificada con bajo retardo y codificación de audio (USAC) | |
| ES2664185T3 (es) | Codificador de audio, decodificador de audio, método para proporcionar una información de audio codificada, método para proporcionar una información de audio decodificada, programa informático y representación codificada utilizando una ampliación de ancho de banda adaptada a la señal | |
| ES2628127T3 (es) | Cuantificador avanzado | |
| US8442837B2 (en) | Embedded speech and audio coding using a switchable model core | |
| KR102217709B1 (ko) | 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템 | |
| TW200935403A (en) | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs | |
| CN1989548A (zh) | 语音解码装置及补偿帧生成方法 | |
| US20110026581A1 (en) | Scalable Coding with Partial Eror Protection | |
| ES2312142T3 (es) | Aparato avanzado para codificar datos de audio digitales. | |
| KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
| JP3557164B2 (ja) | オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体 | |
| JP4195598B2 (ja) | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム | |
| Bernard | Source-channel coding of speech | |
| Kandadai et al. | Optimal Bit Layering for Scalable Audio Compression Using Objective Audio Quality Metrics | |
| BRPI0317954B1 (pt) | Variable rate audio coding and decoding process |