ES2754925T3 - Aparato y procedimiento de decodificación de una señal multicanal - Google Patents

Aparato y procedimiento de decodificación de una señal multicanal Download PDF

Info

Publication number
ES2754925T3
ES2754925T3 ES09823820T ES09823820T ES2754925T3 ES 2754925 T3 ES2754925 T3 ES 2754925T3 ES 09823820 T ES09823820 T ES 09823820T ES 09823820 T ES09823820 T ES 09823820T ES 2754925 T3 ES2754925 T3 ES 2754925T3
Authority
ES
Spain
Prior art keywords
frequency band
information
phase parameter
signal
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09823820T
Other languages
English (en)
Inventor
Jung-Hoe Kim
Eunmi Oh
Miyoung Kim
Kihyun Choo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of ES2754925T3 publication Critical patent/ES2754925T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)

Abstract

Un aparato de decodificación (200), que comprende: una unidad (210) de decodificación de señales mono dispuesta para descodificar una señal mono, que es una señal de mezcla descendente de una señal multicanal, a partir de un flujo de bits en el que se codifica la señal multicanal; una unidad (220) de determinación de banda de frecuencias dispuesta para determinar si existe un parámetro de fase de una pluralidad de canales en el flujo de bits, en base a la información de codificación del flujo de bits, y cuando existe el parámetro de fase en el flujo de bits, determinar una banda de frecuencias de la señal mono en la que aplicar el parámetro de fase; una unidad (230) de decodificación de parámetros dispuesta para descodificar el parámetro de fase del flujo de bits; y una unidad (240) de mezcla ascendente dispuesta para mezclar ascendentemente la señal mono aplicando el parámetro de fase a la banda de frecuencias.

Description

DESCRIPCIÓN
Aparato y procedimiento de decodificación de una señal multicanal
Campo técnico
Las realizaciones ejemplares se refieren a un aparato y procedimiento para la codificación/decodificación de una señal multicanal, y más particularmente, a un aparato y procedimiento para la codificación/decodificación de una señal multicanal utilizando información de fase.
Antecedentes de la técnica
Una tecnología de Estéreo Paramétrico (PS) se puede usar para codificar una señal estéreo. Una tecnología de PS puede generar una señal mono mezclando descendentemente una señal estéreo introducida, extraer un parámetro estéreo que indica información lateral de la señal estéreo, y codificar la señal mono generada y el parámetro estéreo extraído para codificar la señal estéreo.
En este caso, el parámetro estéreo puede incluir una Diferencia De Intensidad Entre Canales (IID) o una Diferencia De Nivel De Canal (EPC), una Coherencia Entre Canales o Correlación Entre Canales (ICC), una Diferencia De Fase Entre Canales (IPD), una Diferencia De Fase Total (OPD), y similares. La IID o la CLD pueden indicar una diferencia de intensidad en función de un nivel de energía de al menos dos señales de los canales incluidos en una señal estéreo. La ICC puede indicar una correlación entre al menos dos señales de canal en función de la coherencia de las formas de onda de los al menos dos señales de los canales incluidos en una señal estéreo. El IPD puede indicar una diferencia de fase entre al menos dos señales de los canales incluidos en una señal estéreo. La OPD puede indicar cómo una diferencia de fase entre al menos dos señales de canal, incluido en una señal estéreo, se distribuye entre dos canales basándose en una señal mono. El documento US2008/253576 desvela un aparato y procedimiento de decodificación de acuerdo con la técnica anterior.
Breve descripción de los dibujos
la Figura 1 es un diagrama de bloques que ilustra un aparato de codificación de una señal multicanal de acuerdo con una realización ejemplar;
la Figura 2 es un diagrama de bloques que ilustra un aparato de decodificación de una señal multicanal de acuerdo con una realización ejemplar;
la Figura 3 es un diagrama que ilustra una configuración de un flujo de bits de una señal multicanal codificada por un aparato de codificación de acuerdo con una realización ejemplar;
la Figura 4 es un diagrama de flujo que ilustra un procedimiento de codificar una señal multicanal; de acuerdo con una realización ejemplar;
la Figura 5 es un diagrama de flujo que ilustra un procedimiento de decodificación de una señal multicanal de acuerdo con una realización ejemplar; y
las Figuras 6 a 8 son diagramas de flujo que ilustran un procedimiento de codificar una señal multicanal de acuerdo con otra realización ejemplar.
Mejor modo de realizar la invención
A continuación se hará referencia en detalle a las realizaciones ejemplares, cuyos ejemplos se ilustran en los dibujos adjuntos, en los que números de referencia se refieren a los elementos, como en todas partes. Las realizaciones ejemplares se describen a continuación para explicar las realizaciones ejemplares haciendo referencia a las figuras. La Figura 1 es un diagrama de bloques que ilustra un aparato 100 de codificación de una señal multicanal de acuerdo con una realización ejemplar.
El aparato de codificación de una señal multicanal, en lo sucesivo, referido como un aparato 100 de codificación, puede incluir una unidad 110 de codificación de parámetros, una unidad 120 de codificación de señales mono, y una unidad 130 de generación de flujo de bits. En este caso, la señal multicanal puede indicar una señal de una pluralidad de canales, y cada uno de la pluralidad de canales incluidos en la señal multicanal puede referirse como una señal de canal.
De aquí en adelante, se puede suponer que el aparato 100 de codificación codifica una señal de estéreo incluyendo una señal (L) del canal izquierdo y una señal (R) del canal derecho por conveniencia de la descripción. Sin embargo, es evidente para los expertos en la materia relacionada que el aparato 100 de codificación puede no estar limitado para codificar la señal estéreo, y puede codificar una señal multicanal.
La unidad 110 de codificación de parámetros puede determinar si para codificar un parámetro de fase, y generar información de codificación. Cuando se determina codificar el parámetro de fase, la unidad 110 de codificación de parámetros puede codificar el parámetro de fase. Aquí, el parámetro de fase puede indicar información de fase de una pluralidad de canales, y la señal multicanal o una señal estéreo se puede configurar como la pluralidad de canales. De aquí en adelante, la señal multicanal o la señal estéreo puede denominarse como una señal estéreo.
Como se ha descrito anteriormente, un parámetro estéreo, que se utiliza cuando se decodifica la señal estéreo utilizando una tecnología de Estéreo Paramétrico (PS), puede incluir una Diferencia De Nivel De Canal (CLD), una Coherencia Entre Canales o Correlación Entre Canales (ICC), una Diferencia De Fase Entre Canales (IPD), una Diferencia De Fase Total (OPD), y similares.
Por ejemplo, la unidad 110 de codificación de parámetros puede incluir una unidad de extracción de parámetros. En este caso, el parámetro estéreo se puede extraer por la unidad de extracción de parámetros.
En este caso, la unidad 110 de codificación de parámetros puede determinar si codificar el parámetro de fase, lo que indica información de fase de la pluralidad de canales, a partir del parámetro estéreo extraído, y generar información de codificación. Es decir, la información de codificación puede indicar si el parámetro de fase está incluido en un flujo de bits generado mediante la codificación de la señal estéreo. Aquí, el flujo de bits puede ser generado por la unidad 130 de generación de flujo de bits. Se puede determinar si codificar el parámetro de fase basándose en una importancia de la información de fase en la señal estéreo a transmitir. Además, la unidad 110 de codificación de parámetros puede codificar la CLD y la ICC.
De acuerdo con una realización ejemplar, la información de codificación se puede representar por un único bit. Cuando un parámetro de fase codificado se incluye en el flujo de bits, el bit puede tener un valor de '1', y cuando el parámetro de fase codificado no está incluido en el flujo de bits, el bit puede tener un valor de '0'.
Cuando se determina codificar el parámetro de fase, la unidad 110 de codificación de parámetros puede codificar el parámetro de fase, y generar información de codificación que tiene un valor de '1'. Cuando se determina no codificar el parámetro de fase, la unidad 110 de codificación de parámetros puede no codificar el parámetro de fase, y generar información de codificación que tiene un valor de '0'.
De acuerdo con una realización ejemplar, el parámetro de fase puede incluir tanto IPD como OPD, o incluir solamente IPD. Puesto que la OPD se puede estimar usando la IPD u otro parámetro estéreo, el parámetro de fase puede incluir solo la IPD, que se describe con mayor detalle con referencia a la Figura 3.
De acuerdo con una realización ejemplar, la unidad 110 de codificación de parámetros puede incluir una unidad de mezcla descendente. La unidad de mezcla descendente puede generar una señal mono mezclando descendentemente la señal estéreo.
Una señal mono de un solo canal se puede generar a partir de una señal estéreo de al menos dos canales a través de mezcla descendente, y la mezcla descendente puede reducir la cantidad de bits asignados durante la codificación. En este caso, la señal mono puede representar la señal estéreo. Es decir, el aparato 100 de codificación puede codificar solo la señal mono y transmitir la señal mono codificada, sin codificar cada una de una señal del canal izquierdo y la señal del canal derecho incluidas en la señal estéreo. Por ejemplo, una magnitud de la señal mono se puede obtener usando una magnitud media de la señal del canal izquierdo y la señal del canal derecho. Además, una fase de la señal mono se puede obtener usando una fase media de la señal del canal izquierdo y de la señal del canal derecho.
La unidad 120 de codificación de señales mono puede codificar la señal mono obtenida mezclando descendentemente la señal estéreo.
Por ejemplo, cuando la señal estéreo es una señal de voz, la unidad 120 de codificación de señales mono puede codificar la señal mono basándose en un esquema de Predicción Lineal Excitada por Código (CELP).
También, por ejemplo, cuando la señal estéreo es una señal de música, la unidad 120 de codificación de señales mono puede codificar la señal mono utilizando un esquema similar a una 2/4 Codificación de audio avanzada (AAC)-Grupo de expertos en imagen en movimiento (MPEG) o un archivo MPEG Audio capa 3(MP3).
La unidad 130 de generación de flujo de bits puede generar el flujo de bits que codifica la señal estéreo, utilizando la señal monofónica codificada.
De acuerdo con una realización ejemplar, cuando se determina codificar el parámetro de fase, la unidad 130 de generación de flujo de bits puede generar el flujo de bits que codifica la señal estéreo utilizando la señal mono codificada, el parámetro de fase codificado, y la información de codificación. Por ejemplo, la unidad 130 de generación de flujo de bits puede generar el flujo de bits multiplexando la señal mono codificada, el parámetro de fase codificado, y la información de codificación.
De acuerdo con otra realización ejemplar, cuando se determina no codificar el parámetro de fase, la unidad 130 de generación de flujo de bits puede generar el flujo de bits que codifica la señal estéreo, utilizando la señal mono codificada y la información de codificación. En este caso, la unidad 130 de generación de flujo de bits puede generar el flujo de bits utilizando un esquema de multiplexación.
Además, como se ha descrito anteriormente, la unidad 110 de codificación de parámetros puede codificar la CLD y la ICC. Por consiguiente, la unidad 130 de generación de flujo de bits puede utilizar la CLD e ICC, codificarse cuando se genera el flujo de bits, independientemente de si se codifica el parámetro de fase.
Es decir, el aparato 100 de codificación de acuerdo con una realización ejemplar puede codificar selectivamente el parámetro de fase, insertar el parámetro de fase en el flujo de bits, y transmitir el flujo de bits. Por consiguiente, en comparación a cuando se codifica/descodificada sin usar un parámetro de fase una señal estéreo, el aparato 100 de codificación puede proporcionar una señal estéreo con una calidad de sonido mejorada. También, en comparación a cuando se codifica/descodificada una señal de estéreo utilizando un parámetro de fase cada vez, el aparato 100 de codificación puede reducir una cantidad de datos a transmitir.
Como se ha descrito anteriormente, se puede determinar si codificar el parámetro de fase basándose en la importancia de la información de fase en la señal estéreo a transmitir. De acuerdo con una realización ejemplar, la unidad 110 de codificación de parámetros puede determinar si codificar el parámetro de fase basándose en al menos uno de una diferencia entre una coherencia entre canales y una correlación entre canales, y una continuidad de la información de fase de una pluralidad de tramas incluidas en la señal estéreo.
Es decir, la diferencia es significativa, lo que indica que la información de fase puede ser perceptivamente significativa. En consecuencia, la unidad 110 de codificación de parámetros puede determinar codificar el parámetro de fase. La coherencia de la pluralidad de canales puede ser la coherencia de la pluralidad de canales que utilizan la información de fase.
Además, un valor de fase de la pluralidad de tramas cambia secuencialmente, lo que indica que una imagen estéreo puede secuencialmente cambio dependiendo de la fase. En consecuencia, la unidad 110 de codificación de parámetros puede determinar que el parámetro de fase debe ser codificado. A la inversa, cuando el valor de fase cambia aleatoriamente, la unidad 110 de codificación de parámetros puede determinar que el parámetro de fase no debe codificarse.
De acuerdo con una realización ejemplar, el flujo de bits, generado por la unidad 130 de generación de flujo de bits, puede incluir un encabezado y una pluralidad de tramas. La información de codificación se puede insertar en el encabezado y en cada una de la pluralidad de tramas.
Cuando el aparato 100 de codificación mezcla ascendentemente la señal mono usando el parámetro de fase, el parámetro de fase, así como la información de banda de frecuencias de la señal mono que el parámetro de fase debe aplicar pueden requerirse. La información acerca de la banda de frecuencias puede ser información sobre en qué banda de frecuencias se utiliza el parámetro de fase cuando se mezcla ascendentemente la señal mono.
Por tanto, de acuerdo con una realización de ejemplo, cuando se determina codificar el parámetro de fase, la unidad 130 de generación de flujo de bits puede generar el flujo de bits mediante el uso adicional de la información de banda de frecuencias de la señal mono. En este caso, la información de banda de frecuencias puede indicar información sobre una banda de frecuencias que el parámetro de fase debe aplicar cuando se mezcla ascendentemente la señal mono. Es decir, la información de banda de frecuencias puede indicar información sobre una banda de frecuencias que el parámetro de fase que debe aplicarse cuando el aparato 100 de codificación mezcla ascendentemente la señal mono.
De acuerdo con una realización ejemplar, la información de banda de frecuencias puede incluir un número de bandas de frecuencias en las que el parámetro de fase se va a aplicar. En este ejemplo, un número de bandas de baja frecuencia puede ser el mismo que el número de bandas de frecuencias que puede seleccionarse como la banda de frecuencias que el parámetro de fase va a aplicar, a partir de una pluralidad de bandas de frecuencias de la señal mono.
Por ejemplo, cuando una frecuencia de la señal mono se divide en 28 bandas de frecuencias, y el número de bandas de frecuencias es mayor que 14, la banda de frecuencias que el parámetro de fase debe aplicar puede ser de 14 bandas de frecuencias con una baja frecuencia, puesto que el parámetro de fase puede ser significativo en una banda de baja frecuencia.
En este ejemplo, cuando la frecuencia de la señal mono se divide en siete o menos bandas de frecuencias, la importancia del flujo de bits puede reducirse. En consecuencia, el número de bandas de frecuencias puede ser cero. Es decir, el parámetro de fase no puede utilizarse cuando se mezcla ascendentemente la señal mono.
De acuerdo con una realización ejemplar, la unidad 110 de codificación de parámetros puede codificar además al menos una de la CLD y la ICC, y la unidad 130 de generación de flujo de bits puede generar el flujo de bits utilizando además al menos una de la CLD y la ICC. En consecuencia, un número de bits puede determinarse basándose en el número de bandas de frecuencias que la al menos una de la CLD y la ICC va a aplicar, cuando se mezcla ascendentemente la señal mono. El número de bits puede representar la información de banda de frecuencia.
Es decir, el número de bandas de frecuencias en las que el parámetro de fase debe aplicar puede determinarse basándose en el número de bandas de frecuencias que va a aplicar la CLD o la ICC. Por ejemplo, el número de bandas de frecuencias en las que el parámetro de fase debe aplicar puede ser igual al número de bandas de frecuencias que va a aplicar la CLD o la ICC. Además, puede ser el doble del número de bandas de frecuencias en las que la CLD o la ICC se va a aplicar como el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar.
De acuerdo con una realización ejemplar, la información de banda de frecuencias puede incluir además información acerca de si actualizar el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar.
Es decir, la información acerca de si actualizar puede indicar si un número de bandas de frecuencias en las que el parámetro de fase se va a aplicar en una trama actual en el que se está realizando la codificación es igual a un número de bandas de frecuencias en las que el parámetro de fase va a aplicar en una trama anterior.
Por ejemplo, la información sobre si se debe actualizar puede representarse por un único bit. Cuando el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar en la trama actual es diferente del número de bandas de frecuencias en las que el parámetro de fase va a aplicar en la trama anterior, el bit puede tener un valor de '1'. Cuando el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar en la trama actual es igual al número de bandas de frecuencias en las que el parámetro de fase va a aplicar aplicado en la trama anterior, el bit puede tener un valor de '0'.
Cuando la información acerca de si actualizar tiene un valor de '1', la información de banda de frecuencias puede incluir información sobre un número de bandas de frecuencias de una señal mono que el parámetro de fase va a aplicar. A la inversa, cuando la información acerca de si actualizar tiene un valor de '0', la información de banda de frecuencias no puede incluir información sobre el número de bandas de frecuencias de la señal mono que el parámetro de fase va a aplicar.
Como se ha descrito anteriormente, el aparato 100 de codificación puede usar la información sobre si se debe actualizar, y de este modo puede evitar que la información innecesaria sea codificada varias veces y reducir la cantidad de datos a transmitir.
De acuerdo con una realización ejemplar, la información de banda de frecuencias se puede insertar en el encabezado o cada una de la pluralidad de tramas. Por ejemplo, cuando se inserta la información de codificación en el encabezado, la información de banda de frecuencias puede insertarse también en el encabezado. Cuando se inserta la información de codificación en cada una de la pluralidad de tramas, la información de banda de frecuencias se puede insertar en cada una de la pluralidad de tramas.
De acuerdo con una realización ejemplar, la unidad 110 de codificación de parámetros puede comparar la información de fase de una pluralidad de tramas incluidos en la señal multicanal, y determinar si codificar el parámetro de fase.
Es decir, cuando la información de fase en una trama actual es idéntica a la información de fase en una trama anterior, la unidad 110 de codificación de parámetros puede no codificar el parámetro de fase. En este caso, la unidad 110 de codificación de parámetros puede generar información de actualización de parámetros de fase que indica el parámetro de fase no se actualiza. Además, la información de actualización de parámetros de fase puede incluirse en el flujo de bits y transmitirse. Cuando el parámetro de fase no se actualiza, el aparato 100 de codificación puede mezclar ascendentemente la señal mono utilizando un parámetro de fase en la trama anterior. La Figura 2 es un diagrama de bloques que ilustra un aparato 200 de decodificación de una señal multicanal de acuerdo con una realización ejemplar.
El aparato 200 de decodificación de una señal multicanal, en lo sucesivo, referido como un aparato 200 de decodificación, puede incluir una unidad 210 de decodificación de señales mono, una unidad 220 de determinación de bandas de frecuencias, una unidad 230 de decodificación de parámetros, y una unidad 240 de mezcla ascendente.
De aquí en adelante, se puede suponer que un flujo de bits, introducido en el aparato 200 de decodificación, es un flujo de bits que codifica una señal estéreo para conveniencia de la descripción.
Además, se puede suponer que el flujo de bits introducido es demultiplexado en una señal mono codificada, un parámetro estéreo codificada, y se codifica la información de banda de frecuencia.
La unidad 210 de decodificación de señales mono puede decodificar una señal mono que es una señal de mezcla descendente de la señal multicanal a partir de la flujo de bits que codifica la señal de multi-canal o la señal estéreo. De aquí en adelante, la señal multi-canal o la señal estéreo se pueden denominar como una señal estéreo. Específicamente, cuando una señal mono se codifica en un dominio de tiempo, la unidad 210 de decodificación de señales mono puede decodificar la señal mono codificada en el dominio del tiempo. Cuando la señal mono se codifica en un dominio de frecuencia, la unidad 210 de decodificación de señales mono puede decodificar la señal mono codificada en el dominio de frecuencia.
La unidad 220 de determinación de bandas de frecuencias puede determinar si existe un parámetro de fase de una pluralidad de canales en el flujo de bits. La pluralidad de canales se puede incluir en una señal multicanal. Cuando existe el parámetro de fase en el flujo de bits, la unidad 220 de determinación de bandas de frecuencias puede determinar una banda de frecuencias de una señal mono que el parámetro de fase va a aplicar.
Por ejemplo, la unidad 220 de determinación de bandas de frecuencias puede determinar la información de codificación, incluido en el flujo de bits, y por lo tanto puede determinar si existe el parámetro de fase en el flujo de bits.
La unidad 230 de decodificación de parámetros puede descodificar el parámetro de fase de la pluralidad de canales del flujo de bits. Por ejemplo, la unidad 230 de decodificación de parámetros puede decodificar la información de codificación, incluido en el flujo de bits, y por lo tanto, puede determinar si el parámetro de fase está incluido en el flujo de bits. Cuando el parámetro de fase está incluido en el flujo de bits, la unidad 230 de decodificación de parámetros puede descodificar el parámetro de fase.
Además, la unidad 230 de decodificación de parámetros puede decodificar otros parámetros estéreo incluido en el flujo de bits tal como una CLD, una ICC, y similares.
Como se ha descrito anteriormente, el parámetro de fase puede incluir tanto IPD como OPD, e incluir solo la IPD. Cuando el parámetro de fase incluye tanto IPD como OPD, la unidad 230 de decodificación de parámetros puede decodificar la IPD y la OPD del flujo de bits.
Cuando el parámetro de fase incluye sola la IPD, la OPD puede estimarse a partir de la IPD y los otros parámetros estéreo. Aquí, se puede suponer que la OPD puede estimarse por una unidad de estimación de OPD incluida en la unidad 230 de decodificación de parámetros, y la unidad de estimación de OPD se describe en detalle. Aquí, puede ser evidente para los expertos en la materia relacionada que las ecuaciones que se describen a continuación pueden ser simplemente realizaciones ejemplares y pueden variar.
La unidad de estimación de OPD puede calcular una primera variable intermedia c usando una IID de acuerdo con la ecuación 1 proporcionada a continuación.
[Ecuación 1]
iID (b )
Figure imgf000006_0001
20
en la que b puede denotar un índice de una banda de frecuencia. Como la Ecuación 1, la primera variable c intermedia puede obtenerse mediante la representación de un valor, que se obtiene dividiendo una IID en una banda de frecuencias predeterminada entre 20, como exponente de 10. En este ejemplo, una segunda variable c intermedia y una tercera variable c2 intermedia se pueden obtener mediante el uso de la primera variable intermedia c de acuerdo con la Ecuación 2 y la Ecuación 3 proporcionadas a continuación.
[Ecuación 2]
Figure imgf000006_0002
Es decir, la tercera variable intermedia c2 puede obtenerse multiplicando la segunda variable c intermedia por c(b). Además, una primera señal del canal izquierdo y una primera señal del canal derecho pueden representarse usando la señal mono decodificada, la segunda variable ^intermedia, y la tercera variable c2 intermedia, de acuerdo con la ecuación 4 y la ecuación 5 proporcionadas a continuación.
[Ecuación 4]
^ n , k = C f á n , k
en la que n y k pueden denotar un índice de intervalo de tiempo y un índice de banda de parámetro. La primera señal Rn, k del canal izquierdo se puede representar como una multiplicación de la segunda variable intermedia c por la señal M mono decodificada.
[Ecuación 5]
Figure imgf000007_0001
La primera señal Ln.k del canal izquierdo puede representarse como una multiplicación de la tercera variable c2 intermedia y la señal M mono decodificada.
En este ejemplo, cuando un valor de la IPD es g>, una primera señal Mn.k mono puede representarse utilizando la primera señal Rn.k del canal derecho y la primera señal Ln.k del canal izquierdo como la ecuación 6 proporcionada a continuación.
[Ecuación 6]
Figure imgf000007_0002
Además, utilizando la ecuación 3 a la Ecuación 6, una cuarta variable p intermedia asociada con la ventana de tiempo y la banda de parámetro puede obtenerse de acuerdo con la Ecuación 7 como se proporciona a continuación.
[Ecuación 7]
Figure imgf000007_0003
en la que la cuarta variable p intermedia puede calcularse dividiendo un valor entre dos. Aquí, el valor puede obtenerse mediante la suma de las magnitudes de la primera señal del canal izquierdo, la primera señal del canal derecho, y la primera señal mono. En este ejemplo, cuando un valor de la OPD es ^ 1, la OPD se puede obtener mediante,
[Ecuación 8]
Figure imgf000007_0004
Además, cuando una diferencia entre la OPD y la IPD es ^ 2, ^ 2 se puede obtener mediante,
[Ecuación 9]
Figure imgf000007_0005
^ 1, el valor de la OPD obtenido de acuerdo con la Ecuación 8, puede denotar una diferencia de fase entre la señal mono decodificada y una señal del canal izquierdo que se va a mezclar ascendentemente. ^ 2 obtenido de acuerdo con la Ecuación 9 puede denotar una diferencia de fase entre la señal mono decodificada y una señal del canal derecho que se va a mezclar ascendentemente.
Por consiguiente, la unidad de estimación de OPD puede generar la primera señal del canal izquierdo y la primera señal del canal derecho con respecto a la señal del canal izquierdo y la señal del canal derecho, de la señal mono decodificada usando la IID que indica una diferencia de intensidad entre los canales señales de estéreo. Además, la unidad de estimación de OPD puede generar la primera señal mono desde la primera señal del canal izquierdo y la primera señal del canal derecho utilizando la IPD que indica una diferencia de fase entre canales de señales estéreo. Además, la unidad de estimación de OPD puede estimar el valor OPD usando la primera señal del canal izquierdo generada, la primera señal del canal derecho, y la primera señal mono. El valor OPD puede indicar una diferencia de fase entre la señal mono decodificada y la señal estéreo.
La unidad 240 de mezcla ascendente puede mezclar ascendentemente la señal mono aplicando el parámetro de fase a la banda de frecuencias para decodificar la señal estéreo.
Una señal de estéreo de al menos dos canales se puede generar a partir de una señal mono de un solo canal a través de la mezcla ascendente. La mezcla ascendente puede inversa para oponerse a la mezcla descendente. La unidad 240 de mezcla ascendente puede mezclar ascendentemente la señal mono mediante la aplicación de los otros parámetros estéreo como la CLD, la ICC, y similares. En lo sucesivo, una operación de la unidad 240 de mezcla ascendente que realiza la mezcla ascendente usando la CLD, ICC, IPD, y OPD se describe en detalle. Cuando un valor de ICC es p, la unidad 240 de mezcla ascendente puede obtener una primera fase a + 3 y una segunda fase a - 3, utilizando la segunda variable c intermedia y la tercera variable c2 intermedia, de acuerdo con la Ecuación 10 y la Ecuación 11 proporcionadas a continuación.
[Ecuación 10]
Figure imgf000008_0001
Cuando la señal mono decodificada es M y una señal descorrelacionada es D, de acuerdo con la Ecuación 12 y la Ecuación 13, la unidad 240 de mezcla ascendente puede obtener una señal del canal izquierdo mezclada ascendentemente y la señal del canal derecho, utilizando la primera fase y la segunda fase, obtenida de acuerdo con la Ecuación 10 y la Ecuación 11, la segunda variable c intermedia y la tercera variable c2 intermedia, el valor de OPD obtenido de acuerdo con la Ecuación 8, y de ^ 2 obtenido de acuerdo con la Ecuación 9.
[Ecuación 12]
L' = (M • cosí# P ) D * sen(a + /?) )■ exp(J(px)■ c2
[Ecuación 13]
R! = (M * cos( a - p ) —D' sen (a - p )) * expí j<p2) * q Como se ha descrito anteriormente, el aparato 200 de decodificación puede estimar el valor OPD usando los otros parámetros, transmitidos desde el aparato 100 de codificación, sin recibir el valor OPD desde el aparato 100 de codificación. En consecuencia, los tipos de parámetros utilizados para la mezcla ascendente pueden aumentarse y una calidad de sonido de una señal estéreo mezclada ascendentemente puede mejorarse.
De acuerdo con una realización ejemplar, el aparato 200 de decodificación puede incluir una tabla en la que se almacena la información banda de frecuencias sobre una banda de frecuencia. Además, la unidad 220 de determinación de bandas de frecuencias puede seleccionar a información de banda de frecuencias correspondiente a la señal mono de la tabla, y determinar la banda de frecuencia.
Es decir, cuando el aparato 100 de codificación y el aparato 200 de decodificación comparten la tabla que almacena la información de banda de frecuencia, el equipo 100 de codificación y el aparato 200 de la decodificación pueden seleccionar información sobre una banda de frecuencias que un parámetro de fase va a aplicar haciendo referencia a la tabla, y determinar la banda de frecuencias que el parámetro de fase va a aplicar.
Además, de acuerdo con una realización ejemplar, la unidad 220 de determinación de bandas de frecuencias puede decodificar la información de banda de frecuencias basándose en la banda de frecuencias del flujo de bits, y determinar la banda de frecuencias basándose en la información de banda de frecuencias decodificada.
Es decir, la unidad 220 de determinación de bandas de frecuencias puede decodificar directamente la información de banda de frecuencias del flujo de bits, y determinar la banda de frecuencias utilizando la información de banda de frecuencias decodificada.
De acuerdo con una realización ejemplar, la unidad 220 de determinación de bandas de frecuencias puede decodificar la información de banda de frecuencias de un encabezado o cada uno de una pluralidad de tramas del flujo de bits.
Es decir, la información de banda de frecuencias se puede insertar en el encabezado o en cada una de la pluralidad de tramas del flujo de bits introducido. En este caso, la unidad 220 de determinación de bandas de frecuencias puede decodificar la información de banda de frecuencias del encabezado o de cada una de la pluralidad de tramas del flujo de bits introducido.
De acuerdo con una realización ejemplar, la información de banda de frecuencias puede incluir un número de bandas de frecuencias en las que se va a aplicar el parámetro de fase.
Cuando la información de banda de frecuencias incluye el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar, la unidad 220 de determinación de bandas de frecuencias puede determinar un mismo número de bandas de baja frecuencia como el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar, a partir de una pluralidad de bandas de frecuencias de la señal mono.
Por ejemplo, cuando una frecuencia de la señal mono se divide en 28 bandas de frecuencias, y el número de bandas de frecuencias es 14, la banda de frecuencias en la que el parámetro de fase debe aplicarse puede ser de 14 bandas de frecuencias con una frecuencia baja. En este caso, cuando el número de bandas de frecuencias es cero, el parámetro de fase puede no utilizarse cuando se mezcla ascendentemente la señal mono.
Además, de acuerdo con una realización ejemplar, la información de banda de frecuencias puede incluir además información acerca de si actualizar el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar.
En este caso, la unidad 220 de determinación de bandas de frecuencias puede analizar la información acerca de si se debe actualizar.
Cuando se actualiza el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar, la unidad 220 de determinación de bandas de frecuencias puede extraer el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar, a partir del flujo de bits, y determinar una banda de frecuencias en la que el parámetro de fase se va a aplicar, basándose en el número actualizado de bandas de frecuencias.
A la inversa, cuando el número de bandas de frecuencias en las que el parámetro de fase debe aplicarse y no se actualiza, la unidad 220 de determinación de bandas de frecuencias puede determinar la banda de frecuencias en la que el parámetro de fase se va a aplicar, basándose en un número de bandas de frecuencias en una trama anterior. La Figura 3 es un diagrama que ilustra una configuración de un flujo de bits de una señal multicanal codificada por un aparato de codificación de acuerdo con una realización ejemplar.
Como se ha descrito anteriormente, la información de codificación y la información de banda de frecuencias pueden insertarse en un encabezado o una trama de un flujo de bits.
La Figura 3(a) ilustra una configuración del flujo de bits en el que se inserta la información de codificación y la información de banda de frecuencias en el encabezado 310 del flujo de bits. En la Figura 3(a), el encabezado 310 puede incluir un campo 311 de información lateral, un campo 312 de información de codificación, y un campo de información 313 de banda de frecuencia.
El campo 311 de información lateral puede incluir diversa información utilizada cuando datos multicanales se codifican/descodifican. Por ejemplo, el campo 311 de información lateral puede incluir información sobre un número de bandas de frecuencias de una CLD y una ICC.
El campo 312 de información de codificación puede incluir información sobre si un parámetro de fase existe en el flujo de bits. Como se ha descrito anteriormente, el campo 312 de información de codificación se puede representar por un único bit. Además, cuando el parámetro de fase está incluido en el flujo de bits, el bit puede tener un valor de '1'. Cuando el parámetro de fase no está incluido en el flujo de bits, el bit puede tener un valor de '0'. El parámetro de fase puede almacenarse en un campo 322 de parámetros de fase de cada uno de una pluralidad de tramas 320.
El campo 313 de información de banda de frecuencias puede incluir información sobre una banda de frecuencias en la que el parámetro de fase debe aplicarse cuando una señal mono premezcla las pistas. Por ejemplo, cuando la información sobre la banda de frecuencias indica un número de bandas de frecuencias en las que el parámetro de fase se va a aplicar, una banda de frecuencias en la que el parámetro de fase se va a aplicar se puede representar como un máximo de 28 bandas de frecuencias. En consecuencia, el campo 313 de información de banda de frecuencias puede tener una longitud de cinco bits.
El parámetro de fase se puede almacenar en el campo 322 de parámetro de fase de cada una de la pluralidad de tramas 320.
La Figura 3(b) ilustra una configuración del flujo de bits que se inserta solamente la información de codificación en el encabezado 330 del flujo de bits. En la Figura 3(b), el encabezado 330 puede incluir solamente un campo 331 información lateral y el campo 332 de información de codificación, en contraposición con un campo de información de banda de frecuencia.
En este ejemplo, el aparato 100 de codificación y el aparato 200 de decodificación pueden incluir una tabla que almacena información de banda de frecuencia. En este caso, el aparato 100 de codificación y el aparato 200 de decodificación pueden seleccionar la información acerca de una banda de frecuencias en la que un parámetro de fase se va a aplicar haciendo referencia a la tabla, y determinar la banda de frecuencias en la que el parámetro de fase se va a aplicar. Por ejemplo, el aparato 100 de codificación y el aparato 200 de decodificación pueden determinar la información de banda de frecuencias mediante la búsqueda en la tabla basándose en información sobre un número de bandas de frecuencias de una CLD y una ICC. Aquí, la CLD y la ICC pueden existir en el campo de información secundaria 331 del encabezado 330.
La Figura 3(c) ilustra una configuración del flujo de bits en la que información de codificación y la información de banda de frecuencias se insertan en una trama 360 del flujo de bits.
En este ejemplo, un encabezado 350 puede incluir solamente un campo de información lateral. El bastidor 360 puede incluir un campo 361 de datos, un campo 362 de información de codificación, un campo 363 de información acerca de si se debe actualizar la información de banda de frecuencia, un campo 364 de información de banda de frecuencia, y un campo 365 de parámetros de fase.
El campo 362 de información de codificación, el campo 364 de información de banda de frecuencia, y el campo 365 de parámetros de fase puede ser el mismo que el campo 312 de información de codificación, el campo 313 de información de banda de frecuencia, y el campo 322 de parámetros de fase de la Figura 3(a), y por tanto una descripción más detallada se omite aquí.
El campo 363 de información acerca de si se debe actualizar la información de banda de frecuencias puede incluir información sobre si la información de banda de frecuencias en la que el parámetro de fase se va a aplicar en una trama actual es idéntica a la información de banda de frecuencias en la que el parámetro de fase se va a aplicar en una trama anterior.
Como se ha descrito anteriormente, el campo 363 se puede representar por un único bit. Cuando la información de banda de frecuencias en la trama actual es diferente de la información banda de frecuencias en la trama anterior, el bit puede tener un valor de '1'. Cuando la información de banda de frecuencias en la trama actual es idéntica a la información banda de frecuencias en la trama anterior, el bit puede tener un valor de '0'.
Cuando la información acerca de si actualizar tiene un valor de '0', la información de banda de frecuencias en la trama actual es idéntica a la información de banda de frecuencias en la trama anterior, y así el campo 364 de información de banda de frecuencias se puede establecer como '0'. En este caso, el aparato 200 de decodificación puede realizar la decodificación mediante la información de banda de frecuencias en la trama anterior.
En consecuencia, el aparato 100 de codificación puede utilizar además de la información sobre si se debe actualizar la banda de frecuencias en la que el parámetro de fase se va a aplicar, y de este modo puede impedir que la información innecesaria sea codificada varias veces y reducir la cantidad de datos a transmitir.
La Figura 3(d) ilustra una configuración del flujo de bits en la que se inserta solamente la información de codificación en una trama 380 del flujo de bits. La información de banda de frecuencias y la información sobre si se debe actualizar la información de banda de frecuencias no pueden incluirse en el flujo de bits.
Como se ha descrito anteriormente, cuando el aparato 100 de codificación y el aparato 200 de decodificación incluyen una tabla que almacena la información de banda de frecuencia, el equipo 100 de codificación y el aparato 200 de decodificación pueden seleccionar información sobre una banda de frecuencias en la que un parámetro de fase se va a aplicar haciendo referencia a la tabla, y determinar la banda de frecuencias en la que el parámetro de fase se va a aplicar.
La Figura 4 a la Figura 8 ilustran la sintaxis asociada con un flujo de bits generado por un aparato de codificación de acuerdo con una realización.
La sintaxis descrita a continuación puede basarse en una sintaxis utilizada en las tecnologías de Envolvente MPEG y Discurso Unificado MPEG y de codificación de audio.
La Figura 4 a la Figura 6 ilustran la sintaxis asociada con información de codificación insertada en un encabezado de un flujo de bits. Es decir, la sintaxis ilustrada en la Figura 4 a la Figura 6 puede asociarse con el flujo de bits ilustrado en la Figura 3(a) y (b).
La sintaxis de la Figura 4 puede asociarse con un encabezado del flujo de bits. Como se ilustra en la Figura 4, se puede añadir información de 'bsPhaseMode' 410.
La información de 'bsPhaseMode' 410 puede indicar información acerca de si codificar y transmitir un parámetro de fase, es decir, información de codificación. Como se ha descrito anteriormente, la información de 'bsPhaseMode' 410 se puede representar por un único bit.
Cuando se inserta información de banda de frecuencias en el encabezado del flujo de bits, es decir, cuando el flujo de bits de la Figura 3(a) se genera, una sintaxis de 'OttConfig' 420 puede cambiar, como se ilustra en la Figura 5(a). La Figura 5(a) ilustra una sintaxis de 'OttConfig'. Como se ilustra en la Figura 5 (a), la información de 'bsOttBandsPhase[i]' 510 se puede añadir adicionalmente.
La información de 'bsOttBandsPhase[i]' 510 puede indicar un número de bandas de frecuencias en las que un parámetro de fase se va a aplicar. La información de 'bsOttBandsPhase[i]' 510 se puede representar por un bit que tiene una magnitud de 'nBitsBandsPhase'.
'Ott (One-To-Two)' se puede usar para la mezcla ascendente estéreo. El número de bandas de frecuencias en las que el parámetro de fase se va a aplicar en 'Ott' se puede determinar en la sintaxis de 'OttConfig'. Cuando la información de 'bsPhaseMode' es '1', es decir, cuando se utiliza el parámetro de fase, la información sobre la banda de frecuencias en la que el parámetro de fase se utiliza para la mezcla ascendentemente requiere una señal mono. En este caso, cuando se inserta la información sobre la banda de frecuencias en el flujo de bits, la información puede representarse usando 'bsOttBandsPhase'. La información de 'bsFreqRes' puede indicar un número de bandas de frecuencias de una CLD y una CCI, y se transmite al encabezado. En general, puesto que la información de 'bsFreqRes' se puede representar como máximo de 28 bandas (NumBands), se requieren cinco bits. Cuando la banda de frecuencias en la que el parámetro de fase se va a aplicar se representa usando 'nBitsBandsPhase', un número máximo de bandas se puede determinar dependiendo de la información de 'bsFreqRes'. Por consiguiente, los bits pueden asignarse dinámicamente.
Por ejemplo, cuando la información de 'bsFreqRes' tiene un valor de cuatro, el número máximo de bandas de la CLD es de diez. En consecuencia, como se representa en 'nBitsBandsPhase(full band)' de una tabla ilustrada en la Figura 5(b), un número de bandas de frecuencias puede representarse por medio de cuatro bits.
Además, como se ha descrito anteriormente, el parámetro de fase se puede aplicar a única banda de baja frecuencia. En este caso, como se representa en 'nBitsBandsPhase(low band)' de una tabla ilustrada en la Figura 5(b), una banda de frecuencias puede determinarse y los bits pueden asignarse dinámicamente. En este caso, puede no ser necesario utilizar todos los cinco bits, en contraposición a cuando el parámetro de fase se aplica a todas las bandas de frecuencias. Además, cuando la información de 'bsFreqRes' tiene un valor igual o superior a cinco, una serie de bandas de la CLD puede ser siete. En este caso, el parámetro de fase puede no utilizarse, y la información de 'nBitsBandsPhase' puede ser '0' y no puede transmitirse.
Cuando la información de banda de frecuencias no se inserta en el encabezado del flujo de bits, es decir, cuando el flujo de bits de la Figura 3(b) se genera, un aparato de codificación y un aparato de decodificación pueden tener una tabla que almacena la información de banda de frecuencia. La Figura 5(c) ilustra un ejemplo de una tabla que almacena la información de banda de frecuencia.
La Figura 6 ilustra una sintaxis de 'OttData' utilizado cuando un parámetro de fase se codifica y se inserta en cada trama. En este ejemplo, la información de 'bsPhaseMode' puede tener un valor de '1'. La información de 'EcDataIPD' 610 puede indicar un resultado de codificación sin pérdida con respecto al parámetro de fase.
La información de 'EcDataIPD' 610 puede determinar si se debe mantener un valor de una trama anterior o si codificar la información de una trama actual a través de codificación sin pérdidas, usando un poco de 'bsIPDdataMode. Cuando el parámetro de fase no tiene sentido en un período de audio predeterminado, el parámetro de fase se puede establecer como '0' y se codifica. Además, el bit de 'bsIPDDdataMode' podrá fijarse en '0' y se transmite. En consecuencia, un parámetro de fase innecesario no se puede transmitir. A la inversa, cuando el bit de 'bsIPDDdataMode' puede ser '1', el parámetro de fase se puede codificar y transmitir.
La Figura 7 y la Figura 8 ilustran la sintaxis asociada con la información de codificación insertada en una trama de un flujo de bits. Es decir, la sintaxis ilustrada en la Figura 7 a la Figura 8 puede estar asociada con el flujo de bits ilustrado en las Figuras 3(c) y (d).
La sintaxis de la Figura 7 puede estar asociada con un cuadro del tren de bits. Como se ilustra en la Figura 7, se puede añadir información de 'bsPhaseMode' 710.
La Figura 8(a) ilustra una sintaxis asociada con 'Ottdata' incluida en la sintaxis de la Figura 7.
Cuando la información de banda de frecuencias y la información sobre si se debe actualizar la información de banda de frecuencias se insertan en la trama, la sintaxis de la Figura 8 puede añadirse.
La información de 'bsUpdateOttBandsPhase' puede ser información sobre si se debe actualizar un número de bandas de frecuencias en las que un parámetro de fase se va a aplicar en una trama actual. Cuando la información de 'bsUpdateOttBandsPhase' tiene un valor de '1', el número de bandas de frecuencias se va a actualizar. Además, el número de bandas de frecuencias puede actualizarse, además, el uso de la información de 'bsOttBandsPhase'. A la inversa, cuando la información de 'bsUpdateOttBandsPhase' tiene un valor de '0', el parámetro de fase puede decodificarase usando un número de bandas de frecuencias en las que el parámetro de fase, utilizado en la trama anterior, se va a aplicar.
Cuando la información de 'bsPhaseMode' es '1', es decir, cuando se utiliza el parámetro de fase, la información sobre la frecuencia de la banda en que el parámetro de fase se utiliza cuando una señal mono mezclada ascendentemente se requiere. En este caso, cuando se inserta la información sobre la banda de frecuencias en el flujo de bits, la información puede representarse usando 'bsOttBandsPhase'. La información de 'bsFreqRes' puede indicar un número de bandas de frecuencias de una CLD y una CCI, y se transmite un encabezado. En general, puesto que la información de 'bsFreqRes' se puede representar como un máximo de 28 bandas (NumBands), se requieren cinco bits para representar una banda de frecuencia. Cuando la banda de frecuencias en la que el parámetro de fase se va a aplicar se representa usando 'nBitsBandsPhase', un número máximo de bandas se puede determinar dependiendo de la información de 'bsFreqRes'. Por consiguiente, los bits pueden asignarse dinámicamente.
Por ejemplo, cuando la información de 'bsFreqRes' tiene un valor de cuatro, un número máximo de bandas de CLD es de diez. En consecuencia, como se representa en 'nBitsBandsPhase(full band)' de una tabla ilustrada en la Figura 8(b), un número de bandas de frecuencias puede representarse por medio de cuatro bits.
También, como se ha descrito anteriormente, el parámetro de fase se puede aplicar a solamente una banda de baja frecuencia. En este caso, como se representa en 'nBitsBandsPhase(low banda)' de una tabla ilustrada en la Figura 8(b), una banda de frecuencias puede determinarse y los bits pueden asignarse dinámicamente. En este caso, puede no ser necesario utilizar todos los cinco bits, en contraposición a cuando el parámetro de fase se aplica a todas las bandas de frecuencias. Además, cuando la información de 'bsFreqRes' tiene un valor igual o superior a cinco, una serie de bandas de la CLD puede ser siete. En este caso, el parámetro de fase puede no utilizarse, y la información de 'nBitsBandsPhase' puede ser '0' y no puede transmitirse. Antes de que la información 'bsUpdateOttBandsPhase' se establezca en '1' y se actualice, la información de 'bsUpdateOttBandsPhase' puede inicializarse como 'Initial bsOttBandsPhase' de una tabla ilustrada en la Figura 8 (b) y se opera.
La información de 'EcDataIPD' 820 puede indicar un resultado de codificación sin pérdida con respecto al parámetro de fase.
Cuando la información de banda de frecuencias no se inserta en la trama del flujo de bits, es decir, cuando el flujo de bits de la Figura 3(d) se genera, el aparato 100 de codificación y el aparato 200 de decodificación pueden utilizar una tabla, almacenar la información de banda de frecuencia, como se ilustra en la Figura 5(c).
La Figura 9 es un diagrama de flujo que ilustra un procedimiento de codificar una señal multicanal de acuerdo con un ejemplo de forma de realización.
Haciendo referencia a la Figura 9, el procedimiento de codificar una señal multicanal, en lo sucesivo, referido como un procedimiento de codificación, puede incluir operaciones de series de tiempo procesadas por un aparato de codificación de la Figura 1. En consecuencia, las descripciones sobre el aparato de codificación descrito anteriormente con referencia a la Figura 1 se pueden aplicar al procedimiento de codificación de acuerdo con una realización ejemplar.
En la operación S910, se puede determinar si codificar un parámetro de fase, y la codificación de la información puede generarse. El parámetro de fase puede indicar información de fase de una pluralidad de canales, y la pluralidad de canales puede incluirse en una señal multicanal.
De acuerdo con una realización ejemplar, el parámetro de fase puede incluir tanto IPD como OPD, e incluir solo la IPD.
Además, de acuerdo con una realización ejemplar, en la operación S910, puede determinarse si hay que codificar basándose en al menos uno de una diferencia entre una coherencia entre canales y una correlación entre canales, y una continuidad de la información de fase de una pluralidad de tramas incluidas en la señal multicanal.
En la operación S920, una señal mono puede codificarse. La señal mono se puede obtener por mezcla descendente de la señal multicanal.
En la operación S930, se determina si codificar el parámetro de fase.
Cuando se determina codificar el parámetro de fase en la operación S930, un flujo de bits codifica la señal multicanal utilizando la señal mono codificada, el parámetro de fase codificado, y la información de codificación en la operación S940.
Cuando se determina no codificar el parámetro de fase en la operación S930, un flujo de bits codifica la señal multicanal utilizando la señal mono codificada y la información de codificación en la operación S950.
De acuerdo con una realización ejemplar, el flujo de bits, generado en la operación S940 y S950, puede incluir un encabezado y una pluralidad de tramas. La información de codificación se puede insertar en el encabezado o en cada una de la pluralidad de tramas.
Además, de acuerdo con una realización ejemplar, en la operación S940, el flujo de bits codificado puede generarse adicionalmente usando información de banda de frecuencia.
Además, de acuerdo con una realización ejemplar, la información de banda de frecuencias puede incluir un número de bandas de frecuencias en las que el parámetro de fase se va a aplicar, e incluir también información acerca de si actualizar el número de bandas de frecuencias en las que el parámetro de fase se aplica.
La Figura 10 es un diagrama de flujo que ilustra un procedimiento de decodificación de una señal multicanal de acuerdo con una realización ejemplar.
Haciendo referencia a la figura. 10, el procedimiento de decodificación de una señal multicanal, en lo sucesivo, referido como un procedimiento de decodificación, puede incluir operaciones de series de tiempo procesadas por un aparato de decodificación de la Figura 2. En consecuencia, las descripciones sobre el aparato de decodificación descrito anteriormente con referencia a la Figura 2 se pueden aplicar al procedimiento de codificación de acuerdo con una realización ejemplar.
En la operación S1010, una señal mono puede decodificarse. La señal mono puede ser una señal de mezcla descendente de la señal multicanal a partir de un flujo de bits en el que la señal multicanal se codifica.
En la operación S1020, puede determinarse si existe un parámetro de fase de una pluralidad de canales en el flujo de bits.
Cuando se determina que el parámetro de fase existe en el flujo de bits en la operación S1020, una banda de frecuencias de la señal mono en la que el parámetro de fase debe aplicarse puede determinarse en la operación S1030.
En la operación S1040, el parámetro de fase se puede decodificar. En la operación S1050, la señal mono puede mezclarse ascendentemente mediante la aplicación del parámetro de fase en la banda de frecuencia.
De acuerdo con una realización ejemplar, en la operación S1040, la información de banda de frecuencias correspondiente a la señal mono se puede seleccionar de una mesa, y la banda de frecuencias se puede determinar. La información de banda de frecuencias acerca de la banda de frecuencias se puede almacenar en la tabla.
Además, de acuerdo con una realización ejemplar, en la operación S1040, la información de banda de frecuencias sobre la banda de frecuencias se puede descodificar a partir del flujo de bits.
Además, de acuerdo con una realización ejemplar, en la operación S1040, la información de banda de frecuencias se puede descodificar de un encabezado o cada una de una pluralidad de tramas del flujo de bits.
De acuerdo con una realización ejemplar, la información de banda de frecuencias puede incluir un número de bandas de frecuencias en las que el parámetro de fase se va a aplicar, e incluir también información acerca de si actualizar el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar.
Cuando se determina que el parámetro de fase no existe en el flujo de bits en la operación S1020, la señal mono se puede mezclar ascendentemente utilizando solo otro parámetro estéreo.
Las Figuras 11 a 13 son diagramas de flujo que ilustran un procedimiento de codificar una señal multicanal de acuerdo con otra realización ejemplar.
La Figura 11 es un diagrama de flujo que ilustra un procedimiento de decodificación de un flujo de bits que se ilustra en las Figuras 3(a) y (b).
En la operación S1101, una señal mono se puede descodificar a partir de un flujo de bits en el que se codifica la señal multicanal. La señal mono puede ser una señal de mezcla descendente de la señal multicanal.
En la operación S1102, se puede determinar si existe información de encabezado en el flujo de bits.
Cuando se determina que existe la información de encabezado en el flujo de bits en la operación S1102, la decodificación puede llevarse a cabo en la operación S1108.
Cuando se determina que la información de encabezado no existe en el flujo de bits en la operación S1102, la información de encabezado se puede decodificar en la operación S1103 y la información acerca de si se aplica un parámetro de fase puede decodificarse en la operación S1104.
En la operación S1105, se puede determinar si se aplica el parámetro de fase basándose en la información decodificada.
Cuando se determina que el parámetro de fase no se aplica en la operación S1105, un número de bandas de frecuencias en las que el parámetro de fase se va a aplicar y el parámetro de fase se pueden inicializar en '0' en la operación S1107.
Cuando se determina que el parámetro de fase se aplica en la operación S1105, y el flujo de bits se configura como se ilustra en la Figura 3(a), el número de bandas de frecuencias en las que el parámetro de fase debe aplicarse puede ser extraerse en la operación S1106. Además, cuando se determina que el parámetro de fase se aplica en la operación S1105, y el flujo de bits se configura como se ilustra en la Figura 3(b), la información de banda de frecuencias correspondiente a la señal mono se puede seleccionar de una tabla, y una banda de frecuencias se puede determinar en la operación S1106. La información de banda de frecuencias acerca de la banda de frecuencias se puede almacenar en la tabla.
En la operación S1108, una CLD que indica que una diferencia de nivel de energía de los canales puede decodificarse. En la operación S1109, una ICC que indica una correlación de canales puede decodificarse.
En la operación S1111, se puede determinar si se aplica el parámetro de fase.
Cuando se determina que el parámetro de fase se aplica en la operación S1111, los parámetros de fase tanto como un número de bandas de frecuencias en las que debe aplicarse el parámetro de fase se pueden decodificar en la operación S1111. En la operación S1112, la señal mono decodificada puede mezclarse ascendentemente basándose en el parámetro de fase decodificado.
Cuando se determina que el parámetro de fase no se aplica en la operación S1111, la señal mono decodificada puede mezclarse ascendentemente en la operación S1112, sin decodificarse en la operación S1111.
La Figura 12 es un diagrama de flujo que ilustra un procedimiento de decodificación de un flujo de bits que se ilustra en la Figura 3(d).
En la operación S1210, una señal mono se puede descodificar a partir de un flujo de bits que se codifica la señal multicanal. La señal mono puede ser una señal de mezcla descendente de la señal multicanal.
En la operación S1220, se puede determinar si existe información de encabezado en el flujo de bits.
Cuando se determina que la información de encabezado no existe en el flujo de bits en la operación S1220, la decodificación puede llevarse a cabo en la operación S1250.
Cuando se determina que existe la información de encabezado en el flujo de bits en la operación S1220, la información de encabezado se puede decodificar en la operación S1230.
En la operación S1240, la información acerca de si se aplica un parámetro de fase puede decodificarse. En la operación S1250, una CLD puede decodificarse. En la operación S1260, una ICC puede decodificarse.
En la operación S1270, se puede determinar si se aplica el parámetro de fase.
Cuando se determina que el parámetro de fase se aplica en la operación S1270, un mismo número de parámetros de fase como una serie de bandas de frecuencias en las que el parámetro de fase debe aplicarse pueden decodificarse en la operación S1280. En la operación S1290, la señal mono decodificada puede mezclarse ascendentemente basándose en el parámetro de fase decodificado.
Cuando se determina que el parámetro de fase no se aplica en la operación S1270, la señal mono decodificada puede mezclarse ascendentemente en la operación S1290, sin decodificarse en la operación S1280.
La Figura 13 es un diagrama de flujo que ilustra un procedimiento de decodificación de un flujo de bits, que se ilustra en la Figura 3(c), que se asocia con la Figura 12.
Cuando se determina que el parámetro de fase se aplica en la operación S1270, la información acerca de si actualizar el número de bandas de frecuencias en las que el parámetro de fase debe aplicarse puede decodificarse en la operación S1271.
En la operación S1272, se puede determinar si el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar se actualiza.
Cuando se determina que el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar se actualiza en la operación S1272, el número de bandas de frecuencias en las que el parámetro de fase debe aplicarse puede extraerse en la operación S1273. En este caso, el parámetro de fase puede decodificarse utilizando el número extraído de bandas de frecuencias.
Cuando se determina que el número de bandas de frecuencias en las que el parámetro de fase se va a aplicar no se actualiza en la operación S1272, el parámetro de fase puede decodificarse utilizando un número de bandas de frecuencias en las que el parámetro de fase se va a aplicar en una trama anterior en la operación S1280, sin decodificarse en la operación S1273.
Las realizaciones ejemplares incluyen medios legibles por ordenador que incluyen instrucciones de programa para implementar diversas operaciones encarnadas por un ordenador. Los medios pueden incluir también, solo o en combinación con las instrucciones de los programas, archivos de datos, estructuras de datos, tablas, y similares. Las instrucciones de los medios y el programa pueden ser aquellos especialmente diseñados y construidos para los fines de las realizaciones ejemplares, o pueden ser del tipo conocido y disponible para los expertos en la materia de software informático. Los ejemplos de medios legibles por ordenador incluyen medios magnéticos tales como discos duros, disquetes, y cinta magnética; medios ópticos tales como discos CD ROM; medios magneto-ópticos tales como discos floptical; y dispositivos de hardware que están especialmente configurados para almacenar y ejecutar instrucciones de programa, tal como dispositivos de memoria de solo lectura (ROM) y memoria de acceso aleatorio (RAM). Ejemplos de instrucciones de programa incluyen tanto código máquina, tal como el producido por un compilador, como archivos que contienen código de nivel superior que puede ejecutarse por el ordenador usando un intérprete. Los dispositivos de hardware descritos pueden configurarse para actuar como uno o más módulos de software para realizar las operaciones de las realizaciones ejemplares descritas anteriormente, o viceversa.
A pesar de las pocas realizaciones ejemplares que se han mostrado y descrito, la presente descripción no se limita a las realizaciones ejemplares descritas. En su lugar, sería apreciado por los expertos en la materia que se pueden hacer cambios a estas realizaciones ejemplares sin apartarse de los principios de la descripción, cuyo ámbito se define por las reivindicaciones adjuntas.

Claims (6)

REIVINDICACIONES
1. Un aparato de decodificación (200), que comprende:
una unidad (210) de decodificación de señales mono dispuesta para descodificar una señal mono, que es una señal de mezcla descendente de una señal multicanal, a partir de un flujo de bits en el que se codifica la señal multicanal;
una unidad (220) de determinación de banda de frecuencias dispuesta para determinar si existe un parámetro de fase de una pluralidad de canales en el flujo de bits, en base a la información de codificación del flujo de bits, y cuando existe el parámetro de fase en el flujo de bits, determinar una banda de frecuencias de la señal mono en la que aplicar el parámetro de fase;
una unidad (230) de decodificación de parámetros dispuesta para descodificar el parámetro de fase del flujo de bits; y
una unidad (240) de mezcla ascendente dispuesta para mezclar ascendentemente la señal mono aplicando el parámetro de fase a la banda de frecuencias.
2. El aparato de decodificación de la reivindicación 1, en el que la unidad (220) de determinación de banda de frecuencias selecciona información de banda de frecuencias correspondiente a la señal mono de una tabla que almacena la información de banda de frecuencias, y determina la banda de frecuencias.
3. El aparato de decodificación de la reivindicación 1 o 2, en el que la unidad (220) de determinación de banda de frecuencias decodifica la información de banda de frecuencias de la banda de frecuencias del encabezado o de cada una de la pluralidad de tramas del flujo de bits, y determina la banda de frecuencias en base a la información de banda de frecuencias decodificada.
4. El aparato de decodificación de la reivindicación 1, 2 o 3, en el que la información de banda de frecuencias incluye una serie de bandas de frecuencias de la señal mono en las que aplicar el parámetro de fase o información acerca de si actualizar un número de bandas de frecuencias en las que aplicar el parámetro de fase.
5. Un procedimiento de descodificación, que comprende:
decodificar una señal mono, que es una señal de mezcla descendente de una señal multicanal, de un flujo de bits en el que se codifica la señal multicanal;
determinar si existe un parámetro de fase de una pluralidad de canales en el flujo de bits, en base a la información de codificación del flujo de bits;
determinar una banda de frecuencias de la señal mono en la que aplicar el parámetro de fase, cuando existe el parámetro de fase en el flujo de bits;
decodificar el parámetro de fase del flujo de bits; y
mezclar ascendentemente la señal mono aplicando el parámetro de fase a la banda de frecuencias.
6. Un medio de grabación legible por ordenador que almacena un programa para implementar el procedimiento de acuerdo con la reivindicación 5.
ES09823820T 2008-10-30 2009-10-28 Aparato y procedimiento de decodificación de una señal multicanal Active ES2754925T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020080107240A KR101600352B1 (ko) 2008-10-30 2008-10-30 멀티 채널 신호의 부호화/복호화 장치 및 방법
PCT/KR2009/006247 WO2010050740A2 (ko) 2008-10-30 2009-10-28 멀티 채널 신호의 부호화/복호화 장치 및 방법

Publications (1)

Publication Number Publication Date
ES2754925T3 true ES2754925T3 (es) 2020-04-21

Family

ID=42129457

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09823820T Active ES2754925T3 (es) 2008-10-30 2009-10-28 Aparato y procedimiento de decodificación de una señal multicanal

Country Status (8)

Country Link
US (3) US8959026B2 (es)
EP (1) EP2352152B1 (es)
KR (1) KR101600352B1 (es)
CN (1) CN102292772B (es)
ES (1) ES2754925T3 (es)
HU (1) HUE047440T2 (es)
PL (1) PL2352152T3 (es)
WO (1) WO2010050740A2 (es)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
CN102446507B (zh) * 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
RU2649944C2 (ru) * 2012-07-02 2018-04-05 Сони Корпорейшн Устройство декодирования, способ декодирования, устройство кодирования, способ кодирования и программа
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
US9437198B2 (en) 2012-07-02 2016-09-06 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
RU2652468C2 (ru) 2012-07-02 2018-04-26 Сони Корпорейшн Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа
CN106471575B (zh) 2014-07-01 2019-12-10 韩国电子通信研究院 多信道音频信号处理方法及装置
WO2016003206A1 (ko) * 2014-07-01 2016-01-07 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
JP6088626B1 (ja) 2015-11-20 2017-03-01 東芝テック株式会社 決済装置
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
CN108269577B (zh) * 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796844A (en) 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
EP1013140B1 (en) 1997-09-05 2012-12-05 Harman International Industries, Incorporated 5-2-5 matrix decoder system
US6108622A (en) * 1998-06-26 2000-08-22 Lsi Logic Corporation Arithmetic logic unit controller for linear PCM scaling and decimation in an audio decoder
EP1427252A1 (en) * 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
ATE390683T1 (de) 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
WO2007043843A1 (en) * 2005-10-13 2007-04-19 Lg Electronics Inc. Method and apparatus for processing a signal
KR100902899B1 (ko) * 2006-02-07 2009-06-15 엘지전자 주식회사 부호화/복호화 장치 및 방법
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
CN103137130B (zh) * 2006-12-27 2016-08-17 韩国电子通信研究院 用于创建空间线索信息的代码转换设备
EP2111617B1 (en) * 2007-02-14 2013-09-04 LG Electronics Inc. Audio decoding method and corresponding apparatus
KR101453732B1 (ko) * 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036062A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal

Also Published As

Publication number Publication date
EP2352152A4 (en) 2015-05-13
US9384743B2 (en) 2016-07-05
CN102292772B (zh) 2016-08-31
US8959026B2 (en) 2015-02-17
EP2352152A2 (en) 2011-08-03
KR101600352B1 (ko) 2016-03-07
US20120010891A1 (en) 2012-01-12
US8452018B2 (en) 2013-05-28
US20120294447A1 (en) 2012-11-22
EP2352152B1 (en) 2019-09-18
PL2352152T3 (pl) 2019-12-31
HUE047440T2 (hu) 2020-05-28
WO2010050740A3 (ko) 2010-06-24
WO2010050740A2 (ko) 2010-05-06
KR20100048202A (ko) 2010-05-11
CN102292772A (zh) 2011-12-21
US20150199972A1 (en) 2015-07-16

Similar Documents

Publication Publication Date Title
ES2754925T3 (es) Aparato y procedimiento de decodificación de una señal multicanal
ES2682073T3 (es) Codificación conjunta paramétrica de fuentes de audio
EP1784819B1 (en) Stereo compatible multi-channel audio coding
JP5453514B2 (ja) 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
ES2914474T3 (es) Método de decodificación de una señal de audio estéreo codificada usando una dirección de predicción variable
CN101044550B (zh) 产生编码多通道信号的设备和方法、对编码多通道信号进行解码的设备和方法
ES2387692T3 (es) Método y aparato para codificar señales de audio basadas en objetos
JP5123351B2 (ja) 信号分割情報のデコーディング方法
ES2313646T3 (es) Codificacion y descodificacion de audio.
ES2430414T3 (es) Cálculo de máscara de escalado selectivo basado en detección de pico
US8718284B2 (en) Method, medium, and system encoding/decoding multi-channel signal
US20120275609A1 (en) Multi-object audio encoding and decoding method and apparatus thereof
KR20080032146A (ko) 파라메트릭 멀티 채널 오디오 코딩과 매트릭스 서라운드멀티 채널 코딩 사이의 갭을 브릿징하는 개념
JP2011501544A (ja) ダウンミックスを用いたオーディオコーディング
CN102938253A (zh) 用于可伸缩声道解码的方法、介质和设备
JP4859925B2 (ja) オーディオ信号デコーディング方法及びその装置
JP4568363B2 (ja) オーディオ信号デコーディング方法及びその装置
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
KR101613979B1 (ko) 멀티 채널 신호의 복호화방법
KR101709690B1 (ko) 멀티 채널 신호의 복호화방법
HK1124682B (en) A method and apparatus for decoding an audio signal
HK1106606B (en) Stereo compatible multi-channel audio coding