ES2655046T3 - Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio - Google Patents

Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio Download PDF

Info

Publication number
ES2655046T3
ES2655046T3 ES14783660.5T ES14783660T ES2655046T3 ES 2655046 T3 ES2655046 T3 ES 2655046T3 ES 14783660 T ES14783660 T ES 14783660T ES 2655046 T3 ES2655046 T3 ES 2655046T3
Authority
ES
Spain
Prior art keywords
matrix
input
down mix
mix matrix
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14783660.5T
Other languages
English (en)
Inventor
Florin Ghido
Achim Kuntz
Bernhard Grill
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2655046T3 publication Critical patent/ES2655046T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un procedimiento para decodificar una matriz de mezcla descendente (306) para mapear una pluralidad de canales de entrada (300) de contenido de audio con una pluralidad de canales de salida (302), en el que los canales de entrada y salida (300, 302) están asociados a respectivos altavoces en posiciones predeterminadas con respecto a la posición de un oyente, en la que la matriz de mezcla descendente (306) es codificada mediante el aprovechamiento de la simetría de los pares de altavoces (S1-S9) de la pluralidad de canales de entrada (300) y la simetría de los pares de altavoces (S10-S11) de la pluralidad de canales de salida (302), comprendiendo el procedimiento: recibir información codificada que representa la matriz de mezcla descendente codificada (306) de un codificador y decodificar la información codificada para obtener la matriz de mezcla descendente decodificada (306), en el cual los respectivos pares (S1-S11) de canales de entrada y salida (300, 302) de la matriz de mezcla descendente (306) tienen asociadas respectivas ganancias de mezcla para adaptar un nivel en el cual un canal de entrada dado (300) contribuye a un canal de salida dado (302) y en el que el procedimiento comprende además: la decodificación de la información que representa los valores de significancia de la matriz de mezcla descendente codificada (306), en la que los respectivos valores de significancia son asignados a pares (S1-S11) de grupos simétricos de altavoces de los canales de entrada (300) y grupos de altavoces simétricos de los canales de salida (302), indicando el valor de significancia si una ganancia de mezcla para uno o más de los canales de entrada (300) es cero o no y la decodificación a partir de la información que representa la matriz de mezcla descendente (306) las ganancias de mezcla codificadas.

Description

imagen1
imagen2
imagen3
imagen4
imagen5
imagen6
imagen7
imagen8
imagen9
imagen10
imagen11
[0055] Ahora se puede codificar esta lista, por ejemplo, utilizando también la codificación limitada de Golomb-Rice. En comparación con la realización descrita con respecto a la Fig. 6, se puede ver que se puede codificar esta 5 lista de manera aun más eficaz. En el mejor de los casos, cuando la matriz compacta es idéntica a la matriz plantilla, la totalidad del vector consiste sólo en ceros y sólo se debe codificar un número de longitudes de ejecución.
[0056] En lo que respecta al uso de una matriz plantilla, como se describiera con respecto a la Fig. 7, cabe señalar que tanto el codificador como el decodificador tienen que tener una serie predeterminada de dichas plantillas
10 compactas, lo que se determina de forma individual mediante una serie de altavoces de entrada y salida, a diferencia de una configuración de entrada o salida que está determinada por la lista de altavoces. Esto significa que el orden de los altavoces de entrada y salida no es relevante para determinar la matriz plantilla, sino que puede ser permutado antes de usarse para equipararse al orden de una matriz compacta dada.
15 [0057] En lo sucesivo, como ya se ha mencionado anteriormente, se pasa a describir realizaciones con respecto a la codificación de las ganancias de mezcla proporcionadas en la matriz de mezcla descendente original que ya no están presentes en la matriz de mezcla compacta y que también deben ser codificadas y transmitidas.
[0058] La Fig. 8 describe una realización para codificar las ganancias de mezcla. Esta realización hace uso
20 de las propiedades de las sub-matrices que corresponden a dichas una o más entradas no cero de la matriz de mezcla descendente original, de acuerdo con diferentes combinaciones de grupos de altavoces de entrada y salida, es decir los grupos S (simétricos, L y R), C (central) y A (asimétricos). La Fig. 8 describe sub-matrices posibles que se pueden derivar de la matriz de mezcla descendente mostrada en la Fig. 4, de acuerdo con diferentes combinaciones de altavoces de entrada y salida, a saber, los altavoces simétricos L y R, los canales centrales C y
25 los altavoces asimétricos A. En la Fig. 8, las letras a, b, c y d representan valores de ganancia arbitrarios.
[0059] La Fig. 8A ilustra cuatro sub-matrices posibles que se pueden derivar de la matriz de la Fig. 4. La primera es la sub-matriz que define el mapeo de dos canales centrales, por ejemplo los altavoces C en la configuración de entrada 300 y el altavoz C en la configuración de salida 302, y el valor de ganancia “a” es el valor 30 de ganancia indicado en el elemento de la matriz [1,1] (elemento de superior izquierdo de la Fig. 4). La segunda submatriz de la Fig. 8A representa, por ejemplo, el mapeo de dos canales de entrada simétricos, por ejemplo los canales de entrada Lc y Rc, con un altavoz central, tal como el altavoz C, en la configuración de los canales de salida. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [1,2] y [1,3]. La tercera sub-matriz de la Fig. 8A se refiere al mapeo de un altavoz central C, tal como el altavoz Cvr de la 35 configuración de entrada 300 de la Fig. 4, con dos canales simétricos tales como los canales Ls y Rs, de la configuración de salida 302. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [4,21] y [5,21]. La cuarta sub-matriz de la Fig. 8A representa un caso en que se mapean dos canales simétricos, por ejemplo los canales L, R de la configuración de entrada 300 se mapean con los canales L, R de la configuración de salida 302. Los valores de ganancia “a” a “d” son los valores de ganancia indicados en los
40 elementos de matriz [2,4], [2,5], [3,4] y [3,5].
[0060] La Fig. 8B ilustra las sub-matrices cuando se mapean altavoces asimétricos. La primera representación es una sub-matriz que se obtiene al mapear dos altavoces asimétricos (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4). La segunda sub-matriz de la Fig. 8B se refiere al mapeo de dos
45 canales de entrada simétricos con un canal de salida asimétrico que, en la realización de la Fig. 4 es, por ejemplo, el mapeo de los dos canales de entrada simétricos LFE y LFE2 con el canal de salida LFE. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [6,11] y [6,12]. La terceras sub-matrices de la Fig. 8B representa el caso en que se corresponde un altavoz asimétrico de entrada con un par de altavoces de salida simétrico. En el caso del ejemplo no hay ningún altavoz de entrada asimétrico.
50 [0061] La Fig. 8C ilustra dos sub-matrices para el mapeo de los canales centrales con altavoces asimétricos. La primera sub-matriz mapea un altavoz central de entrada a un altavoz asimétrico de salida (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4), y la segunda sub-matriz mapea un altavoz de entrada asimétrico con un altavoz central de salida.
55 [0062] De acuerdo con esta realización, por cada grupo de altavoces de salida, se verifica si la columna
12
imagen12
detenerse aquí si el nivel de precisión es 0,5 dB; -sumar el resto de los enteros múltiplos de 0,25 dB, descendiendo de 0 dB a minGain y sumar el resto de los enteros múltiplos de 0,25 dB, ascendiendo de 0,25 dB a maxGain.
5 [0067] Por ejemplo, cuando maxGain es 2 dB y minGain es -6 dB y la precisión es 0,5 dB, se genera la siguiente lista:
0, -3, -6, -1, -2, -4, -5, 1, 2, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5, 0,5, 1,5.
10 [0068] En lo que respecta a la realización anterior, cabe señalar que la invención no se limita a los valores anteriormente indicados; por el contrario, en lugar de utilizar enteros múltiplos de 3dB y a partir de 0dB, se pueden seleccionar otros valores y también se pueden seleccionar otros valores del nivel de precisión, dependiendo de las circunstancias.
15 [0069] En general, la lista de valores de ganancia se puede generar de la siguiente manera:
-sumar enteros múltiplos de un primer valor de ganancia, entre la ganancia mínima, inclusive, y un valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer valor de ganancia, entre el valor de ganancia inicial, inclusive, y la
20 ganancia máxima, inclusive, en orden creciente; -sumar el resto de los enteros múltiplos de un primer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
25 -detenerse aquí si el nivel de precisión es el primer nivel de precisión; -sumar el resto de los enteros múltiplos de un segundo nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del segundo nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
30 -detenerse aquí si el nivel de precisión es el segundo nivel de precisión; -sumar el resto de los enteros múltiplos de un tercer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente y -sumar el resto de los enteros múltiplos del tercer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente.
35 [0070] En la realización anterior, cuando el valor de ganancia inicial es cero, las partes que suman los valores restantes en orden creciente y que satisfacen la condición de multiplicidad asociada suman inicialmente el primer valor de ganancia o el primero, segundo o tercer nivel de precisión. Sin embargo, en la generalidad de los casos, las partes que suman los valores restantes en orden creciente suman inicialmente el menor valor, satisfaciendo la
40 condición de multiplicidad asociada, en el intervalo entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive. De manera correspondiente, las partes que suman los valores restantes en orden decreciente suman inicialmente el valor más grande, satisfaciendo la condición de multiplicidad asociada, en el intervalo entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive.
45 [0071] Considerando un ejemplo similar al anterior pero con un valor de ganancia inicial = 1dB (un primer valor de ganancia = 3dB, maxGain = 2dB, minGain = -6dB y un nivel de precisión = 0,5dB) da lo siguiente:
Descendente: 0, -3, -6 Ascendente: [vacío]
50 Descendente: 1, -2, -4, -5 Ascendente: 2 Descendente: 0,5, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5 Ascendente: 1,5
55 [0072] Para codificar un valor de ganancia, preferentemente se busca la ganancia en la tabla y se emite su posición dentro de la tabla. Siempre se encuentra la ganancia deseada, puesto que todas las ganancias son previamente cuantificadas al número entero más cercano múltiplo de la precisión estipulada de, por ejemplo, 1dB, 0,5dB o 0,25dB. De acuerdo con una realización preferida, las posiciones de los valores de ganancia tienen un índice asociado que indica la posición en la tabla y los índices de las ganancias pueden ser codificados, por ejemplo,
14
imagen13
matriz de mezcla descendente está indicado en el flujo de bits como un valor de ganancia máxima maxGain y un valor de ganancia mínima minGain; por lo tanto no se desperdician bits en valores que no se utilizan en realidad y a la vez no se limita la flexibilidad.
5 [0077] Suponiendo que se dispone de una lista de canales de entrada y también de una lista de canales de salida que aportan información geométrica sobre cada altavoz, como por ejemplo los ángulos azimutal y de elevación y, opcionalmente, el nombre convencional del altavoz, por ejemplo de acuerdo con las referencias de la técnica anterior [6] o [7], un algoritmo para codificar una matriz de mezcla descendente, de acuerdo con las realizaciones puede ser el mostrado a continuación en la tabla 1:
10 Tabla 1 -Sintaxis de DownmixMatrix
Sintaxis
No. de bits Mnemónico
DownmixMatrix(inputConfig, inputCount, outputConfig, outputCount) {
equalizerPresent; if (equalizerPresent) { EqualizerConfig(inputConfig, inputCount); }
1 uimsbf
precisionLevel; maxGain = escapedValue(3, 4, 0); minGain = escapedValue(4, 5, 0) + 1; ConvertToCompactConfig(inputConfig, inputCount); ConvertToCompactConfig(outputConfig, outputCount);
2 uimsbf
isAllSeparable; if (!isAllSeparable) { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) {
1 uimsbf
isSeparable[i]; } } } else { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) { isSeparable[i] = 1; } } }
1 uimsbf
isAllSymmetric; if (!isAllSymmetric) { for (i = 0; i < compactOutputCount; i++) {
1 uimsbf
isSymmetric[i]; } } else { for (i = 0; i < compactOutputCount; i++) { isSymmetric[i] = 1; }
1 uimsbf
mixLFEOnlyToLFE;
1 uimsbf
rawCodingCompactMatrix; if (rawCodingCompactMatrix) { for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (!mixLFEOnlyToLFE || (compactInputConfig[i].isLFE == compactOutputConfig[j].isLFE)) {
1 uimsbf
compactDownmixMatrix[i][j];
1 uimsbf
16
} else { compactDownmixMatrix[i][j] = 0; } } } } else { if (mixLFEOnlyToLFE) { compactInputLFECount = 0; compactOutputLFECount = 0; for (i = 0; i < compactInputCount; i++) { if (compactInputConfig[i].isLFE) compactInputLFECount++; } for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].isLFE) compactOutputLFECount++; } totalCount = (compactInputCount -compactInputLFECount) * (compactOutputCount -compactOutputLFECount); } else { totalCount = compactInputCount * compactOutputCount; } useCompactTemplate; n = 3; if (totalCount >= 256) n = 4; runLGRParam; count = 0; flatCompactMatrix[totalCount + 1]; while (count < totalCount) { zeroRunLength; /* limited Golomb-Rice using runLGRparam */ flatCompactMatrix[count .. count + zeroRunLength] = {0, ..., 0, 1}; count += zeroRunLength + 1; } count = 0; for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (mixLFEOnlyToLFE && compactInputConfig[i].isLFE && compactOutputConfig[j].isLFE) { compactDownmixMatrix[i][j]; } else if (mixLFEOnlyToLFE && (compactInputConfig[i].isLFE ^ compactOutputConfig[j].isLFE)) { compactDownmixMatrix[i][j] = 0; } else { compactDownmixMatrix[i][j] = flatCompactMatrix[count++]; } } } if (useCompactTemplate) { compactTemplate = FindCompactTemplate(inputConfig, inputCount, outputConfig, outputCount); for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { compactDownmixMatrix[i][j] ^= compactTemplate[i][j]; } } } } fullForAsymmetricInputs;
1 n varía 1 1 1 uimsbf uimsbf bslbf uimsbf uimsbf uimsbf
17
rawCodingNonzeros; if (!rawCodingNonzeros) { gainLGRParam; generateGainTable(maxGain, minGain, precisionLevel); } for (i = 0; i < compactInputCount; i++) { iType = compactInputConfig[i].pairType; for (j = 0; j < compactOutputCount; j++) { oType = compactOutputConfig[j].pairType; i1 = compactInputConfig[i].originalPosition; o1 = compactOutputConfig[j].originalPosition; if ((iType != SYMMETRIC) && (oType != SYMMETRIC)) { downmixMatrix[i1][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); } else if (iType != SYMMETRIC) { o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); useFull = (iType == ASYMMETRIC) && fullForAsymmetricInputs; if (isSymmetric[j] && !useFull) { downmixMatrix[i1][o2] = downmixMatrix[i1][o1]; } else { downmixMatrix[i1][o2] = DecodeGainValue(); } } else if (oType != SYMMETRIC) { i2 = compactInputConfig[i].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i2][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSymmetric[j]) { downmixMatrix[i2][o1] = downmixMatrix[i1][o1]; } else { downmixMatrix[i2][o1] = DecodeGainValue(); } } else { i2 = compactInputConfig[i].SymmetricPair.originalPosition; o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; downmixMatrix[i2][o1] = 0.0; downmixMatrix[i2][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSeparable[j] && isSymmetric[j]) { downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (!isSeparable[j] && isSymmetric[j]) { downmixMatrix[i1][o2] = DecodeGainValue(); downmixMatrix[i2][o1] = downmixMatrix[i1][o2]; downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (isSeparable[j] && !isSymmetric[j]) {
3 uimsbf
18
imagen14
}
eqExtendedRange; for (i = 0; i < numEqualizers; i++) { numSections = escapedValue(2, 4, 0) + 1; lastCenterFreqP10 = 0; lastCenterFreqLd2 = 10; maxCenterFreqLd2 = 99; for (j = 0; j < numSections; j++) { centerFreqP10 = lastCenterFreqP10 + ReadRange(4 -lastCenterFreqP10); if (centerFreqP10 > lastCenterFreqP10) lastCenterFreqLd2 = 10; if (centerFreqP10 == 3) maxCenterFreqLd2 = 24; centerFreqLd2 = lastCenterFreqLd2 + ReadRange(1 + maxCenterFreqLd2 -lastCenterFreqLd2); qFactorIndex; if (qFactorIndex > 19) { qFactorExtra; } cgBits = 4 + eqExtendedRange + eqPrecisionLevel; centerGainIndex; } sgBits = 4 + eqExtendedRange + min(eqPrecisionLevel + 1, 3); scalingGainIndex; } for (i = 0; i < inputCount; i++) { hasEqualizer[i]; if (hasEqualizer[i]) { equalizerIndex[i] = ReadRange(numEqualizers); } } 1 5 3 cgBits sgBits 1 uimsbf uimsbf uimsbf uimsbf uimsbf uimsbf
[0081] Los elementos de la matriz de mezcla descendente, de acuerdo con las realizaciones, pueden ser como se muestran en la siguiente tabla 5:
Tabla 5 -Elementos de DownmixMatrix
Campo
Descripción / Valores
paramConfig,
Vectores de configuración de canales que especifican la información acerca de
inputConfig,
cada altavoz. Cada entrada, paramConfig[i], es una estructura que consta de las
outputConfig
siguientes partes: -AzimuthAngle, el valor absoluto del ángulo azimutal del altavoz; -AzimuthDirection, la dirección azimutal, 0 (izquierda) o 1 (derecha); -ElevationAngle, el valor absoluto del ángulo de elevación del altavoz; -ElevationDirection, la dirección de elevación, 0 (ascendente) o 1 (descendente); -alreadyUsed, indica si el altavoz ya es parte de un grupo; -isLFE, indica si el altavoz es un altavoz LFE.
paramCount, inputCount, outputCount
Número de altavoces en los correspondientes vectores de configuración de canales
compactParamConfig,
Vectores de configuración de canales compactos que especifican la información
compactInputConfig,
acerca de cada grupo de altavoces. Cada entrada, compactParamConfig[i], es una
compactOutputConfig
estructura que consta de las siguientes partes: -pairType, tipo de grupo de altavoces, que puede ser SIMÉTRICO (un par simétrico de dos altavoces), CENTRAL o ASIMÉTRICO; -isLFE, indica si el grupo de altavoces consisten altavoces LFE; -originalPosition, posición en la configuración de canales original del primer altavoz, o único altavoz, del grupo; -symmetricPair.originalPosition, posición en la configuración de canales original
20
del segundo altavoz del grupo, sólo para grupos SIMÉTRICOS.
compactParamCount, compactInputCount, compactOutputCount
Número de grupos de altavoces en los correspondientes vectores de configuración compacta de canales
equalizerPresent
Booleano que indica si está presente la información de ecualizador que se ha de aplicar a los canales de entrada
precisionLevel
Precisión usada para la cuantificación uniforme de las ganancias: 0 = 1 dB, 1 = 0,5 dB, 2 = 0,25 dB, 3 reservado
maxGain
Máxima ganancia real en la matriz, expresada en dB: Valores posibles de 0 a 22, en lineal 1 .. 12.589
minGain
Mínima ganancia real en la matriz, expresada en dB: Valores posibles de -1 a -47, en lineal 0,891 .. 0,004
isAllSeparable
Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de separabilidad
isSeparable[i]
Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de separabilidad
isAllSymmetric
Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de simetría
isSymmetric[i]
Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de simetría
mixLFEOnlyToLFE
Booleano que indica si los altavoces LFE se mezclan sólo con altavoces LFE y, al mismo tiempo, si los altavoces no LFE se mezclan sólo con altavoces no LFE
rawCodingCompactMatrix
Booleano que indica si compactDownmixMatrix es codificado raw (del inglés, crudo) (utilizando un bit por entrada) o se codifica utilizando la codificación de longitud de ejecución seguida por Golomb-Rice limitada
compactDownmixMatrix[i][j]
Una entrada en compactDownmixMatrix que corresponde al grupo de altavoces de entrada i y al grupo de altavoces de salida j, que indica si alguna de las ganancias asociadas es no cero: 0 = todas las ganancias son cero, 1 = al menos una ganancia es no cero
useCompactTemplate
Booleano que indica si se ha de aplicar una XOR por elemento a compactDownmixMatrix con una matriz plantilla compacta predefinida, para mejorar la eficacia de la codificación por longitud de ejecución
runLGRParam
Parámetro de Golomb-Rice Limitada utilizado para codificar las longitudes de ejecución cero en la flatCompactMatrix linealizada
flatCompactMatrix
Versión linealizada de compactDownmixMatrix con la matriz plantilla compacta predefinida ya aplicada; Cuando mixLFEOnlyToLFE está habilitado, esto no incluye las entradas de cero conocidas (debido a la mezcla entre no LFE y LFE) o las utilizadas para la mezcla de LFE con LFE
compactTemplate
Matriz plantilla compacta predefinida, que contiene entradas “típicas” que es sometida a XOR por elementos a compactDownmixMatrix, para mejorar la eficacia de codificación mediante la creación de entradas de valores principalmente de cero
zeroRunLength
La longitud de una ejecución cero siempre seguida por un uno, en la flatCompactMatrix, que es codificada con codificación limitada de Golomb–Rice, usando el parámetro runLGRParam
fullForAsymmetricInputs
Booleano que indica si se debe ignorar la propiedad de simetría por cada grupo asimétrico de altavoces de entrada; En caso de habilitarse, cada grupo asimétrico de altavoces de entrada tendrá dos valores de ganancia decodificados por cada grupo simétrico de altavoces de salida con el índice i, independientemente de isSymmetric[i]
gainTable
Tabla de ganancias dinámicamente generada que contiene la lista de todas las ganancias posibles entre minGain y maxGain con la precisión precisionLevel
rawCodingNonzeros
Booleano que indica si los valores de ganancia no cero se codifican raw (codificación uniforme, utilizando la función ReadRange) o sus índices en la lista gainTable se codifican utilizando codificación limitada de Golomb–Rice
gainLGRParam
Parámetro de Golomb–Rice Limitado utilizado para codificar los índices de ganancia no cero, calculado mediante la búsqueda de cada ganancia de la lista gainTable
21
imagen15
imagen16
imagen17
imagen18
imagen19

Claims (1)

  1. imagen1
    imagen2
    imagen3
    imagen4
    imagen5
ES14783660.5T 2013-10-22 2014-10-13 Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio Active ES2655046T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20130189770 EP2866227A1 (en) 2013-10-22 2013-10-22 Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
EP13189770 2013-10-22
PCT/EP2014/071929 WO2015058991A1 (en) 2013-10-22 2014-10-13 Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Publications (1)

Publication Number Publication Date
ES2655046T3 true ES2655046T3 (es) 2018-02-16

Family

ID=49474267

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14783660.5T Active ES2655046T3 (es) 2013-10-22 2014-10-13 Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio

Country Status (19)

Country Link
US (6) US9947326B2 (es)
EP (2) EP2866227A1 (es)
JP (1) JP6313439B2 (es)
KR (1) KR101798348B1 (es)
CN (2) CN105723453B (es)
AR (1) AR098152A1 (es)
AU (1) AU2014339167B2 (es)
BR (1) BR112016008787B1 (es)
CA (1) CA2926986C (es)
ES (1) ES2655046T3 (es)
MX (1) MX353997B (es)
MY (1) MY176779A (es)
PL (1) PL3061087T3 (es)
PT (1) PT3061087T (es)
RU (1) RU2648588C2 (es)
SG (1) SG11201603089VA (es)
TW (1) TWI571866B (es)
WO (1) WO2015058991A1 (es)
ZA (1) ZA201603298B (es)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102627374B1 (ko) * 2015-06-17 2024-01-19 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
EP3312837A4 (en) * 2015-06-17 2018-05-09 Samsung Electronics Co., Ltd. Method and device for processing internal channels for low complexity format conversion
KR102856247B1 (ko) * 2015-06-17 2025-09-04 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
JP6921832B2 (ja) * 2016-02-03 2021-08-18 ドルビー・インターナショナル・アーベー オーディオ符号化における効率的なフォーマット変換
KR102358283B1 (ko) 2016-05-06 2022-02-04 디티에스, 인코포레이티드 몰입형 오디오 재생 시스템
CN109716794B (zh) * 2016-09-20 2021-07-13 索尼公司 信息处理装置、信息处理方法及计算机可读存储介质
US10075789B2 (en) * 2016-10-11 2018-09-11 Dts, Inc. Gain phase equalization (GPEQ) filter and tuning methods for asymmetric transaural audio reproduction
US10659906B2 (en) * 2017-01-13 2020-05-19 Qualcomm Incorporated Audio parallax for virtual reality, augmented reality, and mixed reality
US10979844B2 (en) * 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
JP7224302B2 (ja) * 2017-05-09 2023-02-17 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャネル空間的オーディオ・フォーマット入力信号の処理
WO2019004524A1 (ko) * 2017-06-27 2019-01-03 엘지전자 주식회사 6자유도 환경에서 오디오 재생 방법 및 오디오 재생 장치
JP7222668B2 (ja) * 2017-11-17 2023-02-15 日本放送協会 音響処理装置及びプログラム
JP7596146B2 (ja) 2017-12-19 2024-12-09 ドルビー・インターナショナル・アーベー 音声音響統合復号および符号化の改良のための方法、機器、およびシステム
GB2571572A (en) * 2018-03-02 2019-09-04 Nokia Technologies Oy Audio processing
CN111955020B (zh) * 2018-04-11 2022-08-23 杜比国际公司 用于音频渲染的预渲染信号的方法、设备和系统
WO2020089302A1 (en) 2018-11-02 2020-05-07 Dolby International Ab An audio encoder and an audio decoder
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
CA3193359A1 (en) * 2019-06-14 2020-12-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Parameter encoding and decoding
EP4014506B1 (en) 2019-08-15 2023-01-11 Dolby International AB Methods and devices for generation and processing of modified audio bitstreams
US12205607B2 (en) 2019-08-15 2025-01-21 Dolby Laboratories Licensing Corporation Methods and devices for generation and processing of modified bitstreams
US12165657B2 (en) 2019-08-30 2024-12-10 Dolby Laboratories Licensing Corporation Channel identification of multi-channel audio signals
EP3809709A1 (en) * 2019-10-14 2021-04-21 Koninklijke Philips N.V. Apparatus and method for audio encoding
BR112022010737A2 (pt) 2019-12-02 2022-08-23 Dolby Laboratories Licensing Corp Sistemas, métodos e aparelho para conversão de áudio com base em canal para áudio com base em objeto
GB2593672A (en) * 2020-03-23 2021-10-06 Nokia Technologies Oy Switching between audio instances
EP4154249B1 (en) 2020-05-20 2024-01-24 Dolby International AB Methods and apparatus for unified speech and audio decoding improvements
BR112022025161A2 (pt) 2020-06-11 2022-12-27 Dolby Laboratories Licensing Corp Codificação de sinais de áudio de multicanal compreendendo a mixagem de rebaixamento de um canal de entrada primário e de dois ou mais canais de entrada não primária
CN115843378A (zh) 2020-07-07 2023-03-24 弗劳恩霍夫应用研究促进协会 使用针对多声道音频信号的声道的缩放参数的联合编码的音频解码器、音频编码器以及相关方法
DE112021004444T5 (de) * 2020-08-27 2023-06-22 Apple Inc. Stereobasierte immersive codierung (stic)
CN114334040B (zh) * 2021-11-26 2025-05-30 腾讯科技(深圳)有限公司 分子图重构模型的训练方法、装置以及电子设备
CN119179461B (zh) * 2024-11-19 2025-04-01 杭州海康威视数字技术股份有限公司 拼接屏音频输出的管理方法、装置、系统、设备及介质

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6108633A (en) * 1996-05-03 2000-08-22 Lsi Logic Corporation Audio decoder core constants ROM optimization
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
US20040062401A1 (en) * 2002-02-07 2004-04-01 Davis Mark Franklin Audio channel translation
CA2992051C (en) * 2004-03-01 2019-01-22 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
US6522270B1 (en) * 2001-12-26 2003-02-18 Sun Microsystems, Inc. Method of coding frequently occurring values
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
WO2005098821A2 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
TWI393121B (zh) * 2004-08-25 2013-04-11 杜比實驗室特許公司 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
DE602006015294D1 (de) * 2005-03-30 2010-08-19 Dolby Int Ab Mehrkanal-audiocodierung
DE602006004959D1 (de) * 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
JP4988717B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
CA2610430C (en) * 2005-06-03 2016-02-23 Dolby Laboratories Licensing Corporation Channel reconfiguration with side information
US8032240B2 (en) * 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of processing an audio signal
US8160888B2 (en) * 2005-07-19 2012-04-17 Koninklijke Philips Electronics N.V Generation of multi-channel audio signals
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
TWI469133B (zh) * 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
KR101294022B1 (ko) * 2006-02-03 2013-08-08 한국전자통신연구원 공간큐를 이용한 다객체 또는 다채널 오디오 신호의 랜더링제어 방법 및 그 장치
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
CN101506875B (zh) * 2006-07-07 2012-12-19 弗劳恩霍夫应用研究促进协会 用于组合多个参数编码的音频源的设备和方法
EP2082397B1 (en) * 2006-10-16 2011-12-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
AU2007312598B2 (en) * 2006-10-16 2011-01-20 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
EP2102856A4 (en) * 2006-12-07 2010-01-13 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL
CA2645915C (en) * 2007-02-14 2012-10-23 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
WO2008120933A1 (en) * 2007-03-30 2008-10-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
CA2684975C (en) * 2007-04-26 2016-08-02 Dolby Sweden Ab Apparatus and method for synthesizing an output signal
WO2009039897A1 (en) * 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
JP5391203B2 (ja) * 2007-10-09 2014-01-15 コーニンクレッカ フィリップス エヌ ヴェ バイノーラル音声信号を生成するための方法と装置
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
JP5883561B2 (ja) * 2007-10-17 2016-03-15 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ アップミックスを使用した音声符号器
JP5243554B2 (ja) * 2008-01-01 2013-07-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US7733245B2 (en) * 2008-06-25 2010-06-08 Aclara Power-Line Systems Inc. Compression scheme for interval data
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
JP5520300B2 (ja) * 2008-09-11 2014-06-11 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マイクロホン信号に基づいて一組の空間手がかりを供給する装置、方法およびコンピュータ・プログラムと2チャンネルのオーディオ信号および一組の空間手がかりを供給する装置
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
BR122019023947B1 (pt) * 2009-03-17 2021-04-06 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
MX2011013829A (es) * 2009-06-24 2012-03-07 Fraunhofer Ges Forschung Decodificador de señales de audio, metodo para decodificar una señal de audio y programa de computacion que utiliza etapas en cascada de procesamiento de objetos de audio.
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
TWI557723B (zh) * 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
CN103649706B (zh) * 2011-03-16 2015-11-25 Dts(英属维尔京群岛)有限公司 三维音频音轨的编码及再现
WO2012177067A2 (ko) 2011-06-21 2012-12-27 삼성전자 주식회사 오디오 신호 처리방법 및 장치와 이를 채용하는 단말기
EP2560161A1 (en) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
KR20130093798A (ko) * 2012-01-02 2013-08-23 한국전자통신연구원 다채널 신호 부호화 및 복호화 장치 및 방법
EP2862370B1 (en) * 2012-06-19 2017-08-30 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
EP2956935B1 (en) * 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
EP2976768A4 (en) * 2013-03-20 2016-11-09 Nokia Technologies Oy AUDIO SIGNAL ENCODER COMPRISING A MULTI-CHANNEL PARAMETER SELECTOR
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Also Published As

Publication number Publication date
ZA201603298B (en) 2019-09-25
EP3061087A1 (en) 2016-08-31
CN105723453B (zh) 2019-11-08
JP6313439B2 (ja) 2018-04-25
US9947326B2 (en) 2018-04-17
TWI571866B (zh) 2017-02-21
CN110675882A (zh) 2020-01-10
AU2014339167B2 (en) 2017-01-05
BR112016008787A2 (es) 2017-08-01
US11393481B2 (en) 2022-07-19
AR098152A1 (es) 2016-05-04
PL3061087T3 (pl) 2018-05-30
EP3061087B1 (en) 2017-11-22
KR20160073412A (ko) 2016-06-24
MY176779A (en) 2020-08-21
AU2014339167A1 (en) 2016-05-26
WO2015058991A1 (en) 2015-04-30
SG11201603089VA (en) 2016-05-30
CA2926986A1 (en) 2015-04-30
CA2926986C (en) 2018-06-12
JP2016538585A (ja) 2016-12-08
US12412586B2 (en) 2025-09-09
RU2648588C2 (ru) 2018-03-26
KR101798348B1 (ko) 2017-11-15
US20180197553A1 (en) 2018-07-12
US20200090666A1 (en) 2020-03-19
US11922957B2 (en) 2024-03-05
BR112016008787B1 (pt) 2022-07-12
MX353997B (es) 2018-02-07
US20240304193A1 (en) 2024-09-12
US10468038B2 (en) 2019-11-05
US20160232901A1 (en) 2016-08-11
TW201521013A (zh) 2015-06-01
RU2016119546A (ru) 2017-11-28
US20260038512A1 (en) 2026-02-05
CN105723453A (zh) 2016-06-29
US20230005489A1 (en) 2023-01-05
CN110675882B (zh) 2023-07-21
PT3061087T (pt) 2018-03-01
EP2866227A1 (en) 2015-04-29
MX2016004924A (es) 2016-07-11

Similar Documents

Publication Publication Date Title
ES2655046T3 (es) Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio
ES2687044T3 (es) Control de rango dinámico controlado por metadatos
BR112015029132A2 (pt) codificação de cenas de áudio
ES2667871T3 (es) Decodificador de audio con sonoridad y metadatos de límite de programa
ES2916254T3 (es) Sonoridad de programa basada en la presentación, independiente de la transmisión
RU2711055C2 (ru) Устройство и способ для кодирования или декодирования многоканального сигнала
ES2965423T3 (es) Codificador de audio
ES2641390T3 (es) Codificación y decodificación eficientes de una señal de audio multicanal con múltiples flujos secundarios
NO20180990A1 (no) Kompatibel flerkanal-koding/dekoding.
ES2945723T3 (es) Método de codificación y decodificación y aparato de codificación y decodificación para señales estéreo
AR097012A1 (es) Decodificador de audio, codificador de audio, método para proporcionar al menos cuatro señales de canales de audio sobre la base de una representación codificada, método para proporcionar una representación codificada sobre la base de al menos cuatro señales de canales de audio y programa de computadora usando extensión de ancho de banda
MY199026A (en) Decoding video data using a two-level multi-type-tree framework
BR112017016341A2 (pt) codificação em modo paleta para codificação de vídeo
SI2834978T1 (en) Code encoding a coded block
MX2013014931A (es) Elementos de sintaxis de señalizacion para coeficientes de transformada para subconjuntos de una unidad de codificacion de nivel de hoja.
BR112016005192B1 (pt) método em um codificador de áudio para a quantização de parâmetros relativos à codificação paramétrica espacial de sinais de áudio, meio legível por computador não transitório, codificador de áudio, método em um decodificador de áudio para a desquantização de parâmetros quantizados relativos à codificação paramétrica espacial de sinais de áudio, decodificador de áudio e sistema de codificação/decodificação
MX364405B (es) Mezcla parametrica de senales de audio.
AR113482A1 (es) Codificadores de audio, decodificadores de audio, métodos y programas de computadora que adaptan una codificación y decodificación de bits menos significativos
ES3050734T3 (en) Apparatuses for encoding and decoding a sequence of integer values, methods for encoding and decoding a sequence of integer values and computer program for implementing these methods
BRPI0612179A2 (pt) codificação por entropia com livros-código compactos
ES3059272T3 (en) Spatial coding of higher order ambisonics for a low latency immersive audio codec
BR112022012096A2 (pt) Métodos para decodificar e codificar pelo menos uma imagem parada atual, decodificador para decodificar imagens paradas, e, codificador para codificar imagens paradas
ES2946235T3 (es) Codificador de señal de audio estéreo
EP4500480A4 (en) OPTIMIZED MIXED REALITY AUDIO RENDERING
ES2867477T3 (es) Decodificación de secuencias de bits de audio con metadatos de replicación de banda espectral mejorada en al menos un elemento de relleno