ES2655046T3 - Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio - Google Patents
Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio Download PDFInfo
- Publication number
- ES2655046T3 ES2655046T3 ES14783660.5T ES14783660T ES2655046T3 ES 2655046 T3 ES2655046 T3 ES 2655046T3 ES 14783660 T ES14783660 T ES 14783660T ES 2655046 T3 ES2655046 T3 ES 2655046T3
- Authority
- ES
- Spain
- Prior art keywords
- matrix
- input
- down mix
- mix matrix
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un procedimiento para decodificar una matriz de mezcla descendente (306) para mapear una pluralidad de canales de entrada (300) de contenido de audio con una pluralidad de canales de salida (302), en el que los canales de entrada y salida (300, 302) están asociados a respectivos altavoces en posiciones predeterminadas con respecto a la posición de un oyente, en la que la matriz de mezcla descendente (306) es codificada mediante el aprovechamiento de la simetría de los pares de altavoces (S1-S9) de la pluralidad de canales de entrada (300) y la simetría de los pares de altavoces (S10-S11) de la pluralidad de canales de salida (302), comprendiendo el procedimiento: recibir información codificada que representa la matriz de mezcla descendente codificada (306) de un codificador y decodificar la información codificada para obtener la matriz de mezcla descendente decodificada (306), en el cual los respectivos pares (S1-S11) de canales de entrada y salida (300, 302) de la matriz de mezcla descendente (306) tienen asociadas respectivas ganancias de mezcla para adaptar un nivel en el cual un canal de entrada dado (300) contribuye a un canal de salida dado (302) y en el que el procedimiento comprende además: la decodificación de la información que representa los valores de significancia de la matriz de mezcla descendente codificada (306), en la que los respectivos valores de significancia son asignados a pares (S1-S11) de grupos simétricos de altavoces de los canales de entrada (300) y grupos de altavoces simétricos de los canales de salida (302), indicando el valor de significancia si una ganancia de mezcla para uno o más de los canales de entrada (300) es cero o no y la decodificación a partir de la información que representa la matriz de mezcla descendente (306) las ganancias de mezcla codificadas.
Description
[0055] Ahora se puede codificar esta lista, por ejemplo, utilizando también la codificación limitada de Golomb-Rice. En comparación con la realización descrita con respecto a la Fig. 6, se puede ver que se puede codificar esta 5 lista de manera aun más eficaz. En el mejor de los casos, cuando la matriz compacta es idéntica a la matriz plantilla, la totalidad del vector consiste sólo en ceros y sólo se debe codificar un número de longitudes de ejecución.
[0056] En lo que respecta al uso de una matriz plantilla, como se describiera con respecto a la Fig. 7, cabe señalar que tanto el codificador como el decodificador tienen que tener una serie predeterminada de dichas plantillas
10 compactas, lo que se determina de forma individual mediante una serie de altavoces de entrada y salida, a diferencia de una configuración de entrada o salida que está determinada por la lista de altavoces. Esto significa que el orden de los altavoces de entrada y salida no es relevante para determinar la matriz plantilla, sino que puede ser permutado antes de usarse para equipararse al orden de una matriz compacta dada.
15 [0057] En lo sucesivo, como ya se ha mencionado anteriormente, se pasa a describir realizaciones con respecto a la codificación de las ganancias de mezcla proporcionadas en la matriz de mezcla descendente original que ya no están presentes en la matriz de mezcla compacta y que también deben ser codificadas y transmitidas.
[0058] La Fig. 8 describe una realización para codificar las ganancias de mezcla. Esta realización hace uso
20 de las propiedades de las sub-matrices que corresponden a dichas una o más entradas no cero de la matriz de mezcla descendente original, de acuerdo con diferentes combinaciones de grupos de altavoces de entrada y salida, es decir los grupos S (simétricos, L y R), C (central) y A (asimétricos). La Fig. 8 describe sub-matrices posibles que se pueden derivar de la matriz de mezcla descendente mostrada en la Fig. 4, de acuerdo con diferentes combinaciones de altavoces de entrada y salida, a saber, los altavoces simétricos L y R, los canales centrales C y
25 los altavoces asimétricos A. En la Fig. 8, las letras a, b, c y d representan valores de ganancia arbitrarios.
[0059] La Fig. 8A ilustra cuatro sub-matrices posibles que se pueden derivar de la matriz de la Fig. 4. La primera es la sub-matriz que define el mapeo de dos canales centrales, por ejemplo los altavoces C en la configuración de entrada 300 y el altavoz C en la configuración de salida 302, y el valor de ganancia “a” es el valor 30 de ganancia indicado en el elemento de la matriz [1,1] (elemento de superior izquierdo de la Fig. 4). La segunda submatriz de la Fig. 8A representa, por ejemplo, el mapeo de dos canales de entrada simétricos, por ejemplo los canales de entrada Lc y Rc, con un altavoz central, tal como el altavoz C, en la configuración de los canales de salida. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [1,2] y [1,3]. La tercera sub-matriz de la Fig. 8A se refiere al mapeo de un altavoz central C, tal como el altavoz Cvr de la 35 configuración de entrada 300 de la Fig. 4, con dos canales simétricos tales como los canales Ls y Rs, de la configuración de salida 302. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [4,21] y [5,21]. La cuarta sub-matriz de la Fig. 8A representa un caso en que se mapean dos canales simétricos, por ejemplo los canales L, R de la configuración de entrada 300 se mapean con los canales L, R de la configuración de salida 302. Los valores de ganancia “a” a “d” son los valores de ganancia indicados en los
40 elementos de matriz [2,4], [2,5], [3,4] y [3,5].
[0060] La Fig. 8B ilustra las sub-matrices cuando se mapean altavoces asimétricos. La primera representación es una sub-matriz que se obtiene al mapear dos altavoces asimétricos (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4). La segunda sub-matriz de la Fig. 8B se refiere al mapeo de dos
45 canales de entrada simétricos con un canal de salida asimétrico que, en la realización de la Fig. 4 es, por ejemplo, el mapeo de los dos canales de entrada simétricos LFE y LFE2 con el canal de salida LFE. Los valores de ganancia “a” y “b” son los valores de ganancia indicados en los elementos de matriz [6,11] y [6,12]. La terceras sub-matrices de la Fig. 8B representa el caso en que se corresponde un altavoz asimétrico de entrada con un par de altavoces de salida simétrico. En el caso del ejemplo no hay ningún altavoz de entrada asimétrico.
50 [0061] La Fig. 8C ilustra dos sub-matrices para el mapeo de los canales centrales con altavoces asimétricos. La primera sub-matriz mapea un altavoz central de entrada a un altavoz asimétrico de salida (no se presentan ejemplos correspondientes a dicha sub-matriz en la Fig. 4), y la segunda sub-matriz mapea un altavoz de entrada asimétrico con un altavoz central de salida.
55 [0062] De acuerdo con esta realización, por cada grupo de altavoces de salida, se verifica si la columna
12
detenerse aquí si el nivel de precisión es 0,5 dB; -sumar el resto de los enteros múltiplos de 0,25 dB, descendiendo de 0 dB a minGain y sumar el resto de los enteros múltiplos de 0,25 dB, ascendiendo de 0,25 dB a maxGain.
5 [0067] Por ejemplo, cuando maxGain es 2 dB y minGain es -6 dB y la precisión es 0,5 dB, se genera la siguiente lista:
0, -3, -6, -1, -2, -4, -5, 1, 2, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5, 0,5, 1,5.
10 [0068] En lo que respecta a la realización anterior, cabe señalar que la invención no se limita a los valores anteriormente indicados; por el contrario, en lugar de utilizar enteros múltiplos de 3dB y a partir de 0dB, se pueden seleccionar otros valores y también se pueden seleccionar otros valores del nivel de precisión, dependiendo de las circunstancias.
15 [0069] En general, la lista de valores de ganancia se puede generar de la siguiente manera:
-sumar enteros múltiplos de un primer valor de ganancia, entre la ganancia mínima, inclusive, y un valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer valor de ganancia, entre el valor de ganancia inicial, inclusive, y la
20 ganancia máxima, inclusive, en orden creciente; -sumar el resto de los enteros múltiplos de un primer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del primer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
25 -detenerse aquí si el nivel de precisión es el primer nivel de precisión; -sumar el resto de los enteros múltiplos de un segundo nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente; -sumar el resto de los enteros múltiplos del segundo nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente;
30 -detenerse aquí si el nivel de precisión es el segundo nivel de precisión; -sumar el resto de los enteros múltiplos de un tercer nivel de precisión, entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive, en orden decreciente y -sumar el resto de los enteros múltiplos del tercer nivel de precisión, entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive, en orden creciente.
35 [0070] En la realización anterior, cuando el valor de ganancia inicial es cero, las partes que suman los valores restantes en orden creciente y que satisfacen la condición de multiplicidad asociada suman inicialmente el primer valor de ganancia o el primero, segundo o tercer nivel de precisión. Sin embargo, en la generalidad de los casos, las partes que suman los valores restantes en orden creciente suman inicialmente el menor valor, satisfaciendo la
40 condición de multiplicidad asociada, en el intervalo entre el valor de ganancia inicial, inclusive, y la ganancia máxima, inclusive. De manera correspondiente, las partes que suman los valores restantes en orden decreciente suman inicialmente el valor más grande, satisfaciendo la condición de multiplicidad asociada, en el intervalo entre la ganancia mínima, inclusive, y el valor de ganancia inicial, inclusive.
45 [0071] Considerando un ejemplo similar al anterior pero con un valor de ganancia inicial = 1dB (un primer valor de ganancia = 3dB, maxGain = 2dB, minGain = -6dB y un nivel de precisión = 0,5dB) da lo siguiente:
Descendente: 0, -3, -6 Ascendente: [vacío]
50 Descendente: 1, -2, -4, -5 Ascendente: 2 Descendente: 0,5, -0,5, -1,5, -2,5, -3,5, -4,5, -5,5 Ascendente: 1,5
55 [0072] Para codificar un valor de ganancia, preferentemente se busca la ganancia en la tabla y se emite su posición dentro de la tabla. Siempre se encuentra la ganancia deseada, puesto que todas las ganancias son previamente cuantificadas al número entero más cercano múltiplo de la precisión estipulada de, por ejemplo, 1dB, 0,5dB o 0,25dB. De acuerdo con una realización preferida, las posiciones de los valores de ganancia tienen un índice asociado que indica la posición en la tabla y los índices de las ganancias pueden ser codificados, por ejemplo,
14
matriz de mezcla descendente está indicado en el flujo de bits como un valor de ganancia máxima maxGain y un valor de ganancia mínima minGain; por lo tanto no se desperdician bits en valores que no se utilizan en realidad y a la vez no se limita la flexibilidad.
5 [0077] Suponiendo que se dispone de una lista de canales de entrada y también de una lista de canales de salida que aportan información geométrica sobre cada altavoz, como por ejemplo los ángulos azimutal y de elevación y, opcionalmente, el nombre convencional del altavoz, por ejemplo de acuerdo con las referencias de la técnica anterior [6] o [7], un algoritmo para codificar una matriz de mezcla descendente, de acuerdo con las realizaciones puede ser el mostrado a continuación en la tabla 1:
10 Tabla 1 -Sintaxis de DownmixMatrix
- Sintaxis
- No. de bits Mnemónico
- DownmixMatrix(inputConfig, inputCount, outputConfig, outputCount) {
- equalizerPresent; if (equalizerPresent) { EqualizerConfig(inputConfig, inputCount); }
- 1 uimsbf
- precisionLevel; maxGain = escapedValue(3, 4, 0); minGain = escapedValue(4, 5, 0) + 1; ConvertToCompactConfig(inputConfig, inputCount); ConvertToCompactConfig(outputConfig, outputCount);
- 2 uimsbf
- isAllSeparable; if (!isAllSeparable) { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) {
- 1 uimsbf
- isSeparable[i]; } } } else { for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].pairType == SYMMETRIC) { isSeparable[i] = 1; } } }
- 1 uimsbf
- isAllSymmetric; if (!isAllSymmetric) { for (i = 0; i < compactOutputCount; i++) {
- 1 uimsbf
- isSymmetric[i]; } } else { for (i = 0; i < compactOutputCount; i++) { isSymmetric[i] = 1; }
- 1 uimsbf
- mixLFEOnlyToLFE;
- 1 uimsbf
- rawCodingCompactMatrix; if (rawCodingCompactMatrix) { for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (!mixLFEOnlyToLFE || (compactInputConfig[i].isLFE == compactOutputConfig[j].isLFE)) {
- 1 uimsbf
- compactDownmixMatrix[i][j];
- 1 uimsbf
16
- } else { compactDownmixMatrix[i][j] = 0; } } } } else { if (mixLFEOnlyToLFE) { compactInputLFECount = 0; compactOutputLFECount = 0; for (i = 0; i < compactInputCount; i++) { if (compactInputConfig[i].isLFE) compactInputLFECount++; } for (i = 0; i < compactOutputCount; i++) { if (compactOutputConfig[i].isLFE) compactOutputLFECount++; } totalCount = (compactInputCount -compactInputLFECount) * (compactOutputCount -compactOutputLFECount); } else { totalCount = compactInputCount * compactOutputCount; } useCompactTemplate; n = 3; if (totalCount >= 256) n = 4; runLGRParam; count = 0; flatCompactMatrix[totalCount + 1]; while (count < totalCount) { zeroRunLength; /* limited Golomb-Rice using runLGRparam */ flatCompactMatrix[count .. count + zeroRunLength] = {0, ..., 0, 1}; count += zeroRunLength + 1; } count = 0; for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { if (mixLFEOnlyToLFE && compactInputConfig[i].isLFE && compactOutputConfig[j].isLFE) { compactDownmixMatrix[i][j]; } else if (mixLFEOnlyToLFE && (compactInputConfig[i].isLFE ^ compactOutputConfig[j].isLFE)) { compactDownmixMatrix[i][j] = 0; } else { compactDownmixMatrix[i][j] = flatCompactMatrix[count++]; } } } if (useCompactTemplate) { compactTemplate = FindCompactTemplate(inputConfig, inputCount, outputConfig, outputCount); for (i = 0; i < compactInputCount; i++) { for (j = 0; j < compactOutputCount; j++) { compactDownmixMatrix[i][j] ^= compactTemplate[i][j]; } } } } fullForAsymmetricInputs;
- 1 n varía 1 1 1 uimsbf uimsbf bslbf uimsbf uimsbf uimsbf
17
- rawCodingNonzeros; if (!rawCodingNonzeros) { gainLGRParam; generateGainTable(maxGain, minGain, precisionLevel); } for (i = 0; i < compactInputCount; i++) { iType = compactInputConfig[i].pairType; for (j = 0; j < compactOutputCount; j++) { oType = compactOutputConfig[j].pairType; i1 = compactInputConfig[i].originalPosition; o1 = compactOutputConfig[j].originalPosition; if ((iType != SYMMETRIC) && (oType != SYMMETRIC)) { downmixMatrix[i1][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); } else if (iType != SYMMETRIC) { o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); useFull = (iType == ASYMMETRIC) && fullForAsymmetricInputs; if (isSymmetric[j] && !useFull) { downmixMatrix[i1][o2] = downmixMatrix[i1][o1]; } else { downmixMatrix[i1][o2] = DecodeGainValue(); } } else if (oType != SYMMETRIC) { i2 = compactInputConfig[i].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i2][o1] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSymmetric[j]) { downmixMatrix[i2][o1] = downmixMatrix[i1][o1]; } else { downmixMatrix[i2][o1] = DecodeGainValue(); } } else { i2 = compactInputConfig[i].SymmetricPair.originalPosition; o2 = compactOutputConfig[j].SymmetricPair.originalPosition; downmixMatrix[i1][o1] = 0.0; downmixMatrix[i1][o2] = 0.0; downmixMatrix[i2][o1] = 0.0; downmixMatrix[i2][o2] = 0.0; if (!compactDownmixMatrix[i][j]) continue; downmixMatrix[i1][o1] = DecodeGainValue(); if (isSeparable[j] && isSymmetric[j]) { downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (!isSeparable[j] && isSymmetric[j]) { downmixMatrix[i1][o2] = DecodeGainValue(); downmixMatrix[i2][o1] = downmixMatrix[i1][o2]; downmixMatrix[i2][o2] = downmixMatrix[i1][o1]; } else if (isSeparable[j] && !isSymmetric[j]) {
- 3 uimsbf
18
- }
- eqExtendedRange; for (i = 0; i < numEqualizers; i++) { numSections = escapedValue(2, 4, 0) + 1; lastCenterFreqP10 = 0; lastCenterFreqLd2 = 10; maxCenterFreqLd2 = 99; for (j = 0; j < numSections; j++) { centerFreqP10 = lastCenterFreqP10 + ReadRange(4 -lastCenterFreqP10); if (centerFreqP10 > lastCenterFreqP10) lastCenterFreqLd2 = 10; if (centerFreqP10 == 3) maxCenterFreqLd2 = 24; centerFreqLd2 = lastCenterFreqLd2 + ReadRange(1 + maxCenterFreqLd2 -lastCenterFreqLd2); qFactorIndex; if (qFactorIndex > 19) { qFactorExtra; } cgBits = 4 + eqExtendedRange + eqPrecisionLevel; centerGainIndex; } sgBits = 4 + eqExtendedRange + min(eqPrecisionLevel + 1, 3); scalingGainIndex; } for (i = 0; i < inputCount; i++) { hasEqualizer[i]; if (hasEqualizer[i]) { equalizerIndex[i] = ReadRange(numEqualizers); } } 1 5 3 cgBits sgBits 1 uimsbf uimsbf uimsbf uimsbf uimsbf uimsbf
[0081] Los elementos de la matriz de mezcla descendente, de acuerdo con las realizaciones, pueden ser como se muestran en la siguiente tabla 5:
Tabla 5 -Elementos de DownmixMatrix
- Campo
- Descripción / Valores
- paramConfig,
- Vectores de configuración de canales que especifican la información acerca de
- inputConfig,
- cada altavoz. Cada entrada, paramConfig[i], es una estructura que consta de las
- outputConfig
- siguientes partes: -AzimuthAngle, el valor absoluto del ángulo azimutal del altavoz; -AzimuthDirection, la dirección azimutal, 0 (izquierda) o 1 (derecha); -ElevationAngle, el valor absoluto del ángulo de elevación del altavoz; -ElevationDirection, la dirección de elevación, 0 (ascendente) o 1 (descendente); -alreadyUsed, indica si el altavoz ya es parte de un grupo; -isLFE, indica si el altavoz es un altavoz LFE.
- paramCount, inputCount, outputCount
- Número de altavoces en los correspondientes vectores de configuración de canales
- compactParamConfig,
- Vectores de configuración de canales compactos que especifican la información
- compactInputConfig,
- acerca de cada grupo de altavoces. Cada entrada, compactParamConfig[i], es una
- compactOutputConfig
- estructura que consta de las siguientes partes: -pairType, tipo de grupo de altavoces, que puede ser SIMÉTRICO (un par simétrico de dos altavoces), CENTRAL o ASIMÉTRICO; -isLFE, indica si el grupo de altavoces consisten altavoces LFE; -originalPosition, posición en la configuración de canales original del primer altavoz, o único altavoz, del grupo; -symmetricPair.originalPosition, posición en la configuración de canales original
20
- del segundo altavoz del grupo, sólo para grupos SIMÉTRICOS.
- compactParamCount, compactInputCount, compactOutputCount
- Número de grupos de altavoces en los correspondientes vectores de configuración compacta de canales
- equalizerPresent
- Booleano que indica si está presente la información de ecualizador que se ha de aplicar a los canales de entrada
- precisionLevel
- Precisión usada para la cuantificación uniforme de las ganancias: 0 = 1 dB, 1 = 0,5 dB, 2 = 0,25 dB, 3 reservado
- maxGain
- Máxima ganancia real en la matriz, expresada en dB: Valores posibles de 0 a 22, en lineal 1 .. 12.589
- minGain
- Mínima ganancia real en la matriz, expresada en dB: Valores posibles de -1 a -47, en lineal 0,891 .. 0,004
- isAllSeparable
- Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de separabilidad
- isSeparable[i]
- Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de separabilidad
- isAllSymmetric
- Booleano que indica si todos los grupos de altavoces de salida satisfacen la propiedad de simetría
- isSymmetric[i]
- Booleano que indica si el grupo de altavoces de salida con el índice i satisface la propiedad de simetría
- mixLFEOnlyToLFE
- Booleano que indica si los altavoces LFE se mezclan sólo con altavoces LFE y, al mismo tiempo, si los altavoces no LFE se mezclan sólo con altavoces no LFE
- rawCodingCompactMatrix
- Booleano que indica si compactDownmixMatrix es codificado raw (del inglés, crudo) (utilizando un bit por entrada) o se codifica utilizando la codificación de longitud de ejecución seguida por Golomb-Rice limitada
- compactDownmixMatrix[i][j]
- Una entrada en compactDownmixMatrix que corresponde al grupo de altavoces de entrada i y al grupo de altavoces de salida j, que indica si alguna de las ganancias asociadas es no cero: 0 = todas las ganancias son cero, 1 = al menos una ganancia es no cero
- useCompactTemplate
- Booleano que indica si se ha de aplicar una XOR por elemento a compactDownmixMatrix con una matriz plantilla compacta predefinida, para mejorar la eficacia de la codificación por longitud de ejecución
- runLGRParam
- Parámetro de Golomb-Rice Limitada utilizado para codificar las longitudes de ejecución cero en la flatCompactMatrix linealizada
- flatCompactMatrix
- Versión linealizada de compactDownmixMatrix con la matriz plantilla compacta predefinida ya aplicada; Cuando mixLFEOnlyToLFE está habilitado, esto no incluye las entradas de cero conocidas (debido a la mezcla entre no LFE y LFE) o las utilizadas para la mezcla de LFE con LFE
- compactTemplate
- Matriz plantilla compacta predefinida, que contiene entradas “típicas” que es sometida a XOR por elementos a compactDownmixMatrix, para mejorar la eficacia de codificación mediante la creación de entradas de valores principalmente de cero
- zeroRunLength
- La longitud de una ejecución cero siempre seguida por un uno, en la flatCompactMatrix, que es codificada con codificación limitada de Golomb–Rice, usando el parámetro runLGRParam
- fullForAsymmetricInputs
- Booleano que indica si se debe ignorar la propiedad de simetría por cada grupo asimétrico de altavoces de entrada; En caso de habilitarse, cada grupo asimétrico de altavoces de entrada tendrá dos valores de ganancia decodificados por cada grupo simétrico de altavoces de salida con el índice i, independientemente de isSymmetric[i]
- gainTable
- Tabla de ganancias dinámicamente generada que contiene la lista de todas las ganancias posibles entre minGain y maxGain con la precisión precisionLevel
- rawCodingNonzeros
- Booleano que indica si los valores de ganancia no cero se codifican raw (codificación uniforme, utilizando la función ReadRange) o sus índices en la lista gainTable se codifican utilizando codificación limitada de Golomb–Rice
- gainLGRParam
- Parámetro de Golomb–Rice Limitado utilizado para codificar los índices de ganancia no cero, calculado mediante la búsqueda de cada ganancia de la lista gainTable
21
Claims (1)
-
imagen1 imagen2 imagen3 imagen4 imagen5
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP20130189770 EP2866227A1 (en) | 2013-10-22 | 2013-10-22 | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
| EP13189770 | 2013-10-22 | ||
| PCT/EP2014/071929 WO2015058991A1 (en) | 2013-10-22 | 2014-10-13 | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2655046T3 true ES2655046T3 (es) | 2018-02-16 |
Family
ID=49474267
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES14783660.5T Active ES2655046T3 (es) | 2013-10-22 | 2014-10-13 | Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio |
Country Status (19)
| Country | Link |
|---|---|
| US (6) | US9947326B2 (es) |
| EP (2) | EP2866227A1 (es) |
| JP (1) | JP6313439B2 (es) |
| KR (1) | KR101798348B1 (es) |
| CN (2) | CN105723453B (es) |
| AR (1) | AR098152A1 (es) |
| AU (1) | AU2014339167B2 (es) |
| BR (1) | BR112016008787B1 (es) |
| CA (1) | CA2926986C (es) |
| ES (1) | ES2655046T3 (es) |
| MX (1) | MX353997B (es) |
| MY (1) | MY176779A (es) |
| PL (1) | PL3061087T3 (es) |
| PT (1) | PT3061087T (es) |
| RU (1) | RU2648588C2 (es) |
| SG (1) | SG11201603089VA (es) |
| TW (1) | TWI571866B (es) |
| WO (1) | WO2015058991A1 (es) |
| ZA (1) | ZA201603298B (es) |
Families Citing this family (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
| EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
| KR102627374B1 (ko) * | 2015-06-17 | 2024-01-19 | 삼성전자주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
| EP3312837A4 (en) * | 2015-06-17 | 2018-05-09 | Samsung Electronics Co., Ltd. | Method and device for processing internal channels for low complexity format conversion |
| KR102856247B1 (ko) * | 2015-06-17 | 2025-09-04 | 삼성전자주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
| JP6921832B2 (ja) * | 2016-02-03 | 2021-08-18 | ドルビー・インターナショナル・アーベー | オーディオ符号化における効率的なフォーマット変換 |
| KR102358283B1 (ko) | 2016-05-06 | 2022-02-04 | 디티에스, 인코포레이티드 | 몰입형 오디오 재생 시스템 |
| CN109716794B (zh) * | 2016-09-20 | 2021-07-13 | 索尼公司 | 信息处理装置、信息处理方法及计算机可读存储介质 |
| US10075789B2 (en) * | 2016-10-11 | 2018-09-11 | Dts, Inc. | Gain phase equalization (GPEQ) filter and tuning methods for asymmetric transaural audio reproduction |
| US10659906B2 (en) * | 2017-01-13 | 2020-05-19 | Qualcomm Incorporated | Audio parallax for virtual reality, augmented reality, and mixed reality |
| US10979844B2 (en) * | 2017-03-08 | 2021-04-13 | Dts, Inc. | Distributed audio virtualization systems |
| JP7224302B2 (ja) * | 2017-05-09 | 2023-02-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャネル空間的オーディオ・フォーマット入力信号の処理 |
| WO2019004524A1 (ko) * | 2017-06-27 | 2019-01-03 | 엘지전자 주식회사 | 6자유도 환경에서 오디오 재생 방법 및 오디오 재생 장치 |
| JP7222668B2 (ja) * | 2017-11-17 | 2023-02-15 | 日本放送協会 | 音響処理装置及びプログラム |
| JP7596146B2 (ja) | 2017-12-19 | 2024-12-09 | ドルビー・インターナショナル・アーベー | 音声音響統合復号および符号化の改良のための方法、機器、およびシステム |
| GB2571572A (en) * | 2018-03-02 | 2019-09-04 | Nokia Technologies Oy | Audio processing |
| CN111955020B (zh) * | 2018-04-11 | 2022-08-23 | 杜比国际公司 | 用于音频渲染的预渲染信号的方法、设备和系统 |
| WO2020089302A1 (en) | 2018-11-02 | 2020-05-07 | Dolby International Ab | An audio encoder and an audio decoder |
| GB2582749A (en) * | 2019-03-28 | 2020-10-07 | Nokia Technologies Oy | Determination of the significance of spatial audio parameters and associated encoding |
| CA3193359A1 (en) * | 2019-06-14 | 2020-12-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Parameter encoding and decoding |
| EP4014506B1 (en) | 2019-08-15 | 2023-01-11 | Dolby International AB | Methods and devices for generation and processing of modified audio bitstreams |
| US12205607B2 (en) | 2019-08-15 | 2025-01-21 | Dolby Laboratories Licensing Corporation | Methods and devices for generation and processing of modified bitstreams |
| US12165657B2 (en) | 2019-08-30 | 2024-12-10 | Dolby Laboratories Licensing Corporation | Channel identification of multi-channel audio signals |
| EP3809709A1 (en) * | 2019-10-14 | 2021-04-21 | Koninklijke Philips N.V. | Apparatus and method for audio encoding |
| BR112022010737A2 (pt) | 2019-12-02 | 2022-08-23 | Dolby Laboratories Licensing Corp | Sistemas, métodos e aparelho para conversão de áudio com base em canal para áudio com base em objeto |
| GB2593672A (en) * | 2020-03-23 | 2021-10-06 | Nokia Technologies Oy | Switching between audio instances |
| EP4154249B1 (en) | 2020-05-20 | 2024-01-24 | Dolby International AB | Methods and apparatus for unified speech and audio decoding improvements |
| BR112022025161A2 (pt) | 2020-06-11 | 2022-12-27 | Dolby Laboratories Licensing Corp | Codificação de sinais de áudio de multicanal compreendendo a mixagem de rebaixamento de um canal de entrada primário e de dois ou mais canais de entrada não primária |
| CN115843378A (zh) | 2020-07-07 | 2023-03-24 | 弗劳恩霍夫应用研究促进协会 | 使用针对多声道音频信号的声道的缩放参数的联合编码的音频解码器、音频编码器以及相关方法 |
| DE112021004444T5 (de) * | 2020-08-27 | 2023-06-22 | Apple Inc. | Stereobasierte immersive codierung (stic) |
| CN114334040B (zh) * | 2021-11-26 | 2025-05-30 | 腾讯科技(深圳)有限公司 | 分子图重构模型的训练方法、装置以及电子设备 |
| CN119179461B (zh) * | 2024-11-19 | 2025-04-01 | 杭州海康威视数字技术股份有限公司 | 拼接屏音频输出的管理方法、装置、系统、设备及介质 |
Family Cites Families (64)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6108633A (en) * | 1996-05-03 | 2000-08-22 | Lsi Logic Corporation | Audio decoder core constants ROM optimization |
| US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
| US20040062401A1 (en) * | 2002-02-07 | 2004-04-01 | Davis Mark Franklin | Audio channel translation |
| CA2992051C (en) * | 2004-03-01 | 2019-01-22 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
| US6522270B1 (en) * | 2001-12-26 | 2003-02-18 | Sun Microsystems, Inc. | Method of coding frequently occurring values |
| US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
| US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
| WO2005098821A2 (en) * | 2004-04-05 | 2005-10-20 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
| SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
| US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
| TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | 杜比實驗室特許公司 | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
| CN101010724B (zh) * | 2004-08-27 | 2011-05-25 | 松下电器产业株式会社 | 音频编码器 |
| US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
| SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
| US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
| US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
| DE602006015294D1 (de) * | 2005-03-30 | 2010-08-19 | Dolby Int Ab | Mehrkanal-audiocodierung |
| DE602006004959D1 (de) * | 2005-04-15 | 2009-03-12 | Dolby Sweden Ab | Zeitliche hüllkurvenformgebung von entkorrelierten signalen |
| JP4988717B2 (ja) * | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
| CA2610430C (en) * | 2005-06-03 | 2016-02-23 | Dolby Laboratories Licensing Corporation | Channel reconfiguration with side information |
| US8032240B2 (en) * | 2005-07-11 | 2011-10-04 | Lg Electronics Inc. | Apparatus and method of processing an audio signal |
| US8160888B2 (en) * | 2005-07-19 | 2012-04-17 | Koninklijke Philips Electronics N.V | Generation of multi-channel audio signals |
| US7974713B2 (en) * | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
| KR100888474B1 (ko) * | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
| TWI469133B (zh) * | 2006-01-19 | 2015-01-11 | Lg Electronics Inc | 媒體訊號處理方法及裝置 |
| KR101294022B1 (ko) * | 2006-02-03 | 2013-08-08 | 한국전자통신연구원 | 공간큐를 이용한 다객체 또는 다채널 오디오 신호의 랜더링제어 방법 및 그 장치 |
| US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
| US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
| CN101506875B (zh) * | 2006-07-07 | 2012-12-19 | 弗劳恩霍夫应用研究促进协会 | 用于组合多个参数编码的音频源的设备和方法 |
| EP2082397B1 (en) * | 2006-10-16 | 2011-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
| AU2007312598B2 (en) * | 2006-10-16 | 2011-01-20 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
| DE102006050068B4 (de) * | 2006-10-24 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm |
| EP2102856A4 (en) * | 2006-12-07 | 2010-01-13 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL |
| CA2645915C (en) * | 2007-02-14 | 2012-10-23 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
| WO2008120933A1 (en) * | 2007-03-30 | 2008-10-09 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi object audio signal with multi channel |
| DE102007018032B4 (de) * | 2007-04-17 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Erzeugung dekorrelierter Signale |
| CA2684975C (en) * | 2007-04-26 | 2016-08-02 | Dolby Sweden Ab | Apparatus and method for synthesizing an output signal |
| WO2009039897A1 (en) * | 2007-09-26 | 2009-04-02 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
| JP5391203B2 (ja) * | 2007-10-09 | 2014-01-15 | コーニンクレッカ フィリップス エヌ ヴェ | バイノーラル音声信号を生成するための方法と装置 |
| DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
| JP5883561B2 (ja) * | 2007-10-17 | 2016-03-15 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | アップミックスを使用した音声符号器 |
| JP5243554B2 (ja) * | 2008-01-01 | 2013-07-24 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
| US7733245B2 (en) * | 2008-06-25 | 2010-06-08 | Aclara Power-Line Systems Inc. | Compression scheme for interval data |
| EP2154911A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
| JP5520300B2 (ja) * | 2008-09-11 | 2014-06-11 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マイクロホン信号に基づいて一組の空間手がかりを供給する装置、方法およびコンピュータ・プログラムと2チャンネルのオーディオ信号および一組の空間手がかりを供給する装置 |
| US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
| EP2175670A1 (en) * | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
| BR122019023947B1 (pt) * | 2009-03-17 | 2021-04-06 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
| US8000485B2 (en) * | 2009-06-01 | 2011-08-16 | Dts, Inc. | Virtual audio processing for loudspeaker or headphone playback |
| MX2011013829A (es) * | 2009-06-24 | 2012-03-07 | Fraunhofer Ges Forschung | Decodificador de señales de audio, metodo para decodificar una señal de audio y programa de computacion que utiliza etapas en cascada de procesamiento de objetos de audio. |
| EP2360681A1 (en) * | 2010-01-15 | 2011-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information |
| TWI557723B (zh) * | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
| US8908874B2 (en) * | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
| EP2477188A1 (en) * | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
| CN103649706B (zh) * | 2011-03-16 | 2015-11-25 | Dts(英属维尔京群岛)有限公司 | 三维音频音轨的编码及再现 |
| WO2012177067A2 (ko) | 2011-06-21 | 2012-12-27 | 삼성전자 주식회사 | 오디오 신호 처리방법 및 장치와 이를 채용하는 단말기 |
| EP2560161A1 (en) * | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
| KR20130093798A (ko) * | 2012-01-02 | 2013-08-23 | 한국전자통신연구원 | 다채널 신호 부호화 및 복호화 장치 및 방법 |
| EP2862370B1 (en) * | 2012-06-19 | 2017-08-30 | Dolby Laboratories Licensing Corporation | Rendering and playback of spatial audio using channel-based audio systems |
| US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
| US9479886B2 (en) * | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
| EP2956935B1 (en) * | 2013-02-14 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Controlling the inter-channel coherence of upmixed audio signals |
| EP2976768A4 (en) * | 2013-03-20 | 2016-11-09 | Nokia Technologies Oy | AUDIO SIGNAL ENCODER COMPRISING A MULTI-CHANNEL PARAMETER SELECTOR |
| EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
-
2013
- 2013-10-22 EP EP20130189770 patent/EP2866227A1/en not_active Withdrawn
-
2014
- 2014-10-13 CN CN201480057957.8A patent/CN105723453B/zh active Active
- 2014-10-13 CA CA2926986A patent/CA2926986C/en active Active
- 2014-10-13 PL PL14783660T patent/PL3061087T3/pl unknown
- 2014-10-13 RU RU2016119546A patent/RU2648588C2/ru active
- 2014-10-13 SG SG11201603089VA patent/SG11201603089VA/en unknown
- 2014-10-13 JP JP2016525036A patent/JP6313439B2/ja active Active
- 2014-10-13 KR KR1020167013337A patent/KR101798348B1/ko active Active
- 2014-10-13 WO PCT/EP2014/071929 patent/WO2015058991A1/en not_active Ceased
- 2014-10-13 AU AU2014339167A patent/AU2014339167B2/en active Active
- 2014-10-13 PT PT147836605T patent/PT3061087T/pt unknown
- 2014-10-13 ES ES14783660.5T patent/ES2655046T3/es active Active
- 2014-10-13 CN CN201910973920.4A patent/CN110675882B/zh active Active
- 2014-10-13 BR BR112016008787-9A patent/BR112016008787B1/pt active IP Right Grant
- 2014-10-13 MX MX2016004924A patent/MX353997B/es active IP Right Grant
- 2014-10-13 MY MYPI2016000689A patent/MY176779A/en unknown
- 2014-10-13 EP EP14783660.5A patent/EP3061087B1/en active Active
- 2014-10-21 TW TW103136287A patent/TWI571866B/zh active
- 2014-10-22 AR ARP140103967A patent/AR098152A1/es active IP Right Grant
-
2016
- 2016-04-18 US US15/131,263 patent/US9947326B2/en active Active
- 2016-05-16 ZA ZA2016/03298A patent/ZA201603298B/en unknown
-
2018
- 2018-03-05 US US15/911,974 patent/US10468038B2/en active Active
-
2019
- 2019-09-23 US US16/579,293 patent/US11393481B2/en active Active
-
2022
- 2022-06-15 US US17/807,095 patent/US11922957B2/en active Active
-
2024
- 2024-02-12 US US18/439,072 patent/US12412586B2/en active Active
-
2025
- 2025-08-15 US US19/300,847 patent/US20260038512A1/en active Pending
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2655046T3 (es) | Procedimiento para decodificar y codificar una matriz de mezcla descendente, procedimiento para presentar contenidos de audio, codificador y decodificador para una matriz de mezcla descendente, codificador de audio y decodificador de audio | |
| ES2687044T3 (es) | Control de rango dinámico controlado por metadatos | |
| BR112015029132A2 (pt) | codificação de cenas de áudio | |
| ES2667871T3 (es) | Decodificador de audio con sonoridad y metadatos de límite de programa | |
| ES2916254T3 (es) | Sonoridad de programa basada en la presentación, independiente de la transmisión | |
| RU2711055C2 (ru) | Устройство и способ для кодирования или декодирования многоканального сигнала | |
| ES2965423T3 (es) | Codificador de audio | |
| ES2641390T3 (es) | Codificación y decodificación eficientes de una señal de audio multicanal con múltiples flujos secundarios | |
| NO20180990A1 (no) | Kompatibel flerkanal-koding/dekoding. | |
| ES2945723T3 (es) | Método de codificación y decodificación y aparato de codificación y decodificación para señales estéreo | |
| AR097012A1 (es) | Decodificador de audio, codificador de audio, método para proporcionar al menos cuatro señales de canales de audio sobre la base de una representación codificada, método para proporcionar una representación codificada sobre la base de al menos cuatro señales de canales de audio y programa de computadora usando extensión de ancho de banda | |
| MY199026A (en) | Decoding video data using a two-level multi-type-tree framework | |
| BR112017016341A2 (pt) | codificação em modo paleta para codificação de vídeo | |
| SI2834978T1 (en) | Code encoding a coded block | |
| MX2013014931A (es) | Elementos de sintaxis de señalizacion para coeficientes de transformada para subconjuntos de una unidad de codificacion de nivel de hoja. | |
| BR112016005192B1 (pt) | método em um codificador de áudio para a quantização de parâmetros relativos à codificação paramétrica espacial de sinais de áudio, meio legível por computador não transitório, codificador de áudio, método em um decodificador de áudio para a desquantização de parâmetros quantizados relativos à codificação paramétrica espacial de sinais de áudio, decodificador de áudio e sistema de codificação/decodificação | |
| MX364405B (es) | Mezcla parametrica de senales de audio. | |
| AR113482A1 (es) | Codificadores de audio, decodificadores de audio, métodos y programas de computadora que adaptan una codificación y decodificación de bits menos significativos | |
| ES3050734T3 (en) | Apparatuses for encoding and decoding a sequence of integer values, methods for encoding and decoding a sequence of integer values and computer program for implementing these methods | |
| BRPI0612179A2 (pt) | codificação por entropia com livros-código compactos | |
| ES3059272T3 (en) | Spatial coding of higher order ambisonics for a low latency immersive audio codec | |
| BR112022012096A2 (pt) | Métodos para decodificar e codificar pelo menos uma imagem parada atual, decodificador para decodificar imagens paradas, e, codificador para codificar imagens paradas | |
| ES2946235T3 (es) | Codificador de señal de audio estéreo | |
| EP4500480A4 (en) | OPTIMIZED MIXED REALITY AUDIO RENDERING | |
| ES2867477T3 (es) | Decodificación de secuencias de bits de audio con metadatos de replicación de banda espectral mejorada en al menos un elemento de relleno |