ES2392609T3 - Aparato para determinar una señal de audio multicanal de salida espacial - Google Patents
Aparato para determinar una señal de audio multicanal de salida espacial Download PDFInfo
- Publication number
- ES2392609T3 ES2392609T3 ES09777815T ES09777815T ES2392609T3 ES 2392609 T3 ES2392609 T3 ES 2392609T3 ES 09777815 T ES09777815 T ES 09777815T ES 09777815 T ES09777815 T ES 09777815T ES 2392609 T3 ES2392609 T3 ES 2392609T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- decomposed
- transformed
- foreground
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
Aparato (100) para determinar una señal de audio multicanal de salida espacial basándose en una señal de audio de entrada, que comprende: un descomponedor (110) semántico configurado para descomponer la señal de audio de entrada para obtener una primera señal descompuesta que tiene una primera propiedad semántica, siendo la primera señal descompuesta una parte de señal de primer plano, y una segunda señal descompuesta que tiene una segunda propiedad semántica que es diferente de la primera propiedad semántica, siendo la segunda señal descompuesta una parte de señal de segundo plano; un transformador (120) configurado para transformar la parte de señal de primer plano usando la panorámica de amplitud como primera característica de transformación para obtener una primera señal transformada que tiene la primera propiedad semántica, comprendiendo el transformador (120) una fase (221, 340) de panorámica de amplitud para procesar la parte de señal de primer plano, en la que se proporciona ruido (350) de paso bajo generado localmente a la fase (340) de panorámica de amplitud para variar temporalmente una ubicación de panorámica de una fuente de audio en la parte de señal de primer plano; y para transformar la parte de señal de segundo plano decorrelacionando la segunda señal descompuesta como segunda característica de transformación para obtener una segunda señal transformada que tiene la segunda propiedad semántica; y un procesador (130, 330) configurado para procesar la primera señal transformada y la segunda señal transformada para obtener la señal de audio multicanal de salida espacial.
Description
Aparato para determinar una señal de audio multicanal de salida espacial
La presente invención pertenece al campo del procesamiento de audio, especialmente el procesamiento de propiedades de audio espaciales.
El procesamiento y/o la codificación de audio han avanzado de muchas maneras. Cada vez se genera más demanda para aplicaciones de audio espaciales. En muchas aplicaciones el procesamiento de señales de audio se utiliza para decorrelacionar o transformar señales. Tales aplicaciones pueden llevar a cabo, por ejemplo, un mezclado en sentido ascendente de mono a estéreo, un mezclado de mono/estéreo a multicanal, reverberación artificial, ampliación de estéreo o mezclado/transformación interactivo de usuario.
Para determinadas clases de señales como por ejemplo señales similares a ruido, como por ejemplo señales similares a aplausos, los métodos y sistemas convencionales se ven afectados por o bien una calidad de percepción insatisfactoria
o bien, si se usa un enfoque orientado al objeto, una elevada complejidad computacional debido al número de eventos auditivos que deben modelizarse o procesarse. Otros ejemplos de material de audio, que es problemático, son generalmente material de ambiente tal como, por ejemplo, el ruido que se emite por una bandada de pájaros, una orilla del mar, caballos galopando, una división de soldados marchando, etc.
Los conceptos convencionales usan, por ejemplo, codificación de estéreo paramétrica o de sonido envolvente MPEG (MPEG = Moving Pictures Expert Group, Grupo de expertos de imágenes en movimiento). La figura 6 muestra una aplicación típica de un decorrelacionador en una mezcladora en sentido ascendente de mono a estéreo. La figura 6 muestra una señal de entrada mono proporcionada a un decorrelacionador 610, que proporciona una señal de entrada decorrelacionada en su salida. La señal de entrada original se proporciona a una matriz 620 de mezclado en sentido ascendente junto con la señal decorrelacionada. Dependiendo de parámetros 630 de control de mezclado en sentido ascendente, se transforma en una señal de salida estéreo. El decorrelacionador 610 de señales genera una señal D decorrelacionada alimentada a la fase 620 de formación de matriz junto con la señal M mono sin modificar. Dentro de la matriz 620 de mezclado, los canales estéreo L (L = canal estéreo izquierdo) y R (R = canal estéreo derecho) están formados según una matriz H de mezclado. Los coeficientes en la matriz H pueden fijarse de manera dependiente de la señal o controlarse por un usuario.
Alternativamente, la matriz puede controlarse mediante información complementaria, transmitida junto con la mezcla en sentido descendente, que contiene una descripción paramétrica de cómo mezclar en sentido ascendente las señales de la mezcla en sentido descendente para formar la salida multicanal deseada. Esta información complementaria espacial se genera habitualmente mediante un codificador de señales antes del proceso de mezclado en sentido ascendente.
Esto se realiza normalmente en la codificación de audio espacial paramétrica como, por ejemplo, en estéreo paramétrico, véase J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, “High-Quality Parametric Spatial Audio Coding at Low Bitrates” en 116ª Convención de AES, Berlín, preimpresión 6072, mayo de 2004 y en sonido envolvente MPEG, véase J. Herre, K. Kjörling, J. Breebaart, et al., “MPEG Surround -the ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding” en Procedimientos de la 122ª Convención de AES, Viena, Austria, mayo de 2007. Una estructura típica de un decodificador estéreo paramétrico se muestra en la figura 7. En este ejemplo, el proceso de decorrelación se realiza en un dominio de transformada, que está indicado por el banco 710 de filtros de análisis, que transforma una señal mono de entrada en el dominio de transformada como, por ejemplo, el dominio de frecuencia en cuanto a un número de bandas de frecuencia.
En el dominio de frecuencia, el decorrelacionador 720 genera la señal decorrelacionada correspondiente, que debe mezclarse en sentido ascendente en la matriz 730 de mezclado en sentido ascendente. La matriz 730 de mezclado en sentido ascendente considera parámetros de mezclado en sentido ascendente, que se proporcionan mediante la caja 740 de modificación de parámetros, a la que se le proporcionan parámetros de entrada espaciales y que está acoplada a una fase 750 de control de parámetros. En el ejemplo mostrado en la figura 7, los parámetros espaciales pueden modificarse por un usuario o mediante herramientas adicionales tales como, por ejemplo, postprocesamiento para transformación/presentación binaural. En este caso, los parámetros de mezclado en sentido ascendente pueden fusionarse con los parámetros procedentes de los filtros binaurales para formar los parámetros de entrada para la matriz 730 de mezclado en sentido ascendente. La medición de los parámetros puede llevarse a cabo mediante el bloque 740 de modificación de parámetros. La salida de la matriz 730 de mezclado en sentido ascendente se proporciona entonces a un banco 760 de filtros de síntesis, que determina la señal de salida estéreo.
Como se describió anteriormente, la salida L/R de la matriz H de mezclado puede calcularse a partir de la señal M de salida mono y la señal D decorrelacionada, por ejemplo según
En la matriz de mezclado, la cantidad de sonido decorrelacionado alimentado a la salida puede controlarse basándose en los parámetros transmitidos tales como, por ejemplo, configuraciones de ICC (ICC = Interchannel Correlation, correlación intercanal) y/o mixtas o definidas por el usuario.
Otro enfoque convencional se establece mediante el método de permutación temporal. Una propuesta dedicada sobre la decorrelación de señales similares a aplausos puede encontrarse, por ejemplo, en Gerard Hotho, Steven van de Par, Jeroen Breebaart, “Multichannel Coding of Applause Signals,” en EURASIP Journal on Advances in Signal Processing, vol. 1, art. 10, 2008. En este caso, una señal de audio monofónica se segmenta en segmentos de tiempo solapantes, que se permitan temporalmente de manera pseudoaleatoria dentro de un “superbloque” para formar los canales de salida decorrelacionados. Las permutaciones son independientes entre sí para un número n de canales de salida.
Otro enfoque es el intercambio de canal alternante de copia original y retardada con el fin de obtener una señal decorrelacionada, véase la solicitud de patente alemana 102007018032.4-55.
En algunos sistemas orientados al objeto conceptuales convencionales, por ejemplo en Wagner, Andreas; Walther, Andreas; Melchoir, Frank; Strauß, Michael; “Generation of Highly Immersive Atmospheres for Wave Field Synthesis Reproduction” en la 116ª Convención internacional de EAS, Berlín, 2004, se describe cómo crear una escena inmersiva a partir de muchos objetos tales como por ejemplo palmadas individuales, mediante la aplicación una síntesis de campo de ondas.
Aún otro enfoque es la denominada “codificación de audio direccional” (DirAC = Directional Audio Coding), que es un método para la representación de sonido espacial, aplicable para diferentes sistemas de reproducción de sonido, véase Pulkki, Ville, “Spatial Sound Reproduction with Directional Audio Coding” en J. Audio Eng. Soc., vol. 55, n.º 6, 2007. En la parte de análisis, la difusividad y la dirección de llegada del sonido se estiman en una única ubicación dependiendo del tiempo y de la frecuencia. En la parte de síntesis, señales de micrófono se dividen en primer lugar en partes no difusas y difusas y entonces se reproducen usando diferentes estrategias.
Los enfoques convencionales tienen varias desventajas. Por ejemplo, el mezclado en sentido ascendente guiado o no guiado de señales de audio que tienen contenido, tal como un aplauso, puede requerir una decorrelación fuerte. Por consiguiente, por un lado, es necesaria una decorrelación fuerte para restaurar la sensación ambiente de estar, por ejemplo, en una sala de conciertos. Por otro lado, los filtros de decorrelación adecuados tales como, por ejemplo, los filtros todo paso, degradan una reproducción de calidad de eventos transitorios, como una única palmada con las manos introduciendo efectos de difuminado temporales tales como ecos previos y posteriores y llamada de filtro. Además, la panorámica espacial de eventos de palmadas individuales debe realizarse en una cuadrícula de tiempo bastante fina, mientras que la decorrelación ambiente debe ser cuasi estacionaria a lo largo del tiempo.
Los sistemas del estado de la técnica según J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, “High-Quality Parametric Spatial Audio Coding at Low Bitrates” en la 116ª Convención de AES, Berlín, preimpresión 6072, mayo de 2004 y J. Herre, K. Kjörling, J. Breebaart, et al., “MPEG Surround -the ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding” en Procedimientos de la 122ª Convención de AES, Viena, Austria, mayo de 2007, comprometen la resolución temporal frente a la estabilidad ambiente y la degradación de calidad transitoria frente a la decorrelación ambiente.
Un sistema que utilice el método de permutación temporal, por ejemplo, presentará una degradación perceptible del sonido de salida debido a una determinada calidad repetitiva en la señal de audio de salida. Esto se debe al hecho de que un mismo segmento de la señal de entrada aparece inalterado en cada canal de salida, aunque en un punto de tiempo diferente. Además, para evitar un aumento de la densidad de aplausos, deben omitirse algunos canales originales en el mezclado en sentido ascendente y, por tanto, puede perderse algún evento auditivo importante en la mezcla en sentido ascendente resultante.
En sistemas orientados al objeto, normalmente tales eventos de sonido están espaciados como un gran grupo de fuentes de tipo puntual, lo que conduce a una implementación computacionalmente compleja.
El documento GB 2353193 A da a conocer un método y un aparato de procesamiento de sonido que pueden realizar un procesamiento de sonido sobre señales de audio de entrada que contienen una pluralidad de componentes de señal que son diferentes en condiciones de procesamiento de sonido deseadas, de manera que permite la reproducción del sonido natural. La señal de audio de entrada se separa en una pluralidad de componentes de señal separadas, y cada componente de señal se somete a un procesamiento de sonido individual, incluyendo por ejemplo análisis espectral, y la pluralidad de componentes de señal separadas se emiten como al menos una señal de audio. La pluralidad de componentes de señal separadas se sintetizan para dar una señal de audio sintetizada, o la pluralidad de componentes de señal separadas se emiten por separado como señales de audio. El método es útil para la radiodifusión en directo, en la que la señal de audio de entrada contiene una componente de sonido ambiente y una componente de habla en el acto. También es útil para ayudar a personas con una mala función auditiva.
El objeto de la presente invención es proporcionar un concepto mejorado para el procesamiento de audio espacial.
Este objeto se consigue mediante un aparato según la reivindicación 1 y un método según la reivindicación 11.
Es un hallazgo de la presente invención que una señal de audio puede descomponerse en varias componentes a las que puede estar adaptada una transformación espacial, por ejemplo, en cuanto a una decorrelación o en cuanto a un enfoque de panorámica de amplitud. Dicho de otro modo, la presente invención se basa en el hallazgo de que, por ejemplo, en un escenario con múltiples fuentes de audio, las fuentes de primer plano y de segundo plano pueden distinguirse y transformarse o decorrelacionarse de manera diferente. Generalmente pueden distinguirse diferentes extensiones y/o profundidades espaciales de objetos de audio.
Uno de los puntos clave de la presente invención es la descomposición de señales, como el sonido que se origina de un público que aplaude, una bandada de pájaros, una orilla del mar, caballos galopando, una división de soldados marchando, etc. en una parte de primer plano y una de segundo plano, de modo que la parte de primer plano contiene eventos auditivos individuales originados de, por ejemplo, fuentes cercanas y la parte de segundo plano contiene el ambiente de los eventos lejanos fusionados perceptivamente. Antes del mezclado final, estas dos partes de señal se procesan por separado, por ejemplo, con el fin de sintetizar la correlación, transformar una escena, etc.
Las realizaciones no se limitan a distinguir sólo las partes de primer plano y de segundo plano de la señal, puede distinguir múltiples partes de audio diferentes, que pueden transformarse o decorrelacionarse todas de manera diferente.
En general, las señales de audio pueden descomponerse en n partes semánticas diferentes mediante las realizaciones, que se procesan por separado. La descomposición/el procesamiento separado de componentes semánticas diferentes puede llevarse a cabo en el domino de tiempo y/o de frecuencia mediante las realizaciones.
Las realizaciones pueden proporcionar la ventaja de una calidad de percepción superior del sonido transformado a un coste de cálculo moderado. Las realizaciones proporcionan con ello un método de decorrelación/transformación novedoso que ofrece una calidad de percepción elevada a costes moderados, especialmente para material de audio crítico similar a aplausos u otro material de ambiente similar como, por ejemplo, el ruido que se emite por una bandada de pájaros, una orilla del mar, caballos galopando, una división de soldados marchando, etc.
Las realizaciones de la presente invención se detallarán con la ayuda de las figuras adjuntas, en las que
la figura 1a muestra un aparato para determinar una señal de audio multicanal de audio
- espacial;
- la figura 1b
- muestra un dia grama de bloque s de otro apara to;
- la figura 2
- muestra un aparato que ilustra una multiplicidad de señales
descompuestas;
la figura 3 ilustra una realización de la invención con una descomposición semántica de primera plano y una de segundo plano;
la figura 4 ilustra un ejemplo de un método de separación transitoria para obtener una componente de señal de segundo plano;
la figura 5 ilustra una síntesis de fuentes de sonido que tienen espacialmente una gran extensión;
la figura 6 ilustra una aplicación del estado de la técnica de un decorrelacionador en dominio de tiempo en una mezcladora en sentido ascendente de mono a estéreo; y
la figura 7 muestra otra aplicación del estado de la técnica de un decorrelacionador en dominio de frecuencia en un escenario de mezcladora en sentido ascendente de mono a estéreo.
La figura 1 muestra un aparato 100 para determinar una señal de audio multicanal de salida espacial basándose en una señal de audio de entrada. En algunas realizaciones, el aparato puede estar adaptado para basar adicionalmente la señal de audio multicanal de salida espacial en un parámetro de entrada. El parámetro de entrada puede generarse localmente o proporcionarse con la señal de audio de entrada, por ejemplo, como información complementaria.
En la figura 1, el aparato 100 comprende un descomponedor 110 para descomponer la señal de audio de entrada para obtener una primera señal descompuesta que tiene una primera propiedad semántica y una segunda señal descompuesta que tiene una segunda propiedad semántica que es diferente de la primera propiedad semántica.
El aparato 100 comprende además un transformador 120 para transformar la primera señal descompuesta usando una primera característica de transformación para obtener una primera señal transformada que tiene la primera propiedad semántica y para transformar la segunda señal descompuesta usando una segunda característica de transformación para obtener una segunda señal transformada que tiene la segunda propiedad semántica.
Una propiedad semántica puede corresponder a una propiedad espacial, tal como cerca o lejos, enfocada o amplia, y/o a una propiedad dinámica tal como por ejemplo si una señal es tonal, estacionaria o transitoria y/o a una propiedad de dominancia tal como por ejemplo si la señal es de primer plano o de segundo plano, a una medida de las mismas respectivamente.
Además, el aparato 100 comprende un procesador 130 para procesar la primera señal transformada y la segunda señal transformada para obtener la señal de audio multicanal de salida espacial.
Dicho de otro modo, el descomponedor 110 está adaptado para descomponer la señal de audio de entrada, En algunas realizaciones, basándose en el parámetro de entrada. La descomposición de la señal de audio de entrada está adaptada a las propiedades semánticas, por ejemplo espaciales, de diferentes partes de la señal de audio de entrada. Además, la transformación llevada a cabo por el transformador 120 según las características de transformación primera y segunda también puede estar adaptada a las propiedades espaciales, lo que permite, por ejemplo en un escenario en el que la primera señal descompuesta corresponde a una señal de audio de segundo plano y la segunda señal descompuesta corresponde a una señal de audio de primer plano, una transformación diferente o pueden aplicarse decorrelacionadores, al revés respectivamente. En lo sucesivo el término “de primer plano” se entiende que se refiere a un objeto de audio que es dominante en un entorno de audio, de modo que un posible oyente notaría un objeto de audio de primer plano. Una fuente u objeto de audio de primer plano puede distinguirse o diferenciarse de una fuente u objeto de audio de segundo plano. Una fuente u objeto de audio de segundo plano puede no poder notarse por un posible oyente en un entorno de audio ya que es menos dominante que una fuente u objeto de audio de primer plano. En las realizaciones las fuentes u objetos de audio de primer plano pueden ser, pero no se limitan a, una fuente de audio de tipo puntual, pudiendo corresponder las fuentes u objetos de audio de segundo plano a fuentes u objetos de audio espacialmente más lejanos.
Dicho de otro modo, en las realizaciones la primera característica de transformación puede basarse en o hacerse coincidir con la primera propiedad semántica y la segunda característica de transformación puede basarse en o hacer coincidir con la segunda propiedad semántica. En una realización, la primera propiedad semántica y la primera característica de transformación corresponden a una fuente u objeto de audio de primer plano y el transformador 120 puede estar adaptado para aplicar una panorámica de amplitud a la primera señal descompuesta. El transformador 120 puede estar adaptado entonces adicionalmente para proporcionar como primera señal transformada dos versiones con panorámica de amplitud de la primera señal descompuesta. En esta realización, la segunda propiedad semántica y la segunda característica de transformación corresponden a una fuente u objeto de audio de segundo plano, una pluralidad de los mismos respectivamente, y el transformador 120 puede estar adaptado para aplicar una decorrelación a la segunda señal descompuesta y proporcionar como segunda señal transformada la segunda señal descompuesta y la versión decorrelacionada de la misma.
El transformador 120 puede estar adaptado adicionalmente para transformar la primera señal descompuesta de modo que la primera característica de transformación no tenga una característica de introducción de retardo. Dicho de otro modo, puede no haber decorrelación de la primera señal descompuesta. En otro caso, la primera característica de transformación puede tener una característica de introducción de retardo que tiene una primera cantidad de retardo y la segunda característica de transformación puede tener una segunda cantidad de retardo, siendo la segunda cantidad de retardo mayor que la primera cantidad de retardo. Dicho de otro modo, tanto la primera señal descompuesta como la segunda señal descompuesta pueden estar decorrelacionadas, sin embargo, el nivel de decorrelación puede ajustarse a escala con la cantidad de retardo introducido a las respectivas versiones decorrelacionadas de las señales descompuestas. Por tanto, la decorrelación puede ser más fuerte para la segunda señal descompuesta que para la primera señal descompuesta.
En las realizaciones, la primera señal descompuesta y la segunda señal descompuesta pueden solaparse y/o pueden ser síncronas en el tiempo. Dicho de otro modo, el procesamiento de señales puede llevarse a cabo por bloques, pudiendo subdividirse un bloque de muestras de señal de audio de entrada por el descomponedor 110 en varios bloques de señales descompuestas. En las realizaciones, el número de señales descompuestas pueden solaparse al menos parcialmente en el dominio de tiempo, es decir pueden representar muestras de dominio de tiempo solapantes. Dicho de otro modo, las señales descompuestas pueden corresponder a partes de la señal de audio de entrada, que se solapan, es decir que representan al menos parcialmente señales de audio simultáneas. En las realizaciones, las señales descompuestas primera y segunda pueden representar versiones filtradas o transformadas de una señal de entrada original. Por ejemplo, pueden representar partes de señal que se extraen de una señal espacial compuesta correspondiente por ejemplo a una fuente de sonido cercada o una fuente de sonido más distante. En otras realizaciones, pueden corresponder a componentes de señal transitorias y estacionarias, etc.
En las realizaciones, el transformador 120 puede subdividirse en un primer transformador y un segundo transformador, pudiendo estar adaptado el primer transformador para transformar la primera señal descompuesta y pudiendo estar adaptado el segundo transformador para transformar la segunda señal descompuesta. En las realizaciones, el transformador 120 puede implementarse en software, por ejemplo, como programa almacenado en una memoria que debe ejecutarse en un procesador o un procesador de señal digital que, a su vez, está adaptado para transformar las señales descompuestas secuencialmente.
El transformador 120 puede estar adaptado para decorrelacionar la primera señal descompuesta para obtener una primera señal decorrelacionada y/o para decorrelacionar la segunda señal descompuesta para obtener una segunda señal decorrelacionada. Dicho de otro modo, el transformador 120 puede estar adaptado para decorrelacionar ambas señales descompuestas, sin embargo, usando diferentes características de decorrelación o transformación. En las realizaciones, el transformador 120 puede estar adaptado para aplicar una panorámica de amplitud a una cualquiera de las señales descompuestas primera o segunda en lugar o además de una decorrelación.
El transformador 120 puede estar adaptado para transformar las señales transformadas primera y segunda que tienen cada una tantos componentes como canales en la señal de audio multicanal de salida espacial y el procesador 130 puede estar adaptado para combinar las componentes de las señales transformadas primera y segunda para obtener la señal de audio multicanal de salida espacial. En otras realizaciones, el transformador 120 puede estar adaptado para transformar las señales transformadas primera y segunda que tienen cada una menos componentes que la señal de audio multicanal de salida espacial y pudiendo estar adaptado el procesador 130 para mezclar en sentido ascendente las componentes de las señales transformadas primera y segunda para obtener la señal de audio multicanal de salida espacial.
La figura 1b muestra otro aparato 100, que comprende componentes similares a las introducidas con la ayuda de la figura 1a. Sin embargo, la figura 1b muestra un aparato que tiene más detalles. La figura 1b muestra un descomponedor 110 que recibe la señal de audio de entrada y opcionalmente el parámetro de entrada. Como puede observarse a partir de la figura 1b, el descomponedor está adaptado para proporcionar una primera señal descompuesta y una segunda señal descompuesta a un transformador 120, lo que se indica mediante las líneas discontinuas. En el aparato mostrado en la figura 1b, se supone que la primera señal descompuesta corresponde a una fuente de audio de tipo puntual como primera propiedad semántica y que el transformador 120 está adaptado para aplicar una panorámica de amplitud como primera característica de transformación a la primera señal descompuesta. En las realizaciones, las señales descompuestas primera y segunda son intercambiables, es decir en otras realizaciones puede aplicarse una panorámica de amplitud a la segunda señal descompuesta.
En el aparato representado en la figura 1b, el transformador 120 muestra, en el trayecto de señal de la primera señal descompuesta, dos amplificadores 121 y 122 ajustables a escala, que están adaptados para amplificar dos copias de la primera señal descompuesta de manera diferente. Los diferentes factores de amplificación usados pueden determinarse, en las realizaciones, a partir del parámetro de entrada, en otras realizaciones, pueden determinarse a partir de la señal de audio de entrada, ya esté preestablecida o se genere localmente, posiblemente también haciendo referencia a una entrada de usuario. Las salidas de los dos amplificadores 121 y 122 ajustables a escala se proporcionan al procesador 130, para el que se proporcionan detalles más adelante.
Como puede observarse a partir de la figura 1b, el descomponedor 110 proporciona una segunda señal descompuesta al transformador 120, que lleva a cabo una transformación diferente en el trayecto de procesamiento de la segunda señal descompuesta. En otras realizaciones, la primera señal descompuesta puede procesarse en el trayecto descrito en este momento además o en lugar de la segunda señal descompuesta. Las señales descompuestas primera y segunda pueden intercambiarse en las realizaciones.
En el aparato representado en la figura 1b, en el trayecto de procesamiento de la segunda señal descompuesta, hay un decorrelacionador 123 seguido de un módulo 124 de rotador o estéreo paramétrico o de mezcla en sentido ascendente como segunda característica de transformación. El decorrelacionador 123 puede estar adaptado para decorrelacionar la segunda señal descompuesta X[k] y para proporcionar una versión decorrelacionada Q[k] de la segunda señal descompuesta al módulo 124 estéreo paramétrico o de mezcla en sentido ascendente. En la figura 1b, la señal mono X[k] se alimenta a la unidad 123 de decorrelacionador “D” así como el módulo 124 de mezcla en sentido ascendente. La unidad 123 de decorrelacionador puede crear la versión decorrelacionada Q[k] de la señal de entrada, que tiene las mismas características de frecuencia y la misma energía a largo plazo. El módulo 124 de mezcla en sentido ascendente puede calcular una matriz de mezcla ascendente basándose en los parámetros espaciales y sintetizar los canales de salida Y1[k] y Y2[k]. El módulo de mezcla en sentido ascendente puede explicarse según
siendo los parámetros cl, cr, � y � constantes, o valores variables en tiempo y en frecuencia estimados a partir de la señal de entrada X[k] de manera adaptativa, o transmitidos como información complementaria junto con la señal de entrada X[k] en forma de por ejemplo parámetros de ILD (ILD = Inter Channel Level Difference, diferencia de nivel intercanal) y parámetros de ICC (ICC = Inter Channel Correlation). La señal X[k] es la señal mono recibida, la señal Q[k] es la señal decorrelacionada, siendo una versión decorrelacionada de la señal de entrada X[k]. Las señales de salida se designan con Y1[k] y Y2[k].
El decorrelacionador 123 puede implementarse como un filtro de IIR (IIR = Infinite Impulse Response, respuesta infinita al impulso), un filtro de FIR arbitrario (FIR = Finite Impulse Response, respuesta finita al impulso) o un filtro de FIR especial que usa una única toma para retardar de manera simple la señal.
Los parámetros cl, cr, \pueden determinarse de diferentes maneras. En algunas realizaciones, se determinan de manera simple mediante parámetros de entrada, que pueden proporcionarse junto con la señal de audio de entrada, por ejemplo, con los datos de mezcla en sentido descendente como información complementaria. En otras realizaciones, pueden generarse localmente o derivarse de propiedades de la señal de audio de entrada.
En el aparato mostrado en la figura 1b, el transformador 120 está adaptado para proporcionar la segunda señal transformada en cuanto a las dos señales de salida Y1[k] y Y2[k] del módulo 124 de mezcla en sentido ascendente al procesador 130.
Según el trayecto de procesamiento de la primera señal descompuesta, las dos versiones con panorámica de amplitud de la primera señal descompuesta, disponibles de las salidas de los dos amplificadores 121 y 122 ajustables a escala, también se proporcionan al procesador 130. En otras realizaciones, los amplificadores 121 y 122 ajustables a escala pueden estar presentes en el procesador 130, pudiendo proporcionarse sólo la primera señal descompuesta y un factor de panorámica por el transformador 120.
Como puede observarse en la figura 1b, el procesador 130 puede estar adaptado para procesar o combinar la primera señal transformada y la segunda señal transformada, en esta realización combinando simplemente las salidas con el fin de proporcionar una señal estéreo que tiene un canal izquierdo L y un canal derecho R que corresponde a la señal de audio multicanal de salida espacial de la figura 1a.
En el aparato en la figura 1b, en ambos trayectos de señalización, se determinan los canales izquierdo y derecho para una señal estéreo. En el trayecto de la primera señal descompuesta, se lleva a cabo una panorámica de amplitud mediante los dos amplificadores 121 y 122 ajustables a escala, por tanto, las dos componentes dan como resultado dos señales de audio en fase, que se ajustan a escala de manera diferente. Esto corresponde a una impresión de una fuente de audio de tipo puntual como propiedad semántica o característica de transformación.
En el trayecto de procesamiento de señales de la segunda señal descompuesta, las señales de salida Y1[k] y Y2[k] se proporcionan al procesador 130 que corresponde a los canales izquierdo y derecho tal como se determina mediante el módulo 124 de mezcla en sentido ascendente. Los parámetros cl, cr, y � determinan la lejanía espacial de la fuente de audio correspondiente. Dicho de otro modo, los parámetros cl, cr, \pueden elegirse de un modo o intervalo tal, que para los canales L y R cualquier correlación entre una correlación máxima y una correlación mínima pueda obtenerse en el segundo trayecto de procesamiento de señales como segunda característica de transformación. Además, esto puede llevarse a cabo independientemente para diferentes bandas de frecuencia. Dicho de otro modo, los parámetros cl, cr, \pueden elegirse de un modo o intervalo tal, que los canales L y R estén en fase, modelizando una fuente de audio de tipo puntual como propiedad semántica.
Los parámetros cl, cr, \también pueden elegirse de un modo o intervalo tal, que los canales L y R en el segundo trayecto de procesamiento de señales estén decorrelacionados, modelizando una fuente de audio espacialmente bastante distribuida como propiedad semántica, por ejemplo modelizando una fuente de sonido de segundo plano o espacialmente más lejana.
La figura 2 ilustra otro aparato, que es más general. La figura 2 muestra un bloque 210 de descomposición semántica, que corresponde al descomponedor 110. La salida de la descomposición 210 semántica es la entrada de una fase 220 de transformación, que corresponde al transformador 120. La fase 220 de transformación se compone de varios transformadores 221 a 22n individual, es decir la fase 210 de descomposición semántica está adaptada para descomponer una señal de entrada mono/estéreo en n señales descompuestas, que tienen n propiedades semánticas. La descomposición puede llevarse a cabo basándose en parámetros que controlan la descomposición, que pueden proporcionarse junto con la señal de entrada mono/estéreo, ya esté preestablecida, se genere localmente o se introduzca por un usuario, etc.
Dicho de otro modo, el descomponedor 110 puede estar adaptado para descomponer la señal de audio de entrada semánticamente basándose en el parámetro de entrada opcional y/o para determinar el parámetro de entrada a partir de la señal de audio de entrada.
La salida de la fase 220 de decorrelación o de transformación se proporciona entonces a un bloque 230 de mezcla en sentido ascendente, que determina una salida multicanal basándose en las señales decorrelacionadas o transformadas y opcionalmente basándose en parámetros controlados mediante mezcla en sentido ascendente.
Generalmente, las realizaciones pueden separar el material sonoro en n componentes semánticas diferentes y decorrelacionar cada componente por separado con un decorrelacionador asociado, que también se indican con D1 aDn en la figura 2. Dicho de otro modo, en las realizaciones las características de transformación pueden hacerse coincidir con las propiedades semánticas de las señales descompuestas. Cada uno de los decorrelacionadores o transformadores puede estar adaptado para las propiedades semánticas de la componente de señal descompuesta de manera correspondiente. Posteriormente, las componentes procesadas pueden mezclarse para obtener la señal multicanal de salida. Las diferentes componentes pueden corresponder, por ejemplo, a objetos de modelizado de primer plano y de segundo plano.
Dicho de otro modo, el transformador 110 puede estar adaptado para combinar la primera señal descompuesta y la primera señal decorrelacionada para obtener una señal de mezcla en sentido ascendente estéreo o multicanal como primera señal transformada y/o para combinar la segunda señal descompuesta y la segunda señal decorrelacionada para obtener una señal de mezcla en sentido ascendente estéreo como segunda señal transformada.
Además, el transformador 120 puede estar adaptado para transformar la primera señal descompuesta según una característica de audio de segundo plano y/o para transformar la segunda señal descompuesta según una característica de audio de primer plano o viceversa.
Puesto que, por ejemplo, señales similares a aplausos pueden observarse como compuestas de palmadas cercanas individuales distintas y un ambiente similar a ruido originado a partir de palmadas lejanas muy densas, una descomposición adecuada de tales señales puede obtenerse distinguiendo entre eventos de palmada de primer plano aislados como una componente y un segundo plano similar a ruido como la otra componente. Dicho de otro modo, en una realización, n=2. En una realización de este tipo, por ejemplo, el transformador 120 puede estar adaptado para transformar la primera señal descompuesta mediante una panorámica de amplitud de la primera señal descompuesta. Dicho de otro modo, la correlación o transformación de la componente de palmada de primer plano puede conseguirse, en las realizaciones, en D1 mediante una panorámica de amplitud de cada evento individual hasta su ubicación original estimada.
En las realizaciones, el transformador 120 puede estar adaptado para transformar la primera y/o segundo señal descompuesta, por ejemplo, sometiendo a filtrado todo paso la primera o segunda señal descompuesta para obtener la primera o segunda señal decorrelacionada.
Dicho de otro modo, en las realizaciones, los antecedentes puede decorrelacionarse o transformarse mediante el uso de m filtros D21...m todo paso independientes entre sí. En las realizaciones, sólo el segundo plano cuasi estacionario puede procesarse mediante los filtros todo paso, pudiendo evitarse de esta manera los efectos de difuminado temporal de los métodos de decorrelación del estado de la técnica. Dado que la panorámica de amplitud puede aplicarse a los eventos del objeto de primer plano, la densidad de aplausos de primera plano original puede restaurarse aproximadamente a diferencia del sistema del estado de la técnica tal como se presenta, por ejemplo, en el artículo corto J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, “High-Quality Parametric Spatial Audio Coding at Low Bitrates” en 116ª Convención de AES, Berlín, preimpresión 6072, mayo de 2004 y J. Herre, K. Kjörling, J. Breebaart, et al., “MPEG Surround -the ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding” en Procedimientos de la 122ª Convención de AES, Viena, Austria, mayo de 2007.
Dicho de otro modo, en las realizaciones, el descomponedor 110 puede estar adaptado para descomponer la señal de audio de entrada semánticamente basándose en el parámetro de entrada, pudiendo proporcionarse el parámetro de entrada junto con la señal de audio de entrada como, por ejemplo, información complementaria. En una realización de este tipo, el descomponedor 110 puede estar adaptado para determinar el parámetro de entrada a partir de la señal de audio de entrada. En otras realizaciones, el descomponedor 110 puede estar adaptado para determinar el parámetro de entrada como parámetro de control independiente de la señal de audio de entrada, que puede generarse localmente, estar preestablecida o también puede introducirse por un usuario.
En las realizaciones, el transformador 120 puede estar adaptado para obtener una distribución espacial de la primera señal transformada o la segunda señal transformada aplicando una panorámica de amplitud de banda. Dicho de otro modo, según la descripción de la figura 1b anterior, en lugar de generar una fuente de tipo puntual, la ubicación de panorámica de la fuente puede variarse temporalmente con el fin de generar una fuente de audio que tenga una determinada distribución espacial. En las realizaciones, el transformador 120 puede estar adaptado para aplicar el ruido de paso bajo generado localmente para una panorámica de amplitud, es decir los factores de ajuste a escala para la panorámica de amplitud para, por ejemplo, los amplificadores 121 y 122 ajustables a escala en la figura 1b corresponden a un valor de ruido generado localmente, es decir son variables en el tiempo con un determinado ancho de banda.
Las realizaciones pueden estar adaptadas para hacerse funcionar en un modo guiado o uno no guiado. Por ejemplo, en un escenario guiado, haciendo referencia a las líneas discontinuas, por ejemplo en la figura 2, la decorrelación puede llevarse a cabo aplicando filtros de decorrelación de tecnología convencional controlados en una cuadrícula de tiempo gruesa a, por ejemplo, sólo la parte de segundo plano o ambiente y obtener la correlación mediante la redistribución de cada evento individual en, por ejemplo, la parte de primer plano por medio de posicionamiento espacial variable en el tiempo usando una panorámica de amplitud de banda ancha en una cuadrícula de tiempo mucho más fina. Dicho de otro modo, en las realizaciones, el transformador 120 puede estar adaptado para hacer funcionar los decorrelacionadores para diferentes señales descompuestas en diferentes cuadrículas de tiempo, por ejemplo basándose en diferentes escalas de tiempo, lo que puede ser en cuanto a diferentes tasas de muestreo o un retardo diferente para los respectivos decorrelacionadores. En una realización, a la hora de llevar a cabo la separación de primera plano y de segundo plano, la parte de primer plano puede usar una panorámica de amplitud, mientras que la amplitud se cambia en una cuadrícula de tiempo mucho más fina que el funcionamiento para un decorrelacionador con respecto a la parte de segundo plano.
Además, se enfatiza que para la decorrelación de, por ejemplo, señales similares a aplausos, es decir señales con una calidad aleatoria cuasi estacionaria, la posición espacial exacta de cada palmada de primer plano individual puede no ser de importancia tan crucial, como la recuperación de la distribución global de la multitud de eventos de palmada. Las realizaciones pueden aprovechar este hecho y pueden funcionar en un modo no guiado. En un modo de este tipo, el factor de panorámica de amplitud mencionado anteriormente puede controlarse mediante el ruido de paso bajo según la invención. La figura 3 ilustra un sistema de mono a estéreo que implementa el escenario. La figura 3 muestra un bloque 310 de descomposición semántica que corresponde al descomponedor 110 para descomponer la señal de entrada mono en una parte de señal descompuesta de primera plano y de segundo plano.
Como puede observarse a partir de la figura 3, la parte descompuesta de segundo plano de la señal se transforma mediante el filtro 320 todo paso D1. La señal decorrelacionada se proporciona entonces junto con la parte descompuesta de segundo plano no transformada a la mezcla 330 en sentido ascendente, que corresponde al procesador 130. La parte de señal descompuesta de primer plano se proporciona a una fase 340 de panorámica de amplitud D2, que corresponde al transformador 120. El ruido 250 de paso bajo generado localmente también se proporciona a la fase 340 de panorámica de amplitud, que puede proporcionar entonces la señal descompuesta de primer plano en una configuración con panorámica de amplitud a la mezcla 330 en sentido ascendente. La fase 340 de panorámica de amplitud D2 puede determinar su salida proporcionando un factor de ajuste a escala k para una selección de amplitud entre dos de un conjunto estéreo de canales de audio. El factor de ajuste a escala k puede basarse en el ruido de paso bajo.
Como puede observarse a partir de la figura 3, hay una flecha entre la panorámica 340 de amplitud y la mezcla 330 en sentido ascendente. Esta flecha también puede representar señales con panorámica de amplitud, es decir en el caso de la mezcla en sentido ascendente estéreo, ya el canal izquierdo y el derecho. Como puede observarse a partir de la figura 3, la mezcla 330 en sentido ascendente que corresponde al procesador 130 está adaptada entonces para procesar o combinar las señales descompuestas de segundo plano y de primer plano para derivar la salida estéreo.
Otras realizaciones pueden usar procesamiento nativo con el fin de derivar señales descompuestas de segundo plano y de primer plano o parámetros de entrada para la descomposición. El descomponedor 110 puede estar adaptado para determinar la primera señal descompuesta y/o la segunda señal descompuesta basándose en un método de separación transitoria. Dicho de otro modo, el descomponedor 110 puede estar adaptado para determinar la primera o segunda señal descompuesta basándose en un método de separación y la otra señal descompuesta basándose en la diferencia entre la primera señal descompuesta determinada y la señal de audio de entrada. En otras realizaciones, la primera o segunda señal descompuesta puede determinarse basándose en el método de separación transitoria y la otra señal descompuesta puede basarse en la diferencia entre la primera o segunda señal descompuesta y la señal de audio de entrada.
El descomponedor 110 y/o el transformador 120 y/o el procesador 130 pueden comprender una fase de monosíntesis de DirAC y/o una fase de síntesis de DirAC y/o una fase de fusión de DirAC. En las realizaciones, el descomponedor 110 puede estar adaptado para descomponer la señal de audio de entrada, el transformador 120 puede estar adaptado para transformar las señales descompuestas primera y/o segunda, y/o el procesador 130 puede estar adaptado para procesar las señales transformadas primera y/o segunda en cuanto a diferentes bandas de frecuencia.
Las realizaciones pueden usar la siguiente aproximación para señales similares a aplausos. Aunque las componentes de primer plano pueden obtenerse mediante métodos de separación o detección transitoria, véase Pulkki, Ville; “Spatial Sound Reproducción with Directional Audio Coding” en J. Audio Eng. Soc., vol. 55, n.º 6, 2007, la componente de segundo plano puede venir dada por la señal residual. La figura 4 representa un ejemplo de un método adecuado para obtener una componente de segundo plano x’(n) de, por ejemplo, una señal similar a aplausos x(n) para implementar la descomposición 310 semántica en la figura 3, es decir una realización del descomponedor 120. La figura 4 muestra una señal de entrada diferenciada en el tiempo x(n), que es una entrada para una DFT 410 (DFT = Discrete Fourier Transform, transformada discreta de Fourier). La salida del bloque 410 de DFT se proporciona a un bloque para suavizar el espectro 420 y a un bloque 430 de blanqueamiento espectral para el blanqueamiento espectral basándose en la salida de la DFT 410 y la salida de la fase 430 de espectro suave.
La salida de la fase 430 de blanqueamiento espectral se proporciona entonces a una fase 440 de detección de picos espectrales, que separa el espectro y proporciona dos salidas, es decir una señal residual transitoria y de ruido y una señal tonal. La señal residual transitoria y de ruido se proporciona a un filtro 450 de LPC (LPC = Linear Prediction Coding, codificación predictiva lineal) de la que se proporciona la señal de ruido residual a la fase 460 de mezclado junto con la señal tonal como salida de la fase 440 de detección de picos espectrales. La salida de la fase 460 de mezclado se proporciona entonces a una fase 470 de conformación espectral, que conforma el espectro basándose en el espectro suavizado proporcionado por la fase 420 de espectro suavizado. La salida de la fase 470 de conformación espectral se proporciona entonces al filtro 480 de síntesis, es decir una inversa de la transformada discreta de Fourier con el fin de obtener x’(n) que representa la componente de segundo plano. La componente de primer plano puede derivarse entonces como la diferencia entre la señal de entrada y la señal de salida, es decir como x(n)-x’(n).
Las realizaciones de la presente invención pueden hacerse funcionar en aplicaciones de realidad virtual tales como, por ejemplo, juegos en 3D. En tales aplicaciones, la síntesis de fuentes de sonido con una gran extensión espacial puede ser complicada y compleja cuando se basa en conceptos convencionales. Tales recursos pueden, por ejemplo, ser una orilla del mar, una bandada de pájaros, caballos galopando, la división de soldados marchando o un público que aplaude. Normalmente, tales eventos de sonido están espaciados como un grupo grande de fuentes de tipo puntual, lo que conduce a implementaciones computacionalmente complejas, véase Wagner, Andreas; Walther, Andreas; Melchoir, Frank; Strauß, Michael; “Generation of Highly Immersive Atmospheres for Wave Field Synthesis Reproduction” en la 116ª Convención internacional de EAS, Berlín, 2004.
Las realizaciones pueden llevar a cabo un método, que realiza la síntesis de la extensión de fuentes de sonido de manera plausible pero que tiene, al mismo tiempo, una complejidad estructural y computacional inferior. Las realizaciones pueden basarse en DirAC (DirAC = Directional Audio Coding), véase Pulkki, Ville; “Spatial Sound Reproduction with Directional Audio Coding” en J. Audio Eng. Soc., vol. 55, n.º 6, 2007. Dicho de otro modo, en las realizaciones, el descomponedor 110 y/o el transformador 120 y/o el procesador 130 pueden estar adaptados para procesar señales de DirAC. Dicho de otro modo, el descomponedor 110 puede comprender fases de monosíntesis de DirAC, el transformador 120 puede comprender una fase de síntesis de DirAC y/o el procesador puede comprender una fase de fusión de DirAC.
Las realizaciones pueden basarse en procesamiento de DirAC, por ejemplo, usando sólo dos estructuras de síntesis, por ejemplo, una para fuentes de sonido de primer plano y una para fuentes de sonido de segundo plano. El sonido de primer plano puede aplicarse a un flujo de DirAC individual con datos direccionales controlados, dando como resultado la percepción de fuentes de tipo puntual cercanas. El sonido de segundo plano también puede reproducirse usando un único flujo directo con datos direccionales controlados de manera diferente, lo que conduce a la percepción de objetos de sonido diseminados espacialmente. Los dos flujos de DirAC pueden entonces fusionarse y decodificarse para una configuración de altavoces arbitraria o para auriculares, por ejemplo.
La figura 5 ilustra una síntesis de fuentes de sonido que tiene una espacialmente grande. La figura 5 muestra un bloque 610 de monosíntesis superior, que crea un flujo de mono-DirAC que conduce a una percepción de una fuente de sonido de tipo puntual cercana, tal como las palmadas más cercanas de un público. El bloque 620 de monosíntesis inferior se usa para crear un flujo de mono-DirAC que conduce a la percepción de sonido diseminado espacialmente, lo que es adecuado, por ejemplo, para generar sonido de segundo plano como el sonido de palmadas del público. Las salidas de los dos bloques 610 y 620 de monosíntesis de DirAC se fusionan entonces en la fase 630 de fusión de DirAC. La figura 5 muestra que sólo se usan dos bloques 610 y 620 de síntesis de DirAC. Uno de ellos se usa para crear los eventos de sonidos que están en el primer plano, tal como los pájaros cercanos o más cercanos o las personas cercanas o más cercanas en un público que aplaude y el otro genera un sonido de segundo plano, el sonido continuo de la bandada de pájaros, etc.
El sonido de primer plano se convierte en un flujo de mono-DirAC con el bloque 610 de monosíntesis de DirAC de una manera tal que los datos acimutales se mantienen constantes con la frecuencia, sin embargo, cambian aleatoriamente o se controlan mediante un proceso externo en el tiempo. El parámetro de difusividad 'se establece a 0, es decir representando una fuente de tipo puntual. Se supone que la entrada de audio al bloque 610 son sonidos temporalmente no solapantes, tales como distintos reclamos de pájaros o palmadas con las manos, que generan la percepción de fuentes de sonido cercanas, tales como pájaros o personas que aplauden. La extensión espacial de los eventos de sonido de primer plano se controla ajustando 8y 8intervalo_primer plano, lo que significa que los eventos de sonido individuales se percibirán en la dirección 8+ 8intervalo_primer plano, sin embargo, un único evento puede percibirse como puntual. Dicho de otro modo, se generan fuentes de sonido de tipo puntual en las que las posibles posiciones del punto están limitadas
al intervalo 8±8intervalo_primer plano.
El bloque 620 de segundo plano adopta como flujo de audio de entrada una señal, que contiene todos los demás eventos de sonido no presentes en el flujo de audio de primer plano, lo que pretende incluir muchos eventos de sonido temporalmente solapantes, por ejemplo cientos de pájaros o un gran número de personas lejanas que aplauden. Los valores acimutales asociados se fijan entonces aleatoriamente tanto en tiempo como en frecuencia, dentro de los valores acimutales restringidos facilitados 8±8intervalo_primer plano. Por tanto, la extensión espacial de los sonidos de segundo plano puede sintetizarse con una complejidad computacional baja. También puede controlarse la difusividad '. Si se añadió, el decodificador de DirAC aplicaría el sonido a todas las direcciones, lo que puede usarse cuando la fuente
5 de sonido envuelve totalmente al oyente. Si no lo envuelve, la difusividad puede mantenerse baja o próxima a cero, o cero en las realizaciones.
Las realizaciones de la presente invención pueden proporcionar la ventaja de que puede conseguirse una calidad de percepción superior de sonidos transformados a un coste computacional moderado. Las realizaciones pueden permitir una implementación modular de transformación de sonido espacial tal como se muestra, por ejemplo, en la figura 5.
10 Dependiendo de determinados requisitos de implementación de los métodos inventivos, los métodos inventivos pueden implementarse en hardware o en software. La implementación can puede realizarse usando un medio de almacenamiento digital y, particularmente, una memoria flash, un disco, un DVD o un CD que tiene señales de control legibles electrónicamente almacenadas en el mismo, que coopera con el sistema informático programable, de modo que se realicen los métodos inventivos. Generalmente, la presente invención es, por tanto, un producto de programa
15 informático con un código de programa almacenado en una portadora legible por máquina, siendo el código de programa operativo para realizar los métodos inventivos cuando se ejecuta en un ordenador el producto de programa informático. Dicho de otro modo, los métodos inventivos son, por tanto, un programa informático que tiene un código de programa para realizar al menos uno de los métodos inventivos cuando se ejecuta el programa informático en un ordenador.
Claims (12)
- REIVINDICACIONES1. Aparato (100) para determinar una señal de audio multicanal de salida espacial basándose en una señal de audio de entrada, que comprende:un descomponedor (110) semántico configurado para descomponer la señal de audio de entrada para obtener una primera señal descompuesta que tiene una primera propiedad semántica, siendo la primera señal descompuesta una parte de señal de primer plano, y una segunda señal descompuesta que tiene una segunda propiedad semántica que es diferente de la primera propiedad semántica, siendo la segunda señal descompuesta una parte de señal de segundo plano;un transformador (120) configuradopara transformar la parte de señal de primer plano usando la panorámica de amplitud como primera característica de transformación para obtener una primera señal transformada que tiene la primera propiedad semántica, comprendiendo el transformador (120) una fase (221, 340) de panorámica de amplitud para procesar la parte de señal de primer plano, en la que se proporciona ruido (350) de paso bajo generado localmente a la fase (340) de panorámica de amplitud para variar temporalmente una ubicación de panorámica de una fuente de audio en la parte de señal de primer plano; ypara transformar la parte de señal de segundo plano decorrelacionando la segunda señal descompuesta como segunda característica de transformación para obtener una segunda señal transformada que tiene la segunda propiedad semántica; yun procesador (130, 330) configurado para procesar la primera señal transformada y la segunda señal transformada para obtener la señal de audio multicanal de salida espacial.
-
- 2.
- Aparato (100) según la reivindicación 1, en el que la primera característica de transformación se basa en la primera propiedad semántica y la segunda característica de transformación se basa en la segunda propiedad semántica.
-
- 3.
- Aparato (100) según la reivindicación 1 ó 2, en el que el transformador (120) está adaptado para transformar las señales transformadas primera y segunda que tienen cada una tantos componentes como canales en la señal de audio multicanal de salida espacial y el procesador (130) está adaptado para combinar las componentes de las señales transformadas primera y segunda para obtener la señal de audio multicanal de salida espacial.
-
- 4.
- Aparato (100) según la reivindicación 1 ó 2, en el que el transformador (120) está adaptado para transformar las señales transformadas primera y segunda que tienen cada una menos componentes que la señal de audio multicanal de salida espacial y en el que el procesador (130) está adaptado para mezclar en sentido ascendente las componentes de las señales transformadas primera y segunda para obtener la señal de audio multicanal de salida espacial.
-
- 5.
- Aparato (100) según la reivindicación 1, en el que el descomponedor (110) está adaptado para determinar un parámetro de entrada como parámetro de control a partir de la señal de audio de entrada.
-
- 6.
- Aparato (100) según una de las reivindicaciones 1 a 5, en el que el transformador (120) está adaptado para transformar la primera señal descompuesta y la segunda señal descompuesta basándose en diferentes cuadrículas de tiempo.
-
- 7.
- Aparato (100) según una de las reivindicaciones 1 a 8, en el que el descomponedor (110) está adaptado para determinar la primera señal descompuesta y/o la segunda señal descompuesta basándose en un método de separación transitoria.
-
- 8.
- Aparato (100) según la reivindicación 7, en el que el descomponedor (110) está adaptado para determinar una de la primera señal descompuesta o la segunda señal descompuesta mediante un método de separación transitoria y la otra basándose en la diferencia entre ésta y la señal de audio de entrada.
-
- 9.
- Aparato (100) según una de las reivindicaciones 1 a 8, en el que el descomponedor (110) está adaptado para descomponer la señal de audio de entrada, el transformador (120) está adaptado para transformar las señales descompuestas primera y/o segunda, y/o el procesador (130) está adaptado para procesar las señales transformadas primera y/o segunda en cuanto a diferentes bandas de frecuencia.
-
- 10.
- Aparato según la reivindicación 1, en el que el procesador está configurado para procesar la primera señal transformada, la segunda señal transformada y la parte de señal de segundo plano para obtener la señal de audio multicanal de salida espacial.
-
- 11.
- Método para determinar una señal de audio multicanal de salida espacial basándose en una señal de audio de entrada y un parámetro de entrada que comprende las etapas de:
descomponer semánticamente la señal de audio de entrada para obtener una primera señal descompuesta que tiene una primera propiedad semántica, siendo la primera señal descompuesta una parte de señal de primer 5 plano, y una segunda señal descompuesta que tiene una segunda propiedad semántica que es diferente de la primera propiedad semántica, siendo la segunda señal descompuesta una parte de señal de segundo plano;transformar la parte de señal de primer plano usando la panorámica de amplitud para obtener una primera señal transformada que tiene la primera propiedad semántica, procesando la parte de señal de primer plano en una fase (221, 340) de panorámica de amplitud, en la que se proporciona ruido (350) de paso bajo generado10 localmente a la fase (340) de panorámica de amplitud para variar temporalmente una ubicación de panorámica de una fuente de audio en la parte de señal de primer plano;transformar la parte de señal de segundo plano decorrelacionando la segunda señal descompuesta para obtener una segunda señal transformada que tiene la segunda propiedad semántica; yprocesar la primera señal transformada y la segunda señal transformada para obtener la señal de audio 15 multicanal de salida espacial. - 12. Programa informático que tiene un código de programa para realizar el método según la reivindicación 11, cuando el código de programa se ejecuta en un ordenador o un procesador.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US8850508P | 2008-08-13 | 2008-08-13 | |
| US88505P | 2008-08-13 | ||
| EP08018793 | 2008-10-28 | ||
| EP08018793A EP2154911A1 (en) | 2008-08-13 | 2008-10-28 | An apparatus for determining a spatial output multi-channel audio signal |
| PCT/EP2009/005828 WO2010017967A1 (en) | 2008-08-13 | 2009-08-11 | An apparatus for determining a spatial output multi-channel audio signal |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2392609T3 true ES2392609T3 (es) | 2012-12-12 |
Family
ID=40121202
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES11187018.4T Active ES2545220T3 (es) | 2008-08-13 | 2009-08-11 | Un aparato para determinar una señal de audio de multi-canal de salida espacial |
| ES11187023.4T Active ES2553382T3 (es) | 2008-08-13 | 2009-08-11 | Un aparato y un método para generar datos de salida por ampliación de ancho de banda |
| ES09777815T Active ES2392609T3 (es) | 2008-08-13 | 2009-08-11 | Aparato para determinar una señal de audio multicanal de salida espacial |
Family Applications Before (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES11187018.4T Active ES2545220T3 (es) | 2008-08-13 | 2009-08-11 | Un aparato para determinar una señal de audio de multi-canal de salida espacial |
| ES11187023.4T Active ES2553382T3 (es) | 2008-08-13 | 2009-08-11 | Un aparato y un método para generar datos de salida por ampliación de ancho de banda |
Country Status (16)
| Country | Link |
|---|---|
| US (3) | US8824689B2 (es) |
| EP (4) | EP2154911A1 (es) |
| JP (3) | JP5425907B2 (es) |
| KR (5) | KR101456640B1 (es) |
| CN (3) | CN102348158B (es) |
| AU (1) | AU2009281356B2 (es) |
| BR (3) | BRPI0912466B1 (es) |
| CA (3) | CA2822867C (es) |
| CO (1) | CO6420385A2 (es) |
| ES (3) | ES2545220T3 (es) |
| MX (1) | MX2011001654A (es) |
| MY (1) | MY157894A (es) |
| PL (2) | PL2421284T3 (es) |
| RU (3) | RU2504847C2 (es) |
| WO (1) | WO2010017967A1 (es) |
| ZA (1) | ZA201100956B (es) |
Families Citing this family (74)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8107631B2 (en) * | 2007-10-04 | 2012-01-31 | Creative Technology Ltd | Correlation-based method for ambience extraction from two-channel audio signals |
| MX2011006186A (es) | 2008-12-11 | 2011-08-04 | Ten Forschung Ev Fraunhofer | Aparato para generar una señal de audio multicanal. |
| WO2010087627A2 (en) * | 2009-01-28 | 2010-08-05 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
| WO2011071928A2 (en) * | 2009-12-07 | 2011-06-16 | Pixel Instruments Corporation | Dialogue detector and correction |
| JP5753899B2 (ja) * | 2010-07-20 | 2015-07-22 | ファーウェイ テクノロジーズ カンパニー リミテッド | オーディオ信号合成器 |
| EP4645307B1 (en) | 2010-08-25 | 2026-04-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for encoding an audio signal having a plurality of channels |
| WO2012025580A1 (en) * | 2010-08-27 | 2012-03-01 | Sonicemotion Ag | Method and device for enhanced sound field reproduction of spatially encoded audio input signals |
| EP2541542A1 (en) * | 2011-06-27 | 2013-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal |
| US20140226842A1 (en) * | 2011-05-23 | 2014-08-14 | Nokia Corporation | Spatial audio processing apparatus |
| RU2595912C2 (ru) * | 2011-05-26 | 2016-08-27 | Конинклейке Филипс Н.В. | Аудиосистема и способ для нее |
| PL2727381T3 (pl) | 2011-07-01 | 2022-05-02 | Dolby Laboratories Licensing Corporation | Sposób i urządzenie do renderowania obiektów audio |
| KR101901908B1 (ko) * | 2011-07-29 | 2018-11-05 | 삼성전자주식회사 | 오디오 신호 처리 방법 및 그에 따른 오디오 신호 처리 장치 |
| EP2600343A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for merging geometry - based spatial audio coding streams |
| US9336792B2 (en) * | 2012-05-07 | 2016-05-10 | Marvell World Trade Ltd. | Systems and methods for voice enhancement in audio conference |
| US9190065B2 (en) | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
| PL2880654T3 (pl) | 2012-08-03 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder i sposób realizacji uogólnionej parametrycznej koncepcji kodowania przestrzennych obiektów audio dla przypadków wielokanałowego downmixu/upmixu |
| BR112015013154B1 (pt) | 2012-12-04 | 2022-04-26 | Samsung Electronics Co., Ltd | Aparelho fornecedor de áudio, e método fornecedor de áudio |
| WO2014112793A1 (ko) | 2013-01-15 | 2014-07-24 | 한국전자통신연구원 | 채널 신호를 처리하는 부호화/복호화 장치 및 방법 |
| US10068579B2 (en) | 2013-01-15 | 2018-09-04 | Electronics And Telecommunications Research Institute | Encoding/decoding apparatus for processing channel signal and method therefor |
| CN104010265A (zh) | 2013-02-22 | 2014-08-27 | 杜比实验室特许公司 | 音频空间渲染设备及方法 |
| US9332370B2 (en) * | 2013-03-14 | 2016-05-03 | Futurewei Technologies, Inc. | Method and apparatus for using spatial audio rendering for a parallel playback of call audio and multimedia content |
| WO2014171706A1 (ko) * | 2013-04-15 | 2014-10-23 | 인텔렉추얼디스커버리 주식회사 | 가상 객체 생성을 이용한 오디오 신호 처리 방법 |
| EP2806658B1 (en) * | 2013-05-24 | 2017-09-27 | Barco N.V. | Arrangement and method for reproducing audio data of an acoustic scene |
| CN105378826B (zh) | 2013-05-31 | 2019-06-11 | 诺基亚技术有限公司 | 音频场景装置 |
| KR102149046B1 (ko) * | 2013-07-05 | 2020-08-28 | 한국전자통신연구원 | 2차원 및 3차원 공간 상에서의 가상 음상 정위 방법 |
| EP2830054A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
| EP2830336A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Renderer controlled spatial upmix |
| CN105408955B (zh) * | 2013-07-29 | 2019-11-05 | 杜比实验室特许公司 | 用于降低去相关器电路中瞬态信号的时间伪差的系统和方法 |
| ES2641580T3 (es) | 2013-10-03 | 2017-11-10 | Dolby Laboratories Licensing Corporation | Generación de señal difusa adaptativa en un mezclador ascendente |
| KR102244379B1 (ko) * | 2013-10-21 | 2021-04-26 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성 |
| EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
| KR102231755B1 (ko) * | 2013-10-25 | 2021-03-24 | 삼성전자주식회사 | 입체 음향 재생 방법 및 장치 |
| CN103607690A (zh) * | 2013-12-06 | 2014-02-26 | 武汉轻工大学 | 一种3d音频中多声道信号的下混方法 |
| CN106416301B (zh) | 2014-03-28 | 2018-07-06 | 三星电子株式会社 | 用于渲染声学信号的方法和设备 |
| EP2942981A1 (en) | 2014-05-05 | 2015-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | System, apparatus and method for consistent acoustic scene reproduction based on adaptive functions |
| CA2953674C (en) * | 2014-06-26 | 2019-06-18 | Samsung Electronics Co. Ltd. | Method and device for rendering acoustic signal, and computer-readable recording medium |
| CN105336332A (zh) | 2014-07-17 | 2016-02-17 | 杜比实验室特许公司 | 分解音频信号 |
| EP2980789A1 (en) * | 2014-07-30 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhancing an audio signal, sound enhancing system |
| US10140996B2 (en) | 2014-10-10 | 2018-11-27 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
| US9984693B2 (en) * | 2014-10-10 | 2018-05-29 | Qualcomm Incorporated | Signaling channels for scalable coding of higher order ambisonic audio data |
| CA2963771A1 (en) * | 2014-10-16 | 2016-04-21 | Sony Corporation | Transmission device, transmission method, reception device, and reception method |
| CN107211227B (zh) | 2015-02-06 | 2020-07-07 | 杜比实验室特许公司 | 用于自适应音频的混合型基于优先度的渲染系统和方法 |
| CN105992120B (zh) | 2015-02-09 | 2019-12-31 | 杜比实验室特许公司 | 音频信号的上混音 |
| WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
| WO2016165776A1 (en) * | 2015-04-17 | 2016-10-20 | Huawei Technologies Co., Ltd. | Apparatus and method for driving an array of loudspeakers with drive signals |
| ES2769061T3 (es) | 2015-09-25 | 2020-06-24 | Fraunhofer Ges Forschung | Codificador y método para codificar una señal de audio con ruido de fondo reducido que utiliza codificación predictiva lineal |
| WO2018026963A1 (en) * | 2016-08-03 | 2018-02-08 | Hear360 Llc | Head-trackable spatial audio for headphones and system and method for head-trackable spatial audio for headphones |
| US10901681B1 (en) * | 2016-10-17 | 2021-01-26 | Cisco Technology, Inc. | Visual audio control |
| EP3324407A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
| EP3324406A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
| KR102580502B1 (ko) * | 2016-11-29 | 2023-09-21 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
| US10659906B2 (en) * | 2017-01-13 | 2020-05-19 | Qualcomm Incorporated | Audio parallax for virtual reality, augmented reality, and mixed reality |
| EP3382703A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
| GB2565747A (en) * | 2017-04-20 | 2019-02-27 | Nokia Technologies Oy | Enhancing loudspeaker playback using a spatial extent processed audio signal |
| US10416954B2 (en) * | 2017-04-28 | 2019-09-17 | Microsoft Technology Licensing, Llc | Streaming of augmented/virtual reality spatial audio/video |
| US11595774B2 (en) | 2017-05-12 | 2023-02-28 | Microsoft Technology Licensing, Llc | Spatializing audio data based on analysis of incoming audio data |
| PT3692523T (pt) | 2017-10-04 | 2022-03-02 | Fraunhofer Ges Forschung | Aparelho, método e programa de computador para codificação, descodificação, processamento de cena e outros procedimentos relacionados com codificação de áudio espacial com base em dirac |
| GB201808897D0 (en) * | 2018-05-31 | 2018-07-18 | Nokia Technologies Oy | Spatial audio parameters |
| IL319278A (en) * | 2018-07-02 | 2025-04-01 | Dolby Laboratories Licensing Corp | Methods and devices for generating or decoding a bit sequence comprising embedded audio signals |
| WO2020008112A1 (en) | 2018-07-03 | 2020-01-09 | Nokia Technologies Oy | Energy-ratio signalling and synthesis |
| DE102018127071B3 (de) | 2018-10-30 | 2020-01-09 | Harman Becker Automotive Systems Gmbh | Audiosignalverarbeitung mit akustischer Echounterdrückung |
| KR20210124283A (ko) | 2019-01-21 | 2021-10-14 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 공간 오디오 표현을 인코딩하기 위한 장치 및 방법 또는 인코딩된 오디오 신호를 트랜스포트 메타데이터를 이용하여 디코딩하기 위한 장치 및 방법 및 연관된 컴퓨터 프로그램들 |
| GB2584630A (en) * | 2019-05-29 | 2020-12-16 | Nokia Technologies Oy | Audio processing |
| WO2020242506A1 (en) * | 2019-05-31 | 2020-12-03 | Dts, Inc. | Foveated audio rendering |
| JP7578219B2 (ja) | 2019-07-30 | 2024-11-06 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 複数のスピーカーを通じた複数のオーディオ・ストリームの再生の管理 |
| EP3809709A1 (en) * | 2019-10-14 | 2021-04-21 | Koninklijke Philips N.V. | Apparatus and method for audio encoding |
| WO2021180938A1 (en) | 2020-03-13 | 2021-09-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for rendering a sound scene using pipeline stages |
| EP3879856A1 (en) * | 2020-03-13 | 2021-09-15 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Apparatus and method for synthesizing a spatially extended sound source using cue information items |
| KR102785656B1 (ko) | 2020-03-13 | 2025-03-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 이산화된 곡면을 포함하는 사운드 장면을 렌더링하는 장치 및 방법 |
| EP4118846A1 (en) | 2020-03-13 | 2023-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for rendering an audio scene using valid intermediate diffraction paths |
| GB2595475A (en) | 2020-05-27 | 2021-12-01 | Nokia Technologies Oy | Spatial audio representation and rendering |
| JP7581714B2 (ja) | 2020-09-09 | 2024-11-13 | ヤマハ株式会社 | 音信号処理方法および音信号処理装置 |
| WO2022229319A1 (en) | 2021-04-29 | 2022-11-03 | Dolby International Ab | Methods, apparatus and systems for modelling audio objects with extent |
| CN113889125B (zh) * | 2021-12-02 | 2022-03-04 | 腾讯科技(深圳)有限公司 | 音频生成方法、装置、计算机设备和存储介质 |
Family Cites Families (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5210366A (en) * | 1991-06-10 | 1993-05-11 | Sykes Jr Richard O | Method and device for detecting and separating voices in a complex musical composition |
| GB9211756D0 (en) * | 1992-06-03 | 1992-07-15 | Gerzon Michael A | Stereophonic directional dispersion method |
| JP4038844B2 (ja) * | 1996-11-29 | 2008-01-30 | ソニー株式会社 | ディジタル信号再生装置、ディジタル信号再生方法、ディジタル信号記録装置、ディジタル信号記録方法及び記録媒体 |
| JP3594790B2 (ja) * | 1998-02-10 | 2004-12-02 | 株式会社河合楽器製作所 | ステレオ楽音発生方法及びその装置 |
| AU6400699A (en) * | 1998-09-25 | 2000-04-17 | Creative Technology Ltd | Method and apparatus for three-dimensional audio display |
| JP2001069597A (ja) * | 1999-06-22 | 2001-03-16 | Yamaha Corp | 音声処理方法及び装置 |
| KR100542129B1 (ko) * | 2002-10-28 | 2006-01-11 | 한국전자통신연구원 | 객체기반 3차원 오디오 시스템 및 그 제어 방법 |
| EP1618763B1 (en) * | 2003-04-17 | 2007-02-28 | Koninklijke Philips Electronics N.V. | Audio signal synthesis |
| US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
| US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
| ATE390683T1 (de) * | 2004-03-01 | 2008-04-15 | Dolby Lab Licensing Corp | Mehrkanalige audiocodierung |
| ES2333137T3 (es) * | 2004-07-14 | 2010-02-17 | Koninklijke Philips Electronics N.V. | Conversion de canal de audio. |
| CN101040512B (zh) * | 2004-10-13 | 2010-05-26 | 皇家飞利浦电子股份有限公司 | 回波抵消设备与方法 |
| JP5106115B2 (ja) * | 2004-11-30 | 2012-12-26 | アギア システムズ インコーポレーテッド | オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング |
| KR100714980B1 (ko) | 2005-03-14 | 2007-05-04 | 한국전자통신연구원 | 가상음원위치정보를 이용한 멀티채널 오디오 신호의 압축및 복원 방법 |
| WO2007078254A2 (en) * | 2006-01-05 | 2007-07-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Personalized decoding of multi-channel surround sound |
| US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
| US8345899B2 (en) * | 2006-05-17 | 2013-01-01 | Creative Technology Ltd | Phase-amplitude matrixed surround decoder |
| DE102006050068B4 (de) * | 2006-10-24 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm |
| JP4819742B2 (ja) | 2006-12-13 | 2011-11-24 | アンリツ株式会社 | 信号処理方法および信号処理装置 |
| JP5554065B2 (ja) * | 2007-02-06 | 2014-07-23 | コーニンクレッカ フィリップス エヌ ヴェ | 複雑さの軽減されたパラメトリックステレオデコーダ |
-
2008
- 2008-10-28 EP EP08018793A patent/EP2154911A1/en not_active Withdrawn
-
2009
- 2009-08-11 PL PL11187018T patent/PL2421284T3/pl unknown
- 2009-08-11 KR KR1020117003247A patent/KR101456640B1/ko active Active
- 2009-08-11 ES ES11187018.4T patent/ES2545220T3/es active Active
- 2009-08-11 BR BRPI0912466-7A patent/BRPI0912466B1/pt active IP Right Grant
- 2009-08-11 CN CN201110376700.7A patent/CN102348158B/zh active Active
- 2009-08-11 BR BR122012003329-4A patent/BR122012003329B1/pt not_active IP Right Cessation
- 2009-08-11 CN CN2009801314198A patent/CN102165797B/zh active Active
- 2009-08-11 RU RU2011106583/08A patent/RU2504847C2/ru not_active Application Discontinuation
- 2009-08-11 EP EP11187018.4A patent/EP2421284B1/en active Active
- 2009-08-11 ES ES11187023.4T patent/ES2553382T3/es active Active
- 2009-08-11 KR KR1020127000148A patent/KR101301113B1/ko active Active
- 2009-08-11 EP EP11187023.4A patent/EP2418877B1/en active Active
- 2009-08-11 ES ES09777815T patent/ES2392609T3/es active Active
- 2009-08-11 KR KR1020137002826A patent/KR101310857B1/ko active Active
- 2009-08-11 KR KR1020137012892A patent/KR101424752B1/ko active Active
- 2009-08-11 CN CN201110376871.XA patent/CN102523551B/zh active Active
- 2009-08-11 MY MYPI2011000617A patent/MY157894A/en unknown
- 2009-08-11 KR KR1020127000147A patent/KR101226567B1/ko active Active
- 2009-08-11 RU RU2011154550/08A patent/RU2537044C2/ru active
- 2009-08-11 AU AU2009281356A patent/AU2009281356B2/en active Active
- 2009-08-11 MX MX2011001654A patent/MX2011001654A/es active IP Right Grant
- 2009-08-11 CA CA2822867A patent/CA2822867C/en active Active
- 2009-08-11 PL PL09777815T patent/PL2311274T3/pl unknown
- 2009-08-11 CA CA2827507A patent/CA2827507C/en active Active
- 2009-08-11 WO PCT/EP2009/005828 patent/WO2010017967A1/en not_active Ceased
- 2009-08-11 JP JP2011522431A patent/JP5425907B2/ja active Active
- 2009-08-11 EP EP09777815A patent/EP2311274B1/en active Active
- 2009-08-11 CA CA2734098A patent/CA2734098C/en active Active
- 2009-08-11 BR BR122012003058-9A patent/BR122012003058B1/pt active IP Right Grant
-
2011
- 2011-02-07 ZA ZA2011/00956A patent/ZA201100956B/en unknown
- 2011-02-11 US US13/025,999 patent/US8824689B2/en active Active
- 2011-03-04 CO CO11026918A patent/CO6420385A2/es active IP Right Grant
- 2011-11-08 US US13/291,964 patent/US8879742B2/en active Active
- 2011-11-08 US US13/291,986 patent/US8855320B2/en active Active
- 2011-11-09 JP JP2011245562A patent/JP5379838B2/ja active Active
- 2011-11-09 JP JP2011245561A patent/JP5526107B2/ja active Active
- 2011-12-27 RU RU2011154551/08A patent/RU2523215C2/ru active
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2392609T3 (es) | Aparato para determinar una señal de audio multicanal de salida espacial | |
| AU2011247872B8 (en) | An apparatus for determining a spatial output multi-channel audio signal | |
| HK1154145B (en) | An apparatus for determining a spatial output multi-channel audio signal | |
| HK1172475B (en) | An apparatus for determining a spatial output multi-channel audio signal | |
| AU2011247873A1 (en) | An apparatus for determining a spatial output multi-channel audio signal | |
| HK1168708B (en) | An apparatus for determining a spatial output multi-channel audio signal | |
| HK1164010B (en) | An apparatus for determining a spatial output multi-channel audio signal |