ES2359752T3 - Resolución espacial mejorada del campo sonoro para sistemas de reproducción de audio multicanal mediante derivación de señales con términos angulares de orden superior. - Google Patents

Resolución espacial mejorada del campo sonoro para sistemas de reproducción de audio multicanal mediante derivación de señales con términos angulares de orden superior. Download PDF

Info

Publication number
ES2359752T3
ES2359752T3 ES07838488T ES07838488T ES2359752T3 ES 2359752 T3 ES2359752 T3 ES 2359752T3 ES 07838488 T ES07838488 T ES 07838488T ES 07838488 T ES07838488 T ES 07838488T ES 2359752 T3 ES2359752 T3 ES 2359752T3
Authority
ES
Spain
Prior art keywords
signals
audio signals
sound field
input audio
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07838488T
Other languages
English (en)
Inventor
David Stanley Mcgrath
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of ES2359752T3 publication Critical patent/ES2359752T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

Un método para aumentar la resolución espacial de señales de audio que representan un campo sonoro, comprendiendo el método: recibir tres o más señales de audio de entrada que representan el campo sonoro en función de la dirección angular con términos angulares de orden cero y de primer orden; analizar las tres o más señales de audio de entrada para derivar características estadísticas del campo sonoro expresadas como funciones seno y coseno de primer orden de direcciones angulares de energía acústica en el campo sonoro; derivar dos o más señales procesadas de combinaciones ponderadas de las tres o más señales de audio de entrada en el que las tres o más señales de audio son ponderadas según las características estadísticas, en el que las dos o más señales procesadas representan el campo sonoro en función de la dirección angular con términos angulares de uno o más ordenes mayores que uno; proporcionar cinco o más señales de audio de salida que representan el campo sonoro en función de la dirección angular con términos angulares de órdenes cero, uno y mayor que uno, en el que las cinco o más señales de audio de salida comprenden las tres o más señales de audio de entrada y las dos o más señales procesadas.

Description

CAMPO TÉCNICO
La presente invención incumbe generalmente a audio e incumbe más específicamente a dispositivos y técnicas que pueden ser usados para mejorar la resolución espacial percibida de una reproducción de una señal de audio de resolución espacial baja mediante un sistema de reproducción de audio multicanal.
TÉCNICA ANTECEDENTE
Los sistemas de reproducción de audio multicanal ofrecen el potencial para recrear exactamente la sensación auditiva de un suceso acústico tal como una interpretación musical o un acontecimiento deportivo aprovechando las capacidades de altavoces múltiples que rodean a un oyente. Idealmente, el sistema de reproducción genera un campo sonoro multidimensional que recrea la sensación de dirección aparente de sonidos así como reverberación difusa que se espera acompañe a tal suceso acústico.
En un acontecimiento deportivo, por ejemplo, un espectador espera normalmente que los sonidos direccionales procedentes de los jugadores en un campo de juego sean acompañados por sonidos envolventes procedentes de otros espectadores. Una recreación exacta de las sensaciones auditivas en el acontecimiento no pude ser conseguida sin este sonido envolvente. De modo similar, las sensaciones auditivas en un concierto dentro de una sala no pueden ser recreadas exactamente sin recrear los efectos de reverberación de la sala de conciertos.
El realismo de las sensaciones recreadas por un sistema de reproducción es afectado por la resolución espacial de la señal reproducida. La exactitud de la recreación aumenta generalmente cuando aumenta la resolución espacial. Los sistemas de reproducción de audio comerciales y para consumidores emplean frecuentemente números mayores de altavoces pero, desgraciadamente, las señales de audio que reproducen pueden tener una resolución espacial relativamente baja. Muchas señales de audio difundidas y grabadas tienen una resolución espacial menor que la que puede ser deseada. Como resultado, el realismo que puede ser conseguido por un sistema de reproducción puede ser limitado por la resolución espacial de la señal de audio que ha de ser reproducida. Lo que es necesario es un modo de aumentar la resolución espacial de señales de audio.
Los documentos Patente de EE.UU. 5.757.927 y publicación de solicitud de patente internacional nº WO 00/19415 exponen sistemas reproductores Ambisonic que reciben señales de audio de entrada desde micrófonos de orden cero y primer orden. Aunque es conocido que la resolución espacial de un campo sonoro reproducido por estos sistemas puede ser incrementada incluyendo señales que representan el campo sonoro en función de la dirección con términos de orden superior, estos documentos no enseñan cómo derivar términos de orden segundo y superiores de estas señales de audio de entrada.
DESCRIPCIÓN DE LA INVENCIÓN
Un objeto de la presente invención es proveer lo necesario para el aumento de resolución espacial de señales de audio que representan un campo sonoro multidimensional.
Este objeto es conseguido por la invención descrita en esta exposición. Según un aspecto de la presente invención, características estadísticas del campo sonoro, expresadas como funciones seno y coseno de primer orden de direcciones angulares de energía acústica en el campo sonoro, son derivadas analizando tres o más señales de audio de entrada que representan el campo sonoro en función de la dirección angular con términos angulares de orden cero y primer orden. Dos o más señales procesadas son derivadas de combinaciones ponderadas de las tres o más señales de audio de entrada. Las tres o más señales de audio son ponderadas en la combinación según las características estadísticas. Las dos o más señales procesadas representan el campo sonoro en función de la dirección angular con términos angulares de uno o más órdenes mayores que uno. Las tres o más señales de audio de entrada y las dos o más señales procesadas representan el campo sonoro en función de la dirección angular con términos angulares de órdenes cero, uno y mayor que uno.
Las diversas características de la presente invención y sus realizaciones preferidas pueden ser mejor comprendidas refiriéndose a la discusión siguiente y los dibujos adjuntos en los que los números de referencia iguales se refieren a elementos iguales en la diversas figuras. Los contenidos de la discusión siguiente y los dibujos son expuestos como ejemplos solamente y no debería entenderse que representan limitaciones en el alcance de la presente invención.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
La Figura 1 es un diagrama esquemático de un suceso acústico captado por un sistema de micrófonos y reproducido subsiguientemente por un sistema de reproducción.
La Figura 2 ilustra un oyente y el acimut aparente de un sonido.
La Figura 3 ilustra una porción de un sistema de reproducción ejemplar que distribuye señales a altavoces para recrear una sensación de dirección.
La Figura 4 es una ilustración gráfica de funciones de ganancia para los canales de dos altavoces adyacente en un sistema de reproducción hipotético.
La Figura 5 es una ilustración gráfica de funciones de ganancia que muestra una degradación en resolución espacial producida por una mezcla de señales de primer orden.
La Figura 6 es una ilustración gráfica de funciones de ganancia que incluyen señales de tercer orden.
Las Figuras 7A a 7D son diagramas de bloques esquemáticos de sistemas de reproducción ejemplares hipotéticos.
Las Figuras 8 y 9 son diagramas de bloques esquemáticos de un procedimiento para derivar términos de orden superior a partir de señales en formato B de tres canales (W, X, Y).
Las Figuras 10 a 12 son diagramas de bloques esquemáticos de circuitos que pueden ser usados para derivar características estadísticas de señales en formato B de tres canales.
La Figura 13 ilustra diagramas de bloques esquemáticos de circuitos que pueden ser usados para generar señales de segundo y tercer orden a partir de características estadísticas de señales en formato B de tres canales.
La Figura 14 es un diagrama de bloques esquemático de un sistema de micrófonos que incorpora diversos aspectos de la presente invención.
Las Figuras 15A y 15B son diagramas esquemáticos de disposiciones alternativas de transductores en un sistema de micrófonos.
La Figura 16 es una ilustración gráfica de funciones de ganancia hipotéticas para canales de altavoces en un sistema de reproducción.
La Figura 17 es un diagrama de bloques esquemático de un dispositivo que puede ser usado para implementar diversos aspectos de la presente invención.
MODOS DE REALIZAR LA INVENCIÓN
A. Introducción
La Figura 1 proporciona una ilustración esquemática de un suceso acústico 10 y un descodificador 17 que incorpora aspectos de la presente invención, que recibe señales de audio 18 que representan sonidos del suceso acústico captados por el sistema 15 de micrófonos. El descodificador 17 procesa las señales recibidas para generar señales procesadas con resolución espacial aumentada. Las señales procesadas son reproducidas por un sistema que incluye un conjunto de altavoces 19 dispuestos próximos a uno o más oyentes 12 para proporcionar una recreación exacta de las sensaciones auditivas que podrían haber sido experimentadas en el suceso acústico. El sistema 15 de micrófonos capta tanto ondas directas 13 de sonido como ondas indirectas 14 de sonido que llegan después de la reflexión en una
o más superficies en algún entorno acústico 16 tal como una habitación o una sala de conciertos.
En una implementación, el sistema 15 de micrófonos proporciona señales de audio que se ajustan al formato Ambisonic de señales de cuatro canales (W, X, Y, Z) conocido como formato B. El sistema de micrófonos SPS422B y el sistema de micrófonos MKV obtenible de SoundField Ltd., Wakefield, Inglaterra, son dos ejemplos que pueden ser usados. Detalles de implementación que usa sistemas de micrófonos SoundField son tratados después. Otros sistemas de micrófonos y formatos de señales pueden ser usados si se desea sin apartarse del alcance de la presente invención.
Las señales en formato B de cuatro canales (W, X, Y, Z) pueden ser obtenidas desde un conjunto de cuatro transductores acústicos coincidentes. Conceptualmente, un transductor es omnidireccional y tres transductores tienen modelos en forma de dipolo mutuamente ortogonales de sensibilidad direccional. Muchos sistemas de micrófonos en formato B están construidos a partir de un conjunto tetraédrico de cuatro transductores acústicos direccionales y un procesador de señales que genera las señales en formato B de cuatro canales en respuesta a la salida de los cuatro transductores. La señal de canal W representa una onda sonora omnidireccional y la señales de canales X, Y y Z representan ondas sonoras orientadas a lo largo de tres ejes mutuamente ortogonales que son expresadas típicamente como funciones de la dirección angular con términos angulares θ de primer orden. El eje X está alineado horizontalmente desde atrás hacia delante con respecto a un oyente, el eje Y está alineado horizontalmente desde la derecha la izquierda con respecto al oyente y el eje Z está alineado verticalmente hacia arriba con respecto al oyente. Los ejes X e Y son ilustrados en la Figura 2. La Figura 2 también ilustra el azimut aparente θ de un sonido, que puede ser expresado como un vector (x, y). Obligando a que el vector tenga longitud unitaria, puede verse que:
imagen1
5
15
25
35
45
Las señales en formato B de cuatro canales pueden transportar información tridimensional sobre un campo sonoro. Las aplicaciones que requieren solo información bidimensional sobre un campo acústico pueden usar una señal en formato B de tres canales (W, X, Y) que omite el canal Z. Diversos aspectos de la presente invención pueden ser aplicados a sistemas de reproducción bidimensionales y tridimensionales pero la exposición restante hace mención más particular de aplicaciones bidimensionales.
B. Reparto panorámico (panning) de señales
La Figura 3 ilustra una porción de un sistema de reproducción ejemplar con ocho altavoces que rodean al oyente 12. La figura ilustra un estado en el que el sistema está generando un campo sonoro en respuesta a dos señales P y Q de entrada que representan dos sonidos con direcciones aparentes P' y Q', respectivamente. El componente 33 de reparto panorámico (panner) procesa las señales P y Q de entrada para distribuir o repartir panorámicamente (pan) las señales procesadas entre los canales de altavoces para recrear la sensación de dirección. El componente 33 de repartidor panorámico (panner) puede usar un número de procesos. Un proceso que puede ser usado es conocido como el Reparto de Amplitudes de Altavoces Más Próximos (NSAP: Nearest Speaker Amplitude Pan).
El proceso de NSAP distribuye señales a los canales de altavoces adaptando la ganancia para cada canal de altavoz en respuesta a la dirección aparente de un sonido y las ubicaciones de los altavoces con respecto a un oyente o área de audición. En un sistema bidimensional, por ejemplo, la ganancia para la señal P es obtenida de una función del acimut θP de la dirección aparente para el sonido que esta señal representa y de los acimuts θF y θE, de los dos altavoces SF y SE, respectivamente, que están situados en ambos lados de la dirección aparente θP. En una implementación, las ganancias para todos los canales de altavoces distintos que los canales para estos dos altavoces más próximos son dispuestas en cero y las ganancias para los canales de los dos altavoces más próximos son calculados según las ecuaciones siguientes:
imagen1
Cálculos similares son usados para obtener las ganancias para otras señales. La señal Q representa un caso especial donde la dirección aparente θQ del sonido que representa está alineada con un altavoz SC. Cualquier altavoz SB o SD puede ser seleccionado como el segundo altavoz más próximo. Como puede verse por las ecuaciones 1a y 1b, la ganancia para el canal del altavoz SC es igual a uno y las ganancias para todos los demás canales de altavoces son cero.
Las ganancias para los canales de altavoces pueden ser trazadas en función del acimut. El gráfico mostrado en la Figura 4 ilustra las funciones de ganancia para los canales de los altavoces SE y SF en el sistema mostrado en la Figura 3 donde los altavoces SE y SF están separados entre sí y de sus vecinos inmediatos para un ángulo igual a 45 grados. El acimut es expresado en términos del sistema de coordenadas mostrado en la Figura 2. Cuando un sonido tal como el representado por la señal P tiene una dirección aparente entre 135 grados y 180 grados, las ganancias para los altavoces SE y SF estarán entre cero y uno y las ganancias para todos los demás altavoces en el sistema serán dispuestas en cero.
C. Modelos o patrones de ganancias de micrófonos
Los sistemas pueden aplicar el proceso de NSAP a señales que representan sonidos con direcciones discretas para generar campos sonoros que son capaces de recrear exactamente las sensaciones auditivas de un suceso acústico original. Desgraciadamente, los sistemas de micrófonos no proporcionan señales que representan sonidos con direcciones discretas.
Cuando un suceso acústico 10 es captado por el sistema 15 de micrófonos, las ondas sonoras 13, 14 llegan típicamente al sistema de micrófonos desde un gran número de direcciones diferentes. Los sistemas de micrófonos de Sound Field Ltd. mencionado anteriormente generan señales que se ajustan al formato B. Señales en formato B de cuatro canales (W, X, Y, Z) pueden ser generadas para transportar características tridimensionales de un campo sonoro expresadas como funciones de la dirección angular. Ignorando la señal de canal Z, señales en formato B de tres canales (W, X, Y) pueden ser obtenidas para representar características bidimensionales de un campo sonoro que también son expresadas como funciones de la dirección angular. Lo que se precisa es un modo de procesar estas señales de modo que las sensaciones auditivas puedan ser recreadas con una exactitud espacial similar a la que puede ser conseguida por el proceso de NSAP cuando es aplicado a señales que representan sonidos con direcciones discretas. La capacidad de conseguir este grado de exactitud espacial es dificultada por la resolución espacial de las señales que son provistas por el sistema 15 de micrófonos.
5
10
15
20
25
30
35
40
45
La resolución espacial de una señal obtenida de un sistema de micrófonos depende de con cuanta exactitud el modelo direccional real de sensibilidad para el sistema de micrófonos se ajusta a algún modelo ideal, lo que a su vez depende del modelo direccional real de sensibilidad para los transductores acústicos individuales dentro del sistema de micrófonos. El modelo direccional de sensibilidad para transductores reales puede apartarse significativamente de algún modelo ideal pero el procesamiento de señales puede compensar estas desviaciones respecto a los modelos ideales. El procesamiento de señales también puede convertir las señales de salida de transductores en un formato deseado tal como el formato B. El modelo direccional eficaz que incluye el formato de señales del sistema de transductor/procesador es el resultado combinado de sensibilidad direccional de transductor y procesamiento de señales. Los sistemas de micrófonos de SoundField Ltd. mencionados anteriormente son ejemplos de este procedimiento. Este detalle de implementación no es crítico para la presente invención porque no es importante como es conseguido el modelo direccional eficaz. En el resto de esta discusión, términos como "modelo direccional" y "direccionalidad" se refieren a la sensibilidad direccional eficaz del transductor o combinación de transductor/procesador usada para captar un campo sonoro.
Un modelo direccional bidimensional de sensibilidad para un transductor puede ser descrito como un modelo de ganancia que es una función de la dirección angular θ, que puede tener una forma que puede ser expresada por cualquiera de las ecuaciones siguientes:
imagen1
donde a=0 para un modelo de ganancia omnidireccional;
a=0,5 para un modelo de ganancia cardioide; y
a=1 para un modelo de ganancia en figura 8.
Estos modelos son expresados como funciones de la dirección angular con términos angulares θ de primer orden y son citados en esto como modelos de ganancia de primer orden.
En implementaciones típicas, el sistema 15 de micrófonos usa tres o cuatro transductores con modelos de ganancia de primer orden para proporcionar señales en formato B de tres canales (W, X, Y) cuatro canales (W, X, Y, Z) que transportan información bidimensional o tridimensional sobre un campo sonoro. Refiriéndose a las ecuaciones 4a y 4b, un modelo de ganancia para cada uno de los tres canales (W, X, Y) de señales en formato B puede ser expresado como:
imagen1
donde el canal W tiene un modelo de ganancia de orden cero omnidireccional como es indicado por a=θ y los canales X e Y tienen un modelo de ganancia de primer orden en figura 8 como es indicado por a=1.
D. Resolución de sistema de reproducción
El número y la colocación de altavoces en un conjunto de reproducción puede influir en la resolución espacial percibida de un campo sonoro recreado. Un sistema con ocho altavoces igualmente separados es tratado e ilustrado aquí pero esta disposición es un ejemplo simplemente. Al menos tres altavoces son necesarios para recrear un campo sonoro que rodea a un oyente pero cinco o más altavoces son generalmente preferidos. En implementaciones preferidas de un sistema de reproducción, el descodificador 17 genera una señal de salida para cada altavoz que es descorrelacionada lo más posible respecto a otras señales de salida. Niveles más altos de descorrelación tienden a estabilizar la dirección percibida de un sonido dentro de un área mayor de audición, evitando problemas de localización bien conocidas para oyentes que están situados fuera del denominado lugar ideal ("sweet spot").
En una implementación de un sistema de reproducción según la presente invención, el descodificador 17 procesa señales en formato B de tres canales (W, X, Y) que representan un campo sonoro en función de la dirección solo con términos angulares de orden cero y primer orden para derivar señales procesadas que representan el campo sonoro en función de la dirección con términos angulares de orden superior que son distribuidos a uno o más altavoces. En sistemas convencionales, el descodificador 17 mezcla señales procedentes de cada uno de los tres canales en formato B en una señal procesada respectiva para cada uno de los altavoces usando factores de ganancia que son seleccionados basados en ubicaciones de altavoces. Desgraciadamente, este tipo de proceso de mezcla no proporciona una resolución espacial tan grande como las funciones de ganancia usadas en el proceso de NSAP para sistemas típicos como se describió anteriormente. Por ejemplo, el gráfico ilustrado en la Figura 5 muestra una degradación en resolución espacial para las funciones de ganancia que resultan de una mezcla lineal de señales en formato B de primer orden.
La causa de esta degradación en resolución espacial puede ser explicada observando que el acimut preciso θP de un sonido P con amplitud R no es medido por el sistema 15 de micrófonos. En cambio, el sistema 15 de micrófonos registra tres señales W=R, S=R. cos θP e Y=R. sen θP que representan un campo sonoro en función de la dirección con términos angulares de orden cero y primer orden. Por ejemplo, la señal procesada generada para el altavoz SE está compuesta por una combinación lineal de la señales de canales W, X e Y.
La curva de ganancia para este proceso de mezcla puede ser considerada como una aproximación de Fourier de orden reducido a la función deseada de ganancia de NSAP. La función de ganancia de NSAP para el canal de altavoz SE mostrado en la Figura 4, por ejemplo, puede ser representada por una serie de Fourier
imagen1
pero el proceso de mezcla de un descodificador típico omite términos por encima del primer orden, lo que puede ser expresado como:
imagen1
La resolución espacial de la función de procesamiento para el descodificador 17 puede ser aumentada incluyendo señales que representan un campo sonoro en función de la dirección con términos de orden superior. Por ejemplo, una función de ganancia para el canal de altavoz SE que incluye términos hasta el tercer orden puede ser expresada como:
imagen1
Una función de ganancia que incluye términos de tercer orden puede proporcionar una aproximación más exacta a la curva deseada de ganancia de NSAP como se ilustra en la Figura 6.
Términos angulares de segundo orden y tercer orden podrían ser obtenidos usando un sistema de micrófonos que capta componentes de campo sonoro de segundo orden y tercer orden pero esto exigiría transductores acústicos con modelos direccionales de segundo orden y tercer orden de sensibilidad. Los transductores con sensibilidades direccionales de orden superior son muy difíciles de fabricar. Además, este procedimiento no proporcionaría ninguna solución para le reproducción de señales que fueron registradas usando transductores con modelos direccionales de primer orden de sensibilidad.
Los diagramas de bloques esquemáticos mostrados en las Figuras 7A a 7D ilustran sistemas de reproducción hipotéticos diferentes que pueden ser usados para generar un campo sonoro multidimensional en respuesta a tipos diferentes de señales de entrada. El sistema de reproducción ilustrado en la Figura 7A excita ocho altavoces en respuesta a ocho señales de entrada discretas. Los sistemas de reproducción ilustrados en las Figuras 7B y 7C excitan ocho altavoces en respuesta a señales de entrada en formato B de primer orden y tercer orden, respectivamente, usando un descodificador 17 que realiza un proceso de descodificación que es apropiado para el formato de las señales de entrada. El sistema de reproducción ilustrado en la Figura 7D incorpora diversas características de la presente invención, en el que el descodificador 17 procesa señales de orden cero y primer orden en formato B de tres canales (W, X, Y) para derivar señales procesadas que se aproximan a la señales que podrían haber sido obtenidas de un sistema de micrófonos que usa transductores con modelos de ganancia de segundo orden y tercer orden. La discusión siguiente describe métodos diferentes que pueden ser usados para derivar estas señales procesadas.
E. Derivar términos de orden superior
Dos procedimientos básicos para derivar términos angulares de orden superior son descritos a continuación. El primer procedimiento deriva los términos angulares para señales de banda ancha. El segundo procedimiento es una variación del primer procedimiento que deriva los términos angulares para subbandas de frecuencias. Las técnicas pueden ser usadas para generar señales con componentes de orden superior. Además, estas técnicas pueden ser aplicadas a la señales en formato B de cuatro canales para aplicaciones tridimensionales.
1. Procedimiento de banda ancha
La Figura 8 es un diagrama de bloques esquemático de un procedimiento de banda ancha para derivar términos de orden superior a partir de señales en formato B de tres canales (W, X, Y). Cuatro características estadísticas indicadas como
C1 = una estimación de cos θ(t);
S1 = una estimación de sen θ(t); C2 = una estimación de cos 2θ(t); y S2 = una estimación de sen 2θ(t); son derivadas de un análisis de las señales en formato B y estas características son usadas para generar estimaciones
de los términos de segundo orden y tercer orden, que son indicados como:
imagen1
10 Una técnica para obtener las cuatro características estadísticas supone que en cualquier instante particular t, la mayor parte de la energía acústica incidente en el sistema 15 de micrófonos llega desde una sola dirección angular, lo que hace el acimut una función de tiempo que puede ser designada como θ(t). Como resultado, se supone que las señales de canales W, X e Y son esencialmente de la forma:
imagen1
Estimaciones de las cuatro características estadísticas de direcciones angulares de la energía acústica pueden ser derivadas de las ecuaciones 9a a 9d mostradas a continuación, en las que la notación Av(x) representa un valor medio de la señal x. Este valor medio puede ser calculado en un período de tiempo que es relativamente breve en
20 comparación con el intervalo en el que las características de señal cambian significativamente.
imagen1
imagen1
Otras técnicas pueden ser usadas para obtener estimaciones de las cuatro características estadísticas S1, C1, S2, C2 como se trata después.
Las cuatro señales X2, Y2, X3, Y3 mencionados anteriormente pueden ser generadas a partir de combinaciones ponderadas de las señales de canales W, X e Y que usan las cuatro características estadísticas como ponderaciones en cualquiera de varios modos usando las identidades trigonométricas siguientes:
imagen1
La señal X2 puede ser obtenida a partir de cualquiera de las combinaciones ponderadas siguientes:
imagen1
El valor calculado en la ecuación 10c es una media de las dos primeras expresiones. La señal Y2 puede ser obtenida a partir de cualquiera de las combinaciones ponderadas siguientes:
imagen1
El valor calculado en la ecuación 11c es una media de las dos primeras expresiones. Las señales de tercer orden pueden ser obtenidas a partir de la combinaciones ponderadas siguientes:
imagen1
Otras combinaciones ponderadas pueden ser usadas para calcular las cuatro señales X2, Y2, X3, Y3. Las ecuaciones mostradas anteriormente son simplemente ejemplos de cálculos que pueden ser usados.
Otras técnicas pueden ser usadas para derivar las cuatro características estadísticas. Por ejemplo, si están disponibles recursos suficientes de procesamiento, puede ser práctico obtener C1 de la ecuación siguiente:
imagen1
5
10
15
20
25
30
35
Esta ecuación calcula el valor de C1 en la muestra n analizando las señales de canales W, X e Y sobre las K muestras anteriores.
Otra técnica que puede ser usada para obtener C1 es un cálculo que usa un filtro de aplanamiento recurrente de primer orden en lugar de las sumas finitas en la ecuación 14a, como se muestra en la ecuación siguiente:
imagen1
La constante de tiempo del filtro de aplanamiento es determinada por el factor α. Este cálculo puede ser realizado como se muestra en el esquema de bloques ilustrado en la Figura 10. Los errores de dividir por cero que ocurrirían cuando el denominador de la expresión en la ecuación 14b es igual a cero pueden ser evitados sumando un valor pequeño ε al denominador como se muestra en la figura. Esto modifica la ecuación ligeramente como sigue:
imagen1
El error de dividir por cero también puede ser evitado usando un bucle de realimentación como se muestra en la Figura
11. Esta técnica usa la estimación anterior C1(n-1) para calcular la función de error siguiente:
imagen1
Si el valor de la función de error es mayor que cero, la estimación previa de C1 es demasiado pequeña, el valor de signo (Err(n)) es igual a uno y la estimación es aumentada en una cantidad de ajuste igual a α1. Si el valor de la función de error es menor que cero, la estimación previa de C1 es demasiado grande, la función signo (Err(n)) es igual a uno negativo y la estimación es reducida en una cantidad de ajuste igual a α1. Si el valor de la función de error es cero, la estimación previa de C1 es correcta, la función signo (Err(n)) es igual a cero y la estimación no es cambiada. Una versión aproximada de la estimación de C1 es generada en el elemento de retardo o almacenamiento mostrado en la porción inferior izquierda del esquema de bloques ilustrado en la Figura 11, y una versión aplanada de esta estimación es generada en la salida etiquetada C1 en la porción inferior derecha del esquema de bloques. La constante de tiempo del filtro de aplanamiento es determinada por el factor α2.
Las cuatro características estadísticas C1, S1, C2, S2 pueden ser obtenidas usando circuitos y procesos correspondientes a los esquemas de bloques mostrados en la Figura 12. Las señales X2, Y2, X3, Y3 con términos de orden superior pueden ser obtenidas según las ecuaciones 10c, 11c, 12 y 13 usando circuitos y procesos correspondientes a los esquemas de bloques mostrados en la Figura 13.
Los procesos usados para derivar las cuatro características estadísticas de las señales de entrada de los canales W, X e Y incurrirán en algún retardo si estos procesos usan técnicas de promediado en el tiempo. En un sistema en tiempo real, puede ser ventajoso añadir algún retardo a los trayectos de señales de entrada como se muestra en la Figura 9 para compensar el retado en la derivación estadística. En muchas implementaciones, un valor típico de retardo para análisis estadístico está entre 10 ms y 50 ms. El retado insertado en el trayecto de señal de entrada debería ser generalmente menor o igual que el retado de análisis estadístico. En muchas implementaciones, el retardo de trayecto de señal puede ser omitido sin degradación significativa en el rendimiento funcional global del sistema.
2. Procedimiento multibanda
Las técnicas tratadas anteriormente derivan características estadísticas de banda ancha que pueden ser expresadas como valores escalares que varían con el tiempo pero no varían con la frecuencia. Las técnicas de derivación pueden ser ampliadas para derivar características estadísticas dependientes de la banda de frecuencias que pueden ser
5
10
15
20
30
35
expresadas como vectores con elementos correspondientes a un número de frecuencias diferentes o subbandas de frecuencias diferentes. Alternativamente, cada una de las características estadísticas C1, S1, C2 y S2 dependientes de la frecuencia puede ser expresada como una respuesta de impulsos.
Si los elementos en cada uno de los vectores C1, S1, C2 y S2 son tratados como valores de ganancia dependientes de la frecuencia, combinaciones ponderadas de las señales X2, Y2, X3 e Y3 pueden ser generadas aplicando un filtro apropiado a la señales de canales W, X, e Y que tienen respuestas de frecuencia basadas en los valores de ganancia en estos vectores. Las operaciones de multiplicar mostradas en las ecuaciones y los esquemas anteriores son sustituidas por una operación de filtración tal como convolución.
El análisis estadístico de las señales de canales W, X e Y puede ser realizado en el dominio de frecuencia o en el dominio de tiempo. Si el análisis es realizado en el dominio de frecuencia, las señales de entrada pueden ser transformadas en un dominio de frecuencia de tiempo breve usando una transformada de Fourier de bloque o similar para generar coeficientes en el dominio de frecuencia y las cuatro características estadísticas pueden ser calculadas para cada coeficiente en el dominio de frecuencia o para grupos de coeficientes en el dominio de frecuencia que definen subbandas de frecuencias. El proceso usado para generar las señales X2, Y2, X3 e Y3 puede efectuar este procesamiento sobre una base de coeficiente por coeficiente o sobre una base de banda por banda.
F. Implementación en un sistema de micrófonos
Las técnicas tratadas anteriormente pueden ser incorporadas en una disposición de transductor/procesador para formar un sistema 15 de micrófonos que puede proporcionar señales de salida con exactitud espacial mejorada. En una implementación mostrada esquemáticamente en la Figura 14, el sistema 15 de micrófonos comprende tres transductores acústicos A, B, C coincidentes o casi coincidentes que tienen modelos direccionales cardioides de sensibilidad que están dispuestos en los vértices de un triángulo equilátero con cada transductor enfrentado hacia fuera alejado del centro del triángulo. Los modelos de ganancias direccionales de transductor pueden ser expresados como
imagen2
donde el transductor A mira hacia delante a lo largo del eje X, el transductor B mira hacia atrás y a la izquierda en un ángulo de 120 grados respecto al eje X y el transductor C mira hacia atrás y a la derecha en un ángulo de 120 grados respecto al eje X.
Las señales de salida de estos transductores pueden ser convertidas en señales en formato B de primer orden de tres canales (W, X, Y) como sigue:
imagen1
Un mínimo de tres transductores es necesario para captar las señales en formato B de tres canales. En la práctica, cuando se usan transductores de bajo coste, puede ser preferible usar cuatro transductores. Los diagramas esquemáticos mostrados en las Figuras 15A y 15B ilustran dos disposiciones alternativas. Un conjunto de tres transductores puede ser dispuesto con los transductores enfrentados en ángulos diferentes tales como 60, -60 y 180 grados. Un conjunto de cuatro transductores puede ser dispuesto en una denominada configuración en "T" con los transductores enfrentados en 0,90, -90 y 180 grados, o dispuesto en una denominada configuración en "Cruz" con los transductores enfrentados en 45, -45, 135 y -135 grados. Los modelos de ganancias para la configuración en "Cruz" son:
imagen3
donde los subíndices LF, RF, LB y RB designan ganancias para los transductores enfrentados en las direcciones izquierda hacia delante, derecha hacia delante, izquierda hacia atrás y derecha hacia atrás.
Las señales de salida de la configuración en cruz de transductores pueden ser convertidas en las señales en formato B 10 de primer orden de tres canales (W, X, Y) como sigue:
imagen1
En la práctica real, los modelos de ganancia direccionales para cada transductor se desvían del modelo cardioide ideal.
15 Las ecuaciones de conversión mostradas anteriormente pueden ser ajustadas para tener en cuenta estas desviaciones. Además, los transductores pueden tener peor sensibilidad direccional a frecuencias más bajas; sin embargo, esta propiedad puede ser tolerada en muchas aplicaciones porque los oyentes son generalmente menos sensibles a los errores direccionales en frecuencias más bajas.
G. Ecuaciones de mezcla
20 El conjunto de siete señales de primero, segundo y tercer orden (W, X, Y, X2, Y2, X3, Y3) puede ser mezclado o combinado por una matriz para excitar un número deseado de altavoces. El conjunto siguiente de ecuaciones de mezcla definen una matriz de 7x5 que puede ser usada para excitar cinco altavoces en una configuración típica de sonido envolvente que incluye canales izquierdo (L), derecho (R), central (C), izquierdo envolvente (LS), y derecho envolvente (RS).
imagen2
Las funciones de ganancia de altavoces que son provistas por estas ecuaciones de mezcla son ilustradas gráficamente en la Figura 16. Estas funciones de ganancia suponen que la matriz de mezcla es alimentada con un conjunto ideal de señales de entrada.
H. Implementación
30 Dispositivos que incorporan diversos aspectos de la presente invención pueden ser implementados de modos diversos que incluyen software para ejecución por un ordenador o algún otro dispositivo que incluye componentes más especializados tales como circuitos de procesador de señales digitales (DSP: digital signal processor) acoplados a componentes similares a los hallados en un ordenador de uso general. La Figura 17 es un diagrama de bloques esquemático de un dispositivo 70 que puede ser usado para implementar aspectos de la presente invención. El procesador 72 proporciona recursos de cómputo. La memoria RAM 73 es la memoria de acceso aleatorio (RAM) del sistema usada por el procesador 72 para procesamiento. La memoria ROM 74 representa alguna forma de almacenamiento persistente tal como la memoria de solo lectura (ROM: read only memory) o memoria flash para almacenar programas necesarios para hacer funcionar el dispositivo 70 y posiblemente para llevar a cabo diversos
5 aspectos de la presente invención. El control 75 de entrada/salida (I/O: imput/output) representa circuitos de interfaz para recibir y transmitir señales por vía de los canales 76, 77 de comunicación. En la realización mostrada, todos los componentes principales del sistema se conectan al bus 71 que puede representar más de un bus físico o lógico; una arquitectura de bus no es necesaria para implementar la presente invención.
El dispositivo 78 de almacenamiento es opcional. Programas que implementan diversos aspectos de la presente
10 invención pueden ser grabados en un dispositivo 78 de almacenamiento que tiene un soporte de almacenamiento tal como una cinta o disco magnético, o un soporte óptico. El soporte de almacenamiento también puede ser usado para grabar programas de instrucciones para sistemas operativos, utilidades y aplicaciones.
Las funciones necesarias para poner en práctica diversos aspectos de la presente invención pueden ser realizados por componentes que son implementados en una extensa variedad de modos que incluyen componentes lógicos discretos,
15 circuitos integrados, uno o más circuitos integrados de aplicaciones específicas (ASICs: application-specific integrated circuits) y/o procesadores controlados por programas. La manera en la que estos componentes son implementados no es importante para la presente invención.
Implementaciones de software de la presente invención pueden ser transportadas por una variedad de soportes legibles por máquina tales como trayectos de comunicación en banda base o modulados en todo el espectro que incluye desde
20 frecuencias supersónicas a ultravioletas, o soportes de almacenamiento que transportan información usando esencialmente cualquier tecnología de grabación que incluye cinta, tarjetas o disco magnético, tarjetas o disco óptico, y marcaciones detectables sobre soportes incluyendo papel.

Claims (13)

  1. REIVINDICACIONES
    1. Un método para aumentar la resolución espacial de señales de audio que representan un campo sonoro, comprendiendo el método:
    recibir tres o más señales de audio de entrada que representan el campo sonoro en función de la dirección angular con términos angulares de orden cero y de primer orden;
    analizar las tres o más señales de audio de entrada para derivar características estadísticas del campo sonoro expresadas como funciones seno y coseno de primer orden de direcciones angulares de energía acústica en el campo sonoro;
    derivar dos o más señales procesadas de combinaciones ponderadas de las tres o más señales de audio de entrada en el que las tres o más señales de audio son ponderadas según las características estadísticas, en el que las dos o más señales procesadas representan el campo sonoro en función de la dirección angular con términos angulares de uno o más ordenes mayores que uno;
    proporcionar cinco o más señales de audio de salida que representan el campo sonoro en función de la dirección angular con términos angulares de órdenes cero, uno y mayor que uno, en el que las cinco o más señales de audio de salida comprenden las tres o más señales de audio de entrada y las dos o más señales procesadas.
  2. 2.
    El método según la reivindicación 1, en el que las tres o más señales de audio de entrada son recibidas desde una pluralidad de transductores acústicos, teniendo cada uno sensibilidades direccionales con términos angulares de un orden no mayor que el primer orden.
  3. 3.
    El método según la reivindicación 1 o 2, que deriva de las características estadísticas dos o más señales que representan el campo sonoro en función de la dirección angular con términos angulares de segundo orden.
  4. 4.
    El método según la reivindicación 1 o 2, que deriva de las características estadísticas cuatro o más señales procesadas que representan el campo sonoro en función de la dirección angular con términos angulares de segundo orden y tercer orden.
  5. 5.
    El método según la reivindicación 1 o 2, que deriva de las características estadísticas cuatro o más señales procesadas que representan el campo sonoro en función de la dirección angular con términos angulares de dos o más órdenes mayores que uno.
  6. 6.
    El método según una cualquiera de las reivindicaciones 1 a 5, en el que las características estadísticas son derivadas al menos en parte de medias de las tres o más señales de audio de entrada calculadas sobre intervalos de tiempo.
  7. 7.
    El método según una cualquiera de las reivindicaciones 1 a 5, en el que cada una de las señales de audio de entrada es representada por muestras y las características estadísticas son derivadas al menos en parte de una suma de una pluralidad de las muestras para una señal de audio de entrada respectiva.
  8. 8.
    El método según una cualquiera de las reivindicaciones 1 a 5, en el que las características estadísticas son derivadas al menos en parte aplicando un filtro de aplanamiento a valores derivados de las tres o más señales de audio de entrada.
  9. 9.
    El método según una cualquiera de las reivindicaciones 1 a 8, que deriva características estadísticas dependientes de la frecuencia para las tres o más señales de audio de entrada.
  10. 10.
    El método según la reivindicación 9, que comprende:
    aplicar una transformada de bloque a las tres o más señales de audio de entrada para generar coeficientes en el dominio de frecuencia; derivar las características estadísticas dependientes de la frecuencia a partir de coeficientes individuales en el dominio de la frecuencia o grupos de coeficientes en el dominio de la frecuencia, y
    derivar las dos o más señales procesadas aplicando filtros a las tres o más señales de audio de entrada que tienen respuestas de frecuencia basadas en las características estadísticas dependientes de la frecuencia.
  11. 11.
    El método según la reivindicación 9, que comprende derivar las dos o más señales procesadas aplicando filtros a las tres o más señales de audio de entrada que tienen respuestas de impulsos basadas en las características estadísticas dependientes de la frecuencia.
  12. 12.
    Un aparato (70) para aumentar la resolución espacial de señales de audio que representan un campo sonoro, comprendiendo el aparato medios para realizar el método según una cualquiera de las reivindicaciones 1 a 11.
  13. 13.
    Un soporte (78) de almacenamiento que graba un programa de instrucciones ejecutable por un dispositivo (70), en el que la ejecución del programa de instrucciones causa que el dispositivo realice el método según una cualquiera de las reivindicaciones 1 a 11.
ES07838488T 2006-09-25 2007-09-19 Resolución espacial mejorada del campo sonoro para sistemas de reproducción de audio multicanal mediante derivación de señales con términos angulares de orden superior. Active ES2359752T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US84732206P 2006-09-25 2006-09-25
US847322P 2006-09-25

Publications (1)

Publication Number Publication Date
ES2359752T3 true ES2359752T3 (es) 2011-05-26

Family

ID=39189341

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07838488T Active ES2359752T3 (es) 2006-09-25 2007-09-19 Resolución espacial mejorada del campo sonoro para sistemas de reproducción de audio multicanal mediante derivación de señales con términos angulares de orden superior.

Country Status (10)

Country Link
US (1) US8103006B2 (es)
EP (1) EP2070390B1 (es)
JP (1) JP4949477B2 (es)
CN (1) CN101518101B (es)
AT (1) ATE495635T1 (es)
DE (1) DE602007011955D1 (es)
ES (1) ES2359752T3 (es)
RU (1) RU2420027C2 (es)
TW (1) TWI458364B (es)
WO (1) WO2008039339A2 (es)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8036767B2 (en) 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
CA2729744C (en) * 2008-06-30 2017-01-03 Constellation Productions, Inc. Methods and systems for improved acoustic environment characterization
EP2154677B1 (en) * 2008-08-13 2013-07-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a converted spatial audio signal
EP2205007B1 (en) * 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
GB2476747B (en) 2009-02-04 2011-12-21 Richard Furse Sound system
CN102461212B (zh) * 2009-06-05 2015-04-15 皇家飞利浦电子股份有限公司 环绕声系统及用于其的方法
KR101387195B1 (ko) * 2009-10-05 2014-04-21 하만인터내셔날인더스트리스인코포레이티드 오디오 신호의 공간 추출 시스템
US9173048B2 (en) 2011-08-23 2015-10-27 Dolby Laboratories Licensing Corporation Method and system for generating a matrix-encoded two-channel audio signal
KR101651419B1 (ko) 2012-03-23 2016-08-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 머리 전달 함수들의 선형 믹싱에 의한 머리 전달 함수 생성을 위한 방법 및 시스템
EP2645748A1 (en) 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
EP2688066A1 (en) 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
EP2898506B1 (en) * 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
EP2974253B1 (en) * 2013-03-15 2019-05-08 Dolby Laboratories Licensing Corporation Normalization of soundfield orientations based on auditory scene analysis
EP2782094A1 (en) * 2013-03-22 2014-09-24 Thomson Licensing Method and apparatus for enhancing directivity of a 1st order Ambisonics signal
KR102414609B1 (ko) * 2013-04-26 2022-06-30 소니그룹주식회사 음성 처리 장치, 정보 처리 방법, 및 기록 매체
CN104244164A (zh) * 2013-06-18 2014-12-24 杜比实验室特许公司 生成环绕立体声声场
JP6412931B2 (ja) * 2013-10-07 2018-10-24 ドルビー ラボラトリーズ ライセンシング コーポレイション 空間的オーディオ・システムおよび方法
CA3155815C (en) * 2014-03-24 2025-08-12 Dolby International Ab Method and device for applying dynamic range compression to a higher order ambisonics signal
US9774976B1 (en) 2014-05-16 2017-09-26 Apple Inc. Encoding and rendering a piece of sound program content with beamforming data
TWI628454B (zh) 2014-09-30 2018-07-01 財團法人工業技術研究院 基於聲波的空間狀態偵測裝置、系統與方法
CN105635635A (zh) 2014-11-19 2016-06-01 杜比实验室特许公司 调节视频会议系统中的空间一致性
US9606620B2 (en) 2015-05-19 2017-03-28 Spotify Ab Multi-track playback of media content during repetitive motion activities
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
US10932078B2 (en) 2015-07-29 2021-02-23 Dolby Laboratories Licensing Corporation System and method for spatial processing of soundfield signals
WO2017209477A1 (ko) * 2016-05-31 2017-12-07 지오디오랩 인코포레이티드 오디오 신호 처리 방법 및 장치
FR3062967B1 (fr) 2017-02-16 2019-04-19 Conductix Wampfler France Systeme de transfert d'un lien magnetique
JP7196399B2 (ja) * 2017-03-14 2022-12-27 株式会社リコー 音響装置、音響システム、方法およびプログラム
WO2018213159A1 (en) 2017-05-15 2018-11-22 Dolby Laboratories Licensing Corporation Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals
CN110771181B (zh) * 2017-05-15 2021-09-28 杜比实验室特许公司 用于将空间音频格式转换为扬声器信号的方法、系统和设备
US10609502B2 (en) * 2017-12-21 2020-03-31 Verizon Patent And Licensing Inc. Methods and systems for simulating microphone capture within a capture zone of a real-world scene
US12614555B2 (en) * 2023-09-27 2026-04-28 Apple Inc. Method and system for producing an augmented ambisonic format
US12604150B2 (en) * 2023-09-27 2026-04-14 Apple Inc. Method and system for spatial audio processing using multiple orders of ambisonics

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3072878A (en) * 1961-05-29 1963-01-08 United Carr Fastener Corp Electrical lamp socket
US4095049A (en) * 1976-03-15 1978-06-13 National Research Development Corporation Non-rotationally-symmetric surround-sound encoding system
US4063034A (en) * 1976-05-10 1977-12-13 Industrial Research Products, Inc. Audio system with enhanced spatial effect
US4262170A (en) * 1979-03-12 1981-04-14 Bauer Benjamin B Microphone system for producing signals for surround-sound transmission and reproduction
JPH0613027B2 (ja) * 1985-06-26 1994-02-23 富士通株式会社 超音波媒体特性値測定装置
FR2631707B1 (fr) * 1988-05-20 1991-11-29 Labo Electronique Physique Echographe ultrasonore a coherence de phase controlable
US5757927A (en) * 1992-03-02 1998-05-26 Trifield Productions Ltd. Surround sound apparatus
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6072878A (en) 1997-09-24 2000-06-06 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
AU6400699A (en) 1998-09-25 2000-04-17 Creative Technology Ltd Method and apparatus for three-dimensional audio display
US20020050983A1 (en) * 2000-09-26 2002-05-02 Qianjun Liu Method and apparatus for a touch sensitive system employing spread spectrum technology for the operation of one or more input devices
DE10252339A1 (de) * 2002-11-11 2004-05-19 Stefan Schreiber Zweiseitiger, hybrider optischer Datenträger in Scheibenformat (SACD/DVD)
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
CN1512768A (zh) * 2002-12-30 2004-07-14 �ʼҷ����ֵ��ӹɷ����޹�˾ 一种在hd-dvd系统中用于生成视频目标单元的方法
DE10352774A1 (de) * 2003-11-12 2005-06-23 Infineon Technologies Ag Ortungsanordnung, insbesondere Losboxen-Lokalisierungssystem, Kennzeicheneinheit und Verfahren zur Ortsbestimmung

Also Published As

Publication number Publication date
ATE495635T1 (de) 2011-01-15
EP2070390A2 (en) 2009-06-17
WO2008039339A2 (en) 2008-04-03
JP2010504717A (ja) 2010-02-12
EP2070390B1 (en) 2011-01-12
DE602007011955D1 (de) 2011-02-24
RU2420027C2 (ru) 2011-05-27
TW200822781A (en) 2008-05-16
WO2008039339A3 (en) 2008-05-29
CN101518101B (zh) 2012-04-18
TWI458364B (zh) 2014-10-21
US20090316913A1 (en) 2009-12-24
CN101518101A (zh) 2009-08-26
RU2009115648A (ru) 2010-11-10
JP4949477B2 (ja) 2012-06-06
US8103006B2 (en) 2012-01-24

Similar Documents

Publication Publication Date Title
ES2359752T3 (es) Resolución espacial mejorada del campo sonoro para sistemas de reproducción de audio multicanal mediante derivación de señales con términos angulares de orden superior.
ES2690164T3 (es) Dispositivo y método para convertir una señal de audio espacial
US11451920B2 (en) Method and device for decoding a higher-order ambisonics (HOA) representation of an audio soundfield
TWI770059B (zh) 用以再生空間分散聲音之方法
KR101715541B1 (ko) 복수의 파라메트릭 오디오 스트림들을 생성하기 위한 장치 및 방법 그리고 복수의 라우드스피커 신호들을 생성하기 위한 장치 및 방법
Alary et al. Directional feedback delay network
McCormack et al. Parametric ambisonic encoding of arbitrary microphone arrays
US6766028B1 (en) Headtracked processing for headtracked playback of audio signals
US6072878A (en) Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
ES2922639T3 (es) Método y dispositivo para la reproducción mejorada de campo sonoro de señales de entrada de audio codificadas espacialmente
Laborie et al. A new comprehensive approach of surround sound recording
Farina et al. Measuring spatial MIMO impulse responses in rooms employing spherical transducer arrays
Hacihabiboğlu et al. Panoramic recording and reproduction of multichannel audio using a circular microphone array
CN110637466A (zh) 扬声器阵列与信号处理装置