ES2355271T3 - Captura de audio direccional. - Google Patents

Captura de audio direccional. Download PDF

Info

Publication number
ES2355271T3
ES2355271T3 ES06799561T ES06799561T ES2355271T3 ES 2355271 T3 ES2355271 T3 ES 2355271T3 ES 06799561 T ES06799561 T ES 06799561T ES 06799561 T ES06799561 T ES 06799561T ES 2355271 T3 ES2355271 T3 ES 2355271T3
Authority
ES
Spain
Prior art keywords
signal
sound
signal processing
control unit
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06799561T
Other languages
English (en)
Inventor
Morgan KJØLERBAKKEN
Vibeke Jahr
Ines Hafizovic
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SquareHead Tech AS
Original Assignee
SquareHead Tech AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SquareHead Tech AS filed Critical SquareHead Tech AS
Application granted granted Critical
Publication of ES2355271T3 publication Critical patent/ES2355271T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Studio Devices (AREA)

Abstract

Sistema para el enfoque y la orientación directivos y digitales de sonido muestreado dentro de un área objetivo (400) con el fin de producir una salida de audio selectiva, que comprende una o más matrices de micrófonos, de banda ancha (100, 110), una unidad conversora de señales de A/D (200), una unidad de control (300), en donde la unidad de control (300) comprende: - unos medios receptores (310) para recibir señales digitales de sonido capturado desde todos los micrófonos que comprende el sistema; - unos medios de entrada (350) para recibir instrucciones que comprenden datos de posición selectivos en forma de coordenadas, donde las coordenadas se presentan en dos o tres dimensiones para definir un(os) punto(s) de enfoque; - unos medios de procesado de la señal (330) para escoger señales de una selección de micrófonos pertinentes en la(s) matriz(es) (100, 110) para un procesado posterior, donde la selección realizada se basa en análisis espectrales de la señal recibida; - unos medios de procesado de la señal (330) para realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes con el fin de enfocar y orientar el sonido según las instrucciones recibidas; - unos medios de procesado de la señal (330) para generar una o más salida(s) de audio selectiva(s) de acuerdo con instrucciones recibidas y el procesado de la señal realizado.

Description

INTRODUCCIÓN
La presente invención se refiere a la captura de audio direccional y, más específicamente, a un método y un sistema para producir audio selectivo en una producción de vídeo, posibilitando de este modo una radiodifusión con funcionalidad de orientación y zoom controlados. 5
El sistema es útil para capturar sonido bajo condiciones de ruido en las que es necesario un filtrado espacial, por ejemplo, la captura de sonido de atletas, árbitros y entrenadores en acontecimientos deportivos para una producción de emisiones de radiodifusión.
El sistema comprende una o más matrices de micrófonos, una o más unidades de muestreo, medios de almacenamiento, y una unidad de control y procesado de la señal con medios de entrada para recibir datos de 10 posición.
ANTECEDENTES DE LA INVENCIÓN – TÉCNICA ANTERIOR
Una matriz de micrófonos es un montaje de captación acústica multicanal que comprende dos o más sensores de presión acústica situados en ubicaciones diferentes en el espacio con el fin de muestrear espacialmente la presión acústica de una o varias fuentes. Se pueden usar técnicas de procesado de la señal para 15 controlar, o más específicamente orientar, la matriz de micrófonos hacia cualquier fuente de interés. Las técnicas a usar pueden ser, entre otras: retardo de señales, filtrado, ponderación, y suma de señales de los elementos de micrófono para alcanzar la selectividad espacial deseada. A esto se le hace referencia como conformación de haces. Los micrófonos en una matriz de micrófonos controlable deberían estar bien adaptados en cuanto a amplitud y fase. Si no, deben conocerse las diferencias para realizar correcciones de errores en el software y/o el hardware. 20 Los principios que subyacen tras la orientación de una matriz son bien conocidos a partir de la bibliografía pertinente del procesado de señales. Las matrices de micrófonos pueden ser rectangulares, circulares, o tridimensionales.
Existen varios sistemas conocidos que comprenden matrices de micrófonos. La mayoría de ellos se centran principalmente en el procesado de las señales para alcanzar una optimización de señales muestreadas y/o 25 la interpretación de la posición de objetos o elementos en la imagen.
A continuación se describe la técnica anterior más relevante.
El documento US2003/0072461 describe una matriz colineal múltiple de micrófonos seguida por un procesado de la señal, con una respuesta altamente direccional.
La patente US nº 5.940.118 describe un sistema y un método para orientar micrófonos direccionales. El 30 sistema está destinado a ser usado en salas de conferencia que contienen miembros de la audiencia. Comprende medios de entrada ópticos, es decir, cámaras, y medios de interpretación para interpretar qué miembros de la audiencia están hablando, y medios para activar el sonido hacia la fuente de sonido.
La patente US nº 6.469.732 describe un aparato y un método usados en un sistema de videoconferencia para proporcionar una determinación exacta de la posición de un participante que está hablando. 35
El documento JP2004 180197 describe una matriz de micrófonos que se puede controlar digitalmente con respecto al enfoque acústico.
La presente invención es un método y un sistema para el enfoque y la orientación controlados del sonido que va a ser presentado junto con vídeo. La invención difiere con respecto a la técnica anterior en su flexibilidad y facilidad de uso. 40
En una forma de realización preferida, la invención es un método y un sistema para recibir datos de posición y enfoque desde una o más cámaras que filman un evento, y para usar estos datos de entrada con el fin de generar una salida acústica pertinente junto con el vídeo.
En otra forma de realización, un usuario puede introducir la ubicación deseada desde la cual captar sonido, y unos medios de procesado de la señal usarán la misma para realizar el procesado necesario de la señal. 45
Todavía en otra forma de realización, los datos de posición para la ubicación desde la cual captar sonido se pueden enviar desde un sistema que comprende antena(s) que captan señales de radiocomunicaciones de transmisor(es) de radiocomunicaciones ubicado(s) sobre o en objeto(s) del(de los) que se va a realizar un seguimiento, junto con medios para deducir la ubicación y enviar esta información al sistema según la presente invención. El emisor de radiocomunicaciones se puede situar, por ejemplo, en un balón de fútbol, permitiendo de 50 este modo que el sistema registre sonido desde la ubicación del balón, y que también controle una o más cámaras de tal manera que tanto el vídeo como el sonido se enfocarán en la ubicación del balón.
OBJETIVOS Y SUMARIO DE LA INVENCIÓN
El objetivo de la presente invención es proporcionar una salida de audio selectiva con respecto a un(a) área(s) objetivo relevante(s).
El objetivo se alcanza mediante un sistema para el enfoque y la orientación directivos y digitales de sonido muestreado dentro del área objetivo con el fin de producir la salida de audio selectiva. El sistema comprende una o 5 más matrices de micrófonos, de banda ancha, una o más unidades conversoras de señales de A/D, una unidad de control con medios de entrada, medios de salida, medios de almacenamiento, y una o más unidades de procesado de señales.
El sistema está caracterizado porque la unidad de control comprende unos medios de entrada para recibir señales digitales de sonido capturado desde todos los micrófonos que comprende el sistema, y unos medios de 10 entrada para recibir instrucciones que comprenden datos de posición selectivos.
El sistema está caracterizado además porque la unidad de control comprende unos medios de procesado de la señal para: escoger señales de una selección de micrófonos pertinentes en la(s) matriz(es) para un procesado posterior, y para realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes con el fin de enfocar y orientar el sonido según las instrucciones recibidas, y para generar una salida de audio selectiva 15 de acuerdo con el procesado realizado.
El objetivo de la invención se alcanza además mediante un método para enfocar y orientar de forma digital y directiva sonido muestreado dentro de un área objetivo con el fin de producir una salida de audio selectiva, donde el método comprende el uso de una o más matrices de micrófonos, de banda ancha, una unidad conversora de señales de A/D, y una unidad de control con medios de entrada, medios de salida, medios de almacenamiento y 20 una o más unidades de procesado de señales.
El método está caracterizado porque comprende las siguientes etapas realizadas por la unidad de control:
- recibir señales digitales de sonido capturado desde todos los micrófonos que comprende el sistema;
- recibir instrucciones que comprenden datos de posición selectivos a través de los medios de entrada en la unidad de control; 25
- escoger señales de una selección de micrófonos pertinentes en la(s) matriz(es) de banda ancha para un procesado posterior, y donde la selección realizada se basa en análisis espectrales de la señal;
- realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes para enfocar y orientar el sonido según las instrucciones recibidas;
- generar una o más salida(s) de audio selectiva(s) de acuerdo con el procesado realizado. 30
Una característica principal de la invención es que los datos de posición selectivos se pueden proporcionar en tiempo real o en un proceso de postprocesado del sonido registrado. El(las) área(s) de enfoque desde la(s) cual(es) se va a producir sonido puede(n) ser definida(s) por un usuario final que proporcione instrucciones de entrada del(de las) área(s) o mediante la posición y el enfoque de una o más cámaras.
Los objetivos de la invención se alcanzan con los medios y el método según se exponen en el conjunto de 35 reivindicaciones adjuntas.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
Se describirá más detalladamente la invención haciendo referencia a las figuras, en las que:
la Fig. 1 muestra una vista general de los diferentes componentes del sistema, integrados con cámaras;
la Fig. 2 muestra un montaje que puede proporcionar audio desde diferentes ubicaciones a un sistema 40 envolvente, dependiendo de las cámaras que se estén usando.
La Fig. 3 muestra ejemplos de optimización de frecuencias con filtros espaciales en el diseño de matrices.
DESCRIPCIÓN DETALLADA DE LAS FORMAS DE REALIZACIÓN PREFERIDAS
La Figura 1 muestra una vista general de los diferentes componentes del sistema, integrados con cámaras.
Los componentes mostrados en el dibujo son matrices de micrófonos, de banda ancha 100, 110, que se 45 van a posicionar adyacentes al área desde la que se va a registrar sonido. Las señales analógicas de cada micrófono se convierten en una señal digital en un conversor A/D 210 incluido en una unidad de A/D 200. La unidad de A/D puede tener también medios de memoria 220 para almacenar las señales digitales, y medios de transferencia de datos 230 para transferir las señales digitales hacia una unidad de control 300.
La unidad de control 300 puede estar situada en una ubicación remota y recibir las señales digitales del 50 sonido capturado a través de una red alámbrica o inalámbrica, por ejemplo, por medio de cable o satélite dejando
que un usuario final realice todo el procesado de la señal de orientación y enfoque de manera local. La unidad de control 300 comprende un receptor de datos 310 para recibir señales de sonido digitales de la unidad de A/D 200. Comprende además unos medios de almacenamiento de datos 320 para almacenar las señales recibidas, medios de procesado de señales 330 para tiempo real o postprocesado, y unos medios generadores de audio 340 para generar una salida de audio selectiva. Antes de almacenar las señales en los medios de almacenamiento de datos, 5 la señal se puede convertir a un formato comprimido para ahorrar espacio.
La unidad de control 300 comprende además medios de entrada 350 para recibir instrucciones que comprenden datos de posición selectivos. Estas instrucciones son típicamente coordenadas que definen la posición y el punto de enfoque de una o más cámara(s) que están filmando un evento que tiene lugar en una(s) ubicación(es) específica(s) dentro del área objetivo. 10
En una primera forma de realización, las coordenadas de la fuente de sonido se pueden proporcionar por medio del punto de enfoque de la(s) cámara(s) 150, 160 y a partir del acimut y la altitud del(de los) trípode(s) de la(s) cámara(s). Mediante la conexión del sistema a una o más cámaras de televisión y la recepción de coordenadas de posicionamiento en dos o tres dimensiones (acimut, altitud y alcance), es posible orientar y enfocar el sonido según el punto de enfoque de la lente de la cámara. 15
En una segunda forma de realización, las coordenadas, y por lo tanto la ubicación de la fuente de sonido, las puede proporcionar un operador que haga funcionar una(s) interfaz(es) de usuario gráfica(s) (GUI), que muestre una vista general del área objetivo, un teclado, una unidad mezcladora de audio, y una o más palancas de mando. La GUI proporciona al operador la información sobre en dónde realizar la orientación y el zoom.
La GUI puede mostrar vídeo en directo desde una o más cámaras conectadas (múltiples canales). En una 20 forma de realización preferida, a la GUI se le añaden gráficos adicionales con el fin de señalar hacia dónde se está orientando el sistema. Esto simplifica el funcionamiento del sistema y proporciona al operador un control total sobre la función de zoom y orientación.
En una tercera forma de realización, el sistema puede usar algoritmos para hallar fuentes de sonido predefinidas. Por ejemplo, el sistema se puede configurar para escuchar el silbato de un árbitro y, a continuación, 25 orientar y enfocar audio y vídeo hacia esta ubicación.
Todavía en otra forma de realización, la ubicación o coordenadas las puede proporcionar un sistema que realice un seguimiento de la ubicación de un objeto, por ejemplo, un balón de fútbol con el que se esté jugando en un campo de juego.
Una combinación de las formas de realización mencionadas anteriormente constituye también una 30 alternativa viable.
Para que el sonido y el área de enfoque de la(s) cámara(s) estén sincronizados, es necesario que el sistema tenga un sistema de coordenadas común. Las coordenadas de las cámaras se calibrarán con respecto a un punto de referencia común para el sistema y las cámaras.
El sistema puede capturar sonido de varias ubicaciones diferentes simultáneamente (funcionalidad 35 multicanal) y proporcionar audio a un sistema envolvente. Las ubicaciones se pueden predefinir para cada cámara o pueden cambiar dinámicamente en tiempo real de acuerdo con la posición, el enfoque, y el ángulo de las cámaras.
La salida de audio selectiva se alcanza combinando las señales de sonido digitales y los datos de posición y realizando el procesado de señal necesario en el procesador de señales.
El muestreo de las señales de los micrófonos se puede realizar simultáneamente para todos los 40 micrófonos o se puede multiplexar multiplexando señales de los micrófonos antes de la conversión analógica a digital.
El procesado de la señal comprende una conformación de haz espacial y espectral y un cálculo del retardo de la señal debido al muestreo multiplexado, para realizar correcciones en software o hardware.
El procesado de la señal comprende además el cálculo del retardo de la presión acústica desde el objetivo 45 acústico a la matriz de micrófonos con el fin de realizar la sincronización de la señal con un retardo de tiempo predefinido.
El procesado de la señal comprende la regulación de la velocidad de muestreo sobre elementos de micrófono seleccionados para obtener un muestreo y un procesado óptimos de la señal.
El procesado de la señal posibilita una salida de audio dinámicamente selectiva con panoramización, 50 inclinación y zoom del sonido hacia una o más ubicaciones simultáneamente y también proporciona audio a uno o varios canales que incluyen sistemas envolventes.
El procesado de la señal proporciona también una frecuencia de muestreo (Fs) variable. La Fs sobre elementos de micrófonos activos a altas frecuencias es mayor que sobre elementos activos a bajas frecuencias. La Fs basada en el espectro de la señal y en el criterio de Rayleigh (velocidad de muestreo por lo menos dos veces 55
mayor que la frecuencia de la señal) ofrece un muestreo y un procesado óptimos de la señal, y proporciona una menor cantidad de datos a almacenar y procesar.
El procesado de la señal comprende el cambio de la apertura de la matriz de micrófonos con el fin de obtener una respuesta de frecuencia determinada y reducir el número de elementos activos en la matriz de micrófonos. 5
El(los) punto(s) de enfoque decide(n) qué funciones de ponderación espacial usar para ajustar el grado de conformación espacial del haz con enfoque y orientación con retardo y suma de conformadores de haces, y para cambiar el nivel de los lóbulos laterales y el ancho del haz.
La conformación espacial del haz se ejecuta escogiendo una función de ponderación de entre Cosin, Kaiser, Hamming, Hannig, Blackmann-Harris y Prolato-Esferoidal según el ancho de haz escogido del lóbulo 10 principal.
El sistema muestrea la presión acústica del sonido de todos los elementos, o una selección de elementos en todas las matrices, y almacena los datos en una unidad de almacenamiento. El muestreo se puede realizar simultáneamente para todos los canales o se puede multiplexar. Puesto que se muestrea y almacena el campo acústico completo, la totalidad del procesado de la señal de orientación-y-zoom para el sonido se puede realizar, 15 además de como un procesado en tiempo real, como un postprocesado (yendo atrás en el tiempo y extrayendo sonido de cualquier ubicación). El postprocesado de los datos almacenados ofrece la misma funcionalidad que el procesado en tiempo real y el operador puede proporcionar audio desde cualquier ubicación deseada para cuya cobertura esté ajustado el sistema.
Como resulta muy importante proporcionar una sincronización con equipos externos de audio y vídeo, el 20 sistema puede estimar y compensar el retardo de la señal de audio debido al tiempo de propagación de la señal desde la fuente de sonido a la(s) matriz(es) de micrófonos. El operador fijará el alcance requerido máximo que es necesario que cubra el sistema, y se calculará automáticamente el retardo del tiempo máximo. Este será el retardo de salida del sistema, y todo el audio fuera del sistema presentará este retardo.
Mediante la utilización de sensores diferentes, el sistema puede corregir el error en la propagación del 25 sonido debido a gradientes de temperatura, humedad en los medios (aire), y movimientos en los medios provocados por el viento e intercambio de aire caliente y frío.
La Figura 2 muestra un montaje que puede proporcionar audio de diferentes ubicaciones a un sistema envolvente, dependiendo de las cámaras que se estén usando. La figura muestra un campo de juego 400 con una matriz de micrófonos 100 ubicados en mitad del campo de juego 400 y por encima del mismo. La figura muestra 30 además una cámara 150 que cubre el lateral más corto del campo de juego 400, y otra cámara 160 que cubre el lateral más largo del campo de juego 400.
Usando este montaje, la presente invención puede proporcionar sonido relevante desde múltiples canales (CH1 a CH4) a la escena cubierta por cada cámara.
Mediante la recepción de información de ubicación desde un sistema que comprende un transmisor de 35 radiocomunicaciones, situado en un balón con el que se está jugando en campo de juego, y una(s) antena(s) para captar las señales de radiocomunicaciones, es posible disponer de un sistema que capta siempre el sonido desde el lugar en el que se produce la acción, y, por ejemplo, deja que este sonido represente el canal central en un sistema envolvente.
La Figura 3 muestra ejemplos del cambio de apertura para la optimización de frecuencias con filtros 40 espaciales en el diseño de la matriz.
Los sistemas pueden cambiar dinámicamente la apertura de la matriz con el fin de obtener un haz optimizado según el ancho de haz, la respuesta en frecuencia y la ganancia de la matriz deseados. Esto se puede alcanzar simplemente procesando datos de elementos seleccionados de la matriz y, de esta manera, el sistema puede reducir la cantidad necesaria de procesado de la señal. 45
Los puntos negros indican elementos de micrófono activos, y los puntos blancos indican elementos de micrófono pasivos.
A muestra una matriz de micrófonos con todos los elementos de micrófono activos. Esta configuración proporcionará la respuesta y directividad óptimas para todos los espectros que cubra la matriz.
B muestra una matriz estrechada optimizada de alta frecuencia que se puede usar cuando no haya 50 presente sonido de baja frecuencia o cuando no se requiera un filtrado especial para las frecuencias inferiores.
C muestra una matriz estrechada y optimizada, de frecuencias centrales, que se puede usar cuando no haya presente sonido de frecuencias bajas o altas, o cuando no se desee un filtrado espacial para las frecuencias más bajas o altas, por ejemplo, cuando haya presente únicamente habla normal.
D muestra una matriz estrechada y optimizada, de baja frecuencia, que se puede usar cuando no haya presente sonido de alta frecuencia o cuando no se requiera un filtrado especial para las frecuencias más altas.
Son factibles varias adaptaciones del sistema, lo cual posibilita formas diferentes de usar el mismo. El procesado de la señal, y, por lo tanto, la salida de sonido final, se puede procesar localmente, o en una ubicación remota. 5
Al permitir un procesado de la señal en una ubicación remota es posible que un usuario final, que esté viendo, por ejemplo, un evento deportivo en una TV, controle desde qué ubicaciones recibir sonido. En el usuario final se pueden situar medios de procesado de la señal, y el usuario puede introducir las ubicaciones desde las que desea recibir sonido. El dispositivo de entrada para introducir ubicaciones puede ser, por ejemplo, un ratón o una palanca de mando que controle un cursor sobre la pantalla en la que se está visualizando el evento deportivo. Los 10 medios de procesado de la señal 300 con sus medios de salida y entrada 340, 350 se pueden implementar entonces en una caja particular del televisor.
Alternativamente, el usuario final puede enviar datos de posición a medios de procesado de la señal situados en otra ubicación que no sea el usuario final, y recibir, a su vez, el sonido procesado y orientado desde una(s) posición(es) pertinente(s). 15

Claims (26)

  1. REIVINDICACIONES
    1. Sistema para el enfoque y la orientación directivos y digitales de sonido muestreado dentro de un área objetivo (400) con el fin de producir una salida de audio selectiva, que comprende una o más matrices de micrófonos, de banda ancha (100, 110), una unidad conversora de señales de A/D (200), una unidad de control (300), en donde la unidad de control (300) comprende:
    - unos medios receptores (310) para recibir señales digitales de sonido capturado desde todos los 5 micrófonos que comprende el sistema;
    - unos medios de entrada (350) para recibir instrucciones que comprenden datos de posición selectivos en forma de coordenadas, donde las coordenadas se presentan en dos o tres dimensiones para definir un(os) punto(s) de enfoque;
    - unos medios de procesado de la señal (330) para escoger señales de una selección de micrófonos 10 pertinentes en la(s) matriz(es) (100, 110) para un procesado posterior, donde la selección realizada se basa en análisis espectrales de la señal recibida;
    - unos medios de procesado de la señal (330) para realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes con el fin de enfocar y orientar el sonido según las instrucciones recibidas; 15
    - unos medios de procesado de la señal (330) para generar una o más salida(s) de audio selectiva(s) de acuerdo con instrucciones recibidas y el procesado de la señal realizado.
  2. 2. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) está situada en una ubicación remota y comprende unos medios (310) para recibir las señales digitales del sonido capturado a través de una red alámbrica o inalámbrica. 20
  3. 3. Sistema según la reivindicación 1, caracterizado porque los medios de entrada (350) en la unidad de control (300) comprenden unos medios para recibir datos de posición selectivos a través de una red alámbrica o inalámbrica.
  4. 4. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) comprende además unos medios de almacenamiento de datos (320) para almacenar las señales digitales recibidas del sonido 25 capturado.
  5. 5. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) realiza un procesado de la señal sobre varios canales basándose en una o varias coordenadas de entrada diferentes.
  6. 6. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) comprende unos medios para cambiar la apertura de la(s) matriz(es) de micrófonos (100, 110) basándose en los componentes 30 espectrales del sonido entrante.
  7. 7. Sistema según la reivindicación 4, caracterizado porque la unidad de control (300) comprende además unos medios para convertir señales recibidas a un formato comprimido antes de que las mismas sean almacenadas en los medios de almacenamiento (320).
  8. 8. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) comprende 35 además unos medios para controlar y enfocar una o más cámaras basándose en instrucciones recibidas que comprenden datos de posición selectivos.
  9. 9. Método para enfocar y orientar de forma digital y directiva sonido muestreado dentro de un área objetivo (400) con el fin de producir una salida de audio selectiva, donde el método comprende el uso de una o más matrices de micrófonos, de banda ancha (100, 110), una unidad conversora de señales de A/D (200), y una unidad 40 de control (300), comprendiendo el método las siguientes etapas realizadas por la unidad de control (300):
    - recibir señales digitales de sonido capturado desde todos los micrófonos que comprende el sistema;
    - recibir instrucciones que comprenden datos de posición selectivos en forma de coordenadas, a través de medios de entrada (350) en la unidad de control (300), donde las coordenadas están en dos o tres dimensiones para definir un(os) punto(s) de enfoque(s); 45
    - escoger señales de una selección de micrófonos pertinentes en la(s) matriz(es) (100, 110) para un procesado posterior, donde la selección realizada se basa en análisis espectrales de la señal recibida;
    - realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes para enfocar y orientar el sonido según las instrucciones recibidas; 50
    - generar una o más salida(s) de audio selectiva(s) de acuerdo con las instrucciones recibidas y el procesado realizado.
  10. 10. Método según la reivindicación 9, caracterizado porque las señales digitales recibidas están en un formato comprimido.
  11. 11. Método según la reivindicación 9, caracterizado porque las señales digitales recibidas del sonido capturado de todos los micrófonos en la(s) matriz(es) (100, 110) se almacenan en unos medios de almacenamiento de datos (320). 5
  12. 12. Método según la reivindicación 9, caracterizado porque la unidad de procesado de la señal (300) ejecuta el procesado de la señal en tiempo real.
  13. 13. Método según la reivindicación 9 y 11, caracterizado porque la unidad de procesado de la señal (300) ejecuta el procesado de la señal en un proceso de postprocesado usando las señales almacenadas del sonido capturado. 10
  14. 14. Método según la reivindicación 9, caracterizado porque el procesado de la señal comprende conformación espacial y espectral de los haces.
  15. 15. Método según la reivindicación 9, caracterizado porque el procesado de la señal comprende un muestreo multiplexado y un cálculo del retardo de la señal, debido al multiplexado, para realizar correcciones en software o hardware. 15
  16. 16. Método según la reivindicación 9, caracterizado porque el procesado de la señal comprende el cálculo del retardo de la presión acústica desde el objetivo acústico a la matriz de micrófonos con el fin de realizar la sincronización de la señal con un retardo de tiempo predefinido.
  17. 17. Método según la reivindicación 9, caracterizado porque el procesado de la señal posibilita una salida de audio dinámicamente selectiva con zoom y panoramización del sonido hacia una o más ubicaciones 20 simultáneamente y proporciona también audio a uno o varios canales, que incluyen sistemas envolventes.
  18. 18. Método según la reivindicación 9, caracterizado porque el procesado de la señal comprende la regulación de la velocidad de muestreo sobre elementos de micrófono seleccionados con el fin de obtener un muestreo y un procesado óptimos de la señal.
  19. 19. Método según la reivindicación 9, caracterizado porque el cambio de apertura de la matriz de 25 micrófonos se realiza para obtener una respuesta en frecuencia determinada y reducir el número de elementos activos en la matriz de micrófonos.
  20. 20. Método según la reivindicación 19, caracterizado porque los datos de posición selectivos recibidos provienen de un sistema que realiza un seguimiento de uno o más objetos.
  21. 21. Método según la reivindicación 14 y 19, caracterizado porque los datos de posición deciden qué 30 funciones de ponderación espacial usar para ajustar el grado de conformación espacial del haz con enfoque y orientación con retardo y suma de conformadores de haz, y para cambiar el nivel de los lóbulos laterales y el ancho del haz.
  22. 22. Método según la reivindicación 21, caracterizado porque la conformación espacial del haz se ejecuta seleccionando una función de ponderación de entre Cosin, Kaiser, Hamming, Hannig, Blackmann-Harris y Prolato-35 Esferoidal según el ancho de haz seleccionado del lóbulo principal.
  23. 23. Método según la reivindicación 19, caracterizado porque las coordenadas se definen por la posición y el(los) punto(s) de enfoque de una o más cámara(s) que está(n) filmando un evento que tiene lugar en una(s) ubicación(es) específica(s) dentro del área objetivo.
  24. 24. Método según la reivindicación 19, caracterizado porque las coordenadas se definen por un usuario 40 que controla una interfaz de usuario que comprende una o más pantallas que muestran una vista general del área objetivo, un teclado, una unidad mezcladora de audio, y una o más palancas de mando.
  25. 25. Método según la reivindicación 19, caracterizado porque las coordenadas se usan para controlar y enfocar una o más cámaras.
  26. 26. Método según la reivindicación 17, caracterizado porque la salida de audio dinámicamente selectiva 45 en un sistema envolvente se encuentra en coherencia con una o más cámara(s).
ES06799561T 2005-09-30 2006-09-29 Captura de audio direccional. Active ES2355271T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NO20054527 2005-09-30
NO20054527A NO323434B1 (no) 2005-09-30 2005-09-30 System og metode for a produsere et selektivt lydutgangssignal
US721999P 2005-09-30

Publications (1)

Publication Number Publication Date
ES2355271T3 true ES2355271T3 (es) 2011-03-24

Family

ID=35307883

Family Applications (1)

Application Number Title Priority Date Filing Date
ES06799561T Active ES2355271T3 (es) 2005-09-30 2006-09-29 Captura de audio direccional.

Country Status (7)

Country Link
CN (1) CN101278596B (es)
AT (1) ATE487333T1 (es)
DE (1) DE602006018050D1 (es)
DK (1) DK1946606T3 (es)
ES (1) ES2355271T3 (es)
NO (1) NO323434B1 (es)
PT (1) PT1946606E (es)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9196238B2 (en) 2009-12-24 2015-11-24 Nokia Technologies Oy Audio processing based on changed position or orientation of a portable mobile electronic apparatus
CN102137318B (zh) * 2010-01-22 2014-08-20 华为终端有限公司 拾音控制方法和装置
US9332346B2 (en) * 2010-02-17 2016-05-03 Nokia Technologies Oy Processing of multi-device audio capture
CN102377975A (zh) * 2010-08-10 2012-03-14 华为终端有限公司 用于视频通信的视频处理方法、装置及系统
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
CN103024629B (zh) * 2011-09-30 2017-04-12 斯凯普公司 处理信号
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
JP5958717B2 (ja) * 2013-07-19 2016-08-02 パナソニックIpマネジメント株式会社 指向性制御システム、指向性制御方法、収音システム及び収音制御方法
WO2015168901A1 (en) * 2014-05-08 2015-11-12 Intel Corporation Audio signal beam forming
EP3151534A1 (en) * 2015-09-29 2017-04-05 Thomson Licensing Method of refocusing images captured by a plenoptic camera and audio based refocusing image system
US9756421B2 (en) * 2016-01-22 2017-09-05 Mediatek Inc. Audio refocusing methods and electronic devices utilizing the same
US10789949B2 (en) * 2017-06-20 2020-09-29 Bose Corporation Audio device with wakeup word detection
EP3866457A1 (en) * 2020-02-14 2021-08-18 Nokia Technologies Oy Multi-media content
KR102952330B1 (ko) 2020-08-04 2026-04-14 삼성전자주식회사 오디오 데이터를 처리하는 전자 장치와 이의 동작 방법
CN121632573A (zh) * 2026-02-04 2026-03-10 天津奥美自动化系统有限公司 一种控制阀的故障诊断方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3157769B2 (ja) * 1998-03-02 2001-04-16 静岡日本電気株式会社 Tv音声制御装置

Also Published As

Publication number Publication date
NO323434B1 (no) 2007-04-30
CN101278596A (zh) 2008-10-01
ATE487333T1 (de) 2010-11-15
DE602006018050D1 (de) 2010-12-16
NO20054527D0 (no) 2005-09-30
CN101278596B (zh) 2012-08-29
PT1946606E (pt) 2011-01-28
DK1946606T3 (da) 2011-02-21

Similar Documents

Publication Publication Date Title
ES2355271T3 (es) Captura de audio direccional.
EP1946606B1 (en) Directional audio capturing
JP4252377B2 (ja) 全方位カメラ及びマイクロフォンアレイのためのシステム
US20180220070A1 (en) Omnidirectional sensor array system
US20060227224A1 (en) Imaging device, sound record device, and sound record method
WO2002069623A1 (en) Image input device
US20020122113A1 (en) Method and system for compensating for parallax in multiple camera systems
US11765464B2 (en) Composite reception/emission apparatus
US12395794B2 (en) Conferencing systems and methods for room intelligence
WO2016054679A1 (en) Method and apparatus for providing customised sound distributions
CN115134499B (zh) 一种音视频监控方法及系统
CN105706462A (zh) 指向性控制装置、指向性控制方法、存储介质及指向性控制系统
JP5939444B2 (ja) 撮像装置
JP2021121121A (ja) 撮像装置、撮像システムおよび再生装置
JP4892927B2 (ja) 撮影装置、および通信会議システム
US11665391B2 (en) Signal processing device and signal processing system
CN117319879A (zh) 处理音频数据的方法、装置、设备和存储介质
JP6274251B2 (ja) 画像データ発生装置及び画像データ発生方法
GB2432990A (en) Direction-sensitive video surveillance
Véronique OBJECT-AUDIO CAPTURE SYSTEM FOR SPORTS BROADCAST
JP6249047B2 (ja) 音声処理装置、映像処理装置、音声処理方法及び映像処理方法