ES2355271T3

ES2355271T3 - Captura de audio direccional.

Info

Publication number: ES2355271T3
Application number: ES06799561T
Authority: ES
Inventors: Morgan KJØLERBAKKEN; Vibeke Jahr; Ines Hafizovic
Original assignee: SquareHead Tech AS
Current assignee: SquareHead Tech AS
Priority date: 2005-09-30
Filing date: 2006-09-29
Publication date: 2011-03-24
Anticipated expiration: 2026-09-29
Also published as: NO323434B1; CN101278596A; ATE487333T1; DE602006018050D1; NO20054527D0; CN101278596B; PT1946606E; DK1946606T3

Abstract

Sistema para el enfoque y la orientación directivos y digitales de sonido muestreado dentro de un área objetivo (400) con el fin de producir una salida de audio selectiva, que comprende una o más matrices de micrófonos, de banda ancha (100, 110), una unidad conversora de señales de A/D (200), una unidad de control (300), en donde la unidad de control (300) comprende: - unos medios receptores (310) para recibir señales digitales de sonido capturado desde todos los micrófonos que comprende el sistema; - unos medios de entrada (350) para recibir instrucciones que comprenden datos de posición selectivos en forma de coordenadas, donde las coordenadas se presentan en dos o tres dimensiones para definir un(os) punto(s) de enfoque; - unos medios de procesado de la señal (330) para escoger señales de una selección de micrófonos pertinentes en la(s) matriz(es) (100, 110) para un procesado posterior, donde la selección realizada se basa en análisis espectrales de la señal recibida; - unos medios de procesado de la señal (330) para realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes con el fin de enfocar y orientar el sonido según las instrucciones recibidas; - unos medios de procesado de la señal (330) para generar una o más salida(s) de audio selectiva(s) de acuerdo con instrucciones recibidas y el procesado de la señal realizado.

Description

INTRODUCCIÓN

La presente invención se refiere a la captura de audio direccional y, más específicamente, a un método y un sistema para producir audio selectivo en una producción de vídeo, posibilitando de este modo una radiodifusión con funcionalidad de orientación y zoom controlados. 5

El sistema es útil para capturar sonido bajo condiciones de ruido en las que es necesario un filtrado espacial, por ejemplo, la captura de sonido de atletas, árbitros y entrenadores en acontecimientos deportivos para una producción de emisiones de radiodifusión.

El sistema comprende una o más matrices de micrófonos, una o más unidades de muestreo, medios de almacenamiento, y una unidad de control y procesado de la señal con medios de entrada para recibir datos de 10 posición.

ANTECEDENTES DE LA INVENCIÓN – TÉCNICA ANTERIOR

Una matriz de micrófonos es un montaje de captación acústica multicanal que comprende dos o más sensores de presión acústica situados en ubicaciones diferentes en el espacio con el fin de muestrear espacialmente la presión acústica de una o varias fuentes. Se pueden usar técnicas de procesado de la señal para 15 controlar, o más específicamente orientar, la matriz de micrófonos hacia cualquier fuente de interés. Las técnicas a usar pueden ser, entre otras: retardo de señales, filtrado, ponderación, y suma de señales de los elementos de micrófono para alcanzar la selectividad espacial deseada. A esto se le hace referencia como conformación de haces. Los micrófonos en una matriz de micrófonos controlable deberían estar bien adaptados en cuanto a amplitud y fase. Si no, deben conocerse las diferencias para realizar correcciones de errores en el software y/o el hardware. 20 Los principios que subyacen tras la orientación de una matriz son bien conocidos a partir de la bibliografía pertinente del procesado de señales. Las matrices de micrófonos pueden ser rectangulares, circulares, o tridimensionales.

Existen varios sistemas conocidos que comprenden matrices de micrófonos. La mayoría de ellos se centran principalmente en el procesado de las señales para alcanzar una optimización de señales muestreadas y/o 25 la interpretación de la posición de objetos o elementos en la imagen.

A continuación se describe la técnica anterior más relevante.

El documento US2003/0072461 describe una matriz colineal múltiple de micrófonos seguida por un procesado de la señal, con una respuesta altamente direccional.

La patente US nº 5.940.118 describe un sistema y un método para orientar micrófonos direccionales. El 30 sistema está destinado a ser usado en salas de conferencia que contienen miembros de la audiencia. Comprende medios de entrada ópticos, es decir, cámaras, y medios de interpretación para interpretar qué miembros de la audiencia están hablando, y medios para activar el sonido hacia la fuente de sonido.

La patente US nº 6.469.732 describe un aparato y un método usados en un sistema de videoconferencia para proporcionar una determinación exacta de la posición de un participante que está hablando. 35

El documento JP2004 180197 describe una matriz de micrófonos que se puede controlar digitalmente con respecto al enfoque acústico.

La presente invención es un método y un sistema para el enfoque y la orientación controlados del sonido que va a ser presentado junto con vídeo. La invención difiere con respecto a la técnica anterior en su flexibilidad y facilidad de uso. 40

En una forma de realización preferida, la invención es un método y un sistema para recibir datos de posición y enfoque desde una o más cámaras que filman un evento, y para usar estos datos de entrada con el fin de generar una salida acústica pertinente junto con el vídeo.

En otra forma de realización, un usuario puede introducir la ubicación deseada desde la cual captar sonido, y unos medios de procesado de la señal usarán la misma para realizar el procesado necesario de la señal. 45

Todavía en otra forma de realización, los datos de posición para la ubicación desde la cual captar sonido se pueden enviar desde un sistema que comprende antena(s) que captan señales de radiocomunicaciones de transmisor(es) de radiocomunicaciones ubicado(s) sobre o en objeto(s) del(de los) que se va a realizar un seguimiento, junto con medios para deducir la ubicación y enviar esta información al sistema según la presente invención. El emisor de radiocomunicaciones se puede situar, por ejemplo, en un balón de fútbol, permitiendo de 50 este modo que el sistema registre sonido desde la ubicación del balón, y que también controle una o más cámaras de tal manera que tanto el vídeo como el sonido se enfocarán en la ubicación del balón.

OBJETIVOS Y SUMARIO DE LA INVENCIÓN

El objetivo de la presente invención es proporcionar una salida de audio selectiva con respecto a un(a) área(s) objetivo relevante(s).

El objetivo se alcanza mediante un sistema para el enfoque y la orientación directivos y digitales de sonido muestreado dentro del área objetivo con el fin de producir la salida de audio selectiva. El sistema comprende una o 5 más matrices de micrófonos, de banda ancha, una o más unidades conversoras de señales de A/D, una unidad de control con medios de entrada, medios de salida, medios de almacenamiento, y una o más unidades de procesado de señales.

El sistema está caracterizado porque la unidad de control comprende unos medios de entrada para recibir señales digitales de sonido capturado desde todos los micrófonos que comprende el sistema, y unos medios de 10 entrada para recibir instrucciones que comprenden datos de posición selectivos.

El sistema está caracterizado además porque la unidad de control comprende unos medios de procesado de la señal para: escoger señales de una selección de micrófonos pertinentes en la(s) matriz(es) para un procesado posterior, y para realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes con el fin de enfocar y orientar el sonido según las instrucciones recibidas, y para generar una salida de audio selectiva 15 de acuerdo con el procesado realizado.

El objetivo de la invención se alcanza además mediante un método para enfocar y orientar de forma digital y directiva sonido muestreado dentro de un área objetivo con el fin de producir una salida de audio selectiva, donde el método comprende el uso de una o más matrices de micrófonos, de banda ancha, una unidad conversora de señales de A/D, y una unidad de control con medios de entrada, medios de salida, medios de almacenamiento y 20 una o más unidades de procesado de señales.

El método está caracterizado porque comprende las siguientes etapas realizadas por la unidad de control:

- recibir señales digitales de sonido capturado desde todos los micrófonos que comprende el sistema;

- recibir instrucciones que comprenden datos de posición selectivos a través de los medios de entrada en la unidad de control; 25

- escoger señales de una selección de micrófonos pertinentes en la(s) matriz(es) de banda ancha para un procesado posterior, y donde la selección realizada se basa en análisis espectrales de la señal;

- realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes para enfocar y orientar el sonido según las instrucciones recibidas;

- generar una o más salida(s) de audio selectiva(s) de acuerdo con el procesado realizado. 30

Una característica principal de la invención es que los datos de posición selectivos se pueden proporcionar en tiempo real o en un proceso de postprocesado del sonido registrado. El(las) área(s) de enfoque desde la(s) cual(es) se va a producir sonido puede(n) ser definida(s) por un usuario final que proporcione instrucciones de entrada del(de las) área(s) o mediante la posición y el enfoque de una o más cámaras.

Los objetivos de la invención se alcanzan con los medios y el método según se exponen en el conjunto de 35 reivindicaciones adjuntas.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

Se describirá más detalladamente la invención haciendo referencia a las figuras, en las que:

la Fig. 1 muestra una vista general de los diferentes componentes del sistema, integrados con cámaras;

la Fig. 2 muestra un montaje que puede proporcionar audio desde diferentes ubicaciones a un sistema 40 envolvente, dependiendo de las cámaras que se estén usando.

La Fig. 3 muestra ejemplos de optimización de frecuencias con filtros espaciales en el diseño de matrices.

DESCRIPCIÓN DETALLADA DE LAS FORMAS DE REALIZACIÓN PREFERIDAS

La Figura 1 muestra una vista general de los diferentes componentes del sistema, integrados con cámaras.

Los componentes mostrados en el dibujo son matrices de micrófonos, de banda ancha 100, 110, que se 45 van a posicionar adyacentes al área desde la que se va a registrar sonido. Las señales analógicas de cada micrófono se convierten en una señal digital en un conversor A/D 210 incluido en una unidad de A/D 200. La unidad de A/D puede tener también medios de memoria 220 para almacenar las señales digitales, y medios de transferencia de datos 230 para transferir las señales digitales hacia una unidad de control 300.

La unidad de control 300 puede estar situada en una ubicación remota y recibir las señales digitales del 50 sonido capturado a través de una red alámbrica o inalámbrica, por ejemplo, por medio de cable o satélite dejando

que un usuario final realice todo el procesado de la señal de orientación y enfoque de manera local. La unidad de control 300 comprende un receptor de datos 310 para recibir señales de sonido digitales de la unidad de A/D 200. Comprende además unos medios de almacenamiento de datos 320 para almacenar las señales recibidas, medios de procesado de señales 330 para tiempo real o postprocesado, y unos medios generadores de audio 340 para generar una salida de audio selectiva. Antes de almacenar las señales en los medios de almacenamiento de datos, 5 la señal se puede convertir a un formato comprimido para ahorrar espacio.

La unidad de control 300 comprende además medios de entrada 350 para recibir instrucciones que comprenden datos de posición selectivos. Estas instrucciones son típicamente coordenadas que definen la posición y el punto de enfoque de una o más cámara(s) que están filmando un evento que tiene lugar en una(s) ubicación(es) específica(s) dentro del área objetivo. 10

En una primera forma de realización, las coordenadas de la fuente de sonido se pueden proporcionar por medio del punto de enfoque de la(s) cámara(s) 150, 160 y a partir del acimut y la altitud del(de los) trípode(s) de la(s) cámara(s). Mediante la conexión del sistema a una o más cámaras de televisión y la recepción de coordenadas de posicionamiento en dos o tres dimensiones (acimut, altitud y alcance), es posible orientar y enfocar el sonido según el punto de enfoque de la lente de la cámara. 15

En una segunda forma de realización, las coordenadas, y por lo tanto la ubicación de la fuente de sonido, las puede proporcionar un operador que haga funcionar una(s) interfaz(es) de usuario gráfica(s) (GUI), que muestre una vista general del área objetivo, un teclado, una unidad mezcladora de audio, y una o más palancas de mando. La GUI proporciona al operador la información sobre en dónde realizar la orientación y el zoom.

La GUI puede mostrar vídeo en directo desde una o más cámaras conectadas (múltiples canales). En una 20 forma de realización preferida, a la GUI se le añaden gráficos adicionales con el fin de señalar hacia dónde se está orientando el sistema. Esto simplifica el funcionamiento del sistema y proporciona al operador un control total sobre la función de zoom y orientación.

En una tercera forma de realización, el sistema puede usar algoritmos para hallar fuentes de sonido predefinidas. Por ejemplo, el sistema se puede configurar para escuchar el silbato de un árbitro y, a continuación, 25 orientar y enfocar audio y vídeo hacia esta ubicación.

Todavía en otra forma de realización, la ubicación o coordenadas las puede proporcionar un sistema que realice un seguimiento de la ubicación de un objeto, por ejemplo, un balón de fútbol con el que se esté jugando en un campo de juego.

Una combinación de las formas de realización mencionadas anteriormente constituye también una 30 alternativa viable.

Para que el sonido y el área de enfoque de la(s) cámara(s) estén sincronizados, es necesario que el sistema tenga un sistema de coordenadas común. Las coordenadas de las cámaras se calibrarán con respecto a un punto de referencia común para el sistema y las cámaras.

El sistema puede capturar sonido de varias ubicaciones diferentes simultáneamente (funcionalidad 35 multicanal) y proporcionar audio a un sistema envolvente. Las ubicaciones se pueden predefinir para cada cámara o pueden cambiar dinámicamente en tiempo real de acuerdo con la posición, el enfoque, y el ángulo de las cámaras.

La salida de audio selectiva se alcanza combinando las señales de sonido digitales y los datos de posición y realizando el procesado de señal necesario en el procesador de señales.

El muestreo de las señales de los micrófonos se puede realizar simultáneamente para todos los 40 micrófonos o se puede multiplexar multiplexando señales de los micrófonos antes de la conversión analógica a digital.

El procesado de la señal comprende una conformación de haz espacial y espectral y un cálculo del retardo de la señal debido al muestreo multiplexado, para realizar correcciones en software o hardware.

El procesado de la señal comprende además el cálculo del retardo de la presión acústica desde el objetivo 45 acústico a la matriz de micrófonos con el fin de realizar la sincronización de la señal con un retardo de tiempo predefinido.

El procesado de la señal comprende la regulación de la velocidad de muestreo sobre elementos de micrófono seleccionados para obtener un muestreo y un procesado óptimos de la señal.

El procesado de la señal posibilita una salida de audio dinámicamente selectiva con panoramización, 50 inclinación y zoom del sonido hacia una o más ubicaciones simultáneamente y también proporciona audio a uno o varios canales que incluyen sistemas envolventes.

El procesado de la señal proporciona también una frecuencia de muestreo (Fs) variable. La Fs sobre elementos de micrófonos activos a altas frecuencias es mayor que sobre elementos activos a bajas frecuencias. La Fs basada en el espectro de la señal y en el criterio de Rayleigh (velocidad de muestreo por lo menos dos veces 55

mayor que la frecuencia de la señal) ofrece un muestreo y un procesado óptimos de la señal, y proporciona una menor cantidad de datos a almacenar y procesar.

El procesado de la señal comprende el cambio de la apertura de la matriz de micrófonos con el fin de obtener una respuesta de frecuencia determinada y reducir el número de elementos activos en la matriz de micrófonos. 5

El(los) punto(s) de enfoque decide(n) qué funciones de ponderación espacial usar para ajustar el grado de conformación espacial del haz con enfoque y orientación con retardo y suma de conformadores de haces, y para cambiar el nivel de los lóbulos laterales y el ancho del haz.

La conformación espacial del haz se ejecuta escogiendo una función de ponderación de entre Cosin, Kaiser, Hamming, Hannig, Blackmann-Harris y Prolato-Esferoidal según el ancho de haz escogido del lóbulo 10 principal.

El sistema muestrea la presión acústica del sonido de todos los elementos, o una selección de elementos en todas las matrices, y almacena los datos en una unidad de almacenamiento. El muestreo se puede realizar simultáneamente para todos los canales o se puede multiplexar. Puesto que se muestrea y almacena el campo acústico completo, la totalidad del procesado de la señal de orientación-y-zoom para el sonido se puede realizar, 15 además de como un procesado en tiempo real, como un postprocesado (yendo atrás en el tiempo y extrayendo sonido de cualquier ubicación). El postprocesado de los datos almacenados ofrece la misma funcionalidad que el procesado en tiempo real y el operador puede proporcionar audio desde cualquier ubicación deseada para cuya cobertura esté ajustado el sistema.

Como resulta muy importante proporcionar una sincronización con equipos externos de audio y vídeo, el 20 sistema puede estimar y compensar el retardo de la señal de audio debido al tiempo de propagación de la señal desde la fuente de sonido a la(s) matriz(es) de micrófonos. El operador fijará el alcance requerido máximo que es necesario que cubra el sistema, y se calculará automáticamente el retardo del tiempo máximo. Este será el retardo de salida del sistema, y todo el audio fuera del sistema presentará este retardo.

Mediante la utilización de sensores diferentes, el sistema puede corregir el error en la propagación del 25 sonido debido a gradientes de temperatura, humedad en los medios (aire), y movimientos en los medios provocados por el viento e intercambio de aire caliente y frío.

La Figura 2 muestra un montaje que puede proporcionar audio de diferentes ubicaciones a un sistema envolvente, dependiendo de las cámaras que se estén usando. La figura muestra un campo de juego 400 con una matriz de micrófonos 100 ubicados en mitad del campo de juego 400 y por encima del mismo. La figura muestra 30 además una cámara 150 que cubre el lateral más corto del campo de juego 400, y otra cámara 160 que cubre el lateral más largo del campo de juego 400.

Usando este montaje, la presente invención puede proporcionar sonido relevante desde múltiples canales (CH1 a CH4) a la escena cubierta por cada cámara.

Mediante la recepción de información de ubicación desde un sistema que comprende un transmisor de 35 radiocomunicaciones, situado en un balón con el que se está jugando en campo de juego, y una(s) antena(s) para captar las señales de radiocomunicaciones, es posible disponer de un sistema que capta siempre el sonido desde el lugar en el que se produce la acción, y, por ejemplo, deja que este sonido represente el canal central en un sistema envolvente.

La Figura 3 muestra ejemplos del cambio de apertura para la optimización de frecuencias con filtros 40 espaciales en el diseño de la matriz.

Los sistemas pueden cambiar dinámicamente la apertura de la matriz con el fin de obtener un haz optimizado según el ancho de haz, la respuesta en frecuencia y la ganancia de la matriz deseados. Esto se puede alcanzar simplemente procesando datos de elementos seleccionados de la matriz y, de esta manera, el sistema puede reducir la cantidad necesaria de procesado de la señal. 45

Los puntos negros indican elementos de micrófono activos, y los puntos blancos indican elementos de micrófono pasivos.

A muestra una matriz de micrófonos con todos los elementos de micrófono activos. Esta configuración proporcionará la respuesta y directividad óptimas para todos los espectros que cubra la matriz.

B muestra una matriz estrechada optimizada de alta frecuencia que se puede usar cuando no haya 50 presente sonido de baja frecuencia o cuando no se requiera un filtrado especial para las frecuencias inferiores.

C muestra una matriz estrechada y optimizada, de frecuencias centrales, que se puede usar cuando no haya presente sonido de frecuencias bajas o altas, o cuando no se desee un filtrado espacial para las frecuencias más bajas o altas, por ejemplo, cuando haya presente únicamente habla normal.

D muestra una matriz estrechada y optimizada, de baja frecuencia, que se puede usar cuando no haya presente sonido de alta frecuencia o cuando no se requiera un filtrado especial para las frecuencias más altas.

Son factibles varias adaptaciones del sistema, lo cual posibilita formas diferentes de usar el mismo. El procesado de la señal, y, por lo tanto, la salida de sonido final, se puede procesar localmente, o en una ubicación remota. 5

Al permitir un procesado de la señal en una ubicación remota es posible que un usuario final, que esté viendo, por ejemplo, un evento deportivo en una TV, controle desde qué ubicaciones recibir sonido. En el usuario final se pueden situar medios de procesado de la señal, y el usuario puede introducir las ubicaciones desde las que desea recibir sonido. El dispositivo de entrada para introducir ubicaciones puede ser, por ejemplo, un ratón o una palanca de mando que controle un cursor sobre la pantalla en la que se está visualizando el evento deportivo. Los 10 medios de procesado de la señal 300 con sus medios de salida y entrada 340, 350 se pueden implementar entonces en una caja particular del televisor.

Alternativamente, el usuario final puede enviar datos de posición a medios de procesado de la señal situados en otra ubicación que no sea el usuario final, y recibir, a su vez, el sonido procesado y orientado desde una(s) posición(es) pertinente(s). 15

Claims

REIVINDICACIONES

1. Sistema para el enfoque y la orientación directivos y digitales de sonido muestreado dentro de un área objetivo (400) con el fin de producir una salida de audio selectiva, que comprende una o más matrices de micrófonos, de banda ancha (100, 110), una unidad conversora de señales de A/D (200), una unidad de control (300), en donde la unidad de control (300) comprende:

- unos medios receptores (310) para recibir señales digitales de sonido capturado desde todos los 5 micrófonos que comprende el sistema;

- unos medios de entrada (350) para recibir instrucciones que comprenden datos de posición selectivos en forma de coordenadas, donde las coordenadas se presentan en dos o tres dimensiones para definir un(os) punto(s) de enfoque;

- unos medios de procesado de la señal (330) para escoger señales de una selección de micrófonos 10 pertinentes en la(s) matriz(es) (100, 110) para un procesado posterior, donde la selección realizada se basa en análisis espectrales de la señal recibida;

- unos medios de procesado de la señal (330) para realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes con el fin de enfocar y orientar el sonido según las instrucciones recibidas; 15

- unos medios de procesado de la señal (330) para generar una o más salida(s) de audio selectiva(s) de acuerdo con instrucciones recibidas y el procesado de la señal realizado.
2. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) está situada en una ubicación remota y comprende unos medios (310) para recibir las señales digitales del sonido capturado a través de una red alámbrica o inalámbrica. 20
3. Sistema según la reivindicación 1, caracterizado porque los medios de entrada (350) en la unidad de control (300) comprenden unos medios para recibir datos de posición selectivos a través de una red alámbrica o inalámbrica.
4. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) comprende además unos medios de almacenamiento de datos (320) para almacenar las señales digitales recibidas del sonido 25 capturado.
5. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) realiza un procesado de la señal sobre varios canales basándose en una o varias coordenadas de entrada diferentes.
6. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) comprende unos medios para cambiar la apertura de la(s) matriz(es) de micrófonos (100, 110) basándose en los componentes 30 espectrales del sonido entrante.
7. Sistema según la reivindicación 4, caracterizado porque la unidad de control (300) comprende además unos medios para convertir señales recibidas a un formato comprimido antes de que las mismas sean almacenadas en los medios de almacenamiento (320).
8. Sistema según la reivindicación 1, caracterizado porque la unidad de control (300) comprende 35 además unos medios para controlar y enfocar una o más cámaras basándose en instrucciones recibidas que comprenden datos de posición selectivos.
9. Método para enfocar y orientar de forma digital y directiva sonido muestreado dentro de un área objetivo (400) con el fin de producir una salida de audio selectiva, donde el método comprende el uso de una o más matrices de micrófonos, de banda ancha (100, 110), una unidad conversora de señales de A/D (200), y una unidad 40 de control (300), comprendiendo el método las siguientes etapas realizadas por la unidad de control (300):

- recibir señales digitales de sonido capturado desde todos los micrófonos que comprende el sistema;

- recibir instrucciones que comprenden datos de posición selectivos en forma de coordenadas, a través de medios de entrada (350) en la unidad de control (300), donde las coordenadas están en dos o tres dimensiones para definir un(os) punto(s) de enfoque(s); 45

- escoger señales de una selección de micrófonos pertinentes en la(s) matriz(es) (100, 110) para un procesado posterior, donde la selección realizada se basa en análisis espectrales de la señal recibida;

- realizar un procesado de la señal sobre las señales de la selección de micrófonos pertinentes para enfocar y orientar el sonido según las instrucciones recibidas; 50

- generar una o más salida(s) de audio selectiva(s) de acuerdo con las instrucciones recibidas y el procesado realizado.
10. Método según la reivindicación 9, caracterizado porque las señales digitales recibidas están en un formato comprimido.
11. Método según la reivindicación 9, caracterizado porque las señales digitales recibidas del sonido capturado de todos los micrófonos en la(s) matriz(es) (100, 110) se almacenan en unos medios de almacenamiento de datos (320). 5
12. Método según la reivindicación 9, caracterizado porque la unidad de procesado de la señal (300) ejecuta el procesado de la señal en tiempo real.
13. Método según la reivindicación 9 y 11, caracterizado porque la unidad de procesado de la señal (300) ejecuta el procesado de la señal en un proceso de postprocesado usando las señales almacenadas del sonido capturado. 10
14. Método según la reivindicación 9, caracterizado porque el procesado de la señal comprende conformación espacial y espectral de los haces.
15. Método según la reivindicación 9, caracterizado porque el procesado de la señal comprende un muestreo multiplexado y un cálculo del retardo de la señal, debido al multiplexado, para realizar correcciones en software o hardware. 15
16. Método según la reivindicación 9, caracterizado porque el procesado de la señal comprende el cálculo del retardo de la presión acústica desde el objetivo acústico a la matriz de micrófonos con el fin de realizar la sincronización de la señal con un retardo de tiempo predefinido.
17. Método según la reivindicación 9, caracterizado porque el procesado de la señal posibilita una salida de audio dinámicamente selectiva con zoom y panoramización del sonido hacia una o más ubicaciones 20 simultáneamente y proporciona también audio a uno o varios canales, que incluyen sistemas envolventes.
18. Método según la reivindicación 9, caracterizado porque el procesado de la señal comprende la regulación de la velocidad de muestreo sobre elementos de micrófono seleccionados con el fin de obtener un muestreo y un procesado óptimos de la señal.
19. Método según la reivindicación 9, caracterizado porque el cambio de apertura de la matriz de 25 micrófonos se realiza para obtener una respuesta en frecuencia determinada y reducir el número de elementos activos en la matriz de micrófonos.
20. Método según la reivindicación 19, caracterizado porque los datos de posición selectivos recibidos provienen de un sistema que realiza un seguimiento de uno o más objetos.
21. Método según la reivindicación 14 y 19, caracterizado porque los datos de posición deciden qué 30 funciones de ponderación espacial usar para ajustar el grado de conformación espacial del haz con enfoque y orientación con retardo y suma de conformadores de haz, y para cambiar el nivel de los lóbulos laterales y el ancho del haz.
22. Método según la reivindicación 21, caracterizado porque la conformación espacial del haz se ejecuta seleccionando una función de ponderación de entre Cosin, Kaiser, Hamming, Hannig, Blackmann-Harris y Prolato-35 Esferoidal según el ancho de haz seleccionado del lóbulo principal.
23. Método según la reivindicación 19, caracterizado porque las coordenadas se definen por la posición y el(los) punto(s) de enfoque de una o más cámara(s) que está(n) filmando un evento que tiene lugar en una(s) ubicación(es) específica(s) dentro del área objetivo.
24. Método según la reivindicación 19, caracterizado porque las coordenadas se definen por un usuario 40 que controla una interfaz de usuario que comprende una o más pantallas que muestran una vista general del área objetivo, un teclado, una unidad mezcladora de audio, y una o más palancas de mando.
25. Método según la reivindicación 19, caracterizado porque las coordenadas se usan para controlar y enfocar una o más cámaras.
26. Método según la reivindicación 17, caracterizado porque la salida de audio dinámicamente selectiva 45 en un sistema envolvente se encuentra en coherencia con una o más cámara(s).