ES2962111T3 - Aparatos para convertir una posición de objeto de un objeto de audio, proveedor de corriente de audio, sistema de producción de contenido de audio, aparato de reproducción de audio, métodos y programas informáticos - Google Patents
Aparatos para convertir una posición de objeto de un objeto de audio, proveedor de corriente de audio, sistema de producción de contenido de audio, aparato de reproducción de audio, métodos y programas informáticos Download PDFInfo
- Publication number
- ES2962111T3 ES2962111T3 ES19701383T ES19701383T ES2962111T3 ES 2962111 T3 ES2962111 T3 ES 2962111T3 ES 19701383 T ES19701383 T ES 19701383T ES 19701383 T ES19701383 T ES 19701383T ES 2962111 T3 ES2962111 T3 ES 2962111T3
- Authority
- ES
- Spain
- Prior art keywords
- spherical
- audio
- representation
- radius
- triangles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/02—Spatial or constructional arrangements of loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Se describe un aparato (100) para convertir la posición de un objeto de audio de una representación cartesiana (110) a una representación esférica (112). Un área base de la representación cartesiana se subdivide en una pluralidad de triángulos de área base (630, 532, 634, 636), y en donde una pluralidad de triángulos de dominio esférico (660, 662, 664, 666) están inscritos en un círculo de una representación esférica. El aparato está configurado para determinar en cuál de los triángulos del área de base está dispuesta una proyección (P) de la posición del objeto de audio en el área de base; y el aparato está configurado para determinar una posición mapeada (fórmula (I)) de la proyección (P) de la posición del objeto usando una transformada lineal (fórmula (II)), que mapea el triángulo del área base en su triángulo de dominio esférico asociado. El aparato está configurado para derivar un ángulo de acimut (φ) y un valor de radio intermedio (fórmula (III)) a partir de la posición mapeada (fórmula (I)). El aparato está configurado para obtener un valor de radio de dominio esférico (fórmula (IV)) y un ángulo de elevación (fórmula (V)) en dependencia del valor de radio intermedio (rxy, (fórmula (III)) y en dependencia de una distancia (z) de la posición del objeto desde el área base. También se describen un aparato para convertir una posición de objeto de un objeto de audio de una representación esférica a una representación esférica, aplicaciones de estos aparatos, métodos y programas de computadora. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Aparatos para convertir una posición de objeto de un objeto de audio, proveedor de corriente de audio, sistema de producción de contenido de audio, aparato de reproducción de audio, métodos y programas informáticosCampo técnico
Las realizaciones de acuerdo con la invención se refieren a aparatos para convertir una posición de objeto de un objeto de audio de una representación cartesiana a una representación esférica y viceversa.
Las realizaciones de acuerdo con la invención se refieren a un proveedor de corriente de audio.
Otras realizaciones de acuerdo con la invención se refieren a un sistema de producción de contenido de audio.
Otras realizaciones de acuerdo con la invención se refieren a un aparato de reproducción de audio.
Otras realizaciones de acuerdo con la invención se refieren a métodos respectivos.
Otras realizaciones de acuerdo con la invención se refieren a programas informáticos.
Las realizaciones de acuerdo con la invención se refieren a una regla de mapeo para metadatos de posición de objeción dinámica.
Antecedentes de la invención
El documento WO 2016/210174 A1 da a conocer un sistema de transformación de panorámica de audio para renderizar o hacer panorámica de objetos de audio espacializados a al menos una disposición de altavoces virtuales. El documento WO 2016/109065 A1 da a conocer técnicas para procesar audio codificado direccionalmente para tener en cuenta las características espaciales del entorno de reproducción de un oyente.
El documento WO 2016/172254 A1 da a conocer un método para renderizar objetos de audio en señales de audio codificadas espacialmente.
El documento US 2012/051565 A1 da a conocer un aparato de reproducción de audio para reproducir un campo sonoro difuso con una sensación muy realista, incluso con un sistema de altavoces de 5.1 canales que incluye un par de altavoces de canal envolvente.
Las posiciones de los objetos de audio o de los altavoces a veces se describen en coordenadas cartesianas (descripción centrada en la habitación), y a veces se describen en coordenadas esféricas (descripción egocéntrica). Sin embargo, se ha encontrado que a menudo es deseable convertir una posición de objeto o una posición de altavoz de una representación a otra, mientras se mantiene una buena impresión auditiva. También es deseable mantener la topología general de una configuración de altavoces descrita y mantener las posiciones correctas de los objetos reproducidas desde las posiciones de altavoces designadas.
En vista de esta situación, existe el deseo de un concepto que permita una conversión entre una representación cartesiana de metadatos del objeto (por ejemplo, datos de posición del objeto) y una representación esférica que proporcione una buena compensación entre una impresión auditiva alcanzable y una complejidad computacional.Sumario de la invención
De acuerdo con la invención, se proporciona un aparato para convertir una posición de objeto de un objeto de audio de una representación cartesiana a una representación esférica tal como se define en la reivindicación 1.
De acuerdo con la invención, se proporciona además un aparato para convertir una posición de objeto de un objeto de audio de una representación esférica a una representación cartesiana, tal como se define en la reivindicación 10. Además, de acuerdo con la invención, se proporciona un método para convertir una posición de objeto de un objeto de audio de una representación cartesiana a una representación esférica, tal como se define en la reivindicación 19. Además, de acuerdo con la invención, se proporciona un método para convertir una posición de objeto de un objeto de audio de una representación esférica a una representación cartesiana, tal como se define en la reivindicación 20.
Las realizaciones preferidas se definen en las reivindicaciones dependientes.
Debe observarse que todas las aplicaciones (por ejemplo, la herramienta de producción o el decodificador) se pueden implementar de manera inversa (refleja), en donde una conversión de coordenadas esféricas a coordenadas cartesianas puede reemplazarse por una conversión de coordenadas cartesianas a coordenadas esféricas y viceversa (por ejemplo, Esféricas -> Cartesianas y Cartesianas -> Esféricas).
Además, las realizaciones de acuerdo con la invención crean programas informáticos para realizar dichos métodos.
Breve descripción de las figuras
Cualquier ejemplo explicado en el presente documento que no tenga todas las características, o equivalentes de las mismas, de cualquiera de las reivindicaciones independientes se proporciona para facilitar la comprensión de la invención. A continuación se describirán realizaciones de acuerdo con la presente solicitud haciendo referencia a las figuras adjuntas, en las que:
La Figura 1 muestra un diagrama esquemático de bloques de un aparato para convertir una posición de objeto de un objeto de audio de una representación cartesiana a una representación esférica, de acuerdo con una realización de la presente invención;
La Figura 2 muestra un diagrama esquemático de bloques de un aparato para convertir una posición de objeto de un objeto de una representación esférica a una representación cartesiana, de acuerdo con una realización de la presente invención;
La Figura 3 muestra una representación esquemática de un ejemplo de una sala de parámetros cartesianos con las correspondientes posiciones de los altavoces para una configuración 5.1 4H;
La Figura 4 muestra una representación esquemática de un sistema de coordenadas esféricas según ISO/IEC 23008-3:2015 MPEG-H 3D Audio;
La Figura 5 muestra una representación esquemática de las posiciones de los altavoces en un sistema de coordenadas cartesianas y en un sistema de coordenadas esféricas;
La Figura 6 muestra una representación gráfica de un mapeo de triángulos en un sistema de coordenadas cartesianas sobre triángulos correspondientes en un sistema de coordenadas esféricas;
La Figura 7 muestra una representación esquemática de un mapeo de un punto dentro de un triángulo en el sistema de coordenadas cartesianas en un punto dentro de un triángulo correspondiente en el sistema de coordenadas esféricas;
La Tabla 1 muestra las coordenadas de las esquinas de los triángulos en el sistema de coordenadas cartesianas y las esquinas o los triángulos correspondientes en el sistema de coordenadas esféricas;
La Figura 8 muestra una representación esquemática de un ajuste de radio que se usa en realizaciones de acuerdo con la presente invención;
La Figura 9 muestra una representación esquemática de una derivación de un ángulo de elevación y de un radio de dominio esférico, que se usa en realizaciones de acuerdo con la presente invención;
La Figura 10 muestra una representación esquemática de una corrección de un radio, que se utiliza en realizaciones de acuerdo con la presente invención;
La Figura 11 muestra un diagrama esquemático de bloques de un proveedor de corriente de audio, de acuerdo con una realización de la presente invención;
La Figura 12 muestra un diagrama esquemático de bloques de un sistema de producción de contenido de audio, de acuerdo con una realización de la presente invención;
La Figura 13 muestra un diagrama esquemático de bloques de un aparato de reproducción de audio, de acuerdo con una realización de la presente invención;
La Figura 14 muestra un diagrama de flujo de un método, de acuerdo con una realización de la presente invención; La Figura 15 muestra un diagrama de flujo de un método, de acuerdo con una realización de la presente invención; y
La Figura 16 muestra un diagrama de flujo de un método, de acuerdo con una realización de la presente invención;
La Figura 17 muestra una representación esquemática de un ejemplo de una sala de parámetros cartesianos con las correspondientes posiciones de los altavoces para una configuración 5.1 4H;
La Figura 18 muestra una representación esquemática de un sistema de coordenadas esféricas según ISO/IEC 23008-3:2015 MPEG-H 3D Audio;
La Figura 19 muestra una representación esquemática de las posiciones de los altavoces en un sistema de coordenadas cartesianas y en un sistema de coordenadas esféricas;
La Figura 20 muestra una representación gráfica de un mapeo de triángulos en un sistema de coordenadas cartesianas sobre triángulos correspondientes en un sistema de coordenadas esféricas;
La Figura 21 muestra una representación esquemática de un mapeo de un punto dentro de un triángulo en el sistema de coordenadas cartesianas sobre un punto dentro de un triángulo correspondiente en el sistema de coordenadas esféricas;
La Tabla 2 muestra las coordenadas de las esquinas de los triángulos en el sistema de coordenadas cartesianas y las esquinas o los triángulos correspondientes en el sistema de coordenadas esféricas;
La Figura 22 muestra una representación esquemática de un ajuste de radio que se usa en realizaciones de acuerdo con la presente invención;
La Figura 23 muestra una representación esquemática de una derivación de un ángulo de elevación y de un radio de dominio esférico, que se usa en realizaciones de acuerdo con la presente invención;
La Figura 24 muestra una representación esquemática de una corrección de un radio, que se usa en realizaciones de acuerdo con la presente invención.
Descripción detallada de las realizaciones
A continuación, se describirán diferentes realizaciones y aspectos de la invención. Además, otras realizaciones se definirán mediante las reivindicaciones adjuntas.
Además, las características y funcionalidades dadas a conocer en el presente documento que se refieren a un método también se pueden usar en un aparato (configurado para realizar dicha funcionalidad). Además, cualquier característica y funcionalidad descrita en este documento con respecto a un aparato también puede usarse en un método correspondiente. En otras palabras, los métodos descritos en el presente documento pueden complementarse con cualquiera de las características y funcionalidades descritas con respecto a los aparatos.
Además, cualquiera de las características y funcionalidades descritas en este documento se pueden implementar en hardware o en software, o utilizando una combinación de hardware y software, como se describirá en la sección "Alternativas de implementación".
1. Realización de acuerdo con la Figura 1
La Figura 1 muestra un diagrama esquemático de bloques de un aparato para convertir una posición de objeto de un objeto de audio de una representación cartesiana a una representación esférica.
El aparato 100 está configurado para recibir la representación cartesiana 110, que puede, por ejemplo, comprender coordenadas cartesianas x, y, z. Además, el aparato 100 está configurado para proporcionar una representación esférica 112, que puede comprender, por ejemplo, las coordenadas r, 9 y 0.
El aparato puede basarse en el supuesto de que un área base de una representación cartesiana está subdividida en una pluralidad de triángulos de área base (por ejemplo, como se muestra en la Figura 6) y que una pluralidad de triángulos de dominio esférico están inscritos en un círculo de una representación esférica (por ejemplo, como también se muestra en la Figura 6).
El aparato 100 comprende un determinador (o determinación) de triángulo 120, que está configurado para determinar en cuál de los triángulos de área base se dispone una proyección de la posición de objeto del objeto de audio en el área base. Por ejemplo, el determinador de triángulo 120 puede proporcionar una identificación de triángulo 122 sobre la base de una coordenada x y una coordenada y de la información de posición del objeto.
Además, el aparato puede comprender un determinador de posición mapeado que está configurado para determinar una posición mapeada de la proyección de la posición del objeto usando una transformación lineal, que mapea el triángulo de área base (en el cual se dispone la proyección de la posición de objeto del objeto de audio en el área base) sobre su triángulo de dominio esférico asociado. En otras palabras, el determinador de posición mapeada puede mapear posiciones dentro de un primer triángulo de área base sobre posiciones dentro de un primer triángulo de dominio esférico, y puede mapear posiciones dentro de un segundo triángulo de área base sobre posiciones dentro de un segundo triángulo de dominio esférico. En términos generales, las posiciones dentro de un enésimo triángulo de área base pueden mapearse sobre posiciones dentro de un enésimo triángulo de dominio esférico (en donde un límite del enésimo triángulo de área base puede mapearse sobre un límite del enésimo triángulo de dominio esférico).
Por consiguiente, el determinador de posición mapeada 130 puede proporcionar una posición mapeada 132 sobre la base de la coordenada x y la coordenada y, y también sobre la base de la identificación de triángulo 122 proporcionada por el determinador de triángulo 120.
Además, el aparato 100 comprende un ángulo de acimut / valor de radio intermedio 140 que está configurado para derivar un ángulo de acimut (por ejemplo, un ángulo 9) y un valor de radio intermedio (por ejemplo, un valor de radio
intermedio 6xy) desde la posición mapeada 132 (que puede ser descrita por dos coordenadas). La información del ángulo de acimut se designa con 142 y el valor de radio intermedio se designa con 144.
Opcionalmente, el aparato 100 comprende un ajustador de radio 146, que recibe el valor de radio intermedio 144 y proporciona, en función de este, un valor de radio intermedio ajustado 148. A continuación, se describirá el procesamiento posterior haciendo referencia al valor de radio intermedio ajustado. Sin embargo, en ausencia del ajustador de radio opcional 146, el valor de radio intermedio 144 puede tomar el lugar del valor de radio intermedio ajustado 148.
El aparato 100 también comprende un calculador de ángulo de elevación 150 que está configurado para obtener un
ángulo de elevación 152 (por ejemplo, designado con@)en función del valor de radio intermedio 144, o independientemente del valor de radio intermedio ajustado 148, y también en función de la coordenada z, que describe la distancia de la posición del objeto desde el área base.
Además, el aparato 100 comprende un calculador de valor de radio de dominio esférico que está configurado para obtener un valor de radio de dominio esférico en función del valor de radio intermedio 144 o del valor de radio intermedio ajustado 148 y también en función de la coordenada z que describe la distancia de la posición del objeto desde el área base. En consecuencia, el calculador de valor de radio de dominio esférico 160 proporciona un valor de
radio de dominio esférico 162, que también se designa conr .
Opcionalmente, el aparato 100 también comprende un corrector de ángulo de elevación (o ajustador) 170, que está configurado para obtener un ángulo de elevación Icorregido o ajustado 172 (designado, por ejemplo, con 0) sobre la base del ángulo de elevación 152.
Además, el aparato 100 también comprende un corrector de valor de radio de dominio esférico (o un ajustador de valor de radio de dominio esférico) 180, que está configurado para proporcionar un valor de radio de dominio esférico corregido o ajustado 182 sobre la base del valor de radio de dominio esférico 162. El valor de radio de dominio esférico corregido o ajustado 182 se designa, por ejemplo, con r.
Cabe señalar que el aparato 100 puede complementarse con cualquiera de las características y funcionalidades descritas en este documento. Además, se debe tener en cuenta que cada uno de los bloques individuales puede, por ejemplo, implementarse utilizando los detalles que se describen a continuación, sin necesidad de implementar otros bloques utilizando detalles específicos.
Con respecto a la funcionalidad del aparato 100, debe observarse que el aparato está configurado para realizar múltiples pasos pequeños, cada uno de los cuales es invertible en el lado de un aparato que convierte una representación esférica de nuevo en una representación cartesiana.
La funcionalidad general del aparato se basa en la idea de que una posición de objeto, que se da en una representación cartesiana (en donde, por ejemplo, las posiciones de objetos válidas pueden estar dentro de un cubo centrado en un origen del sistema de coordenadas cartesianas y alineado con los ejes del sistema de coordenadas cartesianas) se puede mapear en una representación esférica (en donde, por ejemplo, las posiciones válidas del objeto pueden estar dentro de una esfera centrada en un origen del sistema de coordenadas esféricas) sin degradar significativamente la impresión auditiva. Por ejemplo, el mapeo directo de altavoces se habilita si las posiciones de los altavoces definen los triángulos / la segmentación. Una proyección de la posición del objeto sobre el área base (por ejemplo, en el plano x-y) se puede mapear sobre una posición dentro de un triángulo de dominio esférico que está asociado con un triángulo en donde está dispuesta la proyección de la posición del objeto en el área base. Por consiguiente, se obtiene una posición mapeada 132, que es una posición bidimensional dentro del área dentro de la cual están dispuestos los triángulos de dominio esférico.
Un ángulo de acimut se deriva directamente de esta posición mapeada 132 utilizando el derivado del ángulo de acimut o la derivación del ángulo de acimut. Sin embargo, se ha encontrado que un ángulo de elevación 152 y un valor de radio de dominio esférico 162 también se pueden obtener sobre la base de un valor de radio intermedio 144 (o sobre la base de un valor de radio intermedio ajustado 148) que puede derivarse de la posición mapeada 132. En una opción simple, el valor de radio intermedio 144, que se puede derivar fácilmente de la posición mapeada 132, se puede usar para derivar el valor de radio de dominio esférico 162, en donde se considera la coordenada z (calculador del valor de radio de dominio esférico 160). Además, el ángulo de elevación 152 puede derivarse fácilmente del valor de radio intermedio 144, o del valor de radio intermedio ajustado 148, en donde también se considera la coordenada z. En particular, el mapeo realizado por el determinador de posición mapeada 130 mejora significativamente los resultados cuando se compara con un enfoque que no realizaría un mapeo de este tipo.
Además, se ha encontrado que la calidad de la conversión se puede mejorar aún más si el valor de radio intermedio se ajusta con el ajustador de radio 146 y si el ángulo de elevación 152 se ajusta con el corrector de ángulo de elevación opcional o el ajustador de ángulo de elevación 170 y si el valor del radio de dominio esférico 162 se corrige o ajusta mediante el corrector del valor de radio de dominio esférico o el ajustador del valor de radio de dominio esférico 180. El ajustador de radio 146 y el corrector de valor de radio de dominio esférico 180 pueden usarse, por ejemplo, para ajustar el rango de valores del radio, de modo que el valor de radio resultante 182 comprende un rango de valores bien adaptados a la representación cartesiana. De manera similar, el corrector de ángulo de elevación 170 puede proporcionar un ángulo de elevación corregido 172, que aporta una impresión auditiva particularmente buena, ya que se logrará que el ángulo de elevación se ajuste mejor a la representación esférica que se usa típicamente en el campo del procesamiento de audio.
Además, debe observarse que el aparato 100 puede complementarse opcionalmente con cualquiera de las características y funcionalidades descritas en el presente documento, tanto individualmente como en combinación.
En particular, el aparato 100 puede complementarse opcionalmente con cualquiera de las características y funcionalidades descritas con respecto a la "conversión del lado de producción".
Las características, funcionalidades y detalles descritos en este documento pueden introducirse opcionalmente en forma individual o en combinación en el aparato 100.
2. Realización de acuerdo con la Figura 2
La Figura 2 muestra un diagrama esquemático de bloques de un aparato para convertir una posición de objeto de un objeto de audio de una representación esférica a una representación cartesiana.
El aparato para convertir una posición de objeto de una representación esférica a una representación cartesiana se designa en su totalidad con 200.
El aparato 200 recibe una información de posición del objeto, que es una representación esférica. La representación esférica puede, por ejemplo, comprender un valor de radio de dominio esférico r, un valor de ángulo de acimut (por ejemplo, 9) y un valor de elevación (por ejemplo, 0).
Similar al aparato 100, el aparato 200 también se basa en el supuesto de que un área base de la representación cartesiana (por ejemplo, un área cuadrática en un plano x-y, por ejemplo con puntos de esquina (-1; -1; 0), (1; -1; 0), (1; 1; 0) y (-1; 1; 0)) se subdivide en una pluralidad de triángulos de área base (por ejemplo, un primer triángulo de área base, un segundo triángulo de área base, un tercer triángulo de área base y un cuarto triángulo de área base). Por ejemplo, los triángulos de área base pueden tener todos una esquina en una posición central del área base. Además, se supone que hay una pluralidad de triángulos de dominio esférico (correspondientes o asociados) que están inscritos en un círculo de una representación esférica (en donde, por ejemplo, cada uno de los triángulos de dominio esférico está asociado a un triángulo de área base, en donde los triángulos de dominio esférico se deforman típicamente cuando se comparan con los triángulos de área base asociados, y en donde hay un mapeo lineal para mapear un triángulo de área base dado sobre su triángulo de área esférica asociado). Además, los triángulos de dominio esférico pueden, por ejemplo, comprender una esquina en el centro del círculo.
El aparato 200 comprende opcionalmente un mapeador de ángulo de elevación 220, que recibe el valor del ángulo de elevación de la representación esférica 210. El mapeador de ángulo de elevación 220 está configurado para obtener
un ángulo de elevación mapeado 222 (por ejemplo, designado con@)sobre la base de un ángulo de elevación (por ejemplo, designado con 0). Por ejemplo, el mapeador de ángulo de elevación 220 puede configurarse para obtener el ángulo de elevación mapeado 222 usando un mapeo no lineal que mapea de manera lineal los ángulos en una primera región de ángulo sobre una primera región de ángulo mapeada y que mapea de manera lineal los ángulos dentro de una segunda región de ángulo sobre una segunda región de ángulo mapeada, en donde la primera región de ángulo tiene un ancho diferente cuando se compara con la primera región de ángulo mapeada y donde, por ejemplo, un rango de ángulo cubierto por la primera región de ángulo y la segunda región de ángulo es idéntico a un rango de ángulo cubierto por la primera región de ángulo mapeada y la segunda región de ángulo mapeada juntas.
Además, el aparato 200 comprende opcionalmente un mapeador del valor de radio de dominio esférico 230, que recibe el radio de dominio esférico (por ejemplo, r). El mapeador del valor de radio de dominio esférico230, que es opcional, puede configurarse para obtener un radio de dominio esférico mapeado 232 sobre la base del radio de dominio esférico (por ejemplo, r).
Además, el aparato 200 comprende un calculador de coordinada z 240, que está configurado para obtener un valor (por ejemplo, z) que describe una distancia de la posición del objeto desde el área base sobre la base del ángulo de elevación 218 o sobre la base del ángulo de elevación mapeado 222, y sobre la base del radio de dominio esférico 228 o sobre la base del radio de dominio esférico mapeado 232. El valor que describe una distancia de la posición del objeto desde el área base se designa con 242, y también se puede designar con "z".
Además, el aparato 200 comprende un calculador de radio intermedio 250, que está configurado para obtener un radio intermedio 252 (por ejemplo, designado con rxy) sobre la base del ángulo de elevación 218 o sobre la base del ángulo de elevación mapeado 222 y también sobre la base del radio de dominio esférico 228 o sobre la base del radio de dominio esférico mapeado 232.
El aparato 200 comprende opcionalmente un corrector de radio 260, que puede configurarse para recibir el radio intermedio 252 y el ángulo de acimut 258 y para proporcionar un valor de radio corregido (o ajustado) 262.
El aparato 200 también comprende un determinador de posición 270, que está configurado para determinar una posición dentro de uno de los triángulos inscritos en el círculo (triángulo de dominio esférico) sobre la base del radio intermedio 252, o sobre la base de la versión corregida 262 del radio intermedio, y sobre la base del valor de acimut 258 (por ejemplo, 9). La posición dentro de uno de los triángulos puede designarse con 272 y puede, por ejemplo,
describirse mediante dos coordenadas*yV(que son coordenadas cartesianas dentro del plano en donde se encuentran los triángulos de dominio esférico).
El aparato 200 puede comprender opcionalmente una identificación de triángulo 280, que determina en qué triángulos de dominio esférico se encuentra la posición 272. Esta identificación, que se realiza mediante la identificación de triángulo 280, se puede usar, por ejemplo, para seleccionar una regla de mapeo que usará un mapeador 290.
El mapeador 290 está configurado para determinar una posición mapeada 292 de la proyección de la posición del objeto sobre el plano base sobre la base de la posición determinada 272 dentro de uno de los triángulos inscritos en el círculo (por ejemplo, usando una transformación o una transformación lineal que mapea el triángulo, en donde se encuentra la posición determinada, sobre un triángulo asociado en el plano base). Por consiguiente, la posición mapeada 292 (que puede ser una posición bidimensional dentro del plano base) y la distancia de la posición del objeto desde el área base (por ejemplo, el valor z 242) pueden, juntos, determinar la posición del objeto de audio en el sistema de coordenadas cartesianas.
Debe observarse que la funcionalidad del aparato 200 puede ser, por ejemplo, inversa a la funcionalidad del aparato 100, de modo que es posible mapear una representación esférica 112 proporcionada por el aparato 100 de nuevo a una representación cartesiana de la posición del objeto utilizando el aparato 200 (en donde la información de posición del objeto 210, en la representación esférica (que puede comprender el ángulo de elevación 218, el radio de dominio esférico 228 y el ángulo de acimut 258) puede ser igual a la representación esférica 112 proporcionada por el aparato 100, o puede derivarse de la representación esférica 112 (por ejemplo, puede ser una versión codificada o cuantificada con pérdida de la representación esférica 112). Por ejemplo, mediante una elección apropiada del procesamiento, puede lograrse que la conversión realizada por el aparato 100 sea invertible con un esfuerzo moderado por el aparato 200.
Además, debe notarse que una característica importante del aparato 200 es que hay un mapeo de una posición dentro de uno de los triángulos de dominio esférico sobre una posición en el plano base de la representación cartesiana, porque esta funcionalidad permite un mapeo que proporciona una buena impresión auditiva con complejidad moderada.
Además, debe observarse que el aparato 200 puede complementarse con cualquiera de las características, funcionalidades y detalles que se describen aquí, tanto individualmente como en combinación.
3. Otras realizaciones y consideraciones
A continuación, se describirán algunos detalles relacionados con la regla de mapeo para los metadatos de posición del objeto o para los metadatos de posición dinámica del objeto. Cabe destacar que no es necesario que la posición sea dinámica. También se pueden mapear posiciones estáticas de objetos.
Las realizaciones de acuerdo con la invención se refieren a una conversión de metadatos de objeto del lado de producción, especialmente datos de posición del objeto, en el caso de que en el lado de producción se use un sistema de coordenadas cartesianas, pero en el formato de transporte, los metadatos de posición del objeto se describen en las coordenadas esféricas.
Se ha reconocido que es un problema que, en las coordenadas cartesianas, los altavoces no siempre están ubicados en las posiciones matemáticamente "correctas" en comparación con el sistema de coordenadas esféricas. Por lo tanto, se desea una conversión que garantice que el área cuboide del espacio cartesiano se proyecte correctamente en la esfera o semiesfera.
Por ejemplo, las posiciones de los altavoces se renderizan de manera equitativa utilizando un renderizador de objetos de audio basado en un sistema de coordenadas esféricas (por ejemplo, un renderizador como se describe en el estándar de audio 3D MPEG-H) o utilizando un renderizador cartesiano con el algoritmo de conversión correspondiente.
Se ha encontrado que las superficies cuboides deben ser mapeadas o proyectadas (o algunas veces tienen que ser mapeadas o proyectadas) sobre la superficie de la esfera en la que se encuentran los altavoces. Además, se desea (o algunas veces se requiere) que el algoritmo de conversión tenga una complejidad computacional pequeña. Esto es especialmente cierto para el paso de conversión de coordenadas esféricas a cartesianas.
Una aplicación de ejemplo para la invención es: utilizar herramientas de creación de objetos de audio de última generación que a menudo usan un espacio de parámetros cartesianos (x, y, z) para las coordenadas del objeto de audio, pero utilizan un formato de transporte que describe las posiciones de los objetos de audio en coordenadas esféricas (acimut, elevación, radio), como por ejemplo, audio 3D MPEG-H. Sin embargo, el formato de transporte puede ser agnóstico para el renderizador (esférico o cartesiano), que se aplica después.
Cabe señalar que, a continuación, la invención se describe, como ejemplo, para una configuración de altavoces 5.1 4H, pero se puede transferir fácilmente a todo tipo de configuraciones de altavoces (por ejemplo, 7.1+4, 22.2, etc.) o a espacios de parámetros cartesianos variados (diferente orientación de los ejes, o diferente escala de los ejes). Comparación general de sistemas de coordenadas
A continuación, se proporcionará una comparación general de los sistemas de coordenadas.
Para este propósito, la Figura 3 muestra una representación esquemática de un ejemplo de una sala de parámetros cartesianos con las correspondientes posiciones de los altavoces para una configuración 5.1 4H. Como puede verse, una posición normalizada del objeto puede, por ejemplo, estar dentro de los cuboides que tienen esquinas en las coordenadas (-1; -1; 0), (1; -1; 0), (1; 1; 0), (- 1; 1; 0), (-1; -1; 1), (1; -1; 1), (1; 1; 1) y (-1; 1; 1).
Como comparación, la Figura 4 muestra una representación esquemática de un sistema de coordenadas esféricas según ISO/IEC 23008-3:2015 MEG-H 3D audio. Como se puede ver, la posición de un objeto se describe mediante un ángulo de acimut, un ángulo de elevación y un radio (de dominio esférico).
Sin embargo, debe tenerse en cuenta que las coordenadas X e Y en el sistema de coordenadas ISO se definen de manera diferente en comparación con el sistema de coordenadas cartesianas descrito anteriormente.
Sin embargo, debe tenerse en cuenta que los sistemas de coordenadas que se muestran aquí deben considerarse solo como ejemplos.
3.1 Conversión del lado de producción (cartesiano-esférico o cartesiano a esférico)
A continuación, se describirá una conversión de una representación cartesiana (por ejemplo, de una posición del objeto) a una representación esférica (por ejemplo, de la posición del objeto), que preferiblemente puede ser realizada por el aparato 100.
Cabe señalar que las características, funcionalidades y detalles descritos aquí pueden incorporarse opcionalmente al aparato 100, tanto individualmente como en combinación.
Sin embargo, la "conversión del lado de proyección" (que es una conversión de una representación cartesiana a una representación esférica) descrita aquí se puede considerar como una realización de acuerdo con la invención, que se puede usar tal cual (o en combinación con una o más de las características y funcionalidades del aparato 100, o en combinación con una o más de las características y funcionalidades definidas en las reivindicaciones).
Aquí se supone, por ejemplo, que las posiciones de los altavoces se dan en coordenadas esféricas como describe, por ejemplo, la recomendación de la ITU ITU-R BS.2159-7 y se describe en la especificación MPEG-H.
La conversión se aplica en un enfoque separado. Primero, las coordenadas x e y se mapean al ángulo de acimut 9 y el radio rxy en el plano acimut / x-y (por ejemplo, un plano base). Esto se puede realizar, por ejemplo, mediante los bloques 120, 130, 140 del aparato 100. Luego, el ángulo de elevación y el radio en el espacio 3D (a menudo designado como valor de radio de dominio esférico) se calculan utilizando la coordenada z. Esto se puede realizar, por ejemplo, por los bloques 146 (opcional), 150, 160, 170 (opcional) y 180 (opcional). El mapeo se describe, como ejemplo (o ilustración), para la configuración de altavoz 5.1 4H.
Caso especial x = y = 0
Cabe señalar que, opcionalmente, se puede hacer el siguiente supuesto para el caso especial x = y = 0.
Para z > 0:
9 = indefinido (= 0 °), 0 = 90 ° y r = z.
Para z = 0:
9 = indefinido (= 0 °), 0 = 0 ° y r = 0.
1) Conversión en el plano x-y
La conversión que tiene lugar en el plano x-y puede, por ejemplo, comprender tres pasos que se describirán a continuación.
Paso 1: (opcional; puede ser un paso preparatorio)
En el primer paso, los triángulos en el sistema de coordenadas cartesianas se mapean a los triángulos correspondientes en el sistema de coordenadas esféricas.
Por ejemplo, la Figura 6 muestra una representación gráfica de los triángulos de área base y los triángulos de dominio esférico asociados. Por ejemplo, una representación gráfica 610 muestra cuatro triángulos. Por ejemplo, hay una dirección de la coordenada x 620 y una dirección de la coordenada y 622. Un origen es, por ejemplo, en la posición 624. Por ejemplo, cuatro triángulos están inscritos en un cuadrado que puede, por ejemplo, comprender coordenadas normalizadas (-1; -1), (1; -1), (1; 1) y (-1; 1). Un primer triángulo (mostrado en verde o usando una primera trama) se designa con 630 y comprende esquinas en (1; 1), (-1; 1) y (0; 0). Un segundo triángulo, mostrado en púrpura o usando una segunda trama, se designa con 632 y tiene esquinas en las coordenadas (-1; 1), (-1; -1) y (0; 0). Un tercer triángulo 634 se muestra en rojo o utilizando una tercera trama y tiene esquinas en las coordenadas (-1; -1), (1; -1) y (0; 0). Un cuarto triángulo 636 se muestra en blanco o usando una cuarta trama y tiene esquinas en las coordenadas (1; -1), (1 ; 1) y (0; 0).
Por consiguiente, toda el área interior de un cuadrado unitario (normalizado) se rellena con los cuatro triángulos, en donde los cuartos triángulos tienen todos una de sus esquinas en el origen del sistema de coordenadas. Puede establecerse que el primer triángulo 630 esté "delante" del origen (por ejemplo, frente a un oyente que se supone que está en el origen), el segundo triángulo 632 esté en el lado izquierdo del origen, el tercer triángulo esté “detrás” del origen y el cuarto triángulo 636 esté en el lado derecho del origen. Dicho de otra forma, el primer triángulo 630 cubre un primer rango de ángulo cuando se ve desde el origen, el segundo triángulo 632 cubre un segundo rango de ángulo cuando se ve desde el origen, el tercer triángulo cubre un tercer rango de ángulo cuando se ve desde el origen y el cuarto triángulo cubre un cuarto rango de ángulo cuando se ve desde el origen. Se debe tener en cuenta que cuatro posibles posiciones de los altavoces coinciden con las esquinas s del cuadrado unitario, y que se puede suponer que una quinta posición de altavoz (altavoz central) está en la coordenada (0; 1).
Una representación gráfica 650 muestra triángulos asociados que están inscritos en un círculo unitario en un sistema de coordenadas esféricas.
Como se puede ver en la representación gráfica 650, cuatro triángulos están inscritos en el círculo unitario, que se encuentra, por ejemplo, en un área base de un sistema de coordenadas esféricas (por ejemplo, un ángulo de elevación de cero). Un primer triángulo de dominio esférico 660 se muestra en color verde o en una primera trama, y está asociado con el primer triángulo de área base 630. El segundo triángulo de dominio esférico 662 se muestra en color púrpura o en una segunda trama y se asocia con el segundo triángulo de área base 632. Un tercer triángulo de dominio esférico 664 se muestra en color rojo o en una tercera trama y se asocia con el tercer triángulo de área base 634. Un cuarto triángulo de dominio esférico 666 se muestra en color blanco o en una cuarta trama y se asocia con un cuarto triángulo de área base 636. Los triángulos de dominio esférico adyacentes comparten un borde de triángulo común. Además, los cuatro triángulos de dominio esférico cubren un rango completo de 360 ° cuando se ven desde el origen. Por ejemplo, el primer triángulo de dominio esférico 660 cubre un primer rango de ángulo cuando se ve desde el origen, el segundo triángulo de dominio esférico 662 cubre un segundo rango de ángulo cuando se ve desde el origen, el tercer triángulo de dominio esférico 664 cubre un tercer rango de ángulo cuando se ve desde el origen, y el cuarto triángulo de dominio esférico 666 cubre un cuarto rango de ángulo cuando se ve desde el origen. Por ejemplo, el primer triángulo de dominio esférico 660 puede cubrir un rango de ángulo frente al origen, el segundo triángulo de dominio esférico 662 puede cubrir un rango de ángulo en un lado izquierdo del origen, el tercer triángulo de dominio esférico puede cubrir un rango de ángulo detrás del origen, y el cuarto triángulo de dominio esférico 666 puede cubrir un rango de ángulo en un lado derecho del origen. Además, las cuatro posiciones de altavoz se pueden disponer en posiciones del círculo que son esquinas comunes de los triángulos de dominio esférico adyacentes. Otra posición del altavoz (por ejemplo, de un altavoz central) puede estar dispuesta fuera de los triángulos de dominio esférico (por ejemplo, en el círculo "en frente" del primer triángulo de dominio esférico).
En términos generales, también se debe tener en cuenta que los rangos de ángulos cubiertos por los triángulos de dominio esférico pueden ser diferentes de los rangos de ángulos cubiertos por los triángulos de área base asociados. Por ejemplo, mientras que cada uno de los triángulos de área base puede, por ejemplo, cubrir un rango de ángulo de 90 ° cuando se ve desde el origen del sistema de coordenadas cartesianas, los triángulos de dominio esférico primero, segundo y cuarto pueden cubrir rangos de ángulo que son más pequeños que 90 °, y el tercer triángulo de dominio esférico puede cubrir un rango de ángulo mayor a 90 ° (cuando se ve desde el origen del sistema de coordenadas esféricas). Alternativamente, se pueden usar más triángulos, como se muestra en el siguiente ejemplo con 5 segmentos.
Además, mientras que los triángulos de área base 630, 632, 634, 636 pueden ser iguales, los triángulos de dominio esférico pueden tener diferentes formas, en donde la forma del segundo triángulo de dominio esférico 666 y la forma del cuarto triángulo de dominio esférico 666 pueden ser iguales (pero en reflejo uno del otro).
Además, se debe tener en cuenta que se podría utilizar un mayor número de triángulos tanto en la representación cartesiana como en la representación esférica.
A continuación, se mostrará un mapeo de triángulos en el sistema de coordenadas cartesianas a los triángulos correspondientes en el sistema de coordenadas esféricas, como ejemplo, para un triángulo.
Como ejemplo, la Figura 7 muestra una representación gráfica de un triángulo de área base y un triángulo de dominio esférico asociado. Como puede verse en una representación gráfica 710, el triángulo de área base, que puede ser el "segundo triángulo de área base", comprende esquinas en las coordenadas P1, P2 y en el origen del sistema de coordenadas cartesianas. El triángulo de dominio esférico asociado (por ejemplo, el "segundo triángulo de dominio esférico") puede incluir esquinas en las coordenadasP i,p 2y en el origen del sistema de coordenadas cartesianas, como se puede ver en una representación gráfica 750. Por ejemplo, un punto P dentro del primer triángulo de área base 632 se mapea a un punto correspondientePen el triángulo de dominio esférico asociado 662.
Los triángulos, o posiciones en ellos, como, por ejemplo, el punto P se pueden proyectar (o mapear) entre sí utilizando una transformación lineal:
La matriz de transformación se puede calcular (o precalcular), por ejemplo, utilizando las posiciones conocidas de lasp
esquinas de los triángulos (asociados)Vrp
2ip^
* i y P 2- Estos puntos dependen de la configuración del altavoz y de las posiciones correspondientes de los altavoces y del triángulo en donde se encuentra la posiciónP.
Sin embargo, cabe señalar que la matriz de transformación — puede, por ejemplo, precalcularse.
Por ejemplo, si el concepto se implementa utilizando el aparato 100, el determinador de triángulo 120 puede determinar en qué triángulo se ubica una posición P a convertir de una representación cartesiana a una representación esférica (o, más precisamente, puede determinar en cuál de los triángulos de área base se dispone una proyección P (bidimensional) de la posición (original, tridimensional) en el plano base, donde se supone que la posición puede ser una posición tridimensional descrita por una coordenada x, una coordenada y y una coordenada z). De acuerdo con la determinación de en cuál de los triángulos se encuentra la proyección P de la posición, una matriz de transformación apropiada — puede seleccionarse y puede aplicarse (por ejemplo, a la proyección P) por el determinador de posición mapeada 130.
Así, se obtiene la posición mapeadaP
A continuación, se describirá un ejemplo con respecto a los triángulos de área base y los triángulos de dominio esférico. Por ejemplo, la configuración de los altavoces 5.1 4H contiene en la capa media una configuración de altavoces estándar 5.1, que es la base para la proyección en el plano x-y. En la tabla 1, se dan los puntos correspondientes Pi, P2, ^1 and para los cuatro triángulos que hay que proyectar. Sin embargo, debe tenerse en cuenta que los puntos que se muestran en la tabla 1 deben considerarse solo como un ejemplo, y que el concepto también se puede aplicar en combinación con otras disposiciones de altavoces, en donde los triángulos pueden elegirse naturalmente de una manera diferente.
Paso 2
En un segundo paso, un radior*y(que también se puede designar como un radio intermedio o un valor de radio intermedio) y el ángulo de acimut cp se calculan en función de las coordenadas mapeadas x eY. Por ejemplo, este cálculo se realiza mediante el desviador de ángulo de acimut y el determinador de valor de radio intermedio, que se muestra como bloque 140 en el aparato 100. Por ejemplo, se puede realizar el siguiente cálculo o mapeo:
Paso 3 (opcional)
f
El radio (por ejemplo, el valor de radio intermedioxy )puede ajustarse, porque los altavoces, por ejemplo, se colocan en un cuadrado en el sistema de coordenadas cartesianas en contraste con el sistema de coordenadas esféricas. En el sistema de coordenadas esféricas, los altavoces se colocan, por ejemplo, en un círculo.
Para ajustar el radio, el límite del cuadrado cartesiano del altavoz se proyecta sobre el círculo del sistema de coordenadas esféricas. Esto significa que la cuerda se proyecta en el segmento correspondiente del círculo.
Cabe señalar que esta funcionalidad, por ejemplo, puede ser realizada por el ajustador de radio 146 del aparato 100. La figura 8 ¡lustra la escala, considerando, por ejemplo, el primer triángulo de dominio esférico. Un punto 840 dentro del primer triángulo de dominio esférico 830 se describe, por ejemplo, por un valor de radio intermedio y por un ángulo de acimut 9. Los puntos en la cuerda pueden, por ejemplo, comprender típicamente valores de radio (intermedios) que son más pequeños que el radio del círculo (en donde el radio del círculo puede ser 1 si se supone que el radio está normalizado). Sin embargo, el "radio" (o coordenada del radio, o distancia desde el origen) de los puntos de la cuerda puede depender del ángulo de acimut, en donde los puntos finales de la cuerda pueden tener un valor de radio que es idéntico al radio del círculo. Sin embargo, para los puntos dentro del primer triángulo de dominio esférico, los valores de radio pueden ser escalados por la relación entre el radio del círculo (por ejemplo, 1) y el valor del radio (por ejemplo, la distancia desde el origen) de un respectivo punto en la cuerda. En consecuencia, los valores de radio de los puntos de la cuerda se pueden escalar de manera que se vuelvan iguales al radio del círculo. Otros puntos (como, por ejemplo, el punto 840) que tienen el mismo ángulo de acimut, se escalan de manera proporcional. Un ejemplo para tal ajuste del radio (más precisamente, del valor de radio intermedio) se proporcionará a continuación:
2) Conversión del componente z
Por ejemplo, se supone que la elevación de una capa superior es un ángulo de elevación de 30 ° en un sistema de coordenadas esféricas.
En otras palabras, se supone, como ejemplo, que los altavoces elevados (que pueden considerarse como una "capa superior") están dispuestos a un ángulo de elevación de 30 °.
La Figura 9 muestra, como ejemplo, una definición de cantidades en un sistema de coordenadas esféricas. Como puede verse en la Figura 9, las definiciones se muestran en una vista de proyección bidimensional. En particular, la Figura 9 muestra el valor de radio intermedio (ajustado) rxy, la coordenada z de la representación cartesiana, un valor
de radio de dominio esféricory un ángulo de elevación 0.
A continuación se describen diferentes pasos para determinarry<A>o las versiones corregidas o ajustadas r, 9 de las mismas.
Paso 1:
En un ejemplo, es posible calcular el ángulo de elevación ® basado en el radio rxy (que puede ser el valor de radio intermedio ajustado) y el componente z (que puede ser el valor z de la representación cartesiana). Este cálculo puede, por ejemplo, ser realizado por el calculador de ángulo de elevación 150. Además, el método también comprende
calcular el radio 3Dr(también designado como valor de radio de dominio esférico) basado en el ángulo ® (también
designado como ángulo de elevación) y rxy. Por ejemplo, se puede usar un cálculor =rxy/cos( ®).
Alternativamente, sin embargo, el radio 3Drse puede calcular en función del radio rxy y el componente z. Este cálculo puede realizarse, por ejemplo, mediante el calculador de valor de radio de dominio esférico 160.
Por ejemplo y se pueden calcular de acuerdo con:
Paso 2: (opcional)
Opcionalmente, se puede realizar una corrección del radiordebido a la proyección de los límites rectangulares del sistema cartesiano sobre el círculo unitario de la coordenada esférica.
La figura 10 muestra una representación esquemática de esta transformación.
r
Como se puede ver en la Figura 10, el valor de radio de dominio esférico puede tomar valores que son más grandes que el radio del círculo unitario en el sistema de coordenadas esféricas. Tomando referencia a la ecuación anteriorr ,—
mencionada en los pasos anteriores, puede tomar valores hasta \ 2 bajo el supuesto de que rxy puede tomar valores entre 0 y 1 y bajo el supuesto de que z puede tomar valores entre 0 y 1, o entre -1 y 1 (por ejemplo, para puntos dentro de un cubo unitario dentro del sistema de coordenadas esféricas).
Por consiguiente, el valor de radio de dominio esférico se corrige o ajusta para obtener así un valor r de radio de dominio esférico corregido (o ajustado). Por ejemplo, la corrección o el ajuste se puede hacer usando las siguientes ecuaciones o reglas de mapeo:
Además, se debe tener en cuenta que el ajuste o la corrección del valor de radio de dominio esférico mencionado anteriormente se puede realizar mediante el corrector de valor de radio de dominio esférico 180.
Paso 3: (opcional)
Opcionalmente, se puede realizar una corrección del ángulo de elevaciónudebido a la diferente ubicación de los altavoces en el sistema de coordenadas cartesianas f1e = 45°/\ y esféricas (0 = 30 °).
En otras palabras, dado que los altavoces de altura o los altavoces elevados están, por ejemplo, dispuestos a diferentes alturas en un sistema de coordenadas cartesianas y en un sistema de coordenadas esféricas, se puede realizar opcionalmente un mapeo de 9 a 0. Tal mapeo puede ser útil para mejorar una impresión auditiva que puede lograrse en el lado de un decodificador de audio. Por ejemplo, el mapeo de 9 a 0 se realizará de acuerdo con la siguiente ecuación o regla de mapeo:
Sin embargo, se pueden usar fórmulas más generales, como se describirá más adelante.
Por ejemplo, el mapeo de 9 a 0 puede ser realizado por el corrector de ángulo de elevación 170.
Para concluir, se han descrito detalles sobre la funcionalidad que se puede usar al transformar una representación cartesiana en una representación esférica. Los detalles descritos aquí pueden introducirse opcionalmente en el aparato 100, tanto individualmente como en combinación.
3.2 Conversión del lado del decodificador (esférico a cartesiano o “esf. a cart.”) (Realización)
En el lado del decodificador, se puede ejecutar una conversión inversa (que puede ser inversa al procedimiento realizado en el lado de producción). Esto significa que los pasos de conversión pueden, por ejemplo, invertirse en orden opuesto.
A continuación, se describirán algunos detalles.
1) Conversión de elevación y proyección de radio en el plano x-y (cálculo del componente z)
Caso especial 0 = 90 °: (opcional)
Opcionalmente, se puede realizar un manejo especial en el caso de 0 = 90°. Por ejemplo, pueden usarse las siguientes configuraciones en este caso:
x = 0, y = 0 y z = r
Paso 1: (opcional)
Opcionalmente, se puede realizar un mapeo de 0 a 9, lo que puede, por ejemplo, revertir el mapeo (opcional) de 9 a 0 mencionado anteriormente. Por ejemplo, el mapeo de 0 a 9 se puede hacer usando la siguiente regla de mapeo:
Cabe señalar que el mapeo de 0 a ® puede, por ejemplo, ser realizado por el mapeador de ángulo de elevación 220, lo que puede considerarse como opcional.
Paso 2: (opcional)
Opcionalmente, se puede realizar una inversión de una corrección de radio. Por ejemplo, la corrección antes mencionada del radio ^debido a la proyección de los límites rectangulares del sistema cartesiano sobre el círculo unitario del sistema de coordenadas esféricas, se puede invertir mediante una operación de este tipo.
Por ejemplo, la inversión de la corrección del radio se puede realizar utilizando la siguiente regla de mapeo:
Por ejemplo, la inversión de la corrección del radio puede ser realizada por el mapeador del valor de radio de dominio esférico 230.
Paso 3:
Además, una coordenada z y un valor de radio o "valor de radio intermedio rxy" se pueden calcular sobre la base del valor de radio de dominio esférico mapeadofy sobre la base del ángulo de elevación mapeado 9 (o, alternativamente, sobre la base de un valor de radio de dominio esférico r y un ángulo de elevación 0, si el mapeo opcional antes mencionado de ^ a 0 y la inversión opcional antes mencionada de la corrección del radio se omiten). Por ejemplo, el cálculo de z y rxy puede realizarse de acuerdo con las siguientes reglas de mapeo:
Por ejemplo, el cálculo de la coordenada z puede realizarse mediante el calculador 240 de coordenada z. El cálculo de rxy puede realizarse, por ejemplo, mediante el calculador de radio intermedio 250.
2) Cálculo del componente x e y
A continuación, se describirá el cálculo de un componente x y un componente y. Por ejemplo, el componente x y el componente y se determinan sobre la base del radio intermedio rxy y sobre la base del ángulo de acimut 9.
Paso 1: (opcional)
Opcionalmente, se puede realizar una inversión de la corrección de radio. Por ejemplo, el ajuste del radio opcional, que se realiza porque los altavoces están colocados en un cuadrado en el sistema de coordenadas cartesianas en contraste con el sistema de coordenadas esféricas, puede invertirse.
La inversión opcional de la corrección de radio se puede realizar, por ejemplo, de acuerdo con la siguiente regla de mapeo:
Por ejemplo, la inversión opcional de la corrección de radio puede ser realizada por el corrector de radio 260.
Paso 2:
Además, se puede realizar un cálculo de coordenadasXe y . Por ejemplo,XeYpueden determinarse sobre la base del valor de radio corregidofxyy sobre la base del ángulo de acimut. Por ejemplo, la siguiente regla de mapeo puede usarse para el cálculo deXey:
El cálculo deXe y puede, por ejemplo, ser realizado por el determinador de posición 270. Paso 3:
Además, se puede realizar un cálculo de las coordenadas x e y, que son coordenadas en la representación cartesiana. En particular, se puede usar una transformación lineal T-1. La matriz de transformación T-1 puede ser una inversa de la matriz de transformación T mencionada anteriormente. La matriz de transformación T_1 puede, por ejemplo, seleccionarse en función de la pregunta en cuál de los triángulos de dominio esférico se disponen las coordenadasXey. Para este propósito, se puede realizar opcionalmente una identificación de triángulo 280. Entonces, se puede seleccionar una matriz de transformación T_1 adecuada, que se define como se mencionó anteriormente.
Por ejemplo, el cálculo de las coordenadas x e y se puede realizar de acuerdo con la siguiente regla de mapeo:
<p>= Q = r 1<p>
Por ejemplo, el mapeador 290 realizará el cálculo de x e y, en donde la matriz de mapeo apropiada T_1 se selecciona en función de las coordenadas * e y y, en particular, en función de la pregunta de en cuál de los triángulos de dominio esférico se dispone un punto que tiene coordenadasXeV.
Para concluir, se describió una derivación de las coordenadas cartesianas x, y, z sobre la base de las coordenadas esféricas r, ^ y 0.
Sin embargo, debe mencionarse que el cálculo anterior podría adaptarse, por ejemplo, eligiendo diferentes triángulos de área base, triángulos de dominio esféricos o constantes de reglas de mapeo. Además, se podría variar una serie de triángulos, por ejemplo, dividiendo uno de los triángulos de área base en dos triángulos de área base y/o definiendo más triángulos de dominio esféricos.
También se debe tener en cuenta que cualquiera de los detalles descritos en este documento pueden introducirse opcionalmente en el aparato 200, tanto individualmente como en combinación.
3. Proveedor de corriente de audio según la Figura 11
La Figura 11 muestra un diagrama esquemático de bloques de un proveedor de corriente de audio, de acuerdo con una realización de la presente invención.
El proveedor de corriente de audio según la Figura 11 se designa en su totalidad con 1100. El proveedor de corriente de audio 1100 está configurado para recibir información de posición de objeto de entrada que describe una posición de un objeto de audio en una representación cartesiana. Además, el proveedor de corriente de audio está configurado para proporcionar una corriente de audio 1112 que comprende información de posición del objeto de salida que describe la posición del objeto de audio en una representación esférica. El proveedor de corriente de audio 1100 comprende un aparato 1130 para convertir la posición de objeto de un objeto de audio de una representación cartesiana a una representación esférica.
El aparato 1130 se utiliza para convertir la representación cartesiana, que se incluye en la información de posición del objeto de entrada, en la representación esférica, que se incluye en la corriente de audio 1112. Por consiguiente, el proveedor de corriente de audio 1100 es capaz de proporcionar una corriente de audio que describe una posición del objeto en una representación esférica, incluso aunque la información de posición del objeto de entrada simplemente describa la posición del objeto de audio en una representación cartesiana. Por lo tanto, la corriente de audio 1112 es utilizable por decodificadores de audio que requieren una representación esférica de la posición del objeto para representar correctamente un contenido de audio. Por lo tanto, el proveedor de corriente de audio 1100 es adecuado para su uso en un entorno de producción en donde la información de posición del objeto está disponible en una representación cartesiana. Se debe tener en cuenta que muchos entornos de producción de audio están adaptados para especificar de manera conveniente una posición de un objeto de audio en una representación cartesiana (por ejemplo, utilizando las coordenadas x, y, z). Por lo tanto, el proveedor de corriente de audio 1100 puede recibir información de posición del objeto desde dicho equipo de producción de audio y proporcionar una corriente de audio 1112 que puede ser utilizada por un decodificador de audio que se basa en una representación esférica de la información de posición del objeto.
Además, debe tenerse en cuenta que el proveedor de corriente de audio 1100 puede comprender opcionalmente funcionalidades adicionales. Por ejemplo, el proveedor de corriente de audio 1100 puede comprender un codificador de audio que recibe una información de audio de entrada y proporciona, sobre la base de esta, una representación de audio codificada. Por ejemplo, el proveedor de corriente de audio puede recibir una señal de entrada de un canal o puede recibir una señal de entrada de múltiples canales y proporcionar, sobre la base de esta, una representación codificada de la señal de audio de entrada de un canal o de la señal de audio de entrada de múltiples canales, que también se incluye en la corriente de audio 1112. Por ejemplo, el uno o más canales de entrada pueden representar una señal de audio de un "objeto de audio" (por ejemplo, de una fuente de audio específica, como un instrumento musical específico u otra fuente de sonido específica). Esta señal de audio puede ser codificada por un codificador de audio incluido en el proveedor de corriente de audio y la representación codificada puede incluirse en la corriente de audio. La codificación puede, por ejemplo, usar un codificador de dominio de frecuencia (como un codificador AAC, o una versión mejorada del mismo) o un codificador de audio de dominio de predicción lineal (como un codificador de audio basado en LPC). Sin embargo, una posición del objeto de audio puede, por ejemplo, ser descrita por la información de posición del objeto de entrada 1110, y puede ser convertida en una representación esférica por el aparato 1130, en donde la representación esférica de la información de posición del objeto de entrada puede incluirse en la corriente de audio. Por consiguiente, el contenido de audio de un objeto de audio puede codificarse por separado respecto de la información de posición del objeto, lo que típicamente mejora en grado significativo la eficiencia de la codificación.
Sin embargo, debe observarse que el proveedor de corriente de audio puede comprender opcionalmente funcionalidades adicionales, como una funcionalidad de mezcla descendente (por ejemplo, para mezclar en forma descendente señales de una pluralidad de objetos de audio en una o dos o más señales de mezcla descendente), y puede configurarse para proporcionar una representación codificada de una o dos o más señales de mezcla descendente en la corriente de audio 1112.
Además, el proveedor de corriente de audio también puede comprender opcionalmente una funcionalidad para obtener cierta información secundaria que describe una relación entre dos o más señales de objeto de dos o más objetos de audio (como, por ejemplo, una correlación entre objetos, una diferencia de tiempo entre objetos, una diferencia de fase entre objetos y/o una diferencia de nivel entre objetos). Esta información secundaria puede ser incluida en la corriente de audio 1112 por el proveedor de corriente de audio, por ejemplo, en una versión codificada.
De esta manera, la información puede ser incluida en la corriente de audio 1112 por el proveedor de corriente de audio, por ejemplo, en una versión codificada.
Por lo tanto, el proveedor de corriente de audio 1100 puede, por ejemplo, configurarse para incluir una señal de mezcla descendente codificada, metadatos de relación de objeto codificados (información secundaria) e información de posición de objeto codificada en la corriente de audio, en donde la información de posición de objeto codificada puede estar en una representación esférica.
Sin embargo, el proveedor de corriente de audio 1100 puede complementarse opcionalmente con cualquiera de las características y funcionalidades conocidas por los expertos en la técnica con respecto a los proveedores de corriente de audio y los codificadores de audio.
Además, debe observarse que el aparato 1130 puede, por ejemplo, corresponder al aparato 100 descrito anteriormente, y puede comprender opcionalmente características y funcionalidades adicionales y detalles como se describe en el presente documento.
4. Sistema de producción de contenido de audio según la Figura 12
La Figura 12 muestra un diagrama esquemático de bloques de un sistema de producción de contenido de audio 1200, de acuerdo con una realización de la presente invención.
El sistema de producción de contenido de audio 1200 puede configurarse para determinar una información de posición del objeto que describe una posición de un objeto de audio en una representación cartesiana. Por ejemplo, el sistema de producción de contenido de audio puede comprender una interfaz de usuario, donde un usuario puede ingresar la información de posición del objeto en una representación cartesiana. Sin embargo, opcionalmente, el sistema de producción de contenido de audio también puede derivar la información de posición del objeto en la representación cartesiana de otra información de entrada, por ejemplo, de una medición de la posición del objeto o de una simulación de un movimiento de un objeto, o de cualquier otra funcionalidad apropiada.
Además, el sistema de producción de contenido de audio comprende un aparato para convertir una posición de objeto de un objeto de audio de una representación cartesiana a una representación esférica, como se describe aquí. El aparato para convertir la posición del objeto se designa con 1230 y puede corresponder al aparato 100 como se describe anteriormente. Además, el aparato 1230 se utiliza para convertir la representación cartesiana determinada en la representación esférica.
Además, el sistema de producción de contenido de audio está configurado para incluir la representación esférica proporcionada por el aparato 1230 en una corriente de audio 1212.
Por lo tanto, el sistema de producción de contenido de audio puede proporcionar una corriente de audio que comprende una información de posición del objeto en una representación esférica, aunque la información de posición del objeto se puede determinar originalmente en una representación cartesiana (por ejemplo, desde una interfaz de usuario o utilizando cualquier otro concepto de determinación de posición del objeto).
Naturalmente, el sistema de producción de contenido de audio también puede incluir otra información de contenido de audio, por ejemplo, una representación codificada de una señal de audio, y posiblemente una metainformación adicional en la corriente de audio 1212. Por ejemplo, el sistema de producción de contenido de audio puede incluir la información adicional descrita con respecto al proveedor de corriente de audio 1110 en la corriente de audio 1212. Por lo tanto, el sistema de producción de contenido de audio 1200 puede comprender opcionalmente un codificador de audio que proporciona una representación codificada de una o más señales de audio. El sistema de producción de contenido de audio 1200 también puede comprender opcionalmente un mezclador descendente, que mezcla de manera descendente señales de audio de una pluralidad de objetos de audio en una o dos o más señales de mezcla descendente. Además, el sistema de producción de contenido de audio puede configurarse opcionalmente para derivar información de relación de objeto (como, por ejemplo, información de diferencia de nivel de objeto o valores de correlación entre objetos, o valores de diferencia de tiempo entre objetos, o similares) y puede incluir una representación codificada del mismo en la corriente de audio 1212.
Para resumir, el sistema de producción de contenido de audio 1200 puede proporcionar una corriente de audio 1212 en donde la información de posición del objeto se incluye en una representación esférica, aunque la posición del objeto se proporcione originalmente en una representación cartesiana.
Naturalmente, el aparato 1230 para convertir la posición del objeto de la representación cartesiana a la representación esférica puede complementarse con cualquiera de las características, funcionalidades y detalles descritos en el presente documento.
5. Aparato de reproducción de audio según la Figura 13
La Figura 13 muestra un diagrama esquemático de bloques de un aparato de reproducción de audio 1300, de acuerdo con una realización de la presente invención.
El aparato de reproducción de audio 1300 está configurado para recibir una corriente de audio 1310 que comprende una representación esférica de una información de posición del objeto. Además, la corriente de audio 1310 también comprende típicamente datos de audio codificados.
El aparato de reproducción de audio comprende un aparato 1330 para convertir una posición de objeto de una representación esférica en una representación cartesiana, como se describe en este documento. El aparato 1330 para convertir la posición del objeto puede, por ejemplo, corresponder al aparato 200 descrito en este documento. Por lo tanto, el aparato 1330 para convertir una posición de objeto puede recibir la información de posición del objeto en la representación esférica y proporcionar la información de posición del objeto en una representación cartesiana, como se muestra en el número de referencia 1332.
Además, el aparato de reproducción de audio 1300 también comprende un renderizador 1340 que está configurado para renderizar un objeto de audio a una pluralidad de señales de canal 1350 asociadas con transductores de sonido en función de la representación cartesiana 1332 de la información de posición del objeto.
Opcionalmente, el aparato de reproducción de audio también comprende una decodificación de audio (o un decodificador de audio) 1360 que puede, por ejemplo, recibir datos de audio codificados, que se incluyen en la corriente de audio 1310, y proporcionar, sobre su base, información de audio decodificada 1362. Por ejemplo, la decodificación de audio puede proporcionar, como la información de audio decodificada 1362, una o más señales de canal o una o más señales de objeto al renderizador 1340.
Además, se debe tener en cuenta que el renderizador 1340 puede renderizar una señal de un objeto de audio en una posición (dentro de un entorno auditivo) determinada por la representación cartesiana 1332 de la posición del objeto. Por lo tanto, el renderizador 1340 puede usar la representación cartesiana 1332 de la posición del objeto para determinar cómo debe distribuirse una señal asociada a un objeto de audio a las señales del canal 1350. En otras palabras, el renderizador 1340 decide, en función de la representación cartesiana de la información de posición del objeto, mediante qué transductores de sonido o altavoces se renderiza una señal de un objeto de audio (y en qué intensidad se renderiza la señal en las diferentes señales de canal).
Esto proporciona un concepto eficiente para una reproducción de audio. Además, se debe tener en cuenta que se pueden usar varios tipos de renderizadores que reciben información de posición del objeto en una representación cartesiana, ya que muchos renderizadores generalmente tienen dificultades para manejar una representación de posición del objeto en una representación esférica (o no pueden tratar la información de posición del objeto en una representación esférica en absoluto).
De este modo, al utilizar el aparato 1330 para convertir la información de posición de un objeto en una representación esférica a una representación cartesiana, el aparato de reproducción de audio puede usar aparatos de renderización que sean más adecuados para la información de posición de objeto proporcionada en una representación cartesiana. Además, se debe tener en cuenta que el aparato 1330 puede implementarse con un esfuerzo computacional comparativamente pequeño, como se discutió anteriormente.
Además, debe observarse que el aparato 1330 puede complementarse con cualquiera de las características y funcionalidades y los detalles descritos con respecto al aparato 200.
6. Método de acuerdo con la Figura 14
La Figura 14 muestra un diagrama de flujo de un método para convertir una posición de objeto de un objeto de audio de una representación cartesiana a una representación esférica.
El método 1400 de acuerdo con la reivindicación 14 comprende determinar 1410 en cuál de los triángulos de área base se dispone una proyección de la posición de objeto del objeto de audio en el área base. El método también comprende determinar 1420 una posición mapeada de la proyección de la posición de objeto utilizando una transformación lineal, que mapea el triángulo de área base sobre su triángulo de dominio esférico asociado.
El método también comprende derivar 1430 un ángulo de acimut y un valor de radio intermedio a partir de la posición mapeada. El método también comprende obtener 1440 un valor de radio de dominio esférico y un ángulo de elevación en función del valor de radio intermedio y en función de una distancia de la posición del objeto desde el área base.
Este método se basa en las mismas consideraciones que el aparato mencionado anteriormente para convertir una posición de objeto de una representación cartesiana a una representación esférica. Por consiguiente, el método 1400 puede complementarse con cualquiera de las características, funcionalidades y detalles descritos aquí, por ejemplo, con respecto al aparato 100.
7. Método de acuerdo con la Figura 15
La Figura 15 muestra un diagrama de flujo de un método para convertir una posición de objeto de un objeto de audio de una representación esférica a una representación cartesiana.
El método comprende obtener 1510 un valor que describe una distancia de la posición del objeto desde el área base y un radio intermedio sobre la base de un ángulo de elevación o un ángulo de elevación mapeado y sobre la base de un radio de dominio esférico o un radio de dominio esférico mapeado.
El método también comprende determinar 1520 una posición dentro de uno de una pluralidad de triángulos inscritos en un círculo sobre la base del radio intermedio, o una versión corregida del mismo, y sobre la base de un ángulo de acimut.
El método también comprende determinar una posición mapeada 1530 de la proyección de la posición del objeto sobre un plano base de una representación cartesiana sobre la base de la posición determinada dentro de uno de los triángulos inscritos en el círculo.
Este método se basa en las mismas consideraciones que los aparatos descritos anteriormente. Además, el método 1500 puede complementarse con cualquiera de las características, funcionalidades y detalles descritos en este documento.
En particular, el método 1500 puede complementarse con cualquiera de las características, funcionalidades y detalles descritos con respecto al aparato 200.
8. Método de acuerdo con la Figura 16
La Figura 16 muestra un diagrama de flujo de un método 1600 para la reproducción de audio.
El método comprende recibir 1610 una corriente de audio que comprende una representación esférica de una información de posición de objeto.
El método también comprende convertir 1620 la representación esférica en una representación cartesiana de la información de posición del objeto.
El método también comprende representar 1630 un objeto de audio a una pluralidad de señales de canal asociadas con transductores de sonido en función de la representación cartesiana de la información de posición del objeto. En particular, el método 1600 puede complementarse con cualquiera de las características, funcionalidades y detalles descritos en este documento.
9. Conclusiones y otras realizaciones
A continuación, se describirán realizaciones adicionales que pueden usarse individualmente o en combinación con las características, funcionalidades y detalles descritos en el presente documento.
Además, las características y funcionalidades y los detalles descritos a continuación se pueden usar opcionalmente en combinación con cualquiera de las otras realizaciones descritas en el presente documento.
Un primer aspecto crea un método para convertir metadatos de objetos relacionados con audio entre diferentes espacios de coordenadas.
Un segundo aspecto crea un método para convertir metadatos de objetos relacionados con audio de coordenadas relacionadas con la sala a coordenadas relacionadas con el oyente, y viceversa.
Un tercer aspecto crea un método para convertir las posiciones de los altavoces entre diferentes espacios de coordenadas.
Un cuarto aspecto crea un método para convertir metadatos de las posiciones de los altavoces de coordenadas relacionadas con la sala a coordenadas relacionadas con el oyente, y viceversa.
Un quinto aspecto crea un método para convertir metadatos de posición del objeto de audio de un espacio de parámetros cartesianos a un sistema de coordenadas esféricas, que separa la conversión del plano x-y al ángulo de acimut j y la conversión del componente z al ángulo de elevación q.
Un sexto aspecto crea un método de acuerdo con el quinto aspecto que mapea correctamente las posiciones de los altavoces desde el espacio cartesiano al sistema de coordenadas esféricas.
Un séptimo aspecto crea un método de acuerdo con el quinto aspecto que proyecta las superficies del espacio cuboide en el sistema de coordenadas cartesianas, en donde se ubican los altavoces, sobre la superficie de la esfera que contiene los altavoces correspondientes en el sistema de coordenadas esféricas.
Un octavo aspecto crea un método de acuerdo con uno del primer al quinto aspecto, que comprende los siguientes pasos de procesamiento:
- Proyectar triángulos formados por 2 posiciones de altavoces adyacentes en el plano x-y y el centro del cuboide sobre el triángulo correspondiente en el espacio esférico
- Corregir el radio para mapear el borde exterior del rectángulo del altavoz desde el plano x-y sobre el círculo correspondiente que contiene los altavoces en el plano horizontal del sistema de coordenadas esféricas
- Aplicar la elevación en el radio basado en el componente z, para determinar un radio esférico (3D)
- Corregir el radio según el ángulo de elevación para mapear también los altavoces de altura sobre la esfera - Corregir el ángulo de elevación para reflejar las diferentes elevaciones de los altavoces de altura en sistemas de coordenadas cartesianas y esféricas
Un noveno aspecto crea un método que realiza las operaciones inversas de acuerdo con el quinto aspecto.
Un décimo aspecto crea un método que realiza las operaciones inversas de acuerdo con el sexto aspecto.
Un undécimo aspecto crea un método que realiza las operaciones inversas de acuerdo con el séptimo aspecto. Un duodécimo aspecto crea un método que realiza las operaciones inversas de acuerdo con el octavo aspecto. 10. Otras realizaciones
A continuación, se describirán realizaciones adicionales de acuerdo con la invención, que pueden usarse individualmente o en combinación con cualquiera de las características, funcionalidades y detalles descritos aquí (también en las reivindicaciones). Además, cualquiera de las otras realizaciones descritas en este documento (también en las reivindicaciones) se puede complementar opcionalmente con cualquiera de las características, funcionalidades y detalles descritos en esta sección, tanto individualmente como en combinación.
Regla de mapeo para metadatos de posición de objeto dinámica:
Esta sección describe una conversión de metadatos de objeto del lado de producción, especialmente datos de posición del objeto, en caso de que en el lado de producción se use un sistema de coordenadas cartesianas, pero en el formato de transporte los metadatos de posición del objeto se describen en coordenadas esféricas.
El problema es que en las coordenadas cartesianas los altavoces no siempre están ubicados en las posiciones matemáticamente correctas en comparación con el sistema de coordenadas esféricas. Por lo tanto, se necesita una conversión que garantice que el área cuboidea del espacio cartesiano se proyecte correctamente en la esfera (o semiesfera). Por ejemplo, las posiciones de los altavoces se representan igualmente utilizando un renderizador de objetos de audio basado en un sistema de coordenadas esféricas (por ejemplo, un renderizador como se describe en el estándar de audio 3D MPEG-H) o utilizando un renderizador cartesiano con el algoritmo de conversión correspondiente. Las superficies cuboides deben ser mapeadas / proyectadas sobre la superficie de la esfera en la que se encuentran los altavoces.
Además, se desea o se requiere que el algoritmo de conversión tenga complejidad computacional reducida, especialmente el paso de conversión de coordenadas esféricas a cartesianas.
Una aplicación de ejemplo para las realizaciones de acuerdo con la invención es: usar herramientas de creación de objetos de audio de última generación que a menudo usan un espacio de parámetros cartesianos (x, y, z) para las coordenadas del objeto de audio, pero usan un formato de transporte que describe las posiciones del objeto de audio en coordenadas esféricas (acimut, elevación, radio), como por ejemplo Audio 3D MPEG-H. Sin embargo, el formato de transporte puede ser (o debe ser) independiente del renderizador (esférico o cartesiano), que se aplica después. La conversión se describe a modo de ejemplo para una configuración de altavoces 5.1 4H, pero se puede transferir fácilmente a todo tipo de configuraciones de altavoces (por ejemplo, 7.1+4, 22.2, etc.) o espacios de parámetros cartesianos variados (diferente orientación de los ejes o diferente escalado de los ejes).
Comparación general de sistemas de coordenadas
En la Figura 17 se muestra un ejemplo de una sala de parámetros cartesianos con las correspondientes posiciones de los altavoces para una configuración 5.1+4H.
En la Figura 18 se muestra un ejemplo de un Sistema de Coordenadas Esféricas según ISO/IEC 23008-3:2015 MPEG-H Audio 3D.
Tenga en cuenta que las coordenadas X e Y en el sistema de coordenadas ISO se definen de manera diferente en comparación con el sistema de coordenadas cartesianas descrito anteriormente.
Conversión del lado de producción (cartesiana a esférica)
Las posiciones de los altavoces se dan en coordenadas esféricas como, por ejemplo, se describe en la recomendación de ITU-R ITU-R BS.2051-1 (sistema de sonido avanzado para la producción de programas) y se describe en la especificación MPEG-H. La conversión se aplica en un enfoque separado. En primer lugar las coordenadas x e y sef
mapean al ángulo de acimut cp y el radio XV en el plano acimut / xy. Luego, el ángulo de elevación y el radio en el espacio 3D se calculan utilizando la coordenada z. El mapeo se describe a modo de ejemplo para la configuración de altavoces 5.1 4H.
Caso especial x = y = 0:
Para z > 0:
9 = indefinido (= 0 °), 0 = 90 ° y r = z.
Para z = 0:
9 = indefinido (= 0 °), 0 = 0 ° y r = 0.
1) Conversión en el plano xy
Se hace referencia a la Figura 19, que muestra una representación esquemática de un sistema de coordenadas cartesianas y de un sistema de coordenadas esféricas, y de altavoces (cuadrados rellenos).
Paso 1:
En el primer paso, los triángulos en el sistema de coordenadas cartesianas se mapean a los triángulos correspondientes en el sistema de coordenadas esféricas.
Se hace referencia a la Figura 20, que muestra una representación gráfica de triángulos inscritos en un cuadrado en el sistema de coordenadas cartesianas y en un círculo en el sistema de coordenadas esféricas.
A continuación, esto se muestra a modo de ejemplo para un triángulo. También se hace referencia a la Figura 21. Los triángulos se pueden proyectar unos sobre otros utilizando una transformación lineal:
La matriz de transformación se puede calcular utilizando las posiciones conocidas de las esquinas del triánguloP2,P\y? 2.Estos puntos dependen de la configuración del altavoz y de las posiciones correspondientes de los altavoces y del triángulo en donde se encuentra la posiciónP.
La configuración de los altavoces 5.1 4H contiene en la capa media una configuración de altavoces estándar 5.1, que es la base para la proyección en el plano x-y. En la Tabla 2 los puntos correspondientesp2,y ^2 se dan para los 5 triángulos que hay que proyectar.
Paso 2:
Calcular el radior *Yy el ángulo de acimut cp basado en las coordenadas mapeadas Aye<y>.
Paso 3:
El radio debe ajustarse, ya que los altavoces se colocan en un cuadrado en el sistema de coordenadas cartesianas en contraste con el sistema de coordenadas esféricas. En el sistema de coordenadas esféricas, los altavoces se colocan en un círculo.
Para ajustar el radio, el límite del cuadrado cartesiano del altavoz se proyecta en el círculo del sistema de coordenadas esféricas. Esto significa que la cuerda se proyecta en el segmento correspondiente del círculo.
2) Conversión del componente z
Se supone que la elevación de la capa superior está a un ángulo de elevacióno<P>= 30 ° (o 35 °) en el sistema de coordenadas esféricas (elevación típica recomendada por ITU-R BS.2051).
También se hace referencia a la Figura 23.
Paso 1:
Calcular el ángulo de elevación0basado en el radio1XV 1y el componente z. Además, calcular el radio 3D 'rbasadonk
en el ángulo yx y m
Paso 2:
Corrección del radio f debido a la proyección de los límites rectangulares del sistema cartesiano en el círculo unitario del sistema de coordenadas esféricas.
También se hace referencia a la Figura 24.
Paso 3:
Corrección del ángulo de elevación ° P , debido a la diferente colocación de los altavoces en el sistema de coordenadas cartesianas ( ^ r °P = 45 °) y esféricas ( ^ r °P = 30 ° (o 35 °)).
n
Mapeo deua 0:
Conversión del lado del decodificador (esférica a cartesiana)
En el lado del decodificador, se debe ejecutar la conversión inversa al lado de producción. Esto significa que los pasos de conversión se invierten en orden opuesto.
Conversión de elevación y proyección de radio en el plano xy (cálculo del componente z)
Caso especial Q = 90 °:
Paso 1:
Paso 2:
Inversión de corrección de radio: con
Paso 3:
Calcular
Cálculo del componente x e y
Paso 1:
Inversión de la corrección del radio
Paso 2:
Cálculo de ^ e y
Paso 3:
Cálculo de x ey.
Regla de mapeo para metadatos dispersos:
Codificador (cartesiano -> esférico): (Nota: no podrá utilizar la señalización de dispersión uniforme)
Dispersión de ancho:S9, dispersión de altura:^0y dispersión de distancia: ^
Decodificador (Esférico -> Cartesiano)
En caso de dispersión uniforme en el flujo de bits, la conversión es:
rangos entre [0, 1],
11. Observaciones adicionales
Como observación general, se debe tener en cuenta que no es necesario usar exactamente 4 segmentos o triángulos. Por ejemplo, los segmentos (o triángulos, como los triángulos de dominio cartesiano y los triángulos de dominio esférico) pueden definirse por las posiciones de los altavoces del plano horizontal de la configuración de altavoces. Por ejemplo, en una configuración de altavoces de altura 5.1 4 (altavoces elevados), los segmentos o triángulos pueden definirse por la configuración de base 5.1. Por consiguiente, se pueden definir 5 segmentos en este ejemplo (ver, por ejemplo, la descripción en la sección 10). En una configuración de altavoces de altura de 7.1 4 (altavoces elevados), se pueden definir 7 segmentos o triángulos. Esto puede, por ejemplo, estar representado por las ecuaciones más genéricas que se muestran en la sección 10 (que no comprenden ángulos fijos). Además, los ángulos de los altavoces de altura (altavoces elevados) pueden, por ejemplo, diferir de una configuración a otra (por ejemplo, 30 grados o 35 grados).
Por lo tanto, el número de triángulos y los rangos de los ángulos pueden, por ejemplo, variar de una realización a otra.
12. Alternativas de implementación
Cualquiera de las características y funcionalidades descritas en este documento se pueden implementar en hardware o en software, o utilizando una combinación de hardware y software, como se describirá en esta sección.
Aunque algunos aspectos se han descrito en el contexto de un aparato, está claro que estos aspectos también representan una descripción del método correspondiente, donde un bloque o dispositivo corresponde a un paso del método o una característica de un paso del método. Análogamente, los aspectos descritos en el contexto de un paso del método también representan una descripción de un bloque o elemento o característica correspondiente de un aparato correspondiente. Algunos o todos los pasos del método pueden ser ejecutados por un aparato de hardware (o mediante su uso), como, por ejemplo, un microprocesador, una ordenador programable o un circuito electrónico. En algunas realizaciones, uno o más de los pasos del método más importantes pueden ser ejecutados por un aparato de este tipo.
Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden implementarse en hardware o en software. La implementación se puede realizar utilizando un medio de almacenamiento digital, por ejemplo, un disquete, DVD, Blu-Ray, CD, ROM, Pr OM, EPROM, EEPROM o una memoria FLASH, con señales de control legibles electrónicamente almacenadas allí, que cooperan (o son capaces de cooperar) con un sistema informático programable de tal manera que se realice el método respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
El aparato descrito en el presente documento puede implementarse usando un aparato de hardware, o usando un ordenador, o usando una combinación de un aparato de hardware y un ordenador.
El aparato descrito en el presente documento, o cualquier componente del aparato descrito aquí, puede implementarse al menos parcialmente en hardware y/o en software.
Los métodos descritos en el presente documento pueden realizarse usando un aparato de hardware, o usando una ordenador, o usando una combinación de un aparato de hardware y un ordenador.
Los métodos descritos en el presente documento, o cualquiera de los componentes del aparato descrito en este documento, pueden realizarse al menos parcialmente por hardware y/o por software.
Las realizaciones descritas anteriormente son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y los detalles descritos en este documento serán evidentes para otros expertos en la técnica. Es la intención, por lo tanto, limitarse únicamente por el alcance de las reivindicaciones de patente y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.
Claims (5)
- REIVINDICACIONES i. Un aparato (100) para convertir una posición de objeto de un objeto de audio de una representación cartesiana (110) a una representación esférica (112), que comprende un ángulo de acimut, un valor de radio de dominio esférico y un ángulo de elevación, en donde un área base de la representación cartesiana se subdivide en una pluralidad de triángulos de área base (630,532,634,636), y en donde una pluralidad de triángulos de dominio esférico (660,662,664,666) están inscritos en un círculo de una representación esférica, y en donde cada uno de los triángulos de dominio esférico está asociado a un triángulo de área base, en donde el aparato está configurado para determinar en cuál de los triángulos del área de base está dispuesta una proyección de la posición del objeto de audio en el área de base; y en donde el aparato está configurado para determinar una posición mapeada de la proyección de la posición del objeto usando una transformación lineal, que mapea el triángulo del área base, en donde está dispuesta la proyección de la posición del objeto del objeto de audio en el área base, sobre su triángulo de dominio esférico asociado, en donde el aparato está configurado para derivar el ángulo de acimut y un valor de radio intermedio a partir de la posición mapeada; en donde el aparato está configurado para obtener el valor del radio del dominio esférico y el ángulo de elevación dependiendo del valor del radio intermedio y dependiendo de la distancia de la posición del objeto desde el área base.
- 2. Un aparato (100) de acuerdo con la reivindicación 1, en donde las posiciones de las esquinas de al menos algunos de los triángulos del área de la base corresponden a posiciones de los altavoces en el sistema de coordenadas cartesianas, y en donde las posiciones de las esquinas de al menos algunos de los triángulos de dominio esférico corresponden a posiciones de los altavoces en el sistema de coordenadas esféricas.
- 3. El aparato de acuerdo con la reivindicación 1 o la reivindicación 2, en donde la posición mapeada esPy la proyección es P y la transformación lineal se describe mediante una matriz de transformación T de acuerdo conen donde el aparato está configurado para obtener la matriz de transformación en función del triángulo de área base determinado.
- 4. El aparato de acuerdo con la reivindicación 3, en donde la matriz de transformación se define de acuerdo conD p D D en donde u ,* , r '-y ■r 2,x.r 2.Son las coordenadas x e y de dos esquinas del triángulo de área base determinado; y Ó p Ó p en donde 1.*’ 1./’ 2.x ■ 2, son las coordenadas x e y de dos esquinas del triángulo de dominio esférico asociado.
- 5. El aparato de acuerdo con una de las reivindicaciones 1 a 4, en donde el aparato está configurado para obtener el valor del radio del dominio esférico en función del valor del radio intermedio usando un ajuste de radio, y en donde el ajuste del radio está adaptado para escalar el valor del radio intermedio obtenido antes en función del ángulo de acimut, 6. El aparato de acuerdo con una de las reivindicaciones 1 a 5, en donde el aparato está configurado para obtener el ángulo de elevación como un ángulo de un triángulo rectángulo que tiene patas del valor de radio intermedio y de la distancia de la posición del objeto desde el área base: y/o en donde el aparato está configurado para obtener el radio de dominio esférico como una longitud de hipotenusa de un triángulo rectángulo que tiene patas del valor de radio intermedio y de la distancia de la posición del objeto desde el área base.en donde z es la distancia de la posición del objeto desde el área base, y en donder * yes el valor de radio intermedio, o una versión ajustada del mismo. 8 El aparato de acuerdo con una de las reivindicaciones 1 a 7, en donde el aparato está configurado para obtener el ángulo de elevación ajustado utilizando un mapeo no lineal que mapea de manera lineal los ángulos en una primera región de ángulo sobre una primera región de ángulo mapeada y que mapea de manera lineal los ángulos dentro de una segunda región de ángulo sobre una segunda región de ángulo mapeada, en donde la primera región de ángulo tiene un ancho diferente en comparación con la primera región de ángulo mapeada. 9 El aparato de acuerdo con una de las reivindicaciones 1 a 8, en donde el aparato está configurado para obtener un radio de dominio esférico ajustado r sobre la base de un radio de dominio esférico, en donde el radio de dominio esférico esry el aparato está configurado para mapear el radio de dominio esférico sobre el radio de dominio esférico ajustado r de acuerdo con: para 0 < <9<45 ° :para 45° < ~6< 90° :en donde ^es el ángulo de elevación. 10. Un aparato (200) para convertir una posición de objeto de un objeto de audio de una representación esférica (218,228,258) a una representación cartesiana (242,292), en donde, en la representación esférica (218,228,258), la posición del objeto se describe usando un ángulo de acimut, un ángulo de elevación (218) y un radio de dominio esférico r (228), en donde un área base de la representación cartesiana se subdivide en una pluralidad de triángulos de área base, y en donde una pluralidad de triángulos de dominio esférico se inscribe en un círculo de un sistema de coordenada esférica, en donde el aparato está configurado para obtener un valor (z) (242) que describe una distancia de la posición del objeto desde el área base y un radio intermedio (252, rxy) sobre la base del ángulo de elevación (218) y sobre la base del radio de dominio esférico (228); en donde el aparato está configurado para determinar una posición (272) dentro de uno de los triángulos inscritos en el círculo sobre la base del radio intermedio (252) y sobre la base de un ángulo de azimut; y en donde el aparato está configurado para determinar una posición mapeada (292) de la proyección (272, P) de la posición del objeto en el plano base sobre la base de la posición determinada (272) dentro de uno de los triángulos inscritos en el círculo. El aparato (200) de acuerdo con la reivindicación 10, en donde las posiciones de las esquinas de al menos algunos de los triángulos de área base corresponden a las posiciones de los altavoces en el sistema de coordenadas cartesianas, y en donde las posiciones de las esquinas de al menos algunos de los triángulos de dominio esférico corresponden a las posiciones de los altavoces en el sistema de coordenadas esféricas; en donde el aparato está configurado para realizar la determinación de la posición mapeada (292) de la proyección (272) de la posición del objeto sobre el plano base usando una transformada lineal que mapea el triángulo en el que se encuentra la posición determinada, sobre un triángulo asociado en el plano base, en donde el valor z (242) describe la distancia de la posición del objeto desde el área base y la posición mapeada (292) describe la posición del objeto en la representación cartesiana. El aparato de acuerdo con la reivindicación 10 o la reivindicación 11, en donde el aparato está configurado para obtener un ángulo de elevación mapeado en base al ángulo de elevación, y en donde el aparato está configurado para obtener el ángulo de elevación mapeado usando un mapeo no lineal que mapea linealmente ángulos en una primera región de ángulo en una primera región de ángulo mapeada y que mapea linealmente ángulos dentro de una segunda región de ángulo en una segunda región de ángulo mapeada, en donde la primera región de ángulo tiene un ancho diferente en comparación con la primera región de ángulo mapeada. El aparato de acuerdo con la reivindicación 10 o la reivindicación 12, en donde el aparato está configurado para obtener el radio de dominio esférico mapeadorsobre la base de un radio de dominio esférico r de acuerdo conen donde9es el ángulo de elevación o el ángulo de elevación mapeado; o en donde el aparato está configurado para obtener el radio de dominio esférico mapeadorsobre la base de un radio de dominio esférico r de acuerdo conen donde9es el ángulo de elevación o el ángulo de elevación mapeado, y en donde 0Top es un ángulo de elevación de los altavoces de altura en el sistema de coordenadas esféricas. El aparato de acuerdo con una de las reivindicaciones 10 a 13, en donde el aparato está configurado para escalar el radio intermedio en función del ángulo de acimut, para obtener un radio corregido, o en donde el radio corregido esrxy ,el radio intermedio esrxyy el aparato está configurado para obtener el radio corregido en base al radio intermedio de acuerdo conen donde ^ es el ángulo de acimut. o en donde el aparato está configurado para obtener el radio corregidorxysobre la base del radio intermediorxyde acuerdo conen donde ^ es el ángulo de acimut, y en donde jP - jJ yj P i )son ángulos de posición de dos esquinas de un triángulo de dominio esférico en el que está dispuesta la posición del objeto de audio. El aparato de acuerdo con una de las reivindicaciones 10 a 14, en donde el aparato está configurado para determinar la posición dentro de uno de los triángulos inscritos en el círculo de acuerdo con ° en dondexeyson valores de coordenadas; en donderxyes el radio intermedio o el radio corregido; y en donde ^ es el ángulo de acimut; y/o en donde el aparato está configurado para determinar la posición mapeada de la proyección de la posición del objeto en el plano base sobre la base de la posición determinada dentro de uno de los triángulos inscritos en el círculo usando una transformación lineal que mapea el triángulo en donde se encuentra la posición determinada, sobre un triángulo asociado en el plano base; y/o en donde la Proyección es P y el aparato está configurado para determinar la posición mapeada de la proyección P de la posición del objeto en el plano base de acuerdo conen donde T es una matriz de transformación, y en dondePes un vector que representa la proyección de la posición del objeto sobre el plano base. Un proveedor de corriente de audio (1100) para proporcionar una corriente de audio, en donde el proveedor de corriente de audio está configurado para recibir información de posición del objeto de entrada (1110) que describe una posición de un objeto de audio en una representación cartesiana y para proporcionar una corriente de audio (1112) que comprende información de posición del objeto de salida que describe la posición del objeto en una representación esférica, y en donde el proveedor de corriente de audio comprende un aparato (100; 1130) de acuerdo con una de las reivindicaciones 1 a 9 para convertir la representación cartesiana en la representación esférica; o en donde el proveedor de corriente de audio está configurado para recibir información de posición del objeto de entrada (1110) que describe una posición de un objeto de audio en una representación esférica y para proporcionar una corriente de audio (1112) que comprende información de posición de salida del objeto que describe la posición del objeto en una representación cartesiana, y en donde el proveedor de corriente de audio comprende un aparato (100; 1130) de acuerdo con una de las reivindicaciones 10 a 15 para convertir la representación esférica en la representación cartesiana. Un sistema de producción de contenido de audio (1200), en donde el sistema de producción de contenido de audio está configurado para determinar una información de posición del objeto que describe una posición de un objeto de audio en una representación cartesiana, y en donde el sistema de producción de contenido de audio comprende un aparato (100; 1230) de acuerdo con una de las reivindicaciones 1 a 9 para convertir la representación cartesiana en una representación esférica, y en donde el sistema de producción de contenido de audio está configurado para incluir la representación esférica en una corriente de audio; o en donde el sistema de producción de contenido de audio está configurado para determinar una información de posición del objeto que describe una posición de un objeto de audio en una representación esférica, y en donde el sistema de producción de contenido de audio comprende un aparato (100; 1230) de acuerdo con una de las reivindicaciones 10 a 15 para convertir la representación esférica en una representación cartesiana, y en donde el sistema de producción de contenido de audio está configurado para incluir la representación cartesiana en una corriente de audio. Un aparato de reproducción de audio (1300), en donde el aparato de reproducción de audio está configurado para recibir una corriente de audio (1112; 1212; 1310) que comprende una representación esférica de una información de posición del objeto, y en donde el aparato de reproducción de audio comprende un aparato (200; 1330) de acuerdo con una de las reivindicaciones 10 a 15, que está configurado para convertir la representación esférica en una representación cartesiana de la información de posición del objeto, y en donde el aparato de reproducción de audio comprende un renderizador (1340) configurado para renderizar un objeto de audio a una pluralidad de señales de canal (1350) asociadas con transductores de sonido que dependen de la representación cartesiana de la información de posición del objeto; o en donde el aparato de reproducción de audio está configurado para recibir una corriente de audio (1112; 1212; 1310) que comprende una representación cartesiana de una información de posición del objeto, y en donde el aparato de reproducción de audio comprende un aparato (200; 1330) de acuerdo con una de las reivindicaciones 1 a 9, que está configurado para convertir la representación cartesiana en una representación esférica de la información de posición del objeto, y en donde el aparato de reproducción de audio comprende un renderizador (1340) configurado para renderizar un objeto de audio a una pluralidad de señales de canal (1350) asociadas con transductores de sonido que dependen de la representación esférica de la información de posición del objeto. Un método (1400) para convertir una posición de objeto de un objeto de audio de una representación cartesiana a una representación esférica que comprende un ángulo de acimut, un valor de radio de dominio esférico y un ángulo de elevación, en donde un área de base de la representación cartesiana se subdivide en una pluralidad de triángulos de área de base, y en donde una pluralidad de triángulos de dominio esférico están inscritos en un círculo de la representación esférica, y en donde cada uno de los triángulos de dominio esférico está asociado a un triángulo de área base, en donde el método comprende determinar (1410) en cuál de los triángulos del área base está dispuesta una proyección de la posición del objeto de audio en el área base; y en donde el método comprende determinar (1420) una posición mapeada de la proyección de la posición del objeto usando una transformación lineal, que mapea el triángulo del área base en el que la proyección de la posición del objeto del objeto de audio en el área base está dispuesta sobre su triángulo de dominio esférico asociado, en donde el método comprende derivar (1430) el ángulo de acimut y un valor de radio intermedio a partir de la posición mapeada; en donde el método comprende obtener (1440) el valor del radio del dominio esférico y el ángulo de elevación en función del valor del radio intermedio y en función de la distancia de la posición del objeto desde el área base. Un método (1500) para convertir una posición de objeto de un objeto de audio de una representación esférica, a una representación cartesiana, en donde, en la representación esférica (218,228,258), la posición del objeto se describe usando un ángulo de acimut, un ángulo de elevación (218) y un radio de dominio esférico (228), en donde una superficie base de la representación cartesiana está subdividida en una pluralidad de triángulos de superficie base, y en donde una pluralidad de triángulos de dominio esférico están inscritos en un círculo en un sistema de coordenadas esféricas, en donde el método comprende obtener (1510) un valor z que describe una distancia de la posición del objeto desde el área base y un radio intermedio en base al ángulo de elevación y en base al radio del dominio esférico; en donde el método comprende determinar (1520) una posición dentro de uno de los triángulos inscritos en el círculo en base al radio intermedio y en base al ángulo de acimut; y en donde el método comprende determinar (1530) una posición mapeada de la proyección de la posición del objeto sobre el plano base en base a la posición determinada dentro de uno de los triángulos inscritos en el círculo. 21. Un programa informático con instrucciones que, cuando se ejecuta el programa por un ordenador, hace que el ordenador lleve a cabo un método de acuerdo con la reivindicación 19 o la reivindicación 20.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP18154307 | 2018-01-30 | ||
| PCT/EP2018/025211 WO2019149337A1 (en) | 2018-01-30 | 2018-08-08 | Apparatuses for converting an object position of an audio object, audio stream provider, audio content production system, audio playback apparatus, methods and computer programs |
| PCT/EP2019/052156 WO2019149710A1 (en) | 2018-01-30 | 2019-01-29 | Apparatuses for converting an object position of an audio object, audio stream provider, audio content production system, audio playback apparatus, methods and computer programs |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2962111T3 true ES2962111T3 (es) | 2024-03-15 |
Family
ID=61188596
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES19701383T Active ES2962111T3 (es) | 2018-01-30 | 2019-01-29 | Aparatos para convertir una posición de objeto de un objeto de audio, proveedor de corriente de audio, sistema de producción de contenido de audio, aparato de reproducción de audio, métodos y programas informáticos |
Country Status (15)
| Country | Link |
|---|---|
| US (1) | US11653162B2 (es) |
| EP (1) | EP3747204B1 (es) |
| JP (1) | JP7034309B2 (es) |
| KR (1) | KR102412012B1 (es) |
| CN (1) | CN112154676B (es) |
| AR (2) | AR114348A1 (es) |
| AU (1) | AU2019214298C1 (es) |
| CA (1) | CA3090026C (es) |
| ES (1) | ES2962111T3 (es) |
| MX (1) | MX2020007998A (es) |
| MY (1) | MY205739A (es) |
| RU (1) | RU2751129C1 (es) |
| SG (1) | SG11202007293UA (es) |
| TW (1) | TWI716810B (es) |
| WO (2) | WO2019149337A1 (es) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112352278A (zh) * | 2018-07-04 | 2021-02-09 | 索尼公司 | 信息处理装置和方法以及程序 |
| JP7700470B2 (ja) * | 2020-03-24 | 2025-07-01 | ヤマハ株式会社 | 情報処理方法および情報処理装置 |
Family Cites Families (24)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6684176B2 (en) * | 2001-09-25 | 2004-01-27 | Symbol Technologies, Inc. | Three dimensional (3-D) object locator system for items or sites using an intuitive sound beacon: system and method of operation |
| ZA200503594B (en) * | 2002-12-02 | 2006-08-30 | Thomson Licensing Sa | Method for describing the composition of audio signals |
| FR2858403B1 (fr) * | 2003-07-31 | 2005-11-18 | Remy Henri Denis Bruno | Systeme et procede de determination d'une representation d'un champ acoustique |
| JP5363567B2 (ja) * | 2009-05-11 | 2013-12-11 | パナソニック株式会社 | 音響再生装置 |
| PL2727381T3 (pl) | 2011-07-01 | 2022-05-02 | Dolby Laboratories Licensing Corporation | Sposób i urządzenie do renderowania obiektów audio |
| EP2600637A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for microphone positioning based on a spatial power density |
| WO2014036085A1 (en) * | 2012-08-31 | 2014-03-06 | Dolby Laboratories Licensing Corporation | Reflected sound rendering for object-based audio |
| US9913064B2 (en) | 2013-02-07 | 2018-03-06 | Qualcomm Incorporated | Mapping virtual speakers to physical speakers |
| CN105075288B (zh) | 2013-02-15 | 2018-10-19 | 松下知识产权经营株式会社 | 指向性控制系统、校准方法、水平偏差角计算方法及指向性控制方法 |
| EP2979467B1 (en) * | 2013-03-28 | 2019-12-18 | Dolby Laboratories Licensing Corporation | Rendering audio using speakers organized as a mesh of arbitrary n-gons |
| EP2809088B1 (en) * | 2013-05-30 | 2017-12-13 | Barco N.V. | Audio reproduction system and method for reproducing audio data of at least one audio object |
| KR102226420B1 (ko) | 2013-10-24 | 2021-03-11 | 삼성전자주식회사 | 다채널 오디오 신호 생성 방법 및 이를 수행하기 위한 장치 |
| JP2015179986A (ja) | 2014-03-19 | 2015-10-08 | ヤマハ株式会社 | オーディオ定位設定装置、方法、及び、プログラム |
| EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
| EP2925024A1 (en) * | 2014-03-26 | 2015-09-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio rendering employing a geometric distance definition |
| US9723419B2 (en) * | 2014-09-29 | 2017-08-01 | Bose Corporation | Systems and methods for determining metric for sound system evaluation |
| US9578439B2 (en) * | 2015-01-02 | 2017-02-21 | Qualcomm Incorporated | Method, system and article of manufacture for processing spatial audio |
| US10257636B2 (en) * | 2015-04-21 | 2019-04-09 | Dolby Laboratories Licensing Corporation | Spatial audio signal manipulation |
| US10334387B2 (en) * | 2015-06-25 | 2019-06-25 | Dolby Laboratories Licensing Corporation | Audio panning transformation system and method |
| US10277997B2 (en) * | 2015-08-07 | 2019-04-30 | Dolby Laboratories Licensing Corporation | Processing object-based audio signals |
| WO2017085562A2 (en) * | 2015-11-20 | 2017-05-26 | Dolby International Ab | Improved rendering of immersive audio content |
| GB2546504B (en) * | 2016-01-19 | 2020-03-25 | Facebook Inc | Audio system and method |
| CN105898668A (zh) * | 2016-03-18 | 2016-08-24 | 南京青衿信息科技有限公司 | 一种声场空间的坐标定义方法 |
| US9949052B2 (en) * | 2016-03-22 | 2018-04-17 | Dolby Laboratories Licensing Corporation | Adaptive panner of audio objects |
-
2018
- 2018-08-08 WO PCT/EP2018/025211 patent/WO2019149337A1/en not_active Ceased
-
2019
- 2019-01-29 RU RU2020128321A patent/RU2751129C1/ru active
- 2019-01-29 JP JP2020541721A patent/JP7034309B2/ja active Active
- 2019-01-29 MY MYPI2020003940A patent/MY205739A/en unknown
- 2019-01-29 TW TW108103342A patent/TWI716810B/zh active
- 2019-01-29 WO PCT/EP2019/052156 patent/WO2019149710A1/en not_active Ceased
- 2019-01-29 SG SG11202007293UA patent/SG11202007293UA/en unknown
- 2019-01-29 ES ES19701383T patent/ES2962111T3/es active Active
- 2019-01-29 CA CA3090026A patent/CA3090026C/en active Active
- 2019-01-29 AU AU2019214298A patent/AU2019214298C1/en active Active
- 2019-01-29 CN CN201980024318.4A patent/CN112154676B/zh active Active
- 2019-01-29 MX MX2020007998A patent/MX2020007998A/es unknown
- 2019-01-29 KR KR1020207025026A patent/KR102412012B1/ko active Active
- 2019-01-29 EP EP19701383.2A patent/EP3747204B1/en active Active
- 2019-01-30 AR ARP190100210A patent/AR114348A1/es active IP Right Grant
-
2020
- 2020-07-30 US US16/943,778 patent/US11653162B2/en active Active
-
2022
- 2022-09-29 AR ARP220102631A patent/AR127189A2/es unknown
Also Published As
| Publication number | Publication date |
|---|---|
| KR102412012B1 (ko) | 2022-06-22 |
| EP3747204B1 (en) | 2023-09-27 |
| CA3090026A1 (en) | 2019-08-08 |
| CA3090026C (en) | 2023-03-21 |
| JP7034309B2 (ja) | 2022-03-11 |
| KR20200139670A (ko) | 2020-12-14 |
| WO2019149710A1 (en) | 2019-08-08 |
| BR112020015417A2 (pt) | 2020-12-08 |
| JP2021513775A (ja) | 2021-05-27 |
| AU2019214298B2 (en) | 2022-04-07 |
| EP3747204C0 (en) | 2023-09-27 |
| RU2751129C1 (ru) | 2021-07-08 |
| AR114348A1 (es) | 2020-08-26 |
| TW201937944A (zh) | 2019-09-16 |
| AR127189A2 (es) | 2023-12-27 |
| AU2019214298A1 (en) | 2020-09-17 |
| WO2019149337A1 (en) | 2019-08-08 |
| US20200359149A1 (en) | 2020-11-12 |
| CN112154676B (zh) | 2022-05-17 |
| TWI716810B (zh) | 2021-01-21 |
| AU2019214298C1 (en) | 2023-07-20 |
| EP3747204A1 (en) | 2020-12-09 |
| SG11202007293UA (en) | 2020-08-28 |
| US11653162B2 (en) | 2023-05-16 |
| MY205739A (en) | 2024-11-11 |
| MX2020007998A (es) | 2020-09-21 |
| CN112154676A (zh) | 2020-12-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2953685T3 (es) | Aparato y procedimiento para el remapeo de objetos de audio relacionado con la pantalla | |
| US11882426B2 (en) | Methods, apparatus and systems for three degrees of freedom (3DoF+) extension of MPEG-H 3D audio | |
| ES2659179T3 (es) | Ajuste por segmentos de señal de audio espacial a diferente configuración de altavoces de reproducción | |
| ES3058491T3 (en) | Apparatus and method for object-based spatial audio-mastering | |
| ES2773293T3 (es) | Aparato y método para la renderización de audio empleando una definición de distancia geométrica | |
| EP3909264B1 (en) | Spatially-bounded audio elements with interior and exterior representations | |
| WO2019040827A1 (en) | QUICK AND EFFICIENT ENCODING OF MEMORY OF SOUND OBJECTS USING SPHERICAL HARMONIC SYMMETRIES | |
| ES2975074T3 (es) | Aparato y procedimiento para generar una pluralidad de canales de audio | |
| ES2962111T3 (es) | Aparatos para convertir una posición de objeto de un objeto de audio, proveedor de corriente de audio, sistema de producción de contenido de audio, aparato de reproducción de audio, métodos y programas informáticos | |
| BRPI0316548B1 (pt) | método para descrição de composição de sinais de áudio | |
| ES2913426T3 (es) | Reproducción de sonido espacial usando sistemas de altavoz de múltiples canales | |
| US11375332B2 (en) | Methods, apparatus and systems for three degrees of freedom (3DoF+) extension of MPEG-H 3D audio | |
| ES2964178T3 (es) | Renderización de sonido espacial | |
| BR112020015417B1 (pt) | Aparelhos para converter uma posição de objeto de um objeto de áudio, fornecedor de transmissão contínua de áudio, sistema de produção de conteúdo de áudio, aparelho de reprodução de áudio e métodos | |
| US20250247660A1 (en) | Ambisonic Decoder Filters |