ES2628153T3

ES2628153T3 - Procedimiento y aparato para una reproducción de audio normalizada de un contenido multimedia con y sin metadatos incorporados de volumen sonoro en nuevos dispositivos multimedia

Info

Publication number: ES2628153T3
Application number: ES14701394.0T
Authority: ES
Inventors: Robert Bleidt
Original assignee: Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date: 2013-01-28
Filing date: 2014-01-27
Publication date: 2017-08-01
Anticipated expiration: 2034-01-27
Also published as: EP2948947B1; JP2016509693A; BR112015017295A2; BR122022020326A8; CA2898567A1; US9576585B2; CN105190750B; BR122022020284A8; KR101849612B1; BR122022020326B1; CA2898567C; AR096574A1; BR122022020284B1; WO2014114781A1; BR122022020326A2; TWI524330B; BR122022020319B1; CN110853660B; TW201438003A; BR122022020319A2

Abstract

Dispositivo decodificador para decodificar un flujo de bits (1) a fin de producir a partir de este último una señal de salida de audio (42), el flujo de bits (1) comprende datos de audio (2) y, opcionalmente, metadatos de volumen sonoro (3) que contienen un valor de volumen sonoro de referencia (4), el dispositivo decodificador (41) comprende: un dispositivo decodificador de audio (9) configurado para reconstruir una señal de audio (8) a partir de los datos de audio (2); y un procesador de señal (27) configurado para producir la señal de salida de audio (42) basándose en la señal de audio (8); en el que el procesador de señal (27) comprende un dispositivo de control de ganancia (10, 15, 28) configurado para ajustar un nivel de volumen sonoro de la señal de salida de audio (42); en el que el dispositivo de control de ganancia (10, 15, 28) comprende un decodificador de volumen sonoro de referencia (10) configurado para crear un valor de volumen sonoro (37), en el que el valor de volumen sonoro (37) es el valor de volumen sonoro de referencia (4) en caso de que el valor de volumen sonoro de referencia (4) esté presente en el flujo de bits (1); en el que el dispositivo de control de ganancia (10, 15, 28) comprende una calculadora de ganancia (28) configurada para calcular un valor de ganancia (33) basándose en el valor de volumen sonoro (37) y basándose en un valor de control de volumen (20), que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de volumen (20); en el que el dispositivo de control de ganancia (10, 15, 28) comprende un procesador de volumen sonoro (15) configurado para controlar el nivel de volumen sonoro de la señal de salida de audio (42) basándose en el valor de ganancia (33).

Description

DESCRIPCION

Procedimiento y aparato para una reproduccion de audio normalizada de un contenido multimedia con y sin metadatos incorporados de volumen sonoro en nuevos dispositivos multimedia 5

ANTECEDENTES DE LA INVENCION

[0001] La invencion se refiere al control del volumen sonoro de audio, video y contenido multimedia reproducido de forma digital en dispositivos de reproduccion electronica, especlficamente, pero no exclusivamente,

10 al control del volumen sonoro de reproduccion con el contenido que se prepara con y sin los metadatos incorporados de volumen sonoro como ocurre comunmente en nuevos dispositivos multimedia.

[0002] En la produccion y transmision de musica, video y otros contenidos multimedia, el procedimiento de normalizacion de volumen sonoro se lleva a cabo para asegurar que el consumidor escuche la senal de audio con

15 un volumen sonoro apropiado entre cancion y cancion o programa y programa. Desde los comienzos de la grabacion y la realization de pellculas, esto se ha efectuado durante el procedimiento de produccion o por normas de reproduccion para teatros. La practica comun hoy en dla en las industrias de la transmision de musica y radio es ajustar el volumen sonoro a un valor proximo al nivel cresta maximo del medio, mientras que la practica en las industrias cinematografica y televisiva es utilizar uno de los varios niveles de volumen sonoro convencionales que 20 pueden estar entre 20 a 31 dB por debajo del nivel cresta maximo. En la era antes de la convergencia de medios, esto paso desapercibido por los consumidores como dispositivos independientes o se utilizaron configuraciones de volumen para la reproduccion de cada tipo de contenido.

[0003] Con la llegada de los dispositivos moviles, tales como telefonos moviles o reproductores multimedia 25 portatiles que tienen por objeto la reproduccion tanto de contenido de musica como cinematografico, esta diferencia

en las practicas de produccion conduce a diferencias en el volumen sonoro que pueden ser de hasta 30 dB, si el contenido se transmite al dispositivo sin modification. Esto puede conducir a pellculas que se oyen demasiado bajo, o a la musica que esta demasiado alta, cuando se cambia de un tipo de contenido a otro.

30 [0004] Una tendencia relacionada es el aumento del volumen sonoro de muchos generos de musica grabada

a traves del uso de una fuerte compresion de rango dinamico, limitation, y distorsion durante la masterizacion de una grabacion. Tal masterizacion se efectua teniendo en cuenta solo los soportes de grabacion sin perdidas, tales como compact discs, aunque la mayorla de la musica que se vende actualmente esta en formatos de datos comprimidos con perdida, tales como MPEG AAC y MP3. El procedimiento de compresion de datos puede introducir 35 cambios en la forma de onda de dominio de tiempo reconstruida en el decodificador durante la reproduccion que causa sobreexcesos en la forma de onda por encima de los llmites a escala completa o valor de cresta maximo de la senal. En un decodificador de punto fijo (o decodificador de coma flotante saturado) que se utiliza normalmente en dispositivos moviles, esto puede conducir a la distorsion del sobreexceso en el llmite a escala completa, causando una distorsion audible adicional en la senal reproducida.

40

[0005] Esta fuerte compresion y distorsion de la musica se efectua en algunos casos para fines artlsticos, pero se efectua mas comunmente como un intento de aumentar el atractivo comercial de una grabacion haciendola que "suene mas fuerte" que otras, o para proporcionar contenido que pueda escucharse en todas las circunstancias de escucha, tales como en aeropuertos o lugares ruidosos, as! como entornos silenciosos.

45

[0006] En las industrias cinematografica y de video, el amplio rango dinamico de audio se utiliza en algunos generos para conseguir el efecto dramatico y crear una experiencia mas atractiva. Cuando se transmite a un consumidor a traves de los codecs Dolby Digital o MPEG-4 AAC, los metadatos de control de rango dinamico de audio se suelen incluir para permitir que el rango dinamico se reduzca opcionalmente en el receptor o reproductor

50 para casos en los que existe un entorno ruidoso o en los que las escenas fuertes serlan demasiado molestas.

[0007] Los metadatos tradicionales incluidos en el contenido en DVD o BluRay codificado con Dolby Digital o transmitido en las senales de TV codificadas con Dolby Digital (normalizados por Advanced Television Systems Committee, Inc. Norma de compresion de audio A/52) o MpEG-4 AaC (normalizados por la norma ISO/IEC 14496-3

55 y ETSI TS 101 154) incluyen los siguientes componentes:

1. Un valor de metadatos unico estatico que indica el volumen sonoro integrado a largo plazo general del programa, denominado nivel de referencia del programa en las normas MPEG.

2. Los valores de metadatos estaticos de ganancias de mezcla descendente utilizados para controlar la mezcla de contenido multicanal para la salida a traves de un dispositivo estereo o monofonico.

3. Dos conjuntos de ganancias de control de rango dinamico o factores de escala, enviados para cada trama de 5 flujo de bits de datos comprimidos para una pluralidad de bandas o regiones de frecuencia en la senal de audio.

Uno se utiliza para la compresion "ligera" en la lengua vernacula de la industria y el otro para la compresion "pesada". El uso de estos valores DRC ligeros y pesados esta normalmente ligado a la operacion a niveles diana de volumen sonoro del decodificador establecidos para los modos de funcionamiento "Modo Llnea" y "Modo RF". Las convenciones de nombres y puntos de funcionamiento de estos modos se establecieron en los primeros dlas 10 de los medios digitales cuando podrla haber sido necesario convertir el audio digital a senales analogicas enviadas a traves de cables de banda base a las llneas de entrada de un dispositivo posterior o transmitidas a traves de un portador RF a un televisor analogico.

[0008] El uso de estos metadatos permite adaptar la reproduccion a un entorno de escucha de una manera 15 no destructiva durante la reproduccion. La misma corriente o archivo puede reproducirse con un conjunto diferente

de metadatos, o sin ningun metadato utilizado, para producir un rango dinamico diferente. A diferencia del uso de un compresor que reside unicamente en el dispositivo de reproduccion, el control de rango dinamico que utiliza metadatos permite que los artistas creativos supervisen y controlen la naturaleza de la compresion durante el procedimiento de produccion, si se desea.

20

[0009] Por desgracia, los metadatos de control de rango dinamico que se implementan comunmente en los codecs con perdida, tales como MPEG AAC o la familia Dolby Digital no pueden comprimir una senal lo suficientemente fuerte como para que se equilibre con el volumen sonoro de la musica contemporanea, puesto que los metadatos afectan a la potencia media de la senal (potencialmente en varias bandas de frecuencia) en una base

25 de trama de compresion de audio, con periodos de trama comunes de 20-40 ms. Este control de ganancia trama a trama no es lo suficientemente rapido para reducir la cresta con respecto a la relacion media de la senal a la de la musica contemporanea altamente procesada.

[0010] La estrategia adoptada por Wolters y col. como se describe en [5] para resolver este problema es 30 emplear un limitador de audio seguido del decodificador en un dispositivo de reproduccion para aumentar el volumen

sonoro promedio. Esto va a resolver el problema de equilibrado de volumen sonoro, por lo que el contenido de musica y cinematografico tienen un volumen sonoro igual, pero tiene varias desventajas. Cuando un consumidor esta reproduciendo contenidos en un entorno silencioso, tal vez con el dispositivo movil conectado a los altavoces en una habitacion silenciosa o utilizando cascos o auriculares con un fuerte aislamiento acustico, el contenido de la 35 pellcula se comprimira indeseablemente con tanta fuerza como la musica. Asimismo, el limitador introduce una carga de trabajo adicional en la UCP o PSD del dispositivo, acortando la vida de la baterla.

[0011] Una estrategia diferente se describe por Camerer y col. en [6], que proponen la codificacion de una medicion del volumen sonoro tal como se describe en la norma ITU BS.1770-2 como metadatos en archivos de

40 musica y la normalizacion de la reproduccion de cada archivo a un nivel diana establecido por el control del volumen del dispositivo. Esto se basa en los sistemas previos de la normalizacion del volumen sonoro en la musica, tales como SoundCheck (
www.apple.com) y ReplayGain (
www.replaygain.org), que han sido caracterlsticas opcionales de algunos reproductores de musica, tales como el iPod. En su estrategia, abogan exigir la normalizacion del volumen sonoro activado de forma predeterminada; no obstante, no especifican lo que sucedera cuando un usuario no 45 permita la normalizacion del volumen sonoro, o mas importante, lo que ocurrira cuando el contenido que no ha sido codificado con metadatos de volumen sonoro se reproduzca. Su hipotesis es que todo el contenido se analizara por el dispositivo de reproduccion o mediante un distribuidor de confianza segura, tal como iTunes antes de la reproduccion. Adicionalmente, no existe ninguna disposition para el ajuste del rango dinamico general del contenido para adaptarlo al entorno de escucha.

50

[0012] Por lo tanto, es objeto de la invention proporcionar una estrategia unificada para el problema de normalizacion del volumen sonoro en la reproduccion del contenido de estilo de pellculas/vldeo, con un rango dinamico potencialmente amplio y posibles metadatos incorporados de volumen sonoro, y contenido de musica o radio/podcast, con un rango dinamico potencial y extremadamente estrecho y fuerte compresion, limitation, y

55 distorsion, potencialmente, pero probablemente no contiene metadatos incorporados de volumen sonoro, debido a la gran cantidad de contenido de musica que ya poseen o intercambian los consumidores.

[0013] Otro objeto de esta invencion es permitir que el rango dinamico del contenido que contiene metadatos de control de rango dinamico se ajuste al entorno o gusto de escucha del consumidor.

[0014] Un objeto adicional de esta invencion es prevenir la distorsion potencial en decodificadores de audio

de compresion de datos con perdida, tal como un decodificador AAC, MP3, o Dolby Digital, causada por los cambios en los componentes de senal introducidos por el procedimiento de compresion de datos.

5 [0015] Un objeto adicional de esta invencion es proporcionar un incentivo leve a la industria de grabacion de

musica para que abandone la busqueda de una compresion de rango dinamico, limitacion, y distorsion cada vez mas fuerte en su contenido.

[0016] Otro objeto de esta invencion es limitar la carga de trabajo adicional en la UCP del dispositivo o PDS 10 causada por el procesamiento de volumen sonoro o la prevencion de distorsion.

[0017] Una realizacion de la invencion incluye un dispositivo decodificador para decodificar un flujo de bits para que se produzca una senal de salida de audio, el flujo de bits comprende los datos de audio y metadatos de volumen sonoro que contienen opcionalmente un valor de volumen sonoro de referencia, el dispositivo decodificador

15 comprende:

un dispositivo decodificador de audio configurado para reconstruir una senal de audio a partir de los datos de audio; y

20 un procesador de senal configurado para producir la senal de salida de audio basandose en la senal de audio;

en el que el procesador de senal comprende un dispositivo de control de ganancia configurado para ajustar un nivel de la senal de salida de audio;

25 en el que el dispositivo de control de ganancia comprende un decodificador de volumen sonoro de referencia configurado para crear un valor de volumen sonoro, en el que el valor de volumen sonoro es el valor de volumen sonoro de referencia en caso de que el valor de volumen sonoro de referencia este presente en el flujo de bits;

en el que el dispositivo de control de ganancia comprende una calculadora de ganancia configurada para calcular 30 un valor de ganancia basandose en el valor de volumen sonoro y basandose en un valor de control de volumen, que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de volumen;

en el que el dispositivo de control de ganancia comprende un procesador de volumen sonoro configurado para controlar el volumen sonoro de la senal de salida de audio basandose en el valor de ganancia.

35

[0018] El dispositivo decodificador de audio puede ser cualquier dispositivo que sea capaz de reconstruir una senal de audio a partir de los datos de audio del flujo de bits comprimido. El procesador de senal puede ser cualquier dispositivo que sea capaz de producir la senal de salida de audio cuando la senal de audio del dispositivo decodificador de audio se establece en ello y que tiene un dispositivo de control de ganancia que se explica a

40 continuacion. El dispositivo de control de ganancia es un dispositivo que se configura para controlar el volumen sonoro de la senal de salida de audio.

[0019] El decodificador de volumen sonoro de referencia se configura para decodificar los metadatos de volumen sonoro contenidos en el flujo de bits. Si los metadatos de volumen sonoro contienen un valor de volumen

45 sonoro de referencia, el decodificador de volumen sonoro de referencia produce solamente este valor de volumen sonoro de referencia como valor de volumen sonoro.

[0020] La calculadora de ganancia es un dispositivo para calcular un valor de ganancia que se basa en el valor de volumen sonoro producido por el decodificador de volumen sonoro de referencia y un valor de control de

50 volumen establecido por un usuario del dispositivo decodificador. Para establecer el valor de control de volumen puede utilizarse cualquier interfaz de usuario. La calculadora de ganancia puede ser en particular un restador.

[0021] El procesador de volumen sonoro es capaz de controlar el nivel de volumen sonoro de la senal de salida de audio basandose en el valor de ganancia proporcionado por la calculadora de ganancia. El procesador de

55 volumen sonoro puede ser en particular un multiplicador.

[0022] A diferencia de un dispositivo decodificador comprimido tradicional, tal como un dispositivo descodificador Dolby Digital o AAC, utilizado en dispositivos portatiles o en equipos electronicos de consumo, un dispositivo decodificador comprimido funciona con un valor de ganancia variable o un valor de umbral diana del

decodificador (correspondiente al nivel decodificado de un flujo de bits a escala completa) que se controla por el control de volumen del usuario. Esto permite al dispositivo decodificador funcionar normalmente muy por debajo del rango maximo de la escala completa del sistema de audio digital del dispositivo. Tal operacion evita la posibilidad de una distorsion de los sobreexcesos del decodificador y permite la normalizacion de volumen sonoro del contenido de 5 estilo cinematografico sin compresion pesada de rango dinamico y limitacion a la del contenido musical con la compresion pesada y limitacion, sin compresion adicional o limitacion del contenido de estilo cinematografico, como se requiere normalmente. La invencion realiza esta normalizacion sin reducir el rango dinamico de contenido con el unico fin de equilibrado de volumen sonoro.

10 [0023] En una realizacion preferida de la invencion, el valor de volumen sonoro es un valor de volumen

sonoro preestablecido en caso de que el valor de volumen sonoro de referencia no este presente en el flujo de bits. Estas caracterlsticas permiten una reproduccion de alta calidad de los flujos de bits que no tienen metadatos de volumen sonoro.

15 [0024] En una realizacion preferida de la invencion, el valor de volumen sonoro preestablecido se establece

en un valor comprendido entre -4 dB y -10 dB, en particular entre -6 dB y -8 dB, con referencia a una amplitud a escala completa. Los estudios emplricos de musica contemporanea muestran que el llmite superior de volumen sonoro observado de contenido musical que tiene por objeto la reproduccion a escala completa es de aproximadamente -7 dB. Por tanto, los valores de volumen sonoro preestablecidos, como se reivindica, proporcionan

20 un modo optimizado para la reproduccion de flujos de bits que no tienen metadatos de volumen sonoro.

[0025] En una realizacion preferida de la invencion, el procesador de senal comprende un dispositivo de

control de rango dinamico configurado para ajustar un rango dinamico de la senal de salida de audio,

en el que el dispositivo de control de rango dinamico comprende un conmutador de control de rango dinamico

25 configurado para derivar al menos un valor de control de rango dinamico de los metadatos de volumen sonoro y para producir alternativamente uno de los valores de control de rango dinamico derivado o un valor de control de rango dinamico preestablecido,

en el que el dispositivo de control de rango dinamico comprende una calculadora de rango dinamico configurada para calcular un valor de rango dinamico basandose en el valor de control de rango dinamico producido por el

30 conmutador de control de rango dinamico y basandose en un valor de control de compresion, que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de compresion; en el que el dispositivo de control de rango dinamico comprende un procesador de rango dinamico configurado para controlar el rango dinamico de la senal de salida de audio basandose en el valor de rango dinamico.

35 [0026] El dispositivo de control de rango dinamico comprende un conmutador de control de rango dinamico

que se configura para decodificar los metadatos de volumen sonoro del flujo de bits de manera tal que al menos puede derivarse un valor de control de rango dinamico. Normalmente, el conmutador de control de rango dinamico se configura de manera tal que pueden derivarse un valor de control de rango dinamico para el control de rango dinamico ligero y otro valor de control de rango dinamico para el control de rango dinamico pesado. El conmutador

40 de control de rango dinamico puede producir uno de estos valores de control de rango dinamico derivado o un valor de control de rango dinamico preestablecido alternativamente. El conmutador de control de rango dinamico puede controlarse automaticamente, por ejemplo en funcion del equipo posterior utilizando la senal de salida de audio, o manualmente por una accion del usuario. El valor de control de rango dinamico preestablecido puede establecerse por ejemplo a 0 dB.

45

[0027] El dispositivo de control de rango dinamico puede comprender una calculadora de rango dinamico que es capaz de calcular un valor de rango dinamico basandose en el valor de control de rango dinamico producido por el conmutador de control de rango dinamico y basandose en un valor de control de compresion, que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de compresion. La calculadora de

50 rango dinamico puede ser en particular un multiplicador.

[0028] Ademas, se preve que un procesador de rango dinamico es capaz de controlar el rango dinamico de la senal de salida de audio basandose en el valor de rango dinamico. Por estas caracterlsticas, la reproduccion del flujo de bits puede adaptarse a traves del entorno de escucha y/o a los gustos de los oyentes.

55

[0029] Segun la realizacion preferida de la invencion, el procesador de senal comprende un dispositivo limitador configurado para limitar una amplitud de la senal de audio de salida, en el que el dispositivo limitador comprende un componente limitador que tiene un limitador y un componente de control configurado para controlar el componente limitador, en el que la senal de audio procesada, que se deriva a partir de la senal de audio por

procesarse al menos por el dispositivo de control de ganancia, se introduce en el componente limitador, y en el que la senal de audio de salida se produce del componente limitador.

[0030] El dispositivo limitador proporciona una limitacion para el fin de la prevencion de la distorsion del 5 sobreexceso del decodificador, la limitacion del volumen para la prevencion de la perdida de la capacidad auditiva o

la preferencia del usuario, y la compresion artlstica para permitir la generacion reversible del contenido con una limitacion de cresta cuando sea necesario debido al entorno de escucha o al gusto del usuario.

[0031] Segun una realizacion preferida de la invencion, el componente de control se configura para controlar 10 el componente limitador en funcion de una velocidad binaria del flujo de bits. La probabilidad de la distorsion del

sobreexceso del decodificador aumenta cuando se disminuye la velocidad binaria. Por lo tanto, la prevencion de la distorsion del sobreexceso del decodificador se potencia cuando el componente limitador se controla en funcion de la velocidad binaria del flujo de bits.

15 [0032] Segun una realizacion preferida de la invencion, el componente de control se configura para controlar

el componente limitador en funcion de un rendimiento de compresion del dispositivo decodificador de audio. El rendimiento de compresion de un dispositivo codificador de audio que produce el flujo de bits y al mismo tiempo de la descodificacion del dispositivo decodificador de audio, el flujo de bits describe la cantidad de datos que se reduce cuando se codifican los datos de audio originales con el fin de producir el flujo de bits. Cuanto mas se reduzca la 20 cantidad de datos, la probabilidad de distorsion del sobreexceso del decodificador aumenta. Por tanto, la prevencion de la distorsion del sobreexceso del decodificador se potencia cuando el componente limitador se controla en funcion del rendimiento de compresion del dispositivo decodificador de audio.

[0033] Segun una realizacion preferida de la invencion, el componente de control se configura para controlar

25 el componente limitador en funcion de un valor verdadero de cresta transmitido en los metadatos de volumen sonoro del flujo de bits e indica un nivel maximo de cresta de una fuente de audio convertida al flujo de bits por un codificador externo. El uso de este valor verdadero de cresta permite el computo de un valor mas exacto para el nivel maximo de cresta posible de la senal de salida de audio.

30 [0034] Segun una realizacion preferida de la invencion, el componente de control se configura para controlar

el componente limitador en funcion del valor de ganancia del dispositivo de control de ganancia. El nivel maximo de cresta posible de la senal de salida de audio se determina en este subcaso por el valor de ganancia del dispositivo de control de ganancia. Si dicho valor es 0 dB, el dispositivo decodificador esta funcionando en sus llmites a escala completa conforme lo ordenado por la configuracion maxima del valor de control de volumen. Como se reduce dicho 35 valor de control de volumen, el dispositivo decodificador funcionara de manera tal que los valores de flujo de bits a gran escala solo alcanzan el nivel maximo establecido por el valor de ganancia del dispositivo de control de ganancia.

[0035] Segun una realizacion preferida de la invencion, el componente de control se configura para controlar 40 el componente limitador en funcion de un valor llmite de volumen establecido por el usuario o el fabricante con el fin

de evitar danos en la capacidad auditiva. Por estas caracterlsticas, los danos en la capacidad auditiva pueden evitarse de manera eficiente.

[0036] Segun una realizacion preferida de la invencion, el componente de control se configura para controlar 45 el componente limitador en funcion de parametros de limitador artlstico transmitidos en los metadatos de volumen

sonoro del flujo de bits e indicando valores de umbral de limitador artlstico, valores de tiempo de ataque de limitador artlstico y/o valores de tiempo de liberacion de limitador artlstico. Estas caracterlsticas permiten que el funcionamiento del dispositivo limitador este bajo el control creativo del artista o del creador de contenido. Los valores de control de rango dinamico contenidos en los metadatos de volumen sonoro discutidos previamente 50 permiten que el rango dinamico general del contenido se adapte al entorno de escucha a traves del uso de ganancias de compresion que actuan con constantes temporales tlpicas de 100 ms a 3 segundos. En entornos de escucha desafiantes, la compresion de la senal de audio con estas constantes temporales no puede producir una senal con volumen sonoro suficiente para la inteligibilidad o disfrute sin niveles de cresta desagradablemente altos. Tambien existe la posibilidad de que los creadores de musica, que han producido tradicionalmente solo una mezcla 55 altamente "aplastada" comprimida, puedan desear utilizar la flexibilidad de esta invencion para producir tanto una mezcla "aplastada" como una mezcla "sin aplastar" con menos limitacion y compresion, de modo que los consumidores puedan escuchar la version "sin aplastar" en entornos silenciosos o cuando se desee.

[0037] Segun una realizacion preferida de la invencion, el componente de control se configura para controlar

el componente limitador de forma continua o repetida. Estas caracterlsticas permiten la variable controlada del componente limitador con el tiempo. Segun la realizacion preferida de la invencion, el dispositivo limitador se configura para derivar el limitador por medio de un dispositivo de derivacion que tiene una funcion de transferencia que es, en relacion con una ganancia y un retardo, similar a una funcion de transferencia del limitador. Por estas 5 caracterlsticas, la carga de trabajo del procesador de senal puede reducirse significativamente.

[0038] Una realizacion de la invencion incluye un sistema que comprende un decodificador y un codificador,

en el que el decodificador se disena como se reivindica.

10 [0039] Una realizacion de la invencion incluye un procedimiento de decodificacion de un flujo de bits para

producir a partir de este ultimo una senal de salida de audio, el flujo de bits comprende los datos de audio y los metadatos de volumen sonoro que contienen opcionalmente un valor de volumen sonoro de referencia, el procedimiento comprende las etapas de:

15 reconstruction de una senal de audio de los datos de audio utilizando un dispositivo decodificador de audio; y

production de la senal de salida de audio basandose en la senal de audio utilizando un procesador de senal;

en el que un nivel de volumen sonoro de la senal de salida de audio se ajusta utilizando un dispositivo de control 20 de ganancia comprendido en el procesador de senal;

en el que un valor de volumen sonoro se crea por un decodificador de volumen sonoro de referencia comprendido en el dispositivo de control de ganancia, en el que el valor de volumen sonoro es el valor de volumen sonoro de referencia en el caso que el valor de volumen sonoro de referencia este presente en el flujo 25 de bits;

en el que un valor de ganancia se calcula basandose en el valor de volumen sonoro y basandose en un valor de control de volumen, que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de volumen, por una calculadora de ganancia comprendida en el dispositivo de control de ganancia;

30

en el que el nivel de volumen sonoro de la senal de salida de audio se controla basandose en el valor de ganancia por un procesador de volumen sonoro comprendido en el dispositivo de control de ganancia.

[0040] Una realizacion de la invencion incluye un programa informatico adaptado para realizar, cuando se 35 ejecuta en un ordenador o un procesador, el procedimiento como se reivindica en esta invencion.

[0041] Las realizaciones preferidas de la invencion se discuten posteriormente con respecto a los dibujos adjuntos, en los que:

40 La Figura 1 muestra un diagrama de bloques de un decodificador de audio de datos comprimidos de la tecnica anterior existente con el soporte de metadatos de volumen sonoro, tal como se especifica por la norma ISO/IEC 14496-3 y ETSI TS 101 154, como parte integrante en un telefono movil, tablet, o reproductor multimedia portatil tlpicos;

La Figura 2 muestra una realizacion de un decodificador con un dispositivo decodificador de audio de datos 45 comprimidos y un limitador de audio opcional segun la invencion, que es adecuado para la integration en un telefono movil, tablet, o un reproductor multimedia portatil tlpicos;

La Figura 3 muestra una funcion derivada emplricamente de la posible distorsion adicional debido al sobreexceso de la forma de onda de la senal reconstruida en un decodificador estereo AAC-LC frente a la velocidad binaria de flujo de bits;

50 La Figura 4 muestra un diagrama de bloques de una realizacion preferida del dispositivo limitador opcional segun la invencion; y

La Figura 5 muestra un diagrama de bloques de una realizacion preferida del dispositivo limitador opcional que funciona en un modo de limitation artlstica segun la invencion.

55 [0042] Como ayuda para comprender el funcionamiento de la invencion, el funcionamiento de un dispositivo

decodificador de datos comprimidos que permiten metadatos de la tecnica anterior existente 21, tal como se especifica por la norma ISO/IEC 14496-3 y ETSI TS 101 154 [2], como parte integrante en un telefono movil, tablet o reproductor multimedia portatil tlpicos, se presenta en la Fig. 1. Un flujo de bits de audio comprimido 1 puede incluir tanto los datos de esencia de audio comprimidos 2 y los metadatos de volumen sonoro 3. El dispositivo

decodificador 21 comprende un dispositivo decodificador de audio 9 configurado para reconstruir una senal de audio 8 a partir de los datos de audio 2; y un procesador de senal 26 configurado para generar la senal de salida de audio 18 basandose en la senal de audio 8. Los metadatos de volumen sonoro 3 incluyen un valor de volumen sonoro de referencia 4 para el volumen sonoro integrado general de todo el archivo, programa, cancion o album, conocido 5 como el nivel de referencia del programa en la norma ISO/IEC 14496-3. Este valor de volumen sonoro de referencia 4 puede transmitirse en el flujo de bits 1 uno por archivo o con una frecuencia de repeticion suficiente como para permitir que un flujo de bits de transmision 1 se una, mientras que el programa esta en marcha. Este valor de volumen sonoro de referencia 4 se compara con un valor de nivel diana del decodificador fijo, que se proporciona por un proveedor de nivel diana estatico 17, por la calculadora de ganancia 16, que se designa como restador 16. La 10 salida de la calculadora de ganancia 16 es la diferencia de volumen sonoro entre el flujo de bits entrante 1 y el nivel diana deseado. Esto se aplica al procesador de volumen sonoro 15, que se disena como un multiplicador 15, para ajustar el nivel de la senal de salida de audio 18 de modo que se alcance el volumen sonoro diana a largo plazo para la cancion o programa. El conmutador de control de rango dinamico 12 permite la aplicacion de cualquiera de los valores de control de rango dinamico ligero 6, como se utiliza normalmente en el "Modo Line" o valores de control de 15 rango dinamico pesado 7, como se utiliza normalmente en el "Modo RF", o ninguno en absoluto. Estos valores 6, 7 se envlan a cada trama de flujo de bits de datos comprimidos para una pluralidad de bandas de frecuencia o regiones en el flujo de bits 1 y se aplican a un procesador de rango dinamico 13, que se disena como un multiplicador 13, para cambiar el nivel de salida del dispositivo decodificador de audio 9 de modo que el volumen sonoro a corto plazo (del orden de segundos) de la senal de salida de audio 18 se comprima segun el rango 20 dinamico deseado. Normalmente, el nivel diana del decodificador proporcionado por el proveedor del mensaje diana estatico 17 tambien se ajusta con la seleccion de 12 a -20 dB para el Modo RF y -31 dB para el Modo Llnea. El funcionamiento de los valores de control de rango dinamico 6 y/o 7 se pre-computan habitualmente de modo que cualquier aumento en el nivel creado por el funcionamiento del multiplicador 16 en combinacion con el multiplicador 13 se controle de manera tal que se impida la distorsion en la senal de salida de audio 18.

25

[0043] Los metadatos 3 contienen tambien valores de ganancia de mezcla descendente 5 que se utilizan para ajustar la mezcla de los canales de contenido multicanal (tal como un programa de sonido envolvente del canal 5.1) en una salida estereo o mono cuando sea necesario. Como la invention puede aplicarse al flujo de bits 1 que contiene cualquier numero de canales, esta caracterlstica no se discute mas.

30

[0044] De manera importante, si no hay valor de volumen sonoro de referencia 4 presente en un flujo de bits dado 1, el valor de volumen sonoro 31 producido por el decodificador de volumen sonoro de referencia 10 se establece igual al nivel diana del decodificador producido por el proveedor de nivel diana estatico 17 de modo que no hay ajuste de ganancia de la senal de salida de audio 18, y el dispositivo decodificador 21 funciona como un

35 dispositivo decodificador simple con su rango de salida igual al rango dinamico a gran escala de la senal de salida de audio 18.

[0045] La salida del decodificador de audio 21 se suministra entonces normalmente a un mezclador de audio del sistema 23 en el que la senal de salida de audio 18 se combina con los sonidos de interfaz de usuario (sonidos

40 de lU), tonos de llamada u otras senales de audio 22 de modo que se crea una senal de audio mixta 19. El volumen general se controla por el valor de control de volumen 20. El funcionamiento del mezclador de senal de audio 23 puede incluir controles secundarios de volumen para ajustar los niveles relativos de cada tipo de senal de audio o para cambiar su amplitud en funcion del modo de funcionamiento del dispositivo, que no son pertinentes para la comprension del funcionamiento de la invencion. Lo que es importante es que la senal de salida de audio 18 del 45 dispositivo decodificador 21 este normalmente reducida a una escala comun de modo que una senal de salida a escala completa corresponde a un valor de coma flotante a escala completa nominal o de punto fijo maximo (normalmente en el margen -1,0 a 1,0). Con los datos de audio altamente comprimidos, como es tlpico de la musica contemporanea, la senal de salida del decodificador 18 tendra crestas que se aproximan a sus valores de escala completa cuando se escucha a niveles de escucha nominales. De este modo, 0 dB FS (con referencia a la amplitud 50 a escala completa de la senal de salida de audio), una cresta a escala completa en la senal de salida de audio 18 se atenuara en el mezclador de audio del sistema 23 y se corresponde con un nivel de presion de sonido (NPS) en los oldos del oyente a quizas 75 dB NPS cuando se escucha en un entorno silencioso.

[0046] La Fig. 2 representa un dispositivo decodificador 41 para la decodificacion de un flujo de bits 1 de 55 modo que se produce a partir de este ultimo una senal de salida de audio 42, el flujo de bits 1 comprende datos de

audio 2 y opcionalmente metadatos de volumen sonoro 3 que contienen un valor de volumen sonoro de referencia 4, el dispositivo de descodificacion 41 comprende:

un dispositivo decodificador de audio 9 configurado para reconstruir una senal de audio 8 a partir de los datos de

audio 2; y

un procesador de senal 27 configurado para producir la senal de salida de audio 42 basandose en la senal de audio 8;

en el que el procesador de senal 27 comprende un dispositivo de control de ganancia 10, 15, 28 configurado para ajustar un nivel de la senal de salida de audio 42;

en el que el dispositivo 10, 15, 28 comprende un decodificador de volumen sonoro de referencia 10 configurado 10 para crear un valor de volumen sonoro 37, en el que el valor de volumen sonoro 37 es el valor de volumen sonoro de referencia 4 en caso de que el valor de volumen sonoro de referencia 4 este presente en el flujo de bits 1;

en el que el dispositivo de control de ganancia; 10, 15, 28 comprende una calculadora de ganancia 28 15 configurada para calcular un valor de ganancia 33 basandose en el valor de volumen sonoro 37 y basandose en un valor de control de volumen 20, que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de volumen 20;

en el que el dispositivo de control de ganancia 10, 15, 28 comprende un procesador de volumen sonoro 28 20 configurado para controlar el volumen sonoro de la senal de salida de audio 42 basandose en el valor de ganancia 33.

[0047] El dispositivo decodificador de audio 9 puede ser cualquier dispositivo 9 que sea capaz de reconstruir

una senal de audio 8 a partir de los datos de audio 2 del flujo de bits comprimido 1. El procesador de senal 37 puede 25 ser cualquier dispositivo 37 que sea capaz de producir la senal de salida de audio 42 cuando se alimente en este la senal de audio 8 del dispositivo decodificador de audio 9 y que tenga un dispositivo de control de ganancia 10, 15, 28 como se explica mas adelante. El dispositivo de control de ganancia 10, 15, 28 es un dispositivo que se configura para controlar el volumen sonoro de la senal de salida de audio 42.

30 [0048] El decodificador de volumen sonoro de referencia 10 se configura para decodificar los metadatos de

volumen sonoro 3 contenidos en el flujo de bits 1. Si los metadatos de volumen sonoro 3 contienen un valor de volumen sonoro de referencia 4, el decodificador de volumen sonoro de referencia 10 produce solo este valor de volumen sonoro de referencia 4 como un valor de volumen sonoro 37.

35 [0049] La calculadora de ganancia 28 es un dispositivo para calcular un valor de ganancia 33 que se basa en

el valor de volumen sonoro 37 producido por el decodificador de volumen sonoro de referencia 10 y un valor de control de volumen 20 establecido por un usuario del dispositivo decodificador 41. Para establecer el valor de control de volumen 20 puede utilizarse cualquier interfaz de usuario. La calculadora de ganancia 28 en particular puede ser un restador 28.

40

[0050] El procesador de volumen sonoro 15 es capaz de controlar el nivel de volumen sonoro de la senal de

salida de audio 42 basandose en el valor de ganancia 33 proporcionado por la calculadora de ganancia 28. El procesador de volumen sonoro 15 puede ser, en particular, un multiplicador 15.

45 [0051] A diferencia de un dispositivo decodificador comprimido tradicional 21, tal como un dispositivo

descodificador Dolby Digital o AAC, utilizado en dispositivos portatiles o en equipos electronicos de consumo, el dispositivo decodificador comprimido 41 funciona con un valor de ganancia variable 33 o un valor de umbral diana del decodificador 33 (correspondiente al nivel decodificado de un flujo de bits a escala completa) que se controla por el control de volumen del usuario. Esto permite que el dispositivo decodificador 41 funcione normalmente muy por 50 debajo del rango maximo a gran escala del sistema de audio digital del dispositivo. Tal operacion evita la posibilidad de distorsion de los sobreexcesos del decodificador y permite la normalizacion de volumen sonoro del contenido de estilo cinematografico sin compresion de rango dinamico pesado y la limitacion a la del contenido musical con compresion pesada y limitacion sin compresion adicional o limitacion del contenido de estilo cinematografico, como normalmente se requiere. La invencion realiza esta normalizacion sin reducir el rango dinamico de contenido con el 55 unico fin de equilibrado de volumen sonoro.

[0052] En una realizacion preferida de la invencion, el valor de volumen sonoro 37 es un valor de volumen

sonoro preestablecido 37 en caso de que el valor de volumen sonoro de referencia 4 no este presente en el flujo de bits 1. Estas caracterlsticas permiten una reproduccion de alta calidad de los flujos de bits 1 que no tienen

metadatos de volumen sonoro 3.

[0053] En una realizacion preferida de la invencion, el valor de volumen sonoro preestablecido 37 se

establece en un valor comprendido entre -4 dB y -10 dB, en particular entre-6 dB y -8 dB, con referencia a una

5 amplitud a escala completa. Los estudios emplricos de musica contemporanea muestran que el llmite superior de volumen sonoro observado de contenido musical que tiene por objeto la reproduccion a escala completa es de aproximadamente -7 dB. Por tanto, los valores de volumen sonoro preestablecido 37, como se reivindica, proporcionan un modo optimizado para la reproduccion de flujos de bits que no tienen metadatos de volumen sonoro adecuado 3.

10

[0054] En una realizacion preferida de la invencion, el procesador de senal 27 comprende un dispositivo de

control de rango dinamico 12, 13, 14 configurado para ajustar un rango dinamico de la senal de salida de audio 42, en el que el dispositivo de control de rango dinamico 12, 13, 14 comprende un conmutador de control de rango dinamico 12 configurado para derivar al menos un valor de control de rango dinamico 6, 7 de los metadatos de

15 volumen sonoro 3 y producir alternativamente uno de los valores de control de rango dinamico derivado 6, 7 o un valor de control de rango dinamico preestablecido 43,

en el que el dispositivo de control de rango dinamico 12, 13, 14 comprende una calculadora de rango dinamico 14 configurada para calcular un valor de rango dinamico 44 basandose en el valor de control de rango dinamico 6, 7, 43 producido por el conmutador de control de rango dinamico 12 y basandose en un valor de control de compresion 25, 20 que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de compresion 25;

en el que el dispositivo de control de rango dinamico 12, 13, 14 comprende un procesador de rango dinamico 13 configurado para controlar el rango dinamico de la senal de salida de audio 42 basandose en el valor de rango dinamico 44.

25

[0055] El dispositivo de control de rango dinamico 12, 13, 14 comprende un conmutador de control de rango dinamico 12 que se configura para decodificar los metadatos de volumen sonoro 3 del flujo de bits 1 de manera tal que al menos se puede derivar un valor de control de rango dinamico 6, 7. Normalmente el conmutador de control de rango dinamico 12 se configura de manera tal que pueden derivarse un valor de control de rango dinamico 6 para el

30 control de rango dinamico ligero y otro valor de control de rango dinamico 7 para el control de rango dinamico pesado. El conmutador de control de rango dinamico 12 puede producir uno de estos valores de control de rango dinamico derivado 6, 7 o un valor de control de rango dinamico preestablecido 43 alternativamente. El conmutador de control de rango dinamico 12 puede controlarse automaticamente, por ejemplo en funcion del equipo posterior utilizando la senal de salida de audio 42, o manualmente por una accion del usuario. El valor de control de rango 35 dinamico preestablecido puede establecerse por ejemplo a 0 dB.

[0056] El dispositivo de control de rango dinamico 12, 13, 14 puede comprender una calculadora de rango dinamico 14 que es capaz de calcular un valor de rango dinamico 44 basandose en el valor de control de rango dinamico 6, 7, 43 producido por el conmutador de control de rango dinamico 12 y basandose en un valor de control

40 de compresion 25, que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de compresion 25. La calculadora de rango dinamico 14 puede ser, en particular, un multiplicador 14.

[0057] Ademas, se preve un procesador de rango dinamico 13, que es capaz de controlar el rango dinamico de la senal de salida de audio 42 basandose en el valor de rango dinamico 44. Mediante estas caracterlsticas, la

45 reproduccion del flujo de bits 1 puede adaptarse a traves del entorno de escucha y/o al gusto de los oyentes.

[0058] La Fig. 2 muestra el funcionamiento de una realizacion preferida de la invencion como se contiene en

un decodificador de audio mejorado 41. El flujo de bits de audio entrante 1 consiste en datos de esencia de audio 2 y metadatos de volumen sonoro opcionales 3 que contienen los valores de metadatos convencionales mencionados

50 anteriormente para el nivel de referencia del programa 4, ganancias de mezcla descendente 5, valores DRC ligeros 6 y valores DRC pesados 7. Los metadatos 3 tambien pueden incluir parametros de limitador artlstico 32 y valores verdaderos de cresta 36 que se utilizan en una realizacion opcional.

[0059] En contraste con el funcionamiento descrito previamente en la Fig. 1, el valor de volumen sonoro 37

55 producido por el decodificador de volumen sonoro de referencia 10 se compara con el valor de control de volumen

20 del control de volumen de modo que el multiplicador 15 se utilice para ajustar la senal de salida de audio 42 del dispositivo decodificador 41 al nivel de escucha deseado. Dicha senal de salida de audio 41 se anade entonces a la senal de audio suplementaria ajustada al volumen sonoro 24 del mezclador de audio del sistema 23 para formar la senal de audio mezclada 29 enviada para las funciones posteriores de post-procesamiento de audio en el dispositivo

o directamente al convertidor digital a analogico (CDA) y a los altavoces, o para una salida digital del dispositivo, tal como se producirla habitualmente cuando el dispositivo esta conectado a otro equipo mediante HDMI, MHL, S/PDIF, AES, TosLink, AirPlay, u otro cable o normas de interfaz inalambrica digital.

5 [0060] De manera importante, la senal de salida de audio 42 en esta invention no funciona normalmente a

valores de escala completa. 0 dB FS de la senal de salida de audio 42 corresponde ahora al nivel maximo posible de presion de sonido con el dispositivo decodificador 41 y, en funcion de los auriculares, altavoces, u otros transductores conectados, quizas en el rango de 110-120 dB de NPS con auriculares tlpicos. Si no hay ningun valor 4 presente en un flujo de bits 1 dado, el valor de volumen sonoro 37 se establece en un nivel de -7 dB FS. Los 10 estudios emplricos de musica contemporanea (tales como en [5]) muestran que este es el llmite superior observado de volumen sonoro para el contenido de musica que tiene por objeto la reproduction a gran escala. Esto proporciona un incentivo leve para creadores y distribuidores de musica para preparar versiones de su contenido sin limitation pesada, compresion, o distorsion para su distribution a dispositivos o a ecosistemas de distribution que utilizan esta invencion, puesto que su contenido se distribuira as! pues con metadatos de volumen sonoro 3 que permitiran que 15 su contenido se reproduzca fuerte o mas fuerte que una version "aplastada" tradicional del contenido.

[0061] Al igual que en el decodificador de la tecnica anterior de la Fig. 1, el conmutador de control de rango

dinamico 12 no permite de nuevo la selection de una modification de rango dinamico, o la aplicacion del valor de control de rango dinamico ligero 6 o el valor de control de rango dinamico pesado 7. Por ejemplo, en un telefono 20 movil, el valor de control de rango dinamico ligero 6 puede aplicarse cuando el telefono esta conectado a un sistema de audio externo a traves de HDMI y el valor de control de rango dinamico pesado 7 puede aplicarse cuando se utiliza el conector para auriculares. Estos valores de control de rango dinamico (o un valor de control de rango dinamico preestablecido estatico 43, que puede establecerse en cero, si no se aplica un control de rango dinamico, se alimenta entonces al multiplicador 14 que se reduce a una escala comun de los valores de control de rango 25 dinamico segun un nuevo valor de control de compresion del usuario 25 que varla en un margen de 0 a 1. El valor de control de compresion 25 permite que los valores de control de rango dinamico 6, 7, 43 se reduzcan a una escala comun de manera tal que una cantidad variable de compresion de rango dinamico puede aplicarse a la senal de salida de audio 42, independiente del nivel de escucha. El valor del valor de control de compresion 25 puede obtenerse a partir de un elemento de control por una interfaz de usuario en el dispositivo decodificador 41, a partir de 30 pre-establecimientos correspondientes a los modos del dispositivo 41 o a su ubicacion o configuration, a partir de las estimaciones de ruido ambiental obtenidas por el dispositivo decodificador 41, a partir de funciones obtenidas emplricamente de la configuracion de volumen general o el nivel de salida, o por otros medios. La salida 44 del multiplicador 14 que contiene los valores de control de rango dinamico reducidos a una escala comun se aplican entonces al multiplicador 13 de manera usual, con el multiplicador 13 modificando el volumen sonoro de la senal de 35 audio 8 del dispositivo decodificador de audio 9 para la modificacion adicional por el multiplicador 15. La senal de audio procesada 35 producida por el multiplicador 15 (o en otras realizaciones producidas por el multiplicador 13) se conecta al dispositivo limitador 30 de una realization opcional explicada a continuation, o directamente utilizada como la senal de salida de audio 42.

40 [0062] Los expertos en la materia entenderan que puede haber una necesidad de un desfase o reduction a

una escala comun del valor de control de volumen 20 en el mezclador de audio del sistema 23 o el restador 28 de modo que el volumen de la senal de audio mezclada 29 siga el volumen sonoro con la senal de audio suplementaria ajustada al volumen sonoro 24.

45 [0063] En estrategias anteriores, para equilibrar el volumen sonoro de los contenidos de varios generos, tales

como en [5], se empleo un limitador en la cadena de senal siguiendo el decodificador de audio nucleo y la aplicacion de metadatos de control de rango dinamico con el fin de limitar las crestas de senal y de este modo aumentar el nivel promedio de la senal sin distorsion. Un limitador de este tipo deberla funcionar de una manera que limite las crestas de senal de una manera "suave" mediante la variation de la ganancia de la senal a medida que la forma de 50 onda de senal se acerca o supera un valor de umbral, en contraposition a un limitador "duro" o recortador que implementa simplemente una saturation matematica a un nivel de umbral para evitar introducir artefactos audibles en la senal. Tales limitadores suaves son computacionalmente caros, consumen potencialmente el 10-30 % de la carga de trabajo incurrida por el dispositivo decodificador.

55 [0064] En cambio, la presente invencion no requiere un limitador para el control de la cresta a la relation

promedia de la senal de salida de audio 42 para el fin del equilibrado de volumen sonoro, pero puede incluir el dispositivo limitador opcional 30 para los fines de la proteccion contra la distorsion, la limitacion para evitar danos en la capacidad auditiva, y para limitar el efecto artlstico o aumentar la compresion. Un dispositivo decodificador particular 41 puede estar equipado con el dispositivo limitador 30 para cualquiera o todos estos fines con costes de

aplicacion variables, o el dispositivo limitador 30 puede simplemente omitirse. Cada uno de estos casos se explica a continuacion.

[0065] Al considerar el caso de la proteccion contra la distorsion, se han de considerar dos subcasos de 5 senales: algunos flujos de bits 1 pueden no contener ningun metadato 3, tal como el contenido de musica tradicional

ya presente en el dispositivo del usuario, que no se ha analizado para el volumen sonoro o rango dinamico. En este subcaso, el multiplicador 13 no esta activo, y el multiplicador 15 proporciona una ganancia maxima de la unidad en la configuracion mayor de control de volumen. De este modo, el unico posible para la distorsion es la posibilidad de sobreexcesos inducidos por compresion de datos en la forma de onda de la senal. La cantidad de sobreexceso

10 potencial posible con senales ordinarias puede determinarse emplricamente para un codec de compresion en un intervalo de confianza como una funcion de los bits por muestra por canal o una metrica similar de relacion de compresion. Una funcion de prediccion de distorsion determinada emplricamente tlpica 56 para flujos de bits de AAC LC estereo se muestra en la Fig. 3. Los expertos en la materia deben entender que otros procedimientos emplricos, anallticos, o iterativos, pueden utilizarse para determinar o predecir la cantidad de distorsion que puede estar

15 presente.

[0066] Segun una realizacion preferida de la invencion mostrada en las Figs. 4 y 5, el procesador de senal 27 comprende un dispositivo limitador 30 configurado para limitar una amplitud de la senal de audio de salida 42, en el que el dispositivo limitador 30 comprende un componente limitador 62 que tiene un limitador 51 y un componente de

20 control 63 configurado para controlar el componente limitador 62, en el que una senal de audio procesada 35 derivada de la senal de audio 8 que se procesa al menos por el dispositivo de control de ganancia 10, 15, 28, se introduce en el componente limitador 62, y en el que la senal de salida de audio 42 se produce del componente limitador 62.

25 [0067] El dispositivo limitador 30 proporciona limitacion para el fin de la prevencion de distorsion del

sobreexceso del decodificador, la limitacion del volumen para la prevencion de la perdida en la capacidad acustica o la preferencia del usuario, y la compresion artlstica para permitir la generacion reversible del contenido con la limitacion de crestas cuando sea necesario debido al entorno de escucha o al gusto del usuario.

30 [0068] El limitador 51 se controla por senales internas o un nivel de cresta suministrado o metadatos

artlsticos, que proporcionan una limitacion para el fin de la prevencion de distorsion del sobreexceso del decodificador, la limitacion del volumen para la prevencion de la perdida en la capacidad acustica o la preferencia del usuario, y la compresion artlstica para permitir la generacion reversible del contenido con la limitacion de crestas cuando sea necesario debido al entorno de escucha o al gusto del usuario.

35

[0069] El limitador 51 es idealmente un limitador de anticipacion sin distorsiones eficiente, tal como se utiliza comunmente en la masterizacion de audio digital y se conoce por los expertos en la materia. Por ejemplo, puede ser una implementation, tal como se describe en [8]. Alternativamente, si la proteccion contra la distorsion no es una caracterlstica deseada, pero la limitacion del volumen lo es, puede sustituirse un recortador duro con umbral

40 establecido por la salida del 58 y la memoria tampon de compensation 53 se elimina o acorta.

[0070] Segun una realizacion preferida de la invencion mostrada en la Fig. 4, el componente de control 63 se configura para controlar el componente limitador 62 en funcion de una velocidad binaria del flujo de bits 1. La probabilidad de la distorsion del sobreexceso del decodificador aumenta cuando disminuye la velocidad binaria. Por

45 lo tanto, la prevencion de la distorsion del sobreexceso del decodificador se potencia cuando el componente limitador 62 se controla en funcion de la velocidad binaria del flujo de bits 1.

[0071] En una realizacion preferida de esta caracterlstica opcional, el valor de velocidad binaria 34 del flujo de bits 1 que se decodifica por el dispositivo decodificador de audio 9 se introduce en un dispositivo de prediccion de

50 distorsion 54, que comprende una funcion de prediccion de distorsion 56 implementada en expresiones o puertas logicas, como una tabla de consulta, o por otras tecnicas de implementacion de una funcion de al menos una variable que se conocera por los expertos en la materia. La salida de la funcion 56 se alimenta a traves de una funcion minima 59, implementada de manera similar, que selecciona la menor de sus dos entradas, al comparador 55. Se considera en este caso que la caracterlstica de llmite de volumen descrita a continuacion no esta activa y el

55 conmutador 58 produce de este modo un valor correspondiente a 0 dB FS (escala completa) cuya funcion minima 59 siempre se controla por la salida de la funcion de prediccion de distorsion 56. De esta manera, el comparador 55 compara la salida de la funcion de proteccion de distorsion 56 al nivel de cresta maximo posible de la senal de audio procesada 35 para determinar si es necesario vincular el limitador 51 a traves del conmutador limitador 52 para protegerse contra las distorsiones en la senal de salida de audio 42.

[0072] Segun una realizacion preferida de la invencion, el componente de control se configura para controlar

el componente limitador 62 en funcion de un rendimiento de compresion del dispositivo decodificador de audio 9. El rendimiento de compresion de un dispositivo codificador de audio que produce el flujo de bits y al mismo tiempo del dispositivo decodificador de audio 9 que decodifica el flujo de bits 1 describe la cantidad de datos que se reduce 5 cuando se codifican los datos de audio originales con el fin de producir el flujo de bits 1. Cuanta mas cantidad de datos se reduzca, la probabilidad de distorsion del sobreexceso del decodificador aumenta. Por tanto, la prevencion de distorsion del sobreexceso del decodificador se potencia cuando el componente limitador 62 se controla en funcion del rendimiento de compresion del dispositivo decodificador de audio 9.

10 [0073] En una realizacion preferida de esta caracterlstica opcional, un rendimiento de compresion del

dispositivo decodificador de audio 9 se introduce en un dispositivo de prediccion de distorsion 54, que comprende una funcion de prediccion de distorsion 56 implementada en expresiones o puertas logicas, como una tabla de consulta, o por otras tecnicas de implementacion de una funcion de al menos una variable que se conocera por los expertos en la materia. La salida de la funcion 56 se alimenta a traves de una funcion minima 59, implementada de 15 manera similar, que selecciona la menor de sus dos entradas, al comparador 55. Se considera en este caso que la caracterlstica de llmite de volumen descrita a continuacion no esta activa y el conmutador 58 produce de este modo un valor correspondiente a 0 dB FS (escala completa) cuya funcion minima 59 siempre se controla por la salida de la funcion de prediccion de distorsion 56. De esta manera, el comparador 55 compara la salida de la funcion de proteccion de distorsion 56 al nivel de cresta maximo posible de la senal de audio procesada 35 para determinar si 20 es necesario vincular el limitador 51 a traves del conmutador limitador 52 para protegerse contra las distorsiones en la senal de salida de audio 42.

[0074] En los casos en los que el nivel maximo de la senal de salida del decodificador de nucleo procesado

35 es menor que el nivel predicho por la funcion de prediccion de distorsion 56, no hay posibilidad de distorsion 25 debido a los sobreexcesos del decodificador (en el intervalo de confianza o cota de error de la funcion 54) y el conmutador 52 selecciona la salida de la memoria tampon de compensacion 53. Dicha memoria tampon es meramente un retraso para equilibrar el retardo de procesamiento del limitador 51, e introducira solamente una carga de trabajo computacional insignificante, en comparacion con la carga de trabajo significante del limitador 51.

30 [0075] Segun una realizacion preferida de la invencion, el componente de control 63 se configura para

controlar el componente limitador 62 en funcion del valor de ganancia 33 del dispositivo de control de ganancia 10, 15, 28. El nivel de cresta maximo posible de la senal de salida de audio 42 se determina en este subcaso por el valor de ganancia 33 del dispositivo de control de ganancia 10, 15, 28. Si dicho valor es 0 dB, el dispositivo decodificador 41 esta funcionando en sus limites a escala completa conforme lo ordenado por la configuration maxima del valor 35 de control de volumen 20. Puesto que dicho valor de control de volumen 20 se reduce, el dispositivo decodificador 41 funcionara de manera tal que los valores de flujo de bits a gran escala solo alcanzan el nivel maximo establecido por el valor de ganancia 33 del dispositivo de control de ganancia 10, 15, 28.

[0076] En este subcaso, en el que no hay metadatos 3 presentes, el conmutador 60 produce un valor 0 dB 40 FS ya que este es el maximo posible en los datos de audio entrantes 2 del flujo de bits 1.

[0077] Segun una realizacion preferida de la invencion, el componente de control 63 se configura para controlar el componente limitador 62 en funcion de un valor verdadero de cresta 36 transmitido en los metadatos de volumen sonoro 3 del flujo de bits 1 y que indica un nivel de cresta maximo de una fuente de audio convertida al flujo

45 de bits 1 por un codificador externo. El uso de este valor verdadero de cresta 36 permite el computo de un valor mas exacto para el nivel de cresta maximo posible de la senal de salida de audio 42.

[0078] En el caso, en que los flujos de bits contengan metadatos de volumen sonoro 3, los metadatos 3 pueden especificarse para incluir tambien la medicion verdadera de cresta especificada por la norma ITU BS.1770-3.

50 En este subcaso, el conmutador 60 selecciona el valor verdadero de cresta 36 contenido en los metadatos de volumen sonoro 3 en lugar de la constante 0 dB FS. La suma del ajuste de ganancia 33 y el valor verdadero de cresta 38, que indica la amplitud maxima de cresta de la entrada de senal 35 al limitador 30, se computa por el sumador 61 y luego se compara con la salida de la funcion de distorsion 56 por el comparador 55. El uso de este valor verdadero de cresta de metadatos 36 permite simplemente el computo de un valor mas exacto para el nivel de 55 cresta maximo posible de la senal de salida de audio 41.

[0079] Segun una realizacion preferida de la invencion, el componente de control 63 se configura para controlar el componente limitador 62 en funcion de un valor limite de volumen 57 establecido por el usuario o el fabricante con el fin de evitar danos en la capacidad auditiva. Por estas caracteristicas, los danos en la capacidad

auditiva pueden evitarse de manera eficiente.

[0080] En el caso de la limitacion para evitar danos en la capacidad auditiva, el usuario o el fabricante del

dispositivo pueden establecer un nivel de cresta maximo 57 en el que la salida ha de limitarse utilizando una senal 5 llmite de volumen. Cuando el conmutador 58 estima activar esta caracterlstica llmite de volumen, la funcion minima 59 selecciona el menor de los dos niveles de salida necesarios para o bien acoplar el limitador 51 para limitar la salida debido a la prevencion de distorsion o para la limitacion del volumen. La salida del conmutador 58 tambien se introduce en el limitador 51 para establecer su umbral al nivel apropiado.

10 [0081] Segun una realizacion preferida de la invencion mostrada en la Fig. 5, el componente de control 63 se

configura para controlar el componente limitador 62 en funcion de los parametros de limitador artlstico 32 transmitidos en los metadatos de volumen sonoro 3 del flujo de bits 1 y que indica valores de umbral de limitador artlstico 74a, valores de tiempo de ataque de limitador artlstico 74b y/o valores de tiempo de liberacion de limitador artistico 74c. Estas caracteristicas permiten que el funcionamiento del dispositivo limitador 30 este bajo el control 15 creativo del artista o creador de contenido. Los valores de control de rango dinamico 6, 7 contenidos en los metadatos de volumen sonoro 3 discutidos previamente permiten el rango dinamico general del contenido que se adapta al entorno de escucha a traves del uso de las ganancias de compresion que actuan con constantes temporales tipicas de 100 ms a 3 segundos. En entornos de escucha desafiantes, la compresion de la senal de audio con estas constantes temporales puede no producir una senal con el volumen sonoro suficiente para la 20 inteligibilidad o disfrute sin niveles de cresta desagradablemente altos. Tambien existe la posibilidad de que los creadores de musica, que han producido tradicionalmente solo una mezcla "aplastada" altamente comprimida, puedan desear utilizar la flexibilidad de esta invencion para producir tanto una mezcla "aplastada" como una mezcla "sin aplastar" con menos limitacion y compresion, de modo que los consumidores puedan escuchar la version "sin aplastar" en entornos silenciosos o cuando se desee. Para abordar estas preocupaciones, el limitador 30 puede 25 reconfigurarse para funcionar en un modo limitador artistico como se muestra en la FIG. 5.

[0082] En este modo, los metadatos de volumen sonoro 3 incluyen parametros de limitador artistico 32 mostrados en la notacion de bus electrico en la Fig. 5, que se envian para cada trama de audio del contenido. Contenidos en 32, se encuentran el tiempo de ataque del limitador, el tiempo de liberacion, y los valores de umbral

30 para los modos ligero y pesado seleccionados por el conmutador 12 y seleccionados por un conmutador acoplado de forma correspondiente 73 a un bus de salida 74. El bus 74 contiene el valor de umbral de limitador artlstico seleccionado 74a, que se anade al ajuste de ganancia del decodificador 33 por el sumador 71, y los tiempos de ataque y liberacion deseados 74b y 74c, que se suministran directamente al limitador 51. La funcion minima 72 se utiliza para seleccionar el llmite de volumen 57 (o 0 dB FS si no se utiliza el llmite de volumen) o la salida del 35 sumador 71. De esta manera, el limitador 51 funciona normalmente a un umbral controlado por el valor 74a hasta que el control de volumen 20 se incremente a un punto en el que se alcanza el llmite de volumen y limita el nivel maximo del umbral del limitador. En este modo, el limitador 51 funciona de forma continua, y el conmutador 52 siempre esta en la posicion mostrada. El uso artistico de estos parametros puede lograrse mediante la supervision de la salida de un dispositivo, un complemento de software de audio, u otro aparato que contiene una copia de la 40 invencion durante la mezcla, masterizacion u otras operaciones creativas o de distribucion.

[0083] Segun una realizacion preferida de la invencion, no hay posibilidad alguna de aplicar la composition de ganancia despues de que el dispositivo limitador 30 aumente artificialmente su volumen sonoro, ya que esto eliminaria el incentivo leve mencionado anteriormente.

45

[0084] Segun una realizacion preferida de la invencion, el componente de control 63 se configura para controlar el componente limitador 62 de forma continua o repetida, estas caracteristicas permiten un control variable del componente limitador 82 con el tiempo.

50 [0085] Segun la realizacion preferida de la invencion, el dispositivo limitador 30 se configura para derivar el

limitador 51 por medio de un dispositivo de derivation 53 que tiene una funcion de transferencia que es, en relation con una ganancia y un retardo, similar a una funcion de transferencia del limitador 51. Por estas caracteristicas, la carga de trabajo del procesador de senal 27 puede reducirse de manera significativa.

55 [0086] Los expertos en la materia entenderan que este procedimiento puede implementarse en un software

como una serie de instrucciones informaticas o en componentes de hardware. Los funcionamientos descritos en este caso se llevan a cabo normalmente como instrucciones de software por una UCP del ordenador o procesador de senal digital y los registradores y operadores mostrados en las figuras pueden implementarse por instrucciones informaticas correspondientes. No obstante, esto no excluye la realizacion de un diseno de hardware equivalente

utilizando componentes de hardware. Asimismo, los expertos en la materia entenderan que los valores 4, 6, 7, 20, 33, 36, 57, 74a, y otros se expresaran normalmente en un dominio en escala logarltmica, como es practica convencional y especificada en las normas de referencia. Ademas, se muestra en este caso el funcionamiento de la invencion de una manera secuencial elemental. Los expertos en la materia entenderan que los funcionamientos 5 pueden combinarse, transformarse, o pre-computarse con el fin de optimizar el rendimiento cuando se implementa en una plataforma de hardware o software particular. Ademas, se entendera que estos funcionamientos pueden llevarse a cabo en los datos de dominio de tiempo o pueden llevarse a cabo en una o mas bandas de frecuencia en el dominio de frecuencia.

10 [0087] En la construccion del dispositivo decodificador mejorado 41, los expertos en la materia reconoceran

que sera necesario el uso de representaciones numericas, longitudes de registro, u otros medios ordinarios para evitar la saturacion interna, distorsion, o exceso en la trayectoria de senal desde el audio decodificador 9 a traves de los multiplicadores 13 y 15, y el dispositivo limitador opcional 30 a la senal de salida de audio 42, as! como en otras partes de la invencion.

15

[0088] Debe entenderse ademas que aunque la invencion ofrece la ventaja especlfica de controlar la distorsion producida por los sobreexcesos del decodificador en codecs de compresion de datos de audio con perdida, tales como AAC, MP3, o Dolby Digital, tambien puede utilizarse en sistemas de audio con codecs de audio sin perdida o con las senales de audio que apenas se comprimen con un codec de audio.

20

[0089] Aunque algunos aspectos se han descrito en el contexto de un aparato, resulta evidente que estos aspectos tambien representan una descripcion del procedimiento correspondiente, en el que un bloque o dispositivo corresponde a una etapa de procedimiento o una caracterlstica de una etapa de procedimiento. De manera semejante, los aspectos descritos en el contexto de una etapa de procedimiento tambien representan una

25 descripcion de un bloque correspondiente o un elemento o caracterlstica de un aparato correspondiente. Algunas o todas las etapas del procedimiento pueden ejecutarse por (o utilizando) un aparato de hardware, como por ejemplo, un microprocesador, un ordenador programable o un circuito electronico. En algunas realizaciones, algunas o mas de las etapas del procedimiento mas importantes pueden ejecutarse por un aparato de este tipo.

30 [0090] Dependiendo de ciertos requisitos de implementacion, las realizaciones de la invencion pueden

implementarse en hardware o en software. La implementacion puede realizarse utilizando un medio de almacenamiento no transitorio, tal como un medio de almacenamiento digital, por ejemplo un disquete, un DVD, un disco Blu-Ray, un CD, una ROM, una PROM, y EPROM, una EEPROM o una memoria FLASH, que tenga senales de control legibles electronicamente almacenadas en el mismo, que coopere (o sea capaces de cooperar) con un 35 sistema informatico programable de manera tal que se realice el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.

[0091] Algunas realizaciones segun la invencion comprenden un soporte de datos que tiene senales de control legibles electronicamente, que son capaces de cooperar con un sistema informatico programable, de modo

40 que se realice uno de los procedimientos descritos en esta invencion.

[0092] Generalmente, las realizaciones de la presente invencion pueden implementarse como un producto de programa informatico con un codigo de programa, el codigo de programa funciona para realizar uno de los procedimientos cuando el producto de programa informatico se ejecuta en un ordenador. El codigo de programa

45 puede ser, por ejemplo, almacenado en un soporte legible por la maquina.

[0093] Otras realizaciones comprenden el programa informatico para realizar uno de los procedimientos descritos en esta invencion, almacenado en un soporte legible por una maquina.

50 [0094] En otras palabras, una realizacion del procedimiento inventivo es, por lo tanto, un programa

informatico que tiene un codigo de programa para realizar uno de los procedimientos descritos en esta invencion, cuando el programa informatico se ejecuta en un ordenador.

[0095] Una realizacion adicional del procedimiento inventivo es, por lo tanto, un portador de datos (o un 55 medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en el mismo, el

programa informatico para realizar uno de los procedimientos descritos en esta invencion. El portador de datos, el medio de almacenamiento digital o el medio de grabado son normalmente tangibles y/o no transitorios.

[0096] Una realizacion adicional del procedimiento inventivo es, por lo tanto, un flujo de datos o una

secuencia de senales que representan el programa informatico para realizar uno de los procedimientos descritos en esta invencion. El flujo de datos o la secuencia de senales puede, por ejemplo, configurarse para transferirse a traves de una conexion de comunicacion de datos, por ejemplo, a traves de Internet.

5 [0097] Una realizacion adicional comprende un medio de procesamiento, por ejemplo, un ordenador o un

dispositivo logico programable, configurado para, o adaptado para, realizar uno de los procedimientos descritos en esta invencion.

[0098] Una realizacion adicional comprende un ordenador que tiene instalado en el mismo el programa 10 informatico para realizar uno de los procedimientos descritos en esta invencion.

[0099] Una realizacion adicional segun la invencion comprende un aparato o un sistema configurado para transferir (por ejemplo, electronica u opticamente) un programa informatico para realizar uno de los procedimientos descritos en esta invencion a un receptor. El receptor puede, por ejemplo, ser un ordenador, un dispositivo movil, un

15 dispositivo de memoria o similares. El aparato o el sistema puede, por ejemplo, comprender un servidor de archivos para transferir el programa informatico al receptor.

[0100] En algunas realizaciones, un dispositivo logico programable (por ejemplo, una matriz de puertas programable en campo) puede utilizarse para realizar algunas o todas de las funcionalidades de los procedimientos

20 descritos en esta invencion. En algunas realizaciones, una matriz de puertas programable en campo podra cooperar con un microprocesador con el fin de realizar uno de los procedimientos descritos en esta invencion. Generalmente, los procedimientos se realizan preferentemente por cualquier aparato de hardware.

[0101] Las realizaciones anteriormente descritas son meramente ilustrativas de los principios de la presente 25 invencion. Se comprende que las modificaciones y variaciones de las disposiciones y los detalles descritos en esta

invencion resultaran evidentes para otros expertos en la materia. El objeto, por lo tanto, es que se limite solo por el alcance de las reivindicaciones de la patente inminente y no por los detalles especlficos presentados a modo de descripcion y explicacion de las realizaciones de esta invencion.

30 Signos de referencia:

[0102]

1

35 2

3

4

5

6

40 7 8

9

10 11

45 12

13

14

15

16 50 17

18

19

20 21

55 22

23

24

25

26

flujo de bits datos de audio

metadatos de volumen sonoro valor de volumen sonoro de referencia valor de ganancia de mezcla descendente valor de control de rango dinamico ligero valor de control de rango dinamico pesado senal de audio

dispositivo decodificador de audio

decodificador de volumen sonoro de referencia

decodificador de ganancia de mezcla descendente

conmutador de control de rango dinamico

procesador de rango dinamico

calculadora de rango dinamico

procesador de volumen sonoro

calculadora de ganancia

proveedor de nivel diana estatico

senal de salida de audio

senal de audio mezclada

valor de control de volumen

dispositivo decodificador

senal de audio suplementaria

mezclador de senal de audio

senal de audio suplementaria ajustada al volumen sonoro valor de control de compresion procesador de senal

: 27 procesador de senal

: 28 calculadora de ganancia

: 29 senal de audio mezclada

: 30 dispositivo limitador

5: 31 valor de volumen sonoro

: 32 parametros de limitador artlstico

: 33 valor de ganancia

: 34 valor de velocidad binaria

: 35 senal de audio procesada

10: 36 valor verdadero de cresta

: 37 valor de volumen sonoro

: 41 dispositivo descodificador

: 42 senal de salida de audio

: 43 valor de control de rango dinamico preestablecido

15: 44 valor de rango dinamico

: 51 limitador

: 52 conmutador limitador

: 53 dispositivo de derivacion

: 54 dispositivo de prediccion de distorsion

20: 55 comparador

: 56 funcion de prediccion de distorsion

: 57 valor llmite de volumen

: 58 conmutador de llmite de volumen

: 59 conmutador buscador mlnimo

25: 60 conmutador de valor verdadero de cresta

: 61 combinador

: 62 componente limitador

: 63 componente de control

: 71 combinador

30: 72 conmutador buscador mlnimo

: 73 conmutador de controles de rango dinamico

: 74 datos de salida del conmutador de control de rango dinamico

: 70a valor de umbral de limitador artlstico

: 70b valor de tiempo de ataque de limitador artlstico

35: 70c valor de tiempo de liberacion de limitador artlstico

: BIBLIOGRAFIA

: [0103]

40

[1] International Organization for Standardization and International Electrotechnical Commission, ISO/IEC 144963 Information technology-Coding of audio-visual objects - Part 3: Audio,
www.iso.org.

[2] European Telecommunications Standards Institute, ETSI TS 101 154: Digital Video Broadcasting (DVB); 45 Specification for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG-2 transport

stream, no. V1.11.1, 24 July 2012,
www.etsi.org, XP014071122.

[3] Advanced Television Systems Committee, Inc., Audio Compression Standard A/52,
www.atsc.org.

50 [4] International Telecommunications Union, Recommendation ITU-R BS.1770-3: Algorithms to measure audio

programme loudness and true-peak audio level,
www.itu.int.

[5] Martin Wolters, Harald Mundt, and Jeffrey Riedmiller, "Loudness Normalization In The Age Of Portable Media Players", paper 8044, Audio Engineering Society 128th Convention,
www.aes.org

55

[6] Florian Camerer, et al, "Loudness Normalization: The Future of File-Based Playback," Music Loudness Alliance,
www.music-loudness.com.

[7] Dolby Laboratories, Inc., Dolby Digital Professional Encoding Guidelines,
www.dolby.com.

[8] Perttu Hamalainen, "Smoothing Of The Control Signal Without Clipped Output In Digital Peak Limiters", Proc. of the 5th International Conference on Digital Audio Effects, Hamburg, Germany, September 26-28, 2002.

Claims

REIVINDICACIONES

1. Dispositivo decodificador para decodificar un flujo de bits (1) a fin de producir a partir de este ultimo una senal de salida de audio (42), el flujo de bits (1) comprende datos de audio (2) y, opcionalmente, metadatos de

5 volumen sonoro (3) que contienen un valor de volumen sonoro de referencia (4), el dispositivo decodificador (41) comprende:

un dispositivo decodificador de audio (9) configurado para reconstruir una senal de audio (8) a partir de los datos de audio (2); y

10 un procesador de senal (27) configurado para producir la senal de salida de audio (42) basandose en la senal de audio (8);

en el que el procesador de senal (27) comprende un dispositivo de control de ganancia (10, 15, 28) configurado para ajustar un nivel de volumen sonoro de la senal de salida de audio (42);

en el que el dispositivo de control de ganancia (10, 15, 28) comprende un decodificador de volumen sonoro de 15 referencia (10) configurado para crear un valor de volumen sonoro (37), en el que el valor de volumen sonoro (37) es el valor de volumen sonoro de referencia (4) en caso de que el valor de volumen sonoro de referencia (4) este presente en el flujo de bits (1);

en el que el dispositivo de control de ganancia (10, 15, 28) comprende una calculadora de ganancia (28) configurada para calcular un valor de ganancia (33) basandose en el valor de volumen sonoro (37) y basandose 20 en un valor de control de volumen (20), que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de volumen (20);

en el que el dispositivo de control de ganancia (10, 15, 28) comprende un procesador de volumen sonoro (15) configurado para controlar el nivel de volumen sonoro de la senal de salida de audio (42) basandose en el valor de ganancia (33).

25
2. Dispositivo decodificador segun la reivindicacion anterior, en el que el valor de volumen sonoro (37) es un valor de volumen sonoro preestablecido en caso de que el valor de volumen sonoro de referencia (4) no este presente en el flujo de bits (1).

30 3. Dispositivo decodificador segun la reivindicacion anterior, en el que el valor de volumen sonoro

preestablecido se establece en un valor comprendido entre -4 dB y -10 dB, en particular entre -6 dB y -8 dB, con referencia a una amplitud a escala completa.
4. Dispositivo decodificador segun una de las reivindicaciones anteriores, en el que el procesador de 35 senal (27) comprende un dispositivo de control de rango dinamico (12, 13, 14) configurado para ajustar un rango

dinamico de la senal de salida de audio (42),

en el que el dispositivo de control de rango dinamico (12, 13, 14) comprende un conmutador de control de rango dinamico (12) configurado para derivar al menos un valor de control de rango dinamico (6, 7) de los metadatos de volumen sonoro (3) y para producir alternativamente uno de los valores de control de rango dinamico derivado (6, 7) 40 o un valor de control de rango dinamico preestablecido (43),

en el que el dispositivo de control de rango dinamico (12, 13, 14) comprende una calculadora de rango dinamico (14) configurada para calcular un valor de rango dinamico (44) basandose en el valor de control de rango dinamico (6, 7, 43) producido por el conmutador de control de rango dinamico (12) y basandose en un valor de control de compresion (25), que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de 45 control de compresion (25); en el que el dispositivo de control de rango dinamico (12, 13, 14) comprende un procesador de rango dinamico (13) configurado para controlar el rango dinamico de la senal de salida de audio (42) basandose en el valor de rango dinamico (44).
5. Dispositivo decodificador segun una de las reivindicaciones anteriores, en el que el procesador de 50 senal (27) comprende un dispositivo limitador (30) configurado para limitar una amplitud de la senal de audio de

salida (42), en el que el dispositivo limitador (30) comprende un componente limitador (62) que tiene un limitador (51) y un componente de control (63) configurado para controlar el componente limitador (62), en el que una senal de audio procesada (35) derivada de la senal de audio (8) que se procesa al menos por el dispositivo de control de ganancia (10, 15, 28), se introduce en el componente limitador (62), y en el que la senal de salida de audio (42) se 55 produce del componente limitador (62).
6. Dispositivo descodificador segun la reivindicacion anterior, en el que el componente de control (63) se configura para controlar el componente limitador (62) en funcion de una velocidad binaria del flujo de bits (1).
7. Dispositivo decodificador segun la reivindicacion 5 o 6, en el que el componente de control (63) se

configura para controlar el componente limitador (62) en funcion de un rendimiento de compresion del dispositivo decodificador de audio (9).

5 8. Dispositivo decodificador segun una de las reivindicaciones 5 a 7, en el que el componente de control

(63) se configura para controlar el componente limitador (62) en funcion de un valor verdadero de cresta (36) transmitido en los metadatos de volumen sonoro (3) del flujo de bits (1) y que indica un nivel de cresta maximo de una fuente de audio convertida en el flujo de bits (1) por un codificador externo.

10 9. Dispositivo decodificador segun una de las reivindicaciones 5 a 8, en el que el componente de control

(63) se configura para controlar el componente limitador (62) en funcion del valor de ganancia (33) del dispositivo de control de ganancia (10, 15, 28).
10. Dispositivo decodificador segun una de las reivindicaciones 5 a 9, en el que el componente de control 15 (63) se configura para controlar el componente limitador (62) en funcion de un valor llmite de volumen (57)

establecido por el usuario o el fabricante con el fin de evitar danos en la capacidad auditiva.
11. Dispositivo decodificador segun una de las reivindicaciones 5 a 10, en el que el componente de control (63) se configura para controlar el componente limitador (62) en funcion de parametros de limitador artlstico (32)

20 transmitidos en los metadatos de volumen sonoro (3) del flujo de bits (1) e indicando valores de umbral de limitador artlstico (74a), valores de tiempo de ataque de limitador artlstico (74b) y/o valores de tiempo de liberacion de limitador artlstico (74c).
12. Dispositivo decodificador segun una de las reivindicaciones 5 a 11, en el que el componente de control 25 (63) se configura para controlar el componente limitador (62) de manera continua o repetida.
13. Dispositivo decodificador segun una de las reivindicaciones 5 a 12, en el que el dispositivo limitador (30) se configura para derivar el limitador (51) a modo de un dispositivo de derivacion (53) que tiene una funcion de transferencia que es, con respecto a una ganancia y un retardo, similar a una funcion de transferencia del limitador

30 (51).
14. Un sistema que comprende un dispositivo decodificador (41) y un codificador, en el que el dispositivo descodificador (41) se disena segun una de las reivindicaciones 1 a 13.

35 15. Un procedimiento de decodificacion de un flujo de bits (1) de modo que se produzca a partir de este

ultimo una senal de salida de audio (42), el flujo de bits (1) comprende datos de audio (2) y opcionalmente metadatos de volumen sonoro (3) que contienen un valor de volumen sonoro de referencia (4), el procedimiento comprende las etapas de:

40 reconstruir una senal de audio (8) a partir de datos de audio (2) utilizando un dispositivo decodificador de audio (9); y producir la senal de salida de audio (42) basandose en la senal de audio (8) utilizando un procesador de senal (27);

en el que un nivel de volumen sonoro de la senal de salida de audio (42) se ajusta utilizando un dispositivo de control de ganancia (10, 15, 28) comprendido en el procesador de senal (27);

45 en el que un valor de volumen sonoro (37) se crea por un decodificador de volumen sonoro de referencia (10) comprendido en el dispositivo de control de ganancia (10, 15, 28), en el que el valor de volumen sonoro (37) es el valor de volumen sonoro de referencia (4) en el caso que el valor de volumen sonoro de referencia (4) este presente en el flujo de bits;

en el que un valor de ganancia (33) se calcula basandose en el valor de volumen sonoro (37) y basandose en un 50 valor de control de volumen (20), que se proporciona por una interfaz de usuario que permite a un usuario controlar el valor de control de volumen (20), por una calculadora de ganancia (28) comprendida en el dispositivo de control de ganancia (10, 15, 28);

en el que el nivel de volumen sonoro de la senal de salida de audio (42) se controla basandose en el valor de ganancia (33) por un procesador de volumen sonoro (15) comprendido en el dispositivo de control de ganancia 55 (10, 15, 28).
16. Programa informatico adaptado para realizar, cuando se ejecuta en un ordenador o en un procesador,

el procedimiento de la reivindicacion 15.