BRPI0709877A2 - cÁlculo e ajuste de intensidade acéstica percebida e/ou do equilÍbrio espectral percebido de um sinal de Áudio - Google Patents

cÁlculo e ajuste de intensidade acéstica percebida e/ou do equilÍbrio espectral percebido de um sinal de Áudio Download PDF

Info

Publication number
BRPI0709877A2
BRPI0709877A2 BRPI0709877-4A BRPI0709877A BRPI0709877A2 BR PI0709877 A2 BRPI0709877 A2 BR PI0709877A2 BR PI0709877 A BRPI0709877 A BR PI0709877A BR PI0709877 A2 BRPI0709877 A2 BR PI0709877A2
Authority
BR
Brazil
Prior art keywords
acoustic intensity
audio signal
specific
approximation
intensity
Prior art date
Application number
BRPI0709877-4A
Other languages
English (en)
Inventor
Alan Jeffrey Seefeldt
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of BRPI0709877A2 publication Critical patent/BRPI0709877A2/pt
Publication of BRPI0709877B1 publication Critical patent/BRPI0709877B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L2021/065Aids for the handicapped in understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

<B>CÁLCULO E AJUSTE DA INTENSIDADE ACéSTICA PERCEBIDA E/OU DO EQUILÍBRIO ESPECTRAL PERCEBIDO DE UM SINAL DE ÁUDIO<D>Um processamento de sinal de áudio relativo à medição e contraie da intensidade acústica de som percebida e/ou do equilíbrio espectral percebido de um sinal de áudio é útil, por exemplo, em um ou mais dentre: o controle do volume compensado em intensidade acústica, o controle do ganho automático, o controle da faixa dinâmica (incluindo, por exemplo, limitadores, compressores, expansores, etc.), a equalização dinâmica, e a com- pensação para a interferência de ruído de fundo em um ambiente de reprodução de áudio. Em várias modalidades, parâmetros de modificação são obtidos de modo a modificar o sinal de áudio a fim de reduzir a diferença entre a sua intensidade acústica específica e a intensidade acústica alvo específica.

Description

Relatório Descritivo da Patente de Invenção para "CALCULO EAJUSTE DA INTENSIDADE ACÚSTICA PERCEBIDA E/OU DO EQUILÍ-BRIO ESPECTRAL PERCEBIDO DE UM SINAL DE ÁUDIO".CAMPO DA TÉCNICA
A presente invenção refere-se a um processamento de sinal deáudio. Mais particularmente, a presente invenção se refere à medição e aocontrole da intensidade acústica do som percebida e/ou equilíbrio espectralpercebido de um sinal de áudio. A presente invenção é útil, por exemplo, emum ou mais dentre: o controle do volume compensado em intensidade acús-tica, o controle do ganho automático, o controle da faixa dinâmica (incluindo,por exemplo, limitadores, compressores, expansores, etc.), a equalizaçãodinâmica, e a compensação para a interferência de ruído de fundo em umambiente de reprodução de áudio. A presente invenção inclui não apenasmétodos, mas também os programas e aparelhos de computador corres-pondentes.ANTECEDENTES DA INVENÇÃO
Têm-se feito muitas tentativas no sentido de desenvolver ummétodo objetivo satisfatório de se medir uma intensidade acústica. Em 1933,Fletcher e Munson determinaram que a audição humana é menos sensível abaixas e altas freqüências que a freqüências médias (ou da voz). Tambémdescobriram-se que a mudança relativa de sensibilidade diminuía conformeo nível do som aumentava. Um medidor de intensidade acústica da técnicaanterior consiste em um microfone, um amplificador, um medidor, e de umacombinação de filtros desenhados para imitar grosseiramente a resposta defreqüência da audição nos níveis baixo, médio e alto de som.
Mesmo que tais dispositivos provessem uma medição da inten-sidade acústica de um único nível constante, as medições tonais isoladas desons mais complexos não corresponderiam muito bem às impressões subje-tivas da intensidade acústica. Os medidores de níveis de som deste tipo fo-ram padronizados, mas só são usados para tarefas específicas, tais comopara o monitoramento e controle do barulho industrial.
No início dos anos 50, Zwicker e Stevens, entre outros, estende-ram o trabalho de Fletcher e Munson no desenvolvimento de um modelomais realista do processo de percepção da intensidade acústica. Em 1956,Stevens publicou um método para o "Cálculo da Intensidade Acústica deRuídos Complexos" no Periódico da Sociedade Acústica da América, e, em1958, Zwicker publicou o seu artigo sobre Acústica intitulado "Base Psicoló-gica e Metodológica da Intensidade Acústica". Em 1959, Zwicker publicouum procedimento gráfico para o cálculo da intensidade acústica, assim comovários artigos similares logo em seguida. Os métodos de Stevens e de Zwic-ker foram padronizados como ISO 532, partes AeB (respectivamente). Am-bos os métodos envolvem etapas similares.
Primeiramente, a distribuição variante no tempo da energia aolongo da membrana basilar do ouvido interno, referida como excitação, ésimulada ao passar um áudio por um banco de filtros auditivos de passabanda com freqüências centrais espaçadas uniformemente em uma escalade taxa de banda crítica. Cada filtro auditivo é concebido de modo a simulara resposta de freqüência em um local em particular ao longo da membranabasilar do ouvido interno, com a freqüência central do filtro correspondente aeste local. Uma largura de banda crítica é definida como a largura de bandade tal filtro. Medida em unidades de Hertz, a largura de banda crítica destesfiltros auditivos aumenta com uma maior freqüência central. É, portanto, útilse definir uma escala de freqüência deformada de tal modo que a largura debanda crítica para todos os filtros auditivos medidos nesta escala deformadaseja constante. Tal escala deformada é referida como uma escala de taxa debanda crítica e é muito útil para o entendimento e simulação de uma amplafaixa de fenômenos psicoacústicos. Vide, por exemplo, Psychoacoustics -Faets and Models de E. Zwicker e H. Fastl, Springer-Verlag, Berlim, 1990.
Os métodos de Stevens e Zwicker utilizam uma escala de taxa de bandacrítica referida como escala de Bark, na qual a largura de banda crítica éconstante abaixo de 500 Hz e aumenta acima de 500 Hz. Mais recentemen-te, Moore e Glasberg definiram uma escala de taxa de banda crítica, quenomearam escala de Largura de Banda Retangular Equivalente (ERB)(B.C.J. Moore, B. Glasberg, T. Baer, "A Model for the Prediction of Thre-sholds, Loudness, and Partial Loudness", Journal of the Audio EngineeringSociety, Vol. 45, N. 4. abril de 1997, pp. 224-240). Através de experimentospsicoacústicos que utilizam mascarados de ruído chanfrados, Moore e Glas-berg demonstraram que a largura de banda crítica continua a diminuir abaixode 500 Hz em contraste à escala de Bark na qual a largura de banda críticapermanece constante.
Após a computação da excitação tem-se uma função compressi-va não linear que gera uma quantidade referida como "intensidade acústicaespecífica". A intensidade acústica específica é uma medida da intensidadeacústica perceptiva como uma função de freqüência e do tempo e pode sermedida em unidades de intensidade acústica perceptiva por freqüência uni-tária ao longo de uma escala de taxa de banda crítica, tal como a escala deBark ou de banda ERB acima apresentada. Em termos ideais, a intensidadeacústica específica representa uma distribuição contínua de intensidade a-cústica como uma função de freqüência e de tempo, e a "intensidade acústi-ca total" variante no tempo é computada ao integrar esta distribuição atravésda freqüência. Na prática, uma representação precisa de uma intensidadeacústica específica é obtida por meio da amostragem desta distribuição demaneira uniforme ao longo de uma escala de taxa de banda crítica atravésdo uso, por exemplo, dos filtros auditivos acima mencionados. Neste caso, aintensidade acústica total pode ser computada ao simplesmente somar aintensidade acústica específica de cada filtro. A fim de reduzir complexidade,algumas aplicações podem computar uma aproximação mais grosseira daintensidade acústica específica graças às pequenas imprecisões na estima-tiva e na modificação da intensidade acústica percebida. Tais aproximaçõesserão apresentadas em mais detalhes mais adiante.
A intensidade acústica pode ser medida em unidades de phon. Aintensidade acústica de um dado som em phon é o nível de pressão de som(SPL) de um tom de 1 kHz tendo uma intensidade acústica subjetiva igual aodaquele som. Convencionalmente, a referência 0 dB para o nível SPL é umapressão de raiz quadrada mínima de 2 χ 10"5 Pascal, e isto é, também, por-tanto, a referência 0 phon. Usando esta definição em comparação à intensi-4dade acústica dos tons em freqüências diferentes de 1 kHz com a intensida-de acústica a 1 kHz, um contorno de intensidade acústica igual poderá serdeterminado para um dado nível de phon. A Figura 11 mostra contornos deintensidade acústica iguais para freqüências entre 20 Hz e 12,5 kHz, e para níveis de phon entre 4,2 phon (considerado como o limite da audição) e 120phon (IS0226: 1087 (E)1 "Acoustics - Normal equal Ioudness levei con-tours"). A medição de phon leva em consideração a variante sensibilidade doouvido humano à freqüência, mas os resultados não permitem a avaliaçãodas intensidades acústicas subjetivas relativas dos sons em níveis variantes, uma vez que não se faz uma tentativa no sentido de corrigir a não linearida-de do crescimento da intensidade acústica com nível SPL, ou seja, para ofato de que o espaçamento dos contornos varia.
A intensidade acústica pode também ser medida em unidadesde "sone". Existe um mapeamento de um para um entre as unidades dephon e as unidades de sone, conforme indicado na Figura 11. Um som édefinido como a intensidade acústica de uma onda seno pura de 1 kHz 40dB (SPL) e eqüivale a 40 phon. As unidades de sone são tais que um au-mento dobrado em sone corresponderá ao dobro da intensidade acústicapercebida. Por exemplo, 4 sones são percebidos como duas vezes tão altoquanto 2 sons. Sendo assim, os níveis de intensidade acústica expressosem sone são mais informativos. Dada a definição da intensidade acústicacomo uma medida da intensidade acústica perceptiva como uma função defreqüência e tempo, uma intensidade acústica específica poderá ser medidaem unidades de sone por freqüência unitária. Deste modo, ao se usar a es-cala de Bark, a intensidade acústica específica tem unidades de sone porBark e, da mesma forma, ao se usar a escala ERB, as unidades serão emsone por ERB.
Conforme acima mencionado, a sensibilidade do ouvido humanovaria de acordo com a freqüência e o nível, um fato bem documentado naliteratura psicoacústica. Um dos resultados é que o espectro ou timbre per-cebido de um dado som varia de acordo com o nível acústico no qual o somé ouvido. Por exemplo, para um som contendo freqüências baixas, médias ealtas, as proporções relativas percebidas de tais componentes de freqüênciamudam de acordo com a intensidade acústica geral do som; quando o som écalmo, os componentes de freqüências baixa e alta soam mais calmos comrelação às freqüências médias do que, quando o som é alto. Este fenômenoé bem conhecido e é suavizado em um equipamento de reprodução de sompor meio dos assim chamados controles de intensidade acústica. Um contro-le de intensidade acústica é um controle de volume que aplica um reforço(boost) de freqüência baixa e às vezes também alta quando o volume é des-ligado. Sendo assim, a sensibilidade menor do ouvido em freqüências ex-tremas é compensada por um reforço artificial destas freqüências. Estescontroles são completamente passivos; o grau de compensação aplicado éuma função da definição do controle de volume ou algum outro controle ope-rado pelo usuário, não como uma função do conteúdo dos sinais de áudio.
Na prática, as mudanças no equilíbrio espectral relativo percebi-do entre freqüências baixa, média e alta dependem do sinal, em particular deseu espectro real e de se quer ser alto ou suave. Considere a gravação deuma orquestra sinfônica. Reproduzido no mesmo nível que uma pessoa daplatéia ouviria em um concerto, o equilíbrio através do espectro poderá sercorreto se a orquestra estiver tocando alto ou baixo. Se a música é reprodu-zida 10 dB mais baixo, por exemplo, o equilíbrio percebido através do espec-tro muda de uma maneira nas passagens altas e muda de uma outra manei-ra nas passagens baixas. Um controle de intensidade acústica passiva con-vencional não aplica diferentes compensações como uma função da música.
No Pedido de Patente Internacional Nq PCT/US2004/016964,depositado em 27 de maio de 2004, publicado em 23 de dezembro de 2004como o documento WO 2004/111994 A2, Seefeldt e outros apresentam, en-tre outras coisas, um sistema para a medição e ajuste da intensidade acústi-ca percebida de um sinal de áudio. O dito pedido PCT, que designa os Esta-dos Unidos da América, é incorporado ao presente documento à guisa dereferência em sua totalidade. No dito pedido, um modelo psicoacústico cal-cula a intensidade acústica de um sinal de áudio em unidades perceptivas.Além disso, o pedido introduz técnicas para a computação de um ganho mui-tiplicativo de banda larga que, quando aplicado ao áudio, resulta em umaintensidade acústica do áudio modificado no ganho substancialmente igualcomo uma intensidade acústica de referência. A aplicação de tal ganho debanda larga, no entanto, muda o equilíbrio espectral do áudio.
DESCRIÇÃO DA INVENÇÃO
Em um aspecto, a presente invenção provê a obtenção de in-formações utilizáveis para o controle da intensidade acústica específica deum sinal de áudio por meio da modificação do sinal de áudio a fim de reduzira diferença entre a sua intensidade acústica específica e uma intensidadeacústica alvo específica. A intensidade acústica específica é uma medida daintensidade acústica perceptiva como uma função da freqüência e do tempo.Em implementações práticas, a intensidade acústica específica do sinal deáudio modificado pode ser feita de modo a se aproximar da intensidade a-cústica alvo específica. A aproximação pode ser afetada não apenas porconsiderações simples de processamento de sinal, mas também pela suavi-zação no tempo e/ou na freqüência que pode ser empregada na modifica-ção, conforme descrito abaixo.
Uma vez que a intensidade acústica específica é uma medida daintensidade acústica perceptiva de um sinal de áudio como uma função dafreqüência e do tempo, a fim de reduzir a diferença entre a intensidade acús-tica específica do sinal de áudio e a intensidade acústica alvo específica, amodificação pode modificar o sinal de áudio como uma função da freqüên-cia. Embora em alguns casos a intensidade acústica alvo específica possaser invariante no tempo e o próprio sinal de áudio possa ser um sinal invari-ante no tempo de estado estacionário, tipicamente, a modificação pode tam-bém modificar o sinal de áudio como uma função do tempo.
Aspectos da presente invenção podem também ser empregadosno sentido de compensar a interferência do ruído de fundo em um ambientede reprodução de áudio. Quando um áudio é ouvido na presença de um ruí-do de fundo, o ruído pode parcial ou completamente mascarar o áudio demaneira dependente tanto no nível ou espectro do áudio, como também nonível ou espectro do ruído. O resultado é uma alteração do espectro perce-bido do áudio. De acordo com estudos psicoacústicos (vide, por exemplo,Moore, Glasberg, e Baer, "A Modelo for the Prediction of Thresholds, Loud-ness, and Parcial Loudness", J. Audio Eng. Soc., Vol. 45, N. 4, abril de1997), pode-se definir a intensidade acústica parcial específica" do áudiocomo a intensidade acústica perceptiva do áudio na presença de um sinalsonoro de interferência secundário, como o ruído.
Sendo assim, em um outro aspecto, a presente invenção provê aobtenção de informações utilizáveis para o controle da intensidade acústicaparcial específica de um sinal de áudio por meio da modificação de um sinalde áudio a fim de reduzir a diferença entre a sua intensidade acústica parcialespecífica e uma intensidade acústica alvo específica. Isto suaviza os efeitosdo ruído de uma maneira perceptivamente precisa. Neste e em outros as-pectos da presente invenção considerando um sinal de ruído de interferên-cia, pressupõe-se que haja um acesso ao sinal de áudio por si só e ao sinalde interferência secundário por si só.
Em um outro aspecto, a presente invenção provê o controle daintensidade acústica específica de um sinal de áudio por meio da modifica-ção do sinal de áudio, a fim de reduzir a diferença entre a sua intensidadeacústica específica e uma intensidade acústica alvo específica.
Quando a intensidade acústica alvo específica não é uma funçãodo sinal de áudio, a mesma pode ser uma intensidade acústica alvo especí-fica armazenada ou recebida. Quando a intensidade acústica alvo específicanão é uma função do sinal de áudio, a modificação ou a obtenção poderáexplícita ou implicitamente calcular uma intensidade acústica específica ouuma intensidade acústica parcial específica. Exemplos de cálculo implícitoincluem uma tabela de pesquisa ou uma expressão matemática "de senten-ça fechada", na qual a intensidade acústica específica e/ou a intensidadeacústica parcial específica é inerentemente determinada (o termo sentençafechada descreve uma expressão matemática que pode ser representadaexatamente usando um número finito de operações e funções matemáticaspadrão, tais como a exponencial ou a co-seno). Ainda, quanto a intensidadeacústica alvo específica não é uma função do sinal de áudio, a intensidadeacústica alvo específica pode ser tanto invariante no tempo e invariante nafreqüência, como também pode ser invariante no tempo.
Ainda, em um outro aspecto, a presente invenção provê o pro-cessamento de um sinal de áudio por meio do processamento do sinal deáudio ou uma medida do sinal de áudio de acordo com um ou mais proces-sos e um ou mais parâmetros de controle de processo a fim de produzir umaintensidade acústica alvo específica. Embora a intensidade acústica alvoespecífica possa ser invariante no tempo ("fixa"), a intensidade acústica alvoespecífica poderá com vantagem ser uma função da intensidade acústicaespecífica do sinal de áudio. Embora possa ser um sinal invariante no tempoe na freqüência, tipicamente, o sinal de áudio em si é variante na freqüênciae no tempo, fazendo com que a intensidade acústica alvo específica sejavariante na freqüência e no tempo quando a mesma é uma função do sinalde áudio.
O áudio e uma intensidade acústica alvo específica ou uma re-presentação de uma intensidade acústica alvo específica podem ser recebi-dos a partir de uma transmissão ou reproduzidos a partir de um meio de ar-mazenamento.
A representação de uma intensidade acústica alvo específicapode ser um ou mais fatores de escala que gradua o sinal de áudio ou medeo sinal de áudio.
A intensidade acústica alvo específica de qualquer um dos as-pectos acima da presente invenção pode ser uma função do sinal de áudioou medida do sinal de áudio. Uma medida adequada do sinal de áudio é aintensidade acústica específica do sinal de áudio. A função do sinal de áudioou medida do sinal de áudio pode ser uma graduação do sinal de áudio oumedida do sinal de áudio. Por exemplo, a graduação pode ser uma ou umacombinação de graduações:
(a) uma graduação do fator de escala variante no tempo e vari-ante na freqüência Ξ [b, t] da intensidade acústica específica, como na rela-ção:
N[b, t] = Ξ [b, t] N[b, t];(b) uma graduação de fator de escala variante no tempo e inva-riante na freqüência Φ [t] da intensidade acústica específica, como na rela-ção:
N [b, t] = Φ [t] N[b, t];
(c) uma graduação do fator de escala invariante no tempo e va-riante na freqüência Φ [b] da intensidade acústica específica, como na rela-ção:
N[b, t] = Φ [b] N[b,t];e
(d) uma graduação do fator de escala invariante no tempo e in-variante na freqüência α da intensidade acústica específica, como na rela-ção:
N[b, t] = α N[b, t],
na qual N[b, t] é a intensidade acústica alvo específica, N[b, t] é a intensida-de acústica específica do sinal de áudio, b é uma medida de freqüência, e t éuma medida de tempo.
No caso (a) de um fator de escala variante no tempo e variantena freqüência, a graduação pode ser determinada pelo menos em parte poruma razão de uma intensidade acústica multibanda desejada e de uma in-tensidade acústica multibanda do sinal de áudio. Tal graduação pode serutilizável como um controle de faixa dinâmica. Outros detalhes dos aspectosempregados pela presente invenção quanto a um controle de faixa dinâmicasão apresentados a seguir.
Ainda no caso (a) de um fator de escala variante no tempo e nafreqüência, a intensidade acústica específica pode ser graduada por meio darazão de uma medida de uma forma espectral desejada para a medida deuma forma espectral do sinal de áudio. Esta graduação pode ser empregadano sentido de transformar o espectro percebido do sinal de áudio a partir deum espectro percebido variante no tempo para um espectro percebido inva-riante no tempo. Quando a intensidade acústica específica é graduada pelarazão de uma medida de uma forma de espectro desejada para a medida deuma forma espectro do sinal de áudio, tal graduação pode ser utilizável co-mo um equalizador dinâmico. Outros detalhes de se usar aspectos da pre-sente invenção como um equalizador dinâmico são apresentados a seguir.
No caso (b) de um fator de escala variante no tempo e invariantena freqüência, a graduação pode ser determinada pelo menos em parte poruma razão de uma intensidade acústica de banda larga desejada para a in-tensidade acústica de banda larga do sinal de áudio. Esta graduação podeser utilizável como um controle de ganho automático ou como um controlede faixa dinâmica. Outros detalhes de se empregar aspectos da presenteinvenção como um controle de ganho automático ou controle de faixa dinâ-mica são apresentados a seguir.
No caso (a) (um fator de escala variante no tempo e na freqüên-cia) ou no caso (b) (um fator de escala variante no tempo e invariante nafreqüência), o fator de escala pode ser uma função do sinal de áudio ou me-dida do sinal de áudio.
No caso (c) de um fator de escala invariante no tempo, variantena freqüência ou o caso (d) um fator de escala invariante no tempo e invari-ante na freqüência, a modificação ou a obtenção pode incluir o armazena-mento do fator de escala ou o fator de escala pode ser recebido a partir deuma fonte externa.
Em ambos os casos (c) e (d), o fator de escala pode não seruma função do sinal de áudio ou medida do sinal de áudio.
Em qualquer dos diversos aspectos da presente invenção e suasvariações, a modificação, a obtenção, ou a produção podem, de várias ma-neiras, explícita ou implicitamente calcular (1) a intensidade acústica especí-fica, e/ou (2) a intensidade acústica parcial específica, e/ou (3) a intensidadeacústica alvo específica. Os cálculos implícitos podem envolver, por exem-plo, uma tabela de pesquisa ou uma expressão matemática de sentença fe-chada.
Os parâmetros de modificação podem ser temporalmente suavi-zados. Os parâmetros de modificação podem ser, por exemplo, (1) uma plu-ralidade de fatores de graduação de amplitude relativos às bandas de fre-qüência do sinal de áudio ou (2) uma pluralidade de coeficientes de filtro pa-ra o controle de um ou mais filtros, como, por exemplo, um filtro FIR de di-versas derivações ou um filtro IIR multipolar. Os fatores de escala ou os coe-ficientes de filtro (e os filtros aos quais os mesmos são aplicados) podem servariantes no tempo.
Ao calcular a função da intensidade acústica específica do sinal de áudio que define a intensidade acústica alvo específica ou o inverso des-ta função, o processo ou processos que fazem estes cálculos operam noque se pode ser caracterizado como o domínio de intensidade acústica per-ceptiva (psicoacústica) - a entrada e a saída do cálculo são as intensidadesacústicas específicas. Em contrapartida, ao aplicar fatores de escala de am- plitude às bandas de freqüência do sinal de áudio ou ao aplicar coeficientesde filtro a uma filtragem controlável do sinal de áudio, os parâmetros de mo-dificação operam no sentido de modificar o sinal de áudio fora do domínio deintensidade acústica perceptiva (psicoacústica) no que pode ser caracteriza-do como o domínio do sinal elétrico. Embora possam ser feitas modificaçõesao sinal de áudio no domínio do sinal elétrico, estas mudanças no domíniodo sinal elétrico são provenientes dos cálculos no domínio de intensidadeacústica perceptiva (psicoacústica) de tal modo que o sinal de áudio modifi-cado tenha uma intensidade acústica específica que se aproxima da intensi-dade acústica alvo específica desejada.
Ao se obter parâmetros de modificação a partir de cálculos nodomínio da intensidade acústica, um controle maior sobre a intensidade a-cústica perceptiva e o equilíbrio espectral percebido poderá ser alcançadodo que se estes parâmetros de modificação fossem obtidos no domínio dosinal elétrico. Além disso, o uso de um banco de filtros psicoacústico simula-dor de membrana basilar ou equivalente na realização dos cálculos de do-mínio de intensidade acústica pode prover um controle mais detalhado doespectro percebido que nas disposições que provêm parâmetros de modifi-cação no domínio de sinal elétrico.
Cada modificação, obtenção e produção pode ser dependentede uma ou mais dentre uma medida de um sinal de áudio de interferência,uma intensidade acústica alvo específica, uma estimativa da intensidadeacústica específica do sinal de áudio não modificado obtido a partir da inten-sidade acústica específica ou da intensidade acústica parcial específica dosinal de áudio modificado, a intensidade acústica específica do sinal de áu-dio não modificado, e uma aproximação à intensidade acústica alvo específi-ca obtida a partir da intensidade acústica específica ou da intensidade acús-tica parcial específica do sinal de áudio modificado.
A modificação ou a obtenção pode produzir parâmetros de modi-ficação pelo menos em parte a partir de um ou mais dentre uma medida deum sinal de áudio de interferência, uma intensidade acústica alvo específica,uma estimativa da intensidade acústica específica do sinal de áudio não mo-dificado obtido a partir da intensidade acústica específica ou da intensidadeacústica parcial específica do sinal de áudio modificado, a intensidade acús-tica específica do sinal de áudio não modificado, e uma aproximação à in-tensidade acústica alvo específica obtida a partir da intensidade acústicaespecífica ou da intensidade acústica parcial específica do sinal de áudiomodificado.
Mais particularmente, a modificação ou a obtenção pode produ-zir parâmetros de modificação pelo menos em parte a partir de:
(1) um dentre:
- uma intensidade acústica alvo específica; e
- uma estimativa da intensidade acústica específica do sinal deáudio não modificado recebido a partir da intensidade acústica específica dosinal de áudio modificado, e
(2) um dentre:
- a intensidade acústica específica do sinal de áudio não modifi-cado, e
- uma aproximação à intensidade acústica alvo específica obtidaa partir da intensidade acústica específica do sinal de áudio modificado,
ou quando um sinal de áudio de interferência deve ser levadoem consideração, a modificação ou a obtenção pode derivar de parâmetrosde modificação pelo menos em parte de:
(1) uma medida de um sinal de áudio de interferência;
(2) um dentre:- uma intensidade acústica alvo específica, e
- uma estimativa da intensidade acústica específica do sinal deáudio não modificado obtido a partir da intensidade acústica parcial específi-ca do sinal de áudio modificado, e
(3) um dentre:
- a intensidade acústica específica do sinal de áudio não modifi-cado, e
- uma aproximação à intensidade acústica alvo específica obtidaa partir da intensidade acústica parcial específica do sinal de áudio modifica-do.
Uma disposição de alimentação direta pode ser empregada naqual a intensidade acústica específica é obtida a partir do sinal de áudio, ena qual a intensidade acústica alvo específica é recebida a partir de umafonte externa ao método ou a partir de um armazenamento quando a modifi-cação ou a obtenção inclui o armazenamento de uma intensidade acústicaalvo específica. De maneira alternativa, uma disposição híbrida de alimenta-ção direta / retroalimentação pode ser empregada, na qual uma aproximaçãoà intensidade acústica alvo específica é obtida a partir do sinal de áudio mo-dificado, e na qual a intensidade acústica alvo específica é recebida de umafonte externa ao método ou a partir de um armazenamento quando a modifi-cação ou a obtenção inclui o armazenamento de uma intensidade acústicaalvo específica.
A modificação ou a obtenção pode incluir um ou mais processospara a obtenção, explícita ou implícita, da intensidade acústica alvo específi-ca, um ou alguns dos quais calcula, explícita ou implicitamente, uma funçãodo sinal de áudio ou a medida do sinal de áudio. Em uma alternativa, umadisposição de alimentação direta pode ser empregada na qual a intensidadeacústica específica e a intensidade acústica alvo específica são obtidas apartir do sinal de áudio, a obtenção dá intensidade acústica alvo específicaempregando uma função do sinal de áudio ou a medida do sinal de áudio.Em uma outra alternativa, uma disposição híbrida de alimentação direta/retroalimentação pode ser empregada, na qual uma aproximação à intensi-dade acústica alvo específica é obtida a partir do sinal de áudio modificado,e a intensidade acústica alvo específica é obtida a partir do sinal de áudio, aobtenção da intensidade acústica alvo específica empregando uma funçãodo sinal de áudio ou a medida do sinal de áudio.
A modificação ou a obtenção pode incluir um ou mais processospara a obtenção, explícita ou implícita, de uma estimativa da intensidadeacústica específica do sinal de áudio não modificado em resposta ao sinal deáudio modificado, um ou alguns dos quais calcula, explícita ou implicitamen-te, o inverso de uma função do sinal de áudio ou a medida do sinal de áudio.Em uma alternativa, uma disposição de retroalimentação é empregada naqual uma estimativa da intensidade acústica específica do sinal de áudio nãomodificado e uma aproximação à intensidade acústica alvo específica sãoobtidas a partir do sinal de áudio modificado, a estimativa da intensidadeacústica específica sendo calculada usando o inverso da dita função do sinalde áudio ou da medida do sinal de áudio. Em uma outra alternativa, umadisposição híbrida de alimentação direta / retroalimentação é empregada naqual a intensidade acústica específica é obtida a partir do sinal de áudio, e aestimativa da intensidade acústica específica do sinal de áudio não modifi-cado é obtida a partir do sinal de áudio modificado, a obtenção da estimativasendo calculada usando o inverso da dita função do sinal de áudio ou damedida do sinal de áudio.
Os parâmetros de modificação podem ser aplicados ao sinal deáudio de modo a produzir um sinal de áudio modificado.
Um outro aspecto da presente invenção é que pode haver umaseparação temporal e/ou espacial de processos ou dispositivos de modo aexistir, com efeito, um codificador ou codificação e ainda um decodificadorou decodificação. Por exemplo, pode haver um sistema de codificação / de-codificação no qual a modificação ou obtenção pode transmitir ou receber ouarmazenar ou ainda reproduzir o sinal de áudio e ainda (1) os parâmetros demodificação ou (2) uma intensidade acústica alvo específica ou uma repre-sentação de uma intensidade acústica alvo específica. De maneira alternati-va, pode haver, com efeito, somente um codificador ou codificação na qualse faz uma transmissão ou armazenamento do sinal de áudio e (1) dos pa-râmetros de modificação ou (2) de uma intensidade acústica alvo específicaou representação da intensidade acústica alvo específica. De maneira alter-nativa, conforme acima mencionado, pode haver, com efeito, somente umdecodificador ou decodificação na qual se faz uma recepção ou reproduçãodo sinal de áudio e (1) dos parâmetros de modificação ou (2) de uma inten-sidade acústica alvo específica ou representação da intensidade acústicaalvo específica.
DESCRIÇÃO DOS DESENHOS
A Figura 1 é um diagrama em bloco funcional ilustrando um e-xemplo de uma implementação de alimentação direta de acordo com os as-pectos da presente invenção.
A Figura 2 é um diagrama em bloco funcional ilustrando um e-xemplo de uma implementação de retroalimentação de acordo com os as-pectos da presente invenção.
A Figura 3 é um diagrama em bloco funcional ilustrando um e-xemplo de uma implementação híbrida de alimentação direta / retroalimenta-ção de acordo com os aspectos da presente invenção.
A Figura 4 é um diagrama em bloco funcional ilustrando um e-xemplo de uma outra implementação híbrida de alimentação direta / retroa-limentação de acordo com os aspectos da presente invenção.
A Figura 5 é um diagrama em bloco funcional ilustrando a ma-neira pela qual o sinal de áudio não modificado e os parâmetros de modifi-cação conforme determinados por qualquer uma dentre as disposições dealimentação direta, de retroalimentação, ou híbridas de alimentação direta /retroalimentação podem ser armazenados ou transmitidos para uso, por e-xemplo, em um dispositivo ou processo temporal ou espacialmente separado.
A Figura 6 é um diagrama em bloco funcional ilustrando a ma-neira pela qual o sinal de áudio não modificado e a intensidade acústica alvoespecífica ou representação da mesma conforme determinados por qualqueruma dentre as disposições de alimentação direta, de retroalimentação, ouhíbridas de alimentação direta / retroalimentação podem ser armazenadosou transmitidos para uso, por exemplo, em um dispositivo ou processo tem-poral ou espacialmente separado.
A Figura 7 é um diagrama em bloco funcional esquemático oufluxograma esquemático mostrando um resumo de um aspecto da presenteinvenção.
A Figura 8 é uma resposta característica idealizada de um filtrolinear P(z) adequado como um filtro de transmissão em uma modalidade dapresente invenção na qual o eixo vertical é a atenuação em decibéis (dB) e oeixo horizontal é uma base logarítmica 10 de freqüência energia Hertz (Hz).
A Figura 9 mostra a relação entre a escala de freqüência ERB(eixo vertical) e a freqüência em Hertz (eixo horizontal).
A Figura 10 mostra um conjunto de respostas características defiltro auditivo idealizadas que aproximam uma formação de banda crítica naescala ERB. A escala horizontal é a freqüência em Hertz e a escala verticalé o nível em decibéis.
A Figura 11 mostra os contornos de intensidade acústica iguaisdo ISO 226. A escala horizontal é a freqüência em Hertz (escala de base 10logarítmica) e a escala vertical é o nível de pressão de som em decibéis.
A Figura 12 mostra os contornos de intensidade acústica iguaisdo ISO 226 normalizados pelo filtro de transmissão P(z). A escala horizontalé a freqüência em Hertz (escala de base 10 logarítmica) e a escala vertical éo nível de pressão de som em decibéis.
A Figura 13a é um gráfico idealizado mostrando os ganhos debanda larga e os ganhos de multibanda para uma graduação de intensidadeacústica de 0,25 em um segmento de fala feminina. A escala horizontal é debandas ERB e a escala vertical é o ganho relativo em decibéis (dB).
A Figura 13b é um gráfico idealizado mostrando a intensidadeacústica específica, respectivamente, de um sinal original, de um sinal modi-ficado em ganho de banda larga, e um sinal modificado em ganho de multi-banda. A escala horizontal é de bandas ERB e a escala vertical é de umaintensidade acústica específica (sone/ERB).A Figura 14a é um gráfico idealizado mostrando: L0 [t] como umafunção de L1 [t] para um ganho ACG típico. A escala horizontal é o log (L1 [t])é a escala vertical é o log (L0 [t]).
A Figura 14b é um gráfico idealizado mostrando: L0 [t] como umafunção de L1 [t] para um controle DRC típico. A escala horizontal é o log (L1[t]) e a escala vertical é o log (L0 [t]).
A Figura 15 é um gráfico idealizado mostrando uma função típicade suavização de banda para um controle DRC multibanda. A escala hori-zontal é um número de banda e a escala vertical é a saída de ganho para abanda b.
A Figura 16 é um diagrama em bloco funcional esquemático oufluxograma esquemático mostrando um resumo de um aspecto da presenteinvenção.
A Figura 17 é um diagrama em bloco funcional esquemático oufluxograma esquemático similar ao da Figura 1 incluindo uma compensaçãopara ruído em um ambiente de reprodução.
MELHOR MODO DE SE EXECUTAR A INVENÇÃO
As Figuras 1 a 4 mostram diagramas em blocos funcionais ilus-trando as possíveis alimentação direta, a retroalimentação, e duas versõesde exemplos de implementação híbrida de alimentação direta / retroalimen-tação de acordo com aspectos da presente invenção.
Com referência ao exemplo de uma topologia de alimentaçãodireta na Figura 1, um sinal de áudio é aplicado em dois trajetos: (1) um tra-jeto de sinal tendo um processo ou dispositivo 2("Modificar Sinal de áudio")capaz de modificar o áudio em resposta aos parâmetros de modificação, e(2) um trajeto de controle tendo um processo ou dispositivo 4 ("Gerar Parâ-metros de Modificação") capaz de gerar estes parâmetros de modificação. Oexemplo de topologia de alimentação direta Modificar Sinal de áudio 2 naFigura 1 e em cada um dos exemplos das Figuras 2 a 4 pode ser um dispo-sitivo ou processo que modifica o sinal de áudio, por exemplo, sua amplitu-de, de uma maneira variante na freqüência e/ou no tempo de acordo com osparâmetros de modificação M recebidos do Gerar Parâmetros de Modifica-ção 4 (ou dos processos ou dispositivos de contrapartida 4', 4", e 4'" em ca-da uma dos exemplos das Figuras 2 a 4, respectivamente). O Gerar Parâ-metros de Modificação 4 e suas contrapartidas nas Figuras 2 a 4 opera pelomenos parcialmente no domínio de intensidade acústica perceptiva. O Modi-ficar Sinal de áudio 2 opera no domínio do sinal elétrico e produz um sinal deáudio modificado em cada um dos exemplos das Figuras 1 a 4. Ainda nosexemplos das Figuras 1 a 4, o Modificar Sinal de áudio 2 e o Gerar Parâme-tros de Modificação 4 (ou suas contrapartidas) modificam o sinal de áudio demodo a reduzir a diferença entre a intensidade acústica específica e umaintensidade acústica alvo específica.
No exemplo de alimentação direta da Figura 1, o processo oudispositivo 4 pode incluir vários processos e/ou dispositivos; um processo oudispositivo "Calcular Intensidade acústica alvo específica" 6 que calcula umaintensidade acústica alvo específica em resposta ao sinal de áudio ou umamedida de sinal de áudio, tal como a intensidade acústica específica do sinalde áudio, um processo ou dispositivo "Calcular Intensidade acústica especí-fica" 8 que calcula a intensidade acústica específica do sinal de áudio emresposta ao sinal de áudio ou uma medida dos sinais de áudio tais como suaexcitação, e um processo ou dispositivo "Calcular Parâmetros de Modifica-ção" 10 que calcula os parâmetros de modificação em resposta à intensida-de acústica específica e à intensidade acústica alvo específica. O CalcularIntensidade acústica alvo específica 6 pode realizar uma ou mais funções"F", cada uma das quais podendo ter parâmetros de função. Por exemplo,ele pode calcular a intensidade acústica específica do sinal de áudio e emseguida aplicar uma ou mais funções F ao mesmo de modo a prover umaintensidade acústica alvo específica. Isto é indicado esquematicamente naFigura 1 como uma entrada "Selecionar Funções F e Parâmetros de Fun-ções" para o processo ou dispositivo 6. Ao invés de ser calculado pelo dis-positivo ou processo 6, a intensidade acústica alvo específica pode ser pro-vida por um processo ou dispositivo de armazenamento (mostrado esque-maticamente como uma entrada "Armazenado" para o processo ou dispositi-vo 10) incluído ou associado ao Gerar Parâmetros de Modificação 4, ou poruma fonte externa ao processo ou dispositivo como um todo (mostrada es-quematicamente como a entrada "Externa" ao processo ou dispositivo 10).Deste modo, os parâmetros de modificação se baseiam pelo menos em par-te nos cálculos do domínio da intensidade acústica perceptiva (psicoacústi-co) (isto é, pelo menos a intensidade acústica específica e, em alguns casos,os cálculos de intensidade acústica alvo específica).
Os cálculos feitos pelos processos ou dispositivos 6, 8 (e pelosprocessos ou dispositivos 12, 14, 10' da Figura 2, 6, 14, 10" da Figura 3, e 8,12, 10"' da Figura 4) podem ser feitos explícita ou implicitamente. Exemplosde um desempenho implícito incluem (1) uma tabela de pesquisa cujas en-tradas se baseiam no todo ou em parte na intensidade acústica específicae/ou na intensidade acústica alvo específica e/ou nos cálculos de parâmetrode modificação, e (2) uma expressão matemática de sentença fechada ine-rentemente baseada no todo ou em parte na intensidade acústica específica e/ou na intensidade acústica alvo específica e/ou nos parâmetros de modifi-cação.
Embora os processos ou dispositivos de cálculo 6, 8, 10 da Figu-ra 1 (e os processos ou dispositivos 12, 14, 10" da Figura 2, 6, 14, 10" daFigura 3, e 8, 12, 10'" da Figura 4) sejam mostrados esquematicamente edescritos em separado, isto é, apenas para fins de explicação. Será entendi-do que alguns ou todos estes processos ou dispositivos podem ser combi-nados em um único processo ou dispositivo ou combinados de várias manei-ras em múltiplos processos ou dispositivos. Por exemplo, na disposição daFigura 9 abaixo, uma topologia de alimentação direta como no exemplo daFigura 1, o processo ou dispositivo que calcula os parâmetros de modifica-ção atua desta forma em reposta à excitação suavizada obtida a partir dosinal de áudio e de uma intensidade acústica alvo específica. Na Figura 9, odispositivo ou processo que calcula os parâmetros de modificação implicita-mente calcula a intensidade acústica específica do sinal de áudio.
Como um aspecto da presente invenção, na Figura 1 e em ou-tros exemplos de modalidades da presente invenção, a intensidade acústicaalvo específica (N[b, t]) pode ser calculada por meio da graduação da inten-sidade acústica específica (N[b, t]) com um ou mais fatores de graduação. Agraduação pode ser uma graduação de fator de escala variante no tempo ena freqüência Ξ [b, t] da intensidade acústica específica como na relaçãoN[b, t] = Ξ [b, t] N[b, t],uma graduação de fator de escala variante no tempo, invariante na freqüên-cia Φ [t] da intensidade acústica específica como na relação
N[b, t] = Φ [t] N[b, t],uma graduação de fator de escala invariante no tempo, variante na freqüên-cia Θ [b] da intensidade acústica específica como na relaçãoN[b, t] = Θ [b] N[b, t], ou
uma graduação de fator de escala α da intensidade acústica específica co-mo na relação
N[b, t] = α N[b, t],
onde b é uma medida de freqüência (por exemplo, o número da banda) e t éuma medida de tempo (por exemplo, o número do bloco). Múltiplas gradua-ções podem também ser empregadas, usando múltiplas instâncias de umagraduação em particular e/ou combinações de graduações particulares. E-xemplos destas múltiplas graduações são apresentados abaixo. Em algunscasos, conforme explicado em mais detalhe abaixo, a graduação pode seruma função do sinal de áudio ou a medida do sinal de áudio. Em outros ca-sos, também conforme explicado em mais detalhe abaixo, quando a gradua-ção não é uma função de uma medida do sinal de áudio, a graduação pode-rá ser determinada ou suprida de outra maneira. Por exemplo, um usuáriopode selecionar ou aplicar um fator de escala invariante no tempo e freqüên-cia α ou um fator de escala invariante no tempo, variante na freqüência 0[b].
Assim, a intensidade acústica alvo específica pode ser expressacomo uma ou mais funções F do sinal de áudio ou medida do sinal de áudio(a intensidade acústica específica sendo uma medida possível do sinal deáudio):
N[b, t] = F(N[b, t]).
Desde que a função ou funções F seja inversivo, a intensidadeacústica específica (N[b, t] do sinal de áudio não modificado poderá ser cal-culada como a função ou funções F'1 inversa da intensidade acústica alvoespecífica (N[b, t]):
N[b, t] = F1 (N[b, t]).
Como se notará, a função ou funções F1 inversa é calculada nosexemplos de alimentação e alimentação híbrida de alimentação direta / re-troalimentação das Figuras 2 e 4.
Uma entrada "Selecionar Funções e Parâmetros de Funções"para o Calcular Intensidade acústica alvo específica 6 é mostrada para indi-car que o dispositivo ou processo 6 pode calcular a intensidade acústica alvoespecífica por meio da aplicação de uma ou mais funções de acordo comum ou mais parâmetros de função. Por exemplo, o Calcular Intensidade a-cústica alvo específica 8 pode calcular a função ou funções "F" da intensida-de acústica específica do sinal de áudio a fim de definir a intensidade acústi-ca alvo específica. Por exemplo, a entrada "Selecionar Funções e Parâme-tros de Função" pode selecionar uma ou mais funções em particular que re-caia no um ou mais tipos acima de graduação, juntamente com um ou maisparâmetros de função, tais como as constantes (por exemplo, os fatores deescala) pertencentes às funções.
Os fatores de graduação associados a uma graduação podemservir como uma representação da intensidade acústica alvo específica, umavez que a intensidade acústica alvo específica pode ser computada comouma graduação da intensidade acústica específica, conforme indicado aci-ma. Deste modo, no exemplo da Figura 9, descrita abaixo e acima mencio-nada, a tabela de pesquisa pode ser indexada pelos fatores de escala e ex-citações, de tal modo que o cálculo da intensidade acústica específica e daintensidade acústica alvo específica fique inerente à tabela.
Ao se empregar uma tabela de pesquisa, uma expressão mate-mática de sentença fechada, ou alguma outra técnica, a operação do GerarParâmetros de Modificação 4 (e seus processos ou dispositivos similares 4',4" e 4'" das Figuras 2 a 4) é tal que os cálculos se baseiem no domínio daintensidade acústica perceptiva (psicoacústico) mesmo que a intensidadeacústica específica ou a intensidade acústica alvo específica não tenha sidoexplicitamente calculada. Em ambos os casos, há uma intensidade acústicaespecífica explícita ou há uma intensidade acústica específica nocional, im-plícita. De maneira similar, em ambos os casos, há uma intensidade acústicaalvo específica explícita ou há uma intensidade acústica alvo específica no-cional, implícita. Em qualquer caso, o cálculo dos parâmetros de modificaçãobusca gerar parâmetros de modificação que modifiquem o sinal de áudio afim de reduzir a diferença entre a intensidade acústica específica e uma in-tensidade acústica alvo específica.
Em um ambiente de reprodução tendo um sinal de áudio de in-terferência secundário, tal como um ruído, o Calcular Parâmetros de Modifi-cação 10 (e seus processos ou dispositivos similares 10', 10", 10"' em cadauma das Figuras 2 a 4, respectivamente) pode também receber como umaentrada opcional uma medida de tal sinal de áudio de interferência secundá-rio ou o próprio sinal de interferência secundário como uma de suas entra-das. Tal entrada opcional é mostrada na Figura 1 (e nas Figuras 2 a 4) emlinha pontilhada. A medida de um sinal de interferência secundário pode sera sua excitação, como na Figura 17, descrita abaixo. A aplicação de umamedida do sinal de interferência ou do próprio sinal (pressupondo que o sinalde interferência esteja separadamente disponível para processamento) aoCalcular Parâmetros de Modificação, o processo ou dispositivos 10 da Figu-ra 1 (ou seus processos ou dispositivos similares 10', 10" e 10'" de cada umadas Figuras 2 a 4, respectivamente) permite que tal processo ou dispositivoadequadamente configurado calcule os parâmetros de modificação que le-vam o sinal de interferência em consideração, conforme explicado abaixo noparágrafo "Compensação de Ruído". Nos exemplos das Figuras 2 a 4, o cál-culo da intensidade acústica parcial específica pressupõe que uma medidaadequada de um sinal de interferência é aplicado não somente ao respectivoCalcular Parâmetros de Modificação 10', 10", 10'", mas também ao processoou dispositivo 12 "Calcular Aproximação de Intensidade acústica específicade Áudio Não Modificado" e/ou ao processo ou dispositivo 14 "Calcular A-proximação de Intensidade acústica alvo específica" a fim de facilitar o cál-culo da intensidade acústica parcial específica por aquela função ou disposi-tivo. No exemplo de alimentação direta da Figura 1, a intensidade acústicaparcial específica não é explicitamente calculada - o Calcular Parâmetros deModificação 10 da Figura 1 calcula os parâmetros de modificação apropria-dos para que a intensidade acústica parcial específica do áudio modificadose aproxime da intensidade acústica alvo específica. Isto é explicado emmais detalhe abaixo no parágrafo "Compensação de Ruído", acima mencionado.
Conforme acima mencionado, em cada um dos exemplos dasFiguras 1 a 4, os parâmetros de modificação M1 quando aplicados ao sinalde áudio pelo Modificador de Sinal de áudio 2, reduzem a diferença entre aintensidade acústica específica ou a intensidade acústica parcial específicado áudio modificado resultante e a intensidade acústica alvo específica. Emtermos ideais, a intensidade acústica específica do sinal de áudio modificadose aproxima muito ou é igual à intensidade acústica alvo específica. Os pa-râmetros de modificação M, por exemplo, assumem a forma de fatores deganho variados aplicados às bandas de freqüência obtidas a partir de umbanco de filtros ou aos coeficientes de um filtro variante no tempo. Por con-seguinte, em todos os exemplos das Figuras 1 a 4, o Modificar Sinal de áu-dio 2 pode ser implementado, por exemplo, como uma pluralidade de esca-Iadores de amplitude, cada qual operando em uma banda de freqüência, ouem um filtro variante no tempo (por exemplo, um filtro FIR de diversas deri-vações ou um filtro IIR multipolar).
Aqui ou em qualquer ponto no presente documento, o uso domesmo numerai de referência indica que o dispositivo ou processo pode sersubstancialmente idêntico ao outro ou a outros que tenham o mesmo nume-rai de referência. Os numerais de referência com números aspeados (porexemplo, 10"') indicam que o dispositivo ou processo é similar em estruturaou função, mas pode ser uma modificação de um outro ou outros que te-nham o mesmo numerai de referência básico ou suas versões iniciadas.
Sob certas limitações, uma disposição de retroalimentação qua-se equivalente ao exemplo de alimentação direta da Figura 1 pode ser pro-duzida. A Figura 2 ilustra tal exemplo no qual o sinal de áudio é também a-plicado a um processo ou dispositivo 2 Modificar Sinal de áudio em um traje-to de sinal. O processo ou dispositivo 2 também recebe os parâmetros demodificação M de um trajeto de controle no qual um processo ou dispositivo4' Gerar Parâmetros de Modificação em uma dispositivo de retroalimentaçãorecebe como entrada o sinal de áudio modificado a partir da saída do Modifi-car Sinal de áudio 2. Desta forma, na Figura 2, o áudio modificado, ao invésdo áudio não modificado, é aplicado ao trajeto de controle. O processo oudispositivo 2 Modificar Sinal de áudio e o processo ou dispositivo 4' GerarParâmetros de Modificação modificam o sinal de áudio a fim de reduzir adiferença entre a sua intensidade acústica específica e uma intensidade a-cústica alvo específica. O processo ou dispositivo 4 pode incluir várias fun-ções e ou dispositivos: um processo ou dispositivo 12 "Calcular Aproximaçãode Intensidade acústica específica de Áudio Não Modificado", um processoou dispositivo 14 "Calcular Aproximação de Intensidade acústica alvo espe-cífica", e um processo ou dispositivo 10' "Calcular Parâmetros de Modifica-ção" que calcula os parâmetros de modificação.
Com a limitação de que a função ou funções F é inversiva, oprocesso ou dispositivo 12 estima a intensidade acústica específica do sinalde áudio não modificado ao aplicar a função inversa F1 à intensidade acústi-ca específica ou à intensidade acústica parcial específica do sinal de áudiomodificado. O dispositivo ou processo 12 pode calcular uma função inversaF1 conforme acima descrito. Isto é indicado esquematicamente na Figura 2como uma entrada "Selecionar Funções F"1 Inversas e Parâmetros de Fun-ção" para o processo ou dispositivo 12. O "Calcular Aproximação de Intensi-dade acústica alvo específica" '4 opera por meio do cálculo da intensidadeacústica específica ou intensidade acústica parcial específica do sinal deáudio modificado. Tal intensidade acústica ou intensidade acústica parcialespecífica é uma aproximação da intensidade acústica alvo específica. Aaproximação da intensidade acústica específica do sinal de áudio não modi-ficado e a aproximação da intensidade acústica alvo específica são usadaspelo Calcular Parâmetros de Modificação 10' a fim de obter os parâmetrosde modificação M, que, quando aplicado ao sinal de áudio pelo ModificarSinal de áudio 2, reduz a diferença entre a intensidade acústica específicaou a intensidade acústica parcial específica do áudio modificado e a intensi-dade acústica alvo específica. Conforme acima mencionado, estes parâme-tros de modificação M podem, por exemplo, assumir a forma de ganhos va-riantes no tempo aplicados às bandas de freqüência de um banco de filtrosou aos coeficientes de um filtro variante no tempo. Nas modalidades práticasdo Calcular Parâmetros de Modificação 10", um laço de retroalimentaçãopoderá introduzir um retardo entre a computação e a aplicação dos parâme-tros de modificação M.
Conforme acima mencionado, em um ambiente de reproduçãotendo um sinal de áudio de interferência secundário, tal como um ruído, oCalcular Parâmetros de Modificação 10', o Calcular Aproximação de Intensi-dade acústica específica de Áudio Não Modificado 12, e o Calcular Aproxi-mação da Intensidade acústica alvo específica 14 poderão também recebercomo uma entrada opcional uma medida de tal sinal de áudio de interferên-cia secundário ou o próprio sinal de interferência secundário como uma desuas entradas e o processo ou dispositivo 12 ou o processo ou dispositivo14 poderão calcular a intensidade acústica parcial específica do sinal de áu-dio modificado. Estas entradas opcionais são mostradas na Figura 2, naslinhas pontilhadas.
Conforme acima mencionado, exemplos de implementação hí-brida de alimentação direta / retroalimentação dos aspectos da presente in-venção são possíveis. As Figuras 3 e 4 mostram dois exemplos de tais im-plementações. Nas Figuras 3 e 4, assim como nas Figuras 1 e 2, um sinal deáudio é também aplicado a um processo ou dispositivo Modificar Sinal deáudio em um trajeto de sinal, mas o Gerar Parâmetros de Modificação (4" naFigura 3 e 4'" na Figura 4) em respectivos trajetos de controle recebe tantoum sinal de áudio não modificado como um sinal de áudio modificado. Emambas as Figuras 3 e 4, o Modificar Sinal de áudio 2 e o Gerar Parâmetrosde Modificação (4" e 4"', respectivamente) modificam o sinal de áudio a fimde reduzir a diferença entre sua intensidade acústica específica, que podeser implícita, e uma intensidade acústica alvo específica, que também podeser implícita.
No exemplo da Figura 3, o processo ou dispositivo 4' Gerar Pa-râmetros de Modificação pode incluir diversas funções e ou dispositivos: umCalcular Intensidade acústica alvo específica 6, como na Figura 1, um Calcu-lar Aproximação de Intensidade acústica alvo específica 14, como na retroa-limentação da Figura 2, e um processo ou dispositivo 10" "Calcular Parâme-tros de Modificação". Como na Figura 1, na porção de alimentação diretadeste exemplo híbrido de alimentação direta / retroalimentação, o CalcularIntensidade acústica alvo específica 6 pode realizar uma ou mais funções"F", cada uma das quais podendo ter parâmetros de função. Isto é indicadoesquematicamente na Figura 3 como uma entrada "Selecionar Funções F eParâmetros de Função" ao processo ou dispositivo 6. Na porção de retroali-mentação deste exemplo híbrido de alimentação direta / retroalimentação, osinal de áudio modificado é aplicado a um Calcular Aproximação de Intensi- dade acústica alvo específica 14, como na retroalimentação da Figura 2. Oprocesso ou dispositivo 14 opera no exemplo da Figura 3 e no exemplo daFigura 2 por meio do cálculo da intensidade acústica específica ou da inten-sidade acústica parcial específica do sinal de áudio modificado. Tal intensi-dade acústica específica ou intensidade acústica parcial específica é uma aproximação da intensidade acústica alvo específica. A intensidade acústicaalvo específica (do processo ou dispositivo 6) e a aproximação da intensida-de acústica alvo específica (do processo ou dispositivo 14) são aplicadas aoCalcular Parâmetros de Modificação 10" a fim de obter os parâmetros demodificação M que, quando aplicados ao sinal de áudio pelo Modificar Sinalde áudio 2, reduzem a diferença entre a intensidade acústica específica dosinal de áudio não modificado e a intensidade acústica alvo específica. Con-forme acima mencionado, os parâmetros de modificação M, podem, por e-xemplo, assumir a forma de ganhos variantes no tempo aplicados às bandasde freqüência de um banco de filtros ou aos coeficientes de um filtro variante no tempo. Nas modalidades práticas, um laço de retroalimentação poderáintroduzir um retardo entre a computação e a aplicação dos parâmetros demodificação M. Conforme acima mencionado, em um ambiente de reprodu-ção tendo um sinal de áudio de interferência secundário, tal como um ruído,o Calcular Parâmetros de Modificação 10", e o Calcular Aproximação de In-tensidade acústica alvo específica 14 poderão também receber como umaentrada opcional uma medida de tal sinal de áudio de interferência secundá-rio ou o próprio sinal de interferência secundário como uma de suas entra-das e o processo ou dispositivo 14 poderão calcular a intensidade acústicaparcial específica do sinal de áudio modificado. Estas entradas opcionaissão mostradas na Figura 3, nas linhas pontilhadas.
O Calcular Parâmetros de Modificação 10" poderá empregar umdispositivo ou função de detecção de erro, de tal modo que as diferençasentre a sua intensidade acústica alvo específica e as entradas de aproxima-ção de intensidade acústica alvo de especificação ajustem os Parâmetros deModificação de modo a reduzir as diferenças entre a aproximação da inten-sidade acústica alvo específica e a intensidade acústica alvo específica "cor-rente". Estes ajustes reduzem as diferenças entre a intensidade acústicaespecífica do sinal de áudio não modificado e a intensidade acústica alvoespecífica, que pode ser implícita, desta forma, os parâmetros de modifica-ção M podem ser atualizados com base em um erro entre a intensidade a -cústica alvo específica, computada no trajeto da alimentação direta a partirda intensidade acústica específica do áudio original usando a função F, e aaproximação da intensidade acústica alvo específica computada no trajetode retroalimentação a partir da intensidade acústica específica ou da intensi-dade acústica parcial específica do áudio modificado.
Na Figura 4, é mostrado um exemplo de alimentação direta / re-troalimentação alternativa. Esta alternativa difere do exemplo da Figura 3 nosentido de que a função ou funções F1 inversa é calculada no trajeto de re-troalimentação ao invés de a função ou funções F ser calculada no trajeto dealimentação direta. Na Figura 4, o processo ou dispositivo 4' Gerar Parâme-tros de Modificação pode incluir diversas funções e ou dispositivos: um Cal-cular Intensidade acústica específica 8, como no exemplo da alimentaçãodireta da Figura 1, um Calcular Aproximação de Intensidade acústica especí-fica de Áudio Não Modificado 12, como no exemplo da retroalimentação daFigura 2, e um Calcular Parâmetros de Modificação 10"'. Como no exemploda alimentação direta da Figura 1, o Calcular Intensidade acústica específica8 provê, como uma entrada ao Calcular Parâmetros de Modificação 10"', aintensidade acústica específica do sinal de áudio não modificado. Como noexemplo de retroalimentação da Figura 2, com a limitação de que a funçãoou funções F ser inversiva, o processo ou dispositivo 12 estima a intensida-de acústica específica do sinal de áudio não modificado por meio da aplica-ção da função F1 inversa à intensidade acústica específica ou à intensidadeacústica parcial específica do sinal de áudio modificado. Uma entrada "Sele-cionar Funções Inversas e Parâmetros de Funções Inversas" para o CalcularAproximação de Intensidade acústica específica de Áudio Não Modificado 12é mostrada para indicar que o dispositivo ou processo 12 pode calcular umafunção inversa F-1, conforme acima descrito. Isto é indicado esquematica-mente na Figura 4 como uma entrada "Selecionar Funções Inversas F-1 eParâmetros de Função" ao processo ou dispositivo 12. Desta forma, o pedi-do 12 provê como uma outra entrada ao Calcular Parâmetros de Modificação10"' uma aproximação à intensidade acústica específica do sinal de áudionão modificado.
Como nos exemplos das Figuras 1 a 3, o Calcular Parâmetrosde Modificação 10"' obtém os parâmetros de modificação M que, quandoaplicados ao sinal de áudio pelo Modificar Sinal de áudio 2, reduzem a dife-rença entre a intensidade acústica específica do sinal de áudio não modifi-cado e a intensidade acústica alvo específica, que é implícita neste exemplo.Conforme acima mencionado, os parâmetros de modificação M, podem, por25 exemplo, assumir a forma de ganhos variantes no tempo aplicados às ban-das de freqüência de um banco de filtros ou aos coeficientes de um filtro va-riante no tempo. Nas modalidades práticas, um laço de retroalimentação po-derá introduzir um retardo entre a computação e a aplicação dos parâmetrosde modificação M. Conforme acima mencionado, em um ambiente de repro-30 dução tendo um sinal de áudio de interferência secundário, tal como um ruí-do, o Calcular Parâmetros de Modificação 10"' e o Calcular Aproximação deIntensidade acústica específica do Áudio Não Modificado 12 poderão tam-bém receber como uma entrada opcional uma medida de tal sinal de áudiode interferência secundário ou o próprio sinal de interferência secundáriocomo uma de suas entradas e o processo ou dispositivo 12 poderá calculara intensidade acústica parcial específica do sinal de áudio modificado. Estasentradas opcionais são mostradas na Figura 4, nas linhas pontilhadas.
O Calcular Parâmetros de Modificação 10"' pode empregar umdispositivo ou função de detecção de erro, de tal modo que as diferençasentre a sua intensidade acústica específica e as entradas de aproximação deintensidade acústica específica produzam saídas que ajustem os Parâme-tros de Modificação de modo a reduzir as diferenças entre a aproximação daintensidade acústica específica e a intensidade acústica específica "corren-te". Uma vez que a aproximação da intensidade acústica específica é obtidaa partir da intensidade acústica específica ou da intensidade acústica parcialespecífica do áudio modificado, que pode ser vista como uma aproximaçãoda intensidade acústica alvo específica, estes ajustes reduzem as diferençasentre a intensidade acústica específica do sinal de áudio modificado e a in-tensidade acústica alvo específica, que é inerente na função ou funções F1.Desta forma, os parâmetros de modificação M podem ser atualizados combase em um erro entre a intensidade acústica específica, computada no tra-jeto da alimentação direta do áudio original, e a aproximação da intensidadeacústica específica computada, usando a função ou funções F1 inversa, notrajeto de retroalimentação a partir da intensidade acústica específica ou daintensidade acústica parcial específica do áudio modificado. Devido ao traje-to de retroalimentação, implementações práticas poderão introduzir um re-tardo entre a atualização e a aplicação dos parâmetros de modificação.
Embora os parâmetros de modificação M nos exemplos das Fi-guras 1 a 4, quando aplicados a um processo ou dispositivo 2 Modificar Sinalde áudio, reduzam a diferença entre a intensidade acústica específica dosinal de áudio e a intensidade acústica alvo específica, nas modalidades prá-ticas, os parâmetros de modificação correspondentes produzidos em respos-ta ao mesmo sinal de áudio poderão não ser idênticos entre si.
Embora não crítico ou essencial aos aspectos da presente in-venção, o cálculo da intensidade acústica específica do sinal de áudio ou dosinal de áudio modificado poderá com vantagem empregar as técnicas apre-sentadas no dito Pedido de Patente Internacional Ne PCT/US2004/016964,publicado como o documento WO 2004/111964 A2, no qual o cálculo sele-ciona, a partir de um grupo de duas ou mais funções de modelo de intensi-dade acústica específica, uma ou uma combinação de duas ou mais funçõesde modelo de intensidade acústica específica, cuja seleção é controlada pelamedida das características do sinal de áudio de entrada. A descrição da In-tensidade acústica específica 104 da Figura 1, abaixo, descreve tal disposição.
De acordo com outros aspectos da presente invenção, o sinal deáudio não modificado ou (1) os parâmetros de modificação ou (2) a intensi-dade acústica alvo específica ou uma representação da intensidade acústicaalvo específica (por exemplo, os fatores de escala utilizáveis no cálculo ex-plícito ou implícito da intensidade acústica alvo específica) podem ser arma-zenados ou transmitidos para uso, por exemplo, em um dispositivo ou pro-cesso temporalmente e/ou espacialmente separados. Os parâmetros de mo-dificação, a intensidade acústica alvo específica, ou a representação da in-tensidade acústica alvo específica podem ser determinados de uma maneiraadequada, como, por exemplo, em um dentre os exemplos de disposição dealimentação direta, de alimentação, ou de alimentação dianteira e retroali-mentação híbrida das Figuras 1 a 4, conforme descrito acima. Na prática,uma disposição de alimentação direta, como no exemplo da Figura 1, é amenos complicada e mais rápida, uma vez que evita os cálculos baseadosno sinal de áudio modificado. Um exemplo de transmissão ou armazena-mento do áudio não modificado e dos parâmetros de modificação é mostra-do na Figura 5, enquanto um exemplo da transmissão ou armazenamento doáudio não modificado e da intensidade acústica alvo específica ou uma re-presentação da intensidade acústica alvo específica é mostrado na Figura 6.
Uma disposição como a do exemplo da Figura 5 pode ser usadapara separar temporal e/ou espacialmente a aplicação dos parâmetros demodificação ao sinal de áudio a partir da geração de tais parâmetros de mo-dificação. Uma disposição tal como a da Figura 6 pode ser usada de modo aseparar temporal e/ou espacialmente tanto a geração como a aplicação dosparâmetros de modificação da geração da intensidade acústica alvo especí-fica ou sua representação. Ambos os tipos de disposições possibilitam umadisposição de reprodução ou recepção de baixo custo, evitando a complexi-dade de se gerar parâmetros de modificação ou de se gerar a intensidadeacústica alvo específica. Embora um tipo de disposição da Figura 5 sejamais simples que o tipo de disposição da Figura 6, a disposição da Figura 6tem a vantagem de a informação requerida para ser armazenada ou transmi-tida poder ser muito menor, particularmente quando uma representação daintensidade acústica específica, tal como um ou mais fatores de escala, éarmazenada ou transmitida. Tal redução de armazenamento ou transmissãode informação pode ser particularmente útil em ambientes de áudio de baixataxa de bits.
Por conseguinte, outros aspectos da presente invenção são aprovisão de um dispositivo ou processo (1) que recebe ou reproduz, a partirde um armazenador ou dispositivo ou processo de transmissão, parâmetrosde modificação M e aplica os mesmos a um sinal de áudio que é tambémrecebido ou (2) que recebe ou reproduz, a partir de um armazenador ou dis-positivo ou processo de transmissão, uma intensidade acústica alvo especí-fica ou representação de uma intensidade acústica alvo específica, gera pa-râmetros de modificação M por meio da aplicação da intensidade acústicaalvo específica ou sua representação para o sinal de áudio que é tambémrecebido (ou para uma medida do sinal de áudio tal como sua intensidadeacústica específica, que pode ser obtida a partir do sinal de áudio), e aplicaos parâmetros de modificação M para o sinal de áudio recebido. Estes dis-positivos ou processos podem ser caracterizados como processos de deco-dificação ou decodificadores; enquanto os dispositivos ou processos reque-ridos para produzir as informações armazenadas ou transmitidas podem sercaracterizados como processos de codificação ou codificadores. Estes pro-cessos de codificação ou codificadores são as porções dos exemplos dedisposição das Figuras 1 a 4 utilizáveis para se produzir as informações re-queridas pelos respectivos processos de decodificação ou decodificadores.Estes processadores de decodificação ou decodificadores podem ser asso-ciados a ou operativos com virtualmente qualquer tipo de processo ou dispo-sitivo que processe e/ou reproduza som.
Em um aspecto da presente invenção, como no exemplo da Fi-gura 5, o sinal de áudio não modificado e os parâmetros de modificação Mproduzidos, por exemplo, por um processo de geração ou gerador de parâ-metros de modificação, tais como o Gerar Parâmetros de modificação 4 daFigura 1, 4' da Figura 2, 4" da Figura 3 ou 4'" da Figura 4, podem ser aplica-dos a qualquer dispositivo ou função de armazenamento ou transmissão a-dequado ("Armazenar ou Transmitir") 16. No caso de se usar o exemplo dealimentação direta da Figura 1 como um processo de codificação ou codifi-cador, o Modificar Sinal de áudio 2 não precisará gerar o áudio modificado epoderá ser omitido quando não houver nenhuma exigência no sentido deprover o áudio modificado no local temporal ou espacial do codificador ouprocesso de codificação. O Armazenar ou Transmitir 16 pode incluir, por e-xemplo, qualquer dispositivo de armazenamento e reprodução magnético,óptico, ou de estado sólido ou qualquer dispositivo de transmissão e recep-ção de fio ou sem fio, a escolha dos mesmos não sendo uma questão críticapara a presente invenção. Os parâmetros de modificação reproduzidos ourecebidos podem então ser aplicados a um Modificar Sinal de áudio 2, dotipo empregado nos exemplos das Figuras 1 a 4, a fim de modificar o sinalde áudio reproduzido ou recebido de modo que sua intensidade acústicaespecífica se aproxime da intensidade acústica alvo específica da ou ineren-te à disposição na qual os parâmetros de modificação são obtidos. Os parâ-metros de modificação podem ser armazenados ou transmitidos de diversasmaneiras. Por exemplo, eles podem ser armazenados ou transmitidos comometadados anexos ao sinal de áudio, os mesmos podem ser enviados emseparados trajetos ou canais, podem ser codificados de maneira estegano-gráfica no áudio, podem ser multiplexados, etc. o uso dos parâmetros demodificação para modificar o sinal de áudio pode ser opcional e, se opcional,o seu uso pode ser selecionado, por exemplo, por um usuário. Por exemplo,os parâmetros de modificação, quando aplicados ao sinal de áudio, podemreduzir a faixa dinâmica do sinal de áudio. Empregar ou não tal redução defaixa dinâmica pode ser selecionado por um usuário.
Em um outro aspecto da presente invenção, como no exemploda Figura 6, o sinal de áudio não modificado e a intensidade acústica alvoespecífica ou representação da intensidade acústica alvo específica podeser aplicada a qualquer dispositivo ou função de armazenamento ou trans-missão adequado ("Armazenar ou Transmitir") 16. No caso de se usar umaconfiguração de alimentação direta, tal como no exemplo da Figura 1, comoum processo de codificação ou um codificador, nem um processo ou disposi-tivo do tipo Calcular Parâmetros de modificação 10, nem um processo oudispositivo do tipo Modificar Sinal de áudio 2 seria necessário e poderiam seromitidos caso não haja nenhuma exigência no sentido prover parâmetros demodificação ou o áudio modificado no local temporal ou espacial do codifica-dor ou processo de codificação. Como no caso da Figura 5, o Armazenar ouTransmitir 16 pode incluir, por exemplo, qualquer dispositivo de armazena-mento e reprodução magnético, óptico, ou de estado sólido ou qualquer dis-positivo de transmissão e recepção de fio ou sem fio adequado, a escolhados mesmos não sendo uma questão crítica para a presente invenção. Aintensidade acústica alvo específica reproduzida ou recebida ou representa-ção da intensidade acústica alvo específica pode então ser aplicada, junta-mente com o áudio não modificado, a um Calcular Parâmetros de modifica-ção 10, do tipo empregado no exemplo da Figura 1, ou a um Calcular Parâ-metros de modificação 10", do tipo empregado no exemplo da Figura 3, a fimde prover os parâmetros de modificação M que podem então ser aplicados aum Modificar Sinal de áudio 2, do tipo empregado nos exemplos das Figuras1 a 4, a fim de modificar o sinal de áudio reproduzido ou recebido de modoque sua intensidade acústica específica se aproxime da intensidade acústicaalvo específica da ou inerente à disposição na qual os parâmetros de modifi-cação são obtidos. Embora a intensidade acústica alvo específica ou suarepresentação possa ser mais prontamente obtida em um processo de codi-ficação ou codificador do tipo da Figura 1, a intensidade acústica alvo espe-cífica ou sua representação ou uma aproximação à intensidade acústica alvoespecífica ou sua representação pode ser obtida em um processo de codifi-cação ou codificador das Figuras 2 a 4 (as aproximações são calculadas nosprocessos ou dispositivos 14 das Figuras 2 e 3 e no processo ou dispositivo12 da Figura 4). A intensidade acústica alvo específica ou sua representaçãopode ser armazenada ou transmitida de diversas maneiras. Por exemplo, amesma pode ser armazenada ou transmitida como metadados anexados aosinal de áudio, pode ser enviada em trajetos ou canais separados, pode sercodificada de maneira esteganográfica no áudio, pode ser multiplexada, etc.O uso dos parâmetros de modificação obtidos da intensidade acústica alvoespecífica armazenada ou transmitida ou representação para modificar osinal de áudio pode ser opcional e, se opcional, o seu uso pode ser selecio-nado, por exemplo, por um usuário. Por exemplo, os parâmetros de modifi-cação, quando aplicados ao sinal de áudio, podem reduzir a faixa dinâmicado sinal de áudio. Empregar ou não tal redução de faixa dinâmica pode serselecionado por um usuário.
Ao se implementar a presente invenção como um sistema digital,uma configuração de alimentação direta é mais prática, e exemplos de taisconfigurações são, portanto, descritos abaixo em detalhe, ficando entendidoque o âmbito de aplicação da presente invenção não se limita aos mesmos.
Por todo o presente documento, termos tais como "filtro" ou"banco de filtros" são usados de modo a incluir essencialmente qualquerforma de filtragem recursiva ou não recursiva, tal como os filtros IIR ou trans-formadores, e as informações "filtradas" são o resultado da aplicação de taisfiltros. As modalidades descritas abaixo empregam bancos de filtro imple-mentados por transformadores.
A Figura 7 ilustra detalhes de uma modalidade exemplar de umaspecto da presente invenção incorporada em uma disposição de alimenta-ção direta. O áudio, primeiramente, passa por uma função ou dispositivo debanco de filtros de análise ("Banco de filtros de Análise") 100, que divide osinal de áudio em uma pluralidade de bandas de freqüência (assim, a Figura5 mostra múltiplas saídas do Banco de filtros de Análise 100, cada saídarepresentando uma banda de freqüência, cuja saída carrega as várias fun-ções ou dispositivos até um banco de filtros de síntese, que soma as bandasem um sinal de banda larga combinado, conforme descrito em mais detalheabaixo). A resposta do filtro associado a cada banda de freqüência no Bancode filtros de Análise 100 é concebida de modo a simular a resposta em umlocal em particular da membrana basilar no ouvido interno. A saída de cadafiltro no Banco de filtros de Análise 100, em seguida, passa para um filtro detransmissão ou função de filtro de transmissão ("Filtro de Transmissão") 101que simula o efeito de filtragem da transmissão de áudio através do ouvidoexterno e médio. Se apenas a intensidade acústica do áudio tivesse de sermedida, o filtro de transmissão poderia ser aplicado antes do banco de filtrosde análise, mas, uma vez que as saídas do banco de filtros de análise sãousadas para sintetizar o áudio modificado, é vantajoso se aplicar o filtro detransmissão depois do banco de filtros. As saídas do Filtro de transmissão101 em seguida passam para uma função ou dispositivo de excitação ("Exci-tação") 102, cujas saídas simulam a distribuição de energia ao longo damembrana basilar. Os valores da energia de excitação podem ser suaviza-dos com o tempo por meio de uma função ou dispositivo de suavização("Suavização") 103. As constantes do tempo da função de suavização sãodefinidas de acordo com as exigências de uma aplicação desejada. Os si-nais de excitação suavizados são em seguida convertidos em intensidadeacústica específica na função ou dispositivo de intensidade acústica especí-fica ("Intensidade acústica específica" (SL)") 104. A intensidade acústica es-pecífica é representada em unidades de sone por freqüência unitária. Ocomponente de intensidade acústica específica associado a cada bandapassa para uma função ou dispositivo de modificação ou dispositivo de mo-dificação de intensidade acústica específica ("Modificação de SL") 105. Amodificação de SL 105 toma como sua entrada a intensidade acústica espe-cífica original e em seguida emite uma intensidade acústica específica "alvo"ou desejada, que, de acordo com um aspecto da presente invenção é depreferência uma função da intensidade acústica específica original (vide a-baixo o parágrafo intitulado "Intensidade acústica alvo específica". A modifi-cação de SL 105 pode operar de forma independente em cada banda, oupode haver uma interdependência entre bandas (uma suavização de fre-qüência, conforme sugerido pelas linhas cruzadas na Figura 7), dependendodo efeito desejado. Ao se tomar como suas entradas os componentes debanda de freqüência de excitação suavizada da Excitação 102 e a intensida-de acústica alvo específica da Modificação de SL 105, uma função ou dispo-sitivo de solucionador de ganho ("Solucionador de Ganho") 106 determina oganho que precisa ser aplicado a cada banda da saída do Banco de filtrosde Análise 100 a fim de transformar a intensidade acústica específica medi-da na intensidade acústica alvo específica. O solucionador de ganho podeser implementado de várias maneiras. Por exemplo, o Solucionador de ga-nho pode incluir um processo iterativo, tal como o apresentado no dito Pedi-do de Patente Internacional Ne PCT/US2004/016964, publicado como o do-cumento WO 2004/111994 A2, ou de maneira alternativa, uma pesquisa detabela. Embora os ganhos por banda gerados pelo Solucionador de Ganho106 possam ser mais suavizados ao longo do tempo por meio da função oudispositivo de suavização opcional ("Suavização") 107 a fim de minimizar osartefatos perceptivos, é preferido que a suavização temporal seja aplicadaem qualquer lugar por todo o processo ou dispositivo, conforme descrito.Finalmente, os ganhos são aplicados às respectivas bandas do Banco defiltros de Análise 100 através de uma função de combinação ou combinadormultiplicativa 108, e o áudio processado ou "modificado" é sintetizado a par-tir das bandas modificadas no ganho em uma função ou dispositivo de bancode filtros de síntese ("Banco de filtros de Síntese) 110. Além disso, as saídasdo banco de filtros de análise podem ser atrasadas por uma função ou dis-positivo de retardo ("Retardo") 109 antes da aplicação dos ganhos a fim decompensar qualquer latência associada à computação de ganho. De manei-ra alternativa,_ao invés de se calcular os ganhos para uso na aplicação demodificações de ganho em bandas de freqüência, os Solucionadores de Ga-nho 106 podem calcular os coeficientes de filtro que controlam um filtro vari-ante no tempo, tal como um filtro FIR de diversas derivas ou um filtro IIRmultipolar. Para fins de simplicidade da exposição, aspectos da presenteinvenção são principalmente descritos empregando fatores de ganho aplica-dos às bandas de freqüência, sendo entendido que os coeficientes de filtro eos filtros variantes no tempo podem também ser empregados em modalida-des práticas.
Nas modalidades práticas, o processamento do áudio pode serfeito no domínio digital. Por conseguinte, o sinal de entrada de áudio é indi-cado pela seqüência de tempo discreta χ [n] que é amostrada a partir da fon-te de áudio em alguma freqüência de amostragem fs. Supõe-se que a se-qüência χ [n] seja apropriadamente graduada de modo que a força rms de χ [n] em decibéis dada por
<formula>formula see original document page 38</formula>
seja igual ao nível de pressão de som em dB no qual o áudio é ouvido porum ouvinte humano. Além disso, pressupõe-se que o sinal de áudio sejamonofônico para fins de simplicidade de exposição. O Banco de filtros de Análise 100, o Filtro de transmissão 101, aExcitação 102, a Intensidade acústica específica 104, a Modificação de In-tensidade acústica específica 105, o Solucionador de Ganho 106, e o Bancode filtros de Síntese 110 podem ser descritos em mais detalhes como segue.O Banco de filtros de Análise 100 O sinal de entrada de áudio é aplicado a um banco de filtros deanálise ou função de banco de filtros ("Banco de filtros de Análise") 100. Ca-da filtro do Banco de filtros de Análise 100 é concebido para simular a res-posta de freqüência em um local em particular ao longo da membrana basi-lar do ouvido interno. O banco de filtros 100 pode incluir um conjunto de fil- tros lineares cuja largura de banda e espaçamento são constantes na escalade freqüência de Largura de banda Retangular Equivalente (ERB), comodefinido por Moore, Glasberg e Baer (B. C. J. Moore, B. Glasberg, T. Baer,"A Model for the Prediction of Thresholds, Loudness, and Partial Loudness",supra).
Embora a escala de freqüência ERB combine mais proximamen-te com a percepção humana e mostre um desempenho melhor na produçãode medições de intensidade acústica objetiva que correspondem aos resul-tados de intensidade acústica subjetiva, a escala de freqüência de Bark podeser empregada com menor desempenho.
Para uma freqüência central / em hertz, a largura de uma bandaERB em hertz pode ser aproximada como:
ERB (/) = 24.7 (4.37//1000 +1) (1)
A partir desta relação uma escala de freqüência deformada édefinida de tal modo que em qualquer ponto ao longo da escala deformada,a ERB correspondente em unidades da escala deformada seja igual a um. Afunção de conversão de freqüência linear em hertz nesta escala de freqüên-cia ERB é obtida por meio da integração da recíproca da Equação 1:
<formula>formula see original document page 39</formula>
É igualmente útil expressar a transformação da escala ERB no-vamente na escala de freqüência linear por meio da solução da Equação 2apara /:
<formula>formula see original document page 39</formula>
na qual e é em unidades da escala ERB. A Figura 9 mostra a relação entre aescala ERB e a freqüência em hertz.
O Banco de filtros de Análise 100 pode incluir os filtros auditivosB, referidos como bandas, nas freqüências centrais fc [1] fc [B] espaçadasuniformemente ao longo da escala ERB. Mais especificamente,
<formula>formula see original document page 39</formula>
em que Δ é o espaçamento ERB desejado do Banco de filtros de Análise100, e nas quais fmm e /max são as freqüências centrais mínima e máximadesejadas, respectivamente. Pode-se escolher Δ = 1, levando-se em consi-deração a faixa de freqüência sobre a qual o ouvido humano é sensível, epode-se definir /min = 50 Hz e Zmax = 20.000 Hz. Com tais parâmetros, porexemplo, a aplicação das Equações 3a a c produz B = 40 filtros auditivos.
A resposta de freqüência de magnitude de cada filtro auditivopode ser caracterizado por uma função exponencial arredondada, conformesugerido por Moore e Glasberg. Em termos específicos, a resposta de mag-nitude de um filtro com uma freqüência central fc [b] pode ser computadacomo:
<formula>formula see original document page 40</formula>
Nas quais as respostas de magnitude de tais filtros auditivos Bque se aproxima da formação de banda crítica na escala ERB são mostra-das na Figura 10.
As operações de filtragem do Banco de filtros de Análise 100podem ser adequadamente aproximadas usando uma Transformação Dis-creta de Fourier de comprimento finito, normalmente referida como a Trans-formação Discreta de Fourier de Tempo Curto (STDFT), uma vez que sesupõe que uma implementação executada nos filtros na taxa de amostragemdo sinal de áudio, referida como uma implementação taxa plena ("full-rate"),provenha uma resolução mais temporal que o necessário para precisas me-dições de intensidade acústica. Ao se usar a STDFT ao invés de uma im-plementação taxa plena ("full-rate"), um aumento da eficiência e uma redu-ção da complexidade computacional podem ser obtidas.
A transformação STDFT do sinal de áudio de entrada x[n] é defi-nida como:
<formula>formula see original document page 40</formula>na qual k é o índice de freqüência, t é o índice de bloco de tempo, N é o ta-manho da DFT, T é o tamanho do segmento hop, e w[n] é uma janela detamanho N normalizada de modo que
<formula>formula see original document page 40</formula>
Observa-se que a variável t na Equação 5a é um índice discretorepresentando o bloco de tempo da STDFT em oposição a uma medida detempo em segundos. Cada incremento em t representa um segmento hop deamostras T ao longo do sinal x{n]. As referências subseqüentes ao índice tpressupõem esta definição. Embora diferentes definições de parâmetros eformas de janelas possam ser usadas dependendo dos detalhes da imple-mentação, para fs = 44100 Hz, escolher N = 2048, T = 1024, e ter w[n] comouma janela de Hanning oferece um equilíbrio de tempo e resolução de fre-qüência adequados. A STDFT descrita acima pode ser mais eficiente utili-zando a Transformação Rápida de Fourier (FFT).
Ao invés da STDFT, a Transformação Discreta de Co-seno Mo-dificada (MDCT) pode ser utilizada para implementar o banco de filtros deanálise. A MDCT é uma transformação normalmente usada em codificadoresde áudio perceptivos, tais como os Dolby AC-3. Quando o sistema apresen-tado é implementado com tal áudio codificado perceptivamente, a medição ea modificação da intensidade acústica apresentadas poderão mais eficien-temente implementadas por meio do processamento dos coeficientes daMDCT existentes do áudio codificado, desta forma eliminando a necessidadede se fazer a transformação do banco de filtros de análise. A MDCt do sinalde áudio de entrada x[n] é calculada por:
<formula>formula see original document page 41</formula>
na qual 2
De modo geral, o tamanho do segmento hop T é exatamente ametade do comprimento N da transformação de modo a ser possível umaperfeita reconstrução do sinal x[n].
Filtro de Transmissão 101
As saídas do Banco de filtros de Análise 100 são aplicadas a umfiltro de transmissão ou a uma função de filtro de transmissão ("Filtro detransmissão") 101 que filtra cada banda do banco de filtros de acordo com atransmissão do áudio através do ouvido externo e intermediário. A Figura 8ilustra uma resposta de freqüência de magnitude adequada do filtro detransmissão, P(f), através da faixa de freqüência audível. A resposta é umaunidade abaixo de 1 kHz, e acima de 1 kHz, seguindo o inverso do limite daaudição conforme especificado no padrão IS0226, com o limite normalizadoem unidade igual a 1 kHz.Excitacão 102
A fim de computar a intensidade acústica do sinal de áudio deentrada, uma medição da energia passageira dos sinais de áudio em cadafiltro do Banco de filtros de Análise 100 após a aplicação do Filtro de trans-missão 101 torna-se necessária. Esta medição variante no tempo e na fre-qüência é referida como excitação. A saída de energia passageira de cadafiltro no Banco de filtros de Análise 100 pode ser aproximada na Função deExcitação 102 através da multiplicação das respostas dos filtros no domínioda freqüência com o espectro de força do sinal de entrada:
<formula>formula see original document page 42</formula>
na qual b é o número de banda, t é o número de bloco, e Hb[k] e P[k] são asrespostas de freqüência do filtro auditivo e do filtro de transmissão, respecti-vamente, amostrados em uma freqüência correspondente ao índice k binárioda transformação STDFT ou MDCT. Deve-se notar que as formas para a15 resposta de magnitude dos filtros auditivos diferentes das especificadas nasEquações 4a a 4c podem ser usadas na Equação 7 para se obter resultadossimilares. Por exemplo, o dito Pedido Internacional N9 PCT/US2004/016964,publicado como o documento WO 2004/111994 A2, descreve duas alternati-vas: um filtro auditivo caracterizado por uma função de transferência de 12aordem, e uma aproximação passa banda de "parede de tijolo" de baixo cus-to.
Em suma, a saída da Função de Excitação 102 é uma represen-tação de domínio de freqüência da energia E nas respectivas bandas ERBpor período de tempo t.Intervalo de Tempo ("Suavização") 103
Para certas aplicações da presente invenção, conforme abaixodescrito, pode ser desejável suavizar a excitação E [b, t] antes de sua trans-formação em intensidade acústica específica. Por exemplo, a suavizaçãopode ser feita recursivamente na função Suavização 103 de acordo com aequação:
<formula>formula see original document page 42</formula>
na qual as constantes de tempo Ab em cada banda b são selecionadas deacordo com a aplicação desejada. Na maioria dos casos, as constantes detempo podem ser vantajosamente proporcionais ao tempo de integração dapercepção humana da intensidade acústica dentro da banda b. Watson eGengel realizaram experimentos demonstrando que este tempo de integra-ção está dentro da faixa de 150 a 175 ms a baixas freqüências (125 a 200Hz) e de 40 a 60 ms a altas freqüências (Charles S. Watson e Roy W. Gen-gel, "Signal Duration and Signal Frequency in Relation to Auditory Sensiti-vity" Journal of the Acoustical Society of America, Vol. 46, N. 4 (Parte 2),1969, pp. 989-997).
Intensidade acústica específica 104
No conversor ou função de conversão da intensidade acústicaespecífica ("Intensidade acústica específica") 104, cada banda de freqüênciaé convertida em um valor componente da intensidade acústica específica,medida em sone por ERB.
Inicialmente, na computação da intensidade acústica específica,o nível de excitação em cada banda de E[b, t] pode ser transformado em umnível de excitação equivalente a 1 kHz, conforme especificado pelos contor-nos iguais de intensidade acústica do ISO 226 (Figura 11) normalizados pelofiltro de transmissão P9z) (Figura 12):
<formula>formula see original document page 43</formula>
na qual Τικηζ(Ε,/) é uma função que gera o nível a 1 kHz, o que é igualmentealto para o nível E na freqüência /. Na prática, T|kH2(E,/) é implementadocomo uma interpolação de uma tabela de pesquisa dos contornos iguais daintensidade acústica, normalizados pelo filtro de transmissão, a transforma-ção a níveis equivalentes a 1 kHz simplifica o seguinte cálculo de intensida-de acústica específica.
Em seguida, a intensidade acústica específica em cada bandapode ser computada como:
<formula>formula see original document page 43</formula>
na qual Nnb[b, t] e Nwb[b, t] são valores de intensidade acústica específicabaseados em um modelo de sinal de banda estreita e banda larga, respecti-vamente. O valor E[b, t] é um fator de interpolação entre 0 e 1 computado apartir do sinal de áudio. O dito Pedido PCT/US2004/016964, publicado comoo documento WO 2004/111994 A2, descreve uma técnica para o cálculo deE[b, t] a partir do achatamento espectral da excitação. O documento descre-ve ainda os modelos de sinal de "banda estreita" e de "banda larga" em maisdetalhes.
Os valores de intensidade acústica de banda estreita e bandalarga NNB[b, t] e NWB[b, t] podem ser estimados a partir da excitação trans-formada usando as funções exponenciais:
<formula>formula see original document page 44</formula>
nas quais TQlkHz é o nível de excitação no limite em silêncio para um tom de1 kHz. A partir dos contornos de intensidade acústica iguais (Figuras 11 e12), TQikHz é igual a 4,2 dB. Nota-se que ambas as funções de intensidadeacústica específica são iguais a zero quando a excitação é igual ao limite emsilêncio. Para excitações maiores que o limite em silêncio, ambas as funçõescrescem monotonamente com uma lei de força de acordo com a lei de Ste-vens de sensação de intensidade. O expoente para a função de banda es-treita é maior que o da função de banda larga, fazendo a função de bandaestreita aumentar mais rapidamente que a função de banda larga. A seleçãoespecífica dos expoentes β e os ganhos G para os casos de banda estreitae banda larga são escolhidos de modo a corresponderem aos dados expe-rimentais sobre o crescimento da intensidade acústica para tons e ruído.
Moore e Glasberg sugerem que a intensidade acústica específi-ca deve ser igual a algum valor pequeno ao invés de zero quando a excita-ção está no limite da audição. A intensidade acústica específica deve entãodiminuir monotonamente a zero à medida que a excitação diminui para zero.A justificativa é que o limite da audição é um limite probabilístico (o ponto noqual um tom é detectado 50 % das vezes), e que vários tons, cada qual nolimite, apresentados juntos, podem somar um som mais audível que qual-quer um dos tons individuais. Na aplicação apresentada, aumentar as fun-ções de intensidade acústica específica com esta propriedade tem o benefí-cio adicional de fazer com que o solucionador de ganho, apresentado abai-xo, se comporte mais apropriadamente quando a excitação está perto dolimite. Quando a intensidade acústica específica é definida como zero,quando a excitação está no ou abaixo do limite, uma solução única para osolucionador de ganho não existirá para as excitações no ou abaixo do limi-te. Quando, por outro lado, a intensidade acústica específica é definida demodo a aumentar monotonamente em todos os valores de excitação maiorque ou igual a zero, conforme sugerido por Moore e Glasberg, uma soluçãoúnica existirá. Uma graduação de intensidade acústica maior que a unidadesempre resultará em um ganho maior que a unidade ou vice versa. As fun-ções de intensidade acústica específica nas Equações 11a e 11b podem seralteradas de modo a apresentar uma propriedade desejada de acordo com:
<formula>formula see original document page 45</formula>
nas quais a constante λ é maior que um, o expoente η é menor que um, e asconstantes K e C são escolhidas de tal modo que a função de intensidadeacústica específica e sua primeira derivada sejam contínuas no ponto <formula>formula see original document page 45</formula>
A partir da intensidade acústica específica, a intensidade acústi-ca geral ou "total" L[t] é dada pela soma da intensidade acústica específica
ao longo de todas as bandas b:
<formula>formula see original document page 45</formula>
Modificação da Intensidade acústica específica 105
Na função de modificação de intensidade acústica específica("Modificação de Intensidade acústica específica") 105, a intensidade acústi-ca alvo específica, referida como N[b, t], pode ser calculada a partir da inten-sidade acústica específica do nível SL 104 (Figura 7) de várias maneirasdependendo da aplicação desejada do dispositivo ou processo geral. Con-forme descrito em mais detalhes abaixo, uma intensidade acústica alvo es-pecífica pode ser calculada usando um fator de escala a, por exemplo, nocaso de um controle de volume. Vide Equação 16 abaixo e sua descriçãoassociada. No caso do controle de ganho automático (AGC) e do controle defaixa dinâmica (DRC), uma intensidade acústica alvo específica pode sercalculada usando uma razão de intensidade acústica de saída desejada paraa intensidade acústica de entrada. Vide as Equações 17 e 18 abaixo e suasdescrições associadas. No caso de uma equalização dinâmica, uma intensi-dade acústica alvo específica pode ser calculada usando uma relação apre-sentada na Equação 23 e sua descrição associada.Solucionador de Ganho 106
Neste exemplo, para cada banda b e cada intervalo de tempo t,o Solucionador de ganho 106 toma como suas entradas a excitação suavi-zada E[b, t] e a intensidade acústica alvo específica N[b, t] e gera os ganhosG[b, t] usados em seguida para a modificação do áudio. A função ψ{.} repre-senta a transformação não linear a partir da excitação para a intensidadeacústica específica de modo que:
(13)
e o Solucionador de ganho encontra G[b, t] de modo que:
(14a)
Os Solucionadores de ganho 106 determinam os ganhos varian-tes na freqüência e no tempo, que, quando aplicados à excitação original,resultam em uma intensidade acústica específica que, em termos ideais, éigual à intensidade acústica alvo específica desejada. Na prática, os Solu-cionadores de ganho determinam os ganhos variantes na freqüência e notempo que, quando aplicados à versão de domínio da freqüência do sinal deáudio, resultam na modificação do sinal de áudio a fim de reduzir a diferençaentre a sua intensidade acústica específica e a intensidade acústica alvoespecífica. Idealmente, a modificação é tal que o sinal de áudio modificadotenha uma intensidade acústica específica que é uma aproximação estrita daintensidade acústica alvo específica. A solução para a Equação 14a podeser implementada de várias maneiras. Por exemplo, quando há uma expres-são matemática de sentença fechada para o inverso da intensidade acústicaespecífica, representada por ψ"1{.}, os ganhos poderão ser computados dire-tamente pela equação reajustada 14a:
<formula>formula see original document page 47</formula>
De maneira alternativa, quando uma solução de sentença fecha-da para ψ"1{.} não existe, uma abordagem iterativa poderá ser empregada naqual cada equação de iteração 14a é avaliada usando uma estimativa cor-rente dos ganhos. A intensidade acústica específica resultante é comparadaao alvo desejado e os ganhos são atualizados com base no erro. Quando osganhos são atualizados apropriadamente, eles convergem para a soluçãodesejada. Um outro método envolve a pré-computação da função ψ {.} parauma faixa de valores de excitação em cada banda a fim de criar uma tabelade pesquisa. A partir desta tabela de pesquisa, obtém-se uma aproximaçãoda função inversa ψ"1{.} e os ganhos podem ser computados a partir da e-quação 14b. conforme acima mencionado, a intensidade acústica alvo espe-cífica pode ser representada por uma graduação da intensidade acústicaespecífica:
<formula>formula see original document page 47</formula>
Substituindo a equação 13 pela 14c e em seguida a 14c pela14b, produz-se uma expressão alternativa para os ganhos:
<formula>formula see original document page 47</formula>
Observa-se que os ganhos podem ser expressos basicamentecomo uma função da excitação E [b, t] e da graduação da intensidade acús-tica específica Ξ[b, t]. portanto, os ganhos podem ser computados atravésda avaliação da equação 14d ou de uma tabela de pesquisa equivalentesem nunca explicitamente computar a intensidade acústica específica ou aintensidade acústica alvo específica como valores intermediários. No entan-to, estes valores são implicitamente computados através do uso da equação14d. Outros métodos equivalentes para a computação dos parâmetros demodificação através de uma computação explícita ou implícita da intensida-de acústica específica e da intensidade acústica alvo específica podem serconsiderados, e a presente invenção pretende abranger todos estes métodos.
Banco de filtros de Síntese 110
Conforme acima descrito, o Banco de filtros de Análise 100 podeser implementado com eficiência através do uso da Transformação Discretade Fourier de curto tempo (STDFT) ou da Transformação Discreta de Co-seno Modificada, e a STDFT ou a MDCT podem ser usadas de maneira si-milar a fim de implementar o Banco de filtros de Síntese 110. Em termos es-pecíficos, ao se deixar X[k, t] representar a STDFT ou a MDCT do áudio deentrada, conforme acima descrito, a STDFT ou a MDCT do áudio (modifica-do) processado no Banco de filtros de Síntese 110 podem ser calculadascomo:
<formula>formula see original document page 48</formula>
na qual Sb[k] é a resposta do filtro de síntese associado à banda b, e d é oretardo associado ao bloco de retardos 109 da Figura 7. A forma dos filtrosde síntese Sb[k] pode ser igual a dos filtros utilizados no banco de filtros deanálise, Hb[k], ou pode ser modificada de modo a prover uma perfeita re-construção na ausência de qualquer modificação de ganho (isto é, quandoG[b, t] = 1). O áudio processado final pode então ser gerado através datransformação inversa de Fourier ou da transformação de co-seno modifica-da de X[k, t] ou da síntese de adição sobreposta, conforme familiar a umapessoa versada na técnica.
Intensidade acústica alvo específica
O comportamento das disposições que abrangem os aspectosda presente invenção, como, por exemplo, os exemplos das Figuras 1 a 7, édeterminado principalmente pela maneira na qual a intensidade acústica alvoespecífica N[b, t] é calculada. Embora a presente invenção não se limite anenhuma função ou função inversa em particular para calcular a intensidadeacústica alvo específica, diversas funções e aplicações adequadas para asmesmas serão descritas a seguir.
Função Invariante no tempo e Invariante na freqüência Adequada para oControle de Volume
Um controle de volume padrão ajusta a intensidade acústica deum sinal de áudio por meio da aplicação de um ganho de banda larga aoáudio. De modo geral, o ganho é acoplado a um botão ou corrediça que éajustado por um usuário até que a intensidade acústica do áudio esteja emum nível desejado. Um aspecto da presente invenção permite uma maneiramais consistente em termos psicoacústicos de se implementar tal controle.De acordo com este aspecto da presente invenção, ao invés de se ter umganho de banda larga acoplado ao controle de volume que resulta em umamudança do ganho pela mesma quantidade ao longo de todas as bandas defreqüência, o que pode provocar uma mudança no espectro percebido, umfator de graduação de intensidade acústica específica é associado ao ajustede controle de volume de modo que o ganho em cada uma dentre as múlti-plas bandas de freqüência mude em quantidade, levando em consideração omodelo de audição humana, e de modo que idealmente não haja uma mu-dança no espectro percebido. No contexto deste aspecto da presente inven-ção e em uma aplicação exemplar da mesma, "constante" ou "invariante notempo" pretende permitir mudanças na definição de um fator de escala decontrole de volume de tempos em tempos por um usuário, por exemplo. Estainvariância no tempo é às vezes referida como "quase invariante no tempo","quase estacionária", "um pouco invariante no tempo", "um pouco estacioná-ria", "invariante no tempo em escala", e "estacionária em escala". Dado talfator de escala, a, a intensidade acústica alvo específica pode ser calculadacomo a intensidade acústica específica medida multiplicada por a:
<formula>formula see original document page 49</formula>
Uma vez que a intensidade acústica total L[t] é a soma da inten-sidade acústica específica N[b, t] em todas as bandas b, a modificação aci-ma também gradua a intensidade acústica total por um fator de a, mas deuma maneira a preservar o mesmo espectro percebido em um momento emparticular para as mudanças no ajuste de controle de volume. Ou seja, emqualquer momento em particular, uma mudança no ajuste de controle devolume resulta em uma mudança na intensidade acústica percebida, porémnenhuma mudança no espectro percebido do áudio modificado versus o es-pectro percebido do áudio não modificado. A Figura 13a os ganhos multi-banda resultantes G[b, t] em todas as bandas b em um momento particular tquando α = 0,25 para um sinal de áudio que consiste em uma fala feminina.Para fins de comparação, o ganho de banda larga requerido para graduar aintensidade acústica total original em 0,25 (linha horizontal), como em umcontrole de volume padrão, é também registrado. O ganho multibanda G[b, t]aumenta nas bandas de baixa e alta freqüências em comparação às bandasde freqüência intermediárias. Isto é consistente com os contornos iguais deintensidade acústica, indicando que o ouvido humano é menos sensível abaixa e alta freqüências.
A Figura 13b ilustra a intensidade acústica específica para o si-nal de áudio original, o sinal modificado no ganho de banda larga conformemodificado de acordo com um controle de volume da técnica anterior, e osinal modificado no ganho multibanda conforme modificado de acordo comeste aspecto da presente invenção, a intensidade acústica específica do si-nal modificado de ganho multibanda é o graduado original em 0,25. A inten-sidade acústica específica do sinal modificado em banda larga muda emforma espectral com relação à do sinal não modificado original. Neste caso,a intensidade acústica específica, em um sentido relativo, perde intensidadeacústica em ambas baixa e alta freqüências. Isto é percebido como umasurdez do áudio, uma vez que seu volume está desligado, um problema quenão ocorre com o sinal modificado multibanda, cuja intensidade acústica écontrolada pelos ganhos obtidos no domínio de intensidade acústica perceptiva.
Juntamente com a distorção do equipamento espectral percebi-do associado ao controle de volume tradicional, existe um segundo proble-ma. Uma propriedade da percepção da intensidade acústica, que se refleteno modelo de intensidade acústica mostrado nas Equações 11a a 11 d, é aintensidade acústica de um sinal em qualquer freqüência que diminui maisrapidamente à medida que o nível de sinal se aproxima do limite da audição.Como resultado, a atenuação elétrica requerida de modo a comunicar amesma atenuação de intensidade acústica a um sinal mais suave será me-nor que a requerida para um sinal mais alto. Um controle de volume tradicio-nal comunica atenuação, independentemente do nível de sinal, e, portanto,sinais suaves se tornam "suaves demais" com relação aos sinais mais altosquando o volume é desligado. Em muitos casos, isto resulta na perda dodetalhe do áudio. Considere-se o registro de uma castanhola em um ambi-ente reverberante. Em tal registro, a batida principal da castanhola é bemalta em comparação aos ecos reverberantes, mas são os ecos reverberan-tes que dão o tamanho do ambiente. Quando o volume é desligado com umcontrole de volume tradicional, os ecos reverberantes ficam mais suavescom relação à batida principal e eventualmente desaparecem abaixo do limi-te da audição, deixando uma castanhola de som "seco". O controle de volu-me com base na intensidade acústica impede o desaparecimento das partesmais sua^s das nravarõfis an refnmar a Dorcão reverberante mais suaveda gravação com relação à batida principal mais alta de modo que a intensi-dade acústica relativa entre estas seções permaneça constante. Para chegara este efeito, os ganhos multibanda G[b, t] devem variar ao longo do tempo auma velocidade proporcional à resolução temporal humana da percepção daintensidade acústica. Uma vez que os ganhos multibanda G[b, t] são compu-tados como uma função da excitação suavizada E[b, t], a seleção das cons-tantes de tempo λ na Equação 8 determina quão rapidamente os ganhospoderão variar no tempo em cada banda b. conforme acima mencionado,estas constantes de tempo podem ser selecionadas de modo a serem pro-porcionais ao tempo de integração da percepção da intensidade acústicahumana dentro da banda b e, deste modo, produzem a variação apropriadade g[b, t] ao longo do tempo. Deve-se notar que se as constantes de tempoforem escolhidas de maneira imprópria (ou rápido demais ou lento demais),artefatos perceptivamente objetáveis poderão ser introduzidos no áudio pro-cessado.
Função Invariante no tempo e Variante na freqüência Adequada para Equa-lização Fixa
Em alguma aplicações, pode-se querer aplicar uma equalizaçãoperceptiva fixa ao áudio, em cujo caso a intensidade acústica alvo específicapode ser computada por meio da aplicação de um fator de escala invarianteno tempo porém variante na freqüência 0[b] como na relaçãoN[b, t] = Ξ [b, t] N[b, t],na qual (N[b, t]) é a intensidade acústica alvo específica, (N[b, t]) é a intensida-de acústica específica do sinal de áudio, b é uma medida de freqüência, e t éuma medida de tempo. Neste caso, a graduação pode variar de banda parabanda. Tal aplicação pode ser útil para enfatizar, por exemplo, a porção doespectro dominado pelas freqüências de fala a fim de reforçar a inteligibilidade.Função Invariante na freqüência e Variante no tempo Adequada para GanhoAutomático e Controle de Faixa Dinâmica
As técnicas do ganho automático e do controle de faixa dinâmica(ACG e DRC) são bem conhecidas no campo do processamento automático.Em um sentido abstrato, ambas as técnicas medem o nível de um sinal deáudio de alguma maneira e em seguida modificam em ganho o sinal em umaquantidade que vem a ser uma função do nível medido. No caso do AGC, osinal é modificado em ganho de modo que o seu nível medido fique maispróximo de um nível de referência selecionado por um usuário. Com o con-trole DRC, o sinal é modificado em ganho de modo que a faixa do nível me-dido do sinal se transforme em uma faixa desejada. Por exemplo, pode-sequerer fazer porções silenciosas de um áudio mais alto e as porções altasmais silenciosas. Este sistema é descrito por Robinson e Gundry (CharlesRobinson e Kenneth Gundry, "Dynamic Range Control via Metadata", 107thConvention of the AES1 Preprint 5028, 24 a 27 de setembro de 1999, NovaIorque). Implementações tradicionais do ganho ACG e do controle DRC demodo geral utilizam uma medição simples de nível de sinal de áudio, tal co-mo pico suavizado ou amplitude de raiz quadrada mínima (rms), a fim derealizar a modificação de ganho. Estas medições simples se correlacionamem algum grau à intensidade acústica percebida do áudio, porém aspectosda presente invenção permitem um ganho ACG e um controle DRC maisrelevantes perceptivamente ao fazer as modificações de ganho com umamedida de intensidade acústica com base em um modelo psicoacústico. A-inda, muitos sistemas de ganho AGC e de controle DRC tradicionais aplicama modificação de ganho com um ganho de banda larga, incorrendo, assim,nas distorções timbrais (espectrais) acima mencionadas no áudio processa-do. Os aspectos da presente invenção, por outro lado, utilizam um ganhomultibanda para formar a intensidade acústica específica de uma maneira areduzir ou minimizar tais distorções.
Ambas as aplicações de AGC e DRC empregam aspectos dapresente invenção caracterizados por uma função que transforma ou mapeiauma intensidade acústica de banda larga de entrada L,[t] em uma intensida-de acústica de banda larga de saída desejada l_o[t], na qual a intensidadeacústica é medida em unidades de intensidade acústica perceptiva, tal comosone. A intensidade acústica de banda larga de entrada L,[t] é uma funçãoda intensidade acústica específica do sinal de áudio de energia N[b, t]. em-bora ela possa ser igual à intensidade acústica total do sinal de áudio de en-trada, a mesma poderá ser uma versão suavizada temporalmente da inten-sidade acústica total do sinal de áudio.
As Figuras 14a e 14b ilustram exemplos de funções de mapea-mento típicas de um AGC e de um DRC, respectivamente. Dado tal mapea-mento no qual L0 [t] é uma função de L, [t], a intensidade acústica alvo espe-cífica pode ser calculada como:
<formula>formula see original document page 53</formula>
A intensidade acústica específica original do sinal de áudio N[b,t] é simplesmente graduada pela razão da intensidade acústica de bandalarga de saída desejada para a intensidade acústica de banda larga de en-trada de modo a produzir uma intensidade acústica específica de saída N[b,t]. Para um sistema de ganho AGC, a intensidade acústica de banda largade entrada Lj [t] deve de modo geral ser uma medida da intensidade acústicatotal de longo prazo do áudio. Isto pode ser obtido por meio da suavizaçãoda intensidade acústica total L[t] ao longo do tempo a fim de gerar Li [t].
Em comparação a um ganho AGC, um sistema de controle DRCreage às mudanças de prazo menor em uma intensidade acústica do sinal,e, portanto, Lj [t] poderá simplesmente ficar igual a L[t]. como um resultado, agraduação da intensidade acústica específica, dada por Lo [t] / Li [t], podeflutuar rapidamente, resultando em artefatos indesejados no áudio proces-sado. Um artefato típico é a modulação audível de uma porção do espectrode freqüência por alguma parte não relacionada do espectro. Por exemplo, aseleção de uma música clássica deve conter altas freqüências dominadaspor uma nota de corda sustentada, enquanto as baixas freqüências contêmum tímpano batendo alto. Sempre que o tímpano é batido, a intensidade a-cústica geral Li [t] aumenta, e o sistema DRC aplica uma atenuação a toda aintensidade acústica específica. As cordas são então ouvidas, subindo edescendo em intensidade acústica com o tímpano. Este bombeamento cru-zado no espectro é um problema com os sistemas de DRC de banda largatradicionais também, e uma solução típica envolve a aplicação de um DRCindependente para diferentes bandas de freqüência diferentes. O sistemaaqui apresentado é inerentemente multibanda devido ao banco de filtros eao cálculo de uma intensidade acústica específica que emprega um modelode intensidade acústica perceptiva, e, portanto, a modificação de um sistemade DRC a fim de operar de uma forma em multibanda de acordo com os as-pectos da presente invenção é relativamente direta e é descrita a seguir.
Função Variante na freqüência e Variante no tempo Adequada para Controlede Faixa Dinâmica
O sistema DRC pode ser expandido de modo a operar de umamaneira multibanda ou variante na freqüência ao permitir que a intensidadeacústica de entrada e saída varie independentemente com a banda b. estesvalores de intensidade acústica multibanda são referidos como L, [b, t] e Lo[b, t], e a intensidade acústica alvo específica pode em seguida ser dada por:
<formula>formula see original document page 54</formula>
em que Lo [b, t] é calculado ou mapeado a partir de Li [b, t], conforme ilustra-do na Figura 14b, porém de maneira independente para cada banda b. Aintensidade acústica multibanda de entrada Li [b, t] é uma função do intensi-dade acústica específica do sinal de áudio de entrada N[b, t]. Embora possaser igual à intensidade acústica específica do sinal de áudio de entrada, elapode ser uma versão suavizada temporalmente e/ou suavizada em freqüên-cia da intensidade acústica específica do sinal de áudio.
A maneira mais direta de se calcular Li [b,t] é definir a mesmaigual à intensidade acústica específica N[b,t]. Neste caso, o DRV é feito in-dependentemente em cada banda no banco de filtros auditivos do modelo deintensidade acústica perceptiva ao invés de ser feito de acordo com a mes-ma entrada versus a razão de intensidade acústica de saída para todas asbandas, como descrito acima intitulada "Função Invariante na freqüência evariante no tempo adequada para ganho automático e controle de faixa di-nâmica". Em uma modalidade prática que emprega 40 bandas, o espaça-mento destas bandas ao longo do eixo de freqüência é relativamente fino afim de prover uma medição precisa da intensidade acústica. No entanto, aaplicação de um fator de escala DRC independentemente à cada banda po-de fazer com que o áudio processado pareça "partido". Para evitar este pro-blema, pode-se calcular Li [b,t] por meio da suavização da intensidade acús-tica específica N[b,t] através das bandas de modo que a quantidade deDRC aplicada de uma banda para a outra não varie drasticamente. Isto podeser obtido ao se definir um filtro de suavização de banda Q(b) e em seguidasuavizar a intensidade acústica específica em todas as bandas c de acordocom a soma de convolução padrão:
<formula>formula see original document page 55</formula>
em que N[c,t] é a intensidade acústica específica do sinal de áudio e Q(b -c) é a resposta deslocada na banda do filtro de suavização. A Figura 15 ilus-tra um exemplo de tal filtro de suavização de banda.
Quando a função DRC que calcula Li [b,t] como uma função deLo[b,t] é fixada para cada banda b, o tipo de mudança feita em cada bandada intensidade acústica específica N[b,t] irá variar dependendo do espectrodo áudio que é processado, mesmo que a intensidade acústica geral do sinalcontinue a mesma. Por exemplo, um sinal de áudio com baixo alto e agudobaixo pode ter o baixo cortado e o agudo reforçado. Um sinal com baixo si-lencioso e agudo alto pode ocasionar o oposto. O efeito líquido é uma mu-dança no timbre ou no espectro percebido do áudio, e isto pode ser desejá-vel em certas aplicações.
No entanto, pode-se desejar fazer um DRC multibanda sem mo-dificar o espectro percebido médio do áudio. Pode-se querer que a modifica-ção média de cada banda seja grosso modo igual e ainda assim permitir queas variações de curto prazo das modificações operem independentementeentre bandas. O efeito desejado pode ser obtido ao fazer com que o compor-tamento médio do DRC em cada banda fique igual ao de um comportamentode referência. Pode-se escolher este comportamento de referência como ocontrole DRC desejado para a intensidade acústica de entrada de bandalarga Li [b, t]. Sendo assim, a função L0 [t] = DRC{l_i [t]} representa uma ver-são mediada no tempo da intensidade acústica de entrada de banda larga, eLi [b, t] representa uma versão mediada no tempo da intensidade acústica deentrada multibanda Li [b, t]. A intensidade acústica de saída multibanda podeentão ser calculada como:
Observa-se que a intensidade acústica de entrada multibanda éprimeiramente graduada de modo a ficar na mesma faixa média que a inten-sidade acústica de entrada de banda larga. A função DRC concebida para aintensidade acústica de banda larga é então aplicada. Por último, o resultadoé graduado de volta à faixa média da intensidade acústica multibanda. Comesta formulação de DRC multibanda, os benefícios de um bombeamentoespectral reduzido são mantidos, ao mesmo tempo preservando o espectropercebido médio do áudio.
Função Variante na freqüência e Variante no tempo Adequada para Eguali-zacão Dinâmica
Uma outra aplicação de aspectos da presente invenção é atransformação não intencional do espectro percebido variante no tempo doáudio em um espectro percebido invariante no tempo alvo, ao mesmo tempopreservando a faixa dinâmica original do áudio. Pode-se referir a este pro-cessamento como uma Equalização Dinâmica (DEQ). Com a equalizaçãotradicional, uma simples filtragem fixa é aplicada ao áudio a fim de mudar oseu espectro. Por exemplo, pode-se aplicar um baixo fixo ou um reforço deagudo. Este processamento não leva em conta o espectro corrente do áudioe pode, portanto, ser impróprio para alguns sinais, ou seja, para os sinaisque já contêm uma quantidade relativamente grande de baixo e agudo. Com o DEQ, o espectro do sinal é medido e o sinal é em seguida dinamicamentemodificado a fim de transformar o espectro medido em uma forma desejadaessencialmente estática. Para os aspectos da presente invenção, tal formadesejada é especificada nas bandas do banco de filtros e referida como EQ[b]. em uma modalidade prática, o espectro medido deve representar a for-ma espectral média do áudio que pode ser gerada por meio da suavizaçãoda intensidade acústica específica N[b, t] através do tempo. Pode-se referir àintensidade acústica específica suavizada como N[b, t]. de acordo com ocontrole DRC multibanda, pode-se não querer que a modificação DEQ variedrasticamente de uma banda para a outra, e, sendo assim, uma função desuavização de banda pode ser aplicada de modo a gerar um espectro suavi-zado na banda L[b, t]:
<formula>formula see original document page 57</formula>
A fim de preservar a faixa dinâmica original do áudio, o espectrodesejado EQ [b] deve ser normalizado de modo a apresentar a mesma in-tensidade acústica geral que a forma espectral medida dada por L[b, t]. Po-de-se referir a esta forma espectral normalizada como Leofb, t]:
<formula>formula see original document page 57</formula>
Finalmente, o parâmetro específico é vulgarmente calculadocomo:
<formula>formula see original document page 57</formula>
em que β é um parâmetro especificado pelo usuário variando de zero a um,indicando o grau de DEQ a ser aplicado. Olhando a Equação 23, nota-seque, quando β = 0, a intensidade acústica específica original não é modifica-da, e quando β = 1, a intensidade acústica específica é graduada pela razão30 espectral desejada para a forma espectral medida.Uma maneira conveniente de gerar a forma espectral desejadaEQ[b] é o usuário definir a mesma igual a L [b, t] conforme medida para amesma peça de áudio cujo equilíbrio espectral o usuário considera agradá-vel. Em uma modalidade prática, por exemplo, conforme mostrado na Figura16, o usuário pode ser provido com um botão ou outro atuador adequado507 que, quando atuado, provoca a captura da medida corrente da formaespectral do áudio L[b, t] e, em seguida, armazena esta medida como umapredefinição (em Captura e Armazenamento Predefinidos de Intensidadeacústica alvo específica 506) que poderá ser mais tarde carregada para oEQ [b] quando o DEQ estiver habilitado (como pela seleção predefinida 508).
A Figura 16 é uma versão simplificada da Figura 7 na qual apenas uma úni-ca linha é mostrada para representar múltiplas bandas do Banco de filtros deanálise 100 para o Banco de filtros de síntese 110. O exemplo da Figura 17também provê uma Modificação de intensidade acústica específica de EQDinâmico 505 que provê uma modificação à intensidade acústica específicamedida por meio da função ou dispositivo 104 de acordo com a equalízaçãodinâmica, conforme explicado acima.
Processamento Combinado
Pode-se querer combinar todos o processamento acima descri-to, incluindo o Controle de volume (VC), o controle AGC, o DRC1 e o DEQ,em um único sistema. Uma vez que cada um destes processos pode serrepresentado como uma graduação da intensidade acústica específica, to-dos eles são facilmente combinados, como segue:
<formula>formula see original document page 58</formula>
em que E[b, t] representa os fatores de escala associados ao processo "*".
Um único conjunto de ganhos G [b, t] pode então ser calculado para a inten-sidade acústica alvo específica que representa o processamento combinado.
Em alguns casos, os fatores de escala de um processo ou com-binação de processos de modificação de intensidade acústica podem flutuarrápido demais ao longo do tempo e produzir artefatos no áudio processadoresultante. Pode, portanto, ser desejável suavizar um subconjunto destesfatores de escala. Em geral, os fatores de escala de VC e DEQ variam sua-vemente ao longo do tempo, mas a suavização da combinação dos fatoresde escala de AGC e DRC pode ser necessária. A combinação destes fatoresde escala são representados por:
<formula>formula see original document page 59</formula>
A noção básica atrás da suavização é que os fatores de escalacombinados devem reagir rapidamente quando a intensidade acústica espe-cífica aumenta, e que os fatores de escala devem ser mais fortemente sua-vizados quando a intensidade acústica específica diminui. Esta noção cor-responde à prática bem conhecida de se utilizar um rápido ataque e umalenta liberação na concepção dos compressores de áudio. As constantes detempo apropriadas para a suavização dos fatores de escala podem ser cal-culadas ao se suavizar ao longo do tempo uma versão suavizada na bandada intensidade acústica específica. Primeiramente, uma versão suavizada nabanda da intensidade acústica específica é computada:
<formula>formula see original document page 59</formula>
em que N[b, t] é a intensidade acústica específica do sinal de áudio e Q(b -c) é a resposta deslocada na banda do filtro de suavização, como na Equa-ção 19 acima.
A versão suavizada no tempo desta intensidade acústica especí-fica suavizada na banda é então calculada como:
<formula>formula see original document page 59</formula>
em que o coeficiente de suavização dependente de banda λ [b, t] é dado por:
<formula>formula see original document page 59</formula>
Os fatores de escala combinados suavizados são em seguidacalculados como:
<formula>formula see original document page 59</formula>
em que λΜ [b, t] é uma versão suavizada na banda de λ [b,t]:
<formula>formula see original document page 59</formula>
A suavização de banda do coeficiente de suavização impedeque os fatores de escala suavizados no tempo mudem drasticamente atra-vés das bandas. A suavização na banda e no tempo dos fatores de escaladescritos resulta em um áudio processado contendo menos artefatos per-ceptivos objetáveis.
Compensação de Ruído
Em muitos ambientes de reprodução de áudio existe ruído defundo que interfere no áudio que um ouvinte deseja escutar. Por exemplo,um ouvinte em um automóvel em movimento pode estar ouvindo música deum sistema estéreo instalado e o barulho do motor e da rua pode significati-vamente alterar a percepção da música. Em particular, para as partes doespectro nas quais a energia do ruído é significante com relação à energiada música, a intensidade acústica percebida da música é reduzida. Quandoo nível do ruído é muito grande, a música fica completamente mascarada.Com relação a um aspecto da presente invenção, pode-se querer escolherganhos G [b, t] de modo que a intensidade acústica específica do áudio pro-cessado na presença do ruído de interferência seja igual à intensidade acús-tica alvo específica N[b, t]. para se chegar a este efeito, pode-se utilizar oconceito de intensidade acústica parcial, conforme definido por Moore eGlasberg, supra. Pressupõe-se que se possa obter uma medição do ruídopor si só e uma medição do áudio por si só. En [b, t] representaria a excita-ção do ruído e Ea [b, t] representaria a excitação do áudio. A intensidadeacústica específica combinada do áudio e do ruído é então dada por:
(31)
em que, mais uma vez, ψ{.} representa a transformação não linear a partirda excitação para a intensidade acústica específica. Pode-se pressupor quea audição de um ouvinte divide a intensidade acústica específica combinadaentre o intensidade acústica específica parcial do áudio e a intensidade a-cústica específica parcial do ruído de maneira a preservar a intensidade a-cústica específica combinada:
<formula>formula see original document page 60</formula>
A intensidade acústica específica parcial do áudio, NA[b, t], é ovalor que se quer controlar, e, portanto, deve-se solucionar este valor. A in-tensidade acústica específica parcial do ruído pode ser aproximada, como:<formula>formula see original document page 61</formula>
em que ETN[b, t] é o limite mascarado na presença do ruído, Etq[b] é o limiteda audição em silêncio na banda b, e k é um expoente entre zero e um.
Ao se combinar as Equações 31 a 33, chega-se a uma expres-são para a intensidade acústica específica parcial do áudio:
<formula>formula see original document page 61</formula>
Nota-se que quando a excitação do áudio é igual ao limite mas-carado do ruído (EA[b, t] = ETN[b, t]), a intensidade acústica específica parcialdo áudio será igual à intensidade acústica de um sinal no limite em silêncio,o que vem a ser um resultado desejado. Quando a excitação do áudio é mui-to maior que a do ruído, o segundo termo da Equação 34 desaparece, e aintensidade acústica específica do áudio será aproximadamente igual ao queseria se o ruído não estivesse presente. Em outras palavras, uma vez que oáudio fica muito mais alto que o ruído, o ruído é mascarado pelo áudio. Oexpoente K é escolhido empiricamente de modo a oferecer um bom ajusteaos dados da intensidade acústica de um tom no ruído como uma função darazão sinal para ruído. Moore e Glasberg descobriram que um valor de k =0.3 é apropriado. O limite mascarado do ruído pode ser aproximado comouma função da própria excitação do ruído.
<formula>formula see original document page 61</formula>
em que K[b] é uma constante que aumenta em bandas de freqüência maisbaixas. Sendo assim, a intensidade acústica específica parcial do áudio da-da pela Equação 34 pode ser representada abstratamente como uma funçãoda excitação do áudio e da excitação do ruído:
<formula>formula see original document page 61</formula>
Um solucionador de ganho modificado pode em seguida ser uti-lizado no sentido de calcular os ganhos G[b, t] de tal modo que a intensidadeacústica específica parcial do áudio processado na presença do ruído fiqueigual à intensidade acústica alvo específica:
<formula>formula see original document page 61</formula>
A Figura 17 ilustra o sistema da Figura 7 com o Solucionador deganho original 106 substituído pelo Solucionador de ganho de Compensaçãode Ruído descrito 206 (observe que as múltiplas linhas verticais entre osblocos representando as múltiplas bandas do banco de filtros foram substitu-ídas por uma única linha a fim de simplificar o diagrama). Além disso, a figu-ra ilustra a medição da excitação de ruído (pelo Banco de filtros de análise200, pelo Filtro de transmissão 201, pela Excitação 202 e pela Suavização203 de uma maneira correspondente à operação dos blocos 100, 101, 102 e103) que alimenta o novo solucionador de ganho 206 juntamente com a exci-tação do áudio (a partir da Suavização 103) e da intensidade acústica alvoespecífica (a partir da Modificação de nível SL 105).
Em seu modo mais básico de operação, a Modificação SL 105da Figura 17 pode simplesmente definir uma intensidade acústica alvo espe-cífica N[b, t] igual à intensidade acústica específica original do áudio N[b, t].ou seja, a Modificação SL provê uma graduação α de fator de escala invari-ante na freqüência da intensidade acústica específica do sinal de áudio, naqual α = 1. Com uma disposição como a da Figura 17, os ganhos são calcu-lados de modo que o espectro da intensidade acústica percebida do áudioprocessado na presença do ruído seja igual aos do espectro de intensidadeacústica do áudio na ausência do ruído. Além disso, qualquer técnica oucombinação de técnicas previamente descritas para a computação da inten-sidade acústica alvo específica como uma função do original, incluindo VC,AGC, DRC, e DEQ, pode ser utilizada em conjunto com o sistema de modifi-cação de intensidade acústica de compensação de ruído.
Em uma modalidade prática, a medição do ruído pode ser feita apartir de um microfone colocado no ou próximo do ambiente no qual o áudioserá tocado. De maneira alternativa, um conjunto predeterminado de excita-ções de ruído padrão pode ser utilizado próximo do espectro de ruído ante-cipado de acordo com diversas condições. Por exemplo, o ruído de uma ca-bine de automóvel pode ser pré-analisado a várias velocidades de direção eem seguida armazenado como uma tabela de pesquisa da excitação de ruí-do versus velocidade. A excitação de ruído alimentada para o Solucionadorde ganho 206 da Figura 17 pode ser aproximada desta tabela de pesquisa àmedida que a velocidade do automóvel varia.Aproximações à Intensidade acústica específica
Embora a presente invenção funcione melhor quando uma me-dida precisa da intensidade acústica específica é usada, algumas aplicaçõespodem requerer o uso de uma aproximação mais grosseira a fim de reduzir acomplexidade computacional. Com uma aproximação adequada, uma esti-mativa aceitável e modificação da intensidade acústica percebida poderãoainda ser obtidas. Tal aproximação deve tentar preservar, pelo menos emparte, vários aspectos chave da percepção de intensidade acústica. Primei-ramente, a aproximação deve pelo menos capturar grosso modo a sensibili-dade variante na percepção de intensidade acústica com freqüência. Emtermos gerais, a aproximação deve exibir menor sensibilidade a freqüênciasmais baixas e mais altas em comparação às freqüências intermediárias. Emsegundo lugar, a aproximação deve exibir um crescimento não linear da in-tensidade acústica com nível de sinal. Especificamente, o crescimento daintensidade acústica específica deve ser mais rápida para os sinais de nívelbaixo próximos do limite de audição e então diminuir a uma taxa de cresci-mento constante à medida que o nível de sinal aumenta, por último, a apro-ximação deve exibir a propriedade de somar intensidade acústica, isto que-rendo dizer que, para um nível de sinal constante, a intensidade acústicatotal (a integração da intensidade acústica específica através da freqüência)aumentará à medida que a largura de banda de um sinal aumenta.
Uma maneira de se reduzir a complexidade da computação daintensidade acústica específica e ao mesmo tempo manter as propriedadesdesejadas de percepção de intensidade acústica é usar um banco de filtroscom menos bandas, no qual as bandas não podem ser espaçadas unifor-memente em uma escala de taxa de banda crítica. Por exemplo, pode-seusar um banco de filtros de 5 bandas com as bandas distribuídas uniforme-mente em uma escala de freqüência linear em oposição às 40 bandas des-critas anteriormente. Existem muitas técnicas para uma eficiente implemen-tação de tais bancos de filtros, por exemplo, os bancos de filtros moduladosem co-seno (Ρ. P. Vaidyanthan, MuItiRate Systems and Filter Banks, 1993,Prentice Hall). Como um exemplo geral, considere-se um banco de filtroscom bandas B, no qual cada banda é descrita por uma resposta de impulsode domínio de tempo hb[n], Suponha, ainda, que o banco de filtros seja umareconstrução quase perfeita, isto significando que:
<formula>formula see original document page 64</formula>
A resposta de freqüência de cada banda b pode ser caracteriza-da por uma freqüência central fb e uma largura de banda Afb em Hertz. Afreqüência central equivalente e a largura de banda em unidades de ERBsão então obtidas por:
<formula>formula see original document page 64</formula>
Quando o número de bandas é relativamente pequeno, a largurade banda eb de cada banda será provavelmente maior que 1 ERB.
Quando xb[n] = hb[n] * [n] representa o sinal de áudio associadoà cada banda, um sinal de excitação suavizado E[b, n] poderá ser computa-do de maneira similar às Equações 7 e 8 por meio da computação da forçarms suavizada de xb[n] ponderada pela resposta de freqüência do filtro detransmissão amostrado na freqüência /b e o inverso da largura de banda emunidades de ERB:
<formula>formula see original document page 64</formula>
A ponderação da excitação da banda b por 1/eb efetivamentedistribui a energia dentro daquela banda uniformemente por todas as bandascríticas sub-somadas dentro da mesma. Pode-se, alternativamente, atribuirtoda a energia à banda crítica, cuja freqüência central fica mais próxima da freqüência central /b da banda, porém a distribuição uniforme da energiaoferece uma melhor aproximação para a maioria dos sinais de áudio domundo real.
Com a excitação E[b, n], pode-se continuar a computar a inten-sidade acústica específica N[b, n], a intensidade acústica alvo específica N[b, n], e os ganhos G[b, n], conforme apresentado acima, com exceção deque, aqui, o número total de bandas poderá ser muito menor, desta formareduzindo a complexidade. Ainda, uma modificação precisa ser feita nacomputação da intensidade acústica geral L[n]: a intensidade acústica espe-cífica precisa ser ponderada pelo número de bandas ERB dentro da banda bquando a mesma é somada através das bandas:
<formula>formula see original document page 65</formula>
Finalmente, um sinal modificado γ[η] pode ser produzido ao sesomar cada um dos sinais de banda ponderados pelo ganho da respectivabanda:
<formula>formula see original document page </formula>
Para simplificar a exposição, as computações acima são mos-tradas para serem realizadas para cada período de amostra η do sinal x[n].Na prática, no entanto, a excitação pode ser subamostrada a uma taxa muitomenor através do tempo, e, em seguida, todo o processamento de intensi-dade acústica subseqüente pode ser feito nesta taxa reduzida. Quando osganhos são aplicados no fim, os mesmos poderão então ser supermostradosatravés de interpolação antes de serem aplicados aos sinais de banda.
Acima encontra-se tão-somente um exemplo de uma aproxima-ção mais grosseira a uma intensidade acústica específica apropriada para apresente invenção, outras aproximações são possíveis, e a presente inven-ção tem a intenção de incluir o uso de todas estas aproximações.Implementação
A presente invenção pode ser implementada em hardware ousoftware, ou em uma combinação de ambos (por exemplo, arrays lógicosprogramáveis). A menos que de outra forma especificado, os algoritmos in-cluídos como parte da presente invenção não se referem inerentemente anenhum computador em particular ou outro aparelho. A este aspecto, váriasmáquinas de uso geral poderão ser usadas com os programas descritos deacordo com os ensinamentos do presente documento, ou poderá ser maisconveniente construir aparelhos mais especializados (por exemplo, circuitosintegrados) a fim de executar as etapas de método requeridas. Sendo assim,a presente invenção pode ser implementada em um ou mais programas decomputador que executem um ou mais sistemas computacionais programá-veis, cada qual compreendendo pelo menos um processador, pelo menosum sistema de armazenamento de dados (incluindo as memórias voláteise/ou não voláteis e/ou elementos de armazenamento), pelo menos um dis-positivo ou porta de entrada, e pelo menos um dispositivo ou porta de saída.Um código de programa é aplicado aos dados de entrada a fim de realizar asfunções descritas no presente documento e gerar as informações de saída.As informações de saída são aplicadas a um ou mais dispositivos de saída,de uma maneira conhecida.
Cada programa pode ser implementado em qualquer linguagemcomputacional desejada (incluindo máquina, montagem, ou linguagens deprogramação procedimental de alto nível, lógica, ou orientada a objeto) nosentido de se comunicar com um sistema de computador. De qualquer ma-neira, a linguagem deve ser uma linguagem compilada ou interpretada.
Cada programa de computador deve, de preferência, ser arma-zenado em ou transferido para um meio ou dispositivo de armazenamento(por exemplo, uma memória ou meio de estado sólido, ou um meio magnéti-co ou óptico) legível por um computador programável de uso geral ou de usoespecial, para a configuração e operação do computador quando o meio oudispositivo de armazenamento é lido por um sistema de computador a fim derealizar os procedimentos descritos no presente documento. O sistema in-ventivo pode também ser considerado de modo a ser implementado comoum meio de armazenamento legível em computador, configurado com umprograma de computador, no qual o meio de armazenamento assim configu-rado faz com que o sistema computacional opere de uma maneira específicae predefinida a fim de executar as funções descritas no presente documento.
Foram descritas diversas modalidades da presente invenção, noentanto, deve-se entender que várias modificações podem ser feitas sem seafastar do espírito e âmbito de aplicação da presente invenção. Por exem-pio, algumas etapas aqui descritas podem ser independentes de ordem, e,assim, poderão ser realizadas em uma ordem diferente da descrita.

Claims (15)

1. Método para controlar uma característica de intensidade acús-tica particular de um sinal de áudio, em que a intensidade acústica particularé, ou uma aproximação da intensidade acústica específica, que é uma medi-da de intensidade acústica perceptiva como uma função da freqüência e dotempo, ou uma aproximação da intensidade acústica específica parcial, queé uma medida de intensidade acústica perceptiva do sinal na presença deum sinal de interferência secundário como uma função da freqüência e dotempo, o método compreendendo:- obter uma aproximação para uma intensidade acústica alvoespecífica;- calcular os parâmetros de modificação variantes de freqüênciautilizáveis para modificar um sinal de áudio, a fim de reduzir a diferença en-tre a sua característica de intensidade acústica particular e a aproximaçãopara uma intensidade acústica alvo específica; ea) aplicar os parâmetros de modificação ao sinal de áudio, a fimde reduzir a diferença entre a sua característica de intensidade acústica par-ticular e a aproximação para uma intensidade acústica alvo específica, oub) transmitir ou armazenar os parâmetros de modificação e osinal de áudio para aplicação temporariamente e/ou espacialmente separadados parâmetros de modificação para o sinal de áudio reduzir a diferença en-tre a sua característica de intensidade acústica particular e a aproximaçãopara uma intensidade acústica alvo específica.
2. Método para controlar uma característica de intensidade acús-tica particular de um sinal de áudio, em que a intensidade acústica particularé ou uma aproximação da intensidade acústica específica, que é uma medi-da de intensidade acústica perceptiva como uma função da freqüência e dotempo, ou uma aproximação da intensidade acústica parcial, que é uma me-dida de intensidade acústica perceptiva do sinal de áudio na presença de umsinal de interferência secundário como uma função da freqüência e do tem-po, o método compreendendo:receber a partir de uma transmissão ou reprodução de um meiode armazenamento o sinal de áudio, ea) parâmetros de modificação variantes de freqüência para mo-dificar o sinal de áudio, os parâmetros de modificação tendo sido calculadosa partir de uma aproximação para uma intensidade acústica alvo específica,oub) uma aproximação para uma intensidade acústica alvo especí-fica ou uma representação da aproximação para aquela intensidade acústicaalvo específica, emodificar o sinal de áudio em resposta a a) os parâmetros demodificação recebidos, ou b) parâmetros de modificação calculados a partirde uma aproximação para uma intensidade acústica alvo específica ou suarepresentação de modo a reduzir a diferença entre a sua característica deintensidade acústica particular do sinal de áudio e a aproximação para umaintensidade acústica alvo específica.
3. Método de acordo com a reivindicação 1 ou reivindicação 2,em que a aproximação para uma intensidade acústica alvo específica não éuma função do sinal de áudio.
4. Método de acordo com a reivindicação 3, em que a dita modi-ficação ou o dito cálculo inclui receber uma aproximação para uma intensi-dade acústica alvo específica a partir de uma fonte externa ao método.
5. Método de acordo com a reivindicação 3 ou reivindicação 4,em que a dita modificação ou o dito cálculo inclui o processamento que cal-cula explicitamente uma aproximação para uma intensidade acústica especí-fica e/ou uma aproximação para intensidade acústica específica parcial.
6. Método de acordo com a reivindicação 3 ou reivindicação 4,em que a dita modificação ou o dito cálculo inclui o processamento que im-plicitamente calcula uma aproximação para uma intensidade acústica espe-cífica e/ou uma aproximação para intensidade acústica específica parcial
7. Método de acordo com a reivindicação 6, em que o proces-samento emprega uma tabela de consulta tal que o processamento determi-na inerentemente uma aproximação para uma intensidade acústica específi-ca e/ou uma aproximação para intensidade acústica específica parcial
8. Método de acordo com a reivindicação 6, em que uma apro-ximação intensidade acústica específica e/ou uma aproximação para inten-sidade acústica específica parcial é determinada inerentemente em uma ex-pressão matemática de forma fechada empregada pelo processamento.
9. Método, de acordo com qualquer uma das reivindicações 3 a 8, em que a aproximação para uma intensidade acústica alvo específica éinvariante em freqüência e tempo.
10. Método, de acordo com qualquer uma das reivindicações 3 a 8, em que a aproximação para uma intensidade acústica alvo específica éinvariante em tempo.
11. Método de acordo com a reivindicação 1 ou reivindicação 2,em que a aproximação para uma intensidade acústica alvo específica é umafunção do sinal de áudio ou medida do sinal de áudio.
12. Método de acordo com a reivindicação 11, em que a medidado sinal de áudio é uma aproximação para uma intensidade acústica especí-fica do sinal de áudio.
13. Método de acordo com a reivindicação 11 ou reivindicação 12, em que a função do sinal de áudio ou medida do sinal de áudio é um oumais escalonamentos do sinal de áudio ou medida do sinal de áudio.
14. Aparelho adaptado para executar todas as etapas do métodoconforme definido em qualquer uma das reivindicações 1 a 13.
15. Programa de computador, armazenado em um meio legívelpor computador, adaptado para fazer com que um computador execute to-das as etapas do método conforme definido em qualquer uma das reivindi-cações 1 a 13.
BRPI0709877A 2006-04-04 2007-03-30 método e aparelho para controlar uma característica de intensidade acústica particular de um sinal de áudio BRPI0709877B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US78953906P 2006-04-04 2006-04-04
US60/789,539 2006-04-04
PCT/US2007/007946 WO2007120453A1 (en) 2006-04-04 2007-03-30 Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal

Publications (2)

Publication Number Publication Date
BRPI0709877A2 true BRPI0709877A2 (pt) 2011-07-26
BRPI0709877B1 BRPI0709877B1 (pt) 2019-12-31

Family

ID=38325459

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0709877A BRPI0709877B1 (pt) 2006-04-04 2007-03-30 método e aparelho para controlar uma característica de intensidade acústica particular de um sinal de áudio

Country Status (9)

Country Link
EP (1) EP2002429B1 (pt)
JP (1) JP4981123B2 (pt)
CN (1) CN101421781A (pt)
BR (1) BRPI0709877B1 (pt)
ES (1) ES2400160T3 (pt)
PL (1) PL2002429T3 (pt)
RU (1) RU2426180C2 (pt)
TW (1) TWI471856B (pt)
WO (1) WO2007120453A1 (pt)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10299040B2 (en) 2009-08-11 2019-05-21 Dts, Inc. System for increasing perceived loudness of speakers

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA05012785A (es) 2003-05-28 2006-02-22 Dolby Lab Licensing Corp Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio.
MX2007005027A (es) 2004-10-26 2007-06-19 Dolby Lab Licensing Corp Calculo y ajuste de la sonoridad percibida y/o el balance espectral percibido de una senal de audio.
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
EP2002426B1 (en) 2006-04-04 2009-09-02 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
RU2417514C2 (ru) 2006-04-27 2011-04-27 Долби Лэборетериз Лайсенсинг Корпорейшн Регулировка усиления звука с использованием основанного на конкретной громкости обнаружения акустических событий
CN101529721B (zh) 2006-10-20 2012-05-23 杜比实验室特许公司 使用复位的音频动态处理
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
JP5192544B2 (ja) 2007-07-13 2013-05-08 ドルビー ラボラトリーズ ライセンシング コーポレイション 聴覚情景分析とスペクトルの歪みを用いた音響処理
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
AU2009274456B2 (en) 2008-04-18 2011-08-25 Dolby Laboratories Licensing Corporation Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
TWI416328B (zh) * 2008-04-29 2013-11-21 Novatek Microelectronics Corp 用於一多媒體裝置控制音頻資料來源的方法及其相關裝置
EP2347556B1 (en) * 2008-09-19 2012-04-04 Dolby Laboratories Licensing Corporation Upstream signal processing for client devices in a small-cell wireless network
EP2329492A1 (en) 2008-09-19 2011-06-08 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
TWI491277B (zh) * 2008-11-14 2015-07-01 That Corp 動態音量控制和多空間處理保護(二)
EP2374211B1 (en) 2008-12-24 2012-04-04 Dolby Laboratories Licensing Corporation Audio signal loudness determination and modification in the frequency domain
US8675298B2 (en) * 2009-01-09 2014-03-18 Lsi Corporation Systems and methods for adaptive target search
TWI503816B (zh) * 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
US20120123769A1 (en) * 2009-05-14 2012-05-17 Sharp Kabushiki Kaisha Gain control apparatus and gain control method, and voice output apparatus
CN102440007B (zh) * 2009-05-18 2015-05-13 奥迪康有限公司 使用无线流传输的信号增强的装置和方法
WO2010138309A1 (en) * 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Audio signal dynamic equalization processing control
WO2010138311A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Equalization profiles for dynamic equalization of audio data
TWI525987B (zh) * 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
PL2381574T3 (pl) * 2010-04-22 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób do modyfikacji wejściowego sygnału audio
JP5126281B2 (ja) * 2010-04-27 2013-01-23 ソニー株式会社 楽曲再生装置
TWI896112B (zh) 2010-12-03 2025-09-01 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
CN102044249B (zh) * 2010-12-10 2012-05-30 北京中科大洋科技发展股份有限公司 一种适用于文件播出系统的音频响度一致性控制方法
CN102610229B (zh) * 2011-01-21 2013-11-13 安凯(广州)微电子技术有限公司 一种音频动态范围压缩方法、装置及设备
US8930182B2 (en) * 2011-03-17 2015-01-06 International Business Machines Corporation Voice transformation with encoded information
EP2530835B1 (en) 2011-05-30 2015-07-22 Harman Becker Automotive Systems GmbH Automatic adjustment of a speed dependent equalizing control system
EP2820863B1 (en) 2011-12-22 2016-06-08 Widex A/S Method of operating a hearing aid and a hearing aid
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN104221284B (zh) 2012-04-12 2017-05-24 杜比实验室特许公司 用于调平音频信号的响度变化的系统及方法
CN121122295A (zh) * 2012-05-18 2025-12-12 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
CN103428607A (zh) * 2012-05-25 2013-12-04 华为技术有限公司 一种音频信号播放系统及电子设备
ITTO20120530A1 (it) * 2012-06-19 2013-12-20 Inst Rundfunktechnik Gmbh Dynamikkompressor
EP2693637A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
CN103841241B (zh) * 2012-11-21 2017-02-08 联想(北京)有限公司 音量调整方法及装置
CN103050119B (zh) * 2012-12-30 2015-06-17 安徽科大讯飞信息科技股份有限公司 一种灯光或电机与声音同步的自适应检测方法
TWM467148U (zh) * 2013-01-21 2013-12-01 Dolby Lab Licensing Corp 具響度處理狀態詮釋資料之音訊處理設備
EP2787746A1 (en) * 2013-04-05 2014-10-08 Koninklijke Philips N.V. Apparatus and method for improving the audibility of specific sounds to a user
CN107093991B (zh) 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
DK2981963T3 (en) 2013-04-05 2017-02-27 Dolby Laboratories Licensing Corp COMPRESSION APPARATUS AND PROCEDURE TO REDUCE QUANTIZATION NOISE USING ADVANCED SPECTRAL EXTENSION
MY171256A (en) * 2013-06-21 2019-10-07 Fraunhofer Ges Forschung Time scaler, audio decoder, method and a computer program using a quality control
KR101953613B1 (ko) 2013-06-21 2019-03-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 지터 버퍼 제어부, 오디오 디코더, 방법 및 컴퓨터 프로그램
JP6201460B2 (ja) * 2013-07-02 2017-09-27 ヤマハ株式会社 ミキシング管理装置
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
EP2879131A1 (en) 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
KR102356012B1 (ko) * 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
EP3108669B1 (en) 2014-02-18 2020-04-08 Dolby International AB Device and method for tuning a frequency-dependent attenuation stage
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal
CA3155815C (en) * 2014-03-24 2025-08-12 Dolby International Ab Method and device for applying dynamic range compression to a higher order ambisonics signal
US9615185B2 (en) * 2014-03-25 2017-04-04 Bose Corporation Dynamic sound adjustment
US9503803B2 (en) 2014-03-26 2016-11-22 Bose Corporation Collaboratively processing audio between headset and source to mask distracting noise
US9800220B2 (en) * 2014-09-24 2017-10-24 Intel Corporation Audio system with noise interference mitigation
CN104393848B (zh) * 2014-10-27 2017-08-04 广州酷狗计算机科技有限公司 音量调节方法及装置
RU2589298C1 (ru) * 2014-12-29 2016-07-10 Александр Юрьевич Бредихин Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
WO2016172111A1 (en) 2015-04-20 2016-10-27 Dolby Laboratories Licensing Corporation Processing audio data to compensate for partial hearing loss or an adverse hearing environment
CN107925390B (zh) 2015-08-24 2021-11-23 杜比实验室特许公司 音量均一化处理
US9590580B1 (en) * 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
CN106817324B (zh) * 2015-11-30 2020-09-11 腾讯科技(深圳)有限公司 频响校正方法及装置
CN105916095B (zh) * 2016-05-31 2017-08-04 音曼(北京)科技有限公司 反馈延迟网络音色优化的方法
CN106101925B (zh) * 2016-06-27 2020-02-21 联想(北京)有限公司 一种控制方法及电子设备
CN106354469B (zh) * 2016-08-24 2019-08-09 北京奇艺世纪科技有限公司 一种响度调节方法及装置
WO2018066383A1 (ja) 2016-10-07 2018-04-12 ソニー株式会社 情報処理装置および方法、並びにプログラム
TWI590239B (zh) 2016-12-09 2017-07-01 宏碁股份有限公司 語音信號處理裝置及語音信號處理方法
US10389323B2 (en) 2017-12-18 2019-08-20 Tls Corp. Context-aware loudness control
WO2019178809A1 (zh) * 2018-03-22 2019-09-26 华为技术有限公司 一种调节音量的方法和电子设备
CN111048108B (zh) * 2018-10-12 2022-06-24 北京微播视界科技有限公司 音频处理方法和装置
US11223340B2 (en) 2018-10-24 2022-01-11 Gracenote, Inc. Methods and apparatus to adjust audio playback settings
US11295718B2 (en) 2018-11-02 2022-04-05 Bose Corporation Ambient volume control in open audio device
US11032642B1 (en) 2020-03-10 2021-06-08 Nuvoton Technology Corporation Combined frequency response and dynamic range correction for loudspeakers
CN111698631B (zh) * 2020-05-22 2021-10-15 深圳市东微智能科技股份有限公司 音频设备自动调试方法、音频设备以及音频系统
EP3944240A1 (en) * 2020-07-20 2022-01-26 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk Onderzoek TNO Method of determining a perceptual impact of reverberation on a perceived quality of a signal, as well as computer program product
US11317203B2 (en) 2020-08-04 2022-04-26 Nuvoton Technology Corporation System for preventing distortion of original input signal
US11202149B1 (en) 2020-09-11 2021-12-14 Ford Global Technologies, Llc Vehicle audio control
US11380345B2 (en) * 2020-10-15 2022-07-05 Agora Lab, Inc. Real-time voice timbre style transform
CN112040373B (zh) * 2020-11-02 2021-04-23 统信软件技术有限公司 一种音频数据处理方法、计算设备及可读存储介质
CN116215420A (zh) * 2021-12-02 2023-06-06 广州六环信息科技有限公司 车载音响的音频随速调节方法、装置、车载音响
CN115798509A (zh) * 2022-11-11 2023-03-14 维沃移动通信有限公司 音频处理方法、装置、电子设备和可读存储介质
CN116033314B (zh) * 2023-02-15 2023-05-30 南昌航天广信科技有限责任公司 一种音频自动增益补偿方法、系统、计算机及存储介质
CN121037739B (zh) * 2025-10-30 2026-02-03 深圳市纵贯无限科技有限公司 一种摩托车骑行耳机室内骑行还原性提升的drc控制方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2012994C1 (ru) * 1989-03-01 1994-05-15 Белорусский государственный университет Устройство автоматической регулировки уровня сигнала
JP3006259B2 (ja) * 1992-01-17 2000-02-07 ソニー株式会社 補聴器
JPH07122953A (ja) * 1993-10-22 1995-05-12 Matsushita Electric Ind Co Ltd 信号レベル圧縮装置
WO1998047313A2 (en) * 1997-04-16 1998-10-22 Dspfactory Ltd. Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signals in hearing aids
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
CA2372017A1 (en) * 1999-04-26 2000-11-02 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
AUPQ952700A0 (en) * 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
DE10107385A1 (de) * 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
RU2206174C2 (ru) * 2001-03-05 2003-06-10 Журин Дмитрий Вячеславович Способ регулирования громкости звуковоспроизведения и устройства для его реализации
US7242784B2 (en) * 2001-09-04 2007-07-10 Motorola Inc. Dynamic gain control of audio in a communication device
DE10308483A1 (de) * 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
MXPA05012785A (es) 2003-05-28 2006-02-22 Dolby Lab Licensing Corp Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio.
TWI233090B (en) * 2003-07-24 2005-05-21 Inventec Multimedia & Telecom System and method of language translation for multimedia data
US20050069153A1 (en) * 2003-09-26 2005-03-31 Hall David S. Adjustable speaker systems and methods
MX2007005027A (es) * 2004-10-26 2007-06-19 Dolby Lab Licensing Corp Calculo y ajuste de la sonoridad percibida y/o el balance espectral percibido de una senal de audio.

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10299040B2 (en) 2009-08-11 2019-05-21 Dts, Inc. System for increasing perceived loudness of speakers

Also Published As

Publication number Publication date
WO2007120453A1 (en) 2007-10-25
ES2400160T3 (es) 2013-04-08
EP2002429A1 (en) 2008-12-17
PL2002429T3 (pl) 2013-03-29
BRPI0709877B1 (pt) 2019-12-31
JP2009532739A (ja) 2009-09-10
EP2002429B1 (en) 2012-11-21
RU2426180C2 (ru) 2011-08-10
TWI471856B (zh) 2015-02-01
RU2008143336A (ru) 2010-05-10
CN101421781A (zh) 2009-04-29
TW200746049A (en) 2007-12-16
JP4981123B2 (ja) 2012-07-18

Similar Documents

Publication Publication Date Title
BRPI0709877A2 (pt) cÁlculo e ajuste de intensidade acéstica percebida e/ou do equilÍbrio espectral percebido de um sinal de Áudio
US11296668B2 (en) Methods and apparatus for adjusting a level of an audio signal
US8199933B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according art. 34 industrial property law
B06T Formal requirements before examination
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 21/02 , G10L 19/00 , H03G 3/32 , H03G 9/02 , H04R 25/00

Ipc: G10L 25/69 (2013.01), G10L 21/0364 (2013.01), H03G

B09A Decision: intention to grant
B16A Patent or certificate of addition of invention granted

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 31/12/2019, OBSERVADAS AS CONDICOES LEGAIS.