BRPI0618002A2 - método para uma melhor conformação temporal e espacial dos sinais de áudio multicanais - Google Patents

método para uma melhor conformação temporal e espacial dos sinais de áudio multicanais Download PDF

Info

Publication number
BRPI0618002A2
BRPI0618002A2 BRPI0618002-7A BRPI0618002A BRPI0618002A2 BR PI0618002 A2 BRPI0618002 A2 BR PI0618002A2 BR PI0618002 A BRPI0618002 A BR PI0618002A BR PI0618002 A2 BRPI0618002 A2 BR PI0618002A2
Authority
BR
Brazil
Prior art keywords
representation
resolution
waveform
signal
channel
Prior art date
Application number
BRPI0618002-7A
Other languages
English (en)
Inventor
Juergen Herre
Matthias Neusinger
Gerard Hotho
Sascha Disch
Jeroen Breebaart
Original Assignee
Fraunhofer Ges Forschung
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung, Koninkl Philips Electronics Nv filed Critical Fraunhofer Ges Forschung
Publication of BRPI0618002A2 publication Critical patent/BRPI0618002A2/pt
Publication of BRPI0618002B1 publication Critical patent/BRPI0618002B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

<b>MéTODO PAPA UMA MELHOR CONFORMAçãO TEMPORAL E ESPACIAL DOS SINAIS DE áUDIO MULTICANAIS<d>. Um canal selecionado de um sinal multicanais que é representado por frames compostos por valores de amostragem tendo uma alta resolução de tempo pode ser codificado com maior qualidade quando é obtida uma representação paramétrica de forma de onda que representa a forma de onda de uma representação de resolução intermediária do canal selecionado, a representação paramétrica de forma de onda incluindo uma sequência de parâmetros de forma de onda intermediária tendo uma resolução de tempo menor que a alta resolução de tempo dos valores de amostragem e maior que a resolução de tempo definida por uma taxa de repetição de frame. A representação paramétrica de forma de onda com a resolução intermediária pode ser usada para conformar um canal reconstruido de maneira a recuperar um canal tendo um envelope de sinal próximo daquele do canal original selecionado. A escala de tempo em que a conformação é feita é mais curta que a escala de tempo de um processamento de frames, ampliando assim a qualidade do canal reconstruído. Por outro lado, a escala de tempo da conformação é maior que a escala de tempo dos valores de amostragem, reduzindo significativamente a quantidade necessária de dados pela representação paramétrica de forma de onda.

Description

"MÉTODO PARA UMA MELHOR CONFORMAÇÃO TEMPORAL EESPACIAL DOS SINAIS DE ÁUDIO MULTICANAIS".
Campo da Invenção
A presente invenção se refere à codificação desinais de áudio multicanais e, em particular, a um conceito paramelhorar a percepção espacial de um sinal multicanaisreconstruído.
Histórico da invenção e técnica anterior
0 recente desenvolvimento da codificação de áudiotornou disponível a capacidade de recriar uma representaçãomulticanais de um sinal de áudio com base em um sinal estéreo (oumono) e nos dados de controle correspondentes. Esses métodosdiferem essencialmente das antigas soluções baseadas em matrizescomo a Dolby Prologic, já que os dados de controle adicionais sãotransmitidos para controlar a recriação, também denominada de up-mix, dos canais surround com base nos canais mono e estéreotransmitidos.
Assim, os decodificadores paramétricos de áudiomulticanais reconstroem N canais com base em M canaistransmitidos, onde N > M, e com base nos dados adicionais decontrole. Os dados adicionais de controle representam uma taxa dedados significativamente menor do que a transmissão de todos os Ncanais, tornando a codificação muito eficiente, enquanto ao mesmotempo garante a compatibilidade tanto dos dispositivos de M canaiscomo dos dispositivos de N canais. Os M canais tanto podem ser umarepresentação de canais mono única, estéreo ou 5.1. Portanto, épossível ter, por exemplo, um sinal original de canal 7.2 com downmix para um sinal reversamente compatível de canal 5.1, eparâmetros de áudio espacial que permitem que um decodificador deáudio espacial reproduza uma versão muito próxima dos canais 7.2originais, com uma pequena taxa inicial adicional de bits.
Esses métodos paramétricos de codificaçãosurround normalmente compreendem uma parametrização do sinalsurround baseada em ILD (Diferença de Nivel Intercanais) e ICC(Coerência Intercanais) . Esses parâmetros descrevem, por exemplo,relações de potência e correlação entre pares de canais do sinalmulticanais original. No processo de decodificação, o sinalmulticanal recriado pela distribuição da energia dos canaisdownmix recebidos entre todos os pares de canais descritos pelosparâmetros ILD transmitidos. Entretanto, como um sinal multicanaispode ter distribuição igual de potência entre todos os canais,enquanto os sinais nos diferentes canais são muito diferentes,dando assim a impressão auditiva de um som muito amplo (difuso) , alargura correta (difusibilidade) é obtida misturando os sinais comsuas versões não correlacionadas. Essa mistura é descrita peloparâmetro ICC. A versão não correlacionada do sinal é obtidapassando o sinal por um filtro passa tudo, como um reverberador.
Isto significa que a versão não correlacionada dosinal é criada no lado do decodif icador, não sendo, como noscanais downmix, transmitida do codificador para o decodificador.Os sinais de saida dos filtros passa tudo (decorrelatores) têm umtempo-resposta normalmente muito plano. Assim, um sinal de entradadireta proporciona uma explosão de ruido decrescente. Portanto, aomixar o sinal não correlacionado com o original, é importante paraalguns tipos de sinais, como densos transientes (sinais deaplausos), conformar o envelope de tempo do sinal nãocorrelacionado para melhor combinar com o do canal down-mix, que égeralmente chamado de sinal seco. Se isto não for feito, resultaráem uma percepção de uma sala de maior tamanho e de sinaistransientes com sons não naturais. Tendo os sinais transientes eum reverberador como filtro passa tudo, até mesmo os problemas dotipo eco podem ser introduzidos quando é omitida a conformação dossinais (úmidos) não correlacionados.
A partir do ponto de vista técnico, um dosprincipais desafios na reconstrução dos sinais multicanais, comopor exemplo, dentro de uma síntese de som MPEG, consiste naadequada reprodução dos sinais multicanais com uma imagem sonoramuito ampla. Falando tecnicamente, isto corresponde à geração devários sinais com baixa correlação intercanais (ou coerência), masainda com envelopes espectrais e temporais sob rígido controle. Umexemplo desses sinais são os "aplausos", que possuem tanto um altograu de decorrelação e aguçados eventos transientes (palmas). Comoconseqüência, esses itens são os mais críticos para a tecnologiasurround MPEG que é, por exemplo, elaborada em maiores detalhes no"Report on MPEG Spatial Audio Coding RMO Listening Tests", ISO/IECJTCl/SC2 9/WG11 (MPEG), Document N7138, Busan, Korea, 2005". Emgeral, os trabalhos anteriores se focalizaram em alguns aspectosrelativos à reprodução ideal de sinais amplos/difusos, como osaplausos, fornecendo soluções que
1. adaptam a forma temporal (e espectral) dosinal decorrelacionado ao do sinal downmix transmitido, de maneiraa evitar o pré-eco - como problemas (nota: isto não exige o enviode quaisquer informações auxiliares do codificador de áudioespacial para o decodificador de áudio espacial).2. adaptam os envelopes temporais dos canaissintetizados de saída a suas formas originais de envelopes(presentes na entrada do codificador correspondente) usandoinformações auxiliares que descrevem os envelopes temporais dos sinais originais de entrada e que são transmitidas do codificadorde áudio espacial ao decodificador de áudio espacial.
Atualmente, o MPEG Surround Reference Model(Modelo de Referência MPEG Surround) já contém várias ferramentasque suportam a codificação desses sinais, por exemplo
• Time Domain Temporal Shaping (TP)
• Temporal Conformação de envelope (TES)
Em um sistema de síntese MPEG Surround, o somdecorrelacionado é gerado e mixado com o sinal "seco", de maneiraa controlar a correlação dos canais sintetizados de saída deacordo com os valores ICC transmitidos. Daqui para frente, o sinaldecorrelacionado será denominado de sinal Mifuso' , apesar de otermo 'difuso' refletir propriedades do campo do som espacialreconstruído ao invés das propriedades do próprio sinal. Nossinais transientes, o som difuso gerado no decodificador nãocombina automaticamente com a fina forma temporal dos sinais secose não se funde perceptualmente bem com o sinal seco. Isto resultaem uma má reprodução transiente, em analogia ao "problema de pré-eco" conhecido na codificação de áudio perceptual. A ferramenta TPque implementa o' Time Domain Temporal Shaping é projetada parasolucionar esse problema, processando o som difuso.
A ferramenta TP é aplicada ao domínio do tempo,·como ilustrado na Fig. 14. Basicamente consiste de uma estimativado envelope temporal dos sinais seco e difuso com uma maiorresolução temporal que a fornecida pelo banco de filtros docodificador MPEG Surround. 0 sinal difuso é reescalado em seuenvelope temporal para combinar com o envelope do sinal seco. Istoresulta em um aumento significativo na qualidade do som dos sinaistransientes críticos com uma ampla imagem espacial / baixacorrelação entre os sinais de canal, como os aplausos.
A conformação de envelope (ajustando a evoluçãotemporal da energia contida dentro de um canal) é feita combinandoa energia normalizada de curto tempo do sinal úmido com a do sinalseco. Isto é feito por meio de uma função de ganho na variação dotempo que é aplicada ao sinal difuso, de maneira que o envelope detempo do sinal difuso seja conformado para combinar com o do sinalseco.
Notar que isto não requer que qualquer informaçãoauxiliar seja transmitida do codificador para o decodificador paraprocessar o envelope temporal do sinal (somente informações decontrole para habilitar/desabilitar seletivamente a TP sãotransmitidas pelo codificador surround).
A Fig. 14 ilustra a conformação temporal nodomínio do tempo, como aplicada dentro da codificação MPEGsurround. Os sinais a serem processados são o sinal direto 10 e osinal difuso 12, ambos fornecidos em um domínio de banco defiltros. Opcionalmente, dentro do MPEG surround, pode haver umsinal residual 14 que seja adicionado ao sinal direto 10 aindadentro do domínio do banco de filtros. No caso especial de umdecodificador MPEG surround, somente são conformadas as partes dealta freqüência do sinal difuso 12, portanto as partes de baixafreqüência 16 do sinal são adicionadas ao sinal direto 10 dentrodo domínio do banco de filtros.
O sinal direto 10 e o sinal difuso 12 sãoconvertidos separadamente no domínio do tempo pelos dispositivosde síntese do banco de filtros 18a e 18b. A real conformaçãotemporal no domínio do tempo é feita após o banco de filtros desíntese. Como somente as partes de alta freqüência do sinal difuso12 devem ser conformadas, as representações no domínio do tempo dosinal direto 10 e do sinal difuso 12 entram nos filtros passaaltas 20a e 20b que garantem que somente as porções de altafreqüência dos sinais sejam usadas nas etapas seguintes defiltragem. Pode ser feito um branqueamento espectral subseqüentedos sinais nos branqueadores espectrais 22a e 22b para garantirque as taxas de amplitude (energia) de toda a faixa espectral dossinais sejam adicionadas na seguinte estimativa envelope 24 quecompara a taxa das energias que estão contidas no sinal direto eno sinal difuso em uma dada porção de tempo. Essa porção de tempoé normalmente definida pelo comprimento do frame. A estimativaenvelope 24 tem como saída um fator de escala 26, que é aplicadoao sinal difuso 12 na conformação envelope 28 no domínio do tempo,para garantir que o envelope sinal seja basicamente o mesmo para osinal difuso 12 e para o sinal direto 10 dentro de cada frame.
Finalmente, o sinal difuso conformado em envelopeé novamente filtrado em passa alta por um filtro passa altas 29 demaneira a garantir que não existam problemas de bandas de menoresfreqüências no sinal difuso conformado em envelope. A combinaçãodo sinal direto e do sinal difuso é feita por um adicionador 30. Osinal de saída 32 então contém partes do sinal do sinal direto 10e do sinal difuso 12, onde o sinal difuso foi conformado emenvelope para garantir que o envelope sinal seja basicamente omesmo para o sinal difuso 12 e para o sinal direto 10 antes dacombinação.
O problema do controle preciso da conformaçãotemporal do som difuso também pode ser solucionado pela denominadaferramenta Temporal Conformação de envelope (TES), que é projetadapara ser uma alternativa de baixa complexidade à ferramentaTemporal Processing (TP) . Apesar de a TP operar no domínio dotempo por meio de uma escalação no domínio do tempo do envelope desom difuso, a abordagem TES alcança o mesmo efeito principalcontrolando o envelope de som difuso em uma representação dedomínio espectral. Isto é feito de forma similar à da abordagem daTemporal Noise Shaping (TNS), como é conhecida no MPEG-2/4Advanced Audio Coding (AAC). A manipulação do fino envelopetemporal de som difuso é feita pela convolução de seuscoeficientes espectrais na freqüência com um adequado filtro deconformação obtido de uma análise LPC dos coeficientes espectraisdo sinal seco. Devido ao tempo de resolução muito alto do banco defiltros do MPEG Surround, o processamento TES requer somentefiltragem de baixa ordem (previsão complexa de primeira ordem),sendo assim baixa em sua complexidade computacional. Por outrolado, devido às limitações, por exemplo, relacionadas aoserrilhado temporal, não pode prover a totalidade do controletemporal que a ferramenta TP oferece.
Notar que, de forma similar ao caso TP, a TES nãoexige que nenhuma informação auxiliar seja transmitida docodificador para o decodificador para descrever o envelopetemporal do sinal.As duas ferramentas, TP e TES, resolvem comsucesso o problema da conformação temporal do som difuso,adaptando sua forma temporal à do sinal down mix transmitido.Apesar de esse fato evitar o tipo pré-eco de desmascaramento, nãopode compensar um segundo tipo de deficiência no sinal de saidamulticanais, que se deve à falta de redistribuição espacial:
Um sinal de aplauso consiste de uma densa misturade eventos transientes (palmas), vários dos quais caem no mesmoframe de parâmetro. Claramente, nem todas as palmas de um frame seoriginam da mesma (ou similar) direção espacial. Para umdecodificador MPEG Surround, entretanto, a granularidade temporaldo decodificador é amplamente determinada pelo tamanho do frame epela granularidade temporal do slot do parâmetro. Assim, após asíntese, todas as palmas que se situarem em um frame aparecem coma mesma orientação espacial (distribuição de nível entre os canaisde saída) em contraste com o sinal original para o qual cada palmapode ser localizada (e, de fato, percebida) individualmente.
Para também obter bons resultados em termos deredistribuição espacial de sinais altamente críticos como sinaisde aplauso, os envelopes de tempo do sinal upmixed devem serconformados com uma resolução muito alta de tempo.
Sumário da invenção
É o objetivo da presente invenção prover umconceito para a codificação de sinais de áudio multicanais quepermita a codificação eficiente, provendo uma melhor preservaçãoda distribuição espacial dos sinais multicanais.
De acordo com o primeiro aspecto da presenteinvenção, este objetivo é alcançado por um decodificador para ageração de um sinal de saída multicanais com base em um sinal baseobtido de um sinal multicanais original tendo um ou mais canais, onúmero de canais do sinal base sendo menor que o número de canaisdo sinal multicanais original, o sinal base sendo organizado emframes, um frame compreendendo valores de amostragem dotados dealta resolução, e com base em uma representação paramétrica deforma de onda que representa uma forma de onda de umarepresentação de resolução intermediária de um canal originalselecionado do sinal multicanais original, a representaçãoparamétrica de forma de onda incluindo uma seqüência de parâmetrosde forma de onda intermediária tendo uma resolução de tempointermediária inferior à alta resolução de tempo dos valores deamostragem e superior à baixa resolução de tempo definida por umataxa de repetição de frame, compreendendo: um upmixer para ageração de uma pluralidade de canais upmixed tendo uma resoluçãode tempo mais alta do que a resolução intermediária; e um shaper(conformador) para conformar um canal upmixed selecionado usandoos parâmetros intermediários de forma de onda do canal originalselecionado que corresponde ao canal upmixed selecionado.
De acordo com um segundo aspecto da presenteinvenção, este objetivo é atingido por um codificador para ageração de uma representação paramétrica de forma de onda de umcanal de um sinal multicanais representado por frames, um framecompreendendo valores de amostragem tendo um período deamostragem, o codificador compreendendo: um redutor da resoluçãode tempo para a obtenção de uma representação de baixa resoluçãodo canal usando os valores de amostragem de um frame, arepresentação de baixa resolução tendo valores de baixa resoluçãodotados de um período de baixa resolução associado maior que operíodo de amostragem; e um calculador paramétrico de forma deonda para o cálculo da representação paramétrica de forma de ondaque representa uma forma de onda da representação de baixaresolução, em que o calculador paramétrico de forma de onda estáadaptado para gerar uma seqüência de parâmetros de forma de ondatendo uma resolução de tempo menor que a resolução de tempo dosvalores de amostragem e maior que a resolução de tempo definidapela taxa de repetição de frame.
De acordo com um terceiro aspecto da presenteinvenção, este objetivo é alcançado por um método para a geraçãode um sinal de saída multicanais com base em um sinal base obtidode um sinal multicanais original tendo um ou mais canais, o númerode canais do sinal base sendo menor que o número de canais dosinal multicanais original, o sinal base sendo organizado emframes, um frame compreendendo valores de amostragem tendo umaalta resolução, e com base em uma representação paramétrica deforma de onda que representa uma forma de onda de umarepresentação de resolução intermediária de um canal originalselecionado do sinal multicanais original, a representaçãoparamétrica de forma de onda incluindo uma seqüência de parâmetrosde forma de onda intermediária tendo uma resolução de tempointermediária menor que a alta resolução de tempo dos valores deamostragem e maior que uma baixa resolução de tempo definida poruma taxa de repetição de frame, o método compreendendo: a geraçãode uma pluralidade de canais upmixed tendo uma resolução de tempomaior que a resolução intermediária; e conformando um canalupmixed selecionado usando os parâmetros intermediários de formade onda do canal original selecionado que correspondem ao canalupmixed selecionado.
De acordo com um quarto aspecto da presenteinvenção, este objetivo é alcançado por um método para a geraçãode uma representação paramétrica de forma de onda de um canal deum sinal multicanais representado por frames, um framecompreendendo valores de amostragem tendo um período deamostragem, o método compreendendo: obter uma representação debaixa resolução do canal usando os valores de amostragem de umframe, a representação de baixa resolução tendo valores de baixaresolução tendo associado um período de baixa resolução maior queo período de amostragem; e calcular uma representação paramétricade forma de onda que representa a forma de onda da representaçãode baixa resolução, em que o calculador paramétrico de forma deonda está adaptado para gerar uma seqüência de parâmetros de formade onda tendo uma resolução de tempo menor que a resolução detempo dos valores de amostragem e maior que a resolução de tempodefinida por uma taxa de repetição de frame.
De acordo com um quinto aspecto da presenteinvenção, este objetivo é alcançado por uma representação de umsinal de áudio multicanais com base em um sinal base obtido dosinal de áudio multicanais tendo um ou mais canais, o número decanais do sinal base sendo menor que o número de canais do sinalmulticanais, o sinal base sendo organizado em frames, um framecompreendendo valores de amostragem tendo uma alta resolução, ecom base em uma representação paramétrica de forma de onda querepresenta uma forma de onda de uma representação de resoluçãointermediária de um canal selecionado do sinal multicanais, arepresentação paramétrica de forma de onda incluindo uma seqüênciade parâmetros de forma de onda intermediária tendo a resolução detempo menor que uma alta resolução de tempo dos valores deamostragem e maior que uma baixa resolução de tempo definida poruma taxa de repetição de frame.
De acordo com um sexto aspecto da presenteinvenção, este objetivo é alcançado por um meio de armazenagemlegível por computador, tendo armazenado uma representação de umsinal de áudio multicanais com base em um sinal base obtido dosinal de áudio multicanais tendo um ou mais canais, o número decanais do sinal base sendo menor que o número de canais do sinalmulticanais, o sinal base sendo organizado em frames, um framecompreendendo valores de amostragem tendo uma alta resolução, ecom base em uma representação paramétrica de forma de onda querepresenta a forma de onda de uma representação de resoluçãointermediária de um canal selecionado do sinal multicanais, arepresentação paramétrica de forma de onda incluindo uma seqüênciade parâmetros de forma de onda intermediária tendo uma resoluçãode tempo menor que a alta resolução de tempo dos valores deamostragem e maior que uma baixa resolução de tempo definida poruma taxa de repetição de frame.
De acordo com um sétimo aspecto da presenteinvenção, este objetivo é alcançado por um receptor ou reprodutorde áudio tendo um decodificador para a geração de um sinal desaída multicanais com base em um sinal base obtido de um sinalmulticanais original tendo um ou mais canais, o número de canaisdo sinal base sendo menor que o número de canais do sinalmulticanais original, o sinal base sendo organizado em frames, umframe compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma deonda que representa a forma de onda de uma representação deresolução intermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, compreendendo: um upmixer para a geração de uma pluralidadede canais upmixed tendo uma resolução de tempo maior que aresolução intermediária; e um shaper para a conformação de umcanal upmixed selecionado usando os parâmetros intermediários deforma de onda do canal original selecionado que correspondem aocanal upmixed selecionado.
De acordo com um oitavo aspecto da presenteinvenção, este objetivo é alcançado por um transmissor ou gravadorde áudio tendo um codificador para gerar uma representaçãoparamétrica de forma de onda de um canal de um sinal multicanaisrepresentado por frames, um frame compreendendo valores deamostragem tendo um período de amostragem, o codificadorcompreendendo: um redutor da resolução de tempo para obter uma.representação de baixa resolução do canal usando os valores deamostragem de um frame, a representação de baixa resolução tendovalores de baixa resolução tendo associados um período de baixaresolução maior que o período de amostragem; e um calculadorparamétrico de forma de onda para o cálculo da representaçãoparamétrica de forma de onda que representa uma forma de onda darepresentação de baixa resolução, em que o calculador paramétricode forma de onda está adaptado para gerar uma seqüência deparâmetros de forma de onda tendo uma resolução de tempo menor quea resolução de tempo dos valores de amostragem e maior que aresolução de tempo definida por uma taxa de repetição de frame.
De acordo com um nono aspecto da presenteinvenção, este objetivo é alcançado por um método de recepção oude reprodução de áudio, o método tendo um método para a geração deum sinal de saída multicanais com base em um sinal base obtido deum sinal multicanais original tendo um ou mais canais, o número decanais do sinal base sendo menor que o número de canais do sinalmulticanais original, o sinal base sendo organizado em frames, umframe compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma deonda que representa a forma de onda de uma representação deresolução intermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, o método compreendendo: a geração de uma pluralidade decanais upmixed tendo uma resolução de tempo maior que a resoluçãointermediária; e conformando um canal upmixed selecionado usandoos parâmetros intermediários de forma de onda do canal originalselecionado que correspondem ao canal upmixed selecionado.
De acordo com um décimo aspecto da presenteinvenção, este objetivo é alcançado por um método para atransmissão ou a gravação de áudio, o método tendo um método paraa geração de uma representação paramétrica de forma de onda de umcanal de um sinal multicanais representado por frames, um framecompreendendo valores de amostragem tendo um período deamostragem, o método compreendendo: obter uma representação debaixa resolução de um canal usando os valores de amostragem de umframe, a representação de baixa resolução tendo valores de baixaresolução tendo associado um período de baixa resolução maior queo período de amostragem; e calcular a representação paramétrica deforma de onda que representa a forma de onda da representação debaixa resolução, em que o calculador paramétrico de forma de ondaestá adaptado para gerar uma seqüência de parâmetros de forma deonda tendo uma resolução de tempo menor que a resolução de tempodos valores de amostragem e maior que a resolução de tempodefinida por uma taxa de repetição de frame.
De acordo com um décimo primeiro aspecto dapresente invenção, este objetivo é alcançado por um sistema detransmissão dotado de um transmissor e um receptor, o transmissortendo um codificador para a geração de uma representaçãoparamétrica de forma de onda de um canal de um sinal multicanaisrepresentado por frames, um frame compreendendo valores deamostragem tendo um período de amostragem; e o receptor tendo umdecodificador para a geração de um sinal de saída multicanais combase em um sinal base obtido de um sinal multicanais originaltendo um ou mais canais, o número de canais do sinal base sendomenor que o número de canais do sinal multicanais original, osinal base sendo organizado em frames, um frame compreendendovalores de amostragem tendo uma alta resolução, e com base em umarepresentação paramétrica de forma de onda que representa a formade onda de uma representação de resolução intermediária de umcanal original selecionado do sinal multicanais original, arepresentação paramétrica de forma de onda incluindo uma seqüênciade parâmetros de forma de onda intermediária tendo uma resoluçãode tempo intermediária menor que a alta resolução de tempo dosvalores de amostragem e maior que uma baixa resolução de tempodefinida por uma taxa de repetição de frame.
De acordo com um décimo segundo aspecto dapresente invenção, este objetivo é alcançado por um método para atransmissão e recepção, o método de transmissão tendo um métodopara a geração de uma representação paramétrica de forma de ondade um canal de um sinal multicanais representado por frames, umframe compreendendo valores de amostragem tendo um período deamostragem; e o método de recepção tendo um método para a geraçãode um sinal de saída multicanais com base em um sinal base obtidode um sinal multicanais original tendo um ou mais canais, o númerode canais do sinal base sendo menor que o número de canais dosinal multicanais original, o sinal base sendo organizado emframes, um frame compreendendo valores de amostragem tendo umaalta resolução, e com base em uma representação paramétrica deforma de onda que representa a forma de onda de uma representaçãode resolução intermediária de um canal original selecionado dosinal multicanais original, a representação paramétrica de formade onda incluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, o método compreendendo.
De acordo com um décimo terceiro aspecto dapresente invenção, este objetivo é alcançado por um programa decomputador tendo um código de programa para, quando operando em umcomputador, desenvolver qualquer dos métodos acima.
A presente invenção se baseia no achado de que umcanal selecionado de um sinal multicanais que é representado porframes compostos de valores de amostragem tendo uma alta resoluçãode tempo pode ser codificado com uma maior qualidade quando éobtida a representação paramétrica de forma de onda que representaa forma de onda de uma representação de resolução intermediária docanal selecionado, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo menor que a altaresolução de tempo dos valores de amostragem e mais alta que aresolução de tempo definida por uma taxa de repetição de frame. Arepresentação paramétrica de forma de onda com a resoluçãointermediária pode ser usada para conformar um canal reconstruídopara obter um canal tendo um envelope de sinal perto daquele docanal original selecionado. A escala de tempo em que a conformaçãoé feita é mais fina que a escala de tempo de um processamento nadireção dos frames, aumentando assim a qualidade do canalreconstruído. Por outro lado, a escala de tempo conformada é maisgrossa que a escala de tempo dos valores de amostragem, reduzindosignificativamente a quantidade necessária de dados pelarepresentação paramétrica de forma de onda.
Uma representação paramétrica de forma de ondasendo adequada para conformação de envelope pode, em umaconfiguração preferida da presente invenção, conter comoparâmetros uma medida de resistência de sinal, que indica umaresistência do sinal em um período de amostragem. Como aresistência do sinal está altamente relacionada com a intensidadeperceptual de um sinal, o uso de parâmetros de resistência desinal é, portanto, uma escolha adequada para a implementação daconformação de envelope. Dois parâmetros de resistência de sinalnaturais são, por exemplo, a amplitude ou a amplitude ao quadrado,isto é, a energia do sinal.
A presente invenção visa prover um mecanismo pararecuperar os sinais da distribuição espacial em uma altagranularidade temporal, e assim recuperar a sensação completa de"distribuição espacial" como é relevante, por exemplo, para ossinais de aplauso. Uma importante condição secundária é seralcançado um melhor desempenho de apresentação sem um inaceitávelgrande aumento das informações transmitidas de controle(informações surround auxiliares).
A presente invenção descrita nos parágrafossubseqüentes se refere primariamente à reconstrução multicanais desinais de áudio com base em um sinal down-mix disponível e nosdados adicionais de controle. Os parâmetros espaciais sãoextraídos no lado do codificador, representando as característicasmulticanais com respeito a um (dado) down-mix dos canaisoriginais. 0 sinal down mix e a representação espacial são usadosem um decodificador para recriar uma representação muito parecidado sinal multicanais original por meio da distribuição de umacombinação do sinal down-mix com uma versão decorrelacionada delacom os canais sendo reconstruídos.A invenção se aplica a sistemas onde é desejávelum sinal downmix reversamente compatível, do tipo transmissão derádio estéreo digital (DAB, rádio satélite XM, etc.), mas tambémem sistemas que exigem representação muito compacta do sinal multicanais. Nos parágrafos a seguir, a presente invenção édescrita em sua aplicação dentro do padrão de áudio MPEG surround.É também possível dizer que é aplicável dentro de outros sistemasde codificação de áudio multicanais como, por exemplo, naquelesmencionados abaixo.
A · presente invenção se baseia nas seguintes
considerações:
• Para uma qualidade ideal de áudio perceptual,o estágio de síntese MPEG Surround não somente deve prover meiospara a decorrelação, como também pode resintetizar a distribuição
espacial do sinal em uma fina granularidade temporal.
• Isto requer a transmissão das informaçõessurround auxiliares que representam a distribuição espacial(envelopes de canal) do sinal multicanais.
• Para minimizar a taxa necessária de bits para uma transmissão dos envelopes individuais de canal temporal, essasinformações são codificadas de forma normalizada e relacionada comrelação ao envelope do sinal down mix. Segue-se uma outra etapa decodificação de entropia para reduzir ainda mais a taxa de bitsnecessária para a transmissão do envelope.
De acordo com essas informações, odecodificador MPEG Surround conforma tanto o som direto como odifuso (ou o som combinado direto/difuso), de forma que combinecom o envelope temporal alvo. Isto permite o controle independentedos envelopes de canais individuais e recria a percepção dedistribuição espacial em uma fina granularidade temporal, quemuito se parece com a original (ao invés de um processamentoespacial de baixa resolução com base em frames por meio somente detécnicas de decorrelação).
O principio de conformação guiada de envelopepode tanto ser aplicado no domínio espectral como no domínio dotempo, onde a implementação no domínio espectral caracteriza umamenor complexidade computacional.
Em uma configuração da presente invenção, umcanal selecionado de um sinal multicanais é representado por umarepresentação paramétrica que descreve o envelope do canal, em queo canal é representado por frames de valores de amostragem tendouma alta taxa de amostragem, isto é, uma alta resolução de tempo.O envelope está sendo definido como a evolução temporal da energiacontida no canal, em que o envelope é tipicamente computado em umintervalo de tempo que corresponde ao comprimento do frame. Napresente invenção, o espaço de tempo para o qual um únicoparâmetro representa o envelope é reduzido com relação à escala detempo definida por um frame, isto é, esse espaço de tempo é umintervalo intermediário de tempo que é maior que o intervalo deamostragem e mais curto que o comprimento do frame. Para se obteristo, é computada uma representação de resolução intermediária docanal selecionado que descreve um frame com resolução temporalreduzida comparado à resolução provida pelos parâmetros deamostragem. O envelope do canal selecionado é estimado com aresolução de tempo da representação de baixa resolução que, por umlado, aumenta a resolução temporal da representação de resoluçãomais baixa e, por outro lado, reduz a quantidade de dados e acomplexidade de computação necessária quando comparada àconformação no domínio do tempo.
Em uma configuração preferida da presenteinvenção, é provida uma representação de resolução intermediáriado canal selecionado por um banco de filtros que obtém umarepresentação de banco de filtros com resolução reduzida do canalselecionado. Na representação do banco de filtros, cada canal édividido em várias bandas finitas de freqüências, cada banda defreqüência sendo representada por vários valores de amostragem quedescrevem a evolução temporal do sinal dentro da banda defreqüência selecionada com uma resolução de tempo menor que aresolução de tempo dos valores de amostragem.
A aplicação da presente invenção no domínio dobanco de filtros tem um grande número de vantagens. Aimplementação se adapta bem aos existentes esquemas decodificação, isto é, a presente invenção pode ser implementada deforma totalmente reversamente compatível aos esquemas existentesde codificação de áudio, como a codificação de áudio MPEGsurround. Além disso, a necessária redução da resolução temporal éprovida automaticamente pelas propriedades de redução de resoluçãodo banco de filtros e um branqueamento de um espectro pode serimplementado com uma complexidade computacional bem menor nodomínio do banco de filtros que no domínio do tempo. Uma outravantagem é que o conceito do invento somente pode ser aplicado àspartes da freqüência do canal selecionado que precisam deconformação a partir do ponto de vista de qualidade perceptual .
Em uma outra configuração preferida da presenteinvenção, é obtida uma representação paramétrica de forma de ondade um canal selecionado que descreve uma relação entre o envelopedo canal selecionado e o envelope de um sinal down-mix obtido nolado do codificador. A obtenção da representação paramétrica deforma de onda com base em uma estimativa diferencial ou relativados envelopes tem a grande vantagem de reduzir mais a taxa de bitsexigida pela representação paramétrica de forma de onda. Em umaoutra configuração preferida a assim derivada representaçãoparamétrica de forma de onda é quantizada para reduzir ainda maisa taxa de bits necessária pela representação paramétrica de formade onda. É também mais vantajoso aplicar uma codificação deentropia aos parâmetros quantizados para economizar mais taxa debits sem uma maior perda de informações.
Em uma outra configuração preferida da presenteinvenção, os parâmetros de forma de onda se baseiam em medidasenergéticas que descrevem a energia contida no canal selecionadoem uma dada porção de tempo. A energia é preferivelmente calculadacomo a soma ao quadrado dos parâmetros de amostragem que descrevemo canal selecionado.
Em uma outra configuração da presente invenção, oconceito do invento de obter uma representação paramétrica deforma de onda com base na representação de resolução intermediáriade um canal selecionado de áudio de um sinal de áudio multicanaisé implementado no domínio do tempo. A obtenção necessária darepresentação de resolução intermediária pode ser obtida pelacomputação da média (quadrada) ou soma da energia de um número deconsecutivos valores de amostragem. A variação do número devalores consecutivos de amostragem na média permite o convenienteajuste da resolução de tempo do processo de conformação doenvelope. Em uma modificação da configuração anteriormentedescrita, somente cada enésimo valor de amostragem é usado para aobtenção da representação paramétrica de forma de onda, reduzindoainda mais a complexidade computacional.
Em uma outra configuração da presente invenção aobtenção dos parâmetros de conformação é feita com complexidadecomputacional comparativamente baixa no domínio da freqüência,onde a conformação real, isto é, a aplicação dos parâmetros deconformação, é feita no domínio do tempo.
Em uma outra configuração da presente invenção aconformação de envelope é somente aplicada naquelas porções docanal selecionado que exigem uma conformação de envelope com altaresolução temporal.
A presente invenção descrita nos parágrafosanteriores proporciona as seguintes vantagens:
• Melhoria da qualidade do som espacial de sonstransientes densos, como sinais de aplausos, que atualmente podemser considerados os sinais de pior caso.
• Somente um aumento moderado na taxa deinformações auxiliares de áudio espacial (aproximadamente 5 kbit/spara a transmissão contínua de envelopes) devido à codificaçãomuito compacta das informações de envelope.
• A taxa geral de bits pode ser ainda maisreduzida permitindo que o codificador transmita envelopes somentequando forem perceptualmente necessários. A sintaxe proposta doelemento envelope de fluxo de bits cuida disso.
0 conceito do invento pode ser descrito como umaconformação guiada de envelope sendo brevemente resumido nosparágrafos seguintes:
A conformação guiada de envelope restaura oenvelope de banda larga do sinal de saída sintetizado peloaplanamento do envelope e a reconformação de cada canal de saídausando as informações auxiliares de envelope de banda largaparamétrica contidas no fluxo de bits.
No processo de reconformação, são extraídos osenvelopes dos canais downmix e de saída. Para obter essesenvelopes, são calculadas as energias de cada banda paramétrica ede cada slot. Depois, é feita uma operação de branqueamentoespectral, em que são ponderados os valores energéticos de cadabanda paramétrica, de maneira que as energias totais de todas asbandas paramétricas sejam iguais. Finalmente, é obtido o envelopede banda larga somando e normalizando as energias ponderadas detodas as bandas paramétricas, sendo obtida uma energia média delongo prazo pela filtragem passa baixas com uma constante de longotempo.
O processo de reconformação de envelope realiza oaplanamento e a reconformação dos canais de saída na direção doenvelope alvo, calculando e aplicando uma curva de ganhos naporção sonora direta e na difusa de cada canal de saída. Portanto,os envelopes do down mix transmitido e do respectivo canal desaída são extraídos como acima descrito.
É obtida então a curva de ganho escalando arelação do envelope down mix extraído e do envelope de saídaextraído com os valores de relação envelope transmitidos no fluxode bits.A ferramenta proposta de conformação de envelopeusa informações auxiliares quantizadas transmitidas no fluxo debits. A demanda total de taxa de bits das informações auxiliaresde envelope está listada na Tabela 1 (supondo taxa de amostragemde 44,1 kHz, informações auxiliares de envelope quantizadas em 5etapas) .
Tabela 1 - Taxa estimada de bits das informaçõesauxiliares de envelope
<table>table see original document page 26</column></row><table>
Como mencionado anteriormente, a conformação deenvelope temporal guiado focaliza assuntos que são ortogonaisàqueles focalizados pela TES ou TP: Enquanto a conformação deenvelope temporal guiado proposta visa melhorar a distribuiçãoespacial de eventos transientes, a ferramenta TES e TP é funcionalpara conformar o envelope de som difuso de maneira a combinar como envelope seco. Assim, para um cenário de aplicação de altaqualidade, é recomendada uma combinação da ferramenta recém-proposta com TES ou TP. Para um desempenho ideal, a conformação deenvelope temporal guiada é feita antes da aplicação da TES ou TPna cadeia de ferramenta do decodificador. Além disso, asferramentas TES e TP são um pouco mais adaptadas em suasconfigurações para se integrarem perfeitamente à ferramentaproposta: Basicamente, o sinal usado para obter o envelope alvo noprocessamento TES ou TP é alterado do uso do sinal down mix para ouso dos sinais up mix de canal individual reconformados.
Como já mencionado acima, a grande vantagem doconceito do invento é a sua possibilidade de ser colocado dentrodo esquema de codificação MPEG surround. 0 conceito do invento,por um lado, amplia a funcionalidade da ferramenta TP/TES, já queimplementa o mecanismo de conformação temporal necessário para omanuseio adequado de eventos ou sinais transientes. Por outrolado, a ferramenta exige a transmissão de informações auxiliarespara orientar o processo de conformação. Apesar da taxa de bits deinformações auxiliares média necessária (aprox. 5 KBit/s paratransmissão de envelope continua) ser comparativamente baixa, oganho na qualidade conceituai é significativo. Como conseqüência,o novo conceito é proposto como uma adição às ferramentas TP/TESexistentes. No sentido de manter a complexidade computacional maisbaixa, enquanto é mantida uma alta qualidade de áudio, acombinação do conceito recém-proposto com TES é um modo preferidode operação. Quando se trata de complexidade computacional, podeser notado que alguns dos cálculos são necessários para a extraçãoe reconformação de envelope, quadro a quadro, enquanto outros sãofeitos por slot (isto é, um intervalo de tempo dentro do domíniodo banco de filtros) . A complexidade é dependente do comprimentodo frame, assim como da freqüência de amostragem. Supondo umcomprimento de frame de 32 slots e uma taxa de amostragem de 44,1KHz, o algoritmo descrito requer aproximadamente 105.000 operaçõespor segundo (OPS) para a extração do envelope para um canal e330.000 OPS para a reconformação de um canal. Como é necessáriauma extração de envelope por canal down-mix e uma operação dereconformação é necessária para cada canal de saída, isto resultaem uma complexidade total de 1,76 MOPS para uma configuração 5-1-5, isto é, uma configuração onde 5 canais de um sinal de áudiomulticanais sejam representados por um sinal down-mix monofônico e1,86 MOPS para a configuração 5-2-5 utilizando um sinal down-mixestéreo.
Breve descrição dos desenhos
Serão subseqüentemente descritas as configuraçõespreferidas da presente invenção por referência aos desenhosanexos, onde:
A Fig. 1 mostra um decodificador do invento;
A Fig. 2 mostra um codificador do invento;
As Figs. 3a e 3b mostram uma tabela indicandoíndices de banda de filtro de um banco de filtros híbrido aoscorrespondentes índices de sub-banda;
A Fig. 4 mostra parâmetros de diferentesconfigurações de decodificação;
A Fig. 5 mostra um esquema de codificação queilustra a compatibilidade reversa do conceito do invento;
A Fig. 6 mostra configurações paramétricasselecionando diferentes configurações;
A Fig. 7 mostra um esquema de codificaçãoreversamente compatível;
A Fig. 7b ilustra diferentes esquemas dequantização;
A Fig. 8 mostra ainda o esquema de codificaçãoreversamente compatível;
A Fig. 9 mostra um livro de códigos de Huffmanusado para uma implementação eficiente;
A Fig. 10 mostra um exemplo de uma configuraçãode canal de um sinal de saída multicanais;A Fig. 11 mostra um transmissor ou gravador de
áudio do invento;
A Fig. 12 mostra um receptor ou reprodutor de
áudio do invento;
A Fig. 13 mostra um sistema de transmissão do
invento; e
A Fig. 14 ilustra a conformação temporal nodomínio do tempo da técnica anterior.
Descrição detalhada das configurações preferidas
A Fig. 1 mostra um decodif icador do invento 40tendo um upmixer 42 e um shaper (conformador) 44.
O decodificador 40 recebe como entrada um sinalbase 46 obtido de um sinal multicanais original, o sinal basetendo um ou mais canais, onde o número de canais do sinal base é menor que o número de canais do sinal multicanais original. Odecodificador 40 recebe como segunda entrada uma representaçãoparamétrica de forma de onda 48 que representa a forma de onda darepresentação de baixa resolução de um canal original selecionado,onde a representação paramétrica de forma de onda 48 está incluindo uma seqüência de parâmetros de forma de onda tendo umaresolução de tempo menor que a resolução de tempo dos valores deamostragem que estão organizados em frames, os frames descrevendoo sinal base 46. O upmixer 42 gera um canal upmix 50 do sinal base46, onde o upmix 50 é uma representação estimada de baixa resolução de um canal original selecionado do sinal multicanaisoriginal que tem uma resolução de tempo menor que a resolução detempo dos valores de amostragem. O shaper 44 recebe o canal upmix50 e a representação paramétrica de forma de onda 48 como entradae obtém um canal up-mixed conformado 52 que está conformado demaneira que o envelope do canal up-mixed conformado 52 estáajustado para se adaptar ao envelope do correspondente canaloriginal dentro de uma faixa de tolerância, onde a resolução detempo é dada pela resolução de tempo da representação paramétricade forma de onda.
Assim, o envelope do canal up-mixed conformadopode ser conformado com a resolução de tempo que é maior que aresolução de tempo definida pelos frames que constroem o sinal base 46. Portanto, a redistribuição espacial de um sinalreconstruído é garantida por uma granularidade temporal mais finaque pelo uso de frames e a qualidade de percepção pode serampliada com o custo de um pequeno aumento da taxa de bits devidoà representação paramétrica de forma de onda 48.
A Fig. 2 mostra um codificador do invento 60tendo um redutor da resolução de tempo 62 e um calculadorparamétrico de forma de onda 64. O codificador 60 recebe comoentrada um canal de um sinal multicanais que é representado pelosframes 66, os frames compreendendo valores de amostragem 68a a68g, cada valor de amostragem representando um primeiro período deamostragem. O redutor da resolução de tempo 62 está obtendo umarepresentação de baixa resolução 70 do canal em que um frame estátendo valores de baixa resolução 72a a 72d que são associados a umperíodo de baixa resolução maior que o período de amostragem.
O calculador paramétrico de forma de onda 64recebe a representação de baixa resolução 70 como entrada ecalcula os parâmetros de forma de onda 74, em que os parâmetros deforma de onda 74 estão tendo uma resolução de tempo mais baixa quea resolução de tempo dos valores de amostragem e maior que umaresolução de tempo definida pelos frames.
Os parâmetros de forma de onda 74 dependempreferivelmente da amplitude do canal dentro de uma porção de tempo definida pelo período de baixa resolução. Em umaconfiguração preferida, os parâmetros de forma de onda 74descrevem a energia que está contida dentro do canal em um períodode baixa resolução. Em uma configuração preferida, os parâmetrosde forma de onda são obtidos de maneira que uma medida de energia contida nos parâmetros de forma de onda 74 é obtida com relação àmedida de energia de referência que é definida por um sinal down-mix recebido pelo codificador de áudio multicanais do invento.
A aplicação do conceito do invento no contexto deum codificador de áudi o MPEG surround está descrita em maiores detalhes nos parágrafos seguintes para ressaltar as idéias doinvento.
A aplicação do conceito do invento no domínio desub-banda de um codificador MPEG da técnica anterior aindaressalta a vantajosa compatibilidade reversa do conceito do invento com relação aos esquemas de codificação da técnicaanterior.
A presente invenção (conformação guiada deenvelope) restaura o envelope de banda larga do sinal de saídasintetizado. Compreende um procedimento upmix modificado seguido pelo aplanamento do envelope e a reconformação da porção do sinaldireta (seca) e da difusa (úmida) de cada canal de saída. Paraorientar, são usadas as informações auxiliares de envelope debanda larga paramétríca reconformadas contidas no fluxo de bits.As informações auxiliares consistem de relações (envRatio) que sereferem ao envelope de sinais downmix transmitidos para o envelopede sinais de canal de entrada originais.
Como o processo de conformação do envelopeemprega uma operação de extração de envelope nos diferentessinais, o processo de extração de envelope deverá ser primeirodescrito em maiores detalhes. Deve ser notado que dentro doesquema de codificação MPEG, os canais são manipulados em umarepresentação obtida por um banco de filtros híbrido, isto é, doisfiltros consecutivos são aplicados a um canal de entrada. Umprimeiro banco de filtros obtém uma representação de um canal deentrada em que uma pluralidade de intervalos de freqüência édescrita de forma independente por parâmetros tendo uma resoluçãode tempo inferior à da resolução de tempo dos valores deamostragem do canal de entrada. Essas bandas paramétricas são aseguir indicadas pela letra κ. Algumas bandas paramétricas sãosubseqüentemente filtradas por um banco adicional de filtros queestá ainda subdividindo algumas das bandas de freqüências doprimeiro banco de filtros em uma ou mais bandas de freqüênciafinitas com representações que são indicadas como k nos parágrafosseguintes. Em outras palavras, cada banda paramétrica κ pode terassociado mais do que um índice híbrido k.
As Figs. 3a e 3b mostram uma tabela que associavárias bandas paramétricas aos correspondentes parâmetroshíbridos. O parâmetro híbrido k é dado na primeira coluna 80 databela onde a banda paramétrica associada κ é dada em uma dascolunas 82a ou 82b. A aplicação da coluna 82a ou 82b depende de umparâmetro 84 (decType) que indica duas diferentes configuraçõespossíveis de um banco de filtros decodificador MPEG.
Deve ainda ser notado que os parâmetrosassociados a um canal são processados de maneira dirigida aframes, onde um único frame tem η intervalos de tempo, e onde paracada intervalo de tempo η existe um único parâmetro y para cadaíndice híbrido k. Os intervalos de tempo η são também chamados deslots e os parâmetros associados são indicados como yn,k. Para aestimativa do envelope normalizado, as energias das bandasparamétricas são calculadas com yn,k sendo o sinal de entrada paracada slot de um frame:
<formula>formula see original document page 33</formula>
A soma inclui todos os k que estiverem sendoatribuídos a todas as bandas paramétricas κ de acordo com a tabelamostrada nas Figs. 3a e 3b.Subseqüentemente, a energia total da banda
paramétrica no frame de cada banda paramétrica é calculada como
<formula>formula see original document page 33</formula>
Com a sendo um fator de pesagem que correspondea um IIR de primeira ordem passa baixas com 400 ms de constante detempo, t indica o índice do frame, sFreq a taxa de amostragem dosinal de entrada, e 64 representa o fator de down-sample do bancode filtros. A energia média em um frame é calculada como
<formula>formula see original document page 33</formula><formula>formula see original document page 34</formula>
A relação dessas energias é determinada paraobter pesos para o branqueamento espectral:
<formula>formula see original document page 34</formula>
O envelope de banda larga é obtido pela soma dascontribuições pesadas das bandas paramétricas, normalizando ecalculando a raiz quadrada
<formula>formula see original document page 34</formula>
Após a extração do envelope, é feito o processode conformação do envelope, que consiste de um aplanamento doenvelope de som direto e difuso de cada canal de saida, seguidopor uma reconformação na direção do envelope alvo. Isto resulta emuma curva de ganho sendo aplicada à porção do sinal direto edifuso de cada canal de saida.
No caso de um esquema de codificação MPEGsurround compatível, devem ser distinguidas uma configuração 5-1-5e uma 5-2-5 .
Para a configuração 5-1-5, o envelope alvo éobtido estimando o envelope do Envnmx down mix transmitido e depoisescalando-o com relações de codificador transmitido e de enveloperequantizado envRatioi'U-C-R-Rs . a curva de ganho de todos os slots emum frame é calculada para cada canal de saída, estimando oenvelope Env1j^fdo sinal direto e difuso respectivamente erelacionando-o com o envelope alvo<formula>formula see original document page 35</formula>
Para as configurações 5-2-5, o envelope alvo de Le Ls é obtido a partir do envelope down mix do sinal transmitidocompatível com o canal esquerdo <formula>formula see original document page 35</formula>, para R e Rs é usado o downmix transmitido compatível com o canal direito para obter EnvDmrR.O canal central é obtido a partir da soma dos envelopes de downmix do sinal transmitido compatível com os canais esquerdo edireito. A curva de ganho é calculada para cada canal de saída pormeio da estimativa do envelope <formula>formula see original document page 35</formula> do sinal direto e difusorespectivamente e o relacionando com o envelope alvo
<formula>formula see original document page 35</formula>
Para todos os canais, a curva de ganho de ajustedo envelope é aplicada como
<formula>formula see original document page 35</formula>
Com k iniciando na sub-banda híbrida transversalk0 e para n = 0,...,numSlots -1 .
Após a conformação de envelope dos sinais úmido eseco separadamente, o som conformado direto e difuso é mixadodentro do domínio de sub-banda de acordo com a seguinte fórmula:
<formula>formula see original document page 35</formula>
Ficou demonstrado nos parágrafos anteriores servantajosamente possível implementar o conceito do invento dentrode um esquema de codificação da técnica anterior, que se baseia nacodificação MPEG surround. A presente invenção também usa umarepresentação já existente de domínio de sub-banda dos sinais aserem manipulados, introduzindo mais uma pequena ação decomputador. Para aumentar a eficiência de uma implementação doconceito do invento em uma codificação MPEG de áudio multicanais,são preferidas alterações adicionais na conformação de upmixing etemporal de envelope.
Se a conformação guiada de envelope estiverhabilitada, os sinais direto e difuso são sintetizadosseparadamente usando uma pós-mixagem modificada no domínio de sub-banda híbrida de acordo com
<formula>formula see original document page 36</formula>
com k0 indicando a sub-banda híbrida transversal.
Como pode ser visto nas equações acima, as saídasdiretas mantêm o sinal direto, o sinal difuso para as bandasinferiores e o sinal residual (se presente). As saídas difusasproporcionam o sinal difuso para as bandas superiores.
Aqui, k0 indica a sub-banda híbrida transversalde acordo com a Fig. 4. A Fig. 4 mostra uma tabela que dá a sub-banda híbrida transversal k0 na dependência das duas configuraçõespossíveis de decodificador indicadas pelo parâmetro 84 (decType).
Se TES for usada em combinação com a conformaçãoguiada de envelope, o processamento TES é um pouco adaptado para odesempenho ideal:
Ao invés dos sinais downmix, os sinais upmixdiretos reconfigurados são usados para a conformação de estimativado filtro:
Xc = Y direct,c
Independente do modo 5-1-5 ou 5-2-5, todos oscálculos TES são feitos adequadamente, decanal a canal. Alémdisso, a etapa de mixagem dos sinais direto e difuso é omitida naconformação guiada de envelope, e então como feita pela TES.
Se a TP for usada em combinação com a conformaçãoguiada de envelope, o processamento TP é um pouco mais adaptadopara o desempenho ideal:
Ao invés de um downmix comum (obtido do sinalmulticanais original), o sinal upmix direto reconformado de cadacanal é usado para extrair o envelope alvo de cada canal.
Ydirec = Ydirect
Independente do modo 5-1-5 ou 5-2-5 todos oscálculos TP são feitos de acordo com um procedimento canal acanal. Além disso, a etapa de mixagem do sinal direto e difuso éomitida na conformação guiada de envelope, sendo feita pela TP.
Para uma maior ênfase e provar a compatibilidadereversa do conceito do invento com a codificação MPEG de áudio, asfiguras a seguir mostram definições e funções de fluxos de bitsdefinidas como sendo totalmente compatíveis reversamente e, alémdisso, suportando dados de reconformação de envelope quantizado.
A Fig. 5 mostra uma sintaxe geral que descreve aconfiguração espacial especifica de um fluxo de bits.Em uma primeira parte 90 da configuração, asvariáveis estão relacionadas com a codificação MPEG da técnicaanterior que define, por exemplo, se a codificação residual éaplicada ou dando indicações sobre os esquemas de decorrelação aserem aplicados. Essa configuração pode ser facilmente estendidapor uma segunda parte 92 que descreve a configuração modificadaquando o conceito do invento da conformação guiada de envelope foraplicado.
Em particular, a segunda parte utiliza umavariável bsTempShapeConfig, indicando a configuração daconformação de envelope aplicável pelo decodificador.
A Fig. 6 mostra uma forma reversamente compatívelde interpretação de quatro bits consumida pela referida variável.Como pode ser visto na Fig. 6, os valores variáveis de 4 a 7(indicados na linha 94) indicam o uso do conceito do invento e,além disso, uma combinação do conceito do invento com osmecanismos de conformação da tédhica anterior TP e TES.
A Fig. 7 revela a sintaxe proposta para umesquema de codificação de entropia como é implementado em umaconfiguração preferida da presente invenção. Além disso, asinformações auxiliares de envelope são quantizadas com uma regrade quantização de cinco etapas. Em uma primeira parte dopseudocódigo apresentado na Fig. 7, a conformação de envelopetemporal é habilitada para todos canais de saída desejados, ondeem uma segunda parte 102 do código apresentado, é necessária areconformação de envelope. Isto está indicado pela variávelbsTempShapeConfig mostrada na Fig. 6.
Em uma configuração preferida da presenteinvenção, é usada a quantização de cinco etapas e os valoresquantizados são codificados em conjunto com as informações, casode um a oito valores idênticos consecutivos tiverem ocorridodentro do fluxo de bits dos parâmetros de conformação de envelope.
Deve ser notado que, em principio, é possível umaquantização mais fina da quantização proposta de cinco etapas, quepode então ser indicada por uma variável bsEnvquantMode comomostrada na Fig. 7b. Apesar de ser possível em princípio, apresente implementação introduz somente uma quantização válida.
A Fig. 8 mostra um código que é adaptado para aobtenção dos parâmetros quantizados da representação codificada deHuffman. Como já mencionado, as informações combinadas referentesao valor quantizado e ao número de repetições do valor em questãosão representadas por uma única palavra código de Huffman. Adecodificação Huffman, portanto, compreende uma primeiracomponente 104 que inicia um Ioop sobre os canais desejados desaída, e uma segunda componente 106 que recebe os valorescodificados de cada canal individual por meio da transmissão daspalavras código de Huffman e recepção dos valores paramétricosassociados e os dados de repetição como indicados na Fig. 9.
A Fig. 9 mostra o livro código associado deHuffman que tem 40 entradas, já que para os 5 diferentes valoresde parâmetros 110, é prevista uma taxa de repetição máxima de 8.Cada palavra código de Huffman 112, portanto, descreve umacombinação do parâmetro 110 com o número de ocorrênciasconsecutivas 114.
Dados os valores paramétricos decodificados deHuffman, as relações de envelopes usadas para a conformação guiadade envelope são obtidas a partir dos dados de reconformaçãotransmitidos de acordo com a seguinte equação:
<formula>formula see original document page 40</formula>
com η = 0,...,numSlots -1 e X e oc indicando o canalde saida de acordo com a Fig. 10.
A Fig. 10 mostra uma tabela que está associando avariável Ioop oc 120, como usada pelas tabelas e expressõesanteriores com os canais de saídas 122 de um sinal multicanaisreconstruído.
Como ficou demonstrado pelas Figuras 3a a 9, éfacilmente possível uma aplicação do conceito do invento nosesquemas de codificação da técnica anterior, resultando em umaumento da qualidade perceptual, enquanto é mantida toda acompatibilidade reversa.
A Fig. 11 mostra um gravador ou transmissor deáudio do invento 330 que tem um codificador 60, uma interface deentrada 332 e uma interface de saída 334.
Pode ser enviado um sinal de áudio na interfacede entrada 332 do transmissor/gravador 330. 0 sinal de áudio écodificado por um codificador do invento 60 dentro dotransmissor/gravador e a representação codificada sai na interfacede saída 334 do transmissor/gravador 330. A representaçãocodificada pode então ser transmitida ou armazenada em um meio dearmazenagem.
A Fig. 12 mostra um receptor do invento oureprodutor de áudio 340, tendo um decodificador do invento 40, umaentrada de fluxo de bits 342 e uma saída de áudio 344.
Um fluxo de bits pode ser enviado para a entrada342 do receptor/reprodutor de áudio do invento 340. O fluxo debits é então decodificado pelo decodificador 40 e o sinaldecodificado é enviado ou tocado na saida 344 doreceptor/reprodutor de áudio do invento 340.
A Fig. 13 mostra um sistema de transmissãocompreendendo um transmissor do invento 330, e um receptor doinvento 340.
A entrada de sinal de áudio na interface deentrada 332 do transmissor 330 é codificada e transferida da saida 334 do transmissor 330 para a entrada 342 do receptor 340. Oreceptor decodifica o sinal de áudio e faz o playback ou envia osinal de áudio para sua saida 344.
Resumindo, a presente invenção proporcionasoluções aperfeiçoadas descrevendo, por exemplo, - Uma maneira para o cálculo de um envelope de
banda larga adequado e estável que minimize a distorção percebida
Um método otimizado para codificar asinformações auxiliares de envelope de uma maneira que sejamrepresentadas com relação ao (normalizadas em relação a) envelope do sinal downmix e que assim minimize o excesso de taxa de bits
Um esquema de quantização para que asinformações de envelope sejam transmitidas
Uma adequada sintaxe de fluxo de bits para atransmissão dessas informações auxiliares -Um método eficiente para a manipulação deenvelopes de banda larga no domínio de sub-banda QMF
Um conceito de como os tipos de processamento(1) e (2), como acima descritos, podem ser unificados dentro deuma única arquitetura, que pode recuperar a fina distribuiçãoespacial do sinal multicanais no tempo, caso as informaçõesauxiliares espaciais existirem descrevendo os envelopes originaisde canal temporal. Caso nenhuma dessas informações seja enviada nofluxo de bits espacial (por exemplo, devido às restrições na taxade bits das informações auxiliares disponíveis), o processamentorecua para um tipo de (1) processamento que ainda pode realizar acorreta conformação temporal do som decorrelacionado (apesar denão individualmente por canal).
Apesar de o conceito da invenção acima descritater sido extensamente descrito em sua aplicação em esquemas decodificação MPEG existentes, é óbvio que o conceito do inventopode ser aplicado a qualquer outro tipo de codificação, em que ascaracterísticas de áudio espacial devam ser preservadas.
O conceito do invento da introdução ou do uso deum sinal intermediário para a conformação do envelope, isto é, aenergia de um sinal com uma resolução de tempo aumentada, pode seraplicado não somente no domínio da freqüência, como ilustradopelas figuras, mas também no domínio do tempo onde, por exemplo,uma redução na resolução de tempo e, portanto, uma redução na taxaexigida de bits pode ser alcançada fazendo a média dos espaços detempo consecutivos ou somente levando em conta cada enésimo valorde amostra de uma representação de amostras de um sinal de áudio.
Apesar de o conceito do invento, como ilustradonos parágrafos anteriores, incorporar um branqueamento espectraldos sinais processados, a idéia de ter um sinal de resoluçãointermediária também pode ser incorporada sem o branqueamentoespectral.Dependendo de determinadas exigências deimplementação dos métodos do invento, os métodos do invento podemser implementados em hardware ou em software. A implementação podeser feita usando um meio digital de armazenagem, em particular umdisco, DVD ou um CD dotado de armazenamento de sinais de controlede leitura eletrônica, que cooperam com um sistema de computadorprogramável, de maneira que os métodos do invento possam serrealizados. Em geral, a presente invenção é, portanto, um produtode programa de computador com o armazenamento de um código deprogramas em um portador de leitura por máquina, o código deprograma operando para a realização dos métodos do invento quandoo produto de programa de computador opera em um computador. Emoutras palavras, os métodos do invento são, portanto, um programade computador tendo um código de programa para a realização depelo menos um dos métodos do invento quando o programa decomputador opera em um computador.
Apesar do exposto ter sido particularmentemostrado e descrito com referência a suas configuraçõesparticulares, será compreendido pelos técnicos no assunto quevárias outras alterações na forma e nos detalhes podem ser feitassem abandonar seu espirito e escopo. Será compreendido que váriasalterações podem ser feitas para a adaptação das diferentesconfigurações sem abandonar os conceitos mais amplos ora reveladose englobados pelas reivindicações que seguem.

Claims (34)

1. Decodificador para a geração de um sinal desaida multicanais com base em um sinal base obtido de um sinalmulticanais original tendo um ou mais canais, caracterizado pelofato de que o número de canais do sinal base é menor que o númerode canais do sinal multicanais original, o sinal base tendo umframe, o frame compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma deonda que representa a forma de onda de uma representação deresolução intermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, compreendendo: um upmixer para a geração de uma pluralidadede canais upmixed tendo uma resolução de tempo maior que aresolução intermediária e para obter uma representação deresolução intermediária do sinal base usado para gerar os canaisupmixed; e um shaper para a obtenção de uma representaçãoparamétrica de forma de onda de referência da representação deresolução intermediária do sinal base e para a conformação de umcanal upmixed selecionado usando a representação paramétrica deforma de onda de referência e os parâmetros intermediários deforma de onda do canal original selecionado que correspondem aocanal upmixed selecionado.
2. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o upmixer ainda opera para obteruma representação de resolução intermediária do sinal base.
3. Decodificador, de acordo com a reivindicação 2, caracterizado pelo fato de que o upmixer opera para obter arepresentação de resolução intermediária do sinal base usando umbanco de filtros, caracterizado pelo fato de que a representaçãode resolução intermediária do sinal base é obtida em um domínio debanco de filtros.
4. Decodificador, de acordo com a reivindicação 3, caracterizado pelo fato de que o banco de filtros é um banco defiltros modulado complexo.
5. Decodificador, de acordo com a reivindicação 1, caracterizado pelo fato de que o upmixer tem um ou maisdecorrelatores para a obtenção de um ou mais sinaisdecorrelacionados do sinal base.
6. Decodificador, de acordo com a reivindicação 5, caracterizado pelo fato de que o upmixer opera de maneira que ageração dos canais upmixed inclui uma combinação linear dos canaisdo sinal base e do um ou mais sinais decorrelacionados.
7. Decodificador, de acordo com a reivindicação 6, caracterizado pelo fato de que o shaper opera para conformar umcanal upmixed selecionado de maneira que uma primeira parte docanal upmixed selecionado obtido do sinal base seja conformado deforma independente de uma segunda parte do canal upmixedselecionado obtido de um ou mais sinais decorrelacionados.
8. Decodificador, de acordo com a reivindicação 1, caracterizado pelo fato de que o shaper opera para usarparâmetros de forma de onda intermediária que descrevem a medidade resistência de sinal da representação de resoluçãointermediária do canal selecionado.
9. Decodificador, de acordo com a reivindicação-8, caracterizado pelo fato de que o shaper opera pra usar osparâmetros de forma de onda intermediária que descrevem a medidade resistência de sinal tendo uma amplitude ou uma medida deenergia.
10. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o shaper opera para conformar ocanal upmixed selecionado dé maneira que a conformação compreendauma combinação dos parâmetros da representação paramétrica deforma de onda e da representação paramétrica de forma de onda dereferência.
11. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o shaper opera pra obter umarepresentação espectralmente plana da representação de resoluçãointermediária do sinal base, a representação espectralmente planatendo um espectro plano de freqüência, e para obter arepresentação paramétrica de forma de onda de referência darepresentação espectralmente plana.
12. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o shaper ainda está adaptadopara conformar o canal upmixed selecionado usando outrosparâmetros de forma de onda tendo a baixa resolução de tempodefinida pela taxa de repetição de frame.
13. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que tem ainda uma interface de saidapara gerar o sinal de saida multicanais dotado de alta resoluçãode tempo usando o canal upmixed selecionado conformado.
14. Decodificador, de acordo com a reivindicação-13, caracterizado pelo fato de que a interface de saida opera paragerar o sinal de saida multicanais, de maneira que a geração dosinal de saida multicanais compreende uma síntese de umarepresentação de banco de filtros de uma pluralidade de canaisupmixed conformados, resultando em uma representação no domínio dotempo da pluralidade de canais upmixed conformados tendo uma altaresolução de tempo.
15. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o shaper tem um dequantizadorpara a obtenção da representação paramétrica de forma de onda deuma representação quantizada dela, usando uma regra dedequantização tendo menos que 10 etapas de quantização.
16. Decodificador, de acordo com a reivindicação-15, caracterizado pelo fato de que o shaper tem um decodificadorde entropia para obter a representação quantizada da representaçãoparamétrica de forma de onda de uma representação codificada deentropia dele.
17. Decodificador, de acordo com a reivindicação-16, caracterizado pelo fato de que o decodif icador de entropiaopera para usar um livro código de Huffman para a obtenção darepresentação quantizada da representação paramétrica de forma deonda.
18. Decodificador, de acordo com a reivindicação-3, caracterizado pelo fato de que o shaper opera para conformar ocanal upmixed selecionado no domínio do tempo.
19. Codificador para a geração de umarepresentação paramétrica de forma de onda de um canal de um sinalmulticanais dotado de um frame, o frame compreendendo valores deamostragem tendo um período de amostragem, o codificadorcompreendendo: um redutor da resolução de tempo para obter umarepresentação de baixa resolução do canal usando os valores deamostragem de um frame, a representação de baixa resolução tendovalores de baixa resolução com a associação de um período de baixaresolução maior que o período de amostragem e para a obtenção deuma representação de baixa resolução de referência de um sinalbase obtido do sinal multicanais, o número de canais do sinal basesendo menor que o número de canais do sinal multicanais; e umcalculador paramétrico de forma de onda para o cálculo darepresentação paramétrica de forma de onda que representa a formade onda da representação de baixa resolução, caracterizado pelofato de que o calculador paramétrico de forma de onda estáadaptado para gerar uma seqüência de parâmetros de forma de ondatendo uma resolução de tempo menor que a resolução de tempo dosvalores de amostragem e maior que a resolução de tempo definidapor uma taxa de repetição de frame, caracterizado pelo fato de queo calculador paramétrico de forma de onda opera para calcular osparâmetros de forma de onda usando a representação de baixaresolução de referência e a representação de baixa resolução docanal.
20. Codificador, de acordo com a reivindicação-19, caracterizado pelo fato de que o redutor da resolução de tempotem um banco de filtros para a obtenção da representação de baixaresolução do canal, a representação de baixa resolução do canalsendo obtida em um domínio de banco de filtros.
21. Codificador, de acordo com a reivindicação-19, caracterizado pelo fato de que o calculador paramétrico deforma de onda opera de maneira que o cálculo dos parâmetros deforma de onda compreende uma combinação de medidas de amplitude darepresentação de baixa resolução de referência e da representaçãode baixa resolução do canal.
22. Codificador, de acordo com a reivindicação-19, caracterizado pelo fato de que o calculador paramétrico deforma de onda tem um quantizador para a obtenção de umarepresentação quantizada dos parâmetros de forma de onda.
23. Codificador, de acordo com a reivindicação-22, caracterizado pelo fato de que o calculador paramétrico deforma de onda tem um codificador de entropia para obter umarepresentação codificada de entropia da representação quantizadados parâmetros de forma de onda.
24. Método para a geração de um sinal de saidamulticanais com base em um sinal base obtido de um sinalmulticanais original tendo um ou mais canais, o número de canaisdo sinal base sendo menor que o número de canais do sinalmulticanais original, o sinal base caracterizado pelo fato de quetem um frame, o frame compreendendo valores de amostragem tendouma alta resolução, e com base em uma representação paramétrica deforma de onda representando a forma de onda de uma representaçãode resolução intermediária de um canal original selecionado dosinal multicanais original, a representação paramétrica de formade onda incluindo uma seqüência de parâmetros de forma de ondaintermediária dotada de uma resolução de tempo intermediária menorque a alta resolução de tempo dos valores de amostragem e maiorque uma baixa resolução de tempo definida por uma taxa derepetição de frame, o método compreendendo: obter umarepresentação de resolução intermediária do sinal base usada paragerar os canais upmixed; gerar uma pluralidade de canais upmixedtendo uma resolução de tempo maior que a resolução intermediária;obter uma representação paramétrica de forma de onda de referênciada representação de resolução intermediária do sinal base; econformar um canal upmixed selecionado usando a representaçãoparamétrica de forma de onda de referência e os parâmetrosintermediários de forma de onda do canal original selecionado quecorrespondem ao canal upmixed selecionado.
25. Método para a geração de uma representaçãoparamétrica de forma de onda de um canal de um sinal multicanaistendo um frame, o frame compreendendo valores de amostragem tendoum período de amostragem, o método caracterizado pelo fato de quecompreende: obter uma representação de baixa resolução do canalusando os valores de amostragem de um frame, a representação debaixa resolução tendo valores de baixa resolução tendo associadoum período de baixa resolução maior que o período de amostragem;obter uma representação de baixa resolução de referência de umsinal base obtido a partir do sinal multicanais, o número decanais do sinal base sendo menor que o número de canais do sinalmulticanais; e calcular a representação paramétrica de forma deonda que representa a forma de onda da representação de baixaresolução usando a representação de baixa resolução de referênciae a representação de baixa resolução do canal, caracterizado pelofato de que a representação paramétrica de forma de onda tem umaresolução de tempo menor que a resolução de tempo dos valores deamostragem e maior que a resolução de tempo definida pela taxa derepetição de frame.
26. Representação de um sinal de áudiomulticanais com base em um sinal base obtido do sinal de áudiomulticanais tendo um ou mais canais, o número de canais do sinalbase sendo menor que o número de canais do sinal multicanais, osinal base tendo um frame, o frame caracterizado pelo fato de quecompreende valores de amostragem tendo uma alta resolução, e combase em uma representação paramétrica de forma de onda querepresenta a forma de onda de uma representação de resoluçãointermediária de um canal selecionado do sinal multicanais, arepresentação paramétrica de forma de onda incluindo uma seqüênciade parâmetros de forma de onda intermediária tendo uma resoluçãode tempo menor que a alta resolução de tempo dos valores deamostragem e maior que uma baixa resolução de tempo definida poruma taxa de repetição de frame.
27. Meio de armazenagem com leitura porcomputador, caracterizado pelo fato de que tem armazenado umarepresentação de um sinal de áudio multicanais com base em umsinal base obtido do sinal de áudio multicanais tendo um ou maiscanais, o número de canais do sinal base sendo menor que o númerode canais do sinal multicanais, o sinal base tendo um frame, oframe compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma deonda que representa a forma de onda de uma representação deresolução intermediária de um canal selecionado do sinalmulticanais, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo menor que a altaresolução de tempo dos valores de amostragem e maior que uma baixaresolução de tempo definida por uma taxa de repetição de frame.
28. Receptor ou reprodutor de áudio tendo umdecodificador para a geração de um sinal de saida multicanais combase em um sinal base obtido de um sinal multicanais originaltendo um ou mais canais, caracterizado pelo fato de que o númerode canais do sinal base é menor que o número de canais do sinalmulticanais original, o sinal base tendo um frame, o framecompreendendo valores de amostragem tendo uma alta resolução, ecom base em uma representação paramétrica de forma de ondarepresentando a forma de onda de uma representação de resoluçãointermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, compreendendo: um upmixer para a geração de uma pluralidadede canais upmixed tendo uma resolução de tempo maior que aresolução intermediária e para a obtenção de uma representação deresolução intermediária do sinal base usado para gerar os canaisupmixed; e um shaper para a obtenção de uma representaçãoparamétrica de forma de onda de referência da representação deresolução intermediária do sinal base e para conformar um canalupmixed selecionado usando a representação paramétrica de forma deonda de referência e os parâmetros intermediários de forma de ondado canal original selecionado que correspondem ao canal upmixedselecionado.
29. Transmissor ou gravador de áudio tendo umcodificador para a geração de uma representação paramétrica deforma de onda de um canal de um sinal multicanais tendo um frame,o frame compreendendo valores de amostragem tendo um período deamostragem, o codificador compreendendo: um redutor da resoluçãode tempo para obter uma representação de baixa resolução do canalusando os valores de amostragem de um frame, a representação debaixa resolução tendo valores de baixa resolução tendo associadosum período de baixa resolução maior que o período de amostragem epara a obtenção de uma representação de baixa resolução de umsinal base de referência obtida a partir do sinal multicanais, onúmero de canais do sinal base sendo menor que o número de canaisdo sinal multicanais; e um calculador paramétrico de forma de ondapara o cálculo da representação paramétrica de forma de onda querepresenta a forma de onda da representação de baixa resolução,caracterizado pelo fato de que o calculador paramétrico de formade onda está adaptado para gerar uma seqüência de parâmetros deforma de onda tendo a resolução de tempo mais baixa do que aresolução de tempo dos valores de amostragem e mais alta do que aresolução de tempo definida pela taxa de repetição de frame,caracterizado pelo fato de que o calculador paramétrico de formade onda opera para calcular os parâmetros de forma de onda usandoa representação de baixa resolução de referência e a representaçãode baixa resolução do canal.
30. Método para a recepção ou de reprodução deáudio, o método caracterizado pelo fato de que tem um método paraa geração de um sinal de saída multicanais com base em um sinalbase obtido de um sinal multicanais original tendo um ou maiscanais, o número de canais do sinal base sendo menor que o númerode canais do sinal multicanais original, o sinal base tendo umframe, o frame compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma de onda que representa a forma de onda de uma representação deresolução intermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, o método compreendendo: obter uma representação deresolução intermediária do sinal base usada para gerar os canaisupmixed; a geração de uma pluralidade de canais upmixed tendo uma resolução de tempo maior que a resolução intermediária; obter umarepresentação paramétrica de forma de onda de referência darepresentação de resolução intermediária do sinal base; econformar um canal upmixed selecionado usando os parâmetrosintermediários de forma de onda do canal original selecionado que correspondem ao canal upmixed selecionado.
31. Método para a transmissão ou a gravação deáudio, o método tendo um método para a geração de umarepresentação paramétrica de forma de onda de um canal de um sinalmulticanais tendo um frame, o frame compreendendo valores de amostragem tendo um período de amostragem, o método compreendendo:obter uma representação de baixa resolução do canal usando osvalores de amostragem de um frame, a representação de baixaresolução tendo valores de baixa resolução tendo associado umperíodo de baixa resolução maior que o período de amostragem;obter uma representação de baixa resolução de referência de umsinal base obtido do sinal multicanais, o número de canais dosinal base sendo menor que o número de canais do sinalmulticanais; e calcular a representação paramétrica de forma deonda que representa a forma de onda da representação de baixaresolução usando a representação de baixa resolução de referênciae a representação de baixa resolução do canal, caracterizado pelofato de que a representação paramétrica de forma de onda tem umaresolução de tempo menor que a resolução de tempo dos valores deamostragem e maior que a resolução de tempo definida pela taxa derepetição de frame.
32. Sistema de transmissão tendo um transmissor eum receptor, o transmissor tendo um codificador para a geração deuma representação paramétrica de forma de onda de um canal de umsinal multicanais tendo um frame, o frame compreendendo valores deamostragem tendo um período de amostragem, o codificadorcompreendendo: um redutor da resolução de tempo para obter umarepresentação de baixa resolução do canal usando os valores deamostragem de um frame, a representação de baixa resolução tendovalores de baixa resolução tendo associados um período de baixaresolução maior que o período de amostragem e para obter umarepresentação de baixa resolução de referência de um sinal baseobtido do sinal multicanais, o número de canais do sinal basesendo menor que o número de canais do sinal multicanais; e umcalculador paramétrico de forma de onda para o cálculo darepresentação paramétrica de forma de onda que representa a formade onda da representação de baixa resolução, caracterizado pelofato de que o calculador paramétrico de forma de onda estáadaptado para gerar uma seqüência de parâmetros de forma de ondatendo uma resolução de tempo menor que a resolução de tempo dosvalores de amostragem e maior que a resolução de tempo definidapor uma taxa de repetição de frame, caracterizado pelo fato de queo calculador paramétrico de forma de onda opera para calcular osparâmetros de forma de onda usando a representação de baixaresolução de referência e a representação de baixa resolução docanal; e o receptor tendo um decodificador para gerar um sinal desaida multicanais com base em um sinal base obtido de um sinalmulticanais original tendo um ou mais canais, o número de canaisdo sinal base sendo menor que o número de canais do sinalmulticanais original, o sinal base tendo um frame, o framecompreendendo valores de amostragem tendo uma alta resolução, ecom base em uma representação paramétrica de forma de ondarepresentando a forma de onda de uma representação de resoluçãointermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, compreendendo: um upmixer para a geração de uma pluralidadede canais upmixed tendo uma resolução de tempo maior que aresolução intermediária e para obter uma representação deresolução intermediária do sinal base usado para gerar os canaisupmixed; e um shaper para obter uma representação paramétrica deforma de onda de referência da representação de resoluçãointermediária do sinal base e para conformar um canal upmixedselecionado usando a representação paramétrica de forma de onda dereferência e os parâmetros intermediários de forma de onda docanal original selecionado que correspondem ao canal upmixedselecionado.
33. Método de transmissão e recepção, o método detransmissão tendo um método para a geração de uma representaçãoparamétrica de forma de onda de um canal de um sinal multicanaistendo um frame, o frame compreendendo valores de amostragem tendoum período de amostragem, o método compreendendo: obter umarepresentação de baixa resolução do canal usando os valores deamostragem de um frame, a representação de baixa resolução tendovalores de baixa resolução tendo associado um período de baixaresolução maior que o período de amostragem; obter umarepresentação de baixa resolução de referência de um sinal baseobtido do sinal multicanais, o número de canais do sinal basesendo menor que o número de canais do sinal multicanais; ecalcular a representação paramétrica de forma de ondarepresentando a forma de onda da representação de baixa resoluçãousando a representação de baixa resolução de referência e arepresentação de baixa resolução do canal, caracterizado pelo fatode que a representação paramétrica de forma de onda tem umaresolução de tempo menor do que a resolução de tempo dos valoresde amostragem e maior do que a resolução de tempo definida pelataxa de repetição de frame; e método para a recepção tendo ummétodo para a geração de um sinal de saída multicanais com base emum sinal base obtido de um sinal multicanais original tendo um oumais canais, o número de canais do sinal base sendo menor que onúmero de canais do sinal multicanais original, o sinal base tendoum frame, o frame compreendendo valores de amostragem tendo umaalta resolução, e com base em uma representação paramétrica deforma de onda representando uma forma de onda de uma representaçãode resolução intermediária de um canal original selecionado dosinal multicanais original, a representação paramétrica de formade onda incluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, o método compreendendo: obter uma representação deresolução intermediária do sinal base usado para gerar os canaisupmixed; a geração de uma pluralidade de canais upmixed tendo umaresolução de tempo maior que a resolução intermediária; obter arepresentação paramétrica de forma de onda de referência darepresentação de resolução intermediária do sinal base; econformar o canal upmixed selecionado usando a representaçãoparamétrica de forma de onda de referência e os parâmetrosintermediários de forma de onda do canal original selecionado quecorrespondem ao canal upmixed selecionado.
34. Computador tendo um código de programas para,quando operar em um computador, caracterizado pelo fato de querealiza quaisquer das reivindicações 24, 25, 30, 31 ou 33 dométodo.
BRPI0618002-7A 2005-10-12 2006-08-31 método para uma melhor conformação temporal e espacial dos sinais de áudio multicanais BRPI0618002B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US72638905P 2005-10-12 2005-10-12
US60/726,389 2005-10-12
US11/363,985 2006-02-27
US11/363,985 US7974713B2 (en) 2005-10-12 2006-02-27 Temporal and spatial shaping of multi-channel audio signals
PCT/EP2006/008534 WO2007042108A1 (en) 2005-10-12 2006-08-31 Temporal and spatial shaping of multi-channel audio signals

Publications (2)

Publication Number Publication Date
BRPI0618002A2 true BRPI0618002A2 (pt) 2011-08-16
BRPI0618002B1 BRPI0618002B1 (pt) 2021-03-09

Family

ID=37179043

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0618002-7A BRPI0618002B1 (pt) 2005-10-12 2006-08-31 método para uma melhor conformação temporal e espacial dos sinais de áudio multicanais

Country Status (16)

Country Link
US (3) US7974713B2 (pt)
EP (1) EP1934973B1 (pt)
JP (1) JP5102213B2 (pt)
KR (1) KR100947013B1 (pt)
CN (1) CN101356571B (pt)
AU (1) AU2006301612B2 (pt)
BR (1) BRPI0618002B1 (pt)
CA (1) CA2625213C (pt)
ES (1) ES2770146T3 (pt)
IL (1) IL190765A (pt)
MY (1) MY144518A (pt)
NO (1) NO343713B1 (pt)
PL (1) PL1934973T3 (pt)
RU (1) RU2388068C2 (pt)
TW (1) TWI332192B (pt)
WO (1) WO2007042108A1 (pt)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2333137T3 (es) * 2004-07-14 2010-02-17 Koninklijke Philips Electronics N.V. Conversion de canal de audio.
US20090182563A1 (en) * 2004-09-23 2009-07-16 Koninklijke Philips Electronics, N.V. System and a method of processing audio data, a program element and a computer-readable medium
US9080894B2 (en) 2004-10-20 2015-07-14 Electro Industries/Gauge Tech Intelligent electronic device for receiving and sending data at high speeds over a network
US7304586B2 (en) 2004-10-20 2007-12-04 Electro Industries / Gauge Tech On-line web accessed energy meter
US7747733B2 (en) 2004-10-25 2010-06-29 Electro Industries/Gauge Tech Power meter having multiple ethernet ports
US8190381B2 (en) 2005-01-27 2012-05-29 Electro Industries/Gauge Tech Intelligent electronic device with enhanced power quality monitoring and communications capabilities
US8121801B2 (en) * 2005-01-27 2012-02-21 Electro Industries/Gauge Tech System and method for multi-rate concurrent waveform capture and storage for power quality metering
US8620608B2 (en) 2005-01-27 2013-12-31 Electro Industries/Gauge Tech Intelligent electronic device and method thereof
US8160824B2 (en) 2005-01-27 2012-04-17 Electro Industries/Gauge Tech Intelligent electronic device with enhanced power quality monitoring and communication capabilities
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR100891688B1 (ko) 2005-10-26 2009-04-03 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR20080071971A (ko) * 2006-03-30 2008-08-05 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
KR100763920B1 (ko) * 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
DK1956589T3 (da) * 2007-02-06 2010-04-26 Oticon As Estimering af egenstemmeaktivitet i et høreapparatsystem ud fra forholdet mellem direkte lyd og efterklang
US20130275066A1 (en) 2007-04-03 2013-10-17 Electro Industries/Gaugetech Digital power metering system
US11307227B2 (en) 2007-04-03 2022-04-19 Electro Industries/Gauge Tech High speed digital transient waveform detection system and method for use in an intelligent electronic device
US9989618B2 (en) 2007-04-03 2018-06-05 Electro Industries/Gaugetech Intelligent electronic device with constant calibration capabilities for high accuracy measurements
US10845399B2 (en) 2007-04-03 2020-11-24 Electro Industries/Gaugetech System and method for performing data transfers in an intelligent electronic device
CN101308655B (zh) * 2007-05-16 2011-07-06 展讯通信(上海)有限公司 一种音频编解码方法与装置
US8180062B2 (en) 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
US12061218B2 (en) 2008-03-13 2024-08-13 Ei Electronics Llc System and method for multi-rate concurrent waveform capture and storage for power quality metering
US8909361B2 (en) * 2008-06-19 2014-12-09 Broadcom Corporation Method and system for processing high quality audio in a hardware audio codec for audio transmission
PL3573056T3 (pl) 2008-07-11 2022-12-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio i dekoder audio
JP5316896B2 (ja) * 2010-03-17 2013-10-16 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
CN102811034A (zh) 2011-05-31 2012-12-05 财团法人工业技术研究院 信号处理装置及信号处理方法
US8831515B2 (en) * 2011-10-12 2014-09-09 Broadcom Corporation Shaped load modulation in a near field communications (NFC) device
US20130110522A1 (en) 2011-10-21 2013-05-02 Samsung Electronics Co., Ltd. Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus
EP2805326B1 (en) * 2012-01-19 2015-10-14 Koninklijke Philips N.V. Spatial audio rendering and encoding
JP6065452B2 (ja) * 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
CN104584123B (zh) * 2012-08-29 2018-02-13 日本电信电话株式会社 解码方法、以及解码装置
CN103871414B (zh) * 2012-12-11 2016-06-29 华为技术有限公司 一种多声道语音信号的时标调制方法和装置
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
EP2956935B1 (en) 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
JP6146069B2 (ja) * 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102231755B1 (ko) 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
CN103680513B (zh) * 2013-12-13 2016-11-02 广州华多网络科技有限公司 语音信号处理方法、装置及服务器
US20160018443A1 (en) * 2014-07-21 2016-01-21 Tektronix, Inc. Method for determining a correlated waveform on a real time oscilloscope
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
CN107004427B (zh) * 2014-12-12 2020-04-14 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
JP2016126037A (ja) * 2014-12-26 2016-07-11 ソニー株式会社 信号処理装置、および信号処理方法、並びにプログラム
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
WO2017049396A1 (en) 2015-09-25 2017-03-30 Voiceage Corporation Method and system for time domain down mixing a stereo sound signal into primary and secondary channels using detecting an out-of-phase condition of the left and right channels
JP6467561B1 (ja) 2016-01-26 2019-02-13 ドルビー ラボラトリーズ ライセンシング コーポレイション 適応的な量子化
EP3627507B1 (en) 2016-02-17 2024-10-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for enhancing transient processing, computer program
US10958695B2 (en) * 2016-06-21 2021-03-23 Google Llc Methods, systems, and media for recommending content based on network conditions
US10304468B2 (en) 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
CN109427337B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号编码时重建信号的方法和装置
US10891960B2 (en) * 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
RU2763155C2 (ru) 2017-11-17 2021-12-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ кодирования или декодирования параметров направленного кодирования аудио с использованием квантования и энтропийного кодирования
BR112021010972A2 (pt) 2018-12-07 2021-09-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho e método para gerar uma descrição de campo de som
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
WO2021138517A1 (en) 2019-12-30 2021-07-08 Comhear Inc. Method for providing a spatialized soundfield
CN113702893B (zh) * 2021-09-23 2023-11-21 云南电网有限责任公司电力科学研究院 一种直流互感器暂态波形传变一致性评价方法及装置

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4189625A (en) * 1978-03-13 1980-02-19 Strandberg Terry W Method and apparatus for processing dual frequency digital information signals
DE2916308C3 (de) * 1979-04-23 1982-02-25 Deutsche Vereinigte Schuhmaschinen Gmbh, 6000 Frankfurt Klebepresse zum Ankleben von Laufsohlen an aufgeleistetes Schuhwerk
US4285058A (en) 1980-02-26 1981-08-18 Fisher Charles B Waveform correction by sampling
TW226035B (en) 1991-12-13 1994-07-01 Nat Science Committee A process for producing anisotropic ribbon of R-Fe-M-B and the produced anisotropic resin bond
FR2700383B1 (fr) 1993-01-11 1995-02-10 Framatome Sa Echangeur de chaleur dans lequel l'alimentation en fluide secondaire s'effectue en partie haute par un boîtier d'alimentation ouvert vers le bas.
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
KR0174084B1 (ko) * 1995-09-25 1999-04-01 이준 Mpeg-2 다채널 오디오 복호화기의 역변환기
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE69724625T2 (de) * 1996-09-02 2004-06-24 Stmicroelectronics N.V. Verbesserungen bei, oder in bezug auf mehrträgerübertragungssysteme
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
DK1173925T3 (da) 1999-04-07 2004-03-29 Dolby Lab Licensing Corp Matriksforbedringer til tabsfri kodning og dekodning
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US7418043B2 (en) * 2000-07-19 2008-08-26 Lot 41 Acquisition Foundation, Llc Software adaptable high performance multicarrier transmission protocol
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
TW561451B (en) 2001-07-27 2003-11-11 At Chip Corp Audio mixing method and its device
SG108862A1 (en) 2002-07-24 2005-02-28 St Microelectronics Asia Method and system for parametric characterization of transient audio signals
TWI226601B (en) 2003-01-17 2005-01-11 Winbond Electronics Corp System and method of synthesizing a plurality of voices
ATE339759T1 (de) 2003-02-11 2006-10-15 Koninkl Philips Electronics Nv Audiocodierung
EP1667109A4 (en) * 2003-09-17 2007-10-03 Beijing E World Technology Co METHOD AND DEVICE FOR QUANTIFYING MULTI-RESOLUTION VECTOR FOR AUDIO CODING AND DECODING
TWI226035B (en) 2003-10-16 2005-01-01 Elan Microelectronics Corp Method and system improving step adaptation of ADPCM voice coding
TWI229318B (en) 2003-10-29 2005-03-11 Inventec Multimedia & Telecom Voice processing system and method
CN1906855B (zh) * 2004-01-30 2014-04-02 法国电信 空间矢量和可变分辨率量化
JPWO2005081229A1 (ja) 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
CA3026267C (en) * 2004-03-01 2019-04-16 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals

Also Published As

Publication number Publication date
NO20082176L (no) 2008-05-09
US7974713B2 (en) 2011-07-05
JP5102213B2 (ja) 2012-12-19
AU2006301612B2 (en) 2010-07-22
US9361896B2 (en) 2016-06-07
IL190765A (en) 2013-09-30
CN101356571A (zh) 2009-01-28
PL1934973T3 (pl) 2020-06-01
MY144518A (en) 2011-09-30
KR100947013B1 (ko) 2010-03-10
US20070081597A1 (en) 2007-04-12
KR20080059193A (ko) 2008-06-26
JP2009511966A (ja) 2009-03-19
NO343713B1 (no) 2019-05-13
BRPI0618002B1 (pt) 2021-03-09
EP1934973A1 (en) 2008-06-25
WO2007042108A1 (en) 2007-04-19
TW200746044A (en) 2007-12-16
ES2770146T3 (es) 2020-06-30
CA2625213A1 (en) 2007-04-19
EP1934973B1 (en) 2019-11-13
RU2388068C2 (ru) 2010-04-27
RU2008118333A (ru) 2009-11-20
CN101356571B (zh) 2012-05-30
TWI332192B (en) 2010-10-21
CA2625213C (en) 2012-04-10
US20140126725A1 (en) 2014-05-08
US8644972B2 (en) 2014-02-04
AU2006301612A1 (en) 2007-04-19
US20110106545A1 (en) 2011-05-05
IL190765A0 (en) 2008-11-03

Similar Documents

Publication Publication Date Title
BRPI0618002A2 (pt) método para uma melhor conformação temporal e espacial dos sinais de áudio multicanais
CN102157155B (zh) 多声道音频信号表示方法
RU2430430C2 (ru) Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования
US9812136B2 (en) Audio processing system
NO344760B1 (no) Kompatibel flerkanal-koding/dekoding.
BRPI0621499A2 (pt) método melhorado para formatação de sinal em reconstrução de áudio de canais múltiplos
BR122018072505B1 (pt) Codificação paramétrica conjunta de fontes de áudio
CN101410890A (zh) 减小数目的声道解码
BRPI0516405B1 (pt) Conformação individual de canal para esquemas bcc e similares
PT1829026T (pt) Informações auxiliares compactas para a codificação paramétrica de áudio espacial
WO2004084185A1 (en) Processing of multi-channel signals
RU2485605C2 (ru) Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования
BR112017025314B1 (pt) Aparelho e método para codificação ou decodificação de um sinal multicanal utilizando reamostragem de domínio espectral
BRPI0816556B1 (pt) Codificação de áudio usando downmix
HK1117262B (en) Temporal and spatial shaping of multi-channel audio signals
HK1117262A (en) Temporal and spatial shaping of multi-channel audio signals
BRPI0816556A2 (pt) codificação de áudio usando downmix

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/00 , H04S 3/00

Ipc: G10L 19/008 (2013.01), H04S 3/00 (1980.01)

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 09/03/2021, OBSERVADAS AS CONDICOES LEGAIS.