BRPI0618002A2

BRPI0618002A2 - método para uma melhor conformação temporal e espacial dos sinais de áudio multicanais

Info

Publication number: BRPI0618002A2
Application number: BRPI0618002-7A
Authority: BR
Inventors: Juergen Herre; Matthias Neusinger; Gerard Hotho; Sascha Disch; Jeroen Breebaart
Original assignee: Fraunhofer Ges Forschung; Koninkl Philips Electronics Nv
Priority date: 2005-10-12
Filing date: 2006-08-31
Publication date: 2011-08-16
Also published as: US20110106545A1; AU2006301612B2; RU2388068C2; WO2007042108A1; BRPI0618002B1; TWI332192B; EP1934973B1; JP2009511966A; KR20080059193A; IL190765A0; CA2625213C; US20070081597A1; TW200746044A; US8644972B2; IL190765A; US20140126725A1; US7974713B2; JP5102213B2; PL1934973T3; RU2008118333A

Abstract

<b>MéTODO PAPA UMA MELHOR CONFORMAçãO TEMPORAL E ESPACIAL DOS SINAIS DE áUDIO MULTICANAIS<d>. Um canal selecionado de um sinal multicanais que é representado por frames compostos por valores de amostragem tendo uma alta resolução de tempo pode ser codificado com maior qualidade quando é obtida uma representação paramétrica de forma de onda que representa a forma de onda de uma representação de resolução intermediária do canal selecionado, a representação paramétrica de forma de onda incluindo uma sequência de parâmetros de forma de onda intermediária tendo uma resolução de tempo menor que a alta resolução de tempo dos valores de amostragem e maior que a resolução de tempo definida por uma taxa de repetição de frame. A representação paramétrica de forma de onda com a resolução intermediária pode ser usada para conformar um canal reconstruido de maneira a recuperar um canal tendo um envelope de sinal próximo daquele do canal original selecionado. A escala de tempo em que a conformação é feita é mais curta que a escala de tempo de um processamento de frames, ampliando assim a qualidade do canal reconstruído. Por outro lado, a escala de tempo da conformação é maior que a escala de tempo dos valores de amostragem, reduzindo significativamente a quantidade necessária de dados pela representação paramétrica de forma de onda.

Description

"MÉTODO PARA UMA MELHOR CONFORMAÇÃO TEMPORAL EESPACIAL DOS SINAIS DE ÁUDIO MULTICANAIS".

Campo da Invenção

A presente invenção se refere à codificação desinais de áudio multicanais e, em particular, a um conceito paramelhorar a percepção espacial de um sinal multicanaisreconstruído.

Histórico da invenção e técnica anterior

0 recente desenvolvimento da codificação de áudiotornou disponível a capacidade de recriar uma representaçãomulticanais de um sinal de áudio com base em um sinal estéreo (oumono) e nos dados de controle correspondentes. Esses métodosdiferem essencialmente das antigas soluções baseadas em matrizescomo a Dolby Prologic, já que os dados de controle adicionais sãotransmitidos para controlar a recriação, também denominada de up-mix, dos canais surround com base nos canais mono e estéreotransmitidos.

Assim, os decodificadores paramétricos de áudiomulticanais reconstroem N canais com base em M canaistransmitidos, onde N > M, e com base nos dados adicionais decontrole. Os dados adicionais de controle representam uma taxa dedados significativamente menor do que a transmissão de todos os Ncanais, tornando a codificação muito eficiente, enquanto ao mesmotempo garante a compatibilidade tanto dos dispositivos de M canaiscomo dos dispositivos de N canais. Os M canais tanto podem ser umarepresentação de canais mono única, estéreo ou 5.1. Portanto, épossível ter, por exemplo, um sinal original de canal 7.2 com downmix para um sinal reversamente compatível de canal 5.1, eparâmetros de áudio espacial que permitem que um decodificador deáudio espacial reproduza uma versão muito próxima dos canais 7.2originais, com uma pequena taxa inicial adicional de bits.

Esses métodos paramétricos de codificaçãosurround normalmente compreendem uma parametrização do sinalsurround baseada em ILD (Diferença de Nivel Intercanais) e ICC(Coerência Intercanais) . Esses parâmetros descrevem, por exemplo,relações de potência e correlação entre pares de canais do sinalmulticanais original. No processo de decodificação, o sinalmulticanal recriado pela distribuição da energia dos canaisdownmix recebidos entre todos os pares de canais descritos pelosparâmetros ILD transmitidos. Entretanto, como um sinal multicanaispode ter distribuição igual de potência entre todos os canais,enquanto os sinais nos diferentes canais são muito diferentes,dando assim a impressão auditiva de um som muito amplo (difuso) , alargura correta (difusibilidade) é obtida misturando os sinais comsuas versões não correlacionadas. Essa mistura é descrita peloparâmetro ICC. A versão não correlacionada do sinal é obtidapassando o sinal por um filtro passa tudo, como um reverberador.

Isto significa que a versão não correlacionada dosinal é criada no lado do decodif icador, não sendo, como noscanais downmix, transmitida do codificador para o decodificador.Os sinais de saida dos filtros passa tudo (decorrelatores) têm umtempo-resposta normalmente muito plano. Assim, um sinal de entradadireta proporciona uma explosão de ruido decrescente. Portanto, aomixar o sinal não correlacionado com o original, é importante paraalguns tipos de sinais, como densos transientes (sinais deaplausos), conformar o envelope de tempo do sinal nãocorrelacionado para melhor combinar com o do canal down-mix, que égeralmente chamado de sinal seco. Se isto não for feito, resultaráem uma percepção de uma sala de maior tamanho e de sinaistransientes com sons não naturais. Tendo os sinais transientes eum reverberador como filtro passa tudo, até mesmo os problemas dotipo eco podem ser introduzidos quando é omitida a conformação dossinais (úmidos) não correlacionados.

A partir do ponto de vista técnico, um dosprincipais desafios na reconstrução dos sinais multicanais, comopor exemplo, dentro de uma síntese de som MPEG, consiste naadequada reprodução dos sinais multicanais com uma imagem sonoramuito ampla. Falando tecnicamente, isto corresponde à geração devários sinais com baixa correlação intercanais (ou coerência), masainda com envelopes espectrais e temporais sob rígido controle. Umexemplo desses sinais são os "aplausos", que possuem tanto um altograu de decorrelação e aguçados eventos transientes (palmas). Comoconseqüência, esses itens são os mais críticos para a tecnologiasurround MPEG que é, por exemplo, elaborada em maiores detalhes no"Report on MPEG Spatial Audio Coding RMO Listening Tests", ISO/IECJTCl/SC2 9/WG11 (MPEG), Document N7138, Busan, Korea, 2005". Emgeral, os trabalhos anteriores se focalizaram em alguns aspectosrelativos à reprodução ideal de sinais amplos/difusos, como osaplausos, fornecendo soluções que

1. adaptam a forma temporal (e espectral) dosinal decorrelacionado ao do sinal downmix transmitido, de maneiraa evitar o pré-eco - como problemas (nota: isto não exige o enviode quaisquer informações auxiliares do codificador de áudioespacial para o decodificador de áudio espacial).2. adaptam os envelopes temporais dos canaissintetizados de saída a suas formas originais de envelopes(presentes na entrada do codificador correspondente) usandoinformações auxiliares que descrevem os envelopes temporais dos sinais originais de entrada e que são transmitidas do codificadorde áudio espacial ao decodificador de áudio espacial.

Atualmente, o MPEG Surround Reference Model(Modelo de Referência MPEG Surround) já contém várias ferramentasque suportam a codificação desses sinais, por exemplo

• Time Domain Temporal Shaping (TP)

• Temporal Conformação de envelope (TES)

Em um sistema de síntese MPEG Surround, o somdecorrelacionado é gerado e mixado com o sinal "seco", de maneiraa controlar a correlação dos canais sintetizados de saída deacordo com os valores ICC transmitidos. Daqui para frente, o sinaldecorrelacionado será denominado de sinal Mifuso' , apesar de otermo 'difuso' refletir propriedades do campo do som espacialreconstruído ao invés das propriedades do próprio sinal. Nossinais transientes, o som difuso gerado no decodificador nãocombina automaticamente com a fina forma temporal dos sinais secose não se funde perceptualmente bem com o sinal seco. Isto resultaem uma má reprodução transiente, em analogia ao "problema de pré-eco" conhecido na codificação de áudio perceptual. A ferramenta TPque implementa o' Time Domain Temporal Shaping é projetada parasolucionar esse problema, processando o som difuso.

A ferramenta TP é aplicada ao domínio do tempo,·como ilustrado na Fig. 14. Basicamente consiste de uma estimativado envelope temporal dos sinais seco e difuso com uma maiorresolução temporal que a fornecida pelo banco de filtros docodificador MPEG Surround. 0 sinal difuso é reescalado em seuenvelope temporal para combinar com o envelope do sinal seco. Istoresulta em um aumento significativo na qualidade do som dos sinaistransientes críticos com uma ampla imagem espacial / baixacorrelação entre os sinais de canal, como os aplausos.

A conformação de envelope (ajustando a evoluçãotemporal da energia contida dentro de um canal) é feita combinandoa energia normalizada de curto tempo do sinal úmido com a do sinalseco. Isto é feito por meio de uma função de ganho na variação dotempo que é aplicada ao sinal difuso, de maneira que o envelope detempo do sinal difuso seja conformado para combinar com o do sinalseco.

Notar que isto não requer que qualquer informaçãoauxiliar seja transmitida do codificador para o decodificador paraprocessar o envelope temporal do sinal (somente informações decontrole para habilitar/desabilitar seletivamente a TP sãotransmitidas pelo codificador surround).

A Fig. 14 ilustra a conformação temporal nodomínio do tempo, como aplicada dentro da codificação MPEGsurround. Os sinais a serem processados são o sinal direto 10 e osinal difuso 12, ambos fornecidos em um domínio de banco defiltros. Opcionalmente, dentro do MPEG surround, pode haver umsinal residual 14 que seja adicionado ao sinal direto 10 aindadentro do domínio do banco de filtros. No caso especial de umdecodificador MPEG surround, somente são conformadas as partes dealta freqüência do sinal difuso 12, portanto as partes de baixafreqüência 16 do sinal são adicionadas ao sinal direto 10 dentrodo domínio do banco de filtros.

O sinal direto 10 e o sinal difuso 12 sãoconvertidos separadamente no domínio do tempo pelos dispositivosde síntese do banco de filtros 18a e 18b. A real conformaçãotemporal no domínio do tempo é feita após o banco de filtros desíntese. Como somente as partes de alta freqüência do sinal difuso12 devem ser conformadas, as representações no domínio do tempo dosinal direto 10 e do sinal difuso 12 entram nos filtros passaaltas 20a e 20b que garantem que somente as porções de altafreqüência dos sinais sejam usadas nas etapas seguintes defiltragem. Pode ser feito um branqueamento espectral subseqüentedos sinais nos branqueadores espectrais 22a e 22b para garantirque as taxas de amplitude (energia) de toda a faixa espectral dossinais sejam adicionadas na seguinte estimativa envelope 24 quecompara a taxa das energias que estão contidas no sinal direto eno sinal difuso em uma dada porção de tempo. Essa porção de tempoé normalmente definida pelo comprimento do frame. A estimativaenvelope 24 tem como saída um fator de escala 26, que é aplicadoao sinal difuso 12 na conformação envelope 28 no domínio do tempo,para garantir que o envelope sinal seja basicamente o mesmo para osinal difuso 12 e para o sinal direto 10 dentro de cada frame.

Finalmente, o sinal difuso conformado em envelopeé novamente filtrado em passa alta por um filtro passa altas 29 demaneira a garantir que não existam problemas de bandas de menoresfreqüências no sinal difuso conformado em envelope. A combinaçãodo sinal direto e do sinal difuso é feita por um adicionador 30. Osinal de saída 32 então contém partes do sinal do sinal direto 10e do sinal difuso 12, onde o sinal difuso foi conformado emenvelope para garantir que o envelope sinal seja basicamente omesmo para o sinal difuso 12 e para o sinal direto 10 antes dacombinação.

O problema do controle preciso da conformaçãotemporal do som difuso também pode ser solucionado pela denominadaferramenta Temporal Conformação de envelope (TES), que é projetadapara ser uma alternativa de baixa complexidade à ferramentaTemporal Processing (TP) . Apesar de a TP operar no domínio dotempo por meio de uma escalação no domínio do tempo do envelope desom difuso, a abordagem TES alcança o mesmo efeito principalcontrolando o envelope de som difuso em uma representação dedomínio espectral. Isto é feito de forma similar à da abordagem daTemporal Noise Shaping (TNS), como é conhecida no MPEG-2/4Advanced Audio Coding (AAC). A manipulação do fino envelopetemporal de som difuso é feita pela convolução de seuscoeficientes espectrais na freqüência com um adequado filtro deconformação obtido de uma análise LPC dos coeficientes espectraisdo sinal seco. Devido ao tempo de resolução muito alto do banco defiltros do MPEG Surround, o processamento TES requer somentefiltragem de baixa ordem (previsão complexa de primeira ordem),sendo assim baixa em sua complexidade computacional. Por outrolado, devido às limitações, por exemplo, relacionadas aoserrilhado temporal, não pode prover a totalidade do controletemporal que a ferramenta TP oferece.

Notar que, de forma similar ao caso TP, a TES nãoexige que nenhuma informação auxiliar seja transmitida docodificador para o decodificador para descrever o envelopetemporal do sinal.As duas ferramentas, TP e TES, resolvem comsucesso o problema da conformação temporal do som difuso,adaptando sua forma temporal à do sinal down mix transmitido.Apesar de esse fato evitar o tipo pré-eco de desmascaramento, nãopode compensar um segundo tipo de deficiência no sinal de saidamulticanais, que se deve à falta de redistribuição espacial:

Um sinal de aplauso consiste de uma densa misturade eventos transientes (palmas), vários dos quais caem no mesmoframe de parâmetro. Claramente, nem todas as palmas de um frame seoriginam da mesma (ou similar) direção espacial. Para umdecodificador MPEG Surround, entretanto, a granularidade temporaldo decodificador é amplamente determinada pelo tamanho do frame epela granularidade temporal do slot do parâmetro. Assim, após asíntese, todas as palmas que se situarem em um frame aparecem coma mesma orientação espacial (distribuição de nível entre os canaisde saída) em contraste com o sinal original para o qual cada palmapode ser localizada (e, de fato, percebida) individualmente.

Para também obter bons resultados em termos deredistribuição espacial de sinais altamente críticos como sinaisde aplauso, os envelopes de tempo do sinal upmixed devem serconformados com uma resolução muito alta de tempo.

Sumário da invenção

É o objetivo da presente invenção prover umconceito para a codificação de sinais de áudio multicanais quepermita a codificação eficiente, provendo uma melhor preservaçãoda distribuição espacial dos sinais multicanais.

De acordo com o primeiro aspecto da presenteinvenção, este objetivo é alcançado por um decodificador para ageração de um sinal de saída multicanais com base em um sinal baseobtido de um sinal multicanais original tendo um ou mais canais, onúmero de canais do sinal base sendo menor que o número de canaisdo sinal multicanais original, o sinal base sendo organizado emframes, um frame compreendendo valores de amostragem dotados dealta resolução, e com base em uma representação paramétrica deforma de onda que representa uma forma de onda de umarepresentação de resolução intermediária de um canal originalselecionado do sinal multicanais original, a representaçãoparamétrica de forma de onda incluindo uma seqüência de parâmetrosde forma de onda intermediária tendo uma resolução de tempointermediária inferior à alta resolução de tempo dos valores deamostragem e superior à baixa resolução de tempo definida por umataxa de repetição de frame, compreendendo: um upmixer para ageração de uma pluralidade de canais upmixed tendo uma resoluçãode tempo mais alta do que a resolução intermediária; e um shaper(conformador) para conformar um canal upmixed selecionado usandoos parâmetros intermediários de forma de onda do canal originalselecionado que corresponde ao canal upmixed selecionado.

De acordo com um segundo aspecto da presenteinvenção, este objetivo é atingido por um codificador para ageração de uma representação paramétrica de forma de onda de umcanal de um sinal multicanais representado por frames, um framecompreendendo valores de amostragem tendo um período deamostragem, o codificador compreendendo: um redutor da resoluçãode tempo para a obtenção de uma representação de baixa resoluçãodo canal usando os valores de amostragem de um frame, arepresentação de baixa resolução tendo valores de baixa resoluçãodotados de um período de baixa resolução associado maior que operíodo de amostragem; e um calculador paramétrico de forma deonda para o cálculo da representação paramétrica de forma de ondaque representa uma forma de onda da representação de baixaresolução, em que o calculador paramétrico de forma de onda estáadaptado para gerar uma seqüência de parâmetros de forma de ondatendo uma resolução de tempo menor que a resolução de tempo dosvalores de amostragem e maior que a resolução de tempo definidapela taxa de repetição de frame.

De acordo com um terceiro aspecto da presenteinvenção, este objetivo é alcançado por um método para a geraçãode um sinal de saída multicanais com base em um sinal base obtidode um sinal multicanais original tendo um ou mais canais, o númerode canais do sinal base sendo menor que o número de canais dosinal multicanais original, o sinal base sendo organizado emframes, um frame compreendendo valores de amostragem tendo umaalta resolução, e com base em uma representação paramétrica deforma de onda que representa uma forma de onda de umarepresentação de resolução intermediária de um canal originalselecionado do sinal multicanais original, a representaçãoparamétrica de forma de onda incluindo uma seqüência de parâmetrosde forma de onda intermediária tendo uma resolução de tempointermediária menor que a alta resolução de tempo dos valores deamostragem e maior que uma baixa resolução de tempo definida poruma taxa de repetição de frame, o método compreendendo: a geraçãode uma pluralidade de canais upmixed tendo uma resolução de tempomaior que a resolução intermediária; e conformando um canalupmixed selecionado usando os parâmetros intermediários de formade onda do canal original selecionado que correspondem ao canalupmixed selecionado.

De acordo com um quarto aspecto da presenteinvenção, este objetivo é alcançado por um método para a geraçãode uma representação paramétrica de forma de onda de um canal deum sinal multicanais representado por frames, um framecompreendendo valores de amostragem tendo um período deamostragem, o método compreendendo: obter uma representação debaixa resolução do canal usando os valores de amostragem de umframe, a representação de baixa resolução tendo valores de baixaresolução tendo associado um período de baixa resolução maior queo período de amostragem; e calcular uma representação paramétricade forma de onda que representa a forma de onda da representaçãode baixa resolução, em que o calculador paramétrico de forma deonda está adaptado para gerar uma seqüência de parâmetros de formade onda tendo uma resolução de tempo menor que a resolução detempo dos valores de amostragem e maior que a resolução de tempodefinida por uma taxa de repetição de frame.

De acordo com um quinto aspecto da presenteinvenção, este objetivo é alcançado por uma representação de umsinal de áudio multicanais com base em um sinal base obtido dosinal de áudio multicanais tendo um ou mais canais, o número decanais do sinal base sendo menor que o número de canais do sinalmulticanais, o sinal base sendo organizado em frames, um framecompreendendo valores de amostragem tendo uma alta resolução, ecom base em uma representação paramétrica de forma de onda querepresenta uma forma de onda de uma representação de resoluçãointermediária de um canal selecionado do sinal multicanais, arepresentação paramétrica de forma de onda incluindo uma seqüênciade parâmetros de forma de onda intermediária tendo a resolução detempo menor que uma alta resolução de tempo dos valores deamostragem e maior que uma baixa resolução de tempo definida poruma taxa de repetição de frame.

De acordo com um sexto aspecto da presenteinvenção, este objetivo é alcançado por um meio de armazenagemlegível por computador, tendo armazenado uma representação de umsinal de áudio multicanais com base em um sinal base obtido dosinal de áudio multicanais tendo um ou mais canais, o número decanais do sinal base sendo menor que o número de canais do sinalmulticanais, o sinal base sendo organizado em frames, um framecompreendendo valores de amostragem tendo uma alta resolução, ecom base em uma representação paramétrica de forma de onda querepresenta a forma de onda de uma representação de resoluçãointermediária de um canal selecionado do sinal multicanais, arepresentação paramétrica de forma de onda incluindo uma seqüênciade parâmetros de forma de onda intermediária tendo uma resoluçãode tempo menor que a alta resolução de tempo dos valores deamostragem e maior que uma baixa resolução de tempo definida poruma taxa de repetição de frame.

De acordo com um sétimo aspecto da presenteinvenção, este objetivo é alcançado por um receptor ou reprodutorde áudio tendo um decodificador para a geração de um sinal desaída multicanais com base em um sinal base obtido de um sinalmulticanais original tendo um ou mais canais, o número de canaisdo sinal base sendo menor que o número de canais do sinalmulticanais original, o sinal base sendo organizado em frames, umframe compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma deonda que representa a forma de onda de uma representação deresolução intermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, compreendendo: um upmixer para a geração de uma pluralidadede canais upmixed tendo uma resolução de tempo maior que aresolução intermediária; e um shaper para a conformação de umcanal upmixed selecionado usando os parâmetros intermediários deforma de onda do canal original selecionado que correspondem aocanal upmixed selecionado.

De acordo com um oitavo aspecto da presenteinvenção, este objetivo é alcançado por um transmissor ou gravadorde áudio tendo um codificador para gerar uma representaçãoparamétrica de forma de onda de um canal de um sinal multicanaisrepresentado por frames, um frame compreendendo valores deamostragem tendo um período de amostragem, o codificadorcompreendendo: um redutor da resolução de tempo para obter uma.representação de baixa resolução do canal usando os valores deamostragem de um frame, a representação de baixa resolução tendovalores de baixa resolução tendo associados um período de baixaresolução maior que o período de amostragem; e um calculadorparamétrico de forma de onda para o cálculo da representaçãoparamétrica de forma de onda que representa uma forma de onda darepresentação de baixa resolução, em que o calculador paramétricode forma de onda está adaptado para gerar uma seqüência deparâmetros de forma de onda tendo uma resolução de tempo menor quea resolução de tempo dos valores de amostragem e maior que aresolução de tempo definida por uma taxa de repetição de frame.

De acordo com um nono aspecto da presenteinvenção, este objetivo é alcançado por um método de recepção oude reprodução de áudio, o método tendo um método para a geração deum sinal de saída multicanais com base em um sinal base obtido deum sinal multicanais original tendo um ou mais canais, o número decanais do sinal base sendo menor que o número de canais do sinalmulticanais original, o sinal base sendo organizado em frames, umframe compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma deonda que representa a forma de onda de uma representação deresolução intermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, o método compreendendo: a geração de uma pluralidade decanais upmixed tendo uma resolução de tempo maior que a resoluçãointermediária; e conformando um canal upmixed selecionado usandoos parâmetros intermediários de forma de onda do canal originalselecionado que correspondem ao canal upmixed selecionado.

De acordo com um décimo aspecto da presenteinvenção, este objetivo é alcançado por um método para atransmissão ou a gravação de áudio, o método tendo um método paraa geração de uma representação paramétrica de forma de onda de umcanal de um sinal multicanais representado por frames, um framecompreendendo valores de amostragem tendo um período deamostragem, o método compreendendo: obter uma representação debaixa resolução de um canal usando os valores de amostragem de umframe, a representação de baixa resolução tendo valores de baixaresolução tendo associado um período de baixa resolução maior queo período de amostragem; e calcular a representação paramétrica deforma de onda que representa a forma de onda da representação debaixa resolução, em que o calculador paramétrico de forma de ondaestá adaptado para gerar uma seqüência de parâmetros de forma deonda tendo uma resolução de tempo menor que a resolução de tempodos valores de amostragem e maior que a resolução de tempodefinida por uma taxa de repetição de frame.

De acordo com um décimo primeiro aspecto dapresente invenção, este objetivo é alcançado por um sistema detransmissão dotado de um transmissor e um receptor, o transmissortendo um codificador para a geração de uma representaçãoparamétrica de forma de onda de um canal de um sinal multicanaisrepresentado por frames, um frame compreendendo valores deamostragem tendo um período de amostragem; e o receptor tendo umdecodificador para a geração de um sinal de saída multicanais combase em um sinal base obtido de um sinal multicanais originaltendo um ou mais canais, o número de canais do sinal base sendomenor que o número de canais do sinal multicanais original, osinal base sendo organizado em frames, um frame compreendendovalores de amostragem tendo uma alta resolução, e com base em umarepresentação paramétrica de forma de onda que representa a formade onda de uma representação de resolução intermediária de umcanal original selecionado do sinal multicanais original, arepresentação paramétrica de forma de onda incluindo uma seqüênciade parâmetros de forma de onda intermediária tendo uma resoluçãode tempo intermediária menor que a alta resolução de tempo dosvalores de amostragem e maior que uma baixa resolução de tempodefinida por uma taxa de repetição de frame.

De acordo com um décimo segundo aspecto dapresente invenção, este objetivo é alcançado por um método para atransmissão e recepção, o método de transmissão tendo um métodopara a geração de uma representação paramétrica de forma de ondade um canal de um sinal multicanais representado por frames, umframe compreendendo valores de amostragem tendo um período deamostragem; e o método de recepção tendo um método para a geraçãode um sinal de saída multicanais com base em um sinal base obtidode um sinal multicanais original tendo um ou mais canais, o númerode canais do sinal base sendo menor que o número de canais dosinal multicanais original, o sinal base sendo organizado emframes, um frame compreendendo valores de amostragem tendo umaalta resolução, e com base em uma representação paramétrica deforma de onda que representa a forma de onda de uma representaçãode resolução intermediária de um canal original selecionado dosinal multicanais original, a representação paramétrica de formade onda incluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, o método compreendendo.

De acordo com um décimo terceiro aspecto dapresente invenção, este objetivo é alcançado por um programa decomputador tendo um código de programa para, quando operando em umcomputador, desenvolver qualquer dos métodos acima.

A presente invenção se baseia no achado de que umcanal selecionado de um sinal multicanais que é representado porframes compostos de valores de amostragem tendo uma alta resoluçãode tempo pode ser codificado com uma maior qualidade quando éobtida a representação paramétrica de forma de onda que representaa forma de onda de uma representação de resolução intermediária docanal selecionado, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo menor que a altaresolução de tempo dos valores de amostragem e mais alta que aresolução de tempo definida por uma taxa de repetição de frame. Arepresentação paramétrica de forma de onda com a resoluçãointermediária pode ser usada para conformar um canal reconstruídopara obter um canal tendo um envelope de sinal perto daquele docanal original selecionado. A escala de tempo em que a conformaçãoé feita é mais fina que a escala de tempo de um processamento nadireção dos frames, aumentando assim a qualidade do canalreconstruído. Por outro lado, a escala de tempo conformada é maisgrossa que a escala de tempo dos valores de amostragem, reduzindosignificativamente a quantidade necessária de dados pelarepresentação paramétrica de forma de onda.

Uma representação paramétrica de forma de ondasendo adequada para conformação de envelope pode, em umaconfiguração preferida da presente invenção, conter comoparâmetros uma medida de resistência de sinal, que indica umaresistência do sinal em um período de amostragem. Como aresistência do sinal está altamente relacionada com a intensidadeperceptual de um sinal, o uso de parâmetros de resistência desinal é, portanto, uma escolha adequada para a implementação daconformação de envelope. Dois parâmetros de resistência de sinalnaturais são, por exemplo, a amplitude ou a amplitude ao quadrado,isto é, a energia do sinal.

A presente invenção visa prover um mecanismo pararecuperar os sinais da distribuição espacial em uma altagranularidade temporal, e assim recuperar a sensação completa de"distribuição espacial" como é relevante, por exemplo, para ossinais de aplauso. Uma importante condição secundária é seralcançado um melhor desempenho de apresentação sem um inaceitávelgrande aumento das informações transmitidas de controle(informações surround auxiliares).

A presente invenção descrita nos parágrafossubseqüentes se refere primariamente à reconstrução multicanais desinais de áudio com base em um sinal down-mix disponível e nosdados adicionais de controle. Os parâmetros espaciais sãoextraídos no lado do codificador, representando as característicasmulticanais com respeito a um (dado) down-mix dos canaisoriginais. 0 sinal down mix e a representação espacial são usadosem um decodificador para recriar uma representação muito parecidado sinal multicanais original por meio da distribuição de umacombinação do sinal down-mix com uma versão decorrelacionada delacom os canais sendo reconstruídos.A invenção se aplica a sistemas onde é desejávelum sinal downmix reversamente compatível, do tipo transmissão derádio estéreo digital (DAB, rádio satélite XM, etc.), mas tambémem sistemas que exigem representação muito compacta do sinal multicanais. Nos parágrafos a seguir, a presente invenção édescrita em sua aplicação dentro do padrão de áudio MPEG surround.É também possível dizer que é aplicável dentro de outros sistemasde codificação de áudio multicanais como, por exemplo, naquelesmencionados abaixo.

A · presente invenção se baseia nas seguintes

considerações:

• Para uma qualidade ideal de áudio perceptual,o estágio de síntese MPEG Surround não somente deve prover meiospara a decorrelação, como também pode resintetizar a distribuição

espacial do sinal em uma fina granularidade temporal.

• Isto requer a transmissão das informaçõessurround auxiliares que representam a distribuição espacial(envelopes de canal) do sinal multicanais.

• Para minimizar a taxa necessária de bits para uma transmissão dos envelopes individuais de canal temporal, essasinformações são codificadas de forma normalizada e relacionada comrelação ao envelope do sinal down mix. Segue-se uma outra etapa decodificação de entropia para reduzir ainda mais a taxa de bitsnecessária para a transmissão do envelope.

De acordo com essas informações, odecodificador MPEG Surround conforma tanto o som direto como odifuso (ou o som combinado direto/difuso), de forma que combinecom o envelope temporal alvo. Isto permite o controle independentedos envelopes de canais individuais e recria a percepção dedistribuição espacial em uma fina granularidade temporal, quemuito se parece com a original (ao invés de um processamentoespacial de baixa resolução com base em frames por meio somente detécnicas de decorrelação).

O principio de conformação guiada de envelopepode tanto ser aplicado no domínio espectral como no domínio dotempo, onde a implementação no domínio espectral caracteriza umamenor complexidade computacional.

Em uma configuração da presente invenção, umcanal selecionado de um sinal multicanais é representado por umarepresentação paramétrica que descreve o envelope do canal, em queo canal é representado por frames de valores de amostragem tendouma alta taxa de amostragem, isto é, uma alta resolução de tempo.O envelope está sendo definido como a evolução temporal da energiacontida no canal, em que o envelope é tipicamente computado em umintervalo de tempo que corresponde ao comprimento do frame. Napresente invenção, o espaço de tempo para o qual um únicoparâmetro representa o envelope é reduzido com relação à escala detempo definida por um frame, isto é, esse espaço de tempo é umintervalo intermediário de tempo que é maior que o intervalo deamostragem e mais curto que o comprimento do frame. Para se obteristo, é computada uma representação de resolução intermediária docanal selecionado que descreve um frame com resolução temporalreduzida comparado à resolução provida pelos parâmetros deamostragem. O envelope do canal selecionado é estimado com aresolução de tempo da representação de baixa resolução que, por umlado, aumenta a resolução temporal da representação de resoluçãomais baixa e, por outro lado, reduz a quantidade de dados e acomplexidade de computação necessária quando comparada àconformação no domínio do tempo.

Em uma configuração preferida da presenteinvenção, é provida uma representação de resolução intermediáriado canal selecionado por um banco de filtros que obtém umarepresentação de banco de filtros com resolução reduzida do canalselecionado. Na representação do banco de filtros, cada canal édividido em várias bandas finitas de freqüências, cada banda defreqüência sendo representada por vários valores de amostragem quedescrevem a evolução temporal do sinal dentro da banda defreqüência selecionada com uma resolução de tempo menor que aresolução de tempo dos valores de amostragem.

A aplicação da presente invenção no domínio dobanco de filtros tem um grande número de vantagens. Aimplementação se adapta bem aos existentes esquemas decodificação, isto é, a presente invenção pode ser implementada deforma totalmente reversamente compatível aos esquemas existentesde codificação de áudio, como a codificação de áudio MPEGsurround. Além disso, a necessária redução da resolução temporal éprovida automaticamente pelas propriedades de redução de resoluçãodo banco de filtros e um branqueamento de um espectro pode serimplementado com uma complexidade computacional bem menor nodomínio do banco de filtros que no domínio do tempo. Uma outravantagem é que o conceito do invento somente pode ser aplicado àspartes da freqüência do canal selecionado que precisam deconformação a partir do ponto de vista de qualidade perceptual .

Em uma outra configuração preferida da presenteinvenção, é obtida uma representação paramétrica de forma de ondade um canal selecionado que descreve uma relação entre o envelopedo canal selecionado e o envelope de um sinal down-mix obtido nolado do codificador. A obtenção da representação paramétrica deforma de onda com base em uma estimativa diferencial ou relativados envelopes tem a grande vantagem de reduzir mais a taxa de bitsexigida pela representação paramétrica de forma de onda. Em umaoutra configuração preferida a assim derivada representaçãoparamétrica de forma de onda é quantizada para reduzir ainda maisa taxa de bits necessária pela representação paramétrica de formade onda. É também mais vantajoso aplicar uma codificação deentropia aos parâmetros quantizados para economizar mais taxa debits sem uma maior perda de informações.

Em uma outra configuração preferida da presenteinvenção, os parâmetros de forma de onda se baseiam em medidasenergéticas que descrevem a energia contida no canal selecionadoem uma dada porção de tempo. A energia é preferivelmente calculadacomo a soma ao quadrado dos parâmetros de amostragem que descrevemo canal selecionado.

Em uma outra configuração da presente invenção, oconceito do invento de obter uma representação paramétrica deforma de onda com base na representação de resolução intermediáriade um canal selecionado de áudio de um sinal de áudio multicanaisé implementado no domínio do tempo. A obtenção necessária darepresentação de resolução intermediária pode ser obtida pelacomputação da média (quadrada) ou soma da energia de um número deconsecutivos valores de amostragem. A variação do número devalores consecutivos de amostragem na média permite o convenienteajuste da resolução de tempo do processo de conformação doenvelope. Em uma modificação da configuração anteriormentedescrita, somente cada enésimo valor de amostragem é usado para aobtenção da representação paramétrica de forma de onda, reduzindoainda mais a complexidade computacional.

Em uma outra configuração da presente invenção aobtenção dos parâmetros de conformação é feita com complexidadecomputacional comparativamente baixa no domínio da freqüência,onde a conformação real, isto é, a aplicação dos parâmetros deconformação, é feita no domínio do tempo.

Em uma outra configuração da presente invenção aconformação de envelope é somente aplicada naquelas porções docanal selecionado que exigem uma conformação de envelope com altaresolução temporal.

A presente invenção descrita nos parágrafosanteriores proporciona as seguintes vantagens:

• Melhoria da qualidade do som espacial de sonstransientes densos, como sinais de aplausos, que atualmente podemser considerados os sinais de pior caso.

• Somente um aumento moderado na taxa deinformações auxiliares de áudio espacial (aproximadamente 5 kbit/spara a transmissão contínua de envelopes) devido à codificaçãomuito compacta das informações de envelope.

• A taxa geral de bits pode ser ainda maisreduzida permitindo que o codificador transmita envelopes somentequando forem perceptualmente necessários. A sintaxe proposta doelemento envelope de fluxo de bits cuida disso.

0 conceito do invento pode ser descrito como umaconformação guiada de envelope sendo brevemente resumido nosparágrafos seguintes:

A conformação guiada de envelope restaura oenvelope de banda larga do sinal de saída sintetizado peloaplanamento do envelope e a reconformação de cada canal de saídausando as informações auxiliares de envelope de banda largaparamétrica contidas no fluxo de bits.

No processo de reconformação, são extraídos osenvelopes dos canais downmix e de saída. Para obter essesenvelopes, são calculadas as energias de cada banda paramétrica ede cada slot. Depois, é feita uma operação de branqueamentoespectral, em que são ponderados os valores energéticos de cadabanda paramétrica, de maneira que as energias totais de todas asbandas paramétricas sejam iguais. Finalmente, é obtido o envelopede banda larga somando e normalizando as energias ponderadas detodas as bandas paramétricas, sendo obtida uma energia média delongo prazo pela filtragem passa baixas com uma constante de longotempo.

O processo de reconformação de envelope realiza oaplanamento e a reconformação dos canais de saída na direção doenvelope alvo, calculando e aplicando uma curva de ganhos naporção sonora direta e na difusa de cada canal de saída. Portanto,os envelopes do down mix transmitido e do respectivo canal desaída são extraídos como acima descrito.

É obtida então a curva de ganho escalando arelação do envelope down mix extraído e do envelope de saídaextraído com os valores de relação envelope transmitidos no fluxode bits.A ferramenta proposta de conformação de envelopeusa informações auxiliares quantizadas transmitidas no fluxo debits. A demanda total de taxa de bits das informações auxiliaresde envelope está listada na Tabela 1 (supondo taxa de amostragemde 44,1 kHz, informações auxiliares de envelope quantizadas em 5etapas) .

Tabela 1 - Taxa estimada de bits das informaçõesauxiliares de envelope

<table>table see original document page 26</column></row><table>

Como mencionado anteriormente, a conformação deenvelope temporal guiado focaliza assuntos que são ortogonaisàqueles focalizados pela TES ou TP: Enquanto a conformação deenvelope temporal guiado proposta visa melhorar a distribuiçãoespacial de eventos transientes, a ferramenta TES e TP é funcionalpara conformar o envelope de som difuso de maneira a combinar como envelope seco. Assim, para um cenário de aplicação de altaqualidade, é recomendada uma combinação da ferramenta recém-proposta com TES ou TP. Para um desempenho ideal, a conformação deenvelope temporal guiada é feita antes da aplicação da TES ou TPna cadeia de ferramenta do decodificador. Além disso, asferramentas TES e TP são um pouco mais adaptadas em suasconfigurações para se integrarem perfeitamente à ferramentaproposta: Basicamente, o sinal usado para obter o envelope alvo noprocessamento TES ou TP é alterado do uso do sinal down mix para ouso dos sinais up mix de canal individual reconformados.

Como já mencionado acima, a grande vantagem doconceito do invento é a sua possibilidade de ser colocado dentrodo esquema de codificação MPEG surround. 0 conceito do invento,por um lado, amplia a funcionalidade da ferramenta TP/TES, já queimplementa o mecanismo de conformação temporal necessário para omanuseio adequado de eventos ou sinais transientes. Por outrolado, a ferramenta exige a transmissão de informações auxiliarespara orientar o processo de conformação. Apesar da taxa de bits deinformações auxiliares média necessária (aprox. 5 KBit/s paratransmissão de envelope continua) ser comparativamente baixa, oganho na qualidade conceituai é significativo. Como conseqüência,o novo conceito é proposto como uma adição às ferramentas TP/TESexistentes. No sentido de manter a complexidade computacional maisbaixa, enquanto é mantida uma alta qualidade de áudio, acombinação do conceito recém-proposto com TES é um modo preferidode operação. Quando se trata de complexidade computacional, podeser notado que alguns dos cálculos são necessários para a extraçãoe reconformação de envelope, quadro a quadro, enquanto outros sãofeitos por slot (isto é, um intervalo de tempo dentro do domíniodo banco de filtros) . A complexidade é dependente do comprimentodo frame, assim como da freqüência de amostragem. Supondo umcomprimento de frame de 32 slots e uma taxa de amostragem de 44,1KHz, o algoritmo descrito requer aproximadamente 105.000 operaçõespor segundo (OPS) para a extração do envelope para um canal e330.000 OPS para a reconformação de um canal. Como é necessáriauma extração de envelope por canal down-mix e uma operação dereconformação é necessária para cada canal de saída, isto resultaem uma complexidade total de 1,76 MOPS para uma configuração 5-1-5, isto é, uma configuração onde 5 canais de um sinal de áudiomulticanais sejam representados por um sinal down-mix monofônico e1,86 MOPS para a configuração 5-2-5 utilizando um sinal down-mixestéreo.

Breve descrição dos desenhos

Serão subseqüentemente descritas as configuraçõespreferidas da presente invenção por referência aos desenhosanexos, onde:

A Fig. 1 mostra um decodificador do invento;

A Fig. 2 mostra um codificador do invento;

As Figs. 3a e 3b mostram uma tabela indicandoíndices de banda de filtro de um banco de filtros híbrido aoscorrespondentes índices de sub-banda;

A Fig. 4 mostra parâmetros de diferentesconfigurações de decodificação;

A Fig. 5 mostra um esquema de codificação queilustra a compatibilidade reversa do conceito do invento;

A Fig. 6 mostra configurações paramétricasselecionando diferentes configurações;

A Fig. 7 mostra um esquema de codificaçãoreversamente compatível;

A Fig. 7b ilustra diferentes esquemas dequantização;

A Fig. 8 mostra ainda o esquema de codificaçãoreversamente compatível;

A Fig. 9 mostra um livro de códigos de Huffmanusado para uma implementação eficiente;

A Fig. 10 mostra um exemplo de uma configuraçãode canal de um sinal de saída multicanais;A Fig. 11 mostra um transmissor ou gravador de

áudio do invento;

A Fig. 12 mostra um receptor ou reprodutor de

áudio do invento;

A Fig. 13 mostra um sistema de transmissão do

invento; e

A Fig. 14 ilustra a conformação temporal nodomínio do tempo da técnica anterior.

Descrição detalhada das configurações preferidas

A Fig. 1 mostra um decodif icador do invento 40tendo um upmixer 42 e um shaper (conformador) 44.

O decodificador 40 recebe como entrada um sinalbase 46 obtido de um sinal multicanais original, o sinal basetendo um ou mais canais, onde o número de canais do sinal base é menor que o número de canais do sinal multicanais original. Odecodificador 40 recebe como segunda entrada uma representaçãoparamétrica de forma de onda 48 que representa a forma de onda darepresentação de baixa resolução de um canal original selecionado,onde a representação paramétrica de forma de onda 48 está incluindo uma seqüência de parâmetros de forma de onda tendo umaresolução de tempo menor que a resolução de tempo dos valores deamostragem que estão organizados em frames, os frames descrevendoo sinal base 46. O upmixer 42 gera um canal upmix 50 do sinal base46, onde o upmix 50 é uma representação estimada de baixa resolução de um canal original selecionado do sinal multicanaisoriginal que tem uma resolução de tempo menor que a resolução detempo dos valores de amostragem. O shaper 44 recebe o canal upmix50 e a representação paramétrica de forma de onda 48 como entradae obtém um canal up-mixed conformado 52 que está conformado demaneira que o envelope do canal up-mixed conformado 52 estáajustado para se adaptar ao envelope do correspondente canaloriginal dentro de uma faixa de tolerância, onde a resolução detempo é dada pela resolução de tempo da representação paramétricade forma de onda.

Assim, o envelope do canal up-mixed conformadopode ser conformado com a resolução de tempo que é maior que aresolução de tempo definida pelos frames que constroem o sinal base 46. Portanto, a redistribuição espacial de um sinalreconstruído é garantida por uma granularidade temporal mais finaque pelo uso de frames e a qualidade de percepção pode serampliada com o custo de um pequeno aumento da taxa de bits devidoà representação paramétrica de forma de onda 48.

A Fig. 2 mostra um codificador do invento 60tendo um redutor da resolução de tempo 62 e um calculadorparamétrico de forma de onda 64. O codificador 60 recebe comoentrada um canal de um sinal multicanais que é representado pelosframes 66, os frames compreendendo valores de amostragem 68a a68g, cada valor de amostragem representando um primeiro período deamostragem. O redutor da resolução de tempo 62 está obtendo umarepresentação de baixa resolução 70 do canal em que um frame estátendo valores de baixa resolução 72a a 72d que são associados a umperíodo de baixa resolução maior que o período de amostragem.

O calculador paramétrico de forma de onda 64recebe a representação de baixa resolução 70 como entrada ecalcula os parâmetros de forma de onda 74, em que os parâmetros deforma de onda 74 estão tendo uma resolução de tempo mais baixa quea resolução de tempo dos valores de amostragem e maior que umaresolução de tempo definida pelos frames.

Os parâmetros de forma de onda 74 dependempreferivelmente da amplitude do canal dentro de uma porção de tempo definida pelo período de baixa resolução. Em umaconfiguração preferida, os parâmetros de forma de onda 74descrevem a energia que está contida dentro do canal em um períodode baixa resolução. Em uma configuração preferida, os parâmetrosde forma de onda são obtidos de maneira que uma medida de energia contida nos parâmetros de forma de onda 74 é obtida com relação àmedida de energia de referência que é definida por um sinal down-mix recebido pelo codificador de áudio multicanais do invento.

A aplicação do conceito do invento no contexto deum codificador de áudi o MPEG surround está descrita em maiores detalhes nos parágrafos seguintes para ressaltar as idéias doinvento.

A aplicação do conceito do invento no domínio desub-banda de um codificador MPEG da técnica anterior aindaressalta a vantajosa compatibilidade reversa do conceito do invento com relação aos esquemas de codificação da técnicaanterior.

A presente invenção (conformação guiada deenvelope) restaura o envelope de banda larga do sinal de saídasintetizado. Compreende um procedimento upmix modificado seguido pelo aplanamento do envelope e a reconformação da porção do sinaldireta (seca) e da difusa (úmida) de cada canal de saída. Paraorientar, são usadas as informações auxiliares de envelope debanda larga paramétríca reconformadas contidas no fluxo de bits.As informações auxiliares consistem de relações (envRatio) que sereferem ao envelope de sinais downmix transmitidos para o envelopede sinais de canal de entrada originais.

Como o processo de conformação do envelopeemprega uma operação de extração de envelope nos diferentessinais, o processo de extração de envelope deverá ser primeirodescrito em maiores detalhes. Deve ser notado que dentro doesquema de codificação MPEG, os canais são manipulados em umarepresentação obtida por um banco de filtros híbrido, isto é, doisfiltros consecutivos são aplicados a um canal de entrada. Umprimeiro banco de filtros obtém uma representação de um canal deentrada em que uma pluralidade de intervalos de freqüência édescrita de forma independente por parâmetros tendo uma resoluçãode tempo inferior à da resolução de tempo dos valores deamostragem do canal de entrada. Essas bandas paramétricas são aseguir indicadas pela letra κ. Algumas bandas paramétricas sãosubseqüentemente filtradas por um banco adicional de filtros queestá ainda subdividindo algumas das bandas de freqüências doprimeiro banco de filtros em uma ou mais bandas de freqüênciafinitas com representações que são indicadas como k nos parágrafosseguintes. Em outras palavras, cada banda paramétrica κ pode terassociado mais do que um índice híbrido k.

As Figs. 3a e 3b mostram uma tabela que associavárias bandas paramétricas aos correspondentes parâmetroshíbridos. O parâmetro híbrido k é dado na primeira coluna 80 databela onde a banda paramétrica associada κ é dada em uma dascolunas 82a ou 82b. A aplicação da coluna 82a ou 82b depende de umparâmetro 84 (decType) que indica duas diferentes configuraçõespossíveis de um banco de filtros decodificador MPEG.

Deve ainda ser notado que os parâmetrosassociados a um canal são processados de maneira dirigida aframes, onde um único frame tem η intervalos de tempo, e onde paracada intervalo de tempo η existe um único parâmetro y para cadaíndice híbrido k. Os intervalos de tempo η são também chamados deslots e os parâmetros associados são indicados como yn,k. Para aestimativa do envelope normalizado, as energias das bandasparamétricas são calculadas com yn,k sendo o sinal de entrada paracada slot de um frame:

<formula>formula see original document page 33</formula>

A soma inclui todos os k que estiverem sendoatribuídos a todas as bandas paramétricas κ de acordo com a tabelamostrada nas Figs. 3a e 3b.Subseqüentemente, a energia total da banda

paramétrica no frame de cada banda paramétrica é calculada como

<formula>formula see original document page 33</formula>

Com a sendo um fator de pesagem que correspondea um IIR de primeira ordem passa baixas com 400 ms de constante detempo, t indica o índice do frame, sFreq a taxa de amostragem dosinal de entrada, e 64 representa o fator de down-sample do bancode filtros. A energia média em um frame é calculada como

<formula>formula see original document page 33</formula><formula>formula see original document page 34</formula>

A relação dessas energias é determinada paraobter pesos para o branqueamento espectral:

<formula>formula see original document page 34</formula>

O envelope de banda larga é obtido pela soma dascontribuições pesadas das bandas paramétricas, normalizando ecalculando a raiz quadrada

<formula>formula see original document page 34</formula>

Após a extração do envelope, é feito o processode conformação do envelope, que consiste de um aplanamento doenvelope de som direto e difuso de cada canal de saida, seguidopor uma reconformação na direção do envelope alvo. Isto resulta emuma curva de ganho sendo aplicada à porção do sinal direto edifuso de cada canal de saida.

No caso de um esquema de codificação MPEGsurround compatível, devem ser distinguidas uma configuração 5-1-5e uma 5-2-5 .

Para a configuração 5-1-5, o envelope alvo éobtido estimando o envelope do Envnmx down mix transmitido e depoisescalando-o com relações de codificador transmitido e de enveloperequantizado envRatioi'U-C-R-Rs . a curva de ganho de todos os slots emum frame é calculada para cada canal de saída, estimando oenvelope Env1j^fdo sinal direto e difuso respectivamente erelacionando-o com o envelope alvo<formula>formula see original document page 35</formula>

Para as configurações 5-2-5, o envelope alvo de Le Ls é obtido a partir do envelope down mix do sinal transmitidocompatível com o canal esquerdo <formula>formula see original document page 35</formula>, para R e Rs é usado o downmix transmitido compatível com o canal direito para obter EnvDmrR.O canal central é obtido a partir da soma dos envelopes de downmix do sinal transmitido compatível com os canais esquerdo edireito. A curva de ganho é calculada para cada canal de saída pormeio da estimativa do envelope <formula>formula see original document page 35</formula> do sinal direto e difusorespectivamente e o relacionando com o envelope alvo

<formula>formula see original document page 35</formula>

Para todos os canais, a curva de ganho de ajustedo envelope é aplicada como

<formula>formula see original document page 35</formula>

Com k iniciando na sub-banda híbrida transversalk0 e para n = 0,...,numSlots -1 .

Após a conformação de envelope dos sinais úmido eseco separadamente, o som conformado direto e difuso é mixadodentro do domínio de sub-banda de acordo com a seguinte fórmula:

<formula>formula see original document page 35</formula>

Ficou demonstrado nos parágrafos anteriores servantajosamente possível implementar o conceito do invento dentrode um esquema de codificação da técnica anterior, que se baseia nacodificação MPEG surround. A presente invenção também usa umarepresentação já existente de domínio de sub-banda dos sinais aserem manipulados, introduzindo mais uma pequena ação decomputador. Para aumentar a eficiência de uma implementação doconceito do invento em uma codificação MPEG de áudio multicanais,são preferidas alterações adicionais na conformação de upmixing etemporal de envelope.

Se a conformação guiada de envelope estiverhabilitada, os sinais direto e difuso são sintetizadosseparadamente usando uma pós-mixagem modificada no domínio de sub-banda híbrida de acordo com

<formula>formula see original document page 36</formula>

com k0 indicando a sub-banda híbrida transversal.

Como pode ser visto nas equações acima, as saídasdiretas mantêm o sinal direto, o sinal difuso para as bandasinferiores e o sinal residual (se presente). As saídas difusasproporcionam o sinal difuso para as bandas superiores.

Aqui, k0 indica a sub-banda híbrida transversalde acordo com a Fig. 4. A Fig. 4 mostra uma tabela que dá a sub-banda híbrida transversal k0 na dependência das duas configuraçõespossíveis de decodificador indicadas pelo parâmetro 84 (decType).

Se TES for usada em combinação com a conformaçãoguiada de envelope, o processamento TES é um pouco adaptado para odesempenho ideal:

Ao invés dos sinais downmix, os sinais upmixdiretos reconfigurados são usados para a conformação de estimativado filtro:

Xc = Y direct,c

Independente do modo 5-1-5 ou 5-2-5, todos oscálculos TES são feitos adequadamente, decanal a canal. Alémdisso, a etapa de mixagem dos sinais direto e difuso é omitida naconformação guiada de envelope, e então como feita pela TES.

Se a TP for usada em combinação com a conformaçãoguiada de envelope, o processamento TP é um pouco mais adaptadopara o desempenho ideal:

Ao invés de um downmix comum (obtido do sinalmulticanais original), o sinal upmix direto reconformado de cadacanal é usado para extrair o envelope alvo de cada canal.

Ydirec = Ydirect

Independente do modo 5-1-5 ou 5-2-5 todos oscálculos TP são feitos de acordo com um procedimento canal acanal. Além disso, a etapa de mixagem do sinal direto e difuso éomitida na conformação guiada de envelope, sendo feita pela TP.

Para uma maior ênfase e provar a compatibilidadereversa do conceito do invento com a codificação MPEG de áudio, asfiguras a seguir mostram definições e funções de fluxos de bitsdefinidas como sendo totalmente compatíveis reversamente e, alémdisso, suportando dados de reconformação de envelope quantizado.

A Fig. 5 mostra uma sintaxe geral que descreve aconfiguração espacial especifica de um fluxo de bits.Em uma primeira parte 90 da configuração, asvariáveis estão relacionadas com a codificação MPEG da técnicaanterior que define, por exemplo, se a codificação residual éaplicada ou dando indicações sobre os esquemas de decorrelação aserem aplicados. Essa configuração pode ser facilmente estendidapor uma segunda parte 92 que descreve a configuração modificadaquando o conceito do invento da conformação guiada de envelope foraplicado.

Em particular, a segunda parte utiliza umavariável bsTempShapeConfig, indicando a configuração daconformação de envelope aplicável pelo decodificador.

A Fig. 6 mostra uma forma reversamente compatívelde interpretação de quatro bits consumida pela referida variável.Como pode ser visto na Fig. 6, os valores variáveis de 4 a 7(indicados na linha 94) indicam o uso do conceito do invento e,além disso, uma combinação do conceito do invento com osmecanismos de conformação da tédhica anterior TP e TES.

A Fig. 7 revela a sintaxe proposta para umesquema de codificação de entropia como é implementado em umaconfiguração preferida da presente invenção. Além disso, asinformações auxiliares de envelope são quantizadas com uma regrade quantização de cinco etapas. Em uma primeira parte dopseudocódigo apresentado na Fig. 7, a conformação de envelopetemporal é habilitada para todos canais de saída desejados, ondeem uma segunda parte 102 do código apresentado, é necessária areconformação de envelope. Isto está indicado pela variávelbsTempShapeConfig mostrada na Fig. 6.

Em uma configuração preferida da presenteinvenção, é usada a quantização de cinco etapas e os valoresquantizados são codificados em conjunto com as informações, casode um a oito valores idênticos consecutivos tiverem ocorridodentro do fluxo de bits dos parâmetros de conformação de envelope.

Deve ser notado que, em principio, é possível umaquantização mais fina da quantização proposta de cinco etapas, quepode então ser indicada por uma variável bsEnvquantMode comomostrada na Fig. 7b. Apesar de ser possível em princípio, apresente implementação introduz somente uma quantização válida.

A Fig. 8 mostra um código que é adaptado para aobtenção dos parâmetros quantizados da representação codificada deHuffman. Como já mencionado, as informações combinadas referentesao valor quantizado e ao número de repetições do valor em questãosão representadas por uma única palavra código de Huffman. Adecodificação Huffman, portanto, compreende uma primeiracomponente 104 que inicia um Ioop sobre os canais desejados desaída, e uma segunda componente 106 que recebe os valorescodificados de cada canal individual por meio da transmissão daspalavras código de Huffman e recepção dos valores paramétricosassociados e os dados de repetição como indicados na Fig. 9.

A Fig. 9 mostra o livro código associado deHuffman que tem 40 entradas, já que para os 5 diferentes valoresde parâmetros 110, é prevista uma taxa de repetição máxima de 8.Cada palavra código de Huffman 112, portanto, descreve umacombinação do parâmetro 110 com o número de ocorrênciasconsecutivas 114.

Dados os valores paramétricos decodificados deHuffman, as relações de envelopes usadas para a conformação guiadade envelope são obtidas a partir dos dados de reconformaçãotransmitidos de acordo com a seguinte equação:

<formula>formula see original document page 40</formula>

com η = 0,...,numSlots -1 e X e oc indicando o canalde saida de acordo com a Fig. 10.

A Fig. 10 mostra uma tabela que está associando avariável Ioop oc 120, como usada pelas tabelas e expressõesanteriores com os canais de saídas 122 de um sinal multicanaisreconstruído.

Como ficou demonstrado pelas Figuras 3a a 9, éfacilmente possível uma aplicação do conceito do invento nosesquemas de codificação da técnica anterior, resultando em umaumento da qualidade perceptual, enquanto é mantida toda acompatibilidade reversa.

A Fig. 11 mostra um gravador ou transmissor deáudio do invento 330 que tem um codificador 60, uma interface deentrada 332 e uma interface de saída 334.

Pode ser enviado um sinal de áudio na interfacede entrada 332 do transmissor/gravador 330. 0 sinal de áudio écodificado por um codificador do invento 60 dentro dotransmissor/gravador e a representação codificada sai na interfacede saída 334 do transmissor/gravador 330. A representaçãocodificada pode então ser transmitida ou armazenada em um meio dearmazenagem.

A Fig. 12 mostra um receptor do invento oureprodutor de áudio 340, tendo um decodificador do invento 40, umaentrada de fluxo de bits 342 e uma saída de áudio 344.

Um fluxo de bits pode ser enviado para a entrada342 do receptor/reprodutor de áudio do invento 340. O fluxo debits é então decodificado pelo decodificador 40 e o sinaldecodificado é enviado ou tocado na saida 344 doreceptor/reprodutor de áudio do invento 340.

A Fig. 13 mostra um sistema de transmissãocompreendendo um transmissor do invento 330, e um receptor doinvento 340.

A entrada de sinal de áudio na interface deentrada 332 do transmissor 330 é codificada e transferida da saida 334 do transmissor 330 para a entrada 342 do receptor 340. Oreceptor decodifica o sinal de áudio e faz o playback ou envia osinal de áudio para sua saida 344.

Resumindo, a presente invenção proporcionasoluções aperfeiçoadas descrevendo, por exemplo, - Uma maneira para o cálculo de um envelope de

banda larga adequado e estável que minimize a distorção percebida

Um método otimizado para codificar asinformações auxiliares de envelope de uma maneira que sejamrepresentadas com relação ao (normalizadas em relação a) envelope do sinal downmix e que assim minimize o excesso de taxa de bits

Um esquema de quantização para que asinformações de envelope sejam transmitidas

Uma adequada sintaxe de fluxo de bits para atransmissão dessas informações auxiliares -Um método eficiente para a manipulação deenvelopes de banda larga no domínio de sub-banda QMF

Um conceito de como os tipos de processamento(1) e (2), como acima descritos, podem ser unificados dentro deuma única arquitetura, que pode recuperar a fina distribuiçãoespacial do sinal multicanais no tempo, caso as informaçõesauxiliares espaciais existirem descrevendo os envelopes originaisde canal temporal. Caso nenhuma dessas informações seja enviada nofluxo de bits espacial (por exemplo, devido às restrições na taxade bits das informações auxiliares disponíveis), o processamentorecua para um tipo de (1) processamento que ainda pode realizar acorreta conformação temporal do som decorrelacionado (apesar denão individualmente por canal).

Apesar de o conceito da invenção acima descritater sido extensamente descrito em sua aplicação em esquemas decodificação MPEG existentes, é óbvio que o conceito do inventopode ser aplicado a qualquer outro tipo de codificação, em que ascaracterísticas de áudio espacial devam ser preservadas.

O conceito do invento da introdução ou do uso deum sinal intermediário para a conformação do envelope, isto é, aenergia de um sinal com uma resolução de tempo aumentada, pode seraplicado não somente no domínio da freqüência, como ilustradopelas figuras, mas também no domínio do tempo onde, por exemplo,uma redução na resolução de tempo e, portanto, uma redução na taxaexigida de bits pode ser alcançada fazendo a média dos espaços detempo consecutivos ou somente levando em conta cada enésimo valorde amostra de uma representação de amostras de um sinal de áudio.

Apesar de o conceito do invento, como ilustradonos parágrafos anteriores, incorporar um branqueamento espectraldos sinais processados, a idéia de ter um sinal de resoluçãointermediária também pode ser incorporada sem o branqueamentoespectral.Dependendo de determinadas exigências deimplementação dos métodos do invento, os métodos do invento podemser implementados em hardware ou em software. A implementação podeser feita usando um meio digital de armazenagem, em particular umdisco, DVD ou um CD dotado de armazenamento de sinais de controlede leitura eletrônica, que cooperam com um sistema de computadorprogramável, de maneira que os métodos do invento possam serrealizados. Em geral, a presente invenção é, portanto, um produtode programa de computador com o armazenamento de um código deprogramas em um portador de leitura por máquina, o código deprograma operando para a realização dos métodos do invento quandoo produto de programa de computador opera em um computador. Emoutras palavras, os métodos do invento são, portanto, um programade computador tendo um código de programa para a realização depelo menos um dos métodos do invento quando o programa decomputador opera em um computador.

Apesar do exposto ter sido particularmentemostrado e descrito com referência a suas configuraçõesparticulares, será compreendido pelos técnicos no assunto quevárias outras alterações na forma e nos detalhes podem ser feitassem abandonar seu espirito e escopo. Será compreendido que váriasalterações podem ser feitas para a adaptação das diferentesconfigurações sem abandonar os conceitos mais amplos ora reveladose englobados pelas reivindicações que seguem.

Claims

1. Decodificador para a geração de um sinal desaida multicanais com base em um sinal base obtido de um sinalmulticanais original tendo um ou mais canais, caracterizado pelofato de que o número de canais do sinal base é menor que o númerode canais do sinal multicanais original, o sinal base tendo umframe, o frame compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma deonda que representa a forma de onda de uma representação deresolução intermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, compreendendo: um upmixer para a geração de uma pluralidadede canais upmixed tendo uma resolução de tempo maior que aresolução intermediária e para obter uma representação deresolução intermediária do sinal base usado para gerar os canaisupmixed; e um shaper para a obtenção de uma representaçãoparamétrica de forma de onda de referência da representação deresolução intermediária do sinal base e para a conformação de umcanal upmixed selecionado usando a representação paramétrica deforma de onda de referência e os parâmetros intermediários deforma de onda do canal original selecionado que correspondem aocanal upmixed selecionado.

2. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o upmixer ainda opera para obteruma representação de resolução intermediária do sinal base.

3. Decodificador, de acordo com a reivindicação 2, caracterizado pelo fato de que o upmixer opera para obter arepresentação de resolução intermediária do sinal base usando umbanco de filtros, caracterizado pelo fato de que a representaçãode resolução intermediária do sinal base é obtida em um domínio debanco de filtros.

4. Decodificador, de acordo com a reivindicação 3, caracterizado pelo fato de que o banco de filtros é um banco defiltros modulado complexo.

5. Decodificador, de acordo com a reivindicação 1, caracterizado pelo fato de que o upmixer tem um ou maisdecorrelatores para a obtenção de um ou mais sinaisdecorrelacionados do sinal base.

6. Decodificador, de acordo com a reivindicação 5, caracterizado pelo fato de que o upmixer opera de maneira que ageração dos canais upmixed inclui uma combinação linear dos canaisdo sinal base e do um ou mais sinais decorrelacionados.

7. Decodificador, de acordo com a reivindicação 6, caracterizado pelo fato de que o shaper opera para conformar umcanal upmixed selecionado de maneira que uma primeira parte docanal upmixed selecionado obtido do sinal base seja conformado deforma independente de uma segunda parte do canal upmixedselecionado obtido de um ou mais sinais decorrelacionados.

8. Decodificador, de acordo com a reivindicação 1, caracterizado pelo fato de que o shaper opera para usarparâmetros de forma de onda intermediária que descrevem a medidade resistência de sinal da representação de resoluçãointermediária do canal selecionado.

9. Decodificador, de acordo com a reivindicação-8, caracterizado pelo fato de que o shaper opera pra usar osparâmetros de forma de onda intermediária que descrevem a medidade resistência de sinal tendo uma amplitude ou uma medida deenergia.

10. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o shaper opera para conformar ocanal upmixed selecionado dé maneira que a conformação compreendauma combinação dos parâmetros da representação paramétrica deforma de onda e da representação paramétrica de forma de onda dereferência.

11. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o shaper opera pra obter umarepresentação espectralmente plana da representação de resoluçãointermediária do sinal base, a representação espectralmente planatendo um espectro plano de freqüência, e para obter arepresentação paramétrica de forma de onda de referência darepresentação espectralmente plana.

12. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o shaper ainda está adaptadopara conformar o canal upmixed selecionado usando outrosparâmetros de forma de onda tendo a baixa resolução de tempodefinida pela taxa de repetição de frame.

13. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que tem ainda uma interface de saidapara gerar o sinal de saida multicanais dotado de alta resoluçãode tempo usando o canal upmixed selecionado conformado.

14. Decodificador, de acordo com a reivindicação-13, caracterizado pelo fato de que a interface de saida opera paragerar o sinal de saida multicanais, de maneira que a geração dosinal de saida multicanais compreende uma síntese de umarepresentação de banco de filtros de uma pluralidade de canaisupmixed conformados, resultando em uma representação no domínio dotempo da pluralidade de canais upmixed conformados tendo uma altaresolução de tempo.

15. Decodificador, de acordo com a reivindicação-1, caracterizado pelo fato de que o shaper tem um dequantizadorpara a obtenção da representação paramétrica de forma de onda deuma representação quantizada dela, usando uma regra dedequantização tendo menos que 10 etapas de quantização.

16. Decodificador, de acordo com a reivindicação-15, caracterizado pelo fato de que o shaper tem um decodificadorde entropia para obter a representação quantizada da representaçãoparamétrica de forma de onda de uma representação codificada deentropia dele.

17. Decodificador, de acordo com a reivindicação-16, caracterizado pelo fato de que o decodif icador de entropiaopera para usar um livro código de Huffman para a obtenção darepresentação quantizada da representação paramétrica de forma deonda.

18. Decodificador, de acordo com a reivindicação-3, caracterizado pelo fato de que o shaper opera para conformar ocanal upmixed selecionado no domínio do tempo.

19. Codificador para a geração de umarepresentação paramétrica de forma de onda de um canal de um sinalmulticanais dotado de um frame, o frame compreendendo valores deamostragem tendo um período de amostragem, o codificadorcompreendendo: um redutor da resolução de tempo para obter umarepresentação de baixa resolução do canal usando os valores deamostragem de um frame, a representação de baixa resolução tendovalores de baixa resolução com a associação de um período de baixaresolução maior que o período de amostragem e para a obtenção deuma representação de baixa resolução de referência de um sinalbase obtido do sinal multicanais, o número de canais do sinal basesendo menor que o número de canais do sinal multicanais; e umcalculador paramétrico de forma de onda para o cálculo darepresentação paramétrica de forma de onda que representa a formade onda da representação de baixa resolução, caracterizado pelofato de que o calculador paramétrico de forma de onda estáadaptado para gerar uma seqüência de parâmetros de forma de ondatendo uma resolução de tempo menor que a resolução de tempo dosvalores de amostragem e maior que a resolução de tempo definidapor uma taxa de repetição de frame, caracterizado pelo fato de queo calculador paramétrico de forma de onda opera para calcular osparâmetros de forma de onda usando a representação de baixaresolução de referência e a representação de baixa resolução docanal.

20. Codificador, de acordo com a reivindicação-19, caracterizado pelo fato de que o redutor da resolução de tempotem um banco de filtros para a obtenção da representação de baixaresolução do canal, a representação de baixa resolução do canalsendo obtida em um domínio de banco de filtros.

21. Codificador, de acordo com a reivindicação-19, caracterizado pelo fato de que o calculador paramétrico deforma de onda opera de maneira que o cálculo dos parâmetros deforma de onda compreende uma combinação de medidas de amplitude darepresentação de baixa resolução de referência e da representaçãode baixa resolução do canal.

22. Codificador, de acordo com a reivindicação-19, caracterizado pelo fato de que o calculador paramétrico deforma de onda tem um quantizador para a obtenção de umarepresentação quantizada dos parâmetros de forma de onda.

23. Codificador, de acordo com a reivindicação-22, caracterizado pelo fato de que o calculador paramétrico deforma de onda tem um codificador de entropia para obter umarepresentação codificada de entropia da representação quantizadados parâmetros de forma de onda.

24. Método para a geração de um sinal de saidamulticanais com base em um sinal base obtido de um sinalmulticanais original tendo um ou mais canais, o número de canaisdo sinal base sendo menor que o número de canais do sinalmulticanais original, o sinal base caracterizado pelo fato de quetem um frame, o frame compreendendo valores de amostragem tendouma alta resolução, e com base em uma representação paramétrica deforma de onda representando a forma de onda de uma representaçãode resolução intermediária de um canal original selecionado dosinal multicanais original, a representação paramétrica de formade onda incluindo uma seqüência de parâmetros de forma de ondaintermediária dotada de uma resolução de tempo intermediária menorque a alta resolução de tempo dos valores de amostragem e maiorque uma baixa resolução de tempo definida por uma taxa derepetição de frame, o método compreendendo: obter umarepresentação de resolução intermediária do sinal base usada paragerar os canais upmixed; gerar uma pluralidade de canais upmixedtendo uma resolução de tempo maior que a resolução intermediária;obter uma representação paramétrica de forma de onda de referênciada representação de resolução intermediária do sinal base; econformar um canal upmixed selecionado usando a representaçãoparamétrica de forma de onda de referência e os parâmetrosintermediários de forma de onda do canal original selecionado quecorrespondem ao canal upmixed selecionado.

25. Método para a geração de uma representaçãoparamétrica de forma de onda de um canal de um sinal multicanaistendo um frame, o frame compreendendo valores de amostragem tendoum período de amostragem, o método caracterizado pelo fato de quecompreende: obter uma representação de baixa resolução do canalusando os valores de amostragem de um frame, a representação debaixa resolução tendo valores de baixa resolução tendo associadoum período de baixa resolução maior que o período de amostragem;obter uma representação de baixa resolução de referência de umsinal base obtido a partir do sinal multicanais, o número decanais do sinal base sendo menor que o número de canais do sinalmulticanais; e calcular a representação paramétrica de forma deonda que representa a forma de onda da representação de baixaresolução usando a representação de baixa resolução de referênciae a representação de baixa resolução do canal, caracterizado pelofato de que a representação paramétrica de forma de onda tem umaresolução de tempo menor que a resolução de tempo dos valores deamostragem e maior que a resolução de tempo definida pela taxa derepetição de frame.

26. Representação de um sinal de áudiomulticanais com base em um sinal base obtido do sinal de áudiomulticanais tendo um ou mais canais, o número de canais do sinalbase sendo menor que o número de canais do sinal multicanais, osinal base tendo um frame, o frame caracterizado pelo fato de quecompreende valores de amostragem tendo uma alta resolução, e combase em uma representação paramétrica de forma de onda querepresenta a forma de onda de uma representação de resoluçãointermediária de um canal selecionado do sinal multicanais, arepresentação paramétrica de forma de onda incluindo uma seqüênciade parâmetros de forma de onda intermediária tendo uma resoluçãode tempo menor que a alta resolução de tempo dos valores deamostragem e maior que uma baixa resolução de tempo definida poruma taxa de repetição de frame.

27. Meio de armazenagem com leitura porcomputador, caracterizado pelo fato de que tem armazenado umarepresentação de um sinal de áudio multicanais com base em umsinal base obtido do sinal de áudio multicanais tendo um ou maiscanais, o número de canais do sinal base sendo menor que o númerode canais do sinal multicanais, o sinal base tendo um frame, oframe compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma deonda que representa a forma de onda de uma representação deresolução intermediária de um canal selecionado do sinalmulticanais, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo menor que a altaresolução de tempo dos valores de amostragem e maior que uma baixaresolução de tempo definida por uma taxa de repetição de frame.

28. Receptor ou reprodutor de áudio tendo umdecodificador para a geração de um sinal de saida multicanais combase em um sinal base obtido de um sinal multicanais originaltendo um ou mais canais, caracterizado pelo fato de que o númerode canais do sinal base é menor que o número de canais do sinalmulticanais original, o sinal base tendo um frame, o framecompreendendo valores de amostragem tendo uma alta resolução, ecom base em uma representação paramétrica de forma de ondarepresentando a forma de onda de uma representação de resoluçãointermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, compreendendo: um upmixer para a geração de uma pluralidadede canais upmixed tendo uma resolução de tempo maior que aresolução intermediária e para a obtenção de uma representação deresolução intermediária do sinal base usado para gerar os canaisupmixed; e um shaper para a obtenção de uma representaçãoparamétrica de forma de onda de referência da representação deresolução intermediária do sinal base e para conformar um canalupmixed selecionado usando a representação paramétrica de forma deonda de referência e os parâmetros intermediários de forma de ondado canal original selecionado que correspondem ao canal upmixedselecionado.

29. Transmissor ou gravador de áudio tendo umcodificador para a geração de uma representação paramétrica deforma de onda de um canal de um sinal multicanais tendo um frame,o frame compreendendo valores de amostragem tendo um período deamostragem, o codificador compreendendo: um redutor da resoluçãode tempo para obter uma representação de baixa resolução do canalusando os valores de amostragem de um frame, a representação debaixa resolução tendo valores de baixa resolução tendo associadosum período de baixa resolução maior que o período de amostragem epara a obtenção de uma representação de baixa resolução de umsinal base de referência obtida a partir do sinal multicanais, onúmero de canais do sinal base sendo menor que o número de canaisdo sinal multicanais; e um calculador paramétrico de forma de ondapara o cálculo da representação paramétrica de forma de onda querepresenta a forma de onda da representação de baixa resolução,caracterizado pelo fato de que o calculador paramétrico de formade onda está adaptado para gerar uma seqüência de parâmetros deforma de onda tendo a resolução de tempo mais baixa do que aresolução de tempo dos valores de amostragem e mais alta do que aresolução de tempo definida pela taxa de repetição de frame,caracterizado pelo fato de que o calculador paramétrico de formade onda opera para calcular os parâmetros de forma de onda usandoa representação de baixa resolução de referência e a representaçãode baixa resolução do canal.

30. Método para a recepção ou de reprodução deáudio, o método caracterizado pelo fato de que tem um método paraa geração de um sinal de saída multicanais com base em um sinalbase obtido de um sinal multicanais original tendo um ou maiscanais, o número de canais do sinal base sendo menor que o númerode canais do sinal multicanais original, o sinal base tendo umframe, o frame compreendendo valores de amostragem tendo uma altaresolução, e com base em uma representação paramétrica de forma de onda que representa a forma de onda de uma representação deresolução intermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, o método compreendendo: obter uma representação deresolução intermediária do sinal base usada para gerar os canaisupmixed; a geração de uma pluralidade de canais upmixed tendo uma resolução de tempo maior que a resolução intermediária; obter umarepresentação paramétrica de forma de onda de referência darepresentação de resolução intermediária do sinal base; econformar um canal upmixed selecionado usando os parâmetrosintermediários de forma de onda do canal original selecionado que correspondem ao canal upmixed selecionado.

31. Método para a transmissão ou a gravação deáudio, o método tendo um método para a geração de umarepresentação paramétrica de forma de onda de um canal de um sinalmulticanais tendo um frame, o frame compreendendo valores de amostragem tendo um período de amostragem, o método compreendendo:obter uma representação de baixa resolução do canal usando osvalores de amostragem de um frame, a representação de baixaresolução tendo valores de baixa resolução tendo associado umperíodo de baixa resolução maior que o período de amostragem;obter uma representação de baixa resolução de referência de umsinal base obtido do sinal multicanais, o número de canais dosinal base sendo menor que o número de canais do sinalmulticanais; e calcular a representação paramétrica de forma deonda que representa a forma de onda da representação de baixaresolução usando a representação de baixa resolução de referênciae a representação de baixa resolução do canal, caracterizado pelofato de que a representação paramétrica de forma de onda tem umaresolução de tempo menor que a resolução de tempo dos valores deamostragem e maior que a resolução de tempo definida pela taxa derepetição de frame.

32. Sistema de transmissão tendo um transmissor eum receptor, o transmissor tendo um codificador para a geração deuma representação paramétrica de forma de onda de um canal de umsinal multicanais tendo um frame, o frame compreendendo valores deamostragem tendo um período de amostragem, o codificadorcompreendendo: um redutor da resolução de tempo para obter umarepresentação de baixa resolução do canal usando os valores deamostragem de um frame, a representação de baixa resolução tendovalores de baixa resolução tendo associados um período de baixaresolução maior que o período de amostragem e para obter umarepresentação de baixa resolução de referência de um sinal baseobtido do sinal multicanais, o número de canais do sinal basesendo menor que o número de canais do sinal multicanais; e umcalculador paramétrico de forma de onda para o cálculo darepresentação paramétrica de forma de onda que representa a formade onda da representação de baixa resolução, caracterizado pelofato de que o calculador paramétrico de forma de onda estáadaptado para gerar uma seqüência de parâmetros de forma de ondatendo uma resolução de tempo menor que a resolução de tempo dosvalores de amostragem e maior que a resolução de tempo definidapor uma taxa de repetição de frame, caracterizado pelo fato de queo calculador paramétrico de forma de onda opera para calcular osparâmetros de forma de onda usando a representação de baixaresolução de referência e a representação de baixa resolução docanal; e o receptor tendo um decodificador para gerar um sinal desaida multicanais com base em um sinal base obtido de um sinalmulticanais original tendo um ou mais canais, o número de canaisdo sinal base sendo menor que o número de canais do sinalmulticanais original, o sinal base tendo um frame, o framecompreendendo valores de amostragem tendo uma alta resolução, ecom base em uma representação paramétrica de forma de ondarepresentando a forma de onda de uma representação de resoluçãointermediária de um canal original selecionado do sinalmulticanais original, a representação paramétrica de forma de ondaincluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, compreendendo: um upmixer para a geração de uma pluralidadede canais upmixed tendo uma resolução de tempo maior que aresolução intermediária e para obter uma representação deresolução intermediária do sinal base usado para gerar os canaisupmixed; e um shaper para obter uma representação paramétrica deforma de onda de referência da representação de resoluçãointermediária do sinal base e para conformar um canal upmixedselecionado usando a representação paramétrica de forma de onda dereferência e os parâmetros intermediários de forma de onda docanal original selecionado que correspondem ao canal upmixedselecionado.

33. Método de transmissão e recepção, o método detransmissão tendo um método para a geração de uma representaçãoparamétrica de forma de onda de um canal de um sinal multicanaistendo um frame, o frame compreendendo valores de amostragem tendoum período de amostragem, o método compreendendo: obter umarepresentação de baixa resolução do canal usando os valores deamostragem de um frame, a representação de baixa resolução tendovalores de baixa resolução tendo associado um período de baixaresolução maior que o período de amostragem; obter umarepresentação de baixa resolução de referência de um sinal baseobtido do sinal multicanais, o número de canais do sinal basesendo menor que o número de canais do sinal multicanais; ecalcular a representação paramétrica de forma de ondarepresentando a forma de onda da representação de baixa resoluçãousando a representação de baixa resolução de referência e arepresentação de baixa resolução do canal, caracterizado pelo fatode que a representação paramétrica de forma de onda tem umaresolução de tempo menor do que a resolução de tempo dos valoresde amostragem e maior do que a resolução de tempo definida pelataxa de repetição de frame; e método para a recepção tendo ummétodo para a geração de um sinal de saída multicanais com base emum sinal base obtido de um sinal multicanais original tendo um oumais canais, o número de canais do sinal base sendo menor que onúmero de canais do sinal multicanais original, o sinal base tendoum frame, o frame compreendendo valores de amostragem tendo umaalta resolução, e com base em uma representação paramétrica deforma de onda representando uma forma de onda de uma representaçãode resolução intermediária de um canal original selecionado dosinal multicanais original, a representação paramétrica de formade onda incluindo uma seqüência de parâmetros de forma de ondaintermediária tendo uma resolução de tempo intermediária menor quea alta resolução de tempo dos valores de amostragem e maior queuma baixa resolução de tempo definida por uma taxa de repetição deframe, o método compreendendo: obter uma representação deresolução intermediária do sinal base usado para gerar os canaisupmixed; a geração de uma pluralidade de canais upmixed tendo umaresolução de tempo maior que a resolução intermediária; obter arepresentação paramétrica de forma de onda de referência darepresentação de resolução intermediária do sinal base; econformar o canal upmixed selecionado usando a representaçãoparamétrica de forma de onda de referência e os parâmetrosintermediários de forma de onda do canal original selecionado quecorrespondem ao canal upmixed selecionado.

34. Computador tendo um código de programas para,quando operar em um computador, caracterizado pelo fato de querealiza quaisquer das reivindicações 24, 25, 30, 31 ou 33 dométodo.