"CODIFICAÇÃO DE ÁUDIO RESIDUAL ADAPTATIVA"
Campo da Invenção
A presente invenção se refere à codificação e de-codificação de sinais de áudio e, em especial, à codificação efi-ciente de alta qualidade de um par de canais de áudio.
Histórico da técnica anterior da invenção
Recentemente, codificação efetiva de alta quali-dade de sinais de áudio tem se tornado cada vez mais importante,visto que distribuição digital de conteúdo de áudio e vídeo com-primido, por exemplo, por satélite ou por transmissão de áudio ouvídeo digital terrestre, é amplamente usada. A técnica MP3 bem co-nhecida, por exemplo, permite a transmissão conveniente de títulosde áudio pela internet ou por outros canais de transmissão quepossuem larguras de bandas limitadas.
Em adição à MP3, vários outros esquemas de codi-ficação de áudio objetivam maximizar a qualidade de áudio para umataxa de compressão ou taxa de bit provida. Foi demonstrado no "Ef-ficient and scalable Parametric Stereo Coding for Low Bit rate Au-dio Coding Applications", PCT/SE02/01372, que é possível recriarum sinal estéreo que se assemelhe bastante com a imagem estéreooriginal subjacente, a partir de um sinal mono quando é usada, a-dicionalmente, uma representação muito compacta do sinal estéreo,comumente referida como "sinais de som espaciais". Este princípiorevelado divide o sinal de entrada estéreo em bandas de freqüênciae estima parâmetros, os quais são denominados diferença de inten-sidade entre canais (IID) e coerência entre canais (ICC), para ca-da uma das bandas de freqüência separadamente. O primeiro parâme-tro descreve uma medição da distribuição de energia entre os doiscanais na banda de freqüência específica e o segundo parâmetrodescreve uma estimativa da correlação entre os dois canais. Umadescrição mais completa de parâmetros espaciais pode ser encontra-da no "High-quality parametric spatial áudio coding at Iow bit ra-tes" J. Breebaart, S. van de Par, A. Kohlrausch e E. Schuijers,Proc. 116th AES Convention, Berlin (Alemanha), 8 a 11 de Maio de2004. Com base nestes sinais de som espaciais, o sinal de entradaestéreo é adaptativamente combinado em um sinal mono. Ambos os si-nais de som espaciais e o sinal mono são codificados e a represen-tação codificada é multiplexada em uma corrente de bits, que étransmitida para o decodificador. No lado do decodificador a ima-gem estéreo é recriada a partir do sinal mono pela distribuição daenergia do sinal mono entre os dois canais de saída, de acordo comos dados IID, e pela adição de um sinal descorrelacionado, de modoa reter a correlação de canal dos canais estéreos originais, con-forme é descrito pelos parâmetros IIC.
Quando mais larguras de banda de transmissão es-tão disponíveis, uma qualidade de áudio mais elevada por ser obti-da pela substituição do sinal mono descorrelacionado no decodifi-cador por um sinal residual transmitido. Isto é, é requerida atransmissão de um sinal residual adicional para um decodificador.Este é, também, o caso da codificação do lado central (MS) , onde asoma e a diferença dos canais de um sinal estéreo são codificadasem vez dos canais esquerdo e direito diretamente. Uma descrição datécnica MS pode ser encontrada no "Sum-difference stereo transformcoding", Proc. Int. Conf. Acoust. Speech Signal Process. (ICASSP),São Francisco, EUA, 1992, pãgs. II 569 - 572. Codificação MS é ba-seada na descoberta de que o canal esquerdo e o canal direito deum sinal de estéreo são, provavelmente, bastante similares. Por-tanto, uma diferença do canal esquerdo e do canal direito resulta-rá em um sinal tendo uma intensidade comparativamente baixa a mai-or parte do tempo, isto é, a amplitude do sinal de diferença serábem pequena. Dessa maneira, é possível economizar uma quantidadesignificativa de taxa de bits ao codificar o sinal de diferença,visto que os parâmetros que descrevem o sinal de diferença podemser grosseiramente quantizados. 0 sinal de soma evidentemente ne-cessitará aproximadamente da mesma largura de banda que um canalesquerdo ou direito único, quando codificado. Portanto, é possíveleconomizar uma quantidade significativa de largura de banda no to-tal ao usar o esquema de codificação MS.
Quando existir uma grandediferença de intensidade entre o canal esquerdo e o canal direito,a técnica MS terá suas limitações, visto que, então, também o ca-nal de diferença conterá uma quantidade substancial de energia e,portanto, necessitará de uma largura de banda mais elevada. Podeser observado, entretanto, que em implementações de estéreo codi-ficado regulares, codificação MS não será aplicada neste caso, de-vido aos altos custos da codificação. Nestes casos, é vantajosoter a possibilidade de mudar de codificação estéreo normal paracodificação MS, dependendo da intensidade carregada pelos canaisde áudio originais que devem ser codificados.
Substituindo o conceito estático de construção dasoma e da diferença de dois canais estéreos que devem ser codifi-cados por meio da invenção de uma matriz de rotação do decodifica-dor, com elementos de matriz que descrevem a composição de doiscanais intermediários que são uma combinação de dois canais esté-reos, é possível superar o problema acima. Os elementos de matrizdependem de parâmetros de estéreo paramétrico que são extraídos docanal esquerdo e direito do sinal estéreo. Codificação residualadaptativa deve ser capaz de adaptar dinamicamente a regra de com-binação para a geração de canais intermediários às propriedades dosinal presente, atingindo um ganho de desempenho significativo emrelação à codificação MS.
Ao escolher uma dependência adequada dos elemen-tos de matriz da referida matriz de rotação dos parâmetros de es-téreo paramétrico, é possível conseguir que a energia dentro de umcanal de diferença permaneça tão pequena quanto possível, conformedemonstrado anteriormente no pedido de patente Européia não reve-lada, EP 04103168.3. Conforme é introduzida uma matriz de rotaçãopara transformar (dovmmix ou upmix) o sinal estéreo em sinais m es (os sinais intermediários, isto é, o sinal de downmix m e o si-nal residual s), é crucial para a operação do método que as matri-zes de rotação (a matriz de rotação do decodificador e a matriz derotação do codificador) estejam unidas. Isto significa que os ele-mentos de matriz dentro das matrizes não divergem infinitamentedentro da faixa inteira possível dos parâmetros de codificação deestéreo paramétrico.
Em outras palavras, ambas as matrizes de ro-tação devem ser unidas no sentido de que o número de condição dematriz seja suficientemente pequeno para permitir inversão de ma-triz isenta de problema para a faixa inteira de parâmetros de co-dificação de estéreo paramétrico, o que não ocorre para implemen-tação de acordo com a técnica anterior.
Sumário da Invenção
0 objetivo da presente invenção é prover um con-ceito para codificação de áudio de alta qualidade que resulte emuma representação grandemente comprimida de um sinal de áudio, e-vitando simultaneamente artefatos introduzidos pela codificação oudecodificação de forma mais eficiente.
De acordo com um primeiro aspecto da presente invenção, este objetivo é atingido por um codificador de áudio paracodificar um sinal de áudio tendo pelo menos dois canais, compre-endendo: um extrator de parâmetro para prover um parâmetro espaci-al do sinal de áudio, onde o parâmetro espacial descreve uma in-ter-relação dos pelo menos dois canais; um limitador para limitaro parâmetro espacial usando uma regra de limitação para prover umparâmetro espacial limitado, onde a regra de limitação depende deuma inter-relação dos pelo menos dois canais; e um dispositivo dedownmix para prover um sinal de dovmmix e um sinal residual do si-nal de áudio usando uma regra de downmix que depende do parâmetroespacial limitado.
De acordo com um segundo aspecto da presente in-venção, este objetivo é atingido por um decodificador de áudio pa-ra decodificar um sinal de áudio decodificado representando um si-nal de áudio original que tem pelo menos dois canais, o sinal deáudio codificado tendo um sinal de downmix, um sinal residual e umparâmetro espacial que descreve uma inter-relação dos pelo menosdois canais, compreendendo: um limitador para limitar o parâmetroespacial de modo a prover um parâmetro espacial limitado usandouma regra de limitação, onde a regra de limitação depende de umainter-relação dos pelo menos dois canais; e um dispositivo de up-mix para prover uma reconstrução do sinal de áudio original do si-nal de downmix e do sinal residual usando uma regra de upmix quedepende do parâmetro espacial limitado.De acordo com um terceiro aspecto da presente in-venção, este objetivo é atingido por um método para codificar umsinal de áudio que tem pelo menos dois canais, o método compreen-dendo: prover um parâmetro espacial do sinal de áudio, onde o pa-râmetro espacial descreve uma inter-relação dos pelo menos doiscanais; limitar o parâmetro espacial usando uma regra de limitaçãopara prover um parâmetro espacial limitado, onde a regra de limi-tação depende de uma inter-relação dos pelo menos dois canais; eprover um sinal de downmix e um sinal residual a partir de um si-nal de áudio usando uma regra de downmix que depende do parâmetroespacial limitado.
De acordo com um quarto aspecto da presente in-venção, este objetivo é atingido por um método para decodificar umsinal de áudio codificado que representa um sinal de áudio origi-nal tendo pelo menos dois canais, o sinal de áudio codificado ten-do um sinal de downmix, um sinal residual e um parâmetro espacialque descreve uma inter-relação dos pelo menos dois canais, o méto-do compreendendo: limitar o parâmetro espacial para prover um pa-râmetro espacial limitado usando uma regra de limitação, onde aregra de limitação depende de uma inter-relação dos pelo menosdois canais; e provendo uma reconstrução do sinal de áudio origi-nal a partir do sinal de downmix e do sinal residual usando umaregra de upmix que depende do parâmetro espacial limitado.
De acordo com um quinto aspecto da presente invenção, este objetivo é atingido por um transmissor ou gravador deáudio que tem um codificador de áudio para codificar um sinal deáudio que tenha pelo menos dois canais, compreendendo: um extratorde parâmetro para prover um parâmetro espacial do sinal de áudio,onde o parâmetro espacial descreve uma inter-relação dos pelo me-nos dois canais; um limitador para limitar o parâmetro espacialusando uma regra de limitação para prover um parâmetro espacial,onde a regra de limitação depende de uma inter-relação dos pelomenos dois canais; e um dispositivo de downmix para prover um si-nal de downmix e um sinal residual do sinal de áudio usando umaregra de downmix que depende do parâmetro espacial limitado.
De acordo com um sexto aspecto da presente invenção, este objetivo é atingido por um receptor ou reprodutor de áu-dio, que tem um decodificador de áudio para decodificar um sinalde áudio codificado representando um sinal de áudio original quetem pelo menos dois canais, o sinal de áudio codificado tendo umsinal de downmix, um sinal residual e um parâmetro espacial quedescreve uma inter-relação dos pelo menos dois canais, compreen-dendo: um limitador para limitar o parâmetro espacial para proverum parâmetro espacial limitado usando uma regra de limitação, ondea regra de limitação depende de uma inter-relação dos pelo menosdois canais; e um dispositivo de upmix para prover uma reconstru-ção do sinal de áudio original a partir do sinal de downmix e dosinal residual usando uma regra de upmix que depende do parâmetroespacial limitado.
De acordo com um sétimo aspecto da presente in-venção, este objetivo é atingido por um método de transmissão ougravação de áudio, o método tendo um método para gerar um sinalcodificado, o método compreendendo um método para codificar um si-nal de áudio que tem pelo menos dois canais, o método compreenden-do: prover um parâmetro espacial a partir do sinal de áudio, ondeo parâmetro espacial descreve uma inter-relação dos pelo menosdois canais; limitar o parâmetro espacial usando uma regra de li-mitação para prover um parâmetro espacial limitado, onde a regrade limitação depende de uma inter-relação dos pelo menos dois ca-nais; provendo um sinal de downmix e um sinal residual a partir dosinal de áudio usando uma regra de downmix que depende do parâme-tro espacial limitado.
De acordo com um oitavo aspecto da presente in-venção, este objetivo é atingido por um método de recepção ou re-produção de áudio, o método tendo um método para decodificar umsinal de áudio codificado, o método compreendendo um método paradecodificar um sinal de áudio codificado que representa um sinalde áudio original tendo pelo menos dois canais, o sinal de áudiocodificado tendo um sinal de downmix, um sinal residual e um parâ-metro espacial que descreve uma inter-relação dos pelo menos doiscanais, o método compreendendo: limitar o parâmetro espacial demodo a prover um parâmetro espacial limitado usando uma regra delimitação, onde a regra de limitação depende de uma inter-relaçãodos pelo menos dois canais; e provendo uma reconstrução do sinalde áudio original a partir do sinal de downmix e do sinal residualusando uma regra de upmix que depende do parâmetro espacial limitado.
De acordo com um nono aspecto da presente inven-ção, este objetivo é atingido por um sistema de transmissão quetem um transmissor e um receptor, o transmissor tendo um codifica-dor de áudio para codificar um sinal de áudio que tem pelo menosdois canais, compreendendo: um extrator de parâmetro para proverum parâmetro espacial a partir do sinal de áudio, onde o parâmetroespacial descreve uma inter-relação dos pelo menos dois canais; umlimitador para limitar o parâmetro espacial usando uma regra delimitação para prover um parâmetro espacial limitado, onde a regrade limitação depende de uma inter-relação dos pelo menos dois ca-nais; e um dispositivo de downmix para prover um sinal de downmixe um sinal residual a partir do sinal de áudio, usando uma regrade downmix que depende do parâmetro espacial limitado; e o recep-tor tendo um decodificador de áudio para decodificar um sinal deáudio codificado que representa um sinal de áudio original tendopelo menos dois canais, o sinal de áudio codificado tendo um sinalde downmix, um sinal residual e um parâmetro espacial que descreveuma inter-relação dos pelo menos dois canais, compreendendo: umlimitador para limitar o parâmetro espacial para prover um parâme-tro espacial limitado usando uma regra de limitação, onde a regrade limitação depende de uma inter-relação dos pelo menos dois ca-nais; e um dispositivo de upmix para prover uma reconstrução dosinal de áudio original a partir do sinal de downmix e do sinalresidual, usando uma regra de upmix que depende do parâmetro espacial limitado.
De acordo com um décimo aspecto da presente in-venção, este objetivo é atingido por um método de transmissão erecepção, o método incluindo um método de transmissão que tem ummétodo para gerar um sinal codificado a partir de um sinal de áu-dio tendo pelo menos dois canais, o método compreendendo: proverum parâmetro espacial do sinal de áudio, onde o parâmetro espacialdescreve uma inter-relação dos pelo menos dois canais; limitar oparâmetro espacial usando uma regra de limitação para prover umparâmetro espacial limitado, onde a regra de limitação depende deuma inter-relação dos pelo menos dois canais; e prover um sinal dedownmix e um sinal residual a partir do sinal de áudio usando umaregra de downmix que depende do parâmetro espacial limitado; e ummétodo de recepção que tem um método para decodificar um sinal deáudio codificado, o método compreendendo: limitar o parâmetro es-pacial para prover um parâmetro espacial limitado usando uma regrade limitação, onde a regra de limitação depende de uma inter-relação dos pelo menos dois canais; e prover uma reconstrução dosinal de áudio original a partir do sinal de downmix e do sinalresidual usando uma regra de upmix que depende do parâmetro espa-cial limitado.
De acordo com um décimo primeiro aspecto da pre-sente invenção, este objetivo é atingido por um sinal de áudio co-dificado que é uma representação de um sinal de áudio tendo pelomenos dois canais, o sinal de áudio codificado tendo um parâmetroespacial que descreve uma inter-relação dos pelo menos dois ca-nais, um sinal de downmix e um sinal residual, onde o sinal dedownmix e o sinal residual são derivados do sinal de áudio usandouma regra de downmix que depende de um parâmetro espacial limitadoprovido usando uma regra de limitação que depende de uma inter-relação dos pelo menos dois canais.
A presente invenção é baseada na descoberta deque um sinal de áudio tendo pelo menos dois canais pode sofrerdownmix eficientemente em um sinal de downmix e um sinal residual,quando a regra de downmix usada depende de um parâmetro espacialque é derivado do sinal de áudio e que é pós-processado por um li-mitador para aplicar certo limite ao parâmetro espacial derivadocom o objetivo de evitar instabilidade durante os processos de up-mix ou downmix. Tendo uma regra de downmix que depende dinamica-mente de parâmetros que descrevem uma inter-relação dos canais deáudio, é possível assegurar que a energia dentro do sinal residualdé downmix seja tão pequena quanto possível, o que é vantajoso emrelação à eficiência de codificação. Através de pós-processamentodo parâmetro espacial com o limitador antes do uso deste no down-mix, é possível evitar instabilidades no downmix ou upmix, o que,por outro lado, resultaria em um distúrbio na percepção espacialdo sinal de áudio codificado ou decodificado.
Em uma configuração da presente invenção, um si-nal estéreo original que tem um canal esquerdo e um canal direito,é suprido para um dispositivo de downmix e um extrator de parâme-tro. 0 extrator de parâmetro deriva os parâmetros espaciais comu-mente conhecidos ICC (Correlação Entre Canais) e IDD (Diferença deIntensidade Entre Canais). 0 dispositivo de downmix ê capaz de fa-zer o downmix dos canais esquerdo e direito em um sinal de downmixe um sinal residual, onde a regra de downmix é tal que o sinal re-sidual resultante carrega a energia mínima atingível. Portanto,compressão subseqüente do sinal residual resultante por um codifi-cador de áudio padrão resultará em um código extremamente compac-to. Isto pode ser atingido pela formulação da regra de downmix emdependência dos parâmetros espaciais ICC e IID, visto que ambos osparâmetros são descrições de proporções de intensidade ou amplitu-de dos canais estéreos originais. Um problema geral durante codi-ficação é a preservação de energia. É necessário que ambos, o si-nal original e o sinal codificado, contenham a mesma energia, vis-to que uma violação da conservação de energia resultaria em umapercepção de altura de som diferente dos sinais codificados, oumesmo em saltos incontroláveis na altura do sinal codificado. Por-tanto, no esquema de codificação acima, o sinal de downmix e o si-nal residual devem ser escalados por um fator de escalonamento quegaranta a regra de conservação de energia.
Se o sinal de áudio original que deve ser codifi-cado tiver propriedades especiais, este fator de escalonamento po-de divergir, especialmente quando o canal original esquerdo e di-reito forem perfeitamente anti-correlacionados, isto é, quando e-Ies tiverem as mesmas amplitudes e uma mudança de fase de precisa-mente 180°. Esta instabilidade é evitada dentro do conceito inven-tivo pela aplicação de uma função limitativa para o parâmetro ICC,onde a função de limitação depende de um fator de escalonamentomáximo aceitável e do parâmetro IID. Para evitar uma possível di-vergência, a regra que descreve o downmix é alterada diretamente,enquanto em implementações da técnica anterior o fator de escalo-namento é simplesmente limitado pela definição de um limite e ofator de escalonamento é substituído pelo valor de limite quando ofator exceder o limite.
É uma grande vantagem do conceito inventivo, queambos os sinais dentro do canal de downmix e o canal residual se-jam alterados através da alteração dos parâmetros que estão subja-centes ao processo de downmix. Apenas o sinal no canal de downmixseria influenciado ao aplicar um limite de acordo com a técnicaanterior, assim uma preservação melhor da inter-relação entre ocanal original esquerdo e direito pode ser atingida quando o con-ceito inventivo é aplicado.
Uma outra vantagem do conceito descrito acima éque os parâmetros espaciais usados são geralmente derivados duran-te um processo de codificação. Portanto, é possível implementar alógica de limitação necessária sem ter que introduzir novos parâ-metros.
Em uma configuração adicional da presente inven-ção, um limitador é aplicado no lado do decodificador, tendo amesma regra de limitação que um limitador no lado do codificador.
Isto significa que no lado do decodif icador, o downmix e o sinalresidual, assim como os parâmetros espaciais IID e ICC7 são rece-bidos, e os parâmetros espaciais recebidos são limitados usando amesma regra de limitação usada durante o processo de codificação.0 upmix é, então, dependente dos parâmetros espaciais limitados,garantindo a não ocorrência de uma divergência no processo de up-mix. A vantagem de ter as mesmas regras de limitação na codifica-ção e na decodificação é óbvia, visto que é necessário desenvolvercircuitos de hardware ou uma implementação de um algoritmo desoftware apenas uma única vez. Hardware ou software que têm tantofuncionalidade de codificação quando de decodificação, podem serdesenvolvidos com custos menores, visto que é possível reutilizaro mesmo hardware ou software para a funcionalidade de limitação.
Em uma configuração adicional da presente inven-ção, os sinais de downmix e os parâmetros espaciais são comprimi-dos após sua geração, resultando em duas correntes de bits de áu-dio para os sinais de downmix e uma corrente de bits de parâmetroque retém os parâmetros espaciais comprimidos. Isto reduz o tama-nho da representação codificada a ser transmitida, economizando,adicionalmente, largura de banda, onde a codificação pode ser comperda ou sem perda, visto que a própria regra de codificação é in-dependente do conceito inventivo. Um decodificador inventivo deacordo com o conceito inventivo, então, compreende um estágio dedescompressão, onde as representações comprimidas são descomprimi-das nos parâmetros espaciais, no canal de downmix e no canal resi-dual antes de efetuar upmix.
Em uma outra configuração da presente invenção,as correntes de bits de áudio já comprimidas e a corrente de bitsde parâmetro são combinadas em uma corrente de bits combinada, porexemplo, por muitiplexação, permitindo uma armazenagem convenientede um arquivo gerado em um meio de armazenagem. Isto também permi-te aplicações de streaming, por exemplo, streaming do conteúdo co-dificado através da internet, visto que toda a informação relevan-te está compreendida em um único arquivo ou corrente de bits, per-mitindo um manuseio mais conveniente do que em um caso onde trêscorrentes de bit separadas devem ser transferidas. 0 decodificadorinventivo correspondente, então, tem um estágio de descombinação,que poderia, por exemplo, ser um desmultiplexador para descombinara corrente de bits em três correntes de bits separadas, isto é, asduas correntes de bits de áudio e a corrente de bits de parâmetro.
Deve ser observado aqui que o conceito inventivoprovê uma compatibilidade retroativa perfeita à codificação resi-dual da técnica anterior onde os parâmetros espaciais não estãolimitados, e mesmo à codificação estéreo paramétrica da técnicaanterior onde um decodif icador não usa o sinal residual. Isto é,obviamente, uma vantagem importante, visto que dados de áudio co-dificados recentemente podem ser reproduzidos com a qualidade má-xima possível pelos decodificadores inventivos, enquanto eles po-dem também ser reproduzidos por decodificadores já existentes deacordo com a técnica anterior.
Em uma configuração adicional da presente inven-ção, três codificadores inventivos são combinados para codificarum sinal de áudio de canais múltiplos compreendendo seis canaisindividuais, onde cada um dos três codificadores inventivos codi-fica um par de canais, derivando parâmetros espaciais, um downmixe um sinal residual para cada um dos pares de canal. 0 conceitoinventivo pode, portanto, ser usado também para codificar sinaisde áudio de canais múltiplos onde a eficiência da codificação e acompactação da representação resultante têm uma prioridade aindamaior, visto que a quantidade total de dados a ser codificada etransmitida é muito maior que para um sinal estéreo. Em princípio,um número arbitrário de codificadores de áudio inventivos pode sercombinado para codificar simultaneamente um sinal de áudio de ca-nais múltiplos tendo basicamente qualquer número de canais de áu-dios únicos. Em uma configuração adicional do codificador de áudiode canais múltiplos, os sinais de downmix individuais e os sinaisresiduais, assim como as correntes de bit de parâmetro individualsão combinadas por um dispositivo de downmix de 3 para 2 para re-ceber um sinal esquerdo comum, um sinal direito comum, e um sinalresidual comum e uma corrente de bits de parâmetro combinada, re-duzindo adicionalmente a quantidade de largura de banda requerida.Os decodificadores correspondentes compreendem então, de forma di-reta, um estágio de dispositivo de upmix de 2 para 3.
Em uma outra configuração da presente invenção,um transmissor ou gravador de áudio compreende um codificador in-ventivo, permitindo gravação ou transmissão de áudio compacta, dealta qualidade, onde o tamanho do conteúdo de áudio transmitido ouarmazenado pode ser significativamente reduzido. Este conteúdo deáudio pode ser armazenado em um meio de armazenagem de uma capaci-dade dada ou largura de banda menor é usada durante a transmissãodo sinal de áudio.
Em uma outra configuração, um receptor ou repro-dutor de áudio tem um decodificador inventivo, que permite aplica-ções de streaming em ambientes de largura de banda limitados taiscomo telefones móveis ou que permite a construção de dispositivosde reprodução portáteis pequenos, usando meios de armazenagem decapacidade limitada.
Uma combinação de um transmissor e receptor in-ventivos resulta em um sistema de transmissão que permite transmi-tir, de forma conveniente, conteúdo de áudio através de interfacesde transmissão com fio ou sem fio, tais como LAM sem fio, Bluetoo-th, LAN com fio, tecnologias de linha de energia, transmissão derádio, ou qualquer outro tipo de transmissão de dados.
Breve descrição dos desenhos
Configurações preferidas da presente invenção sãodoravante descritas por referência aos desenhos em anexo, onde:
A Fig. 1 mostra um diagrama de bloco de um codi-ficador inventivo;
A Fig. 2 mostra um diagrama de bloco do princípiode codificação inventivo;
A Fig. 3 mostra uma outra configuração de um co-dificador inventivo;
A Fig. 4 mostra a compatibilidade retroativa doesquema de codificação inventivo em relação aos decodificadores datécnica anterior;
A Fig. 5 mostra um codificador de áudio de canaismúltiplos inventivo;17A Fig. 6 mostra um diagrama de bloco de um deco-dificador de áudio inventivo;
A Fig. 7 mostra um diagrama de bloco do conceitoinventivo de decodificação;
A Fig. 8 mostra uma configuração adicional de umdecodificador inventivo;
A Fig. 9 mostra uma configuração de um decodifi-cador de áudio de canais múltiplos inventivo;
A Fig. 10 mostra uma configuração alternativa deum codificador de áudio inventivo;
A Fig. 11 mostra uma configuração alternativa deum decodificador de áudio inventivo;
A Fig. 12 mostra um transmissor/gravador de áudioinventivo;
A Fig. 13 mostra um receptor/reprodutor de áudioinventivo;
A Fig. 14 mostra um sistema de transmissão inventivo.
Descrição detalhada de configurações preferidas
A Figura 1 mostra um diagrama de bloco de um co-dificador de áudio inventivo 10, compreendendo um dispositivo dedownmix 12, um limitador 14, e um extrator de parâmetro 16.
Um sinal estéreo 18, tendo um canal esquerdo e umcanal direito, é inserido simultaneamente em um dispositivo dedownmix 12 e no extrator de parâmetro 16. 0 extrator de parâmetro16 extrai parâmetros espaciais 19 que descrevem uma inter-relaçãoentre o canal esquerdo e o canal direito do sinal estéreo 18. Es-tes parâmetros são, por um lado, disponibilizados para transmissãoe, por outro lado, inseridos no limitador 14. 0 limitador 14 apli-ca uma regra de limitação aos parâmetros. Os detalhes de uma regrade limitação apropriada devem ser providos nos parágrafos a se-guir.
0 limitador deriva parâmetros espaciais limitadose estes são inseridos no dispositivo de downmix 12, onde o dispo-sitivo de downmix 12 aplica uma regra de downmix ao cànal esquerdoe canal direito do sinal estéreo 18 para prover um sinal de down-mix 20 e um sinal residual 22 a partir do canal esquerdo e canaldireito do sinal estéreo. A regra de downmix ê adicionalmente de-pendente do parâmetro espacial limitado.
Ao escolher uma regra de limitação apropriada pa-ra o limitador, o dispositivo de downmix 12 é suprido apenas comparâmetros limitados que são limitados de uma maneira que a regrade downmix que não cause divergência ou produza qualquer saída queesteja deteriorando uma inter-relação espacial do canal esquerdo edo canal direito devido ao downmix.
Como um resultado, o sinal estéreo 18 é represen-tado pelo sinal de downmix 20, pelo sinal residual 22, e pelos pa-râmetros espaciais 19 após o processo de codificação executado pe-lo codificador de áudio 10.
Para entender como uma regra de downmix e uma re-gra de limitação têm que inter-relacionar para prover um sinal re-sidual resultante 22 contendo energia plausível mínima, enquantolimita simultaneamente um parâmetro espacial, de modo que a regrade downmix não cause quaisquer divergências, o conceito básicosubjacente da presente invenção é elaborado em maiores detalhesnos poucos parágrafos a seguir.Os parâmetros extraídos pelo extrator de parâme-tro 16, tipicamente resulta de um tempo único e intervalo de fre-qüência de amostras de sub-banda de uma análise de banco de filtromodulado complexo de sinais de tempo discretos. Isto significa queo sinal de áudio do canal esquerdo e do canal direito do sinal es-téreo 18 é primeiramente dividido em quadros de tempo de um com-primento dado, e dentro de um quadro de tempo único, o espectro defreqüência é subdividido em uma quantidade de amostras de sub-banda. Para cada sub-banda única, o extrator de parâmetro 16, en-tão, provê um parâmetro espacial por comparação dos canais esquer-do e direito do sinal estéreo dentro da sub-banda de interesse.
Portanto, o canal esquerdo e o canal direito do sinal estéreo 18 eo sinal de downmix m e o sinal residual s da Figura 1 têm que serentendidos como vetores de comprimento discretos e finitos, quedescrevem os sinais subjacentes dentro de um intervalo de tempodiscreto. Conforme mencionado acima, durante um processo de down-mix, preservação de energia deve ser garantida. Para vetores com-plexos discretos x, y, o produto interno complexo e a norma qua-drada (comparável à energia) é definida por
<formula>formula see original document page 20</formula>
Após a convenção normal, um * denota conjugaçãocomplexa. A partir daqui, letras maiúsculas descrevem a soma doquadrado ou energia dos vetores complexos de comprimento finitocorrespondentes, denotados por letras minúsculas.
De acordo com a presente invenção, o canal dedownmix m resultante do downmix adaptativo é a soma pesada da e-nergia do canal original esquerdo e direito, e, dessa maneira, de-finido por
<formula>formula see original document page 21</formula>
onde g é um fator de ganho real e positivo ajus-
tado de modo que a energia do downmix (M) seja igual à soma de e-nergias dos vetores de sinal do canal esquerdo (L) e direito (R)(M = L + R).
Visto que este fator de ganho diverge até o infi-nito quando ler estão fora de fase e têm energia comparável (is-to é, 1 + r = 0 na equação n2 2) , é necessário limitar este fatorpor um fator de ganho máximo g0 que esteja, tipicamente, dentro dointervalo [1,2]. O extrator de parâmetro 16, conforme mostrado naFigura 1, extrai os parâmetros de áudio espaciais IID (Diferençade Intensidade Entre Canais) e ICC (Coerência Entre Canais) quesão representados por
<formula>formula see original document page 21</formula>
Aqui, c denota o parâmetro IID e denota o parâ-metro ICC. O fator de ganho g pode ser expresso dependendo dos pa-râmetros ICC e IID e esta limitação requerida do fator de ganhopode ser escrita como segue:
<formula>formula see original document page 21</formula>
De forma geral, visto que 1 1 , nos temos2^c2+1, de modo que....
Para atingir eficiência máxima de codificação, édesejado que a energia dentro do sinal residual 22 seja mínima. Aderivação a seguir resolve um problema de otimização mais geralcompreendendo um sinal residual adicional t, que, então, se revelasendo supérfluo devido a (9) . Considerando o problema do lado dodecodificador, é necessário determinar ganhos a, b, de modo que ossinais residuais s, t no upmix
<formula>formula see original document page 22</formula>
tenham energia mínima. A solução é provida por
<formula>formula see original document page 22</formula>
onde
<formula>formula see original document page 22</formula>
0 mesmo problema, com a restrição adicional deque os coeficientes a,b são reais, tem a solução provida por tomara parte real de (7) e a inserir em (6). Neste caso, ρ pode ser ex-presso em termos dos parâmetros PS c, p, como segue:
<formula>formula see original document page 22</formula>
Inserindo (6) em (5) e adicionando as duas equa-ções em (5) ocorre que:
<formula>formula see original document page 22</formula>
Ao descrever o processo de upmix na notação dematriz usual, o upmix pode ser representado por uma matriz de ro-tação H, como segue:<formula>formula see original document page 23</formula>
No caso onde g não está limitado por g0 em (4),uma representação diferente dos coeficientes ideais a, b é providapor:
<formula>formula see original document page 23</formula>
A primeira coluna da matriz giradora H é idênticaao rotador de amplitude usado no estéreo paramétrico, que é, porexemplo, provido no WO 03/090206 Al.
O downmix necessita ser compatível com o upmix nosentido em que a reconstrução perfeita seja obtida quando todas asetapas de codificação com perda forem omitidas. Como uma conse-qüência, a matriz de downmix D,
<formula>formula see original document page 23</formula>
deve ser o inverso do rotador de upmix H. Umacomputação elementar resulta
<formula>formula see original document page 23</formula>
onde a primeira fila é consistente com (2).
Existe um problema de estabilidade com os doisrotadores ideais providos por (10) e (13). Conforme (c,p) se apro-xima de (1, -1), o valor de ρ dado por (8) diverge. Portanto é ne-cessário desviar dos rotadores ideais em uma vizinhança deste pon-to do domínio do parâmetro PS. A solução ensinada pela presenteinvenção é modificar os parâmetros PS por um limitador de instabi-lidade tanto no codificador quanto no decodificador.
Em sua forma geral, este limitador alterará osvalores do par (c, p) em uma vizinhança de (1, -1) de modo a atin-gir uma faixa limitada por p. Uma solução especialmente atraente ébaseada na observação de que o denominador de (8) é igual àquelede (4) . A solução inventiva mantém c inalterado e modifica ρ exa-tamente quando o ganho de downmix adaptativo g é limitado por g0em (4). Isto ocorre quando
<formula>formula see original document page 24</formula>
A modificação preferida de ρ executada por um li-mitador de instabilidade 14 é, então:
<formula>formula see original document page 24</formula>
0 valor correspondente de ρ dado pela inserção deρ nõ lugar de ρ em (8) tem a propriedade de
<formula>formula see original document page 24</formula>
Nos parágrafos anteriores, a análise do problemaque conduz à definição do limitador 14 foi detalhada. Embora a a-notação seja baseada em sinais estéreo, é claro que o mesmo métodopode ser aplicado em qualquer par de sinais de áudio, tais comopares de canais selecionados ou gerados por um downmix parcial deum sinal de áudio de canais múltiplos. Particularmente vantajoso éque a mesma regra de limitação pode ser usada para limitar os pa-râmetros dentro da matriz de upmix e downmix.
A Figura 2 descreve o procedimento de codificaçãode áudio inventivo usando um diagrama de bloco, mostrando como acodificação de áudio é executada quando seguindo o conceito inven-tivo. Em uma primeira etapa de extração de parâmetro 30, os parâ-metros ICC e IID são derivados.
Estes parâmetros são, então, enviados como saída23 e transferidos para servir como entrada para a etapa de limita-ção 32, onde uma comparação do parâmetro ICC com um parâmetro ICCmínimo computado ICCrain é efetuada, onde ICCmin é dependente de IID.Em um primeiro caso, onde o parâmetro ICC excede o parâmetro ICCmínimo ICCmin (IID), o parâmetro ICC é diretamente enviado para aetapa de downmix 34.
Se o parâmetro ICC não exceder ICCmin (IID) , umaetapa de mudança adicional 36 é executada, onde o valor do parâme-tro ICC é substituído pelo valor do parâmetro ICC mínimo ICC-min(IID) . Após a etapa de mudança 36, o parâmetro ICC que tem o no-vo valor é, então, transferido para a etapa de downmix 34.
Na etapa de downmix 34, o sinal de downmix 20 e osinal residual 22 são derivados dos canais ler, dependendo dosparâmetros ICC e IID.
Finalmente, os parâmetros 23 (ICC e IID), o sinalde downmix 20 e o sinal residual 22 são disponibilizados como saí-da do procedimento de codificação.
A Figura 3 mostra uma outra configuração do dis-positivo de codificação de áudio inventivo 50 que compreende umcodificador de áudio 10, uma unidade de processamento de sinal 51tendo um primeiro compressor de áudio 52, um segundo compressor deáudio 54, e um compressor de parâmetro 56, e uma interface de saí-da 58.
Os componentes do codificador de áudio 10 já fo-ram discutidos nos parágrafos anteriores. Portanto, apenas aquelaspartes do dispositivo codificador de áudio 50 que estão estendendoo codificador de áudio 10 serão discutidas nos parágrafos a seguir.
O propósito geral da unidade de processamento desinal 51 é comprimir o sinal de downmix 20, o sinal residual 22 eos parâmetros 23. Portanto, o sinal de downmix 20 é inserido noprimeiro compressor de áudio 52, o sinal residual 22 é inserido nosegundo compressor de áudio 54 e os parâmetros espaciais 23 sãoinseridos no compressor de parâmetro 56. 0 primeiro compressor deáudio 52 provê uma primeira corrente de bits de áudio 60, o segun-do compressor de áudio 54 provê uma segunda corrente de bits deáudio 62 e o compressor de parâmetro 56 provê uma corrente de bitde parâmetro 64. A primeira e a segunda corrente de bits de áudio(60, 62) e a corrente de bits de áudio de parâmetro 64 são, então,usadas como entradas da interface de saída, que combinam as trêscorrentes de bit (60, 62, 64) para prover uma corrente de bitscombinada 66, que é a saída do dispositivo de codificação 50.
A combinação executada pela interface de saída 58poderia, por exemplo, ser uma multiplexação simples das três cor-rentes de bit que estão entrando. Adicionalmente, qualquer tipo decombinação que conduza a uma corrente de bits de saída única 66 épossível. O manuseio de uma corrente de bits única é muito maisconveniente, tal como streaming através da internet ou outroslinks de dados.Em outras palavras, a Figura 3 ilustra um codifi-cador que toma um sinal de áudio de dois canais, compreendendo oscanais 1, r como entrada e gera uma corrente de bits que permitedecodificação por um decodificador estéreo paramétrico. 0 downmixadaptativo toma o sinal de dois canais 1, r e gera um downmix monom e um sinal residual s. Estes sinais podem, então, ser codifica-dos pelos codificadores de áudio perceptuais para produzir corren-tes de bits de áudio compactas. A estimativa de parâmetro estéreoparamétrico (PS) toma o sinal de dois canais 1, r como entrada egera um conjunto de parâmetros PS. 0 limitador de instabilidademodifica os parâmetros PS que controlam o downmix adaptativo. 0bloco de codificação produz a informação de lado estéreo paramé-trico (informação de lado PS) a partir da saída não modificada daestimativa de parâmetro PS. 0 multiplexador combina todos os dadoscodificados para formar uma corrente de dados combinada.
Uma das principais vantagens do conceito de codi-ficação inventivo é que ele é totalmente compatível retroativamen-te com decodificadores estéreo paramétricos da técnica anterior.Para ilustrar isto, a Figura 4 mostra um decodificador estéreo pa-ramétrico da técnica anterior.
0 decodificador estéreo paramétrico 70 compreendeuma interface de entrada 72, um decodif icador de áudio 74, um de-codif icador de parâmetro 76, e um dispositivo de upmix 78.
A interface de entrada 72 recebe uma corrente debits combinada 80 conforme produzida a partir do codificador deáudio inventivo 50. A interface de entrada 72 do decodificador es-téreo paramétrico da técnica anterior 70 não reconhece o sinal re-sidual 22 e, portanto, extrai apenas o sinal de downmix 60 (pri-meira corrente de bits de áudio 60 da Figura 3) e a corrente debits de parâmetro 64 da corrente de bits de entrada 80. O decodi-ficador de áudio 74 é o dispositivo complementar ao primeiro com-pressor de áudio 52 e o decodificador de parâmetro 76 é o disposi-tivo complementar ao compressor de parâmetro 56. Portanto, a cor-rente de bits de áudio 60 é decodificada no sinal de downmix 20 ea corrente de bits de parâmetro 64 é decodificada nos parâmetrosespaciais 23.
Visto que os parâmetros espaciais 23 foram transfe-ridos diretamente e não foram processados adicionalmente pelo co-dificador inventivo 10 ou 50, um dispositivo de upmix da técnicaanterior 78 pode reconstruir um canal esquerdo e um canal direito,construindo um sinal de saída 80 do sinal de downmix 20 usando osparâmetros espaciais 23.
Em outras palavras, a Figura 4 ilustra um decodi-ficador estéreo paramétrico que toma uma corrente de bits compatí-vel, conforme gerada pelo dispositivo de codificação inventivo 50como a entrada e gera o sinal de áudio estéreo compreendendo oscanais ler, sem usar ou sem acessar a parte da corrente de bitsque descreve o sinal residual. Primeiramente, um desmultiplexadortoma a corrente de bits compatível como entrada e a decompõe emuma corrente de bits de áudio e na informação de lado PS. O deco-dificador de áudio perceptual produz um sinal mono m, e a informa-ção de lado PS é decodificada em parâmetros PS. A síntese PS con-verte o sinal mono nos sinais esquerdo e direito 1 e r de acordocom os parâmetros PS, em especial pela adição de um sinal descor-relacionado de modo a reter a correlação de canal dos canais esté-reo originais.
A Figura 5 mostra um codificador de áudio de ca-nais múltiplos 100 que codifica um sinal de áudio de 6 canais emum downmix estéreo e uma série de conjuntos de parâmetros.
0 codificador de áudio de canais múltiplos 100compreende um primeiro codificador adaptativo 102, um segundo co-dificador adaptativo 104, módulo de estimativa 106, um extrator deparâmetro 108, e um dispositivo de downmix de 3 para 2 110.
O primeiro codificador adaptativo 102 e o segundocodificador adaptativo 104 são configurações de um codificador in-ventivo 10. 0 sinal de entrada de 6 canais possui um canal frontalesquerdo 112a, um canal traseiro esquerdo 112b, um canal frontaldireito 114a, um canal traseiro direito 114b, um canal central116a, um canal de aumento de baixa freqüência 116b. 0 canal fron-tal esquerdo 112a e o canal traseiro esquerdo 112b são inseridosno primeiro codificador adaptativo 102 que provê um primeiro sinalde downmix 118a, o sinal residual correspondente 118b e parâmetrosespaciais 118c. 0 canal frontal direito 114a e o canal traseirodireito 114b são inseridos no segundo codificador adaptativo 104,que provê um segundo sinal de downmix 12 0a, o sinal residual cor-respondente 120b, e os parâmetros espaciais subjacentes 120c. 0canal central 116a e o canal de aumento de baixa freqüência 116bsão inseridos no módulo de soma 106, que adiciona os sinais paracriar um sinal mono 122a e parâmetros espaciais correspondentes122b.
0 dispositivo de downmix de 3 para 2 110 recebeos sinais de downmix 118a, 120a, e 122a para fazer o downmix des-tes em um sinal de saída estéreo 124 que tem um canal esquerdo eum canal direito. 0 dispositivo de downmix de 3 para 2 provê adi-cionalmente um sinal residual 126 dos canais de entrada 118a,120a, e 122a. Além disso, o dispositivo de downmix de 3 para 2 110provê um conjunto de parâmetros 128 dos conjuntos de parâmetro118b, 120b, e 122b.
Resumindo, a Figura 5 ilustra uma parte de um co-dificador de áudio espacial que toma como entrada um sinal de áu-dio de canais múltiplos no formato 5.1, compreendendo os canais Lf(frontal esquerdo), Lr (surround esquerdo), Rf (frontal direito),Rr (surround direito), C (central) e LFE (eficiente de baixa fre-qüência) , e que cria um downmix estéreo, compreendendo LO e RO, euma série de conjuntos de parâmetros. Não são mostradas nesta fi-gura as transformações de tempo para freqüência, a codificação dossinais de downmix e parâmetros, e a multiplexação da informaçãocodificada em uma corrente de bits que pode ser decodificada porum decodificador de áudio espacial correspondente. O downmix adap-tativo toma como entrada os sinais Lf e Lr e produz um sinal monoL e um sinal residual L. A estimativa de parâmetro estéreo (PS)paramétrico toma o sinal de dois canais Lf e Lr como a entrada egera um conjunto de parâmetros PS. 0 limitador de instabilidademodifica os parâmetros PS que controlam o downmix adaptativo. Deuma maneira similar, o downmix adaptativo toma como entrada os si-nais Rf e Rr e produz um sinal mono R e um sinal residual R. A es-timativa de parâmetro estéreo (PS) paramétrico toma o sinal dedois canais Rf e Rr como entrada e gera um conjunto de parâmetrosPS. O limitador de instabilidade modifica os parâmetros PS quecontrolam o downmix adaptativo. O módulo de soma adiciona os si-nais C e LFE para criar um sinal mono C. A estimativa de parâmetroestéreo (PS) paramétrico toma o sinal de dois canais C e LFE comoentrada e gera um conjunto de parâmetros IID, um subconjunto deparâmetros PS. Os sinais mono L, R e C são misturados a um sinalestéreo (Lo e Ro) e a um sinal residual Eo por um módulo de 3 para2. 0 módulo de 3 para 2 também envia um conjunto de parâmetros(Lo, Ro).
A Figura 6 descreve um decodificador de áudio in-ventivo 140, compreendendo um dispositivo de upmix 142, e um limi-tador 144.
0 decodificador inventivo 140 recebe um sinal dedownmix 146, um sinal residual 148 e parâmetros espaciais 150. 0sinal de downmix 146 e o sinal residual 148 são inseridos no dis-positivo de upmix 142, enquanto os parâmetros espaciais 150 sãoinseridos no limitador 144. 0 limitador 144 limita os parâmetrosespaciais 150 para prover parâmetros espaciais limitados 152.
É importante notar que o limitador está usando amesma regra de limitação para prover os parâmetros limitados comoo codificador correspondente durante o processo de codificação. Osparâmetros limitados são usados para controlar o processo de upmixno dispositivo de upmix 142 que provê um sinal estéreo 154 tendoum canal esquerdo e um canal direito a partir do sinal de downmix146 e do sinal residual 148.
A Figura 7 mostra um diagrama de bloco que ilus-tra o princípio do decodificador inventivo. Em uma primeira etapade limitação 160, os parâmetros espaciais recebidos ICC e IID sãolimitados. Isto é, é verificado se o parâmetro ICC recebido excedeum parâmetro ICC mínimo ICCmin (IID) . Se este for o caso, os parâ-metros espaciais 150 (ICC e IID) , um sinal de downmix recebido146, e um sinal residual recebido 148 são transmitidos para a eta-pa de upmix 162. Se o parâmetro ICC não exceder o parâmetro ICCmínimo ICCmin (IID), uma etapa de limitação 164 é adicionalmenteexecutada, onde o valor do parâmetro ICC é trocado pelo valor doparâmetro ICCmin (IID) , tendo o efeito de que o valor de ICCmin(IID)é transmitido para a etapa de upmix 162.
Na etapa de upmix 162, um sinal estéreo 154 tendoum canal esquerdo e um canal direito é derivado do sinal de down-mix 146 e do sinal residual 148, usando os parâmetros espaciaisICC e IID.
A Figura 8 mostra uma configuração adicional deum dispositivo de decodificação inventivo 180 que compreende umdecodificador 140, uma unidade de processamento de sinal 182 tendoum primeiro decodificador de áudio 184, um segundo decodificadorde áudio 186 e um decodificador de parâmetro 188. 0 dispositivo dedecodificação 180 compreende ainda uma interface de entrada 190para receber uma corrente de bits combinada 192, que é gerada porum dispositivo de codificação inventivo 50.
A corrente de bits combinada 192 é decomposta pela interface de entrada 190 em uma primeira corrente de bits deáudio 194a, uma segunda corrente de bits de áudio 194b e uma cor-rente de bits de parâmetro 196.
A primeira corrente de bits de áudio 194a é inse-rida no primeiro decodificador de áudio 185, a segunda corrente debits de áudio 194b é inserida no segundo decodif icador de áudio186, e a corrente de bits de parâmetro 196 é inserida no decodifi-cador de parâmetro 188. 0 sinal de downmix descomprimido 198 (m) eo sinal residual 200 (s) são inseridos no dispositivo de upmix 142do decodificador 140. Parâmetros espaciais 202 derivados pelo de-codificador de parâmetro 188 são inseridos no limitador 144 do de-codificador de áudio 140. A limitação dos parâmetros espaciais e oprocesso de upmix já foram descritos dentro da descrição do deco-dificador de áudio 140. Uma descrição detalhada pode ser obtidanos parágrafos correspondentes da descrição da Figura 6.
O dispositivo de decodificação inventivo 180 fi-nalmente envia um sinal estéreo 204, tendo um canal esquerdo e umcanal direito.
Em outras palavras, a figura 8 ilustra um decodi-ficador estéreo paramétrico que toma uma corrente de bits compatí-vel como entrada e gera o sinal de áudio estéreo compreendendo oscanais ler. Primeiramente, um desmultiplexador toma a correntede bits compatível como a entrada e a decompõe em duas correntesde bit de áudio e na informação de lado PS. Decodificadores de áu-dio perceptuais produzem um sinal mono m e um sinal residual s,respectivamente, e a informação de lado PS é decodificada nos pa-râmetros PS pelo decodificador de parâmetro. 0 limitador de insta-bilidade modifica os parâmetros PS. 0 dispositivo de upmix conver-te os sinais mono e residual nos sinais esquerdo e direito lerpor meio de uma matriz de rotação definida a partir dos parâmetrosPS modificados pelo limitador de instabilidade.
A Figura 9 mostra um decodificador de áudio decanais múltiplos inventivo 210 compreendendo um primeiro decodifi-cador de dois canais 212, um segundo decodif icador de dois canais214, um módulo de síntese 216, e um módulo de 2 para 3 218.
A Figura 9 ilustra parte de um decodificador deáudio espacial que toma como entrada um sinal de áudio estéreo(compreendendo o Lo e Ro) , um sinal residual Eo e um conjunto deparâmetros (Lo, Ro) . 0 módulo de 2 para 3 218 produz três canaisde áudio L, R, e C a partir da entrada mencionada acima. 0 canalmono Leo canal residual L são convertidos por um primeiro deco-dificador de dois canais 211 nos sinais de saída Lf e Lr. O limi-tador de instabilidade modifica o conjunto de parâmetros PS L. Si-milarmente, o canal mono Reo canal residual R são convertidospor um segundo decodificador de dois canais 214 nos sinais de saí-da Rf e Rr. O limitador de instabilidade é igual àquele usado du-rante a geração do canal mono R e modifica o conjunto de parâme-tros PS R. O módulo de síntese PS 216 toma o canal mono Ceo con-junto de parâmetros C e gera os canais de saída C e LFE.
As Figuras 10 e 11 mostram uma solução alternati-va para um codificador e um decodif icador que evita o problema deinstabilidade. A alternativa ê baseada no uso dos parâmetros espa-ciais limitados como os parâmetros a serem codificados e transmi-tidos. Isto pode ser visto no codificador inventivo na Figura 10que é baseado no dispositivo de codificação inventivo da Figura 3.
A Figura 10 mostra uma modificação de um codifi-cador inventivo já mostrado na Figura 3, com a diferença de que osparâmetros alimentados no codificador de parâmetro 56 são tomadosem um ponto 300, isto é, após o processo de limitação. Isto é, osparâmetros limitados são codificados e transmitidos em vez dos pa-râmetros originais.
No lado do decodificador mostrado na Figura 11, émostrada a modificação de que o limitador pode ser omitido se com-parado com o dispositivo de decodificação 180. Portanto, o parâme-tro espacial decodificado 310 é inserido diretamente no dispositi-vo de upmix 142 para prover o sinal estéreo 204.
As desvantagens desta solução se comparado com acolocação de limitadores de instabilidade conforme ensinado ante-riormente e mostrado nas figuras anteriores, são duas. Primeira-mente, a quantização dos parâmetros limitados moveria os rotadoresmais para longe do que seria idealmente necessário. 0 tamanho doresidual, portanto, seria, no geral, maior, conduzindo a uma perdano ganho de codificação para o método de codificação residual. Emsegundo lugar, a compatibilidade retroativa a decodificadores es-téreos paramétricos seria perdida. Em casos críticos, quando acorrelação de canal do canal original é negativa, o decodificadornão seria capaz de reproduzir esta correlação sem acesso ao sinalresidual.
A Figura 12 está mostrando um transmissor ou gra-vador de áudio inventivo 330 que tem um codificador de áudio 50,uma interface de entrada 332 e uma interface de saída 334.
Um sinal de áudio pode ser suprido na interfacede entrada 332 do transmissor/gravador 330. O sinal de áudio é co-dificado por um codificador inventivo 50 dentro do transmis-sor/gravador e a representação codificada é enviada na interfacede saída 334 do transmissor/gravador 330. A representação codifi-cada pode, então, ser transmitida ou armazenada em um meio de ar-mazenagem.
A Figura 13 mostra um receptor inventivo ou re-produtor de áudio 340 tendo um decodificador de áudio inventivo180, uma entrada de corrente de bits 342, e uma saída de áudio344.
Uma corrente de bits pode ser inserida na entrada342 do receptor/reprodutor de áudio inventivo 340. A corrente debits, então, é decodificada pelo decodificador 180 e o sinal deco-dificado ê enviado ou reproduzido na saída 344 do recep-tor/reprodutor de áudio 340.
A Figura 14 mostra um sistema de transmissão com-preendendo um transmissor inventivo 330, e um receptor inventivo 340.
A entrada de sinal de áudio na interface de en-trada 332 do transmissor 330 é codificada e transferida da saída334 do transmissor 330 para a entrada 342 do receptor 340. 0 re-ceptor decodifica o sinal de áudio e reproduz ou envia o sinal deáudio em sua saída 344.
As configurações da presente invenção mencionadase descritas acima são meramente ilustrativas dos princípios dapresente invenção para a melhoria de codificação residual adapta-tiva. É entendido que modificações e variações dos arranjos e de-talhes descritos aqui serão operandos para aqueles especializadosna técnica. É objetivo, portanto, estar limitado apenas pelo esco-po das reivindicações de patente iminente e não pelos detalhes es-pecíficos apresentados como descrição e explanação das configura-ções aqui mencionadas.
Embora as configurações da presente invenção des-critas nas figuras acima sejam descritas usando principalmente umanomenclatura usada para sinais estéreos, fica aparente que a pre-sente invenção não está limitada a sinais estéreos, mas poderiaser aplicada a qualquer outro tipo de combinação de dois sinais deáudio como, por exemplo, é feito dentro dos codificadores e deco-dificadores de áudio de canais múltiplos mostrados na Figura 5 eFigura 9.
Usando um sistema de transmissão inventivo tendoum transmissor e um receptor, a transmissão entre o transmissor eo receptor pode ser obtida por vários meios. Isto pode ser, porexemplo, streaming pela internet ou por outros meios de rede, ar-mazenagem de um arquivo em um meio legível por computador e trans-ferência de mídia, diretamente conectando o transmissor e o recep-tor por um cabo ou conexão sem fio tal como LAN sem fio ou Blueto-oth e qualquer outra conexão de dados imaginável.
Embora tenha sido descrito em detalhes que o pa-râmetro ICC apenas deve ser mudado para garantir uma matriz de up-mix e downmix não divergente, é também possível limitar ambos osparâmetros ICC e IID, de modo que nenhuma divergência ocorra. Deforma mais geral, a aplicação do conceito inventivo pode tambémsignificar prover outros parâmetros espaciais e aplicar uma regrade limitação a estes parâmetros, garantindo um downmix e um upmixnão divergentes.
As interfaces de saída e entrada nos codificado-res e decodificadores inventivos não estão limitadas apenas a mul-tiplexadores ou desmultiplexadores simples. Em uma variação maissofisticada a interface de saída pode combinar as correntes debits não apenas pela multiplexação destas, mas por qualquer outromeio, sendo possível mesmo tentar alguma codificação de entropiaadicional para reduzir o tamanho da corrente de dados.
Dependendo de certos requisitos de implementaçãodos métodos inventivos, os métodos inventivos podem ser implemen-tados no hardware ou no software. A implementação pode ser execu-tada usando um meio de armazenagem digital, em especial um disco,DVD ou um CD tendo sinais de controle eletronicamente legíveis ne-les armazenados, que cooperem com um sistema de computador progra-mável de modo que os métodos inventivos sejam executados. De formageral, a presente invenção é, portanto, um produto de um programade computador com um código de programa armazenado em um transpor-tador legível por máquina, o código do programa sendo operacionalpara executar os métodos inventivos quando o produto de programade computador operar em um computador. Em outras palavras, os mé-todos inventivos são, portanto, um programa de computador tendo umcódigo de programa para executar pelo menos um dos métodos inven-tivos quando o programa de computador estiver operando em um com-putador.
Embora a descrição anterior tenha sido mostrada edescrita especificamente com referência a configurações específi-cas desta, será entendido por aqueles com especialização na técni-ca que várias outras modificações na forma e detalhes podem serefetuadas sem se afastar de seu espírito e escopo. Deve ser enten-dido que várias modificações podem ser efetuadas na adaptação deconfigurações diferentes sem se afastar dos conceitos amplos reve-lados aqui e abrangidos pelas reivindicações a seguir.