BRPI0710923A2

BRPI0710923A2 - métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto

Info

Publication number: BRPI0710923A2
Application number: BRPI0710923-7A
Authority: BR
Inventors: Sung Yong Yoon; Hee Suk Pang; Hyun Kook Lee; Dong Soo Kim; Jae Hyun Lim
Original assignee: Lg Electronics Inc
Priority date: 2006-09-29
Filing date: 2007-10-01
Publication date: 2011-05-31
Also published as: AU2007300810A1; US9792918B2; EP2071564A1; MX2008012315A; US20090164222A1; AU2007300812A1; JP2010505140A; CA2646045C; WO2008039043A1; RU2551797C2; JP5232789B2; AU2007300814A1; KR20090009842A; US20140303985A1; CA2645910A1; EP2071564A4; KR20090013178A; BRPI0711104A2; US7979282B2; EP2070080A1

Abstract

MéTODOS E APARELHAGENS PARA CODIFICAçãO E DECODIFICAçãO DE SINAIS DE áUDIO ORIENTADOS A OBJETO é fornecido um método e aparelhagem de codificação de áudio e um método e aparelhagem de decodificação de áudio aonde os sinais de áudio podem ser codificados ou decodificados de modo que as imagens sonoras possam ser localizadas em qualquer posição desejada para cada sinal de áudio de objeto. O método de decodificação de áudio inclui a extração de um sinal rebaixado e a informação paralela orientada a objeto a partir de um sinal de áudio de entrada; gerando informação de renderização com base na entrada do dado de controle; e gerando informação espacial com base na informação de renderização e na informação paralela orientada a objeto.

Description

"MÉTODOS E APARELHAGENS PARA CODIFICAÇÃO E DECODIFICAÇÃO DESINAIS DE ÁUDIO ORIENTADOS A OBJETO"

Campo Técnico

O método de decodificação de sinal de áudio inclui a extração de um sinalrebaixado e informação paralela orientada a objeto a partir de um sinal de áudio; a geraçãode um sinal rebaixado modificado orientado no sinal rebaixado e da informação extraída, aqual é extraída a partir da informação paralela orientada a objeto; a geração de informaçãoparalela orientada a canal com base na informação paralela orientada a objeto e o controlede dados para renderização do sinal rebaixado; e a geração de um sinal de áudio demúltiplos canais com base no sinal rebaixado modificado e na informação paralela orientadaa canal.

Estado da Técnica

Em regra, nas técnicas de codificação e decodificação de áudio de canais múltiplos,uma quantidade de sinais de canais de um sinal de múltiplos canais é rebaixada para menossinais de canais, a informação paralela com respeito aos sinais do canal original étransmitida, e restabelece-se um sinal de múltiplos canais apresentando tantos canaisquanto o sinal de múltiplos canais original.

As técnicas de codificação e decodificação de áudio orientado a objeto sãobasicamente semelhantes às técnicas de codificação e decodificação de áudio paramúltiplos canais em termos de rebaixamento de várias fontes sonoras para menos fontes desinais sonoros e da transmissão da informação paralela com respeito às fontes sonorasoriginais. Contudo, nas técnicas de codificação e decodificação de áudio orientado a objeto,os sinais objeto, que compreendem os elementos básicos (ou seja, a sonoridade de uminstrumento musical ou o som da voz humana) de um sinal de canal, são tratados da mesmamaneira como para os sinais de canal em técnicas de codificação e decodificação de áudiopara múltiplos canais e podem assim serem codificados.

Em outras palavras, nas técnicas de codificação e decodificação de áudio orientadoa objeto, cada sinal de objeto é correlacionado junto à entidade a ser codificada. A esserespeito, as técnicas de codificação e decodificação de áudio orientado a objetoapresentam-se diferentes das técnicas de codificação e decodificação para múltiplos canaisem que se realiza uma operação de codificação de áudio para múltiplos canaissimplesmente com base na informação entre canais a despeito da quantidade de elementosa serem codificados de um sinal de canal.

Descrição da Invenção

Problema Técnico

A presente invenção proporciona um método e aparelhagem para codificação deáudio em que os sinais de áudio podem ser codificados ou decodificados de modo que asimagens sonoras possam se apresentar localizadas em qualquer posição desejada paracada sinal de áudio de objeto.

Solução Técnica

De acordo com um aspecto da presente invenção, é fornecido um método dedecodificação de áudio incluindo a extração de um sinal de rebaixamento e informaçãoparalela orientada a objeto a partir de um sinal de áudio de entrada; a geração deinformação de renderização com base nos dados de controle de entrada; e geração deinformação espacial com base na informação de renderização e na informação paralelaorientada a objeto.

De acordo com outro aspecto da presente invenção, é fornecida uma aparelhagemde decodificação de áudio incluindo um demultiplexador que extrai um sinal rebaixado e ainformação paralela orientada a objeto a partir de um sinal de áudio de entrada; umcomponente de renderização que gera informação de renderização com base no dado decontrole de entrada; e um transcodificador que gera informação espacial com base nainformação de renderização e na informação paralela orientada a objeto.

De acordo com um aspecto da presente invenção é fornecida uma mídia degravação fixa apresentando gravada na mesma um programa computacional para execuçãode um método de decodificação de áudio, o método de decodificação de áudio incluindo aextração de um sinal de rebaixamento e a informação paralela orientada a objeto a partir deum sinal de áudio de entrada; a geração de informação de renderização com base nosdados de controle de entrada; e geração de informação espacial com base na informação derenderização e na informação paralela orientada a objeto.

Conseqüências Vantajosas

São fornecidos um método e aparelhagem para codificação de áudio e um métodoe aparelhagem para decodificação de áudio em que os sinais de áudio podem sercodificados ou decodificados de modo que as imagens sonoras possam se apresentarlocalizadas em qualquer posição desejada para cada sinal de áudio de objeto.

Breve Descrição dos Desenhos

A presente invenção irá se tornar mais plenamente compreendida a partir dadescrição detalhada fornecida adiante e através dos desenhos de acompanhamento, quesão fornecidos somente para fins ilustrativos, e não pretendem limitar a presente invenção,em que:

a Figura 1 compreende de um diagrama de blocos de um típico sistema decodificação/decodificação de áudio orientado a objeto;

a Figura 2 compreende um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com uma primeira modalidade da presente invenção;

a Figura 3 compreende um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com uma segunda modalidadé da presente invenção;

a Figura 4 compreende um gráfico explicando a influência de uma diferença deamplitude e um diferença de tempo, que são independentes entre si, na localização deimagens sonoras;

a Figura 5 compreende um gráfico de funções com respeito a correlação entre asdiferenças em amplitude e as diferenças temporais que são necessárias para localizaçãodas imagens sonoras em uma posição pré-determinada;

a Figura 6 ilustra o formato do dado de controle incluindo informação harmônica;

a Figura 7 representa um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com uma terceira modalidade da presente invenção;

a Figura 8 compreende de um diagrama de blocos de um módulo rebaixado deganhos artísticos (ADG) que pode ser utilizado na aparelhagem de decodificação de áudio,ilustrada na Figura 7;

a Figura 9 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com uma quarta modalidade da presente invenção;

a Figura 10 representa um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com uma quinta modalidade da presente invenção;

a Figura 11 representa um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com uma sexta modalidade da presente invenção;

a Figura 12 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com uma sétima modalidade da presente invenção;

a Figura 13 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com uma oitava modalidade da presente invenção;

a Figura 14 compreende de um diagrama para explicação da aplicação deinformação tri-dimensional (3D) junto a um quadro através da aparelhagem de decodificaçãode áudio, ilustrada na Figura 13;

a Figura 15 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com uma nona modalidade da presente invenção;

a Figura 16 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio de acordo com a décima modalidade da presente invenção;

as Figuras de 17 a 19 são diagramas que explicam um método de decodificação deáudio de acordo com uma modalidade da presente invenção; e

a Figura 20 compreende de um diagrama de blocos de uma aparelhagem decodificação de áudio de acordo com uma modalidade da presente invenção.

Melhor Modo de Condução da Invenção

A presente invenção será descrita a seguir em detalhes com referência aosdesenhos de acompanhamento aonde são mostradas as modalidades exemplares dainvenção.

Um método e aparelhagem de codificação de áudio e um método e aparelhagempara decodificação de áudio de acordo com a presente invenção podem ser aplicados juntoa operações de processamento de áudio orientadas a objeto, mas a presente invenção nãose restringe a esta finalidade. Em outras palavras, o método e aparelhagem de codificaçãode áudio e o método e aparelhagem de decodificação de áudio podem ser aplicados junto avárias operações de processamento de sinal diferentes daquelas operações de processamento de áudio orientadas a objeto.

A Figura 1 representa um diagrama de blocos de um típico sistema decodificação/decodificação de áudio orientado a objeto. Em regra, a entrada de sinais deáudio junto a uma aparelhagem de codificação de áudio orientada a objeto não correspondeaos canais de um sinal de canais múltiplos, mas compreende sinais independentes deobjeto. A este respeito, uma aparelhagem de codificação de áudio orientada a objeto édiferenciada de uma aparelhagem de codificação de áudio de canais múltiplos aonde sãointroduzidos os sinais de canais de um sinal de múltiplos canais.

Por exemplo, os sinais de canais, tais como um sinal frontal do canal esquerdo eum sinal frontal do canal direito de um sinal de canal em formato 5,1 podem ser introduzidosjunto a um sinal de áudio de múltiplos canais, em que os sinais de áudio de objeto, taiscomo a voz humana ou o som de um instrumento musical (por exp., o som de um violino ouum piano) que compreendem entidades menores do que os sinais de canais, podem serintroduzidos junto a uma aparelhagem de codificação de áudio orientada a objeto.

Com referência a Figura 1, um sistema de codificação/decodificação de áudioorientado a objeto inclui uma aparelhagem de codificação de áudio orientada a objeto e umaaparelhagem de decodificação de áudio orientada a objeto. A aparelhagem de codificaçãode áudio orientada a objeto inclui um codificador de objeto 100, e a aparelhagem dedecodificação de áudio orientada a objeto inclui um decodificador de objeto 111 e umcomponente de renderização 113.

O codificador de objeto 100 recebe N sinais de áudio de objeto, e gera um sinalrebaixado orientado a objeto com um ou mais canais e informação paralela incluindo umaquantidade de peças de informação extraídas de N sinais de áudio de objeto, tal como,diferença de energia, diferença de fase, e valor de correlação. A informação paralela e osinal rebaixado orientado a objeto são incorporados em um único fluxo de bits, e o fluxo debits é transmitido para a aparelhagem de decodificação orientada a objeto.

A informação paralela pode incluir um sinalizador indicando se deve desempenhara codificação de áudio orientado a canal ou a codificação de áudio orientado a objeto, eassim, podendo determinar se deve desempenhar a codificação de áudio orientado a canalou a codificação de áudio orientado a objeto no sinalizador da informação paralela. Ainformação paralela pode incluir também informação de invólucro, informação deagrupamento, informação de período silencioso, e informação de retardo com referência aossinais de objeto. A informação paralela pode incluir também informação de diferenças denível de objeto, informação de correlação cruzada entre objetos, informação rebaixada deganho, informação de diferenças de nível de canal rebaixado, e informação da energiaabsoluta de objeto.

O decodificador de objeto 111 recebe o sinal rebaixado orientado a objeto e ainformação paralela a partir da aparelhagem de codificação de áudio orientado a objeto, erestabelece os sinais de objeto apresentando propriedades similares àquelas dos N sinaisde áudio objeto com base no sinal rebaixado orientado a objeto e na informação paralela.

Os sinais de objeto gerados pelo decodificador de objeto 111 ainda não teriam sidoalocados para qualquer posição em um espaço de múltiplos canais. Assim, o componentede renderização 113 aloca cada um dos sinais de objeto, gerados pelo decodificador deobjeto 111 para uma posição pré-determinada em um espaço de múltiplos canais edetermina os níveis dos sinais de objeto de modo que os sinais de objeto possam serreproduzidos a partir das respectivas posições correspondentes designadas pelocomponente de renderização 113 com os respectivos níveis correspondentes determinadospelo componente de renderização 113. Vê-se que a informação de controle com referência acada um dos sinais de objeto gerados pelo decodificador de objeto 111 pode variar com otempo, e assim, as posições espaciais e os níveis dos sinais de objeto gerados pelodecodificador de objeto 111 podem variar de acordo com a informação de controle.

A Figura 2 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio 120 de acordo com uma primeira modalidade da presente invenção.Com referência a Figura 2, incluída na aparelhagem de decodificação de áudio 120 tem-seum decodificador de objeto 121, um componente de renderização 123, e um conversor deparâmetro 125. Tem-se que aaparelhagem de decodificação de áudio 120 pode incluirtambém um demultiplexador (não mostrado) que extrai um sinal rebaixado e informaçãoparalela a partir da entrada de um fluxo de bits no mesmo, e procedera desta forma paratodas as aparelhagens de decodificação de áudio, de acordo com as outras modalidades dapresente invenção.

O decodificador de objeto 121 gera uma quantidade de sinais de objeto com baseem um sinal rebaixado e da informação paralela modificada provida pelo conversor deparâmetro 125. O componente de renderização 123 aloca cada um dos sinais de objetogerados pelo decodificador de objeto 121 para uma posição pré-determinada em um espaçode múltiplos canais e determina os níveis dos sinais de objeto gerados pelo decodificador deobjeto 121 de acordo com a informação de controle. O conversor de parâmetro 125 gera ainformação paralela modificada através da combinação da informação paralela e dainformação de controle. Então, o conversor de parâmetro 125 transmite a informaçãoparalela modificada para o decodificador de objeto 121.

O decodificador de objeto 121 pode ser capaz de executar a decodificaçãoadaptativa pela análise da informação de controle na informação paralela modificada.

Por exemplo, caso a informação de controle indique que um primeiro sinal de objetoe um segundo sinal de objeto foram alocados para a mesma posição em um espaço demúltiplos canais e se encontram no mesmo nível, uma típica aparelhagem de decodificaçãode áudio pode decodificar separadamente o primeiro e o segundo sinais de objeto, e daí,posicioná-los em um espaço de múltiplos canais através de uma operação demixagem/renderização.

Por outro lado, o decodificador de objeto 121 da aparelhagem de decodificação deáudio 120 apreende da informação de controle na informação paralela modificada que oprimeiro e segundo sinais de objeto foram alocados para a mesma posição em um espaçode múltiplos canais e apresentam o mesmo nível caso eles fossem originados de uma únicafonte sonora. Resultando que, o decodificador de objeto 121 decodifica o primeiro esegundo sinais de objeto tratando-os como uma única fonte sonora sem decodificá-losseparadamente. Resulta que, a complexidade da decodificação diminui. Ainda, devido auma diminuição na quantidade de fontes sonoras que precisam ser processadas, acomplexidade da mixagem/renderização também diminui.

A aparelhagem de decodificação de áudio 120 pode ser utilizada de forma efetivana situação quando uma quantidade de sinais de objeto é maior do que a quantidade decanais de saída devido à pluralidade de sinais de objeto ser muito provavelmente alocadapara a mesma posição espacial.

Alternativamente, a aparelhagem de decodificação de áudio 120 pode ser utilizadana situação quando o primeiro e o segundo sinais de objeto são alocados para a mesmaposição em um espaço de múltiplos canais, mas apresentam níveis diferentes. Nestasituação, a aparelhagem de decodificação de áudio 120 decodifica o primeiro e o segundosinais de objeto tratando-os como um único sinal de objeto, ao invés de decodificá-losseparadamente, e transmitindo-os decodificados para o componente de renderização 123.Mais especificamente, o decodificador de objeto 121 pode obter informação com respeito adiferença entre os níveis do primeiro e do segundo sinais de objeto a partir da informação decontrole na informação paralela modificada, e decodificar o primeiro e segundo sinais deobjeto com base na informação obtida. Resulta que, mesmo caso o primeiro e o segundosinais de objeto apresentem níveis diferentes, eles podem ser decodificados como sefossem uma única fonte sonora.

Ainda, de forma alternativa, o decodificador de objeto 121 pode ajustar os níveisdos sinais de objeto gerados pelo decodificador de objeto 121 de acordo com a informaçãode controle. Então, o decodificador de objeto 121 pode decodificar os sinais de objeto cujosníveis são ajustados. Resulta que, o componente de renderização 123 não necessita deajustar os níveis dos sinais de objeto decodificados providos pelo decodificador de objeto121, mas simplesmente posicionar os sinais de objeto decodificados providos pelodecodificador de objeto 121 em um espaço de múltiplos canais. Em resumo, uma vez que odecodificador de objeto 121 ajusta os níveis dos sinais de objeto gerados pelo decodificadorde objeto 121 de acordo com a informação de controle, o componente de renderização 123pode, prontamente, disponibilizar os sinais de objeto gerados pelo decodificador de objeto121 em um espaço de múltiplos canais sem a necessidade de ajustar adicionalmente osníveis dos sinais de objeto gerados pelo decodificador de objeto 121. Portanto, é possível sereduzir a complexidade da mixagem/renderização.

De acordo com a modalidade da Figura 2, o decodificador de objeto daaparelhagem de decodificação de áudio 120 pode de forma adaptativa desempenhar umaoperação de decodificação através da análise da informação de controle, reduzindo assim, acomplexidade da decodificação e a complexidade da mixagem/renderização. Umacombinação dos métodos descritos anteriormentepela aparelhagem de decodificação deáudio 120 pode ser utilizada.

A Figura 3 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio 130 de acordo com uma segunda modalidade da presente invenção.Pela Figura 3 observa-se que a aparelhagem de decodificação de áudio 130 inclui umdecodificador de objeto 131 e um componente de renderização 133. Tem-se que aaparelhagem de decodificação de áudio 130 é caracterizada pelo fornecimento deinformação paralela não só ao decodificador de objeto 131, mas também para ocomponente de renderização 133.

A aparelhagem de decodificação de áudio 130 pode desempenhar de formaeficiente uma operação de decodificação mesmo quando existe um sinal de objetocorrespondendo a um período de silêncio. Por exemplo, do segundo ao quarto dos sinais deobjeto podem corresponder a um período de reprodução musical durante o qual uminstrumento musical é tocado, e um primeiro sinal de objeto pode corresponder a umperíodo de silêncio aonde um acompanhamento é tocado. Nesta situação, a informaçãoindicando qual de uma pluralidade de sinais de objeto corresponde a um período de silênciopode apresentar-se incluída na informação paralela, e a informação paralela pode serfornecida ao componente de renderização 133, bem como ao decodificador de objeto 131.

O decodificador de objeto 131 pode minimizar a complexidade da decodificaçãonão decodificando um sinal de objeto correspondendo a um período de silêncio. Odecodificador de objeto 131 ajusta um sinal de objeto correspondendo a um valor de 0 etransmite o nível do sinal de objeto para o componente de renderização 133. Em regra, ossinais de objeto apresentando um valor 0 são tratados da mesma maneira dos sinais deobjeto apresentando um valor diferente de 0, e assim estão sujeitos a uma operação demixagem/renderização.

Por outro lado, a aparelhagem de decodificação de áudio 130 transmite informaçãoparalela incluindo informação indicando que uma pluralidade de sinais de objetocorresponde a um período de silêncio junto ao componente de renderização 133 e pode,assim, impedir que um sinal de objeto correspondendo a um período de silêncio sejamsubmetidos a uma operação de mixagem/renderização desempenhada pelo componente derenderização 133. Portanto, a aparelhagem de decodificação de áudio 130 pode impedir queocorra um desnecessário aumento da complexidade de mixagem/renderização.

O componente de renderização 133 pode fazer uso da informação de mixagem deparâmetro que é incluída na informação de controle para localizar uma imagem sonora decada sinal de objeto junto a um cenário estéreo. A informação de mixagem de parâmetropode incluir tanto somente a informação de amplitude como ambas a informação deamplitude e a informação de tempo. A informação de mixagem de parâmetro afeta nãosomente a localização das imagens sonoras em estéreo, mas também a percepçãopsíquico-acústica da qualidade espacial do som por um usuário.

Por exemplo, mediante a comparação de duas imagens sonoras que são geradasutilizando-se um método de varredura para o tempo e um método de varredura para aamplitude, respectivamente, e reproduzidas na mesma localização utilizando-se um alto-falante estéreo de dois-canais, reconhece-se que o método de varredura para a amplitudepode contribuir para determinar uma localização precisa das imagens sonoras, e que ométodo de varredura para o tempo pode fornecer sons naturais com uma profundasensação de espaço. Assim, caso o componente de renderização 133 faça uso somente dométodo de varredura para a amplitude para disponibilizar sinais de objeto em um espaço demúltiplos canais, o componente de renderização 133 pode ser capaz de localizarprecisamente cada imagem sonora, mas pode não ser capaz de fornecer uma profundasensação sonora como quando fazendo uso do método de varredura para o tempo. Osusuários podem dar preferência, às vezes, por uma localização precisa das imagenssonoras ao invés da sensação profunda do som ou vice-versa, de acordo com o tipo defontes sonoras.

As Figuras 4(a ) e 4 (b) explicam a influência da intensidade (diferença deamplitude) e uma diferença de tempo na localização das imagens sonoras conformerealizado na reprodução de sinais com um alto-falante estéreo de dois-canais. Comreferência as Figuras 4(a) e 4(b), uma imagem sonora pode se apresentar localizada em umângulo pré-determinado de acordo com uma diferença de amplitude e uma diferença detempo, que são independentes entre si. Por exemplo, uma amplitude de diferença em tornode 8 dB, ou uma diferença temporal de em torno de 0,5 ms, eqüivalendo a uma diferença deamplitude de 8 dB, pode ser empregada de forma a localizar uma imagem sonora a umângulo de 20°. Portanto, mesmo se somente uma diferença de amplitude é fornecida comoinformação de mixagem de parâmetro, é possível se obter vários sons com diferentespropriedades através da conversão da diferença de amplitude em diferença de tempo que éo equivalente a diferença de amplitude durante a localização das imagens sonoras.

A Figura 5 ilustra funções com respeito à correspondência entre as diferenças deamplitude e as diferenças de tempo que são precisas para se localizar as imagens sonorasem ângulos de 10°, 20°, e 30°. A função, ilustrada na Figura 5, pode ser obtida com basenas Figuras 4(a) e 4(b). Com referência a Figura 5, várias combinações de diferença deamplitude - diferença de tempo podem ser fornecidas para a localização de uma imagemsonora em uma posição pré-determinada. Por exemplo, assumindo que uma diferença deamplitude de 8 dB seja fornecida na forma de informação de mixagem de parâmetro demaneira a se localizar uma imagem sonora a um ângulo de 20°. De acordo com a funçãoilustrada na Figura 5, uma imagem sonora pode se apresentar, também, localizada a umângulo de 20° utilizando-se a combinação de uma diferença de amplitude de 3 dB e umadiferença de tempo de 0,3 ms. Neste caso, não somente a informação da diferença deamplitude, mas também a informação da diferença de tempo podem ser fornecidas na formade informação de mixagem de parâmetro, acentuando assim a sensação de espaço.

Portanto, de modo a se gerar sons com propriedades desejadas pelo usuáriodurante uma operação de mixagem/renderização, a informação de mixagem de parâmetropode ser adequadamente convertida de maneira que qualquer que seja a amplitude e otempo de varredura que agradem ao usuário, ela pode ser realizada. Ou seja, caso ainformação de mixagem de parâmetro inclua somente informação da diferença de amplitudee o usuário deseje sons com uma profunda sensação de espaço, a informação da diferençade amplitude pode ser convertida em informação de diferença de tempo, eqüivalendo ainformação da diferença de amplitude com referência aos dados psíquico-acústicos. Demaneira alternativa, caso seja do desejo do usuário que ambos sons apresentem umaprofunda sensação de espaço e uma localização precisa das imagens sonoras, ainformação da diferença de amplitude pode ser convertida em uma combinação dainformação da diferença de amplitude e a informação da diferença de tempo eqüivalendo ainformação da amplitude original. De forma alternativa, caso a informação de mixagem deparâmetro inclua somente informação da diferença de tempo e o usuário prefira umalocalização precisa das imagens sonoras, a informação da diferença de tempo pode serconvertida na informação da diferença de amplitude equivalente a informação da diferençade tempo, ou pode ser convertida na combinação da informação da diferença de amplitude ea informação da diferença de tempo que venha a satisfazer a preferência do usuárioacentuando tanto a precisão da localização das imagens sonoras como a sensação de espaço.

Ainda, de maneira alternativa, caso a informação de mixagem de parâmetro incluatanto a informação da diferença de amplitude quanto à informação da diferença de tempo eo usuário dê preferência a uma precisa localização das imagens sonoras, a combinação dainformação da diferença de amplitude e a informação da diferença de tempo podem serconvertidas na informação da diferença de amplitude eqüivalendo a combinação dainformação da diferença de amplitude original e a informação da diferença de tempo. Poroutro lado, caso a informação de mixagem de parâmetro inclua tanto a informação dadiferença de amplitude e a informação da diferença de tempo e o usuário dê preferência aacentuar a sensação de espaço, a combinação da informação da diferença de amplitude eda informação da diferença de tempo pode ser convertida na informação da diferença detempo eqüivalendo a combinação da informação da diferença de amplitude e a informaçãoda diferença de tempo original. Com referência a Figura 6, a informação de controle podeincluir a informação de mixagem/renderização e a informação harmônica com respeito a umou mais sinais de objeto. A informação harmônica pode incluir, pelo menos, uma informaçãode passo, informação da freqüência fundamental, e informação da faixa de freqüênciadominante com relação a um ou mais sinais de objeto, e descrições da energia e doespectro de cada sub-faixa de cada um dos sinais de objeto.

A informação harmônica pode ser empregada para processar um sinal de objetodurante uma operação de renderização devido à insuficiência de resolução de umcomponente de renderização que desempenha esta operação em unidades de sub-faixas.

Caso a informação harmônica inclua informação de passo com respeito a um oumais sinais de objeto, o ganho de cada um dos sinais de objeto pode ser ajustado pelaatenuação ou fortalecimento de um pré-determinado domínio da freqüência utilizando umfiltro de pente ou um filtro de pente invertido. Por exemplo, caso um dos sinais de objeto apartir de uma pluralidade seja um sinal vocal, os sinais de objeto podem ser empregados naforma de um karaokê atenuando-se somente o sinal de vocal. De maneira alternativa, casoa informação harmônica inclua a informação de domínio de uma freqüência dominante comrespeito a um ou mais sinais de objeto, pode-se realizar um processo de atenuação oufortalecimento de um domínio para uma freqüência dominante. Ainda, de forma alternativa,caso a informação harmônica inclua informação de espectro com respeito a um ou maissinais de objeto, o ganho de cada um dos sinais de objeto pode ser controlado através dodesempenho da atenuação ou fortalecimento sem se ficar restrito a qualquer um dos limitesdas sub-faixas.

A Figura 7 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio 140 de acordo com uma outra modalidade da presente invenção.Observa-se pela Figura 7 que a aparelhagem de decodificação de áudio 140 faz uso de umdecodificador de múltiplos canais 141, ao invés de um decodificador de objeto e umcomponente de renderização, e decodifica uma quantidade de sinais de objeto após ossinais de objeto serem apropriadamente dispostos em um espaço de múltiplos canais.

Mais especificamente, a aparelhagem de decodificação de áudio 140 inclui odecodificador de múltiplos canais 141 e um conversor de parâmetro 145. O decodificador demúltiplos canais 141 gera um sinal de múltiplos canais cujos sinais de objeto tenham sidopreviamente arranjados em um espaço de múltiplos canais com base em um sinal rebaixadoe na informação de parâmetro espacial, que compreende informação paralela orientada acanal fornecida pelo conversor de parâmetro 145. O conversor de parâmetro 145 analisa ainformação paralela e a informação de controle transmitidas por uma aparelhagem decodificação de áudio (não mostrada), e gera a informação de parâmetro espacial com baseno- resultado da análise. Mais especificamente, o conversor de parâmetro 145 gera ainformação de parâmetro espacial através da combinação da informação paralela e dainformação de controle que inclui a informação de estabelecimento de reprodução e ainformação de mixagem. Ou seja, o conversor de parâmetro 145 desempenha a conversãoda combinação da informação paralela e da informação de controle junto ao dado espacialcorrespondente a uma caixa Um-por-Dois (OTT) ou uma caixa Dois-por-Três (TTT).

A aparelhagem de decodificação de áudio 140 pode desempenhar uma operaçãode decodificação de múltiplos canais aonde uma operação de decodificação orientada aobjeto e uma operação de mixagem/renderização são incorporadas e daí saltar adecodificação de cada sinal de objeto. Portanto, é possível se reduzir a complexidade dadecodificação e/ou mixagem/renderização.

Por exemplo, quando ocorrem 10 sinais de objeto e um sinal de múltiplos canaisobtidos com base nos 10 sinais de objeto para serem reproduzidos através de um sistemade reprodução com alto-falante para canal em formato 5,1, uma típica aparelhagem dedecodificação de áudio orientada a objeto gera sinais decodificados, correspondendo,respectivamente, a 10 sinais de objeto baseados em um sinal rebaixado e na informaçãoparalela, e daí, gerando um sinal para canal em formato 5,1, arranjando-se apropriadamenteos 10 sinais de objeto em um espaço de múltiplos canais, de modo que os sinais de objetopossam se tornar adequados para um ambiente com alto-falante para canal em formato 5,1.Entretanto, é ineficaz se gerar 10 sinais de objeto durante a geração de um sinal para canalem formato 5,1, e este problema torna-se mais severo conforme vá crescendo a diferençaentre a quantidade de sinais de objeto e a quantidade de canais de um sinal de múltiploscanais a serem gerados.

Por outro lado, de acordo com a modalidade da Figura 7, observa-se que aaparelhagem de decodificação de áudio 140 gera informação de parâmetro espacialadequada para um sinal para canal em formato 5,1 com base na informação paralela e nainformação de controle, e fornece a informação do parâmetro espacial e um sinal rebaixadojunto ao decodificador de múltiplos canais 141. Então, o decodificador de múltiplos canais141 gera um sinal para canal em formato 5,1 com base na informação paralela espacial e nosinal rebaixado. Em outras palavras, quando a quantidade de canais a serem liberadoscompreende canais no formato 5,1, a aparelhagem de decodificação de áudio 140 podegerar prontamente um sinal para canal em formato 5,1 com base no sinal rebaixado sem anecessidade de gerar os 10 sinais de objeto, numa forma mais eficiente em termos decomplexidade do que no caso de uma aparelhagem de decodificação de áudioconvencional.

A aparelhagem de decodificação de áudio 140 é considerada ser eficiente quando aquantidade de computação requerida para cálculo da informação de parâmetro espacialcorrespondendo a cada caixa OTT e a cada caixa TTT, através da análise da informaçãoparalela e da informação de controle transmitida por uma aparelhagem de codificação deáudio, é menor do que a quantidade de computação requerida para desempenhar umaoperação de mixagem/renderização após a decodificação de cada sinal de objeto.

A aparelhagem de decodificação de áudio 140 pode ser obtida através da simplesadição de um módulo para geração da informação de parâmetro espacial através da análisede informação paralela e informação de controle junto a uma típica aparelhagem dedecodificação de áudio de múltiplos canais, e pode assim manter a compatibilidade comuma típica aparelhagem de decodificação de áudio de múltiplos canais.

Ainda, a aparelhagem de decodificação de áudio 140 pode melhorar a qualidade dosom utilizando as ferramentas disponíveis de uma típica aparelhagem de decodificação deáudio de múltiplos canais, tais como, um delineador de invólucro, um periférico deprocessamento temporal em sub-faixas (STP), e um misturador. Sendo fornecido esteequipamento conclui-se que todas as vantagens de um típico método de decodificação deáudio de múltiplos canais pode ser prontamente aplicado junto a um método dedecodificação de áudio-objeto.

A informação do parâmetro espacial transmitida para o decodificador de múltiploscanais 141 pelo conversor de parâmetro 145 pode ser comprimida de modo a tornar-seadequada para transmissão. De forma alternativa, a informação de parâmetro espacial podeapresentar formato idêntico daquele dos dados transmitidos via uma típica aparelhagem decodificação de múltiplos canais. Ou seja, a informação de parâmetro espacial pode estarsujeita a uma operação de decodificação Huffman ou a uma operação de decodificaçãopiloto e pode ser transmitida para cada módulo na forma de um dado de instrução espacialnão-comprimido. A primeira operação é adequada para transmissão da informação deparâmetro espacial junto a uma aparelhagem de decodificação de áudio de múltiplos canaisem um local remoto, e a outra operação é conveniente devido a que não existe necessidadede uma aparelhagem de decodificação de áudio de múltiplos canais para conversão do dadode instrução espacial comprimido em um dado de instrução espacial não-comprimido quepossa ser prontamente utilizado em uma operação de decodificação.

A configuração da informação de parâmetro espacial com base na análise dainformação lateral e da informação de controle pode levar a um retardo entre o sinalrebaixado e a informação do parâmetro espacial. De forma a se analisar esta questão, umamemória intermediária adicional pode ser fornecida tanto para um sinal rebaixado como paraa informação de parâmetro espacial de modo que o sinal rebaixado e a informação deparâmetro espacial possam ser sincronizados entre si. Estes métodos, contudo, seapresentam inconvenientes devido á necessidade de ser fornecida uma memóriaintermediária adicional. De maneira alternativa, a informação paralela pode ser transmitidaantes de um sinal rebaixado em consideração da possibilidade de ocorrência de um retardoentre um sinal rebaixado e a informação de parâmetro espacial. Neste caso, a informaçãode parâmetro espacial obtida pela combinação da informação paralela e informação decontrole não necessita de ser ajustada, mas pode ser utilizada prontamente.

Caso uma pluralidade de sinais de objeto de um sinal rebaixado apresente níveisdiferentes, um módulo artístico de ganhos rebaixado (ADG),que pode compensardiretamente o sinal rebaixado, pode determinar os níveis relativos dos sinais de objeto, ecada um dos sinais de objeto pode ser alocado junto a uma posição pré-determinada em umespaço de múltiplos canais utilizando o dado de instrução espacial, tal como a informaçãode diferença de nível de canal, a informação de correlação entre canais (ICC), e ainformação de coeficiente de previsão de canal (CPC).

Por exemplo, caso a informação de controle indique que um sinal de objeto pré-determinado esteja para ser alocado junto a uma posição pré-determinada em um espaçode múltiplos canaise apresente um nível mais elevado do que os outros sinais de objeto, umtípico decodificador de múltiplos canais pode calcular a diferença entre as energias doscanais de um sinal rebaixado, e dividir o sinal rebaixado em uma quantidade de canais desaída com base nos resultados do cálculo. Contudo, um típico decodificador de múltiploscanais não pode aumentar ou reduzir o volume de uma certa sonoridade em um sinalrebaixado. Em outras palavras, um típico decodificador de múltiplos canais distribuisimplesmente um sinal rebaixado junto a uma quantidade de canais de saída e assim, nãopode aumentar ou reduzir o volume sonoro no sinal rebaixado.

É relativamente fácil se alocar cada sinal de uma quantidade de sinais de objeto deum sinal rebaixado gerado por um codificador de objeto junto a uma posição pré-determinada em um espaço de múltiplos canais de acordo com a informação de controle.Entretanto, técnicas especiais são necessárias para se aumentar ou reduzir a amplitude deum sinal de objeto pré-determinado. Em outras palavras, caso um sinal rebaixado geradopor um codificador de objeto seja utilizado da forma esperada, será difícil se reduzir aamplitude de cada sinal de objeto do sinal rebaixado.

Por conseguinte, de acordo com uma modalidade da presente invenção, asamplitudes relativas dos sinais de objeto podem ser variadaspodem ser variadas de acordocom a informação de controle utilizando um módulo ADG 147 ilustrado na Figura 8. Maisespecificamente, a amplitude de qualquer sinal de uma pluralidade de sinais de objeto deum sinal rebaixado transmitido por codificador de objeto pode ser aumentada ou reduzidautilizando-se o módulo ADG 147. Um sinal rebaixado obtido pela compensação executadapelo módulo ADG 147 pode estar sujeito a decodificação de múltiplos canais.

Caso as amplitudes relativas de sinais de objeto de um sinal rebaixado sejamajustadas de forma apropriada utilizando o módulo ADG 147, é possível se executar adecodificação de objeto utilizando-se um típico decodificador de múltiplos canais. Caso umsinal rebaixado gerado por um decodificador de objeto seja um sinal mono ou estéreo ou umsinal de múltiplos canais com três ou mais canais, o sinal rebaixado pode ser processadopelo módulo ADG 147. Caso um sinal rebaixado - gerado por um codificador de objetoapresente dois ou mais canais e um sinal de objeto pré-determinado que precise serajustado pelo módulo AG 147 exista somente em um dos canais do sinal rebaixado - omódulo ADG 147 pode ser aplicado somente para o canal incluindo o sinal de objeto pré-determinado, ao invés de ser aplicado para todos os canais de sinal rebaixado. Um sinalrebaixado processado pelo módulo ADG 147 na maneira descrita acima pode serimediatamente processado utilizando-se um típico decodificador de múltiplos canais sem anecessidade de modificar o quadro do decodificador de múltiplos canais.

Mesmo quando um sinal de saída final não compreende de um sinal de múltiploscanais que possam ser reproduzidos por um alto-falante de múltiplos canais, mascompreenda de um sinal biauricular, o módulo ADG 147 pode ser utilizado para ajustar asamplitudes relativas dos sinais de objeto do sinal de saída final.

Uma forma alternativa ao emprego do módulo ADG 147 é a informação de ganhoespecificando um valor de ganho a ser aplicado à cada sinal de objeto podendo ser incluídana informação de controle durante a geração de uma quantidade de sinais de objeto. Paraisto, o quadro de um típico decodificador de múltiplos canais pode ser modificado. Muitoembora necessitando de uma modificação do quadro de um decodificador de múltiploscanais existente, este método é conveniente em termos de redução da complexidade dedecodificação através da aplicação de um valor de ganho para cada sinal de objeto duranteuma operação de decodificação sem a necessidade de se calcular o ADG e para secompensar cada sinal de objeto.

A Figura 9 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio 150 de acordo com uma quarta modalidade da presente invenção.Com referência a Figura 9, caracteriza-se a aparelhagem de decodificação de áudio 150pela geração de um sinal biauricular.

Mais especificamente, a aparelhagem de decodificação de áudio 150 inclui umdecodificador biauricular de múltiplos canais 151, um primeiro conversor de parâmetro 157,e um segundo conversor de parâmetro 159.

O segundo conversor de parâmetro 159 analisa a informação paralela e ainformação de controle que são fornecidas através de uma aparelhagem de codificação deáudio, e configura a informação de parâmetro espacial com base no resultado da análise. Oprimeiro conversor de parâmetro 157 configura a informação de parâmetro biauricular, quepode ser utilizada pelo decodificador biauricular de múltiplos canais 151, através da adiçãoda informação tri-dimensional (3D), tal como parâmetros funcionais de transferênciarelacionados à cabeça (HRTF), junto à informação de parâmetro espacial. O decodificadorbiauricular de múltiplos canais 151 gera um sinal virtual tri-dimensional (3D) através daaplicação da informação de parâmetro virtual 3D junto a um sinal rebaixado.

O primeiro conversor de parâmetro 157 e o segundo conversor de parâmetro 159podem ser substituídos por um único módulo, ou seja, um módulo de conversão deparâmetro 155 que recebe a informação paralela, a informação de controle, e os parâmetrosHRTF e configura a informação de parâmetro biauricular com base na informação paralela,na informação de controle, e nos parâmetros HRTF.

Convencionalmente, de modo a se gerar um sinal biauricular para a reprodução deum sinal rebaixado incluindo 10 sinais de objeto com fone de ouvido, um sinal de objetodeve gerar 10 sinais decodificados correspondendo, respectivamente, a 10 sinais de objetocom base no sinal rebaixado e na informação paralela. Posteriormente, um componente derenderização aloca cada um dos 10 sinais de objeto em uma posição pré-determinada emum espaço de múltiplos canais com referência a informação de controle de forma a adequar-se num ambiente de alto-falante para canal em formato 5,1. Posteriormente, o componentede renderização gera um sinal para canal em formato 5,1 que pode ser reproduzidoutilizando-se um alto-falante para canal em formato 5,1. Posteriormente, o componente derenderização aplica os parâmetros HRTF junto ao sinal para canal em formato 5,1, gerandoum sinal para dois canais. Em resumo, o método de decodificação de áudio convencionalmencionado acima inclui a reprodução de 10 sinais de objeto, a conversão dos 10 sinais deobjeto para um sinal para canal em formato 5,1, e a geração de um sinal para dois canaiscom base no sinal para cinco canais, e, por conseguinte é ineficiente.

Por outro lado, a aparelhagem de decodificação de áudio 150 pode gerar,prontamente, um sinal biauricular que pode ser reproduzido utilizando-se um fone de ouvidocom base nos sinais de áudio de objeto. Ainda, a aparelhagem de decodificação de áudio150 configura a informação do parâmetro espaciàl através da análise da informação paralelae da informação de controle, e pode assim, gerar um sinal biauricular utilizando um típicodecodificador biauricular de múltiplos canais . Mais ainda, a aparelhagem de decodificaçãode áudio 150 ainda pode fazer uso de um decodificador biauricular típico de múltiplos canaismesmo quando sendo equipada com um conversor de parâmetro incorporado que recebeinformação paralela, informação de controle, e os parâmetros HRTF e configura ainformação de parâmetro biauricular com base na informação paralela, na informação decontrole, e nos parâmetros HRTF.

A Figura 10 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio 160, de acordo com a quinta modalidade da presente invenção.Observa-se pela Figura 10, que a aparelhagem de decodificação de áudio 160 inclui umprocessador de rebaixamento 161, um decodificador de múltiplos canais 163, e umconversor de parâmetros 165. O processador de rebaixamento 161 e o conversor deparâmetros 163 podem ser substituídos por um único módulo 167.

O conversor de parâmetros 165 gera informação de parâmetro espacial, que podeser utilizada pelo decodificador de múltiplos canais 163, e a informação de parâmetro, quepode ser utilizada pelo processador de rebaixamento 161. O processador de rebaixamento161 desempenha uma operação de pré-processamento em um sinal rebaixado, e transmiteum sinal rebaixado resultante da operação de pré-processamento junto ao decodificador demúltiplos canais 163. O decodificador de múltiplos canais 163 desempenha uma operaçãode decodificação no sinal rebaixado transmitido pelo processador de rebaixamento 161,liberando assim um sinal estéreo, um sinal estéreo biauricular ou um sinal de múltiploscanais. Exemplos da operação de pré-processamento desempenhada pelo processador derebaixamento 161 incluem a modificação ou conversão de um sinal rebaixado em umdomínio de tempo ou num domínio de freqüência utilizando-se filtragem.

Caso a entrada de um sinal rebaixado junto à aparelhagem de decodificação deáudio 160 seja um sinal estéreo, o sinal rebaixado pode estar sujeito a um pré-processamento de rebaixamento desempenhado pelo processador de rebaixamento 161antes de ser introduzido junto ao decodificador de múltiplos canais 163 devido àincapacidade do decodificador de múltiplos canais 163 de mapear um componente do sinalrebaixado correspondendo a um canal esquerdo, que compreende ser um dos múltiploscanais, para um canal direito, que é outro dos múltiplos canais. Portanto, de maneira a sedesviar a posição de um sinal de objeto classificado no canal esquerdo para uma direçãoem sentido ao canal direito, a entrada do sinal rebaixado junto a aparelhagem dedecodificação de áudio 160 pode ser pré-processada pelo processador de rebaixamento161, e o sinal rebaixado pré-processado pode ser introduzido junto ao decodificador demúltiplos canais 163.O pré-processamento de um sinal rebaixado estéreo pode ser realizado com basena informação de pré-processamento obtida a partir da informação paralela e da informaçãode controle.

A Figura 11 compreende de um diagrama de blocos de uma aparelhagem de áudio170, de acordo com uma sexta modalidade da presente invenção. Observa-se pela Figura11 que a aparelhagem de decodificação de áudio 170 inclui um decodificador de múltiploscanais 171, um processador de canal 173, e um conversor de parâmetro 175.

O conversor de parâmetro 175 gera a informação de parâmetro espacial, que podeser utilizada pelo decodificador de múltiplos canais 173 e gera a informação de parâmetroque pode ser utilizada pelo processador de canal 173. O processador de canal 173desempenha uma operação de pós-processamento na saída de sinal através dodecodificador de múltiplos canais 173. Exemplos da saída de sinal pelo decodificador demúltiplos canais 173 incluem um sinal estéreo, um sinal estéreo biauricular e um sinal demúltiplos canais.

Exemplos da operação de pós-processamento desempenhada pelo processador dereserva 173 incluem a modificação e conversão de cada canal ou de todos os canais de umsinal de saída. Por exemplo, caso a informação paralela inclua informação da freqüênciafundamental com respeito a um sinal de objeto pré-determinado, o processador de canal173 pode remover os componentes harmônicos do sinal de objeto pré-determinado comreferência a informação da freqüência fundamental. Um método de decodificação de áudiode múltiplos canais pode não ser eficiente o bastante para ser utilizado num sistemakaraokê. Contudo, caso a informação de freqüência fundamental com respeito aos sinais deobjeto vocal seja incluída na informação paralela e os componentes harmônicos dos sinaisde objeto vocal sejam removidos durante uma operação de pós-processamento, é possívelse construir um sistema karaokê de alto desempenho fazendo-se uso da modalidade daFigura 11. Além daqueles sinais de objeto vocal, a modalidade da Figura 11 pode sertambém aplicada junto aos sinais de objeto. Por exemplo, é possível se remover o som deum pré-determinado instrumento musical utilizando-se a modalidade da Figura 11. Ainda, épossível se amplificar os componentes harmônicos pré-determinados fazendo-se uso dainformação da freqüência fundamental com respeito aos sinais de objeto utilizando-se amodalidade da Figura 11.

O processador de canal 173 pode desempenhar o processamento de efeitoadicional em um sinal rebaixado. De forma alternativa, o processador de canal 173 podeadicionar um sinal obtido pelo processamento de efeito adicional junto à saída de sinal pelodecodificador de múltiplos canais 171. O processador de canal 173 pode alterar o espectrode um objeto ou modificar um sinal rebaixado se necessário. Caso não seja apropriadodesempenhar diretamente uma operação de processamento de efeito, tal comoreverberação de um sinal rebaixado e transmitir o sinal obtido pela operação deprocessamento de efeito para o decodificador de múltiplos canais 171 ,o processador derebaixamento 173 pode adicionar o sinal obtido pela operação de processamento de efeitojunto à saída do decodificador de múltiplos canais 171, ao invés de desempenhar oprocessamento de efeito no sinal rebaixado.

A aparelhagem de decodificação de áudio 170 pode ser projetada para incluir nãosomente o processador de canal 173, mas também um processador de rebaixamento .Neste caso, o processador de rebaixamento pode se apresentar localizado na frente dodecodificador de múltiplos canais 173, e o processador de canal 173 pode se apresentardisposto atrás do decodificador de múltiplos canais 173.

A Figura 12 representa um diagrama de blocos de uma aparelhagem dedecodificação de áudio 210 de acordo com uma sétima modalidade da presente invenção.

Observa-se pela Figura 12, que a aparelhagem de decodificação de áudio 210 faz uso deum decodificador de múltiplos canais 213, ao invés de um decodificador de objeto.

Mais especificamente, a aparelhagem de decodificação de áudio 210 inclui odecodificador de múltiplos canais 213, um transcodificador 215, um componente derenderização 217, e uma base de dados de informação 3D 217.

O componente de renderização 217 determina as posições em 3D de umapluralidade de sinais de objeto com base na informação 3D correspondendoaos dadosindexados incluídos na informação de controle. O transcodificador 215 gera a informaçãoparalela orientada a canal pela sintetização da informação da posiçãocom respeito àquantidade de sinais de áudio de objeto aonde se obtém a informação 3D aplicada pelocomponente de renderização 217. O decodificador de múltiplos canais 213 libera um sinal3D através da aplicação da informação paralela orientada a canal junto a um sinalrebaixado.

Uma função de transferência relacionada à cabeça (HRTF) pode ser empregadacomo a informação 3D. Um HRTF compreende de uma função de transferência quedescreve a transmissão de ondas sonoras entre uma fonte sonora em uma posiçãoarbitrária e o tímpano, e retorna com um valor que varia de acordo com a direção e a altitudeda fonte sonora. Caso um sinal sem nenhuma capacidade de direção seja filtrado fazendo-se emprego do HRTF, o sinal pode ser ouvido como se tivesse sido reproduzido a partir deuma certa direção.

Quando se recebe uma entrada de fluxo de bits, a aparelhagem de decodificaçãode áudio 210 extrai um sinal rebaixado orientado a objeto e informação de parâmetroorientada a objeto a partir da entrada do fluxo de bits fazendo-se emprego de umdemultiplexador (não mostrado). Então, o componente de renderização 217 extrai o dadoindexado a partir da informação de controle, que é utilizado para determinar as posições deuma pluralidade de sinais de áudio de objeto, e retira a informação 3D correspondendo aodado indexado extraído da base dados da informação 3D 219.

Mais especificamente, a informação de mixagem de parâmetro, que é incluída nainformação de controle que é utilizada pela aparelhagem de decodificação de áudio 210,pode incluir não somente a informação de nível, mas também os dados indexadosnecessários para a busca da informação 3D. A informação de mixagem de parâmetro podeincluir também a informação de tempo com respeito à diferença de tempo entre os canais, ainformação de posição e um ou mais parâmetros obtidos pelo fato de apropriadamentecombinarem a informação de nível e a informação de tempo.

A posição de um sinal de áudio de objeto pode ser determinada inicialmente deacordo com a falta de informação de mixagem de parâmetro, e pode ser alteradaposteriormente através da aplicação da informação 3D correspondendo a uma posiçãodesejada pelo usuário junto ao sinal de áudio de objeto. De forma alternativa, caso o usuáriodeseje aplicar um efeito 3D somente para vários sinais de áudio de objeto, a informação denível e a informação de tempo, com respeito aos outros sinais de áudio de objeto para osquais o usuário não deseja aplicar um efeito 3D, podem ser utilizados na forma deinformação de mixagem de parâmetro.

O transcodificador 217 gera informação paralela orientada a canal com respeito a Mcanais através da sintetização da informação de parâmetro orientada a objeto considerandoN sinais de objeto transmitidos pela aparelhagem de codificação de áudio e pela informaçãode posição de uma quantidade de sinais de objeto aonde se aplica a informação 3D, talcomo um HRTF pelo componente de renderização 217.

O decodificador de múltiplos canais 213 gera um sinal de áudio com base em umsinal rebaixado e na informação paralela orientada a canal provida pelo transcodificador217, e gera um sinal de múltiplos canais 3D através da execução de uma operação derenderização 3D fazendo uso da informação 3D incluída na informação paralela orientada acanal.

A Figura 13 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio 220 de acordo com uma oitava modalidade da presente invenção.Observa-se pela Figura 13, que a aparelhagem de decodificação de áudio 220 é diferenteda aparelhagem de decodificação de áudio 210 ilustrada na Figura 12 no sentido que umtranscodificador 225 transmite informação paralela orientada a canal e informação 3Dseparadamente para um decodificador de múltiplos canais 223. Em outras palavras, otranscodificador 225 da aparelhagem de decodificação de áudio 220 obtém informaçãoparalela orientada a canal com respeito a M canais a partir da informação de parâmetroorientada a objeto com respeito aos N sinais de objeto e transmite a informação paralelaorientada a canal e a informação 3D, que é aplicada junto a cada um dos N sinais de objeto,junto ao decodificador de múltiplos canais 223, em que o transcodificador 217 daaparelhagem de decodificação de áudio 210 transmite a informação paralela orientada acanal incluindo a informação 3D junto ao decodificador de múltiplos canais 213.

A Figura 14 é referenciada em que a informação paralela orientada a canal e ainformação 3D podem incluir uma pluralidade de indexadores de quadro.Assim, odecodificador de múltiplos canais 223 pode sincronizar a informação paralela orientada acanal e a informação 3D com referência aos indexadores de quadro de cada informaçãoparalela orientada a canal e informação 3D, e pode, assim, aplicar a informação 3D junto aum quadro de um fluxo de bits correspondendo a informação 3D. Por exemplo, a informação3D apresentando um indexador 2 pode ser aplicada no início do quadro 2 apresentando umindexador 2.

Uma vez que a informação paralela orientada a canal e a informação 3D incluem,ambas, indexadores de quadro, é possível, efetivamente, se determinar uma posiçãotemporal da informação paralela orientada a canal aonde deva ser aplicada a informação3D, mesmo caso a informação 3D venha a ser atualizada periodicamente. De outra forma, otranscodificador 225 inclui informação 3D e uma quantidade de indexadores de quadro nainformação paralela orientada a canal, e, dessa maneira, o decodificador de múltiplos canais223 pode facilmente sincronizar a informação paralela orientada a canal e a informação 3D.

O processador de rebaixamento 231, o transcodificador 235, o componente derenderização 237 e a base de dados da informação 3D podem ser substituídos por um únicomódulo 239.

A Figura 15 compreende de um diagrama de blocos de uma aparelhagem dedecodificação de áudio 230 de acordo com uma nona modalidade da presente invenção.Observa-se da Figura 15 que a aparelhagem de decodificação de áudio 230 é diferenciadada aparelhagem de decodificação de áudio 220 ilustrada na Figura 14 pela inclusãoadicional de um processador de rebaixamento 231.

Mais especificamente, a aparelhagem de decodificação de áudio 230 inclui umtranscodificador 235, um componente de renderização 237, uma base de dados cominformação 3D 239, um decodificador de múltiplos canais 233, e o processador derebaixamento 231. O transcodificador 235, o componente de renderização 237, mais a basede dados com informação 3D 239, e o decodificador de múltiplos canais 233 são idênticosas suas respectivas partes contrárias, ilustradas na Figura 14. O processador derebaixamento 231 desempenha uma operação de pré-processamento em um sinalrebaixado estéreo para ajustamento da posição. A base de dados com informação 3D 239pode ser incorporada com o componente de renderização 237. Um módulo para a aplicaçãode um efeito pré-determinado junto a um sinal rebaixado pode ser fornecido também naaparelhagem de decodificação de áudio 230.A Figura 16 ilustra um diagrama de blocos de uma aparelhagem de decodificaçãode áudio 240 de acordo com uma décima modalidade da presente invenção. Vê-se pelaFigura 16 que a aparelhagem de decodificação de áudio 240 é diferenciada da aparelhagemde decodificação de áudio 230 ilustrada na Figura 15 pela inclusão de um combinador deunidade de controle de múltiplos pontos 241.

Ou seja, a aparelhagem de decodificação de áudio 240, assim como a aparelhagemde decodificação de áudio 230, inclui um processador de rebaixamento 243, umdecodificador de múltiplos canais 244, um transcodificador 245, um componente derenderização 247, e uma base de dados com informação 3D 249. O combinador de unidadede controle de múltiplos pontos 241 combina uma pluralidade de fluxos de bits obtidas pelacodificação orientada a objeto, obtendo dessa forma um único fluxo de bits. Por exemplo,quando um primeiro fluxo de bits para um primeiro sinal de áudio e um segundo fluxo de bitspara um segundo sinal de áudio são introduzidos, o combinador de unidade de controle demúltiplos pontos 241 extrai um primeiro sinal rebaixado a partir do primeiro fluxo de bits,extrai um segundo sinal rebaixado a partir do segundo fluxo de bits e gera um terceiro sinalrebaixado pela combinação do primeiro e do segundo sinais rebaixados. Ainda, ocombinador de unidade de controle de múltiplos pontos 241 extrai a primeira informaçãoparalela orientada a objeto a partir do primeiro fluxo de bits, extrai a segunda informaçãoparalela orientada a objeto a partir do segundo fluxo de bits, e gera a terceira informaçãoparalela orientada a objeto pela combinação da primeira e segunda informações paralelasorientadas a objeto. Posteriormente, o combinador de unidade de controle de múltiplospontos 241 gera um fluxo de bits através da combinação do terceiro sinal rebaixado e daterceira informação paralela orientada a objeto e libera o fluxo de bits gerado.

Portanto, de acordo com a décima modalidade da presente invenção, é possível seprocessar de maneira eficiente sinais combinados transmitidos por dois ou mais padrões decomunicação em comparação com a situação de se codificar ou decodificar cada sinal deobjeto.

De modo que o combinador de unidade de controle de múltiplos pontos 241incorpore uma pluralidade de sinais rebaixados, que são respectivamente extraídos de umapluralidade de fluxos de bits e são associados com diferentes códigos de compressão,convergindo para um único sinal rebaixado, os sinais rebaixados podem necessitar deserem convertidos em sinais de modulação de código de pulso (PCM) ou em sinais para umdomínio de freqüência pré-determinado de acordo com os tipos dos códigos de compressãodos sinais rebaixados, os sinais PCM ou os sinais obtidos pela conversão podem necessitarde serem conjuntamente combinados, e um sinal obtido pela combinação pode necessitarde ser convertido utilizando-se um código de compressão pré-determinado. Nesta situação,pode ocorrer um retardo de acordo se os sinais rebaixados são incorporados em um sinalPCM ou em um sinal no domínio de freqüência pré-determinado. Portanto, o retardo podenecessitar de ser incluído em um fluxo de bits e ser transmitido juntamente com o fluxo debits. O retardo pode indicar a quantidade de amostras de retardo em um sinal PCM ou aquantidade de amostras de retardo no domínio de freqüência pré-determinado.

Durante uma operação de codificação de áudio orientada a objeto, umaconsiderável quantidade de sinais de entrada pode às vezes necessitar de processamentoem comparação com a quantidade de sinais de entrada, em regra, processados duranteuma típica operação de codificação de múltiplos canais (por exp., uma operação decodificação de canal em formato 5,1 ou 7,1). Portanto, um método de codificação de áudioorientado a objeto requer taxas de bits muito mais elevadas do que no caso de um típicométodo de codificação de áudio de múltiplos canais orientado a canal. Contudo, uma vezque um método de codificação de áudio orientado a objeto envolve o processamento desinais de objeto que são menores do que os sinais de canal, é possível se gerar sinais desaída dinâmicos utilizando um método de codificação de áudio orientado a objeto.

Descrever-se-á em detalhes com referência as Figuras 17 até 20, um método decodificação de áudio de acordo com uma modalidade da presente invenção.

No método de codificação de áudio orientado a objeto, os sinais de objeto podemser definidos como representando sonoridades individuais, tais como a voz humana ou osom de um instrumento musical. De maneira alternativa, os sons apresentandocaracterísticas semelhantes, tais como os sons de instrumentos musicais de corda (por exp.,uma viola, e um violoncelo), sons inclusos dentro da mesma faixa de freqüência, ou sonsclassificados na mesma categoria de acordo com as direções e os ângulos de suas fontessonoras, podem ser agrupados em conjunto, e definidos pelos mesmos sinais de objeto.Ainda, de maneira alternativa, os sinais de objeto podem ser definidos fazendo-se empregoda combinação dos métodos descritos acima.

Uma quantidade de sinais de objeto pode ser transmitida na forma de um sinalrebaixado e de informação paralela. Durante a criação de informação a ser transmitida, aenergia ou potência de um sinal rebaixado ou cada pluralidade de sinais de objeto do sinalrebaixado é calculada originalmente com a finalidade de se detectar o invólucro do sinalrebaixado. Os resultados dos cálculos podem ser utilizados para a transmissão dos sinaisde objeto ou do sinal rebaixado ou para se calcular a razão de níveis dos sinais de objeto.

Um algoritmo de codificação com predição linear (LPC) pode ser empregado junto ataxas de bits mais baixas. Mais especificamente, uma quantidade de coeficientes LPC querepresenta o invólucro de um sinal é gerada através da análise do sinal, e os coeficientesLPC são transmitidos, ao invés da transmissão da informação do invólucro com respeito aosinal. Este método é eficiente em termos de taxas de bits. Contudo, uma vez que oscoeficientes LPCs tendem a se apresentardiscrepantes a partir do invólucro atual do sinal,este método requer um processo de adição, tal como correção de erro. Em resumo, ümmétodo que envolve a transmissão da informação de invólucro de um sinal pode garantir umsom de alta qualidade, mas isto resulta em um aumento considerável da quantidade deinformação que precisa ser transmitida. Por outro lado, um método que envolve a utilizaçãode coeficientes LPC pode reduzir a quantidade de informação que precisa ser transmitida,mas requer um processo adicional tal como correção de erro e resulta em uma redução daqualidade sonora.

De acordo com uma modalidade da presente invenção, pode-se utilizar umacombinação desses métodos. Em outras palavras, o invólucro de um sinal pode serrepresentado pela energia ou potência do sinal ou um valor indexado ou outro valor, talcomo um coeficiente LPC correspondendo à energia ou potência do sinal.

A informação de invólucro com respeito a um sinal pode ser obtida em unidades deseções temporais ou seções de freqüência. Mais especificamente, pela Figura 17 vê-se quea informação de invólucro com respeito a um sinal pode ser obtida em unidades de quadro.

De forma alternativa, caso um sinal seja representado por um quadro de faixa de freqüênciafazendo uso de um banco de filtro, tal como um banco de filtro em quadratura espelhada(QMF), informação de invólucro com respeito a um sinal pode ser obtida em unidades desub-faixas de freqüência, partições de sub-faixas de freqüência que compreendem fatoresmenores do que as sub-faixas de freqüência, grupos de sub-faixas de freqüência ou gruposde partições de sub-faixas de freqüência. Ainda, de forma alternativa, uma combinação dométodo orientado a quadro, o método de freqüência orientado a sub-faixa, e o método defreqüência orientado a partição de sub-faixa podem ser empregados dentro do escopo dapresente invenção.

Ainda, de forma alternativa, dado que os componentes de baixa freqüência de umsinal, em regra, apresentam mais informação do que os componentes de alta-frequência dosinal, a informação de invólucro com respeito aos componentes de baixa freqüência de umsinal pode ser transmitida como ela se apresenta, em que a informação de invólucro comrespeito aos componentes de alta-frequência do sinal pode ser representada peloscoeficientes LPC ou outros valores, e os coeficientes LPC ou outros valores podem sertransmitidos ao invés da informação de invólucro com respeito aos componentes de alta-frequência do sinal. Contudo, os componentes de baixa freqüência de um sinal podem nãoapresentar, necessariamente mais informação do que os componentes de alta-frequência dosinal. Portanto, o método descrito acima deve ter aplicação flexível de acordo com ascircunstâncias.

De acordo com uma modalidade da presente invenção, pode-se transmitir ainformação de invólucro ou o dado indexado correspondendo a uma porção (referida norelatório como a porção dominante) de um sinal que surge como dominante no eixo dotempo/frequência, e pode não se transmitir nada da informação de invólucro e do dadoindexado correspondendo a uma porção não-dominante do sinal. De maneira alternativa,pode-se transmitir os valores (por exp., os coeficientes LPC) que representam a energia e apotência da porção dominante, e pode-se não transmitir nenhum dos valorescorrespondendo a porção não-dominante do sinal. Ainda, de forma alternativa, pode-setransmitir a informação de invólucro ou do dado indexado correspondendo a porçãodominante do sinal, e os valores que representam a energia ou a potência da porção não-dominante do sinal podem ser transmitidos. Ainda, de forma alternativa, a informação comrespeito somente a porção dominante do sinal pode ser transmitida de modo que a porçãonão-dominante do sinal possa ser estimada com base na informação com respeito à porçãodominante do sinal. Ainda, de forma alternativa, pode-se utilizar uma combinação dosmétodos descritos acima.

Por exemplo, com respeito à Figura 18, caso seja dividido um sinal em um períododominante e um período não-dominante, a informação com referência ao sinal pode sertransmitida de quatro diferentes maneiras, conforme indicado por (a) até (d).

De maneira a se transmitir uma quantidade de sinais de objeto como a combinaçãode um sinal rebaixado e informação paralela, o sinal rebaixado necessita de ser dividido emuma pluralidade de elementos como parte de uma operação de decodificação, por exemplo,levando em consideração a taxa dos níveis dos sinais de objeto. De modo a se garantir aindependência entre os elementos do sinal rebaixado, uma operação para se desfazer acorrelação necessita de ser adicionalmente realizada.

Os sinais de objeto que compreendem as unidades de codificação em um métodode codificação orientado a objeto apresentam mais independência do que os sinais de canalque compreendem as unidades de codificação em um método de codificação de múltiploscanais. Em outras palavras, um sinal de canal inclui uma quantidade de sinais de objeto,necessitando de terem a correlação desfeita. Por outro lado, os sinais de objeto seapresentam independentes uns dos outros, e, assim, a separação de canal pode ser feita demaneira facilitada, utilizando-se simplesmente as características dos sinais de objeto sem anecessidade de uma operação que desfaça a correlação.

Mais especificamente, pela Figura 19, os sinais de objeto A, B, e C levam tempopara surgirem como dominantes no eixo da freqüência. Neste caso, não existe anecessidade de se dividir um sinal rebaixado em uma quantidade de sinais, de acordo coma taxa de níveis dos sinais de objeto A, B, e C e de se desfazer a correlação. Ao contrário, ainformação com respeito aos períodos dominantes dos sinais de objeto A, B, e C pode sertransmitida, ou um valor de ganho pode ser aplicado para cada componente da freqüênciade cada um dos sinais de objeto A, B, e C, evitando-se então desfazer-se a correlação.Portanto, é possível se reduzir a quantidade de computação e se reduzir a taxa de bits poruma quantidade que teria sido solicitada pela informação paralela necessária para sedesfazer a correlação.

Em resumo, de forma a se evitar desfazer a correlação, que é realizada de forma ase garantir a independência entre uma quantidade de sinais obtida via a divisão de um sinalrebaixado pela razão das razões dos sinais de objeto do sinal rebaixado, pode-se transmitirinformação com respeito a um domínio de freqüência, incluindo cada sinal de objeto naforma de informação paralela. De forma alternativa, os diferentes valores de ganho podemser aplicados junto a um período dominante durante o qual cada sinal de objeto surge comodominante e um período não-dominante durante o qual cada sinal de objeto surge comomenos dominante, e assim, informação com respeito ao período dominante pode serprincipalmente fornecida como informação paralela. Ainda, de forma alternativa, ainformação com respeito ao período dominante pode ser transmitida como informaçãoparalela, e pode não ser transmitida nenhuma informação com respeito ao período não-dominante. Ainda, de forma alternativa, pode-se fazer uso de uma combinação dos métodosdescritos acima que representam alternativas a um método para se desfazer a correlação.

Os métodos descritos acima que compreendem alternativas a um método para sedesfazer a correlação podem ser aplicados para todos os sinais de objeto ou somente paraalguns sinais de objeto que sejam períodos dominantes facilmente distinguíveis. Ainda, osmétodos descritos acima que compreendem alternativas a um método para se desfazer acorrelação podem ser aplicados de modos variáveis nas unidades de quadros.

A codificação dos sinais de áudio de objeto fazendo uso de um sinal residual serádescrita em detalhe adiante.

Em regra, em um método de codificação de áudio orientado a objeto, umaquantidade de sinais de objeto é codificada, e os resultados da codificação são transmitidosna forma de combinação de um sinal rebaixado e informação paralela. Daí, uma quantidadede sinais de objeto é restaurada a partir do sinal rebaixado através da decodificação deacordo com a informação paralela, e os sinais de objeto restaurados são devidamentemixados, por exemplo, mediante a solicitação de um usuário de acordo com a informação decontrole, gerando assim um sinal de canal final. Um método de codificação de áudioorientado a objeto, em regra, objetiva a variar livremente um sinal de canal liberado deacordo com a informação de controle com o auxílio de um mixer. Contudo, um método decodificação de áudio orientado a objeto pode também ser utilizado para gerar uma saída decanal em uma maneira pré-definida indiferentemente da informação de controle.

Para isto, a informação paralela pode incluir não somente a informação necessáriapara se obter uma quantidade de sinais de objeto a partir de um sinal rebaixado, mastambém a informação de mixagem de parâmetro necessária para se gerar um sinal decanal. Assim, é possível se gerar um sinal de saída de canal final sem o auxílio de um mixer.Neste caso, tal algoritmo pode ser empregado na forma de codificação residual para semelhorar a qualidade do som.

Um método de codificação residual típico inclui a codificação de um sinal e acodificação do erro entre o sinal codificado e o sinal original, ou seja, um sinal residual.

Durante uma operação de decodificação, o sinal codificado é decodificado enquantocompensando o erro entre o sinal codificado e o sinal original, restabelecendo assim umsinal que se apresenta semelhante ao sinal original, tanto quanto possível. Uma vez que oerro entre o sinal codificado e o sinal original, em regra, é intolerável, é possível se reduzir aquantidade de informação adicional necessária para se executara codificação residual.

Caso uma saída de canal final de um decodificador seja fixada, não somente ainformação de mixagem de parâmetro, necessária para geração de um sinal de canal final,mas também, a informação de codificação residual, podem ser fornecidas como informaçãoparalela. Neste caso, é possível se melhorar a qualidade sonora.

A Figura 20 compreende de uma aparelhagem de codificação de áudio 310 deacordo com uma modalidade da presente invenção. Pela Figura 20, a aparelhagem decodificação de áudio 310 é caracterizada pelo emprego de um sinal residual.

Mais especificamente, a aparelhagem de codificação de áudio 310 inclui umcodificador 311, um decodificador 313, um primeiro mixer 315, um segundo mixer 319, umadicionador 317, e um gerador de fluxo de bits 321.

O primeiro mixer 315 desempenha uma operação de mixagem em um sinal original,e o segundo mixer 319 desempenha uma operação de mixagem em um sinal obtida pelaexecução de uma operação de codificação, e daí, uma operação de decodificação do sinaloriginal. O adicionador 317 calcula um sinal residual entre uma saída de sinal pelo primeiromixer 315 e uma saída de sinal pelo segundo mixer 319. O gerador de fluxo de bits 321adiciona o sinal residual na informação paralela e transmite o resultado da adição. Destamaneira, é possível se melhorar a qualidade do som.

O cálculo de um sinal residual pode ser aplicado para todas as porções de um sinalou somente para as porções de baixa freqüência de um sinal. De maneira alternativa, ocálculo de um sinal residual pode ser aplicado de maneira variável somente para domíniosda freqüência incluindo os sinais dominantes em uma base de quadro a quadro. Ainda demaneira alternativa, pode-se empregar uma combinação dos métodos descritos acima.

Uma vez que a quantidade de informação paralela incluindo a informação de sinalresidual é muito maior do que a quantidade de informação paralela incluindo a ausência deinformação de sinal residual, o cálculo de um sinal residual pode ser somente aplicado paraalgumas porções de um sinal que afetam diretamente a qualidade do som, prevenindo-seassim quanto a um aumento excessivo da taxa de bits. A presente invenção pode serexecutada na forma de um código de computador fixo escrito em uma mídia de gravaçãofixa. A mídia de gravação fixa pode compreender qualquer tipo de dispositivo de gravaçãoaonde o dado é armazenado em uma maneira fixa. Exemplos da mídia de gravação fixaincluem um ROM, um RAM, um CD-ROM, uma fita magnética, um disco floppy, umadispositivo de armazenagem de dado ótico, uma onda portadora (por exp., transmissão dedados através da Internet). A mídia de gravação fixa pode ser distribuída através de umapluralidade de sistemas computacionais conectados numa rede de trabalho, de modo que ocódigo fixo seja escrito nos mesmos e ali executado em uma maneira descentralizada. Osprogramas funcionais, códigos, segmentos de códigos necessários para a execução dapresente invenção podem ser facilmente construídos por um especialista na área.

Aplicabilidade Industrial

Conforme descrito acima, de acordo com a presente invenção, as imagens sonorasapresentam-se localizadas para cada sinal de áudio de objeto beneficiando-se com asvantagens dos métodos de decodificação e codificação de áudio orientado a objeto. Assim,é possível se oferecer sons mais realísticos através da reprodução de sinais de áudio deobjeto.Ainda, a presente invenção pode ser aplicada para jogos interativos, e pode ofereceruma experiência virtualmente mais realística da realidade a um usuário.

Enquanto a presente invenção tenha sido apresentada e descrita com respeito assuas modalidades exemplares, compreender-se-á que os especialistas na área poderãoconceber várias alterações na forma e nos detalhes sem se afastarem do espírito e escopoda presente invenção definida conforme as reivindicações apensas.

Claims

1. Método de decodificação de áudio, CARACTERIZADO pelo fato decompreender:extração de um sinal rebaixado e informação paralela orientada a objeto a partir daentrada de um sinal de áudio;geração de informação de renderização com base na entrada de informação decontrole; egeração de informação paralela orientada a canal com base na informação derenderização e na informação paralela orientada a objeto.

2. Método de decodificação de áudio, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de compreender ainda geração de um sinal de áudio demúltiplos canais com base no sinal rebaixado e na informação paralela orientada a canal.

3. Método de decodificação de áudio, de acordo com a reivindicação 1,CARACTERIZADO pelo fato da informação de controle compreender de, pelo menos, umainformação tri-dimensional (3D), informação de mixagem e informação harmônica paraprocessamento de um sinal de objeto pré-determinado.

4. Método de decodificação de áudio, de acordo com a reivindicação 1,CARACTERIZADO pelo fato da geração de informação de renderização compreender aconversão da informação de tempo incluída na informação de mixagem em informação deamplitude equivalente em resposta a um comando de usuário.

5. Método de decodificação de áudio, de acordo com a reivindicação 3,CARACTERIZADO pelo fato da geração de informação de renderização compreender aindaa conversão da informação de amplitude incluída na informação de mixagem em informaçãode tempo equivalente em resposta a um comando de usuário.

6. Método de decodificação de áudio, de acordo com a reivindicação 3,CARACTERIZADO pelo fato da informação harmônica compreender, pelo menos, de umainformação de passo, informação da freqüência fundamental e informação da freqüênciadominante do sinal de objeto pré-determinado.

7. Método de decodificação de áudio, de acordo com a reivindicação 6,CARACTERIZADO pelo fato de compreender ainda ajuste de ganho do sinal de objeto pré-determinado com base na informação harmônica.

8. Método de decodificação de áudio, de acordo com a reivindicação 6,CARACTERIZADO pelo fato de compreender ainda compensação para um sinal de objetoem uma faixa de freqüência pré-determinada com base na informação harmônica.

9. Método de decodificação de áudio, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de compreender ainda compensação para um retardo entre ainformação espacial e o sinal rebaixado.

10. Aparelhagem de decodificação de áudio, CARACTERIZADA pelo fato decompreender:um demultiplexador que extrai um sinal rebaixado e uma informação paralelaorientada a objeto a partir de um sinal de áudio de entrada;um componente de renderização que gera informação de renderização com basena entrada de informação de controle; eum transcodificador que gera informação paralela orientada a canal com base nainformação de renderização e na informação paralela orientada a objeto.

11. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 10,CARACTERIZADA pelo fato de compreender ainda um decodificador de múltiplos canaisque gera um sinal de áudio de múltiplos canis com base no sinal rebaixado e na informaçãoparalela orientada a canal.

12. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 10,CARACTERIZADA pelo fato do dado de controle compreender, pelo menos, ou ainformação 3D, a informação de mixagem e a informação harmônica para processamento deum sinal de objeto pré-determinado.

13. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 12,CARACTERIZADA pelo fato do componente de renderização converter a informação detempo incluída na informação de mixagem em informação de amplitude equivalente emresposta a um comando de usuário durante a geração da informação de renderização.

14. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 12,CARACTERIZADA pelo fato do componente de renderização converter a informação deamplitude incluída na informação de mixagem em informação de tempo equivalente emresposta a um comando de usuário durante a geração da informação de renderização.

15. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 12,CARACTERIZADA pelo fato da informação harmônica compreender, pelo menos, deinformação de passo, informação de freqüência fundamental e informação de freqüênciadominante do sinal de objeto pré-determinado.

16. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 15,CARACTERIZADA pelo fato do componente de renderização ajustar o ganho de sinal deobjeto pré-determinado com base na informação harmônica.

17. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 15,CARACTERIZADA pelo fato do componente de renderização compensar um sinal de objetoem uma faixa de freqüência pré-determinada com base na informação harmônica.

18. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 10,CARACTERIZADA pelo fato de compreender ainda uma memória intermediária quecompensa um retardo entre a informação espacial e o sinal rebaixado.

19. Mídia de gravação legível por computador, CARACTERIZADA pelo fato deapresentar registrado na mesma um programa de computador para execução de um métodode decodificação de áudio, o método de decodificação de áudio compreendendo:extração de um sinal rebaixado e uma informação paralela orientada a objeto apartir da entrada de um sinal de áudio;geração de informação de renderização com base na entrada do dado de controle;egeração de informação paralela orientada a canal com base na informação derenderização e na informação paralela orientada a objeto.

20. Mídia de gravação legível por computador, de acordo com a reivindicação 19,CARACTERIZADA pelo método de decodificação de áudio compreender ainda a geraçãode um sinal de áudio de múltiplos canais fazendo uso de sinal rebaixado e da informaçãoparalela orientada a canal.