BRPI0621485A2

BRPI0621485A2 - decodificador e método para extrair sinal de down mix de fone de ouvido, decodificador para extrair sinal de down mix estéreo espacial, receptor ou reprodutor e método de recepção ou reprodução de áudio e mìdia de armazenamento

Info

Publication number: BRPI0621485A2
Application number: BRPI0621485-1A
Authority: BR
Inventors: Lars Villemoes; Kristofer Kjoerling; Jeroen Breebaart
Original assignee: Dolby Sweden Ab; Koninkl Philips Electronics Nv
Priority date: 2006-03-24
Filing date: 2006-09-01
Publication date: 2011-12-13
Also published as: EP1999999B1; JP2009531886A; ES2376889T3; EP1999999A1; KR20080107433A; RU2008142141A; US8175280B2; KR101010464B1; BRPI0621485B1; PL1999999T3; ATE532350T1; US20070223708A1; RU2407226C2; WO2007110103A1; CN101406074A; CN101406074B; JP4606507B2

Abstract

DECODIFICADOR E MéTODO PARA EXTRAIR SINAL DE DOWN MIX DE FONE DE OUVIDO, DECODIFICADOR PARA EXTRAIR SINAL DE DOWN MIX ESTéREO ESPACIAL, RECEPTOR OU REPRODUTOR E MéTODO DE RECEPçãO OU REPRODUçãO DE áUDIO E MìDIA DE ARMAZENAMENTO. A presente invenção refere-se ao down mix para os fones de ouvido (314) que pode ser eficientemente extraída a partir de uma conversão paramétrica de multicanais em estéreo de um sinal de multicanal (312), quando FTAs modificadas (310) (função de transferência relativa à cabeça) são extraídas a partir de FTAs (308) de um sinal de multicanal usando um parâmetro de nível (306) dotado de informação sobre a relação de nível entre dois canais dos sinais de multicanal de tal forma que as modificadas FTAs (310) são mais fortemente influenciadas pelas FTA (308) de um canal dotado de um nível mais alto do que pelas FTA (308) de um canal dotado de um nível mais baixo. FTAs modificadas (310) são extraidas no processo de decodificação levando em consideração a força relativa dos canais associados com as FTAs (308). As FTAs (308) são deste modo modificadas de tal forma que um down mix (314) da representação paramétrica de um sinal de muíticanal pode diretamente ser usada para promover a síntese do down mix para os fones de ouvido (314) sem a necessidade de uma reconstrução de multicanal paramétrica total intermediária da conversão paramétrica de muIticanais em sinal estéreo.

Description

Relatório Descritivo da Patente de Invenção para "DECODIFI- CADOR E MÉTODO PARA EXTRAIR SINAL DE DOWN MIX DE FONE DE OUVIDO, DECODIFICADOR PARA EXTRAIR SINAL DE DOWN MIX ES- TÉREO ESPACIAL, RECEPTOR OU REPRODUTOR E MÉTODO DE RE- CEPÇÃO OU REPRODUÇÃO DE ÁUDIO E MÍDIA DE ARMAZENAMEN- TO".

Campo da Invenção

A presente invenção refere-se à decodificação de sinais de áudio de multicanal codificados baseada em representação paramétrica multicanal e em particular à geração de down mix de dois canais proporcionando uma experiência de audição espacial como, por exemplo, um down mix espacial compatível com fones de ouvido ou um down mix espacial para arranjos de duas caixas de som.

Antecedentes da invenção na técnica anterior

O desenvolvimento recente na codificação de áudio tornou pos- sível recriar uma representação multicanal de um sinal de áudio baseada em um sinal estéreo (ou mono) e seus correspondentes dados de controle. Os referidos métodos diferem substancialmente das soluções baseadas em ma- trizes antigas tais como Dolby Prologic, uma vez que os dados de controle adicionais são transmitidos para controlar a recriação, também chamada de upmix, dos canais envolventes baseado nos canais mono ou nos canais es- téreo transmitidos.

Deste ponto, o referido decodificador de áudio paramétrico mul- ticanal, por exemplo, MPEG Envolvente, reconstrói N canais baseado em M canais transmitidos, onde N > M, e os dados adicionais de controle. Os da- dos adicionais de controle representam uma significativa taxa de dados mais baixa do que transmitindo todos os N canais, fazendo a codificação muito eficiente e ao mesmo tempo assegurando a compatibilidade com ambos os dispositivos do canal M e dispositivos do canal N.

Os métodos de codificação paramétrica envolvente em geral compreendem a parametrização do sinal envolvente baseado em Dll (Dife- rença de Intensidade Intercanal) ou DNC (Diferença de Nível de Canal) e CIC (Coerência lntercanal). Os referidos parâmetros descrevem taxas de energia e correlações entre pares de canais no processo de recriação dos canais envolventes. Ainda outros parâmetros também usados no método anterior compreendem a predição dos parâmetros usados para a predição dos canais intermediários ou dos canais de saída durante o procedimento de recriação dos canais envolventes.

Outros avanços na reprodução de conteúdo de áudio multicanal proporcionaram meios para obter uma impressão de audição espacial usan- do fones de ouvido estéreo. Para alcançar uma experiência de audição es- pacial usando apenas os dois alto-falantes do fone de ouvido, os sinais de multicanal são reduzidos a sinais estéreo usando FTA (função de transferên- cia relativa à cabeça), cuja intenção é levar em consideração as característi- cas extremamente complexas da transmissão de uma cabeça humana para proporcionar a experiência de audição espacial.

Uma outra aproximação relacionada é usar um ambiente con- vencional da reprodução de 2 canais e filtrar os canais de um sinal de áudio multicanal com filtros apropriados para alcançar uma experiência de audição próxima à referida experiência da reprodução com o número original de alto- falantes. O processamento dos sinais é semelhante à reprodução dos fones de ouvido para criar down mix espacial apropriado e sendo dotado das pro- priedades corretas. Ao contrário do caso dos fones de ouvido, os sinais de ambos os alto-falantes alcançam diretamente ambas as orelhas de um ou- vinte causando efeitos cruzados indesejados. Como o referido deve ser le- vado em consideração para uma excelente qualidade de reprodução, os fil- tros usados para o processamento de sinal são freqüentemente chamados de filtros de cancelamento de efeitos cruzados. Em geral, o alvo desta técni- ca é estender a escala possível de fontes de som fora da base do alto- falante estereofônico pelo cancelamento da interferência inerente usando complexos filtros de cancelamento de interferência.

Em razão de sua filtragem complexa, os filtros de FTA são muito longos, isto é os filtros podem compreender, cada um, diversas centenas de pontos de extração de filtragem. Pela mesma razão, dificilmente é possível encontrar um parametrização de filtros que funcione bem o bastante para não prejudicar a qualidade da percepção quando usados no lugar dos filtros atuais.

Além disso, por um lado, existem alguns que conservam repre- sentações paramétricas dos sinais de multicanais que permitem um trans- porte eficiente de um sinal codificado. Por outro lado, são apenas conheci- das as maneiras mais elegantes de se criar uma experiência de audição es- pacial para um sinal de multicanal quando são usados fones de ouvido esté- reo ou alto-falantes estéreo. No entanto, os referidos requerem que o núme- ro total de sinais sinal de multicanal seja a entrada para a aplicação da fun- ção de transferência relativa à cabeça que cria down mix. Deste modo, todo o conjunto completo de sinal de multicanal deve ser transmitido ou uma re- presentação deve ser totalmente reconstruída antes da aplicação da função de transferência relativa à cabeça ou dos filtros de anulação de interferência e deste modo tanto a largura de faixa da transmissão como a complexidade computacional são inaceitavelmente altos. Sumário da Invenção

É um objetivo da presente invenção proporcionar um conceito para uma reconstrução mais eficiente de um sinal de dois canais proporcio- nando uma experiência de audição espacial usando representações paramé- tricas de sinais de multicanal.

De acordo com um primeiro aspecto da presente invenção, o re- ferido objetivo é alcançado por um decodificador para extrair down mix de fone de ouvido usando a representação do down mix de um sinal de multi- canal e usando um parâmetro de nível dotado de informação em uma rela- ção de nível entre dois canais ou com o sinal de multicanal e usando fun- ções de transferência relativas à cabeça em relação aos dois canais do sinal de multicanal, compreendendo: um calculador de filtro para realizar a extra- ção das funções de transferência relativas à cabeça modificadas através da ponderação das funções de transferência relativa à cabeça dos dois canais usando o parâmetro de nível de tal forma que uma função de transferência relativa à cabeça modificada é fortemente influenciada pela função de trans- ferência relativa à cabeça de um canal dotado de um nível mais alto do que a função de transferência relativa à cabeça do canal dotado de um nível mais baixo; e um sintetizador para extrair o sinal de down mix de fones de ouvido usando função de transferência relativa à cabeça modificada e a re- presentação do down mix.

De acordo com um segundo aspecto da presente invenção, o re- ferido objetivo é alcançado através de um decodificador binaural, compreen- dendo: um decodificador extrair o sinal de down mix para fone de ouvido u- sando a representação de um down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação da relação de nível entre dois canais do sinal de multicanal e usando a função de transferência relativa à cabeça em relação aos dois canais dos sinais multicanal, compreendendo um calculador de filtro para extrair as funções de transferência relativas à cabeça modificadas através da ponderação das funções de transferência relativas à cabeça dos dois canais usando o parâmetro de nível de tal forma que uma função de transferência relativa à cabeça modificada é mais forte- mente influenciada pela função de transferência relativa à cabeça de um ca- nal dotado de um nível mais alto do que pela função de transferência relativa à cabeça de um canal dotado de um nível mais baixo; e um sintetizador para extrair o sinal de down mix de fones de ouvido usando as funções de trans- ferência relativas à cabeça modificadas e a representação do down mix, um banco de filtros de freqüência de análise para extrair a representação do si- nal de down mix de multicanal pela filtragem de sub-banda do down mix do sinal de multicanal; e um banco de filtros de freqüência de síntese para ex- trair o sinal do fone de ouvido de domínio de tempo pela síntese do down mix do fone de ouvido.

De acordo com um terceiro aspecto da presente invenção, o re- ferido objetivo é alcançado através do método de extrair um sinal de down mix de fone de ouvido usando a representação de um down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação em uma relação de nível entre dois canais do sinal de multicanal e usando fun- ções de transferência relativas à cabeça em relação aos dois canais do sinal de multicanal, o método compreendendo: realizar a extração, usando o pa- râmetro de nível, as funções de transferência relativas à cabeça modificadas pela ponderação das funções de transferência relativas à cabeça dos dois canais de tal forma que a função de transferência relativa à cabeça modifi- cada é mais fortemente influenciada pela função de transferência relativa à cabeça de um canal dotado de um nível mais alto do que pela função de transferência relativa à cabeça de um canal dotado de um nível mais baixo; e realizar a extração do down mix de fones de ouvido usando as funções de transferência relativas à cabeça modificadas e a representação do down mix.

De acordo com um quarto aspecto da presente invenção, o refe- rido objetivo é alcançado através de um receptor ou reprodutor de áudio do- tado de um decodificador para extrair o down mix de fones de ouvido usando a representação de um down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando as funções de transferência relativas à cabeça em relação aos dois canais do sinal de multicanal, compreenden- do: um calculador de filtro para realizar a extração das funções de transfe- rência relativas à cabeça modificadas através da ponderação das funções de transferência relativas à cabeça dos dois canais usando o parâmetro de ní- vel de tal forma que a função de transferência relativa à cabeça modificada é mais fortemente influenciada pela função de transferência relativa à cabeça de um canal dotado de um nível mais alto do que pela função de transferên- cia relativa à cabeça de um canal dotado de um nível mais baixo; e um sinte- tizador para extrair o down mix de fones de ouvido usando as funções de transferência relativas à cabeça modificadas e a representação do down mix.

De acordo com um quinto aspecto da presente invenção, o refe- rido objetivo é alcançado através de um método de recepção ou reprodução de áudio, o método dotado de um método para extrair o sinal de down mix de fone de ouvido usando a representação de um sinal de down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando as funções de transferência relativas à cabeça em relação aos dois canais do sinal de multicanal, o método compreendendo: extrair, usando o parâmetro de nível, as funções de transferência relativas à cabeça modificadas através da ponderação das funções de transferência relativas à cabeça dos dois ca- nais de tal forma que a função de transferência relativa à cabeça modificada é mais fortemente influenciada pela função de transferência relativa à cabe- ça de um canal dotado de um nível mais alto do que pela função de transfe- rência relativa à cabeça de um canal dotado de um nível mais baixo; e reali- zar a extração do down mix para os fones de ouvido usando as funções de transferência relativas à cabeça modificadas e a representação do down mix.

De acordo com um sexto aspecto da presente invenção, o refe- rido objetivo é alcançado através de um decodificador para extrair um sinal espacial de down mix usando a representação de um down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando filtros de anulação de interferência em relação aos dois canais do sinal de multicanal, compreendendo: um calculador de filtro para extrair os filtros de anulação de interferência modificados pela ponderação dos filtros de anulação de interfe- rência dos dois canais usando o parâmetro de nível de tal modo que um filtro de anulação de interferência modificado é mais fortemente influenciado pelo filtro de anulação de interferência de um canal dotado de um nível mais alto do que pelo filtro de anulação de interferência de um canal dotado de um nível mais baixo; e um sintetizador para extrair o sinal de down mix espacial usando o filtro de anulação de interferências modificado e a representação do down mix.

A presente invenção é baseada na descoberta de que um down mix para os fones de ouvido pode ser extraída a partir de um down mix pa- ramétrico de um sinal de multicanal, quando um calculador de filtro é usado para realizar a extração das FTAs modificadas (funções de transferência re- lativas à cabeça) a partir da FTA original do sinal de multicanal e quando o conversor de filtro usa um parâmetro de nível dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal de tal forma que as FTAs modificadas são mais fortemente influenciada pela FTA de um canal dotado de um nível mais alto do que pela FTA de um canal dotado de um nível mais baixo. As FTAs modificadas são extraídas durante o processo de decodificação levando em consideração a força relativa dos canais associa- dos com as FTAs. As FTAs originais são modificadas de tal modo que um down mix de uma representação paramétrica de um sinal de multicanal pode ser diretamente usada para promover a síntese do down mix para os fones de ouvido sem a necessidade de uma reconstrução de multicanal paramétri- ca da conversão paramétrica de multicanais em sinal estéreo.

Em uma modalidade da presente invenção, um criativo decodifi- cador é usado implementando a reconstrução de multicanal paramétrica bem como também uma inventiva reconstrução binaural de uma transmitida conversão paramétrica de multicanais em estéreo de um sinal de multicanal original. De acordo com a presente invenção, uma reconstrução total do si- nal de multicanal anterior para conversão binaural de multicanais em estéreo não é necessária, e é dotada da óbvia grande vantagem de uma forte redu- ção da complexidade computacional. O referido permite, por exemplo, dis- positivos celulares dotados de reservatórios de energia apenas limitados pa- ra estender significativamente o tempo de reprodução. Ainda uma outra van- tagem é que o mesmo dispositivo pode servir como pode servir como forne- cedor para sinais de multicanal completos (por exemplo, sinais 5.1, 7.1, 7.2) bem como também para a conversão binaural de multicanais em estéreo de sinal dotado de uma experiência espacial de audição mesmo quando usando apenas fones de ouvido com dois alto-falantes. O referido pode, por exem- plo, ser muito vantajoso em configurações de entretenimento doméstico.

Em ainda outra modalidade da presente invenção, um calculador de filtro é usados para realizar a extração das FTAs modificadas não somen- te eficiente para combinar as FTAs de dois canais aplicando fatores de pon- deração individuais das FTAs, mas introduzindo fatores de fase adicionais para que cada FTAs seja combinada. A introdução do fator de fase tem a vantagem de conseguir uma compensação do atraso de dois filtros antes de sua superposição ou combinação. O referido conduz a uma resposta combi- nada que modela um tempo de atraso médio que corresponde a uma posi- ção intermediária entre os alto-falantes dianteiros e os alto-falantes traseiros.

Uma segunda vantagem é que um fator de ganho, que tenha que ser aplicado durante a combinação dos filtros para assegurar a conser- vação de energia, é muito mais estável no que se refere a seu comporta- mento com a freqüência do que sem a introdução do fator de fase. O referido é particularmente relevante para o conceito criativo, uma vez que, de acordo com uma modalidade da presente invenção a representação de um down mix de um sinal de multicanal é processada dentro de um domínio de banco de filtros de freqüência para realizar a extração do sinal de down mix do fone de ouvido. Da referida maneira, diferentes bandas de freqüência da repre- sentação do down mix devem ser processadas separadamente e conse- qüentemente, um comportamento liso das funções individualmente aplicadas do ganho é vital.

Em ainda outra modalidade da presente invenção, as funções de transferência relativa à cabeça são convertidas para filtros de sub-bandas para domínios de sub-banda de tal forma que o número total de FTAs modi- ficadas usados no domínio de sub-banda é menor que o número total de FTAs originais. O referido processo é dotado da vantagem evidente de que a complexidade computacional para extrair os sinais de down mix de fone de ouvido é ainda menor em comparação com o down mix usando os filtros de FTA padrão.

Executar o conceito inventivo permite o uso de FTAs extrema- mente longas e deste modo permite a reconstrução de um down mix para os fones de ouvidos baseado em uma representação de uma conversão para- métrica de multicanais em estéreo de um sinal de multicanal com excelente qualidade de percepção.

Além disso, usando o conceito inventivo em filtros de anulação de interferências torna possível a geração de um down mix espacial para ser usada com uma instalação de 2 alto-falantes-padrão, baseada em uma re- presentação de uma conversão paramétrica de multicanais em estéreo de um sinal de multicanal com excelente qualidade de percepção.

Uma vantagem grande mais adicional do conceito inventivo da decodificação é que um único decodificador binaural inventivo que executa o conceito inventivo pode ser usado para extrair uma conversão binaural de multicanais em estéreo bem como também uma reconstrução multicanal de um down mix transmitida levando em consideração os parâmetros espaciais adicionalmente transmitidos.

Em uma modalidade da presente invenção um inventivo decodi- ficador binaural é dotado de um banco de filtros de análise de freqüência para extrair a representação do down mix do sinal de multicanal em um do- mínio de sub-banda e um inventivo decodificador implementando a calcula- ção das FTAs modificadas. O decodificador ainda compreende a síntese do banco de filtros de freqüência para finalmente extrair uma representação do domínio de tempo de um sinal de down mix de fones de ouvido, a qual está pronta para ser reproduzida por qualquer equipamento de reprodução de áudio convencional.

Nos parágrafos a seguir, os esquemas de decodificação paramé- trica do método anterior e os esquemas de decodificação binaural são expli- cados em mais detalhes com referência aos desenhos em anexo, para deli- near mais claramente as grandes vantagens do conceito inventivo.

A maioria das modalidades da presente invenção detalhadas a seguir descrevem o conceito inventivo usando FTAs. Como previamente no- tado, o processamento de FTA é similar ao uso de filtros de anulação de in- terferência. Sendo assim, todas as modalidades devem ser entendidas em referência ao processamento de FTA bem como também aos filtros de anu- lação de interferência. Em outras palavras, todos os filtros de FTA podem ser substituídos por filtros de anulação de interferência abaixo para aplicar o conceito inventivo para o uso dos filtros de anulação de interferência. Breve Descrição das Ilustrações

As modalidades preferidas da presente invenção são subse- qüentemente descritas fazendo referência às ilustrações em anexo nas quais:

a figura 1 mostra uma síntese convencional binaural usando FTAs; a figura 1b mostra um uso convencional de filtros de anulação de interferência;

a figura 2 mostra um exemplo de um codificador espacial multi- canal;

a figura 3 mostra um exemplo de acordo com o método anterior, do decodificador espacial binaural;

a figura 4 mostra um exemplo de um codificador paramétrico multicanal;

a figura 5 mostra um exemplo de um decodificador paramétrico multicanal;

a figura 6 mostra um exemplo de um inventivo decodificador; a figura 7 mostra um diagrama de bloco ilustrando o conceito de transformação de filtros em domínio de sub-banda;

a figura 8 mostra um exemplo de um inventivo decodificador;

a figura 9 mostra ainda outro exemplo de um inventivo decodifi- cador; e

a figura 10 mostra um exemplo para um inventivo receptor ou reprodutor de áudio.

Descrição detalhada das Modalidades Preferidas

As modalidades abaixo descritas são meramente ilustrativas dos princípios da presente invenção para Decodificação Binaural dos sinais de multicanal por Filtragem de FTA por superposição. Entende-se que as modi- ficações e variações dos arranjos e dos detalhes descritos aqui serão apa- rentes para aqueles versados na técnica. É a intenção, sendo assim, limitar apenas o escopo, evitando reivindicações iminentes de patente, e não os detalhes específicos apresentados através das descrições e explanação das modalidades.

De modo a melhor esboçar, as características e as vantagens da presente invenção, será agora fornecida uma explicação mais detalhada do método anterior.

Um algoritmo de síntese binaural convencional é descrito na fi- gura 1. Um conjunto de canais de entrada (esquerdo frontal (LF), direito fron- tal (RF)1 envolvente esquerdo (LS)1 envolvente direito (RS) e centro (C)), 10a, 10b, 10c, 10d e 10e é filtrado por um conjunto de FTAs 12a a 12j. Cada sinal de entrada é dividido em dois sinais (um componente L esquerdo e um componente R direito) no qual cada um dos referidos componentes do sinal é subseqüentemente filtrado por um FTA correspondendo à posição de som desejada. Finalmente, todos os sinais do ouvido esquerdo são somados em um conjugador 14a para gerar o sinal de saída binaural esquerdo L e todos os sinais do ouvido direito são somados em um conjugador 14b para gerar o sinal de saída binaural esquerdo R.

Deve-se notar que a solução de FTA pode principalmente ser re- alizada no domínio de tempo, mas em geral é preferível realizar a filtragem no domínio da freqüência graças ao aumento da eficiência computacional. O referido significa que, a adição mostrada na figura 1 é também realizada no domínio da freqüência e a subseqüente transformação em domínio de tempo é adicionalmente exigida.

A figura 1b ilustra o processo de anulação de interferência que tenciona alcançar a impressão de audição espacial usando apenas dois alto- falantes de um ambiente de reprodutor estéreo padrão.

O alvo é a reprodução de um sinal de multicanal por meio de um sistema de reprodução de áudio estéreo dotado de apenas dois alto-falantes 16a e 16b de tal forma que um ouvinte 18 experimente uma experiência de audição espacial. Uma grande diferença com respeito à reprodução de fones de ouvido é que sinais de ambos os alto-falantes 16a e 16b alcançam dire- tamente ambos ouvidos do ouvinte 18. Os referidos sinais indicados por Ii- nhas tracejadas (interferência) sendo assim devem ser elevados em consi- deração adicionalmente.

Para facilitar a explanação, apenas uma entrada de 3 canais do- tada de 3 fontes 20a a 20c é ilustrada na figura 1b. É desnecessário dizer que o cenário pode ser estendido em princípio para um número de canais arbitrário.

Para realizar a extração do sinal estéreo a ser reproduzido, cada fonte de entrada é processada por 2 dos filtros de anulação de interferências 21a a 21 f, um filtro para cada canal de sinal de reprodução. Finalmente, to- dos os sinais filtrados para o canal de reprodução esquerdo 16a e para o canal de reprodução direito 16b são somados para reprodução. É evidente que os filtros de anulação de interferências serão, em geral, diferentes para cada fonte 20a e 20b (dependendo de sua posição percebida desejada) e que os referidos filtros, além disso, dependem do ouvinte.

Em função da alta flexibilidade do conceito inventivo, o usuário se beneficia do design e da aplicação do filtro de anulação de interferências uma vez que os referidos filtros podem ser otimizados para cada aplicação ou dispositivo de reprodução individualmente. Ainda outra vantagem é que o método é computacional e extremamente eficiente, uma vez que apenas 2 bancos de filtros de freqüências de síntese são exigidos.

Um esboço inicial de um codificador de áudio espacial é mostra- do na figura 2. No referido cenário básico de codificação, um decodificador de áudio espacial 40 compreende um codificador espacial 42, um codificador de down mix 44 e a Multiplexador 46.

O sinal de entrada de multicanal 50 é analisado pelo codificador espacial 42, extraindo os parâmetros espaciais que descrevem as proprie- dades espaciais do sinal de entrada de multicanal que devem ser transmiti- das para o lado do decodificador. O sinal reduzido gerado pelo codificador espacial 42 pode, por exemplo, ser um sinal monofônico ou estéreo depen- dendo de diferentes cenários de codificação. O codificador de down mix 44 pode então codificar a conversão monofônica ou estéreo usando qualquer esquema de codificação de áudio mono ou estéreo. O multiplexador 46 cria um fluxo de dados de saída pela combinação dos parâmetros espaciais e da conversão espacial codificada de multicanais em sinal estéreo no fluxo de dados de saída.

A figura 3 mostra uma possível combinação de um decodificador multicanal correspondendo ao codificador da figura 2 e um método de sínte- se binaural, por exemplo, delineado na figura 1. Como pode ser visto, a a- bordagem do método anterior de combinar as características é simples e direta. O ajuste compreende um desmultiplexador 60, um decodificador do down mix 62, um decodificador espacial 64 e um sintetizador binaural 66. Uma entrada de fluxo de dados 68 é desmultiplexada resultando em parâ- metros espaciais 70 e um down mix do fluxo de dados. A última conversão do sinal do fluxo de dados é decodificada pelo decodificador do down mix 62 usando um decodificador convencional mono ou estéreo. O down mix deco- dificada é enviada, junto com os parâmetros espaciais 70, para o decodifica- dor espacial 64 que gera um sinal de saída multicanal 72 dotado das propri- edades espaciais indicadas pelos parâmetros espaciais 70. Com o sinal de multicanal 72 completamente reconstruído, a abordagem de simplesmente adicionar um sintetizador binaural 66 para implementar o conceito de síntese binaural da figura 1 é direto.

Sendo assim, o sinal de saída multicanal 72 é usado como as uma entrada para o sintetizador binaural 66 que possui o sinal de saída mul- ticanal para extrar o sinal de saída binaural resultante 74. A abordagem mos- trada na figura 3 é dotada de pelo menos três desvantagens:

uma representação completa do sinal de multicanal representa- ção deve ser computada como uma etapa intermediária, sendo seguida por convolução de FTA e down mix na síntese binaural.

Apesar da convolução de FTA dever ser realizada de um em um canal, pelo fato de que cada canal de áudio pode ser dotado de uma posição espacial diferente, o referido é uma situação indesejável a partir de um com- plexo ponto de vista. Além disso, a complexidade computacional é alta e a energia é desperdiçada. O decodificador espacial opera no domínio do ban- co de filtros (QMF). A convolução de FTA, por outro lado, é tipicamente apli- cada no domínio FFT. Sendo assim, uma cascata de bancos de filtros de freqüência multicanal de síntese de QMF, uma transformação multicanal de DFT, e uma transformação de OFT inverso estéreo é necessária, resultando no sistema com alta demanda computacional.

Os artefatos de codificação criados pelo decodificador espacial para criar uma reconstrução multicanal serão audíveis, e possivelmente au- mentados na saída binaural estéreo.

Uma descrição ainda mais detalhada da decodificação e da codi- ficação multicanal é fornecida nas figuras 4 e 5.

O codificador espacial 100 mostrado na figura 4 compreende um primeiro OTT (1-a-2-codificador) 102a, um segundo OTT 102b e um TTT (3- a-2-codificador) 104. Um sinal de entrada de multicanal 106 consistindo em canais LF, LS, C, RF, RS (esquerdo frontal, esquerdo-envolvente, centro, direito-frontal e direito-envolvente) é processado pelo codificador espacial 100. As caixas OTT recebem duas entradas de canais de áudio cada, e ex- traem um único canal de saída de áudio monofônico e seus parâmetros es- paciais associados, os parâmetros dotados de informação das propriedades espaciais dos canais originais com respeito um ao outro ou com respeito ao canal de saída (por exemplo, os parâmetros CLO, CIC). No codificador 100, os canais LF e os canais LS são processados por um Codificador OTT 102a e os canais RF e RS são processados por um Codificador OTT 102b. Dois sinais, L e R são gerados, um apenas sendo dotado da informação do lado esquerdo e o outro apenas dotado de informação do lado direito. Os sinais L, R e C são ainda processados pelo codificador TTT 104, gerando um down mix e adicionais parâmetros.

Os parâmetros que resultam do Codificador TTT tipicamente consistem em um par de coeficientes de predição para cada banda de parâ- metro ou um par de diferenças de nível para descrever as taxas de energia dos três sinais de entradas. Os parâmetros dos codificadores OTT consistem em diferenças de nível e coerência ou valores de referência cruzada entre os sinais de entrada para cada banda de freqüência.

Deve-se notar que apesar do esboço esquemático do codificador espacial 100 apontar para um processamento seqüencial de canais individu- ais de down mix durante a codificação, é também possível implementar um completo processamento de down mix do codificador 100 em uma única o- peração de matriz.

A figura 5 mostra um decodificador espacial correspondente, re- cebendo como uma entrada um down mix como proporcionado pelo codifi- cador da figura 4 e os parâmetros espaciais correspondente.

O Decodificador espacial 120 compreende 2-a-3 decodificadores 122 e 1-a-2 decodificadores 124a a 124c. Os sinais L0 e R0 são inseridos nos 2-a-3-decodificadores 122 que recriam um canal central C, um canal direito R e um canal esquerdo L.

Os referidos três canais são posteriormente processados pelos decodificadores OTT 124a a 124c rendendo seis canais de saída. Deve-se notar que a extração de um canal de realce de baixa freqüência EFE não é mandatória e pode ser omitido de tal forma que um único codificador de OTT pode ser salvo sem um decodificador envolvente 120 mostrado na figura 5.

De acordo com uma modalidade da presente invenção o concei- to inventivo é aplicado em um decodificador como mostrado na figura 6. O inventivo decodificador 200 compreende 2-a-3 decodificadores 104 e seis filtros de FTA 106a a 106f. Um sinal de entrada estéreo (L0, Ro) é processa- do pelo codificador de TTT 104, realizando a extração de três sinais L, C e R. Pode ser notado que é assumido que o sinal de entrada estéreo seja en- tregue no domínio de sub-banda, uma vez que o codificador de TTT pode ser o mesmo codificador como mostrada na figura 5 e deste ponto adaptado para ser operante em sinais de sub-banda. Os sinais L, R e C são sujeitos ao processamento do parâmetro de FTA pelos filtros de FTA 106a a 106f.

Os 6 canais resultantes são adicionados para gerar o par de saí- da estéreo binaural (Lb, Rb).

O codificador de TTT 106 pode ser descrito como a operação de matriz a seguir:

<formula>formula see original document page 16</formula>

Com entradas de matriz mxy dependentes dos parâmetros espa- ciais. A relação dos parâmetros espaciais e das entradas de matriz é idêntica às referidas relações do decodificador 5.1 multicanal MPEG envolvente. Ca- da uma dos três resultantes sinais L, R, e C são divididos em dois e proces- sados com parâmetros de FTA correspondendo às desejadas (percebidas) posições das referidas fontes de áudio, para o canal central (C)1 os parâme- tros espaciais da posição de fonte de áudio podem ser aplicados diretamen- te resultando em dois sinais de saída para o centro, Lb(C) e Rb(C):

<formula>formula see original document page 17</formula>

Para o canal esquerdo (L)1 os parâmetros de FTAdos canais es- querdo-frontal e esquerdo-envolvente são combinados em um conjunto de parâmetros FTA, usando os pesos WLF e WRF.

O 'compósito' de parâmetros de FTA resultante simula os efeitos de ambos os canais frontal e envolvente em sentido artificial. As equações a seguir são usadas para gerar o par da saída binaural (Lb, Rb) para o canal esquerdo:

<formula>formula see original document page 17</formula>

De maneira similar, a saída binaural para o canal direito é obtida de acordo com:

<formula>formula see original document page 17</formula>

Dadas as definições acima de Lb(C) e Rb(C)i Lb(L)1 Rb(L) Lb(R) e Rb(R)1 os sinais podem ser extraídos a partir de uma única matriz 2 por 2 dada por um sinal de entrada estéreo:

<formula>formula see original document page 17</formula>

com

h11 = m11HL(L)+m21HL(R)+m31HL(C), h12 = m12HL(L)+m22HL(R)+m22HL(C), h21 = m111HR(L)+m21HR(R)+m31HR(C), h22 = m12HR(L)+m22HR(R)+m32HR(C),

Acima assumiu-se que os elementos Hy(X)1 para Y = Lo, R0 e X = L,R,C, eram escalares complexos. No entanto, a presente invenção ensina como estender a abordagem de uma matriz de decodificador binaural 2 por 2 para lidar com comprimentos de filtros de FTA arbitrários. Para alcançar o referido, a presente invenção compreende as seguintes etapas:

• Transformar as respostas do filtro de FTA para o domínio do banco de filtros de freqüência;

• Extração total da diferença do atraso ou da diferença de fase dos pares de filtro de FTA;

• Sobrepor as respostas do par de filtros de FTA como uma fun- ção dos parâmetros do DNC

• ajustar o ganho

O referido é alcançado através da substituição dos seis ganhos complexos Hy(X) por Y = L0, Ro e X = L1 R1 C com seis filtros. Os referidos filtros são extraídos de dez filtros Hy(X) para Y = U, Ro e X = Lf1 Ls1 Rf, RS, C, os quais descrevem a resposta do filtro FTA no domínio de QMF. As refe- ridas representações QMF podem ser alcançadas de acordo com o método descrito em um dos parágrafos que se seguem.

Em outras palavras, a presente invenção ensina um conceito pa- ra extrair as FTAs modificadas através da modificação (sobreposição) dos filtros frontais de canal envolvente finais usando uma complexa combinação linear de acordo com

Como pode ser visto a partir da formula acima, realizar a extra- ção das FTAs modificadas é uma superposição pesada das originais FTAs1 adicionalmente aplicando fatores de fase. Os pesos Wa, Wfl dependem dos parâmetros DNC cuja intenção é serem usados pelos decodificadores OTT 124a e 124b da figura 5.

Os pesos W|f e W|S dependem dos parâmetros DNC da caixa "OTT" para Lf e Ls:

<formula>formula see original document page 18</formula>

Os pesos Wrf e Wre dependem dos parâmetros DNC da caixa "OTT" para Rf e Rs; <table>table see original document page 19</column></row><table>

O parâmetro de fase ^xr pode ser extraído da diferença de tempo médio do atraso entre os filtros frontal e traseiro de FTA e o índice de sub-banda η do banco QMF:

<table>table see original document page 19</column></row><table>

A função do referido parâmetro de fase na sobreposição de fil- tros é dupla. Primeiro, o referido parâmetro realiza uma compensação do atraso dos dois filtros anteriores à superposição o que leva a uma resposta combinada a qual modela um tempo médio de atraso correspondendo a uma posição da fonte entre os alto-falantes frontal e o traseiro. Segundo, o referi- do parâmetro torna o necessário fator de compensação de ganho g muito mais estável e lentamente variando sobre a freqüência, mais do que no caso de uma simples superposição com Φ** ~

O fator de ganho g é determinado pela incoerente regra de po- der de adição,

<formula>formula see original document page 19</formula>

onde

<formula>formula see original document page 19</formula>

e Pxy é o valor real da complexa correlação cruzada normalizada en- tre os filtros

e Ht(Xs) .

Para as equações acima, P denota um parâmetro descrevendo um nível médio de banda de freqüência para a resposta de impulso do filtro especificado pelos índices. A referida intensidade principal é, claro, facilmen- te extraída, uma vez que a função de resposta do filtro é conhecida.

Em caso de simples superposição com = 0, o valor de pxy varia de modo oscilatório e errático em função de freqüência, o que leva a necessidade de extensivo ajuste de ganho. Na implementação prática é ne- cessário limitar o valor do ganho g e a remanescente colorização espectral do sinal não pode ser evitada.

Em contrapartida, o uso de sobreposição com uma compensa- ção de fase baseada em atraso, como ensinado pela presente invenção, leva a um comportamento mais estável de pxy como a função de freqüência.

O referido valor é muitas vezes mais próximo de um para pares de filtro de FTA naturais uma vez que os referidos diferem principalmente em atraso e amplitude, e o propósito do parâmetro de fase é levar em consideração as diferenças de atraso domínio do banco de filtros de freqüência QMF.

Uma benéfica escolha alternativa de parâmetro de fase ^r en- sinada pela presente invenção é dada pelo ângulo de fase da correlação transversal complexa normalizada entre os filtros

Hy(Xf) e Hy(Xs)r

desempacotando os valores da fase com técnicas-padrão de de- sempacotamento padrão em função do índice η da sub-banda do banco de QMF. Esta escolha tem como conseqüência pxy nunca ser negativo e deste ponto o ganho de compensação g satisfaz <formula>formula see original document page 20</formula> para todas as sub- bandas. Além disso, a referida escolha de parâmetro de fase permite a so- breposição dos filtros dos canais frontal e envolvente em situações onde uma diferença no tempo de atraso médio não está disponível.

Para a modalidade da presente invenção como descrito acima, é explicado como transformar acuradamente as FTAs em uma representação eficiente dos Filtros FTA no domínio QMF.

A figura 7 dá um esboço principal para acuradamente transfor- mar os filtros de domínio de tempo em filtros no domínio de sub-banda dota- dos do mesmo efeito de rede em um sinal reconstruído. Afigura 7 mostra um complexo banco de análise 300, a síntese de banco 302 correspondendo ao banco de análise 300, um conversor de filtro 304 e um filtro de sub-banda 306.

Um sinal de entrada 310 é proporcionado para o qual um filtro 312 é conhecido sendo dotado das propriedades desejadas. O cerne da im- plementação do conversor de filtro 304 é que o sinal de saída 314 é dotado das mesmas características após a análise pelo banco de filtros de freqüên- cia de análise 300, subseqüente filtragem sub-banda 306 e síntese 302 co- mo se teria quando filtrado pelo filtro 312 no domínio de tempo. A tarefa de proporcionar um número de filtros de sub-banda correspondendo ao número de sub-bandas usadas é atendida pelo conversor de filtro 304.

A descrição a seguir delineia um método para a implementação de um dado filtro FIR h(v) no complexo domínio de sub-banda QMF. O prin- cípio de operação é mostrado na figura 7.

Aqui, a filtragem de sub-banda é simplesmente a aplicação de um complexo filtro valorado FIR para cada sub-banda, η = 0, 1, ..., L-1 para transformar os índices originais cn em suas contrapartes filtradas dn de acor- do com a seguinte fórmula:

<formula>formula see original document page 21</formula>

Observe que a referida fórmula é diferente de métodos bem- conhecidos desenvolvidos para bancos de filtros de freqüências criticamente misturados, uma vez que os referidos métodos exigem a filtragem multibanda com respostas mais longas. O componente principal é o conversor de filtro, o que converte qualquer filtro FIR de domínio de tempo nos complexos filtros de domínio de sub-banda. Uma vez que o complexo domínio de sub-banda QMF é definido, não há conjunto de filtros de sub-banda para um dado filtro de domínio de tempo. Diferentes filtros de sub-banda podem ser dotados do mesmo efeito de rede que o sinal do domínio de tempo. O que será descrito aqui é uma solu- ção aproximada particularmente atrativa, o que é obtida pela restrição do con- versor de filtro para ser um complexo banco de análise similar ao QMF.

Assumindo que o protótipo do conversor de filtro possui um comprimento de 64Kq um filtro de saída FIR 64Kh real é transformado em um conjunto de 64 complexos filtros de saída Kh+Kq-I de sub-banda. Para Kq = 3, um filtro FIR de 1024 saídas é convertido em 18 saídas de filtragem sub-banda com uma qualidade aproximada de 50 dB.

As saídas de filtro de sub-banda são computadas a partir da fórmula

<formula>formula see original document page 21</formula> onde q(v) é um protótipo de filtro FIR extraído do filtro protótipo QMF. Como pode ser visto, o referido é apenas um complexo banco de análise de filtro do filtro h(v) dado.

No que se segue, o conceito inventivo será esboçado para ainda outra modalidade da presente invenção, onde representação paramétrica multicanal para um sinal de multicanal dotado de cinco canais está disponí- vel. É favor notar que, na referida modalidade da presente invenção em par- ticular, os 10 filtros de FTA V y,x (como por exemplo dados por uma represen- tação QMF dos filtros 12a a 12j da figura 1) são sobrepostos em seis filtros h v,x para Y = L, R e X = L, R, C.

Os dez filtros vy x para Y = L, R e X = FL,BL,FR,BR,C descrevem as respostas dadas do filtro de FTA no domínio híbrido QMF.

A combinação dos filtros de canal frontal e envolvente é realiza- da com uma complexa combinação linear de acordo com

<formula>formula see original document page 22</formula>

Os fatores de ganho <formula>formula see original document page 22</formula> são determinados por

<formula>formula see original document page 22</formula>

Os parâmetros <formula>formula see original document page 22</formula> e os parâmetros de fase Φ são

definidos como se segue:

Um quociente médio frontal/traseiro por banda híbrida para os fil- tros de FTA é definido para Y = L,R e X = L,R por

<formula>formula see original document page 22</formula>

Além disso, os parâmetros <formula>formula see original document page 22</formula> são então defi- nidos para Y = L, R e X = L1 R por

<formula>formula see original document page 23</formula>

Onde as complexas correlações cruzadas

<formula>formula see original document page 23</formula> são definidas por

<formula>formula see original document page 23</formula>

Um desempacotamento de fase é aplicado aos parâmetros de fase ao longo do índice da sub-banda índex k de tal forma que o valor abso- luto do incremento da fase a partir da sub-banda k para a sub-banda k+1 é menor ou igual a π para k = 0,1... . Em casos onde existem duas escolhas, ± π, para o incremento, o sinal do incremento para a medida da fase no inter- valo ]- π, π ] é escolhido.

Finalmente, correlações cruzadas de fases normalizadas são de- finidas para Y = L,R e X = L,R por

<formula>formula see original document page 23</formula>

É favor notar que, no caso onde o processamento multicanal é realizado no domínio da sub-banda híbrida, isto é, no domínio onde as sub- bandas são decompostas em diferentes bandas de freqüência, um mapea- mento das respostas FTA para aos filtros de banda híbrida podem ser reali- zados, por exemplo, como se segue:

Como no caso sem um banco de filtros de freqüência híbrido, as dez respostas dadas de impulso FTA a partir da fonte X = FL,BL,FR,BR1C para o alvo Y = L,R são todos convertidos em filtros QMF de sub-banda de acordo com o método delineado acima. O resultado são os dez filtros de sub-banda

<formula>formula see original document page 23</formula>

com componentes

<formula>formula see original document page 23</formula>

Para a Sub-banda QMF m = 0,1,...,63 e as alocações de tempo

QMF

<formula>formula see original document page 23</formula>

Permita que o mapeamento de índice da banda híbrida k para a banda QMF seja denotado por m = Q(k).

Então os filtros FTA

<formula>formula see original document page 23</formula>

no domínio de banda híbrida são defi- nidos por

<formula>formula see original document page 24</formula>

Para a específica modalidade descrita nos parágrafos anteriores, a conversão de filtro de filtros de FTA em domínio QMF pode ser implemen- tada como se segue, dado um filtro FIR h(v) de comprimento Nh para ser transferido para o complexo domínio de sub-banda QMF:

A filtragem de sub-banda consiste na aplicação separada de um complexo filtro FIR valorado hm(I) para cada sub-banda QMF, m = 0,1,...,63. O componente principal é o conversor de filtro, que converte o filtro FIR de domínio de tempo dado h(v) nos complexos filtros de domínio de sub-banda hm (I)

O conversor de filtro é um complexo banco de análise similar ao banco de análise QMF. Seu protótipo de filtro q(v) é de comprimento 192. Uma ex- tensão com zeros do filtro FIR de domínio de tempo é definida por

<formula>formula see original document page 24</formula>

O domínio de filtros de sub-banda de comprimento,

<formula>formula see original document page 24</formula>

onde

<formula>formula see original document page 24</formula>

é então dado para m = 0,1,...,63 e

<formula>formula see original document page 24</formula>

por

<formula>formula see original document page 24</formula>

Apesar de o conceito inventivo ter sido detalhado com respeito ao down mix dotado de dois canais, por exemplo, um sinal estéreo transmiti- do, a aplicação do inventivo conceito não está de Neusa forma restrita ao cenário dotado de umum down mix.

Resumindo, a presente invenção se relaciona com o problema de usar longos filtros FTA ou filtros de anulação de interferências para a ren- dição binaural de sinais de multicanal paramétricos. A invenção ensina novas formas de estender a abordagem arbitrariamente comprimento de filtros de FTA.

A presente invenção compreende as seguintes características:

• Multiplicar um down mix através de uma matriz 2 por 2 onde cada elemento da matriz é um filtro FIR ou um comprimento arbitrário (como dado pelo filtro de FTA);

• Realizar a extração dos filtros na matriz 2 por 2 por sobreposi- ção dos filtros original de FTA baseado nos parâmetros multicanal transmiti- dos;

• Cálculo da sobreposição dos filtros FTA de modo que seja obti- da a correção do envelope espectral e da energia total.

A figura 8 mostra um exemplo de um inventivo decodificador 300 para extrair o sinal de down mix de fones de ouvido. O decodificador com- preende um calculador de filtro 302 e um sintetizador 304. O calculador de filtro recebe como primeiros níveis de entrada parâmetros 306 e como uma segunda entrada FTAs (funções de transferência relativas à cabeça) 308 para extrair as FTAs modificadas 310 que são dotadas do mesmo efeito de rede em um sinal quando aplicadas ao sinal no domínio de sub-banda do que as funções de transferência relativas à cabeça 308 aplicadas no domínio de tempo. As FTAs modificadas 310 servem como primeira entrada para o sintetizador 304 que recebe como uma segunda entrada a representação de um sinal de down mix 312 com um domínio de sub-banda. A representação do sinal de down mix 312 é extraída por um codificador paramétrico multica- nal e entende-se que seja usado como uma base para a reconstrução de um sinal de multicanal total por um decodificador de multicanal. O sintetizador 404 é deste modo capaz para extrair o sinal de down mix de fones de ouvi- do 314 usando as FTAs modificadas 310 e a representação do sinal do down mix 312.

Deve ser notado que as FTAs poderiam ser proporcionadas em qualquer representação paramétrica possível, por exemplo, como a função de transferência associada com o filtro, como a resposta de impulso do filtro ou como uma série de coeficientes de saída para um filtro FIR.

O exemplo anterior assume que a representação do sinal de down mix já é fornecida como uma representação de banco de filtros de fre- qüência, isto é como amostra extraída por um banco de filtros de freqüência. Em aplicações práticas, no entanto, um down mix de domínio de tempo é tipicamente fornecida e transmitida para possibilitar também a reprodução direta do sinal submetido em ambientes de reprodução simples. Sendo as- sim, na figura 9 na modalidade posterior da presente invenção, onde um de- codificador compatível binaural 400 compreende um banco de filtro de análi- se 402 e a síntese do banco de filtros de freqüência 404 e um inventivo de- codificador, que poderia, por exemplo, ser o decodificador 300 da figura 8. As funcionalidades do decodificador suas descrições aplicáveis na figura 9 bem como também na figura 8 e a descrição do decodificador 300 serão o- mitidas no parágrafo seguinte.

O banco de filtros de freqüência de análise 402 recebe o down mix de um sinal de multicanal 406 como criado por um codificador paramé- trico multicanal. O banco de filtros de freqüência de análise 402 extrai a re- presentação do banco de filtros de freqüência do sinal recebido 406 que é então inserido no decodificador 300 que extrai um sinal de down mix de fo- nes de ouvido 408, ainda no domínio do banco de filtros de freqüência. Isto é, o down mix é representada por uma variedade de amostras ou coeficien- tes nas bandas de freqüência introduzidas pelo banco de filtros de freqüên- cia de análise 402. A partir de então, para proporcionar a conversão final de multicanais em sinal estéreo para os fones de ouvido 410 no domínio de tempo do sinal de down mix de fones de ouvido 408 é inserido no banco de filtros de freqüência de síntese 404 que extrai um down mix para os fones de ouvido 410, que está pronto para ser reproduzido pelo equipamento de re- produção estéreo.

A figura 10 mostra um receptor da presente invenção ou repro- dutor de áudio 500, dotado de um decodificador de áudio da presente inven- ção 501, uma entrada de fluxo de dados 502, e uma saída de áudio 504.

Um fluxo de dados pode ser inserido na entrada 502 do reprodu- tor/receptor 500 da presente invenção. O fluxo de dados então é decodifica- do pelo decodificador 501 e o decodificado sinal é enviado ou reproduzido na saída 504 do receptor/ reprodutor de áudio 500 da presente invenção.

Apesar de alguns exemplos terem sido extraídos nos parágrafos anteriores para implementar o conceito inventivo com base em um down mix transmitida, o conceito inventivo pode também ser aplicado em configura- ções baseadas em uma única conversão de multicanais monofônica ou em mais do que dois canais de down mix.

Uma particular implementação da transferência de funções de transferência relativa à cabeça no domínio de sub-banda é oferecida na des- crição da presente invenção. No entanto, outras técnicas para extrair os fil- tros de sub-banda podem também ser usadas sem limitação do conceito in- ventivo.

Os fatores de fase introduzidos na extração das FTAs modifica- das podem ser extraídos também por outros procedimentos computacionais que não os referidos anteriormente apresentados. Sendo assim, realizar a extração dos referidos fatores de forma diferente não limita o escopo da in- venção.

Mesmo que o conceito inventivo seja mostrado particularmente para FTA e filtros de anulação de interferência, o referido conceito pode ser usado para outros filtros definidos para um ou mais canais individual de um sinal multicanal para permitir para uma geração computacionalmente eficien- te de um sinal de reprodução com alta qualidade em estéreo. Os filtros são, além disso, não apenas restritos a filtros cuja intenção é modelar um ambi- ente de audição. Mesmo filtros que adicionam componentes "artificiais" a um sinal podem ser usados tais como, por exemplo, filtros de reverberação ou outros filtros de distorção.

Dependendo de certas exigências da implementação métodos inventivos podem ser implementados em hardware ou em software. A im- plementação pode ser realizada usando um meio de armazenagem digital, em particular um disco, DVD ou um CD dotado de controle eletronicamente legível de sinais armazenados depois disso, que cooperam com um sistema programável do computador, tais que os métodos inventivos estão executa- dos. Em geral, a presente invenção é, sendo assim, um programa de compu- tador com um código de programa armazenado em um condutor legível na máquina, o código do programa sendo operante para a realização de méto- dos inventivos quando o produto de programa de computador roda em um computador. Em outras palavras, os métodos da presente invenção são, as- sim, um programa de computador dotado de um código de programa para realizar pelo menos um dentre os métodos inventivos quando o produto de programa de computador roda em um computador.

Enquanto o que foi dito acima foi particularmente mostrado e descrito com referência as suas modalidades particulares, deve ser entendi- do por aqueles versados na técnica que várias outras modificações na forma e nos detalhes podem ser realizadas sem prejuízo de seu espírito e escopo. Deve ser entendido que várias modificações podem ser implementadas a- daptando as diferentes modalidades sem prejuízo dos mais amplos concei- tos descritos aqui e compreendidos pelas reivindicações que se seguem.

Claims

1. Decodificador para extrair um sinal de down mix de fone de ouvido (314) usando a representação de um sinal de down mix de multica- nal (312) e usando um parâmetro de nível (306) dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando funções de transferência relativa à cabeça (308) em relação aos dois canais do sinal de multicanal, caracterizado por compreender: um calculador de filtro (302) para extrair uma função de transfe- rência modificada relativa à cabeça (310) através da ponderação das fun- ções de transferência relativa à cabeça (308) dos dois canais usando o pa- râmetro de nível (306) de tal forma que a função de transferência relativa à cabeça modificada (310) é mais fortemente influenciada pela função de transferência relativa à cabeça (308) de um canal dotado de um nível mais alto do que pela função de transferência relativa à cabeça (308) de um canal dotado de um nível mais baixo e que uma compensação de fase das fun- ções de transferência relativas à cabeça (304) dos dois canais é obtida antes para uma combinação das funções de transferência relativas à cabeça com- pensadas em fase e ponderadas dos dois canais; e um sintetizador (304) para extrair o sinal de down mix para os fones de ouvido (314) usando função de transferência relativa à cabeça mo- dificada (310) e a representação do down mix (312).

2. Decodificadorde acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante para extrair as fun- ções de transferência relativas à cabeça modificadas (310) ainda aplicando fatores de fase às funções de transferência relativa à cabeça (308) dos dois canais de tal forma que a função de transferência relativa à cabeça (308) de um canal dotado de um nível mais baixo é deslocada mais perto de uma fa- se média das funções de transferência relativa à cabeça (308) dos dois ca- nais do que um canal dotado de um nível mais alto.

3. Decodificador de acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante de tal forma que o número de funções de transferência relativa à cabeça modificadas (310) ex- traídas é menor do que o número de funções de transferência relativa à ca- beça (308) associadas dos dois canais.

4. Decodificador de acordo com a reivindicação 1, caracterizado pelo fato de que calculador de filtro (302) é operante para extrair as funções de transferência relativa à cabeça modificadas (310) adaptadas para serem aplicadas a uma representação do banco de filtros de freqüência do down mix.

5. Decodificador de acordo com a reivindicação 1, caracterizado por ser adaptado para usar a representação do banco de filtros de freqüên- cia do down mix extraída em um domínio do banco de filtros de freqüência.

6. Decodificadorde acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante para realizar a extrai- or as funções de transferência relativas à cabeça modificadas (310) usando funções de transferência relativas à cabeça (308) com mais do que três pa- râmetros.

7. Decodificador de acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante para extrair os fatores de ponderação para funções de transferência relativas à cabeça (308) dos dois canais usando o mesmo parâmetro de nível (306).

8. Decodificador de acordo com a reivindicação 7, caracterizado pelo fato de que o calculador de filtro (302) é operante para extrair um pri- meiro fator de ponderação Wif para um primeiro canal f e um segundo fator de ponderação Wte para um segundo canal s usando o parâmetro de nível CLDi de acordo com as seguintes fórmulas: <formula>formula see original document page 30</formula>

9. Decodificador de acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante para extrair as fun- ções de transferência relativas à cabeça modificadas (310) aplicando um fator de ganho comum a funções de transferência relativas à cabeça (308) dos dois canais de tal forma que a energia é preservada quando realizada a extração das funções de transferência relativas à cabeça modificadas (310).

10. Decodificador de acordo com a reivindicação 9, caracteriza- do pelo fato de que o fator de ganho comum está dentro do intervalo [1√2,1]

11. Decodificador de acordo com a reivindicação 2, caracteriza- do pelo fato de que o calculador de filtro (302) é operante para extrair os fa- tores de fase usando um tempo de atraso entre respostas de impulso de funções de transferência relativa à cabeça (308) dos dois canais.

12. Decodificador de acordo com a reivindicação 11, caracteri- zado pelo fato de que o calculador de filtro (302) é operativo no domínio do banco de filtros de freqüência dotado de L bandas de freqüência e extrair os deslocamentos médios de fase individual para cada banda de freqüência usando o tempo de atraso.

13. Decodificador de acordo com a reivindicação 11, caracteri- zado pelo fato de que o calculador de filtro (302) é operante no domínio de banco de filtros de freqüência dotado de mais do que 2 bandas de freqüên- cia e para extrair parâmetros de fase Φxy para cada banda de freqüência usando o tempo de atraso τxy de acordo com a seguinte fórmula <formula>formula see original document page 31</formula>

14. Decodificador de acordo com a reivindicação 2, caracteriza- do pelo fato de que o calculador de filtro (302) é operante para extrair os fa- tores de fase usando o ângulo de fase da complexa correlação cruzada normalizada entre as respostas de impulso das funções de transferência re- lativas à cabeça (308) do primeiro e do segundo canal.

15. Decodificador de acordo com a reivindicação 1, caracteriza- do pelo fato de que o primeiro canal dos dois canais é um canal frontal lado do esquerdo ou do lado direito do sinal de multicanal e o segundo canal dos dois canais é o traseiro do mesmo lado.

16. Decodificador de acordo com a reivindicação 15, caracteri- zado pelo fato de que o calculador de filtro é operante para extrair as fun- ções de transferência relativas à cabeça modificadas Hy(X) (310) usando a função de transferência relativa à cabeça Hy(Xf) do canal frontal e a função de transferência relativa à cabeça do canal traseiro Hy(Xs) usando a seguin- te combinação linear complexa: <formula>formula see original document page 32</formula> na qual φ xy é um parâmentro de fase, wsewf são fatores de pon- deração extraídos usando o parâmetro de nível (306) e g é um fator de ga- nho comum extraído usando o parâmetro de nível (306).

17. Decodificador de acordo com a reivindicação 1, caracteriza- do por ser adaptado para usar uma representação de umum down mix (312) dotado de um canal esquerdo e um canal direito extraídos a partir de um si- nal de multicanal dotado de um canal esquerdo-frontal, um canal esquerdo- envolvente, um canal direito-frontal, um canal direito-envolvente e um canal de centro.

18. Decodificador de acordo com a reivindicação 1, caracteriza- do pelo fato de que o sintetizador é operante para extrair o sinal de down mix de fones de ouvido (314) aplicando uma combinação linear de funções de transferência relativas à cabeça modificadas (310) para a representação do down mix (312) do sinal de multicanal.

19. Decodificador de acordo com a reivindicação 18, caracteri- zado pelo fato de que o sintetizador é operante para usar coeficientes para a combinação linear das funções de transferência relativas à cabeça, as quais dependem do parâmetro de nível (306).

20. Decodificador de acordo com a reivindicação 18, caracteri- zado pelo fato de que o sintetizador (304) é operante para usar coeficientes para a combinação linear dependendo de parâmetros de multicanal adicio- nais em relação a propriedades adicionais espaciais do sinal de multicanal.

21. Decodificador binaural, caracterizado por compreender: um decodificador, como definido na reivindicação 1; um banco de filtros de análise (300) para extrair a representação do sinal de down mix de multicanal (312) por filtragem de sub-banda do down mix do sinal de multicanal; e um banco de filtros de síntese (302 ) para extrair o sinal do fone de ouvido no domínio de tempo sintetizando um down mix para os fones de ouvido (314).

22. Decodificador para extrair o sinal de down mix estéreo espa- ciai usando a representação de um down mix de um sinal multicanal (312) e usando um parâmetro de nível (306) dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando um filtro de anula- ção de interferências em relação aos dois canais do sinal de multicanal, ca- racterizado por compreender: um calculador de filtro (302) para extrair um filtro de anulação de interferência modificado por meio da ponderação e aplicando fatores de fase ao filtro de anulação de interferência dos dois canais usando o parâmetro de nível (306) de tal forma que o filtro de anulação de interferências modificados é mais fortemente influenciado pelo filtro de anulação de interferência de canal dotado de um nível mais alto do que pelo filtro de anulação de interfe- rência de um canal dotado de um nível mais baixo e que uma compensação de fase dos filtros de anulação de interferência (308) dos dois canais é obti- da antes de uma combinação dos filtros de anulação de interferência ponde- rados e compensados em fase dos dois canais; e um sintetizador (304) para extrair o sinal de down mix espacial estéreo usando o filtro de anulação de interferência modificado e a represen- tação de um down mix do sinal de down mix (312).

23. Método de extrair um sinal de down mix de fone de ouvido (314) usando a representação de um down mix de um sinal de multicanal (312) e usando um parâmetro de nível (306) dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando funções de transferência relativa à cabeça (308) em relação aos dois canais do sinal de multicanal, o método caracterizado por compreender: extrair usando um parâmetro de nível (306), funções de transfe- rência relativas à cabeça modificadas (310) através da ponderação e aplica- ção de fatores de fase às funções de transferência relativas à cabeça (308) dos dois canais de tal forma que as funções de transferência relativa à cabe- ça modificadas são mais fortemente influenciadas pelas funções de transfe- rência relativa à cabeça modificadas de um canal sendo dotado de um nível mais alto do que pela função de transferência relativa à cabeça de um canal dotado de um nível mais baixo e que a compensação de fase das funções de transferências relativas a cabeça (308) dos dois canais é obtida antes para uma combinação das funções de transferência relativas à cabeça pon- deradas e compensadas em fase dos dois canais; e extrair o sinal de down mix de fone de ouvido (314) usando as funções de transferência relativas à cabeça modificadas (310) e a represen- tação do sinal de down mix.

24. Receptor ou reprodutor de áudio caracterizado pelo fato de ter um decodificador para extrair um sinal de down mix de fone de ouvido (314) como definido nas reivindicações 1 a 20.

25. Método de recepção ou reprodução de áudio, caracterizado pelo fato de ser um método para extrair um sinal de down mix de fone de ouvido (314) de acordo com a reivindicação 23.

26. Midia de armazenamento digital que tem um código de pro- grama para realizar quando rodando em um computador, um dos métodos como definido na reinvidicação 23 ou 25.