BRPI0621485A2 - decodificador e método para extrair sinal de down mix de fone de ouvido, decodificador para extrair sinal de down mix estéreo espacial, receptor ou reprodutor e método de recepção ou reprodução de áudio e mìdia de armazenamento - Google Patents

decodificador e método para extrair sinal de down mix de fone de ouvido, decodificador para extrair sinal de down mix estéreo espacial, receptor ou reprodutor e método de recepção ou reprodução de áudio e mìdia de armazenamento Download PDF

Info

Publication number
BRPI0621485A2
BRPI0621485A2 BRPI0621485-1A BRPI0621485A BRPI0621485A2 BR PI0621485 A2 BRPI0621485 A2 BR PI0621485A2 BR PI0621485 A BRPI0621485 A BR PI0621485A BR PI0621485 A2 BRPI0621485 A2 BR PI0621485A2
Authority
BR
Brazil
Prior art keywords
channel
down mix
signal
channels
head
Prior art date
Application number
BRPI0621485-1A
Other languages
English (en)
Inventor
Lars Villemoes
Kristofer Kjoerling
Jeroen Breebaart
Original Assignee
Dolby Sweden Ab
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Sweden Ab, Koninkl Philips Electronics Nv filed Critical Dolby Sweden Ab
Publication of BRPI0621485A2 publication Critical patent/BRPI0621485A2/pt
Publication of BRPI0621485B1 publication Critical patent/BRPI0621485B1/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Peptides Or Proteins (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

DECODIFICADOR E MéTODO PARA EXTRAIR SINAL DE DOWN MIX DE FONE DE OUVIDO, DECODIFICADOR PARA EXTRAIR SINAL DE DOWN MIX ESTéREO ESPACIAL, RECEPTOR OU REPRODUTOR E MéTODO DE RECEPçãO OU REPRODUçãO DE áUDIO E MìDIA DE ARMAZENAMENTO. A presente invenção refere-se ao down mix para os fones de ouvido (314) que pode ser eficientemente extraída a partir de uma conversão paramétrica de multicanais em estéreo de um sinal de multicanal (312), quando FTAs modificadas (310) (função de transferência relativa à cabeça) são extraídas a partir de FTAs (308) de um sinal de multicanal usando um parâmetro de nível (306) dotado de informação sobre a relação de nível entre dois canais dos sinais de multicanal de tal forma que as modificadas FTAs (310) são mais fortemente influenciadas pelas FTA (308) de um canal dotado de um nível mais alto do que pelas FTA (308) de um canal dotado de um nível mais baixo. FTAs modificadas (310) são extraidas no processo de decodificação levando em consideração a força relativa dos canais associados com as FTAs (308). As FTAs (308) são deste modo modificadas de tal forma que um down mix (314) da representação paramétrica de um sinal de muíticanal pode diretamente ser usada para promover a síntese do down mix para os fones de ouvido (314) sem a necessidade de uma reconstrução de multicanal paramétrica total intermediária da conversão paramétrica de muIticanais em sinal estéreo.

Description

Relatório Descritivo da Patente de Invenção para "DECODIFI- CADOR E MÉTODO PARA EXTRAIR SINAL DE DOWN MIX DE FONE DE OUVIDO, DECODIFICADOR PARA EXTRAIR SINAL DE DOWN MIX ES- TÉREO ESPACIAL, RECEPTOR OU REPRODUTOR E MÉTODO DE RE- CEPÇÃO OU REPRODUÇÃO DE ÁUDIO E MÍDIA DE ARMAZENAMEN- TO".
Campo da Invenção
A presente invenção refere-se à decodificação de sinais de áudio de multicanal codificados baseada em representação paramétrica multicanal e em particular à geração de down mix de dois canais proporcionando uma experiência de audição espacial como, por exemplo, um down mix espacial compatível com fones de ouvido ou um down mix espacial para arranjos de duas caixas de som.
Antecedentes da invenção na técnica anterior
O desenvolvimento recente na codificação de áudio tornou pos- sível recriar uma representação multicanal de um sinal de áudio baseada em um sinal estéreo (ou mono) e seus correspondentes dados de controle. Os referidos métodos diferem substancialmente das soluções baseadas em ma- trizes antigas tais como Dolby Prologic, uma vez que os dados de controle adicionais são transmitidos para controlar a recriação, também chamada de upmix, dos canais envolventes baseado nos canais mono ou nos canais es- téreo transmitidos.
Deste ponto, o referido decodificador de áudio paramétrico mul- ticanal, por exemplo, MPEG Envolvente, reconstrói N canais baseado em M canais transmitidos, onde N > M, e os dados adicionais de controle. Os da- dos adicionais de controle representam uma significativa taxa de dados mais baixa do que transmitindo todos os N canais, fazendo a codificação muito eficiente e ao mesmo tempo assegurando a compatibilidade com ambos os dispositivos do canal M e dispositivos do canal N.
Os métodos de codificação paramétrica envolvente em geral compreendem a parametrização do sinal envolvente baseado em Dll (Dife- rença de Intensidade Intercanal) ou DNC (Diferença de Nível de Canal) e CIC (Coerência lntercanal). Os referidos parâmetros descrevem taxas de energia e correlações entre pares de canais no processo de recriação dos canais envolventes. Ainda outros parâmetros também usados no método anterior compreendem a predição dos parâmetros usados para a predição dos canais intermediários ou dos canais de saída durante o procedimento de recriação dos canais envolventes.
Outros avanços na reprodução de conteúdo de áudio multicanal proporcionaram meios para obter uma impressão de audição espacial usan- do fones de ouvido estéreo. Para alcançar uma experiência de audição es- pacial usando apenas os dois alto-falantes do fone de ouvido, os sinais de multicanal são reduzidos a sinais estéreo usando FTA (função de transferên- cia relativa à cabeça), cuja intenção é levar em consideração as característi- cas extremamente complexas da transmissão de uma cabeça humana para proporcionar a experiência de audição espacial.
Uma outra aproximação relacionada é usar um ambiente con- vencional da reprodução de 2 canais e filtrar os canais de um sinal de áudio multicanal com filtros apropriados para alcançar uma experiência de audição próxima à referida experiência da reprodução com o número original de alto- falantes. O processamento dos sinais é semelhante à reprodução dos fones de ouvido para criar down mix espacial apropriado e sendo dotado das pro- priedades corretas. Ao contrário do caso dos fones de ouvido, os sinais de ambos os alto-falantes alcançam diretamente ambas as orelhas de um ou- vinte causando efeitos cruzados indesejados. Como o referido deve ser le- vado em consideração para uma excelente qualidade de reprodução, os fil- tros usados para o processamento de sinal são freqüentemente chamados de filtros de cancelamento de efeitos cruzados. Em geral, o alvo desta técni- ca é estender a escala possível de fontes de som fora da base do alto- falante estereofônico pelo cancelamento da interferência inerente usando complexos filtros de cancelamento de interferência.
Em razão de sua filtragem complexa, os filtros de FTA são muito longos, isto é os filtros podem compreender, cada um, diversas centenas de pontos de extração de filtragem. Pela mesma razão, dificilmente é possível encontrar um parametrização de filtros que funcione bem o bastante para não prejudicar a qualidade da percepção quando usados no lugar dos filtros atuais.
Além disso, por um lado, existem alguns que conservam repre- sentações paramétricas dos sinais de multicanais que permitem um trans- porte eficiente de um sinal codificado. Por outro lado, são apenas conheci- das as maneiras mais elegantes de se criar uma experiência de audição es- pacial para um sinal de multicanal quando são usados fones de ouvido esté- reo ou alto-falantes estéreo. No entanto, os referidos requerem que o núme- ro total de sinais sinal de multicanal seja a entrada para a aplicação da fun- ção de transferência relativa à cabeça que cria down mix. Deste modo, todo o conjunto completo de sinal de multicanal deve ser transmitido ou uma re- presentação deve ser totalmente reconstruída antes da aplicação da função de transferência relativa à cabeça ou dos filtros de anulação de interferência e deste modo tanto a largura de faixa da transmissão como a complexidade computacional são inaceitavelmente altos. Sumário da Invenção
É um objetivo da presente invenção proporcionar um conceito para uma reconstrução mais eficiente de um sinal de dois canais proporcio- nando uma experiência de audição espacial usando representações paramé- tricas de sinais de multicanal.
De acordo com um primeiro aspecto da presente invenção, o re- ferido objetivo é alcançado por um decodificador para extrair down mix de fone de ouvido usando a representação do down mix de um sinal de multi- canal e usando um parâmetro de nível dotado de informação em uma rela- ção de nível entre dois canais ou com o sinal de multicanal e usando fun- ções de transferência relativas à cabeça em relação aos dois canais do sinal de multicanal, compreendendo: um calculador de filtro para realizar a extra- ção das funções de transferência relativas à cabeça modificadas através da ponderação das funções de transferência relativa à cabeça dos dois canais usando o parâmetro de nível de tal forma que uma função de transferência relativa à cabeça modificada é fortemente influenciada pela função de trans- ferência relativa à cabeça de um canal dotado de um nível mais alto do que a função de transferência relativa à cabeça do canal dotado de um nível mais baixo; e um sintetizador para extrair o sinal de down mix de fones de ouvido usando função de transferência relativa à cabeça modificada e a re- presentação do down mix.
De acordo com um segundo aspecto da presente invenção, o re- ferido objetivo é alcançado através de um decodificador binaural, compreen- dendo: um decodificador extrair o sinal de down mix para fone de ouvido u- sando a representação de um down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação da relação de nível entre dois canais do sinal de multicanal e usando a função de transferência relativa à cabeça em relação aos dois canais dos sinais multicanal, compreendendo um calculador de filtro para extrair as funções de transferência relativas à cabeça modificadas através da ponderação das funções de transferência relativas à cabeça dos dois canais usando o parâmetro de nível de tal forma que uma função de transferência relativa à cabeça modificada é mais forte- mente influenciada pela função de transferência relativa à cabeça de um ca- nal dotado de um nível mais alto do que pela função de transferência relativa à cabeça de um canal dotado de um nível mais baixo; e um sintetizador para extrair o sinal de down mix de fones de ouvido usando as funções de trans- ferência relativas à cabeça modificadas e a representação do down mix, um banco de filtros de freqüência de análise para extrair a representação do si- nal de down mix de multicanal pela filtragem de sub-banda do down mix do sinal de multicanal; e um banco de filtros de freqüência de síntese para ex- trair o sinal do fone de ouvido de domínio de tempo pela síntese do down mix do fone de ouvido.
De acordo com um terceiro aspecto da presente invenção, o re- ferido objetivo é alcançado através do método de extrair um sinal de down mix de fone de ouvido usando a representação de um down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação em uma relação de nível entre dois canais do sinal de multicanal e usando fun- ções de transferência relativas à cabeça em relação aos dois canais do sinal de multicanal, o método compreendendo: realizar a extração, usando o pa- râmetro de nível, as funções de transferência relativas à cabeça modificadas pela ponderação das funções de transferência relativas à cabeça dos dois canais de tal forma que a função de transferência relativa à cabeça modifi- cada é mais fortemente influenciada pela função de transferência relativa à cabeça de um canal dotado de um nível mais alto do que pela função de transferência relativa à cabeça de um canal dotado de um nível mais baixo; e realizar a extração do down mix de fones de ouvido usando as funções de transferência relativas à cabeça modificadas e a representação do down mix.
De acordo com um quarto aspecto da presente invenção, o refe- rido objetivo é alcançado através de um receptor ou reprodutor de áudio do- tado de um decodificador para extrair o down mix de fones de ouvido usando a representação de um down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando as funções de transferência relativas à cabeça em relação aos dois canais do sinal de multicanal, compreenden- do: um calculador de filtro para realizar a extração das funções de transfe- rência relativas à cabeça modificadas através da ponderação das funções de transferência relativas à cabeça dos dois canais usando o parâmetro de ní- vel de tal forma que a função de transferência relativa à cabeça modificada é mais fortemente influenciada pela função de transferência relativa à cabeça de um canal dotado de um nível mais alto do que pela função de transferên- cia relativa à cabeça de um canal dotado de um nível mais baixo; e um sinte- tizador para extrair o down mix de fones de ouvido usando as funções de transferência relativas à cabeça modificadas e a representação do down mix.
De acordo com um quinto aspecto da presente invenção, o refe- rido objetivo é alcançado através de um método de recepção ou reprodução de áudio, o método dotado de um método para extrair o sinal de down mix de fone de ouvido usando a representação de um sinal de down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando as funções de transferência relativas à cabeça em relação aos dois canais do sinal de multicanal, o método compreendendo: extrair, usando o parâmetro de nível, as funções de transferência relativas à cabeça modificadas através da ponderação das funções de transferência relativas à cabeça dos dois ca- nais de tal forma que a função de transferência relativa à cabeça modificada é mais fortemente influenciada pela função de transferência relativa à cabe- ça de um canal dotado de um nível mais alto do que pela função de transfe- rência relativa à cabeça de um canal dotado de um nível mais baixo; e reali- zar a extração do down mix para os fones de ouvido usando as funções de transferência relativas à cabeça modificadas e a representação do down mix.
De acordo com um sexto aspecto da presente invenção, o refe- rido objetivo é alcançado através de um decodificador para extrair um sinal espacial de down mix usando a representação de um down mix de um sinal de multicanal e usando um parâmetro de nível dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando filtros de anulação de interferência em relação aos dois canais do sinal de multicanal, compreendendo: um calculador de filtro para extrair os filtros de anulação de interferência modificados pela ponderação dos filtros de anulação de interfe- rência dos dois canais usando o parâmetro de nível de tal modo que um filtro de anulação de interferência modificado é mais fortemente influenciado pelo filtro de anulação de interferência de um canal dotado de um nível mais alto do que pelo filtro de anulação de interferência de um canal dotado de um nível mais baixo; e um sintetizador para extrair o sinal de down mix espacial usando o filtro de anulação de interferências modificado e a representação do down mix.
A presente invenção é baseada na descoberta de que um down mix para os fones de ouvido pode ser extraída a partir de um down mix pa- ramétrico de um sinal de multicanal, quando um calculador de filtro é usado para realizar a extração das FTAs modificadas (funções de transferência re- lativas à cabeça) a partir da FTA original do sinal de multicanal e quando o conversor de filtro usa um parâmetro de nível dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal de tal forma que as FTAs modificadas são mais fortemente influenciada pela FTA de um canal dotado de um nível mais alto do que pela FTA de um canal dotado de um nível mais baixo. As FTAs modificadas são extraídas durante o processo de decodificação levando em consideração a força relativa dos canais associa- dos com as FTAs. As FTAs originais são modificadas de tal modo que um down mix de uma representação paramétrica de um sinal de multicanal pode ser diretamente usada para promover a síntese do down mix para os fones de ouvido sem a necessidade de uma reconstrução de multicanal paramétri- ca da conversão paramétrica de multicanais em sinal estéreo.
Em uma modalidade da presente invenção, um criativo decodifi- cador é usado implementando a reconstrução de multicanal paramétrica bem como também uma inventiva reconstrução binaural de uma transmitida conversão paramétrica de multicanais em estéreo de um sinal de multicanal original. De acordo com a presente invenção, uma reconstrução total do si- nal de multicanal anterior para conversão binaural de multicanais em estéreo não é necessária, e é dotada da óbvia grande vantagem de uma forte redu- ção da complexidade computacional. O referido permite, por exemplo, dis- positivos celulares dotados de reservatórios de energia apenas limitados pa- ra estender significativamente o tempo de reprodução. Ainda uma outra van- tagem é que o mesmo dispositivo pode servir como pode servir como forne- cedor para sinais de multicanal completos (por exemplo, sinais 5.1, 7.1, 7.2) bem como também para a conversão binaural de multicanais em estéreo de sinal dotado de uma experiência espacial de audição mesmo quando usando apenas fones de ouvido com dois alto-falantes. O referido pode, por exem- plo, ser muito vantajoso em configurações de entretenimento doméstico.
Em ainda outra modalidade da presente invenção, um calculador de filtro é usados para realizar a extração das FTAs modificadas não somen- te eficiente para combinar as FTAs de dois canais aplicando fatores de pon- deração individuais das FTAs, mas introduzindo fatores de fase adicionais para que cada FTAs seja combinada. A introdução do fator de fase tem a vantagem de conseguir uma compensação do atraso de dois filtros antes de sua superposição ou combinação. O referido conduz a uma resposta combi- nada que modela um tempo de atraso médio que corresponde a uma posi- ção intermediária entre os alto-falantes dianteiros e os alto-falantes traseiros.
Uma segunda vantagem é que um fator de ganho, que tenha que ser aplicado durante a combinação dos filtros para assegurar a conser- vação de energia, é muito mais estável no que se refere a seu comporta- mento com a freqüência do que sem a introdução do fator de fase. O referido é particularmente relevante para o conceito criativo, uma vez que, de acordo com uma modalidade da presente invenção a representação de um down mix de um sinal de multicanal é processada dentro de um domínio de banco de filtros de freqüência para realizar a extração do sinal de down mix do fone de ouvido. Da referida maneira, diferentes bandas de freqüência da repre- sentação do down mix devem ser processadas separadamente e conse- qüentemente, um comportamento liso das funções individualmente aplicadas do ganho é vital.
Em ainda outra modalidade da presente invenção, as funções de transferência relativa à cabeça são convertidas para filtros de sub-bandas para domínios de sub-banda de tal forma que o número total de FTAs modi- ficadas usados no domínio de sub-banda é menor que o número total de FTAs originais. O referido processo é dotado da vantagem evidente de que a complexidade computacional para extrair os sinais de down mix de fone de ouvido é ainda menor em comparação com o down mix usando os filtros de FTA padrão.
Executar o conceito inventivo permite o uso de FTAs extrema- mente longas e deste modo permite a reconstrução de um down mix para os fones de ouvidos baseado em uma representação de uma conversão para- métrica de multicanais em estéreo de um sinal de multicanal com excelente qualidade de percepção.
Além disso, usando o conceito inventivo em filtros de anulação de interferências torna possível a geração de um down mix espacial para ser usada com uma instalação de 2 alto-falantes-padrão, baseada em uma re- presentação de uma conversão paramétrica de multicanais em estéreo de um sinal de multicanal com excelente qualidade de percepção.
Uma vantagem grande mais adicional do conceito inventivo da decodificação é que um único decodificador binaural inventivo que executa o conceito inventivo pode ser usado para extrair uma conversão binaural de multicanais em estéreo bem como também uma reconstrução multicanal de um down mix transmitida levando em consideração os parâmetros espaciais adicionalmente transmitidos.
Em uma modalidade da presente invenção um inventivo decodi- ficador binaural é dotado de um banco de filtros de análise de freqüência para extrair a representação do down mix do sinal de multicanal em um do- mínio de sub-banda e um inventivo decodificador implementando a calcula- ção das FTAs modificadas. O decodificador ainda compreende a síntese do banco de filtros de freqüência para finalmente extrair uma representação do domínio de tempo de um sinal de down mix de fones de ouvido, a qual está pronta para ser reproduzida por qualquer equipamento de reprodução de áudio convencional.
Nos parágrafos a seguir, os esquemas de decodificação paramé- trica do método anterior e os esquemas de decodificação binaural são expli- cados em mais detalhes com referência aos desenhos em anexo, para deli- near mais claramente as grandes vantagens do conceito inventivo.
A maioria das modalidades da presente invenção detalhadas a seguir descrevem o conceito inventivo usando FTAs. Como previamente no- tado, o processamento de FTA é similar ao uso de filtros de anulação de in- terferência. Sendo assim, todas as modalidades devem ser entendidas em referência ao processamento de FTA bem como também aos filtros de anu- lação de interferência. Em outras palavras, todos os filtros de FTA podem ser substituídos por filtros de anulação de interferência abaixo para aplicar o conceito inventivo para o uso dos filtros de anulação de interferência. Breve Descrição das Ilustrações
As modalidades preferidas da presente invenção são subse- qüentemente descritas fazendo referência às ilustrações em anexo nas quais:
a figura 1 mostra uma síntese convencional binaural usando FTAs; a figura 1b mostra um uso convencional de filtros de anulação de interferência;
a figura 2 mostra um exemplo de um codificador espacial multi- canal;
a figura 3 mostra um exemplo de acordo com o método anterior, do decodificador espacial binaural;
a figura 4 mostra um exemplo de um codificador paramétrico multicanal;
a figura 5 mostra um exemplo de um decodificador paramétrico multicanal;
a figura 6 mostra um exemplo de um inventivo decodificador; a figura 7 mostra um diagrama de bloco ilustrando o conceito de transformação de filtros em domínio de sub-banda;
a figura 8 mostra um exemplo de um inventivo decodificador;
a figura 9 mostra ainda outro exemplo de um inventivo decodifi- cador; e
a figura 10 mostra um exemplo para um inventivo receptor ou reprodutor de áudio.
Descrição detalhada das Modalidades Preferidas
As modalidades abaixo descritas são meramente ilustrativas dos princípios da presente invenção para Decodificação Binaural dos sinais de multicanal por Filtragem de FTA por superposição. Entende-se que as modi- ficações e variações dos arranjos e dos detalhes descritos aqui serão apa- rentes para aqueles versados na técnica. É a intenção, sendo assim, limitar apenas o escopo, evitando reivindicações iminentes de patente, e não os detalhes específicos apresentados através das descrições e explanação das modalidades.
De modo a melhor esboçar, as características e as vantagens da presente invenção, será agora fornecida uma explicação mais detalhada do método anterior.
Um algoritmo de síntese binaural convencional é descrito na fi- gura 1. Um conjunto de canais de entrada (esquerdo frontal (LF), direito fron- tal (RF)1 envolvente esquerdo (LS)1 envolvente direito (RS) e centro (C)), 10a, 10b, 10c, 10d e 10e é filtrado por um conjunto de FTAs 12a a 12j. Cada sinal de entrada é dividido em dois sinais (um componente L esquerdo e um componente R direito) no qual cada um dos referidos componentes do sinal é subseqüentemente filtrado por um FTA correspondendo à posição de som desejada. Finalmente, todos os sinais do ouvido esquerdo são somados em um conjugador 14a para gerar o sinal de saída binaural esquerdo L e todos os sinais do ouvido direito são somados em um conjugador 14b para gerar o sinal de saída binaural esquerdo R.
Deve-se notar que a solução de FTA pode principalmente ser re- alizada no domínio de tempo, mas em geral é preferível realizar a filtragem no domínio da freqüência graças ao aumento da eficiência computacional. O referido significa que, a adição mostrada na figura 1 é também realizada no domínio da freqüência e a subseqüente transformação em domínio de tempo é adicionalmente exigida.
A figura 1b ilustra o processo de anulação de interferência que tenciona alcançar a impressão de audição espacial usando apenas dois alto- falantes de um ambiente de reprodutor estéreo padrão.
O alvo é a reprodução de um sinal de multicanal por meio de um sistema de reprodução de áudio estéreo dotado de apenas dois alto-falantes 16a e 16b de tal forma que um ouvinte 18 experimente uma experiência de audição espacial. Uma grande diferença com respeito à reprodução de fones de ouvido é que sinais de ambos os alto-falantes 16a e 16b alcançam dire- tamente ambos ouvidos do ouvinte 18. Os referidos sinais indicados por Ii- nhas tracejadas (interferência) sendo assim devem ser elevados em consi- deração adicionalmente.
Para facilitar a explanação, apenas uma entrada de 3 canais do- tada de 3 fontes 20a a 20c é ilustrada na figura 1b. É desnecessário dizer que o cenário pode ser estendido em princípio para um número de canais arbitrário.
Para realizar a extração do sinal estéreo a ser reproduzido, cada fonte de entrada é processada por 2 dos filtros de anulação de interferências 21a a 21 f, um filtro para cada canal de sinal de reprodução. Finalmente, to- dos os sinais filtrados para o canal de reprodução esquerdo 16a e para o canal de reprodução direito 16b são somados para reprodução. É evidente que os filtros de anulação de interferências serão, em geral, diferentes para cada fonte 20a e 20b (dependendo de sua posição percebida desejada) e que os referidos filtros, além disso, dependem do ouvinte.
Em função da alta flexibilidade do conceito inventivo, o usuário se beneficia do design e da aplicação do filtro de anulação de interferências uma vez que os referidos filtros podem ser otimizados para cada aplicação ou dispositivo de reprodução individualmente. Ainda outra vantagem é que o método é computacional e extremamente eficiente, uma vez que apenas 2 bancos de filtros de freqüências de síntese são exigidos.
Um esboço inicial de um codificador de áudio espacial é mostra- do na figura 2. No referido cenário básico de codificação, um decodificador de áudio espacial 40 compreende um codificador espacial 42, um codificador de down mix 44 e a Multiplexador 46.
O sinal de entrada de multicanal 50 é analisado pelo codificador espacial 42, extraindo os parâmetros espaciais que descrevem as proprie- dades espaciais do sinal de entrada de multicanal que devem ser transmiti- das para o lado do decodificador. O sinal reduzido gerado pelo codificador espacial 42 pode, por exemplo, ser um sinal monofônico ou estéreo depen- dendo de diferentes cenários de codificação. O codificador de down mix 44 pode então codificar a conversão monofônica ou estéreo usando qualquer esquema de codificação de áudio mono ou estéreo. O multiplexador 46 cria um fluxo de dados de saída pela combinação dos parâmetros espaciais e da conversão espacial codificada de multicanais em sinal estéreo no fluxo de dados de saída.
A figura 3 mostra uma possível combinação de um decodificador multicanal correspondendo ao codificador da figura 2 e um método de sínte- se binaural, por exemplo, delineado na figura 1. Como pode ser visto, a a- bordagem do método anterior de combinar as características é simples e direta. O ajuste compreende um desmultiplexador 60, um decodificador do down mix 62, um decodificador espacial 64 e um sintetizador binaural 66. Uma entrada de fluxo de dados 68 é desmultiplexada resultando em parâ- metros espaciais 70 e um down mix do fluxo de dados. A última conversão do sinal do fluxo de dados é decodificada pelo decodificador do down mix 62 usando um decodificador convencional mono ou estéreo. O down mix deco- dificada é enviada, junto com os parâmetros espaciais 70, para o decodifica- dor espacial 64 que gera um sinal de saída multicanal 72 dotado das propri- edades espaciais indicadas pelos parâmetros espaciais 70. Com o sinal de multicanal 72 completamente reconstruído, a abordagem de simplesmente adicionar um sintetizador binaural 66 para implementar o conceito de síntese binaural da figura 1 é direto.
Sendo assim, o sinal de saída multicanal 72 é usado como as uma entrada para o sintetizador binaural 66 que possui o sinal de saída mul- ticanal para extrar o sinal de saída binaural resultante 74. A abordagem mos- trada na figura 3 é dotada de pelo menos três desvantagens:
uma representação completa do sinal de multicanal representa- ção deve ser computada como uma etapa intermediária, sendo seguida por convolução de FTA e down mix na síntese binaural.
Apesar da convolução de FTA dever ser realizada de um em um canal, pelo fato de que cada canal de áudio pode ser dotado de uma posição espacial diferente, o referido é uma situação indesejável a partir de um com- plexo ponto de vista. Além disso, a complexidade computacional é alta e a energia é desperdiçada. O decodificador espacial opera no domínio do ban- co de filtros (QMF). A convolução de FTA, por outro lado, é tipicamente apli- cada no domínio FFT. Sendo assim, uma cascata de bancos de filtros de freqüência multicanal de síntese de QMF, uma transformação multicanal de DFT, e uma transformação de OFT inverso estéreo é necessária, resultando no sistema com alta demanda computacional.
Os artefatos de codificação criados pelo decodificador espacial para criar uma reconstrução multicanal serão audíveis, e possivelmente au- mentados na saída binaural estéreo.
Uma descrição ainda mais detalhada da decodificação e da codi- ficação multicanal é fornecida nas figuras 4 e 5.
O codificador espacial 100 mostrado na figura 4 compreende um primeiro OTT (1-a-2-codificador) 102a, um segundo OTT 102b e um TTT (3- a-2-codificador) 104. Um sinal de entrada de multicanal 106 consistindo em canais LF, LS, C, RF, RS (esquerdo frontal, esquerdo-envolvente, centro, direito-frontal e direito-envolvente) é processado pelo codificador espacial 100. As caixas OTT recebem duas entradas de canais de áudio cada, e ex- traem um único canal de saída de áudio monofônico e seus parâmetros es- paciais associados, os parâmetros dotados de informação das propriedades espaciais dos canais originais com respeito um ao outro ou com respeito ao canal de saída (por exemplo, os parâmetros CLO, CIC). No codificador 100, os canais LF e os canais LS são processados por um Codificador OTT 102a e os canais RF e RS são processados por um Codificador OTT 102b. Dois sinais, L e R são gerados, um apenas sendo dotado da informação do lado esquerdo e o outro apenas dotado de informação do lado direito. Os sinais L, R e C são ainda processados pelo codificador TTT 104, gerando um down mix e adicionais parâmetros.
Os parâmetros que resultam do Codificador TTT tipicamente consistem em um par de coeficientes de predição para cada banda de parâ- metro ou um par de diferenças de nível para descrever as taxas de energia dos três sinais de entradas. Os parâmetros dos codificadores OTT consistem em diferenças de nível e coerência ou valores de referência cruzada entre os sinais de entrada para cada banda de freqüência.
Deve-se notar que apesar do esboço esquemático do codificador espacial 100 apontar para um processamento seqüencial de canais individu- ais de down mix durante a codificação, é também possível implementar um completo processamento de down mix do codificador 100 em uma única o- peração de matriz.
A figura 5 mostra um decodificador espacial correspondente, re- cebendo como uma entrada um down mix como proporcionado pelo codifi- cador da figura 4 e os parâmetros espaciais correspondente.
O Decodificador espacial 120 compreende 2-a-3 decodificadores 122 e 1-a-2 decodificadores 124a a 124c. Os sinais L0 e R0 são inseridos nos 2-a-3-decodificadores 122 que recriam um canal central C, um canal direito R e um canal esquerdo L.
Os referidos três canais são posteriormente processados pelos decodificadores OTT 124a a 124c rendendo seis canais de saída. Deve-se notar que a extração de um canal de realce de baixa freqüência EFE não é mandatória e pode ser omitido de tal forma que um único codificador de OTT pode ser salvo sem um decodificador envolvente 120 mostrado na figura 5.
De acordo com uma modalidade da presente invenção o concei- to inventivo é aplicado em um decodificador como mostrado na figura 6. O inventivo decodificador 200 compreende 2-a-3 decodificadores 104 e seis filtros de FTA 106a a 106f. Um sinal de entrada estéreo (L0, Ro) é processa- do pelo codificador de TTT 104, realizando a extração de três sinais L, C e R. Pode ser notado que é assumido que o sinal de entrada estéreo seja en- tregue no domínio de sub-banda, uma vez que o codificador de TTT pode ser o mesmo codificador como mostrada na figura 5 e deste ponto adaptado para ser operante em sinais de sub-banda. Os sinais L, R e C são sujeitos ao processamento do parâmetro de FTA pelos filtros de FTA 106a a 106f.
Os 6 canais resultantes são adicionados para gerar o par de saí- da estéreo binaural (Lb, Rb).
O codificador de TTT 106 pode ser descrito como a operação de matriz a seguir:
<formula>formula see original document page 16</formula>
Com entradas de matriz mxy dependentes dos parâmetros espa- ciais. A relação dos parâmetros espaciais e das entradas de matriz é idêntica às referidas relações do decodificador 5.1 multicanal MPEG envolvente. Ca- da uma dos três resultantes sinais L, R, e C são divididos em dois e proces- sados com parâmetros de FTA correspondendo às desejadas (percebidas) posições das referidas fontes de áudio, para o canal central (C)1 os parâme- tros espaciais da posição de fonte de áudio podem ser aplicados diretamen- te resultando em dois sinais de saída para o centro, Lb(C) e Rb(C):
<formula>formula see original document page 17</formula>
Para o canal esquerdo (L)1 os parâmetros de FTAdos canais es- querdo-frontal e esquerdo-envolvente são combinados em um conjunto de parâmetros FTA, usando os pesos WLF e WRF.
O 'compósito' de parâmetros de FTA resultante simula os efeitos de ambos os canais frontal e envolvente em sentido artificial. As equações a seguir são usadas para gerar o par da saída binaural (Lb, Rb) para o canal esquerdo:
<formula>formula see original document page 17</formula>
De maneira similar, a saída binaural para o canal direito é obtida de acordo com:
<formula>formula see original document page 17</formula>
Dadas as definições acima de Lb(C) e Rb(C)i Lb(L)1 Rb(L) Lb(R) e Rb(R)1 os sinais podem ser extraídos a partir de uma única matriz 2 por 2 dada por um sinal de entrada estéreo:
<formula>formula see original document page 17</formula>
com
h11 = m11HL(L)+m21HL(R)+m31HL(C), h12 = m12HL(L)+m22HL(R)+m22HL(C), h21 = m111HR(L)+m21HR(R)+m31HR(C), h22 = m12HR(L)+m22HR(R)+m32HR(C),
Acima assumiu-se que os elementos Hy(X)1 para Y = Lo, R0 e X = L,R,C, eram escalares complexos. No entanto, a presente invenção ensina como estender a abordagem de uma matriz de decodificador binaural 2 por 2 para lidar com comprimentos de filtros de FTA arbitrários. Para alcançar o referido, a presente invenção compreende as seguintes etapas:
• Transformar as respostas do filtro de FTA para o domínio do banco de filtros de freqüência;
• Extração total da diferença do atraso ou da diferença de fase dos pares de filtro de FTA;
• Sobrepor as respostas do par de filtros de FTA como uma fun- ção dos parâmetros do DNC
• ajustar o ganho
O referido é alcançado através da substituição dos seis ganhos complexos Hy(X) por Y = L0, Ro e X = L1 R1 C com seis filtros. Os referidos filtros são extraídos de dez filtros Hy(X) para Y = U, Ro e X = Lf1 Ls1 Rf, RS, C, os quais descrevem a resposta do filtro FTA no domínio de QMF. As refe- ridas representações QMF podem ser alcançadas de acordo com o método descrito em um dos parágrafos que se seguem.
Em outras palavras, a presente invenção ensina um conceito pa- ra extrair as FTAs modificadas através da modificação (sobreposição) dos filtros frontais de canal envolvente finais usando uma complexa combinação linear de acordo com
Como pode ser visto a partir da formula acima, realizar a extra- ção das FTAs modificadas é uma superposição pesada das originais FTAs1 adicionalmente aplicando fatores de fase. Os pesos Wa, Wfl dependem dos parâmetros DNC cuja intenção é serem usados pelos decodificadores OTT 124a e 124b da figura 5.
Os pesos W|f e W|S dependem dos parâmetros DNC da caixa "OTT" para Lf e Ls:
<formula>formula see original document page 18</formula>
Os pesos Wrf e Wre dependem dos parâmetros DNC da caixa "OTT" para Rf e Rs; <table>table see original document page 19</column></row><table>
O parâmetro de fase ^xr pode ser extraído da diferença de tempo médio do atraso entre os filtros frontal e traseiro de FTA e o índice de sub-banda η do banco QMF:
<table>table see original document page 19</column></row><table>
A função do referido parâmetro de fase na sobreposição de fil- tros é dupla. Primeiro, o referido parâmetro realiza uma compensação do atraso dos dois filtros anteriores à superposição o que leva a uma resposta combinada a qual modela um tempo médio de atraso correspondendo a uma posição da fonte entre os alto-falantes frontal e o traseiro. Segundo, o referi- do parâmetro torna o necessário fator de compensação de ganho g muito mais estável e lentamente variando sobre a freqüência, mais do que no caso de uma simples superposição com Φ** ~
O fator de ganho g é determinado pela incoerente regra de po- der de adição,
<formula>formula see original document page 19</formula>
onde
<formula>formula see original document page 19</formula>
e Pxy é o valor real da complexa correlação cruzada normalizada en- tre os filtros
e Ht(Xs) .
Para as equações acima, P denota um parâmetro descrevendo um nível médio de banda de freqüência para a resposta de impulso do filtro especificado pelos índices. A referida intensidade principal é, claro, facilmen- te extraída, uma vez que a função de resposta do filtro é conhecida.
Em caso de simples superposição com = 0, o valor de pxy varia de modo oscilatório e errático em função de freqüência, o que leva a necessidade de extensivo ajuste de ganho. Na implementação prática é ne- cessário limitar o valor do ganho g e a remanescente colorização espectral do sinal não pode ser evitada.
Em contrapartida, o uso de sobreposição com uma compensa- ção de fase baseada em atraso, como ensinado pela presente invenção, leva a um comportamento mais estável de pxy como a função de freqüência.
O referido valor é muitas vezes mais próximo de um para pares de filtro de FTA naturais uma vez que os referidos diferem principalmente em atraso e amplitude, e o propósito do parâmetro de fase é levar em consideração as diferenças de atraso domínio do banco de filtros de freqüência QMF.
Uma benéfica escolha alternativa de parâmetro de fase ^r en- sinada pela presente invenção é dada pelo ângulo de fase da correlação transversal complexa normalizada entre os filtros
Hy(Xf) e Hy(Xs)r
desempacotando os valores da fase com técnicas-padrão de de- sempacotamento padrão em função do índice η da sub-banda do banco de QMF. Esta escolha tem como conseqüência pxy nunca ser negativo e deste ponto o ganho de compensação g satisfaz <formula>formula see original document page 20</formula> para todas as sub- bandas. Além disso, a referida escolha de parâmetro de fase permite a so- breposição dos filtros dos canais frontal e envolvente em situações onde uma diferença no tempo de atraso médio não está disponível.
Para a modalidade da presente invenção como descrito acima, é explicado como transformar acuradamente as FTAs em uma representação eficiente dos Filtros FTA no domínio QMF.
A figura 7 dá um esboço principal para acuradamente transfor- mar os filtros de domínio de tempo em filtros no domínio de sub-banda dota- dos do mesmo efeito de rede em um sinal reconstruído. Afigura 7 mostra um complexo banco de análise 300, a síntese de banco 302 correspondendo ao banco de análise 300, um conversor de filtro 304 e um filtro de sub-banda 306.
Um sinal de entrada 310 é proporcionado para o qual um filtro 312 é conhecido sendo dotado das propriedades desejadas. O cerne da im- plementação do conversor de filtro 304 é que o sinal de saída 314 é dotado das mesmas características após a análise pelo banco de filtros de freqüên- cia de análise 300, subseqüente filtragem sub-banda 306 e síntese 302 co- mo se teria quando filtrado pelo filtro 312 no domínio de tempo. A tarefa de proporcionar um número de filtros de sub-banda correspondendo ao número de sub-bandas usadas é atendida pelo conversor de filtro 304.
A descrição a seguir delineia um método para a implementação de um dado filtro FIR h(v) no complexo domínio de sub-banda QMF. O prin- cípio de operação é mostrado na figura 7.
Aqui, a filtragem de sub-banda é simplesmente a aplicação de um complexo filtro valorado FIR para cada sub-banda, η = 0, 1, ..., L-1 para transformar os índices originais cn em suas contrapartes filtradas dn de acor- do com a seguinte fórmula:
<formula>formula see original document page 21</formula>
Observe que a referida fórmula é diferente de métodos bem- conhecidos desenvolvidos para bancos de filtros de freqüências criticamente misturados, uma vez que os referidos métodos exigem a filtragem multibanda com respostas mais longas. O componente principal é o conversor de filtro, o que converte qualquer filtro FIR de domínio de tempo nos complexos filtros de domínio de sub-banda. Uma vez que o complexo domínio de sub-banda QMF é definido, não há conjunto de filtros de sub-banda para um dado filtro de domínio de tempo. Diferentes filtros de sub-banda podem ser dotados do mesmo efeito de rede que o sinal do domínio de tempo. O que será descrito aqui é uma solu- ção aproximada particularmente atrativa, o que é obtida pela restrição do con- versor de filtro para ser um complexo banco de análise similar ao QMF.
Assumindo que o protótipo do conversor de filtro possui um comprimento de 64Kq um filtro de saída FIR 64Kh real é transformado em um conjunto de 64 complexos filtros de saída Kh+Kq-I de sub-banda. Para Kq = 3, um filtro FIR de 1024 saídas é convertido em 18 saídas de filtragem sub-banda com uma qualidade aproximada de 50 dB.
As saídas de filtro de sub-banda são computadas a partir da fórmula
<formula>formula see original document page 21</formula> onde q(v) é um protótipo de filtro FIR extraído do filtro protótipo QMF. Como pode ser visto, o referido é apenas um complexo banco de análise de filtro do filtro h(v) dado.
No que se segue, o conceito inventivo será esboçado para ainda outra modalidade da presente invenção, onde representação paramétrica multicanal para um sinal de multicanal dotado de cinco canais está disponí- vel. É favor notar que, na referida modalidade da presente invenção em par- ticular, os 10 filtros de FTA V y,x (como por exemplo dados por uma represen- tação QMF dos filtros 12a a 12j da figura 1) são sobrepostos em seis filtros h v,x para Y = L, R e X = L, R, C.
Os dez filtros vy x para Y = L, R e X = FL,BL,FR,BR,C descrevem as respostas dadas do filtro de FTA no domínio híbrido QMF.
A combinação dos filtros de canal frontal e envolvente é realiza- da com uma complexa combinação linear de acordo com
<formula>formula see original document page 22</formula>
Os fatores de ganho <formula>formula see original document page 22</formula> são determinados por
<formula>formula see original document page 22</formula>
Os parâmetros <formula>formula see original document page 22</formula> e os parâmetros de fase Φ são
definidos como se segue:
Um quociente médio frontal/traseiro por banda híbrida para os fil- tros de FTA é definido para Y = L,R e X = L,R por
<formula>formula see original document page 22</formula>
Além disso, os parâmetros <formula>formula see original document page 22</formula> são então defi- nidos para Y = L, R e X = L1 R por
<formula>formula see original document page 23</formula>
Onde as complexas correlações cruzadas
<formula>formula see original document page 23</formula> são definidas por
<formula>formula see original document page 23</formula>
Um desempacotamento de fase é aplicado aos parâmetros de fase ao longo do índice da sub-banda índex k de tal forma que o valor abso- luto do incremento da fase a partir da sub-banda k para a sub-banda k+1 é menor ou igual a π para k = 0,1... . Em casos onde existem duas escolhas, ± π, para o incremento, o sinal do incremento para a medida da fase no inter- valo ]- π, π ] é escolhido.
Finalmente, correlações cruzadas de fases normalizadas são de- finidas para Y = L,R e X = L,R por
<formula>formula see original document page 23</formula>
É favor notar que, no caso onde o processamento multicanal é realizado no domínio da sub-banda híbrida, isto é, no domínio onde as sub- bandas são decompostas em diferentes bandas de freqüência, um mapea- mento das respostas FTA para aos filtros de banda híbrida podem ser reali- zados, por exemplo, como se segue:
Como no caso sem um banco de filtros de freqüência híbrido, as dez respostas dadas de impulso FTA a partir da fonte X = FL,BL,FR,BR1C para o alvo Y = L,R são todos convertidos em filtros QMF de sub-banda de acordo com o método delineado acima. O resultado são os dez filtros de sub-banda
<formula>formula see original document page 23</formula>
com componentes
<formula>formula see original document page 23</formula>
Para a Sub-banda QMF m = 0,1,...,63 e as alocações de tempo
QMF
<formula>formula see original document page 23</formula>
Permita que o mapeamento de índice da banda híbrida k para a banda QMF seja denotado por m = Q(k).
Então os filtros FTA
<formula>formula see original document page 23</formula>
no domínio de banda híbrida são defi- nidos por
<formula>formula see original document page 24</formula>
Para a específica modalidade descrita nos parágrafos anteriores, a conversão de filtro de filtros de FTA em domínio QMF pode ser implemen- tada como se segue, dado um filtro FIR h(v) de comprimento Nh para ser transferido para o complexo domínio de sub-banda QMF:
A filtragem de sub-banda consiste na aplicação separada de um complexo filtro FIR valorado hm(I) para cada sub-banda QMF, m = 0,1,...,63. O componente principal é o conversor de filtro, que converte o filtro FIR de domínio de tempo dado h(v) nos complexos filtros de domínio de sub-banda hm (I)
O conversor de filtro é um complexo banco de análise similar ao banco de análise QMF. Seu protótipo de filtro q(v) é de comprimento 192. Uma ex- tensão com zeros do filtro FIR de domínio de tempo é definida por
<formula>formula see original document page 24</formula>
O domínio de filtros de sub-banda de comprimento,
<formula>formula see original document page 24</formula>
onde
<formula>formula see original document page 24</formula>
é então dado para m = 0,1,...,63 e
<formula>formula see original document page 24</formula>
por
<formula>formula see original document page 24</formula>
Apesar de o conceito inventivo ter sido detalhado com respeito ao down mix dotado de dois canais, por exemplo, um sinal estéreo transmiti- do, a aplicação do inventivo conceito não está de Neusa forma restrita ao cenário dotado de umum down mix.
Resumindo, a presente invenção se relaciona com o problema de usar longos filtros FTA ou filtros de anulação de interferências para a ren- dição binaural de sinais de multicanal paramétricos. A invenção ensina novas formas de estender a abordagem arbitrariamente comprimento de filtros de FTA.
A presente invenção compreende as seguintes características:
• Multiplicar um down mix através de uma matriz 2 por 2 onde cada elemento da matriz é um filtro FIR ou um comprimento arbitrário (como dado pelo filtro de FTA);
• Realizar a extração dos filtros na matriz 2 por 2 por sobreposi- ção dos filtros original de FTA baseado nos parâmetros multicanal transmiti- dos;
• Cálculo da sobreposição dos filtros FTA de modo que seja obti- da a correção do envelope espectral e da energia total.
A figura 8 mostra um exemplo de um inventivo decodificador 300 para extrair o sinal de down mix de fones de ouvido. O decodificador com- preende um calculador de filtro 302 e um sintetizador 304. O calculador de filtro recebe como primeiros níveis de entrada parâmetros 306 e como uma segunda entrada FTAs (funções de transferência relativas à cabeça) 308 para extrair as FTAs modificadas 310 que são dotadas do mesmo efeito de rede em um sinal quando aplicadas ao sinal no domínio de sub-banda do que as funções de transferência relativas à cabeça 308 aplicadas no domínio de tempo. As FTAs modificadas 310 servem como primeira entrada para o sintetizador 304 que recebe como uma segunda entrada a representação de um sinal de down mix 312 com um domínio de sub-banda. A representação do sinal de down mix 312 é extraída por um codificador paramétrico multica- nal e entende-se que seja usado como uma base para a reconstrução de um sinal de multicanal total por um decodificador de multicanal. O sintetizador 404 é deste modo capaz para extrair o sinal de down mix de fones de ouvi- do 314 usando as FTAs modificadas 310 e a representação do sinal do down mix 312.
Deve ser notado que as FTAs poderiam ser proporcionadas em qualquer representação paramétrica possível, por exemplo, como a função de transferência associada com o filtro, como a resposta de impulso do filtro ou como uma série de coeficientes de saída para um filtro FIR.
O exemplo anterior assume que a representação do sinal de down mix já é fornecida como uma representação de banco de filtros de fre- qüência, isto é como amostra extraída por um banco de filtros de freqüência. Em aplicações práticas, no entanto, um down mix de domínio de tempo é tipicamente fornecida e transmitida para possibilitar também a reprodução direta do sinal submetido em ambientes de reprodução simples. Sendo as- sim, na figura 9 na modalidade posterior da presente invenção, onde um de- codificador compatível binaural 400 compreende um banco de filtro de análi- se 402 e a síntese do banco de filtros de freqüência 404 e um inventivo de- codificador, que poderia, por exemplo, ser o decodificador 300 da figura 8. As funcionalidades do decodificador suas descrições aplicáveis na figura 9 bem como também na figura 8 e a descrição do decodificador 300 serão o- mitidas no parágrafo seguinte.
O banco de filtros de freqüência de análise 402 recebe o down mix de um sinal de multicanal 406 como criado por um codificador paramé- trico multicanal. O banco de filtros de freqüência de análise 402 extrai a re- presentação do banco de filtros de freqüência do sinal recebido 406 que é então inserido no decodificador 300 que extrai um sinal de down mix de fo- nes de ouvido 408, ainda no domínio do banco de filtros de freqüência. Isto é, o down mix é representada por uma variedade de amostras ou coeficien- tes nas bandas de freqüência introduzidas pelo banco de filtros de freqüên- cia de análise 402. A partir de então, para proporcionar a conversão final de multicanais em sinal estéreo para os fones de ouvido 410 no domínio de tempo do sinal de down mix de fones de ouvido 408 é inserido no banco de filtros de freqüência de síntese 404 que extrai um down mix para os fones de ouvido 410, que está pronto para ser reproduzido pelo equipamento de re- produção estéreo.
A figura 10 mostra um receptor da presente invenção ou repro- dutor de áudio 500, dotado de um decodificador de áudio da presente inven- ção 501, uma entrada de fluxo de dados 502, e uma saída de áudio 504.
Um fluxo de dados pode ser inserido na entrada 502 do reprodu- tor/receptor 500 da presente invenção. O fluxo de dados então é decodifica- do pelo decodificador 501 e o decodificado sinal é enviado ou reproduzido na saída 504 do receptor/ reprodutor de áudio 500 da presente invenção.
Apesar de alguns exemplos terem sido extraídos nos parágrafos anteriores para implementar o conceito inventivo com base em um down mix transmitida, o conceito inventivo pode também ser aplicado em configura- ções baseadas em uma única conversão de multicanais monofônica ou em mais do que dois canais de down mix.
Uma particular implementação da transferência de funções de transferência relativa à cabeça no domínio de sub-banda é oferecida na des- crição da presente invenção. No entanto, outras técnicas para extrair os fil- tros de sub-banda podem também ser usadas sem limitação do conceito in- ventivo.
Os fatores de fase introduzidos na extração das FTAs modifica- das podem ser extraídos também por outros procedimentos computacionais que não os referidos anteriormente apresentados. Sendo assim, realizar a extração dos referidos fatores de forma diferente não limita o escopo da in- venção.
Mesmo que o conceito inventivo seja mostrado particularmente para FTA e filtros de anulação de interferência, o referido conceito pode ser usado para outros filtros definidos para um ou mais canais individual de um sinal multicanal para permitir para uma geração computacionalmente eficien- te de um sinal de reprodução com alta qualidade em estéreo. Os filtros são, além disso, não apenas restritos a filtros cuja intenção é modelar um ambi- ente de audição. Mesmo filtros que adicionam componentes "artificiais" a um sinal podem ser usados tais como, por exemplo, filtros de reverberação ou outros filtros de distorção.
Dependendo de certas exigências da implementação métodos inventivos podem ser implementados em hardware ou em software. A im- plementação pode ser realizada usando um meio de armazenagem digital, em particular um disco, DVD ou um CD dotado de controle eletronicamente legível de sinais armazenados depois disso, que cooperam com um sistema programável do computador, tais que os métodos inventivos estão executa- dos. Em geral, a presente invenção é, sendo assim, um programa de compu- tador com um código de programa armazenado em um condutor legível na máquina, o código do programa sendo operante para a realização de méto- dos inventivos quando o produto de programa de computador roda em um computador. Em outras palavras, os métodos da presente invenção são, as- sim, um programa de computador dotado de um código de programa para realizar pelo menos um dentre os métodos inventivos quando o produto de programa de computador roda em um computador.
Enquanto o que foi dito acima foi particularmente mostrado e descrito com referência as suas modalidades particulares, deve ser entendi- do por aqueles versados na técnica que várias outras modificações na forma e nos detalhes podem ser realizadas sem prejuízo de seu espírito e escopo. Deve ser entendido que várias modificações podem ser implementadas a- daptando as diferentes modalidades sem prejuízo dos mais amplos concei- tos descritos aqui e compreendidos pelas reivindicações que se seguem.

Claims (26)

1. Decodificador para extrair um sinal de down mix de fone de ouvido (314) usando a representação de um sinal de down mix de multica- nal (312) e usando um parâmetro de nível (306) dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando funções de transferência relativa à cabeça (308) em relação aos dois canais do sinal de multicanal, caracterizado por compreender: um calculador de filtro (302) para extrair uma função de transfe- rência modificada relativa à cabeça (310) através da ponderação das fun- ções de transferência relativa à cabeça (308) dos dois canais usando o pa- râmetro de nível (306) de tal forma que a função de transferência relativa à cabeça modificada (310) é mais fortemente influenciada pela função de transferência relativa à cabeça (308) de um canal dotado de um nível mais alto do que pela função de transferência relativa à cabeça (308) de um canal dotado de um nível mais baixo e que uma compensação de fase das fun- ções de transferência relativas à cabeça (304) dos dois canais é obtida antes para uma combinação das funções de transferência relativas à cabeça com- pensadas em fase e ponderadas dos dois canais; e um sintetizador (304) para extrair o sinal de down mix para os fones de ouvido (314) usando função de transferência relativa à cabeça mo- dificada (310) e a representação do down mix (312).
2. Decodificadorde acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante para extrair as fun- ções de transferência relativas à cabeça modificadas (310) ainda aplicando fatores de fase às funções de transferência relativa à cabeça (308) dos dois canais de tal forma que a função de transferência relativa à cabeça (308) de um canal dotado de um nível mais baixo é deslocada mais perto de uma fa- se média das funções de transferência relativa à cabeça (308) dos dois ca- nais do que um canal dotado de um nível mais alto.
3. Decodificador de acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante de tal forma que o número de funções de transferência relativa à cabeça modificadas (310) ex- traídas é menor do que o número de funções de transferência relativa à ca- beça (308) associadas dos dois canais.
4. Decodificador de acordo com a reivindicação 1, caracterizado pelo fato de que calculador de filtro (302) é operante para extrair as funções de transferência relativa à cabeça modificadas (310) adaptadas para serem aplicadas a uma representação do banco de filtros de freqüência do down mix.
5. Decodificador de acordo com a reivindicação 1, caracterizado por ser adaptado para usar a representação do banco de filtros de freqüên- cia do down mix extraída em um domínio do banco de filtros de freqüência.
6. Decodificadorde acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante para realizar a extrai- or as funções de transferência relativas à cabeça modificadas (310) usando funções de transferência relativas à cabeça (308) com mais do que três pa- râmetros.
7. Decodificador de acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante para extrair os fatores de ponderação para funções de transferência relativas à cabeça (308) dos dois canais usando o mesmo parâmetro de nível (306).
8. Decodificador de acordo com a reivindicação 7, caracterizado pelo fato de que o calculador de filtro (302) é operante para extrair um pri- meiro fator de ponderação Wif para um primeiro canal f e um segundo fator de ponderação Wte para um segundo canal s usando o parâmetro de nível CLDi de acordo com as seguintes fórmulas: <formula>formula see original document page 30</formula>
9. Decodificador de acordo com a reivindicação 1, caracterizado pelo fato de que o calculador de filtro (302) é operante para extrair as fun- ções de transferência relativas à cabeça modificadas (310) aplicando um fator de ganho comum a funções de transferência relativas à cabeça (308) dos dois canais de tal forma que a energia é preservada quando realizada a extração das funções de transferência relativas à cabeça modificadas (310).
10. Decodificador de acordo com a reivindicação 9, caracteriza- do pelo fato de que o fator de ganho comum está dentro do intervalo [1√2,1]
11. Decodificador de acordo com a reivindicação 2, caracteriza- do pelo fato de que o calculador de filtro (302) é operante para extrair os fa- tores de fase usando um tempo de atraso entre respostas de impulso de funções de transferência relativa à cabeça (308) dos dois canais.
12. Decodificador de acordo com a reivindicação 11, caracteri- zado pelo fato de que o calculador de filtro (302) é operativo no domínio do banco de filtros de freqüência dotado de L bandas de freqüência e extrair os deslocamentos médios de fase individual para cada banda de freqüência usando o tempo de atraso.
13. Decodificador de acordo com a reivindicação 11, caracteri- zado pelo fato de que o calculador de filtro (302) é operante no domínio de banco de filtros de freqüência dotado de mais do que 2 bandas de freqüên- cia e para extrair parâmetros de fase Φxy para cada banda de freqüência usando o tempo de atraso τxy de acordo com a seguinte fórmula <formula>formula see original document page 31</formula>
14. Decodificador de acordo com a reivindicação 2, caracteriza- do pelo fato de que o calculador de filtro (302) é operante para extrair os fa- tores de fase usando o ângulo de fase da complexa correlação cruzada normalizada entre as respostas de impulso das funções de transferência re- lativas à cabeça (308) do primeiro e do segundo canal.
15. Decodificador de acordo com a reivindicação 1, caracteriza- do pelo fato de que o primeiro canal dos dois canais é um canal frontal lado do esquerdo ou do lado direito do sinal de multicanal e o segundo canal dos dois canais é o traseiro do mesmo lado.
16. Decodificador de acordo com a reivindicação 15, caracteri- zado pelo fato de que o calculador de filtro é operante para extrair as fun- ções de transferência relativas à cabeça modificadas Hy(X) (310) usando a função de transferência relativa à cabeça Hy(Xf) do canal frontal e a função de transferência relativa à cabeça do canal traseiro Hy(Xs) usando a seguin- te combinação linear complexa: <formula>formula see original document page 32</formula> na qual φ xy é um parâmentro de fase, wsewf são fatores de pon- deração extraídos usando o parâmetro de nível (306) e g é um fator de ga- nho comum extraído usando o parâmetro de nível (306).
17. Decodificador de acordo com a reivindicação 1, caracteriza- do por ser adaptado para usar uma representação de umum down mix (312) dotado de um canal esquerdo e um canal direito extraídos a partir de um si- nal de multicanal dotado de um canal esquerdo-frontal, um canal esquerdo- envolvente, um canal direito-frontal, um canal direito-envolvente e um canal de centro.
18. Decodificador de acordo com a reivindicação 1, caracteriza- do pelo fato de que o sintetizador é operante para extrair o sinal de down mix de fones de ouvido (314) aplicando uma combinação linear de funções de transferência relativas à cabeça modificadas (310) para a representação do down mix (312) do sinal de multicanal.
19. Decodificador de acordo com a reivindicação 18, caracteri- zado pelo fato de que o sintetizador é operante para usar coeficientes para a combinação linear das funções de transferência relativas à cabeça, as quais dependem do parâmetro de nível (306).
20. Decodificador de acordo com a reivindicação 18, caracteri- zado pelo fato de que o sintetizador (304) é operante para usar coeficientes para a combinação linear dependendo de parâmetros de multicanal adicio- nais em relação a propriedades adicionais espaciais do sinal de multicanal.
21. Decodificador binaural, caracterizado por compreender: um decodificador, como definido na reivindicação 1; um banco de filtros de análise (300) para extrair a representação do sinal de down mix de multicanal (312) por filtragem de sub-banda do down mix do sinal de multicanal; e um banco de filtros de síntese (302 ) para extrair o sinal do fone de ouvido no domínio de tempo sintetizando um down mix para os fones de ouvido (314).
22. Decodificador para extrair o sinal de down mix estéreo espa- ciai usando a representação de um down mix de um sinal multicanal (312) e usando um parâmetro de nível (306) dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando um filtro de anula- ção de interferências em relação aos dois canais do sinal de multicanal, ca- racterizado por compreender: um calculador de filtro (302) para extrair um filtro de anulação de interferência modificado por meio da ponderação e aplicando fatores de fase ao filtro de anulação de interferência dos dois canais usando o parâmetro de nível (306) de tal forma que o filtro de anulação de interferências modificados é mais fortemente influenciado pelo filtro de anulação de interferência de canal dotado de um nível mais alto do que pelo filtro de anulação de interfe- rência de um canal dotado de um nível mais baixo e que uma compensação de fase dos filtros de anulação de interferência (308) dos dois canais é obti- da antes de uma combinação dos filtros de anulação de interferência ponde- rados e compensados em fase dos dois canais; e um sintetizador (304) para extrair o sinal de down mix espacial estéreo usando o filtro de anulação de interferência modificado e a represen- tação de um down mix do sinal de down mix (312).
23. Método de extrair um sinal de down mix de fone de ouvido (314) usando a representação de um down mix de um sinal de multicanal (312) e usando um parâmetro de nível (306) dotado de informação sobre a relação de nível entre dois canais do sinal de multicanal e usando funções de transferência relativa à cabeça (308) em relação aos dois canais do sinal de multicanal, o método caracterizado por compreender: extrair usando um parâmetro de nível (306), funções de transfe- rência relativas à cabeça modificadas (310) através da ponderação e aplica- ção de fatores de fase às funções de transferência relativas à cabeça (308) dos dois canais de tal forma que as funções de transferência relativa à cabe- ça modificadas são mais fortemente influenciadas pelas funções de transfe- rência relativa à cabeça modificadas de um canal sendo dotado de um nível mais alto do que pela função de transferência relativa à cabeça de um canal dotado de um nível mais baixo e que a compensação de fase das funções de transferências relativas a cabeça (308) dos dois canais é obtida antes para uma combinação das funções de transferência relativas à cabeça pon- deradas e compensadas em fase dos dois canais; e extrair o sinal de down mix de fone de ouvido (314) usando as funções de transferência relativas à cabeça modificadas (310) e a represen- tação do sinal de down mix.
24. Receptor ou reprodutor de áudio caracterizado pelo fato de ter um decodificador para extrair um sinal de down mix de fone de ouvido (314) como definido nas reivindicações 1 a 20.
25. Método de recepção ou reprodução de áudio, caracterizado pelo fato de ser um método para extrair um sinal de down mix de fone de ouvido (314) de acordo com a reivindicação 23.
26. Midia de armazenamento digital que tem um código de pro- grama para realizar quando rodando em um computador, um dos métodos como definido na reinvidicação 23 ou 25.
BRPI0621485A 2006-03-24 2006-09-01 decodificador e método para derivar sinal de down mix de fone de ouvido, decodificador para derivar sinal de down mix estéreo espacial, receptor, método de recepção, reprodutor de áudio e método de reprodução de áudio BRPI0621485B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SE0600674 2006-03-24
SE0600674-6 2006-03-24
US74455506P 2006-04-10 2006-04-10
US60/744,555 2006-04-10
PCT/EP2006/008566 WO2007110103A1 (en) 2006-03-24 2006-09-01 Generation of spatial downmixes from parametric representations of multi channel signals

Publications (2)

Publication Number Publication Date
BRPI0621485A2 true BRPI0621485A2 (pt) 2011-12-13
BRPI0621485B1 BRPI0621485B1 (pt) 2020-01-14

Family

ID=40538857

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0621485A BRPI0621485B1 (pt) 2006-03-24 2006-09-01 decodificador e método para derivar sinal de down mix de fone de ouvido, decodificador para derivar sinal de down mix estéreo espacial, receptor, método de recepção, reprodutor de áudio e método de reprodução de áudio

Country Status (11)

Country Link
US (1) US8175280B2 (pt)
EP (1) EP1999999B1 (pt)
JP (1) JP4606507B2 (pt)
KR (1) KR101010464B1 (pt)
CN (1) CN101406074B (pt)
AT (1) ATE532350T1 (pt)
BR (1) BRPI0621485B1 (pt)
ES (1) ES2376889T3 (pt)
PL (1) PL1999999T3 (pt)
RU (1) RU2407226C2 (pt)
WO (1) WO2007110103A1 (pt)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110010140A (zh) * 2013-04-05 2019-07-12 杜比国际公司 立体声音频编码器和解码器

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
AU2003282763A1 (en) 2002-10-15 2004-05-04 Verance Corporation Media monitoring, management and information system
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
US7369677B2 (en) * 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8577686B2 (en) 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
WO2007007500A1 (ja) * 2005-07-11 2007-01-18 Matsushita Electric Industrial Co., Ltd. 超音波探傷方法と超音波探傷装置
WO2007031905A1 (en) * 2005-09-13 2007-03-22 Koninklijke Philips Electronics N.V. Method of and device for generating and processing parameters representing hrtfs
TWI469133B (zh) * 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
JP5199129B2 (ja) * 2006-02-07 2013-05-15 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
AU2007312598B2 (en) * 2006-10-16 2011-01-20 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
KR101406531B1 (ko) * 2007-10-24 2014-06-13 삼성전자주식회사 스테레오 오디오 신호로부터 바이노럴 비트를 발생시키는 장치 및 방법
JP2009128559A (ja) * 2007-11-22 2009-06-11 Casio Comput Co Ltd 残響効果付加装置
US9445213B2 (en) * 2008-06-10 2016-09-13 Qualcomm Incorporated Systems and methods for providing surround sound using speakers and headphones
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
ES2531422T3 (es) * 2008-07-31 2015-03-13 Fraunhofer Ges Forschung Generación de señales para señales binaurales
UA101542C2 (ru) 2008-12-15 2013-04-10 Долби Лабораторис Лайсензин Корпорейшн Виртуализатор окружающего звука с динамическим сжатием диапазона и способ
JP5524237B2 (ja) 2008-12-19 2014-06-18 ドルビー インターナショナル アーベー 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置
RU2011130551A (ru) * 2008-12-22 2013-01-27 Конинклейке Филипс Электроникс Н.В. Формирование выходного сигнала посредством обработки сенд-эффектов
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
TWI557723B (zh) 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
KR20110116079A (ko) 2010-04-17 2011-10-25 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
US9607131B2 (en) 2010-09-16 2017-03-28 Verance Corporation Secure and efficient content screening in a networked environment
CN103649706B (zh) * 2011-03-16 2015-11-25 Dts(英属维尔京群岛)有限公司 三维音频音轨的编码及再现
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
FR2986932B1 (fr) * 2012-02-13 2014-03-07 Franck Rosset Procede de synthese transaurale pour la spatialisation sonore
US10321252B2 (en) 2012-02-13 2019-06-11 Axd Technologies, Llc Transaural synthesis method for sound spatialization
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US9106964B2 (en) 2012-09-13 2015-08-11 Verance Corporation Enhanced content distribution using advertisements
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
US9191516B2 (en) * 2013-02-20 2015-11-17 Qualcomm Incorporated Teleconferencing using steganographically-embedded audio data
US9093064B2 (en) * 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
US9262794B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
EP2973551B1 (en) 2013-05-24 2017-05-03 Dolby International AB Reconstruction of audio scenes from a downmix
BR112015029132B1 (pt) 2013-05-24 2022-05-03 Dolby International Ab Método para codificar um mosaico de tempo/frequência de uma cena de áudio, codificador que codifica um mosaico de tempo/frequência de uma cena de áudio, método para decodificar um mosaico de tempo-frequência de uma cena de áudio, decodificador que decodifica um mosaico de tempo-frequência de uma cena de áudio e meio legível em computador.
EP2830336A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
WO2015137146A1 (ja) * 2014-03-12 2015-09-17 ソニー株式会社 音場収音装置および方法、音場再生装置および方法、並びにプログラム
KR101731770B1 (ko) 2014-03-13 2017-04-28 베란스 코오포레이션 임베디드 코드를 사용한 양방향 콘텐츠 획득
US9779739B2 (en) 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
CN109115245B (zh) * 2014-03-28 2021-10-01 意法半导体股份有限公司 多通道换能器设备和其操作方法
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US9510125B2 (en) * 2014-06-20 2016-11-29 Microsoft Technology Licensing, Llc Parametric wave field coding for real-time sound propagation for dynamic sources
CA3298877A1 (en) 2015-08-25 2026-03-02 Dolby International Ab Audio encoding and decoding using presentation transform parameters
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
WO2017127271A1 (en) * 2016-01-18 2017-07-27 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
CN108632714B (zh) * 2017-03-23 2020-09-01 展讯通信(上海)有限公司 扬声器的声音处理方法、装置及移动终端
FR3065137B1 (fr) * 2017-04-07 2020-02-28 Axd Technologies, Llc Procede de spatialisation sonore
CN108156575B (zh) * 2017-12-26 2019-09-27 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端
US10764704B2 (en) * 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
US10602298B2 (en) 2018-05-15 2020-03-24 Microsoft Technology Licensing, Llc Directional propagation
US10798515B2 (en) * 2019-01-30 2020-10-06 Facebook Technologies, Llc Compensating for effects of headset on head related transfer functions
CA3193359A1 (en) 2019-06-14 2020-12-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Parameter encoding and decoding
US10932081B1 (en) 2019-08-22 2021-02-23 Microsoft Technology Licensing, Llc Bidirectional propagation of sound
JP7286876B2 (ja) 2019-09-23 2023-06-05 ドルビー ラボラトリーズ ライセンシング コーポレイション 変換パラメータによるオーディオ符号化/復号化
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
CN120526780A (zh) * 2020-03-09 2025-08-22 日本电信电话株式会社 声音信号缩混方法、编码方法、缩混装置及程序

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1131508C (zh) 1993-05-05 2003-12-17 皇家菲利浦电子有限公司 包括至少一个编码器的传输系统
US6198827B1 (en) * 1995-12-26 2001-03-06 Rocktron Corporation 5-2-5 Matrix system
US5771295A (en) * 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
DE19640825C2 (de) 1996-03-07 1998-07-23 Fraunhofer Ges Forschung Codierer zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal und Decodierer zum decodieren eines nicht hörbar in einem Audiosignal enthaltenen Datensignals
EP0875107B1 (de) 1996-03-07 1999-09-01 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
US6711266B1 (en) 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
TW429700B (en) * 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
DE19947877C2 (de) 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6725372B1 (en) * 1999-12-02 2004-04-20 Verizon Laboratories Inc. Digital watermarking
JP3507743B2 (ja) 1999-12-22 2004-03-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮オーディオデータへの電子透かし方法およびそのシステム
US7136418B2 (en) 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
DE10129239C1 (de) 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
US7243060B2 (en) 2002-04-02 2007-07-10 University Of Washington Single channel sound separation
AU2003216669A1 (en) 2002-05-10 2003-11-11 Koninklijke Philips Electronics N.V. Watermark embedding and retrieval
WO2004028204A2 (en) * 2002-09-23 2004-04-01 Koninklijke Philips Electronics N.V. Generation of a sound signal
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
JP4898673B2 (ja) * 2004-07-14 2012-03-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 方法、装置、エンコーダ装置、デコーダ装置及びオーディオシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110010140A (zh) * 2013-04-05 2019-07-12 杜比国际公司 立体声音频编码器和解码器
CN110010140B (zh) * 2013-04-05 2023-04-18 杜比国际公司 立体声音频编码器和解码器
US12080307B2 (en) 2013-04-05 2024-09-03 Dolby International Ab Stereo audio encoder and decoder

Also Published As

Publication number Publication date
EP1999999B1 (en) 2011-11-02
RU2008142141A (ru) 2010-04-27
US8175280B2 (en) 2012-05-08
JP4606507B2 (ja) 2011-01-05
KR101010464B1 (ko) 2011-01-21
BRPI0621485B1 (pt) 2020-01-14
EP1999999A1 (en) 2008-12-10
JP2009531886A (ja) 2009-09-03
US20070223708A1 (en) 2007-09-27
CN101406074A (zh) 2009-04-08
ES2376889T3 (es) 2012-03-20
CN101406074B (zh) 2012-07-18
KR20080107433A (ko) 2008-12-10
WO2007110103A1 (en) 2007-10-04
PL1999999T3 (pl) 2012-07-31
RU2407226C2 (ru) 2010-12-20
ATE532350T1 (de) 2011-11-15

Similar Documents

Publication Publication Date Title
BRPI0621485A2 (pt) decodificador e método para extrair sinal de down mix de fone de ouvido, decodificador para extrair sinal de down mix estéreo espacial, receptor ou reprodutor e método de recepção ou reprodução de áudio e mìdia de armazenamento
US12165656B2 (en) Encoding of a multi-channel audio signal to generate binaural signal and decoding of an encoded binauralsignal
JP4834153B2 (ja) 非エネルギー節約型アップミックス・ルールのコンテクストにおけるバイノーラル・マルチチャンネル・デコーダ
JP5698189B2 (ja) オーディオ符号化
JP7652849B2 (ja) バイノーラル・ダイアログ向上
BRPI0709276A2 (pt) processo e dispositivo de espacialização sonora binaural eficaz no domìnio transformado
BRPI0812669B1 (pt) método e processador de áudio para gerar um sinal estéreo com qualidade perceptual
PT1774515E (pt) Aparelho e processo para gerar um sinal de saída multicanal
BRPI0611505A2 (pt) reconfiguração de canal com informação secundária
BRPI0608036B1 (pt) Dispositivo e método para a geração de um sinal estéreo codificado de uma peça de áudio ou fluxo de dados de áudio
GB2485979A (en) Spatial audio coding
MX2008011994A (es) Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.
HK40121700A (en) Binaural dialoague enhancement
HK1122174B (en) Generation of spatial downmixes from parametric representations of multi channel signals
HK1146975B (en) Binaural multi-channel decoder in the context of non-energy-conserving upmix rules

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 6A ANUIDADE.

B08H Application fees: decision cancelled [chapter 8.8 patent gazette]

Free format text: REFERENTE AO DESPACHO 8.6 NA RPI 2166 DE 10/07/2012.

B25F Entry of change of name and/or headquarter and transfer of application, patent and certif. of addition of invention: change of name on requirement

Owner name: DOLBY SWEDEN AB (SE) , KONINKLIJKE PHILIPS ELECTRO

Free format text: A FIM DE ATENDER AS ALTERACOES DE NOME E ENDERECO REQUERIDAS ATRAVES DA PETICAO NO 20120001417/RJ, DE 06/01/2012, E NECESSARIO APRESENTAR DOCUMENTACAO QUE COMPROVE AS MESMAS, ALEM DA GUIA DE CUMPRIMENTO DE EXIGENCIA.

B25D Requested change of name of applicant approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V (NL) , DOLBY

B25G Requested change of headquarter approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V (NL) , DOLBY INTERNATIONAL AB (NL)

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V (NL) , DOLBY

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 14/01/2020, OBSERVADAS AS CONDICOES LEGAIS.

B25G Requested change of headquarter approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N.V. (NL) ; DOLBY INTERNATIONAL AB (IE)