BRPI0613469A2 - aparelhos e métodos para gerar um número de canais de áudio de saìda e um fluxo de dados, fluxo de dados, meio de armazenamento, receptor para gerar um número de canais de áudio de saìda, transmissor para gerar um fluxo de dados, sistema de transmissão, métodos de recepção e de transmissão de um fluxo de dados, produto de programa de computador, e, dispositivos de reprodução de áudio e de gravação de áudio - Google Patents

aparelhos e métodos para gerar um número de canais de áudio de saìda e um fluxo de dados, fluxo de dados, meio de armazenamento, receptor para gerar um número de canais de áudio de saìda, transmissor para gerar um fluxo de dados, sistema de transmissão, métodos de recepção e de transmissão de um fluxo de dados, produto de programa de computador, e, dispositivos de reprodução de áudio e de gravação de áudio Download PDF

Info

Publication number
BRPI0613469A2
BRPI0613469A2 BRPI0613469-6A BRPI0613469A BRPI0613469A2 BR PI0613469 A2 BRPI0613469 A2 BR PI0613469A2 BR PI0613469 A BRPI0613469 A BR PI0613469A BR PI0613469 A2 BRPI0613469 A2 BR PI0613469A2
Authority
BR
Brazil
Prior art keywords
data
hierarchical
decoder
channel
data stream
Prior art date
Application number
BRPI0613469-6A
Other languages
English (en)
Inventor
Erik G P Schuijers
Wolfgang A Schildbach
Holger Horich
Hans M K Kjorling
Karl J Roeden
Gerard H Hotho
Heiko Purnhagen
Original Assignee
Koninkl Philips Electronics Nv
Coding Tech Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninkl Philips Electronics Nv, Coding Tech Ab filed Critical Koninkl Philips Electronics Nv
Publication of BRPI0613469A2 publication Critical patent/BRPI0613469A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Amplifiers (AREA)

Abstract

APARELHOS E MéTODOS PARA GERAR UM NúMERO DE CANAIS DE áUDIO DE SáIDA E UM FLUXO DE DADOS, FLUXO DE DADOS, MEIO DE ARMAZENAMENTO, RECEPTOR PARA GERAR UM NúMERO DE CANAIS DE áUDIO DE SáIDA, TRANSMISSOR PARA GERAR EM FLUXO DE DADOS, SISTEMA DE TRANSMISSãO, MéTODOS DE RECEPçãO E DE TRANSMISSãO DE UM FLUXO DE DADOS, PRODUTO DE PROGRAMA DE COMPUTADOR, E, DISPOSITIVOS DE REPRODUçãO DE áUDIO E DE GRAVAçãO DE áUDIO. Um codificador de áudio (109) tem uma estrtura de codificação hierárquico e gera um fluxo de dados em um ou mais canais de áudio assim como todas de codificação de áudio paramétricos. O codificador (109) compreende um processador de estrutura de codificação (305) que insere dados de estrutura de árvore de decodificador no fluxo de dados. Os dados de estrutura de árvore de decodificador no fluxo de dados. Os dados de estrutura de árvore de decodificador comrpeendem, pelo menos, um valor de dados indicativo de uma características de divisão de canal para um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador e pode especificamente, especificar estruturas de árvore de decodificador a serem aplicadas através de um decodificador. Um decodificador (115) compreende em resposta aos dados de estrutura de árvore de decodificador. Um processador de decodificação (403) então gera canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.

Description

"APARELHOS E MÉTODOS PARA GERAR UM NÚMERO DE CANAIS DE ÁUDIO DE SAÍDA E UM FLUXO DE DADOS, FLUXO DE DADOS, MEIO DE ARMAZENAMENTO, RECEPTOR PARA GERAR UM NÚMERO DE CANAIS DE ÁUDIO DE SAÍDA, TRANSMISSOR PARA GERAR UM FLUXO DE DADOS, SISTEMA DE TRANSMISSÃO, MÉTODOS DE RECEPÇÃO E DE TRANSMISSÃO DE UM FLUXO DE DADOS, PRODUTO DE PROGRAMA DE COMPUTADOR, E, DISPOSITIVOS DE
REPRODUÇÃO DE ÁUDIO E DE GRAVAÇÃO DE ÁUDIO"
A invenção se refere á codificação de áudio e/ou decodificação de áudio usando estruturas de codificação hierárquica e/ou estrutura hierárquica de decodifícador.
No campo de processamento de áudio, é bem conhecido converter um número de canais de áudio em um outro, grande número de canais de áudio. Tal uma conversão pode ser efetuada por várias razões. Por exemplo, um sinal de áudio pode ser convertido em um outro formato para fornecer uma experiência aprimorada ao usuário. E. /g. gravações de estéreo tradicionais somente compreende dois canais, ao passo que sistemas de áudio avançados tipicamente usam cinco a seis canais, como nos populares sistemas de áudio ambiente 5.1. Conseqüentemente, os dois canais podem ser convertidos em cinco ou seis canais de modo a tirar completa vantagem do sistema de áudio avançado.
Uma outra razão para uma conversão de canal é eficiência de codificação. Tem sido encontrado que, e. g. sinais de áudio estéreo podem ser codificados como sinais de áudio de canal único, combinados com um fluxo de bit de parâmetro descrevendo as propriedades locais do sinal de áudio. O decodifícador pode reproduzir os sinais de áudio estéreo com um grau bem satisfatório de precisão. Desta maneira, taxa de bit substancial pode ser obtida.
Há vários parâmetros que podem ser usados para descrever a sistema propriedades locais de sinais de áudio. Um tal parâmetro é a correlação cruzada inter canal, tal como a correspondente cruzada entre o canal esquerdo e o canal direito para sinais estéreos. Um outro parâmetro é a proporção de potência dos canais. No assim chamado (paramétricos) (de)codificadores de áudio local, esses e outros parâmetros são extraídos do sinal de áudio original a fim de produzir um sinal de áudio tendo um número de canais reduzido, por exemplo, somente um canal único, mais um conjunto de pás descrevendo as propriedades locais do sinal de áudio original. Nos assim chamados (paramétricos) decodificadores de áudio local, o sinal de áudio original é reconstruído.
Codificação de Áudio Local é uma técnica introduzida recentemente para eficientemente codificar material de áudio de multi canal. Em Codificação de Áudio Local, um sinal de áudio de M-canal é descrito como um sinal de áudio de N-canal mais um conjunto de parâmetros locais correspondentes onde N é tipicamente menor do que M. Então, no codificador de Áudio Local, ao sinal de M-canal é redução por mixagem em um sinal de N-canal e os parâmetros locais são extraídos. No decodificador, o sinal de N- canal e os parâmetros locais são empregados para (perceptivamente) reconstruir o sinal de M-canal.
Tal codificação de áudio local preferencialmente emprega uma estrutura hierárquica baseada em árvore ou cascata compreendendo unidades padrões no codificador e no decodificador. No codificador, essas unidades padrões podem ser redutores por mixagem, combinando canais em um número mais baixo de canais tais como redutores por mixagem de 2 para 1, 3 para 1, 3 para 2, etc., enquanto no decodificador as unidades padrões correspondentes podem ser elevadores por mixagem separando canais em um número mais alto de canais tais como elevadores por mixagem de 1 para 2, 2 para 3.
Contudo, um problema com tal uma abordagem é que a estrutura de decodificador precisa coincidir com a estrutura do codificador. Embora isso possa ser alcançado pelo usuário de uma estrutura de codificador e decodificador padronizada, tal uma abordagem é inflexível e tende a resultar em desempenho sub ótimo.
Então um sistema aprimorado seria vantajoso e um particular um sistema permitindo flexibilidade aumentada, complexidade reduzida e/ou desempenho aprimorado seria vantajoso.
Conseqüentemente, a Invenção procura, preferencialmente, diminuir, aliviar ou eliminar uma ou mais das desvantagens mencionadas acima de forma única ou em qualquer combinação.
De acordo com um primeiro aspecto da invenção é fornecido um aparelho para gerar um número de canais de áudio de saída; o aparelho compreendendo: meios para receber um fluxo de dados compreendendo um número de canais de áudio de entrada e dados de áudio paramétricos; o fluxo de dados ainda compreendendo dados de estrutura de árvore de decodificador para uma estrutura hierárquica de decodificador, os dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de características de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador; meios para gerar a estrutura hierárquica de decodificador em resposta aos dados de estrutura de árvore de decodificador; e meios para gerar o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
A invenção pode permitir uma geração flexível de canais de áudio e pode, em particular, permitir uma funcionalidade de decodificador para se adaptar a uma estrutura de codificador usada para gerar o fluxo de dados. A invenção e. g. permite que um codificador selecione uma abordagem de codificação adequada para um sinal de multi canal enquanto permite que o aparelho automaticamente se adapte a ele. A invenção pode permitir um fluxo de dados ter uma qualidade aprimorada para proporção de taxa de bit. Em particular, a invenção pode permitir automaticamente adaptação e/ou um maior grau de flexibilidade enquanto fornecendo a qualidade de áudio aprimorada alcançável das estruturas de codificação/decodificação hierárquicas. Ainda mais, a invenção pode permitir uma comunicação eficiente de informação da estrutura hierárquica de decodificados Especificamente, a invenção pode fornecer um aparelho que automaticamente se adapta o fluxo de bits recebido e que pode ser usado com qualquer estrutura de codificação hierárquica.
Cada canal de áudio pode suportar um sinal de áudio individual. O fluxo de dados pode ser um fluxo de bits único ou pode e. g. se referir a uma combinação de uma grande quantidade de sub fluxos de bits por exemplo distribuídas através de canais de distribuição diferentes. O fluxo de dados pode ter uma duração limitada tal como uma duração fixa correspondendo ao arquivo de dados de um dado tamanho. A característica de divisão de canal pode ser uma característica indicativa de quantos canais um canal de áudio dado é dividido dentro de uma camada hierárquica. Por exemplo, a característica de divisão de canal pode refletir se um dado canal de áudio não está dividido ou se está dividido em dois canais de áudio.
A estrutura de árvore de decodiflcador pode compreender dados para a estrutura hierárquica de decodiflcador de uma grande quantidade de canais de áudio. Especificamente, os dados de estrutura de árvore de decodificador podem compreender um conjunto de dados para cada um do número de canais de áudio de entrada. Por exemplo, os dados de estrutura de árvore de decodificador podem compreender dados para uma estrutura de árvore de decodificador para cada sinal de entrada.
De acordo com uma característica opcional da invenção, os dados de estrutura de árvore de decodificador compreendem uma grande quantidade de valores de dados, cada valor de dados indicativo de uma característica de divisão de canal para um canal em uma camada hierárquica da estrutura hierárquica de decodificador.
Isto pode fornecer uma comunicação eficiente de dados permitindo ao aparelho se adaptar à codificação usada para o fluxo de dados. Os dados de estrutura de árvore de decodificador podem, especificamente, compreender um valor de dados para cada função de divisão de canal na estrutura hierárquica de decodificador. Os dados de estrutura de árvore de decodificador também podem compreender um valor de dados para cada canal de saída indicando que nenhuma divisão de canal adicional ocorre para um dado sinal de camada hierárquica.
De acordo com uma característica opcional da invenção, um valor de dados predeterminado é indicativo de nenhuma divisão de canal para o canal na camada hierárquica.
Isto pode fornecer uma comunicação eficiente de dados, permitindo ao aparelho, efetivamente e de forma confiável, se adaptar à codificação usada para o fluxo de dados.
De acordo com uma característica opcional da invenção, um valor de dados predeterminado é indicativo de divisão de canal de um para dois para o canal na camada hierárquica. Isto pode fornecer uma comunicação eficiente de dados, permitindo ao aparelho, efetivamente e de forma confiável, se adaptar à codificação usada para o fluxo de dados. Em particular, isto pode permitir transferência de informação bem eficiente para muitos sistemas hierárquicos usando funções de divisão de canal de padrão de baixa complexidade. De acordo com uma característica opcional da invenção, a grande quantidade de valores de dados são valores de dados binários.
Isto pode fornecer uma comunicação eficiente de dados, permitindo ao aparelho, efetivamente e de forma confiável, se adaptar à codificação usada para o fluxo de dados. Em particular, isto pode permitir transferência de informação bem eficiente para sistemas, principalmente usando uma funcionalidade de divisão de canal específica, tal como uma funcionalidade de divisão de canal de um para dois.
De acordo com uma característica opcional da invenção, um valor de dados binários predeterminado é indicativo de uma divisão de canal de um para dois, e um outro valor de dados binários predeterminado é indicativo de nenhuma divisão de canal.
Isto pode fornecer uma comunicação eficiente de dados, permitindo ao aparelho, efetivamente e de forma confiável, se adaptar à codificação usada para o fluxo de dados.. Em particular, isto pode permitir transferência de informação bem eficiente para sistemas baseados em torno de uma funcionalidade de divisão de canal de um para dois de baixa complexidade. Uma decodificação eficiente pode ser alcançada através de uma estrutura hierárquica de decodificador de baixa complexidade que pode ser gerada em resposta aos dados de baixa complexidade. A característica pode permitir uma baixa sobrecarga para a comunicação de dados de estrutura de árvore de decodificador e pode particularmente ser adequada para fluxos de dados codificados por uma função de codificação simples.
De acordo com uma característica opcional da invenção, o fluxo de dados ainda compreende uma indicação do número de canais de entrada.
Isto pode facilitar a decodificação e a geração da estrutura de decodificação e/ou pode permitir uma codificação mais eficiente de informação da estrutura hierárquica de decodificador nos dados de estrutura de árvore de decodificador. Em particular, os meios para gerar a estrutura hierárquica de decodificador podem fazer assim, em resposta à indicação do número de canais de entrada. Por exemplo, em muitas situações práticas o número de canais de entrada pode ser derivado do fluxo de dados, contudo, em alguns casos especiais, o áudio e os dados de parâmetro podem estar separados. Em tais casos, pode ser benéfico se o número de canais de entrada é conhecido conforme os dados do fluxo de dados podem ser manipulados (e.g redução por mixagem de estéreo para mono).
De acordo com uma característica opcional da invenção, o fluxo de dados ainda compreende uma indicação do número de canais de saída.
Isto pode facilitar a decodificação e a geração da estrutura de decodificação e/ou pode permitir uma codificação mais eficiente de informação da estrutura hierárquica de decodificador nos dados de estrutura de árvore de decodificador. Em particular, os meios para gerar a estrutura hierárquica de decodificador podem fazer assim, em resposta à indicação do número de canais de saída. Também, a indicação pode ser usada como uma verificação de erro dos dados de estrutura de árvore de decodificador.
De acordo com uma característica opcional da invenção, o fluxo de dados compreende uma indicação de um número de funções de divisão de canal de um para dois na estrutura hierárquica de decodificador.
Isto pode facilitar a decodificação e a geração da estrutura de decodificação e/ou pode permitir uma codificação mais eficiente de informação da estrutura hierárquica de decodificador nos dados de estrutura de árvore de decodificador. Em particular, os meios para gerar a estrutura hierárquica de decodificador podem fazer assim, em resposta à indicação do número de funções de divisão de canal de um para dois na estrutura hierárquica de decodificador.
De acordo com uma característica opcional da invenção, o fluxo de dados ainda compreende uma indicação de um número de funções de divisão de canal de dois para três na estrutura hierárquica de decodificador.
Isto pode facilitar a decodificação e a geração da estrutura de decodificação e/ou pode permitir uma codificação mais eficiente de informação da estrutura hierárquica de decodificador nos dados de estrutura de árvore de decodificador. Em particular, os meios para gerar a estrutura hierárquica de decodificador podem fazer assim, em resposta à indicação do número de funções de divisão de canal de dois para três na estrutura hierárquica de decodificador.
De acordo com uma característica opcional da invenção, os dados de estrutura de árvore de decodificador compreendem dados para a grande quantidade de estruturas de árvore de decodificador ordenadas em resposta à presença de uma funcionalidade de divisão de canal de dois para três.
Isto pode facilitar a decodificação e a geração da estrutura de decodificação e/ou pode permitir uma codificação mais eficiente de informação da estrutura hierárquica de decodificador nos dados de estrutura de árvore de decodificador. Em particular, a característica pode permitir desempenho vantajoso em sistemas onde divisões de canal de dois para três somente podem ocorrer na camada raiz. E. g. os meios para gerar a estrutura hierárquica de decodificador pode primeiro gerar a funcionalidade de divisão de canal de dois para três para dois canais de entrada seguidos pela geração da estrutura remanescente usando somente funcionalidade de divisão de canal de um para dois. A estrutura remanescente pode, especificamente, ser gerada em resposta aos dados de estrutura de árvore de decodificador binários, assim sendo, reduzindo a taxa de bit requerida. O fluxo de dados pode ainda conter informação da ordem da grande quantidade de estruturas de árvore de decodificador.
De acordo com uma característica opcional da invenção, os dados de estrutura de árvore de decodificador para pelo menos um canal de entrada compreende uma indicação de uma função de divisão de canal de dois para três estando presente na camada raiz seguida de dados binários onde cada valor de dados binários é indicativo de ou nenhuma funcionalidade de divisão ou uma função de divisão de canal de um para dois para camadas dependentes da funcionalidade de divisão de canal de dois para três.
Isto pode facilitar a decodificação e a geração da estrutura de decodificação e/ou pode permitir uma codificação mais eficiente de informação da estrutura hierárquica de decodificador nos dados de estrutura de árvore de decodificador. Em particular, a característica pode permitir desempenho vantajoso em sistemas onde divisões de canal de dois para três somente podem ocorrer na camada raiz. E. g. os meios para gerar a estrutura hierárquica de decodificador pode primeiro gerar a funcionalidade de divisão de canal de dois para três para um canal de entrada seguido pela geração da estrutura remanescente usando somente funcionalidade de divisão de canal de um para dois. A estrutura remanescente pode, especificamente, ser gerada em resposta aos dados de estrutura de árvore de decodificador binários, assim sendo, reduzindo a taxa de bit requerida.
De acordo com uma característica opcional da invenção, o fluxo de dados compreende uma indicação de uma posição de alto-falante para pelo menos um dos canais de saída.
Isto pode permitir codificação facilitada e pode permitir desempenho aprimorado e/ou adaptação do aparelho assim fornecendo flexibilidade.
De acordo com uma característica opcional da invenção, os meios para gerar a estrutura hierárquica de decodificador são arrumados para determinar parâmetros de multiplicação para funções de divisão de canal das camadas hierárquicas em resposta aos dados de estrutura de árvore de decodificador.
Isto pode permitir desempenho aprimorado e/ou adaptação/ flexibilidade aprimorada. Em particular, a característica pode permitir não somente a estrutura hierárquica de decodificador mas também a operação das funções de divisão de canal para se adaptar o fluxo de dados recebida. Os parâmetros de multiplicação podem ser parâmetros de multiplicação de matriz.
De acordo com uma característica opcional da invenção, a estrutura de árvore de decodificador compreende pelo menos uma funcionalidade de divisão de canal em pelo menos uma camada hierárquica, a pelo menos uma funcionalidade de divisão de canal compreendendo: meios de desfazer correlação para gerar um sinal desprovido de correlação diretamente de um canal de entrada de áudio do fluxo de dados; em pelo menos uma unidade de separação de canal para gerar uma grande quantidade de canais de saída de camada hierárquica de um canal de áudio a partir de uma mais alta camada hierárquica e do sinal de correlação desfeita; e meios para determinar pelo menos uma característica do filtro de desfazer correlação ou da unidade de divisão de canal em resposta aos dados de estrutura de árvore de decodificador.
Isto pode permitir desempenho aprimorado e/ou adaptação/ flexibilidade aprimorada. Em particular, a característica pode permitir uma estrutura hierárquica de decodificador que tem desempenho de codificação aprimorado, e que pode gerar canais de saída tendo qualidade de áudio aumentada. Em particular, uma estrutura hierárquica de decodificador onde nenhum sinal de desfazer correlação que é gerado pelos filtros em cascata de desfazer correlação pode ser alcançado e dinamicamente e automaticamente adaptado o fluxo de dados recebido.
O filtro de desfazer correlação recebe o canal de entrada de áudio do fluxo de dados sem modificações, e, especificamente, em qualquer filtragem anterior do sinal (tal como por um outro filtro de desfazer correlação). O ganho do filtro de desfazer correlação pode, especificamente ser determinado em resposta aos dados de estrutura de árvore de decodificador.
De acordo com uma característica opcional da invenção, os méis de desfazer correlação compreendem meios de compensação de nível para efetuar uma compensação de nível de áudio no canal de entrada de áudio, para gerar um sinal de áudio nível compensado; e um filtro de desfazer correlação para filtrar o sinal de áudio de nível compensado para gerar o sinal de correlação desfeita.
Isto pode permitir qualidade aprimorada e/ou implementação facilitada.
De acordo com uma característica opcional da invenção, os meios de compensação de nível compreendem uma multiplicação de matriz por uma pré-matriz. Isto pode permitir uma implementação eficiente.
De acordo com uma característica opcional da invenção, os coeficientes da pré-matriz têm pelo menos um valor de unidade para uma estrutura hierárquica de decodificador compreendendo somente
funcionalidade de divisão de canal de um para dois.
Isto pode reduzir complexidade e permitir uma implementação eficiente. A estrutura hierárquica de decodificador pode compreender outra funcionalidade que a funcionalidade de divisão de canal de um para dois mas não irá, de acordo com esta característica, compreender qualquer outra funcionalidade de divisão de canal.
De acordo com uma característica opcional da invenção, o aparelho ainda compreende meios para determinar a pré-matriz para a, pelo menos uma, funcionalidade de divisão de canal na, pelo menos uma, camada hierárquica em resposta aos parâmetros de uma funcionalidade de divisão de canal em uma mais alta camada hierárquica.
Isto pode permitir implementação eficiente e/ou desempenho aprimorado. A funcionalidade de divisão de canal em uma mais alta camada hierárquica pode incluir uma funcionalidade de divisão de canal de dois para três, e. g. localizada na camada de raiz de uma estrutura de árvore de decodificador.
De acordo com uma ótima característica da invenção, o aparelho compreende meios para determinar um matriz de divisão de canal para a, pelo menos uma, funcionalidade de divisão de canal em resposta aos parâmetros da, pelo menos uma, funcionalidade de divisão de canal na, pelo menos uma, camada hierárquica.
Isto pode permitir implementação eficiente e/ou desempenho aprimorado. Isto podem ser particularmente vantajoso para estruturas de árvore de decodificador compreendendo somente funcionalidade de divisão de canal de um para dois.
De acordo com uma ótima característica da invenção, o aparelho ainda compreende meios para determinar a pré-matriz da, pelo menos uma, funcionalidade de divisão de canal na, pelo menos uma, camada hierárquica em resposta aos parâmetros de um elevador por mixagem de dois para três de uma mais alta camada hierárquica.
Isto pode permitir implementação eficiente e/ou desempenho aprimorado. Isto podem ser particularmente vantajoso para estruturas de árvore de decodificador compreendendo uma funcionalidade de divisão de canal de um para dois na camada de raiz de uma estrutura de árvore de decodificador.
De acordo com uma ótima característica da invenção, os meios para determinar a pré-matriz são arranjados para determinar a pré-matriz para a, pelo menos uma, funcionalidade de divisão de canal em resposta para determinar uma primeira sub pré-matriz correspondendo a uma primeira entrada do elevador por mixagem de dois para três, e uma segunda sub pré- matriz correspondendo a uma segunda entrada do elevador por mixagem de dois para três.
Isto pode permitir implementação eficiente e/ou desempenho aprimorado. Isto podem ser particularmente vantajoso para estruturas de árvore de decodificador compreendendo uma funcionalidade de divisão de canal de dois para três na camada de raiz de uma estrutura de árvore de decodificador.
De acordo com um outro aspecto da invenção, é fornecido um aparelho para gerar um fluxo de dados compreendendo um número de canais de saída, o aparelho compreendendo: meios para receber um número de canais de entrada; meios de codificação hierárquica para, de forma paramétrica, codificar o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; meios para determinar uma estrutura hierárquica de decodificador correspondendo aos meios de codificação hierárquica; e meios para incluir dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados.
De acordo com um outro aspecto da invenção, é fornecida um fluxo de dados compreendendo: um número de canais de áudio codificados; dados de áudio paramétricos; e dados de estrutura de árvore de decodificador para uma estrutura hierárquica de decodificador, os dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de características de divisão de canal para canais de áudio em camadas hierárquicas da estrutura hierárquica de decodificador.
De acordo com um outro aspecto da invenção, é fornecido um meio de armazenamento tendo armazenado nele um sinal como descrito acima.
De acordo com um outro aspecto da invenção, é fornecido um método para gerar um número de canais de saída de áudio; o método compreendendo; receber um fluxo de dados compreendendo um número de canais de áudio de entrada e dados de áudio paramétricos; o fluxo de dados ainda compreendendo dados de estrutura de árvore de decodificador para uma estrutura hierárquica de decodificador, os dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de características de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador; gerar a estrutura hierárquica de decodificador em resposta aos dados de estrutura de árvore de decodificador; e gerar o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
De acordo com um outro aspecto da invenção, é fornecido um método para gerar um fluxo de dados compreendendo um número de canais de áudio de saída; o método compreendendo; receber um número de canais de áudio de entrada; meios de codificação hierárquica para, de forma paramétrica, codificar o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; determinar uma estrutura hierárquica de decodificador correspondendo aos meios de codificação hierárquica; e incluir dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados.
De acordo com um outro aspecto da invenção, é fornecido um receptor para gerar um número de canais de áudio de saída; o receptor compreendendo; meios para receber um fluxo de dados compreendendo um número de canais de áudio de entrada e dados de áudio paramétricos; o fluxo de dados ainda compreendendo dados de estrutura de árvore de decodificador para uma estrutura hierárquica de decodificador, os dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador; meios para gerar a estrutura hierárquica de decodificador em resposta as dados de estrutura de árvore de decodificador; e meios para gerar o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
De acordo com um outro aspecto da invenção, é fornecido um transmissor para gerar um fluxo de dados compreendendo um número de canais de áudio de saída; o transmissor compreendendo; meios para receber um número de canais de áudio de entrada; meios de codificação hierárquica para, de forma paramétrica, codificar o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; meios para determinar uma estrutura hierárquica de decodificador correspondendo aos meios de codificação hierárquica; e meios para incluir dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados.
De acordo com um outro aspecto da invenção, é fornecido um sistema de transmissão compreendendo um transmissor para gerar um fluxo de dados e um receptor para gerar um número de canais de áudio de saída; onde o transmissor compreende; meios para receber um número de canais de áudio de entrada, meios de codificação hierárquica para, de forma paramétrica, codificar o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; meios para determinar uma estrutura hierárquica de decodificador correspondendo aos meios de codificação hierárquica, meios para incluir dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados, e meios para transmitir o fluxo de dados para o receptor, e o receptor compreende; meios para receber o fluxo de dados, meios para gerar a estrutura hierárquica de decodificador em resposta aos dados de estrutura de árvore de decodificador, e meios para gerar o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
De acordo com um outro aspecto da invenção, é fornecido um método de recepção de um fluxo de dados; o método compreendendo; receber um fluxo de dados compreendendo um número de canais de áudio de entrada e dados de áudio paramétricos; o fluxo de dados ainda compreendendo uma estrutura de árvore de decodificador para uma estrutura hierárquica de decodificador, os dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador; gerar a estrutura de árvore de decodificador em resposta aos dados de estrutura de árvore de decodificador; e gerar o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
De acordo com um outro aspecto da invenção, é fornecido um método de transmissão de um fluxo de dados compreendendo um número de canais de áudio de saída; o método compreendendo; receber um número de canais de áudio de entrada; de forma paramétrica, codificar o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; determinar uma estrutura hierárquica de decodificador correspondendo aos meios de codificação hierárquica; incluir dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados; e transmitir o fluxo de dados.
De acordo com um outro aspecto da invenção, é fornecido um método de transmissão e recepção de um fluxo de dados, o método compreendendo; em um transmissor: receber um número de canais de áudio de entrada; de forma paramétrica, codificar o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio e dados de áudio paramétricos; determinar uma estrutura hierárquica de decodificador correspondendo aos meios de codificação hierárquica, incluindo dados de estrutura de árvore de decodificador compreendendo, pelo menos,um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados; e transmitir o fluxo de dados para o receptor; e em um receptor: receber o fluxo de dados, gerar a estrutura hierárquica de decodificador em resposta aos dados de estrutura de árvore de decodificador, e gerar o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
De acordo com um outro aspecto da invenção, é fornecido um produto de programa de computador para executar qualquer dos métodos descritos acima.
De acordo com um outro aspecto da invenção, é fornecido um dispositivo de reprodução de áudio compreendendo um aparelho como descrito acima.
De acordo com um outro aspecto da invenção, é fornecido um dispositivo de gravação de áudio compreendendo um aparelho como descrito acima.
Estes e outros aspectos, características e vantagens da invenção serão aparentes e elucidadas com referência as modalidade(s) descritas daqui em diante.
Modalidades da invenção serão descritas, por meio de exemplo somente, com referência aos desenhos, nos quais;
Fig. 1 ilustra um sistema de transmissão para comunicação de uma sinal de áudio de acordo com algumas modalidades da invenção;
Fig. 2 ilustra um exemplo de uma estrutura de codificador hierárquica que pode ser empregada em algumas modalidades da invenção;
Fig. 3 ilustra um exemplo de um codificador de acordo com algumas modalidades da invenção;
Fig. 4 ilustra um exemplo de um decodificador de acordo com algumas modalidades da invenção;
Fig. 5 ilustra um exemplo de uma estrutura hierárquica de decodificador que pode ser empregada em algumas modalidades da invenção;
Fig. 6 ilustra exemplo de estruturas de decodificador hierárquica tendo elevadores por mixagem de dois para três na raiz;
Fig. 7 ilustra um exemplo de uma estrutura hierárquica de decodificador compreendendo uma grande quantidade de estruturas de árvore de decodificador;
Fig. 8 ilustra um exemplo de um elevador por mixagem de um para dois;
Fig. 9 ilustra um exemplo de algumas estruturas de decodificador hierárquica que podem ser empregadas em algumas modalidades da invenção;
Fig. 10 ilustra um exemplo de algumas estruturas de decodificador hierárquica que podem ser empregadas em algumas modalidades da invenção;
Fig. 11 ilustra um fluxograma para um método de decodificação de acordo com algumas modalidades da invenção;
Fig. 12 ilustra um exemplo de uma estrutura de decodificador de matriz de acordo com algumas modalidades da invenção;
Fig. 13 ilustra um exemplo de uma estrutura hierárquica de decodificador que pode ser empregada em algumas modalidades da invenção;
Fig. 14 ilustra um exemplo de uma estrutura hierárquica de decodificador que pode ser empregada em algumas modalidades da invenção;
Fig. 15 ilustra um método de transmissão e de recepção de um sinal de áudio de acordo com algumas modalidades da invenção.
A descrição a seguir foca nas modalidades da invenção aplicável para codificação e decodificação de um sinal de áudio de multi canal usando um número de redutores por mixagem e elevadores por mixagem de canal de baixa complexidade. Contudo, será apreciado que a invenção não é limitada a essas aplicações. Deve ser entendido por aqueles com habilidade na técnica que um redutor por mixagem é arrumado para combinar um número de canais de áudio em um número mais baixo de canais de áudio e dados paramétricos adicionais, e que um elevador por mixagem é arrumado para gerar um número de canais de áudio a partir de um número mais baixo de canais de áudio e dados paramétricos. Assim sendo, um elevador por mixagem fornece uma funcionalidade de divisão de canal.
Fig. 1 ilustra um sistema de transmissão 100 para comunicação de um sinal de áudio de acordo com algumas modalidades da invenção. O sistema de transmissão 100 compreende um transmissor 101 que é acoplado a um receptor 103 através de uma rede 105 que especificamente pode ser a Internet.
No exemplo específico, o transmissor 101 é um dispositivo de gravação de sinal e o receptor é um dispositivo de execução de sinal 103 mas será apreciado que em outras modalidades um transmissor e receptor podem ser usados em outras aplicações e para outros propósitos. Por exemplo, o transmissor 101 e/ou o receptor 103 podem ser parte de uma funcionalidade de trans-codificação e podem e. g. fornecer interface para outras fontes ou destinações de sinal.
No exemplo específico, onde uma função de gravação de sinal é suportada, o transmissor 101 compreende um digitalizador 107 que recebe um sinal analógico que é convertido em um sinal digital de PCM através de amostragem e conversão de analógico para digital.
O transmissor 101 é acoplado ao codificador 109 da Fig. 1 que codifica o sinal de PCM de acordo com um algoritmo de codificação. O codificador 100 é acoplado a um transmissor de rede 111 que recebe o sinal codificado e faz interface com a Internet 105. O transmissor de rede 111 pode transmitir o sinal codificado para o receptor 103 através da Internet 105.
O receptor 103 compreende um receptor de rede 113 que faz a interface com a Internet 105 e que é arrumado para receber o sinal codificado do transmissor 101.
O receptor de rede 111 é acoplado a um decodificador 115. O decodificador 115 recebe o sinal codificado e decodifica de acordo com um algoritmo de decodificação.
No exemplo específico onde uma função de tocador de sinalização é suportada, o receptor 103 ainda compreende um tocador de sinal 117 que recebe o sinal de áudio decodificado do decodificador 115 e o apresenta para o usuário. Especificamente, o tocador de sinal 113 pode compreender um conversor de digital para analógico, amplificadores e alto- falantes como exigido para emitir o sinal de áudio decodificado.
No exemplo da Fig. 1, o codificador 109 e o decodificador 115 usam uma estrutura baseada em árvore ou em cascata, consistindo de pequenos blocos de construção. O codificador 109 assim sendo, usa uma estrutura de codificação hierárquica onde os canais de áudio são progressivamente processados em camadas diferentes da estrutura hierárquica. Tal uma estrutura pode levar a uma particularmente vantajosa codificação com alta qualidade de áudio ainda relativamente de baixa complexidade e implementação fácil do codificador 109.
Fig. 2 ilustra um exemplo de uma estrutura de codificador hierárquica que pode ser empregada em algumas modalidades da invenção.
No exemplo, o codificador 109 codifica um sinal de entrada de som ambiente de canal 5.1 consistindo de um canal frontal esquerdo (If), ambiente esquerdo (Is), frontal direito (rf), ambiente direito, central (c0) e um canal de subwoofer ou Intensificação de Freqüência baixa (Ife). Os canais são primeiro segmentados e transformados para o domínio da freqüência nos blocos de segmentação 201. Os sinais de domínio de freqüência resultantes são alimentados em pares direto para redutores por mixagem de Dois para Um (TTO) 203 que reduzem por mixagem dos sinais de entrada em um canal de saída único e extrai os parâmetros correspondentes. Assim sendo, os três redutores por mixagem de TTO 203 reduzem por mixagem dos seis canais de
entrada para três canais de áudio e parâmetros.
Como ilustrado na Fig. 2, a saída dos redutores por mixagem
de TTO 203 é usada como entrada para outros redutores por mixagem de TTO 205, 207. Especificamente, dois dos redutores por mixagem de TTO 203 são acoplados a um quarto redutor por mixagem de TTO 205 que combina os canais correspondentes em um único canal. O terceiro dos redutores por mixagem de TTO 203 é, junto com o quarto redutor por mixagem de TTO205, acoplado a um quinto redutor por mixagem de TTO207 que combina os dois canais remanescentes em um único canal (M). Este sinal é finalmente transformado de volta para o domínio do tempo resultando em um fluxo m de
bit de áudio de multi canal codificada.
Os redutores por mixagem de TTO 203 podem ser
considerados para compreender a primeira camada de estrutura de codificação, com uma segunda camada compreendendo o quarto redutor por mixagem de TTO 205 e a terceira camada compreendendo o quinto redutor por mixagem de TTO 207. Assim sendo, uma combinação de um número de canais de áudio em um número mais baixo de canais de áudio está ocorrendo
em cada camada da estrutura de codificador hierárquica.
A estrutura de codificação hierárquica do codificador 109 pode resultar em codificação bem eficiente e de alta qualidade para uma baixa complexidade, ainda mis, a estrutura de codificação hierárquica pode ser variada dependendo na natureza do sinal que é codificado. Por exemplo, se um sinal estéreo simples é codificado, isto pode ser alcançado por uma estrutura de codificação hierárquica compreendendo somente um único redutor por mixagem de TTO e uma única camada.
De modo para o decodificador 115 tratar sinais codificados usando estruturas de codificação hierárquica diferentes, é preciso ser capaz de se adaptar a estrutura de codificação hierárquica usada para o sinal específico. Especificamente, o decodificador 115 compreende funcionalidade para se configurar para ter uma estrutura hierárquica de decodificador que coincide com a estrutura de codificação hierárquica do codificador 109. Contudo, de modo a fazer isso, o decodificador 115 precisa ser provido com informação da estrutura de codificação hierárquica usada para codificar o fluxo de binária recebido.
Fig. 3 ilustra um exemplo de codificador 109 de acordo com algumas modalidades da invenção.
O codificador 109 compreende um processador de recepção 301 que recebe um número de canais de áudio de entrada. Para o exemplo específico da Fig. 2,o codificador 109 recebe seis canais. O processador de recepção 301 é acoplado a um processador de codificação 303 que tem uma estrutura de codificação hierárquica. Como um exemplo, a estrutura de codificação hierárquica do processador de codificação 303 pode coiresponder àquela ilustrada na Fig. 2.
Ainda mais, o processador de codificação 303 é acoplado a um processador de estrutura de codificação 305 que é arrumado par determinar a estrutura de codificação hierárquica usada pelo processador de codificação 303. O processador de codificação 303 pode, especificamente, alimentar dados de estrutura para o processador de estrutura de codificação 305. Em resposta, o processador de estrutura de codificação 305 gera dados de estrutura de árvore de decodificador que são indicativos da estrutura hierárquica de decodificador que precisa ser usada pelo decodificador para decodificar o sinal codificado gerado pelo processador de codificação 303.
Deve ser apreciado, que os dados de estrutura de árvore de decodificador podem ser diretamente determinados como dados descrevendo a estrutura de codificação hierárquica ou podem e. g. ser dados que diretamente descrevem a estrutura hierárquica de decodificador que precisa ser usada (e. g pode descrever a estrutura complementar àquela do processador de codificação 303).
Os dados de estrutura de árvore de decodificador, especificamente, compreendem, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em camadas hierárquicas da estrutura hierárquica de decodificador. Assim sendo, os dados de estrutura de árvore de decodificador podem compreender, pelo menos, uma indicação de onde um canal de áudio precisa ser dividido no decodificador. Tal uma indicação pode por exemplo, ser uma indicação de uma camada na qual a estrutura de codificação compreende um redutor por mixagem ou pode de forma equivalente, ser um a indicação de uma camada da estrutura de árvore de decodificador que precisa compreender um elevador por mixagem.
O processador de codificação 303 e o processador de estrutura de codificação 305 são acoplados a um gerador 307 de fluxo de dados que gera um fluxo de bits compreendendo o áudio codificado do processador de codificação 303 e os dados de estrutura de árvore de decodificador do processador de estrutura de codificação 305. Este fluxo de dados é então alimentada para o transmissor de rede 11 para comunicação ao receptor 103.
Fig. 4 ilustra um exemplo do decodificador 115 de acordo com algumas modalidades da invenção.
O decodificador 115 compreende um receptor 401 que recebe o fluxo de dados transmitida dão receptor de rede 113. Ainda mais, o decodificador 115 compreende um processador de decodificação 403 e um processador de estrutura de decodificador 405, acoplados ao receptor 401.
O receptor 401 extrai os dados de estrutura de árvore de decodificador e os alimenta para o processador de estrutura de decodificador405, ao passo que os dados de codificação de áudio compreendendo um número de canais de áudio e os dados de áudio paramétricos são alimentados
para o processador de decodificação 403.
O processador de estrutura de decodificador 405 é arrumado
para determinar a estrutura hierárquica de decodificador em resposta aos dados de estrutura de árvore de decodificador recebidos. Especificamente, o processador de estrutura de decodificador 405 pode extrair os valores de dados especificando as divisões de dados e pode gerar informação da estrutura hierárquica de decodificador que complementa a estrutura de codificação hierárquica do processador de codificação 303. Esta informação é alimentada para processador de decodificação 403 fazendo com que este seja configurado para a estrutura hierárquica de decodificador especificada.
Subseqüentemente, o processador de estrutura de decodificador 405 procede, para gerar os canais de saída correspondendo às entradas originais para o codificador 109 usando a estrutura hierárquica de
decodificador.
Assim sendo, o sistema pode permitir uma codificação
eficiente e de alta qualidade, decodificação e distribuição de sinais de áudio e
especificamente, de sinais de áudio de multi canal. Um sistema bem flexível é
possibilitado onde decodificadores podem automaticamente se adaptar aos
codificadores e os mesmos decodificadores podem assim, serem usados com
um número de codificadores diferentes.
Os dados de estrutura de árvore de decodificador são
efetivamente comunicados usando valores de dados que são indicativos de
características de divisão de canal para os canais de áudio nas camadas hierárquicas diferentes da estrutura hierárquica de decodificador. Assim sendo, os dados de estrutura de árvore de decodificador são otimizados para estruturas de codificação e decodificação hierárquicas de alto desempenho e flexíveis.
Por exemplo, um sinal de canal de 5.1 (i. e., um sinal de seis
canais) pode ser codificado como um sinal estéreo mais um conjunto de parâmetros locais. Tal codificação pode ser alcançada através de muitas estruturas de codificação hierárquicas diferentes que usam redutores por mixagem simples de TTO ou de Três para Dois (TTT) e assim muitas estruturas de decodificador hierárquicas diferentes são possíveis usando elevadores por mixagem de Um para Dois (OTT) ou de Dois para Três (TTT). Assim sendo, de modo a decodificar o fluxo de bit local correspondente, o decodificador deve ter conhecimento da estrutura de codificação hierárquica que foi empregada no codificador. Uma abordagem direta e simples é então sinalizar a árvores no fluxo de bit por meio de um indexador em uma tabela de procura. Um exemplo de tabela de procura adequada pode ser:
<table>table see original document page 26</column></row><table>
Contudo, usando tal uma tabela de procura tem a desvantagem que todas as estruturas de codificação hierárquicas que possivelmente podem ser usadas precisam ser explicitamente especificada na tabela de procura. Contudo, isto requer que todos decodificadores/codificadores precisam receber tabelas de procura atualizadas de modo a introduzir uma nova estrutura de codificação hierárquica no sistema. Isto é altamente indesejável e resulta em operação complexa e um sistema inflexível.
Ao contrário, o uso de dados de estrutura de árvore de decodificador onde valores de dados indicam divisões de canais em camadas diferentes da estrutura hierárquica de decodificador, permite uma comunicação geral simples dos dados de estrutura de árvore de decodificador que podem descrever qualquer estrutura hierárquica de decodificador. Assim sendo, novas estruturas de codificação podem ser prontamente usadas sem requerer qualquer notificação anterior dos decodificadores correspondentes.
Assim sendo, em contraste com a abordagem baseada na tabela de procura, o sistema da Fig. 1 pode tratar um número arbitrário de canais de entrada e de saída enquanto mantendo flexibilidade total. Isto é alcançado especificando uma descrição da árvore do codificador/decodificador no fluxo de bit. A partir desta descrição, o decodificador pode derivar onde e como aplicar os parâmetros subseqüentes codificados no fluxo de bit.
Os dados de estrutura de árvore de decodificador podem especificamente compreender uma grande quantidade de valores de dados onde cada valor de dados é indicativo de uma característica de divisão de canal para um canal em uma camada hierárquica da estrutura hierárquica de decodificador. Especificamente, os dados de estrutura de árvore de decodificador podem compreender um valor de dados para cada elevador por mixagem a ser incluído na estrutura hierárquica de decodificador. Ainda mais, um valor de dados pode ser incluído para cada canal que não é mais para ser dividido. Assim sendo, se um valor de dados dos dados de estrutura de árvore de decodificador tem um valor correspondendo a um valor específico predeterminado, este pode indicar que o canal correspondente não é mais para ser dividido, mas é de fato um canal de saída do decodificador 115.
Em algumas modalidades, o sistema somente pode incorporar decodificadores que exclusivamente usam redutores por mixagem de TTO e o decodificador pode conseqüentemente ser implementado usando somente elevadores por mixagem de OTT. Em tal uma modalidade, um valor de dados pode ser incluído para cada canal do decodificador. Ainda mais, o valor de dados pode ter um dos dois possíveis valores com um valor indicando que o cana não é dividido e o outro valor indicando que o canal é dividido em dois canais através de um elevador por mixagem de OTT. Ainda mais, a ordem dos valores de dados nos dados de estrutura de árvore de decodificador pode indicar que canais são divididos e assim a localização dos elevadores por mixagem de OTT na estrutura hierárquica de decodificador. Assim sendo, dados de estrutura de árvore de decodificador compreendendo valores binários simples completamente descrevendo a estrutura hierárquica de decodificador exigida podem ser obtidos.
Como um exemplo específico, a derivação de uma descrição de fluxo de bit da estrutura hierárquica de decodificador do decodificador da Fig. 5 será descrita.
No exemplo, é assumido que codificadores somente podem usar redutores por mixagem de TTO e assim a árvore do decodificador pode ser descrita através de um fluxo binário. No exemplo da Fig. 5, um canal de áudio de entrada único é expandido para um sinal de saída de cinco canais usando elevadores por mixagem de OTT. No exemplo, quatro camadas de profundidade podem ser discernidas, a primeira, denotada com O, é a camada do sinal de entrada, a última, denotada com 3, é a camada dos sinais de saída. Deve ser apreciado que nesta descrição, as camadas são caracterizadas através de canais de áudio com os elevadores por mixagem formando as fronteira de camada, as camadas podem, de forma equivalente, serem consideradas para compreender os ou serem formadas através dos elevadores por mixagem.
No exemplo, a estrutura hierárquica de decodificador da Fig. 5 pode ser descrita pelo fluxo de bit "111001000" derivado através dos passos a seguir:
.1 - O sinal de entrada na camada 0, to é dividido (elevador por mixagem de OTT A), como um resultado, todos sinais na camada 0 são levados em conta, passa para a camada 1.
.1 - O primeiro sinal na camada 1 (vindo do topo de elevador por mixagem de OTT A) é dividido (elevador por mixagem de OTT B).
1 - O segundo sinal na camada 1 (vindo da base de elevador por mixagem de OTT A) é dividido (elevador por mixagem de OTT C), todos sinais na camada 1 são descritos, passa para camada 2.
O-O primeiro sinal na camada 2 (topo do elevador por
mixagem de OTT B) não é mais dividido.
0- O segundo sinal na camada 2 (base do elevador por mixagem de OTT B) não é mais dividido.
1 - 0 terceiro sinal na camada 2 (topo do elevador por mixagem de OTT C) é dividido de novo.
0- O quarto sinal na camada 2 (base do elevador por mixagem de OTT D) não é mais dividido, todo sinais na camada 2 são descritos, passa para camada 3.
0- O primeiro sinal na camada 3 (topo do elevador por mixagem de OTT D) não é mais dividido.
0- O segundo sinal na camada 3 (base do elevador por mixagem de OTT D) não é mais dividido, todos sinais foram descritos.
Em algumas modalidades, a codificação pode ser limitada para usar somente redutores por mixagem de TTO e TTT e assim a codificação pode ser limitada para usar somente elevadores por mixagem de OTT e TTT. embora, os elevadores por mixagem de TTT possam ser usados em muitas configurações diferentes, é particularmente vantajoso usá-los em um modo onde (forma de onda) prognóstico é usado para precisamente estimar os três sinais de entrada a partir dos dois sinais de entrada. Devido a esta natureza de prognostico dos elevadores por mixagem de TTT, a posição lógica para esses elevadores por mixagem é na raiz da árvore. Isto é uma seqüência dos elevadores por mixagem de OTT destruindo a formada de onda original e por meio disso fazendo prognóstico inadequado. Assim sendo, em algumas modalidades, somente os elevadores por mixagem que são usados na estrutura de decodificador são elevadores por mixagem de OTT ou elevadores por mixagem de TTT na camada raiz.
Então, para cada sistema, três diferentes situações podem ser discernidas, que juntas permitem uma descrição universal da árvore:
1) Árvores que têm um elevador por mixagem de TTT como raiz.
de OTT.
2) Árvores consistindo somente de elevadores por mixagem
3) "Árvores vazias", i. e., um mapeamento direto de canal(s) de entrada para canal(s) de saída.
Fig. 6 ilustra exemplo de estruturas de decodificador hierárquica tendo elevadores por mixagem de TTT na raiz e Fig. 7 ilustra um exemplo de estrutura hierárquica de decodificador compreendendo uma grande quantidade de estruturas de árvore de decodificador. A estrutura hierárquica de decodificador da Fig. 7, compreende estruturas de árvore de decodificador de acordo com todas os três exemplos apresentados acima.
Em algumas modalidades, os dados de estrutura de árvore de decodificador são ordenados de modo a saber se um canal de entrada compreende um elevador por mixagem de TTT ou não. Os dados de estrutura de árvore de decodificador podem compreender uma indicação de um elevador por mixagem de TTT estando presente na camada da raiz, seguido de indicativos dados binários se os canais das camadas mais baixas estão divididos ou não são mais divididos. Isto pode melhorar desempenho em termos de taxa de bit e custo de sinalização baixo.
Por exemplo, os dados de estrutura de árvore de decodificador podem indicar quantos elevadores por mixagem de TTT são incluídos na estrutura hierárquica de decodificador. Como cada estrutura de árvore somente pode compreender um elevador por mixagem que é localizado no nível raiz, o restante da árvore pode ser descrito através de um fluxo binário como descrito previamente (i. e. como a árvore é uma árvore de elevadores por mixagem de OTT somente para camadas mais baixa, a mesma abordagem com descrito para uma estrutura hierárquica de decodificador de somente
elevador por mixagem de OTT pode ser aplicada).
Também, as estruturas de árvore remanescentes são, ou
árvores de somente elevador por mixagem de OTT ou árvores vazias que
também podem ser descritas com fluxos binários. Assim sendo, todas as
árvores podem ser descritas por valores de dados binários e a interpretação do
fluxo binário pode depender de que categoria a árvore pertence. Esta
informação pode ser fornecida pela localização da árvore nos dados de
estrutura de árvore de decodificador. Por exemplo, todas as árvores
compreendendo um elevador por mixagem de TTT, primeiro, podem ser
localizadas nos dados de estrutura de árvore de decodificador, seguido pelas
árvores de somente elevador por mixagem de OTT, seguido pelas árvores
vazias. Se o número de elevadores por mixagem de TTT e de elevadores por
mixagem de OTT na estrutura hierárquica de decodificador é incluído nos
dados de estrutura de árvore de decodificador, o decodificador pode ser
configurado sem requerer quaisquer dados adicionais. Assim sendo, uma
comunicação altamente eficiente de informação de estrutura de decodificador
exigida é alcançada. A sobrecarga de comunicação dos dados de estrutura de
árvore de decodificador pode ser mantida bem baixa, ainda um sistema
altamente flexível é fornecido que pode descrever uma ampla variedade de
estruturas de decodificador hierárquicas.
Como um exemplo específico, as estruturas de decodificador
hierárquicas do decodificador da Fig. 7 podem ser derivadas a partir dos
dados de estrutura de árvore de decodificador pelo seguinte processo:
- O número de canais de entrada é derivado da (possivelmente
codificado) redução por mixagem.
- O número de elevadores por mixagem de OTT e Elevadores por mixagem de TTT da árvore inteira são sinalizados nos dados de estrutura de árvore de decodificador e podem ser extraídos deles. O número de sinais de saída podem ser derivado como: # de sinais de saída = # de sinais de entrada + # de elevadores por mixagem de TTT + # de elevadores por mixagem de OTT.
- Os canais de entrada podem ser re-mapeados em dados de
estrutura de árvore de decodificador, tais que, primeiro, após re-mapeamento, as árvores de acordo com a situação 1) são encontradas, seguidas das árvores de acordo com a situação 2) e então 3). Por exemplo da Fig. 7, resultaria na ordem 3, 0, 1, 2, 4, i. e„ sinal 0 é o sinal 3 após re-mapeamento, sinal 1 é o sinal 0 após re-mapeamento, etc.
- Para cada elevador por mixagem de TTT, três descrições de árvore de somente OTT são dadas usando o método descrito acima, uma árvore de somente OTT por canal de saída de TTT.
- Para dos sinais de entrada remanescentes descrições somente de OTT são dadas.
Em algumas modalidades, uma indicação de uma posição de alto-falante para os canais de saída é incluída nos dados de estrutura de árvore de decodificador. Por exemplo, uma tabela de procura de localizações de alto- falantes predeterminadas pode ser usada, tal como por exemplo:
<table>table see original document page 32</column></row><table>
Alternativamente, as localizações dos alto-falantes podem ser representadas usando uma abordagem hierárquica, e. g. uns poucos primeiros bits especificam o eixo do x. e. g. Lj R5 C, então uns outros poucos bits especificam o eixo do y. e. g. Frontal, Lateral, Ambiente e uns outros poucos bits especificam o eixo do ζ (elevação).
Com um exemplo específico, o seguinte fornece uma sintaxe
de fluxo de bit exemplar para um fluxo de bit seguindo as orientações acima. No exemplo, o número de sinais de entrada e saída é explicitamente codificado no fluxo de bits. Tal informação pode ser usada para validar o fluxo de bits Sintaxe
TreeDcseriptionO {
}
For (ch=G; ch< numOuCta; ch++) {
Idx = O;
OttUpJMxerIdK = O; Para (i==0; i< numTttUpjraixere; t++) { TttConfíg(i); Para (çfr*0; C^i ch++, idx++) { OtfTreeDescriptian(idx);
}
}
Neste exemplo, cada OLttTree é tratada na OttTreeDescriptionO que é ilustrada abaixo. Sintaxe
OttTreeDescription(idx)
{
CurrLayerSignals =1
NextLayerSignals = 0
enquanto (CurrLayerSignals>0) {
bsOttUp_mixerPresent
if (bsOttUp_mixerPresent = 1) {
OttConfig(ottUP_mixerIdx);
ottDefaultCld[[ottUp_mixerIdx);
bsOttDcfaultCld(ottUp_mixerIdx];
ottModeLfe[ottUp_mixerIdx] =
bsOttModeLfe[ottUp_mixerIdx];
NextLayerSignals + =2;
ottUp_mixeridx ++;
}
CurrLayerSignals—-;
if ((CurrLayerSignals = 0)&&
(NextLayerSignals>0))) {
CurrLayerSignals = NextLayerSignals;
NextLayerSignals = 0;
}
}
}
Na sintaxe acima formato em negrito é usado para indicar elementos lidos do fluxo de bit.
Será apreciado que a noção de camadas hierárquicas não é necessária em tal uma descrição. Por exemplo, uma descrição baseada em um princípio de "enquanto houverem extremidades abertas, haverá mais bits para vir" poderia também ser aplicado. Contudo, de modo a decodificar os dados, esta noção pode se tornar útil.
Além dos bits únicos denotando se um elevador por mixagem de OTT está ou não presente, os seguintes dados são incluídos para o elevador por mixagem de OTT: - A Diferente de Nível de Canal padrão.
- Se o elevador por mixagem de OTT é um elevador por
mixagem de OTT de LFE (Intensificação de Freqüência baixa), i. e., se os parâmetros somente são limitados em banda e não contêm qualquer descrição detalhada a seguir de correlação/coerência.
Adicionalmente, dados podem especificar propriedades dos elevadores por mixagem, tal como no exemplo do elevador por mixagem de TTT, que modo de usar (prognóstico baseado em forma de onda, descrição baseada em energia, etc.).
Como será conhecido por uma pessoa com habilidade na técnica, um elevador por mixagem de OTT usa um sinal desprovido de correlação para dividir um canal único em dois canais. Ainda mais, o sinal desprovido de correlação é derivado a partir do sinal de canal de entrada único. Fig. 802.16 ilustra um exemplo de uma elevador por mixagem de OTT de acordo com esta abordagem. Assim sendo, o decodificador exemplar da
Fig. 5 pode ser representado pelo diagrama da Fig. 9 onde os blocos de desfazer correlação gerando os sinal desprovidos de correlação são explicitamente mostrados.
Contudo, como pode ser visto, esta abordagem leva a uns blocos de desfazer correlação de cascata tal que o sinal desprovido de correlação para um elevador por mixagem de OTT de camada mais baixa é gerado a partir de uma modalidade sinal de entrada que foi gerado a partir de um outro sinal desprovido de correlação. Assim sendo, melhor do que sendo gerado a partir do sinal de entrada original na camada de raiz, os sinais desprovidos de correlação de camadas mais baixa terão sido processados por vários blocos de desfazer correlação. Como cada bloco de desfazer correlação compreende um filtro de desfazer correlação, esta abordagem pode resultar em um "mancha" do sinal desprovido de correlação (por exemplo, transientes podem ser significantemente distorcidos). Isto resulta em degradação da qualidade de áudio para o sinal de saída.
Assim sendo, de modo a melhorar a qualidade de áudio, os
desfazedores de correlação aplicados na elevação por mixagem de
decodificador podem, por conseguinte, em algumas modalidades serem
movidos tal que uma cascata de sinais desprovidos de correlação é evitada.
Fig. 10 ilustra um exemplo de uma estrutura de decodificador correspondendo
àquela da Fig. 9 mas com os desfazedores de correlação diretamente
acoplados como canal de entrada. Assim sendo, no lugar de pegar a saída do
elevador por mixagem de OTT predecessor como entrada para o desfazedor
de correlação, os elevadores por mixagem do desfazedor de correlação pegam
o sinal de entrada original to, presente-processado pelo ganho dos elevadores
por mixagem Gb, Gc e Gd. Estes ganhos asseguram que a potência na entrada
do desfazedor de correlação é idêntica à potência que teria sido alcançada na
entrada do desfazedor de correlação na estrutura da Fig. 9. A estrutura obtida
desta formada não contém uma cascata de desfazedores de correlação e por
meio disso resultando em qualidade de áudio melhorada.
A seguir, um exemplo de como determinar parâmetros de
multiplicação de matriz para os elevadores por mixagem das camadas hierárquicas em resposta aos dados de estrutura de árvore de decodificador - será descrito. Particularmente, a descrição irá focar em modalidades onde os filtros de desfazer correlação para gerar os sinais desprovidos de correlação dos elevadores por mixagem são conectados diretamente aos canais de entrada de áudio da estrutura de decodificação. Assim sendo, a descrição irá focar em modalidades de codificadores tal com ilustrados na Fig. MN 10. Fig. 11 ilustra um fluxograma exemplar para um método de
decodificação de acordo com algumas modalidades da invenção.
No passo 1101, os parâmetros quantizados e codificados são
decodificados a partir dos fluxos de bits recebidos. Como será apreciado pela pessoa com habilidade na técnica, isto pode resultar em um número de vetores de parâmetros de codificação de áudio paramétricos convencionais, tais como: CLD0= [-10 15 MN 10 2... 10] CLD1 = [5 12 15 MN 10... 2] ICCo = [1 0,6 0,9 0,3... -1] ICCi = [0 1 0.6 0.9... 9.3] etc.
Cada vetor representa os parâmetros ao longo do eixo da
freqüência.
Passo 1101 é seguido pelo passo 1103 onde as matrizes para os elevadores por mixagem individuais são determinadas a partir dos dados
paramétricos decodificados.
As (independente da freqüência) matrizes de OTT e TTT
generalizadas podem, respectivamente serem dadas por:
Jh 1 ^
A- >2.
M^ M9
21 íM 22 M32 M-
'31
33
X1
Λ
Os sinais xu dt e yt representam sinais de entrada, sinais desprovidos de correlação derivados a partir dos sinais Xi e os sinais de saída respectivamente. As entradas de matrizHijCMij são funções dos parâmetros
derivados no passo 1103.
O método então divide em dois caminhos paralelos onde um
caminho é direcionado para derivar valores de matriz de pré-árvore (passo1105) e um caminho é direcionado par derivar valores de matriz de mixagem
de árvore (passo 1107).
As pré- matrizes correspondem às multiplicações de matriz
aplicadas ao sinal de entrada antes de desfazer correlação e da aplicação de
matriz. Especificamente, as pré-matrizes correspondem ao ganho dos
elevadores por mixagem aplicado ao sinal de entrada antes dos filtros de desfazer correlação.
Em mais detalhes, uma implementação de decodificador direta
e simples, em geral levará a uma cascata de filtros de desfazer correlação, com e. g. aplicado na Fig. 9. Como explicado acima, é preferível evitar esta cascata. De modo a fazer assim, os filtros de desfazer correlação são todos movidos para o mesmo nível hierárquico como mostrado na Fig. 10. De modo a assegurar que os sinais desprovidos de correlação tenham o nível de energia apropriado, i. e. idêntico ao nível dos sinais desprovidos de correlação no caso direto e simples da Fig. 9, as pré-matrizes são aplicadas antes de desfazer
correlação.
Como um exemplo, o ganho Gb na Fig. 10 é derivado com a seguir. Primeiro, é importante notar que um elevador por mixagem de 1 para2 divide a potência de sinal de entrada para a saída superior e inferior do elevador por mixagem de 1 para 2. Esta propriedade é refletida nos parâmetros de Diferença de Intensidade de Inter-Canal (IID) ou de Diferença de Nível de Inter-Canal (ICLD). Então, o ganho Gb é calculado como a proporção de energia da saída superior dividida pela soma da saída superior e inferior do elevador por mixagem de 1 para 2 A. Será apreciado que já que os parâmetros de ILD ou de ICLD podem ser variantes no tempo e na freqüência, o ganho também pode variar sobre ambos, o tempo e a freqüência.
As matrizes de mixagem são matrizes aplicadas ao sinal de entrada através dos elevadores por mixagem de modo a gerar canais adicionais.
As equações finais de pré-matriz e de matriz de mixagem são um resultado de uma cascata dos elevadores por mixagem de OTT e de TTT. Como a estrutura de decodificador foi alterada para evitar uma cascata de desfazedores de correlação, isto precisa ser levado em conta quando
determinando as equações finais.
Nas modalidades, onde somente configurações predeterminadas são usadas, a relação entre as entradas de matriz HijQMijO as equações finais de matriz é constante e uma modificação padrão pode ser aplicada.
Contudo, para a abordagem dinâmica e mais flexível previamente descrita, a determinação dos valores de presente'-matriz e matriz de mixagem podem ser determinada através de abordagens mais complexas como será descrito mais tarde.
Passo 1105 é seguido pelo passo 1109, onde as pré-matrizes derivadas no passo 1005 são mapeados para a grade de freqüência realizar que é aplicada para transformar o sinal de domínio do tempo para domínio de freqüência (no passo 1113).
Passo 1109 é seguido pelo passo 1111, onde interpolação dos parâmetros de matriz de freqüência podem ser interpelados. Especificamente, dependendo ou não, da atualização temporal dos parâmetros correspondendo à atualização da transformação de tempo para freqüência no passo 1113, interpolação pode ser aplicada.
No passo 1113, os sinais de entrada são convertidos para o domínio da freqüência de modo a aplicação as pré-matrizes mapeadas e opcionalmente interpoladas.
Passo 1115 segue passo 1111 e passo 1113 e compreende, aplicar as pré-matrizes para os sinais de entrada no domínio da freqüência. A aplicação de matriz realizar é um conjunto de multiplicações de matriz.
Passo 1115 é seguido pelo passo 1117, onde parte dos sinais resultantes da aplicação de matriz do passo 1115 é alimentado para um filtro de desfazer correlação para gerar sinais desprovidos de correlação.
A mesma abordagem é aplicada para derivar equações de matriz de mixagem.
Especificamente, passo 117 é seguido pelo passo 119, onde as equações determinadas no passo 117 são mapeadas para a grade de freqüência da transformação de tempo para freqüência do passo 1113.
Passo 1119 é seguido pelo passo 1121, onde os valores de
matriz de mixagem são opcionalmente interpelados, de novo dependendo da
atualização temporal dos parâmetros e da transformação.
Os valores gerados nos passos 1115, 1117 e 1121 assim
formam os parâmetros requeridos para a multiplicação de matriz de elevação
por mixagem e isto é efetuado no passo 1123.
Passo 1123 é seguido pelo passo 1125, onde a saída resultante
é transformada de volta para o domínio do tempo.
Os valores gerados nos passos 1115, 1117 e 1123 na Fig. 11
podem ser ainda ilustrados pela Fig. 12. fig. 12 ilustra um exemplo de uma
estrutura de decodificador de matriz de acordo com algumas modalidades da
invenção.
Fig. 12 ilustra com os canais de redução por mixagem de entrada podem ser usados para re-construir a saída de multi canal. Como evidenciado acima, o processo pode ser descrito através de duas multiplicações de matriz com unidades intermediárias de desfazer correlação.
Então, o processamento dos canais de entrada para formar os
canais de saída pode ser descrito de acordo com: v^ =Mfxnjt y»* =Mfw"'*
onde
Mi n,k é uma matriz de duas dimensões mapeando um certo número de canais de entrada para um certo número de canais indo para os desfazedores de correlação, e é definido para pedaço de tempo « modo e cada
sub banda k\ e
M2 n,k é uma matriz de duas dimensões mapeando um certo número de canais pré-processados para um certo número de canais, e é definido para pedaço de tempo η modo e cada sub banda k. A seguir, um exemplo de como as equações de pré-matrizes e de matriz de mixagem dos passos 1105 e 1107 podem ser geradas a partir dos dados de estrutura de árvore de decodificador, serão descritas.
Primeiramente, estruturas de árvore de decodificador tendo somente elevadores por mixagem de OTT serão consideradas com referência
a árvore exemplar da Fig. 13.
Para estes tipos de árvores é benéfico definir um número de
variáveis auxiliares.
• 1 2 3 4" 0 0 11
descreve os índices de elevador por mixagem de OTT que são encontrados para cada elevador por mixagem de OTT (i. e. no exemplo, o sinal sendo entrado para o quarto elevador por mixagem de OTT tem passado através de0-enésimo e primeiro elevador por mixagem de OTT, como dados pela quinta coluna na matriz Tree Similarmente o sinal sendo entrado para o segundo elevador por mixagem de OTT tem passado através da 0-enésima caixa de OTT, como dados pela terceira coluna na matriz Tree \ e assim por diante.
anal
lllli 1-11-1
1 I
descreve se o caminho superior ou inferior é buscado para cada elevador por mixagem de OTT- Um sinal positivo indica o caminho superior, e um sinal
negativo indica o caminho inferior.
A matriz corresponde à matriz de Tree \ e então quando uma
certa coluna e linha na matriz Tree 1 apontam para um certo elevador por
mixagem de OTT, a mesma coluna e linha na matriz Tree 1 sinai indica se a
parte superior e inferior daquele elevador por mixagem de OTT específico é
usado para alcançar o elevador por mixagem de OTT dados na primeira linha
da coluna específica, (i. e. no exemplo, o sinal sendo entrado no quarto elevador por mixagem de OTT tem passado através do caminho superior do O-ésimo elevador por mixagem de OTT (como indicado pela terceira linha, quinta coluna na matriz Tree 1 sinal), e o caminho inferior do primeiro elevador por mixagem de OTT (como indicado pela segunda linha, quinta coluna na
matriz Tree1 Sinai)-
Tree 1 sina, = [1 22 3 3] descreve a profundidade da árvore para cada elevador por mixagem de OTT (i. e. no exemplo, elevador por mixagem O está na camada 1, elevador por mixagem 1 e 2 estão na camada 2 e elevador por mixagem 3 e 4 estão na
camada 3); e
Tree elementos = [5]
denota o número de elementos na árvore (i. e. no exemplo, a árvore
compreende cinco elevadores por mixagem)
Uma matriz temporária K, descrevendo a pré-matriz para
somente os sinais desprovidos de correlação é então definida de acordo com:
I3 de outro modo
onde
é o valor de ganho para o elevador por mixagem de OTT indicado por Tree \i, P) dependendo se a saída superior ou inferior da caixa de OTT é usada, e
onde
Os valores de IID são os valores de Diferença de Intensidade
de Inter-Canal obtidos a partira do fluxo de bits.
A matriz Mi de pré-mixagem é então construída como:
í - Lembrando que objetivo da matriz de pré-mixagem é ser capaz de mover os desfazedores de correlação incluídos no elevador por mixagem de OTT na Fig. 13, antes das caixas de OTT. então, a matriz de pré-mixagem necessária para fornecer um sinal de entrada "enxuto" para todos os desfazedores de correlação no elevador por mixagem de OTT, onde os sinal de entrada tem o nível que eles teriam tido no ponto específico na árvore quando o desfazedor de
correlação estava situado antes de movê-lo na frente da árvore.
Também lembrando que a pré-matriz somente aplica um pré-
ganho para sinais indo para os desfazedores de correlação, e a mixagem dos sinais do desfazedor de correlação e do sinal de redução por mixagem "enxuto" ocorre na matriz de mixagem M2, que será elaborada abaixo, o primeiro elemento da matriz de pré-mixagem dá uma saída que é diretamente acoplada a matriz M2 (ver Fig. 12, onde a linha m/c ilustra isso).
Dado que uma árvore de somente elevador por mixagem de OTT está correntemente sendo observado, é claro que também o segundo elemento do vetor de pré-mixagem M1, será uma, já que o sinal indicado para o desfazedor de correlação no elevador por mixagem de OTT zero, é exatamente o sinal de entrada de redução por mixagem, e que para este elevador por mixagem de OTT não há diferença para mover o desfazedor de correlação em frente da árvore inteira já que ele está primeiro na árvore.
Ainda mais, dados que o vetor de entrada para os desfazedores
de correlação são dados por V = M1 **x e observando Fig. 13 e Fig. 12, e a maneira os elementos na matriz M1 "<* são derivados, é claro que a primeira linha de Ml corresponde ao sinal m na Fig. 12, as linhas subseqüentes correspondem ao sinal de entrada do desfazedor de correlação de caixa de OTT 9,..., 4. Então o vetor w será com a seguir:
m onde en denota a saída do desfazedor de correlação da n-enésima caixa de OTTnaFig. 13.
Agora observando a matriz de mixagem M2, os elementos desta matriz podem ser deduzidos similarmente. Contudo, para esta matriz o objetivo é ganhar ajuste do sinal e mixar dele com as saídas do desfazedor de correlação relevantes. Lembrando que cada elevador por mixagem de OTT na árvore pode ser descrito pelo seguinte
<formula>formula see original document page 45</formula>
onde, Y1 é a saída superior da caixa de OTT, e Y2 é a inferior e X é o sinal de entrada enxuto e Quadro é o sinal do desfazedor de correlação.
Já que os canais de saída são formados pela multiplicação de matriz
<formula>formula see original document page 45</formula>
e o vetor w n,k é formado como uma combinação do sinal de redução por mixagem e a saída dos desfazedores de correlação como indicado pela Fig. 12, cada linha da matriz M2,corresponde a um canal de saída, e cada elemento na linha específica, indica quanto do sinal de redução por mixagem e dos desfazedores de correlação diferentes que deve ser mixada para formar o canal de saída específico.
Como um exemplo, a primeira linha da matriz de mixagem M2, pode ser observada.
<formula>formula see original document page 45</formula>
O primeiro elemento da primeira linha em M2, corresponde a contribuição do sinal "m", e é a contribuição da saída dada pelas saídas superiores dos elevador por mixagem de OTT O, 1 e 4. Dados a matriz H acima, esta corresponde à Hll0, Hll1 e Hll3, já que a quantidade de sinal enxuto para a saída superior de uma caixa de OTT é dada pelo elemento Hl 1 do elevador por mixagem de OTT.
O segundo elemento corresponde à contribuição de desfazedor de correlação Dl, que de acordo com o acima está situado no elevador por mixagem de OTT 0. Então, a contribuição deste é Hll0j Hll3 e H 12o. Isto é evidente, já que o elemento H120 dá a saída do desfazedor de correlação do elevador por mixagem de OTT O, e que o sinal é subseqüentemente passado através dos elevadores por mixagem de OTT 1 e 3, como parte da sinalização dry, e assim ganho ajustado de acordo com os elementos Hll0 e Hl I3.
Similarmente, o terceiro elemento corresponde à contribuição do desfazedor de correlação D2, que de acordo com o acima está situado no elevador por mixagem de OTT 1. Então,a contribuição deste é Hl 20 e Hl I3.
O quinto elemento corresponde à contribuição do desfazedor de correlação D3, que de acordo com a notação acima está situado no elevador por mixagem de OTT 3. Então,a contribuição deste é H123.
O quarto e sexto elementos da primeira linha são zeros já que nenhuma contribuição dos desfazedores de correlação D4 ou D6, é parte do canal de saída correspondendo à primeira linha na matriz.
O exemplo acima torna evidente que elementos da matriz pode ser deduzidos com produtos dos elementos H de matriz de elevador por mixagem de OTT.
De modo a derivar a matriz de mixagem M2, para uma árvore genérica, um processamento similar ao da matriz Mi, pode ser derivado. Primeiro, as variáveis auxiliares a seguir são derivadas:
A matriz Tree, mantém uma coluna para cada canal de saída, descrevendo os índices dos elevadores por mixagem de OTT que o sinal passa para atingir cada canal de saída. <formula>formula see original document page 47</formula>
A matriz Tree sinal mantém um indicador para cada elevador por mixagem na árvore para indicar se o caminho superior (1) ou inferior (-1) deve ser usada para atingir o canal de saída corrente. <formula>formula see original document page 47</formula>
O vetor Tree prof. mantém o número de elevadores por mixagem que precisa ser passado para atingir um canal de saída específico.
Tree prof.= [3 3 3 3 2 2]
O vetor Tree elementos = mantém um número de elevadores por mixagem em cada sub árvore da árvore inteira.
Tree elementos=[5]
Provido que a notação definida acima é suficiente par descrever todas as árvores que podem ser sinalizadas, a matriz M2, pode ser definida. A matriz par uma sub árvore k, criando N canais de saída de um canal de entrada é definido de acordo com:
<formula>formula see original document page 47</formula>
onde onde os elementos H são definidos pelos parâmetros correspondendo ao
elevador por mixagem de OTT com índice Tree (p, j).
A seguir, uma forma mais geral de árvore envolvendo
elevadores por mixagem de TTT no nível de raiz é assumida, tal como por exemplo, a estrutura de decodificador da Fig. 14. Os elevadores por mixagem contendo duas variáveis Mli e M2i denotam árvores de OTT e assim não necessariamente elevadores por mixagem de OTT únicos. Ainda mais, primeiramente, é assumido que os elevadores por mixagem de TTT não empregam um sinal desprovido de correlação, i. e. a matriz TTT pode ser descrita com um matriz 3x2.
Sob esses pressupostos e de modo a derivar a pré-matriz e matriz de mixagem finais para o primeiro elevador por mixagem de TTT, dois conjuntos de pré-matrizes são derivados para cada árvore de OTT, uma descrevendo a pré-mixagem para o primeiro sinal de entrada do elevador por mixagem de TTT e uma descrevendo a pré-mixagem para o segundo sinal de entrada do elevador por mixagem de TTT. Após aplicação de ambos os blocos de pré-mixagem e desfazer correlação, os
sinais podem ser somados.
Os sinais de saída podem assim ser derivado com a seguir: m —^Mlftw-Ml1
,_Mlliro-Ml2—»
43] -P-MI^1-Mlj——J χ(2] —Mft1-M 431 —P-MlSw ■»»
J—Μ24—Ρ"
423 —i^Ml^yn -Mls—Κ±
m —^-ΜΙ^η-ΜΙ,
44] —Mli——Μ26» 451 -P-MLr-
Finalmente, no caso do elevador por mixagem de TTT empregar desfazer correlação, a contribuição do sinal desprovido de correlação pode adicionado na forma d em uma modalidade pós-processo. Após o sinal desprovido de correlação do elevador por mixagem de TTT ter sido derivado, a contribuição para cada sinal de saída é simplesmente a contribuição dados pelo vetor [M13, M23, M331 distribuído pelos IIDs de cada
elevador por mixagem de OTT seguinte.
Fig. 15 ilustra um método de transmitir e receber um sinal de
áudio de acordo com algumas modalidades da invenção.
O método inicia no passo 1501, onde um transmissor receber
um nível de canais de áudio de entrada.
Passo 1501 é seguido pelo passo 1503 onde, o transmissor, de
forma paramétrica, codifica o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio e de
dados de áudio paramétricos.
Passo 1503 é seguido pelo passo 1505 onde, a estrutura
hierárquica de decodificador correspondendo aos meios de codificação
hierárquica é determinada.
Passo 1505 é seguido pelo passo 1507 onde, o transmissor
inclui dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárqmca
de decodificador no fluxo de dados.
Passo 1507 é seguido pelo passo 1509 onde, o transmissor
transmitir o fluxo de dados para o receptor.
Passo 1509 é seguido pelo passo 1511 onde, um receptor
recebe o fluxo de dados.
Passo 1511 é seguido pelo passo 1513 onde, a estrutura
hierárquica de decodificador a ser usada pelo receptor é determinada em
resposta aos dados de estrutura de árvore de decodificador.
Passo 1513 é seguido pelo passo 1515 onde, o receptor gera o
número de canais de áudio de saída a partir aos desenhos anexados, nos quais
fluxo de dados usando a estrutura hierárquica de decodificador.
Será apreciado que a descrição acima para fins de clareza
descreveu modalidades da invenção com referência às unidades e processadores funcionais diferentes. Contudo, será aparente que qualquer distribuição adequada de funcionalidade entre unidades ou processadores funcionais diferentes pode ser usada sem diminuir a invenção. Por exemplo, funcionalidades ilustradas para serem efetuadas por processadores ou controladores separados podem ser efetuadas pelos mesmos processadores ou controladores. Logo, referências às unidades funcionais específicas sao somente para serem vistas como referências para meios adequados para fornecer a fimcionalidade descrita, melhor do que indicativo de uma lógica
estrita ou de uma estrutura física ou de uma organização.
A invenção pode ser implementada em qualquer forma
adequada incluindo hardware, software, firmware ou qualquer combinação
destes. A invenção pode, opcionalmente ser implementada parâmetro, pelo
menos, parcialmente como software de computador rodando em um ou mais
processadores de dados e/ou processadores de sinal digital. Os elementos e
componentes de uma modalidade da invenção podem ser implementados,
fisicamente, funcionalmente, e logicamente em qualquer maneira adequada.
De fato a funcionalidade pode ser implementada em uma unidade única, em
uma grande quantidade de unidades ou como parte de outras unidades
funcionais. Tal como, a invenção pode ser implementada em uma unidade
única ou pode ser fisicamente e funcionalmente distribuída entre unidades e
processadores diferentes.
Embora a presente invenção foi descrita em conexão com
algumas modalidades, não é pretendido ser limitada para a forma específica
aqui estabelecida. Em vez disso, o escopo da presente invenção é limitado
pelas reivindicações anexas. Adicionalmente, embora a característica pode
parecer ser descrita em conexão com modalidades particulares, alguém com
habilidade na técnica reconheceria que várias características das modalidades
descritas podem ser combinadas de acordo com a invenção. Nas
reivindicações, o termo compreendendo não exclui a presença de outros
elementos os passos.
Ainda mias, embora, individualmente listados, a grande
quantidade de meios, elementos ou passos de método pode ser implementada
por uma e. g. unidade ou processador único. Adicionalmente, embora,
características individuais podem ser incluídas em reivindicações diferentes,
essas podem ser possivelmente combinadas de forma vantajosa, e a inclusão
em reivindicações diferentes não implica que uma combinação de características não seja viável ou vantajosa. Também, a inclusão de uma característica em uma categoria de reivindicações não implica uma limitação para esta categoria, mas em vez disso indica que a característica é igualmente aplicável a outras categorias de reivindicação como apropriado. Ainda mais, a ordem das características nas reivindicações não implica qualquer ordem específica na qual as características precisam ser trabalhadas e em particular a ordem de passos individuais em uma reivindicação de método não implica que os passos precisem ser efetuados nesta ordem. Em vez disso, os passo pode ser efetuados em quadro ordem adequada. Em adição, referências singulares não excluem a grande quantidade. Assim sendo, referências à "um", "uma", "primeiro", "segundo", etc não se opõem a uma grande quantidade. Sinais de referência nas reivindicações são fornecidos meramente com um exemplo esclarecedor, não devem ser interpretados como limitantes de qualquer forma do escopo das reivindicações.

Claims (36)

1. Aparelho para gerar um número de canais de áudio de saída, caracterizado pelo fato de compreender: - meios para receber um fluxo de dados (401) compreendendo um número de canais de áudio de entrada e dados de áudio paramétricos; o fluxo de dados ainda compreendendo dados de estrutura de árvore de decodificador para uma estrutura hierárquica de decodificador, os dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de características de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador; - meios para gerar (405) a estrutura hierárquica de decodificador em resposta aos dados de estrutura de árvore de decodificador; e - meios para gerar (403) o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
2. Aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que os dados de estrutura de árvore de decodificador compreendem uma grande quantidade de valores de dados, cada valor de dados indicativo de uma característica de divisão de canal para um canal em uma camada hierárquica da estrutura hierárquica de decodificador.
3. Aparelho de acordo com a reivindicação 2, caracterizado pelo fato de que um valor de dados predeterminado é indicativo de nenhuma divisão de canal par o canal na camada hierárquica.
4. Aparelho de acordo com a reivindicação 2, caracterizado pelo fato de que um valor de dados predeterminado é indicativo de uma divisão de canal de um para dois para o canal na camada hierárquica.
5. Aparelho de acordo com a reivindicação 2, caracterizado pelo fato de que a grande quantidade de valores de dados são valores de dados binários.
6. Aparelho de acordo com a reivindicação 5, caracterizado pelo fato de que um valor de dados binários predeterminado é indicativo de uma divisão de canal de um para dois, e um outro valor de dados binários predeterminado é indicativo de nenhuma divisão de canal.
7. Aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que o fluxo de dados ainda compreende uma indicação do número de canais de entrada.
8. Aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que o fluxo de dados ainda compreende uma indicação do número de canais de saída.
9. Aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que o fluxo de dados ainda compreende uma indicação do número de funções de divisão de canal de um para dois na estrutura hierárquica de decodificador.
10. Aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que o fluxo de dados ainda compreende uma indicação do número de funções de divisão de canal de dois para três na estrutura hierárquica de decodificador.
11. Aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que aos dados de estrutura de árvore de decodificador compreendem dados para uma grande quantidade de estruturas de árvore de decodificador ordenadas em resposta à presença de uma funcionalidade de divisão de canal de dois para três.
12. Aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que aos dados de estrutura de árvore de decodificador para, pelo menos, um canal de entrada compreende uma indicação de uma função de divisão de dois para três estando presente na camada de raiz seguido por dados binários onde cada valor de dados binários é indicativo de ou, nenhuma funcionalidade de divisão ou uma funcionalidade de divisão de canal de um para dois para camadas dependentes da funcionalidade de divisão de canal de dois para três.
13. Aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que o fluxo de dados ainda compreende uma indicação de uma posição de alto-falante para, pelo menos, um dos canais de saída.
14. Aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que os meios para gerar (405) a estrutura hierárquica de decodificador são arrumados para determinar parâmetros de multiplicação para funções de divisão de canal das camadas hierárquicas em resposta aos dados de estrutura de árvore de decodificador.
15. Aparelho de acordo com a reivindicação 1, onde a estrutura de árvore de decodificador compreende, pelo menos, uma funcionalidade de divisão de canal em, pelo menos, uma camada hierárquica, a, pelo menos, uma funcionalidade de divisão de canal, caracterizado pelo fato de compreender: - meios de desfazer correlação para gerar um sinal desprovido de correlação diretamente a partir de um canal de áudio de entrada do fluxo de dados; - pelo menos, uma unidade de divisão de canal para gerar uma grande quantidade de canais de saída de um canal de áudio de camada hierárquica a partir de uma camada hierárquica mais alta e do sinal desprovido de correlação; e - meios para determinar, pelo menos, uma característica do filtro de desfazer correlação ou da unidade de divisão de canal em resposta aos dados de estrutura de árvore de decodificador.
16. Aparelho de acordo com a reivindicação 15, caracterizado pelo fato de que os meios de desfazer correlação compreendem uns meios de compensação de nível para efetuar uma compensação de nível de áudio no canal de entrada de áudio, para gerar um sinal da áudio compensado em nível; e um filtro de desfazer correlação para filtrar o sinal de áudio compensado em nível para gerar sinal desprovido de correlação.
17. Aparelho de acordo com a reivindicação 16, caracterizado pelo fato de que os meios de compensação de nível compreendem uma multiplicação de matriz por uma pré-matriz.
18. Aparelho de acordo com a reivindicação 17, caracterizado pelo fato de que os coeficientes da pré-matriz têm, pelo menos, um valor de unidade para uma estrutura hierárquica de decodificador compreendendo somente funcionalidade de divisão de canal de um para dois.
19. Aparelho de acordo com a reivindicação 17, caracterizado pelo fato de compreender meios para determinar a pré-matriz para a, pelo menos, uma funcionalidade de divisão de canal na, pelo menos, uma camada hierárquica em resposta aos parâmetros de uma funcionalidade de divisão de canal em um camada hierárquica mais alta.
20. Aparelho de acordo com a reivindicação 17, caracterizado pelo fato de que o aparelho compreende meios para determinar uma matriz de divisão de canal para a, pelo menos, uma funcionalidade de divisão de canal, em resposta aos parâmetros da, pelo menos, uma funcionalidade de divisão de canal na, pelo menos, uma camada hierárquica.
21. Aparelho de acordo com a reivindicação 17, caracterizado pelo fato de compreender meios para determinar a pré-matriz para a, pelo menos, uma funcionalidade de divisão de canal na, pelo menos, uma camada hierárquica em resposta aos parâmetros de uma funcionalidade de divisão de canal de dois para três de uma camada hierárquica mais alta.
22. Aparelho de acordo com a reivindicação 21, caracterizado pelo fato de que os meios para determinar a pré-matriz são arrumados para determinar a pré-matriz para a, pelo menos, uma funcionalidade de divisão de canal, em resposta para determinar uma primeira sub pré-matriz correspondendo a um primeira entrada do elevador por mixagem de dois para três e uma segunda sub pré-matriz correspondendo a uma segunda entrada do elevador por mixagem de dois para três.
23. Aparelho para gerar um fluxo de dados compreendendo um número de canais de áudio de saída, caracterizado pelo fato de compreender: - meios para receber (301) um número de canais de entrada; - meios de codificação hierárquica (303) para, de forma paramétrica, codificar o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; - meios para determinar (305) uma estrutura hierárquica de decodificador correspondendo aos meios de codificação hierárquica; e - meios para incluir (307) dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados.
24. Fluxo de dados, caracterizada pelo fato de compreender: - um número de canais de áudio codificados; - dados de áudio paramétricos; e - dados de estrutura de árvore de decodificador para uma estrutura hierárquica de decodificador, os dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de características de divisão de canal para canais de áudio em camadas hierárquicas da estrutura hierárquica de decodificador.
25. Meio de armazenamento, caracterizado pelo fato de ter armazenado nele um sinal como definido na reivindicação 24.
26. Método para gerar um número de canais de áudio de saída, caracterizado pelo fato de compreender: - receber um fluxo de dados (1511) compreendendo um número de canais de áudio de entrada e dados de áudio paramétricos; o fluxo de dados ainda compreendendo dados de estrutura de árvore de decodifxcador para uma estrutura hierárquica de decodificador, os dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de características de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador; - gerar a estrutura hierárquica de decodificador (1513) em resposta aos dados de estrutura de árvore de decodificador; e - gerar o número de canais de áudio de saída (1515) a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
27. Método para gerar um fluxo de dados compreendendo um número de canais de áudio de saída, caracterizado pelo fato de compreender: - receber (1501) um número de canais de áudio de entrada; - codificar (1503), de forma paramétrica, o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; - determinar uma estrutura hierárquica de decodificador (1505) correspondendo aos meios de codificação hierárquica; e - incluir dados de estrutura de árvore de decodificador (1507) compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados.
28. Receptor (103) para gerar um número de canais de áudio de saída, caracterizado pelo fato de compreender: - meios para receber (401) um fluxo de dados compreendendo um número de canais de áudio de entrada e dados de áudio paramétricos; o fluxo de dados ainda compreendendo dados de estrutura de árvore de decodificador para uma estrutura hierárquica de decodificador, os dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador; - meios para gerar (403) a estrutura hierárquica de decodificador em resposta as dados de estrutura de árvore de decodificador; e - meios para gerar (405) o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
29. Transmissor (101) para gerar um fluxo de dados compreendendo um número de canais de áudio de saída, caracterizado pelo fato de compreender: - meios para receber (301) um número de canais de áudio de entrada; - meios de codificação hierárquica (303) para, de forma paramétrica, codificar o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; - meios para determinar (305) uma estrutura hierárquica de decodificador correspondendo aos meios de codificação hierárquica; e - meios para incluir (307) dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados.
30. Sistema de transmissão compreendendo um transmissor (101) para gerar um fluxo de dados e um receptor (103) para gerar um número de canais de áudio de saída, caracterizado pelo fato de o transmissor compreender: - meios para receber (301) um número de canais de áudio de entrada, - meios de codificação hierárquica (303) para, de forma paramétrica, codificar o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; - meios para determinar (305) uma estrutura hierárquica de decodificador correspondendo aos meios de codificação hierárquica, - meios para incluir (307) dados de estrutura de árvore de decodificador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados, e meios para transmitir (111) o fluxo de dados para o receptor (103), e o receptor, compreendendo: - meios para receber (401) o fluxo de dados, _ meios para gerar (403) a estrutura hierárquica de decodificador em resposta aos dados de estrutura de árvore de decodiflcador, e - meios para gerar (405) o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodiflcador.
31. Método de recepção de um fluxo de dados, caracterizado pelo fato de compreender: - receber (1511) um fluxo de dados compreendendo um número de canais de áudio de entrada e dados de áudio paramétricos; o fluxo de dados ainda compreendendo uma estrutura de árvore de decodiflcador para uma estrutura hierárquica de decodiflcador, os dados de estrutura de árvore de decodiflcador compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodiflcador; - gerar (1513) a estrutura de árvore de decodiflcador em resposta aos dados de estrutura de árvore de decodiflcador; e - gerar (1515) o número de canais de áudio de saída a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
32. Método de transmissão de um fluxo de dados compreendendo um número de canais de áudio de saída, caracterizado pelo fato de compreender: - receber (1501) um número de canais de áudio de entrada; - codificar (1503), de forma paramétrica, o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio de saída e dados de áudio paramétricos; - determinar uma estrutura hierárquica de decodificador (1505) correspondendo aos meios de codificação hierárquica; - incluir dados de estrutura de árvore de decodificador (1507) compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados; e - transmitir (1509) o fluxo de dados.
33. Método de transmissão e de recepção de um fluxo de dados compreendendo um número de canais de áudio de saída, caracterizado pelo fato de em um transmissor (101) compreender: - receber (1501) um número de canais de áudio de entrada; - codificar (1503) de forma paramétrica, o número de canais de áudio de entrada para gerar o fluxo de dados compreendendo o número de canais de áudio e dados de áudio paramétricos; - determinar uma estrutura hierárquica de decodificador (1505) correspondendo aos meios de codificação hierárquica, - incluir dados de estrutura de árvore de decodificador (1507) compreendendo, pelo menos, um valor de dados indicativo de uma característica de divisão de canal para um canal de áudio em uma camada hierárquica da estrutura hierárquica de decodificador no fluxo de dados; e - transmitir (1509) o fluxo de dados para o receptor; e em um receptor (103): - receber (1511) o fluxo de dados, - gerar a estrutura hierárquica de decodificador (1513) em resposta aos dados de estrutura de árvore de decodificador, e - gerar o número de canais de áudio de saída (1515) a partir do fluxo de dados usando a estrutura hierárquica de decodificador.
34. Produto de programa de computador, caracterizado pelo fato de executar qualquer das reivindicações 26, 27, 31, 32 e 33.
35. Dispositivo de reprodução de áudio, caracterizado pelo fato de compreender um aparelho como definido na reivindicação 1.
36. Dispositivo de gravação de áudio, caracterizado pelo fato de compreender um aparelho como definido na reivindicação 23.
BRPI0613469-6A 2005-07-14 2006-07-07 aparelhos e métodos para gerar um número de canais de áudio de saìda e um fluxo de dados, fluxo de dados, meio de armazenamento, receptor para gerar um número de canais de áudio de saìda, transmissor para gerar um fluxo de dados, sistema de transmissão, métodos de recepção e de transmissão de um fluxo de dados, produto de programa de computador, e, dispositivos de reprodução de áudio e de gravação de áudio BRPI0613469A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP05106466 2005-07-14
EP05106466.5 2005-07-14
PCT/IB2006/052309 WO2007007263A2 (en) 2005-07-14 2006-07-07 Audio encoding and decoding

Publications (1)

Publication Number Publication Date
BRPI0613469A2 true BRPI0613469A2 (pt) 2012-11-06

Family

ID=37467582

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0613469-6A BRPI0613469A2 (pt) 2005-07-14 2006-07-07 aparelhos e métodos para gerar um número de canais de áudio de saìda e um fluxo de dados, fluxo de dados, meio de armazenamento, receptor para gerar um número de canais de áudio de saìda, transmissor para gerar um fluxo de dados, sistema de transmissão, métodos de recepção e de transmissão de um fluxo de dados, produto de programa de computador, e, dispositivos de reprodução de áudio e de gravação de áudio

Country Status (13)

Country Link
US (1) US7966191B2 (pt)
EP (2) EP2088580B1 (pt)
JP (2) JP5097702B2 (pt)
KR (2) KR101496193B1 (pt)
CN (2) CN102013256B (pt)
AT (2) ATE523877T1 (pt)
BR (1) BRPI0613469A2 (pt)
DE (1) DE602006007139D1 (pt)
ES (2) ES2327158T3 (pt)
MX (1) MX2008000504A (pt)
PL (2) PL1902443T3 (pt)
RU (2) RU2418385C2 (pt)
WO (1) WO2007007263A2 (pt)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7966191B2 (en) * 2005-07-14 2011-06-21 Koninklijke Philips Electronics N.V. Method and apparatus for generating a number of output audio channels
JP5113050B2 (ja) * 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド 符号化されたオーディオ信号の生成方法及びオーディオ信号の処理方法
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR20070099456A (ko) 2006-04-03 2007-10-09 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
MX2009007412A (es) * 2007-01-10 2009-07-17 Koninkl Philips Electronics Nv Decodificador de audio.
EP2093757A4 (en) * 2007-02-20 2012-02-22 Panasonic Corp MULTI-CHANNEL DECODING DEVICE, MULTI-CHANNEL DECODING METHOD, PROGRAM AND INTEGRATED SEMICONDUCTOR SWITCHING
KR20080084757A (ko) * 2007-03-16 2008-09-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
CN101911180A (zh) * 2007-10-22 2010-12-08 韩国电子通信研究院 多对象音频编码和解码方法以及其设备
JP5603339B2 (ja) * 2008-10-29 2014-10-08 ドルビー インターナショナル アーベー 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護
KR20110022251A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
BR122022013454B1 (pt) 2009-10-20 2023-05-16 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método para codificar uma informação de áudio, método para decodificar uma informação de áudio que utiliza uma detecção de um grupo de valores espectrais previamente decodificados
JP5298245B2 (ja) * 2009-12-16 2013-09-25 ドルビー インターナショナル アーベー Sbrビットストリームパラメータダウンミックス
CN102142924B (zh) * 2010-02-03 2014-04-09 中兴通讯股份有限公司 一种多用途语音频编码传输方法和装置
CN103415883B (zh) 2011-03-28 2015-11-25 杜比实验室特许公司 用于低频效果声道的减少复杂性变换
EP2956935B1 (en) * 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
CN110223702B (zh) 2013-05-24 2023-04-11 杜比国际公司 音频解码系统和重构方法
TWI671734B (zh) * 2013-09-12 2019-09-11 瑞典商杜比國際公司 在包含三個音訊聲道的多聲道音訊系統中之解碼方法、編碼方法、解碼裝置及編碼裝置、包含用於執行解碼方法及編碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置及編碼裝置的音訊系統
CA2926243C (en) 2013-10-21 2018-01-23 Lars Villemoes Decorrelator structure for parametric reconstruction of audio signals
JP6479786B2 (ja) 2013-10-21 2019-03-06 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成
EP2866475A1 (en) * 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
BR112017008015B1 (pt) * 2014-10-31 2023-11-14 Dolby International Ab Métodos e sistemas de decodificação e codificação de áudio
CN107710790B (zh) * 2015-06-24 2021-06-22 索尼公司 用于处理声音的装置、方法及程序
US10416954B2 (en) 2017-04-28 2019-09-17 Microsoft Technology Licensing, Llc Streaming of augmented/virtual reality spatial audio/video
EP3719799A1 (en) 2019-04-04 2020-10-07 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3943879B4 (de) * 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
JP3298478B2 (ja) * 1997-11-10 2002-07-02 日本電気株式会社 Mpeg復号装置
JPH11330980A (ja) * 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP2001268697A (ja) * 2000-03-22 2001-09-28 Sony Corp データ伝送システム、データ伝送装置、データ伝送方法
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US6996523B1 (en) * 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2300567T3 (es) * 2002-04-22 2008-06-16 Koninklijke Philips Electronics N.V. Representacion parametrica de audio espacial.
CN100539742C (zh) 2002-07-12 2009-09-09 皇家飞利浦电子股份有限公司 多声道音频信号编解码方法和装置
WO2004008806A1 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
WO2005081229A1 (ja) * 2004-02-25 2005-09-01 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ及びオーディオデコーダ
PL1735779T3 (pl) * 2004-04-05 2014-01-31 Koninklijke Philips Nv Urządzenie kodujące, dekodujące, sposoby z nimi powiązane oraz powiązany system audio
WO2005106850A1 (ja) * 2004-04-28 2005-11-10 Matsushita Electric Industrial Co., Ltd. 階層符号化装置および階層符号化方法
US7966191B2 (en) * 2005-07-14 2011-06-21 Koninklijke Philips Electronics N.V. Method and apparatus for generating a number of output audio channels
JP5321820B2 (ja) * 2009-04-23 2013-10-23 セイコーエプソン株式会社 用紙搬送装置

Also Published As

Publication number Publication date
RU2418385C2 (ru) 2011-05-10
EP2088580B1 (en) 2011-09-07
EP1902443B1 (en) 2009-06-03
EP2088580A2 (en) 2009-08-12
JP5269039B2 (ja) 2013-08-21
JP5097702B2 (ja) 2012-12-12
MX2008000504A (es) 2008-03-07
KR20100134084A (ko) 2010-12-22
WO2007007263A2 (en) 2007-01-18
ATE433182T1 (de) 2009-06-15
US7966191B2 (en) 2011-06-21
PL2088580T3 (pl) 2012-07-31
RU2461078C2 (ru) 2012-09-10
ES2374309T3 (es) 2012-02-15
EP1902443A2 (en) 2008-03-26
DE602006007139D1 (de) 2009-07-16
WO2007007263A3 (en) 2007-03-29
RU2010137467A (ru) 2012-03-20
ES2327158T3 (es) 2009-10-26
EP2088580A3 (en) 2009-08-19
CN102013256B (zh) 2013-12-18
JP2011059711A (ja) 2011-03-24
KR101492826B1 (ko) 2015-02-13
HK1154984A1 (en) 2012-05-04
CN102013256A (zh) 2011-04-13
KR20080037672A (ko) 2008-04-30
CN101223575B (zh) 2011-09-21
ATE523877T1 (de) 2011-09-15
PL1902443T3 (pl) 2009-12-31
KR101496193B1 (ko) 2015-02-26
US20080255856A1 (en) 2008-10-16
RU2008105556A (ru) 2009-08-20
CN101223575A (zh) 2008-07-16
JP2009501354A (ja) 2009-01-15

Similar Documents

Publication Publication Date Title
BRPI0613469A2 (pt) aparelhos e métodos para gerar um número de canais de áudio de saìda e um fluxo de dados, fluxo de dados, meio de armazenamento, receptor para gerar um número de canais de áudio de saìda, transmissor para gerar um fluxo de dados, sistema de transmissão, métodos de recepção e de transmissão de um fluxo de dados, produto de programa de computador, e, dispositivos de reprodução de áudio e de gravação de áudio
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
ES2959236T3 (es) Aparato y método para codificación mejorada de objetos de audio espacial
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
BR112016001137B1 (pt) Decodificador de áudio, codificador de áudio, método para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada, e método para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio que usa uma extensão de largura de banda
US11056122B2 (en) Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
BR112020015570A2 (pt) codificador de cena de áudio, decodificador de cena de áudio e métodos relacionados com uso de análise espacial de codificador/decodificador híbrido
BRPI0509113B1 (pt) Codificador de multicanal, método para codificar sinais de entrada, conteúdo de dados codificados, portador de dados, e, decodificador operável para decodificar dados de saída codificados
BRPI0616019A2 (pt) conceito para a conexão em ponte da lacuna entre a conexão paramétrica de áudio multicanais e a conexão surround matrizada multicanais
BR112016001143B1 (pt) Codificador de áudio para codificar dados de entrada de áudio para obter dados de saída de áudio, decodificador de áudio para decodificar dados de áudio codificados e método de codificação de dados de entrada de áudio para obter dados de saída de áudio
BRPI0612218A2 (pt) codificação de áudio residual adaptativa
BRPI0709235B1 (pt) Decodificador de áudio, método de decodificação de áudio, receptor para receber um sinal de n canais, sistema de transmissão para transmitir um sinal de áudio, método para receber um sinal de áudio, método para transmitir e receber um sinal de áudio, mídia de armazenamento legível por computador, e, dispositivo de reprodução de áudio
BRPI0713236B1 (pt) Conceito para combinação de múltiplas fontes de áudio parametricamente codificadas
BR112016001140B1 (pt) Aparelho e método para codificação eficiente de informações adicionais de áudio
BR112015000247B1 (pt) Decodificador, método de decodificação, codificador, método de codificação, e sistema de codificação e decodificação.
BRPI0606387B1 (pt) Decodificador, dispositivo de reprodução de áudio, codificador, dispositivo de gravação, método para gerar um sinal de áudio multicanal, meio de armazenamento, método paracodificar um sinal de áudio multicanal, receptor, transmissor, sistema de transmissão, método de receber um sinal de áudio multicanal, e método de transmitir um sinal deáudio multicanal
US8626503B2 (en) Audio encoding and decoding
HK1154984B (en) Method and apparatus for generating a number of output audio channels
BRPI0816556B1 (pt) Codificação de áudio usando downmix

Legal Events

Date Code Title Description
B06G Technical and formal requirements: other requirements [chapter 6.7 patent gazette]

Free format text: SOLICITA-SE A REGULARIZACAO DA PROCURACAO, UMA VEZ QUE BASEADO NO ARTIGO 216 1O DA LPI, O DOCUMENTO DE PROCURACAO DEVE SER APRESENTADO NO ORIGINAL, TRASLADO OU FOTOCOPIA AUTENTICADA.

B25G Requested change of headquarter approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V. (NL) , CODI

B25D Requested change of name of applicant approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V. (NL) , DOLB

B25D Requested change of name of applicant approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V. (NL) , DOLB

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/00 , H04S 3/00

Ipc: G10L 19/008 (2013.01), H04S 3/00 (1980.01)

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]

Free format text: MANTIDO O INDEFERIMENTO UMA VEZ QUE NAO FOI APRESENTADO RECURSO DENTRO DO PRAZO LEGAL