BRPI0709310A2 - equipamento e método para a geração de valores de sub-banda de àudio e equipamento e método para a geração de amostras de áudio no domìnio do tempo - Google Patents
equipamento e método para a geração de valores de sub-banda de àudio e equipamento e método para a geração de amostras de áudio no domìnio do tempo Download PDFInfo
- Publication number
- BRPI0709310A2 BRPI0709310A2 BRPI0709310-1A BRPI0709310A BRPI0709310A2 BR PI0709310 A2 BRPI0709310 A2 BR PI0709310A2 BR PI0709310 A BRPI0709310 A BR PI0709310A BR PI0709310 A2 BRPI0709310 A2 BR PI0709310A2
- Authority
- BR
- Brazil
- Prior art keywords
- window
- coefficients
- samples
- time domain
- original document
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000004458 analytical method Methods 0.000 claims abstract description 181
- 230000002123 temporal effect Effects 0.000 claims abstract description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 185
- 238000003786 synthesis reaction Methods 0.000 claims description 185
- 238000005070 sampling Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 24
- 230000002441 reversible effect Effects 0.000 claims description 19
- 238000001308 synthesis method Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 352
- 239000000523 sample Substances 0.000 description 110
- 239000013598 vector Substances 0.000 description 84
- 230000004044 response Effects 0.000 description 28
- 239000011159 matrix material Substances 0.000 description 24
- 230000015654 memory Effects 0.000 description 23
- 230000003595 spectral effect Effects 0.000 description 21
- 230000010355 oscillation Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 230000009467 reduction Effects 0.000 description 15
- 239000000872 buffer Substances 0.000 description 13
- 230000002829 reductive effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000006872 improvement Effects 0.000 description 12
- 230000006399 behavior Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 230000009977 dual effect Effects 0.000 description 10
- 230000000873 masking effect Effects 0.000 description 10
- 230000008901 benefit Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 9
- 230000000052 comparative effect Effects 0.000 description 9
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 238000009432 framing Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 230000001934 delay Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000012074 hearing test Methods 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000009365 direct transmission Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000007040 multi-step synthesis reaction Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003534 oscillatory effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0266—Filter banks
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Liquid Crystal Substances (AREA)
- Tires In General (AREA)
- External Artificial Organs (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Developing Agents For Electrophotography (AREA)
- Materials For Photolithography (AREA)
- Peptides Or Proteins (AREA)
Abstract
EQUIPAMENTO E MéTODO PARA A GERAçAO DE VALORES DE SUB-BANDA DE áUDIO E EQUIPAMENTO E MéTODO PARA A GERAçãO DE AMOSTRAS DE áUDIO NO DOMìNIO DO TEMPO. Uma configuração de um equipamento (100) para a geração de valores de sub-banda de áudio em canais de sub-banda de áudio compreende um janelador de análise (110) para o janelamento de um iframe (120) de amostras de entrada de áudio no domínio do tempo, estando em uma seqúência temporal que se estende de uma amostra prévia até uma amostra posterior usando uma função janela de análise (190), compreendendo uma seqüência de coeficientes de janela para obter amostras janeladas. A função janela de análise compreende um primeiro número de coeficientes de janela obtidos a partir da maior função janela compreendendo uma seqüência de um maior segundo número de coeficientes de janela, onde os coeficientes de janela da função janela são obtidos por uma interpolação de coeficientes de janela da maior função janela. O equipamento (100) ainda compreende um calculador (170) para o cálculo dos valores de sub-banda de áudio usando as amostras janeladas.
Description
"EQUIPAMENTO E MÉTODO PARA A GERAÇÃO DE VALORESDE SUB-BANDA DE ÁUDIO E EQUIPAMENTO E MÉTODO PARA A GERAÇÃO DEAMOSTRAS DE ÁUDIO NO DOMÍNIO DO TEMPO"
Descrição
Campo Técnico
As configurações da presente invenção se referema um equipamento e método para a geração de valores de sub-bandade áudio, um equipamento e um método para a geração de amostras deáudio no domínio do tempo e sistemas compreendendo quaisquer dosequipamentos supramencionados, que podem, por exemplo, serimplementados no campo da moderna codificação de áudio,decodificação de áudio ou de outras aplicações relacionadas com atransmissão de áudio.
0 moderno processamento de áudio digital sebaseia tipicamente em esquemas de codificação que permitem umasignificativa redução em termos de taxas de bits, larguras debandas de transmissão e armazenagem de espaço quando comparada auma transmissão direta ou armazenagem dos respectivos dados deáudio. Isto é obtido pela codificação dos dados de áudio no ladodo remetente e a decodif icação dos dados codificados no lado dorecipiente antes, por exemplo, fornecendo os dados de áudiodecodificado ao ouvinte ou a outro processamento de sinal.
Esses sistemas de processamento de áudio digitalpodem ser implementados com referência a uma grande faixa deparâmetros, que influenciam tipicamente a qualidade dos dados deáudio transmitidos ou de outra forma processados, por um lado, e aeficiência computacional, as larguras de bandas e outrosparâmetros relativos ao desempenho, por outro lado. Muitogeralmente, maiores qualidades exigem maiores taxas de bits, umamaior complexidade computacional e um maior requisito dearmazenagem para os correspondentes dados de áudio codificado.Assim, dependendo da aplicação desejada, os fatores como taxasadmissíveis de bits, uma aceitável complexidade computacional equantidades aceitáveis de dados devem ser balanceados com umaqualidade desejável e obtenível.
Outro parâmetro especialmente importante nasaplicações de tempo real como na comunicação bidirecional oumonodirecional, o retardo imposto pelos diferentes esquemas decodificação também pode desempenhar um papel importante. Comoconseqüência, o retardo imposto pela codificação e decodificaçãode áudio coloca outra restrição em termos dos parâmetrosanteriormente mencionados ao serem balanceadas as necessidades eos custos de diferentes esquemas de codificação tendo um campoespecífico de aplicação desejado. Assim, os sistemas de áudiodigital podem ser aplicados em muitos campos diferentes de uso,variando da transmissão de qualidade ultra-baixa até umatransmissão de alta finalização, sendo que os diferentesparâmetros e diferentes restrições são muito geralmente impostosnos respectivos sistemas de áudio. Em algumas aplicações, um menorretardo pode, por exemplo, exigir uma maior taxa de bits e, assim,uma maior largura de banda de transmissão quando comparado a umsistema de áudio com maior retardo, como de nível comparável dequalidade.
Entretanto, em muitos casos, devem ser feitoscompromissos em termos de diferentes parâmetros como de taxa debits, complexidade computacional, requisitos de memória, qualidadee retardo.
Sumário
De acordo com uma configuração da presenteinvenção, um equipamento para a geração de valores de sub-banda deáudio em canais de sub-banda de áudio compreende um janelador deanálise para o janelamento de um frame de amostras de entrada deáudio no domínio do tempo estando em uma seqüência de tempo que seprolonga a partir de uma amostra prévia até uma amostra posteriorusando uma função de janela de análise que compreende umaseqüência de coeficientes de janela para obter amostras janeladas,a função de janela de análise compreendendo um primeiro número decoeficientes de janela obtidos a partir de uma maior função dejanela compreendendo uma seqüência de um maior segundo número decoeficientes de janela, em que os coeficientes de janela da funçãode janela são obtidos por meio de uma interpolação de coeficientesde janela da maior função de janela, em que o segundo número é umnúmero par e um calculador para o cálculo dos valores de sub-bandade áudio usando amostras janeladas. De acordo com uma configuraçãoda presente invenção, um equipamento para a geração de amostras deáudio no domínio do tempo compreende um calculador para o cálculode uma seqüência de amostras intermediárias no domínio do tempodos valores de sub-banda de áudio em canais de sub-banda de áudio,a seqüência compreendendo amostras prévias intermediárias nodomínio do tempo e amostras posteriores no domínio do tempo, umjanelador de síntese para o janelamento da seqüência de amostrasintermediárias no domínio do tempo usando uma função de janela desíntese compreendendo uma seqüência de coeficientes de janela paraobter amostras janeladas intermediárias no domínio do tempo, afunção de janela de síntese compreendendo um primeiro número decoeficientes de janela obtidos a partir de uma maior função dejanela, compreendendo uma seqüência de um maior segundo númerocoeficientes de janela, em que os coeficientes de janela da funçãojanela são obtidos por uma interpolação de coeficientes de janelada maior função janela, e em que o segundo número é par e umestágio de saída de adição de sobrepasso para o processamento dasamostras janelada s intermediárias no domínio do tempo para aobtenção das amostras no domínio do tempo.
Breve Descrição dos Desenhos
As configurações da presente invenção serãodoravante descritas, com referência aos desenhos anexos.
A Fig. 1 mostra um diagrama de bloco de umaconfiguração de um equipamento para a geração de valores de sub-banda de áudio;
A Fig. 2a mostra um diagrama de bloco de umaconfiguração de um equipamento para a geração de amostras de áudiono domínio do tempo;
A Fig. 2b ilustra um princípio funcional deacordo com uma configuração da presente invenção sob a forma de umequipamento para a geração de amostras no domínio do tempo;
A Fig. 3 ilustra o conceito de coeficientes dejanela de interpolação de acordo com uma configuração da presenteinvenção;
A Fig. 4 ilustra o conceito de coeficientes dejanela de interpolação no caso da função de janela seno;
A Fig. 5 mostra um diagrama de bloco de umaconfiguração da presente invenção compreendendo um decodificadorSBR e um codificador SBR;
A Fig. 6 ilustra as fontes de retardo de umsistema SBR;
A Fig. 7a mostra um fluxograma de umaconfiguração de um método para a geração de valores de sub-bandade áudio;
A Fig. 7b ilustra uma etapa da configuração dométodo mostrado na Fig. 7a;
A Fig. 7c mostra um fluxograma de umaconfiguração de um método para a geração de valores de sub-bandade áudio;
A Fig. 8a mostra um fluxograma de um exemplocomparativo de um método para a geração de amostras no domínio dotempo;
A Fig. 8b mostra um fluxograma de um exemplocomparativo de um método para a geração de amostras no domínio dotempo;
A Fig. 8c mostra um fluxograma de umaconfiguração de um método para a geração de amostras no domínio dotempo;
A Fig. 8d mostra um fluxograma de uma outraconfiguração de um método para a geração de amostras no domínio dotempo;
A Fig. 9a mostra uma possível implementação de umexemplo comparativo de um método para a geração de valores de sub-banda de áudio;
A Fig. 9b mostra uma possível implementação deuma configuração de um método para a geração de valores de sub-banda de áudio;
A Fig. IOa mostra uma possível implementação deum exemplo comparativo de um método para a geração de amostras nodomínio do tempo;
A Fig. IOb mostra uma outra possívelimplementação de uma configuração de um método para a geração deamostras no domínio do tempo;
A Fig. 11 mostra uma comparação de uma função dejanela de síntese de acordo com uma configuração da presenteinvenção e uma função de janela seno;
A Fig. 12 mostra uma comparação de uma função dejanela de síntese de acordo com uma configuração da presenteinvenção e uma função de filtro protótipo SBR QMF;
A Fig. 13 ilustra os diferentes retardos causadospela função janela e a função de filtro protótipo mostrada na Fig.12;
A Fig. 14a mostra uma tabela ilustrando asdiferentes contribuições para o retardo de um codec AAC-LD+SBRconvencional e um codec AAC-ELD compreendendo uma configuração dapresente invenção;
A Fig. 14b mostra uma outra tabela compreendendodetalhes referentes ao retardo de diferentes componentes dediferentes codecs;
A Fig. 15a mostra uma comparação de uma respostade freqüência de equipamentos baseados em uma função janela deacordo com uma configuração da presente invenção e um equipamentobaseado na função de janela seno;
A Fig. 15b mostra uma vista de perto da respostade freqüência mostrada na Fig. 15a;
A Fig. 16a mostra uma comparação da resposta defreqüência de 4 diferentes funções janela;
A Fig. 16b mostra uma vista de perto da respostade freqüências mostrada na Fig. 16a;
A Fig. 17 mostra uma comparação de uma respostade freqüência de duas diferentes funções janela, uma função janelade acordo com a presente invenção e uma função janela sendo umafunção janela simétrica;
A Fig. 18 mostra esquematicamente a propriedadegeral de mascaramento temporal do ouvido humano; e
A Fig. 19 ilustra uma comparação de um sinaloriginal de tempo de áudio, um sinal de tempo gerado com base emum codec HEAAC e um sinal de tempo baseado em codec compreendendouma configuração da presente invenção.
Descrição Detalhada das Configurações
As Figs. 1 a 19 mostram diagramas de bloco eoutros diagramas descrevendo as propriedades funcionais e ascaracterísticas das diferentes configurações de equipamentos emétodos para a geração de valores de sub-banda de áudio, deequipamentos e métodos para a geração de amostras no domínio dotempo e sistemas compreendendo pelo menos um dos equipamentos oumétodos supramencionados. Entretanto, antes de descrever umaprimeira configuração da presente invenção em maiores detalhes,deve ser notado que as configurações da presente invenção podemser implementadas em hardware e software. Assim, as implementaçõesdescritas em termos de diagramas de bloco de implementações dehardware das respectivas configurações também podem serconsideradas como fluxogramas de uma configuração adequada de ummétodo correspondente. Também, um fluxograma descrevendo umaconfiguração da presente invenção pode ser considerado como sendoum diagrama de blocos de uma correspondente implementação dehardware.
Serão descritos a seguir implementações de bancosde filt ros, que podem ser implementadas como um banco de filtrosde análise ou um banco de filtros de síntese. Um banco de filtrosde análise é um equipamento para a geração de valores de sub-bandade áudio em canais de sub-banda de áudio baseados em amostras (deentrada) de áudio no domínio do tempo estando em uma seqüênciatemporal que se estende a partir de uma amostra prévia até umaamostra posterior. Em outras palavras, o termo banco de filtros deanálise pode também ser usado como sinônimo para uma configuraçãoda presente invenção sob a forma de um equipamento para a geraçãode valores de sub-banda de áudio. Da mesma forma, um banco defiltros de síntese é um banco de filtros para a geração deamostras de áudio no domínio do tempo de valores de sub-banda deáudio em canais de sub-banda de áudio. Em outras palavras, o termobanco de filtros de síntese pode ser usado como sinônimo de umaconfiguração de acordo com a presente invenção sob a forma de umequipamento para a geração de amostras de áudio no domínio do tempo.
Ambos, o banco de filtros de análise e o banco defiltros de síntese, que também são denominados para sumarizar comobancos de filtros podem, por exemplo, serem implantados comobancos de filtros modulados. Bancos de filtros modulados, exemplose configurações dos quais serão ressaltados abaixo em maioresdetalhes, se baseiam em oscilações com freqüências que se baseiamou que são obtidas a partir de freqüências centrais de sub-bandascorrespondentes no domínio da freqüência. O termo "modulado" serefere neste contexto ao fato de que as oscilaçõessupramencionadas sao usadas no contexto com uma função janela ouuma função de filtro protótipo, dependendo da implementaçãoconcreta desse banco de filtros modulado. Bancos de filtrosmodulados podem, em princípio, se basear em oscilações de valorreal como em uma oscilação harmônica (oscilação seno ou oscilaçãoco-seno) ou em correspondentes oscilações de valores complexos(oscilações exponenciais complexas) . Da mesma forma, os bancos defiltros modulados são denominados de bancos de filtros moduladosreais ou bancos de filtros modulados de filtros complexos,respectivamente.
15 Na descrição a seguir, as configurações da
presente invenção serão descritas em maiores detalhes sob a formade bancos de filtros de baixo retardo complexos modulados e bancosde filtros de baixo retardo reais modulados e métodoscorrespondentes e implementações de software. Uma das principais2 0 aplicações desses bancos de filtros modulados de baixo retardo éuma integração em um sistema de replicação de banda espectral debaixo retardo (SBR) , que atualmente se baseia no uso de um bancode filtros QMF complexo com um filtro protótipo simétrico (QMF =Filtro em Espelho de Quadratura).25 Como se tornará aparente na estrutura da presente
descrição, uma implementação de bancos de filtros de baixo retardode acordo com as configurações da presente invenção dará avantagem de uma melhor decisão entre a complexidade computacional,resposta de freqüência, disseminação do ruído temporal e daqualidade(reconstrução). Além disso, é obtenível uma melhordecisão entre o retardo e a qualidade de reconstrução com base emuma abordagem para usar as denominadas técnicas de espera zero demaneira a prolongar a resposta de impulso do filtro dosrespectivos bancos de filtros sem a introdução de retardosadicionais. Um menor retardo em um nível predefinido de qualidade,uma melhor qualidade no nível predefinido de retardo ou umamelhora simultânea tanto do retardo como da qualidade, podem serobtidos empregando um banco de filtros de análise ou um banco defiltros de síntese de acordo com uma configuração da presenteinvenção.
As configurações da presente invenção se baseiamno achado que esses aperfeiçoamentos podem ser obtidos empregandoum esquema de interpolação para obter uma função janela tendo umprimeiro número de coeficientes de janela baseados em uma funçãojanela tendo um segundo número maior de coeficientes de janela.Empregando um esquema de interpolação, pode ser obtida uma melhordistribuição de valores de energia dos coeficientes de janela dasfunções janela. Isto leva, em muitos casos, a um melhor nível dealiasing e uma melhora da qualidade de áudio. Por exemplo, quandoa maior função janela compreender um número par de coeficientes dejanela, pode ser útil um esquema de interpolação.
A complexidade computacional só aumenta um poucocom o emprego de um esquema de interpolação. Entretanto, estepequeno aumento não é somente descartado pelo aperfeiçoamentoreferente à qualidade, mas também pelas economias resultantesreferentes ao uso reduzido de memória ao comparar a situação comduas funções janela separadas sendo armazenadas independentemente.
Enquanto a interpolação pode ser feita em um ou poucos ciclos dosinal do clock de um processador em uma implementação, em muitoscasos levando a um retardo insignificante e uma maior complexidadecomputacional, a exigência de memória adicional pode serextremamente importante em muitas aplicações. Por exemplo, no casode aplicações móveis, a memória pode ser limitada, especialmentequando forem empregadas longas funções janela com um significativonúmero de coeficientes de janela.
Mais ainda, as configurações de acordo com apresente invenção podem ser usadas no contexto de uma nova funçãojanela para qualquer dos dois bancos de filtros acima descritos,ainda melhorando as decisões supramencionadas. A qualidade e/ou oretardo podem ser ainda melhorados no caso de um banco de filtrosde análise, empregando uma função janela de análise compreendendouma seqüência de coeficientes de janela, que compreende umprimeiro grupo tendo uma primeira porção consecutiva da seqüênciade coeficientes de janela e o segundo grupo de coeficientes dejanela compreendendo uma segunda porção consecutiva da seqüênciade coeficientes de janela. A primeira porção e a segunda porçãocompreendem todos os coeficientes de janela da função janela. Maisainda, a primeira porção compreende menos coeficientes de janelaque a segunda porção, mas um valor de energia dos coeficientes dejanela na primeira porção é maior que um valor de energia doscoeficientes de janela da segunda porção. O primeiro grupo decoeficientes de janela é usado para o janelamento posterior dasamostras no domínio do tempo e o segundo grupo de coeficientes dejanela é usado para amostras no domínio do tempo janeladasprecocemente. Esta forma da função janela dá a oportunidade doprocessamento de amostras no domínio do tempo com coeficientes dejanela tendo maiores valores de energia previamente. Este é umresultado da distribuição descrita de coeficientes de janela paraas duas porções e suas aplicações na seqüência de amostras deáudio no domínio do tempo. Como conseqüência, o emprego destafunção janela pode reduzir o retardo introduzido pelo banco defiltros em um nível de qualidade constante ou permite um melhornível de qualidade baseado em um nível de retardo constante.
Da mesma forma, no caso de uma configuração dapresente invenção sob a forma de um equipamento para a geração deamostras de áudio no domínio do tempo e método correspondente, umjanelador de síntese pode usar a função de janela de síntese, quecompreende uma seqüência de coeficientes de janela ordenados deforma correspondente em uma primeira (consecutiva) porção e(consecutiva) segunda porção. Também no caso de uma função dejanela de síntese, o valor de energia ou um valor total de energiade um coeficiente de janela na primeira porção é maior que o valorde energia de um valor total de energia de um coeficiente dejanela de uma segunda porção, em que a primeira porção compreendemenos coeficientes de janela que a segunda porção. Devido a essadistribuição dos coeficientes de janela entre as duas porções e ofato que o janelador de síntese usa a primeira porção doscoeficientes do janelador para janelar amostras posteriores no25 domínio do tempo e a segunda porção de coeficientes de janela parao janelamento de amostras prévias no domínio do tempo, os efeitose as vantagens anteriormente descritos também se aplicam a umbanco de filtros de síntese ou a uma correspondente configuraçãode um método.
As descrições detalhadas da função de janela desínteses e das funções janela de análise empregadas na estruturade algumas configurações da presente invenção serão descritasabaixo em maiores detalhes. Em muitas configurações da presenteinvenção, a seqüência de coeficientes de janela da função dejanela de síntese e/ou da função janela de análise compreendemexatamente o primeiro grupo e o segundo grupo de coeficientes dejanela. Mais ainda, cada um dos coeficientes de janela daseqüência de coeficientes de janela pertence exatamente a um doscoeficientes de janela do primeiro grupo e do segundo grupo.
Cada um dos dois grupos compreende exatamente umaporção da seqüência de coeficientes de janela de maneiraconsecutiva. Na presente descrição, uma porção compreende umconjunto consecutivo de coeficientes de janela de acordo com aseqüência de coeficientes de janela. Em configurações de acordocom a presente invenção, cada um dos dois grupos (primeiro esegundo grupo) compreende exatamente uma porção da seqüência doscoeficientes de janela da maneira supramencionada. Os gruposrespectivos de coeficientes de janela não compreendem quaisquerdos coeficientes de janela, que não pertencem a exatamente umaporção do respectivo grupo. Em outras palavras, em muitasconfigurações da presente invenção, cada um do primeiro e dosegundo grupo de coeficientes de janela compreende somente aprimeira porção e a segunda porção de coeficientes de janela semcompreender outros coeficientes de janela.
Na estrutura da presente descrição, uma porçãoconsecutiva da seqüência de coeficientes de janela deve ser vistacomo um conjunto ligado de coeficientes de janela no sentidomatemático, em que o conjunto não tem falta de coeficientes dejanela comparado com a seqüência de coeficientes de janela, que sesituaria em uma faixa (por exemplo, faixa índice) dos coeficientesde janela da respectiva porção. Como conseqüência, em muitasconfigurações da presente invenção, a seqüência de coeficientes dejanela é dividida exatamente em duas porções ligadas decoeficientes de janela, formando cada uma do primeiro ou dosegundo grupo de coeficientes de janela. Nesses casos, cadacoeficiente de janela compreendido no primeiro grupo decoeficientes de janela pode ser disposto antes ou depois de cadaum dos coeficientes de janela do segundo grupo de coeficientes dejanela com referência à seqüência total de coeficientes de janela.
Em ainda outras palavras, em muitas configuraçõesde acordo com a presente invenção, a seqüência de coeficientes dejanela é dividida exatamente em dois grupos ou porções sem deixarfora quaisquer coeficientes de janela. De acordo com a seqüênciados coeficientes de janela, que também representa uma ordemdesses, cada um dos dois grupos ou porções compreende todos oscoeficientes de janela até (mas excluindo) ou iniciando a partirde (incluindo) um coeficiente de janela limítrofe. Como exemplo, aprimeira porção ou o primeiro grupo pode compreender coeficientesde janela com índices de 0 a 95 e de 96 a 639 no caso de umafunção janela compreendendo 640 coeficientes de janela (comíndices de 0 a 639). Aqui, o coeficiente de janela limítrofe seriao correspondente ao índice 96. Naturalmente, também são possíveisoutros exemplos (por exemplo, 0 a 543 e 544 a 639).
A implementação exemplificada detalhada de umbanco de filtros de análise descrito a seguir fornece umcomprimento de filtro cobrindo 10 blocos de amostras de entradaprovocando um retardo de sistema de somente 2 blocos, que é oretardo correspondente introduzido por uma MDCT (transformadamodificada discreta de co-seno) ou uma MDST (transformadamodificada discreta de seno). Uma diferença é devida ao maiorcomprimento de filtro cobrindo 10 blocos de amostras de entradacomparada a uma implementação de uma MDCT ou MDST em que osobrepasso é aumentado de 1 bloco no caso de MDCT e MDST até umsobrepasso e 9 blocos. Entretanto, outras implementações tambémpodem ser feitas cobrindo um diferente número de blocos deamostras de entrada, que também são denominados de amostras deentrada de áudio. Mais ainda, também podem ser consideradas eimplementadas outras decisões.
A Fig. 1 mostra um diagrama de bloco de um bancode filtros de análise 100 como uma configuração de um equipamentopara a geração de valores de sub-banda de áudio em canais de sub-banda de áudio. 0 banco de filtros de análise·100 compreende umjanelador de análise 110 para o janelamento de um frame 12 0 dasamostras de entrada de áudio no domínio do tempo. O frame 12 0compreende T blocos 130-1, ..., 130-T blocos de amostras (deentrada) de áudio no domínio do tempo, onde T é um número inteiropositivo e igual a 10 no caso da configuração mostrada na Fig. 1.Entretanto, o frame 120 também pode compreender um diferentenúmero de blocos 130.
Ambos, o frame 120 e cada um dos blocos 130compreendem amostras de entrada de áudio no domínio do tempo emuma seqüência temporal que se prolonga de uma amostra prévia atéuma amostra posterior de acordo com uma linha de tempo, comoindicada pela flecha 140 na Fig. 1. Em outras palavras, nailustração mostrada na Fig. 1, quanto mais a amostra de áudio nodomínio do tempo, que nesse caso é também uma amostra de entradade áudio no domínio do tempo, estiver para a direita, maisposterior a correspondente amostra de áudio no domínio do tempoestará com referência à seqüência de amostra de áudio no domíniodo tempo.
O janelador de análise 110 gera, baseado em uma10 seqüência de amostras de áudio no domínio do tempo, amostrasjaneladas no domínio do tempo, que são dispostas em um frame 150de amostras janeladas. De acordo com o frame 120 de amostras deentrada de áudio no domínio do tempo, também o frame de amostrasjaneladas 150 compreende T blocos de amostras janeladas 160-1,15 ..., 160-T. Nas configurações preferidas da presente invenção,cada um dos blocos de amostras janeladas 160 compreende o mesmonúmero de amostras janeladas que o número de amostras de entradade áudio no domínio do tempo de cada bloco 13 0 de amostras deentrada de áudio no domínio do tempo. Assim, quando cada um dos20 blocos 13 0 compreende N amostras de áudio de entrada no domínio dotempo, o frame 120 e o frame 150 compreende cada um T · N amostras.Nesse caso, N é um número inteiro positivo, que pode, por exemplo,ter os valores de 32 ou 64. Para T= 10, os frames 120, 150compreendem cada um 320 e 640, respectivamente, no caso acima.2 5 A janela de análise 110 está acoplada a um
calculador 170 para o cálculo dos valores de sub-banda de áudiobaseados nas amostras janeladas providas pelo janelador de análise110. Os valores de sub-banda de áudio são fornecidos pelocalculador 170 como um bloco 180 de valores de sub-banda de áudio,em que cada um dos valores de sub-banda de áudio corresponde a umcanal de sub-banda de áudio. Em uma configuração preferida, tambémo bloco 180 de valores de sub-banda de áudio compreende N valoresde sub-banda.
Cada um dos canais de sub-banda de áudiocorresponde a uma freqüência central característica. Asfreqüências centrais dos diferentes canais de sub-banda de áudiopodem, por exemplo, ser igualmente distribuídas ou igualmenteespaçadas com respeito à largura de banda de freqüência docorrespondente sinal de áudio descrito pelas amostras de entradade áudio no domínio do tempo fornecido ao banco de filtros deanálise 100.
O janelador de análise 110 está adaptado parajanelar as amostras de entrada de áudio no domínio do tempo doframe 120 com base em uma função janela de análise compreendendouma seqüência de coeficientes de janela tendo um primeiro númerode coeficientes de janela para obter as amostras janeladas doframe 150. A janela de análise 110 está adaptada para realizar ojanelamento do frame de amostras de áudio no domínio do tempo 120,multiplicando os valores das amostras de áudio no domínio do tempopelos coeficientes de janela da função janela de análise. Emoutras palavras, o janelamento compreende e multiplica peloelemento as amostras de áudio no domínio do tempo pelocorrespondente coeficiente de janela. Como ambos, o frame 120 deamostras de áudio no domínio do tempo e os coeficientes de janelacompreendem uma seqüência correspondente, a multiplicação emelementos dos coeficientes de janela e as amostras de áudio nodomínio do tempo é feita de acordo com as respectivas seqüências,por exemplo, como indicado por uma amostra e índice de coeficientede janela.
Em configurações da presente invenção, as funçõesjanela usadas para o janelamento do frame de amostras de entradade áudio no domínio do tempo são geradas com base em uma maiorfunção janela compreendendo um maior segundo número decoeficientes de janela empregando um esquema de interpolação como,por exemplo, ressaltado no contexto das Fig. 3 e 4. A maior funçãojanela tipicamente compreende um número par de coeficientes dejanela e pode, por exemplo, ser assimétrico com referência àseqüência de coeficientes de janela. Podem também ser empregadasfunções janela simétricas.
A função janela 190 usada para o janelamento doframe 12 0 de amostras de entrada no domínio do tempo é, porexemplo, obtida pelo janelador de análise 110 ou pelo banco defiltros 100 interpolando os coeficientes de janela da maior funçãojanela. Em configurações de acordo com a presente invenção, isto éfeito, por exemplo, interpolando coeficientes de janelaconsecutivos da maior função janela. Aqui pode ser empregado umesquema de interpolação linear polinomial ou em spline.
Quando, por exemplo, cada coeficiente de janelada maior função janela é usado uma vez para gerar um coeficientede janela da função janela e o segundo número é par, o número decoeficientes de janela da função janela 190 (primeiro número) é ametade do segundo número. Essa interpolação pode se basear em umainterpolação linear, um exemplo da qual será mais tarde ressaltadono contexto da equação (15). Entretanto, como ressaltado, tambémpode ser empregado outros esquemas de interpolação.
Em configurações da presente invenção sob a formade um banco de filtros de análise 100 como mostrado na Fig. 1, afunção janela de análise, assim como a função de janela de sínteseno caso de um banco de filtros de síntese pode, por exemplo,somente compreender coeficientes janelados de valor real. Emoutras palavras, cada um dos coeficientes de janela atribuídos aum índice de coeficiente de janela é um valor real.
Os coeficientes de janela em conjunto, formam arespectiva função janela, um exemplo da qual é mostrado na Fig. 1como uma função janela de análise 190. A seguir, serãoconsideradas funções janela, que permitem uma redução do retardoquando usadas no contexto dos bancos de filtros descritos.Entretanto, as configurações da presente invenção são se limitam aessas funções janela de baixo retardo.
A seqüência de coeficientes de janela que forma afunção janela de análise 190 compreende um primeiro grupo 200 e umsegundo grupo 210 de coeficientes de janela. 0 primeiro grupo 200compreende uma primeira porção consecutiva e ligada doscoeficientes de janela da seqüência de coeficientes de janela,considerando que o segundo grupo 210 compreende uma segunda porçãoconsecutiva e ligada de um coeficiente de janela. Em conjunto coma primeira porção no primeiro grupo 200, formam toda a seqüênciade coeficientes de janela da função janela de análise 190. Maisainda, cada coeficiente de janela da seqüência de coeficientes dejanela ou pertence à primeira porção ou à segunda porção decoeficientes de janela, de maneira que toda a função janela deanálise 190 é composta pelos coeficientes de janela da primeiraporção e da segunda porção. A primeira porção de coeficientes dejanela é, assim, idêntica ao primeiro grupo 200 de coeficientes dejanela e a segunda porção é idêntica ao segundo grupo 210 decoeficientes de janela, como indicado pelas flechascorrespondentes 200, 210 na Fig. 1.
O número de coeficientes de janela no primeirogrupo 2 00 da primeira porção de coeficientes de janela é menor queo número de coeficientes de janela no segundo grupo da segundaporção de coeficientes de janela. Entretanto, um valor de energiaou um valor total de energia dos coeficientes de janela noprimeiro grupo 200 é maior que um valor de energia ou valor totalde energia dos coeficientes de janela no segundo grupo 210. Comoserá depois ressaltado, um valor de energia de um conjunto decoeficientes de janela se baseia na soma dos quadrados dos valoresabsolutos dos correspondentes coeficientes de janela.
Em configurações de acordo com a presenteinvenção, a função janela de análise 190, assim como acorrespondente função de janela de síntese podem ser, portantoassimétricas com referência à seqüência de coeficientes de janelaou a um índice de um coeficiente de janela. Baseado no conjunto dedefinição dos índices de coeficiente de janela no qual a funçãojanela de análise 190 é definida, a função janela de análise 190 éassimétrica, quando para todos os números reais η existe um outronúmero real n0/ de maneira que o valor absoluto do coeficiente dejanela correspondente ao coeficiente de janela do índice decoeficiente de janela (n0 - n) não seja igual ao valor absoluto docoeficiente de janela correspondente ao índice de coeficiente dejanela (n0 + η), quando (n0 - n) e (n0 + n) pertencerem ao conjuntode definição.
Mais ainda, como também mostrado esquematicamentena Fig. 1, a função janela de análise 190 compreende alterações desinais em que o produto de dois coeficientes consecutivos de5 janela é negativo. Mais detalhes e demais características daspossíveis funções janela de acordo com as configurações dapresente invenção serão discutidos em maiores detalhes no contextodas Figs. 11 a 19.
Como antes indicado, o frame de amostras10 janeladas 150 compreende uma estrutura de bloco similar aos blocosindividuais 160-1, ..., 160-T como o frame 120 das amostrasindividuais de entrada no domínio do tempo. Como o janelador deanálise 110 está adaptado para o janelamento das amostras deentrada de áudio no domínio do tempo pela multiplicação desses15 valores pelos coeficientes de janela da função janela de análise190, o frame 150 de amostras janeladas está também no domínio dotempo. O calculador 170 calcula os valores de sub-banda de áudio,ou para ser mais exato, o bloco 180 de valores de sub-banda deáudio usando o frame 150 de amostras janeladas e realiza uma2 0 transferência do domínio do tempo para o domínio da freqüência.Portanto, o calculador 170 pode ser considerado como um conversortempo/freqüência, capaz de prover ao bloco 180 valores de sub-banda de áudio como uma representação espectral do frame 150 dasamostras janeladas.25 Cada valor de sub-banda de áudio do bloco 180
corresponde a uma sub-banda com uma freqüência característica. 0número de valores de sub-banda de áudio compreendido no bloco 180é também algumas vezes denominado de número de banda.Em muitas configurações de acordo com a presenteinvenção, o número de valores de sub-banda de áudio no bloco 180 éidêntico ao número de amostras de entrada de áudio no domínio dotempo de cada um dos blocos 130 do frame 120. No caso em que oframe 150 de amostras janeladas compreende a mesma estrutura embloco que o frame 12 0, de maneira que cada um dos blocos 160 deamostras janeladas também compreende o mesmo número de amostrasjaneladas que o bloco dessas amostras de entrada de áudio nodomínio do tempo 13 0, o bloco 180 de valores de sub-banda de áudiotambém naturalmente compreende o mesmo número que o bloco 160.
O frame 120 pode ser gerado opcionalmente, combase em um bloco de novas amostras de entrada de áudio no domíniodo tempo 220 mudando os blocos 130-1, ..., 130-(T-I) por um blocona direção oposta à flecha 140 indicando a direção no tempo.15 Portanto, um frame 12 0 de amostras de entrada de áudio no domíniodo tempo a ser processado é gerado mudando os (T-I) últimos blocosde um frame 120 diretamente precedente de amostras de áudio nodomínio do tempo por um bloco na direção das amostras de áudioprévias no domínio do tempo e pela adição do novo bloco 220 de2 0 novas amostras de áudio no domínio do tempo como o novo bloco 13Ο-Ι compreendendo as últimas amostras de áudio no domínio do tempodo frame atual 120. Na Fig. 1 isto está também indicado por umasérie de flechas tracejadas 230 indicando a mudança dos blocos130-1, ..., 130-(T-I) na direção oposta à flecha 140.25 Devido à essa mudança de blocos 130 na direção
oposta do tempo como indicado pela flecha 14 0, o atual frame 12 0 aser processado, compreende o bloco 130-(T-I) do frame 120diretamente precedente como o novo bloco 13 0-T. Da mesma forma, osblocos 130-(T-I), ..., 130-2 do frame atual 120 a ser processadosão iguais ao bloco 130-(T-2), ..., 130-1 do frame diretamenteprecedente 120. O bloco 130-T do frame diretamente precedente 120é descartado.
Como conseqüência, cada amostra de áudio nodomínio do tempo do novo bloco 22 0 será processada T vezes naestrutura de T processamentos consecutivos de T framesconsecutivos 12 0 das amostras de entrada de áudio no domínio dotempo. Assim, cada amostra de entrada de áudio no domínio do tempodo novo bloco 220 contribui, não somente para T frames diferentes120, como também para T frames diferentes 150 de amostrasjaneladas e T blocos 180 de valores de sub-banda de áudio. Comoantes indicado, em uma configuração preferida de acordo com apresente invenção, o número de blocos T no frame 120 é igual a 10,de maneira que cada amostra de áudio no domínio do tempo fornecidaao banco de filtros de análise 100 contribui para 10 diferentesblocos 180 de valores de sub-banda de áudio.
No início, antes que um único frame 120 sejaprocessado pelo banco de filtros de análise 100, o frame 120 podeser inicializado em um pequeno valor absoluto (abaixo de um limitepredeterminado), por exemplo, o valor 0. Como será explicado emmaiores detalhes abaixo, o formato da função janela de análise 190compreende um ponto central ou um "centro de massa", quetipicamente corresponde ou se situa entre dois índices decoeficiente de janela do primeiro grupo 200.
Como conseqüência, o número de novos blocos 22 0 aser inserido no frame 120 é pequeno, antes que o frame 12 0 sejapreenchido até um ponto em que as porções do frame 12 0 sejamocupadas por valores não voláteis (isto é, de valor diferente dezero) que correspondem a coeficientes de janela tendo umacontribuição significativa em termos de seus valores de energia.Tipicamente, o número de blocos a ser inserido no frame 12 0 antesque possa ser iniciado um processo "significativo", é de 2 a 4blocos, dependendo do formato da função janela de análise 190.Assim, o banco de filtros de análise 100 é capaz de prover blocos180 mais rapidamente que o correspondente banco de filtros estáempregando, por exemplo, uma função janela simétrica. Comotipicamente os novos blocos 22 0 são fornecidos ao banco de filtrosde análise 10 0 como um conjunto, cada um dos novos blocoscorresponde a um tempo de registro ou de amostragem, que éessencialmente dado pelo comprimento do bloco 220 (isto é, onúmero de amostras de entrada de áudio no domínio do tempocompreendido no bloco 22 0) e a taxa de amostragem ou a freqüênciade amostragem. Portanto, a função janela de análise 190, comoincorporada em uma configuração da presente invenção, leva a umretardo reduzido antes que o primeiro e os seguintes blocos 180 devalores de sub-banda de áudio possam ser providos ou enviados pelobanco de filtros 100.
Como outra opção, o equipamento 100 pode sercapaz de gerar um sinal ou incorporar uma peça de informaçãoreferente ã função janela de análise 190 usada na geração do frame180 ou referente à função de janela de síntese a ser usada naestrutura de um banco de filtros de síntese. Portanto, a função defiltro de análise 190 pode, por exemplo, ser uma versão reversa notempo ou no índice da função de janela de síntese a ser usada pelobanco de filtros de síntese.A Fig. 2a mostra um diagrama de bloco de umaconfiguração de um equipamento 300 para a geração de amostras deáudio no domínio do tempo com base no bloco de valores de sub-banda de áudio. Como já explicado, uma configuração da presenteinvenção sob a forma de um equipamento 3 00 para a geração deamostras de áudio no domínio do tempo é geralmente tambémdenominada de banco de filtros de síntese 300, já que oequipamento é capaz de gerar amostras de áudio no domínio dotempo, que podem em princípio ser reproduzidas, com base emvalores de sub-banda de áudio que compreendem informaçõesespectrais referentes a um sinal de áudio. Assim, o banco defiltros de síntese 3 00 é capaz de sintetizar amostras de áudio nodomínio do tempo com base em valores de sub-banda de áudio, quepodem, por exemplo, ser gerados por um correspondente banco defiltros de análise 100.
A Fig. 2a mostra um diagrama de bloco do banco defiltros de síntese 300 compreendendo um calculador 310 ao qual éprovido um bloco 32 0 de valores de sub-banda de áudio (no domínioda freqüência). O calculador 310 é capaz de calcular um frame 330compreendendo uma seqüência de amostras intermediárias no domíniodo tempo a partir de valores de sub-banda de áudio do bloco 320. Oframe 330 de amostras intermediárias no domínio do tempocompreende em muitas configurações de acordo com a presenteinvenção também uma estrutura de bloco similar, por exemplo, aoframe 150 de amostras janeladas do banco de filtros de análise 100da Fig. 1. Nesses casos, o frame 330 compreende blocos 340-1, ...,340-T blocos de amostras intermediárias no domínio do tempo.
A seqüência de amostras intermediárias no domíniodo tempo do frame 330, assim como cada bloco 340 de amostrasintermediárias no domínio do tempo compreendem uma ordem de acordocom o tempo, como indicado pela flecha 350 na Fig. 2a. Comoconseqüência, o frame 330 compreende uma amostra préviaintermediária no domínio do tempo no bloco 34O-T e uma amostraúltima intermediária no domínio do tempo no bloco 340-1, querepresentam a primeira e a última amostra intermediária no domíniodo tempo do frame 330, respectivamente. Também, cada um dos blocos340 compreende uma ordem similar. Como conseqüência, emconfigurações de um banco de filtros de síntese, os termos nframe"e "seqüência" podem geralmente ser usados como sinônimos.
O calculador 310 está acoplado a um janelador desíntese 360, para o qual é provido o frame 330 de amostrasintermediárias no domínio do tempo. 0 janelador de síntese estáadaptado para janelar a seqüência de amostras intermediárias nodomínio do tempo usando uma função de janela de síntese 370mostrada esquematicamente na Fig. 2a. Como saída, o janelador desíntese 360 provê um frame 380 de amostras janeladasintermediárias no domínio do tempo, que também pode compreenderuma estrutura em bloco dos blocos 390-1, ..., 390-T.
Os frames 330 e 380 podem compreender T blocos340 e 390, respectivamente, onde T é um número inteiro positivo.
Em uma configuração preferida de acordo com a presente invenção,na forma de um banco de filtros de síntese 300, o número de blocosTé igual a 10. Entretanto, em diferentes configurações, tambémdiferentes números de blocos podem estar compreendidos em um dosframes. Para ser mais preciso, em princípio, o número de blocos Tpode ser maior ou igual a 3, ou maior ou igual a 4, dependendo dascircunstâncias da implementação e das decisões anteriormenteexplicadas das configurações de acordo com a presente invençãocompreendendo a estrutura em bloco de frames tanto para o banco defiltros de síntese 100 como para o banco de filtros de síntese300.
O janelador de síntese 360 está acoplado a umestágio de saída de adição de sobrepasso 400, ao qual é fornecidoo frame 380 de amostras janeladas intermediárias no domínio dotempo. O estágio de saída de adição de sobrepasso 400 é capaz deprocessar as amostras janeladas intermediárias no domínio do tempopara obter um bloco 410 de amostras no domínio do tempo. O bloco410 das amostras (de saída) domínio do tempo pode então, porexemplo, ser fornecido para outros componentes para outrosprocessamentos, armazenamentos ou transformações em sinais
audíveis de áudio.
0 calculador 310 para o cálculo da seqüência deamostras no domínio do tempo compreendido no frame 33 0 é capaz detransferir dados do domínio da freqüência no domínio do tempo.Portanto, o calculador 310 pode compreender um conversortempo/freqüência capaz de gerar um sinal no domínio do tempo darepresentação espectral compreendido no bloco 32 0 de valores desub-banda de áudio. Como foi explicado no contexto do calculador170 do banco de filtros de análise 100 mostrado na Fig. 1, cada umdos valores de sub-banda de áudio do bloco 32 0 corresponde a umcanal de sub-banda de áudio tendo uma freqüência centralcaracterística.
Em contraste, as amostras intermediárias nodomínio do tempo compreendidas no frame 33 0 representam emprincípio, informações no domínio do tempo. 0 janelador de síntese360 é capaz e está adaptado para o janelamento da seqüência deamostras intermediárias no domínio do tempo compreendido no frame330 usando a função de janela de síntese 370 como mostradoesquematicamente na Fig. 2a.
Como já ressaltado no contexto da Fig. 1, ojanelador de síntese 360 também usa uma função de janela desíntese 370, que é obtida por interpolação de uma maior funçãojanela compreendendo um segundo número de coeficientes de janela.O segundo número é, assim, maior que um primeiro número decoeficientes de janela da função de janela de síntese 3 70 usadapara o janelamento das amostras intermediárias no domínio do tempodo frame 33 0.
A função de janela de síntese 370 pode, porexemplo, ser obtida pelo janelador de síntese 360 ou pelo banco defiltros 300 (o equipamento) que realiza um dos esquemas deinterpolação ressaltados anteriormente. Os coeficientes de janelada função de janela de síntese pode, por exemplo, ser gerado combase em uma interpolação linear, polinomial ou em spline. Maisainda, em configurações de acordo com a presente invenção, ainterpolação pode ser baseada no uso de consecutivos coeficientesde janela da maior função janela. Quando cada coeficiente dejanela da maior função janela é usado exatamente uma vez, a funçãojanela 370 compreendendo o (menor) primeiro número de coeficientesde janela pode, por exemplo, compreender exatamente a metade donúmero de coeficientes de janela da maior função janela, quando osegundo número é par. Em outras palavras, nesse caso, o segundonúmero pode ser o dobro do primeiro número. Entretanto, tambémoutros cenários de interpolações e esquemas podem serimplementados na estrutura das configurações da presente invenção.
A seguir, será considerado mais de perto o casode uma denominada função janela de baixo retardo. Como indicado5 anteriormente, as configurações de acordo com a presente invençãonão estão limitadas a essas funções janela. Também poderão serusadas outras funções janela, como funções janela simétricas.
A função de janela de síntese 370 compreende umaseqüência de coeficientes de janela, que também compreende um10 primeiro grupo 420 e um segundo grupo 430 de coeficientes dejanela como explicado anteriormente no contexto da função janela190 com um primeiro grupo 200 e um segundo grupo 210 decoeficientes de janela.
0 primeiro grupo 420 de coeficientes de janela da15 função de janela de síntese 370 compreende uma primeira porçãoconsecutiva da seqüência de coeficientes de janela. De formasimilar, o segundo grupo 430 de coeficientes também compreende umasegunda porção consecutiva da seqüência de coeficientes de janela,em que a primeira porção compreende menos coeficientes de janela20 que a segunda porção e onde um valor de energia ou total valor deenergia dos coeficientes de janela na primeira porção é maior queo correspondente valor de energia dos coeficientes de janela dasegunda porção. Outras características e propriedades da função dejanela de síntese 370 podem ser similares às características e25 propriedades correspondentes da função janela de análise 190 comomostrado esquematicamente na Fig. 1. Como conseqüência, é feitareferência no presente à correspondente descrição na estrutura dafunção janela de análise 190 e a outra descrição das funçõesjanela com referência às Figs. 11 a 19, onde o primeiro grupo 200corresponde ao primeiro grupo 420 e o segundo grupo 210corresponde ao segundo grupo 430.
Por exemplo, as porções compreendidas nos dois5 grupos 420, 430 de coeficientes de janela, tipicamente formam cadaconjunto consecutivo e conectado de coeficientes de janela emconjunto compreendendo todos os coeficientes de janela daseqüência de coeficientes de janela da função janela 370. Emmuitas configurações de acordo com a presente invenção, a função10 janela de análise 190 como mostrada na Fig. Iea função de janelade síntese 370 como mostrada na Fig. 2a se baseiam uma na outra.Por exemplo, a função janela de análise 190 pode ser uma versão detempo reverso ou de índice reverso da função de janela de síntese370. Entretanto, também podem ser possíveis outras relações entre15 as duas funções janela 190, 370. Pode ser aconselhável empregaruma função de janela de síntese 370 na estrutura do janelador desíntese 360, que está relacionado com a função janela de análise190, que foi empregada no curso da geração (opcionalmente antes deoutras modificações) do bloco 320 de valores de sub-banda de áudio20 fornecidos ao banco de filtros de síntese 300.
Como realçado no contexto da Fig. 1, o banco defiltros de síntese 3 00 na Fig. 2a pode ser opcionalmente adaptadode maneira que o bloco de entrada 320 pode compreender outrossinais novas peças de informações referentes às funções janela.25 Como exemplo, o bloco 320 pode compreender informações referentesà função janela de análise 190 usada para gerar o bloco 320 oureferente à função de janela de síntese 370 a ser usada pelojanelador de síntese 360. Assim, o banco de filtros 300 pode seradaptado para isolar as respectivas informações e provê-las aojanelador de síntese 360.
0 estágio de saída de adição de sobrepasso 400 écapaz de gerar o bloco 410 de amostras no domínio do tempo5 processando as amostras janeladas intermediárias no domínio dotempo compreendidas no frame 380. Em diferentes configurações deacordo com a presente invenção, o estágio de saída de adição desobrepasso 4 000 pode compreender uma memória para armazenartemporariamente frames anteriormente recebidos 380 de amostras10 janeladas intermediárias no domínio do tempo. Dependendo dosdetalhes de implementação, o estágio de saída de adição desobrepasso 400 pode, por exemplo, compreender T diferentesposições de armazenagem compreendidas na memória para aarmazenagem de um número total de T frames 380 de amostras15 janeladas intermediárias no domínio do tempo. Entretanto, tambémum diferente número de posições de armazenagem podem estarcompreendidas no estágio de saída de adição de sobrepasso 400,como necessário. Mais ainda, em diferentes configurações de acordocom a presente invenção, o estágio de saída de adição de20 sobrepasso 400 pode ser capaz de prover o bloco 410 de amostras nodomínio do tempo baseado unicamente em um frame 380 de amostrasintermediárias no domínio do tempo. As configurações de diferentesbancos de filtros de síntese 3 00 serão explicadas posteriormenteem maiores detalhes.25 A Fig. 2b ilustra um princípio funcional de
acordo com uma configuração da presente invenção sob a forma de umbanco de filtros de síntese 300, em que a geração da função janela370 por interpolação não se focaliza somente na simplicidade.O bloco 320 de valores de sub-banda de áudio éprimeiro transferido do domínio da freqüência para o domínio dotempo pelo calculador 310, que está ilustrado na Fig. 2b por umaflecha 440. O frame resultante 320 de amostras intermediárias nodomínio do tempo compreendendo os blocos 340-1, .··, 340-T deamostras intermediárias no domínio do tempo é então janelado pelojanelador de síntese 360 (não mostrado na Fig. 2b) pelamultiplicação da seqüência de amostras intermediárias no domíniodo tempo do frame 320 pela seqüência de coeficientes de janela dafunção de janela de síntese 370 para obter o frame 380 de amostrasj aneladas intermediárias no domínio do tempo. 0 frame 3 80novamente compreende os blocos 390-1, ..., 390-T de amostrasjaneladas intermediárias no domínio do tempo, formando em conjuntoo frame 3 80 de amostras janeladas intermediárias no domínio dotempo.
Na configuração mostrada na Fig. 2b de um bancode filtros de síntese da invenção 3 00, o estágio de saída deadição de sobrepasso 400 é então capaz de gerar o bloco 410 deamostras de saída no domínio do tempo adicionando para cada valoríndice das amostras de áudio no domínio do tempo do bloco 410, asamostras janeladas intermediárias no domínio do tempo de um bloco390 de diferentes frames 380. Como ilustrado na Fig. 2b, asamostras de áudio no domínio do tempo do bloco 410 são obtidasadicionando para cada índice de amostra de áudio uma amostraintermediária no domínio do tempo janelada do bloco 3 90-1 do frame380, processada pelo janelador de síntese 360 na ocasião atual ecomo previamente descrita, a correspondente amostra intermediáriano domínio do tempo do segundo bloco 390-2 de um frame 380-1processado imediatamente antes do frame 380 e guardado em umaposição de armazenagem no estágio de saída de adição de sobrepasso400. Como ilustrado na Fig. 2b, outras correspondentes amostrasjaneladas intermediárias no domínio do tempo de outros blocos 3905 (por exemplo, bloco 390-3 do frame 380-2, bloco 390-4 do frame380-3, bloco 390-5 do frame 380-4) processados pelo banco defiltros de síntese 300 antes que possam ser usados. Os frames 380-2, 380-3, 380-4 e opcionalmente outros frames 380 foramprocessados pelo banco de filtros de síntese 300 em ocasiões10 anteriores. 0 frame 380-2 foi imediatamente processado antes doframe 380-1 e, da mesma forma, o frame 380-3 foi imediatamentegerado antes do frame 380-2 e assim por diante.
O estágio de saída de adição de sobrepasso 400como empregado na configuração é capaz de somar para cada índice15 do bloco 410 de amostras (de saída) domínio do tempo T diferentesblocos 390-1, ..., 390-T de amostras janeladas intermediárias nodomínio do tempo de T diferentes frames 380, 380-1, ..., 380-(Τ-Ι) . Assim, fora os primeiros T blocos processados, cada uma dasamostras (de saída) domínio do tempo do bloco 410 se baseia em T20 diferentes blocos 320 de valores de sub-banda de áudio.
Como no caso da configuração da presente invençãode um banco de filtros de análise 100 descrito na Fig. 1, devido àforma da função de janela de síntese 370, o banco de filtros desíntese 300 oferece a possibilidade de rapidamente prover o bloco25 410 de amostras (de saída) domínio do tempo. Isto é também umaconseqüência da forma da função janela 370. Como o primeiro grupo420 de coeficientes de janela corresponde 3. utn maior* valor* deenergia e compreende menos coeficientes de janela que o segundogrupo 430, o janelador de síntese 360 é capaz de prover frames"significativos" 380 de amostras janeladas quando o frame 330 deamostras intermediárias no domínio do tempo é preenchido demaneira que pelo menos os coeficientes de janela do primeiro grupo5 420 contribuam para o frame 380. Os coeficientes de janela dosegundo grupo 43 0 demonstram uma menor contribuição devido a seusmenores valores de energia.
Portanto, quando no início, o banco de filtros desíntese 300 é inicializado com 0, a provisão de blocos 410 pode,10 em princípio, ser iniciada quando somente alguns blocos 320 devalores de sub-banda de áudio tiverem sido recebidos pelo banco defiltros de síntese 300. Portanto, também o banco de filtros desíntese 300 permite uma significativa redução de retardo comparadacom o banco de filtros de síntese tendo, por exemplo, uma função15 de janela de síntese simétrica.
Como indicado anteriormente, os calculadores 170e 310 das configurações mostradas nas Figs. 1 e 2a podem serimplementados como calculadores de valor real, gerando ou sendocapazes de processar valores de sub-banda de áudio dos blocos de20 real valor 180 e 320, respectivamente. Nesses casos, oscalculadores podem, por exemplo, ser implementados comocalculadores de valor real baseados em funções oscilantesharmônicas como a função seno ou a função co-seno. Entretanto,também podem ser implementados calculadores de valores complexos25 como os calculadores 170, 310. Nesses casos, os calculadorespodem, por exemplo, ser implementados com base em funçõesexponenciais complexas ou outras funções harmônicas de valorcomplexo. A freqüência das oscilações de valores reais ou devalores complexos normalmente depende do índice do valor de sub-banda de áudio, por vezes também denominado de índice de banda oude índice de sub-banda da sub-banda específica. Mais ainda, afreqüência pode ser idêntica ou depender da freqüência central dacorrespondente sub-banda. Por exemplo, a freqüência da oscilaçãopode ser multiplicada por um fator constante, alterado comreferência à freqüência central da correspondente sub-banda oupode depender de uma combinação de ambas as modificações.
Um calculador de valores complexos 170, 310 podeser construído ou implementado com base em calculadores de valoresreais. Por exemplo, para um calculador de valores complexos, umaimplementação eficiente pode, em princípio, ser usada para ambos,a parte modulada de seno e co-seno de um banco de filtrosrepresentando a parte real e a imaginária de uma componente devalor complexo. Isto significa que é possível a implementação deambas, da parte modulada por co-seno e da parte modulada por senocom base nas, por exemplo, estruturas modificadas DCT-IV- e DST-IV. Mais ainda, outras implementações podem empregar o uso de umaFFT (FFT = Transformada Rápida de Fourier) opcionalmente sendoimplementada em conjunto para ambas, a parte real e a parte doscalculadores complexos modulados, usando uma FFT ou usando umestágio separado FFT para cada transformada.
Descrição Matemática
As seções a seguir descrevem um exemplo dasconfigurações de um banco de filtros de análise e do banco defiltros de síntese com múltiplos sobrepassos de 8 blocos para aparte, que não provoca mais retardo, como explicado acima, e umbloco para o futuro, que provoca o mesmo retardo que para umaestrutura MDCT/MDST (MDCT = Transformada Discreta Co-senoModificada; MDST = Transformada Discreta Seno Modificada). Emoutras palavras, no exemplo a seguir, o parâmetro T é igual a 10.
Primeiro, será dada a descrição de um banco defiltros de análise de baixo retardo complexo modulado. Comoilustrado na Fig. 1, o banco de filtros de análise 100 compreendeas etapas de transformação de um janelamento de análise realizadopelo janelador de análise 110 e uma modulação de análise realizadapelo calculador 170. O janelamento de análise se baseia na equação
<formula>formula see original document page 37</formula>
onde, zi;n é a amostra janelada (de real valor)correspondente ao índice de bloco i e ao índice de amostra η doframe 150 mostrado na Fig. 1. 0 valor Xi,n é a amostra de entradano tempo (de real valor) correspondente ao mesmo índice de bloco ie índice de amostra η. A função janela de análise 190 estárepresentada na equação (1) por seus coeficientes de janela dereal valor w(n), onde η é também o índice de coeficiente de janelana faixa indicada na equação (1). Como já explicado anteriormente,o parâmetro N é o número de amostras em um bloco 22 0, 130, 160, 180.
A partir dos argumentos da função janela deanálise w(lON-l-n) pode ser visto que a função janela de análiserepresenta uma versão invertida ou uma versão reversa no tempo dafunção de janela de síntese, que é realmente representada pelocoeficiente de janela w(n).
A modulação de análise realizada pelo calculador170 na configuração mostrada na Fig. 1, se baseia em duas equações<formula>formula see original document page 38</formula>
para o índice de coeficiente espectral ou índicede banda k sendo um número inteiro na faixa de
0 < k < N . (4)
Os valores XReai,i.k e Xima9,!. k representam a partereal e a parte imaginária do valor de valor complexo de sub-bandade áudio correspondente ao índice de bloco i e ao índice decoeficiente espectral k do bloco 180. 0 parâmetro n0 representauma opção de índice, que é igual a
n0 = -N / 2 + 0.5 . (5)
0 banco de filtros de síntese de baixo retardocomplexo modulado correspondente compreende as etapas detransformação de uma modulação de síntese, um janelamento desíntese, sendo descrita uma adição de sobrepasso.
A modulação de síntese se baseia na equação
<formula>formula see original document page 38</formula>
onde x'i,n ê uma amostra intermediária no domíniodo tempo do frame 33 0 correspondente ao índice de amostra η e aoíndice de bloco i. Mais uma vez, o parâmetro N é um número inteiroque indica o comprimento do bloco 320, 340, 390, 410, que é tambémdenominado de comprimento de bloco de transformada ou, devido àestrutura em bloco dos frames 330, 380, como um desvio do blocoanterior. Também as demais variáveis e parâmetros foramintroduzidos acima, como o índice de coeficiente espectral k e odesvio n0.
O janelamento de síntese realizado pelo janeladorde síntese 360 na configuração mostrada na Fig. 2a se baseia naequação
<formula>formula see original document page 39</formula>
onde ζ'iin é ο valor da amostra intermediária nodomínio do tempo janelada correspondente ao índice de amostra η eao índice de bloco i do frame 380.
A estampa de transformação da adição desobrepasso se baseia na equação
<formula>formula see original document page 39</formula>
onde OUtiill representa a amostra no domínio dotempo (saída) correspondente ao índice de amostra η e ao índice debloco i. A equação (8), assim ilustra a operação de adição desobrepasso como feita no estágio de saída de adição de sobrepasso400 ilustrada na parte inferior da Fig. 2b.
Entretanto, as configurações de acordo com apresente invenção não se limitam aos bancos de filtros de baixoretardo complexos modulados, permitindo um processamento de sinalde áudio com um desses bancos de filtros. Também pode ser feitauma implementação de real valor de um banco de filtros de baixoretardo para uma codificação de áudio ampliada de baixo retardo.
Como comparação, por exemplo, as equações (2) e (6) em termos deuma parte co-seno revela, a contribu ição co-seno da modulação deanálise e a modulação de síntese mostra uma estrutura comparávelquando considerada a de uma MDCT. Apesar do método de projeto emprincípio permitir uma extensão da MDCT em ambas as direçõesreferentes ao tempo, somente uma extensão de E ( = T-2 Jblocospara o passado é aqui aplicada, onde cada um dos T blocoscompreende N amostras. O coeficiente de freqüência Xiik da banda ke bloco i dentro de um banco de filtros de análise com N canais ouN bandas pode ser resumido por
<formula>formula see original document page 40</formula>
para o índice de coeficiente espectral k conforme
definido pela equação (4). Aqui, novamente η é um índice deamostra e wa é uma função janela de análise.
Para garantir a totalidade, a descriçãomatemática anteriormente fornecida do banco de filtros de análisede baixo retardo complexo modulado pode ser dada na mesma formaresumida da equação (9), trocando a função co-seno pela funçãoexponencial de valor complexo. Para ser mais exato, com adefinição e as variáveis dadas acima, as equações (1), (2), (3) e(5) podem ser resumidas e prolongadas de acordo com
<formula>formula see original document page 40</formula>
onde em contraste com as equações (2) e (3), aextensão de 8 blocos no passado foi substituída pela variávelE( = 8).
As etapas da modulação de síntese e dojanelamento de síntese, como descritas para o caso complexo nasequações (6) e (7), podem ser resumidas no caso de um banco defiltros de síntese de valor real. O frame 380 de amostrasjaneladas intermediárias no domínio do tempo, que também édenominado de vetor desmodulado, é dado por
<formula>formula see original document page 41</formula>
onde z'iin é a amostra intermediária no domínio dotempo janelada correspondente ao índice de banda i e ao índice deamostra η. O índice de amostra η é novamente um número inteiro nafaixa de
<formula>formula see original document page 41</formula>
e ws (n) é a janela de síntese, que é compatívelcom a janela de análise wa(n) da equação (9).
A etapa de transformação de adição de sobrepassoé então dada por
<formula>formula see original document page 41</formula>
onde x'i,n é o sinal reconstruído, ou ainda umaamostra no domínio do tempo do bloco 410 como fornecida peloestágio de saída de adição de sobrepasso 400 mostrado na Fig. 2a.
Para o banco de filtros de síntese de valorcomplexo 3 00, as equações (6) e (7) podem ser resumidas egeneralizadas com referência à extensão de E(=8) blocos para ocaminho de acordo com
<formula>formula see original document page 41</formula>
onde j = V-T é a unidade imaginária. A equação(13) representa a generalização da equação (8), sendo tambémválida para o caso de valor complexo.Como a comparação direta da equação (14) comequação (7) mostra, a função janela w(n) da equação (7), isto é, amesma função de janela de síntese que ws(n) da equação (14) . Comoantes ressaltado, a comparação similar da equação (10) com ocoeficiente de função janela de análise wa (n) com equação (1)mostra que a função janela de análise é a versão reversa no tempoda função de janela de síntese no caso da equação (1).
Como em ambas, é mostrado um banco de filtros deanálise 100 na Fig. 1 e um banco de filtros de síntese 300 comomostrado na Fig. 2a oferece um aperfeiçoamento significativo emtermos de decisão entre o retardo, por um lado, e a qualidade doprocesso de áudio; por outro lado, os bancos de filtros 100, 300são geralmente denominados de bancos de filtros de baixo retardo.Sua versão de valor complexo é, por vezes, denominada de banco defiltros complexo de baixo retardo, abreviada por CLDFB. Em algumascircunstâncias, o termo CLDFB não é somente usado para a versão devalor complexo, mas também para a versão de valor real do banco defiltros.
Como mostrou a discussão anterior do históricomatemático, a estrutura usada para implementar os bancos defiltros de baixo retardo proposto utiliza uma estrutura do tipoMDCT ou IMDCT (IMDCT = MDCT inversa) , como mostrado pelo PadrãoMPEG-4, usando um sobrepasso estendido. As regiões adicionais desobrepasso podem ser anexadas em bloco no lado esquerdo assim comono lado direito do núcleo tipo MDCT. Aqui, somente a extensão parao lado direito (para o banco de filtros de síntese) é usada, quesomente funciona a partir das amostras passadas e, portanto nãoprovoca nenhum outro retardo.A inspeção das equações (1), (2) e (14) mostrouque o processamento é muito similar ao da MDCT ou da IMDCT. Comsomente pequenas modificações compreendendo uma função janela deanálise modificada e função de janela de síntese, respectivamente,a MDCT ou a IMDCT é estendida a um banco de filtros modulado quepode operar múltiplos sobrepassos e é muito flexível comreferência a seu retardo. Como por exemplo, as equações (2) e (3)demonstraram que a versão complexa é, em princípio, obtida pelasimples adição de um seno modulado à dada modulação de co-seno.
Interpolação
Como ressaltado no contexto das Figs. 1 e 2a,ambos, o janelador de análise 110 e o janelador de síntese 360 ouos respectivos bancos de filtros 100, 300 são adaptados para ojanelamento dos respectivos trames de amostras no domínio do tempomultiplicando cada uma das respectivas amostras de áudio nodomínio do tempo pelo coeficiente individual de janela. Cada umadas amostras no domínio do tempo é, em outras palavras,multiplicada por um coeficiente de janela(individual), como porexemplo as equações (1), (7), (9), (10), (11), e (14)demonstraram. Como conseqüência, o número de coeficientes dejanela da respectiva função janela é tipicamente idêntico aonúmero das respectivas amostras de áudio no domínio do tempo.
Entretanto, sob certas circunstâncias deimplementação, pode ser aconselhável implementar a função janelatendo um maior segundo número de coeficientes de janela comparadoà real função janela com um menor primeiro número de coeficientes,que é realmente usada durante um janelamento do respectivo frameou seqüência de amostras de áudio no domínio do tempo. Isto pode,por exemplo, ser aconselhável no caso quando as exigências dememória de uma implementação específica puder ser mais valiosa quea eficiência computacional. Um outro cenário em que uma sub-amostragem dos coeficientes de janela possa ser útil, é o caso dadenominada abordagem de índice dual, que é, por exemplo, empregadana estrutura de sistemas SBR (SBR = Replicação de BandaEspectral). O conceito de SBR será explicado em maiores detalhesno contexto das Figs. 5 e 6.
Nesse caso, o janelador de análise 110 ou ojanelador de síntese 360 pode ainda ser adaptado de maneira que arespectiva função janela usada para o janelamento das amostras deáudio no domínio do tempo provida para o respectivo janelador 110,360 seja obtida por uma interpolação de coeficientes de janela damaior função janela tendo um maior segundo número de coeficientesde janela.
A interpolação pode, por exemplo, ser feita poruma interpolação linear polinomial ou baseada em spline. Porexemplo, no caso da interpolação linear, mas também no caso de umainterpolação polinomial ou baseada em spline, o respectivojanelador 100, 360 pode então ser capaz de interpolar oscoeficientes de janela da função janela usados para o janelamentobaseado em dois coeficientes consecutivos de janela da maiorfunção janela, de acordo com uma seqüência dos coeficientes dejanela da maior função janela para obter um coeficiente de janelada função janela.
Especialmente no caso de um número par deamostras de áudio no domínio do tempo e coeficientes de janela,uma implementação de uma interpolação como anteriormente descrito,resulta em um aperfeiçoamento significativo da qualidade de áudio.Por exemplo, no caso de um número par N · T de amostras de áudio nodomínio do tempo em um dos frames 120, 330, não usando umainterpolação, por exemplo, uma interpolação linear, resultará emsérios efeitos de aliasing durante o resto do processamento dasrespectivas amostras de áudio no domínio do tempo.
A Fig. 3 ilustra um exemplo de uma interpolaçãolinear baseada em uma função janela (uma função janela de análiseou uma função de janela de síntese) a ser empregada no contextocom frames compreendendo N T/2 amostras de áudio no domínio dotempo. Devido às restrições de memória ou outros detalhes deimplementação, os próprios coeficientes de janela da função janelanão são guardados em uma memória, mas em uma maior função janelacompreendendo N · T coeficientes de janela sendo guardados durantea disponibilidade da memória adequada ou de outra forma. A Fig. 3ilustra no gráfico superior, os correspondentes coeficientes dejanela c (n) como função dos índices de coeficiente de janela η nafaixa entre 0 e N · T-I.
Com base em uma interpolação linear de doiscoeficientes consecutivos de janela da função janela tendo o maiornúmero de coeficientes de janela como mostrado no gráfico superiorda Fig. 3, é calculada uma função janela interpolada com base naequação
ci[n] = £ (c[2n] + c[2n + l]) for 0 < η < N · T / 2 (15)
O número de coeficientes de janela ci(n)interpolados da função janela a ser aplicada ao frame tendo N · T/2amostras de áudio no domínio do tempo compreende a metade donúmero de coeficientes de janela.
Para melhor ilustrar o fato, na Fig. 3coeficientes de janela 450-0, ..., 450-7 são mostrados na partesuperior da Fig. 3 correspondente a um coeficiente de janela c(0),..., c (7) . Com base nesses coeficientes de janela e os demaiscoeficientes de janela da função janela, uma aplicação da equação(15) leva aos coeficientes de janela ci(n) da função janelainterpolada mostrada na parte inferior da Fig. 3. Por exemplo, combase nos coeficientes de janela 450-2 e 450-3, o coeficiente dejanela 460-1 é gerado com base na equação (15), como ilustradopelas flechas 470 na Fig. 3. Da mesma forma, o coeficiente dejanela 460-2 da função janela interpolada é calculado com base nocoeficiente de janela 450-4, 450-5 da função janela mostrada naparte superior da Fig. 3. A Fig. 3 mostra a geração de outroscoeficientes de janela ci (n) .
Para ilustrar o cancelamento de aliasingconseguido pela sub-amostragem interpolada da função janela, aFig. 4 ilustra a interpolação dos coeficientes de janela no casoda função de janela seno, que pode, por exemplo, ser empregada emuma MDCT. Simplificando, a metade esquerda da função janela e ametade direita da função janela são desenhadas sobrepostas. A Fig.4 mostra uma versão simplificada de uma janela seno, compreendendosomente 2 · 4 coeficientes de janela ou pontos para uma MDCT tendoo comprimento de 8 amostras.
A Fig. 4 mostra quatro coeficientes de janela480-1, 480-2, 480-3 e 480-4 da primeira metade da janela seno equatro coeficientes de janela 490-1, 490-2, 490-3 e 390-4 dasegunda metade da janela seno. O coeficiente de janela 490-1, ...,490-4 corresponde aos índices de coeficiente de janela 5, ..., 8.Os coeficientes de janela 490-1, ..., 490-4 correspondem à segundametade do comprimento da função janela de maneira que os índicesdados N' = 4 devem ser adicionados para se obter os índices reais.
Para reduzir ou mesmo alcançar o cancelamento dosefeitos de aliasing descritos acima, o coeficiente de janela deveobedecer a condição
<formula>formula see original document page 47</formula>
da melhor forma possível. Quanto melhor a relação(16) é obedecida, melhor é a supressão alias ou o cancelamentoalias.
Supondo a situação em que uma nova função janelatendo a metade do número de coeficientes de janela sejadeterminada para a metade esquerda da função janela, surge oseguinte problema. Devido ao fato que a função janela compreendeum número par de coeficientes de janela (sub-amostragem de númerospares), sem empregar um esquema de interpolação como ressaltado naFig. 3, os coeficientes de janela 480-1 e 480-3 ou 480-2 e 480-4correspondem a somente um valor de aliasing· da função janelaoriginal ou do filtro original.
Isto leva a uma proporção desequilibrada daenergia espectral e leva a uma redistribuição assimétrica do pontocentral (centro de massa) da correspondente função janela. Combase na equação de interpolação (15) para o coeficiente de janelaw(n) da Fig. 4, os valores interpolados Ii e I2 obedecem bem melhora relação de aliasing (16), e levarão assim a um melhoraperfeiçoamento referente à qualidade dos dados processados deáudio.Entretanto, o emprego de um esquema deinterpolação ainda mais elaborado, por exemplo, um esquema deinterpolação baseado em spline ou outro similar, pode até resultarem coeficientes de janela, que obedecem até melhor a relação (16).
A interpolação linear é, na maioria dos casos, suficiente epermite uma rápida e eficiente implementação.
A situação no caso de um sistema típico SBR queemprega um banco de filtros SBR-QMF (QMF = Filtro em Espelho deQuadratura), a interpolação linear ou outro esquema deinterpolação não precisa ser implementado já que o filtroprotótipo SBR-QMF compreende um número ímpar de coeficientes defiltro protótipo. Isto significa que o filtro protótipo SBR-QMFcompreende um valor máximo com referência ao qual a sub-amostragempode ser implementada de maneira que a simetria do filtroprotótipo SBR-QMF permaneça intacta.
Nas Figs. 5 e 6, será descrita uma possívelaplicação das configurações de acordo com a presente invenção soba forma de banco de filtros de análise e de um banco de filtros desíntese. Um importante campo de aplicação é o sistema SBR ouferramenta SBR (SBR = Replicação de Banda Espectral). Entretanto,outras aplicações de configurações de acordo com a presenteinvenção podem vir de outros campos, em que exista a necessidadede modificações espectrais (por exemplo, modificações ouequalizações de ganho), como a codificação de objeto de áudioespacial, codificação estéreo paramétrica de baixo retardo,codificação espacial/surround de baixo retardo, ocultação de perdade frame, cancelamento de eco ou outras aplicaçõescorrespondentes.A idéia básica atrás do SBR é a observação de queexiste normalmente uma forte correlação entre as característicasde um faixa de alta freqüência de um sinal, que será denominadosinal de banda alta, e as características da faixa de freqüênciade banda baixa, ainda denominada de banda baixa ou de sinais debanda baixa do mesmo sinal. Portanto, pode ser obtida uma boaaproximação da representação do sinal original de entrada de bandaalta pela transposição da banda baixa para a banda alta.
Além da transposição, a reconstrução da bandaalta incorpora a conformação do envelope espectral, que compreendeum ajuste dos ganhos. Este processo é tipicamente controlado poruma transmissão do envelope espectral de banda alta do sinaloriginal de entrada. Outras informações de orientação podem aindaser enviadas pelos módulos de síntese do controle do codificador,como uma filtragem inversa, uma adição de ruído e seno para seadaptarem ao material de áudio quando somente a transposição possanão ser suficiente. Os parâmetros correspondentes compreendem osparâmetros "banda alta de ruídos" para a adição do ruído e oparâmetro "banda alta de tonalidades" para a adição de seno. Essasinformações de orientação são usualmente denominadas de dados SBR.
0 processo SBR pode ser combinado com qualquerforma convencional de onda ou codec por meio de um pré-processamento no lado do codificador e do pós-processamento nolado do decodificador. 0 SBR codifica a porção de alta freqüênciade um sinal de áudio com custo muito baixo, considerando que ocodec de áudio é usado para codificar a porção de menor freqüênciado sinal.
No lado do codificador, o sinal original deentrada é analisado, o envelope espectral de banda alta e suascaracterísticas com relação à banda baixa são codificados e osdados SBR resultantes são multiplexados com um fluxo de bits docodec para a banda baixa. No lado do decodificador, os dados SBRsão primeiro desmultiplexados. O processo de decodificação égeralmente organizado em etapas. Primeiro, o decodificador núcleogera a banda baixa e, segundo, o decodif icador SBR opera um pós-processador usando os dados SBR decodificados para orientar oprocesso de replicação de banda espectral. É então obtido em sinaltotal de saída de largura de banda.
Para obter a maior eficiência de codificaçãopossível, e para manter baixa a complexidade computacional, sãogeralmente implementados codecs SBR ampliados, como os denominadossistemas de índice dual. índice dual significa que o codec denúcleo de banda limitada está operando na metade do índice deamostragem de áudio externo. Em contraste, a parte SBR éprocessada na freqüência de amostragem total.
A Fig. 5 mostra um diagrama esquemático de blocosde um sistema SBR 500. 0 sistema SBR 500 compreende, por exemplo,um codificador AAC-LD (AAC-LD = Codec de Áudio Avançado de BaixoRetardo) 510 e um codificador SBR 520, ao qual os dados de áudio aserem processados são fornecidos em paralelo. 0 codificador SBR520 compreende um banco de filtros de análise 530, que é mostradona Fig. 5 como banco de filtros de análise QMF. 0 banco de filtrosde análise 530 é capaz de prover valores de áudio de sub-bandacorrespondentes às sub-bandas baseadas nos sinais de áudiofornecidos ao sistema SBR 500. Esses valores de áudio de sub-bandasão então enviados a um módulo de extração de parâmetros SBR 54 0,que gera os dados SBR como anteriormente mencionados, por exemplo,compreendendo o envelope espectral de banda alta, o parâmetro deruído de banda alta e o parâmetro de tonalidade de banda alta.Esses dados SBR são então enviados ao codificador AAC-LD 510.
O codificador AAC-LD 510 está mostrado na Fig. 5como um codificador de índice dual. Em outras palavras, ocodificador 510 opera na metade da freqüência de amostragemcomparada com a freqüência de amostragem dos dados de áudiofornecidos ao codificador 510. Para facilitar isto, o codificadorAAC-LD 510 compreende um estágio de sub-amostragem 550, que podeopcionalmente compreender um filtro passa-baixo para evitar asdistorções causadas, por exemplo, uma violação da Teoria Nyquist-Shannon. Os dados de áudio sub-amostrados como enviados peloestágio de sub-amostragem 550 são então fornecidos a umcodificador 560 (banco de filtros de análise) sob a forma de umbanco de filtros MDCT. Os sinais providos pelo codificador 560 sãoentão quantizados e codificados no estágio de quantização ecodificação 570. Mais ainda, os dados SBR fornecido pelo módulo deextração de parâmetros SBR 540 está também codificado para obterum fluxo de bits, que então será enviado pelo codificador ACC-LD510. O estágio de quantização e codificação 570 pode, por exemplo,quantizar os dados de acordo com as propriedades de audição doouvido humano.
O fluxo de bits é então enviado a umDecodificador AAC-LD 580, que é parte do lado do decodificadorpara o qual é transportado o fluxo de bits. O decodificador AAC-LDcompreende um estágio de decodificação e dequantização 590, queextrai os dados SBR do fluxo de bits e dos dados de áudiodequantizados ou requantizados no domínio da freqüênciarepresentando a banda baixa. Os dados de banda baixa são entãoenviados a um banco de filtros de síntese 600 (banco de filtrosMDCT inverso). O estágio MDCT inverso (MDCT"1) 600 converte ossinais providos ao estágio MDCT inverso do domínio da freqüênciano domínio do tempo para fornecer o sinal de tempo. Este sinal dedomínio do tempo é então fornecido ao decodificador SBR 610, quecompreende um banco de filtros de análise 620, que está mostradona Fig. 5 como um banco de filtros de análise QMF.
O banco de filtros de análise 620 faz uma análiseespectral do sinal de tempo fornecido ao banco de filtros deanálise 620 que representa a banda baixa. Esses dados são entãofornecidos a um gerador de alta freqüência 630, que também édenominado de gerador HF. Com base nos dados SBR fornecidos pelocodificador AAC-LD 580 e seu estágio de decodificação edequantização 590, o gerador HF 630 gera a banda alta com base nossinais de banda baixa providos pelo banco de filtros de análise620. Ambos, os sinais de banda baixa e de banda alta são entãofornecidos a um banco de filtros de síntese 640, que transfere ossinais de banda baixa e de banda alta do domínio da freqüênciapara o domínio do tempo para prover uma forma de sinal de saída deáudio no domínio do tempo para o sistema SBR 500.
Para haver totalidade, deve ser notado que emmuitos casos o sistema SBR 500 como mostrado' na Fig. 5 não éimplementado assim. Para ser mais exato, o codificador AAC-LD 510e o codificador SBR 520 são normalmente implementados no lado docodificador, que é normalmente implementado separadamente no ladodo decodificador compreendendo o decodificador AAC-LD 580 e odecodificador SBR 610. Em outras palavras, o sistema 500 mostradona Fig. 5 representa essencialmente a conexão de dois sistemas,isto é, de um codificador compreendendo os codificadoressupramencionados 510, 520 e um decodificador compreendendo osdecodificadores supramencionados 580, 610.
As configurações de acordo com a presenteinvenção sob a forma de bancos de filtros de análise 100 e bancosde filtros de síntese 300 podem, por exemplo, ser implementadas nosistema 500 mostrado na Fig. 5, como uma substituição do banco defiltros de análise 530, do banco de filtros de análise 620 e dobanco de filtros de síntese 640. Em outras palavras, bancos defiltros síntese ou de análise de componentes SBR do sistema 500podem, por exemplo, serem substituídos pelas correspondentesconfigurações de acordo com a presente invenção. Mais ainda, aMDCT 560 e a MDCT inversa 600 também podem ser substituídas porbancos de filtros de síntese e de análise de baixo retardo,respectivamente. Nesse caso, caso todas as substituições descritastiverem sido implementadas, o denominado codec AAC ampliado debaixo retardo (codec = codificador-decodificador) será completado.
O AAC ampliado de baixo retardo (AAC-ELD) visa acombinação de características de baixo retardo de um AAC-LD(Advanced Audio Codec - Low-delay [Codec de Áudio Avançado - BaixoRetardo] ) com uma alta eficiência de codificação de HE-AAC (HighEfficiency Advanced Audio Codec [Codec de Áudio Avançado de AltaEficiência]) utilizando SBR com AAC-LD. O decodificador SBR 610atua nesse cenário como pós-processador, que é fornecido após odecodificador núcleo 580 incluindo um completo banco de filtros deanálise e um banco de filtros de síntese 640. Portanto, oscomponentes do decodificador SBR 610 adiciona outro retardo dedecodificação, que está ilustrado na Fig. 5, pelo sombreamento doscomponentes 620, 630, 540.
Em muitas implementações de sistemas SBR 500, aparte de freqüência mais baixa ou faixas de bandas mais baixastipicamente de 0 kHz a tipicamente 5-15 kHz são codificadas usandoum codificador de forma de onda, denominado de codec núcleo. Ocodec núcleo pode, por exemplo, ser um da família codec de áudioMPEG. Além disso, a reconstrução da parte de alta freqüência ou debanda alta é obtida por uma transição da banda baixa. A combinaçãode SBR com um codificador núcleo é, em muitos casos, implementadacomo um sistema de índice dual, onde o codificador/decodificadorAAC subjacente é operado na metade da taxa de amostragem docodificador/decodificador SBR.
A maioria dos dados de controle é usada para arepresentação do envelope espectral, que tem resolução variada detempo e freqüência para poder controlar o processo SBR o melhorpossível com o mínimo overhead de taxa de bits possível. Os demaisdados de controle buscam principalmente controlar o índice tonai-para-ruído da banda alta.
Como mostrado na Fig. 5, a saída do decodificadorAAC subjacente 580 é tipicamente analisada com um banco de filtrosQMF de 32 canais 620. Então, o módulo gerador HF 630 recria abanda alta fazendo o patching de sub-bandas QMF a partir da bandabaixa existente para a banda alta. Além disso, a filtragem inversaé feita em base por sub-banda, com base nos dados de controleobtidos a partir do fluxo de bits (dados SBR). O ajustador deenvelope modifica o envelope espectral da banda alta regenerada eadiciona outros componentes como o ruído e senóides sãoadicionados de acordo com os dados de controle no fluxo de bits.Como todas as operações são feitas no domínio da freqüência(também conhecido como QMF ou domínio de sub-banda), a etapa finaldo decodificador 610 é uma síntese QMF 640 para reter o sinal dodomínio do tempo. Por exemplo, no caso em que a análise QMF nolado do codificador é feita em um sistema de sub-banda 32 QFM para1024 amostras no domínio do tempo, a reconstrução de altafreqüência resulta em 64-QMF sub-bandas em que a síntese é feitaproduzindo 2 048 amostras no domínio do tempo, de maneira a serobtida uma sobre-amostragem por um fator de 2.
Além disso, o retardo do codificador núcleo 510 édobrado pela operação em metade da taxa original de amostragem noíndice de modo dual, que dá surgimento a outras fontes de retardoem ambos, no processo do codificador e do decodificador de um AAC-LD em combinação com SBR. A seguir, essas fontes de retardo sãoexaminada e seus retardos associados são minimizados.
A Fig. 6 mostra um diagrama de blocossimplificado do sistema 500 mostrado na Fig. 5. A Fig. 6 concentraas fontes de retardo no processo codificador/decodificador usandoSBR e bancos de filtros de baixo retardo para codificação.Comparando a Fig. 6 com a Fig. 5, a MDCT 560 e a MDCT inversa 600foram substituídas pelos módulos otimizados de retardo, adenominada MDCT de baixo retardo 560' (LD MDCT) e a MDCT inversade baixo retardo 600' (LD IMDCT). Mais ainda, o gerador HF 630também foi substituído pelo módulo otimizado de retardo 630'.
À parte da MDCT de baixo retardo 560' e a MDCTinversa de baixo retardo 600', um framing SBR modificado e umgerador HF modificado 630' são empregados no sistema mostrado naFig. 6. Para evitar o retardo por framing diferente de umcodificador/decodificador núcleo 560, 600 e dos respectivosmódul os SBRf o framing SBR e adaptado para encaixar no comprimentode framing de 480 ou 512 amostras do AAC-LD. Além disso, a gradevariável de tempo do gerador HF 630, que implica em 384 amostrasde retardo, é restrita com referência à disseminação de dados SBRnos frames AC-LD adjacentes. Portanto, as únicas fontesremanescentes de retardo no módulo SBR são os bancos de filtros530, 620 e 640.
De acordo com a situação mostrada na Fig. 6, querepresenta uma implementação parcial do codec AAC-ELD, já foramimplementadas algumas otimizações de retardo, incluindo o uso deum banco de filtros de baixo retardo no núcleo AAC-LD e a remoçãode um sobrepasso SBR anteriormente mencionado. Para maioresaperfeiçoamentos de retardo, devem ser investigados os módulosremanescentes. A Fig. 6 mostra as fontes de retardo no processo docodificador/decodificador usando SBR e os bancos de filtros debaixo retardo denominados LD-MDCT e LD-IMDCT na presente.Comparada com a Fig. 5, na Fig. 6 cada caixa representa uma fontede retardo, onde os módulos otimizadores de retardo são desenhadosem sombreado. Até agora, os modelos similares não foram otimizadospara baixo retardo.
A Fig. 7a ilustra um fluxograma compreendendo umpseudo código C- ou C++ para ilustrar uma configuração de acordocom a presente invenção sob a forma de um banco de filtros deanálise ou um método correspondente para a geração de valores desub-banda de áudio em canais de sub-banda de áudio. Para aindamais preciso, a Fig. 7a representa um fluxograma de um banco defiltros de análise de valor complexo para 32 bandas.
Como ressaltado antes, o banco de filtros deanálise é usado para dividir o sinal no domínio do tempo, porexemplo, enviado do codificador núcleo em N = 32 sinais de sub-banda. A saída do banco de filtros e as amostras de sub-banda ouvalores de sub-banda de áudio têm, no caso de um banco de filtrosde análise de valor complexo valores complexos e portanto super-amostradas de um fator de 2, comparadas a um banco de filtros devalor real. A filtragem envolve e compreende as seguintes etapas,onde um conjunto x(n) compreende exatamente 320 amostras nodomínio do tempo. Quanto mais alto o índice das amostras η noconjunto, mais antigas são as amostras.
Depois de um início das configurações do métodona etapa SlOO, primeiro, as amostras no conjunto x(n) são mudadasde 32 posições na etapa SllO. As 32 amostras mais antigas sãodescartadas e 32 novas amostras são guardadas nas posições 31 a 0na etapa S120. Como mostradas na Fig. 7a, as amostras de áudio nodomínio do tempo de entrada são guardadas em posiçõescorrespondentes a um índice η decrescente na faixa de 31 a 0. Istoresulta em uma reversão de tempo das amostras guardadas no frameou vetor correspondente, de maneira que a reversão do índice dafunção janela, para obter uma função janela de análise com base na(igualmente longa) função de janela de síntese, já tenha sidofeita.
Durante a etapa S130, coeficientes de janelaci(j) são obtidos por uma interpolação linear dos coeficientesc(j) com base na equação (15). A interpolação se baseia em umtamanho de bloco (comprimento de bloco ou número de valores desub-banda) de N = 64 valores e se baseia em um frame compreendendoT = 10 blocos. Assim, o índice dos coeficientes de janela dafunção janela interpolada estão na faixa entre 0 e 319 de acordocom equação (15). Os coeficientes de janela c (n) são dados natabela no Anexo 1 da descrição. Entretanto, dependendo dosdetalhes de implementação, para obter os coeficientes de janelabaseados nos valores dados nas tabelas nos Anexos 1 e 3, outrasalterações de sinais com referência aos coeficientes de janelacorrespondentes aos índices 128 a 255 e 384 a 511 (multiplicaçãopor fator (-1)) devem ser consideradas.
Nesses casos, os coeficientes de janela w(n) ouc(n) a serem usados podem ser obtidos de acordo com
<formula>formula see original document page 58</formula>
com a função de mudança de sinal s (n) de acordo
com
<formula>formula see original document page 58</formula>
para η = 0 a 639, onde wtabie(n) são os valores
dados nas tabelas nos Anexos.
Entretanto, os coeficientes de janela não têmimplementação necessária de acordo com a tabela no Anexo 1 paraobter, por exemplo, a redução já descrita do retardo. Para obteresta redução de retardo, mantendo o nível de qualidade dos dadosprocessados de áudio, ou para obter outra decisão, os coeficientesde janela c (n) para o índice de coeficiente de janela η na faixaentre 0 e 639, podem obedecer um dos conjuntos de relações dadasem um dos Anexos 2 a 4. Mais ainda, deve ser notado que tambémoutros coeficientes de janela c(n) podem ser empregados emconfigurações de acordo com a presente invenção. Naturalmente,também outras funções janela compreendendo um diferente número decoeficientes de janela que 320 ou 640 podem ser implementadas,apesar de as tabelas nos Anexos 1 a 4 somente se aplicarem afunções janela tendo 640 coeficientes de janela.
Uma interpolação linear de acordo com S13 0 leva auma significativa melhora de qualidade e redução ou cancelamentode efeitos de aliasing no caso da função janela compreendendo umnúmero par de coeficientes de janela. Deve ainda ser notado que aunidade complexa não é j como nas equações (1), (2) e (16), masindicada por i =V- 1.
Na etapa S14 0, as amostras do conjunto x(n) têmentão seus elementos multiplicados pelos coeficientes ci(n) dajanela interpolada.
Na etapa S150, as amostras janeladas são somadasde acordo com a equação dada no fluxograma na Fig. 7a para criaremo conjunto de 64 elementos u(n). Na etapa S160, 32 novas amostrasde sub-banda ou valores de sub-banda de áudio W(k,l) sãocalculadas de acordo com a operação matriz Mu, onde os elementosda matriz M são dados por
<formula>formula see original document page 59</formula>
onde exp() indica a função exponencial complexae, como mencionado anteriormente, i é a unidade imaginária. Antesda finalização do Ioop de um fluxograma com etapa S170, cada umdos valores de sub-banda W(k,l) (= W[k][1]) podem ser enviados, oque corresponde à amostra de sub-banda 1 na sub-banda com o índicek. Em outras palavras, cada Ioop no fluxograma mostrado na Fig. 7aproduz 32 valores de sub-banda de valor complexo, cada qualrepresentando a saída de um banco de filtros de sub-banda.
A Fig. 7b ilustra a etapa S150 do colapso doframe 150 das amostras de áudio janeladas no domínio do tempocompreendendo 10 blocos 160-1, ..., 160-10 de amostras de áudiojaneladas no domínio do tempo ζ (η) para o vetor u (n) de 5 vezes,com a soma de blocos do frame 150 cada. 0 colapso ou a retração éfeita com base nos elementos, de maneira que as amostras de áudiojaneladas no domínio do tempo correspondentes ao mesmo índice deamostra dentro de cada um dos blocos 160-1, 160-3, 160-5, 160-7 e160-9 são somadas para obter o valor correspondente nos primeirosblocos 650-1 do vetor u(n) . Da mesma forma, com base nos blocos160-2, 160-4, 160-6, 160-8 e 160-10 os elementos correspondentesdo vetor u(n) no bloco 160-2 são gerados na etapa S150.
Uma outra configuração de acordo com a presenteinvenção sob a forma de um banco de filtros de análise pode serimplementada como um banco de filtros de baixo retardo complexo de64 bandas. O processamento deste banco de filtros complexo debaixo retardo como um banco de filtros de análise é basicamentesimilar ao banco de filtros de análise descrito no contexto daFig. 7a. Devido às similaridades e basicamente o mesmoprocessamento descrito no contexto da Fig. 7a, as diferenças entreo banco de filtros complexo de análise descrito para 32 bandas daFig. 7a e o banco de filtros complexo de análise para 64 sub-bandas serão aqui ressaltadas.
Em contraste com as 32 sub-bandas compreendendo obanco de filtros de análise mostrado na Fig. 7a, o vetor do frameχ (η) compreende, no caso de um banco de filtros de análise de 64bandas 640 elementos tendo índices de 0-639. Assim, a etapa SllO émodificada de maneira que as amostras no conjunto x(n) são mudadasem 64 posições, onde as 64 amostras mais antigas sejamdescartadas. Na etapa S120 em vez de 32 novas amostras, 64 novasamostras são guardadas nas posições 63 a 0. Como mostradas na Fig.7c, as amostras de áudio no domínio do tempo de entrada sãoguardadas em posições correspondentes a um índice decrescente η nafaixa de 63 a 0. Isso resulta em uma reversão de tempo dasamostras guardadas no frawe ou vetor correspondente, de maneiraque a reversão do índice da função janela para obter uma funçãojanela de análise baseada na (igualmente longa) função de janelade síntese já tenha sido feita.
Como a janela c(n) usada para o janelamento doselementos do vetor do frame x(n), compreende tipicamente 640elementos, a etapa S13 0 de interpolação linear dos coeficientes dejanela para a obtenção das janelas interpoladas ci(n) pode seromitida.
Então, durante a etapa S140, as amostras doconjunto x(n) são multiplicadas ou janeladas pelo uso da seqüênciade coeficientes de janela c (η) , que se baseiam mais uma vez nosvalores na tabela do Anexo 1. No caso em que os coeficientes dejanela c (n) são os da função de janela de síntese, é feito umjanelamento ou multiplicação do conjunto x(n) pela janela c(n), deacordo com a equação
<formula>formula see original document page 61</formula>
para an = 0, ..., 639. Mais uma vez, para obteras propriedades de baixo retardo da função janela, não é precisoimplementar a função janela exatamente de acordo com oscoeficientes de janela baseados nos valores dados na tabela doAnexo 1. Para muitas aplicações, uma implementação em que oscoeficientes de janela obedecem cada conjunto de relações dadasnas tabelas dos Anexos 2 a 4 será suficiente para obter umadecisão aceitável entre a qualidade e a redução significativa doretardo. Entretanto, dependendo dos detalhes de implementação,para obter os coeficientes de janela baseados nos valores dadosnas tabelas dos Anexos 1 e 3, outras alterações de sinal comreferência aos coeficientes de janela correspondentes aos índices128 a 255 e 384 a 511 (multiplicação por fator (-1)) devem serconsideradas de acordo com equações (16a) e (16b).
A etapa S150 do fluxograma mostrado na Fig. 7a éentão substituída pela soma das amostras do vetor do frame ζ(η) deacordo com a equação
<formula>formula see original document page 62</formula>
Para criar o conjunto de 128 elementos u(n).
A etapa S160 da Fig. 7a é então substituída poruma etapa em que 64 novas amostras de sub-banda são calculadas deacordo com a operação matriz Mu, onde os elementos de matriz damatriz M são dados por
<formula>formula see original document page 62</formula>
onde exp() indica a função exponencial complexa ei é, como explicado, a unidade imaginária.
A Fig. 7c ilustra um fluxograma de acordo com umaconfiguração da presente invenção sob a forma de banco de filtrosde análise de real valor para 32 canais de sub-banda. Aconfiguração ilustrada na Fig. 7c não difere de maneirasignificativa da configuração mostrada na Fig. 7a. A principaldiferença entre as duas configurações é que a etapa S160 docálculo dos novos 32 valores de áudio de sub-banda de valorcomplexo é substituída na configuração mostrada na Fig. 7c por umaetapa S162 em que as 32 amostras de áudio de sub-banda de valorreal são calculadas de acordo com a operação de matriz Mru, ondeos elementos da matriz Mr são dados por
<formula>formula see original document page 63</formula>
Como conseqüência, cada Ioop do fluxograma produz32 amostras de sub-banda de valor real onde W(k,l) corresponde àamostras de áudio de sub-banda 1 da sub-banda k.
O banco de filtros de análise de real valor pode,por exemplo, ser empregado na estrutura de um modo de baixapotência de um sistema SBR, conforme mostrado na Fig. 5. O modo debaixa potência da ferramenta SBR difere da ferramenta SBR de altaqualidade, principalmente com referência ao fato que sãoempregados bancos de filtros de valor real. Isto reduz acomplexidade computacional e o trabalho computacional por um fatorde 2, de maneira que o número de operações por unidade de tempo éreduzido essencialmente por um fator de 2, já que nenhuma parteimaginária deve ser calculada.
Os novos bancos de filtros propostos de acordocom a presente invenção são totalmente compatíveis com o modo debaixa potência dos sistemas SBR. Portanto, com bancos de filtrosde acordo com a presente invenção, os sistemas SBR podem aindaoperar tanto em modo normal como em modo de alta qualidade combancos de filtros complexos e no modo de baixa potência com bancosde filtros de valor real. O banco de filtros de valor real pode,por exemplo, ser obtido a partir do banco de filtros complexousando somente os valores reais (contribuições moduladas por co-seno) e omitindo os valores imaginários (contribuições moduladaspor seno).
A Fig. 8a mostra um fluxograma de acordo com umexemplo comparativo da presente invenção sob a forma de um bancode filtros de síntese de valor complexo para 64 canais de sub-banda. Como ressaltado anteriormente, a filtragem de síntese dossinais de sub-banda processados por SBR é feita usando um banco defiltros de síntese com 64 sub-bandas. A saída do banco de filtrosé um bloco de amostras no domínio do tempo de valor real comoressaltado no contexto da Fig. 1. O processo é ilustrado pelofluxograma na Fig. 8a, que também ilustra um exemplo comparativosob a forma de um método para a geração de amostras de áudio nodomínio do tempo.
A filtragem de síntese compreende após o início(etapa S200) , as seguintes etapas, onde um conjunto ν compreende1280 amostras. Na etapa S210, as amostras no conjunto ν sãoalteradas em 128 posições, onde as 128 amostras mais antigas sãodescartadas. Na etapa S22 0, os 64 novos valores de sub-banda deáudio de valor complexo são multiplicados por uma matriz N, ondeos elementos de matriz N(k,n) são dados por
<formula>formula see original document page 64</formula>
onde exp() indica a função exponencial complexa ei é a unidade imaginária. A parte real da saída dessa operação éguardada na posição 0-127 do conjunto v, como ilustrado na Fig. 8a.
Na etapa S230, as amostras, que estão agora nodomínio do tempo são extraídas do conjunto ν de acordo com aequação dada na Fig. 8a para criar um conjunto de 64 0 elementosg(n). Na etapa S240, as amostras de valor real no domínio do tempodo conjunto g são multiplicadas pelo coeficiente de janela c (n)para produzirem um conjunto w, onde os coeficientes de janela sãonovamente os coeficientes de janela baseados nos valores dados natabela do Anexo 1.
Entretanto, como ressaltado antes, oscoeficientes de janela não precisam se basear exatamente nosvalores dados na tabela do Anexo 1. E suficiente, em diferentesexemplos comparativos, se os coeficientes de janela satisfizeremum dos conjuntos de relações dadas nas tabelas dos Anexos 2 a 4,para obter a desejada propriedade de baixo retardo do banco defiltros de síntese. Mais ainda, como explicado no contexto dobanco de filtros de análise, também outros coeficientes de janelapodem ser utilizados na estrutura do banco de filtros de síntese.
Entretanto, dependendo dos detalhes de implementação, para obteros coeficientes de janela baseados nos valores guardados nastabelas dos Anexos 1 e 3, outras alterações de sinais comreferência aos coeficientes de janela correspondentes aos índices128 a 255 e 384 a 511 (multiplicação por fator (-1)) devem serconsideradas.
Na etapa S250, 64 novas amostras de saída sãocalculadas pela soma das amostras do conjunto w(n) de acordo com aúltima etapa e a fórmula dada no fluxograma da Fig. 8a, antes queum Ioop de um fluxograma acabe na etapa S260. No fluxograma comomostrado na Fig. 8a, X[k][l] (= X(k,l)) corresponde ao valor desub-banda de áudio 1 na sub-banda tendo o índice k. Todos os novosloops mostrados na Fig. 8a produzem 64 amostras de áudio de valorreal no domínio do tempo como saída.
A implementação como mostrada na Fig. 8a de umbanco de filtros de análise de valor complexo para 64 bandas nãoexige um buffer de sobrepasso/adição compreendendo várias posiçõesde armazenagem como explicado no contexto da configuração mostradana Fig. 2b. Aqui, o buffer de sobrepasso/adição está "escondido"nos vetores ν e g, que é calculado com base nos valores guardadosno vetor ν. O buffer de sobrepasso/adição é implementado naestrutura desses vetores com esses índices sendo maiores que 128,de maneira que os valores correspondam aos valores dos blocosanteriores ou passados.
A Fig. 8b ilustra um fluxograma de um banco defiltros de síntese de valor real para 64 canais de sub-banda deáudio de valor real. 0 banco de filtros de síntese de valor realde acordo com Fig. 8b também pode ser implementado no caso de umaimplementação SBR de baixa potência como um correspondente bancode filtros SBR.
0 fluxograma da Fig. 8b difere do fluxograma daFig. 8a, principalmente com referência à etapa S222, que substituiS220 da Fig. 8a. Na etapa S222, os 64 novos valores de sub-bandade áudio de valor real são multiplicados por uma matriz Nr, ondeos elementos da matriz Nr(k,n) são dados por<formula>formula see original document page 67</formula>
onde a saída dessa operação é novamente guardadanas posições 0-127 do conjunto v.
Além dessas modificações, o fluxograma comomostrado na Fig. 8b no caso de um banco de filtros de síntese devalor real para o modo SBR de baixa potência, não difere dofluxograma mostrado na Fig. 8a do banco de filtros de síntese devalor complexo para o modo SBR de alta qualidade.
A Fig. 8c ilustra um fluxograma de acordo com umaconfiguração da presente invenção sob a forma de um banco defiltros de síntese de valor complexo sub-amostrado e o adequadométodo que pode, por exemplo, ser implementado em umaimplementação SBR de alta qualidade. Para ser mais exato, o bancode filtros de síntese descrito na Fig. 8c se refere a um banco defiltros de síntese de valor complexo capaz de processar valores desub-banda de áudio de valor complexo para 32 canais de sub-banda.
A filtragem de síntese sub-amostrada dos sinaisde sub-banda do processo SBR é feita usando um banco de filtros desíntese de 32 canais como ilustrado na Fig. 8c. A saída do bancode filtros é um bloco de amostras no domínio do tempo de valorreal. O processo é dado no fluxograma da Fig. 8c. A filtragem desíntese compreende depois do início (etapa S3 00), as seguintesetapas, onde o conjunto ν compreende 64 0 amostras no domínio dotempo de valor real.
Na etapa S310, as amostras no conjunto ν sãomudadas em 64 posições, onde as 64 amostras mais antigas sãodescartadas. Depois, na etapa S32 0, as novas 32 amostras de sub-banda de valor complexo ou valores de sub-banda de áudio de valorcomplexo são multiplicadas por uma matriz N, os elementos dosquais são dados por
<formula>formula see original document page 68</formula>
onde exp()indica a função exponencial complexa ei é novamente dessa operação é então guardada nas posições 0-63 doconjunto v.
Na etapa S330, as amostras são extraídas do vetorν de acordo com a equação dada no fluxograma da Fig. 8c para criarum conjunto de 320 elementos g. Na etapa S340, os coeficientes dejanela ci(n) de uma função janela interpolada são obtidos por umainterpolação linear dos coeficientes c(n) de acordo com equação(15), onde o índice η está novamente da faixa entre 0 e 319 (N=64,T=10 para a equação (15)). Como ilustrado antes, os coeficientesda função janela c(n) se baseiam nos valores dados na tabela doAnexo 1. Mais ainda, para obter a propriedade de baixo retardocomo obtido anteriormente, os coeficientes de janela c (n) nãoprecisam ser exatamente os dados fornecidos na tabela do Anexo 1.
É suficiente que os coeficientes de janela c(n) obedeçam pelomenos um conjunto de relações dadas nos Anexos 2 a 4. Entretanto,dependendo dos detalhes de implementação, para obter oscoeficientes de janela baseados nos valores dados nas tabelas nosAnexos 1 e 3, outras alterações de sinais com referência aoscoeficientes de janela correspondentes aos índices 128 a 255 e 384a 511 (multiplicação por fator (-1)) devem ser consideradas deacordo com equações (16a) e (16b). Mais ainda, também diferentesfunções janela compreendendo diferentes coeficientes de janelac (η) podem ser naturalmente empregados em configurações dapresente invenção.
Na etapa S350, as amostras do conjunto g sãomultiplicadas pelo coeficiente de janela interpolado ci(n) dafunção janela interpolada para obter a amostra janelada no domíniodo tempo w(n).
Depois, na etapa S360, 32 novas amostras de saídasão calculadas por uma soma de amostras do conjunto w(n) de acordocom a última etapa S360, antes da etapa final S370 no fluxogramada Fig. 8c.
Como indicado anteriormente, no fluxograma daFig. 8c, X([k][1]) (= x(k,l)) corresponde a um valor de sub-bandade áudio 1 no canal de sub-banda de áudio k. Mais ainda, todos osnovos loops de um fluxograma como indicados na Fig. 8c produz 32amostras no domínio do tempo de valor real como saída.
A Fig. 8d mostra um fluxograma de umaconfiguração de acordo com a presente invenção sob a forma de umbanco de filtros de síntese de valor real sub-amostrado que pode,por exemplo, ser empregado no caso de um banco de filtros SBR debaixa potência. A configuração e o fluxograma mostrados na Fig. 8ddiferem do fluxograma mostrado na Fig. 8c do banco de filtros desíntese de valor complexo sub-amostrado somente com referência àetapa S32 0, que é substituída no fluxograma mostrado na Fig. 8dpela etapa S322.
Na etapa S322, os 32 novos valores de sub-bandade áudio de valor real, ou amostras de sub-banda são multiplicadospela matriz Nr, onde os elementos da matriz Nr são dados por<formula>formula see original document page 70</formula>
onde a saída dessa operação é guardada na posiçãode 0 a 64 do conjunto v.
A Fig. 9a mostra uma implementação de um exemplocomparativo sob a forma de um método correspondente a um banco defiltros de análise de valor complexo para 64 sub-bandas. A Fig. 9amostra uma implementação como uma implementação MATLAB, que provecomo saída um vetor y e um vetor "state". A função definida nessainscrição mostrada na Fig. 9a é chamada LDFB80 para a qual umvetor χ compreendendo novas amostras de áudio e o vetor "state" éprovido como saída. 0 nome da função LDFB80 é uma abreviação debanco de filtros de baixo retardo para 8 blocos prolongando-se nopassado e 0 blocos no futuro.
Na linguagem de programação MATLAB, o sinalporcentual (%) indica observações, que não são realizadas, mas quesomente servem como propósito para comentar e ilustrar o códigofonte. Na descrição a seguir, diferentes segmentos do código fonteserão explicados com referência às suas funções.
Em uma seqüência de código S400, o buffer que érepresentado pelo vetor "state" é atualizado de maneira que oconteúdo do vetor "state" tendo os índices 577 a 640 sejamsubstituídos pelo conteúdo do vetor χ compreendendo as novasamostras de entrada de áudio no domínio do tempo. Em uma seqüênciade código S410, os coeficientes de janela da função janela deanálise como armazenados na variável LDFB80_win são transferidospara o vetor win_ana.
Na etapa S42 0, que supõe que as últimas amostrasestão alinhadas no lado direito do buffer, é feito o realjanelamento. No bloco S420, o conteúdo do vetor "state" émultiplicado em elementos(.*) pelos elementos do vetor win_anacompreendendo a função janela de análise. 0 produto dessamultiplicação é então guardado no vetor x_win_orig.
Na etapa S430, o conteúdo do vetor x_win_orig éreconformado para formar uma matriz com dimensão de 128 · 5elementos chamados x_stack. Na etapa S44 0, a alteração de sinal dapilha x_stack é feita com referência à segunda e quarta colunas damatriz x_stack.
Na etapa S450, a pilha x_stack colapsa ou éretraída pela soma dos elementos de x_stack com referência aosegundo índice e simultaneamente invertendo a ordem dos elementose transpondo o resultado antes de novamente armazenar o resultadonos vários x_stack.
No segmento de código S460, a transformação dodomínio do tempo no domínio da freqüência é feita pela computaçãode uma transformação complexa Rápida de Fourier (FFT) do conteúdomultiplicado por elementos da pilha x_stack multiplicado pelafunção exponencial complexa para a qual é fornecido o argumento (-i · π · n/128) , pelos índices e na faixa de 0 a -127 e a unidadeimaginária i.
No segmento de código S470, é realizado um pós-giro definindo a variável m = (64 + 1) /2 e calculando o blococompreendendo os valores de sub-banda de áudio como um vetor y deacordo com a equação
<formula>formula see original document page 71</formula>
O índice k cobre a faixa de inteiros de 1-64 naimplementação mostrada na Fig. 9a. 0 vetor y é então produzidocomo o vetor ou bloco compreendendo os valores de sub-banda deáudio 180 da Fig. 1. A barra acima da segunda equação de fatoração(26), assim como o segmento de codificação conj() da função S417na Fig. 9a se referem ao conjugado complexo do argumento dorespectivo número complexo.
Em um código-segmento final S480, o vetor "state"é mudado em 64 elementos. O vetor "state" em sua forma alteradapode então ser fornecido à função LDFB80 como entrada novamente emoutro loop da função.
A Fig. 9b mostra uma implementação MATLAB deacordo com uma configuração da presente invenção sob a forma de ummétodo correspondente a um banco de filtros de análise de valorcomplexo para 32 sub-bandas. Da mesma forma, a função definida édenominada de LDFB80_32, indicando que a implementação representaum banco de filtros de baixo retardo para 32 sub-bandas baseado emoutro sobrepasso de 8 blocos no passado e 0 blocos no futuro.
A implementação da Fig. 9b difere daimplementação mostrada na Fig. 9a, somente com referência a poucasseqüências de códigos, como será ressaltado na descrição a seguir.
A seqüência de códigos S400, S430, S460, S470 e S480 é substituídapor uma seqüência correspondente de códigos S400', S430', S460',S470' e S480' levando em conta principalmente o fato que o númerode sub-bandas, ou o número de saídas de valores de sub-banda pelafunção LDFB80_32, é reduzido em um fator de 2. Da mesma forma, aetapa S400' se refere ao vetor "state" sendo atualizado comreferência às 32 últimas entradas correspondentes aos índices 289a 320 com as correspondentes 32 amostras de entrada de áudio nodomínio do tempo do novo bloco 220 conforme mostrado na Fig. 1.
Entretanto, a principal diferença entre asimplementações como mostradas na Figs. 9a e 9b aparece em umaseqüência de código S410 da Fig. 9a, que é substituída por umaseqüência de código S412 na implementação mostrada na Fig. 9b. Aseqüência de código para S412 na Fig. 9b compreende primeiro umacópia dos 64 0 coeficientes de janela compreendendo janelasarmazenadas no vetor LDFB80_win no vetor local win_ana. Então,ocorre uma interpolação de acordo com equação (15) , em que doiscoeficientes consecutivos de janela representados pelo vetorelementos do vetor win_ana são somados e divididos por 2 e entãoguardados de volta no vetor win_ana.
A próxima seqüência de código S420 é idêntica àseqüência de código S420 mostrada na Fig. 9a, que realiza a realmultiplicação em elementos (.*) de um janelamento dos valores, ouelementos, do vetor "state" pelos elementos do vetor win_anacompreendendo os coeficientes de janela interpolados da funçãojanela interpolada. O produto dessa operação é guardado no vetorx_win_orig. Entretanto, a diferença entre a seqüência de códigoS42 0 da Fig. 9b e a correspondente seqüência de código S42 0 daFig. 9a, é que no caso da Fig. 9b, não 640, mas somente 320multiplicações são feitas na estrutura do janelamento.
Na seqüência de código S430' na substituição daseqüência de código S430, a pilha x_stack é preparada porreconformação do vetor x_win_orig. Entretanto, como o vetorX win_orig somente compreende 320 elementos, comparado aocorrespondente vetor da Fig. 9a compreendendo 640 elementos, amatriz χ stack é uma matriz de somente 64 · 5 elementos.A seqüência de códigos S440 da troca de sinais ea seqüência de código S450 do colapso da pilha são idênticas emambas as implementações de acordo com as Figs. 9a e 9b, nãoconsiderando o número reduzido de elementos (320 comparados ao 640).
Em uma seqüência de código S460' é feita asubstituição em uma seqüência de código S460 de uma TransformadaRápida de Fourier (FFT) complexa ímpar dos dados de janela, que ébastante similar à transformada da seqüência de código S460 daFig. 9a. Entretanto, novamente, devido ao reduzido número de saídade valores de sub-banda de áudio, o vetor temp é fornecido com oresultado de uma Transformada Rápida de Fourier, a multiplicaçãoem elementos pelos elementos da pilha x_stack e a funçãoexponencial complexa do argumento (-i · π · n/64), onde o índice ηestá na faixa entre 0 e 63.
Depois, na seqüência de código modificada S470',o pós-giro é feito definindo a variável m =(32+1)/2 e gerando ovetor de saída y de acordo com equação (26) , onde o índice ksomente cobre a faixa de 1 a 32 e onde o número 12 8 que aparece noargumento da função exponencial complexa é substituído pelo número 64.
Na código-seqüência final S480', o estado doJbuffer é alterado em 32 elementos no caso da implementaçãomostrada na Fig. 9b, onde na seqüência de código correspondenteS480, o buffer é alterado em 64 elementos.
A Fig. IOa mostra uma inscrição MATLAB ilustrandouma implementação de acordo com um exemplo comparativo sob a formade um método correspondente a um banco de filtros de síntese devalor complexo para 64 sub-bandas. A inscrição mostrada na Fig.IOa define a função ILDFB8 0 à qual o vetor χ que representa obloco 320 de valores de sub-banda de áudio da Fig. 2a e o vetor deestado "state" são providos como parâmetros de entrada. O nomeILDFB80 indica que a função definida é um banco de filtros debaixo retardo inverso correspondente a 8 blocos de dados de áudiodo passado e 0 blocos do futuro. A função provê um vetor y e umvetor de estado "state" novo ou redefinido como saída, onde ovetor y corresponde ao bloco 410 de amostras de áudio no domíniodo tempo da Fig. 2a.
Em uma seqüência de código S500, é feito um pré-giro, em que são definidos uma variável m =(64 + l)/2, assim comoum vetor temp. Os elementos temp(n) do vetor temp são definidos deacordo com equação
<formula>formula see original document page 75</formula>
onde a barra acima do elemento do vetor x(n) e dafunção conjO representa o conjugado complexo, exp () representa afunção exponencial complexa, i representa a unidade imaginária e ηé um índice na faixa de 1 - a 64.
Em uma seqüência de código S510, o vetor temp égasto na matriz compreendida na primeira coluna dos elementos dovetor temp e na segunda coluna, o conjugado complexo do vetor tempreverso com referência à ordem dos elementos definidos pelo índicedo vetor. Assim, em uma seqüência de código S510 é estabelecidauma simetria ímpar da matriz temp com base no vetor temp.
Em uma seqüência de código S52 0, é feita umaTransformada Rápida de Fourier (FFT) ímpar com base na matriztemp. Nessa seqüência de código, tendo a parte real damultiplicação em elementos do resultado da Transformada de Fourierinversa da matriz temp pela função exponencial tendo o argumentode (i · π/12 8) e enviada a um vetor y_knl, onde o índice η está nafaixa de O a 127.
Em uma seqüência de código S53 0, é feita uma
extensão dos dados e uma mudança de sinal alternativa. Para tanto,a ordem dos elementos do vetor y_knl é revertida e ao mesmo tempoé feita uma mudança de sinal. Depois, a matriz tmp é definida,compreendendo a primeira, a terceira e a quinta colunas do vetory_knl, onde a segunda e a quarta coluna compreendem um vetor y_knlde sinal trocado.
Em uma seqüência de código S540, os coeficientesde janela guardados no vetor LDFB80_win são primeiro copiados parao vetor win_ana. Depois, os coeficientes de janela de síntese sãodeterminados com base nos coeficientes de janela de análise eguardados no vetor win_ana gerando uma versão de tempo reverso dafunção janela de análise de acordo com
<formula>formula see original document page 76</formula>
onde N · T é o número total de coeficientes dejanela e η é o índice dos coeficientes de janela.
Em uma seqüência de código S550, a janela desíntese é aplicada ao vetor tmp por uma multiplicação em elementosdo vetor pela função de janela de síntese. Em uma seqüência decódigo S560, o buffer ê atualizado estabelecendo os elementos dovetor "state" nos índices 577 a 640 a 0 e somando o conteúdo dovetor tmp janelado com o vetor de estado "state".
Em uma seqüência de código S570, o vetor de saíday que compreende as amostras de áudio no domínio do tempo éextraído do vetor "state" por meio da extração de elementos dovetor "state", extraindo os elementos do vetor "state" com osíndices 1 a 64.
Em uma seqüência de código S580, a seqüência decódigo final da função mostrada na Fig. 10a, o vetor de estado"state" é alterado em 64 elementos, de maneira que os elementoscom índices de 65 a 640 sejam copiados a partir dos primeiros 576elementos do vetor "state".
A Fig. IOb mostra uma inscrição MATLAB de umaimplementação de acordo com uma configuração da presente invençãosob a forma de um banco de filtros de síntese de valor complexopara 32 valores de sub-banda. 0 nome da função definida pelainscrição mostrada na Fig. IOb ilustra isto como uma funçãodefinida denominada ILDFB80_32 indicando que a função definida éum banco de filtros inverso de baixo retardo para 32 bandas com 8blocos sobrepasso do passado e 0 blocos sobrepasso do futuro.
Como discutido com referência à comparação daimplementação mostrada nas Figs. 9a e 9b, a implementação deacordo com a inscrição da Fig. 10b também está intimamenterelacionada com a implementação do banco de filtros de síntese com64 sub-bandas de acordo com Fig. 10a. Como conseqüência, os mesmosvetores são fornecidos para a função e são enviados pela funçãoque, entretanto, compreende somente a metade do número deelementos comparada com a implementação da Fig. 10a. Aimplementação de um banco de filtros de síntese de 32 bandas para32 bandas difere da versão de 64 sub-bandas ilustrada na Fig. 10a,principalmente com referência a dois aspectos. A seqüência decódigos S500, S510, S520, S53S, S560, S570 e S580 é substituídapela seqüência de códigos em que o número de elementos a serconsiderado e ainda o número de parâmetros relativos aos elementossão divididos por 2. Mais ainda, a seqüência de código S540 dageração de uma função de janela de síntese é substituída por umaseqüência de código S542, em que a função de janela de síntese égerada como uma função de janela de síntese interpoladalinearmente de acordo com equação (15).
Em uma seqüência de código S50 0' que substituiuma seqüência de código S500, a variável m é definida como igual am = (32+1)/2 e o vetor temp é definido de acordo com equação (27),onde o índice η somente cobre a faixa de 1 a 32 e onde o fator de1/128 é substituído pelo fator 1/64 no argumento da funçãoexponencial.
Da mesma forma, em uma seqüência de código S510'que substitui uma seqüência de código S510, a faixa de índicessomente cobre os índices dos 32 elementos compreendendo o vetortemp. Em outras palavras, o índice somente cobre os valores de 1 a32. Da mesma forma, em uma seqüência de código S520' que substituiuma seqüência de código S520, o argumento da função exponencial ésubstituído por (i ■ π · n/64), onde o índice η está na faixa de 0a 63. Na estrutura de uma seqüência de código S530', a faixa doíndice é também reduzida de um fator de 2 quando comparado a umaseqüência de código S530.
A seqüência de código S542 que substitui umaseqüência de código S540 da Fig. IOa também copia uma funçãojanela como a armazenada no vetor LDFB80_win para vetor win_ana egera uma versão reversa no tempo win_syn de acordo com a equação(28). Entretanto, a seqüência de código S542 da implementaçãomostrada na Fig. 10b ainda compreende uma etapa de interpolação deacordo com equação (15) , em que para cada elemento do vetorredefinido win_syn compreendendo os coeficientes de janela dafunção de janela de síntese, uma interpolação linear de doiscoeficientes consecutivos de janela da função de janela de sínteseoriginal.
A seqüência de código S550 para a aplicação dajanela ao vetor tmp e substituir os elementos tmp por sua versãojanelada é idêntica em termos de código a uma comparação direta darespectiva seqüência de códigos nas Figs. IOa e 10b. Entretanto,devido ao menor tamanho do vetor tmp na implementação da Fig. 10b,durante uma implementação, somente é feita a metade do número demultiplicações.
Também na estrutura de uma seqüência de códigosS560', S570' e S580' substituindo a seqüência de códigos S560,S570 e S580, respectivamente, os índices 640 e 64 são substituídospor 320 e 32, respectivamente. Portanto, essas três seqüênciasfinais de códigos somente diferem da seqüência de códigos daimplementação mostrada na Fig. 10a com referência ao tamanho dovetor "states" tmp e y.
Como as configurações até agora ilustraram, ojanelador de análise assim como o janelador de síntese sãoadaptados para o janelamento das respectivas amostras no domíniodo tempo compreendidas nos respectivos frames multiplicando estesna base de elementos pelos coeficientes de janela da funçãojanela.
Antes de descrever a função janela, que pode serempregada, por exemplo, como uma função de janela de síntese ecomo uma função janela de análise em sua versão reversa no tempomais intimamente, serão ressaltadas as vantagens das configuraçõesde acordo com a presente invenção em maiores detalhes,especialmente em vista de uma implementação na estrutura de umaferramenta SBR ou sistema como mostrado nas Figs. 5 e 6.
Entre as vantagens, as configurações de acordocom a presente invenção e sistemas compreendendo mais de umaconfiguração de acordo com a presente invenção podem oferecer umasignificativa redução do retardo de acordo com outros bancos defiltros. Entretanto, essa propriedade de baixo retardo será vistano contexto das Figs. 13 e 14 em maiores detalhes. Um importanteaspecto deste contexto é notar que o comprimento da função janela,em outras palavras, o número de coeficientes de janela a seraplicado em um frame ou a bloco de amostras no domínio do tempo éindependente do retardo.
As configurações de acordo com a presenteinvenção oferecem outra vantagem de melhorar a qualidade dos dadosde áudio (reconstruídos). A interpolação empregada emconfigurações de acordo com a presente invenção oferece umaliasing significativamente reduzido comparado com outros esquemasde redução referentes ao número de coeficientes de janela.
Mais ainda, como será ressaltado no contexto dasFigs. 17 e 18 mais detalhadamente, em termos de psicoacústica, asconfigurações de acordo com a presente invenção geralmente usam aspropriedades de mascaramento temporal do ouvido humano melhor quemuitos outros bancos de filtros. Mais ainda, como será melhorressaltado no contexto das Figs. 15, 16 e 19, as configurações deacordo com a presente invenção oferecem uma excelente resposta defreqüência.
Também, em muitos bancos de filtros de acordo comuma configuração da presente invenção, é obtenível uma perfeitareconstrução se o banco de filtros de análise e o banco de filtrosde síntese estiverem interconectados. Em outras palavras, asconfigurações de acordo com a presente invenção não somenteoferecem uma saída indistintamente audível comparada com a entradade um conjunto interconectado de um banco de filtros de análise eum banco de filtros de síntese, como (não considerando erros dequantização, os efeitos de arredondamento computacionais e outrosefeitos provocados pela necessária discretização), uma saídaidêntica comparada â entrada.
Pode ser facilmente feita uma integração nomódulo SBR de bancos de filtros de acordo com a presente invenção.Apesar de tipicamente os módulos SBR operarem em modo de índiceduplo, os bancos de filtros de baixo retardo de valor complexo deacordo com as configurações da presente invenção são capazes deprover uma perfeita reconstrução no modo índice simples, enquantoos bancos de filtros SBR QMF originais são capazes de proversomente uma reconstrução quase perfeita. No modo de índice duplo,a versão de 32 bandas da resposta de impulso é obtida pelainterpolação linear também denominada de sub-amostragem de doistaps adjacentes ou coeficientes de janela da resposta de impulsode 64 bandas ou função janela como explicado no contexto da Fig. 3.
No caso de uma implementação de valor complexo deum banco de filtros, pode ser obtido um retardo de análise (ou desíntese) significativamente reduzido para os bancos de filtroscriticamente amostrados, em que a amostragem ou o processamento dafreqüência corresponde à freqüência limite de acordo com a teoriade Nyquist-Shannon. No caso de uma implementação de valor real deum banco de filtros, pode ser obtida uma eficiente implementaçãoempregando algoritmos otimizados como, por exemplo, ilustrados nocontexto da implementação MATLAB mostrada nas Figs. 9 e 10. Essasimplementações podem, por exemplo, ser empregadas no modo de baixapotência da ferramenta SBR como descrita no contexto das Figs. 5 e 6.
Como ressaltado no contexto das Figs. 5 e 6, épossível obter uma maior redução referente ao retardo no caso deum sistema SBR usando um banco de filtros de baixo retardo devalor complexo de acordo com uma configuração da presenteinvenção. Como ressaltado antes, no decodificador SBR 610 comomostrado na Fig. 5, o banco de filtros de análise QMF 620 ésubstituído por um banco de filtros complexo de baixo retardo(CLDFB) de acordo com uma configuração da presente invenção. Estasubstituição pode ser feita por computador, mantendo o número debandas (64), o comprimento da resposta de impulso (640) e usandouma modulação complexa. 0 retardo obtido por essa ferramenta éassim minimizado para a obtenção de um retardo totalsuficientemente baixo para uma comunicação bidirecional semsacrificar um nível obtenível de qualidade.
Comparada, por exemplo, a um sistemacompreendendo uma MDCT e uma MDST para formar um sistema do tipoMDCT de valor complexo, uma configuração de acordo com a presenteinvenção proporciona uma resposta de freqüência muito melhor.Comparado ao banco de filtros QMF, por exemplo, usado hoje noMPEG-4 SBR, um sistema compreendendo um ou mais bancos de filtrosde acordo com as configurações da presente invenção prove umretardo significativamente menor.
Mesmo comparadas a um banco de filtros QMF debaixo retardo, as configurações de acordo com a presente invençãooferecem a vantagem de uma perfeita reconstrução combinada a ummenor retardo. As vantagens que surgem da propriedade da perfeitareconstrução em contraste com a reconstrução quase perfeita dobanco de filtros QMF são as seguintes. Para a reconstrução quaseperfeita, é necessária uma alta atenuação de banda de corte paraatenuar o aliasing em nível suficientemente baixo. Isso restringea possibilidade de se obter um retardo muito baixo no projeto dofiltro. Em contraste, o emprego de uma configuração de acordo coma presente invenção agora tem a possibilidade de projetar de modoindependente o filtro, de maneira que não seja necessária nenhumaatenuação de banda de corte alta para atenuar o aliasing em níveissuficientemente baixos. A atenuação da banda de corte deve sersuficientemente baixa para permitir um reduzido aliasingsuficiente para a desejada aplicação de processamento de sinal.Portanto, pode ser alcançada uma melhor decisão de menor retardono projeto do filtro.
A Fig. 11 mostra uma comparação da função janela700 como pode, por exemplo, ser empregada em uma configuração deacordo com a presente invenção, juntamente com função janela seno710. A função janela 700, que também é denominada de janela CMLDFB"síntese" (CMLDFB = banco de filtros de baixo retardo moduladocomplexo), compreende 640 coeficientes de janela baseados nosvalores dados na tabela do Anexo 1. Com referência à magnitude dasfunções janela, deve ser notado que não são considerados a seguiros fatores de amplificação geral ou fatores de amortecimento parao ajuste de amplitude do sinal janelado. As funções janela podem,por exemplo, ser normalizadas com referência a um valorcorrespondente ao centro de retardo, como ressaltado no contextoda Fig. 13, ou com referência a um valor n = N, n = N- loun = N+ 1, onde N é o comprimento do bloco e η é o índice doscoeficientes de janela. Em comparação, a função janela seno 710 ésomente definida em 12 8 amostras sendo, por exemplo, empregada nocaso de um módulo MDCT ou MDST.
Entretanto, dependendo dos detalhes deimplementação, para obter os coeficientes de janela baseados nosvalores dados nas tabelas dos Anexos 1 e 3, outras alterações desinais com referência aos coeficientes de janela correspondentesaos índices 128 a 255 e 384 a 511 (multiplicação por fator (-1))devem ser consideradas de acordo com equações (16a) e (16b).
Antes de discutir as diferenças das duas funçõesjanela 700, 710, deve ser notado que ambas as funções janelacompreendem somente coeficientes de janela de valor real. Maisainda, em ambos os casos, o valor absoluto do coeficiente dejanela correspondente a um índice η = 0 é menor que 0,1. No casode uma janela CMLDFB 700, o valor respectivo é ainda menor que0, 02.
Considerando as duas funções janela 700, 710 comreferência a seus conjuntos de definição, são evidentes váriasdiferenças significativas. Considerando que a função janela seno710 é simétrica, a função janela 700 mostra um comportamentoassimétrico. Para definir mais claramente o fato, a função janelaseno é simétrica quando existe um valor de valor real n0 comreferênc ia a todos os números η reais, de maneira que uma funçãojanela 710 seja definida para (n0+n) e (n0-n), e a relação
<formula>formula see original document page 85</formula>
seja verdadeira em uma margem desejada (ε > 0; ovalor absoluto da diferença dos termos nos dois lados da equação(29) seja menor ou igual a ε) , onde w(n) representa o coeficientede janela correspondente ao índice n. No caso da janela seno, oíndice respectivo n0 está exatamente na metade dos dois maiorescoeficientes de janela. Em outras palavras, para a janela seno710, o índice é n0 = 63,5. A função janela seno é definida para osíndices η = 0, ..., 127.
Em contraste, a função janela 700 é definida noconjunto dos índices η = 0, ..., 639. A função janela 700 éclaramente assimétrica no sentido que para todos os números n0 devalores reais pelo menos um número real sempre exista, para que(n0+n) e (n0-n) pertençam ao conjunto de definição da funçãojanela, para a qual a desigualdade
<formula>formula see original document page 85</formula>
Tenha uma (quase deliberadamente) margem dedefinição (ε > 0; o valor absoluto da diferença nos termos dosdois lados da equação (29) é maior ou igual a ε) , onde mais umavez w(n) é o coeficiente de janela correspondente ao índice n.
Outras diferenças entre as duas funções janela,que se relacionam com os tamanhos dos blocos de N = 64 amostras, éque o valor máximo da função janela 700 é maior que 1 e tem seusíndices na faixa de<formula>formula see original document page 86</formula>
para uma janela de síntese. No caso da funçãojanela 700 mostrada na Fig. 11, o valor máximo obtido é maior que1,04, obtido no índice de amostra η = 77. Em contraste, os valoresmáximos da janela seno 710 são menores ou iguais a 1, obtidos em η= 63 e η = 64.
Entretanto, também a função janela 700 obtém umvalor de aproximadamente 1 com índices de amostras por volta de η= Ν. Para ser mais preciso, o valor absoluto ou o próprio valor docoeficiente de janela w(N-I) correspondente ao índice η = N-I émenor que 1, considerando que o valor absoluto ou o próprio valordo coeficiente de janela w(N) correspondente ao índice η = N émaior que 1. Em algumas configurações de acordo com a presenteinvenção, esses dois coeficientes de janela obedecem às relações
0,99 < w(N -1) < 1,01,0 <w(N)< 1,01 (32)
que é o resultado da otimização da qualidade dobanco de filtros de áudio de acordo com as configurações dapresente invenção. Em muitos casos, é desejável ter um coeficientede janela w(0) compreendendo um valor absoluto menor possível.Nesse caso, um determinante dos coeficientes de janela
|w(o) · w(2N - l) - w(N - l) · w(N)1
deve estar o mais perto possível de 1 para obteruma qualidade de áudio, que é otimizada com referência aosparâmetros possíveis. 0 sinal do determinante dado pela equação(33) é, entretanto, de livre escolha. Como conseqüência docoeficiente de janela w(0) ser menor que, ou aproximadamente 0, oproduto de w (N-I) · w(N) ou seus valores absolutos devem ser osmais próximos possíveis de +/- 1. Nesse caso, o coeficiente dejanela w(2N-l) pode ser então quase livremente escolhido. Aequação (33) é o resultado do emprego da técnica de matrizes deretardo zero descritas em "New Framework for Modulated PerfectReconstruction Filter Banks" de G.D.T. Sehuller e M.J.T. Smith,IEEE Transactions on Signal Processing, Vol. 44, No. 8, agosto de1996.
Além disso, como será ressaltado maisdetalhadamente no contexto da Fig. 13, os coeficientes de janelacorrespondentes aos índices N-IeN estão compreendidos na metadedo núcleo de modulação e portanto correspondem à amostra tendovalor de aproximadamente 1,0 e que coincide com o retardo do bancode filtros definido pela função de filtro protótipo ou pela funçãojanela.
A função de janela de síntese 700 como mostradana Fig. 11, além disso mostra um comportamento oscilante comcrescentes coeficientes de janela estritamente monotônicos doscoeficientes de janela da seqüência de coeficientes de janelacorrespondente ao índice (n = 0) usado para o janelamento daúltima amostra de áudio no domínio do tempo até o coeficiente dejanela que compreende o maior valor absoluto de todos oscoeficientes de janela da função de janela de síntese 700.
Naturalmente, no caso da função janela de análise de temporeverso, o comportamento oscilante compreende uma reduçãoestritamente monotônica dos coeficientes de janela do coeficientede janela que compreende o maior valor absoluto de todos oscoeficientes de janela de uma correspondente (tempo reversa)função janela de análise para os coeficientes de janela de umaseqüência de coeficientes de janela correspondente a um índice (n= 63 9) usado para o janelaraento da última amostra de áudio nodomínio do tempo.
Como conseqüência do comportamento oscilante, odesenvolvimento da função de janela de síntese 700 inicia com umcoeficiente de janela correspondente ao índice η = 0 com um valorabsoluto menor que 0,02 e um valor absoluto do coeficiente dejanela correspondente ao índice η = 1 menor que 0,03, adquirindoum valor cerca de 1 em um índice η = N, adquirindo um valor máximode mais de 1,04 em um índice de acordo com equação (31),adquirindo um outro valor de aproximadamente 1 em um índice η = 90e 91, uma primeira troca de sinais em valores índice de η = 162 eη = 163, adquirindo um valor mínimo menor que -0,1 ou -0,12755 emum índice de aproximadamente η = 3N e uma outra troca de sinaiscom valores índice de η = 284 e η = 285. Entretanto, a função dejanela de síntese 700 pode ainda compreender outras trocas desinais em outros valores índice n. Ao comparar os coeficientes dejanela com os valores dados nas tabelas dos Anexos 1 e 3, asoutras alterações de sinais com referência aos coeficientes dejanela correspondentes aos índices 128 a 255 e 384 a 511(multiplicação por fator (-1)) deve ser considerada de acordo comequações (16a) e (16b).
O comportamento oscilante da função de janela desíntese 700 é similar à de uma oscilação fortemente amortecida,que é ilustrada pelo valor máximo de cerca de 1,04 e o valormínimo de cerca de -0,12. Como conseqüência, mais de 50% de todosos coeficientes de janela compreendem valores absolutos sendomenores ou iguais a 0,1. Como ressaltado no contexto dasconfigurações descritas nas Figs. 1 e 2a, o desenvolvimento dafunção janela compreende um primeiro grupo 420 (ou 200) e osegundo grupo 430 (ou 210), onde o primeiro grupo 420 compreendeuma primeira porção consecutiva de coeficientes de janela e osegundo grupo 430 compreende uma segunda porção consecutiva decoeficientes de janela. Como já ressaltado antes, a seqüência decoeficientes de janela da janela compreende somente o primeirogrupo 420 de coeficientes de janela e o segundo grupo de funçõesjanela 430, onde o primeiro grupo 420 de coeficientes de janelacompreende exatamente a primeira seqüência consecutiva decoeficientes de janela, e onde o segundo grupo 430 compreendeexatamente a segunda porção consecutiva de coeficientes de janela.
Assim, os termos primeiro grupo 420 e primeira porção decoeficientes de janela, assim como os termos segundo grupo 430 esegunda porção de coeficientes de janela podem ser usados comosinônimos.
Mais que 50% de todos os coeficientes de janelacom valores absolutos menores ou iguais a 0,1 estão compreendidosno segundo grupo ou na segunda porção 430 de coeficientes dejanela como conseqüência do comportamento oscilatório fortementeamortecido da função janela 700. Mais ainda, também mais que 50%de todos os coeficientes de janela compreendidos no segundo grupoou segunda porção 430 de coeficientes de janela compreendemvalores absolutos menores ou iguais a 0,01.
A primeira porção 420 de coeficientes de janelacompreende menos de um terço de todos os coeficientes de janela daseqüência de coeficientes de janela. Da mesma forma, a segundaporção 430 de coeficientes de janela compreende mais de doisterços de coeficientes de janela. No caso de um número total deblocos T a ser processado em um dos frames 120, 150, 330, 380 demais que quatro blocos, a primeira porção tipicamente compreende3/2 · N coeficientes de janela, onde N é o número de amostras nodomínio do tempo de um bloco. Da mesma forma, a segunda porçãocompreende o resto dos coeficientes de janela ou, para ser maispreciso, (T-3/2)N coeficientes de janela. No caso de T = 10 blocospor frame como mostrado na Fig. 11, a primeira porção compreende3/2 · N coeficientes de janela, considerando que a segunda porção210 compreende 8,5 N coeficientes de janela. No caso de umtamanho de bloco de N = 64 amostras de áudio no domínio do tempopor bloco, a primeira porção compreende 96 coeficientes de janela,considerando que a segunda porção compreende 544 coeficientes dejanela. A função de janela de síntese 700 como mostrada na Fig. 11adquire o valor de aproximadamente 0,96 no limite da primeiraporção e da segunda porção com um índice cerca de η = 95 ou 96.
Apesar do número de coeficientes de janelacompreendidos na primeira porção 420 e na segunda porção 430, ovalor de energia ou um total valor de energia dos correspondentescoeficientes de janela diferem significativamente entre si. 0valor de energia é definido por
<formula>formula see original document page 90</formula>
onde w(n) é um coeficiente de janela e o índice ηno qual a soma na equação (34) é avaliada corresponde aos índicesdas respectivas porções 420, 430, a todo o conjunto decoeficientes de janela ou qualquer conjunto de coeficientes dejanela ao qual os respectivos valores de energia E correspondem.Apesar da significativa diferença de coeficientes de janela, ovalor de energia da primeira porção 420 é igual ou maior a 2/3 dovalor total de energia de todos os coeficientes de janela. Damesma forma, o valor de energia da segunda porção 430 é menor ouigual a 1/3 do valor total de energia de todos os coeficientes dejanela.
Para ilustrar o fato, o valor de energia daprimeira porção 420 dos coeficientes de janela da função janela700 é de aproximadamente 55,85, enquanto o valor de energia doscoeficientes de janela da segunda porção 430 é de aproximadamente22,81. O valor total de energia de todos os coeficientes de janelada função janela 700 é de aproximadamente 78,03, portanto o valorde energia da primeira porção 420 é de aproximadamente 71,6% dovalor total de energia, enquanto o valor de energia da segundaporção 430 é de aproximadamente 28,4% do valor total de energia detodos os coeficientes de janela.
Naturalmente, a equação (34) pode ser apresentadaem uma versão normalizada, dividindo o valor de energia E por umfator de normalização E0, que pode em princípio ter qualquer valorde energia. O fator de normalização E0 pode, por exemplo, ser ovalor total de energia de todos os coeficientes de janela de umaseqüência de coeficientes de janela calculada de acordo comequação (34).
Com base nos valores absolutos dos coeficientesde janela ou com base nos valores de energia dos respectivoscoeficientes de janela, também pode ser determinado um pontocentral ou a "centro de massa" de uma seqüência de coeficientes dejanela. 0 centro de massa ou o ponto central de uma seqüência decoeficientes de janela é um número real e tipicamente se situa nafaixa dos índices da primeira porção 420 dos coeficientes dejanela. No caso dos respectivos frames compreendendo mais dequatro blocos de amostras de áudio no domínio do tempo (T > 4) , ocentro de massa nca com base nos valores absolutos dos coeficientesde janela ou o centro de massa nce baseado nos valores de energiados coeficientes de janela é menor que 3/2 · N. Em outras palavras,no caso de T = 10 blocos por frame, o centro de massa se situa bemdentro da região dos índices da primeira porção 200.
0 centro de massa nca com base nos valoresabsolutos dos coeficientes de janela w(n) é definido de acordo com
N-T-I
Σ «· kN
η ι- n=°_
ca N-T-I (35)
Σ KH
n = 0
e o centro de massa nce em vista dos valores deenergia dos coeficientes de janela w(n) é definido de acordo com
N-T-I
Σ n · KnF
η - _
11Ce - N-T-I , (36)
Σ KH2
n = 0
onde NeT são inteiros positivos que indicam onúmero de amostras de áudio no domínio do tempo por bloco e onúmero de blocos por frame, respectivamente. Naturalmente, ospontos centrais de acordo com equações (35) e (36) também podemser calculados com referência a um conjunto limitado decoeficientes de janela substituindo os limites das somas acima damesma forma.
Para a função janela 700 como mostrada na Fig. 1,o centro de massa nca baseado nos valores absolutos doscoeficientes de janela w(n) é igual a um valor de nca « 87,75 e oponto central ou centro de massa nce com referência aos valores deenergia dos coeficientes de janela w(n) é nce » 80,04. Como aprimeira porção 200 de coeficientes de janela da função janela 700compreende 96 (= 3/2 · Ν; N = 64) coeficientes de janela, ambos ospontos centrais se situam bem dentro da primeira porção 200 doscoeficientes de janela, como ressaltado anteriormente.
Os coeficientes de janela w(n) da função janela700 são baseados nos valores dados na tabela do Anexo 1.Entretanto, para obter, por exemplo, a propriedade de baixoretardo do banco de filtros como ressaltado antes, não é precisoimplementar a função janela tão exatamente como dada peloscoeficientes de janela na tabela do Anexo 1. Em muitos casos, émais que suficiente para os coeficientes de janela da funçãojanela compreendendo 64 0 coeficientes de janela obedeceremquaisquer das relações ou equações dadas nas tabelas dos Anexos 2a 4. Os coeficientes de janela ou coeficientes de filtro dados natabela do Anexo 1 representam valores preferidos, que podem seradaptados de acordo com equações (16a) e (16b) em algumasimplementações. Entretanto, como indicado, por exemplo, pelasoutras tabelas dadas nos demais Anexos, os valores preferidospodem variar do segundo, terceiro, quarto, quinto dígito após oponto decimal, de maneira que os filtros resultantes ou funçõesjanela ainda tenham vantagens de configurações de acordo com apresente invenção. Entretanto, dependendo dos detalhes deimplementação, para obter os coeficientes de janela com base nosvalores dados nas tabelas dos Anexos 1 e 3, outras alterações desinais com referência aos coeficientes de janela correspondentesaos índices 128 a 255 e 384 a 511 (multiplicação por fator (-1))devem ser consideradas de acordo com equações (16a) e (16b).
Naturalmente, outras funções janela compreendendoum diferente número de coeficientes de janela podem ser igualmente5 definidas e ser usadas na estrutura das configurações de acordocom a presente invenção. Nesse contexto, deve ser notado que tantoo número de amostras de áudio no domínio do tempo por bloco como onúmero de blocos por frame, assim como a distribuição dos blocoscom referência às amostras passadas e futuras amostras pode variar10 em ampla faixa de parâmetros.
A Fig. 12 mostra uma comparação de um banco defiltros de baixo retardo modulado complexo janela (janela CMLDFB)700 mostrada na Fig. 11 e o filtro protótipo original SBR QMF 720como empregado, por exemplo, na ferramenta SBR de acordo com os15 padrões MPEG. Como mostrada na Fig. 11, a janela CMLDFB 700 énovamente uma janela de síntese de acordo com uma configuração dapresente invenção.
Apesar da função janela 700 de acordo com umaconfiguração de a presente invenção ser claramente assimétrica20 como definida no contexto da equação (30), o filtro protótipooriginal SBR QMF 72 0 é simétrico com referência aos índices η =319 e 320, como a função janela 700, assim como filtro protótipoSBR QMF 720 são definidos com referência a 640 índices cada. Emoutras palavras, com referência à equação (29), o "valor índice"25 n0 que representa o índice do centro de simetria é dado por n0 =319,5 no caso do filtro protótipo SBR QMF 72 0.
Mais ainda, devido à simetria do filtro protótipoSBR QMF 72 0, também o ponto central nca e nce de acordo com equações(35) e (36) , respectivamente, são idênticos ao centro de simetrian0. 0 valor de energia do filtro protótipo SBR QMF 720 é 64,00, jáque o filtro protótipo é um filtro ortogonal. Em contraste, afunção janela simétrica 700 claramente assimétrica compreende um5 valor de energia de 78,0327 como ressaltado antes.
Nas seguintes seções da descrição, serãoconsiderados sistemas SBR como ressaltado no contexto das Figs. 5e 6, em que o decodificador SBR 610 compreende configurações deacordo com a presente invenção sob a forma de um banco de filtros10 de análise como o banco de filtros 62 0 e uma configuração deacordo com a presente invenção sob a forma de um banco de filtrosde síntese para o banco de filtros de síntese 640. Como seráressaltado mais detalhadamente, o retardo total de um banco defiltros de análise de acordo com a presente invenção que emprega15 uma função janela 700 como mostrada nas Figs. 11 e 12 compreendeum retardo total de 12 7 amostras, considerando que a ferramentaSBR baseada no filtro protótipo SBR QMF original resulta em umretardo total de 640 amostras.
A substituição dos bancos de filtros QMF no20 módulo SBR, por exemplo, no decodificador SBR 610, por um banco defiltros de baixo retardo de valor complexo (CLDFB) resulta em umaredução de retardo de 42 ms para 31,3 ms sem introduzir nenhumadegradação da qualidade de áudio ou outra complexidadecomputacional. Com o novo banco de filtros, ambos, o modo SBR25 padrão (modo de alta qualidade) e o modo de baixa potência queemprega somente bancos de filtros de valor real, são suportados,como mostrou a descrição das configurações de acordo com apresente invenção com referência às Figs. 7 a 10.Especialmente no campo das telecomunicações e dacomunicação bidirecional, um baixo retardo é de grandeimportância. Apesar do AAC ampliado de baixo retardo já ser capazde obter um retardo baixo o suficiente para aplicações decomunicações de 42 ms, seu retardo algorítmico é ainda maior que odo corecodec AAC de baixo retardo, que é capaz de obter retardotão baixos quanto 2 0 ms e que os de outros codecs detelecomunicações. No decodificador SBR 610, os estágios de análisee síntese QMF ainda causam um retardo de reconstrução de 12 ms.
Uma abordagem que promete reduzir este retardo é utilizar umatécnica de banco de filtros de baixo retardo de acordo com umaconfiguração da presente invenção e substituir os atuais bancos defiltros QMF pela respectiva versão de baixo retardo de acordo comas configurações da presente invenção. Em outras palavras, outraredução de retardo é obtida simplesmente substituindo os bancos defiltros regulares usados no módulo SBR 610 por um banco de filtroscomplexo de baixo retardo de acordo com as configurações dapresente invenção.
Para o uso no módulo SBR 610, os novos bancos defiltros de acordo com as configurações da presente invenção, quetambém são denominados de CLDFBs, são projetados para serem tãosimilares aos bancos de filtros QMF originalmente usados quantopossível. Isto inclui, por exemplo, o uso de 64 sub-bandas oubandas, de um igual comprimento das respostas de impulso e umacompatibilidade com os modos de índice duplo empregados nossistemas SBR.
A Fig. 13 ilustra a comparação do formato dajanela CLDFB 700 de acordo com uma configuração da presenteinvenção e o filtro protótipo original SBR QMF 720. Além disso,ilustra o retardo dos bancos de filtros modulados, que podem serdeterminados analisando o retardo de sobrepasso introduzido pelofiltro protótipo ou função janela, além do retardo de framing do5 núcleo de modulação com um comprimento de N amostras no caso de umsistema baseado em DCT-IV. A situação mostrada na Fig. 13 serefere novamente ao caso de um banco de filtros de síntese. Afunção janela 700 e a função de filtro protótipo 720 tambémrepresentam respostas de impulso dos filtros protótipos de síntese10 dos dois bancos de filtros envolvidos.
Com referência à análise de retardo tanto dobanco de filtros SBR QMF e do proposto CLDFB, de acordo com umaconfiguração da presente invenção, na análise e na síntese somenteo sobrepasso para o lado direito e para o lado esquerdo do núcleo15 de modulação, respectivamente, adicionam retardo.
Para ambos os bancos de filtros, o núcleo demodulação se baseia em um DCT-IV que introduz um retardo de 64amostras, que está marcado na Fig. 13 como o retardo 750. No casodo filtro protótipo SBR QMF 72 0 devido à simetria, o retardo do2 0 núcleo de modulação 750 está disposto simetricamente comreferência ao centro de massa ou o ponto central da respectivafunção de filtro protótipo 720 como indicado na Fig. 13. A razãopara este comportamento é que o buffer do banco de filtros SBR QMFdeve ser preenchido até um ponto em que será considerada no25 processamento a função de filtro protótipo 720 tendo acontribuição mais significativa em termos dos respectivos valoresde energia dos valores do filtro protótipo. Devido à forma dafunção de filtro protótipo 720, isto exige que o buffer sejapreenchido até pelo menos o ponto central ou centro de massa darespectiva função de filtro protótipo.
Para melhor ilustrar o fato, partindo de todos osbuffers inicializados do correspondente banco dè filtros SBR QMF,o buffer deve ser preenchido até o ponto que o processamento dedados resultará no processamento de dados significativos, queexigem que a respectiva função janela ou função de filtroprotótipo tenha uma contribuição significativa. No caso da funçãode filtro protótipo SBR QMF, a forma simétrica do filtro protótipo720 produz um retardo, que está na ordem do centro de massa ou doponto central da função de filtro protótipo.
Entretanto, como o retardo introduzido pelonúcleo de modulação do sistema baseado em DCT-IV de N = 64 paraamostras está sempre presente e o sistema também compreende oretardo de um bloco, pode ser observado que o protótipo síntese doSBR QMF introduz um retardo de sobrepasso de 288 amostras.
Como indicado anteriormente, no caso dos bancosde filtros de síntese aos quais se refere a Fig. 13, este novosobrepasso do lado esquerdo 760 provoca o retardo, enquanto osobrepasso do lado direito 770 se refere às amostras passadas e,portanto não introduz nenhum novo retardo no caso de um banco defiltros de síntese.
Em contraste, partindo com todos os buffersinicializados do CLDFB de acordo com uma configuração da presenteinvenção, o banco de filtros de síntese, assim como o banco defiltros de análise, são capazes de prover dados "significativos"mais cedo, comparado com o banco de filtros SBR QMF devido à formada função janela. Em outras palavras, devido à forma da função dejanela de análise ou síntese 700, são possíveis amostrasprocessadas pelas funções janela indicativas da significativacontribuição. Como conseqüência, o protótipo de síntese ou funçãode janela de síntese do CLDFB introduz somente um retardo de5 sobrepas so de 32 amostras, levando em conta o retardo jáintroduzido pelo núcleo de modulação 750. A primeira porção 420 ouprimeiro grupo 42 0 de coeficientes de janela da função janela 700de acordo com uma configuração da presente invenção compreende emuma configuração preferida de acordo com a presente invenção, os10 96 coeficientes de janela correspondentes ao retardo causado pelosobrepasso do lado esquerdo 760 em conjunto com o retardo donúcleo de modulação 750.
O mesmo retardo é introduzido pelo banco defiltros de análise ou pela função protótipo de análise. A razão é15 que o banco de filtros de análise se baseia na versão tempo-reversa da função de janela de síntese ou função protótipo.Portanto, o retardo de sobrepasso é introduzido no lado direito,compreendendo o mesmo tamanho de sobrepasso que do banco defiltros de síntese. Assim, no caso de um banco de filtros20 protótipo QMF original, é também introduzido um retardo de 288amostras, enquanto que para um banco de filtros de análise deacordo com uma configuração da presente invenção somente 32amostras são introduzidas como retardo.
A tabela mostrada na Fig. 14a dá uma visão geral25 sobre o retardo com diferentes estágios de modificação supondo umcomprimento de frame de 480 amostras e a taxa de amostragem de 48kHz. Em uma configuração padrão, compreendendo um codec AAC-LDjuntamente com uma ferramenta SBR padrão, os bancos de filtrosMDCT e IMDCT no modo de índice duplo provocam um retardo de 4 0 ms.Mais ainda, a própria ferramenta QMF provoca um retardo de 12 ms.Mais ainda, devido a um sobrepasso SBR, é gerado um outro retardode 8 ms, de maneira que o retardo geral desse codec está na faixade 60 ms.
Em comparação, um codec AAC-ELD compreendendoversões de baixo retardo do MDCT e do IMDCT gera na abordagem deíndice dual um retardo de 30 ms. Comparado ao banco de filtrosoriginal QMF de uma ferramenta SBR, o emprego de um banco defiltros de baixo retardo de valor complexo de acordo com umaconfiguração da presente invenção resultará em um retardo desomente 1 ms comparado aos 12 ms da ferramenta QMF original.
Evitando o sobrepasso SBR, o sobrepasso adicional de 8 ms de umacombinação para frente de um AAC-LD com a ferramenta SBR pode sercompletamente evitado. Portanto, um codec AAC ampliado de baixoretardo é capaz de um retardo algorítmico total de 31 ms, em vezde 60 ms da combinação para frente ressaltada anteriormente.Portanto, pode ser visto que a combinação dos métodos de reduçãode retardo descritos realmente resulta na economia do retardototal de 29 ms.
A tabela da Fig. 14b dá uma outra visão doretardo do codec geral causado pelas versões de banco de filtrosoriginal e proposta em um sistema como mostrado nas Figs. 5 e 6.
Os dados e valores apresentados na Fig. 14b se baseiam na taxa deamostragem de 48 kHz e um tamanho de frame de codificador núcleode 480 amostras. Devido à abordagem de índice duplo de um sistemaSBR como mostrado e discutido nas Figs. 5 e 6, o codificadornúcleo opera efetivamente em uma taxa de amostragem de 24 kHz.Como o retardo de framing de 64 amostras do núcleo de modulação jáestá introduzido pelo codificador núcleo, pode ser subtraído dosvalores de retardo standalone dos dois bancos de filtros comodescrito no contexto da Fig. 13.
A tabela da Fig. 14b ressalta que é possívelreduzir o retardo geral do codec AAC de baixo retardo ampliadocompreendendo as versões de baixo retardo do MDCT e do IMDCT (LDMDCT e LD IMDCT). Apesar de ser obtenível um retardo algorítmicototal de 42 ms somente pelo emprego de versões de baixo retardo do10 MDCT e do IMDCT, assim como dos bancos de filtros QMF originais,usando bancos de filtros de baixo retardo de valor complexo deacordo com as configurações da presente invenção em vez dos bancosde filtros QMF convencionais, o retardo algorítmico total pode serreduzido de maneira significativa a somente 31,3 ms.15 Para avaliar a qualidade dos bancos de filtros de
acordo com as configurações da presente invenção e sistemascompreendendo um ou mais bancos de filtros, devem ser feitostestes de audição, a partir dos quais pode ser concluído se bancosde filtros de acordo com as configurações da presente invenção2 0 mantêm a qualidade de áudio de AAC-ELD no mesmo nível e nãointroduzem degradações, nem para o modo SBR complexo nem para omodo SBR de baixa potência e valor real. Portanto, os bancos defiltros de retardo otimizado de acordo com as configurações dapresente invenção não introduzem nenhuma carga na qualidade de25 áudio, apesar de serem capazes de reduzir o retardo em mais de 10ms. Para os itens transientes, até pode ser observado que algumaspequenas melhoras, apesar de não terem significatividadeestatística, podem ser conseguidas. As melhoras supramencionadasforam observadas durante testes de audição de castanholas evibrafones.
Para melhor verificar que a sub-amostragem nocaso de um banco de filtros de 32 bandas de acordo com uma5 configuração da presente invenção funciona igualmente bem para osbancos de filtros de acordo com a presente invenção comparados aosBancos de filtros QMF, foi feita a seguinte avaliação. Primeiro,uma varredura seno-logaritmica foi analisada com um banco defiltros de 32 bandas sub-amostrado, onde foram adicionadas as 3210 bandas superiores, inicializadas com zeros. Depois, o resultadofoi sintetizado por um banco de filtros de 64 bandas, novamentesub-amostrado e comparado ao sinal original. Usando um filtroprotótipo convencional SBR QMF resulta em um índice sinal ruído(SNR) de 59,5 dB. Um banco de filtros de acordo com a presente15 invenção, entretanto, alcança um valor SNR de 78,5 dB, que ilustraque os bancos de filtros de acordo com as configurações dapresente invenção também operam na versão sub-amostrada pelo menosassim como os bancos de filtros originais QMF.
Para mostrar que esta abordagem de banco de20 filtros de retardo otimizada, não simétrica como empregada emconfigurações de acordo com a presente invenção prove um valoradicional comparada a um banco de filtros clássico com umprotótipo simétrico, serão comparados protótipos assimétricos comprotótipos simétricos tendo o mesmo retardo a seguir.25 A Fig. 15a mostra uma comparação de uma resposta
de freqüência em uma ilustração de campo longínquo de um banco defiltros de acordo com a presente invenção empregando uma janela debaixo retardo (gráfico 800) comparada com a resposta de freqüênciade um banco de filtros que emprega uma janela seno com comprimentode 128 taps (gráfico 810) . A Fig. 15b mostra uma ampliação daresposta de freqüência no campo próximo dos mesmos bancos defiltros que empregam as mesmas funções janela como ressaltadoantes.
Uma comparação direta dos dois gráficos 800, 810mostra que a resposta de freqüência do banco de filtros queemprega um banco de filtros de baixo retardo de acordo com umaconfiguração da presente invenção é significativamente melhor quea correspondente resposta de freqüência de um banco de filtros queemprega uma janela seno de 128 taps tendo o mesmo retardo.
Também, a Fig. 16a mostra uma comparação dediferentes funções janela com um retardo geral de 127 amostras. 0banco de filtros (CLDFB) com 64 bandas compreende um retardo geral15 de 127 amostras incluindo o retardo de framing e o retardo desobrepasso. Um banco de filtros modulado com um protótiposimétrico e o mesmo retardo teria, portanto, um protótipo comcomprimento de 12 8, como já ilustrado no contexto das Figs. 15a e15b. Para esses bancos de filtros com 50% de sobrepasso, como, por2 0 exemplo, o MDCT, as janelas senos ou janelas derivadas de Kaiser-Bessel geralmente fornecem uma boa escolha de protótipos. Assim,na Fig. 16a uma visão geral de resposta de freqüência de um bancode filtros que emprega uma janela de baixo retardo como protótipode acordo com uma configuração da presente invenção é comparada25 com as respostas de freqüência dos protótipos simétricosalternativos com mesmo retardo. A Fig. 16a mostra, além daresposta de freqüência do banco de filtros de acordo com apresente invenção (gráfico 800) e a resposta de freqüência de umbanco de filtros que emprega uma janela seno (gráfico 810) , comojá mostrada na Figs. 15a e 15b, além das duas janelas KBD baseadasnos parâmetros α = 4 (gráfico 820) e α = 6 (gráfico 830). Ambas, aFig. 16a e a aproximação da Fig. 16a mostrada na Fig. 16b, mostramclaramente que um resposta de freqüência muito melhor pode serobtida com um banco de filtros de acordo com uma configuração dapresente invenção tendo uma função janela não simétrica ou afunção de filtro protótipo com mesmo retardo.
Para ilustrar mais geralmente essa vantagem, naFig. 17 são comparados dois protótipos de bancos de filtros comvalores de retardo diferentes do banco de filtros anteriormentedescritos. Apesar de o banco de filtros de acordo com a presenteinvenção, que foi considerado nas Figs. 15 e 16, ter um retardogeral de 127 amostras, que corresponde a um sobrepasso de 8 blocosno passado e 0 blocos no futuro (CLDFB 80), a Fig. 17 mostra umacomparação da resposta de freqüências de dois diferentesprotótipos de bancos de filtros com o mesmo retardo de 383amostras. Para ser mais preciso, a Fig. 17 mostra a resposta defreqüência de um banco de filtros protótipo não simétrico (gráfico840) de acordo com uma configuração da presente invenção, que sebaseia em um sobrepasso de 6 blocos de amostras no domínio dotempo no passado e 2 blocos de amostras no domínio do tempo nofuturo (CLDFB 62) . Mais ainda, a Fig. 17 também mostra a respostade freqüência (gráfico 850) de uma correspondente função de filtroprotótipo simétrico tendo também um retardo de 383 amostras. Podeser visto que o mesmo valor de retardo um protótipo não simétricoou função janela alcança melhor resposta de freqüência que umbanco de filtros com a função janela simétrica ou filtroprotótipo. Isto mostra a possibilidade de uma melhor decisão entreretardo e qualidade, como anteriormente indicado.
A Fig. 18 ilustra o efeito de mascaramentotemporal do ouvido humano. Quando um som ou um tom aparece em ummomento no tempo indicado por uma linha 860 na Fig. 18, surge umefeito de mascaramento referente à freqüência do tom ou do som efreqüências vizinhas aproximadamente 20 ms antes do início do somreal. Este efeito é denominado pré-mascaramento, sendo um aspectodas propriedades psicoacústicas do ouvido humano.
Na situação ilustrada na Fig. 18, o som permaneceaudível por aproximadamente 200 ms até o momento no tempoilustrado pela linha 870. Durante esse tempo, o mascarador doouvido humano está ativo, que também é denominado de mascaramentosimultâneo. Depois da parada do som (ilustrado pela linha 870), o mascaramento da freqüência na freqüência vizinha do tom decailentamente em um período de tempo de aproximadamente 150 ms comoilustrado na Fig. 18. Este efeito psicoacústico é tambémdenominado de pós-mascaramento.
A Fig. 19 ilustra uma comparação de umcomportamento pré-eco de um sinal codificado HE-AAC convencional eum sinal codificado HE-AAC que se baseiam em um banco de filtrosque emprega um banco de filtros de baixo retardo (CMLDFB) deacordo com uma configuração da presente invenção. A Fig. 19ailustra o sinal de tempo original das castanholas, que foi25 processado com um sistema compreendendo um codec HE-AAC (HE-AAC =codec de áudio avançado de alta eficiência). A saída do sistemabaseada no HE-AAC convencional está ilustrada na Fig. 19b. Umacomparação direta dos dois sinais, o sinal de tempo original e osinal de saída do codec HE-AAC mostra que antes do início do somdas castanholas na área ilustrada pela flecha 880, o sinal desaída do codec HE-AAC compreende importantes efeitos de pré-eco.
A Fig. 19c ilustra um sinal de saída de umsistema compreendendo um HE-AAC baseado em bancos de filtroscompreendendo janelas CMLDFB de acordo com uma configuração dapresente invenção. O mesmo sinal original de tempos indicado naFig. 19a e processado usando bancos de filtros de acordo com umaconfiguração da presente invenção mostra uma aparênciasignificativamente reduzida dos efeitos de pré-eco logo antes doinício de um sinal de castanholas como indicado por uma flecha 890na Fig. 19c. Devido ao efeito de pré-mascaramento descrito nocontexto da Fig. 18, o efeito pré-eco indicado pela flecha 890 daFig. 19c estará bem melhor mascarado que os efeitos pré-ecoindicados pela flecha 880 no caso do codec HE-AAC convencional.
Portanto, o comportamento pré-eco dos bancos de filtros de acordocom a presente invenção, que também são o resultado do retardosignificativamente reduzido comparado aos bancos de filtrosconvencionais, faz com que a saída esteja bem melhor adaptada àspropriedades de mascaramento temporal e à psicoacústica do ouvidohumano. Como conseqüência, como já indicado ao descrever os testesde audição, o emprego de bancos de filtros de acordo com umaconfiguração da presente invenção pode mesmo levar a umaperfeiçoamento referente à qualidade devida ao retardo reduzido.
As configurações de acordo com a presenteinvenção não aumentam a complexidade computacional comparadas aosbancos de filtros convencionais. Os bancos de filtros de baixoretardo usam o mesmo comprimento de filtro e o mesmo modo demodulação que, por exemplo, os bancos de filtros QMF no caso desistemas SBR de maneira que a complexidade computacional nãoaumente. Em termos de exigências de memória devido à naturezaassimétrica dos filtro protótipos, a exigência de memória ROM(read-only memory) do banco de filtros de síntese aumenta emaproximadamente 320 palavras no caso de um banco de filtros combase em N = 64 amostras por bloco e T = 10 blocos por frame. Maisainda, no caso de um sistema SBR, a exigência de memória aumentaainda em outras 320 palavras se o filtro de análise for armazenadoseparadamente.
Entretanto, como as atuais exigências de ROM deum núcleo AAC-ELD é de aproximadamente 2,5 k palavras (kilopalavras) e para a implementação SBR outras 2,5 k palavras, aexigência de ROM aumenta só moderadamente em cerca de 10%. Como15 uma possível decisão entre memória e complexidade, se um pequenoconsumo de memória for necessário, pode ser usada uma interpolaçãolinear para gerar o filtro de análise a partir do filtro desíntese como ressaltado no contexto da Fig. 3 e na equação (15) .Essa operação de interpolação aumenta o número das instruções20 necessárias em somente aproximadamente 3,6%. Portanto, nasubstituição dos bancos convencionais de filtros QMF na estruturade módulos SBR pelos bancos de filtros de baixo retardo de acordocom as configurações da presente invenção, o retardo pode serreduzido em algumas configurações em mais de 10 ms sem qualquer25 degradação da qualidade de áudio ou aumento perceptível decomplexidade.
As configurações de acordo com a presenteinvenção, portanto se relacionam com uma janela de análise ouequipamento ou método de janelamento. Mais ainda, é descrito umbanco de filtros de análise ou síntese ou método para a análise ousíntese de um sinal usando a janela. Naturalmente, o programa decomputador que implementa um dos métodos acima é também revelado.
A implementação de acordo com as configurações dapresente invenção pode ser feita em implementações de hardware,implementações de software ou uma combinação de ambas. Os dados,vetores e variáveis geradas, recebidas ou armazenadas a seremprocessados podem ser armazenados em diferentes tipos de memóriascomo em memórias de acesso randômico, buffers, memórias deleitura, memórias não voláteis (por exemplo, EEPROMs, memóriasflash) ou outras memórias como memórias magnéticas ou óticas. Umaposição de armazenagem pode, por exemplo, ser uma ou mais unidadesde memória exigidas para guardar ou salvar as quantidadesrespectivas de dados, como variáveis, parâmetros, vetores,matrizes, coeficientes de janela ou outras peças de informações edados.
As implementações de software podem ser operadasem diferentes computadores, sistemas do tipo computador,processadores, ASICs (circuitos integrados específicos paraaplicações) ou outros circuitos integrados (ICs).
Dependendo de determinadas exigências deimplementação das configurações dos métodos da invenção, asconfigurações dos métodos da invenção podem ser implementadas emhardware, software ou em uma combinação de ambos. A implementaçãopode ser feita usando um meio digital de armazenagem, emparticular um disco CD, um DVD ou outro disco tendo um sinal decontrole de leitura eletrônica armazenado, que coopere com umsistema programável de computador, processador ou circuitointegrado, de maneira a ser realizada uma configuração do métododa invenção. Em geral, uma configuração da presente invenção é,portanto, um produto de programa de computador com um código deprograma armazenado em um portador de leitura por máquina, ocódigo de programa sendo operado para realizar uma configuraçãodos métodos da invenção quando o produto de programa de computadoropera em um computador, processador ou circuito integrado. Emoutras palavras, as configurações dos métodos da invenção são,portanto, um programa de computador tendo um código de programapara realizar pelo menos uma configuração dos métodos da invençãoquando o programa de computador opera em um computador,processador ou circuito integrado.
Um equipamento para a geração de valores de sub-banda de áudio em canais de sub-banda de áudio de acordo com asconfigurações da presente invenção compreende um janelador deanálise (110) para o janelamento de um frame (120) de amostras deentrada de áudio no domínio do tempo estando em uma seqüênciatemporal que se prolonga de uma amostra prévia até uma amostraposterior usando uma função janela de análise (190) compreendendouma seqüência de coeficientes de janela para obter a função janelade análise janelada amostrada (190) compreendendo um primeirogrupo (200) de coeficientes de janela compreendendo uma primeiraporção de uma seqüência de coeficientes de janela e um segundogrupo (210) de coeficientes de janela compreendendo uma segundaporção de uma seqüência de coeficientes de janela, a primeiraporção compreendendo menos coeficientes de janela que a segundaporção, onde um valor de energia dos coeficientes de janela naprimeira porção é maior que um valor de energia dos coeficientesde janela da segunda porção, onde o primeiro grupo de coeficientesde janela é usado para o janelamento posterior das amostras nodomínio do tempo e o segundo grupo de coeficientes de janela éusado para o janelamento precoce das amostras no domínio do tempo,e um calculador (170) para o cálculo dos valores de sub-banda deáudio usando as amostras janeladas.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que a função janela de análise(190) seja assimétrica com referência à seqüência de coeficientesde janela.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que um valor de energia doscoeficientes de janela da primeira porção seja igual ou maior que2/3 de um valor de energia de todos os coeficientes de janela deuma seqüência de coeficientes de janela e um valor de energia doscoeficientes de janela da segunda porção de coeficientes de janelaseja menor ou igual a 1/3 de um valor de energia de todos oscoeficientes de janela de uma seqüência de coeficientes de janela.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que a primeira porção decoeficientes de janela compreende 1/3 ou menos que 1/3 de umnúmero total de coeficientes de janela de uma seqüência decoeficientes de janela e a segunda porção compreende 2/3 ou maisque 2/3 do número total de coeficientes de janela de uma seqüênciade coeficientes de janela.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que um ponto central doscoeficientes de janela da função janela de análise (190)corresponde a um valor real em uma faixa do índice da primeiraporção de coeficientes de janela.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise15 (110) está adaptado de maneira que a função janela de análise(190) compreende uma redução estritamente monotônica docoeficiente de janela compreendendo o maior valor absoluto detodos os coeficientes de janela da função janela de análise (190)de um coeficiente de janela de uma seqüência de coeficientes de2 0 janela usada para o janelamento da última amostra de áudio nodomínio do tempo.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise25 (110) está adaptado de maneira que a função janela de análise(190) compreende um comportamento oscilante.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que o coeficiente de janelacorrespondente a um índice η = (T-I) · N compreenda um valorabsoluto na faixa de 0,9 a 1,1, onde um índice de uma seqüência decoeficientes de janela é um número inteiro na faixa de 0 a N · T -1, onde o coeficiente de janela usado para o janelamento da últimaamostra de entrada de áudio no domínio do tempo do frame 120 é ocoeficiente de janela correspondente ao índice N · T - 1, onde ojanelador de análise (110) está adaptado de maneira que o frame(120) de amostras de entrada de áudio no domínio do tempocompreende uma seqüência de T blocos (130) de amostras de entradade áudio no domínio do tempo que se prolonga do mais recente atéas últimas amostras de entrada de áudio no domínio do tempo doframe (120), cada bloco compreendendo N amostras de entrada deáudio no domínio do tempo, e onde TeN são inteiros positivos e Té maior que 4.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que o coeficiente de janelacorrespondente ao índice dos coeficientes de janela η = N · T - 1compreenda um valor absoluto menor que 0,02.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, a janela de análise (110)está adaptada de maneira que o janelamento compreende amultiplicação das amostras de entrada de áudio no domínio do tempox(n) do frame (12 0) para obter as amostras janeladas ζ(η) do framejanelado com base na equação
z(n) = x(n) c(n)onde η é um número inteiro que indica um índicede uma seqüência de coeficientes de janela na faixa de 0 a T ■ N-I,onde c (n) é o coeficiente de janela da função janela de análisecorrespondente ao índice n, onde x(N · T-l) é a última amostra deentrada de áudio no domínio do tempo de um frame (12 0) de amostrasde entrada de áudio no domínio do tempo, onde o janelador deanálise (110) está adaptado de maneira que o frame (120) de amostras de entrada de áudio no domínio do tempo compreende umaseqüência de T blocos (13 0) de amostras de entrada de áudio nodomínio do tempo que se prolonga da mais recente até as últimasamostras de entrada de áudio no domínio do tempo do frame (12 0),cada bloco compreendendo N amostras de entrada de áudio no domínio15 do tempo, e onde TeN são inteiros positivos e T é maior que 4.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que os coeficientes de janela c (n)2 0 obedecem às relações dadas na tabela do Anexo 4.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o equipamento (100) estáadaptado para usar uma função janela de análise (190) sendo uma25 versão de tempo reverso ou de índice reverso da função de janelade síntese (370) a ser usada para os valores de sub-banda deáudio.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que a primeira porção da funçãojanela de análise compreende um coeficiente de janela tendo umvalor máximo absoluto maior que 1.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que todos os coeficientes de janelade uma seqüência de coeficientes de janela são coeficientes dejanela de valor real.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que o frame (120) de amostras deentrada de áudio no domínio do tempo compreende uma seqüência de Tblocos (130) de amostras de entrada de áudio no domínio do tempoque se prolonga da mais recente até as últimas amostras de entradade áudio no domínio do tempo do frame (120), cada blococompreendendo N amostras de entrada de áudio no domínio do tempo,onde TeN são inteiros positivos e T é maior que 4.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que janelamento compreende umamultiplicação elementar das amostras de entrada de áudio nodomínio do tempo do frame (120) pelos coeficientes de janela deuma seqüência de coeficientes de janela.Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que cada amostra de entrada deáudio no domínio do tempo é multiplicada elementarmente por umcoeficiente de janela da função janela de análise de acordo com aseqüência de amostras de entrada de áudio no domínio do tempo e aseqüência de coeficientes de janela.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que para cada amostra de entrada deáudio no domínio do tempo do frame (120) de amostras de entrada deáudio no domínio do tempo seja gerada exatamente uma amostra15 janelada.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que o coeficiente de janela20 correspondente a um índice dos coeficientes de janela η = (T-3) ■ Ncompreende um valor menor que -0,1, onde o índice de uma seqüênciade coeficientes de janela é um número inteiro na faixa de 0 a N · T- 1, e onde o coeficiente de janela usado para o janelamento daúltima amostra de entrada de áudio no domínio do tempo é o25 coeficiente de janela correspondente ao índice N-T - 1.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que a primeira porção decoeficientes de janela compreende 3/2 -N coeficientes de janela ea segunda porção de coeficientes de janela compreende (T-3/2) · Ncoeficientes de janela de uma seqüência de coeficientes de janela.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que os coeficientes de janela c (n)obedecem às relações dadas na tabela do Anexo 3.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que os coeficientes de janela c (n)obedeçam as relações dadas na tabela do Anexo 2.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o janelador de análise(110) está adaptado de maneira que os coeficientes de janela c (n)compreendem os valores dados na tabela do Anexo 1.20 Em um equipamento para a geração de valores de
sub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o equipamento (100) estáadaptado de maneira que o presente frame (12 0) de amostras deentrada de áudio no domínio do tempo a ser processado seja gerado25 pela mudança (T-I) blocos posteriores de um frame diretamenteprecedente (12 0) de amostras de entrada de áudio no domínio dotempo por um bloco na direção das amostras prévias de entrada deáudio no domínio do tempo e adicionando um bloco (22 0) de novasamostras de áudio no domínio do tempo como o bloco compreendendoas últimas amostras de entrada de áudio no domínio do tempo doframe atual (12 0).
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o equipamento (100) estáadaptado de maneira que o presente frame (12 0) de amostras deentrada de áudio no domínio do tempo x(n) a ser processado sejagerado com base na mudança das amostras de entrada de áudio nodomínio do tempo Xprev(n) do frame diretamente precedente (120) deamostras de entrada de áudio no domínio do tempo com base naequação
x(n - 32) = Xprev (n)
para um índice de tempo ou de amostra η = 32,..., 319, e onde o equipamento (100) está ainda adaptado paragerar as amostras de entrada de áudio no domínio do tempo x(n) doframe atual (120) de amostras de entrada de áudio no domínio dotempo pela inclusão das 32 próximas amostras de entrada no domíniodo tempo de acordo com a ordem das amostras de entrada de áudio nodomínio do tempo de tempo decrescente ou de índices de amostras ηdas amostras de entrada de áudio no domínio do tempo x(n) do frameatual (120) iniciando no índice de tempo ou amostra η = 31.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o calculador (170)compreende um conversor tempo/freqüência adaptado para gerar osvalores de sub-banda de áudio de maneira que todos os valores desub-banda com base em um frame (150) de amostras janeladasrepresentem uma representação espectral das amostras janeladas doframe (150) de amostras janeladas.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o conversortempo/freqüência está adaptado para gerar valores complexos ouvalores reais de sub-banda de áudio.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o calculador (170) estáadaptado para calcular um valor de sub-banda de áudio para cadaamostra de entrada de áudio no domínio do tempo de um bloco (13 0)de amostras de entrada de áudio no domínio do tempo, onde ocálculo de cada valor de sub-banda de áudio ou de cada uma dasamostras de entrada de áudio no domínio do tempo de um bloco (130)de amostras de entrada de áudio no domínio do tempo se baseia nasamostras janeladas do frame janelado (150).
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o calculador (170) estáadaptado para calcular os valores de sub-banda de áudio com basena multiplicação das amostras janeladas (150) pela função deoscilação harmônica de cada valor de sub-banda e somando asamostras janeladas multiplicadas, onde a freqüência da função deoscilação harmônica se baseia em uma freqüência central de umacorrespondente sub-banda dos valores de sub-banda.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o calculador (170) estáadaptado de maneira que a função harmonicamente oscilante seja umafunção exponencial complexa, uma função seno ou uma função co-seno.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o calculador (170) estáadaptado para calcular os valores de sub-banda de áudio Wki combase na equação
Un = Yj z(n + j ■ 64)
para η = 0, ..., 63 e
(π \
= Σ ■ 2 ■ fOSC — ■ (k + 0 .5) · (2n - 95)^o V64
para k = 0, . . ., 31, onde ζ (η) é uma amostrajanelada correspondente a um índice n, onde k é um índice de sub-banda, onde 1 é um índice de um bloco (180) de valores de sub-banda de áudio e onde fosc(x) é uma função oscilante dependendo davariável de valor real x.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o calculador (170) estáadaptado de maneira que a função oscilante fOSc (x) é
^osc (*) = exp(i · x)
OU
25 ou
fOSC (X) = COs(x)
foSÁx) = Sin(x) ,onde i é uma unidade imaginária.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o equipamento (100) estáadaptado para processar um frame (12 0) de amostras de entrada deáudio no domínio do tempo de valor real.
Em um equipamento para a geração de valores desub-banda de áudio em canais de sub-banda de áudio de acordo comas configurações da presente invenção, o equipamento (100) éadaptado para fornecer um sinal indicativo da função de janela desíntese (370) a ser usada com os valores de sub-banda de áudio ouindicativa da função janela de análise (190) usada para gerar osvalores de sub-banda de áudio.
Um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção compreende um calculador (310) para o cálculo deuma seqüência (330) de amostras intermediárias no domínio do tempodos valores de sub-banda de áudio em canais de sub-banda de áudio,uma seqüência compreendendo amostras prévias intermediárias nodomínio do tempo e amostras posteriores no domínio do tempo, ojanelador de síntese (360) para o janelamento da seqüência (330)de amostras intermediárias no domínio do tempo usando a função dejanela de síntese (370) compreendendo a seqüência de coeficientesde janela para obter amostras janeladas intermediárias no domíniodo tempo, a função de janela de síntese (370) compreendendo umprimeiro grupo (420) de coeficientes de janela compreendendo umaprimeira porção de uma seqüência de coeficientes de janela e umsegundo grupo (430) de coeficientes de janela compreendendo umasegunda porção de uma seqüência de coeficientes de janela, aprimeira porção compreendendo menos coeficientes de janela que ásegunda porção, onde um valor de energia dos coeficientes dejanela na primeira porção é maior que um valor de energia doscoeficientes de janela da segunda porção, onde o primeiro grupo decoeficientes de janela é usado para o janelamento posterior deamostras intermediárias no domínio do tempo e o segundo grupo decoeficientes de janela é usado para o janelamento prévio dasamostras intermediárias no domínio do tempo, e um estágio de saídade adição de sobrepasso (400) para o processamento das amostrasjaneladas intermediárias no domínio do tempo de maneira a obter asamostras no domínio do tempo.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que um valor de energia dos coeficientes de janela daprimeira porção de coeficientes de janela seja maior ou igual a2/3 de um valor de energia de todos os coeficientes de janela dafunção de janela de síntese (370) e um valor de energia da segundaporção de coeficientes de janela seja menor ou igual a 1/3 dovalor de energia de todos os coeficientes de janela da função dejanela de síntese.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que a primeira porção de coeficientes de janela compreende1/3 ou menos que 1/3 do número total de todos os coeficientes dejanela de uma seqüência de coeficientes de janela e a segundaporção de coeficientes de janela compreende 2/3 ou mais que 2/3 donúmero total de coeficientes de janela de uma seqüência decoeficientes de janela.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que o ponto central dos coeficientes de janela da funçãode janela de síntese (370) corresponde a um valor real em umafaixa do índice da primeira porção de coeficientes de janela.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que a função de janela de síntese compreende um aumentoestritamente monotônico do coeficiente de janela de uma seqüênciade coeficientes de janela usada para o janelamento da últimaamostra intermediária no domínio do tempo para o coeficiente dejanela compreendendo o maior valor absoluto de todos oscoeficientes de janela da função de janela de síntese.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que a função de janela de síntese (370) compreende umcomportamento oscilante.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o coeficiente de janela correspondente a umíndice η = N compreende um valor absoluto na faixa entre 0,9 e1,1, onde o índice η de uma seqüência de coeficientes de janela éum número inteiro na faixa de 0 a T · N - 1, onde o coeficiente dejanela usado para o janelamento da última amostra intermediária nodomínio do tempo é o coeficiente de janela correspondente aoíndice η = 0, onde T é um número inteiro maior que 4 indicando onúmero de blocos compreendido no frame (330) de amostrasintermediárias no domínio do tempo, onde o equipamento (300) estáadaptado para gerar um bloco (410) de amostras de áudio no domíniodo tempo, o bloco (410) de amostras de áudio no domínio do tempocompreendendo N amostras de áudio no domínio do tempo, onde N é umnúmero inteiro positivo.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que o coeficiente de janela correspondente ao índice η = 0compreenda um valor absoluto menor ou igual a 0,02.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que o coeficiente de janela correspondente a um índice η =3N seja menor que -0,1, onde o equipamento (300) está adaptadopara gerar um bloco (410) de amostras de áudio no domínio dotempo, o bloco (410) de amostras de áudio no domínio do tempocompreendendo N amostras de áudio no domínio do tempo, onde N é umnúmero inteiro positivo.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, a janela de síntese (360) está adaptada demaneira que o janelamento compreende a multiplicação das amostrasintermediárias no domínio do tempo g(n) de uma seqüência deamostras intermediárias no domínio do tempo para obter as amostrasjaneladas ζ (η) do frame janelado (380) com base na equação
<formula>formula see original document page 124</formula>
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que o coeficiente de janela c(n) obedece as relações dadasna tabela do Anexo 4.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o equipamento (300) está adaptado para usar umafunção de janela de síntese (370) sendo uma versão tempo-reversaou índice-reversa de uma função janela de análise (190) usada paragerar os valores de sub-banda de áudio.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o equipamento (300) está adaptado para gerar umbloco (410) de amostras de áudio no domínio do tempo, o bloco(410) de amostras de áudio no domínio do tempo compreendendo Namostras de áudio no domínio do tempo, onde N é um número inteiropositivo.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o equipamento (300) está adaptado para gerar umbloco (410) de amostras de áudio no domínio do tempo, com base emum bloco (320) de valores de sub-banda de áudio compreendendo Nvalores de sub-banda de áudio e onde o calculador (310) estáadaptado para calcular uma seqüência (330) de amostrasintermediárias de áudio no domínio do tempo compreendendo T · Namostras intermediárias de áudio no domínio do tempo, onde T é umnúmero inteiro positivo.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que a função de janela de síntese é assimétrica comreferência a uma seqüência coeficiente de janela.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que a primeira porção compreende um valor máximo de todos15 os coeficientes de janela da função de janela de síntese tendo umvalor absoluto maior que 1.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado de20 maneira que a primeira porção compreende 3/2-N coeficientes dejanela e a segunda porção de coeficientes de janela compreende (T-3/2)-N coeficientes de janela, onde T é um índice maior ou igual a4 indicando um número de blocos 34 0 compreendido no frame (330) deamostras intermediárias no domínio do tempo.25 Em um equipamento para a geração de amostras de
áudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que o janelamento da seqüência de amostras intermediáriasno domínio do tempo compreende uma multiplicação elementar dasamostras intermediárias no domínio do tempo por um coeficiente dejanela.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que cada amostra intermediária no domínio do tempomultiplicado elementarmente pelo coeficiente de janela da funçãode janela de síntese (370) de acordo com a seqüência de amostrasintermediárias no domínio do tempo e uma seqüência de coeficientesde janela.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, a janela de síntese (360) está adaptada demaneira que os coeficientes de janela da função de janela desíntese (370) são valores reais.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que o coeficiente de janela c(n) obedece às relações dadasna tabela do Anexo 3.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que os coeficientes de janela c (n) obedecem às relaçõesdadas na tabela do Anexo 2.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o janelador de síntese (360) está adaptado demaneira que os coeficientes de janela c (n) compreendem os valoresdados na tabela do Anexo 1.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o calculador (310) está adaptado para calcularas amostras intermediárias no domínio do tempo de uma seqüência deamostras intermediárias no domínio do tempo baseadas namultiplicação dos valores de sub-banda de áudio pela função deoscilação harmônica e soma dos valores multiplicados de sub-bandade áudio, onde a freqüência da função de oscilação harmônica sebaseia em uma freqüência central da correspondente sub-banda.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o calculador (310) está adaptado de maneira quea função de oscilação harmônica é uma função exponencial complexa,uma função seno ou uma função co-seno.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o calculador (310) está adaptado para calcularamostras intermediárias de valor real no domínio do tempo com basenos valores de sub-banda de áudio de valores complexos ou devalores reais.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o calculador (310) está adaptado para calcularuma seqüência de amostras de valor real intermediárias no domíniodo tempo z(i,n) com base na equação<formula>formula see original document page 128</formula>
para um número inteiro η na faixa de 0 a N · T-I,onde Re (x) é a parte real do número de valor complexo χ, π =3,14... é o número circular e fosc(x) é uma função de oscilaçãoharmônica, onde
<formula>formula see original document page 128</formula>
quando os valores de sub-banda de áudio providospara o calculador são valores complexos, onde I é a unidadeimaginária, e onde
<formula>formula see original document page 128</formula>
quando os valores de sub-banda de áudio providospara o calculador (310) são valores reais.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o calculador (310) compreende um conversortempo/freqüência adaptado para gerar uma seqüência de amostrasintermediárias no domínio do tempo, de maneira que os valores desub-banda de áudio fornecidos para o calculador (310) representamuma representação espectral de uma seqüência de amostrasintermediárias no domínio do tempo.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o conversor tempo/freqüência está adaptado paragerar uma seqüência de amostras intermediárias tempo/domínio combase nos valores de sub-banda de áudio de valores complexos ou devalores reais.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o calculador (310) está adaptado para calcularuma seqüência de amostras intermediárias no domínio do tempo g(n)a partir dos valores de sub-banda de áudio X(k) com base naequação
v(n) = Vprev (n - 2n)
para um número inteiro η na faixa de 2ON - 1 e 2N,
<formula>formula see original document page 129</formula>
para um número inteiro j na faixa de 0 e 4 e paraum número inteiro k na faixa de 0 e N-I, onde N é um númerointeiro que indica o número de valores de sub-banda de áudio e onúmero das amostras de áudio no domínio do tempo, onde ν é umvetor de valor real, onde Vprev é um vetor de valor real ν dageração diretamente anterior de amostras de áudio no domínio dotempo, onde i é a unidade imaginária e π é o número circular.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o calculador (310) está adaptado para calcularuma seqüência de amostras intermediárias no domínio do tempo g(n)a partir dos valores de sub-banda de áudio X(k) com base naequação
v(n) = Vprev (n - 2n)
para um número inteiro η na faixa de 2ON - 1 e<formula>formula see original document page 130</formula>
para um número inteiro η na faixa de O e 2N-1 e
<formula>formula see original document page 130</formula>
para um número inteiro j na faixa de O e 4 e paraum número inteiro k na faixa de O e N-1, onde N é um númerointeiro que indica o número de valores de sub-banda de áudio e onúmero das amostras de áudio no domínio do tempo, onde ν é umvetor de valor real, onde Vprev é um vetor de valor real ν dageração diretamente anterior de amostras de áudio no domínio dotempo e onde π é o número circular.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o estágio de saída de adição de sobrepasso(400) está adaptado para processar as amostras janeladasintermediárias no domínio do tempo de maneira em sobrepasso, combase nos T blocos consecutivamente providos(320) de valores desub-banda de áudio.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o estágio de saída de adição de sobrepasso(40 0) é adaptado para fornecer as amostras no domínio do tempoouti (η) , onde η é um número inteiro que indica um índice deamostra com base na equação
<formula>formula see original document page 130</formula>onde Zi,n é uma amostra intermediária no domíniodo tempo janelada correspondente a um índice de amostra η e umframe ou seqüência índice 1 na faixa de 0 a T - 1, onde 1 = 0corresponde ao último frame ou seqüência e valores menores que 1dos frames ou seqüências anteriormente gerados.
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o estágio de saída de adição de sobrepasso(400) é adaptado para fornecer as amostras no domínio do tempoout(k) com base na equação
<formula>formula see original document page 131</formula>
onde w é um vetor compreendendo as amostrasjaneladas intermediárias no domínio do tempo e k é um númerointeiro que indica um índice na faixa entre 0 e (N-I).
Em um equipamento para a geração de amostras deáudio no domínio do tempo de acordo com as configurações dapresente invenção, o equipamento (300) é adaptado para receber umsinal indicativo da função janela de análise (190) usada paragerar os valores de sub-banda de áudio, ou indicativa da função dejanela de síntese (370) a ser usada para a geração das amostras deáudio no domínio do tempo.
De acordo com as configurações da presenteinvenção, um codificador (510) compreende um equipamento (560)para a geração de valores de sub-banda de áudio em canais de sub-banda de áudio de acordo com uma configuração da presenteinvenção.
De acordo com as configurações da presenteinvenção, um codificador (510) ainda compreende um quantizador ecodificador (570) acoplados ao equipamento (560) para a geração devalores de sub-banda de áudio e adaptado para quantizar ecodificar os valores de sub-banda de áudio produzidos peloequipamento (560) e produzindo os valores de sub-banda de áudioquantizados codificados.
De acordo com as configurações da presenteinvenção, um decodificador (580) compreende um equipamento (600)para a geração de amostras de áudio no domínio do tempo de acordocom uma configuração da presente invenção.
De acordo com as configurações da presenteinvenção, um decodificador (580) ainda compreende um decodificadore dequantizador (590) adaptados para receber valores de sub-bandade áudio codificados e quantizados, acoplados ao equipamento (600)para a geração de amostras de áudio no domínio do tempo eadaptados para prover valores de sub-banda de áudio decodificadose dequantizados como os valores de sub-banda de áudio para oequipamento (600).
De acordo com as configurações da presenteinvenção, um codificador SBR (520) compreende um equipamento (530)para a geração de valores de sub-banda de áudio em canais de sub-banda de áudio, com base em um frame de amostras de entrada deáudio no domínio do tempo provido para o codificador SBR (520) eum módulo de extração de parâmetros SBR (540) acoplado aoequipamento (530) para a geração de valores de sub-banda de áudioe adaptado para a extração e geração de parâmetros SBR com basenos valores de sub-banda de áudio.
De acordo com as configurações da presenteinvenção, um sistema (610) compreende um equipamento (620) para ageração de valores de sub-banda de áudio a partir de um frame deamostras de entrada de áudio no domínio do tempo provido para osistema (610); e um equipamento (640) para a geração de amostrasde áudio no domínio do tempo com base nos valores de sub-banda deáudio gerados pelo equipamento (640) para a geração de valores desub-banda de áudio.
De acordo com as configurações da presenteinvenção, um sistema (610) é um decodificador SBR.
De acordo com as configurações da presenteinvenção, o sistema ainda compreende um gerador HF (630)interconectado entre o equipamento (620) para a geração de valoresde sub-banda de áudio e o equipamento (640) para a geração deamostras de áudio no domínio do tempo e adaptado para receberdados SBR adaptados para modificar ou adicionar valores de sub-banda de áudio com base nos dados SBR e os valores de sub-banda deáudio do equipamento (620) para a geração de valores de sub-bandade áudio.
Com referência a todos os equipamentos e métodosde acordo com as configurações da presente invenção, dependendodos detalhes de implementação, para obter os coeficientes dejanela com base nos valores dados nas tabelas dos Anexos 1 e 3,podem ser implementadas outras alterações de sinais com referênciaaos coeficientes de janela correspondentes aos índices 128 a 255 e384 a 511 (multiplicação por fator (-1)). Em outras palavras, oscoeficientes de janela da função janela se baseiam noscoeficientes de janela dados na tabela do Anexo 1. Para obter oscoeficientes de janela da função janela mostrados nas figuras, oscoeficientes de janela na tabela correspondente aos índices 0 a127, 256 a 383 e 512 a 639 devem ser multiplicados por ( + 1) (istoé, sem alteração de sinal) e os coeficientes de janelacorrespondentes aos índices 128 a 255 e 384 a 511 devem sermultiplicados por (-1) (isto é, uma alteração de sinal) para obteros coeficientes de janela da função janela mostrada. Da mesma formaas relações dadas na tabela do Anexo 3 devem ser tratadas da mesma forma.
Deve ser notado, que na estrutura do presentepedido de acordo com uma equação baseada em uma equação, estácompreendida uma introdução de retardos adicionais, fatores,outros coeficientes e a introdução de outras funções simples.Depois, podem ser abandonadas as constantes simples, adendos deconstantes, etc. Mais ainda, também estão incluídas transformaçõesalgébri cas, transformações de equivalência e aproximações (porexemplo, uma aproximação de Taylor) não alterando o resultado daequação de nenhuma maneira ou de maneira significativa. Em outraspalavras, tanto pequenas modificações assim como transformaçõesque conduzam essencialmente em termos de um resultado idênticoestão incluídas no caso em que uma equação ou expressão estejabaseada em uma equação ou expressão.
Apesar de o exposto ter sido particularmentemostrado e descrito com referência a suas configuraçõesparticulares, será compreendido pelos peritos na técnica quevárias outras alterações de forma e detalhes podem ser feitas semabandonar seu espírito e escopo. Deve ser compreendido que váriasalterações podem ser feitas na adaptação a diferentesconfigurações sem abandonar o mais amplo conceito ora revelado econtido pelas reivindicações a seguir.
Claims (23)
1. Equipamento para a geração de valores de sub-banda de áudio em canais de sub-banda de áudio, compreendendo: umjanelador de análise (110) para o janelamento de um frame (120) deamostras de entrada de áudio no domínio do tempo, sendo em umaseqüência temporal que se estende de uma amostra prévia para umaamostra posterior usando uma função janela de análise (190),compreendendo uma seqüência de coeficientes de janela para aobtenção de amostras janeladas, a função janela de análisecompreendendo um primeiro número de coeficientes de janela obtidosde uma maior função janela compreendendo uma seqüência de um maiorsegundo número de coeficientes de janela, caracterizado pelo fatode que os coeficientes de janela da função janela são obtidos poruma interpolação de coeficientes de janela da maior função janela;e onde o segundo número é um número par; e um calculador (170)para o cálculo dos valores de sub-banda de áudio usando asamostras janeladas.
2. Equipamento (100), de acordo com areivindicação 1, caracterizado pelo fato de que o equipamento(100) está adaptado para interpolar os coeficientes de janela damaior função janela para obter os coeficientes de janela da funçãojanela.
3. Equipamento (100), de acordo com qualquer umadas reivindicações anteriores, caracterizado pelo fato de que oequipamento (100) ou o janelador de análise (110) está adaptado demaneira que os coeficientes de janela da função janela sejaminterpolados linearmente.
4. Equipamento (100), de acordo com qualquer umadas reivindicações anteriores, caracterizado pelo fato de que oequipamento (100) ou o janelador de análise (110) está adaptado demaneira que os coeficientes de janela da função janela de análisesão interpolados com base em dois coeficientes consecutivos dejanela da maior função janela de acordo com a seqüência doscoeficientes de janela da maior função janela, para obter umcoeficiente de janela da função janela.
5. Equipamento (100), de acordo com qualquer umadas reivindicações anteriores, caracterizado pelo fato de que oequipamento (100) ou o janelador de análise (110) está adaptado demaneira a obter os coeficientes de janela c(n) da função janela deanálise com base na equaçãoΦ) = I (ca(2n) + C2 (2n + l)),onde η é um número inteiro que indica um índicedos coeficientes de janela c(n), e c2(n) é um coeficiente dejanela da maior função janela.
6. Equipamento (100), de acordo com areivindicação 5, caracterizado pelo fato de que o equipamento(100) ou o janelador de análise (110) está adaptado de maneira queos coeficientes de janela C2 (n) da maior função janela obedeçam àsrelações dadas na tabela do Anexo 4.
7. Equipamento (100), de acordo com qualquer umadas reivindicações anteriores, caracterizado pelo fato de que ojanelador de análise (110) está adaptado de maneira que ojanelamento compreende a multiplicação das amostras de entrada deáudio no domínio do tempo x(n) do frame (12 0) para obter asamostras janeladas ζ(η) do frame janelado com base na equaçãoz(n) = x(n) . c(n)onde η é um número inteiro que indica um índiceda seqüência de coeficientes de janela na faixa de 0 a T · N-I,onde c (n) é o coeficiente de janela da função janela de análisecorrespondente ao índice n, onde x(N · T-1) é a última amostra deentrada de áudio no domínio do tempo de um frame (12 0) de amostrasde entrada de áudio no domínio do tempo, onde o janelador deanálise (110) está adaptado de maneira que o frame (120) deamostras de entrada de áudio no domínio do tempo compreende umaseqüência de T blocos (130) de amostras de entrada de áudio nodomínio do tempo que se prolonga da mais anterior até a maisposterior das amostras de entrada de áudio no domínio do tempo doframe (120), cada bloco compreendendo N amostras de entrada deáudio no domínio do tempo, e onde TeN são inteiros positivos e Té maior que 4.
8. Equipamento (100), de acordo com qualquer umadas reivindicações anteriores, caracterizado pelo fato de que ojanelador de análise (110) está adaptado de maneira que a funçãojanela de análise (190) compreende um primeiro grupo (200) decoeficientes de janela compreendendo uma primeira porção daseqüência de coeficientes de janela e um segundo grupo (210) decoeficientes de janela compreendendo uma segunda porção daseqüência de coeficientes de janela, onde a primeira porçãocompreende menos coeficientes de janela que a segunda porção, ondeum valor de energia dos coeficientes de janela na primeira porçãoé maior que um valor de energia dos coeficientes de janela dasegunda porção, e onde o primeiro grupo de coeficientes de janelaé usado para o janelamento posterior das amostras no domínio dotempo e o segundo grupo de coeficientes de janela é usado para ojanelamento das amostras mais anteriores no domínio do tempo.
9. Equipamento, de acordo com qualquer uma dasreivindicações anteriores, caracterizado pelo fato de que oequipamento (100) está adaptado para usar uma função janela deanálise (190) sendo uma versão de tempo reverso ou do índicereverso da função de janela de síntese (370) a ser usado para osvalores de sub-banda de áudio.
10. Equipamento (100), de acordo com qualquer umadas reivindicações anteriores, caracterizado pelo fato de que umjanelador de análise (110) está adaptado de maneira que a maiorfunção janela ê assimétrica com referência à seqüência decoeficientes de janela.
11. Equipamento (300) para a geração de amostrasde áudio no domínio do tempo, compreendendo: um calculador (310)para o cálculo da seqüência (330) de amostras intermediárias nodomínio do tempo a partir de valores de sub-banda de áudio noscanais de sub-banda de áudio, a seqüência compreendendo amostrasmais anteriores intermediárias no domínio do tempo e amostras maisposteriores no domínio do tempo; um janelador de síntese (360)para o janelamento da seqüência (330) de amostras intermediáriasno domínio do tempo usando uma função de janela de síntese (370)compreendendo uma seqüência de coeficientes de janela para obteramostras janeladas intermediárias no domínio do tempo, a função dejanela de síntese compreendendo um primeiro número de coeficientesde janela obtidos de uma maior função janela compreendendo umaseqüência de um maior segundo número de coeficientes de janela,caracterizado pelo fato de que os coeficientes de janela da funçãojanela são obtidos por uma interpolação de coeficientes de janelada maior função janela; e onde o segundo número é par; e umestágio de saída de adição de sobrepasso (400) para oprocessamento das amostras janeladas intermediárias no domínio dotempo de maneira a obter amostras no domínio do tempo.
12. Equipamento (300), de acordo com areivindicação 11, caracterizado pelo fato de que o equipamento(300) é adaptado para interpolar os coeficientes de janela damaior função janela para obter os coeficientes de janela da funçãojanela.
13. Equipamento (300), de acordo com qualquer umadas reivindicações 11 ou 12, caracterizado pelo fato de que oequipamento (300) está adaptado de maneira que os coeficientes dejanela da função de janela de síntese sejam interpoladoslinearmente.
14. Equipamento (300), de acordo com qualquer umadas reivindicações de 11 a 13, caracterizado pelo fato de que oequipamento (300) está adaptado de maneira que os coeficientes dejanela da função de janela de síntese são interpolados com base emdois coeficientes consecutivos de janela da maior função janela deacordo com a seqüência de coeficientes de janela da maior funçãojanela para obter um coeficiente de janela da função janela.
15. Equipamento (300), de acordo com qualquer umadas reivindicações de 11 a 14, caracterizado pelo fato de que oequipamento (300) está adaptado para obter os coeficientes dejanela c(n) da função de janela de síntese com base na equaçãoc(n) = i (ca(2n) + c2(2n + l)),onde C2 (n) são coeficientes de janela de umamaior função janela correspondente ao índice n.
16. Equipamento (300), de acordo com areivindicação 15, caracterizado pelo fato de que o equipamento(300) está adaptado de maneira que os coeficientes de janela c2 (n)obedecem as relações dadas na tabela do Anexo 4.
17. Equipamento (3 00), de acordo com qualquer umadas reivindicações de 11 a 16, caracterizado pelo fato de que ajanela de síntese (360) está adaptada de maneira que o janelamentocompreende a multiplicação das amostras intermediárias no domíniodo tempo g(n) da seqüência de amostras intermediárias no domíniodo tempo para obter as amostras janeladas ζ (η) do frame janelado(380) com base na equação<formula>formula see original document page 140</formula>
18. Equipamento (300), de acordo com qualquer umadas reivindicações de 11 a 17, caracterizado pelo fato de que ojanelador de síntese (360) está adaptado de maneira que a funçãode janela de síntese (370) compreende um primeiro grupo (420) decoeficientes de janela compreendendo uma primeira porção daseqüência de coeficientes de janela e um segundo grupo (430) decoeficientes de janela compreendendo uma segunda porção daseqüência de coeficientes de janela, a primeira porçãocompreendendo menos coeficientes de janela que a segunda porção,onde um valor de energia dos coeficientes de janela na primeiraporção é maior que um valor da energia dos coeficientes de janelada segunda porção, e onde o primeiro grupo de coeficientes dejanela é usado para o janelamento posterior das amostrasintermediárias no domínio do tempo e o segundo grupo decoeficientes de janela é usado para o janelamento prévio dasamostras intermediárias no domínio do tempo.
19. Equipamento (300), de acordo com qualquer umadas reivindicações de 11 a 18, caracterizado pelo fato de que oequipamento (300) está adaptado de maneira para usar uma função dejanela de sínte se (370) sendo uma versão de tempo reverso ou deíndice reverso de uma função janela de análise (190) usada para ageração de valores de sub-banda de áudio.
20. Equipamento (300), de acordo com qualquer umadas reivindicações de 11 a 19, caracterizado pelo fato de que ojanelador de síntese (360) está adaptado de maneira que a maiorfunção janela é assimétrica com referência a uma seqüência decoeficientes de janela.
21. Método para a geração de valores de sub-banda de áudio em canais de sub-banda de áudio,compreendendo: janelamento de um frame de amostras de entradade áudio no domínio do tempo estando em uma seqüênciatemporal que se estende de uma amostra prévia para umaamostra posterior usando uma função janela de análise paraobter amostras janeladas, a função janela de análisecompreendendo um primeiro número de coeficientes de janela obtidosa partir de uma maior função janela compreendendo uma seqüência deum maior segundo número de coeficientes de janela, caracterizadopelo fato de que os coeficientes de janela da função janela sãoobtidos por uma interpolação pelos coeficientes de janela da maiorfunção janela; e onde o segundo número é um número par; e calcularos valores de sub-banda de áudio usando as amostras janeladas.
22. Método para a geração de amostras de áudio nodomínio do tempo, compreendendo: calcular uma seqüência deamostras intermediárias no domínio do tempo a partir de valores desub-banda de áudio em canais de sub-banda de áudio, a seqüênciacompreendendo amostras prévias intermediárias no domínio do tempoe amostras posteriores intermediárias no domínio do tempo;janelamento da seqüência de amostras intermediárias no domínio dotempo usando uma função de janela de síntese para obter amostrasjaneladas no domínio do tempo, a função de janela de síntesecompreendendo um primeiro número de coeficientes de janela obtidasa partir de uma maior função janela compreendendo a seqüência deum maior segundo número de coeficientes de janela, caracterizadopelo fato de que os coeficientes de janela da função janela sãoobtidos por uma interpolação de coeficientes de janela da maiorfunção janela; e onde o segundo número é par; e adição desobrepasso das amostras janeladas no domínio do tempo para obteras amostras no domínio do tempo.
23. Programa com um código de programas para aexecução, caracterizado pelo fato de que opera em um processador,de um método de acordo com a reivindicação 21 ou de acordo com areivindicação 22.<table>table see original document page 0</column></row><table><table>table see original document page 11</column></row><table><table>table see original document page 12</column></row><table><table>table see original document page 13</column></row><table><table>table see original document page 14</column></row><table><table>table see original document page 15</column></row><table><table>table see original document page 16</column></row><table><table>table see original document page 150</column></row><table><table>table see original document page 18</column></row><table><table>table see original document page 152</column></row><table><table>table see original document page 20</column></row><table><table>table see original document page 21</column></row><table><table>table see original document page 155</column></row><table><table>table see original document page 156</column></row><table><table>table see original document page 157</column></row><table><table>table see original document page 158</column></row><table><table>table see original document page 159</column></row><table><table>table see original document page 160</column></row><table><table>table see original document page 28</column></row><table><table>table see original document page 162</column></row><table><table>table see original document page 163</column></row><table><table>table see original document page 164</column></row><table><table>table see original document page 165</column></row><table><table>table see original document page 166</column></row><table><table>table see original document page 167</column></row><table><table>table see original document page 168</column></row><table><table>table see original document page 169</column></row><table>Anexo 4 <table>table see original document page 170</column></row><table><table>table see original document page 171</column></row><table><table>table see original document page 172</column></row><table><table>table see original document page 173</column></row><table><table>table see original document page 174</column></row><table><table>table see original document page 175</column></row><table><table>table see original document page 176</column></row><table><table>table see original document page 177</column></row><table><table>table see original document page 178</column></row><table><table>table see original document page 179</column></row><table><table>table see original document page 180</column></row><table><table>table see original document page 181</column></row><table><table>table see original document page 182</column></row><table><table>table see original document page 183</column></row><table><table>table see original document page 184</column></row><table><table>table see original document page 185</column></row><table><table>table see original document page 186</column></row><table>
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US86295406P | 2006-10-25 | 2006-10-25 | |
| US60/862,954 | 2006-10-25 | ||
| PCT/EP2007/009200 WO2008049590A1 (en) | 2006-10-25 | 2007-10-23 | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| BRPI0709310A2 true BRPI0709310A2 (pt) | 2011-07-05 |
| BRPI0709310B1 BRPI0709310B1 (pt) | 2019-11-05 |
Family
ID=39048961
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0716315A BRPI0716315A2 (pt) | 2006-10-25 | 2007-10-23 | aparelhagem e método para gerar valores de sub-banda de áudio e aparelhagem e método para gerar amostras de áudio de domínio de tempo |
| BRPI0709310-1A BRPI0709310B1 (pt) | 2006-10-25 | 2007-10-23 | equipamento e método para a geração de valores de sub-banda de áudio e equipamento e método para a geração de amostras de áudio no domínio do tempo |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0716315A BRPI0716315A2 (pt) | 2006-10-25 | 2007-10-23 | aparelhagem e método para gerar valores de sub-banda de áudio e aparelhagem e método para gerar amostras de áudio de domínio de tempo |
Country Status (25)
| Country | Link |
|---|---|
| US (12) | USRE50009E1 (pt) |
| EP (10) | EP3848928B1 (pt) |
| JP (2) | JP4936569B2 (pt) |
| KR (2) | KR100957711B1 (pt) |
| CN (2) | CN101606194B (pt) |
| AR (2) | AR063400A1 (pt) |
| AT (1) | ATE435480T1 (pt) |
| AU (2) | AU2007308416B2 (pt) |
| BR (2) | BRPI0716315A2 (pt) |
| CA (2) | CA2645618C (pt) |
| DE (1) | DE602007001460D1 (pt) |
| DK (2) | DK3848928T3 (pt) |
| ES (10) | ES2993633T3 (pt) |
| FI (1) | FI3848928T3 (pt) |
| HU (5) | HUE068021T2 (pt) |
| IL (2) | IL193786A (pt) |
| MX (2) | MX2008011898A (pt) |
| MY (2) | MY142520A (pt) |
| NO (3) | NO341567B1 (pt) |
| PL (10) | PL4300824T3 (pt) |
| PT (5) | PT1994530E (pt) |
| RU (2) | RU2411645C2 (pt) |
| TW (2) | TWI357065B (pt) |
| WO (2) | WO2008049590A1 (pt) |
| ZA (2) | ZA200810308B (pt) |
Families Citing this family (76)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8126721B2 (en) * | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| BRPI0716315A2 (pt) | 2006-10-25 | 2017-05-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | aparelhagem e método para gerar valores de sub-banda de áudio e aparelhagem e método para gerar amostras de áudio de domínio de tempo |
| USRE50158E1 (en) | 2006-10-25 | 2024-10-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
| WO2008072524A1 (ja) * | 2006-12-13 | 2008-06-19 | Panasonic Corporation | オーディオ信号符号化方法及び復号化方法 |
| US8214200B2 (en) * | 2007-03-14 | 2012-07-03 | Xfrm, Inc. | Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid |
| DE602008005250D1 (de) * | 2008-01-04 | 2011-04-14 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
| EP2261896B1 (en) * | 2008-07-29 | 2017-12-06 | Yamaha Corporation | Performance-related information output device, system provided with performance-related information output device, and electronic musical instrument |
| EP2770751B1 (en) * | 2008-07-30 | 2017-09-06 | Yamaha Corporation | Audio signal processing device, audio signal processing system, and audio signal processing method |
| US9384748B2 (en) | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
| HUE064653T2 (hu) * | 2008-12-15 | 2024-04-28 | Fraunhofer Ges Forschung | Audió sávszélesség kiterjesztés dekódoló, megfelelõ eljárás és számítógépi program |
| ES2906255T3 (es) | 2009-01-28 | 2022-04-13 | Dolby Int Ab | Transposición armónica mejorada |
| PL3246919T3 (pl) | 2009-01-28 | 2021-03-08 | Dolby International Ab | Ulepszona transpozycja harmonicznych |
| TWI559679B (zh) | 2009-02-18 | 2016-11-21 | 杜比國際公司 | 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法 |
| US8392200B2 (en) | 2009-04-14 | 2013-03-05 | Qualcomm Incorporated | Low complexity spectral band replication (SBR) filterbanks |
| JP5265008B2 (ja) * | 2009-06-29 | 2013-08-14 | 三菱電機株式会社 | オーディオ信号処理装置 |
| CN101958119B (zh) * | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
| FR2949582B1 (fr) * | 2009-09-02 | 2011-08-26 | Alcatel Lucent | Procede pour rendre un signal musical compatible avec un codec a transmission discontinue ; et dispositif pour la mise en ?uvre de ce procede |
| KR101405022B1 (ko) | 2009-09-18 | 2014-06-10 | 돌비 인터네셔널 에이비 | 입력 신호를 전위시키기 위한 시스템 및 방법, 상기 방법을 수행하는 소프트웨어 프로그램 및 컴퓨터 프로그램 제품을 포함하는 저장 매체 |
| PL4152320T3 (pl) | 2009-10-21 | 2024-02-19 | Dolby International Ab | Nadpróbkowanie w banku filtrów połączonym z modułem transpozycji |
| JP5575149B2 (ja) * | 2009-11-30 | 2014-08-20 | 三菱電機株式会社 | 分波装置、合波装置および中継装置 |
| MY210338A (en) | 2010-01-19 | 2025-09-12 | Dolby Int Ab | Subband block based harmonic transposition |
| JP5782677B2 (ja) | 2010-03-31 | 2015-09-24 | ヤマハ株式会社 | コンテンツ再生装置および音声処理システム |
| EP2559029B1 (en) * | 2010-04-13 | 2019-01-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and encoder and decoder for gap-less playback of an audio signal |
| US9443534B2 (en) | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
| DK2765572T3 (da) | 2010-07-19 | 2017-11-06 | Dolby Int Ab | Behandling af audiosignaler under højfrekvens-rekonstruktion |
| US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
| CN101908342B (zh) * | 2010-07-23 | 2012-09-26 | 北京理工大学 | 利用频域滤波后处理进行音频暂态信号预回声抑制的方法 |
| US8755460B2 (en) * | 2010-07-30 | 2014-06-17 | National Instruments Corporation | Phase aligned sampling of multiple data channels using a successive approximation register converter |
| US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
| FR2969804A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Filtrage perfectionne dans le domaine transforme. |
| EP2676266B1 (en) | 2011-02-14 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based coding scheme using spectral domain noise shaping |
| AR085218A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio |
| PL2676267T3 (pl) | 2011-02-14 | 2017-12-29 | Fraunhofergesellschaft Zur Förderung Der Angewandten Forschung E V | Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio |
| AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
| AR085362A1 (es) * | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral |
| ES2458436T3 (es) * | 2011-02-14 | 2014-05-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Representación de señal de información utilizando transformada superpuesta |
| FR2977439A1 (fr) * | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
| FR2977969A1 (fr) * | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
| EP2573761B1 (en) | 2011-09-25 | 2018-02-14 | Yamaha Corporation | Displaying content in relation to music reproduction by means of information processing apparatus independent of music reproduction apparatus |
| USRE48258E1 (en) | 2011-11-11 | 2020-10-13 | Dolby International Ab | Upsampling using oversampled SBR |
| JP5494677B2 (ja) | 2012-01-06 | 2014-05-21 | ヤマハ株式会社 | 演奏装置及び演奏プログラム |
| EP2717265A1 (en) * | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution in spatial-audio-object-coding |
| DK3125239T3 (da) | 2013-02-05 | 2019-08-19 | Ericsson Telefon Ab L M | Fremgangsmåde og indretning til styring af maskering af audiorammetab |
| KR102450178B1 (ko) | 2013-04-05 | 2022-10-06 | 돌비 인터네셔널 에이비 | 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더 |
| TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
| BR122020017853B1 (pt) | 2013-04-05 | 2023-03-14 | Dolby International Ab | Sistema e aparelho para codificar um sinal de voz em um fluxo de bits, e método e aparelho para decodificar sinal de áudio |
| US10893488B2 (en) | 2013-06-14 | 2021-01-12 | Microsoft Technology Licensing, Llc | Radio frequency (RF) power back-off optimization for specific absorption rate (SAR) compliance |
| EP2830065A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
| BR112016005167B1 (pt) * | 2013-09-12 | 2021-12-28 | Dolby International Ab | Decodificador de áudio, codificador de áudio e método para alinhamento no tempo de dados de processamento baseados em qmf |
| KR102159990B1 (ko) | 2013-09-17 | 2020-09-25 | 주식회사 윌러스표준기술연구소 | 멀티미디어 신호 처리 방법 및 장치 |
| CN105900455B (zh) | 2013-10-22 | 2018-04-06 | 延世大学工业学术合作社 | 用于处理音频信号的方法和设备 |
| KR102244613B1 (ko) * | 2013-10-28 | 2021-04-26 | 삼성전자주식회사 | Qmf 필터링 방법 및 이를 수행하는 장치 |
| WO2015099429A1 (ko) | 2013-12-23 | 2015-07-02 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치 |
| EP3122073B1 (en) | 2014-03-19 | 2023-12-20 | Wilus Institute of Standards and Technology Inc. | Audio signal processing method and apparatus |
| US9848275B2 (en) | 2014-04-02 | 2017-12-19 | Wilus Institute Of Standards And Technology Inc. | Audio signal processing method and device |
| KR102503347B1 (ko) * | 2014-06-10 | 2023-02-23 | 엠큐에이 리미티드 | 오디오 신호의 디지털 캡슐화 |
| WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
| TWI890652B (zh) * | 2015-03-13 | 2025-07-11 | 瑞典商杜比國際公司 | 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體 |
| EP3107096A1 (en) * | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
| US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
| WO2017050398A1 (en) | 2015-09-25 | 2017-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding |
| MX386551B (es) * | 2016-03-07 | 2025-03-19 | Fraunhofer Ges Forschung | Unidad de ocultamiento de error, decodificador de audio, y método relacionado y programa de computadora que usa características de una representación decodificada de una trama de audio decodificada apropiadamente. |
| US10770082B2 (en) * | 2016-06-22 | 2020-09-08 | Dolby International Ab | Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain |
| EP3276620A1 (en) | 2016-07-29 | 2018-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis |
| US10224974B2 (en) | 2017-03-31 | 2019-03-05 | Microsoft Technology Licensing, Llc | Proximity-independent SAR mitigation |
| TWI681384B (zh) * | 2018-08-01 | 2020-01-01 | 瑞昱半導體股份有限公司 | 音訊處理方法與音訊等化器 |
| US12579987B2 (en) | 2019-02-21 | 2026-03-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods for frequency domain packet loss concealment and related decoder |
| AU2020233210B2 (en) | 2019-03-06 | 2023-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downmixer and method of downmixing |
| TWI866996B (zh) | 2019-06-26 | 2024-12-21 | 美商杜拜研究特許公司 | 具有改善頻率解析度的低延遲音訊濾波器組 |
| CN112447166B (zh) * | 2019-08-16 | 2024-09-10 | 阿里巴巴集团控股有限公司 | 一种针对目标频谱矩阵的处理方法及装置 |
| EP3786948A1 (en) * | 2019-08-28 | 2021-03-03 | Fraunhofer Gesellschaft zur Förderung der Angewand | Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar |
| CN120475316A (zh) | 2019-09-03 | 2025-08-12 | 杜比实验室特许公司 | 具有解相关分量的音频滤波器组 |
| CN111402917B (zh) * | 2020-03-13 | 2023-08-04 | 北京小米松果电子有限公司 | 音频信号处理方法及装置、存储介质 |
| EP4682877A3 (en) | 2020-06-11 | 2026-03-04 | Dolby International AB | Frame loss concealment for a low-frequency effects channel |
| US11632147B2 (en) * | 2020-08-13 | 2023-04-18 | Marvell Asia Pte, Ltd. | Simplified frequency-domain filter adaptation window |
| CN114007176B (zh) * | 2020-10-09 | 2023-12-19 | 上海又为智能科技有限公司 | 用于降低信号延时的音频信号处理方法、装置及存储介质 |
Family Cites Families (41)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US351882A (en) | 1886-11-02 | Thill-coupling | ||
| US3666543A (en) | 1969-11-24 | 1972-05-30 | Ludwig Maier | Tris-(2-hydroxyalkyl)-phosphine oxide flame retardant articles |
| HU214139B (en) | 1989-05-17 | 1997-12-29 | Thomson Consumer Electronics | Process for transmitting a signal |
| CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
| JP3277682B2 (ja) | 1994-04-22 | 2002-04-22 | ソニー株式会社 | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法 |
| KR100346734B1 (ko) | 1995-09-22 | 2002-11-23 | 삼성전자 주식회사 | 고속분석필터및합성필터를구비한오디오부호화기및복호화기 |
| US5819215A (en) | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
| AU6044398A (en) | 1997-01-27 | 1998-08-26 | Entropic Research Laboratory, Inc. | A system and methodology for prosody modification |
| JP3065067B2 (ja) * | 1998-03-04 | 2000-07-12 | 韓國電氣通信公社 | Mpegオ―ディオ多チャンネル処理用等間隔サブバンド分析フィルタ及び合成フィルタ |
| FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
| US6226608B1 (en) | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
| US6510407B1 (en) | 1999-10-19 | 2003-01-21 | Atmel Corporation | Method and apparatus for variable rate coding of speech |
| SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
| US6718300B1 (en) | 2000-06-02 | 2004-04-06 | Agere Systems Inc. | Method and apparatus for reducing aliasing in cascaded filter banks |
| US6748363B1 (en) | 2000-06-28 | 2004-06-08 | Texas Instruments Incorporated | TI window compression/expansion method |
| JP2002091499A (ja) | 2000-06-14 | 2002-03-27 | Texas Instruments Inc | ウインドウ圧縮/伸張方法 |
| EP1199711A1 (en) | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
| US6996198B2 (en) | 2000-10-27 | 2006-02-07 | At&T Corp. | Nonuniform oversampled filter banks for audio signal processing |
| US6707869B1 (en) | 2000-12-28 | 2004-03-16 | Nortel Networks Limited | Signal-processing apparatus with a filter of flexible window design |
| SE0101175D0 (sv) * | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
| US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
| US7400651B2 (en) | 2001-06-29 | 2008-07-15 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal |
| JP4012506B2 (ja) | 2001-08-24 | 2007-11-21 | 株式会社ケンウッド | 信号の周波数成分を適応的に補間するための装置および方法 |
| DE10228103A1 (de) | 2002-06-24 | 2004-01-15 | Bayer Cropscience Ag | Fungizide Wirkstoffkombinationen |
| EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
| SE0301273D0 (sv) | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
| JP3876850B2 (ja) | 2003-06-02 | 2007-02-07 | ヤマハ株式会社 | アレースピーカーシステム |
| US7563748B2 (en) | 2003-06-23 | 2009-07-21 | Cognis Ip Management Gmbh | Alcohol alkoxylate carriers for pesticide active ingredients |
| EP1513137A1 (en) | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
| TWI227866B (en) | 2003-11-07 | 2005-02-11 | Mediatek Inc | Subband analysis/synthesis filtering method |
| CN1270290C (zh) * | 2003-11-26 | 2006-08-16 | 联发科技股份有限公司 | 子带分析/合成滤波方法 |
| CN100573666C (zh) * | 2003-11-26 | 2009-12-23 | 联发科技股份有限公司 | 子带分析/合成滤波方法 |
| CN1914669A (zh) | 2004-01-28 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 使用复数值数据的音频信号解码 |
| CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
| RU2346996C2 (ru) | 2004-06-29 | 2009-02-20 | ЮРОПИЭН НИКЕЛЬ ПиЭлСи | Усовершенствованное выщелачивание основных металлов |
| JP5129117B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
| US7774396B2 (en) | 2005-11-18 | 2010-08-10 | Dynamic Hearing Pty Ltd | Method and device for low delay processing |
| US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
| US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
| BRPI0716315A2 (pt) | 2006-10-25 | 2017-05-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | aparelhagem e método para gerar valores de sub-banda de áudio e aparelhagem e método para gerar amostras de áudio de domínio de tempo |
| TW200922334A (en) | 2007-11-02 | 2009-05-16 | Univ Nat Chunghsing | Low complexity frequency field motion estimation method adapted to wavelet video coding |
-
2007
- 2007-10-23 BR BRPI0716315A patent/BRPI0716315A2/pt active IP Right Grant
- 2007-10-23 PL PL23210953.8T patent/PL4300824T3/pl unknown
- 2007-10-23 ES ES23210978T patent/ES2993633T3/es active Active
- 2007-10-23 WO PCT/EP2007/009200 patent/WO2008049590A1/en not_active Ceased
- 2007-10-23 RU RU2008137468/09A patent/RU2411645C2/ru active
- 2007-10-23 MY MYPI20091422A patent/MY142520A/en unknown
- 2007-10-23 US US17/845,375 patent/USRE50009E1/en active Active
- 2007-10-23 KR KR1020087023021A patent/KR100957711B1/ko active Active
- 2007-10-23 US US17/845,435 patent/USRE50015E1/en active Active
- 2007-10-23 PL PL17169583T patent/PL3288027T3/pl unknown
- 2007-10-23 KR KR1020097008382A patent/KR101056253B1/ko active Active
- 2007-10-23 RU RU2009119456/09A patent/RU2420815C2/ru active
- 2007-10-23 ES ES09010010T patent/ES2834024T3/es active Active
- 2007-10-23 PL PL23210951.2T patent/PL4325723T3/pl unknown
- 2007-10-23 WO PCT/EP2007/009199 patent/WO2008049589A1/en not_active Ceased
- 2007-10-23 US US17/845,520 patent/USRE50157E1/en active Active
- 2007-10-23 PL PL23210959.5T patent/PL4325724T3/pl unknown
- 2007-10-23 HU HUE23210953A patent/HUE068021T2/hu unknown
- 2007-10-23 MX MX2008011898A patent/MX2008011898A/es active IP Right Grant
- 2007-10-23 AU AU2007308416A patent/AU2007308416B2/en active Active
- 2007-10-23 EP EP21160250.3A patent/EP3848928B1/en active Active
- 2007-10-23 AU AU2007308415A patent/AU2007308415B2/en active Active
- 2007-10-23 AT AT07819260T patent/ATE435480T1/de active
- 2007-10-23 DK DK21160250.3T patent/DK3848928T3/da active
- 2007-10-23 JP JP2009533722A patent/JP4936569B2/ja active Active
- 2007-10-23 PT PT07819260T patent/PT1994530E/pt unknown
- 2007-10-23 PT PT211602503T patent/PT3848928T/pt unknown
- 2007-10-23 US US17/845,564 patent/USRE50054E1/en active Active
- 2007-10-23 PT PT90100108T patent/PT2109098T/pt unknown
- 2007-10-23 PL PL23157260.3T patent/PL4207189T3/pl unknown
- 2007-10-23 PL PL07819260T patent/PL1994530T3/pl unknown
- 2007-10-23 US US17/845,407 patent/USRE50194E1/en active Active
- 2007-10-23 FI FIEP21160250.3T patent/FI3848928T3/fi active
- 2007-10-23 PL PL21160250.3T patent/PL3848928T3/pl unknown
- 2007-10-23 EP EP23210959.5A patent/EP4325724B1/en active Active
- 2007-10-23 EP EP23210978.5A patent/EP4300825B1/en active Active
- 2007-10-23 PL PL09010010T patent/PL2109098T3/pl unknown
- 2007-10-23 CA CA2645618A patent/CA2645618C/en active Active
- 2007-10-23 EP EP23210951.2A patent/EP4325723B1/en active Active
- 2007-10-23 PT PT78192598T patent/PT2076901T/pt unknown
- 2007-10-23 MY MYPI20083406A patent/MY148715A/en unknown
- 2007-10-23 EP EP07819260A patent/EP1994530B1/en active Active
- 2007-10-23 MX MX2009004477A patent/MX2009004477A/es active IP Right Grant
- 2007-10-23 BR BRPI0709310-1A patent/BRPI0709310B1/pt active IP Right Grant
- 2007-10-23 HU HUE23210951A patent/HUE068022T2/hu unknown
- 2007-10-23 US US12/447,126 patent/US8452605B2/en active Active
- 2007-10-23 ES ES23210953T patent/ES2993632T3/es active Active
- 2007-10-23 EP EP23210953.8A patent/EP4300824B1/en active Active
- 2007-10-23 PL PL07819259T patent/PL2076901T3/pl unknown
- 2007-10-23 ES ES21160250T patent/ES2947516T3/es active Active
- 2007-10-23 EP EP07819259.8A patent/EP2076901B8/en active Active
- 2007-10-23 ES ES23157260T patent/ES2966657T3/es active Active
- 2007-10-23 HU HUE23210978A patent/HUE068326T2/hu unknown
- 2007-10-23 HU HUE23210959A patent/HUE068020T2/hu unknown
- 2007-10-23 EP EP09010010.8A patent/EP2109098B1/en active Active
- 2007-10-23 PL PL23210978.5T patent/PL4300825T3/pl unknown
- 2007-10-23 ES ES17169583T patent/ES2873254T3/es active Active
- 2007-10-23 JP JP2009500788A patent/JP5083779B2/ja active Active
- 2007-10-23 DE DE602007001460T patent/DE602007001460D1/de active Active
- 2007-10-23 ES ES23210959T patent/ES2992734T3/es active Active
- 2007-10-23 US US17/845,632 patent/USRE50159E1/en active Active
- 2007-10-23 US US12/293,532 patent/US8438015B2/en not_active Ceased
- 2007-10-23 DK DK07819260T patent/DK1994530T3/da active
- 2007-10-23 ES ES23210951T patent/ES2996584T3/es active Active
- 2007-10-23 ES ES07819260T patent/ES2328187T3/es active Active
- 2007-10-23 HU HUE23157260A patent/HUE064482T2/hu unknown
- 2007-10-23 CN CN2007800398996A patent/CN101606194B/zh active Active
- 2007-10-23 CN CN2007800097359A patent/CN101405791B/zh active Active
- 2007-10-23 US US17/845,503 patent/USRE50144E1/en active Active
- 2007-10-23 PT PT171695836T patent/PT3288027T/pt unknown
- 2007-10-23 CA CA2667505A patent/CA2667505C/en active Active
- 2007-10-23 EP EP17169583.6A patent/EP3288027B1/en active Active
- 2007-10-23 ES ES07819259T patent/ES2631906T3/es active Active
- 2007-10-23 EP EP23157260.3A patent/EP4207189B1/en active Active
- 2007-10-23 US US17/845,465 patent/USRE50132E1/en active Active
- 2007-10-23 US US17/845,607 patent/USRE49999E1/en active Active
- 2007-10-25 AR ARP070104739A patent/AR063400A1/es active IP Right Grant
- 2007-10-25 TW TW096140028A patent/TWI357065B/zh active
- 2007-10-25 TW TW096140030A patent/TWI355649B/zh active
- 2007-10-25 AR ARP070104728A patent/AR063394A1/es active IP Right Grant
-
2008
- 2008-08-31 IL IL193786A patent/IL193786A/en active IP Right Grant
- 2008-09-19 NO NO20084012A patent/NO341567B1/no unknown
- 2008-12-04 ZA ZA200810308A patent/ZA200810308B/xx unknown
-
2009
- 2009-03-30 ZA ZA200902199A patent/ZA200902199B/xx unknown
- 2009-04-05 IL IL197976A patent/IL197976A/en active IP Right Grant
- 2009-05-19 NO NO20091951A patent/NO341610B1/no unknown
-
2013
- 2013-01-15 US US13/742,246 patent/US8775193B2/en active Active
-
2017
- 2017-03-23 NO NO20170452A patent/NO342691B1/no unknown
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| BRPI0709310A2 (pt) | equipamento e método para a geração de valores de sub-banda de àudio e equipamento e método para a geração de amostras de áudio no domìnio do tempo | |
| USRE50158E1 (en) | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples | |
| HK40098915A (en) | Method for audio signal processing | |
| HK40098915B (en) | Method for audio signal processing | |
| HK40095320B (en) | Apparatus and method for generating time-domain audio samples | |
| HK40095320A (en) | Apparatus and method for generating time-domain audio samples | |
| HK40096196A (en) | Apparatus for audio signal processing | |
| HK40096196B (en) | Apparatus for audio signal processing | |
| HK40103958B (en) | Method for audio signal processing | |
| HK40103958A (en) | Method for audio signal processing | |
| HK1251073B (en) | Apparatus and method for generating complex-valued audio subband values | |
| HK1133115B (en) | Apparatus and method for generating time-domain audio samples |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B06T | Formal requirements before examination [chapter 6.20 patent gazette] |
Free format text: PARECER 6.20 |
|
| B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
| B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
| B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
| B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 05/11/2019, OBSERVADAS AS CONDICOES LEGAIS. |