BRPI0910511A2 - "aparelho e método para decodificação de um sinal de áudio codificado" - Google Patents
"aparelho e método para decodificação de um sinal de áudio codificado" Download PDFInfo
- Publication number
- BRPI0910511A2 BRPI0910511A2 BRPI0910511-5A BRPI0910511A BRPI0910511A2 BR PI0910511 A2 BRPI0910511 A2 BR PI0910511A2 BR PI0910511 A BRPI0910511 A BR PI0910511A BR PI0910511 A2 BRPI0910511 A2 BR PI0910511A2
- Authority
- BR
- Brazil
- Prior art keywords
- signal
- algorithm
- frequency
- encoding
- encoded
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000004590 computer program Methods 0.000 claims description 9
- 230000001419 dependent effect Effects 0.000 claims description 5
- 230000007704 transition Effects 0.000 claims 29
- 230000009466 transformation Effects 0.000 claims 6
- 230000003595 spectral effect Effects 0.000 description 20
- 230000005284 excitation Effects 0.000 description 18
- 238000013139 quantization Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 15
- 238000001228 spectrum Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 206010021403 Illusion Diseases 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 244000089409 Erythrina poeppigiana Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
APARELHO E MÉTODO PARA DECODIFICAÇÃO DE UM SINAL DE ÁUDIO CODIFICADO.
Um aparelho para decodificar (100) um sinal de 5 áudio codificado (102) . Um primeiro decodificador (110a) decodifica uma primeira porção (104a), de acordo com um primeiro algoritmo de decodificação, para uma primeira porção de tempo do sinal codificado (102) para obter um primeiro sinal decodificado (114a) . Um segundo decodificador (110b) decodifica uma segunda porção (104b) , de acordo com um segundo algoritmo de decodificação, para urna segunda porção de tempo do sinal codificado (102) para obter urn segundo sinal decodificam (114b). Um módulo BWE (130) tem uma frequência cruzada (fx) controlável e está configurado para efetuar um algoritmo de extensão de largura de banda usando o primeiro sinal decodificado (114a) e parâmetros de BWE (106) para a primeira porção (104a), bem como para efetuar um algoritmo de extensão de largura de banda usando o segundo sinal decodificado (114b) e os parâmetros de extensão de largura de banda (106) para a segunda porção (104b). Um controlador (140) controla a frequência cruzada (fx) para o módulo BWE (130), de acordo com uma informação de modo de codificação (108).
Description
\Yf ', ;g:Ai , "APARELHO E MÉTODO PARA DECODIFICAÇÃO DE UM SINAL DE ÁUDIO CODIFICADO"
ESPECIFICAÇÃO A presente invenção se refere a um aparelho e a 5 um método para decodíficar um sinal de áudio codificado, um aparelho para codifícar, um rnétodo para codificação e um sinal- de áudio .
Na técnica, os esquemas de codificação de domínio de frequência, tais como MP3 ou AAC, são conhecidos . Os referidos 10 codif_icadorês "de" domínio de frequência são baseados em uma = " " conversão de dominio de tempo/dominio de frequência, uma etapa subseqüente de quantização, na qual o erro de quantização é "J controlado utilizando-se a informação proveniente do módulo ÁJ psicoacústico, bem como uma etapa de codíficação, na qual os - 15— coeficientes = espectrais "quanti"zados " e" a" infoFInaEão co1ateràl " respectiva são codificados por entropia utilizando-se tabelas de código.
3 Por outro lado, há codificadores que são bastante adequados para o processamento de faj-a, tais como AMR-WB+ , 20 conforme descrito em 3GPP TS 26.290. Os referidos esquemas de codificação de fala realizam uma filtragem Preditiva Linear de um sinal de domínio de tempo. A referida filtragem PL é derívada de uma análise de Predição Linear do sinal de entrada de domínio de tempo. Em seguida, os coeficientes do filtro de LP resultantes são 25 codificados e transmitídos como informação coIateral. O processo é conhecido como Codificação de predição Linear (LPC). Na saida do filtro, o sinal residual de predição ou sinal de erro de predição, que é conhecido também como sinal de excítação, é codificado
Ü. ,,¥'"( 2 usando-se as etapas de analysis-by-synthesis [análise pela síntese] do codificador ACELP ou, de modo alternativo, é codificado usando-se um codificador de transformadas que utiliza uma transformada de Fourier com uma sobreposição. A escolha entre 5 a codificação ACELP e a codíficação de excitação de Transformada Codificada, que também é denomínada codificação TCX, é realizada usando-se um algo-ritmo de circuito fechado ou de circuito aberto.
Os esquemas de codificação de áudio de domínio de frequência, tais como o esquema de codificação AAC de alta - 1.0- efici-ência, que _ combiná um" e S queniã de codi"f icação AAC e uma - L!- técniCa de replicação de largura de banda espectral, taríibém podem ser combinados a um joint stereo ou a uma ferramenta de — . codificação de múltiplos canais, que é conhecida pelo termo "MPEG ,b surround". Por outro lado, os códificadores de fala, tais como o ~- m ~ 15 ~AMR-WB+ , também têm uma· et-apa _de "aprimõràwentb dê al'ta Èrequência " e uma funcionalidade estéreo. 'k A referida replicação da banda espectral (SBR) D compreende uma técnica que ganhou popularidade como um add-on para a percepção popular de áudio codificado, tais como MP3, e a 20 codificação avançada de áudio (AAC). A SBR compreende um método de extensão de largura de banda (BWE) no qual a banda baixa (banda de base ou banda central) do espectro é codificada usando-se uma codificação existente, considerando que a banda superior (ou banda alta) é grosseiramente parametrizada usando-se alguns parâmetros.
25 A SBR faz uso de uma correlação entre a banda baixa e a banda alta, para prever o sinal de banda alta proveniente da extração das características da banda mais baixa.
A SBR é, por exemplo, usada em HE-AAC ou AAC+SBR.
X% ,,,a Ç;, 3 Na SBR, é possível alterar dinamicamente a frequência cruzada (frequência inicíal de BWE) , bem como a resolução temporal que significa o número de conjuntos de parâmetros (envelopes) por frame. O AMR-ÍÁ1B+ implementa uma extensão de largura de banda de 5 dornínio de tempo em combinação com um codificador central de dominio de tempo/frequência comutado, fornecendo boa qualidade de áudio, especialmente para sinais de fala. Uin fator íimitante para a qualidade de áudio do AMR-WB+ é a largura de banda de áudio comum para os dois codificadores centrais e a frequência inicial - 10 -- de- BWE que "é um q'uarto da f requênci"a '" de amostragem interna do
L '" sistema. Enquanto o modelo de fala ACELP é capaz de modelar os sínais de fala tão bem sobre a largura de banda total, o —, " " " " " "* co.di.ficador de áudio de dominio de frequência falha ao fornecer :b uma qualidade adequada para alguns sinais gerais de áudio. Assim, =— , m 15+ os' esquemas-de ·codific'açà'o de fa"1a ÍlíostraK uma alta qualidade pa'ra sinais de fala, inclusive em baixas taxas de bit, porém mostram 'E uma baixa qualidade para sinais de música em taxas de bit baixas.
Q Os esquemas de codificação de domínío de frequência, tais como HE-AAC, são vantajosos por mostrar uma alta 20 qualidade em baixas taxas de bits para sinais de músíca.
Entretanto, a qualidade de sinais de fala é problemática em taxas de bits baixas.
Portanto, diferentes categorias de sinal de áudio detnandam diferentes características de ferramenta de extensão de 25 largura de banda.
Este é o objeto da preserrte invenção para fornecer um conceito de codificação/decodificação aprímorado .
O referido objeto é atingido por meío de um
EÀ, ,,fà ' 4 decodificador de áudio, de acordo com a reivindicação 1, um método de decodificação de áudio, em conformídade com a reivindicação 13, um codificador, de acordo com a reivindicação 8, um método para a codificação, em conformidade com a reívindicação 14, um sinal 5 codificado, em conformidade com a reivindicação 15 ou um programa de computador, em conformidade com a reivindicação 16.
A presente invenção está baseada río achacio de que a frequência cruzada ou a frequência inicial de BWE é um parâmetro que influencia a qualidade de áudio. Enquanto os codificadores de 10 domínio_ de tempo - (f ala) - normalmeríte " Cõdi fi cam a " banda de frequência "inteira para"uma taxa de amostragem dada, a Iargura de banda de áudio é um parâmetro de afinação para codificadores ": - "ba'seadoS " êm" "transf"ormadas (por exemplo, codificadores para 0 música), uma vez que diminuem o número total de linhas espectrais 15 para ,, codi f íca r , ao mesmo ternpo eIR- q'ue aume"rrtarão "o "ríúmèrò "de 6its " = ~ por linha espectral disponivel para codificação, que signifíca que Ç. é feito um trade-off entre a qualidade em rel-ação à largura de banda de áudio. Portanto, díferentes ^ m· na nova abordagem, codificadores centrais, com larguras de banda de áudio variáveís, 20 são cornbinados a um sistema comutado com um módulo comum de BWE, no qual o módulo BWE deve contar para diferentes larguras de banda de áudio.
Um modo direto poderia estar para Iocalizar a mais baixa de todas as larguras de banda do codificador central e 25 utilizá-la como frequêncía inicial de BWE, porém isso poderia deteriorar a qualidade de áudio percebida. Ademais, a eficiência de codificação poderia ser reduzida, uma vez que as seções de tempo onde um codificador central está ativo, o qual tem uma
G { >Ô 5 Iargura de banda superior à frequência inícial de BWE, algumas regiões de frequência poderiam ser duas vezes representadas, por meio do codificador central, bem como a BWE que introduz redundância. Portanto, uma melhor solução é adaptar a frequência 5 inicial de BWE para a largura de banda de áudio do codifícador central utilizado.
Portanto, de acordo coin as configurações da" presente invenção, um sistema de codificação de áudío combina uma ferramenta de extensão de largura de banda com um codificador
L + _ 10 _ çentraL- depende-n-te- do —sina-l -(p"or_ exempio, codíf i cadÔr" comutado de [3 '- falaFáudio) 7 "no"qual" "a "Erèquência " cruzada compreende um parâmetro variável. Uma saída classificadora de .sinal, que controla a coMutação entre díferentes modos de codificação central, também pode ser utilizada para comutar as características do sístema de 15 BWE, ta i s como resolução- temporal _ e "snrea ning; "a" resoruçào espectral e a frequência cruzada. k Portanto, urn aspecto da presente invenção é um G' decodificador de áudio para um sinal de áudio codificado, o sinal de áudio codificado que compreende uma primeira porção codificada 20 em conformidade com o primeiro algoritrno de codíficação, uma segunda porção codificada em conformidade com um segundo algoritmo de codifícação, parâmetros de BWE para a primeira porção e para a segunda porção e uma informação de modo de codíficação que indica um primeiro algoritmo de decodificação ou um segundo algoritmo de 25 decodificação, que compreende um primeiro deeodí ficador, um segurido decodi f icar, um módulo BWE e um controlador - O primeiro decodificador decodifica a prirneira porção em conformidade com o primeiro algoritmo de decodifícação para uma primeira porção de
$ê L' 4 6 tempo do sinal codificado pa ra obter um primeiro sinal decodificado. O segundo decodificador decodifica a segunda porção em conforrnidade com o segundo algoritmo de decodificação para uma segunda porção de tempo do sinal codificado para obter um segundo 5 sinal decodificado. O módulo BWE tem uma frequência cruzada controlável e es tá configurado para efetuar urn algoritmo de extensão de largura de banda usando o primeiro sínal decodificado"' " "' e os parâmetros de BWE para a primeira porção, e para efetuar um algoritmo de extensão de largura de banda usando o segundo sinal L- —..
10 decodificado e o parâmetro de extensão de Iargura de banda para a segunda porção. O controlador controla a frequência cruzada para o mSdu'lQ bwe , em _ _con f ormiaade com a inf ormação de modo de coãificação- De acordo com outro aspecto da presente ínvenção, 1'5 ím àparel-ho para codíficação de um sinal de áudio compreende um pF'iIÊIeiro e um segundo codificador, uma etapa de decisão e um módulo BWE- O primeiro codificador está configurado para codificar, em conformidade com um primeíro algoritmo de codificação, c) primeiro algoritmo de codificação que tem uma 20 primeira largura de banda de frequência. O segundo codificador está configurado para codificar, em conformi-dade com uin segundo algoritmo de codificação, c) segundo algorítmo de codificação que tem uma segunda largura de banda de frequêncía que é menor que a primeira largura de banda de frequência. A etapa de decisão indica 25 o primeiro algoritmo de codificação para uma primeíra porção do sinal de áudio e o segundo algorítmo de codificação para umà segunda porção do sinal de áudio, a segunda porção sendo diferente da primeira porção. O módulo de extensão de Iargura de banda
€ 'á 7 calcula os parâmetros de BWE para o sinal de áudio, no qual o módulo BWE é configurado para ser controlado por meio da etapa de decisão para calcular os parâmetros de BWE para urna banda que não inclui a primeira largura de banda de frequência na primeira 5 porção do sinal de áudio, e para uma banda que não inclui a segunda largura de banda de frequêncía na segunda porção do sinal de áudio.
Em oposição às configurações, a SBR, na técnica anterior, somente é aplicada para um codíficador de áudio sem 10 comutação, que resuita nas desvantagens a seguir. Tanto a resolução temporal quando a frequência cruzada poderia ser dinamicamente aplicada, porém as ímplementações do estado da técnica, tais como a fonte 3GPP, aplicam, normalrnente , somente uma alteração de resolução temporária para transientes como, por 15 exemplo, castanholas. Ademais, uma resolução temporal geral rnelhor poderia ser escolhída em taxas superiores, como urri parâmetro de
E afinação dependente da taxa de bits. Não é realizada nenhuma classificação explícita para determinar a resolução temporal ou um limite de decisão que controla a resolução temporal, combínando 20 rnelhor o tipo de sinal,- como, por exemplo, música estacionária, tonal em relação à fala. As configurações da presente invenção superam as referidas desvantagens. As configurações permitem, especialmente, uma frequência cruzada adaptada combinada com uma escolha flexível para o codificador central utilízado, assím o 25 sinal codif icado fornece uma qualidade perceptível significativamente superior comparada ao codificador/decodificador da técnica anterior.
9> í!- 'Ô 8 As configurações preferidas da presente invenção são descritas a seguir ern relação aos desenhos anexados, nos qua1s : A Fig. 1 mostra um diagrama de bloco de um 5 aparelho para decodificação, em conformidade com um primeiro aspecto da presente invenção: A Fig . 2 mostra um diagrama de bioco de um" aparelho para codificação, erri conformidade com o primeiro aspecto da presente invenção; -- 10 A Fig." 3 mostra um diagrama de bloco de um esquema de codificação em mais detalhes: A Fig. 4 mostra um diagrama de bloco de. um = " n # h-~ - 'è's;qu)ema de decodificação em mais detalhes: » A Fig. 5 mostra um diagrama de bloco d:e um ' Ib ' - '_ _ 8~- e -
15. "Tesqu:ema d"e codifiCàção, em éõnformidTdè c.om um segundo aspecto.: A Fig . 6 é um diagrama esquemático de um esquem'a de decodificação, em conformidade com um segundo aspecto; A Fig. 7 ilustra uma etapa de LPC do lado do codif icador que fornece inforrriação preditiva em curto prazo e o 20 sinal de erro de predição; A Fig. 8 ilustra uma configuração adicional de um dispositivo de LPC para gerar um sinal ponderado; As Figs. 9a e 9b mostram um codificador que compreende um switch de áudio/fala que resulta em resolução 25 ternporal diferente para um sinal de áudio; e A Fig. 10 ilustra uma representação para um sinal de áudio codificado.
L. ' d 6 9 A Fig. 1 mostra um aparej-ho decodíficador 100 para decodificar um sinal de áudio codificado 102. O sinal de áudio codificado 102 compreende uma primeira porção 104a codificada em conformidade com o primeiro algoritmo de 5 codificação, uma segunda porção 104b codificada em conformidade com um segundo algoritmo de codificação, parârnetro de BWE 106 para a primeira porção de tempo 104a e para a segunda porção de tempo 104b e uma informação de modo de codificação 108 que indica um primeiro algoritmo de decodificação ou um segundo algoritmo de 10 decodif ic"açã"o parà às respectivas porções de tempo . O apare1ho para decodificação 100 compreende um primeiro decodificador 11Oa, urn segundo decodificador 11Ob, urri módulo BWE 130 e um contro1ado,r = _m .= , . =
140. O prirneiro decodificador 11Oa é adaptado para decodificar a primeira porção 104a, de acordo com o prirneiro algoritmo de 15 decodificação " para" uma = pfimêi rã "po:Êção àe " t'imp; "do" s inal codificado 102 para obter um primeiro sinal decodificado 114a. O segundo decodificador llOb está configurado para decodificar a segunda. porção 104b, de acordo com o segundo algoritmo de decodificação, para uma segunda porçào de tempo do sínal 20 codificado, para obter um segundo sinal decodificado 11Ab. O módulo BWE 130 tem uma frequência cruzada controlável fx que ajusta o comportamento do módulo BWE 130. O módulo BWE 130 está configurado para efetuar um algoritmo de extensão de largura de banda para gerar componentes do sinal de áudio na banda de 25 frequência superior baseada no primeiro sinal decodificado 114a e nos parâmetros de BWE 106 para a primeira porção, e para gerar componentes do sinal de áudio na banda de frequência superior baseada no segundo sinal decodificado 114b e no parâmetro de
L 'b 10 b extensão de largura de banda 106 para a segunda porção. O controlador 140 está configurado para controlar a frequência cruzada fx do módulo BWE 130, de acordo com a ínformação do modo de codificação 108.
5 O módulo BWE 130 pode compreender também um combinador que combina componentes de sinal de áudio da banda de frequência inferior e superior e fornece o sinal de áudio resultante 105.
A informação do modo de codificação 108 indica, - -10 por exewpl"6, qual porção de tempo do sinal de áudio codificado 102 Up " é codificada por qual algoritmo de codificação. Esta informação pode, ao mesmo tempo, identificar o decodificador a ser utilizado ¶ para diferentes porções de tempo. Ademais, a informação do modo de codificação 108 pode controlar um swi tch to swítch entre — 15.- diferentes decodifi"cadotès Parã díferentes porçÕes "de tempo.
Portanto, a frequência cruzada fx é um parâmetro ajustável, que é ajustado erri conformidade com c) decodificador utilizado, o qual pode, por exemplo, compreender urri codificador de fala como o primeiro decodificador llOa e um decodificador de 20 áudio como o segundo decodificador llOb. Conforme acirna mencionado, a frequência cruzada fx para um decodificador de fala (como para o exemplo baseado em TjPC) pode ser superior à frequência cruzada utilizada para um decodificador de áudio (por exemplo, para rnúsica). Assirri, nas configurações adicionais, o 25 controlador 220 está configurado para aumentar a frequência cruzada fx ou para diminuir a frequência cruzada fx dentro de uma das porções de tempo (por exernplo, a segunda porção de tempo), assirn, a frequência cruzada pode ser alterada sem alteração do
4- 'b 11 algoritmo de decodificação. Isso signifíca que uma alteração na frequência cruzada pode não estar relacionada a uma alteração no decodificador utilizado: a frequência cruzada pode ser alterada serri alteração do decodificador utilizado, ou vice-versa, q 5 decodificador pode ser alterado sem alteração da frequência cruzada .
O módulo BWE 130 pode também compreender um switch que é controlado pel-o controlador 140 e/ou pelo parâmetro de BWE 106, assim o prímeíro sinal decodificado 114a é processado _ 10 pç)r meio do móduFo -BWE 130, durarite a primeira porção de tempo, e
G o s-egundo sinal" decodificado 1l4b é processado pelo módulo BWE 130 durante, a segunda porção de tempo. Este switch pode ser atívado à "" po""r "rneio àa alteração na frequêncía cruzada fx ou por um bít explícito dentro do sinal de áudio codificado 102, indicando o + _ _ 15 algçiritmo de- cod-if icação utili zado "dürãnte"= a" res"pect"iva porção de tempo .
Nas demai s configurações, O switch está configurado para comutar entre a primeira e a segunda porção de tempo, a partir do primeiro decodificador para o segundo 20 decodificador, assím o algorítmo de extensão de largura de banda é aplícado tanto ao primeiro sinal decodificado quanto ao segundo sinal decodificado. De modo alternativo, c) algoritmo de extensão de largura de banda é aplicado ao primeiro e/ou ao segundo sinal decodificado e o switch é colocado após este, assim um dos sinais 25 de largura de banda estendida é transmitido.
A Fig. 2 mostra um diagrama de bloco para um aparelho 200 para codificação de um sinal de áudio 105. O aparelho para codificação 200 compreende um primeiro codificador 21Oa, um
'D 12 segundo codificador 21Ob, urna etapa de decisão 220 e um módulo de extensão de Iargura de banda (módulo BWE) 230. O primeiro codificador 21Oa está operante para codificar, de acordo com um primeiro algoritmo de codificação, que tem uma primeira largura de 5 banda de frequência. O segundo codificador 21Ob está operante para codificar, de acordo com um segundo algoritmo de codificação, que tem uma segunda largura de banda de frequência menor que a primeira largura de banda de frequêncía. O prímeiro codificador pode, por exemplo, ser um codificador de Eala, tais como um _ 1Q c_odificador baseado em LPC, cónsi'deFando que""o"segundo codificador & .' 21Ob pode" compreender um codificador de áudio (música). A etapa de decisão 220 está configurada para indicar o primeiro algoritmo de m .= 0 0 " " CodifiC'ação pâra uma primeira porção 204a do sinal de áudio 105, e para indicar o segundo algoritmo de codificação para uma segunda , . . _ i;: . Ê?orção= 204b .do sina.l de- á-udio 105;"" cinde "a" ségünda porção de tempo é diferente da primeira porção de tempo. A primeira porção de tempo 204a pode referir-se à primeira porção de tempo e a segunda porção 204b pode referir-se à segunda porção de tempo, que é diferente da primeira porção de tempo.
20 O módulo BWE 230 está configurado para calcular os parâmetros de BWE 106 para o sinal de áudio 105 e está configurado para ser controlado pela etapa de decisão 220 para calcular o parâmetro de BWE 106 para uma primeira banda que não inclui a primeira Iargura de banda de frequência na primeira 25 porção de tempo 204a do sinal de áudio 105. O módulo de BWE 230 está adicionalmente configurado para calcular o parâmetro de BWE 106 para uma segunda banda, não incluindo a segunda largura de banda na segunda porção de tempo 204b do sinal de áudío 105. A m
Ü 13 primeira (segunda) banda compreende, portanto, coínponentes de frequência do sinal de áudio 105 que estão fora da primeira (&egunda) largura de banda de frequência e estão lirnitados ein direção à extremidade inferior do espectro por meio da frequência 5 cruzada fx. A primeira ou a segunda largura de banda pode, portanto, ser definida por meio de uma frequência cruzada variável que é controlada pela etapa de decisão 220.
Ademai s , o módulo BWE 2 30 pode compreender um switch controlado pela etapa de decisão 220. A etapa de decisào k 10 220 pode determinar um algoritrno de codificação preferido para uína porção de tempo dada e controla o switch, assim, durante uma dada porção de tempo, o codificador preferido é utilizado. A informação modi ficada do modo de codificação 108' compreende o sinal do switch respectivo. Ademais, cj módulo bwe 230 pode também 15 compreender um filtro para obter componentes do sinal de áudio 105 na banda. de frequência inferior/superior, que estão separados pela frequência cruzada fx, que pode compreender um valor de cerca de 4 KHZ ou 5 Khz. Finalmente, o módulo BWE 130 também pode compreender uma ferramenta de análise para determinar o parâmetro de BWR 106.
20 A informação modif icada de modo de codif icação 108' pode ser equivalente (ou igual) à informação do modo de codificação 108. A informação do modo de codificação 108 indica, por exemplo, o algoritmo de codificação utilizado para as respectivas porções de tempo no fluxo de bits do sinal de áudio codificado 105.
25 De acordo COIll configurações adicionais, a etapa de decisão 220 compreende urna ferramenta clasmíficadora de sinal . que analisa o sinal original de saída 105 e gera a informação de controle 108 que aciona a seleção dos diferentes modos de
Ò 14 codificação. A análise do sinal de entrada 105 depende da implementação com o objetivo de escolher o modo de codificação central ideal para um dado frame de sinal de entrada. A saida do classificador de sinal pode (opcionalmente) também ser utilizada 5 para influenciar o comportamento de outras ferramentas, por exemplo, MPEG surround, SBR aprimorada, banco de fil'tros time- warped e outros. A entrada para a ferramenta classificadora de sinal compreende, por exemplo, o sinal de entrada original não modificado 105, mas também, opcionalmente, parâmetros dependentes 10 da implementação. A saida da ferramenta classificadora de sinal compreende Cj sinal de controle 108 para controlar a seleção do codificador central (por exemplo, domínio de frequência não filtrado PL, tempo filtrado por PL, codificação de domínio de frequência ou algoritmos adicionais de codificação).
15 De acordo com as configurações, a frequência cruzada fx é dependente do sinal ajustado, que está combinado com a decisão de switch para o uso de um algoritmo diferente de codificação. Portanto, um s inal simples de switch pode simplesmente ser uma alteração (urri salto) na frequência cruzada 20 f x . Ademai s , a informação do modo de codif ícação 108 também pode compreender a alteração da frequência cruzada fx indicando, ao mesmo teinpo, um esquema de codificação preferido (por exernplo, fala/áudio/música).
De acordo com configurações adicionais, a etapa 25 de decisão 220 é operante para analisar o sinal de áudio 105, uma primeira saida do primeiro codificador 210", uma segunda saída do segundo codificador 21Ob, um sinal obtido pela decodificação de um sinal de saida do codificador 21Oa ou urn segundo codificador 21Ob
%· Cb
D 15 em relação à informação-alvo. A etapa de decisão 220 pode, opcionalmente, ser operante para efetuar uma discriminação de fala/música, de modo que uma escolha para fala seja favorecida em relação a uma escolha para música, assim uma decisão para fala ê 5 tomada, por exemplo, incluMve quando uma porção inferior a 50% de um frame para o primeiro switch é de fala e uma porção superior a 50% do frame para o primeiro switch é de música. Portanto, a etapa de decisão 220 pode compreender uma ferrarnenta de análise que analisa o sinal de áudio para decidir se o sinal de áudio é 10 fundarnentalmente um sinal de fala ou fundamentalmente um sinai de música, assim, com base no resultado da etapa de decisão, é possível decidir qual é o. melhor c.odifica-'d'or a s'.e.r utilízado pa"ra a porção de tempo analisada d'o sínal. de áudío.
As Figs. 1 e 2 não mostr:aml díve.r'sQs dos referídos = 15 detalhes para o codi f i cado"r/decodi fi-cador . Os e'xernpíos detalhados possíveis para q codif íca'dor/decodífi ea'dor são mos"t,rados nas\ figuras seguintes. Ademais, para o primeiro e c) segundo decodificador 11Oa, b da Fig. 1, decodificadores adicionais podem ser apresentados, os quais podem ou não utilizar, por exemplo, 20 algoritmos adicionais de codificação. Da mesma forma, também o codificador 200 da Fig. 2 pode compreender codífícadores adicionais, que podem utilizar algoritmos adicionais de codificação. A seguír, O exemplo com do i S codificadores/decodificadores será explícado com mais detalhes.
25 A Fig. 3 ilustra, em rnai 5 detalhes , um codificador que tem dois switches em cascata. Um sinal rnono, um sínal estéreo ou um sinal de múltiplos canais é introduzido ern uma etapa de decisão 220 e em um switch 232, que é parte do módulo BWE e i. " b 16 230 d.a Fig. 2. O switch 232 é controlado pela etapa de decisão
220. De modo alternativo, a etapa de decisão 220 também pode receber uma informação colateral que é incluída no sinal mono, no sinal estéreo ou no sinal de múltiplos canais ou, ao menos, 5 associada a um determinado sinal, onde a informação existente, que foi, por exernplo, gerada ao produzir originalmente o sinal mono, o sinal estéreo ou o sinal de múltiplos canais A etapa de decisão 220 ativa o switch 232 para alimentar um sinal tanto na porção de codificação de frequência 1"0 21Ob, ilustrada agora na ramificação superior da Fig. 3, quanto uma porção de codificação de domínio LPC 21Oa, ilustrada na ramificação infeEior 3. da Um elemento Fíg. principâl da ~ -— ramificação da codificação do domínio de frequência é um bloco de conversão de espectro 410, que é operarite para converter um sinal .
15- de"saída""' da et"àpa' dê pré="Srocenãmen= comum (comorme"àiscutido adiante) em um domínio espectral. O bloco de conversão de espectro , K pode incluir um algoritmo MDCT, QMF, um algoritmo de FFT, uma análise de wavelet ou um banco de filtros, tais como um banco de filtros criticamente amostrado que tem urn número determinado de 20 canais de banco de filtros, onde os sinais de sub-bandas, neste banco de filtros, podem ser sinais avaliados reais ou sinais avaliados complexos. A saída do bloco de conversão de espectro 410 está codificada usando-se um codificador espectral de áudio 421 que pode incluir blocos de processamento, conhecidos do esquema de 25 codificação A-AC.
De modo geral, o processamento na ramificação 21Ob é um processamento com base em um rriodelo baseado na percepção ou modelo aprofundado de informação. Portanto, esta ramificação i
Ò 17 modela o sistema auditivo humano que recebe o sorn. Contrário a isso, o processamento na ramificação 21Oa é gerar um sinal na excitação, residual ou de domínio de LPC. Geralrnente, o processarnento na ramificação 21Oa é um processamento baseado ern um 5 modelo de fala ou em um modelo de geração de informação. Para sinais de fala, este modelo é um modelo do sistema de geração de fala/som humano gerando som. Entretanto, se um som proveniente de"" urna fonte diferente exigir que um modelo diferente de geração de som seja codificado, então o processamento na ramificação 21Oa ' '10 pode ser díferente'. Ademais, para as ramificações de cQciificâção mostradas, as configurações adicionais compreendem ramificações a'd'ici6nais ou codificadores centrais. Por exernplo, diferentes , W · " P co.dfficadores podem, opcionalmente, ser apresentados para di£erentes fontes, assim o som proveniente de cada fonte pode ser _15 coÍdiTficãdõµmpregàKd"o se uíircDdi£iEãdor pré"ferido ."'" Na ramificação de codifícação ínferior 21Oa, um elemento principal é um dispositivo de LPC 510 que fornece informação LPC, a qual é utilizada para controlar as características de um filtro LPC. A referida ínforrnação LPC é 20 transmitida para um decodificador. O sinal de saída da etapa LPC 510 é um sinal de dominio de LPC que consiste de um sinal de excitação e/ou de um sinal ponderado.
O dispositivo LPC, geralmente, fornece um sinal de domínio de LPC que pode ser qualquer sinal no domínio de LPC ou 25 qualquer outro sinal que foi gerado por meio da aplícação de coeficientes de filtro LPC para um sinal de áudio. Ademais, um dispositivo LPC também pode determinar os referidos coeficientes e pode também quantizar/codificar os referidos coeficientes.
"'Ò 18 A escolha na etapa de decisão 220 pode ser adaptável ao sinal, assim a etapa de decisão efetua uma discriminação de música/fala e controla o switch 232, de modo que os sinais de música são introduzidos na ramificação superior 21Ob, 5 e os sinais de fala são introduzidos na ramificação inferior 21Oa.
Ein uma configuração, a etapa de decisão 220 alimenta sua informação de controle em um fluxo de bits de saída, assim um decodificador pode utilizar a referida informaç.ão de decisão para efetuar as operações corretas de decodificação. Esta informação de " 10 _decisão põde, põr éxemplo, compreender a informação do modo de
P '" cociíficação 10 8 que pode compreender tarnbém informação sobre a frequência cruzada fx ou uma alteração da frequêncía cruzada fx. " + O referido decodificador é ilustrado na Fig. 4. A saida do sinal do codificador espectral de áudio 421 é, após a —-— 1-5 -trarrsmi"s são, íntroduzida ém ürn decoài f í'càdjor "es5ectra1" de áudio
431. A saída do decodificar espectral de áudio 431 é introduzida no conversor de dornínio de tempo 440 (o conversor de dominio de tempo pode, de modo geral, ser um conversor de um primeiro para urri segundo domínio). De modo análogo, a saída da ramificação de 20 codificação do domínio de LPC 21Oa, da Fig. 3, foi recebida no lado do decodificador e processada pelos elementos 531, 533, 534 e 532 para obter um sínal de excitação de LPC. O sinal de excítação de LPC é introduzido em uma etapa de síntese de LPC 540, que recebe, como uma. entrada adicional, a informação de LPC gerada 25 pela etapa de análise de LPC respectiva 510. A saída do conversor de domínio do tempo 440 e/ou a saída da etapa de síntese de LPC 540 são introduzidas em um switch 132, que pode ser parte do módulo BWE 130, na Fig. 1. O switch 132 é controlado vía sínal de t' " 0 19 controle do switch (tais como, a informação do modo de codificação 108 e/ou o parâmetro BWE 106) que foi, por exemplo, gerado pela etapa de decisão 220, ou que foi fornecido externamente como por um criador do sinal mono original, sinal estéreo ou sinal de 5 múltiplos canais.
Na Fig. 3, o sinal de entrada no switch 232 e a etapa de decisão 220 podem ser um sinai mono, um sinal estéreo, um """ sinal de múltiplos canais ou, geralmente, qualquer sinal de áudio.
De acordo com a decisão que pode ser derivada do sinaí de entrada " 10 " do SwitCh 232 ou"de qualquer fonte exterr.a, tais como produtor de sinal de áudio original subjacente à entrada de sinal na etapa 232, o switch comuta entre a ramificação de codificação de = — — frequência 21Ob e a ramificação de codificação de LPC 2.1Qa. A ramificação de codificação de frequência 21Ob compreende uma etapa - — _" 15 _ d'e convérSão " d€" êsµ e ctFo " 41Ô" e = etapâ de quantização/codificação subseqüentemente conectada 421. a etapa de.
quantização/codificação pode incluir qualquer funcionalidade conhecida dos codificadores rrtodernos de domínio de frequência, tais como o codificador AAC. Ademais, a operação de quantização na 20 etapa de quantização/codificação 421 pode ser controlada por meio de um módulo psicoacústico que gera informação psicoacústica, tai-s como limite de mascaramento psicoacústico sobre a frequência, onde esta informação é introduzida na etapa 421.
Na ramifícação de codificação de LPC 21Oa, o 25 sinal de saída do switch é processado por meio de urna etapa de análise de LPC 510 que gera uma informação colateral de LPC e um sinal de domínio de LPC. O codificador de excitação pode compreender um switch adicional para comutar o processamento
Õ 20 adicional do sínal de domínio de LPC entre uma operação de quantização/codificação 522, no domínio de LPC, ou uma de quantização/codificação 524 que processa valores no domínío espectral de LPC. Para esta finalidade, um conversor de espectro 5 523 é fornecido na entrada da etapa de quantização/codificação
524. O switch 521 é controlado em uma configuração de circuito aberto ou em uma configuração de circuito fechado, conforme as configurações especificas, como, por exemplo, descritas na especificação técnica do AMR-WB+.
- 10 - . - - --" Para" ò úiodò de "controle de circuito fechado, o b: " codificadòr" inclui adicionalmente um codificador/quantizador inverso 531 para o sinal de domínio de LPC, um -> ~ ~- ~ m ~ = -*— "g codificador/quantizador inverso 533 para o sinal de domínio , espectral de LPC e um conversor de espectro inverso 534 para a m R _ _ .,15 saída -do.& i-tew 5-33 7 'Os '- d'o_ís'" Sinãis " c'õdiFieados e, no.vamente decodificados nas ramificações de processamentQ, da segunda ramificação de codificação, são inseridos no dispositivo de controle do switch 525. No dispositivo de controle do switch 525, estes dois sinais de saída são comparados entre si e/ou para uma 20 função-alvo ou uma função-alvo é calculada, que pode estar baseada em uma comparação da distorção nos dois sinais, assim o sinal que tem a distorção inferior é utilizado para escolher qual posição o switch 521 deve tomar. De modo alternatívo, no caso as duas ramificações fornecem taxas de bits não constantes, a ramificação 25 que fornece a taxa de bits mais baixa deve ser selecionada, inclusive quando a distorção ou a distorção perceptiva desta ramificação é inferíor à distorção ou distorção perceptiva da outra rarnificação (um exemplo para a distorção pode ser a relação u —
· jj 21 sina1-ruido). De m.odo alternativo, a função-alvo pode ser utilizada, como uma entrada, a distorção de cada sinal e uma taxa de bits de cada sinal e/ou critérios adicionais para localizar a melhor decisão para uma meta especifica.
Se, por exemplo, a meta é
5 que a taxa de bits deve ser a mais baixa possível, então a função-
alvo deve demasiadamente recair na taxa de bíts dos doís sinais fornecidos pelos elemento3 531, 534. Entretanto, quando a meta principal é ter a melhor qualidade para uma determinada taxa de bits, então o controle do switch 525 deve, por exemplo, descartar
10 eada sinal que"estejã acima da"taxa de bits permitida e, quando os b
" doiS sinais estiverem abaixo da taxa de bits permitida, o controle do switch deve selecionar o sinal que tem a rnelhor qualidade ¥ _
" # = — subjetiva estimada, ou seja, que tem as menores distorções de quantização/codificação ou uma melhor relação sínal-ruído. —
_ _15~ —— — - - " O" esqueIÍIa" ciê dècõài f icação, erri conformidade corn uma configuração é, conforme declarado anteriormente, ílustrado na
Fig. 4. Para cada um dos três tipos de sinais de saída possíveis,
existe uma etapa específica de decodificação/requantização 431,
531 ou 533. Enquanto a etapa 431 fornece um espectro de frequência
20 que é convertido no domínio de tempo usando—se um conversor de frequência/tempo 440, a etapa 531 fornece um sinal de domínio de
LPC, bem como o item 533 fornece uni espectro de LPC.
Para certificar-se de que os sinais de entrada no switch 532 estão nos dois domínios de LPC, é fornecido o LPC de espectro/conversor de
25 LPC 534. Os dados de saida do switch 532 são novamente transforrnados no domínío de tempo usando-se uma etapa de sintese de LPC 540, a qual é controlada por meio da informação de LPC gerada e transmitida pelo lado do codificador.
Em seguida,
Õ 22 subseqüente ao bloco 540, as duas ramificações têm informação de domínio de tempo que é comutada em conformidade coni um sinal de controle do switch para, finalmente, obter um sinal de áudio, tais como um sinal mono, um si.nal estéreo ou sinal de múltiplos canais 5 que depende da entrada de sinal no esquema de codificação da Fig.
3.
As Figs. 5 e 6 mostram confígurações adicionais para o codificador/decodifícador, onde as etapas de BWE, como parte dos módulos BWE 130, 230 representam uma unidade comum de 10 processamento. - " A Éig". fj ilustra um esquema de codif icação, onde o esquema de pré-processamento comum conectado à entrada dQ switch - ~ -« 'T = " "' " " "232 pode compreend'er um bloco surround/joint stereo 101 que gera, como uma saída, parâmetros de joint stereo e um sinal de "saída | 1"5_ mo.nQ,—que é gerad> par=meio _de" d'ownmixiiTg ào "sinar de entrada, que ~ é um sinal que tem dois ou mais canais. Geralmente, c) sinal na saida do bloco 101 também pode ser um sinal que tem mais canais, porém devido à funcionalidade de downmixing do bloco 101, o número de canais na saida do bloco 101 será menor que o número dos canais 20 introduzidos no bloco 101.
O esquema de pré-processamento comum pode compreender, além do bloco 101, uma etapa de extensão de Iargura de banda 230. Na configuração da Fig. 5, a saída do bloco 101 é introduzida no bloco de extensão de Iargura de banda 230, qve 25 fornece um sinal limitado à banda, tais como o sinal de banda baixa ou o sínal baixo passante em sua saída. De modo preferido, este sinal também é submetido à downsamplíng (por exemplo, por urn fator de doís). Ademaís, para a banda al-ta da entrada de sinal no bloco 230, os parâmetros de extensão de largura de banda 106, tais como parâmetros de envelope espectral, parâmetros de filtragem inversa, parâmetros de patamar de ruído, etc., conhecidos do perfil HE-AAC do MPEG-4, são gerados e encaminhados para um 5 multiplexador de fíuxo de bits 800.
De modo preferido, a etapa de decisão 220 recebe a entrada do sinal no bloco 101 ou ir'.trcduz no bloco 230 para' decidir entre, por exemplo, um rnodo de música ou um modo de fala.
No modo de rnúsica, a ramificação superior de codificação 21Ob (.segundo -codi f icador -na- Fig. 2 )" é "sélécionadà, ao passo que no - modo de- fala, é s"elècioiiada"a" ramificação inferior de codificação 21Oa. De modo preferido, a etapa de decisão controla + - -adici'onã1mente o 61oco joint stereo 101 e/ou o bloco de extensão de largura de banda 230 para adaptar a funcionalidade destes blocos ao sinal= especí fico .- Porta-nto;= quando "a " etaPa" de "deci"são " = 220 determina que uma determinada porção de tempo do sinal de entrada se refere ao primeiro modo, como o modo de música, então características especificas do bloco 101 e/ou do bloco 230 podem ser controladas pela etapa de decisão 220. De modo alternativo, quando a etapa de decisão 220 determina que o sinal se refere a um modo de fala ou, geralmente, em um segundo modo de domínio de LPC, então características específicas dos blocos IOl e 230 podem ser controladas em conformidade a saída da etapa de decisão. A etapa de decisão 220 produz também a informação de controle 108 e/ou a frequência cruzada fx, a qual também pode ser transmitida para o bloco de BWE 230 e, ademais, para um multiplexador de fluxo de bits 800, assim ela será transmitida ao Iado do decodificador.
De modo preferido, a conversão de espectro da y¶ 24 ramificação de codificação 210,b é efetuada usando-se uma operação de MDCT que, inclusive de modo preferído, é uma operação de MDCT time- wa rped, onda a potência, ou geralmente, a potêncía de distorção pode ser controlada entre zero e uma potência de 5 distorção alta. Em uma potência de distorção zero, a operação de MDCT no bloco 411 é uma operação de MCT direcionada, conhecida na técnica. A potência de distorção de tempo conjuntamente com a informação colateral de distorção de tempo pode transmitida/introduzida no multiplexador de taxa de bits 800 como 10 informação -cotla_teral.
Na ramificação de codificação de LPC, O codificador de domínio de LPC pode incluir um núcíeo ACELP 526 que —. , — ' — _- « calcula uma amplitude de tom, um retardo de torn e/ou informação de codebook, tais como um índice e amplitude de codebook. O modo TCX, = — _ 15 conhecido-a parti·r do- 3G-E'-P T'S 26a 2"9"07 iWc'1u"í 1jmpjCÕcesZamento ãe um sinal perceptivamente ponderado em um domínio por transformadas. Um sinal ponderado de transformada de Fourier é quantizado usando-se uma quantização de rede dividida em rnúltiplas faixas (quantização vetorial algébrica) com quantização de fator 20 de ruido. Uma transformada é calculada em 1024, 512 ou 256 janelas de amostra. O sinal de excitação é recuperado por filtragem inversa do sinal ponderado quantizado por meio de um filtro de ponderação inversa. O modo TCX também pode ser utilizado na forrna modificada, na qual a MDCT é utilizada com uma sobreposição 25 aumentada, quantização escalar e codíficador aritmético para linhas de codificação espectral.
Na ramificação de codificação de "música" 21Ob, um conversor de espectro, preferencialmente, compreende uma operação de MDCT especificamente adaptada que tem deterrninadas funções de janej-a seguidas por uma etapa de codificação por quantização/entropia que pode consistir de uma única etapa de quantização vetorial, porérn, preferencialmente, é um codificador 5 escalar combinado de quantizador/entropia semelhante ao quantizador/codificador na ramificação de codificação de domínio de frequência, ou seja, no item 421 da Fig. 5.
Na ramificação de codificação de "fala" 21C)a, há o bloco de LPC 510 seguido por um switch 521, novamente seguido por um bloco ACELP 526 ou um bloco TCX 527. A descrição de ACELP está ern 3GPP TS 26.190 e a descrição de TCX está no 3GPP TS
26.290. Geralmente, o bloco ACELP 526 recebe um sinal excitação de _ Ç - j, . a~.— LPC, calculado por um procedimento conforme descrito na Fíg. 7. O bloco TCX 527 recebe um sinal ponderado conforme gerado pe,1a Fígü
8.
No lado do decodifícador iíustrado na Fig. 6, após a transformada espectral inversa no bloco 537, a inversa do filtro de ponderação é aplicada, que é (1 - µz"') / (1 - A (z/y) ) . Em seguida, o sinal é filtrado por meio de (1-A(z)) para avançar ao domínio de excitação de LPC. Assim, a conversão ao bloco de domínio de LPC 534 e ao bloco de TCX"' 537 inclui transformada inversa e, em seguida, filtragem pela fórmula a seguir: (1 - µz"') (1 - A(z / Y) ) Onde 1—A(z)) refere-se a conversão a partir do dominio' ponderado para o domínio de excitação.
Embora o item 510, nas Figs. 3 e 5, ilustre u.m bloco único, o bloco 510 pode fornecer sinaís diferentes, desde que os referidos sinais estejam no domínío de LPC. O modo atual do
~ % 26 blQco 510, tais como o modo do sinal de excitação ou modo de sinal ponderado, pode depender do estado atual do switch. De modo alternativo, o bloco 510 pode conter dois dispositivos de processamento paralelo, onde urn dispositivo é implementado de modo S similar à Fig. 7 e o outro dispositivo é implementado conforme a Fig. 8. Portanto, o domínio de LPC na saída do 510 pode representar tanto um sinal áe excitação de LPC quanto um sinal ponderado de LPC ou qualquer outro sinal de domínio de LPC.
Na segunda ramificação de codificação (ACELP/TCX) """ 1O"da Fig. 5, o sinal é preferencialmente pré-enfatizado por meio de um filtro 1-µZ"l, antes da codificação. No decodificador ACELP/TCX na Fig. 6, é retirada a ênfase do sinal sintetizado com o filtro — - — 1/ Q-µz"Y . Erri uma configuração preferida, o parâmetro µ tem o valor de 0, 68. A pré-ênfase pode ser parte do bloco de LPC 510, 15 ondè" õ s ináí"è pré matizado==rItes da"ãnálise '"=ãà" LPC e"da quantização. De modo semelhante, a retirada da ênfase pode ser parte do bloco de sintese de LPC, LPC"' 540.
A Fig. 6 ilustra um esquema de decodificação que se refere ao esquerna de codificação da Fig. 5. O fluxo de bits 20 gerado pelo multiplexador de fluxo de bits 800 (ou interface de saída) da Fig. 5 é introduzido no demultiplexador de fluxo de bits 900 (ou interface de entrada) . Conforme uma informação derivada, por exemplo, do fluxo de bits por meio de um bloco de detecção de modo 601 (por exemplo, parte do controlador 140, na Fig. 1), um 25 switch do lado do decodificador 132 é controlado tanto por sinais encaminhados da rami f icação superí-or por sLna/s provenientes da ramificação inferior para o bloco de extensão de largura de banda 701. O bloco de extensão de largura de banda 701 u Í3 27 r'ecebe, de um demultiplexador de fluxo de bits 900, a inf'ormação cQlateral e, baseado nesta informação colateral e na saída da detecção de modo 601, é reconstruída a banda alta baseada na saída de banda baixa pelo switch 132. O sinal de controle 108 controla a 5 frequência cruzada fx utili zada.
O sinal de banda completa gerado pelo bloco 701 é introduzido na etapa de processamento de joint stereo/surround 702, que reconstrói dois canais estéreos ou vários múltiplos canais. Geralmente, o bloco 702 fornecerá maís canais do que foram 10 introduzidos neste bloco. Conforme a aplicação, "a "e'ntrada no bloco 7 02 pode , inc.lusive, incluir doi s canais , tais como em um modo estéreo e pode, inclusive, incluir mais canais, desde que a saída
Á deste,= bloco- -tenha mai-s" canais àu"e a entrada neste bloco. = O switch 232 na Fig. 5 foi mostrado para comutar " - = 15 entre ramíficações, assim_ somente jima- rami-ficação "féCebê" um s inal = = para processar e a outra ramificação não recebe um sinal para processar. Entretanto, em uma configuração alternativa, o switch 2 32 também pode ser organi zado sub.seqüente ao, por exemplo, codificador de áudio 421 e ao codificador de excitação 522, 523, 20 524, que significa que as duas rarriificações 21Oa, 21Ob processam o mesmo sinal eííi paralelo. Entretanto, para não duplicar a taxa de bits, somente a saída de sinal de uma das rarnificações de codificação 21Oa ou 21Ob é selecionada para ser escríta no fluxo de bits de saída. Ern seguida, etapa de decisão operará, assim o 25 sínal escrito no fluxo de bits rninimiza uma determinada função de custo, onde a função de custo pode ser a taxa de bits gerada, a distorção perceptual gerada ou a função de custo combinada de taxa/distorção. Portanto, tanto neste modo quanto no modo í r 28 ilustrado nas Figuras, a etapa de decisão também pocíe operar em um modo de circuito fechado, para garantir que, finalmente, apenas uma saída de ramificação de codificação seja escrita no fluxo de bits, o qual tem, para uma distorção perceptual dada, a taxa de 5 bits mais baixa ou, para uma dada taxa de bits, a distorção percebida mais baixa. No modo de circuíto fechado, a entrada de feedba ck pode ser derivada das saídas dos três blocos de quantizador/multiplicador de frequências 421, 522 e 424, na Fig. 3.
Também na corifiguração da Fig. 6, o swítch 132 10 pode, em configurações alternativas, ser organizado após o módulo BWE 70i, assim a extensão de -la-rgurá " dé banda é efetuada ern paralelo, para as duas ramificações, e o switch seleciona um dos dois sinais ?stendido-s-de largura dè banda.
Na implementação que tem dois switches, ou seja, = , * F- 15 o primeiro switch 232 e o segundo. ,switch. -521, - é preferido que a """"resolução de tempo, para o primeiro switch, seja menor que a resolução de tempo para o segundo switch. Diferentemente declarado, os blocos do sinal de entrada no primeiro switch, que podem ser comutados via operação de comutação, são maiores que os 20 blocos comutados pelo segundo switch 521, que opera no domínio de" LPC. De exempiar, OS switches de .0 0 W 0 de frequência/domínio de LPC 232 podem comutar blocos de uma extensão de 1024 amostras, e o segundo switch 521 pode comutar blocos que tem 256 amostras cada.
25 A Fig. 7 ilustra uma implementação mais detalhada do bloco de análise de LPC 510. O sinal de áudío é introduzido em um bloco de determinação de filtrQ 83, que determina a ínformação de filtro A(z) . Esta informação é fornecida corno informação preditiva em curto prazo, exigída para um decodificador. A informação preditiva em curto prazo é exigida pelo filtro preditivo atual 85. No subtrator 86, uma amostra atual do sinal de áudio é introduzida e um valor predito para a amostra atuaí é 5 subtraído, assim, para esta amostra, o sinal de erro de predição é gerado na linha 84.
Enquanto a Fig. 7 ilustra o modo preferido para calcular o sinal de excitação, a Fig. 8 ilustra o modo preferido para calcular o sinal ponderado. Em oposição à Fig. 7, o filtro 85 10 é diferentç, quando y é diferente de 1. Um valor ínenor que 1 é preferido- -para y." Adèmais, o bloco 8"7 está presente, e µ é preferível com um número menor que 1 . Geralmente, os elemento_s, na -· ÇÊ m % = — W :-— = __ :-.- -Figj -7" e " 8 "p"òdêm" 'sèt "implementados conforme em 3GPP TS 2 6. 190 e
3.GPP TS 26.290.
15 ¥ - « P 7 .. De . modo- -subseqüerrte ; " ürii " "cõdi=fí ía=d; r" " CÈlp= " de" " = " " ' "" " ana-lysis-by-synthesís é discutido para ilustrar as modificações aplicadas para este alg'eritmo. Este codificador CELP é discutido em detalhes em "Speech Coding: A Tutorial Review" ["Codificação de fala: Uma revisão tutorial"] , Andreas Spanías, Proceedings of the 20 IEEE [Procedimentos do IEEE], vol. 82, No. 10, Outubro de 1994, páginas 1541-1582.
Para casos especificos, quando um frame é uma rnistura de uma fala sem voz e corrt voz, ou quando ocorre uma fala sobre a música, uma codificação TCX pode ser mais adequada para 25 codificar a excitação no domínio de LPC. A codificação TCX processa diretamente a excitação no domínio de frequência sem fazer qualquer suposição da produção de excitação. A TCX é, em seguida, mais genérica que a codificação CELP e nãcj está restrita
"Y g.
30 a. uma modelo de fonte com voz ou sem voz de excitação. A TCX ainda é um modelo de codificação de filtro de fonte que utiliza um filtro preditivo linear para modelar os formantes dos sinais semelhantes à fala.
5 Na codificação semelhante a AMR-WB+, uma seleção entre diferentes modos de TCX e ACELP ocorre conforme conhecído a partir da descrição de AMR-WB+. Os rnodos de TCX são díferentes na referida extensão de blocos do tipo Transformada Rápida de Fourier diferente para modos diferentes e o melhor modo pode ser d* 10 seíecionado por meio de análise para abordagem de síntese ou por meio de um modo direto de "alimentação".
Conforme discutido em relação à Fig. 5 e 6, a eta.pa de pré-processamento comum 100 inclui, preferencialmente, .uín joint multi-channel (dispositivo surrouncíl joínt stereo) 10'1 e,, 15 adicionalmente, uma etapa de extensão de largura de banda 23Q. De modo respectivo, um decodif icador inclui uma etapa de ext'ensã'o cje largura de banda 701 e, subseqüentemente, uma etapa de joint multi-channel conectada 702. Preferencialmente, a etapa de joint multi-channel 101 é, em relação ao codificador, conectada antes 20 que a etapa de extensão de largura de banda 230, e, no Iado do decodíficador, a etapa de extensão de largura de banda 701 é conectada antes da etapa de joint multi-channel 702 em relação à direção do processamento de sinal. Entretanto, de modo alternativo, a etapa de pré-processamentm comum pode incluir uma 25 etapa de joint multi-channel sem a subseqüente etapa de extensão de largura de banda conectada ou uma etapa de extensão de largura de banda sem uma etapa de joint multí-channel conectada.
As Figs . 9a e 9b mostram uma vista simplificada de um codificador da Fig. 5, onde o codif icador compreende uma unidade de escolha de switch 220 e uma unidade de codificação estéreo 101. Ademais, o codificador também cornpreende as ferramentas de extensão de largura de banda 230 como, por exemplo, 5 um calculador de dados de envelope e módulos relativos à SBR. A unidade de escolha de switch 220 fornece um sinal de escolha de switch 108' que comuta entre o codificador de áudio 21Ob e o" codificador de fala 21Oa. O codificador de fala 21Oa pode, ainda, ser dividido em um codificador com voz e sern voz. Cada um destes codificadores pode codificar o sinal de áudio na banda de frequência central usando números diferentes de valores de amostra (por exemplo, 1024 para uma resolução superior ou 256 para uma resolução inferior). O sinal de escolha de switch 108' também é fornecido para a ferrarnenta de extensão de largura de banda (BWE) Z30. Em seguida, a fe'rramenta de BWE 230 utilizará a escolha de switch 108' para, por exemplo, ajustar c) número de envelopes espectrais 104 e ligar/desligar um detector transiente opcional, bem como ajustar a frequência cruzada fx. O sinal de áudio 105 é int,roduzido na unidade de escolha de switch 220 e é introduzido na codificação estéreo 101, assim, a codificação estéreo 101 pode produzir qs valores de amostra que são introduzidos na unidade de extensão de largura de banda 230. Conforrne a decisão 108' gerada pela unidade de escolha de unidade de switch 220, a ferramenta de extensão de largura de banda 230 gerará dados de replicação de banda espectral que são, por sua vez, encaminhados tanto para um codificador de áudio 21Ob quanto para um codificador de fala 21Oa.
O sinal de escolha de switch 108' é dependente do sinal e pode ser obtido a partir da unidade de escolha de switch
" "%)
C 6' 32 220, por meio da análise de sinal de áudio, por exemplo, usando-se um detector transiente ou outros detectores que podem ou não compreender um límite variável. De modo alternativo, o sinal de escolha do switch 108' pode ser manualmente aj ustado (por exemplo, 5 por um usuário) ou obtido a partir de um fluxo de dados (incluído no sinaL de áudio) .
A saida do codificador de áuciio 2iOb e o codificador de fala 21Oa podem, novamente, ser introduzidos no formatador de fluxo de dados 800 (vide Fig. 5).
10 A Fig . 9b mostra ura exemplo para o sinal de escolha de switch 108', que detecta um sinal de áudio para um períocío de tempo antes de um período de tempo ta, e após um segundo tempo tb. Entre o primeiro tempo ta e o segündo tempo tb, a unidade de escolha de switch 220 detecta um sinal de fala 15 resuítante em difererites valores dir:reto,s parà o simal de escolha de switch 108'.
A decisão de utilizar uma frequência cruzada fx superior é controlada por meio da unidade de escolha de switch
220. Isso significa que o método descrito também é passível de 20 utilização dentro de um sisterna no qual o módulo de SBR é combinado somente com um codificador único central e uma frequência cruzada fx variável.
Embora algumas das Fígs. 1 até 9 sejam ilustradas como diagramas de bloco de um aparelho, as referidas figuras são, 25 simultaneamente, mw ilustração de um método, onde m funcionalidades de bloco se referem às etapas de método.
A Fig. 10 ilustra uma representação para um sinal de áudio codificado 102, que compreende a prímeira porção 104a, a segunda porção 104b, a terceira porção 104C e uma quarta porção 104d. Nesta representação, o sinal de áudio codificado 102 é urn fluxo de bits transmitido por um canal de transmissão que compreende ainda a informação de modo de codificação 108. Cada 5 porção 104 do sinal de áudio codificado 102 pode representar uma porção de ternpo diferente, embora diferentes porções 104 possam estar na frequência, bem como no domínio cie tempo, assim o sinal de áudio codificado 102 pode não representar uma Iinha de tempo.
Nesta configuração, o sinal de áudio codificado 102 compreer.de, ademais , uma primeira informação de modo de codificação 108a que identifica o algoritmo de codificação utilizado para a primeira porção 104a; uma segunda infQrTnação de modo de codíficação 108b que identifica o algoritmo de codificação utilizado para a segunda porção 104b; uma terceíra informação de ="15"Wodo de codificaçá=o"I08a que identif ica ò"" àÍS5ritmo de codifica"¢ãÔ" utiliz-ado para a quarta porção 104d. A primeira inforrnação de modo de codificação 108a também pode identificar a primeira frequência cruzada fxl utilizada dentro da primeira porção 104a, e a segunda informação de modo de codificação 108b também pode identificar a segunda frequência cruzada fx2 utilizada dentro da segunda porção 104b. Por exemplo, dentro da primeira porção 104a, o modo de codifícação de "fala" pode ser utilizado e dentro da segunda porção 104b o rnodo de codificação de "música"" pode ser utilizado, assim, a primeira frequência cruzada fxl pode ser superior a segunda frequência cruzada fx2.
Nesta configuração exemplar, o sinal de áudio codificado 102 não compreende nenhuma informação de modo de codificação para a terceira porção 104C que indica que não há
" 'u bu 34 alteração no codificador utilizado e/ou na frequência cruzada fx entre a primeira e a terceira porção 104a, c. Portanto, a informação do modo de codificação 108 pode aparecer como cabeçalho somente para as porções 104 que utilizam um codificador central 5 diferente e/ou frequência cruzada comparada à porção anterior. Em configurações adicionais, em vez de sinalizar os valores das frequências cruzadas para as porções diferentes 104, a informação de modo de codificação 108 pode compreender um único bit que indica o codificador central (primeiro ou segundo codificador 10 21C)a, b) utilizado para a respectiva porção 104.
Portanto, a sinalização do comportamento do switch entre as diferentes ferramentas de SBR pode ser feita, 'por -= " -~ " - = . · . = exemplo, submetendo-se um bit específico dentro de um flu'xo de" bits, assim o referido bit pode atívar ou desatí'var um "" 15" '" '""co'mpo rtamento espe"aFí'co no decodi ficad(5E""Dè modo aiternatíG6, nos sistemas com dois codificadores centraís, de acordD com as configurações, a sinalização do switch também pode ser iniciada por meio da análise do codificador central. Neste caso, a submissão da adaptação das ferramentas de SBR é feita de modo 20 implícito, o que significa que é determinada por meio de atividade respectiva do codificador central.
Mais detalhes sobre a descrição padrão dos elementos de fluxo de bits para a carga útil de SBR podem ser encontrados em ISO/IEC 14496-3, subcategorias 4.5.2.8. Urna 25 modi ficação deste fluxo de bits padrão compreende uma extensão do índice para uma tabela de frequência mestre (para identificar a frequência cruzada utilizada). O índice utílizado é codificado, por exemplo, com quatro bits que permitem que a banda cruzada seja
U 35 vaFiável sobre uma faixa de 0 a 15 bandas.
As configurações da presente invenção podem, portanto, ser resumidas como segue. Sinais diferentes com diferentes características de tempo/frequência têm diferentes 5 demandas sobre a característíca da extensão de Largura de banda.
Os sinais transientes (por exemplo, dentro de um sinal de fala) precisam de uma boa resoiução temporai da BWE, e a frequêncía cruzada fx (a borda superior de frequência do codificador central) deve ser a rnais alta possível (por exemplo, 4 kHz, 5 KHZ ou 6 10 KHz ) . Especialmer.te ria fala coíü voz , uma estrutura temporal distorcida pode diminuír a qualidade percebida. Os sinais tonais precisam de uma reprodução estável dos componentes espectrais e um padrão harmônico de combinação das porções reproduzidas de alta frequência. A reprodução estável das partes tonais limita a 15 largura "ãe"banda do codificador central," porém não precisa de uma BWE com boa temporal, mas com uma resolução espectral melhor. No desenho do codificador central comutado de fala/áudio, tarnbém é possivel utilizar a escolha do codificador central para adaptar as características temporais e espectrais da BWE, bem como para 20 adaptar a frequência BWE inicial (frequência cruzada) para as caracteristicas" de sinal. Portanto, as configurações fornecem uma extensão de largura de banda onde a escolha do codificador central atua como critério de adaptação para caracteristicas de extensão de largura de banda.
25 A sinalização da frequência (cruzada) inicial alterada de BWE pode ser realizada explicitamente por meio do envio de informação adicional (como, por exemplo, a informação do modo de codif icação 108) no fluxo de bits ou implicitamente por meio de derivação da frequênci-a cruzada fx diretamente a partir do , codificador central utilizado (no caso do codificador central é, por exemplo, sinalizado dentro do fluxo de bíts). Por exemplo, uma frequência fx de BWE inferior para o codifícador por transformadas 5 (por exemplo, codificador de áudio/música) e uma frequência superior para um codificador de dominio de tempo (fala). Neste caso, a frequência cruzada pocie estar na faixa entre 0 hz até a frequência de Nyquist.
Embora alguns aspectos sejam descritos no contexto do aparelho, fica claro que os referidos aspectos tambérri representam uma descrição do método respectivo, onde um bloco ou dispositivo se refere a uma etapa de método ou a umà característica de uma etapa de método. De modo análogo, os asp'ectos descritos no contexto de uma etapa de método também · " :.
15" _ represèntam urria"de scriçãW""de um "KToco ," itèm' ou earacterísticas r'es'pectivas de um aparelho pertinente.
O sinal de áudio codificado inventado pode ser armazenado em um meío de armazenamento dígital ou pode ser transmitido por urn meio de transmissão, tais corno um meío de transmissão sem fio ou urn meio de transmissão por cabo, tais como a Internet.
De acordo com determinados requisitos de implementação, as configurações da invenção podem ser implementadas em hardware ou software. A implementação pode ser efetuada utilizando-se um meio de armazenamento dígital, por exemplo, um disco flexível, um DVD, CD, CD-ROM, PROM, EPROM, EEPROM ou um cartão de memória, que contem com sinais de controle que sejam eletronicamente passíveis de leitura do conteúdo armazenado, que sejam compatíveis ( ou sejam capazes de compatibílidade) com um sistema programável de computador, para que assini o respectivo método seja realizado.
Algumas configurações, de acordo com a invenção, 5 compreendem um dispositivo para o transporte de dados que conte com sinais de controle que sejam eletronicamente passiveis de leitura, os quais sejarn compatíveis com um sistema programável de computador, para que assim um dos rnétodos ora descritos seja realizado.
De modo geral, as confi-gurações da presente invenção podem ser implementadas como um produto de programa de computador com uni código de programa, o cõdigo de programa sendo operante para efetuar um dos métodos, quando o produto do programa de computador seja executado ern um computador. O código de . .
.
. . -. - 1$ ' programa pode , por' "'ex'empio", ser armazenado " em" urn dispositivo de transporte passível de Ieitura em uma máquina.
Outras configurações compreendem o programa de computador para a realização de um dos métodos ora descritos, armazenados em um dispositivo de transporte passivel de leitura ern uma máquina, ou seja, uma configuração do.método de invençào é, portanto, um programa de computador que tem um código de programa para efetuar um dos métodos ora descritos, quando q programa de computador é executado em um coniputador.
Uma configuração adícional dos métodos de invenção é, portanto, um dispositivo de transporte de dados (ou um meio de armazenamento digital, ou um meío de leitura em computador) que compreende o conteúdo gravado em si, o rjrograIna de computador para efetuar um dos métodos ora descritos.
·0} d.
38 Uma configuração adícional do rnétodo de invenção é, portanto, um fluxo de dados ou uma seqüência de sinais que representam o prograrna de computador para efetuar um dos métodos ora descritos. O fluxo de dados ou a seqüência de sinais pode, por 5 exemplo, ser configurada para ser transferida via conexão de comunicação de dados, por exemplo, via Internet.
(jma confíguração adicíonal compreende um meio de processamento, por exemplo, um computador, um dispositivo lógico programável, conf igurado para ou adaptado para efetuar um dos 10 métodos ora descritos.
Uma configuração adicional compreende um coutputador que tem instalado o programa de computador para efetuar um dos métodos ora descritos.
Em algumas configurações, um dispositivo lógico 'í5""'Wogramável"" (por exemplo, "um circuito FPGA - "Field Programmable Gate Array") pode ser utilizado para efetuar algumas o'u todas as funcionalidades dos métodos o ra descritos. m alguma s configurações, um circuito FPGA pode ser compatível com um mícroprocessador para efetuar urn dos métodos ora descritos. De 20 mod.o geral, os métodos são preferencialinente realizados por qualquer aparelho de hardware.
As configurações acima descritas são meramente ílustrativas para cjs princípios da presente invenção. É entendido que as rnodificações e variações dos arranjos e dos detalhes ora descrítos 25 serão óbvios para os demais especialistas na técnica. Portanto, é pretendida a limitação somente pelo escopo das reivi-ndicações de patente pendentes e não por detalhes específicos apresentado pela forma de descrição e explicação das configurações ora contidas.
Claims (14)
1. "APARELHO E MÉTODO PARA DECODIFICAÇÃO DE UM SINAL DE ÁUDIO CODIFICADO", onde o aparelho para decodificação (100) de um sinal de áudio codificado (102), é caracterízado pelo 5 sinal de áudio codificado (102) compreender uma primeira porção (104a) codificada conforme um primeiro algoritmo de codificação, urna segunda porção (104b) codificada conforme um segundo algoritmo de codificação, os parâmetros BWE (106) para a primeira porção (104a) e a segunda porção (104b) e uma informação de modo de 10 codificação (108), indicando um prLmeLro algoritmo de
B decodificação ou urn segundo um algoritmo de decodificação, compreendendo: - ~ ~ — +- um primeiro decodificador (llOa) para decodificar a primeira porção (104a), conforme o algoritmo de decodificação 15 para a prirneira - porção de tempo'" do" sinál" coàif'icaào 7ioZj Gara" " obter um primeiro sinal decodi ficado (114a), onde o pr'imeiro decodificador (llOa) compreende um codificador baseado no LPC; um segundo decodif.icador (llOb) para decodificar a segunda porção (104b), conforme o segundo algoritmo de 20 decodificação para uma segunda porção de tempo do sinal codificado ¢ (102) para obter um segundo sinal decodificado (114b), em que o . , segundo deçodi ficador (llOb) compre.ende um codifica-dor baseaci'o em transformação; um módulo BWE (130) tendo uma frequência de 25 transição controlável (fx), o módulo BWE (130) sendo confígurado para executar um algoritmo de extensão de largura de banda utilizando o primeiro sinal decodificado (114a) e cjs parâmetros BWE (106) para a primeira porção (104a) e para a execução de um g.
2 algoritmo de extensão de largura de banda utilizando o segundo sinal decodificado (114b) e o parâmetro de extensão de largura de banda (106) para a segunda porção (104b), em que o rnódulo BWE (130) é configurado para usar 5 uma primeira frequência de transição (fxl) para a extensão de largura de banda do primeiro sinal decodificado (114a) e usar uma segunda frequência (fx2) para a extensão da largura de banda do segundo sinal decodifícado (114b), em que a primei-ra frequência de transição (fxl) é maior do que a segunda frequência de transição lO (fx2) ; e h ~
F um controlador (140) para controlar a frequência de transição (fx) para o rnódulo BWE (130) conforme a informaçào do - modo de codificação (108).
2. O aparelho para a decodificação (100) da 15 reivindicação 1, caracterízado- por compreender" azindâ ümã interfàc=e = de entrada (900) para a entrada do sínal de áudío codificado (10'2) como um fluxo de bíts.
3. O aparelho para decodificação (100) da reivindicação 1 ou da reivindicação 2, caracterízado pelo módulo 20 BWE (130) compreender um comutador (132) que é configurado para à alternar entre a primeira e a segunda porção de tempo do primeiro decodi ficador (llOa) para o segundo decodifícador (llOb) de modo que o algoritmo de extensão da largura de banda, ou seja, aplicado ao prirneiro sinal decodificado (114a) ou ao segundo sinal 25 decodificado (114b) .
4. O aparelho para a decodificação (100) da reivindicação 3, caracterízado peío controlador (140) ser configurado para controlar o cornutador (132) dependente do
F 3 algoritrno de decodificação da informação de modo de codíficação (108) .
5. O aparelho para decodificação (100) de uma das reivindicações anteriores, caracterízado pelo o controlador (140) 5 ser configurado para aurnentar a frequência de transição (fx) dentro da primeira porção de tempo ou para dimínuir a frequência de transição (fx) dentro da segunda porção de tempo.
6. Um aparelho de codificação (200) de um sinal de áudio (105), caracterízado por compreender: 10 um primeiro codificador (21Oa) que é configurado '€ para codificar conforme um primeiro algoritmo de codificação, o algoritmo de codificação com uma primeira largura de banda de frequência,' ém que o primeiro codificador (21Oa) inclui um codificador baseado em LPC; um segundo godi.fic-ador' ("210'b) , "qüe è "c"oáfigufa"do " " " " 15 % K para codifi.car conforme um segundo algoritmo de codíficação, o segundo algoritmo de codificação tendo uma segunda largura de banda de frequência que é menor do que a primeira largura de banda de frequência, onde o segundo codificador (21Ob) inclui um 20 codificador baseado em transformação; urn estágio de decisão (220) para indicar o primeiro algoritmo de codificação para tuna prime'ira porção" (204a) do sinal de áudio (i05) e para indicar o segundo algoritmo de codificação para a segunda porção (204b) do sinal de áudio (105), 25 a segunda porção (204b), sendo diferente da primeira porção (204a) ; e um módulo de extensão de largura de banda (230) para cálculo de parâmetros BWE (106) para o sinal de áudio (105),
onde o módulo BWE (230) é configurado para ser controlado pelo estágio de decisão (220) para calcular os parâmetros BWE (106) para uma faixa não incluindo a primeira Iargura de banda de frequência na primeira porção (204a) do sinal de áudio (105) e 5 para uma faixa não íncluindo a segunda largura de banda de frequência na segunda porção (204b) do sinal de áudio (105), onde a primeira ou a segunda largura de banda de frequências é definida por uma frequência de transição variável (fx) e em que o estágio de decisão (220) é configurado para a 10 saída de frequência de transição variável (fx), em que o módulo BWE (230) é configurado para usar uína primeira frequência de transição (fxl) para calcular os parâmetros BWE de um sinal codificado utilizando o primeíro codificador (21Oa) e usar uma segunda frequência (fx2 ) para um 15 sina-l codificado util"iza"ndõ" o " seijunào coãifícador (21Ob), onde a prímeira frequência de transição (fxl) é maior do que a segunda frequência de transição (fx2).
7. O aparelho m codi-ficação (200) da reivindicação 6, caracterízado por compreender ainda uma írrterface 20 de saída (800) para a saída do sinal de áudio codífícado (102), o í sinal de áudio codificado (102) compreendendo uma primeira porção (I04a)- codif icada- confo-rme urrt pr-imeiro_ atgoritmo de codíf"icação, uma segunda porção (104b) codificada conforrne um segundo algoritmo de codificação, os parâmetros BWE (106) para a primeira porção 25 (l04a) e a segunda porção (104b) e informação de modo de codificação (108 ) que indica o primeiro ou o segundo algoritmos de decodificação.
8. O aparelho de codifícação (200) da reivindicação 6 ou da reivindicação 7, caracterízado pela primeira ou a segunda largura de banda de frequência ser definída por urna frequência de transição variável (fx) e em que o estágio de decisão (220) é configurado para a saída de frequência de 5 transição variável (fx).
9. O aparelho de codificação (200) de uma das reivindicações 6 a 8, caracteri-zado pelo módulo BWE (230) compreende um comutador (232) controlado pelo estágio de decisão (220), em que o interruptor (232) é configurado para alternar 10 entre o primeiro e segundo codificador de tempo (21Oa, 21Ob), de »\ rriodo que o sinal de áudio (105) seja diferente para porções de tempo diferentes, codificadas pelo primeiro e pelo segund9 .
L codificador (21Oa, 21Ob).
10. O aparelho de codificação (200) de uma das 15 r.ei.vindicações .6 a 9; caracterízádò "pé'lo êsEágio de decisão (220) funcionar para analisar o sinal de áudio (105) ou uma primeira saída do primeiro codificador (21Oa) e uma segunda saída do segundo codificador (21Ob) ou um sinal obtido pela decodificação de um sinal de saida do primeiro codíficador (21Oa) ou do segundo 20 codificador (21Ob) Coiti relação a uma função alvo. i
11. Um método para decodificação de um sinal de áudio codificado (102), - caracterízado pelo sinal de áudio codificado (102) compreender uma primeira porção (104a) codificada conforrrie urri primeíro algoritmo de codifícação, uma segunda porção 25 (104b) codi ficada conforme um segundo algoritmo de codif icaçào, os parâmetros BWE (106) para a primeira porção (104a) e a segunda porção (104b) e urna informação de modo de codificação (108), indicando um primeiro algoritmo de decodíficação de ou segundo um algoritmo de decodíficação, compreendendo:'
decodificando a primeira porção (104a), conforme o algoritmo de decodificação da primeira porção de tempo do sinal codificado (102) para obter um primeiro sínal decodi ficado (114a) ,
5 em que o estágio de decodifícação da primeira porção compreende o uso de urn codificador baseado no LPC;
decodificando a segunda porção (104b), conforme o segundo algoritmo de decodificação para uma segunda porção de tempo do sinal codificado (102) para obter um segundo sinal decodificado (114b), em que o estágio de decodificação da segunda porção (104b) compreende o uso de um codificador baseado em trans formação;
executando um algoritmo de extensão de Iargura de banda por um módulo BWE (130) que possua uma frequência de transição controláVèl ("fZ) , " uSãndo o" primei ro sinal decodi ficado
(114a) e os parâmetros BWE (106) da prímeira porção (104a), e execução pelo módulo BWE (130) tendo uma frequência de transição controlável (fx), um algoritmo de extensão de largura de banda usando o segundo sinal decodíficado (114b) e o parâmetro de extensão de largura de banda (106) para a segunda porção (104b),
em que a primeira frequência de transíção (fx) é
.usada para a extensão de- -largu'ra de banda do primeiro s inal decodificado (114a) e uma segunda frequência (FX2) é usada para a extensão da largura de banda do segundo sinal decodifícado (114b),
em que a prímeíra frequência de transição (FXl) é maior do que a segunda frequência de transição (FX2); e controlando a frequência de transição (fx) para o módulo BWE (130) conforme as informações do modo de codificação
(108) .
12. Um método para códif'icaçáó de um sinal de áudio (105) earacterízado por compreender: codificando con f o rme um primeiro algoritmo de 5 codificação, o primeiro algoritmo tendo urna primeira largura de banda de frequência, em que a etapa de codificação conforme o primeiro algoritmo de codificação incluindo o uso de um codificador baseado em LPC; codificação conforme um segundo algoritmo de 10 codificação, o segundo algoritmo de codificação tendo urna segunda e largura de banda de frequência menor do que a primeira largura de banda de frequência, em que a etapa de codificação conforme um segundo algoritmo de codificação compreende o uso de um codificador à base de transformação; = -6 r ¥ = 4 — W · " F " 15 indicando. o. primeiro ' algori"tMó " de codificação para uma primeira porção (204a) do sinal de áudio (105) e para o segundo algoritmo de codificação para a segunda porção (204b) do sinal de áudio (105), a segunda porção (204b), sendo diferente da primeira porção (204a), e 20 calculando os parâmetros BWE (106) para o sinal : de áudio (105) de tal forma que os parâmetros BWE (106) se j am calculados para uma faixa que . não. inclu.i - a prirneira Iargura de banda de frequência na primeira porção (204a) do sinal de áudio (105) e para uma faixa que não inclui a segunda largura de banda 25 de frequência na segunda porção (204b) do sinal de áudio (105), em que a primeira ou a segunda largura de banda de frequência seja definida por uma frequência de transição (fx), em que o módulo BWE (230) é configurado para usar
,Y 'r & urna primeira frequência de transição (fxl) para calcular os parâmetros BWE de um sinal codificado utilizando o codificador baseado em LPC e usar uma segunda frequência de transição (fx2) para um sinal codificado utilizando o codificador baseado em 5 transformação (21Ob), em que a primeira frequência de transição (Exl) é maior do que a segunda frequência de transiçào (fx2).
13 . Um s inal de áudio codificado (102) caracterízado por compreender: uma primeira porção (104a) codificada conforme um ' 10 primeiro algoritmo de codificação, o primeiro algoritmo de
E codificação incluindo codificador baseado em LPC; uma segunda porção (104b) codi f i cada con forrne ym_ .
- algoritmo de codificação diferente, o segundo algoritmo de codíficação incluindo um codificador baseado em transformação; 15 parâmetros de extensão dé "largur"a àe "b'aaâa" iioâ ""=" b Õ â - para a primeira porção (104a) e para a segunda porção (104b), e uma inforrriação de modo de codificação (108), indicando uma primeíra frequência de transição (fxl) utilizada para a primeira porção (104a) ou uma segunda frequência de 20 transição (fx2) utilizada para a segunda porção (104b), em que a : primeira frequência de transição (fxl) é maior que a segunda frequência de transição (fx2). .
14. Programa de computador, caracterízado por executar o método da reivindicação 13 ou 14,' quando executado em 25 um computador.
g « k, q' 1l10 j,moo 11Oa 1 114a ' r ), primeiro decodificador ,, ), '
S · i 104b I 11,4b I j; 105 · - -=--—'! - -- - --segundo decodificadc)r7jLl módulo-— --,-.- .l .- " '°'! 11oÍÍ" j{j '"' I' ' . . =
I ^ — ._ _ m controlador L ~ — .=- , I 1Ó8 iào ] 13'0 k b 1 FlGl
>J =>' 'r~' ~^~ . .- -- - = <NJ r" Á, À ,ak,, > '""4 ÁÁA ,ÀS k 4 g )))) b q
ÇSJ = m CD "CYb 7 ãj;- b Éf =
É aj D 2 ,& = "= -C) &·9! E %g ãj = = çYjr «J
/' ·? 4/10
D CJ 9? .-L nu Ò b 0 CJ k = g 2 12 "% P13 S> |- = "" .à.
O O ' C:.J = i' "" t "" qj "TJ ,1 Ç. C> m"
C "g )1 'Ê g I r-- I ' " C) 3 *\J J I = í!! µ CD -W *. - P|- ' j " LM C3 C)
K g ""í jjj ' IJL *,í iz]) ©"'i,j "% ) 1"%) g"\j=-a|
' '4ár r % 5110 '")|,],m,)))?\ 7 jt , í '"-f~ \" — f- , i:Ê , l& «:> : b " ' '"! 'g'7µALN ' . - - f'ii i:t j;,ií- _S _ o S " jf &" = t "f , jl 'í
CJ , , ij' CJ . '" '8|_ "_ ô"" ÁL " " "m'" "I r " " lcj <C = = C-J "! " I ""{ "' | ,j; E ir 5 C) C-J ' : 'ii¶i'~")"'") ii '1'-)c))"| —jf =i ' " '
. « F" 3 e 6/10 -jf m...
ej '<n = _> ~ I m =
T 'i, l ' Z ' IJ_ _ L I- - T- - - -: - - - ·- - - (Y " 0 i- - - - - · - - - -I I I t I C' ' 'I =,j I I ] Ei! m " = '"|=:"i'|"7' :""1"""""" }" " e ¥ || = li % I -- ,d , _= - . --
CJ C-)
LLJ e ê"ql, 7 !"' ' "" t ' m 1 LY Q 1! 'T" " ' ' l ll = 7 í ,—1 !' " "% |,à,aG JL
UJ :a d) m # E >' & "E7
O >< = = fluxo de bits
'i' r" 7/10 àj m Clj
D
A > — ©àj m A, CL 'F K làj2 ã§ m I 'íii I · || l Í &"\ r^ I 5 " + >J, j I _ : "'"I _ _ _ - ll - - I' . - - I-) -- =L- i ~ \4-_ l=j"= "" I - = " " C5 " " " " " " '& ' !,' ) "IT""1)')t) I' | ) -éi -W m -b I' l I qj © f ' j m m :> =i,!j-!-'" Êí! ,& € G> = E I) ------,
I CU <L> ££ _ — — , µ~ .. Jl = — fk
("è'
Y 8/10 a =
U O =- ~ r"'""""""'"" m> m 'q ~ '¥ I l ~ C> & , + i ) — L- — — — — L — — "> , l , l l m m " " ":" !" " " " F,| kj l,' , { © = —i - =) )" L %,_ .., _ . + aj
H 'Õ5 ·¢U · n
'0 ;'"
9/10
220 1Q5 108' 2(Ob decisão : P·r w$p~Qb©^W*Fâp ej y Wèb de SW I Ê i ! —Sa áudio codi1icação| fâla t estéreo BWE , <> L 232 1Ô1 ~ = _ #J% _ = _ ,. ,= , = + . 2ÍOa - - ---
"Y
-= ~ ~ m = = W * '= " " "
= " " " " ""FlG 9A decisão de SWl áüd,j fala -
ta tb tempo
FlG 9B
%b 'E Q" 0 'r 10/10 ,<_102 104a 104C 104b 104d — = , .
e W u — % I— = & + — ." « — ~ =g N- W & + « = r' y : " " K ~ 'm * ~ t * F " = W * B è m " iOáa · · - - 10bb " " ioh " " " " " " " '" " " " '" " " FlG 10
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US7984108P | 2008-07-11 | 2008-07-11 | |
| US61/079,841 | 2008-07-11 | ||
| US10382008P | 2008-10-08 | 2008-10-08 | |
| US61/103,820 | 2008-10-08 | ||
| PCT/EP2009/004522 WO2010003545A1 (en) | 2008-07-11 | 2009-06-23 | An apparatus and a method for decoding an encoded audio signal |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| BRPI0910511A2 true BRPI0910511A2 (pt) | 2020-08-18 |
| BRPI0910511B1 BRPI0910511B1 (pt) | 2021-06-01 |
Family
ID=40886797
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0910511-5A BRPI0910511B1 (pt) | 2008-07-11 | 2009-06-23 | Aparelho e método para decodificar e codificar um sinal de áudio |
Country Status (18)
| Country | Link |
|---|---|
| US (1) | US8275626B2 (pt) |
| EP (2) | EP2304723B1 (pt) |
| JP (1) | JP5325293B2 (pt) |
| KR (1) | KR101224560B1 (pt) |
| CN (1) | CN102089814B (pt) |
| AR (1) | AR072481A1 (pt) |
| AU (1) | AU2009267531B2 (pt) |
| BR (1) | BRPI0910511B1 (pt) |
| CA (1) | CA2730232C (pt) |
| CO (1) | CO6341674A2 (pt) |
| ES (2) | ES2396927T3 (pt) |
| IL (1) | IL210414A (pt) |
| MX (1) | MX2011000370A (pt) |
| PL (2) | PL2352147T3 (pt) |
| RU (1) | RU2483366C2 (pt) |
| TW (1) | TWI435316B (pt) |
| WO (1) | WO2010003545A1 (pt) |
| ZA (1) | ZA201100087B (pt) |
Families Citing this family (54)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
| JP2011501216A (ja) * | 2007-10-15 | 2011-01-06 | エルジー エレクトロニクス インコーポレイティド | 信号処理方法及び装置 |
| ATE518224T1 (de) * | 2008-01-04 | 2011-08-15 | Dolby Int Ab | Audiokodierer und -dekodierer |
| EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
| PL2301020T3 (pl) * | 2008-07-11 | 2013-06-28 | Fraunhofer Ges Forschung | Urządzenie i sposób do kodowania/dekodowania sygnału audio z użyciem algorytmu przełączania aliasingu |
| US8442837B2 (en) * | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
| CN103119646B (zh) * | 2010-07-20 | 2016-09-07 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、音频解码器、编码音频信息的方法以及解码音频信息的方法 |
| SG187743A1 (en) | 2010-08-12 | 2013-03-28 | Fraunhofer Ges Forschung | Resampling output signals of qmf based audio codecs |
| JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
| CN102610231B (zh) * | 2011-01-24 | 2013-10-09 | 华为技术有限公司 | 一种带宽扩展方法及装置 |
| SG194199A1 (en) | 2011-03-18 | 2013-12-30 | Fraunhofer Ges Forschung | Frame element positioning in frames of a bitstream representing audio content |
| CN104221082B (zh) | 2012-03-29 | 2017-03-08 | 瑞典爱立信有限公司 | 谐波音频信号的带宽扩展 |
| GB201210373D0 (en) * | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
| EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
| US9129600B2 (en) | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
| JPWO2014068817A1 (ja) * | 2012-10-31 | 2016-09-08 | 株式会社ソシオネクスト | オーディオ信号符号化装置及びオーディオ信号復号装置 |
| RU2641461C2 (ru) | 2013-01-29 | 2018-01-17 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер, аудиодекодер, способ обеспечения кодированной аудиоинформации, способ обеспечения декодированной аудиоинформации, компьютерная программа и кодированное представление с использованием сигнально-адаптивного расширения полосы пропускания |
| SG10201608613QA (en) | 2013-01-29 | 2016-12-29 | Fraunhofer Ges Forschung | Decoder For Generating A Frequency Enhanced Audio Signal, Method Of Decoding, Encoder For Generating An Encoded Signal And Method Of Encoding Using Compact Selection Side Information |
| EP4336501A3 (en) * | 2013-01-29 | 2024-05-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method and computer program using an increased temporal resolution in temporal proximity of onsets or offsets of fricatives or affricates |
| AU2014211586B2 (en) | 2013-01-29 | 2017-02-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for coding mode switching compensation |
| KR102450178B1 (ko) | 2013-04-05 | 2022-10-06 | 돌비 인터네셔널 에이비 | 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더 |
| TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
| EP2987166A4 (en) * | 2013-04-15 | 2016-12-21 | Nokia Technologies Oy | BESTIMMER FOR MULTI-CHANNEL AUDIOSIGNAL CODIER MODE |
| US9426569B2 (en) | 2013-06-13 | 2016-08-23 | Blackberry Limited | Audio signal bandwidth to codec bandwidth analysis and response |
| MY171256A (en) * | 2013-06-21 | 2019-10-07 | Fraunhofer Ges Forschung | Time scaler, audio decoder, method and a computer program using a quality control |
| KR101953613B1 (ko) | 2013-06-21 | 2019-03-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 지터 버퍼 제어부, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
| US9666202B2 (en) | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
| CN108172239B (zh) * | 2013-09-26 | 2021-01-12 | 华为技术有限公司 | 频带扩展的方法及装置 |
| US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
| FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
| US9293143B2 (en) | 2013-12-11 | 2016-03-22 | Qualcomm Incorporated | Bandwidth extension mode selection |
| WO2015104447A1 (en) | 2014-01-13 | 2015-07-16 | Nokia Technologies Oy | Multi-channel audio signal classifier |
| EP3109861B1 (en) * | 2014-02-24 | 2018-12-12 | Samsung Electronics Co., Ltd. | Signal classifying method and device, and audio encoding method and device using same |
| EP2980797A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
| US9685164B2 (en) * | 2014-03-31 | 2017-06-20 | Qualcomm Incorporated | Systems and methods of switching coding technologies at a device |
| FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
| US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
| SG11201509526SA (en) | 2014-07-28 | 2017-04-27 | Fraunhofer Ges Forschung | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
| CN106448688B (zh) | 2014-07-28 | 2019-11-05 | 华为技术有限公司 | 音频编码方法及相关装置 |
| EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
| EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
| US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
| US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
| EP3343558A4 (en) * | 2015-09-04 | 2018-07-04 | Samsung Electronics Co., Ltd. | Signal processing methods and apparatuses for enhancing sound quality |
| ES2771200T3 (es) * | 2016-02-17 | 2020-07-06 | Fraunhofer Ges Forschung | Postprocesador, preprocesador, codificador de audio, decodificador de audio y métodos relacionados para mejorar el procesamiento de transitorios |
| EP3208800A1 (en) * | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
| US10157621B2 (en) * | 2016-03-18 | 2018-12-18 | Qualcomm Incorporated | Audio signal decoding |
| GB201620317D0 (en) * | 2016-11-30 | 2017-01-11 | Microsoft Technology Licensing Llc | Audio signal processing |
| US10734001B2 (en) * | 2017-10-05 | 2020-08-04 | Qualcomm Incorporated | Encoding or decoding of audio signals |
| US10733318B2 (en) * | 2017-11-21 | 2020-08-04 | International Business Machines Corporation | Processing analytical queries over encrypted data using dynamical decryption |
| KR102570480B1 (ko) * | 2019-01-04 | 2023-08-25 | 삼성전자주식회사 | 오디오 신호 처리 방법 및 이를 지원하는 전자 장치 |
| JP7092047B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 符号化復号方法、復号方法、これらの装置及びプログラム |
| CN111554312A (zh) * | 2020-05-15 | 2020-08-18 | 西安万像电子科技有限公司 | 控制音频编码类型的方法、装置和系统 |
| CN118043887A (zh) * | 2024-01-04 | 2024-05-14 | 北京小米移动软件有限公司 | 信号编码和解码方法、设备及存储介质 |
Family Cites Families (33)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
| SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
| US6618701B2 (en) | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
| US6978236B1 (en) | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
| US6901362B1 (en) * | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
| SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
| SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
| US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
| PT1423847E (pt) * | 2001-11-29 | 2005-05-31 | Coding Tech Ab | Reconstrucao de componentes de frequencia elevada |
| CN1703736A (zh) * | 2002-10-11 | 2005-11-30 | 诺基亚有限公司 | 用于源控制可变比特率宽带语音编码的方法和装置 |
| JP4048956B2 (ja) * | 2003-01-20 | 2008-02-20 | ティアック株式会社 | 光ディスク装置 |
| SE0301901L (sv) | 2003-06-26 | 2004-12-27 | Abb Research Ltd | Metod för att diagnostisera utrustningsstatus |
| EP1672618B1 (en) | 2003-10-07 | 2010-12-15 | Panasonic Corporation | Method for deciding time boundary for encoding spectrum envelope and frequency resolution |
| CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
| WO2006000110A1 (en) | 2004-06-28 | 2006-01-05 | Abb Research Ltd | System and method for suppressing redundant alarms |
| US7715573B1 (en) * | 2005-02-28 | 2010-05-11 | Texas Instruments Incorporated | Audio bandwidth expansion |
| KR100803205B1 (ko) * | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
| EP1926083A4 (en) * | 2005-09-30 | 2011-01-26 | Panasonic Corp | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
| KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
| US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
| CN101385079B (zh) * | 2006-02-14 | 2012-08-29 | 法国电信公司 | 在音频编码/解码中用于知觉加权的设备 |
| EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
| EP2062255B1 (en) * | 2006-09-13 | 2010-03-31 | Telefonaktiebolaget LM Ericsson (PUBL) | Methods and arrangements for a speech/audio sender and receiver |
| US8417532B2 (en) * | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| FR2912249A1 (fr) * | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
| US20110022924A1 (en) * | 2007-06-14 | 2011-01-27 | Vladimir Malenovsky | Device and Method for Frame Erasure Concealment in a PCM Codec Interoperable with the ITU-T Recommendation G. 711 |
| JP2011501216A (ja) * | 2007-10-15 | 2011-01-06 | エルジー エレクトロニクス インコーポレイティド | 信号処理方法及び装置 |
| KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
| WO2009081315A1 (en) * | 2007-12-18 | 2009-07-02 | Koninklijke Philips Electronics N.V. | Encoding and decoding audio or speech |
| ATE518224T1 (de) * | 2008-01-04 | 2011-08-15 | Dolby Int Ab | Audiokodierer und -dekodierer |
| EP2259253B1 (en) * | 2008-03-03 | 2017-11-15 | LG Electronics Inc. | Method and apparatus for processing audio signal |
| KR20100134623A (ko) * | 2008-03-04 | 2010-12-23 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
| EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
-
2009
- 2009-06-23 PL PL11162255T patent/PL2352147T3/pl unknown
- 2009-06-23 ES ES09776810T patent/ES2396927T3/es active Active
- 2009-06-23 AU AU2009267531A patent/AU2009267531B2/en active Active
- 2009-06-23 BR BRPI0910511-5A patent/BRPI0910511B1/pt active IP Right Grant
- 2009-06-23 PL PL09776810T patent/PL2304723T3/pl unknown
- 2009-06-23 EP EP09776810A patent/EP2304723B1/en active Active
- 2009-06-23 KR KR1020117000699A patent/KR101224560B1/ko active Active
- 2009-06-23 JP JP2011516987A patent/JP5325293B2/ja active Active
- 2009-06-23 CA CA2730232A patent/CA2730232C/en active Active
- 2009-06-23 CN CN2009801267055A patent/CN102089814B/zh active Active
- 2009-06-23 ES ES11162255.1T patent/ES2439549T3/es active Active
- 2009-06-23 WO PCT/EP2009/004522 patent/WO2010003545A1/en not_active Ceased
- 2009-06-23 EP EP11162255.1A patent/EP2352147B9/en active Active
- 2009-06-23 MX MX2011000370A patent/MX2011000370A/es active IP Right Grant
- 2009-06-23 RU RU2011104000/08A patent/RU2483366C2/ru active
- 2009-07-03 TW TW098122550A patent/TWI435316B/zh active
- 2009-07-07 AR ARP090102547A patent/AR072481A1/es active IP Right Grant
-
2010
- 2010-12-30 IL IL210414A patent/IL210414A/en active IP Right Grant
-
2011
- 2011-01-04 ZA ZA2011/00087A patent/ZA201100087B/en unknown
- 2011-01-07 CO CO11001549A patent/CO6341674A2/es active IP Right Grant
- 2011-01-11 US US13/004,272 patent/US8275626B2/en active Active
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| BRPI0910511A2 (pt) | "aparelho e método para decodificação de um sinal de áudio codificado" | |
| CN102099856B (zh) | 具有可切换旁路的音频编码/解码方法及设备 | |
| CN102113051B (zh) | 音频编码器、解码器以及音频信号的编码、解码方法 | |
| CN102089812B (zh) | 用以使用混叠切换方案将音频信号编码/解码的装置与方法 | |
| CN102177426A (zh) | 多分辨率切换音频编码/解码方案 | |
| HK1156433B (en) | An apparatus and a method for decoding an encoded audio signal | |
| HK1154432B (en) | An apparatus and a method for encoding an audio signal | |
| HK1138673B (en) | Audio encoding/decoding scheme having a switchable bypass |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
| B15K | Others concerning applications: alteration of classification |
Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/14 , G10L 21/02 Ipc: G10L 19/20 (2013.01), G10L 21/02 (2013.01), G10L 1 |
|
| B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
| B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
| B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 23/06/2009, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF |