BRPI0609530A2 - método e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala - Google Patents
método e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala Download PDFInfo
- Publication number
- BRPI0609530A2 BRPI0609530A2 BRPI0609530-5A BRPI0609530A BRPI0609530A2 BR PI0609530 A2 BRPI0609530 A2 BR PI0609530A2 BR PI0609530 A BRPI0609530 A BR PI0609530A BR PI0609530 A2 BRPI0609530 A2 BR PI0609530A2
- Authority
- BR
- Brazil
- Prior art keywords
- signal
- high band
- gain
- speech
- filter
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 57
- 230000005284 excitation Effects 0.000 claims abstract description 195
- 230000003595 spectral effect Effects 0.000 claims description 75
- 238000001228 spectrum Methods 0.000 claims description 54
- 238000004458 analytical method Methods 0.000 claims description 32
- 230000002123 temporal effect Effects 0.000 claims description 29
- 239000004606 Fillers/Extenders Substances 0.000 claims description 19
- 238000003786 synthesis reaction Methods 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 14
- 238000003672 processing method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 56
- 230000006870 function Effects 0.000 description 53
- 238000005070 sampling Methods 0.000 description 21
- 230000003044 adaptive effect Effects 0.000 description 18
- 238000009499 grossing Methods 0.000 description 18
- 230000004044 response Effects 0.000 description 18
- 239000013598 vector Substances 0.000 description 17
- 238000009432 framing Methods 0.000 description 14
- 230000007774 longterm Effects 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 230000002441 reversible effect Effects 0.000 description 10
- 238000013139 quantization Methods 0.000 description 9
- 238000003860 storage Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000006073 displacement reaction Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000000737 periodic effect Effects 0.000 description 6
- 239000007844 bleaching agent Substances 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000002087 whitening effect Effects 0.000 description 5
- 238000005452 bending Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000012952 Resampling Methods 0.000 description 3
- 238000004061 bleaching Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 101710167296 Arginine deiminase 2 Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003831 deregulation Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Analogue/Digital Conversion (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Control Of Amplification And Gain Control (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Control Of Eletrric Generators (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Image Analysis (AREA)
- Finish Polishing, Edge Sharpening, And Grinding By Specific Grinding Devices (AREA)
- Amplitude Modulation (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Air Conditioning Control Device (AREA)
- Ticket-Dispensing Machines (AREA)
- Developing Agents For Electrophotography (AREA)
- Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
- Filters And Equalizers (AREA)
- Crystals, And After-Treatments Of Crystals (AREA)
- Transmitters (AREA)
- Filtration Of Liquid (AREA)
- Solid-Sorbent Or Filter-Aiding Compositions (AREA)
- Filtering Of Dispersed Particles In Gases (AREA)
- Telephonic Communication Services (AREA)
- Peptides Or Proteins (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
MéTODOS E EQUIPAMENTO PARA ENCODIFICAR E DECODIFICAR UMA PORçãO DE BANDA ALTA DE UM SINAL DE FALA. Um encodificador de fala de banda larga de acordo com uma modalidade inclui um encodificador de banda baixa e um encodificador de banda alta. O encodificador de banda baixa é configurado para encodificar uma porção de banda baixa de um sinal de fala de banda larga como uni conjunto de parâmetros de filtro e um sinal de excitação encodificado. O encodificador de banda alta é configurado para calcular valores para codificar parâmetros que especificam um envelope espectral e um envelope temporal de uma porção de banda alta do sinal de fala de banda larga. o envelope temporal se baseia em um sinal de excitação de banda alta que é derivado do sinal de excitação encodificado. Em tal exemplo, o envelope temporal se baseia em urna diferença em níveis entre a porção de banda alta e um sinal de banda alta sintetizado, em que o sinal de banda alta sintetizado é gerado de acordo com o sinal de excitação de banda alta e um conjunto de parâmetros de filtro de banda alta.
Description
"MÉTODOS E EQUIPAMENTO PARA ENCODIFICAR E DECODIFICAR UMAPORÇÃO DE BANDA ALTA DE UM SINAL DE FALA"
CAMPO DA INVENÇÃO
Esta invenção se refere a processamento de sinal.
FUNDAMENTOS
Comunicações de voz através de rede de telefoniapública comutada (PSTN) têm sido tradicionalmente limitadasem largura de banda para a faixa de freqüência de 300-3400kHz. As redes novas para comunicação de voz, tal comotelefonia celular e voz sobre IP (Protocolo Internet,VoIP), podem não ter os mesmos limites de largura de banda,e pode ser desejável transmitir e receber comunicações devoz que incluam uma faixa de freqüência de banda largaatravés de tais redes. Por exemplo, pode ser de se j ávelsuportar uma faixa de freqüência de áudio que se estendadescendentemente até 50 Hz e/ou ascendentemente até 7 ou 8kHz. Também pode ser desejável suportar outras aplicações,tal como áudio de alta qualidade ou conferência deáudio/video, que pode ter conteúdo de fala de áudio nasfaixas fora dos limites PSTN tradicionais.
A extensão da faixa suportada por um codificadorde fala em freqüências superiores pode melhorar ainteligibilidade. Por exemplo, a informação de diferenciaf ri cativas tais como "s" e "f" está em grande parte nasfreqüências elevadas. Extensão de banda alta também podemelhorar outras qualidades de fala, tal como presença. Porexemplo, mesmo uma vogai falada pode ter energia espectralbem acima do limite PSTN.
Uma abordagem para codificação de fala de bandalarga envolve escalonamento de uma técnica de codificaçãode fala de banda estreita (por exemplo, aquela configuradapara encodificar a faixa de 0-4 kHz) para cobrir o espectrode banda larga. Por exemplo, um sinal de fala pode seramostrado em uma taxa superior para incluir componentes emaltas freqüências, e uma técnica de codificação de bandaestreita pode ser reconfigurada para utilizar maiscoeficientes de filtro para representar esse sinal de bandalarga. Técnicas de codificação de banda estreita tal comoCELP (predição linear excitada por livro-código) sãocomputacionalmente intensivas, contudo, e um codificadorCELP de banda larga pode consumir muitos ciclos deprocessamento para ser prático para muitas aplicaçõesmóveis e outras aplicações integradas. A encodificação doespectro inteiro de um sinal de banda larga para umaqualidade desejada usando tal técnica também pode levar aum aumento inaceitavelmente grande em largura de banda.Além disso, a transcodificação de tal sinal encodifiçadopode ser exigida antes até mesmo que sua porção de bandaestreita pudesse ser transmitida para e/ou decodificada porum sistema que suporta apenas codificação de bandaestreita.
Outra abordagem para codificação de fala de bandalarga envolve extrapolar o envelope espectral de banda altaa partir do envelope espectral de banda estreita,encodifiçado - Embora tal abordagem possa ser implementadasem qualquer aumento em largura de banda e sem anecessidade de transcodificação, o envelope espectralgrosseiro ou estrutura formante da porção de banda alta deum sinal de fala geralmente não pode ser predito exatamentea partir do envelope espectral da porção de banda estreita.
Pode ser desej ável implementar codificação defala de banda larga de tal modo que pelo menos a porção debanda estreita do sinal encodifiçado possa ser enviadaatravés de um canal de banda estreita (tal como um canalPSTN) sem transcodificação ou outra modificaçãosignificativa. A eficiência da extensão de codificação debanda larga também pode ser desejável, por exemplo, paraevitar uma redução significativa no número de usuários quepodem ser servidos em aplicações tais como telefoniacelular sem fio e transmissão através de canais cabeados ede canais sem fio.
SUMÁRIO
Em uma modalidade, um método para encodificar umaporção de banda alta de um sinal de fala tendo uma porçãode banda baixa e a porção de banda alta inclui calcular umapluralidade de parâmetros de filtro que caracterizam umenvelope espectral da porção de banda alta; calcular umsinal espectralmente estendido mediante extensão doespectro de um sinal derivado da porção de banda baixa;gerar um sinal de banda alta, sintetizado, de acordo com(A) um sinal de excitação de banda alta baseado no sinalespectralmente estendido e (B) a pluralidade de parâmetrosde filtro; e calcular um envelope de ganho com base em umarelação entre a porção de banda alta e um sinal baseado naporção de banda baixa.
Em uma modalidade, o método de processamento defala inclui gerar um sinal de excitação de banda alta combase em um sinal de excitação de banda baixa; gerar umsinal de banda alta, sintetizado, com base em um sinal defala de banda alta e o sinal de excitação de banda alta; ecalcular uma pluralidade de fatores de ganho com base emuma relação entre o sinal de fala de banda alta e um sinalbaseado no sinal de excitação de banda baixa.
Em outra modalidade, um método de decodificar umaporção de banda alta de um sinal de fala tendo uma porçãode banda baixa e a porção de banda alta inclui receber umapluralidade de parâmetros de filtro que caracterizam umenvelope espectral da porção de banda alta e umapluralidade de fatores de ganho que caracterizam umenvelope temporal da porção de banda alta; calcular umsinal espectralmente estendido mediante extensão doespectro de um sinal que se baseia em um sinal de excitaçãoda banda baixa; gerar um sinal de banda alta, sintetizado,de acordo com (A) a pluralidade de parâmetros de filtro e(B) um sinal de excitação de banda alta com base no sinalespectralmente estendido; e modular um envelope de ganho dosinal de banda alta, sintetizado de acordo com apluralidade de fatores de ganho.
Em outra modalidade, um equipamento configuradopara encodificar uma porção de banda alta de um sinal defala tendo uma porção de banda baixa e a porção de bandaalta inclui um módulo de análise configurado para calcularum conj unto de parâmetros de filtro que caracterizam umenvelope espectral da porção de banda alta; um extensor deespectro configurado para calcular um sinal espectralmenteestendido mediante extensão do espectro de um sinalderivado da porção de banda baixa; um filtro de sinteseconfigurado para gerar um sinal de banda alta, sintetizado,de acordo com (A) um sinal de excitação de banda alta combase no sinal espectralmente estendido e (B) o conjunto deparâmetros de filtro; e um calculador de fator de ganhoconfigurado para calcular um envelope de ganho com base emuma relação variável com o passar do tempo entre a porçãode banda alta e um sinal baseado na porção de banda baixa.
Em outra modalidade, um decodifiçador de fala debanda alta é configurado para receber (A) uma pluralidadede parâmetros de filtro que caracterizam um envelopeespectral de uma porção de banda alta de um sinal de fala e(B) um sinal de excitação de banda baixa encodificado,baseado em uma porção de banda baixa do sinal de fala. 0decodificador inclui um extensor de espectro configuradopara calcular um sinal espectralmente estendido medianteextensão do espectro de um sinal que é baseado no sinal deexcitação de banda baixa encodifiçado; um filtro de sinteseconfigurado para gerar um sinal de banda alta, sintetizado,de acordo com (A) uma pluralidade de parâmetros de filtroque caracterizam um envelope espectral da porção de bandaalta e (B) um sinal de excitação de banda alta baseado nosinal espectralmente estendido; e um elemento de controlede ganho configurado para modular um envelope de ganho dosinal de banda alta, sintetizado, de acordo com umapluralidade de fatores de ganho que caracterizam umenvelope temporal da porção da banda alta.
BREVE DESCRIÇÃO DOS DESENHOS
A Figura la mostra um diagrama de blocos de umencodificador de fala de banda larga A100 de acordo com umamodalidade.
A Figura lb mostra um diagrama de blocos de umaimplementação Al02 do encodificador de fala de banda largaA100.
A Figura 2a mostra um diagrama de blocos de umdecodificador de fala de banda larga BI00 de acordo com umamodalidade.
A Figura 2b mostra um diagrama de blocos de umaimplementação BI 02 do encodif icador de fala de banda largaB100.
A Figura 3a mostra um diagrama de blocos de umaimplementação A112 do grupo de filtros A110.
A Figura 3b mostra um diagrama de blocos de umaimplementação B122 do grupo de filtros B120.
A Figura 4a mostra a cobertura de largura debanda das bandas baixa e alta para um exemplo do grupo defiltros A110.
A Figura 4b mostra a cobertura de largura debanda das bandas baixa e alta para outro exemplo do grupode filtros A110.
A Figura 4c mostra um diagrama de blocos de umaimplementação A114 do grupo de filtros A112.
A Figura 4d mostra um diagrama de blocos de umaimplementação B124 do grupo de filtros B122.
A Figura 5a mostra um exemplo de um gráfico defreqüência versus amplitude de registro para um sinal defala.
A Figura 5b mostra um diagrama de blocos de umsistema de codificação de predição linear básica.
A Figura 6 mostra um diagrama de blocos de umaimplementação A122 do encodificador de banda estreita A120.
A Figura 7 mostra um diagrama de blocos de umaimplementação BI12 do decodificador de banda estreita BI10.
A Figura 8a mostra um exemplo de um gráfico defreqüência versus amplitude de registro para um sinalresidual para fala com voz.
A Figura 8b mostra um exemplo de um gráfico detempo versus amplitude de registro para um sinal residualpara fala com voz.
A Figura 9 mostra um diagrama de blocos de umsistema de codificação de predição linear básica que tambémrealiza predição de longo prazo.
A Figura 10 mostra um diagrama de blocos de umaimplementação A202 do encodificador de banda alta A200.
A Figura 11 mostra um diagrama de blocos de umaimplementação A302 do gerador de excitação de banda altaA300.
A Figura 12 mostra um diagrama de blocos de umaimplementação A402 do extensor de espectro A400-
A Figura 12a mostra gráficos de espectros desinal em vários pontos em um exemplo de uma operação deextensão espectral.A Figura 12b mostra gráficos de espectros desinal em vários pontos em outro exemplo de uma operação deextensão espectral.
A Figura 13 mostra um diagrama de blocos de umaimplementação A304 do gerador de excitação de banda altaA302.
A Figura 14 mostra um diagrama de blocos de umaimplementação A306 do gerador de excitação de banda altaA302.
A Figura 15 mostra um fluxograma para uma tarefade cálculo de envelope T100.
A Figura 16 mostra um diagrama de blocos de umaimplementação 4 92 do combinador 4 90.
A Figura 17 ilustra uma abordagem para calcularuma medida da periodicidade do sinal de banda alta S30.
A Figura 18 mostra um diagrama de blocos de umaimplementação A312 do gerador de excitação de banda altaA302 .
A Figura 19 mostra um diagrama de blocos de umaimplementação A314 do gerador de excitação de banda altaA302.
A Figura 20 mostra um diagrama de blocos de umaimplementação A316 do gerador de excitação de banda altaA302.
A Figura 21 mostra um fluxograma para uma tarefade cálculo de ganho T200.
A Figura 22 mostra um fluxograma para umaimplementação T210 da tarefa de cálculo de ganho T200.
A Figura 2 3a mostra um diagrama de uma função deenquadramento.
A Figura 23b mostra uma aplicação de uma funçãode enquadramento como mostrado na Figura 23a aos subquadrosde um sinal de fala.A Figura 24 mostra um diagrama de blocos para umaimplementação B202 do decodificador de banda alta B200.
A Figura 25 mostra um diagrama de blocos de umaimplementação ADIO do encodificador de fala de banda largaA100.
A Figura 26a mostra um diagrama esquemático deuma implementação Dl22 da linha de retardo Dl20.
A Figura 2 6b mostra um diagrama esquemático deuma implementação D124 da linha de retardo D120.
A Figura 27 mostra um diagrama esquemático de umaimplementação D130 da linha de retardo D120.
A Figura 28 mostra um diagrama de blocos de umaimplementação ADI 2 do encodif icador de fala de banda largaADIO.
A Figura 2 9 mostra um fluxograma de um método deprocessamento de sinal MD100 de acordo com uma modalidade.
A Figura 30 mostra um fluxograma para um métodoM100 de acordo com uma modalidade.
A Figura 31a mostra um fluxograma para um métodoM200 de acordo com uma modalidade.
A Figura 31b mostra um fluxograma para umaimplementação M210 do método M200.
A Figura 32 mostra um fluxograma para um métodoM300 de acordo com uma modalidade.
Nas figuras e descrição anexa, os mesmos rótulosde referência se referem aos mesmos elementos ou sinaisanálogos.
DESCRIÇÃO DETALHADA
As modalidades aqui descritas incluem sistemas,métodos, e equipamento que pode ser configurado para proveruma extensão para um codificador de fala de banda estreitapara suportar transmissão e/ou armazenamento de sinais defala de banda larga em um aumento de largura de banda deapenas aproximadamente 800 a 1000 bps (bits por segundo).Vantagens potenciais de tais implementações incluemcodificação integrada para suportar compatibilidade com ossistemas de banda estreita, alocação e realocaçãorelativamente fáceis de bits entre os canais de codificaçãode banda estreita e de banda alta, evitando uma operação desíntese de banda larga computacionalmente intensidade, emantendo uma baixa taxa de amostragem para sinais a seremprocessados pelas rotinas de codificação de forma de ondacomputacionalmente intensivas.
A menos que expressamente limitado por seucontexto, o termo "calculando" é usado aqui para indicarquaisquer de seus significados comuns, tal como computando,gerando, e selecionando a partir de uma lista de valores.
Onde o termo "compreendendo" é usado na presente descriçãoe reivindicações, ele não exclui outros elementos ouoperações. O termo "A se baseia em B" é usado para indicarquaisquer de seus significados comuns, incluindo os casos(i) "A é igual a B" e (ii) "A se baseia em pelo menos B". Otermo "Protocolo Internet" inclui a versão 4, como descritoem IETF (Força Tarefa de Engenharia da Internet) RFC(Solicitação para Comentários) 791, e versões subseqüentestal como a versão 6.
A Figura la mostra um diagrama de blocos de umencodificador de fala de banda larga A100 de acordo com umamodalidade. O grupo de filtros A110 é configurado parafiltrar um sinal de fala de banda larga S10 para produzirum sinal de banda estreita S20 e um sinal de banda altaS30. O encodificador de banda estreita A120 é configuradopara encodificar o sinal de banda estreita S20 paraproduzir parâmetros de filtro de banda estreita (NB) S40 eum sinal residual de banda estreita S50. Como descrito emdetalhe adicional aqui, o encodificador de banda estreitaA120 é configurado tipicamente para produzir parâmetros defiltro de banda estreita S40 e sinal de excitação de bandaestreita encodifiçado S50 como / Índices de livro-código ouem uma forma quantizada. O encodificador de banda alta A200é configurado para encodificar o sinal de banda alta S30 deacordo com informação no sinal de excitação de bandaestreita encodificado S50 para produzir parâmetros decodificação de banda alta S60. Como descrito em detalheadicional aqui, o encodificador de banda alta A200 éconfigurado tipicamente para produzir parâmetros decodificação de banda alta S60 como índices de livro-códigoou em outra forma quantizada. Um exemplo específico deencodificador de fala de banda larga A100 é configuradopara encodificar sinal de fala de banda larga S10 em umataxa de aproximadamente 8.55 kbps (quilobits por segundo),
com aproximadamente 7.55 kbps sendo usados para parâmetrosde filtro de banda estreita S40 e sinal de excitação debanda estreita encodificado S50, e aproximadamente 1 kbpssendo usado para parâmetros de codificação de banda altaS60.
Pode ser desejado combinar os sinais de bandaestreita e de banda alta encodifiçados em um único fluxo debits. Por exemplo, pode ser desejado multiplexar os sinaisencodifiçados em conjunto para transmissão (por exemplo,através de um canal de transmissão cabeado, ótico ou semfio), ou para armazenamento, como um sinal de fala de bandalarga encodificado. A Figura lb mostra um diagrama deblocos de uma implementação A102 de encodificador de falade banda larga A100 que inclui um multiplexador A130configurado para combinar parâmetros de filtro de bandaestreita S40, sinal de excitação de banda estreitaencodificado S50, e parâmetros de filtro de banda alta S60em um sinal multiplexado S70.Um equipamento incluindo encodificador A102também pode incluir conjunto de circuitos configurado paratransmitir sinal multiplexado S70 em um canal detransmissão tal como um canal cabeado, ótico ou sem fio.
Tal equipamento também pode ser configurado para realizaruma ou mais operações de encodificação de canal no sinal,tal como encodif icação de correção de erro (por exemplo,encodificação convolucional compatível com taxa) e/ouencodificação de detecção de erro (por exemplo,encodificação de redundância ciclica), e/ou uma ou maiscamadas de encodificação de protocolo de video (porexemplo, Ethernet, TCP/IP, cdma2000).
Pode ser desejável que o multiplexador A130 sejaconfigurado para integrar o sinal de banda estreitaencodificado (incluindo parâmetros de filtro de bandaestreita S40 e sinal de excitação de banda estreitaencodificado S50) como um subfluxo separável de sinalmultiplexado S70, de tal modo que o sinal de banda estreitaencodificado pode ser recuperado e decodificadoindependentemente de outra porção do sinal multiplexado S70tal como um sinal de banda alta e/ou banda baixa. Porexemplo, o sinal multiplexado S70 pode ser arranjado de talmodo que o sinal de banda estreita encodificado pode serrecuperado mediante remoção dos parâmetros de filtro debanda alta S60. Uma vantagem potencial de talcaracterística é a de evitar a necessidade detranscodificar o sinal de banda larga encodificado antes depassar o mesmo para um sistema que suporta decodificação dosinal de banda estreita, mas não suporta decodificação daporção de banda alta.
A Figura 2a é um diagrama de blocos de umdecodificador de fala de banda larga B100 de acordo com umamodalidade. O decodificador de banda estreita B110 éconfigurado para decodificar os parâmetros de filtro debanda estreita S40 e o sinal de excitação de banda estreitaencodificado S50 para produzir um sinal de banda estreitaS90. 0 decodificador de banda alta B200 é configurado paradecodificar os parâmetros de codificação de banda alta S60de acordo com um sinal de excitação de banda estreita S80,com base no sinal de excitação de banda estreitaencodificado S50, para produzir um sinal de banda altaS100. Nesse exemplo, o decodificador de banda estreita B110é configurado para prover sinal de excitação de bandaestreita S80 ao decodificador de banda alta B200. 0 grupode filtros B120 é configurado para combinar sinal de bandaestreita S90 e sinal de banda alta S100 para produzir umsinal de fala de banda larga SUO.
A Figura 2b é um diagrama de blocos de umaimplementação B102 de decodificador de fala de banda largaB100 que inclui um demultiplexador B130 configurado paraproduzir sinais encodifiçados S40, S50, e S60 a partir dosinal multiplexado S70. Um equipamento incluindodecodificador B102 pode incluir conjunto de circuitosconfigurado para receber sinal multiplexado S70 a partir deum canal de transmissão tal como um canal cabeado, ótico ousem fio. Tal equipamento também pode ser configurado pararealizar uma ou mais operações de decodificação de canal nosinal, tal como decodif icação de correção de erro (porexemplo, decodificação convolucional compatível com taxa)e/ou decodificação de detecção de erro (por exemplo,decodificação de redundância ciclica), e/ou uma ou maiscamadas de decodificação de protocolo de rede (por exemplo,Ethernet, TCP/IP, cdma2000).
0 grupo de filtros A110 é configurado parafiltrar um sinal de entrada de acordo com um esquema debanda dividida para produzir uma sub-banda de baixafreqüência e uma sub-banda de alta freqüência. Dependendodos critérios de desenho para aplicação especifica, as sub-bandas de saida podem ter larguras de banda iguais oudesiguais e podem ser sobrepostas ou não-sobrepostas. Umaconfiguração de grupo de filtros Al 10 que produz mais doque duas sub-bandas também é possivel, Por exemplo, umgrupo de filtros pode ser configurado para produzir um oumais sinais de banda baixa que incluem componentes em umafaixa de freqüência abaixo daquela do sinal de bandaestreita S20 (tal como a faixa de 50-300 Hz) . Também épossivel que tal grupo de filtros seja configurado paraproduzir um ou mais sinais de banda alta, adicionais, queincluem componentes em uma faixa de freqüência acimadaquela do sinal de banda alta S30 (tal como uma faixa de14-20, 16-20, ou 16-32 kHz) . Em tal caso, o encodificadorde fala de banda larga Al 00 pode ser implementado paraencodificar esse sinal ou sinais separadamente, e omultiplexador Al30 pode ser configurado para incluir osinal ou sinais encodifiçados adicionais no sinalmultiplexado S70 (por exemplo, como uma porção separavel).
A Figura 3a mostra um diagrama de blocos de umaimplementação Al 12 do grupo de filtros Al 10 que éconfigurado para produzir dois sinais de sub-banda tendotaxas de amostragem reduzidas. O grupo de filtros Al 10 éarranj ado para receber um sinal de fala de banda larga S10tendo uma porção de freqüência elevada (ou banda alta) euma porção de baixa freqüência (ou banda baixa). O grupo defiltros Al 12 inclui um caminho de processamento de bandabaixa configurado para receber o sinal de fala de bandalarga S10 e produzir um sinal de fala de banda estreitaS20, e um caminho de processamento de banda altaconfigurado para receber o sinal de fala de banda larga S10e produzir sinal de fala de banda alta S30. Filtro passa-baixa 110 filtra o sinal de fala de banda larga S10 parapassar uma sub-banda de baixa freqüência selecionada, efiltro passa-alta 130 filtra o sinal de fala de banda largaS10 para passar uma sub-banda de alta freqüênciaselecionada. Devido ao fato de ambos os sinais de sub-bandaterem mais larguras de banda estreita do que o sinal defala de banda larga S10, suas taxas de amostragem podem serreduzidas até certo ponto sem perda de informação. Odownsampler 120 reduz a taxa de amostragem do sinal passa-baixa de acordo com um fator de decimação desejado (porexemplo, mediante remoção das amostras do sinal e/ousubstituindo as amostras com valores médios), e odownsampler 140 similarmente reduz a taxa de amostragem dosinal passa-alta de acordo com outro fator de decimaçãodesej ado.
A Figura 3b mostra um diagrama de blocos de umaimplementação correspondente BI22 do grupo de filtros B120.O mostrador ascendente 150 aumenta a taxa de amostragem dosinal de banda estreita S90 (por exemplo, medianteenchimento-zero e/ou mediante duplicação das amostras), e ofiltro passa-baixa 160 filtra o sinal amostradoascendentemente para passar apenas uma porção de bandabaixa (por exemplo, para prevenir sinal falso).Similarmente, o upsampler 17 0 aumenta a taxa de amostragemdo sinal de banda alta S100 e o filtro passa-alta 180filtra o sinal amostrado ascendentemente para passar apenasuma porção de banda alta. Os dois sinais de banda passantesão então somados para formar o sinal de fala de bandalarga SI10. Em algumas implementações do decodificadorB100, o grupo de filtros B120 é configurado para produziruma soma ponderada dos dois sinais de banda passante deacordo com um ou mais pesos recebidos e/ou calculados pelodecodificador de banda alta B200. Uma configuração do grupode filtros B120 que combina mais do que dois sinais debanda passante também é considerada.
Cada um dos filtros 110, 130, 160, 180 pode serimplementado como um filtro finito-impulso-resposta (FIR)ou como um filtro infinito-impulso-resposta (IIR). Asrespostas de freqüência dos filtros de encodificação 110 e130 podem ter regiões de transição de formato simétrico oude formato diferente entre a banda de parada e a bandapassante. Similarmente, as respostas de freqüência dosfiltros de decodificador 160 e 180 podem ter regiões detransição simétricas ou de formato diferente entre banda deparada e banda passante. Pode ser desejável, mas não éestritamente necessário que o filtro passa-baixa 110 tenhaa mesma resposta que o filtro passa-baixa 160, e que ofiltro passa-alta 130 tenha a mesma resposta que o filtropassa-alta 180. Em um exemplo, os dois pares de filtro 110,130 e 160, 180 são grupos de filtro de espelho dequadratura (QMF) , com o par de filtros 110, 130 tendo osmesmos coeficientes que o par de filtros 160, 180.
Em um exemplo tipico, o filtro passa-baixa 110tem uma banda passante que inclui a faixa PSTN limitada de300-3400 Hz (por exemplo, a banda de 0 a 4 kHz). As Figuras4a e 4b mostram larguras de banda relativas do sinal defala de banda larga S10, sinal de banda estreita S20, esinal de banda alta S30 em dois exemplos de implementaçãodiferentes. Nesses dois exemplos específicos, o sinal defala de banda larga S10 tem uma taxa de amostragem de 16kHz (representando componentes de freqüência dentro dafaixa de 0 a 8 kHz), e o sinal de banda estreita S20 temuma taxa de amostragem de 8 kHz (representando componentesde freqüência dentro da faixa de 0 a 4 kHz).
No exemplo da Figura 4a, não existe sobreposiçãosignificativa entre as duas sub-bandas. Um sinal de bandaalta S30 como mostrado nesse exemplo pode ser obtidoutilizado um filtro passa-alta 130 com uma banda passantede 4-8 kHz. Em tal caso, pode ser conveniente reduzir ataxa de amostragem para 8 kHz mediante downsampling dosinal filtrado por um fator de dois. Tal operação, a qualconforme se pode esperar reduza significativamente acomplexidade computacional de operações de processamentoadicionais no sinal, mudará a energia de banda passantedescendentemente para a faixa de 0 a 4 kHz sem perda deinformação.
No exemplo alternativo da Figura 4b, as sub-bandas, superior e inferior, têm uma sobreposiçãoconsiderável, de tal modo que a região de 3.5 a 4 kHz édescrita por ambos os sinais de sub-banda. Um sinal debanda alta S30 como nesse exemplo pode ser obtidoutilizando-se um filtro passa-alta 130 com uma bandapassante de 3.5-7 kHz. Em tal caso, pode ser de se j ávelreduzir a taxa de amostragem para 7 kHz mediantedownsampling do sinal filtrado por um fator de 16/7. Taloperação, que pode ser esperada para reduzirsignificativamente a complexidade computacional deoperações de processamento adicionais no sinal, mudará aenergia de banda passante descendentemente para a faixa de0 a 3.5 kHz sem perda de informação.
Em um aparelho telefônico tipico para comunicaçãotelefônica, um ou mais dos transdutores (isto é, omicrofone e o auricular ou alto-falante) não tem umaresposta considerável através da faixa de freqüência de 7-8kHz. No exemplo da Figura 4b, a porção do sinal de fala debanda larga S10 entre 7 e 8 kHz não é incluida no sinalencodificado. Outros exemplos específicos de filtro passa-alta 130 têm bandas passantes de 3.5-7.5 kHz e 3.5-8 kHz.
Em algumas implementações, prover umasobreposição entre sub-bandas como no exemplo da Figura 4bpermite o uso de um filtro passa-baixa e/ou passa-altatendo um decaimento suave sobre a região sobreposta. Taisfiltros são, tipicamente, mais fáceis de projetar, menoscomplexos em termos de computação, e/ou introduzem menosretardo do que os filtros com respostas mais acentuadas ou"brick-wall". Os filtros tendo regiões de transmissãoacentuadas tendem a ter lobos laterais superiores (os quaispodem causar sinal falso) do que os filtros de ordemsimilar que tem decaimentos suaves. Os filtros tendoregiões de transição acentuadas também podem ter respostasde impulso longas que podem causar artefatos de toque. Paraimplementações de grupo de filtros tendo um ou mais filtrosIIR, permitindo um decaimento suave através da regiãosobreposta pode permitir o uso de um filtro ou filtroscujos pólos estão mais distantes do circulo unitário, o quepode ser importante para garantir implementação de pontofixo estável.
A sobreposição de sub-bandas permite umacombinação suave de banda baixa e banda alta que podeconduzir a um número menor de artefatos audíveis, reduzindosinal falso, e/ou uma transição menos perceptível de umabanda para outra. Além disso, a eficiência de codificaçãodo encodifiçador de banda estreita Al 20 (por exemplo, umcodificador de forma de onda) pode diminuir com freqüênciaaumentada. Por exemplo, a qualidade de codificação docodificador de banda estreita pode ser reduzida em baixastaxas de bits, especialmente na presença de ruido de fundo.Em tais casos, prover uma sobreposição das sub-bandas podeaumentar a qualidade dos componentes de freqüênciareproduzidos na região sobreposta.
Além disso, a sobreposição de sub-bandas permiteuma mistura suave de banda baixa e banda alta que podelevar a um número menor de artefatos audíveis, sinaisfalsos reduzidos, e/ou uma transição menos perceptível deuma banda para a outra. Tal característica pode serespecialmente desejável para uma implementação na qual oencodificador de banda estreita A120 e o encodificador debanda alta A200 operam de acordo com diferentesmetodologias de codificação. Por exemplo, técnicas decodificação diferentes podem produzir sinais que soam muitodiferentes. Um codificador que encodifica um envelopeespectral na forma de índices de livro-código pode produzirum sirlal tendo um som diferente do que um codificador queencodifica em vez disso o espectro de amplitude. Umcodificador de domínio de tempo (por exemplo, uma modulaçãode pulso-código ou codificador PCM) pode produzir um sinaltendo um som diferente do que um codificador de freqüência-domínio. Um codificador que encodifica um sinal com umarepresentação do envelope espectral e o sinal residualcorrespondente pode produzir um sinal tendo um somdiferente de um codificador que encodifica um sinal apenascom uma representação do envelope espectral. Um codificadorque encodifica um sinal como uma representação de sua formade onda pode produzir uma saída tendo um som diferentedaquele de um codificador senoidal. Em tais casos, usarfiltros tendo regiões de transição acentuadas para definirsub-bandas de não-sobreposição pode levar a uma transiçãoabrupta e perceptível entre as sub-bandas no sinal de bandalarga sintetizado.
Embora os grupos de filtros QMF tendo respostasde freqüência complementarmente sobrepostas freqüentementesão usados em técnicas de sub-banda, tais filtros sãoinadequados para pelo menos algumas das implementações decodificação de banda larga, aqui descritas. Um grupo defiltros QMF no encodificador é configurado para criar umgrau significativo de sinal falso que é cancelado no grupode filtros QMF correspondente no decodificador. Tal arranjopode não ser apropriado para uma aplicação na qual o sinalincorre em uma quantidade significativa de distorção entreos grupos de filtros, uma vez que a distorção pode reduzira eficácia da propriedade de cancelamento de sinal falso.Por exemplo, aplicações descritas aqui incluemimplementações de codificação configuradas para operar emtaxas de bits muito baixas. Como conseqüência da taxa debits muito baixa, o sinal decodificado provavelmenteparecerá significativamente distorcido em comparação com osinal original, de tal modo que o uso de grupos de filtrosQMF pode levar a sinal falso não-cancelado. Aplicações queutilizam grupos de filtro QMF têm tipicamente taxas de bitssuperiores (por exemplo, acima de 12 kbps para AMR, e 64kbps para G.722).
Adicionalmente, um codificador pode serconfigurado para produzir um sinal sintetizado que éperceptualmente similar ao sinal original, mas o qualdifere efetivamente de forma significativa do sinaloriginal. Por exemplo, um codificador que deriva aexcitação de banda alta a partir do residual de bandaestreita como descrito aqui pode produzir tal sinal, umavez que o residual de banda alta efetivo pode estarcompletamente ausente do sinal decodificado. O uso degrupos de filtros QMF em tais aplicações pode levar a umgrau significativo de distorção causado por sinal falsonão-cancelado.
A quantidade de distorção causada por sinal falsoQMF pode ser reduzida se a sub-banda afetada for estreita,uma vez que o efeito do sinal falso é limitado a umalargura de banda igual à largura da sub-banda. Paraexemplos como descritos aqui nos quais cada sub-bandainclui aproximadamente metade da largura de banda da bandalarga, contudo, a distorção causada por sinal falso não-cancelado poderia afetar uma parte significativa do sinal.A qualidade do sinal também pode ser afetada pelalocalização da banda de freqüência sobre a qual ocorre osinal falso não-cancelado. Por exemplo, distorção criadapróxima ao centro de um sinal de fala de banda larga (porexemplo, entre 3 e 4 kHz) pode ser muito mais questionáveldo que a distorção que ocorre próximo a uma borda do sinal(por exemplo, acima de 6 kHz) .
Embora as respostas dos filtros de um grupo defiltros QMF sejam estritamente relacionadas uma à outra, oscaminhos de banda baixa e de banda alta dos grupos defiltro A110 e B120 podem ser configurados para terespectros que são completamente não-relacionados excetopela sobreposição das duas sub-bandas. Definimos asobreposição de duas sub-bandas como a distância a partirdo ponto no qual a resposta de freqüência do filtro debanda alta cai para -20 dB até o ponto no qual a respostade freqüência do filtro de banda baixa cai para -20 dB. Emvários exemplos do grupo de filtros Al 10 e/ou B120, essasobreposição varia de aproximadamente 200 Hz aaproximadamente 1 kHz. A faixa de aproximadamente 4 00 aaproximadamente 600 Hz pode representar uma contrapartidadesej ável entre eficiência de codificação e suavidadeperceptual. Em um exemplo especifico, como mencionadoacima, a sobreposição é de aproximadamente 500 Hz.
Pode ser desejável implementar o grupo de filtrosAl 12 e/ou B122 para realizar operações conforme ilustradonas Figuras 4a e 4b em vários estágios. Por exemplo, aFigura 4c mostra um diagrama de blocos de uma implementaçãoAl 14 do grupo de filtros Al 12 que realiza um equivalentefuncional das operações de downsampling e de filtraçãopassa-alta utilizando uma série de operações deinterpolação, reamostragem, decimação e outras. Talimplementação pode ser mais fácil de projetar e/ou podepermitir a reutilização de blocos funcionais de lógica e/oucódigo. Por exemplo, o mesmo bloco funcional pode ser usadopara realizar as operações de decimação para 14 kHz edecimação para 7 kHz como mostrado na Figura 4c. A operaçãode reversão espectral pode ser implementada mediantemultiplicação do sinal com a função ejn7r ou a seqüência (-l)n, cujos valores alternam entre +1 e -1. A operação demodelagem espectral pode ser implementada como um filtropassa-baixa configurado para modelar o sinal para obter umaresposta de filtro global desejada -
Observa-se que como uma conseqüência da operaçãode reversão espectral, o espectro do sinal de banda altaS30 é revertido. Operações subseqüentes no encodificador edecodificador correspondente podem ser configuradasconformemente. Por exemplo, o gerador de excitação de bandaalta A300 como aqui descrito pode ser configurado paraproduzir um sinal de excitação de banda alta S120 quetambém tem uma forma espectralmente revertida.
A Figura 4d mostra um diagrama de blocos de umaimplementação B124 do grupo de filtros B122 que realiza umequivalente funcional das operações de filtração deupsampling e de passa-alta utilizando uma série deoperações de interpolação, reamostragem, e outras. 0 grupode filtros B124 inclui uma operação de reversão espectralna banda alta que reverte uma operação similar conformerealizada, por exemplo, em um grupo de filtros doencodif icador tal como o grupo de filtros Al 14. Nesseexemplo especifico, o grupo de filtros BI24 inclui tambémfiltros corta faixas na banda baixa e banda alta queatenuam um componente do sinal em 7100 Hz, embora taisfiltros sejam opcionais e não precisem ser incluídos. 0Pedido de Patente "SYSTEMS, METHODS, AND APPARATUS FORSPEECH SIGNAL FILTERING" depositado com o presente, Númerodo Dossiê do Advogado 050551, inclui descrição adicional efiguras relacionadas às respostas de elementos deimplementações especificas dos grupos de filtro A110 eBI 20, e esse material é pelo presente incorporado comoreferência.
O encodificador de banda estreita A120 éimplementado de acordo com um modelo de fonte-filtro queencodifica o sinal de fala de entrada como (A) um conjuntode parâmetros que descrevem um filtro e (B) um sinal deexcitação que aciona o filtro descrito para produzir umareprodução sintetizada do sinal de fala de entrada. AFigura 5A mostra um exemplo de um envelope espectral de umsinal de fala. Os picos que caracterizam esse envelopeespectral representam ressonâncias do trato vocal e sãodenominados formantes. A maioria dos codificadores de falaencodifica pelo menos essa estrutura espectral grosseiracomo um con j unto de parâmetros tais como coeficientes defiltro.
A Figura 5B mostra um exemplo de um arranj o defiltro-fonte básico conforme aplicado na codificação doenvelope espectral do sinal de banda estreita S20. Ummódulo de análise calcula um conj unto de parâmetros quecaracterizam um filtro correspondendo ao som de fala por umperiodo de tempo (tipicamente 20 mseg) . Um filtro debranqueamento (também denominado um filtro de erro depredição ou análise) configurado de acordo com aquelesparâmetros de filtro remove o envelope espectral paraaplanar espectralmente o final- O sinal branqueadoresultante (também chamado residual) tem menos energia edesse modo menos variância e é mais fácil de encodificar doque o sinal de fala original. Erros resultantes dacodificação do sinal residual podem também ser espalhadosmais igualmente através do espectro. Os parâmetros defiltro e residual são tipicamente quantizados paratransmissão eficiente através do canal. No decodificador,um filtro de síntese configurado de acordo com osparâmetros de filtro é excitado por um sinal com base noresidual para produzir uma versão sintetizada do som defala original- 0 filtro de sintese é configuradotipicamente para ter uma função de transferência que é oinverso da função de transferência do filtro debranqueamento.
A Figura 6 mostra um diagrama de blocos de umaimplementação básica Al 2 2 do encodificador de bandaestreita Al2 0 - Nesse exemplo, um módulo de análise decodificação de predição linear (LPC) 210 encodifica oenvelope espectral do sinal de banda estreita S20 como umconj unto de coeficientes de predição linear (LP) (porexemplo, coeficientes de um filtro todos os pólos 1/A(z)).O módulo de análise processa tipicamente o sinal de entradacomo uma série de quadros de não-sobreposição, com um novoconjunto de coeficientes sendo calculado para cada quadro.O periodo de quadro é geralmente um periodo através do qualse pode esperar que o sinal esteja localmente estacionário;um exemplo comum é de 20 milissegundos (equivalente a 160amostras em uma taxa de amostragem de 8 kHz) , Em umexemplo, o módulo de análise LPC 210 é configurado paracalcular um conjunto de 10 coeficientes de filtro LP paracaracterizar a estrutura de formando de cada quadro de 20-milissegundos. Também é possível implementar o módulo deanálise para processar o sinal de entrada como uma série dequadros sobrepostos.
O modo de análise pode ser configurado paraanalisar as amostras de cada quadro diretamente, ouamostras podem ser ponderadas em primeiro lugar de acordocom a função de enquadramento (por exemplo, uma j anelaHamming). A análise também pode ser realizada através deuma janela que é maior do que o quadro, tal como uma janelade 30 mseg. Essa janela pode ser simétrica (por exemplo, 5-20-5, de tal modo que ela inclui os 5 milissegundosimediatamente antes e após o quadro de 20-milissegundos) ouassimétrica (por exemplo, 10-20, de tal modo que ela incluios últimos 10 milissegundos do quadro precedente). Ummódulo de análise LPC é configurado tipicamente paracalcular os coeficientes de filtro LP utilizando umarecursão Levinson-Durbin ou o algoritmo Leroux-Gueguen. Emoutra implementação, o módulo de análise pode serconfigurado para calcular um conj unto de coeficienteceps trais para cada quadro em vez de um con j unto decoeficientes de filtro LP.
A taxa de saida do encodificador A120 pode serreduzida significativamente, com relativamente pouco efeitosobre a qualidade de reprodução, mediante quantização dosparâmetros de filtro. Os coeficientes de filtro de prediçãolinear são difíceis de quantizar eficientemente enormalmente são mapeados em outra representação, tal comopares espectrais de linha (LSPs) ou freqüências espectraisde linha (LSFs), para quantização e/ou encodificação deentropia. No exemplo da Figura 6, a transformada deeficiente de filtro LP para LSF 22 0 transforma o conjuntode coeficientes de filtro LP em um conjunto correspondentede LSFs. Ou representação de um-para-um dos coeficientes defiltro LP incluem coeficientes de correlação parcial;valores de relação-log-área; pares espectrais de imitância(ISPs); e freqüências espectrais de imitância (ISFs), quesão usados no codec GSM (Sistema Global para ComunicaçõesMóveis) AMR-WB (Banda Larga-Multitaxa Adaptativa).Tipicamente uma transformada entre um conjunto decoeficientes de filtro LP e um conjunto correspondente deLSFs é reversível, mas as modalidades também incluemimplementações do encodificador A120 no qual a transformadanão é reversível sem erro.
O quantizador 230 é configurado para quantizar oconjunto de LSFs de banda estreita (ou outra representaçãode coeficiente), e o encodificador de banda estreita A122 éconfigurado para produzir o resultado dessa quantizaçãocomo os parâmetros de filtro de banda estreita S40. Talquantizador inclui tipicamente um quantizador de vetor queencodif i ca o vetor de entrada como um indice para umaentrada de vetor correspondente em uma tabela ou livro-código.
Como visto na Figura 6, o encodif icador de bandaestreita Al 22 também gera um sinal residual mediantepassagem do sinal de banda estreita S20 através de umfiltro de branqueamento 2 60 (também denominado filtro deerro de pr edição ou análise) que é configurado de acordocom o conj unto de coeficientes de filtro. Nesse exemploespecifico, o filtro de branqueamento 260 é implementadocomo um filtro FIR, embora implementações IIR também possamser usadas - Esse sinal residual conterá tipicamenteinformação perceptualmente importante do quadro de fala,tal como estrutura de longo prazo relacionada à diapasão,que não é representado nos parâmetros de filtro de bandaestreita S40. O quantizador 270 é configurado para calcularuma representação quantizada desse sinal residual parasaida como sinal de excitação de banda estreitaencodifiçado S50. Tal quantizador inclui tipicamente umquantizador de vetor que encodifica o vetor de entrada comoum indice para uma entrada de vetor correspondente em umatabela ou livro-código. Alternativamente, tal quantizadorpode ser configurado para enviar um ou mais parâmetros apartir dos quais o vetor pode ser gerado dinamicamente nodecodificador, mais propriamente do que recuperado a partirdo armazenamento, como em um método de livro-códigoesparso. Tal método é usado em esquemas de codificação talcomo CELP algébrico (predição linear de excitação de livro-código) e codecs tal como 3GPP2 (Parceria de TerceiraGeração 2) EVRC (Codec de Taxa Variável Aperfeiçoado).
É desejável que o encodificador de banda estreitaA120 gere o sinal de excitação de banda estreitaencodifiçada de acordo com os mesmos valores de parâmetrode filtro que estarão disponíveis para o decodificador debanda estreita correspondente. Dessa maneira, o sinal deexcitação de banda estreita encodifiçado, resultante podejá considerar até certo ponto as não-idealidades naquelesvalores de parâmetro, tal como erro de quantização.Conseqüentemente, é desej ável configurar o filtro debranqueamento utilizando os mesmos valores de coeficienteque estarão disponíveis no decodificador. No exemplo básicodo encodificador Al 22 como mostrado na Figura 6, oquantizador inverso 240 dequantiza os parâmetros decodificação de banda estreita S40, a transformada decoeficiente de filtro de LSF-para-LP 250 mapeia os valoresresultantes de volta para um conjunto correspondente decoeficientes de filtro LP, e esse conjunto de coeficientesé usado para configurar o filtro de branqueamento 2 60 paragerar o sinal residual que é quantizado pelo quantizador270.
Algumas implementações do encodificador de bandaestreita Al 20 são configuradas para calcular o sinal deexcitação de banda estreita encodifiçado S50 medianteidentificação de um vetor entre um conjunto de vetores delivro-código que combina melhor com o sinal residual.Observa-se, contudo, que o encodificador de banda estreitaA120 também pode ser implementado para calcular umarepresentação quantizada do sinal residual sem efetivamente gerar o sinal residual. Por exemplo, o encodificador debanda estreita A120 pode ser configurado para usar umnúmero de vetores de livro-código para gerar sinaissintetizados correspondentes (por exemplo, de acordo com umconjunto atual de parâmetros de filtro), e para selecionar o vetor de livro-código associado ao sinal gerado quemelhor combina com o sinal de banda estreita original S20em um domínio perceptualmente ponderado.
A Figura 7 mostra um diagrama de blocos de umaimplementação B112 de decodificador de banda estreita B110.
Quantizador inverso 310 dequantiza os parâmetros de filtrode banda estreita S40 (nesse caso, para um conjunto deLSFs), e a transformada de coeficiente de filtro LSF-para-LP 320 transforma os LSFs em um conjunto de coeficientes defiltro (por exemplo, como descrito acima com referência aoquantizador inverso 240 e transformação 250 doencodificador de banda estreita A122). O quantizadorinverso 340 dequantiza o sinal residual de banda estreitaS40 para produzir um sinal de excitação de banda estreitaS80. Com base nos coeficientes de filtro e sinal deexcitação de banda estreita S80, o filtro de síntese debanda estreita 330 sintetiza o sinal de banda estreita S90.Em outras palavras, o filtro de sintese de banda estreita330 é configurado para moldar espectralmente o sinal deexcitação de banda estreita S80 de acordo com oscoeficientes de filtro dequantizados para produzir o sinalde banda estreita S90. O decodificador de banda estreitaB112 também prove sinal de excitação de banda estreita S80ao encodificador de banda alta A200, o qual utiliza o mesmopara derivar o sinal de excitação de banda alta S120 comodescrito aqui. Em algumas implementações como descritoabaixo, o decodificador de banda estreita B110 pode serconfigurado para prover informação adicional aodecodificador de banda alta B200 que se refere ao sinal debanda estreita, tal como inclinação espectral, ganho eatraso de diapasão, e modo de fala.
0 sistema do encodificador de banda estreita A122e o decodificador de banda estreita B112 são um exemplobásico de um codec de fala de análise-por-sintese. Acodificação de predição linear de excitação de livro-código(CELP) é uma familia popular de codificação de análise-por-sintese, e implementações de tais codificadores podemrealizar encodificação de forma de onda do residual,incluindo operações tais como seleção de entradas a partirde livros-código fixos e adaptativos, operações deminimização de erro, e/ou operações de ponderaçãoperceptual. Outras implementações de codificação deanálise-por-sintese incluem predição linear de citaçãomista (MELP), CELP algébrico (ACELP), CELP de relaxação(RCELP), excitação de pulso regular (RPE), CELP demúltiplos pulsos (MPE), e codificação de predição linearexcitada de vetor-soma (VSELP). Métodos de codificaçãorelacionados incluem codificação de excitação de multibanda(BEM) e de interpolação de forma de onda protótipo (PWI) .Exemplos de codecs de fala de análise-por-sintese,padronizados incluem o codec de taxa completa ETSI(Instituto de Padrão de Telecomunicação Europeu)-GSM (GSM06.10), que utiliza predição linear excitada residual(RELP); o codec de taxa completa aperfeiçoado GSM (ETSI-GSM06.60); o codificação Annex E 11.8 kb/s G.729 padrão ITU(União de Telecomunicação Internacional); os codecs IS(Padrão Interino)-641 para IS-136 (um esquema de acessomúltiplo por divisão de tempo); os codecs de taxa múltiplaadaptativos GSM (GSM-AMR); e o codec 4GV™ (Vocoder™ deQuarta Geração) (QUALCOMM Incorporated, San Diego, CA) . 0encodificador de banda estreita A120 e o decodificadorcorrespondente BI 10 podem ser implementados de acordo comqualquer uma dessas tecnologias, ou qualquer outratecnologia de codificação de fala (seja conhecida ou a serdesenvolvida) que representa um sinal de fala como (A) umconjunto de parâmetros que descrevem um filtro e (B) umsinal de excitação usado para acionar o filtro descritopara reproduzir o sinal de fala.
Mesmo após o filtro de branqueamento ter removidoo envelope espectral grosseiro do sinal de banda estreitaS20, uma quantidade considerável de estrutura harmônicafina pode permanecer, especialmente para fala com voz. AFigura 8A mostra um gráfico espectral de um exemplo de umsinal residual, conforme pode ser produzido por um filtrode branqueamento, para um sinal com voz tal como uma vogai.A estrutura periódica visivel nesse exemplo é relacionada àdiapasão, e diferentes sons com voz falados pelo menosorador podem ter diferentes estruturas formantes porémestruturas de diapasão similares. A Figura 8B mostra umgráfico de dominio de tempo de um exemplo de tal sinalresidual que mostra uma seqüência de pulsos de diapasão emtempo,
A eficiência de codificação e/ou qualidade defala pode ser aumentada mediante uso de um ou mais valoresde parâmetro para encodificar características da estruturade diapasão. Uma característica importante da estrutura dediapasão é a freqüência da primeira harmônica (tambémdenominada freqüência fundamental) , a qual está tipicamentena faixa de 60 a 400 Hz. Essa característica é tipicamenteencodificada como o inverso da freqüência fundamental,também denominado retardo de diapasão. O retardo dediapasão indica o número de amostras em um periodo dediapasão e pode ser encodificado como um ou mais Índices delivro-código. Sinais de fala a partir de oradoresmasculinos tendem a ter retardos de diapasão maiores do queos sinais de fala de oradores do sexo feminino.
Outra característica de sinal relacionado àestrutura de diapasão é a periodicidade, que indica aintensidade da estrutura harmônica ou, em outras palavras,o grau no qual o sinal é harmônico ou não-harmônico. Doisindicadores típicos de periodicidade são: cruzamentos zeroe funções de autocorrelação normalizadas (NACFs). Aperiodicidade também pode ser indicada pelo ganho dediapasão, que é comumente encodificado como um ganho delivro-código (por exemplo, um ganho de livro-códigoadaptativo quantizado).
O encodificador de banda estreita A120 podeincluir um ou mais módulos configurados para encodificar aestrutura harmônica de longo prazo de sinal de bandaestreita S20. Como mostrado na Figura 9, um paradigma CELPtípico que pode ser usado inclui um módulo de análise LPCde loop aberto, o qual encodifica as características decurto prazo ou envelope espectral grosseiro, seguido de umestágio de análise de predição de longo prazo de loopfechado, que encodifica a estrutura harmônica ou diapasãofino. As características de curto prazo são encodifiçadascomo coeficientes de filtro, e as características de longoprazo são encodifiçadas como valores para parâmetros taiscomo retardo de diapasão e ganho de diapasão. Por exemplo,o encodificador de banda estreita A120 pode ser configuradopara produzir sinal de excitação de banda estreitaencodificado S50 em uma forma que inclui um ou mais índicesde livro-código (por exemplo, um índice de livro-códigofixo e um Índice de livro-código adaptativo) e valores deganho correspondentes. Cálculo dessa representaçãoquantizada do sinal residual de banda estreita (porexemplo, pelo quantizador 270) pode incluir selecionar taisíndices e calcular tais valores. A encodificação daestrutura de diapasão também pode incluir interpolação deuma forma de onda protótipo de diapasão, cuja operação podeincluir calcular uma diferença entre pulsos de diapasãosucessivos. A modelagem da estrutura de longo prazo podeser desabilitada para os quadros correspondendo a uma falasem voz, a qual é tipicamente semelhante a ruído e nãoestruturada.
Uma implementação do decodificador de bandaestreita BI 10 de acordo com um paradigma como mostrado naFigura 9 pode ser configurada para produzir sinal deexcitação de banda estreita S80 para o decodificador debanda alta B200 após a estrutura de longo prazo (estruturaharmônica ou de diapasão) ter sido restaurada. Por exemplo,tal decodificador pode ser configurado para produzir sinalde excitação de banda estreita S8 0 como uma versãodequanti zada do sinal de excitação de banda estreitaencodifiçado S50. Evidentemente, também é possívelimplementar o decodificador de banda estreita BI 10 de talmodo que o decodificador de banda alta B200 realizadequantização do sinal de excitação de banda estreitaencodifiçado S50 para obter o sinal de excitação de bandaestreita S80.
Em uma implementação do encodificador de fala debanda larga Al00 de acordo com um paradigma como mostradona Figura 9, o encodif icador de banda alta A2 00 pode serconfigurado para receber o sinal de excitação de bandaestreita conforma produzido pela análise de curto prazo oufiltro de branqueamento. Em outras palavras, oencodificador de banda estreita A120 pode ser configuradopara produzir o sinal de excitação de banda estreita para oencodificador de banda alta A200 antes da encodificação daestrutura de longo prazo. É desejável, contudo, que oencodificador de banda alta A200 receba a partir do canalde banda estreita a mesma informação de codificação queserá recebida pelo decodificador de banda alta B200, de talmodo que os parâmetros de codificação produzidos peloencodificador de banda alta A200 já podem considerar atécerto ponto as não-idealidades naquela informação. Dessemodo pode ser preferível que o encodificador de banda altaA200 reconstrua o sinal de excitação de banda estreita S80a partir do mesmo sinal de excitação de banda estreitaencodifiçado, parametrizado e/ou quantizado S50 a serproduzido pelo encodificador de fala de banda larga A100.
Uma vantagem potencial dessa abordagem é o cálculo maisexato dos fatores de ganho de banda alta S60b descritosabaixo.
Além dos parâmetros que caracterizam a estruturade curto prazo e/ou longo prazo do sinal de banda estreitaS20, o encodificador de banda estreita A120 pode produzirvalores de parâmetro que se relacionam a outrascaracterísticas do sinal de banda estreita S20. Essesvalores, os quais podem ser adequadamente quantizados parasaida pelo encodificador de fala de banda larga A100, podemser incluídos entre os parâmetros de filtro de bandaestreita S40 ou emitidos separadamente. O encodificador debanda alta A200 também pode ser configurado para calcularos parâmetros de codificação de banda alta S60 de acordocom um ou mais desses parâmetros adicionais (por exemplo,após dequantização) . No decodif icador de fala de bandalarga B100, o decodif icador de banda alta B200 pode serconfigurado para receber os valores de parâmetro porintermédio do decodificador de banda estreita BI 10 (porexemplo, após dequantização). Alternativamente, odecodificador de banda alta B200 pode ser configurado parareceber (e possivelmente dequantizar) os valores deparâmetro diretamente.
Em um exemplo de parâmetros de codificação debanda estreita adicionais, o encodificador de bandaestreita Al 20 produz valores para parâmetros de modo defala e inclinação espectral para cada quadro. Inclinaçãoespectral se refere ao formato do envelope espectral sobrea banda passante e é tipicamente representado pelo primeirocoeficiente de reflexão quantizado. Para a maioria dos sonscom voz, a energia espectral diminui com a freqüênciacrescente, de tal modo que o primeiro coeficiente dereflexão é negativo e pode se aproximar de -1. A maioriados sons com voz tem um espectro que ou é plano, de talmodo que o primeiro coeficiente de reflexão está próximo dezero, ou tem mais energia em freqüências altas, de tal modoque o primeiro coeficiente de reflexão é positivo e pode seaproximar de +1.
O modo de fala (também chamado modo de voz)indica se o quadro atual representa fala com voz ou semvoz. Esse parâmetro pode ter um valor binário com base emuma ou mais medidas de periodicidade (por exemplo,cruzamentos zero, NACFs, ganho de diapasão) e/ou atividadede voz para o quadro, tal como uma relação entre uma medidae o valor limite. Em outras implementações, o parâmetro demodo de fala tem um ou mais diferentes estados para indicarmodos tais como ruido de fundo ou silêncio, ou umatransição entre silêncio e fala com voz.
O encodificador de banda alta A2 00 é configuradopara encodificar sinal de banda alta S30 de acordo com ummodelo de fonte-filtro, com a excitação para esse filtro sebaseando no sinal de excitação de banda estreitaencodifiçado. A Figura 10 mostra um diagrama de blocos deuma implementação A202 do encodificador de banda alta A200que é configurado para produzir um fluxo de parâmetros decodificação de banda alta S60 incluindo parâmetros defiltro de banda alta S60a e fatores de ganho de banda altaS60b. 0 gerador de excitação de banda alta A300 deriva umsinal de excitação de banda alta S120 a partir do sinal deexcitação de banda estreita encodifiçado S50. 0 módulo deanálise A210 produz um conjunto de valores de parâmetro quecaracterizam o envelope espectral do sinal de banda altaS30. Nesse exemplo especifico, o módulo de análise A210 éconfigurado para realizar análise LPC para produzir umconjunto de coeficientes de filtro LP para cada quadro dosinal de banda alta S30. Transformada de coeficiente-para-LSF de filtro de predição linear 410 transforma o conjuntode coeficientes de filtro LP em um conjunto correspondentede LSFs. Como observado acima com referência ao módulo deanálise 210 e transformada 220, o módulo de análise A210e/ou transformada 410 pode ser configurado para usar outrosconjuntos de coeficiente (por exemplo, coeficientescepstrais) e/ou representações de coeficiente (por exemplo,ISPs).
O quantizador 420 é configurado para quantizar oconjunto de LSFs de banda alta (ou outra representação decoeficiente, tal como ISPs) , e o encodif icador de bandaalta A202 é configurado para produzir o resultado dessaquantização como os parâmetros de filtro de banda altaS60a. Tal quantizador inclui tipicamente um quantizador devetor que encodifica o vetor de entrada como um Índice parauma entrada de vetor correspondente em uma tabela ou livro-código.
O encodificador de banda alta A202 também incluium filtro de sintese A220 configurado para produzir umsinal de banda alta, sintetizado S130 de acordo com o sinalde excitação de banda alta S120 e o envelope espectralencodificado (por exemplo, o conjunto de coeficientes defiltro LP) produzido pelo módulo de análise A210. 0 filtrode sintese A220 é tipicamente implementado como um filtroIIR, embora as implementações FIR também possam ser usadas.Em um exemplo especifico, o filtro de sintese A220 éimplementado como um filtro auto-regressivo linear de sextaordem.
0 calculador de fator de ganho de banda alta A230calcula uma ou mais diferenças entre os niveis do sinal debanda alta original S30 e o sinal de banda alta,sintetizado SI30 para especificar um envelope de ganho parao quadro. O quantizador 4 30, o qual pode ser implementadocomo um quantizador de vetor que encodifica o vetor deentrada como um indice para uma entrada de vetorcorrespondente em uma tabela ou livro-código quantiza ovalor ou valores especificando o envelope de ganho, e oencodificador de banda alta A202 é configurado paraproduzir o resultado dessa quantização como fatores deganho de banda alta S60b.
Em uma implementação como mostrado na Figura 10,o filtro de sintese A220 é arranj ado para receber oscoeficientes de filtro a partir do módulo de análise A210.Uma implementação alternativa do encodificador de bandaalta A202 inclui um quantizador inverso, e transformadainversa, configurada para decodificar os coeficientes defiltro a partir dos parâmetros de filtro de banda altaS60a, e nesse caso o filtro de sintese A220 é arran j adopara receber em vez disso os coeficientes de filtrodecodificados. Tal arranj o alternativo pode suportarcálculo mais exato do envelope de ganho pelo calculador deganho de banda alta A230.
Em um exemplo especifico, o módulo de análiseA210 e o calculador de ganho de banda alta A230 produzem umconjunto e seis LSFs e um conjunto de cinco valores deganho por quadro, respectivamente, de tal modo que umaextensão de banda larga do sinal de banda estreita S20 podeser conseguida apenas com onze valores adicionais porquadro. 0 ouvido tende a ser menos sensível aos erros defreqüência em freqüências altas, de tal modo quecodificação de banda alta em uma ordem LPC baixa podeproduzir um sinal tendo uma qualidade perceptual comparávelà codificação de banda estreita em uma ordem LPC superior.Uma implementação tipica do encodificador de banda altaA200 pode ser configurada para produzir de 8 a 12 bits porquadro para reconstrução de alta qualidade do envelopeespectral e outros 8 a 12 bits por quadro para reconstruçãode alta qualidade do envelope temporal. Em outro exemploespecifico, o módulo de análise A210 produz um conjunto deoito LSFs por quadro.
Algumas implementações do encodificador de bandaalta A200 são configuradas para produzir sinal de excitaçãode banda alta S120 mediante geração de um sinal de ruidoaleatório tendo componentes de freqüência de banda alta emodulando em amplitude o sinal de ruido de acordo com oenvelope de dominio de tempo do sinal de banda estreitaS20, sinal de excitação de banda estreita S80, ou sinal debanda alta S30. Embora tal método baseado em ruido possaproduzir resultados adequados para sons sem voz, contudo,ele pode não ser desejável para sons com voz, cujosresiduais são normalmente harmônicos e conseqüentemente temcerta estrutura periódica.
0 gerador de excitação de banda alta A300 éconfigurado para gerar sinal de excitação de banda altaS120 mediante prolongamento do espectro do sinal deexcitação de banda estreita S80 para a faixa de freqüênciade banda alta. A Figura 11 mostra um diagrama de blocos deuma implementação A302 do gerador de excitação de bandaalta A300. 0 quantizador inverso 4 50 é configurado paradequantizar o sinal de excitação de banda estreitaencodificado S50 para produzir o sinal de excitação debanda estreita S80. O extensor de espectro A400 éconfigurado para produzir um sinal estendido harmonicamenteS160 baseado no sinal de excitação de banda estreita S80. Ocombinador 470 é configurado para combinar um sinal deruido aleatório gerado pelo gerador de ruido 480 e umenvelope de domínio de tempo calculado pelo calculador deenvelope 460 para produzir um sinal de ruido modulado S170.O combinador 4 90 é configurado para misturar harmonicamenteo sinal estendido S60 e o sinal de ruido modulado S17 0 paraproduzir o sinal de excitação de banda alta S120«
Em um exemplo, o extensor de espectro A4 00 éconfigurado para realizar uma operação de dobramentoespectral (também denominado espelhagem) no sinal deexcitação de banda estreita S80 para produzir sinalharmonicamente estendido SI60. Dobramento espectral podeser realizado pelo sinal de excitação de enchimento zeroS80 e, então, se aplicando um filtro passa-alta para retero sinal falso. Em outro exemplo, o extensor de espectroA4 00 é configurado para produzir sinal harmonicamenteestendido SI 60 mediante conversão espectralmente do sinalde excitação de banda estreita S80 para a banda alta (porexemplo, por intermédio de upsampling seguida demultiplicação com um sinal de co-seno de freqüência constante).
Os métodos de conversão e dobramento espectralpodem produzir sinais espectralmente estendidos, cujaestrutura harmônica é descontínua com a estrutura harmônicaoriginal do sinal de excitação de banda estreita S80, emfase e/ou freqüência. Por exemplo, tais métodos podemproduzir sinais tendo picos que não estão geralmente-localizados em múltiplos da freqüência fundamental, quepode causar artefatos de sonoridade minúscula no sinal defala reconstruído. Esses métodos também tendem a produzirharmônicas de alta freqüência que têm característicastonais não naturalmente vigorosas. Além disso, devido aofato de um sinal PSTN poder ser amostrado em 8 kHz, porémlimitado em banda a não mais do que 3.400 Hz, o espectrosuperior do sinal de excitação de banda estreita S80 podeconter pouca ou nenhuma energia, de tal modo que um sinalestendido gerado de acordo com uma operação de conversãoespectral ou de dobramento espectral pode ter um furoespectral acima de 3.400 Hz.
Outros métodos de gerar sinal harmonicamenteestendido SI60 incluem identificar uma ou mais freqüênciasfundamentais do sinal de excitação de banda estreita S80 egerar tons harmônicos de acordo com aquela informação. Porexemplo, a estrutura harmônica de um sinal de excitaçãopode ser caracterizada pela freqüência fundamental emconj unto com informação de fase e amplitude. Outraimplementação do gerador de excitação de banda alta A300gera um sinal harmonicamente estendido SI 60 com base nafreqüência fundamental e amplitude (conforme indicado, porexemplo, pelo retardo de diapasão e ganho de diapasão). Amenos que o sinal harmonicamente estendido seja coerente emfase com o sinal de excitação de banda estreita S80,contudo, a qualidade da fala decodificada resultante podenão ser aceitável.
Uma função não-linear pode ser usada para criarum sinal de excitação de banda alta que é coerente em fasecom a excitação de banda estreita e preserva a estruturaharmônica sem descontinuidade de fase. Uma função não-linear também pode prover um nível de ruído aumentado entreharmônicas de alta freqüência, o que tende a soar maisnatural do que a harmônica de alta freqüência tonaiproduzida pelos métodos tal como conversão espectral edobramento espectral. Funções não-lineares sem memóriatípicas que podem ser aplicadas pelas várias implementaçõesdo extensor de espectro A4 00 incluem a função de valorabsoluto (também chamada de retificação de onda completa),retificação de meia onda, elevação ao quadrado, à terceirapotência, e corte. Outras implementações do extensor deespectro A4 00 podem ser configuradas para aplicar umafunção não-linear tendo memória.
A Figura 12 é um diagrama de blocos de umaimplementação A402 do extensor de espectro A400 que éconfigurada para aplicar uma função não-linear paraprolongar o espectro do sinal de excitação de bandaestreita S80. 0 upsampler 510 é configurado para amostrarascendentemente o sinal de excitação de banda estreita S80.Pode ser desejável amostrar ascendentemente o sinalsuficientemente para minimizar sinal falso medianteaplicação da função não-linear. Em um exemplo específico, oupsampler 510 amostra ascendentemente o sinal por um fatorde oito. O upsampler 510 pode ser configurado para realizara operação de upsampling mediante preenchimento zero dosinal de entrada e filtração passa-baixa do resultado. 0calculador de função não-linear 520 é configurado paraaplicar uma função não-linear ao sinal amostradoascendentemente. Uma vantagem potencial da função de valorabsoluto em relação às outras funções não-lineares paraextensão espectral, tal como quadratura, é que anormalização de energia não é necessária. Em algumasimplementações, a função de valor absoluto pode seraplicada eficientemente mediante remoção ou retirada do bitde sinal de cada amostra. O calculador de função não-linear520 também pode ser configurado para realizar um ajuste deamplitude do sinal espectralmente estendido ou amostradoascendentemente.
O downsampler 530 é configurado para amostrardescendentemente o resultado espectralmente estendido daaplicação da função não-linear. Pode ser desejável que odownsampler 530 realize uma operação de filtração de bandapassante para selecionar uma banda de freqüência desejadado sinal espectralmente estendido antes de reduzir a taxade amostragem (por exemplo, para reduzir ou evitar sinalfalso ou corrupção por uma imagem não de se j ada) . Tambémpode ser de se j ável que o downsampler 530 reduza a taxa deamostragem em mais do que um estágio.
A Figura 12a é um diagrama que mostra osespectros de sinal em vários pontos em um exemplo de umaoperação de extensão espectral, onde a escala de freqüênciaé a mesma através dos vários gráficos. O gráfico (a) mostrao espectro de um exemplo do sinal de excitação de bandaestreita S80. O gráfico (b) mostra o espectro após o sinalS80 ter sido amostrado ascendentemente por um fator deoito. O gráfico (c) mostra um exemplo do espectro estendidoapós aplicação de uma função não-linear. O gráfico (d)mostra o espectro após filtração passa-baixa. Nesseexemplo, a banda passante se estende até o limite defreqüência superior do sinal de banda alta S30 (porexemplo, 7 kHz ou 8 kHz).
O gráfico (e) mostra o espectro após um primeiroestágio de downsampling, na qual a taxa de amostragem éreduzida em um fator de quatro para obter um sinal de bandalarga. O gráfico (f) mostra o espectro após uma operação defiltração de passa-alta para selecionar a porção de bandaalta do sinal estendido, e o gráfico (g) mostra o espectroapós um segundo estágio de downsampling, na qual a taxa deamostragem é reduzida por um fator de dois. Em um exemploespecifico, o downsampler 530 realiza a filtração passa-alta e segundo estágio de downsampling mediante passagem dosinal de banda larga através do filtro passa-alta 130 edownsampler 140 do grupo de filtros A112 (ou outrasestruturas ou rotinas tendo a mesma resposta) para produzirum sinal espectralmente estendido tendo a faixa defreqüência e taxa de amostragem do sinal de banda alta S30.
Como pode ser visto no gráfico (g) downsamplingdo sinal passa-alta, mostrado no gráfico (f) causa umareversão de seu espectro. Nesse exemplo, o downsampler 530,também configurado para realizar uma operação de flippingespectral no sinal. O gráfico (h) mostra um resultado daaplicação da operação de flipping espectral, a qual podeser realizada mediante multiplicação do sinal com a funçãoe^nK ou a seqüência (-1)", cujos valores alternam entre +1 e-1. Tal operação é equivalente a deslocar o espectrodigital do sinal no dominio de freqüência por uma distânciade n. Observa-se que o mesmo resultado também pode serobtido mediante aplicação das operações de flippingespectral e downsampling em uma ordem diferente. Asoperações de upsampling e/ou downsampling também podem serconfiguradas para incluir reamostragem para se obter umsinal espectralmente estendido tendo a taxa de amostragemdo sinal de banda alta S30 (por exemplo, 7 kHz).
Como observado acima, os grupos de filtro A110 eB120 podem ser implementados de tal modo que um ou ambos ossinais de banda estreita e de banda alta S20, S30 tem umaforma espectralmente reversa na saida do grupo de filtrosA110, é encodificado e decodificado na forma espectralmentereversa, e é outra vez espectralmente reverso no grupo defiltros B120 antes de ser emitido no sinal de fala de bandalarga SUO. Em tal caso, evidentemente, uma operação deflipping espectral como mostrado na Figura 12A não serianecessária, uma vez que seria de se j ável que o sinal deexcitação de banda alta S120 tivesse também uma formaespectralmente reversa.
As várias tarefas de upsampling e downsampling deuma operação de extensão espectral conforme realizada peloextensor de espectro A402 podem ser configuradas earranjadas em muitas formas diferentes. Por exemplo, aFigura 12b é um diagrama que mostra os espectros de sinalem vários pontos em outro exemplo de uma operação deextensão espectral, onde a escala de freqüência é idênticaatravés dos vários gráficos. 0 gráfico (a) mostra oespectro de um exemplo de sinal de excitação de bandaestreita S80. 0 gráfico (b) mostra o espectro após o sinalS80 ter sido amostrado ascendentemente por um fator dedois, 0 gráfico (c) mostra um exemplo do espectro estendidoapós aplicação de uma função não-linear. Nesse caso, sinalfalso que pode ocorrer nas freqüências mais altas é aceito.
O gráfico (d) mostra o espectro após uma operaçãode reversão espectral. 0 gráfico (e) mostra o espectro apósum único estágio de downsampling, no qual a taxa deamostragem é reduzida por um fator de dois para se obter osinal espectralmente estendido desej ado. Nesse exemplo, osinal está na forma espectralmente reversa e pode ser usadoem uma implementação do encodifiçador de banda alta A200que processou o sinal de banda alta S30 em tal forma.
O sinal espectralmente estendido produzido pelocalculador de função não-linear 52 0 provavelmente tem umdropoff pronunciado em amplitude à medida que a freqüênciaaumenta. O extensor espectral A4 02 inclui um aplanadorespectral 54 0 configurado para realizar uma operação debranqueamento no sinal amostrado descendentemente. Oaplanador espectral 540 pode ser configurado para realizaruma operação de branqueamento fixa ou para realizar umaoperação de branqueamento adaptativa. Em um exemploespecifico de branqueamento adaptativo, o aplanadorespectral 540 inclui um módulo de análise LPC configuradopara calcular um conjunto de quatro coeficientes de filtroa partir do sinal amostrado descendentemente e um filtro deanálise de quarta ordem configurado para branquear o sinalde acordo com esses coeficientes. Outras implementações doextensor de espectro A400 incluem configurações nas quais oaplanador espectral 540 opera no sinal espectralmenteestendido antes do downsampler 530.
O gerador de excitação de banda alta A300 podeser implementado para produzir sinal harmonicamenteestendido S160 como sinal de excitação de banda alta S120.Em alguns casos, contudo, utilizar apenas um sinalharmonicamente estendido como a excitação de banda altapode resultar em artefatos audiveis. A estrutura harmônicada fala é geralmente menos pronunciada na banda alta do quena banda baixa, e usar muita estrutura harmônica no sinalde excitação de banda alta pode resultar em um som comzumbido. Esse artefato pode ser especialmente perceptívelem sinais de fala a partir de oradores do sexo feminino.
As modalidades incluem implementações de geradorde excitação de banda alta A300 que são configurados paramisturar sinal harmonicamente estendido SI60 com um sinalde ruido. Como mostrado na Figura 11, o gerador deexcitação de banda alta A302 inclui um gerador de ruido 480que é configurado para produzir um sinal de ruidoaleatório. Em um exemplo, o gerador de ruido 48 0 éconfigurado para produzir um sinal de ruido pseudo-aleatório branco de variância unitária, embora em outrasimplementações o sinal de ruido não precise ser branco epossa ter uma densidade de potência que varia com afreqüência. Pode ser desejável que o gerador de ruido 480seja configurado para produzir o sinal de ruido como umafunção deterministica de tal modo que seu estado pode serduplicado no decodificador. Por exemplo, o gerador de ruido480 pode ser configurado para produzir o sinal de ruidocomo uma função deterministica de informação codificadaanteriormente dentro do mesmo quadro, tal como osparâmetros de filtro de banda estreita S40 e/ou sinal deexcitação de banda estreita encodificado S50.
Antes de ser misturado com o sinal harmonicamenteestendido SI60, o sinal de ruido aleatório produzido pelogerador de ruido 480 pode ser modulado em amplitude parater um envelope de dominio de tempo que se aproxima dadistribuição de energia em relação ao tempo do sinal debanda estreita S20, sinal de banda alta S30, sinal deexcitação de banda estreita S80, ou sinal harmonicamenteestendido SI60. Como mostrado na Figura 11, o gerador deexcitação de banda alta A302 inclui um combinador 470configurado para modular em amplitude o sinal de ruidoproduzido pelo gerador de ruido 480 de acordo com umenvelope de dominio de tempo calculado pelo calculador deenvelope 4 60, Por exemplo, o combinador 470 pode serimplementado como um multiplicador arranjado para escalonara saida do gerador de ruido 480 de acordo com o envelope dedominio de tempo calculado pelo calculador de envelope 4 60para produzir o sinal de ruido modulado S170.
Em uma implementação A304 do gerador de excitaçãode banda alta A302, como mostrado no diagrama de blocos daFigura 13, o calculador de envelope 460 é arranjado paracalcular o envelope do sinal harmonicamente estendido SI60 -Em uma implementação A306 do gerador de excitação de bandaalta A302, como mostrado no diagrama de blocos da Figura14, o calculador de envelope 460 é arranjado para calcularo envelope do sinal de excitação de banda estreita S80.Implementações adicionais do gerador de excitação de bandaalta A302 podem ser configuradas de outra forma paraadicionar ruido ao sinal harmonicamente estendido SI60 deacordo com os locais dos pulsos de diapasão de bandaestreita em tempo.
O calculador de envelope 460 pode ser configuradopara realizar um cálculo de envelope como uma tarefa queinclui uma série de subtarefas. A Figura 15 mostra umfluxograma de um exemplo T100 de tal tarefa. A subtarefaT110 calcula o quadrado de cada amostra do quadro do sinalcujo envelope deve ser modelado (por exemplo, sinal deexcitação de banda estreita S80 ou sinal harmonicamenteestendido Si60) para produzir uma seqüência de valoreselevados ao quadrado. A subtarefa T120 realiza uma operaçãode suavização na seqüência de valores elevados ao quadrado.Em um exemplo, a subtarefa T120 aplica um filtro passa-bá ixa IIR de primeira ordem para a seqüência de acordo coma expressão
y (n) - ax(n) + (1 ~ à)y(n -1), (1)
onde x é a entrada de filtro, y é a saida defiltro, n é um indice de dominio de tempo, e a é umcoeficiente de suavização tendo um valor entre 0,5 e 1. Ovalor do coeficiente de suavização a pode ser fixo ou, emuma implementação alternativa, pode ser adaptativo deacordo com uma indicação de ruido no sinal de entrada, detal modo que a está mais próximo de 1 na ausência de ruidoe mais próximo de 0,5 na presença de ruido. A subtarefaT130 aplica uma função de raiz quadrada a cada amostra daseqüência suavizada para produzir o envelope de dominio detempo.
Tal implementação de calculador de envelope 460pode ser configurada para realizar as várias subtarefas datarefa TI 00 na forma serial e/ou paralela. Emimplementações adicionais da tarefa T100, a subtarefa T110pode ser precedida por uma operação passa-faixa configuradapara selecionar uma porção de freqüência desejada do sinalcujo envelope deve ser modelado, tal como a faixa de 3-4kHz.
O combinador 490 é configurado para misturar osinal harmonicamente estendido SI 60 e o sinal de ruidomodulado S170 para produzir o sinal de excitação de bandaalta S12 0. Implementações do combinador 4 90 podem serconfiguradas, por exemplo, para calcular o sinal deexcitação de banda alta S120 como uma soma do sinalharmonicamente estendido SI 60 e sinal de ruido moduladoS17 0. Tal implementação do combinador 4 90 pode serconfigurada para calcular o sinal de excitação de bandaalta S120 como uma soma ponderada mediante aplicação de umfator de ponderação ao sinal harmonicamente estendido SI60e/ou para modular o sinal de ruido S170 antes da soma. Cadatal fator de ponderação pode ser calculado de acordo com umou mais critérios e pode ser um valor fixo ou,alternativamente, um valor adaptativo que é calculado emuma base quadro por quadro ou subquadro por subquadro.
A Figura 16 mostra um diagrama de blocos de umaimplementação 492 do combinador 490 que é configurada paracalcular o sinal de excitação de banda alta S120 como umasoma ponderada do sinal harmonicamente estendido SI60 e dosinal de ruido modulado S170. 0 combinador 492 éconfigurado para ponderar o sinal harmonicamente estendidoS160 de acordo com o fator de ponderação de harmônica S180,para ponderar o sinal de ruido modulado S170 de acordo como fator de ponderação de ruido S190, e para produzir osinal de excitação de banda alta S120 como uma soma dossinais ponderados. Nesse exemplo, o combinador 492 incluium calculador de fator de ponderação 550 que é configuradopara calcular o fator de ponderação de harmônica S180 e ofator de ponderação de ruido S190.
O calculador de fator de ponderação 550 pode serconfigurado para calcular os fatores de ponderação S180 eS190 de acordo com uma razão desejada de conteúdo deharmônica para conteúdo de ruido no sinal de excitação debanda alta S120. Por exemplo, pode ser conveniente para ocombinador 492 produzir sinal de excitação de banda altaS120 para ter uma relação de energia de harmônica paraenergia de ruido similar àquela do sinal de banda alta S30.Em algumas implementações do calculador de fator deponderação 550, os fatores de ponderação S180, S190 sãocalculados de acordo com um ou mais parâmetros relacionadosa uma periodicidade do sinal de banda estreita S20 ou dosinal residual de banda estreita, tal como ganho dediapasão e/ou modo de fala. Tal implementação do calculadorde fator de ponderação 550 pode ser configurada paraatribuir um valor ao fator de ponderação de harmônica S180que é proporcional ao ganho de diapasão, por exemplo, e/oupara atribuir um valor superior ao fator de ponderação deruido SI 90 para sinais de fala sem voz do que para ossinais de fala com voz.
Em outras implementações, o calculador de fatorde ponderação 550 é configurado para calcular valores parao fator de ponderação de harmônica SI 8 0 e/ou fator deponderação de ruido SI 90 de acordo com uma medida deperiodicidade do sinal de banda alta S30. Em tal exemplo, ocalculador de fator de ponderação 550 calcula o fator deponderação de harmônica S180 como o valor máximo docoeficiente de autocorrelação do sinal de banda alta S30para o quadro ou subquadro atual, onde a autocorrelação érealizada através de uma faixa de busca que inclui umretardo de um atraso de diapasão e não inclui um retardo deamostras zero. A Figura 17 mostra um exemplo de uma talfaixa de busca de n amostras de comprimento que é centradaem torno de um retardo de um atraso de diapasão e tem umalargura não maior do que um atraso de diapasão.
A Figura 17 mostra também um exemplo de uma outraabordagem na qual o calculador de fator de ponderação 550calcula uma medida da periodicidade do sinal de banda altaS30 em vários estágios. Em um primeiro estágio, o quadroatual é dividido em um número de subquadros, e o retardopara o qual o coeficiente de autocorrelação é máximo éidentificado separadamente para cada subquadro. Comomencionado acima, a autocorrelação é realizada através deuma faixa de busca que inclui um retardo de uma retardaçãode diapasão e não inclui um retardo de amostras zero.
Em um segundo estágio, o quadro retardado éconstruído mediante aplicação do retardo correspondenteidentificado para cada subquadro, concatenando ossubquadros resultados para construir um quadro otimamenteretardado, e calculando o fator de ponderação de harmônicaSI8 0 como o coeficiente de correlação entre o quadrooriginal e o quadro otimamente retardado. Em umaalternativa adicional, o calculador de fator de ponderação550 calcula o fator de ponderação de harmônica S180 comouma média dos coeficientes de autocorrelação máximosobtidos no primeiro estágio para cada subquadro.Implementações do calculador de fator de ponderação 550também podem ser configuradas para escalonar o coeficientede correlação, e/ou para combinar o mesmo com outro valor,para calcular o valor para o fator de ponderação deharmônica S180.
Pode ser desejável que o calculador de fator deponderação 550 calcule uma medida de periodicidade do sinalde banda alta S30 apenas em casos onde uma presença deperiodicidade no quadro é de outro modo indicada - Porexemplo, o calculador de fator de ponderação 550 pode serconfigurado para calcular uma medida da periodicidade dosinal de banda alta S30 de acordo com uma relação entreoutro indicador de periodicidade do quadro atual, tal comoganho de diapasão, e um valor limite. Em um exemplo, ocalculador de fator de ponderação 550 é configurado pararealizar uma operação de autocorreiação no sinal de bandaalta S30 apenas se o ganho de diapasão do quadro (porexemplo, o ganho de livro-código adaptativo do residual debanda estreita) tiver um valor de mais do que 0.5(alternativamente, pelo menos 0.5). Em outro exemplo, ocalculador de fator de ponderação 550 é configurado pararealizar uma operação de autocorrelação no sinal de bandaalta S30 apenas para os quadros tendo estados específicosde modo de fala (por exemplo, apenas para sinais com voz).Em tais casos, o calculador de fator de ponderação 550 podeser configurado para atribuir um fator de ponderação padrãoaos quadros que têm outros estados de modo de fala e/ouvalores inferiores de ganho de diapasão.
As modalidades incluem implementações adicionaisdo calculador de fator de ponderação 550 que sãoconfiguradas para calcular fatores de ponderação de acordocom as características diferentes de, ou em adição àperiodicidade. Por exemplo, tal implementação pode serconfigurada para atribuir um valor superior ao fator deganho de ruido SI90 para sinais de fala tendo um retardo dediapasão grande do que para os sinais de fala tendo umpequeno retardo de diapasão. Outra tal implementação docalculador de fator de ponderação 550 é configurada paradeterminar uma medida da harmonicidade do sinal de fala debanda larga S10, ou do sinal de banda alta S30, de acordocom uma medida da energia do sinal em múltiplos dafreqüência fundamental relativa à energia do sinal emoutros componentes de freqüência.
Algumas implementações do encodificador de falade banda larga Al 00 são configuradas para produzir umaindicação da periodicidade ou harmonicidade (por exemplo,um indicador de um bit indicando se o quadro é harmônico ounão-harmônico) com base no ganho de diapasão e/ou outramedida de periodicidade ou harmonicidade como descritoaqui. Em um exemplo, um de codificador de fala de bandalarga correspondente B100 utiliza essa indicação paraconfigurar uma operação tal como cálculo de fator deponderação. Em outro exemplo, tal indicação é usada noencodificador e/ou decodificador no cálculo de um valorpara o parâmetro do modo de fala.
Pode ser desejável para o gerador de excitação debanda alta A302 gerar o sinal de excitação de banda altaS120 de tal modo que a energia do sinal de excitação ésubstancialmente não afetada pelos valores específicos dosfatores de ponderação S180 e S190. Em tal caso, ocalculador de fator de ponderação 550 pode ser configuradopara calcular um valor para o fator de ponderação deharmônica S180 ou para o fator de ponderação de ruido S190(ou para receber tal valor a partir do armazenamento ou deoutro elemento do encodificador de banda alta A200) e paraderivar um valor para o outro fator de ponderação de acordocom uma expressão tal como<formula>formula see original document page 52</formula>
onde Wharmonic denota fator de ponderação deharmônica S180 e Wnoise denota o fator de ponderação deruído S190. Alternativamente, o calculador de fator deponderação 550 pode ser configurado para selecionar, deacordo com um valor de uma medida de periodicidade para oquadro ou subquadro atual, um fator correspondente entreuma pluralidade de pares de fatores de ponderação S180,SI 90, onde os pares são pré-calculados para satisfazer auma relação de constante/energia tal como a expressão (2) .Para uma implementação de calculador de fator de ponderação550 no qual a expressão (2) é observada, valores típicospara o fator de ponderação de harmônica S18 0 variam deaproximadamente 0.7 a aproximadamente 1.0, e valorestípicos para o fator de ponderação de ruído SI90 variam deaproximadamente 0.1 a aproximadamente 0.7. Outrasimplementações de calculador de fator de ponderação 550podem ser configuradas para operar de acordo com uma versãoda expressão (2) que é modificada de acordo com umaponderação de linha base desej ada entre o sinalharmonicamente estendido SI 60 e sinal de ruído modulado S170.
Artefatos podem ocorrer em um sinal de falasintetizada quando um livro-código esparso (aquele cujasentradas são na maior parte valores zero) foi utilizadopara calcular a representação quantizada do residual.Dispersão de livro-código ocorre especialmente quando osinal de banda estreita é encodificado em uma baixa taxa debit. Os artefatos causados pela dispersão de livro-códigosão tipicamente quase periódicos em tempo e ocorrem namaior parte acima de 3 kHz. Devido ao fato da audiçãohumana ter melhor resolução temporal em freqüênciassuperiores, esses artefatos podem ser mais perceptíveis nabanda alta.
Modalidades incluem implementações do gerador deexcitação de banda alta A300 que são configuradas pararealizar filtração anti-dispersão. A Figura 18 mostra umdiagrama de blocos de uma implementação A312 do gerador deexcitação de banda alta A302 que inclui um filtro anti-dispersão 600 arranjado para filtrar o sinal de filtraçãode banda estreita dequantizado produzido pelo quantizadorinverso 450. A Figura 19 mostra um diagrama de blocos deuma implementação A314 do gerador de excitação de bandaalta A302 que inclui um filtro anti-dispersão 600 arranjadopara filtrar o sinal espectralmente estendido produzidopelo extensor de espectro A400. A Figura 20 mostra umdiagrama de blocos de uma implementação A316 do gerador deexcitação de banda alta A302 que inclui um filtro anti-dispersão 600 arranjado para filtrar a saida do combinador490 para produzir o sinal de excitação de banda alta S120.
Evidentemente, implementações do gerador de excitação debanda alta A300 que combinam as características dequaisquer das implementações A304 e A306 com ascaracterísticas de quaisquer das implementações A312, A314e A316 são consideradas e aqui expressamente reveladas. Ofiltro anti-dispersão 600 também pode ser arranjado dentrodo extensor de espectro A400: por exemplo, após quaisquerdos elementos 510, 520, 530 e 540 no extensor de espectroA402. É expressamente assinalado que o filtro anti-dispersão 600 também pode ser usado com implementações doextensor de espectro A400 que realiza dobramento espectral,conversão espectral, ou extensão de harmônica.
O filtro anti-dispersão 600 pode ser configuradopara alterar a fase de seu sinal de entrada. Por exemplo,pode ser desejável que o filtro anti-dispersão 600 sejaconfigurado e arranjado de tal modo que a fase do sinal deexcitação de banda alta S120 é randomizada, ou de outromodo distribuída mais igualmente, com o passar do tempo.
Também pode ser desejável que a resposta do filtro anti-dispersão 600 seja espectralmente plana, de tal modo que oespectro de magnitude do sinal filtrado não éconsideravelmente mudado. Em um exemplo, o filtro anti-dispersão 600 é implementado como um filtro passa-todostendo uma função de transferência de acordo com a seguinteexpressão:
<formula>formula see original document page 54</formula>
Um exemplo de tal filtro pode ser o de espalhar aenergia do sinal de entrada de modo que ela não mais estáconcentrada em apenas umas poucas amostras.
Os artefatos causados por dispersão de livro-código são normalmente mais perceptíveis para os sinaissemelhantes a ruido, onde o residual inclui menosinformação de diapasão, e também para fala em ruido defundo. A dispersão tipicamente causa um número menor deartefatos em casos onde a excitação tem estrutura de longoprazo, e na realidade modificação de fase pode causar ruidonos sinais com voz. Desse modo pode ser desejávelconfigurar o filtro anti-dispersão 600 para filtrar ossinais sem voz e passar pelo menos alguns sinais com vozsem alteração. Os sinais sem voz são caracterizados por umbaixo ganho de diapasão (por exemplo, ganho de livro-códigoadaptativo de banda estreita quantizada) e uma inclinaçãoespectral (por exemplo, primeiro coeficiente de reflexãoquantizado) que está próximo de zero ou positivo, indicandoum envelope espectral que é plano ou inclinado no sentidopara cima com freqüência freqüente. Implementações típicasde filtro anti-dispersão 600 são configuradas para filtrarsons sem voz (por exemplo, como indicado pelo valor dainclinação espectral), para filtrar os sinais com vozquando o ganho de diapasão está abaixo de um valor limite(alternativamente, não superior ao valor limite), e deoutro modo para passar o sinal sem alteração.
Implementações adicionais do filtro anti-dispersão 600 incluem dois ou mais filtros que sãoconfigurados para ter diferentes ângulos de modificação defase máxima (por exemplo, até 180 graus) . Em tal caso, ofiltro anti-dispersão 600 pode ser configurado paraselecionar entre filtros componentes de acordo com um valordo ganho de diapasão (por exemplo, o livro-códigoadaptativo quantizado ou ganho LTP) , de tal modo que umângulo de modificação de fase máximo superior é usado paraos quadros tendo valores de ganho de diapasão inferiores.Uma implementação do filtro anti-dispersão 600 também podeincluir diferentes filtros componentes que são configuradospara modificar a fase através de mais ou menos do espectrode freqüência, de tal modo que um filtro configurado paramodificar a fase através de uma faixa de freqüência maisampla do sinal de entrada é usado para os quadros tendovalores de ganho de diapasão inferiores.
Para reprodução exata do sinal de falaencodifiçado, pode ser desejável que a relação entre osniveis das porções de banda alta e de banda estreita dosinal de fala de banda larga, sintetizado S100 seja similaràquele no sinal de fala de banda larga original S10. Emadição a um envelope espectral conforme representado pelosparâmetros de codificação de banda alta S60a, oencodificador de banda alta A200 pode ser configurado paracaracterizar o sinal de banda alta S30 medianteespecificação de um envelope de ganho ou temporal. Comomostrado na Figura 10, o encodificador de banda alta A202inclui um calculador de fator de ganho de banda alta A230que é configurado e arranjado para calcular um ou maisfatores de ganho de acordo com uma relação entre o sinal debanda alta S30 e o sinal de banda alta, sintetizado S130,tal como uma diferença ou relação entre as energias dosdois sinais através de um quadro ou de certa porção domesmo. Em outras implementações do encodificador de bandaalta A202, o calculador de ganho de banda alta A230 podeser similarmente configurado, porém arranjado em vez dissopara calcular o envelope de ganho de acordo com tal relaçãovariável com o tempo entre o sinal de banda alta S30 e osinal de excitação de banda estreita S80 ou sinal deexcitação de banda alta S120.
Os envelopes temporais do sinal de excitação debanda estreita S80 e sinal de banda alta S30 provavelmentedevem ser similares. Portanto, encodificar um envelope deganho que se baseia na relação entre o sinal de banda altaS30 e o sinal de excitação de banda estreita S80 (ou umsinal derivado a partir dai, tal como sinal de excitação debanda alta S120 ou sinal de banda alta sintetizada S130)geralmente será mais eficiente do que encodificar umenvelope de ganho com base apenas no sinal de banda altaS30. Em uma implementação tipica, o encodificador de bandaalta A202 é configurado para produzir um Índice quantizadode 8 a 12 bits que especifica cinco fatores de ganho paracada quadro.
O calculador de fator de ganho de banda alta A230pode ser configurado para realizar cálculo de fator deganho com uma tarefa que inclui uma ou mais séries desubtarefas. A Figura 21 mostra um fluxograma de um exemploT200 de tal tarefa que calcula um valor de ganho para umsubquadro correspondente de acordo com as energiasrelativas do sinal de banda alta S30 e sinal de banda alta,sintetizado S130. As tarefas 220a e 220b calculam asenergias dos subquadros correspondentes dos sinaisrespectivos. Por exemplo, as tarefas 220a e 220b podem serconfiguradas para calcular a energia como uma soma dosquadrados das amostras do subquadro respectivo. A tarefaT230 calcula um fator de ganho para o subquadro como a raizquadrada da relação dessas energias. Nesse exemplo, atarefa T2 30 calcula o fator de ganho como a raiz quadradada relação da energia do sinal de banda alta S30 para aenergia do sinal de banda alta, sintetizado S130 em relaçãoao subquadro.
Pode ser desej ável que o calculador de fator deganho de banda alta A2 30 seja configurado para calcular asenergias de subquadro de acordo com uma função deenquadramento. A Figura 22 mostra um fluxograma de talimplementação T210 da tarefa de cálculo de fator de ganhoT200. A tarefa T215a aplica uma função de enquadramento aosinal de banda alta S30, e a tarefa T215b aplica a mesmafunção de enquadramento ao sinal de banda alta, sintetizadoS130. As implementações 222a e 222b das tarefas 220a e220bcalculam as energias das janelas respectivas, e a tarefaT2 30 calcula um fator de ganho para o subquadro como a raizquadrada da relação das energias.
Pode ser desej ável aplicar uma função deenquadramento que sobrepõe quadros adjacentes. Por exemplo,a função de enquadramento que produz fatores de ganho quepodem ser aplicados em uma forma de sobreposição-adiçãopode aj udar a reduzir ou evitar a descontinuidade entresubquadros. Em um exemplo, o calculador de fator de ganhode banda alta A230 é configurado para aplicar uma função deenquadramento trapezoidal como mostrado na Figura 23a, naqual a janela se sobrepõe a cada um dos dois subquadrosadjacentes em um milissegundo. A Figura 2 3b mostra umaaplicação dessa função de enquadramento para cada um doscinco subquadros de um quadro de 20 milissegundos. Outrasimplementações do calculador de fator de ganho de bandaalta A230 podem ser configuradas para aplicar funções deenquadramento tendo diferentes periodos de sobreposiçãoe/ou diferentes formatos de janela (por exemplo,retangular, Hamming) que podem ser simétricos ouassimétricos. Também é possivel para uma implementação docalculador de fator de ganho de banda alta A230 serconfigurada para aplicar. diferentes funções deenquadramento aos diferentes subquadros dentro de um quadroe/ou que um quadro inclua subquadros de comprimentosdiferentes.
Sem limitação, os valores a seguir sãoapresentados como exemplos para implementações especificas.Um quadro de 20 msegundos é suposto para esses casos,embora qualquer outra duração possa ser usada. Para umsinal de banda alta amostrado em 7 kHz, cada quadro tem 140amostras. Se tal quadro é dividido em cinco subquadros decomprimento igual, cada subquadro terá 28 amostras, e ajanela como mostrado na Figura 23a terá 42 amostras delargura. Para um sinal de banda alta amostrado em 8 kHz,cada quadro tem 160 amostras. Se tal quadro é dividido emcinco subquadros de comprimento igual, cada subquadro terá32 amostras, e a janela como mostrado nas Figuras 23a seráde 48 amostras de largura. Em outras implementações, ossubquadros de qualquer largura podem ser usados, e é atémesmo possivel que uma implementação do calculador de ganhode banda alta A230 seja configurada para produzir um fatorde ganho diferente para cada amostra de um quadro.
A Figura 24 mostra um diagrama de blocos de umaimplementação B202 do decodificador de banda alta B200. 0decodificador de banda alta B202 inclui um gerador deexcitação de banda alta B300 que é configurado paraproduzir o sinal de excitação de banda alta S120 com baseno sinal de excitação de banda estreita S80. Dependendo dasescolhas de desenho de sistema especifico, o gerador deexcitação de banda alta B300 pode ser implementado deacordo com qualquer uma das implementações do gerador deexcitação de banda alta A300 como descrito aqui.
Tipicamente, é desejável implementar o gerador de excitaçãode banda alta B300 para ter a mesma resposta que o geradorde excitação de banda alta do encodificador de banda altado sistema de codificação especifico. Devido ao fato dodecodificador de banda estreita B110 realizar tipicamente adequantização do sinal de excitação de banda estreitaencodificado S50, contudo, na maioria dos casos o geradorde excitação de banda alta B300 pode ser implementado parareceber o sinal de excitação de banda estreita S80 a partirdo decodificador de banda estreita B110 e não precisar incluir um quantizador inverso configurado para dequantizaro sinal de excitação de banda estreita encodificado S50.
Também é possivel que o decodificador de banda estreitaB110 seja implementado para incluir uma instância do filtroanti-dispersão 600 arranjado para filtrar o sinal deexcitação de banda estreita dequantizado antes de serintroduzido em um filtro de sintese de banda estreita, talcomo filtro 330.
O quantizador inverso 560 é configurado paradequantizar os parâmetros de filtro de banda alta S60a (nesse exemplo, para um conjunto de LSFs), e a transformadade coeficiente de filtro de LSF-para-LP 570 é configuradapara transformar os LSFs em um conjunto de coeficientes defiltro (por exemplo, como descrito acima com referência aoquantizador inverso 240 e transformada 250 do encodificadorde banda estreita Al22). Em outras implementações, comomencionado acima, conjuntos de coeficientes diferentes (porexemplo, coeficientes cepstrais) e/ou representações decoeficientes (por exemplo, ISPs) podem ser usadas. O filtrode sintese de banda alta B200 é configurado para produzirum sinal de banda alta, sintetizado de acordo com o sinalde excitação de banda alta S120 e o conjunto decoeficientes de filtro. Para um sistema no qual oencodificador de banda alta inclui um filtro de sintese(por exemplo, como no exemplo do encodificador A202descrito acima), pode ser conveniente implementar o filtrode sintese de banda alta B200 para ter a mesma resposta(por exemplo, a mesma função de transferência) que aquelado filtro de sintese.
O decodificador de banda alta B202 inclui tambémum quantizador inverso 580 configurado para dequantizar osfatores de ganho de banda alta S60b, e um elemento decontrole de ganho 590 (por exemplo, um multiplicador ouamplificador) configurado e arranjado para aplicar osfatores de ganho dequantizados ao sinal de banda alta,sintetizado para produzir o sinal de banda alta SI00. Paraum caso no qual o envelope de ganho de um quadro éespecificado por mais do que um fator de ganho, o elementode controle de ganho 5 90 pode incluir lógica configuradapara aplicar os fatores de ganho aos subquadrosrespectivos, possivelmente de acordo com uma função deenquadramento que pode ser a mesma ou uma diferente funçãode enquadramento conforme aplicada por um calculador deganho (por exemplo, calculador de ganho de banda alta A230)do encodificador de banda alta correspondente. Em outrasimplementações do decodificador de banda alta B202, oelemento de controle de ganho 590 é similarmenteconfigurado, mas é arranjado em vez disso para aplicar osfatores de ganho dequantizados ao sinal de excitação debanda estreita S80 ou ao sinal de excitação de banda altaS120.
Como mencionado acima, pode ser desejável obter omesmo estado no encodif icador de banda alta e nodecodificador de banda alta (por exemplo, mediante uso devalores dequantizados durante a encodificação) . Desse modopode ser conveniente em um sistema de codificação de acordocom tal implementação garantir o mesmo estado para osgeradores de ruido correspondentes nos geradores deexcitação de banda alta A300 e B300. Por exemplo, osgeradores de excitação de banda alta A300 e B300 de talimplementação podem ser configurados de tal modo que oestado do gerador de ruido é uma função deterministica deinformação já codificada dentro do mesmo quadro (porexemplo, parâmetros de filtro de banda estreita S40 ou umasua porção e/ou sinal de excitação de banda estreitaencodificado S50 ou uma sua porção).
Um ou mais dos quantizadores dos elementos aquidescritos (por exemplo, quantizador 230, 420 ou 430) podemser configurados para realizar quantização de vetorclassificado. Por exemplo, tal quantizador pode serconfigurado para selecionar um de um conjunto de livros- código com base em informação que já foi codificada dentro
do mesmo quadro no canal de banda estreita e/ou no canal debanda alta. Tal técnica tipicamente prove maior eficiênciade codificação à custa de armazenamento de livro-códigoadicional.
Como discutido acima com referência, por exemplo,às Figuras 8 e 9, uma quantidade considerável de estruturaperiódica pode permanecer no sinal residual após remoção doenvelope espectral grosseiro a partir do sinal de fala debanda estreita S20. Por exemplo, o sinal residual podeconter uma seqüência de pulsos ou pontas aproximadamenteperiódicas com relação ao tempo. Tal estrutura, a qual étipicamente relacionada ao diapasão, é especialmenteprovável de ocorrer nos sinais de fala com voz. 0 cálculode uma representação quantizada do sinal residual de bandaestreita pode incluir a encodificação dessa estrutura dediapasão de acordo com um modelo de periodicidade de longoprazo conforme representado, por exemplo, por um ou maislivros-código.
A estrutura de diapasão de um sinal residualefetivo pode não combinar exatamente com o modelo deperiodicidade. Por exemplo, o sinal residual pode incluirpequenas instabilidades na regularidade dos locais dospulsos de diapasão, de tal modo que as distâncias entrepulsos de diapasão sucessivos em um quadro não sãoexatamente iguais e a estrutura não é muito regular. Essasirregularidades tendem a reduzir a eficiência decodificação.
Algumas implementações do encodifiçador de bandaestreita A120 são configuradas para realizar umaregularização da estrutura de diapasão mediante aplicaçãode um ajuste temporal adaptativo ao residual antes oudurante quantização, ou de outro modo mediante inclusão deum ajuste temporal adaptativo no sinal de excitaçãoencodifiçado. Por exemplo, tal encodificador pode serconfigurado para selecionar ou de outro modo calcular umquadro de ajuste temporal (por exemplo, de acordo com um oumais critérios de ponderação perceptual e/ou minimização deerro) de tal modo que o sinal de excitação resultante seajusta otimamente ao modelo de periodicidade de longoprazo. A regularização da estrutura de diapasão é realizadapor um subconjunto de encodificadores CELP denominadosencodificadores de Predição Linear Excitada por Código deRelaxação (RCELP).
Um encodifiçador RCELP é configurado tipicamentepara realizar o aj uste temporal como um deslocamentotemporal adaptativo. Esse deslocamento temporal pode ser umretardo variando de uns poucos milissegundos negativos atéuns poucos milissegundos positivos, e normalmente é variadosuavemente para evitar descontinuidades audíveis. Emalgumas implementações, tal um encodificador é configuradopara aplicar a regularização de uma forma sucessiva, em quecada quadro ou subquadro é aj ustado em um deslocamentotemporal fixo correspondente. Em outras implementações, oencodificador é configurado para aplicar a regularizaçãocomo uma função de a j uste continuo, de tal modo que umquadro ou subquadro é ajustado de acordo com um contorno dediapasão (também denominado traj etória de diapasão) . Emalguns casos, (por exemplo, como descrito na Publicação dePedido de Patente US 2004/0098255), o encodificador éconfigurado para incluir um aj uste temporal no sinal deexcitação encodifiçado mediante aplicação do deslocamento aum sinal de entrada perceptualmente ponderado que é usadopara calcular o sinal de excitação encodifiçado.
O encodificador calcula um sinal de excitaçãoencodifiçado que é regularizado e quantizado, e odecodificador dequantiza o sinal de excitação encodifiçadopara obter um sinal de excitação que é usado parasintetizar o sinal de fala decodificado. O sinal de saidadecodificado desse modo exibe o mesmo retardo variável quefoi incluído no sinal de excitação encodifiçado porintermédio da regularização. Tipicamente, nenhumainformação especificando as quantidades de regularização étransmitida para o decodificador.
A regularização tende a tornar o sinal residualmais fácil de encodificar, o que melhora o ganho decodificação a partir do preditor de longo prazo e dessemodo aumenta a eficiência de codificação global, geralmentesem gerar artefatos. Pode ser desejável realizar aregularização apenas em quadros que têm voz. Por exemplo, oencodificador de banda estreita A124 pode ser configuradopara deslocar apenas aqueles quadros ou subquadros tendouma estrutura de longo prazo, tal como sinais com voz. Podeainda ser desejável realizar a regularização apenas emsubquadros que incluem energia de pulso de diapasão. Váriasimplementações de codificação RCELP são descritas nasPatentes US 5.704.003 (Kleijn et al.) e 6.879.955 (Rao) ena Publicação de Pedido de Patente US 2004/0098255 (Kovesiet al.). Implementações existentes de codificadores RCELPincluem o Codec de Taxa Variável Aperfeiçoado (EVRC),conforme descrito na Associação de Indústrias deTelecomunicações (TIA) IS-127, e o Vocoder de modoselecionável (SMV) de Projeto de Parceria de TerceiraGeração 2 (3GPP2).
Infelizmente, a regularização pode causarproblemas para um codificador de fala de banda larga noqual a excitação de banda alta é derivada do sinal deexcitação de banda estreita encodificado (tal como umsistema incluindo o encodificador de fala de banda larga
A100 e o decodificador de fala de banda larga B100). Devidoà sua derivação a partir de um sinal temporalmenteajustado, o sinal de excitação de banda alta terágeralmente um perfil temporal que é diferente daquele dosinal de fala de banda alta original. Em outras palavras, osinal de excitação de banda alta não mais será sincrono como sinal de fala de banda alta original.
Um desalinhamento em tempo entre o sinal deexcitação de banda alta ajustado e o sinal de fala de bandaalta original pode causar problemas. Por exemplo, o sinalde excitação de banda alta ajustado pode não mais proveruma excitação de fonte adequada para um filtro de sinteseque^ é configurado de acordo com os parâmetros de filtroextraídos do sinal de fala de banda alta original. Comoresultado, o sinal de banda alta, sintetizado pode conterartefatos audíveis que reduzem a qualidade percebida dosinal de fala de banda larga decodificado.
0 desalinhamento em tempo também pode causarineficiências na encodificação de envelope de ganho. Comomencionado acima, é provável que exista uma correlaçãoentre os envelopes temporais do sinal de excitação de bandaestreita S80 e o sinal de banda alta S30. Medianteencodificação do envelope de ganho do sinal de banda altade acordo com uma relação entre esses dois envelopestemporais, um aumento em eficiência de codificação pode serrealizado em comparação com a encodificação do envelope deganho diretamente. Quando o sinal de excitação de bandaestreita encodifiçado é regularizado, contudo, essacorrelação pode ser enfraquecida. 0 desalinhamento em tempoentre o sinal de excitação de banda estreita S80 e o sinalde banda alta S30 pode fazer com que apareçam flutuações emfatores de ganho de banda alta S60b, e a eficiência decodificação pode diminuir.
As modalidades incluem métodos de encodificaçãode fala de banda larga que realizam ajuste temporal de umsinal de fala de banda alta de acordo com um a j ustetemporal incluido em um sinal de excitação de bandaestreita encodifiçado correspondente. Vantagens potenciaisde tais métodos incluem melhorar a qualidade de um sinal defala de banda larga, decodificado e/ou melhorar aeficiência da codificação de um envelope de ganho de bandaalta.A Figura 25 mostra um diagrama de blocos de umaimplementação ADIO de encodif icador de fala de banda largaA100. O encodificador ADIO inclui uma implementação A124 deencodificador de banda estreita A120 que é configurada pararealizar regularização durante cálculo do sinal deexcitação de banda estreita encodificado S50. Por exemplo,o encodificador de banda estreita A124 pode ser configuradode acordo com uma ou mais implementações RCELP discutidasacima.
0 encodificador de banda estreita A124 também éconfigurado para produzir um sinal de dados deregularização SD10 que especifica o grau de ajuste temporalaplicado. Diversos casos nos quais o encodificador de bandaestreita Al 2 4 é configurado para aplicar um deslocamentotemporal fixo a cada quadro ou subquadro, o sinal de dadosde regularização SD10 pode incluir uma série de valoresindicando cada quantidade de deslocamento temporal como umvalor de número inteiro ou de número não inteiro em termosde amostras, milissegundos, ou algum outro incrementotemporal. Para um caso no qual o encodif icador de bandaestreita A124 é configurado para de outro modo modificar aescala temporal de um quadro ou outra seqüência de amostras(por exemplo, mediante compactação de uma porção eexpandindo outra porção), o sinal de informação deregularização SD10 pode incluir uma descriçãocorrespondente da modificação, tal como um conj unto deparâmetros de função. Em um exemplo especifico, oencodificador de banda estreita Al 2 4 é configurado paradividir um quadro em três subquadros e para calcular umdeslocamento temporal fixo para cada subquadro, de tal modoque o sinal de dados de regularização SD10 indica trêsquantidades de deslocamento temporal para cada quadroregularizado do sinal de banda estreita encodificado.O encodificador de fala de banda larga ADIOinclui uma linha de retardo Dl20 configurada para avançarou retardar porções do sinal de fala de banda alta S30, deacordo com as quantidades de retardo indicadas por um sinalde entrada, para produzir o sinal de fala de banda alta,temporalmente ajustado S30a. No exemplo mostrado na Figura25, a linha de retardo D120 é configurada para ajustartemporalmente o sinal de fala de banda alta S30 de acordocom o ajuste indicado pelo sinal de dados de regularizaçãoSD10- De tal modo, a mesma quantidade de ajuste temporalque foi incluída no sinal de excitação de banda estreitaencodificado S50 também é aplicada à porção correspondentedo sinal de fala de banda alta S30 antes da análise. Emboraesse exemplo mostre a linha de retardo Dl2 0 como umelemento separado do encodificador de banda alta A200, emoutras implementações a linha de retardo D120 é arranjadacomo parte do encodificador de banda alta.
Implementações adicionais do encodificador debanda alta A2 00 podem ser configuradas para realizaranálise espectral (por exemplo, análise LPC) do sinal defala de banda alta, não ajustado S30 e para realizar ajustetemporal do sinal de fala de banda alta S30 antes decálculo dos parâmetros de ganho da banda alta S60b. Tal umencodificador pode incluir, por exemplo, uma implementaçãoda linha de retardo Dl20 arranjada para realizar o ajustetemporal. Em tais casos, contudo, os parâmetros de filtrode banda alta S60a com base na análise do sinal nãoaj ustado S30 pode descrever um envelope espectral que édesalinhado em tempo com o sinal de excitação de banda altaS120.
A linha de retardo Dl20 pode ser configurada deacordo com qualquer combinação de elementos lógicos eelementos de armazenamento adequados para aplicar asoperações de ajuste temporal desejadas ao sinal de fala debanda alta S30. Por exemplo, a linha de retardo D120 podeser configurada para ler o sinal de fala de banda alta S30a partir de um buffer (armazenador) de acordo com osdeslocamentos temporais desejados. A Figura 26a mostra umdiagrama esquemático de tal implementação D122 da linha deretardo D120 que inclui um registrador de deslocamento SR1.0 registrador de deslocamento SR1 é um buf f er de certocomprimento m que é configurado para receber e armazenar asm amostras mais recentes do sinal de fala de banda altaS30. 0 valor m é igual pelo menos à soma dos deslocamentostemporais máximos positivos (ou "avanço") e negativos (ou"retardo") a serem suportados. Pode ser conveniente que ovalor m seja igual ao comprimento de um quadro ou subquadrodo sinal de banda alta S30.
A linha de retardo Dl22 é configurada para emitiro sinal de banda alta, temporalmente ajustado S30a a partirde um local de deslocamento OL do registrador dedeslocamento SR1. A posição do local de deslocamento OLvaria em torno de uma posição de referência (deslocamentotemporal zero) de acordo com o deslocamento temporal atualcomo indicado, por exemplo, pelo sinal de dados deregularização SD10. A linha de retardo Dl22 pode serconfigurada para suportar limites iguais de avanço eretardo ou, alternativamente, um limite maior do que ooutro de tal modo que um deslocamento maior pode serrealizado em uma direção do que na outra. A Figura 2 6amostra um exemplo especifico que suporta um deslocamentotemporal positivo maior do que negativo. A linha de retardoDl22 pode ser configurada para produzir uma ou maisamostras em um tempo (dependendo de uma largura debarramento de saida, por exemplo).
Um deslocamento temporal de regularização tendouma magnitude de mais do que uns poucos mi lis segundos podecausar artefatos audíveis no sinal decodificado.Tipicamente a magnitude de um deslocamento temporal deregularização conforme realizada por um encodificador debanda estreita A124 não excederá uns poucos milissegundosde tal modo que os deslocamentos temporais indicados pelosinal de dados de regularização SD10 serão limitados.Contudo, pode ser desejado em tais casos que a linha deretardo D122 seja configurada para impor um limite máximoaos deslocamentos temporais na direção positiva e/ounegativa (por exemplo, para observar um limite maisajustado do que aquele imposto pelo encodificador de bandaestreita).
A Figura 26b mostra um diagrama esquemático deuma implementação Dl24 da linha de retardo Dl22 que incluiuma janela de deslocamento SW. Nesse exemplo, a posição dolocal de deslocamento OL é limitada pela j anel a dedeslocamento SW. Embora a Figura 26b mostre um caso no qualo comprimento do buf f er m é maior do que a largura dajanela de deslocamento SW, a linha de retardo Dl24 tambémpode ser implementada de tal modo que a largura da janelade deslocamento SW seja igual a m.
Em outras implementações, a linha de retardo Dl20é configurada para gravar o sinal de fala de banda alta S30em um buffer de acordo com os deslocamentos temporaisdesejados. A Figura 27 mostra um diagrama esquemático detal implementação Dl30 da linha de retardo Dl20 que incluidois registradores de deslocamento SR2 e SR3 configuradospara receber e armazenar o sinal de fala de banda alta S30.A linha de retardo Dl30 é configurada para gravar um quadroou subquadro a partir do registrador de deslocamento SR2para o registrador de deslocamento SR3 de acordo com umdeslocamento temporal como indicado, por exemplo, pelosinal de dados de regularização SD10. 0 registrador dedeslocamento SR3 é configurado como um buffer FIFOarranjado para emitir o sinal de banda alta, temporalmenteajustado S30.
No exemplo especifico mostrado na Figura 27, oregistrador de deslocamento SR2 inclui uma porção de bufferde quadro FBI e uma porção de buffer de retardo DB, e oregistrador de deslocamento SR3 inclui uma porção de bufferde quadro SB2, uma porção de buffer de avanço AB, e umaporção de buffer de retardo RB. Os comprimentos do bufferde avanço AB e do buffer de retardo RB podem ser iguais, ouum deles pode ser maior do que o outro, de tal modo que umdeslocamento maior em uma direção é suportado do que ocorrena outra direção. 0 buffer de retardo DB e a porção debuffer de retardo RB podem ser configurados para ter omesmo comprimento. Alternativamente, o buffer de retardo DBpode ser mais curto do que o buffer de retardo RB paraconsiderar um intervalo de tempo exigido para transferiramostras a partir do buffer de quadro FBI para oregistrador de deslocamento SR3, o que pode incluir outrasoperações de processamento tal como aj uste das amostrasantes do armazenamento para o registrador de deslocamentoSR3.
No exemplo da Figura 27, o buffer de quadro FBI éconfigurado para ter um comprimento igual àquele de umquadro do sinal de banda alta S30. Em outro exemplo, obuffer de quadro FBI é configurado para ter um comprimentoigual àquele de um subquadro do sinal de banda alta S30. Emtal caso, a linha de retardo B130 pode ser configurada paraincluir lógica para aplicar o mesmo retardo (por exemplo,uma média) a todos os subquadros de um quadro a serdeslocado. A linha de retardo Dl 30 também pode incluirlógica para valores médios a partir do mesmo buffer FBI comvalores a serem sobrescritos no buffer de retardo RB oubuffer de avanço AB. Em um exemplo adicional, o registradorde deslocamento SR3 pode ser configurado para recebervalores do sinal de banda alta S30 apenas por intermédio dobuffer de quadro FBI, e em tal caso a linha de retardo D130pode incluir lógica para interpolar através de espaçoslivres entre quadros ou subquadros sucessivos gravados noregistrador de deslocamento SR3. Em outras implementações,a linha de retardo D130 pode ser configurada para realizaruma operação de ajuste nas amostras a partir do buffer dequadro FBI antes de gravar as mesmas no registrador dedeslocamento SR3 (por exemplo, de acordo com uma funçãodescrita pelo sinal de dados de regularização SD10).
Pode ser de sejável que a linha de retardo Dl 2 0aplique um a juste temporal que se baseia, mas não éidêntico, ao aj uste especificado pelo sinal de dados deregularização SD10. A Figura 28 mostra um diagrama deblocos de uma implementação ADI2 do encodificador de falade banda larga ADIO que inclui um mapeador de valor deretardo DUO. O mapeador de valor de retardo DUO éconfigurado para mapear o aj uste indicado pelo sinal dedados de regularização SD10 em valores de retardo mapeadosSDlOa. A linha de retardo Dl20 é arranjada para produzirsinal de fala de banda alta temporalmente ajustado S30a deacordo com o ajuste indicado pelos valores de retardomapeados SDlOa.
Pode-se esperar que o deslocamento temporalaplicado pelo encodificador de banda estreita se desenvolvasuavemente com o passar do tempo. Portanto, é tipicamentesuficiente computar o deslocamento temporal de bandaestreita, médio, aplicado aos subquadros durante um quadrode fala, e deslocar um quadro correspondente do sinal defala de banda alta S30 de acordo com essa média. Em talexemplo, o mapeador de valor de retardo D110 é configuradopara calcular uma média dos valores de retardo de subquadropara cada quadro, e a linha de retardo D120 é configuradapara aplicar a média calculada a um quadro correspondentedo sinal de banda alta S30. Em outros exemplos, uma médiaem relação a um periodo mais curto (tal como doissubquadros, ou metade de um quadro) ou um periodo maislongo (tal como dois quadros) pode ser calculado eaplicado- Em um caso onde a média é um valor de número não-inteiro de amostras, o mapeador de valor de retardo Dl 10pode ser configurado para arredondar o valor para um númerointeiro de amostras antes de emitir o mesmo para a linha deretardo D120.
O encodificador de banda estreita Al24 pode serconfigurado para incluir um deslocamento temporal deregularização de um número não-inteiro de amostras no sinalde excitação de banda estreita encodifiçado. Em tal caso,pode ser desejável que o mapeador de valor de retardo Dl10seja configurado para arredondar o deslocamento de tempo debanda estreita para um número inteiro de amostras e que alinha de retardo Dl20 aplique o deslocamento temporalarredondado ao sinal de fala de banda alta S30.
Em algumas implementações do encodificador defala de banda larga ADIO, as taxas de amostragem do sinalde fala de banda estreita S20 e do sinal de fala de bandaalta S30 podem diferir. Em tais casos, o mapeador de valorde retardo DUO pode ser configurado para ajustarquantidades de deslocamento temporal indicadas no sinal dedados de regularização SD10 para considerar uma diferençaentre as taxas de amostragem do sinal de fala de bandaestreita S2 0 (ou sinal de excitação de banda estreita S80)e sinal de fala de banda alta S30. Por exemplo, o mapeadorde valor de retardo Dl10 pode ser configurado paraescalonar as quantidades de deslocamento temporal de acordocom uma relação das taxas de amostragem. Em um exemploespecifico, como mencionado acima, o sinal de fala de bandaestreita S20 é amostrado em 8 kHz, e o sinal de fala debanda alta S30 é amostrado em 7 kHz. Nesse caso, o mapeadorde valor de retardo DUO é configurado para multiplicarcada quantidade de deslocamento por 7/8. Implementações domapeador de valor de retardo DUO também podem serconfiguradas para realizar tal operação de escalonamento emconjunto com um arredondamento para número inteiro e/ou umaoperação de cálculo de média de deslocamento temporalconforme descrito aqui.
Em implementações adicionais, a linha de retardoDl20 é configurada para de outro modo modificar a escalatemporal de um quadro ou outra seqüência de amostras (porexemplo, mediante compactação de uma porção e expansão deoutra porção). Por exemplo, o encodificador de bandaestreita Al 2 4 pode ser configurado para realizar aregularização de acordo com uma função tal como um contornoou trajetória de diapasão. Em tal caso, o sinal de dados deregularização SD10 pode incluir uma descriçãocorrespondente da função, tal como um conj unto deparâmetros, e a linha de retardo D120 pode incluir lógicaconfigurada para ajustar quadros ou subquadros do sinal defala de banda alta S30 de acordo com a função. Em outrasimplementações, o mapeador de valor de retardo Dl 10 éconfigurado para calcular a média, escalonar, e/ouarredondar a função antes dela ser empregada ao sinal defala de banda alta S30 pela linha de retardo D120. Porexemplo, o mapeador de valor de retardo Dl 10 pode serconfigurado para calcular um ou mais valores de retardo deacordo com a função, cada valor de retardo indicando umnúmero de amostras, as quais são então aplicadas pela linhade retardo D120 para ajustar temporalmente um ou maisquadros ou subquadros correspondentes do sinal de fala debanda alta S30.
A Figura 2 9 mostra um fluxograma para um métodoMD100 de ajuste temporal de um sinal de fala de banda altade acordo com um ajuste temporal incluido em um sinal deexcitação de banda estreita encodificado correspondente. Atarefa TD100 processa um sinal de fala de banda larga paraobter um sinal de fala de banda estreita e um sinal de falade banda alta. Por exemplo, a tarefa TD100 pode serconfigurada para filtrar o sinal de fala de banda largautilizando um grupo de filtros tendo filtros passa-baixa epassa-alta, tal como uma implementação de grupo de filtrosA110. A tarefa TD200 encodifica o sinal de fala de bandaestreita pelo menos em um sinal de excitação de bandaestreita encodificado e uma pluralidade de parâmetros defiltro de banda estreita. O sinal de excitação de bandaestreita encodificado e/ou os parâmetros de filtro podemser quantizados, e o sinal de fala de banda estreitaencodificado também pode incluir outros parâmetros tal comoum parâmetro de modo de fala. A tarefa TD200 inclui tambémum ajuste temporal no sinal de excitação de banda estreitaencodificado.
A tarefa TD300 gera um sinal de excitação debanda alta com base em um sinal de excitação de bandaestreita. Nesse caso, o sinal de excitação de bandaestreita se baseia no sinal de excitação de banda estreitaencodificado. De acordo pelo menos com o sinal de excitaçãode banda alta, a tarefa TD400 encodifica o sinal de fala debanda alta pelo menos em uma pluralidade de parâmetros defiltro de banda alta. Por exemplo, a tarefa TD400 pode serconfigurada para encodificar o sinal de fala de banda altaem uma pluralidade de LSFs quantizados. A tarefa TD500aplica um deslocamento temporal ao sinal de fala de bandaalta que se baseia na informação relacionada a um ajustetemporal incluído no sinal de excitação de banda estreitaencodifiçado.
A tarefa TD400 pode ser configurada para realizaruma análise espectral (tal como uma análise LPC) no sinalde fala de banda alta, e/ou calcular um envelope de ganhodo sinal de fala de banda alta. Em tais casos, a tarefaTD500 pode ser configurada para aplicar o deslocamentotemporal ao sinal de fala de banda alta antes da análisee/ou do cálculo de envelope de ganho.
Outras implementações do encodificador de fala debanda larga A100 são configuradas para reverter um ajustetemporal do sinal de excitação de banda alta S120 causadopor um ajuste temporal incluído no sinal de excitação debanda estreita encodifiçado. Por exemplo, o gerador deexcitação de banda alta A300 pode ser implementado paraincluir uma implementação da linha de retardo D120 que éconfigurada para receber o sinal de dados de regularizaçãoSD10 ou valores de retardo mapeados SDlOa, e para aplicarum deslocamento temporal reverso correspondente ao sinal deexcitação de banda estreita S80, e/ou a um sinalsubseqüente baseado no mesmo tal como o sinalharmonicamente estendido S160 ou o sinal de excitação debanda alta S120.
Implementações adicionais do encodificador defala de banda larga podem ser configuradas para encodificaro sinal de fala de banda estreita S20 e sinal de fala debanda alta S30 independentemente um do outro, de tal modoque o sinal de fala de banda alta S30 é encodificado comouma representação de um envelope espectral de banda alta eum sinal de excitação de banda alta. Tal implementação podeser configurada para realizar ajuste temporal do sinalresidual de banda alta, ou para de outro modo incluir umaj uste temporal em um sinal de excitação de banda altaencodifiçado, de acordo com informação relacionada a umajuste temporal incluído no sinal de excitação de bandaestreita encodifiçado. Por exemplo, o encodificador debanda alta pode incluir uma implementação da linha deretardo D120 e/ou mapeador de valor de retardo DUOconforme descrito aqui que são configurados para aplicar umajuste temporal ao sinal residual de banda alta. Potenciaisvantagens de tal operação incluem a encodificação maiseficiente do sinal residual de banda alta e uma melhorequiparação entre os sinais de fala de banda estreita e debanda alta, sintetizados.
Como mencionado acima, as modalidades conformeaqui descrito incluem implementações que podem ser usadaspara realizar codificação integrada, suportarcompatibilidade com os sistemas de banda estreita e evitaruma necessidade de transcodificação. Suporte paracodificação de banda alta também pode servir paradiferenciar em uma base de custo entre chips, conjuntos dechips, dispositivos, e/ou redes tendo suporte de bandalarga com compatibilidade regressiva, e aqueles tendoapenas suporte de banda estreita. Suporte para codificaçãode banda.alta conforme descrito aqui também pode ser usadoem conjunto com uma técnica para suportar codificação debanda baixa, e um sistema, método, ou equipamento de acordocom tal modalidade pode suportar a codificação decomponentes de freqüência, por exemplo, a partir deaproximadamente 50 ou 100 Hz até aproximadamente 7 ou 8kHz.
Como mencionado acima, adicionar suporte de bandaalta a um codificador de fala pode aperfeiçoar ainteligibilidade, especialmente com relação à diferenciaçãode fricativas. Embora tal diferenciação normalmente possaser derivada por um ouvinte humano a partir do contextoespecifico, suporte de banda alta pode servir parahabilitar recurso em reconhecimento de fala e outrasaplicações de interpretação de máquina, tais como sistemaspara navegação de menu de voz automatizado e/ouprocessamento de chamada automático.
Um equipamento de acordo com uma modalidade podeser integrado em um dispositivo portátil para comunicaçõessem fio tal como um telefone celular ou um assistentepessoal digital (PDA). Alternativamente, tal equipamentopode ser incluido em outro dispositivo de comunicação talcomo um aparelho de telefone VoIP, um computador pessoalconfigurado para suportar comunicações VolP, ou umdispositivo de rede configurado para rotear comunicaçõestelefônicas ou VoIP. Por exemplo, um equipamento de acordocom uma modalidade pode ser implementado em um chip ouconj unto de chips para um dispositivo de comunicações.Dependendo da aplicação especifica, tal dispositivo tambémpode incluir recursos tais como conversão deanalógico/digital e/ou digital/analógico de um sinal defala, conjunto de circuitos para realizar amplificação e/ououtras operações de processamento de sinal em um sinal defala, e/ou conj unto de circuitos de radiofreqüência paratransmissão e/ou recepção do sinal de fala codificado.
É explicitamente considerado e revelado que asmodalidades podem incluir e/ou ser usadas com um ou maisdas outras características reveladas nos PedidosProvisórios de Patente US 60/667.901 e 60/673.965 dos quaisesse pedido reivindica beneficio. Tais característicasincluem a remoção derajadas de alta energia de curtaduração que ocorrem na banda alta e substancialmente estãoausentes na banda estreita. Tais características incluemsuavização fixa ou adaptativa das representações decoeficiente tal como LSFs de banda alta. Taiscaracterísticas incluem modelagem fixa ou adaptativa deruido associado à quantização de representações decoeficiente tais como LSFs. Tais características tambémincluem suavização fixa ou adaptativa de um envelope deganho, e atenuação adaptativa de um envelope de ganho.
A apresentação anterior das modalidades descritasé provida para permitir que qualquer pessoa versada natécnica realize ou utilize a presente invenção. Diversasmodificações a essas modalidades são possíveis, e osprincípios genéricos apresentados aqui podem ser aplicadostambém a outras modalidades. Por exemplo, uma modalidadepode ser implementada em parte ou integralmente como umcircuito cabeado, como uma configuração de circuitofabricada em um circuito integrado de aplicação especifica,ou como um programa de firmware carregado no armazenamentonão-volátil ou um programa de software carregado a partirde um meio de armazenamento de dados ou para um meio dearmazenamento de dados como código legível por máquina, talcódigo tendo instruções executáveis por um arranj o deelementos lógicos tal como um microprocessador ou outraunidade de processamento de sinal digital. 0 meio dearmazenamento de dados pode ser qualquer arranj o deelementos de armazenamento tal como memória de semicondutor(a qual pode incluir sem limitação RAM dinâmica ou estática(memória de acesso aleatório), ROM (memória de leitura),e/ou RAM flash), ou memória ferroelétrica, magneto-resistiva, ovônica, polimérica, ou de mudança de fase; ouum meio de disco tal como um disco magnético ou ótico. 0termo "software" deve ser entendido como incluindo códigooriginal, código de linguagem de montagem, código demáquina, código binario, firmware, macrocódigo,microcódigo, qualquer um ou mais conjuntos ou seqüências deinstruções executáveis por um arranjo de elementos lógicos,e qualquer combinação de tais exemplos.
Os vários elementos de implementações degeradores de excitação de banda alta A300 e B300,encodificador de banda alta A100, decodificador de bandaalta B200, encodificador de fala de banda larga A100, edecodificador de fala de banda larga B100 podem serimplementados como dispositivos eletrônicos e/ou óticosresidindo, por exemplo, no mesmo chip ou entre dois ou maischips em um conjunto de chips, embora outros arranjos semtal limitação também sejam considerados. Um ou maiselementos de tal equipamento podem ser implementadosintegralmente ou em parte como um ou mais conjuntos deinstruções arranjadas para executar um ou mais arranjosfixos ou programáveis de elementos lógicos (por exemplo,transistores, portas) tais como microprocessadores,processadores integrados, núcleos IP, processadores desinal digital, FPGAs (arranjos de portas programáveis nocampo), ASSPs (produtos padrão de aplicação especifica), eASICs (circuitos integrados de aplicação especifica).Também é possivel que um o mais de tais elementos tenhamestrutura em comum (por exemplo, um processador usado paraexecutar porções de código correspondendo aos elementosdiferentes em tempos diferentes, um conjunto de instruçõesexecutadas para realizar tarefas correspondendo aoselementos diferentes em tempos diferentes, ou um arranjo dedispositivos eletrônicos e/ou óticos realizando operaçõespara elementos diferentes em tempos diferentes). Alémdisso, é possivel que um ou mais de tais elementos sejamusados para realizar tarefas ou executar outros conjuntosde instruções que não são diretamente relacionadas a umaoperação do equipamento, tal como uma tarefa relacionada àoutra operação de um dispositivo ou sistema no qual oequipamento está integrado.
A Figura 30 mostra um fluxograma de um métodoMl00, de acordo com uma modalidade, para encodificar umaporção de banda alta de um sinal de fala tendo uma porçãode banda estreita e a porção de banda alta. A tarefa X100calcula um conj unto de parâmetros de filtro quecaracterizam um envelope espectral da porção de banda alta.A tarefa X200 calcula um sinal espectralmente estendidomediante aplicação de uma função não-linear a um sinalderivado da porção de banda estreita. A tarefa X300 gera umsinal de banda alta, sintetizado de acordo com (A) oconj unto de parâmetros de filtro e (B) um sinal deexcitação de banda alta com base no sinal espectralmenteestendido. A tarefa X4 00 calcula um envelope de ganho combase em uma relação entre (C) energia da porção de bandaalta e (D) energia de um sinal derivado da porção de bandaestreita.
A Figura 31a mostra um fluxograma de um métodoM200 de gerar um sinal de excitação de banda alta de acordocom uma modalidade. A tarefa Y100 calcula um sinalharmonicamente estendido mediante aplicação de uma funçãonão-linear a um sinal de excitação de banda estreitaderivado de uma porção de banda estreita de um sinal defala. A tarefa Y200 mistura o sinal harmonicamenteestendido com um sinal de ruido modulado para gerar umsinal de excitação de banda alta. A Figura 31b mostra umfluxograma de um método M210 de gerar um sinal de excitaçãode banda alta de acordo com outra modalidade incluindo astarefas Y300 e Y400. A tarefa Y300 calcula um envelope dedominio de tempo de acordo com a energia em relação aotempo de um entre o sinal de excitação de banda estreita eo sinal harmonicamente estendido. A tarefa Y400 modula umsinal de ruido de acordo com o envelope de domínio de tempopara produzir o sinal de ruido modulado.
A Figura 32 mostra um fluxograma de um métodoM300 de acordo com uma modalidade, de decodificar umaporção de banda alta de um sinal de fala tendo uma porçãode banda estreita e a porção de banda alta. A tarefa Z100recebe um conjunto de parâmetros de filtro que caracterizamum envelope espectral da porção de banda alta e um conj untode fatores de ganho que caracterizam um envelope temporalda porção de banda alta. A tarefa Z200 calcula um sinalespectralmente estendido mediante aplicação de uma funçãonão-linear a um sinal derivado da porção de banda estreita.A tarefa Z300 gera um sinal de banda alta, sintetizado deacordo com (A) o conjunto de parâmetros de filtro e (B) umsinal de excitação de banda alta com base no sinalespectralmente estendido. A tarefa (Z400) modula umenvelope de ganho do sinal de banda alta, sintetizado combase no conjunto de fatores de ganho. Por exemplo, a tarefaZ400 pode ser configurada para modular o envelope de ganhodo sinal de banda alta, sintetizado mediante aplicação doconjunto de fatores de ganho a um sinal de excitaçãoderivado da porção de banda estreita, ao sinalespectralmente estendido, ao sinal de excitação de bandaalta, ou ao sinal de banda alta, sintetizado.
As modalidades também incluem métodos adicionaisde codificação de fala, encodificação, e decodificação comoexpressamente revelados aqui, por exemplo, por intermédiode descrições das modalidades estruturais configuradas pararealizar tais métodos. Cada um desses métodos também podeser incorporado de forma tangivel (por exemplo, em um oumais meios de armazenamento de dados como relacionadoacima) como um ou mais conj untos de instruções legíveise/ou executáveis por uma máquina incluindo um arranjo deelementos lógicos (por exemplo, um processador,microprocessador, microcontrolador, ou outra máquina deestado finito). Desse modo, não se pretende que a presenteinvenção seja limitada às modalidades mostradas acima, mas,mais propriamente deve ser concedido o mais amplo escopocompatível com os princípios e características inovadorasaqui reveladas de qualquer forma, incluindo nasreivindicações anexas conforme depositadas, que formam umaparte da revelação original.
Claims (22)
1. Método para encodificar uma porção de bandaalta de um sinal de fala tendo uma porção de banda baixa ea porção de banda alta, o método compreendendo:calcular uma pluralidade de parâmetros de filtroque caracterizam um envelope espectral da porção de bandaalta;calcular um sinal espectralmente estendidomediante extensão do espectro de um sinal derivado daporção de banda baixa;gerar um sinal de banda alta, sintetizado deacordo com (A) um sinal de excitação de banda alta baseadono sinal espectralmente estendido e (B) a pluralidade deparâmetros de filtro; ecalcular um envelope de ganho com base em umarelação entre a porção de banda alta e um sinal baseado naporção de banda baixa.
2. Método, de acordo com a reivindicação 1, emque calcular um sinal espectralmente estendido compreendeestender o espectro de um sinal derivado a partir da porçãode banda baixa mediante aplicação de uma função não-linearao sinal.
3. Método, de acordo com a reivindicação 1, emque calcular um envelope de ganho se baseia em uma relaçãoentre a energia da porção de banda alta e a energia de umsinal com base na porção de banda baixa.
4. Método, de acordo com a reivindicação 3, emque calcular um envelope de ganho se baseia em uma relaçãoentre energia da porção de banda alta e energia do sinal debanda alta, sintetizado.
5. Método de processamento de fala, o métodocompreendendo:gerar um sinal de excitação de banda alta combase em um sinal de excitação de banda baixa;gerar um sinal de banda alta, sintetizado combase em um sinal de fala de banda alta e o sinal deexcitação de banda alta; ecalcular uma pluralidade de fatores de ganho combase em uma relação entre o sinal de fala de banda alta eum sinal baseado no sinal de excitação de banda baixa.
6. Método, de acordo com a reivindicação 5, emque cada um da pluralidade de fatores de ganho se baseia emuma relação entre a energia de uma porção em tempo do sinalde fala de banda alta e a energia de uma porçãocorrespondente em tempo de um sinal baseado no sinal deexcitação de banda baixa.
7. Método, de acordo com a reivindicação 5, emque calcular uma pluralidade de fatores de ganho compreendecalcular uma pluralidade de fatores de ganho com base emuma relação entre o sinal de fala de banda alta e o sinalde banda alta, sintetizado.
8. Método, de acordo com a reivindicação 7, emque cada um da pluralidade de fatores de ganho se baseia emuma relação entre energia de uma porção em tempo do sinalde fala de banda alta e energia de uma porçãocorrespondente em tempo do sinal de banda alta,sintetizado.
9. Método, de acordo com a reivindicação 5, emque gerar um sinal de banda alta, sintetizado inclui geraro sinal de banda alta, sintetizado com base no sinal deexcitação de banda alta e uma pluralidade de parâmetros defiltro derivados do sinal de fala de banda alta.
10. Método de decodificar uma porção de bandaalta de um sinal de fala tendo uma porção de banda baixa ea porção de banda alta, o método compreendendo:receber uma pluralidade de parâmetros de filtroque caracterizam um envelope espectral da porção de bandaalta e uma pluralidade de fatores de ganho que caracterizamum envelope temporal da porção de banda alta;calcular um sinal espectralmente estendidomediante extensão do espectro de um sinal que se baseia emum sinal de excitação de banda baixa;gerar um sinal de banda alta, sintetizado deacordo com (A) a pluralidade de parâmetros de filtro e (B)um sinal de excitação de banda alta baseado no sinalespectralmente estendido; emodular um envelope de ganho do sinal de bandaalta, sintetizado de acordo com a pluralidade de fatores deganho.
11. Método, de acordo com a reivindicação 10, emque calcular um sinal espectralmente estendido compreendeestender o espectro de um sinal que se baseia em um sinalde excitação de banda baixa mediante aplicação de umafunção não-linear ao sinal.
12. Método, de acordo com a reivindicação 10, emque a modulação de um envelope de ganho inclui modificar,de acordo com a pluralidade de fatores de ganho, umaamplitude em relação ao tempo de pelo menos um entre umsinal que se baseia no sinal de excitação de banda baixa, osinal espectralmente estendido, o sinal de excitação debanda alta, e o sinal de banda alta, sintetizado.
13. Equipamento configurado para encodificar umaporção de banda alta de um sinal de fala tendo uma porçãode banda baixa e a porção de banda alta, o equipamentocompreendendo:um módulo de análise configurado para calcular umconjunto de parâmetros de filtro que caracterizam umenvelope espectral da porção de banda alta;um extensor de espectro configurado para calcularum sinal espectralmente estendido mediante extensão doespectro de um sinal derivado da porção de banda baixa;um filtro de síntese configurado para gerar umsinal de banda alta, sintetizado de acordo com (A) um sinalde excitação de banda alta baseado no sinal espectralmenteestendido e (B) o conjunto de parâmetros de filtro; eum calculador de fator de ganho configurado paracalcular um envelope de ganho com base em uma relaçãovariável temporalmente entre a porção de banda alta e umsinal baseado na porção de banda baixa.
14. Equipamento, de acordo com a reivindicação-13, em que o extensor de espectro é configurado paraestender o espectro de um sinal derivado da porção de bandabaixa mediante aplicação de uma função não-linear ao sinal.
15. Equipamento, de acordo com a reivindicação-13, em que o calculador de fator de ganho é configuradopara calcular o envelope de ganho com base em uma relaçãovariável temporalmente entre a energia da porção de bandaalta e a energia de um sinal baseado na porção de bandabaixa.
16. Equipamento, de acordo com a reivindicação-15, em que o calculador de fator de ganho é configuradopara calcular um envelope de ganho com base em uma relaçãovariável temporalmente entre a energia da porção de bandaalta e a energia do sinal de banda alta, sintetizado.
17. Equipamento, de acordo com a reivindicação-13, em que o calculador de fator de ganho é configuradopara calcular o envelope de ganho como uma pluralidade defatores de ganho,em que cada um da pluralidade de fatores de ganhose baseia em uma relação entre a energia de uma porção emtempo do sinal de fala de banda alta e a energia de umaporção correspondente em tempo do sinal de banda alta,sintetizado.
18. Equipamento, de acordo com a reivindicação 13, em que o equipamento compreendendo um telefone celular.
19. Decodif icador de fala de banda altaconfigurado para receber (A) uma pluralidade de parâmetrosde filtro que caracterizam um envelope espectral de umaporção de banda alta de um sinal de fala e (B) um sinal deexcitação de banda baixa encodificado com base em umaporção de banda baixa do sinal de fala, o decodificadorcompreendendo:um extensor de espectro configurado para calcularum sinal espectralmente estendido mediante extensão doespectro de um sinal que se baseia no sinal de excitação debanda baixa encodificado;um filtro de síntese configurado para gerar umsinal de banda alta, sintetizado de acordo com apluralidade de parâmetros de filtro e um sinal de excitaçãode banda alta baseado no sinal espectralmente estendido; eum elemento de controle de ganho configurado paramodular um envelope de ganho do sinal de banda alta,sintetizado de acordo com uma pluralidade de fatores deganho que caracterizam um envelope temporal da porção debanda alta.
20. Decodificador, de acordo com a reivindicação 19, em que o extensor de espectro é configurado paraestender o espectro do sinal com base no sinal de excitaçãode banda baixa encodificado mediante aplicação de umafunção não-linear ao sinal.
21. Decodificador, de acordo com a reivindicação 19, em que o elemento de controle de ganho é configuradopara modificar, de acordo com a pluralidade de fatores deganho, a amplitude em relação ao tempo de pelo menos umentre o sinal de excitação de banda baixa encodificado, osinal espectralmente estendido, o sinal de excitação debanda alta, e o sinal de banda alta, sintetizado.
22. Decodificador, de acordo com a reivindicação-19, em que o elemento de controle de ganho compreende pelomenos um entre um multiplicador e um amplificador.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US66790105P | 2005-04-01 | 2005-04-01 | |
| US60/667,901 | 2005-04-01 | ||
| US67396505P | 2005-04-22 | 2005-04-22 | |
| US60/673,965 | 2005-04-22 | ||
| PCT/US2006/012231 WO2006107837A1 (en) | 2005-04-01 | 2006-04-03 | Methods and apparatus for encoding and decoding an highband portion of a speech signal |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| BRPI0609530A2 true BRPI0609530A2 (pt) | 2010-04-13 |
| BRPI0609530B1 BRPI0609530B1 (pt) | 2019-10-29 |
Family
ID=36588741
Family Applications (8)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0609530-5A BRPI0609530B1 (pt) | 2005-04-01 | 2006-04-03 | métodos e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala |
| BRPI0607691-2A BRPI0607691B1 (pt) | 2005-04-01 | 2006-04-03 | método e equipamento para codificação de fala em banda larga |
| BRPI0607646-7A BRPI0607646B1 (pt) | 2005-04-01 | 2006-04-03 | Método e equipamento para encodificação por divisão de banda de sinais de fala |
| BRPI0608306-4A BRPI0608306A2 (pt) | 2005-04-01 | 2006-04-03 | sistemas, métodos e equipamentos para supressão de rajada em banda alta |
| BRPI0608270-0A BRPI0608270A2 (pt) | 2005-04-01 | 2006-04-03 | sistemas, métodos e equipamento para filtragem anti-dispersão |
| BRPI0608305-6A BRPI0608305B1 (pt) | 2005-04-01 | 2006-04-03 | Sistemas, métodos e equipamentos para codificação de fala em banda larga |
| BRPI0607690A BRPI0607690A8 (pt) | 2005-04-01 | 2006-04-03 | Sistemas, métodos e equipamento para geração de excitação em banda alta |
| BRPI0608269A BRPI0608269B8 (pt) | 2005-04-01 | 2006-04-03 | método e aparelho para quantização vetorial de uma representação de envelope espectral |
Family Applications After (7)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0607691-2A BRPI0607691B1 (pt) | 2005-04-01 | 2006-04-03 | método e equipamento para codificação de fala em banda larga |
| BRPI0607646-7A BRPI0607646B1 (pt) | 2005-04-01 | 2006-04-03 | Método e equipamento para encodificação por divisão de banda de sinais de fala |
| BRPI0608306-4A BRPI0608306A2 (pt) | 2005-04-01 | 2006-04-03 | sistemas, métodos e equipamentos para supressão de rajada em banda alta |
| BRPI0608270-0A BRPI0608270A2 (pt) | 2005-04-01 | 2006-04-03 | sistemas, métodos e equipamento para filtragem anti-dispersão |
| BRPI0608305-6A BRPI0608305B1 (pt) | 2005-04-01 | 2006-04-03 | Sistemas, métodos e equipamentos para codificação de fala em banda larga |
| BRPI0607690A BRPI0607690A8 (pt) | 2005-04-01 | 2006-04-03 | Sistemas, métodos e equipamento para geração de excitação em banda alta |
| BRPI0608269A BRPI0608269B8 (pt) | 2005-04-01 | 2006-04-03 | método e aparelho para quantização vetorial de uma representação de envelope espectral |
Country Status (23)
| Country | Link |
|---|---|
| US (8) | US8484036B2 (pt) |
| EP (8) | EP1864283B1 (pt) |
| JP (8) | JP5129117B2 (pt) |
| KR (8) | KR100956877B1 (pt) |
| CN (1) | CN102411935B (pt) |
| AT (4) | ATE459958T1 (pt) |
| AU (8) | AU2006232357C1 (pt) |
| BR (8) | BRPI0609530B1 (pt) |
| CA (8) | CA2603229C (pt) |
| DE (4) | DE602006012637D1 (pt) |
| DK (2) | DK1864101T3 (pt) |
| ES (3) | ES2636443T3 (pt) |
| IL (8) | IL186405A (pt) |
| MX (8) | MX2007012185A (pt) |
| NO (7) | NO20075503L (pt) |
| NZ (6) | NZ562185A (pt) |
| PL (4) | PL1869673T3 (pt) |
| PT (2) | PT1864282T (pt) |
| RU (9) | RU2381572C2 (pt) |
| SG (4) | SG161223A1 (pt) |
| SI (1) | SI1864282T1 (pt) |
| TW (8) | TWI321315B (pt) |
| WO (8) | WO2006107833A1 (pt) |
Families Citing this family (329)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7987095B2 (en) * | 2002-09-27 | 2011-07-26 | Broadcom Corporation | Method and system for dual mode subband acoustic echo canceller with integrated noise suppression |
| US7619995B1 (en) * | 2003-07-18 | 2009-11-17 | Nortel Networks Limited | Transcoders and mixers for voice-over-IP conferencing |
| JP4679049B2 (ja) * | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
| US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
| EP3336843B1 (en) * | 2004-05-14 | 2021-06-23 | Panasonic Intellectual Property Corporation of America | Speech coding method and speech coding apparatus |
| JP4698593B2 (ja) * | 2004-07-20 | 2011-06-08 | パナソニック株式会社 | 音声復号化装置および音声復号化方法 |
| EP2204796B1 (en) * | 2004-08-30 | 2017-07-12 | QUALCOMM Incorporated | Adaptive De-Jitter buffer for voice over IP |
| US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
| US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
| US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
| EP1872364B1 (en) * | 2005-03-30 | 2010-11-24 | Nokia Corporation | Source coding and/or decoding |
| JP5129117B2 (ja) * | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
| PL1875463T3 (pl) * | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
| ATE435481T1 (de) * | 2005-04-28 | 2009-07-15 | Siemens Ag | Verfahren und vorrichtung zur geräuschunterdrückung |
| US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
| US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
| US7831421B2 (en) | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
| DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
| CN101223581A (zh) * | 2005-07-14 | 2008-07-16 | 皇家飞利浦电子股份有限公司 | 音频信号合成 |
| US8169890B2 (en) * | 2005-07-20 | 2012-05-01 | Qualcomm Incorporated | Systems and method for high data rate ultra wideband communication |
| KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
| US7734462B2 (en) * | 2005-09-02 | 2010-06-08 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
| US8326614B2 (en) * | 2005-09-02 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement system |
| KR20080049085A (ko) * | 2005-09-30 | 2008-06-03 | 마츠시타 덴끼 산교 가부시키가이샤 | 음성 부호화 장치 및 음성 부호화 방법 |
| US7991611B2 (en) * | 2005-10-14 | 2011-08-02 | Panasonic Corporation | Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals |
| CN101283407B (zh) | 2005-10-14 | 2012-05-23 | 松下电器产业株式会社 | 变换编码装置和变换编码方法 |
| JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
| EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
| US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
| US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
| US8135047B2 (en) | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
| US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
| US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
| US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
| CN101501761B (zh) | 2006-08-15 | 2012-02-08 | 杜比实验室特许公司 | 无需边信息对时域噪声包络的任意整形 |
| WO2008022181A2 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Updating of decoder states after packet loss concealment |
| US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
| US8046218B2 (en) * | 2006-09-19 | 2011-10-25 | The Board Of Trustees Of The University Of Illinois | Speech and method for identifying perceptual features |
| JP4972742B2 (ja) * | 2006-10-17 | 2012-07-11 | 国立大学法人九州工業大学 | 高域信号補間方法及び高域信号補間装置 |
| BRPI0716315A2 (pt) | 2006-10-25 | 2017-05-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | aparelhagem e método para gerar valores de sub-banda de áudio e aparelhagem e método para gerar amostras de áudio de domínio de tempo |
| USRE50158E1 (en) | 2006-10-25 | 2024-10-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
| US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
| KR101375582B1 (ko) | 2006-11-17 | 2014-03-20 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
| KR101565919B1 (ko) | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
| US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
| GB2444757B (en) * | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
| US20080147389A1 (en) * | 2006-12-15 | 2008-06-19 | Motorola, Inc. | Method and Apparatus for Robust Speech Activity Detection |
| FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
| FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
| KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
| US7873064B1 (en) * | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
| US8032359B2 (en) | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
| GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
| KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
| US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
| PL3591650T3 (pl) | 2007-08-27 | 2021-07-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Sposób i urządzenie do wypełniania dziur widmowych |
| FR2920545B1 (fr) * | 2007-09-03 | 2011-06-10 | Univ Sud Toulon Var | Procede de trajectographie de plusieurs cetaces par acoustique passive |
| RU2449386C2 (ru) * | 2007-11-02 | 2012-04-27 | Хуавэй Текнолоджиз Ко., Лтд. | Способ и устройство для аудиодекодирования |
| EP2227682A1 (en) * | 2007-11-06 | 2010-09-15 | Nokia Corporation | An encoder |
| CN101896968A (zh) * | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 音频编码装置及其方法 |
| US9082397B2 (en) * | 2007-11-06 | 2015-07-14 | Nokia Technologies Oy | Encoder |
| KR101444099B1 (ko) * | 2007-11-13 | 2014-09-26 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
| AU2008326956B2 (en) * | 2007-11-21 | 2011-02-17 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
| US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
| US8050934B2 (en) * | 2007-11-29 | 2011-11-01 | Texas Instruments Incorporated | Local pitch control based on seamless time scale modification and synchronized sampling rate conversion |
| TWI356399B (en) * | 2007-12-14 | 2012-01-11 | Ind Tech Res Inst | Speech recognition system and method with cepstral |
| KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
| US20100280833A1 (en) * | 2007-12-27 | 2010-11-04 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
| KR101413968B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
| KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
| DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
| US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
| US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
| US8326641B2 (en) * | 2008-03-20 | 2012-12-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding using bandwidth extension in portable terminal |
| US8983832B2 (en) * | 2008-07-03 | 2015-03-17 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
| JP5710476B2 (ja) | 2008-07-10 | 2015-04-30 | ヴォイスエイジ・コーポレーション | スーパーフレームにおいてlpcフィルタの量子化および逆量子化を行うためのデバイスおよび方法 |
| MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
| AU2009267529B2 (en) * | 2008-07-11 | 2011-03-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
| KR101400535B1 (ko) * | 2008-07-11 | 2014-05-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩 |
| KR101614160B1 (ko) | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
| WO2010011963A1 (en) * | 2008-07-25 | 2010-01-28 | The Board Of Trustees Of The University Of Illinois | Methods and systems for identifying speech sounds using multi-dimensional analysis |
| US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
| US8407046B2 (en) * | 2008-09-06 | 2013-03-26 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
| US8532998B2 (en) | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
| US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
| US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
| US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
| KR101178801B1 (ko) * | 2008-12-09 | 2012-08-31 | 한국전자통신연구원 | 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법 |
| US20100070550A1 (en) * | 2008-09-12 | 2010-03-18 | Cardinal Health 209 Inc. | Method and apparatus of a sensor amplifier configured for use in medical applications |
| WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
| US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
| US8831958B2 (en) * | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
| US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
| DE102008058496B4 (de) * | 2008-11-21 | 2010-09-09 | Siemens Medical Instruments Pte. Ltd. | Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung |
| GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
| GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
| US9947340B2 (en) | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
| WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
| GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
| GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
| GB2466674B (en) * | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
| GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
| GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
| GB2466675B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
| GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
| EP4145446B1 (en) | 2009-01-16 | 2023-11-22 | Dolby International AB | Cross product enhanced harmonic transposition |
| US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
| KR101320963B1 (ko) * | 2009-03-31 | 2013-10-23 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템 |
| JP4921611B2 (ja) * | 2009-04-03 | 2012-04-25 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
| JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
| WO2010134757A2 (ko) * | 2009-05-19 | 2010-11-25 | 한국전자통신연구원 | 계층형 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치 |
| CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
| US8000485B2 (en) * | 2009-06-01 | 2011-08-16 | Dts, Inc. | Virtual audio processing for loudspeaker or headphone playback |
| KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
| WO2011029484A1 (en) * | 2009-09-14 | 2011-03-17 | Nokia Corporation | Signal enhancement processing |
| WO2011037587A1 (en) * | 2009-09-28 | 2011-03-31 | Nuance Communications, Inc. | Downsampling schemes in a hierarchical neural network structure for phoneme recognition |
| US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
| JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
| EP2491554B1 (en) | 2009-10-20 | 2014-03-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
| PL4152320T3 (pl) * | 2009-10-21 | 2024-02-19 | Dolby International Ab | Nadpróbkowanie w banku filtrów połączonym z modułem transpozycji |
| CN102257567B (zh) | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
| US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
| CA2780971A1 (en) * | 2009-11-19 | 2011-05-26 | Telefonaktiebolaget L M Ericsson (Publ) | Improved excitation signal bandwidth extension |
| JP5619177B2 (ja) * | 2009-11-19 | 2014-11-05 | テレフオンアクチーボラゲット エル エムエリクソン(パブル) | 低域オーディオ信号の帯域拡張 |
| US8489393B2 (en) * | 2009-11-23 | 2013-07-16 | Cambridge Silicon Radio Limited | Speech intelligibility |
| US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
| RU2464651C2 (ru) * | 2009-12-22 | 2012-10-20 | Общество с ограниченной ответственностью "Спирит Корп" | Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов |
| US20110167445A1 (en) * | 2010-01-06 | 2011-07-07 | Reams Robert W | Audiovisual content channelization system |
| US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
| JP5622865B2 (ja) * | 2010-01-12 | 2014-11-12 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および以前の数値コンテキスト値の数値表現の修正を用いたコンピュータプログラム |
| US8699727B2 (en) | 2010-01-15 | 2014-04-15 | Apple Inc. | Visually-assisted mixing of audio using a spectral analyzer |
| US9525569B2 (en) * | 2010-03-03 | 2016-12-20 | Skype | Enhanced circuit-switched calls |
| JP5456914B2 (ja) * | 2010-03-10 | 2014-04-02 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | サンプリングレート依存型タイムワープコンター符号化を用いた、オーディオ信号復号器、オーディオ信号符号化器、方法、およびコンピュータプログラム |
| US8700391B1 (en) * | 2010-04-01 | 2014-04-15 | Audience, Inc. | Low complexity bandwidth expansion of speech |
| WO2011128723A1 (en) * | 2010-04-12 | 2011-10-20 | Freescale Semiconductor, Inc. | Audio communication device, method for outputting an audio signal, and communication system |
| EP2559029B1 (en) * | 2010-04-13 | 2019-01-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and encoder and decoder for gap-less playback of an audio signal |
| JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
| JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
| JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
| US9443534B2 (en) | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
| CN102844810B (zh) * | 2010-04-14 | 2017-05-03 | 沃伊斯亚吉公司 | 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本 |
| EP2559032B1 (en) * | 2010-04-16 | 2019-01-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension |
| US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
| US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
| US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
| US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
| US9378754B1 (en) | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
| US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
| KR101660843B1 (ko) | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
| US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
| ES2372202B2 (es) * | 2010-06-29 | 2012-08-08 | Universidad De Málaga | Sistema de reconocimiento de sonidos de bajo consumo. |
| EP3079152B1 (en) | 2010-07-02 | 2018-06-06 | Dolby International AB | Audio decoding with selective post filtering |
| US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
| JP5589631B2 (ja) * | 2010-07-15 | 2014-09-17 | 富士通株式会社 | 音声処理装置、音声処理方法および電話装置 |
| US8977542B2 (en) | 2010-07-16 | 2015-03-10 | Telefonaktiebolaget L M Ericsson (Publ) | Audio encoder and decoder and methods for encoding and decoding an audio signal |
| JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
| JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
| WO2012031125A2 (en) | 2010-09-01 | 2012-03-08 | The General Hospital Corporation | Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine |
| IL317702A (en) | 2010-09-16 | 2025-02-01 | Dolby Int Ab | Method and system for harmonic, block, subchannel, and enhanced transposition by rhetorical multiplication |
| US8924200B2 (en) | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
| JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
| WO2012053149A1 (ja) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法 |
| JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
| US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
| US8880404B2 (en) | 2011-02-07 | 2014-11-04 | Qualcomm Incorporated | Devices for adaptively encoding and decoding a watermarked signal |
| US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
| MX2013009303A (es) | 2011-02-14 | 2013-09-13 | Fraunhofer Ges Forschung | Codec de audio utilizando sintesis de ruido durante fases inactivas. |
| AR085218A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio |
| ES2458436T3 (es) | 2011-02-14 | 2014-05-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Representación de señal de información utilizando transformada superpuesta |
| TR201908598T4 (tr) | 2011-02-14 | 2019-07-22 | Fraunhofer Ges Forschung | Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem. |
| SG192745A1 (en) * | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Noise generation in audio codecs |
| PL2676267T3 (pl) | 2011-02-14 | 2017-12-29 | Fraunhofergesellschaft Zur Förderung Der Angewandten Forschung E V | Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio |
| MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
| AR085362A1 (es) | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral |
| AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
| EP2676263B1 (en) | 2011-02-16 | 2016-06-01 | Dolby Laboratories Licensing Corporation | Method for configuring filters |
| EP3407352B9 (en) * | 2011-02-18 | 2022-08-10 | Ntt Docomo, Inc. | Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program |
| US9026450B2 (en) | 2011-03-09 | 2015-05-05 | Dts Llc | System for dynamically creating and rendering audio objects |
| US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
| US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
| JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
| US9298287B2 (en) | 2011-03-31 | 2016-03-29 | Microsoft Technology Licensing, Llc | Combined activation for natural user interface systems |
| US9244984B2 (en) | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
| US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
| US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
| CN102811034A (zh) | 2011-05-31 | 2012-12-05 | 财团法人工业技术研究院 | 信号处理装置及信号处理方法 |
| US9264094B2 (en) * | 2011-06-09 | 2016-02-16 | Panasonic Intellectual Property Corporation Of America | Voice coding device, voice decoding device, voice coding method and voice decoding method |
| US9070361B2 (en) | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
| CA2840732C (en) | 2011-06-30 | 2017-06-27 | Samsung Electronics Co., Ltd | Apparatus and method for generating bandwidth extension signal |
| US9059786B2 (en) * | 2011-07-07 | 2015-06-16 | Vecima Networks Inc. | Ingress suppression for communication systems |
| JP5942358B2 (ja) * | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
| RU2486636C1 (ru) * | 2011-11-14 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
| RU2486637C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
| RU2486638C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
| RU2496222C2 (ru) * | 2011-11-17 | 2013-10-20 | Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
| RU2496192C2 (ru) * | 2011-11-21 | 2013-10-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
| RU2486639C1 (ru) * | 2011-11-21 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
| RU2490727C2 (ru) * | 2011-11-28 | 2013-08-20 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) | Способ передачи речевых сигналов (варианты) |
| RU2487443C1 (ru) * | 2011-11-29 | 2013-07-10 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ согласования комплексных сопротивлений и устройство его реализации |
| JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
| US9972325B2 (en) | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
| US9082398B2 (en) * | 2012-02-28 | 2015-07-14 | Huawei Technologies Co., Ltd. | System and method for post excitation enhancement for low bit rate speech coding |
| US9437213B2 (en) * | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
| US9378746B2 (en) | 2012-03-21 | 2016-06-28 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding high frequency for bandwidth extension |
| ES3000058T3 (en) * | 2012-03-29 | 2025-02-27 | Ericsson Telefon Ab L M | Vector quantizer |
| US10448161B2 (en) | 2012-04-02 | 2019-10-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field |
| JP5998603B2 (ja) * | 2012-04-18 | 2016-09-28 | ソニー株式会社 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
| KR101343768B1 (ko) * | 2012-04-19 | 2014-01-16 | 충북대학교 산학협력단 | 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법 |
| RU2504898C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
| RU2504894C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
| US20140006017A1 (en) * | 2012-06-29 | 2014-01-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal |
| ES2661924T3 (es) | 2012-08-31 | 2018-04-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Método y dispositivo para detectar la actividad vocal |
| WO2014046916A1 (en) | 2012-09-21 | 2014-03-27 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
| WO2014062859A1 (en) * | 2012-10-16 | 2014-04-24 | Audiologicall, Ltd. | Audio signal manipulation for speech enhancement before sound reproduction |
| KR101413969B1 (ko) | 2012-12-20 | 2014-07-08 | 삼성전자주식회사 | 오디오 신호의 복호화 방법 및 장치 |
| CN103928031B (zh) | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
| RU2641461C2 (ru) * | 2013-01-29 | 2018-01-17 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер, аудиодекодер, способ обеспечения кодированной аудиоинформации, способ обеспечения декодированной аудиоинформации, компьютерная программа и кодированное представление с использованием сигнально-адаптивного расширения полосы пропускания |
| US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
| CN103971693B (zh) | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
| KR101737254B1 (ko) | 2013-01-29 | 2017-05-17 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법 |
| US20140213909A1 (en) * | 2013-01-31 | 2014-07-31 | Xerox Corporation | Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data |
| US9741350B2 (en) * | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
| US9711156B2 (en) | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
| US9601125B2 (en) * | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
| US9336789B2 (en) * | 2013-02-21 | 2016-05-10 | Qualcomm Incorporated | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
| JP6528679B2 (ja) * | 2013-03-05 | 2019-06-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
| EP2784775B1 (en) * | 2013-03-27 | 2016-09-14 | Binauric SE | Speech signal encoding/decoding method and apparatus |
| CN105264600B (zh) | 2013-04-05 | 2019-06-07 | Dts有限责任公司 | 分层音频编码和传输 |
| KR102450178B1 (ko) * | 2013-04-05 | 2022-10-06 | 돌비 인터네셔널 에이비 | 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더 |
| BR122020017853B1 (pt) * | 2013-04-05 | 2023-03-14 | Dolby International Ab | Sistema e aparelho para codificar um sinal de voz em um fluxo de bits, e método e aparelho para decodificar sinal de áudio |
| PL3540731T3 (pl) | 2013-06-21 | 2024-11-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Szacowanie opóźnienia wysokości tonu |
| RU2642894C2 (ru) * | 2013-06-21 | 2018-01-29 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии |
| FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
| WO2014210549A1 (en) | 2013-06-27 | 2014-12-31 | The General Hospital Corporation | Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data |
| WO2014210527A1 (en) * | 2013-06-28 | 2014-12-31 | The General Hospital Corporation | System and method to infer brain state during burst suppression |
| CN104282308B (zh) | 2013-07-04 | 2017-07-14 | 华为技术有限公司 | 频域包络的矢量量化方法和装置 |
| FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
| EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
| EP3503095A1 (en) * | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
| TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
| EP3043696B1 (en) | 2013-09-13 | 2022-11-02 | The General Hospital Corporation | Systems and methods for improved brain monitoring during general anesthesia and sedation |
| JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
| CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
| CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
| US9224402B2 (en) | 2013-09-30 | 2015-12-29 | International Business Machines Corporation | Wideband speech parameterization for high quality synthesis, transformation and quantization |
| US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
| US10083708B2 (en) * | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
| US9384746B2 (en) * | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
| KR102271852B1 (ko) * | 2013-11-02 | 2021-07-01 | 삼성전자주식회사 | 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 |
| EP2871641A1 (en) * | 2013-11-12 | 2015-05-13 | Dialog Semiconductor B.V. | Enhancement of narrowband audio signals using a single sideband AM modulation |
| WO2015077641A1 (en) | 2013-11-22 | 2015-05-28 | Qualcomm Incorporated | Selective phase compensation in high band coding |
| US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
| CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
| BR112016014476B1 (pt) | 2013-12-27 | 2021-11-23 | Sony Corporation | Aparelho e método de decodificação, e, meio de armazenamento legível por computador |
| FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
| US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
| JP6281336B2 (ja) * | 2014-03-12 | 2018-02-21 | 沖電気工業株式会社 | 音声復号化装置及びプログラム |
| JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
| US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
| ES2975073T3 (es) * | 2014-03-31 | 2024-07-03 | Fraunhofer Ges Forschung | Codificador, descodificador, procedimiento de codificación, procedimiento de descodificación y programa |
| US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
| CN106409304B (zh) | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
| CN105336338B (zh) * | 2014-06-24 | 2017-04-12 | 华为技术有限公司 | 音频编码方法和装置 |
| US9626983B2 (en) * | 2014-06-26 | 2017-04-18 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
| US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
| CN106486129B (zh) * | 2014-06-27 | 2019-10-25 | 华为技术有限公司 | 一种音频编码方法和装置 |
| US9721584B2 (en) * | 2014-07-14 | 2017-08-01 | Intel IP Corporation | Wind noise reduction for audio reception |
| EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
| EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
| EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
| EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
| US10304474B2 (en) | 2014-08-15 | 2019-05-28 | Samsung Electronics Co., Ltd. | Sound quality improving method and device, sound decoding method and device, and multimedia device employing same |
| CN104217730B (zh) * | 2014-08-18 | 2017-07-21 | 大连理工大学 | 一种基于k‑svd的人工语音带宽扩展方法及装置 |
| WO2016040885A1 (en) | 2014-09-12 | 2016-03-17 | Audience, Inc. | Systems and methods for restoration of speech components |
| TWI550945B (zh) * | 2014-12-22 | 2016-09-21 | 國立彰化師範大學 | 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器 |
| US9595269B2 (en) * | 2015-01-19 | 2017-03-14 | Qualcomm Incorporated | Scaling for gain shape circuitry |
| US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
| CA2976864C (en) | 2015-02-26 | 2020-07-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an audio signal to obtain a processed audio signal using a target time-domain envelope |
| WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
| US10847170B2 (en) * | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
| US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
| US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
| US9830921B2 (en) * | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
| WO2017064264A1 (en) * | 2015-10-15 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and appratus for sinusoidal encoding and decoding |
| NO20151400A1 (en) | 2015-10-15 | 2017-01-23 | St Tech As | A system for isolating an object |
| EP3627507B1 (en) | 2016-02-17 | 2024-10-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for enhancing transient processing, computer program |
| FR3049084B1 (fr) | 2016-03-15 | 2022-11-11 | Fraunhofer Ges Forschung | Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code |
| CN117316168A (zh) * | 2016-04-12 | 2023-12-29 | 弗劳恩霍夫应用研究促进协会 | 用于对音频信号进行编码的音频编码器以及方法 |
| US20170330575A1 (en) * | 2016-05-10 | 2017-11-16 | Immersion Services LLC | Adaptive audio codec system, method and article |
| EP3455854B1 (en) * | 2016-05-10 | 2020-09-16 | Immersion Services LLC | Adaptive audio codec method and apparatus |
| US10756755B2 (en) * | 2016-05-10 | 2020-08-25 | Immersion Networks, Inc. | Adaptive audio codec system, method and article |
| US10770088B2 (en) * | 2016-05-10 | 2020-09-08 | Immersion Networks, Inc. | Adaptive audio decoder system, method and article |
| US10699725B2 (en) * | 2016-05-10 | 2020-06-30 | Immersion Networks, Inc. | Adaptive audio encoder system, method and article |
| US10264116B2 (en) * | 2016-11-02 | 2019-04-16 | Nokia Technologies Oy | Virtual duplex operation |
| KR102507383B1 (ko) * | 2016-11-08 | 2023-03-08 | 한국전자통신연구원 | 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템 |
| US10786168B2 (en) | 2016-11-29 | 2020-09-29 | The General Hospital Corporation | Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments |
| MX2019006535A (es) | 2016-12-16 | 2019-08-21 | Ericsson Telefon Ab L M | Metodos, codificador y decodificador para manejar coeficientes de representacion de envolvente. |
| ES2950009T3 (es) | 2017-01-06 | 2023-10-04 | Ericsson Telefon Ab L M | Métodos y aparatos para señalizar y determinar desplazamientos de señal de referencia |
| KR102687184B1 (ko) * | 2017-02-10 | 2024-07-19 | 삼성전자주식회사 | Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법 |
| US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
| US10304468B2 (en) * | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
| TWI901543B (zh) * | 2017-03-23 | 2025-10-11 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
| US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
| US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
| US10791014B2 (en) * | 2017-10-27 | 2020-09-29 | Terawave, Llc | Receiver for high spectral efficiency data communications system using encoded sinusoidal waveforms |
| US11876659B2 (en) | 2017-10-27 | 2024-01-16 | Terawave, Llc | Communication system using shape-shifted sinusoidal waveforms |
| CN109729553B (zh) * | 2017-10-30 | 2021-12-28 | 成都鼎桥通信技术有限公司 | Lte集群通信系统的语音业务处理方法及设备 |
| WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
| EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
| EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
| EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
| EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
| EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
| EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
| EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
| WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
| US10460749B1 (en) * | 2018-06-28 | 2019-10-29 | Nuvoton Technology Corporation | Voice activity detection using vocal tract area information |
| US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
| US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
| JP7088403B2 (ja) * | 2019-02-20 | 2022-06-21 | ヤマハ株式会社 | 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム |
| CN110610713B (zh) * | 2019-08-28 | 2021-11-16 | 南京梧桐微电子科技有限公司 | 一种声码器余量谱幅度参数重构方法及系统 |
| US11380343B2 (en) | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
| TWI723545B (zh) * | 2019-09-17 | 2021-04-01 | 宏碁股份有限公司 | 語音處理方法及其裝置 |
| US11295751B2 (en) * | 2019-09-20 | 2022-04-05 | Tencent America LLC | Multi-band synchronized neural vocoder |
| KR102201169B1 (ko) * | 2019-10-23 | 2021-01-11 | 성균관대학교 산학협력단 | 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법 |
| CN114548442B (zh) * | 2022-02-25 | 2022-10-21 | 万表名匠(广州)科技有限公司 | 一种基于互联网技术的腕表维修管理系统 |
| WO2024052378A1 (en) * | 2022-09-09 | 2024-03-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Low complex bandwidth extension target generation |
| EP4553830A1 (en) * | 2023-11-10 | 2025-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor for extended the audio bandwidth of band-limited audio signal |
| EP4553832A1 (en) * | 2023-11-10 | 2025-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor with a steered audio bandwidth extension |
Family Cites Families (148)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US526468A (en) * | 1894-09-25 | Charles d | ||
| US321993A (en) * | 1885-07-14 | Lantern | ||
| US525147A (en) * | 1894-08-28 | Steam-cooker | ||
| US596689A (en) * | 1898-01-04 | Hose holder or support | ||
| US1126620A (en) * | 1911-01-30 | 1915-01-26 | Safety Car Heating & Lighting | Electric regulation. |
| US1089258A (en) * | 1914-01-13 | 1914-03-03 | James Arnot Paterson | Facing or milling machine. |
| US1300833A (en) * | 1918-12-12 | 1919-04-15 | Moline Mill Mfg Company | Idler-pulley structure. |
| US1498873A (en) * | 1924-04-19 | 1924-06-24 | Bethlehem Steel Corp | Switch stand |
| US2073913A (en) * | 1934-06-26 | 1937-03-16 | Wigan Edmund Ramsay | Means for gauging minute displacements |
| US2086867A (en) * | 1936-06-19 | 1937-07-13 | Hall Lab Inc | Laundering composition and process |
| US3044777A (en) * | 1959-10-19 | 1962-07-17 | Fibermold Corp | Bowling pin |
| US3158693A (en) * | 1962-08-07 | 1964-11-24 | Bell Telephone Labor Inc | Speech interpolation communication system |
| US3855416A (en) | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment |
| US3855414A (en) | 1973-04-24 | 1974-12-17 | Anaconda Co | Cable armor clamp |
| JPS59139099A (ja) | 1983-01-31 | 1984-08-09 | 株式会社東芝 | 音声区間検出装置 |
| US4616659A (en) * | 1985-05-06 | 1986-10-14 | At&T Bell Laboratories | Heart rate detection utilizing autoregressive analysis |
| US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
| US4747143A (en) | 1985-07-12 | 1988-05-24 | Westinghouse Electric Corp. | Speech enhancement system having dynamic gain control |
| NL8503152A (nl) * | 1985-11-15 | 1987-06-01 | Optische Ind De Oude Delft Nv | Dosismeter voor ioniserende straling. |
| US4862168A (en) * | 1987-03-19 | 1989-08-29 | Beard Terry D | Audio digital/analog encoding and decoding |
| US4805193A (en) * | 1987-06-04 | 1989-02-14 | Motorola, Inc. | Protection of energy information in sub-band coding |
| US4852179A (en) * | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
| JP2707564B2 (ja) * | 1987-12-14 | 1998-01-28 | 株式会社日立製作所 | 音声符号化方式 |
| US5285520A (en) | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
| US5077798A (en) * | 1988-09-28 | 1991-12-31 | Hitachi, Ltd. | Method and system for voice coding based on vector quantization |
| US5086475A (en) | 1988-11-19 | 1992-02-04 | Sony Corporation | Apparatus for generating, recording or reproducing sound source data |
| JPH02244100A (ja) | 1989-03-16 | 1990-09-28 | Ricoh Co Ltd | 駆動音源信号生成装置 |
| EP0500913B1 (en) | 1990-09-19 | 1998-01-21 | Koninklijke Philips Electronics N.V. | System comprising a record carrier and a reading device |
| JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
| JP3191457B2 (ja) * | 1992-10-31 | 2001-07-23 | ソニー株式会社 | 高能率符号化装置、ノイズスペクトル変更装置及び方法 |
| US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
| WO1995001680A1 (en) | 1993-06-30 | 1995-01-12 | Sony Corporation | Digital signal encoding device, its decoding device, and its recording medium |
| AU7960994A (en) * | 1993-10-08 | 1995-05-04 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
| US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
| US5487087A (en) | 1994-05-17 | 1996-01-23 | Texas Instruments Incorporated | Signal quantizer with reduced output fluctuation |
| US5797118A (en) | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
| JP2770137B2 (ja) * | 1994-09-22 | 1998-06-25 | 日本プレシジョン・サーキッツ株式会社 | 波形データ圧縮装置 |
| US5699477A (en) | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
| FI97182C (fi) * | 1994-12-05 | 1996-10-25 | Nokia Telecommunications Oy | Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin |
| JP3365113B2 (ja) * | 1994-12-22 | 2003-01-08 | ソニー株式会社 | 音声レベル制御装置 |
| JP3189614B2 (ja) | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
| DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
| JP2956548B2 (ja) | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
| JP2798003B2 (ja) | 1995-05-09 | 1998-09-17 | 松下電器産業株式会社 | 音声帯域拡大装置および音声帯域拡大方法 |
| US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
| US6263307B1 (en) | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
| JP3334419B2 (ja) | 1995-04-20 | 2002-10-15 | ソニー株式会社 | ノイズ低減方法及びノイズ低減装置 |
| US5699485A (en) | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
| US5704003A (en) * | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
| US6097824A (en) * | 1997-06-06 | 2000-08-01 | Audiologic, Incorporated | Continuous frequency dynamic range audio compressor |
| DE69530204T2 (de) * | 1995-10-16 | 2004-03-18 | Agfa-Gevaert | Neue Klasse von Gelbfarbstoffen für photographische Materialien |
| JP3707116B2 (ja) | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
| US5737716A (en) * | 1995-12-26 | 1998-04-07 | Motorola | Method and apparatus for encoding speech using neural network technology for speech classification |
| JP3073919B2 (ja) * | 1995-12-30 | 2000-08-07 | 松下電器産業株式会社 | 同期装置 |
| US5689615A (en) | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
| TW307960B (en) | 1996-02-15 | 1997-06-11 | Philips Electronics Nv | Reduced complexity signal transmission system |
| TW416044B (en) | 1996-06-19 | 2000-12-21 | Texas Instruments Inc | Adaptive filter and filtering method for low bit rate coding |
| JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
| CN1170268C (zh) * | 1996-11-07 | 2004-10-06 | 松下电器产业株式会社 | 声音编码或解码装置及方法 |
| US6009395A (en) | 1997-01-02 | 1999-12-28 | Texas Instruments Incorporated | Synthesizer and method using scaled excitation signal |
| US6202046B1 (en) * | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
| US5890126A (en) | 1997-03-10 | 1999-03-30 | Euphonics, Incorporated | Audio data decompression and interpolation apparatus and method |
| US6041297A (en) | 1997-03-10 | 2000-03-21 | At&T Corp | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations |
| EP0878790A1 (en) | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
| SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
| US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
| US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
| US6029125A (en) | 1997-09-02 | 2000-02-22 | Telefonaktiebolaget L M Ericsson, (Publ) | Reducing sparseness in coded speech signals |
| US6231516B1 (en) * | 1997-10-14 | 2001-05-15 | Vacusense, Inc. | Endoluminal implant with therapeutic and diagnostic capability |
| JPH11205166A (ja) | 1998-01-19 | 1999-07-30 | Mitsubishi Electric Corp | ノイズ検出装置 |
| US6301556B1 (en) * | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
| US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
| US6385573B1 (en) * | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
| JP4170458B2 (ja) * | 1998-08-27 | 2008-10-22 | ローランド株式会社 | 波形信号の時間軸圧縮伸長装置 |
| US6353808B1 (en) | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
| KR20000047944A (ko) | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
| JP4354561B2 (ja) | 1999-01-08 | 2009-10-28 | パナソニック株式会社 | オーディオ信号符号化装置及び復号化装置 |
| US6223151B1 (en) | 1999-02-10 | 2001-04-24 | Telefon Aktie Bolaget Lm Ericsson | Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders |
| US6829360B1 (en) | 1999-05-14 | 2004-12-07 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for expanding band of audio signal |
| US6604070B1 (en) | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
| JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
| US6556950B1 (en) | 1999-09-30 | 2003-04-29 | Rockwell Automation Technologies, Inc. | Diagnostic method and apparatus for use with enterprise control |
| US6715125B1 (en) | 1999-10-18 | 2004-03-30 | Agere Systems Inc. | Source coding and transmission with time diversity |
| JP5220254B2 (ja) | 1999-11-16 | 2013-06-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 広帯域オーディオ伝送システム |
| CA2290037A1 (en) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
| US7260523B2 (en) | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
| WO2001052241A1 (fr) | 2000-01-11 | 2001-07-19 | Matsushita Electric Industrial Co., Ltd. | Dispositif de codage vocal multimode et dispositif de decodage |
| US6757395B1 (en) | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
| US6704711B2 (en) | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
| US6732070B1 (en) * | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
| JP3681105B2 (ja) | 2000-02-24 | 2005-08-10 | アルパイン株式会社 | データ処理方式 |
| FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
| US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
| US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
| US7136810B2 (en) * | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
| US7330814B2 (en) * | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
| DE60118627T2 (de) | 2000-05-22 | 2007-01-11 | Texas Instruments Inc., Dallas | Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen |
| JP2002055699A (ja) | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
| JP2004507191A (ja) * | 2000-08-25 | 2004-03-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | デジタル入力信号のワード長を低減する方法及び装置並びにデジタル入力信号を回復させる方法及び装置 |
| US6515889B1 (en) * | 2000-08-31 | 2003-02-04 | Micron Technology, Inc. | Junction-isolated depletion mode ferroelectric memory |
| US7386444B2 (en) | 2000-09-22 | 2008-06-10 | Texas Instruments Incorporated | Hybrid speech coding and system |
| US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
| JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
| JP3558031B2 (ja) | 2000-11-06 | 2004-08-25 | 日本電気株式会社 | 音声復号化装置 |
| KR100865860B1 (ko) * | 2000-11-09 | 2008-10-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 보다 높은 지각의 품질을 위한 전화 음성의 광대역 확장 |
| SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
| SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
| AU2002218501A1 (en) | 2000-11-30 | 2002-06-11 | Matsushita Electric Industrial Co., Ltd. | Vector quantizing device for lpc parameters |
| GB0031461D0 (en) | 2000-12-22 | 2001-02-07 | Thales Defence Ltd | Communication sets |
| US20040204935A1 (en) | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
| JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
| US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
| SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
| DE50104998D1 (de) | 2001-05-11 | 2005-02-03 | Siemens Ag | Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals |
| CN1235192C (zh) * | 2001-06-28 | 2006-01-04 | 皇家菲利浦电子有限公司 | 传输系统以及用于接收窄带音频信号的接收机和方法 |
| US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
| JP2003036097A (ja) * | 2001-07-25 | 2003-02-07 | Sony Corp | 情報検出装置及び方法、並びに情報検索装置及び方法 |
| TW525147B (en) | 2001-09-28 | 2003-03-21 | Inventec Besta Co Ltd | Method of obtaining and decoding basic cycle of voice |
| US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
| US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
| TW526468B (en) | 2001-10-19 | 2003-04-01 | Chunghwa Telecom Co Ltd | System and method for eliminating background noise of voice signal |
| JP4245288B2 (ja) * | 2001-11-13 | 2009-03-25 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
| US20050004803A1 (en) * | 2001-11-23 | 2005-01-06 | Jo Smeets | Audio signal bandwidth extension |
| CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
| US6751587B2 (en) | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
| JP4290917B2 (ja) * | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
| JP3826813B2 (ja) | 2002-02-18 | 2006-09-27 | ソニー株式会社 | ディジタル信号処理装置及びディジタル信号処理方法 |
| EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
| JP3756864B2 (ja) | 2002-09-30 | 2006-03-15 | 株式会社東芝 | 音声合成方法と装置及び音声合成プログラム |
| KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
| US20040098255A1 (en) | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
| US7242763B2 (en) | 2002-11-26 | 2007-07-10 | Lucent Technologies Inc. | Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems |
| CA2415105A1 (en) | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
| KR100480341B1 (ko) | 2003-03-13 | 2005-03-31 | 한국전자통신연구원 | 광대역 저전송률 음성 신호의 부호화기 |
| RU2316059C2 (ru) | 2003-05-01 | 2008-01-27 | Нокиа Корпорейшн | Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи |
| JP4212591B2 (ja) * | 2003-06-30 | 2009-01-21 | 富士通株式会社 | オーディオ符号化装置 |
| US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
| FI118550B (fi) | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
| US7428490B2 (en) * | 2003-09-30 | 2008-09-23 | Intel Corporation | Method for spectral subtraction in speech enhancement |
| US7698292B2 (en) * | 2003-12-03 | 2010-04-13 | Siemens Aktiengesellschaft | Tag management within a decision, support, and reporting environment |
| KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
| CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
| JP4259401B2 (ja) | 2004-06-02 | 2009-04-30 | カシオ計算機株式会社 | 音声処理装置及び音声符号化方法 |
| US8000967B2 (en) | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
| US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
| CN101185127B (zh) | 2005-04-01 | 2014-04-23 | 高通股份有限公司 | 用于编码和解码语音信号的高频带部分的方法和设备 |
| JP5129117B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
| PL1875463T3 (pl) | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
-
2006
- 2006-04-03 JP JP2008504478A patent/JP5129117B2/ja active Active
- 2006-04-03 CA CA2603229A patent/CA2603229C/en active Active
- 2006-04-03 EP EP06740356A patent/EP1864283B1/en active Active
- 2006-04-03 SG SG201002300-0A patent/SG161223A1/en unknown
- 2006-04-03 AU AU2006232357A patent/AU2006232357C1/en not_active Ceased
- 2006-04-03 BR BRPI0609530-5A patent/BRPI0609530B1/pt active IP Right Grant
- 2006-04-03 KR KR1020077025400A patent/KR100956877B1/ko not_active Expired - Fee Related
- 2006-04-03 TW TW095111819A patent/TWI321315B/zh active
- 2006-04-03 RU RU2007140382/09A patent/RU2381572C2/ru active
- 2006-04-03 DK DK06784345.8T patent/DK1864101T3/da active
- 2006-04-03 JP JP2008504482A patent/JP5161069B2/ja active Active
- 2006-04-03 PL PL06740355T patent/PL1869673T3/pl unknown
- 2006-04-03 RU RU2007140394/09A patent/RU2413191C2/ru active
- 2006-04-03 MX MX2007012185A patent/MX2007012185A/es active IP Right Grant
- 2006-04-03 WO PCT/US2006/012227 patent/WO2006107833A1/en not_active Ceased
- 2006-04-03 NZ NZ562185A patent/NZ562185A/en not_active IP Right Cessation
- 2006-04-03 RU RU2007140426/09A patent/RU2402827C2/ru active
- 2006-04-03 AU AU2006232362A patent/AU2006232362B2/en not_active Ceased
- 2006-04-03 RU RU2009131435/08A patent/RU2491659C2/ru active
- 2006-04-03 AT AT06740354T patent/ATE459958T1/de not_active IP Right Cessation
- 2006-04-03 KR KR1020077025447A patent/KR101019940B1/ko active Active
- 2006-04-03 PT PT67403584T patent/PT1864282T/pt unknown
- 2006-04-03 WO PCT/US2006/012231 patent/WO2006107837A1/en not_active Ceased
- 2006-04-03 CA CA2602806A patent/CA2602806C/en active Active
- 2006-04-03 AU AU2006232363A patent/AU2006232363B2/en active Active
- 2006-04-03 MX MX2007012184A patent/MX2007012184A/es active IP Right Grant
- 2006-04-03 AU AU2006232364A patent/AU2006232364B2/en not_active Ceased
- 2006-04-03 KR KR1020077025422A patent/KR100956523B1/ko not_active Expired - Fee Related
- 2006-04-03 WO PCT/US2006/012233 patent/WO2006107839A2/en not_active Ceased
- 2006-04-03 CA CA2603246A patent/CA2603246C/en active Active
- 2006-04-03 BR BRPI0607691-2A patent/BRPI0607691B1/pt not_active IP Right Cessation
- 2006-04-03 WO PCT/US2006/012230 patent/WO2006107836A1/en not_active Ceased
- 2006-04-03 NZ NZ562186A patent/NZ562186A/xx not_active IP Right Cessation
- 2006-04-03 MX MX2007012187A patent/MX2007012187A/es active IP Right Grant
- 2006-04-03 CN CN201110326747.2A patent/CN102411935B/zh active Active
- 2006-04-03 AU AU2006232361A patent/AU2006232361B2/en not_active Ceased
- 2006-04-03 MX MX2007012191A patent/MX2007012191A/es active IP Right Grant
- 2006-04-03 JP JP2008504480A patent/JP5129118B2/ja active Active
- 2006-04-03 CA CA2603219A patent/CA2603219C/en active Active
- 2006-04-03 BR BRPI0607646-7A patent/BRPI0607646B1/pt active IP Right Grant
- 2006-04-03 US US11/397,794 patent/US8484036B2/en active Active
- 2006-04-03 NZ NZ562190A patent/NZ562190A/en not_active IP Right Cessation
- 2006-04-03 KR KR1020077025432A patent/KR100956525B1/ko not_active Expired - Fee Related
- 2006-04-03 BR BRPI0608306-4A patent/BRPI0608306A2/pt not_active Application Discontinuation
- 2006-04-03 TW TW095111797A patent/TWI316225B/zh active
- 2006-04-03 RU RU2007140365/09A patent/RU2376657C2/ru active
- 2006-04-03 EP EP06740357A patent/EP1866915B1/en active Active
- 2006-04-03 US US11/397,433 patent/US8244526B2/en active Active
- 2006-04-03 BR BRPI0608270-0A patent/BRPI0608270A2/pt not_active Application Discontinuation
- 2006-04-03 BR BRPI0608305-6A patent/BRPI0608305B1/pt active IP Right Grant
- 2006-04-03 DE DE602006012637T patent/DE602006012637D1/de active Active
- 2006-04-03 PL PL06784345T patent/PL1864101T3/pl unknown
- 2006-04-03 KR KR1020077025290A patent/KR100956876B1/ko not_active Expired - Fee Related
- 2006-04-03 TW TW095111794A patent/TWI320923B/zh active
- 2006-04-03 ES ES06740358.4T patent/ES2636443T3/es active Active
- 2006-04-03 US US11/397,505 patent/US8332228B2/en active Active
- 2006-04-03 NZ NZ562188A patent/NZ562188A/en not_active IP Right Cessation
- 2006-04-03 US US11/397,871 patent/US8140324B2/en active Active
- 2006-04-03 AT AT06740355T patent/ATE482449T1/de not_active IP Right Cessation
- 2006-04-03 TW TW095111804A patent/TWI321314B/zh active
- 2006-04-03 AU AU2006252957A patent/AU2006252957B2/en not_active Ceased
- 2006-04-03 PL PL06740357T patent/PL1866915T3/pl unknown
- 2006-04-03 AU AU2006232360A patent/AU2006232360B2/en not_active Ceased
- 2006-04-03 EP EP06740352A patent/EP1864281A1/en not_active Withdrawn
- 2006-04-03 SG SG201004741-3A patent/SG163555A1/en unknown
- 2006-04-03 WO PCT/US2006/012232 patent/WO2006107838A1/en not_active Ceased
- 2006-04-03 US US11/397,370 patent/US8078474B2/en active Active
- 2006-04-03 AU AU2006232358A patent/AU2006232358B2/en not_active Expired - Fee Related
- 2006-04-03 TW TW095111852A patent/TWI324335B/zh active
- 2006-04-03 SI SI200632188T patent/SI1864282T1/sl unknown
- 2006-04-03 PT PT06784345T patent/PT1864101E/pt unknown
- 2006-04-03 CA CA2603187A patent/CA2603187C/en active Active
- 2006-04-03 DE DE602006018884T patent/DE602006018884D1/de active Active
- 2006-04-03 KR KR1020077025293A patent/KR100982638B1/ko active Active
- 2006-04-03 MX MX2007012181A patent/MX2007012181A/es active IP Right Grant
- 2006-04-03 EP EP06784345A patent/EP1864101B1/en active Active
- 2006-04-03 MX MX2007012182A patent/MX2007012182A/es active IP Right Grant
- 2006-04-03 US US11/397,870 patent/US8260611B2/en active Active
- 2006-04-03 CA CA2603231A patent/CA2603231C/en active Active
- 2006-04-03 SG SG201002303-4A patent/SG161224A1/en unknown
- 2006-04-03 NZ NZ562183A patent/NZ562183A/en unknown
- 2006-04-03 NZ NZ562182A patent/NZ562182A/xx not_active IP Right Cessation
- 2006-04-03 TW TW095111851A patent/TWI319565B/zh active
- 2006-04-03 JP JP2008504479A patent/JP5203930B2/ja active Active
- 2006-04-03 EP EP06740358.4A patent/EP1864282B1/en active Active
- 2006-04-03 KR KR1020077025255A patent/KR100956624B1/ko not_active Expired - Fee Related
- 2006-04-03 EP EP06740354A patent/EP1866914B1/en active Active
- 2006-04-03 RU RU2007140383/09A patent/RU2402826C2/ru active
- 2006-04-03 JP JP2008504481A patent/JP4955649B2/ja active Active
- 2006-04-03 BR BRPI0607690A patent/BRPI0607690A8/pt not_active Application Discontinuation
- 2006-04-03 AT AT06740351T patent/ATE485582T1/de not_active IP Right Cessation
- 2006-04-03 EP EP06740351A patent/EP1869670B1/en active Active
- 2006-04-03 ES ES06740354T patent/ES2340608T3/es active Active
- 2006-04-03 JP JP2008504475A patent/JP5129115B2/ja active Active
- 2006-04-03 MX MX2007012189A patent/MX2007012189A/es active IP Right Grant
- 2006-04-03 JP JP2008504477A patent/JP5129116B2/ja active Active
- 2006-04-03 PL PL06740358T patent/PL1864282T3/pl unknown
- 2006-04-03 TW TW095111814A patent/TWI330828B/zh active
- 2006-04-03 WO PCT/US2006/012235 patent/WO2006107840A1/en not_active Ceased
- 2006-04-03 KR KR1020077025421A patent/KR100956524B1/ko not_active Expired - Fee Related
- 2006-04-03 TW TW095111800A patent/TWI321777B/zh active
- 2006-04-03 US US11/397,872 patent/US8069040B2/en active Active
- 2006-04-03 RU RU2007140406/09A patent/RU2390856C2/ru active
- 2006-04-03 EP EP06740355A patent/EP1869673B1/en active Active
- 2006-04-03 SG SG201004744-7A patent/SG163556A1/en unknown
- 2006-04-03 RU RU2007140429/09A patent/RU2387025C2/ru active
- 2006-04-03 WO PCT/US2006/012228 patent/WO2006107834A1/en not_active Ceased
- 2006-04-03 RU RU2007140381/09A patent/RU2386179C2/ru active
- 2006-04-03 MX MX2007012183A patent/MX2007012183A/es active IP Right Grant
- 2006-04-03 AT AT06740357T patent/ATE492016T1/de not_active IP Right Cessation
- 2006-04-03 BR BRPI0608269A patent/BRPI0608269B8/pt active IP Right Grant
- 2006-04-03 DK DK06740358.4T patent/DK1864282T3/en active
- 2006-04-03 DE DE602006017050T patent/DE602006017050D1/de active Active
- 2006-04-03 DE DE602006017673T patent/DE602006017673D1/de active Active
- 2006-04-03 ES ES06784345T patent/ES2391292T3/es active Active
- 2006-04-03 CA CA2602804A patent/CA2602804C/en active Active
- 2006-04-03 US US11/397,432 patent/US8364494B2/en active Active
- 2006-04-03 JP JP2008504474A patent/JP5203929B2/ja active Active
- 2006-04-03 CA CA2603255A patent/CA2603255C/en active Active
- 2006-04-03 WO PCT/US2006/012234 patent/WO2006130221A1/en not_active Ceased
-
2007
- 2007-10-07 IL IL186405A patent/IL186405A/en active IP Right Grant
- 2007-10-07 IL IL186404A patent/IL186404A/en active IP Right Grant
- 2007-10-07 IL IL186443A patent/IL186443A/en active IP Right Grant
- 2007-10-07 IL IL186442A patent/IL186442A/en active IP Right Grant
- 2007-10-07 IL IL186436A patent/IL186436A0/en active IP Right Grant
- 2007-10-07 IL IL186441A patent/IL186441A0/en active IP Right Grant
- 2007-10-07 IL IL186438A patent/IL186438A/en active IP Right Grant
- 2007-10-07 IL IL186439A patent/IL186439A0/en unknown
- 2007-10-31 NO NO20075503A patent/NO20075503L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075514A patent/NO340434B1/no unknown
- 2007-10-31 NO NO20075515A patent/NO340566B1/no unknown
- 2007-10-31 NO NO20075513A patent/NO340428B1/no unknown
- 2007-10-31 NO NO20075512A patent/NO20075512L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075510A patent/NO20075510L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075511A patent/NO20075511L/no not_active Application Discontinuation
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| BRPI0609530A2 (pt) | método e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala | |
| ES2705589T3 (es) | Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia | |
| CN101180677B (zh) | 用于宽频带语音编码的系统、方法和设备 | |
| HK1114940A (en) | Method and apparatus for split-band encoding of speech signals | |
| HK1113848B (en) | Systems, methods, and apparatus for wideband speech coding | |
| HK1115023B (en) | Methods and apparatus for encoding and decoding an highband portion of a speech signal | |
| HK1114685A (en) | Systems, methods, and apparatus for highband time warping | |
| HK1114901B (en) | Systems, methods, and apparatus for highband excitation generation | |
| HK1115024B (en) | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B15K | Others concerning applications: alteration of classification |
Ipc: G10L 21/0208 (2013.01), G10L 19/02 (2013.01), G10L |
|
| B07A | Application suspended after technical examination (opinion) [chapter 7.1 patent gazette] | ||
| B07A | Application suspended after technical examination (opinion) [chapter 7.1 patent gazette] | ||
| B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
| B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 29/10/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 29/10/2019, OBSERVADAS AS CONDICOES LEGAIS |