BRPI0311314B1 - Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada - Google Patents
Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada Download PDFInfo
- Publication number
- BRPI0311314B1 BRPI0311314B1 BRPI0311314-0A BRPI0311314A BRPI0311314B1 BR PI0311314 B1 BRPI0311314 B1 BR PI0311314B1 BR PI0311314 A BRPI0311314 A BR PI0311314A BR PI0311314 B1 BRPI0311314 B1 BR PI0311314B1
- Authority
- BR
- Brazil
- Prior art keywords
- sound signal
- decoded sound
- decoded
- signal
- height
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000005236 sound signal Effects 0.000 claims abstract description 152
- 238000012805 post-processing Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims description 59
- 239000003623 enhancer Substances 0.000 claims description 29
- 238000001914 filtration Methods 0.000 claims description 27
- 238000005070 sampling Methods 0.000 claims description 26
- 230000003044 adaptive effect Effects 0.000 claims description 23
- 230000004044 response Effects 0.000 claims description 19
- 230000006872 improvement Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 4
- 238000003672 processing method Methods 0.000 claims 19
- 230000002238 attenuated effect Effects 0.000 claims 2
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 10
- 238000013459 approach Methods 0.000 description 9
- 230000005284 excitation Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 6
- 230000000737 periodic effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000004704 glottis Anatomy 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Working-Up Tar And Pitch (AREA)
- Inorganic Fibers (AREA)
- Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Executing Machine-Instructions (AREA)
Abstract
"método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada". a presente invenção refere-se a um método e dispositivo para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado, o sinal de som decodificado é dividido em uma pluralidade de sinais de freqüência de sub-banda e o processamento posterior é aplicado para pelo menos um dos sinais de freqüência de sub-banda. após o processamento posterior deste pelo menos um sinal de freqüência de sub-banda, os sinais de freqüência de sub-banda podem ser adicionados para produzir um sinal de som de saída decodificado processado posteriormente. desta maneira, o processamento posterior pode ser localizado para uma sub-banda ou para sub-bandas desejadas deixando outras sub-bandas virtualmente inalteradas.
Description
(54) Título: MÉTODO E DISPOSITIVO PARA APERFEIÇOAMENTO DA ALTURA DE SOM SELETIVO POR FREQÜÊNCIA DE FALA SINTETIZADA (51) Int.CI.: G10L 21/0364; G10L 21/0232 (52) CPC: G10L 21/0364,G10L 21/0232 (30) Prioridade Unionista: 31/05/2002 CA 2,388,352 (73) Titular(es): VOICEAGE CORPORATION (72) Inventor(es): BRUNO BESSETTE; CLAUDE LAFLAMME; MILAN JELINEK; ROCH LEFEBVRE
1/27
Relatório Descritivo da Patente de Invenção para MÉTODO E DISPOSITIVO PARA APERFEIÇOAMENTO DA ALTURA DE SOM SELETIVO POR FREQUÊNCIA DE FALA SINTETIZADA.
Antecedentes da Invenção
1. Campo da invenção:
[001] A presente invenção refere-se a um método e dispositivo para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado.
[002] Este método e dispositivo de processamento posterior podem ser aplicados, em particular mas não de forma exclusiva, à codificação digital de sinais de som (incluindo fala). Por exemplo, este método e dispositivo de processamento posterior também podem ser aplicados ao caso mais geral de aperfeiçoamento de sinal onde a fonte de ruído pode ser a partir de qualquer meio ou sistema, não necessariamente relacionado ao ruído de codificação ou de quantização.
2. Breve descrição da tecnologia atual:
2.1 Codificadores de fala [003] Os codificadores de fala são amplamente utilizados nos sistemas de comunicações digitais para de forma eficiente transmitir e / ou armazenar sinais de fala. Nos sistemas digitais, o sinal de fala de entrada analógico são primeiro amostrados em uma taxa de amostra apropriada e as amostras de fala sucessivas são adicionalmente processadas no domínio digital. Em particular, um codificador de fala recebe as amostras de fala como uma entrada e gera um fluxo de bits de saída comprimido para ser transmitido através de um canal ou armazenado em um meio de armazenamento apropriado. No receptor, um decodificador de fala recebe o fluxo de bits como uma entrada e produz um sinal de fala reconstruído de saída.
[004] Para ser útil, um codificador de fala deve produzir um fluxo
Petição 870170072504, de 27/09/2017, pág. 21/63
2/27 de bits comprimido com uma taxa de bits menor do que a taxa de bits do sinal de fala de entrada digital, amostrado. Os codificadores de fala do estado da técnica tipicamente alcançam uma taxa de compactação de pelo menos 16 até 1 e ainda permitem a decodificação de fala de alta qualidade. Vários destes codificadores de fala do estado da técnica são baseados no modelo CELP (Previsão Linear de Código Estimulado), com diferentes variantes, dependendo do algoritmo.
[005] Na codificação CELP, o sinal de fala digital é processado em blocos sucessivos de amostras de fala chamados quadros. Para cada quadro, o codificador extrai a partir das amostras de fala digitais uma série de parâmetros que são digitalmente codificados e então transmitidos e / ou armazenados. O decodificador é projetado para processar os parâmetros recebidos para reconstruir ou sintetizar o dado quadro do sinal de fala. Tipicamente, os seguintes parâmetros são extraídos a partir das amostras de fala digitais por um codificador CELP:
- Coeficientes de Previsão Linear (coeficientes LP), transmitidos em um domínio transformado tal como as Frequências Espectrais de Linha (LSF) ou Frequências de Emissão de Espectro (ISF);
- Parâmetros de altura de som, incluindo um atraso de altura de som (ou retardo) e um ganho de altura de som; e
- Parâmetros de excitação inovadores (índice e ganho de livro de código fixo).
[006] Os parâmetros de altura de som e os parâmetros de excitação inovadores juntos descrevem o que é chamado de sinal de excitação. Este sinal de excitação é fornecido como uma entrada para um filtro de Previsão Linear (LP) descrito pelos coeficientes LP. O filtro LP pode ser visto como um modelo do trato vocal, ao passo que o sinal de excitação pode ser visto como a saída da glote. Os coeficientes LP ou
Petição 870170072504, de 27/09/2017, pág. 22/63
3/27
LSF são tipicamente calculados e transmitidos em todos os quadros, ao passo que os parâmetros de altura de som e de excitação inovadora são calculados e transmitidos várias vezes por quadro. De forma mais específica, cada quadro é dividido em vários blocos de sinal denominados subquadros e os parâmetros de altura de som e os parâmetros de excitação inovadora são calculados e transmitidos em cada subquadro. Cada quadro tipicamente possui uma duração de 10 até 30 milissegundos, ao passo que um subquadro tipicamente possui uma duração de 5 milissegundos.
[007] Vários padrões de codificação de fala são baseados no modelo CELP Algébrico (ACELP) e de forma mais precisa no algoritmo ACELP. Uma dentre as principais características do ACELP é o uso de livros de código algébricos para codificar a excitação inovadora em cada subquadro. Um livro de código algébrico divide um subquadro em um conjunto de trilhas de posições de pulso intercaladas. Somente poucos pulsos por trilha de amplitude diferente de zero são permitidos e cada pulso de amplitude diferente de zero é restrito às posições da trilha correspondente. O codificador utiliza algoritmos de busca rápida para encontrar as posições e amplitudes ótimas de pulso para os pulsos de cada subquadro. Uma descrição do algoritmo ACELP pode ser encontrada no artigo de R. SALAMI et al., Design and description of CS-ACELP: a toll quality 8kb/s speech coder, IEEE Trans. On Speech and Audio Proc., Vol. 6, No. 2, páginas 116 à 130, Março de 1998, aqui dentro incorporado por referência e o qual descreve o algoritmo de codificação de fala de banda estreita ITU-T G.729 CS-ACELP em 8 kbits / segundo. Deve ser notado que existem várias variações da busca de livro de código de inovação ACELP, dependendo do padrão de conceito. A presente invenção não é dependente destas variações, desde que ela somente se aplica ao processamento posterior do sinal de fala decodificado (sintetizado).
Petição 870170072504, de 27/09/2017, pág. 23/63
4/27 [008] Um padrão recente baseado no algoritmo ACELP é o algoritmo de codificação de fala ETSI/3GPP AMR-WB, o qual também foi adotado pelo ITU-T (Setor de Padronização de Telecomunicação da ITU (União Internacional de Telecomunicação)) como recomendação G.722.2 [ Recomendação ITU-T G.722.2 Wideband coding of speech at around 16 kbits/s using Adaptive Multi-Rate Wideband (AMR-WB), Geneva, 2002], [3GPP TS 26.190, AMR Wideband Speech Codec: Transcoding Functions, Especificação Técnica 3GPP]. O AMR-WB é um algoritmo de múltiplas taxas projetado para operar em nove diferentes taxas de bits entre 6,6 e 23,85 kbits/segundo. Aqueles versados na técnica sabem que a qualidade de fala decodificada geralmente aumenta com a taxa de bits. O AMR-WB tem sido projetado para permitir aos sistemas de comunicação de celular reduzirem a taxa de bits do codificador de fala no caso de condições ruins de canal; os bits são convertidos em bits de codificação de canal para aumentar a proteção dos bits transmitidos. Desta maneira, a qualidade geral dos bits transmitidos pode ser mantida maior do que no caso onde o codificador de fala opera em uma taxa única de bit fixa.
[009] A Figura 7 é um diagrama de bloco esquemático apresentando o princípio do decodificador AMR-WB. De forma mais específica, a Figura 7 é uma representação de alto nível do decodificador, enfatizando o fato de que o fluxo de bits recebido codifica o sinal de fala somente até 6,4 kHz (frequência de amostra de 12,8 kHz) e as frequências maiores do que 6,4 kHz são sintetizadas no decodificador a partir dos parâmetros de banda inferior. Isto implica em que, no codificador, o sinal de fala amostrado em 16 kHz de banda larga original foi primeiro amostrado para baixo para a frequência de amostra de 12,8 kHz, utilizando técnicas de conversão de múltiplas taxas bem conhecidas para aqueles versados na técnica. O decodificador de parâmetro 701 e o decodificador de fala 702 da Figura 7 são análogos em relação ao
Petição 870170072504, de 27/09/2017, pág. 24/63
5/27 decodificador de parâmetro 106 e o decodificador fonte 107 da Figura 1. O fluxo de bits recebido 709 é primeiro decodificado pelo decodificador de parâmetro 701 para recuperar os parâmetros 710 fornecidos para o decodificador de fala 702 para ressintetizar novamente o sinal de fala. No caso específico do decodificador AMR-WB, estes parâmetros são:
- Coeficientes ISF para cada quadro de 20 milissegundos;
- Um atraso de altura de som inteiro T0, um valor de altura de som fracionário T0_frac ao redor de T0 e um ganho de altura de som para cada subquadro de 5 milissegundos; e
- Um formato de livro de código algébrico (posições e sinais de pulso) e ganho para cada subquadro de 5 milissegundos.
[0010] A partir dos parâmetros 710, o decodificador de fala 702 é projetado para sintetizar um dado quadro de sinal de fala para frequências iguais e inferiores à 6,4 kHz e deste modo produzir um sinal de fala sintetizado de banda baixa 712 na frequência de amostra de 12,8 kHz. Para recuperar o sinal de banda completo correspondendo à frequência de amostra de 16 kHz, o decodificador AMR-WB compreende um processador de ressíntese de banda alta 707 responsivo aos parâmetros decodificados 710 a partir do decodificador de parâmetro 701 para sintetizar novamente um sinal de banda alta 711 na frequência de amostra de 16kHz. Os detalhes do processador de ressíntese de sinal de banda alta 707 podem ser encontrados nas publicações seguintes que são aqui dentro incorporadas por referência:
- Recomendação ITU-T G.722.2 Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMRWB), Geneva, 2002; e
- 3GPP TS 26.190, AMR Wideband Speech Codec: Transcoding Functions, 3GPP Technical Specification.
[0011] A saída do processador de ressíntese de banda alta 707,
Petição 870170072504, de 27/09/2017, pág. 25/63
6/27 referida como o sinal de banda alta 711 da Figura 7 é um sinal na frequência de amostra de 16 kHz, possuindo uma energia concentrada acima de 6,4 kHz. O processador 708 soma o sinal de banda alta 711 com um sinal de fala de banda baixa amostrado para cima de 16-kHz 713 para formar o sinal de fala decodificado completo 714 do decodificador AMR-WB na frequência de amostra de 16 kHz.
2.2 Necessidade de processamento posterior [0012] Sempre que um codificador de fala é utilizado em um sistema de comunicação, o sinal sintetizado ou decodificado nunca é idêntico ao sinal de fala original mesmo na ausência de erros de transmissão. Quanto maior a taxa de compactação, maior a distorção introduzida pelo codificador. Esta distorção pode ser feita subjetivamente pequena utilizando diferentes maneiras de se abordar. Uma primeira maneira de se abordar é condicionar o sinal no codificador para melhor descrever, ou codificar, informação subjetivamente relevante no sinal de fala. O uso de um filtro de ponderação formante, geralmente representado como W(z) é um exemplo amplamente utilizado desta primeira maneira de se abordar [B, Kleijn e K. Paliwal editores, «Speech Coding and Synthesis, » Elsevier, 1995]. Este filtro W(z) é tipicamente feito adaptável e é calculado de modo tal que ele reduz a energia do sinal próxima aos formantes espectrais, deste modo aumentando a energia relativa das bandas de energia inferiores. O codificador pode então melhor quantizar bandas de energia inferior, o que de outro modo seria mascarado pelo ruído de codificação, aumentando a distorção percebida. Outro exemplo de condicionamento de sinal no codificador é o então denominado filtro de aguçamento de altura de som, o qual aperfeiçoa a estrutura harmônica do sinal de excitação no codificador. O aguçamento da altura de som almeja assegurar que o nível de ruído inter-harmônico seja mantido baixo o suficiente no senso de percepção.
Petição 870170072504, de 27/09/2017, pág. 26/63
7/27 [0013] Uma segunda maneira de se abordar para minimizar a distorção percebida introduzida por um codificador de fala é aplicar um então denominado algoritmo de processamento posterior. O processamento posterior é aplicado no decodificador, como apresentado na Figura 1. Na Figura 1, o codificador de fala 101 e o decodificador de fala 105 são divididos em dois módulos. No caso do codificador de fala 101, um codificador fonte 102 produz uma série de parâmetros de codificação de fala 109 para serem transmitidos ou armazenados. Estes parâmetros 109 são então codificados em binário pelo codificador de parâmetro 103 utilizando um método de codificação específico, dependendo do algoritmo de codificação de fala e dos parâmetros a serem codificados. O sinal de fala codificado (parâmetros codificados em binário) 110 é então transmitido para o decodificador através de um canal de comunicação 104. No decodificador, o fluxo de bits recebido 111 é primeiro analisado por um decodificador de parâmetro 106 para decodificar os parâmetros de codificação do sinal de som codificados, recebidos, os quais são então utilizados pelo decodificador fonte 107 para gerar o sinal de fala sintetizado 112. O objetivo do processamento posterior (ver processador posterior 108 da Figura 1) é para aperfeiçoar a informação de forma perceptiva relevante no sinal de fala sintetizado, ou de forma equivalente para reduzir ou remover a informação de forma perceptiva importuna. Duas formas comumente utilizadas de processamento posterior são o processamento posterior formante e o processamento posterior de altura de som. No primeiro caso, a estrutura formante do sinal de fala sintetizado é amplificada pelo uso de um filtro adaptável com uma resposta de frequência correlacionada com os formantes de fala. Os picos espectrais do sinal de fala sintetizado são então acentuados à custa dos vales espectrais cuja energia relativa se torna menor. No caso do processamento posterior de altura de som, um filtro adaptável também é aplicado para o sinal de fala sintetizado.
Petição 870170072504, de 27/09/2017, pág. 27/63
8/27
Entretanto, neste caso a resposta de frequência do filtro é correlacionada com a estrutura espectral fina, a saber, os harmônicos. Um filtro posterior de altura de som então acentua os harmônicos à custa da energia inter-harmônica, a qual se torna relativamente menor. Observe que a resposta de frequência de um filtro posterior de altura de som tipicamente abrange toda a faixa de frequência. O impacto é que uma estrutura harmônica é imposta na fala processada posteriormente mesmo em bandas de frequência que não exibem uma estrutura harmônica na fala decodificada. Esta não é uma maneira de se abordar de forma perceptiva ótima para a fala de banda larga (fala amostrada em 16 kHz), a qual raramente exibe uma estrutura periódica em toda a faixa de frequência.
Sumário da Invenção [0014] A presente invenção refere-se a um método para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado, compreendendo dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda e aplicar o processamento posterior para pelo um dos sinais de frequência de sub-banda, mas não para todos os sinais de frequência de sub-banda.
[0015] A presente invenção também envolve um dispositivo para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado, compreendendo dispositivo para dividir o sinal de som codificado em uma pluralidade de sinais de frequência de sub-banda e dispositivos para processar posteriormente pelo menos um dos sinais de frequência de sub-banda, mas não todos sinais de frequência de sub-banda. [0016] De acordo com uma modalidade ilustrativa, após o processamento posterior de pelo menos um sinal de sub-banda de frequência mencionado acima, os sinais de frequência de sub-banda são somaPetição 870170072504, de 27/09/2017, pág. 28/63
9/27 dos para produzir um sinal de som de saída decodificado processado posteriormente.
[0017] Por conseqüência, o método e dispositivo de processamento posterior tornam possível localizar o processamento posterior nas sub-bandas desejadas e deixar virtualmente inalteradas outras subbandas.
[0018] A presente invenção adicionalmente refere-se a um decodificador de sinal de som compreendendo uma entrada para receber um sinal de som codificado, um decodificador de parâmetro fornecido com o sinal de som codificado para decodificar os parâmetros de codificação de sinal de som, um decodificador de sinal de som fornecido com os parâmetros de codificação de sinal de som decodificados para produzir um sinal de som decodificado e um dispositivo de processamento posterior como descrito acima para processar posteriormente o sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado.
[0019] O dito acima e outros objetivos, vantagens e características da presente invenção irão se tornar mais aparentes quando da leitura da descrição não restritiva seguinte das modalidades ilustrativas da mesma, somente dadas à título de exemplo com referência aos desenhos acompanhantes.
Breve Descrição dos Desenhos nos desenhos anexos:
[0020] A Figura 1 é um diagrama de bloco esquemático da estrutura de alto nível de um exemplo de um sistema codificador / decodificador de fala utilizando processamento posterior no decodificador;
[0021] A Figura 2 é um diagrama de bloco esquemático apresentando o princípio geral de uma modalidade ilustrativa da presente invenção utilizando um banco de filtros adaptáveis e filtros de sub-banda, no qual a entrada dos filtros adaptáveis é o sinal (linha sólida) de fala
Petição 870170072504, de 27/09/2017, pág. 29/63
10/27 decodificado (sintetizado) e os parâmetros decodificados (linha pontilhada);
[0022] A Figura 3 é um diagrama de bloco esquemático de um aperfeiçoador de altura de som de duas bandas, o que constitui um caso especial da modalidade ilustrativa da Figura 2;
[0023] A Figura 4 é um diagrama de bloco esquemático de uma modalidade ilustrativa da presente invenção, como aplicado para o caso especial do decodificador de fala de banda larga AMR-WB;
[0024] A Figura 5 é um diagrama de bloco esquemático de uma implementação alternativa da modalidade ilustrativa da Figura 4;
[0025] A Figura 6a é um gráfico ilustrando um exemplo de espectro e de um sinal processado anteriormente;
[0026] A Figura 6b é um gráfico ilustrando um exemplo de espectro do sinal processado posteriormente obtido quando utilizando o método descrito na Figura 3;
[0027] A Figura 7 é um diagrama de bloco esquemático apresentando o princípio da operação do decodificador 3GPP AMR-WB;
[0028] As Figuras 8a e 8b são gráficos apresentando um exemplo da resposta de frequência de um filtro aperfeiçoador de altura de som como descrito pela Equação (1), com o caso especial de um período de altura de som de T=10 amostras;
[0029] A Figura 9a é um gráfico apresentando um exemplo de resposta de frequência para o filtro de banda baixa 404 da Figura 4;
[0030] A Figura 9b é um gráfico apresentando um exemplo de resposta de frequência para o filtro de banda de passagem 407 da Figura 4;
[0031] A Figura 9c é um gráfico apresentando um exemplo de resposta de frequência combinada para o filtro de banda baixa 404 e para os filtros de banda de passagem 407 da Figura 4; e [0032] A Figura 10 é um gráfico apresentando um exemplo da resPetição 870170072504, de 27/09/2017, pág. 30/63
11/27 posta de frequência de um filtro inter-harmônico como descrito pela Equação (2) e utilizada no filtro inter-harmônico 503 da Figura 5, para o caso específico de T = 10 amostras.
Descrição Detalhada das Modalidades Ilustrativas [0033] A Figura 2 é um diagrama de bloco esquemático ilustrando o princípio geral de uma modalidade ilustrativa da presente invenção. [0034] Na Figura 1, o sinal de entrada (sinal no qual o processamento posterior é aplicado) é o sinal de fala decodificado (sintetizado)
112 produzido pelo decodificador de fala 105 (Figura 1) no receptor de um sistema de comunicações (saída do decodificador fonte 107 da Figura 1). O objetivo é produzir um sinal de fala decodificado processado posteriormente na saída 113 do processador posterior 108 da Figura 1 (o qual também é a saída do processador 203 da Figura 2) com qualidade percebida aperfeiçoada. Isto é alcançado por se primeiro aplicar pelo menos uma e possivelmente mais do que uma, operação de filtragem adaptável para o sinal de entrada 112 (ver filtros adaptáveis 201a, 201b,.., 201N). Estes filtros adaptáveis serão descritos na descrição seguinte. Deve ser salientado aqui que alguns dos filtros adaptáveis 201a até 201N podem ser funções triviais, quando requeridas, por exemplo com a saída igual à entrada. A saída 204a, 204b,..., 204N de cada filtro adaptável 201a, 201b,..., 201N é então filtrada por banda de passagem através de um filtro de sub-banda 202a, 202b,..., 202N, respectivamente e o sinal de fala decodificado processado posteriormente
113 é obtido por adicionar através de um processador 203 as saídas resultantes respectivas 205a, 205b,..., 205N dos filtros de sub-banda 202a, 202b,..., 202N.
[0035] Em uma modalidade ilustrativa, uma decomposição de duas bandas é utilizada e a filtragem adaptável é aplicada somente para a banda inferior. Isto resulta em um processamento posterior total que é mais almejado e frequências próximas aos primeiros harmônicos do
Petição 870170072504, de 27/09/2017, pág. 31/63
12/27 sinal de fala sintetizado.
[0036] A Figura 3 é um diagrama de bloco esquemático de um aperfeiçoador de altura de som de duas bandas, o qual constitui um caso especial da modalidade ilustrativa da Figura 2. De forma mais específica, a Figura 3 apresenta as funções básicas de um processador posterior de duas bandas (ver o processador posterior 108 da Figura 1). De acordo com esta modalidade ilustrativa, somente o aperfeiçoamento de altura de som é considerado como processamento posterior, apesar de outros tipos de que processamento posterior poderiam ser contemplados. Na Figura 3, o sinal de fala decodificado (assumido para ser a saída 112 do decodificador 107 da Figura 1) é fornecido através de um par de sub-ramificações 308 e 309.
[0037] Na ramificação superior 308, o sinal de fala decodificado 112 é filtrado por um filtro de banda alta 301 para produzir o sinal de banda superior 310 (sH). Neste exemplo específico, nenhum filtro adaptável é utilizado na ramificação superior. Na ramificação inferior 309, o sinal de fala decodificado 112 é primeiro processado através de um filtro adaptável 307 compreendendo um filtro de banda baixa opcional 302, um módulo de rastreamento de altura de som 303 e um aperfeiçoador de altura de som 304 e então filtrado através de um filtro de banda baixa 305 para obter o sinal processado posteriormente de banda inferior 311 (slef). O sinal de fala decodificado processado posteriormente 113 é obtido por adicionar através de um adicionador 306 os sinais processados posteriormente de banda inferior 311 e superior 312 a partir da saída do filtro de banda baixa 305 e do filtro de banda alta 301, respectivamente. Deve ser salientado que os filtros de banda baixa 305 e de banda alta 301 poderiam ser de vários tipos diferentes, por exemplo, Resposta de Impulso Infinita (UR) ou Resposta de Impulso Finita (FIR). Nesta modalidade ilustrativa, os filtros FIR de fase linear são utilizados.
Petição 870170072504, de 27/09/2017, pág. 32/63
13/27 [0038] Portanto, o filtro adaptável 307 da Figura 3 é composto de dois e possivelmente de três processadores, o filtro de banda baixa opcional 302 similar em relação ao filtro de banda baixa 305, o módulo de rastreamento de altura de som 303 e o aperfeiçoador de altura de som 304.
[0039] O filtro de banda baixa 302 pode ser omitido, mas ele é incluído para permitir a visualização do processamento posterior da Figura 3 como uma decomposição de duas bandas seguida pela filtragem específica em cada sub-banda. Após a filtragem de banda baixa opcional (filtro 302) do sinal de fala decodificado 112 na banda inferior, o sinal resultante Sl é processado através do aperfeiçoador de altura de som 304. O objetivo do aperfeiçoador de altura de som 304 é reduzir o ruído inter-harmônico no sinal de fala decodificado. Na modalidade ilustrativa presente, o aperfeiçoador de altura de som 304 é alcançado por um filtro linear de tempo variante descrito pela seguinte equação:
*n}=(,4,+rB (1) onde a é um coeficiente que controla a atenuação inter-harmônica, T é o período de altura de som do sinal de entrada x[n], e y[n] é o sinal de saída do aperfeiçoador de altura de som. Uma equação mais geral também poderia ser utilizada onde as derivações do filtro em n-T e n+T poderiam ser em atrasos diferentes (por exemplo, n-T1 e n+T2). Os parâmetros T e a variam com o tempo e são dados pelo módulo de rastreamento de altura de som 303. Com um valor de a = 1, o ganho do filtro descrito pela Equação (1) é exatamente 0 em frequências 1/(2T),3/(2T), 5/(2T), etc., isto é, no ponto médio entre as frequências harmônicas 1/T, 3/T, 5/T, etc. Quando a aproxima-se de 0, a atenuação entre os harmônicos produzidos pelo filtro da Equação (1) reduzse. Com um valor de a = 0, a saída do filtro é igual à sua entrada. A
Petição 870170072504, de 27/09/2017, pág. 33/63
14/27
Figura 8 apresenta a resposta de frequência (em dB) do filtro descrito pela Equação (1) para os valores a = 0,8 e 1, quando o atraso de altura de som é (arbitrariamente) estabelecido em um valor de T = 10 amostras. O valor de a pode ser calculado utilizando várias maneiras de se abordar. Por exemplo, a correlação de altura de som normalizada, a qual é bem conhecida por aqueles versados na técnica, pode ser utilizada para controlar o coeficiente a: quanto maior a correlação de altura de som normalizada (quanto mais próximo de 1 ela estiver), maior o valor de a. Um sinal periódico x[n] com um período de T = 10 amostras teria harmônicos no máximo das respostas de frequência da Figura 8, isto é, em frequências normalizadas 0,2, 0,4, etc. É fácil entender a partir da Figura 8 que o aperfeiçoador de altura de som da Equação (1) atenuaria a energia de sinal somente entre seus harmônicos e que os componentes harmônicos não seriam alterados pelo filtro. A Figura 8 também apresenta que variar o parâmetro a permite o controle da quantidade de atenuação inter-harmônica proporcionada pelo filtro da Equação (1). Observe que a resposta de frequência do filtro da Equação (1), apresentada na Figura 8, estende-se para todas as frequências do espectro.
[0040] Desde que o período de altura de som de um sinal de fala varie com o tempo, o valor de altura de som T do aperfeiçoador de altura de som 304 por conseqüência tem que variar. O módulo de rastreamento de altura de som 303 é responsável por proporcionar o valor de altura de som adequado T para o aperfeiçoador de altura de som 304, para cada quadro do sinal de fala decodificado que tem que ser processado. Para este propósito, o módulo de rastreamento de altura de som 303 recebe como entrada não somente as amostras de fala decodificadas mas também os parâmetros decodificados 114 a partir do decodificador de parâmetro 106 da Figura 1.
[0041] Desde que um codificador de fala típico extraia, para cada
Petição 870170072504, de 27/09/2017, pág. 34/63
15/27 subquadro de fala, um atraso de altura de som que nós chamamos de To e possivelmente um valor fracionário Tü_frac utilizado para interpolar a contribuição de livro de código adaptável para a resolução de amostra fracionária, o módulo de rastreamento de altura de som 303 pode então utilizar este atraso de altura de som decodificado para focalizar o rastreamento de altura de som no decodificador. Uma possibilidade é utilizar T0 e T0_frac diretamente no aperfeiçoador de altura de som 304, explorando o fato de que o codificador já executou o rastreamento de altura de som. Outra possibilidade, utilizada nesta modalidade ilustrativa, é recalcular o rastreamento de altura de som no decodificador focalizando nos valores ao redor e nos múltiplos ou submúltiplos do valor de altura de som decodificado T0. O módulo de rastreamento de altura de som 303 então proporciona um atraso de altura de som T para o aperfeiçoador de altura de som 304, o qual utiliza este valor de T na Equação (1) para o quadro presente do sinal de fala decodificado. A saída é o sinal sLE.
[0042] O sinal aperfeiçoado de altura de som sLE é então filtrado por banda baixa através do filtro 305 para isolar as frequências baixas do sinal aperfeiçoado de altura de som sle e para remover os componentes de alta frequência que surgem quando o filtro aperfeiçoador de altura de som da Equação (1) é variado com o tempo, de acordo com o atraso de altura de som T, nos limites de quadro de fala decodificado. Isto produz o sinal processado posteriormente de banda inferior slef, o qual pode agora ser adicionado ao sinal de banda superior sH no adicionador 306. O resultado é o sinal de fala decodificado processado posteriormente 113, com ruído inter-harmônico reduzido na banda inferior. A banda de frequência onde o aperfeiçoamento de altura de som será aplicado depende da frequência de interrupção do filtro de banda baixa 305 (e opcionalmente no filtro de banda baixa 302).
[0043] As Figuras 6a e 6b apresentam um espectro de sinal ilustraPetição 870170072504, de 27/09/2017, pág. 35/63
16/27 tivo ilustrando o efeito do processamento posterior descrito na Figura
3. A Figura 6a é o espectro do sinal de entrada 112 do processador posterior 108 da Figura 1 (sinal de fala decodificado 112 na Figura 3). Neste exemplo ilustrativo, o sinal de entrada é composto de 20 harmônicos, com frequência fundamental fü = 373 Hz escolhida de forma arbitrária, com componentes «ruidosos» adicionados em frequências fo/2, 3fo/2 e 5fo/2. Estes três componentes ruidosos podem ser vistos entre os harmônicos de frequência baixa na Figura 6a. A frequência de amostra é assumida de ser 16 kHz neste exemplo. O aperfeiçoador de altura de som de duas bandas apresentado na Figura 3 e descrito acima é então aplicado ao sinal da Figura 6a. Com uma frequência de amostra de 16 kHz e um sinal periódico de frequência fundamental igual à 373 Hz como na Figura 6a, o módulo de rastreamento de altura de som 303 deve encontrar um período de T = 16000/373 » 43 amostras. Este é o valor que foi utilizado para o filtro aperfeiçoador de altura de som da Equação (1), aplicado para o aperfeiçoador de altura do som 304 da Figura 3. Um valor de a = 0,5 também foi utilizado. Os filtros de banda baixa 305 e de banda alta 301 são filtros FIR de fase linear, simétricos, com 31 derivações. A frequência de interrupção para este exemplo é escolhida como 2000 Hz. Estes valores específicos são dados somente como um exemplo ilustrativo.
[0044] O sinal de fala decodificado processado posteriormente 113 na saída do adicionador 306 possui um espectro apresentado na Figura 6b. Pode ser visto que os sinusóides inter-harmônicos na Figura 6a foram completamente removidos, enquanto os harmônicos do sinal foram praticamente inalterados. Também é observado que o efeito do aperfeiçoador de altura de som diminui à medida que a frequência aproxima-se da frequência de interrupção do filtro da banda baixa (2000 Hz neste exemplo). Então, somente a banda inferior é afetada pelo processamento posterior. Esta é uma característica chave desta
Petição 870170072504, de 27/09/2017, pág. 36/63
17/27 modalidade ilustrativa da presente invenção. Por variar as frequências de interrupção do filtro de banda baixa opcional 302, do filtro de banda baixa 305 e do filtro de banda alta 301, é possível controlar para qual frequência o aperfeiçoamento de altura de som é aplicado.
Aplicação para o decodificador de fala AMR-WB [0045] A presente invenção pode ser aplicada para qualquer sinal de fala sintetizado por um decodificador de fala, ou mesmo para qualquer sinal de fala corrompido por ruído inter-harmônico que precisa ser reduzido. Esta seção irá apresentar uma implementação ilustrativa específica da presente invenção para um sinal de fala decodificado AMRWB. O processamento posterior é aplicado para o sinal de fala sintetizado de banda baixa 712 da Figura 7, isto é, para a saída do decodificador de fala 702, o que produz uma fala sintetizada em uma frequência de amostragem de 12,8 kHz.
[0046] A Figura 4 apresenta o diagrama de bloco de um processador posterior de altura de som quando o sinal de entrada é um sinal de fala sintetizado de banda baixa AMR-WB na frequência de amostragem de 12,8 kHz. De forma mais precisa, o processador posterior apresentado na Figura 4 substitui a unidade de amostragem para cima 703, a qual compreende os processadores 704, 705 e 706. O processador posterior de altura de som da Figura 4 também poderia ser aplicado para o sinal de fala sintetizado amostrado para cima de 16 kHz, mas aplicá-lo para a amostragem para cima reduz o número de operações de filtragem no decodificador e assim reduz a complexidade. [0047] O sinal de entrada (fala sintetizada de banda baixa AMRWB (12,8 kHz)) da Figura 4 é designado como o sinal s. Neste exemplo específico, o sinal s é o sinal de fala sintetizado de banda baixa AMR-WB na frequência de amostragem de 12,8 kHz (saída do processador 702). O processador posterior da altura de som da Figura 4 compreende um módulo de rastreamento de altura de som 401 para
Petição 870170072504, de 27/09/2017, pág. 37/63
18/27 determinar, para cada subquadro de 5 milissegundos, o atraso de altura de som T utilizando os parâmetros decodificados, recebidos 114 (Figura 1) e o sinal de fala sintetizado s. Os parâmetros decodificados utilizados pelo módulo de rastreamento de altura de som são T0, o valor de altura de som inteiro para o subquadro e T0_frac, o valor de altura de som fracionário para a resolução de subamostra. O atraso de altura de som T calculado no módulo de rastreamento de altura de som 401 será utilizado nas próximas etapas para aperfeiçoamento da altura de som. Seria possível utilizar diretamente os parâmetros de altura de som decodificados, recebidos T0 e T0_frac para formar o atraso T utilizado pelo aperfeiçoador de altura de som no filtro de altura do som 402. Entretanto, o módulo de rastreamento de altura de som 401 é capaz de corrigir múltiplos ou submúltiplos de altura de som, o que poderia ter um efeito prejudicial no aperfeiçoamento da altura de som.
[0048] Uma modalidade ilustrativa do algoritmo de rastreamento de altura de som para o módulo 401 é o que se segue (os valores rastreados de altura de som e de limiares específicos são dados somente à título de exemplo):
- Em primeiro lugar, a informação de altura de som decodificada (atraso de altura de som T0) é comparada com um valor armazenado do atraso de altura de som decodificado T_prev do quadro anterior. O T_prev pode ter sido modificado por algumas das seguintes etapas de acordo com o algoritmo de rastreamento de altura de som. Por exemplo, se T0 < 1,16*T_prev então vá para caso 1 abaixo, senão se T0 > 1,16*T_prev, então estabeleça T_temp = T0 e vá para caso 2 abaixo.
[0049] Caso 1: Em primeiro lugar, calcular a correlação cruzada C2 (produto cruzado) entre o último subquadro sintetizado e o sinal de síntese iniciando em T0/2 amostras antes do começo do último subquadro (observe a correlação na metade do valor de altura de som
Petição 870170072504, de 27/09/2017, pág. 38/63
19/27 decodificado).
[0050] Então, calcular a correlação cruzada C3 (produto cruzado) entre o último subquadro sintetizado e o sinal de síntese iniciando em T0/3 amostras antes do começo do último subquadro (observe a correlação em um terço do valor de altura de som decodificado).
[0051] Então, selecione o valor máximo entre C2 e C3 e calcule a correlação normalizada Cn (versão normalizada de C2 ou C3) no submúltiplo correspondente de T0 (em T0/2 se C2 > C3 e em T0/3 se C3 > C2). Chamar T_new, o submúltiplo de altura de som correspondendo à maior correlação normalizada.
[0052] Se Cn > 0,95 (correlação normalizada forte), o novo período de altura de som é T_new (ao invés de T0). Emitir o valor T = T_new a partir do módulo de rastreamento de altura de som 401. Salvar T_prev = T para o próximo rastreamento de altura de som do subquadro e sair do módulo de rastreamento de altura de som 401.
[0053] Se 0,7 < Cn < 0,95, então salvar T_temp = T0/2 ou T0/3 (de acordo com C2 ou C3 acima) para comparações no caso 2 abaixo. Senão, se Cn < 0,7 salvar T_temp = T0.
[0054] Caso 2: Calcular todos os valores possíveis na taxa Tn = [T_temp/n], onde [x] significa a parte inteira de x e n = 1,2,3, etc. é um inteiro.
[0055] Calcular todos as correlações cruzadas Cn nos submúltiplos de atraso de altura de som Tn. Reter Cn_max como a correlação cruzada máxima dentre todos os Cn. Se n > 1 e Cn > 0,8, emitir Tn como a saída do período de altura de som T da unidade de rastreamento de altura de som 401. Senão, emitir T1 = T_temp. Aqui, o valor de T_temp irá depender dos cálculos no Caso 1 acima.
[0056] Deve ser notado que o exemplo acima do módulo de rastreamento de altura de som 401 é dado para propósito somente de ilustração. Qualquer outro método ou dispositivo de rastreamento de
Petição 870170072504, de 27/09/2017, pág. 39/63
20/27 altura de som poderia ser implementado no módulo 401 (ou 303 e 502) para garantir um melhor rastreamento de altura de som no decodificador.
[0057] Portanto, a saída do módulo de rastreamento de altura de som é o período T a ser utilizado no filtro de altura de som 402, o qual é descrito nesta modalidade preferida pelo filtro da Equação (1). Novamente, um valor de a = 0 implica em nenhuma filtragem (a saída do filtro de altura de som 402 é igual à sua entrada) e um valor de a = 1 corresponde à maior quantidade de aperfeiçoamento de altura de som. [0058] Uma vez que o sinal aperfeiçoado Se (Figura 4) é determinado, ele é combinado com o sinal de entrada s de modo que, como na Figura 3, somente a banda inferior seja sujeita ao aperfeiçoamento de altura de som. Na Figura 4, uma maneira de se abordar modificada é utilizada, comparada com a Figura 3. Desde que o processador posterior de altura de som da Figura 4 substitui a unidade de amostragem para cima 703 na Figura 7, os filtros de sub-banda 301 e 305 da Figura 3 são combinados com o filtro de interpolação 705 da Figura 7 para minimizar o número de operações de filtragem e o atraso da filtragem. De forma mais específica, os filtros 404 e 407 da Figura 4 agem tanto como filtros de banda de passagem (para separar as bandas de frequência) como filtros de interpolação (para amostragem para cima de 12,8 até 16 kHz). Estes filtros 404 e 407 poderiam ser adicionalmente projetados de modo que o filtro de banda de passagem 407 possua constrangimentos relaxados em sua banda de parada de frequência baixa (isto é, ele não tem que atenuar completamente o sinal em frequências baixas). Isto poderia ser alcançado por utilizar constrangimentos de projeto similares à estes apresentados na Figura 9. A Figura 9a é um exemplo de resposta de frequência para o filtro de banda baixa 404. Deve ser notado que o ganho DC (Corrente Direta) deste filtro é 5 (ao invés de 1), desde que este filtro também age como um
Petição 870170072504, de 27/09/2017, pág. 40/63
21/27 filtro de interpolação, com uma proporção de interpolação de 5/4, o que implica que o ganho do filtro deve ser 5 em 0 Hz. Então, a Figura 9b apresenta a resposta de frequência do filtro da banda de passagem 407 tornando este filtro 407 complementar, na banda baixa, para o filtro de banda baixa 404. Neste exemplo, o filtro 407 é um filtro de banda de passagem, não um filtro de banda alta tal como o filtro 301, desde que ele deve agir tanto como um filtro de banda alta (tal como o filtro 301) como um filtro de banda baixa (tal como o filtro de interpolação 705). Referindo-se novamente à Figura 9, será visto que os filtros de banda baixa e de banda de passagem 404 e 407 são complementares quando considerados em paralelo, como na Figura 4. Sua resposta de frequência combinada (quando utilizada em paralelo) é apresentada na Figura 9c.
[0059] Para melhor explicar, as tabelas dos coeficientes de filtro utilizados nesta modalidade ilustrativa dos filtros 404 e 407 são dadas abaixo. Sem dúvidas, estas tabelas de coeficientes de filtro são dadas somente a título de exemplo. Deve ser entendido que estes filtros podem ser substituídos sem modificar o escopo, espírito e natureza da presente invenção.
Tabela 1. Coeficientes de banda baixa do filtro 404
| hlp[0] | 0.04375000000000 | hlp[30] | 0.01998000000000 |
| hlp[1] | 0.04371500000000 | hlp[3l] | 0.01882400000000 |
| hlp[2] | 0.04361200000000 | hlp[32] | 0.01768200000000 |
| hlp[3] | 0.04344000000000 | hlp[33] | 0.01655700000000 |
| hlp[4] | 0.04320000000000 | hlp[34] | 0.01545100000000 |
| hlp[5] | 0.04289300000000 | hlp[35] | 0.01436900000000 |
| hlp[6] | 0.04252100000000 | hlp[36] | 0.01331200000000 |
| hlp[7] | 0.04208300000000 | hlp[37] | 0.01228400000000 |
| hlp[8] | 0.04158200000000 | hlp[38] | 0.01128600000000 |
Petição 870170072504, de 27/09/2017, pág. 41/63
22/27
| hlp[9] | 0.04102000000000 | hlp[39] | 0.01032300000000 |
| hlp[10] | 0.04039900000000 | hlp[ 40] | 0.00939500000000 |
| hlp[11] | 0.03972100000000 | hlp[41] | 0.00850500000000 |
| hlp[12] | 0.03898800000000 | hlp[ 42] | 0.00765500000000 |
| hlp[13] | 0.03820200000000 | hlp[ 43] | 0.00684600000000 |
| hlp[14] | 0.03736700000000 | hlp[ 44] | 0.00608100000000 |
| hlp[15] | 0.03648600000000 | hlp[ 45] | 0.00535900000000 |
| hlp[16] | 0.03556100000000 | hlp[ 46] | 0.00468200000000 |
| hlp[17] | 0.03459600000000 | hlp[ 47] | 0.00405100000000 |
| hlp[18] | 0.03359400000000 | hlp[ 48] | 0.00346700000000 |
| hlp[19] | 0.03255800000000 | hlp[ 49] | 0.00292900000000 |
| hlp[20] | 0.03149200000000 | hlp[50] | 0.00243900000000 |
| hlp[21] | 0.03039900000000 | hlp[51] | 0.00199500000000 |
| hlp[22] | 0.02928400000000 | hlp[ 52] | 0.00159900000000 |
| hlp[23] | 0.02814900000000 | hlp[53] | 0.00124800000000 |
| hlp[24] | 0.02699900000000 | hlp[54] | 0.00094400000000 |
| hlp[25] | 0.02583700000000 | hlp[55] | 0.00068400000000 |
| hlp[26] | 0.02466700000000 | hlp[56] | 0.00046800000000 |
| hlp[27] | 0.02349300000000 | hlp[ 57] | 0.00029500000000 |
| hlp[28] | 0.02231800000000 | hlp[58] | 0.00016300000000 |
| hlp[29] | 0.02114600000000 | hlp[59] | 0.00007100000000 |
| hlp[ 60] | 0.00001800000000 |
Tabela 2. Coeficientes de banda de passagem do filtro 407
| hbp[0] | 0.95625000000000 | hbp[30] | -0.01998000000000 |
| hbp[1] | 0.89115400000000 | hbp[31] | -0.00412400000000 |
| hbp[2] | 0.71120900000000 | hbp[32] | 0.00414300000000 |
| hbp[3] | 0.45810600000000 | hbp[33] | 0.00343300000000 |
| hbp[4] | 0.18819900000000 | hbp[34] | -0.00416100000000 |
| hbp[5] | -0.04289300000000 | hbp[35] | -0.01436900000000 |
Petição 870170072504, de 27/09/2017, pág. 42/63
23/27
| hbp[6] | -0.19474300000000 | hbp[36] | -0.02267300000000 |
| hbp[7] | -0.25136900000000 | hbp[37] | -0.02601800000000 |
| hbp[8] | -0.22287200000000 | hbp[38] | -0.02370000000000 |
| hbp[9] | -0.13948000000000 | hbp[39] | -0.01723200000000 |
| hbp[10] | -0.04039900000000 | hbp[ 40] | -0.00939500000000 |
| hbp[11] | 0.03868100000000 | hbp[41] | -0.00297000000000 |
| hbp[12] | 0.07548400000000 | hbp[ 42] | 0.00030500000000 |
| hbp[13] | 0.06566500000000 | hbp[ 43] | 0.00019000000000 |
| hbp[14] | 0.02113800000000 | hbp[ 44] | -0.00226000000000 |
| hbp[15] | -0.03648600000000 | hbp[ 45] | -0.00535900000000 |
| hbp[16] | -0.08465300000000 | hbp[ 46] | -0.00756800000000 |
| hbp[17] | -0.10763400000000 | hbp[ 47] | -0.00805800000000 |
| hbp[18] | -0.10087600000000 | hbp[ 48] | -0.00687000000000 |
| hbp[19] | -0.07091900000000 | hbp[49] | -0.00469500000000 |
| hbp[20] | -0.03149200000000 | hbp[ 50] | -0.00243900000000 |
| hbp[21] | 0.00234200000000 | hbp[51] | -0.00080600000000 |
| hbp[22] | 0.01970000000000 | hbp[52] | -0.00006300000000 |
| hbp[23] | 0.01715300000000 | hbp[53] | -0.00005300000000 |
| hbp[24] | -0.00110700000000 | hbp[54] | -0.00038700000000 |
| hbp[25] | -0.02583700000000 | hbp[55] | -0.00068400000000 |
| hbp[26] | -0.04678900000000 | hbp[ 56] | -0.00074400000000 |
| hbp[27] | -0.05654900000000 | hbp[57] | -0.00057600000000 |
| hbp[28] | -0.05281800000000 | hbp[58] | -0.00031900000000 |
| hbp[29] | -0.03851900000000 | hbp[59] | -0.00011300000000 |
| hbp[60] | -0.00001800000000 |
[0060] A saída do filtro de altura de som 402 da Figura 4 é chamada Se. Para ser recombinada com o sinal da ramificação superior, ela é primeiro amostrada para cima pelo processador 403, pelo filtro de banda baixa 404 e pelo processador 405 e adicionada através de um
Petição 870170072504, de 27/09/2017, pág. 43/63
24/27 adicionador 409 para o sinal de ramificação superior amostrado para cima 410. A operação de amostragem para cima na ramificação superior é executada pelo processador 406, pelo filtro de banda de passagem 407 e pelo processador 408.
[0061] Implementação alternativa do aperfeiçoador de altura de som proposto [0062] A Figura 5 apresenta uma implementação alternativa de um aperfeiçoador de altura de som de duas bandas de acordo com uma modalidade ilustrativa da presente invenção. Deve ser notado que a ramificação superior da Figura 5 não processa todo o sinal de entrada. Isto significa que, neste caso particular, os filtros na ramificação superior da Figura 2 (filtros adaptáveis 201a e 201b) possuem características triviais de entrada-saída (a saída é igual à entrada). Na ramificação inferior, o sinal de entrada (sinal a ser aperfeiçoado) é processado primeiro através de um filtro de banda baixa opcional 501, então através de um filtro linear denominado filtro inter-harmônico 503, definido pela seguinte equação:
y[n] = 2x[n]-1 {x[n - T]+ x[n + T]} (2) [0063] deve ser notado que o sinal negativo na frente do segundo termo no lado direito, comparado com a Equação (1). Também deve ser notado que o fator de aperfeiçoamento a não está incluído na Equação (2), mas ao invés disso ele é introduzido por meio de um ganho adaptável pelo processador 504 da Figura 5. O filtro interharmônico 503, descrito pela Equação (2), possui uma resposta de frequência de modo que ele completamente remova os harmônicos de um sinal periódico possuindo um período de T amostras e de modo que um sinusóide em uma frequência exatamente entre os harmônicos passe através do filtro inalterado em amplitude porém com uma inversão de fase de exatamente 180 graus (o mesmo que a inversão de siPetição 870170072504, de 27/09/2017, pág. 44/63
25/27 nal). Por exemplo, a Figura 10 apresenta a resposta de frequência do filtro descrito pela Equação (2) quando o período é escolhido (arbitrariamente) em T = 10 amostras. Um sinal periódico com período T = 10 amostras apresentaria harmônicos em frequências normalizadas 0,2, 0,4, 0,6, etc. e a Figura 10 apresenta que o filtro da Equação (2), com T = 10 amostras, removeria completamente estes harmônicos. Por outro lado, as frequências no ponto médio exato entre os harmônicos apareceriam na saída do filtro com a mesma amplitude porém com uma mudança de fase de 180°. Esta é a razão pela qual o filtro descrito pela Equação (2) e utilizado como filtro 503 é denominado filtro interharmônico.
[0064] O valor de altura de som T para uso no filtro inter-harmônico 503 é obtido de forma adaptável pelo módulo de rastreamento de altura de som 502. O módulo de rastreamento de altura de som 502 opera no sinal de fala decodificado e nos parâmetros decodificados, de forma similar em relação aos métodos revelados anteriormente como apresentado nas Figuras 3 e 4.
[0065] Então, a saída 507 do filtro inter-harmônico 503 é um sinal formado essencialmente da parte inter-harmônica do sinal decodificado de entrada 112, com mudança de fase de 180° no ponto médio entre os harmônicos do sinal. Então, a saída 507 do filtro inter-harmônico 503 é multiplicada por um ganho a (processador 504) e subsequentemente filtrada por banda baixa (filtro 505) para obter a modificação de banda de baixa frequência que é aplicada para o sinal de fala decodificado de entrada 112 da Figura 5, para obter o sinal decodificado processado posteriormente (sinal aperfeiçoado) 509. O coeficiente a no processador 504 controla a quantidade de aperfeiçoamento de altura de som ou de inter-harmônico. Quanto mais próxima de 1 estiver a, maior será o aperfeiçoamento. Quando a é igual a 0, nenhum aperfeiçoamento é obtido, isto é, a saída do adicionador 506 é exatamente
Petição 870170072504, de 27/09/2017, pág. 45/63
26/27 igual ao sinal de entrada (fala decodificada na Figura 5). O valor de a pode ser calculado utilizando várias maneiras de se abordar. Por exemplo, a correlação de altura de som normalizada, a qual é bemconhecida para aqueles versados na técnica, pode ser utilizada para controlar o coeficiente a: quanto maior a correlação de altura de som normalizada (quanto mais próxima de 1 ela estiver), maior o valor de a. [0066] O sinal de fala decodificado processado posteriormente final 509 é obtido por adicionar através de um adicionador 506 a saída do filtro de banda baixa 505 ao sinal de entrada (sinal de fala decodificado 112 da Figura 5). Dependendo da frequência de interrupção do filtro de banda baixa 505, o impacto deste processamento posterior será limitado para as frequências baixas do sinal de entrada 112, até uma dada frequência. As maiores frequências serão de forma eficaz não afetadas pelo processamento posterior.
[0067] Alternativa de uma banda utilizando um filtro de banda alta adaptável [0068] Uma última alternativa para implementar o processamento posterior de sub-banda para aperfeiçoar o sinal de síntese em frequências baixas é utilizar um filtro de banda alta adaptável, cuja frequência de interrupção é variada de acordo com o valor da altura de som do sinal de entrada. De forma específica e sem referir-se a qualquer desenho, o aperfeiçoamento de baixa frequência utilizando esta modalidade ilustrativa seria executado, em cada quadro de sinal de entrada, de acordo com as seguintes etapas:
[0069] Determinar o valor da altura de som do sinal de entrada (período de sinal) utilizando o sinal de entrada e possivelmente os parâmetros decodificados (saída do decodificador de fala 105) se processar posteriormente um sinal de fala decodificado; esta é uma operação similar em relação à operação de rastreamento de altura de som dos módulos 303, 401 e 502.
Petição 870170072504, de 27/09/2017, pág. 46/63
27/27 [0070] Calcular os coeficientes de um filtro de banda alta de modo que a frequência de interrupção esteja abaixo, porém próxima à frequência fundamental do sinal de entrada; de forma alternativa, interpolar entre os filtros de banda alta armazenados, pré-calculados, de frequências de interrupção conhecidas (a interpolação pode ser feita do domínio de derivações de filtro, ou no domínio de pólo zero, ou em algum outro domínio transformado tal como o LSF (Frequências Espectrais de Linha) do domínio ISF (Frequências de Emissão de Espectro)). [0071] Filtrar o quadro do sinal de entrada com o filtro de banda alta calculado, para obter o sinal processado posteriormente para este quadro.
[0072] Deve ser salientado que a presente modalidade ilustrativa da presente invenção é equivalente a utilizar somente uma ramificação de processamento na Figura 2 e definir o filtro adaptável desta ramificação como um filtro de banda alta controlado por altura de som. O processamento posterior alcançado com esta maneira de se abordar somente irá afetar a faixa de frequência abaixo do primeiro harmônico e não a energia inter-harmônica acima do primeiro harmônico.
[0073] Apesar da presente invenção ter sido descrita na descrição precedente com referência às modalidades ilustrativas da mesma, estas modalidades podem ser modificadas à vontade, dentro do escopo das reivindicações anexas sem se afastar do espírito e natureza da presente invenção. Por exemplo, apesar das modalidades ilustrativas terem sido descritas em relação a um sinal de fala decodificado, aqueles versados na técnica irão apreciar que os conceitos da presente invenção podem ser aplicados para outros tipos de sinais decodificados, em particular mas não exclusivamente para outros tipos de sinais de som decodificados.
Petição 870170072504, de 27/09/2017, pág. 47/63
1/15
Claims (57)
- REIVINDICAÇÕES1. Método para processar posteriormente um sinal de som decodificado (112) em vista de aperfeiçoar uma qualidade percebida do sinal de som decodificado (112) compreendendo as etapas de:dividir (301,305,407,404,505) o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda; e aplicar o processamento posterior (307,401,402,503,504,502) para somente uma parte dos sinais de frequência de sub-banda;caracterizado pelo fato de que ainda aplicar o processamento posterior para somente uma parte dos sinais de frequência de sub-banda compreende aperfeiçoar a altura (304, 402, 503, 504) dos sinais de frequência de sub-banda apenas em uma banda de frequência inferior do sinal de som decodificado (112).
- 2. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende somar (306,409,506) os sinais de frequência de sub-banda, após o processamento posterior de parte dos sinais de sub-banda de frequência para produzir um sinal de som de saída decodificado processado posteriormente (113,509).
- 3. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que aperfeiçoar a altura compreende filtrar de forma adaptável (307) a parte dos sinais de subbanda de frequência.
- 4. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que dividir o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de subbanda compreende filtrar por sub-banda (301,305,407,404,505) o sinal de som decodificado (112) para produzir a pluralidade de sinais de sub-banda de frequência.Petição 870170072504, de 27/09/2017, pág. 48/632/15
- 5. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que para a parte dos sinais de frequência de sub-banda:aperfeiçoar a altura compreende filtrar de forma adaptável (307,401,402,503,504,502) o sinal de som decodificado (112); e dividir o sinal de som decodificado (112) compreende filtrar por sub-banda (301,305,407,404,505) o sinal de som decodificado de forma adaptável filtrado.
- 6. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:dividir o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda compreende:- uma filtragem de banda alta (301) do sinal de som decodificado (112) para produzir um sinal de banda de frequência alta (310); e- uma primeira filtragem de banda baixa (305) do sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa (311); e aperfeiçoar a altura compreende:- aperfeiçoar a altura (304) do sinal de som decodificado (112) antes da primeira filtragem de banda baixa (305) do sinal de som decodificado (112) para produzir o sinal de frequência de banda baixa (311).
- 7. Método de processamento posterior, de acordo com a reivindicação 6, caracterizado pelo fato de que ainda compreende uma segunda filtragem de banda baixa (302) do sinal de som decodificado (112) antes de aperfeiçoar a altura (304) do sinal de som decodificado (112).
- 8. Método de processamento posterior, de acordo com a reivindicação 6, caracterizado pelo fato de que ainda compreendePetição 870170072504, de 27/09/2017, pág. 49/633/15 somar (306) os sinais de frequência de banda alta (310) e de banda baixa (311) para produzir um sinal de som de saída decodificado processado posteriormente (113).
- 9. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:dividir o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda compreende:- filtragem de banda de passagem (407) do sinal de som decodificado (112) para produzir um sinal de frequência de banda superior (410); e- filtragem de banda baixa (404) do sinal de som decodificado (112) para produzir um sinal de frequência de banda inferior; e aperfeiçoar a altura compreende:- aperfeiçoar a altura (402) do sinal de som decodificado (112) antes da filtragem de banda baixa (305) do sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa.
- 10. Método de processamento posterior, de acordo com a reivindicação 9, caracterizado pelo fato de que ainda compreende somar (409) os sinais de frequência de banda superior (410) e de banda inferior para produzir um sinal de som de saída decodificado processado posteriormente.
- 11. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda compreende:- filtragem de banda baixa (505) do sinal de som decodificado para produzir um sinal de frequência de banda baixa; e aperfeiçoar a altura compreende:Petição 870170072504, de 27/09/2017, pág. 50/634/15- aperfeiçoar a altura (503,504) do sinal de frequência de banda baixa.
- 12. Método de processamento posterior, de acordo com a reivindicação 11, caracterizado pelo fato de que aperfeiçoar a altura compreende processar o sinal de som decodificado através de um filtro inter-harmônico (503) para atenuação inter-harmônica do sinal de som decodificado (112).
- 13. Método de processamento posterior, de acordo com a reivindicação 12, caracterizado pelo fato de que aperfeiçoar a altura compreende multiplicar (504) o sinal de som decodificado filtrado interharmônico (507) por um ganho de aperfeiçoamento de altura de som adaptável.
- 14. Método de processamento posterior, de acordo com a reivindicação 12, caracterizado pelo fato de que ainda compreende filtragem de banda baixa (501) do sinal de som decodificado (112) antes de processar o sinal de som decodificado através do filtro interharmônico (503).
- 15. Método de processamento posterior, de acordo com a reivindicação 11, caracterizado pelo fato de que ainda compreende somar (506) o sinal de som decodificado (112) e o sinal de frequência de banda baixa (508) para produzir um sinal de som de saída decodificado processado posteriormente (509).
- 16. Método de processamento posterior, de acordo com a reivindicação 11, caracterizado pelo fato de que aperfeiçoar a altura (503,504) compreende processar o sinal de som decodificado (112) através de um filtro inter-harmônico (503) possuindo a seguinte função de transferência:y\n\ = 2 XM -1 M - T]+ x[n + T]} para atenuação inter-harmônica do sinal de som decodificado (112),Petição 870170072504, de 27/09/2017, pág. 51/635/15 onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado filtrado inter-harmônico (507) em uma dada sub-banda e T é um atraso de altura de som do sinal de som decodificado (112).
- 17. Método de processamento posterior, de acordo com a reivindicação 16, caracterizado pelo fato de que ainda compreende somar (506) o sinal de som decodificado não processado e o sinal de frequência de banda baixa filtrado inter-harmônico (508) para produzir um sinal de som de saída decodificado processado posteriormente (509).
- 18. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que aperfeiçoar a altura compreende aperfeiçoar a altura (304) do sinal de som decodificado (112) utilizando a seguinte equação:y[n]=(l--a ]+Xn+T ]} onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
- 19. Método de processamento posterior, de acordo com a reivindicação 18, caracterizado pelo fato de que compreende receber (106) o atraso de altura de som T através de um fluxo de bits (111).
- 20. Método de processamento posterior, de acordo com a reivindicação 18, caracterizado pelo fato de que compreende decodificar (106) o atraso de altura de som T a partir de um fluxo de bits codificado recebido (111).
- 21. Método de processamento posterior, de acordo com a reivindicação 18, caracterizado pelo fato de que compreende calcular (303) o atraso de altura do som T em resposta ao sinal de som dePetição 870170072504, de 27/09/2017, pág. 52/636/15 codificado (112) para um rastreamento de altura aperfeiçoado.
- 22. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que durante a codificação, o sinal de som é amostrado para baixo a partir de uma frequência de amostragem superior até uma frequência de amostragem inferior, e em que dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda compreende amostrar para cima (403.405.406.408) o sinal de som decodificado (112) a partir da frequência de amostragem inferior até a frequência de amostragem superior.
- 23. Método de processamento posterior, de acordo com a reivindicação 22, caracterizado pelo fato de que dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de subbanda compreende filtragem de sub-banda (407) do sinal de som decodificado (112) e em que a amostragem para cima (406,408) do sinal de som decodificado (112) a partir da frequência de amostragem inferior até a frequência de amostragem superior é combinada com a filtragem de sub-banda (407).
- 24. Método de processamento posterior, de acordo com a reivindicação 22, caracterizado pelo fato de que compreende:filtragem de banda de passagem (407) do sinal de som decodificado (112) para produzir um sinal de frequência de banda superior (410), a filtragem de banda de passagem (407) do sinal de som decodificado (112) sendo combinada com a amostragem para cima (406.408) do sinal de som decodificado (112) a partir da frequência de amostragem inferior até a frequência de amostragem superior; e aperfeiçoamento de altura (402) do sinal de som decodificado (112) e aplicação de filtragem de banda baixa (404) para o sinal de som decodificado com aperfeiçoamento o de altura para produzir um sinal de frequência de banda inferior, a filtragem de banda baixaPetição 870170072504, de 27/09/2017, pág. 53/637/15 (404) do sinal de som decodificado com aperfeiçoamento de altura sendo combinada com a amostragem para cima (403,405) do sinal de som decodificado a partir da frequência de amostragem inferior até a frequência de amostragem superior.
- 25. Método de processamento posterior, de acordo com a reivindicação 24, caracterizado pelo fato de que ainda compreende adicionar (409) o sinal de frequência de banda superior (401) com o sinal de frequência de banda inferior para formar um sinal de som decodificado processado posteriormente e amostrado para cima de saída.
- 26. Método de processamento posterior, de acordo com a reivindicação 24, caracterizado pelo fato de que aperfeiçoar a altura (402) do sinal de som decodificado (112) compreende processar o sinal de som decodificado (112) por meio da seguinte equação:y[n]=(l--a ]+Xn+T ]} onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
- 27. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda compreende dividir (301,305,407,404,505) o sinal de som decodificado (112) em um sinal de frequência de banda superior (310,410) e um sinal de frequência de banda inferior (311,508); e aperfeiçoar a altura compreende aperfeiçoar a altura (304,402,503,504) do sinal de frequência de banda inferior (301,508).Petição 870170072504, de 27/09/2017, pág. 54/638/15
- 28. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que aperfeiçoar a altura compreende:determinar um valor de altura do sinal de som decodificado (112);calcular, em relação ao valor de altura de som determinado, um filtro de banda alta com uma frequência de interrupção abaixo de uma frequência fundamental do sinal de som decodificado (112); e processar o sinal de som decodificado (112) através do filtro de banda alta calculado.
- 29. Dispositivo para processar posteriormente (108) um sinal de som decodificado (112) em vista de aperfeiçoar uma qualidade percebida do sinal de som decodificado compreendendo:um divisor (301,305,407,404,505) do sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda; e um processador posterior (307,401,402,503,504,502) de somente uma parte dos sinais de frequência de sub-banda;caracterizado pelo fato de que o processador posterior compreende um aperfeiçoador de altura (304,402,503,504) dos sinais de frequência de sub-banda apenas em uma banda de frequência inferior do sinal de som decodificado (112).
- 30. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que ainda compreende um adicionador (306,409,506) para somar os sinais de frequência de sub-banda, após o processamento posterior de parte dos sinais de frequência de sub-banda, para produzir um sinal de som de saída decodificado processado posteriormente (113,509).
- 31. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o processadorPetição 870170072504, de 27/09/2017, pág. 55/639/15 posterior compreende um filtro adaptável (307) fornecido com o sinal de som decodificado (112).
- 32. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o divisor compreende um filtro de sub-banda (301,305,407,404,505) fornecido com o sinal de som decodificado.
- 33. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que para a parte dos sinais de frequência de sub-banda:o processador posterior compreende um filtro adaptável (307,401,402,503,504,502) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado de forma adaptável filtrado; e o divisor compreende um filtro de sub-banda (301,305,407,404,505) fornecido com o sinal de som decodificado de forma adaptável filtrado.
- 34. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o divisor compreende:- um filtro de banda alta (301) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda alta (310); e- um primeiro filtro de banda baixa (305) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa; e o aperfeiçoador de altura (304) aperfeiçoa o sinal de som decodificado antes da filtragem de banda baixa do sinal de som decodificado (112) através do primeiro filtro de banda baixa (305).
- 35. Dispositivo de processamento posterior, de acordo com a reivindicação 34, caracterizado pelo fato de que o processadorPetição 870170072504, de 27/09/2017, pág. 56/6310/15 posterior ainda compreende um segundo filtro de banda baixa (302) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado filtrado de banda baixa fornecido para o aperfeiçoador de altura (304).
- 36. Dispositivo de processamento posterior, de acordo com a reivindicação 34, caracterizado pelo fato de que ainda compreende um adicionador (306) para somar os sinais de frequência de banda alta (310) e de banda baixa para produzir um sinal de som de saída decodificado processado posteriormente (113).
- 37. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que:o divisor compreende:- um filtro de banda de passagem (407) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda superior; e- um filtro de banda baixa (404) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda inferior; e o aperfeiçoador de altura (402) aperfeiçoa o sinal de som decodificado (112) antes da filtragem de banda baixa do sinal de som decodificado através do filtro de banda baixa (404) para produzir o sinal de frequência de banda inferior.
- 38. Dispositivo de processamento posterior, de acordo com a reivindicação 37, caracterizado pelo fato de que o aperfeiçoador de altura compreende um filtro de altura (402) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado com a altura aperfeiçoada fornecido para o filtro de banda baixa (404).
- 39. Dispositivo de processamento posterior, de acordo com a reivindicação 37, caracterizado pelo fato de que ainda compreende um adicionador (409) para somar os sinais de frequência de banda suPetição 870170072504, de 27/09/2017, pág. 57/6311/15 perior (410) e de banda inferior para produzir um sinal de som de saída decodificado processado posteriormente.
- 40. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que:o divisor compreende:- um filtro de banda baixa (505) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa (508); e o aperfeiçoador de altura (503,504) aperfeiçoa o sinal de som decodificado (112) para produzir um sinal de som decodificado com a altura aperfeiçoada fornecido para o filtro de banda baixa (505).
- 41. Dispositivo de processamento posterior, de acordo com a reivindicação 40, caracterizado pelo fato de que o aperfeiçoador de altura compreende um filtro inter-harmônico (503) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado atenuado, inter-harmônico (507).
- 42. Dispositivo de processamento posterior, de acordo com a reivindicação 41, caracterizado pelo fato de que o aperfeiçoador de altura compreende um multiplicador (504) para multiplicar o sinal de som decodificado atenuado, inter-harmônico (507) por um ganho de aperfeiçoamento de altura de som adaptável.
- 43. Dispositivo de processamento posterior, de acordo com a reivindicação 41, caracterizado pelo fato de que ainda compreende um filtro de banda baixa (501) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado filtrado de banda baixa fornecido para o filtro inter-harmônico (503).
- 44. Dispositivo de processamento posterior, de acordo com a reivindicação 40, caracterizado pelo fato de que ainda compreende um adicionador (506) para somar o sinal de som decodificado (112) e o sinal de frequência de banda baixa (508) para produzir um sinal dePetição 870170072504, de 27/09/2017, pág. 58/6312/15 som de saída decodificado processado posteriormente (509).
- 45. Dispositivo de processamento posterior, de acordo com a reivindicação 40, caracterizado pelo fato de que o aperfeiçoador de altura compreende um filtro inter-harmônico (503) possuindo a seguinte função de transferência:y\n\ = 2 XM -1 {χ[η - T]+ x[n + T]} para atenuação inter-harmônica do sinal de som decodificado (112), onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado inter-harmonicamente filtrado (507) em uma dada sub-banda e T é um atraso de altura de som do sinal de som decodificado (112).
- 46. Dispositivo de processamento posterior, de acordo com a reivindicação 45, caracterizado pelo fato de que ainda compreende um adicionador (506) para somar o sinal de som decodificado não processado e o sinal de frequência de banda baixa inter-harmonicamente filtrado (508) para produzir um sinal de som de saída decodificado processado posteriormente (509).
- 47. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o aperfeiçoador de altura (304) do sinal de som decodificado (112) utiliza a seguinte equação:y[n]=(l--a {χη-τ ]+ χη+τ ]} onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
- 48. Dispositivo de processamento posterior, de acordo com a reivindicação 47, caracterizado pelo fato de que compreende um receptor (106) do atraso de altura T através de um fluxo de bits (111).Petição 870170072504, de 27/09/2017, pág. 59/6313/15
- 49. Dispositivo de processamento posterior, de acordo com a reivindicação 47, caracterizado pelo fato de que compreende um decodificado (106) do atraso da altura T a partir de um fluxo de bits codificado recebido (111).
- 50. Dispositivo de processamento posterior, de acordo com a reivindicação 47, caracterizado pelo fato de que compreende uma calculadora (303) do atraso de altura de som T em resposta ao sinal de som decodificado (112) para um rastreamento de altura aperfeiçoado.
- 51. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que, durante a codificação, o sinal de som é amostrado para baixo a partir de uma frequência de amostragem superior até uma frequência de amostragem inferior, e em que o divisor compreende um amostrador para cima (403,405,406,408) do sinal de som decodificado a partir da frequência de amostragem inferior até a frequência de amostragem superior.
- 52. Dispositivo de processamento posterior, de acordo com a reivindicação 51, caracterizado pelo fato de que o divisor compreende um filtro de sub-banda (407) fornecido com o sinal de som decodificado (112) e em que o amostrador para cima (406,408) é combinado com o filtro de sub-banda (407).
- 53. Dispositivo de processamento posterior, de acordo com a reivindicação 51, caracterizado pelo fato de que:o aperfeiçoador de altura (402) aperfeiçoa o sinal de som decodificado; e o divisor compreende:- um filtro de banda de passagem (407) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda superior (410), o filtro de banda de passagem (407) sendo combinado com o amostrador para cima (406,408); e- um filtro de banda baixa (404) fornecido com o siPetição 870170072504, de 27/09/2017, pág. 60/6314/15 nal de som decodificado com altura aperfeiçoada para produzir um sinal de frequência de banda inferior, o filtro de banda baixa (404) sendo combinado com o amostrador para cima (403,405).
- 54. Dispositivo de processamento posterior, de acordo com a reivindicação 53, caracterizado pelo fato de que ainda compreende um adicionador (409) para somar o sinal de frequência de banda superior (410) com o sinal de frequência de banda inferior para formar um sinal de som de saída decodificado com altura aperfeiçoada e amostrado para cima.
- 55. Dispositivo de processamento posterior, de acordo com a reivindicação 53, caracterizado pelo fato de que o aperfeiçoador de altura (402) usa a seguinte equação:y[n]=(l--a {X[II-T ]+ Xn+T D onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
- 56. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que:o divisor (301,305,407,404,505) divide o sinal de som decodificado (112) em um sinal de frequência de banda superior (310,410) e um sinal de frequência de banda inferior (311,508); e o aperfeiçoador de altura (304,402,503,504) aperfeiçoa o sinal de frequência de banda inferior (311,508).
- 57. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o aperfeiçoador de altura:determina um valor de altura do sinal de som decodificadoPetição 870170072504, de 27/09/2017, pág. 61/6315/15 (112);calcula, em relação ao valor de altura de som determinado, um filtro de banda alta com uma frequência de interrupção abaixo de uma frequência fundamental do sinal de som decodificado (112); e processa o sinal de som decodificado (112) através do filtro de banda alta calculado.Petição 870170072504, de 27/09/2017, pág. 62/631/11112IPetição 870170072504, de 27/09/2017, pág. 3/63 à2/11Petição 870170072504, de 27/09/2017, pág. 4/633/11 η cn307Petição 870170072504, de 27/09/2017, pág. 5/634/11 to ο•sí·114Petição 870170072504, de 27/09/2017, pág. 6/635/11Petição 870170072504, de 27/09/2017, pág. 7/636/11Petição 870170072504, de 27/09/2017, pág. 8/637/11IQΗ •l·Petição 870170072504, de 27/09/2017, pág. 9/638/11Petição 870170072504, de 27/09/2017, pág. 10/639/11Petição 870170072504, de 27/09/2017, pág. 11/6310/11Petição 870170072504, de 27/09/2017, pág. 12/6311/11 .IDPetição 870170072504, de 27/09/2017, pág. 13/63
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CA2,388,352 | 2002-05-31 | ||
| CA002388352A CA2388352A1 (en) | 2002-05-31 | 2002-05-31 | A method and device for frequency-selective pitch enhancement of synthesized speed |
| PCT/CA2003/000828 WO2003102923A2 (en) | 2002-05-31 | 2003-05-30 | Methode and device for pitch enhancement of decoded speech |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| BRPI0311314B1 true BRPI0311314B1 (pt) | 2018-02-14 |
Family
ID=29589086
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BR0311314-0A BR0311314A (pt) | 2002-05-31 | 2003-05-30 | Método e dispositivo para aperfeiçoamento da altura de som seletivo por frequência de fala sintetizada |
| BRPI0311314-0A BRPI0311314B1 (pt) | 2002-05-31 | 2003-05-30 | Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BR0311314-0A BR0311314A (pt) | 2002-05-31 | 2003-05-30 | Método e dispositivo para aperfeiçoamento da altura de som seletivo por frequência de fala sintetizada |
Country Status (21)
| Country | Link |
|---|---|
| US (1) | US7529660B2 (pt) |
| EP (1) | EP1509906B1 (pt) |
| JP (1) | JP4842538B2 (pt) |
| KR (1) | KR101039343B1 (pt) |
| CN (1) | CN100365706C (pt) |
| AT (1) | ATE399361T1 (pt) |
| AU (1) | AU2003233722B2 (pt) |
| BR (2) | BR0311314A (pt) |
| CA (2) | CA2388352A1 (pt) |
| CY (1) | CY1110439T1 (pt) |
| DE (1) | DE60321786D1 (pt) |
| DK (1) | DK1509906T3 (pt) |
| ES (1) | ES2309315T3 (pt) |
| MX (1) | MXPA04011845A (pt) |
| MY (1) | MY140905A (pt) |
| NO (1) | NO332045B1 (pt) |
| NZ (1) | NZ536237A (pt) |
| PT (1) | PT1509906E (pt) |
| RU (1) | RU2327230C2 (pt) |
| WO (1) | WO2003102923A2 (pt) |
| ZA (1) | ZA200409647B (pt) |
Families Citing this family (80)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6315985B1 (en) * | 1999-06-18 | 2001-11-13 | 3M Innovative Properties Company | C-17/21 OH 20-ketosteroid solution aerosol products with enhanced chemical stability |
| JP4380174B2 (ja) * | 2003-02-27 | 2009-12-09 | 沖電気工業株式会社 | 帯域補正装置 |
| US7619995B1 (en) * | 2003-07-18 | 2009-11-17 | Nortel Networks Limited | Transcoders and mixers for voice-over-IP conferencing |
| FR2861491B1 (fr) * | 2003-10-24 | 2006-01-06 | Thales Sa | Procede de selection d'unites de synthese |
| DE102004007184B3 (de) * | 2004-02-13 | 2005-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Quantisieren eines Informationssignals |
| DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
| DE102004007191B3 (de) * | 2004-02-13 | 2005-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
| CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
| US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
| EP1744139B1 (en) * | 2004-05-14 | 2015-11-11 | Panasonic Intellectual Property Corporation of America | Decoding apparatus and method thereof |
| US8463602B2 (en) * | 2004-05-19 | 2013-06-11 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
| CN101006495A (zh) * | 2004-08-31 | 2007-07-25 | 松下电器产业株式会社 | 语音编码装置、语音解码装置、通信装置以及语音编码方法 |
| JP4407538B2 (ja) * | 2005-03-03 | 2010-02-03 | ヤマハ株式会社 | マイクロフォンアレー用信号処理装置およびマイクロフォンアレーシステム |
| US7177804B2 (en) | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
| US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
| US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
| US8620644B2 (en) * | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
| US8346546B2 (en) * | 2006-08-15 | 2013-01-01 | Broadcom Corporation | Packet loss concealment based on forced waveform alignment after packet loss |
| US20100049512A1 (en) * | 2006-12-15 | 2010-02-25 | Panasonic Corporation | Encoding device and encoding method |
| US8036886B2 (en) * | 2006-12-22 | 2011-10-11 | Digital Voice Systems, Inc. | Estimation of pulsed speech model parameters |
| WO2008081920A1 (ja) * | 2007-01-05 | 2008-07-10 | Kyushu University, National University Corporation | 音声強調処理装置 |
| JP5046233B2 (ja) * | 2007-01-05 | 2012-10-10 | 国立大学法人九州大学 | 音声強調処理装置 |
| CN101622668B (zh) * | 2007-03-02 | 2012-05-30 | 艾利森电话股份有限公司 | 电信网络中的方法和装置 |
| CN101622666B (zh) * | 2007-03-02 | 2012-08-15 | 艾利森电话股份有限公司 | 非因果后置滤波器 |
| JP5255575B2 (ja) * | 2007-03-02 | 2013-08-07 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | レイヤード・コーデックのためのポストフィルタ |
| CN101266797B (zh) * | 2007-03-16 | 2011-06-01 | 展讯通信(上海)有限公司 | 语音信号后处理滤波方法 |
| ES2598113T3 (es) * | 2007-06-27 | 2017-01-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Método y disposición para mejorar señales de audio espaciales |
| JPWO2009004718A1 (ja) * | 2007-07-03 | 2010-08-26 | パイオニア株式会社 | 楽音強調装置、楽音強調方法、楽音強調プログラムおよび記録媒体 |
| JP2009044268A (ja) * | 2007-08-06 | 2009-02-26 | Sharp Corp | 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、及び、記録媒体 |
| US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
| KR101475724B1 (ko) * | 2008-06-09 | 2014-12-30 | 삼성전자주식회사 | 오디오 신호 품질 향상 장치 및 방법 |
| US8538749B2 (en) * | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
| WO2010028301A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Spectrum harmonic/noise sharpness control |
| WO2010028297A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
| US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
| WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
| US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
| GB2466668A (en) * | 2009-01-06 | 2010-07-07 | Skype Ltd | Speech filtering |
| US9202456B2 (en) | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
| GB2473266A (en) * | 2009-09-07 | 2011-03-09 | Nokia Corp | An improved filter bank |
| JP5519230B2 (ja) * | 2009-09-30 | 2014-06-11 | パナソニック株式会社 | オーディオエンコーダ及び音信号処理システム |
| HUE071544T2 (hu) | 2009-10-21 | 2025-09-28 | Dolby Int Ab | Túlmintavételezés kombinált transzponáló szûrõbankban |
| WO2011062535A1 (en) * | 2009-11-19 | 2011-05-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements for loudness and sharpness compensation in audio codecs |
| ES2924180T3 (es) * | 2009-12-14 | 2022-10-05 | Fraunhofer Ges Forschung | Dispositivo de cuantificación vectorial, dispositivo de codificación de habla, procedimiento de cuantificación vectorial y procedimiento de codificación de habla |
| CN102870156B (zh) * | 2010-04-12 | 2015-07-22 | 飞思卡尔半导体公司 | 音频通信设备、输出音频信号的方法和通信系统 |
| US8793126B2 (en) | 2010-04-14 | 2014-07-29 | Huawei Technologies Co., Ltd. | Time/frequency two dimension post-processing |
| US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
| US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
| US8423357B2 (en) * | 2010-06-18 | 2013-04-16 | Alon Konchitsky | System and method for biometric acoustic noise reduction |
| EP3079153B1 (en) * | 2010-07-02 | 2018-08-01 | Dolby International AB | Audio decoding with selective post filtering |
| WO2012110476A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based coding scheme using spectral domain noise shaping |
| JP5914527B2 (ja) | 2011-02-14 | 2016-05-11 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 過渡検出及び品質結果を使用してオーディオ信号の一部分を符号化する装置及び方法 |
| EP2676268B1 (en) * | 2011-02-14 | 2014-12-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
| PL2550653T3 (pl) | 2011-02-14 | 2014-09-30 | Fraunhofer Ges Forschung | Reprezentacja sygnału informacyjnego z użyciem transformacji zakładkowej |
| TR201903388T4 (tr) | 2011-02-14 | 2019-04-22 | Fraunhofer Ges Forschung | Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi. |
| WO2012110447A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
| ES2689072T3 (es) * | 2012-05-23 | 2018-11-08 | Nippon Telegraph And Telephone Corporation | Codificación de una señal de audio |
| FR3000328A1 (fr) * | 2012-12-21 | 2014-06-27 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
| US8927847B2 (en) * | 2013-06-11 | 2015-01-06 | The Board Of Trustees Of The Leland Stanford Junior University | Glitch-free frequency modulation synthesis of sounds |
| US9418671B2 (en) | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
| JP6220610B2 (ja) * | 2013-09-12 | 2017-10-25 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、プログラム、記録媒体 |
| BR112016007515B1 (pt) | 2013-10-18 | 2021-11-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Método de codificação de segmento de sinal de áudio, codificador de segmento de sinal de áudio, e, terminal de usuário. |
| LT3511935T (lt) | 2014-04-17 | 2021-01-11 | Voiceage Evs Llc | Būdas, įrenginys ir kompiuteriu nuskaitoma neperkeliama atmintis garso signalų tiesinės prognozės kodavimui ir dekodavimui po perėjimo tarp kadrų su skirtingais mėginių ėmimo greičiais |
| EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
| EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
| CN107210718A (zh) * | 2014-11-20 | 2017-09-26 | 迪芬尼香港有限公司 | 使用多速率fir和全通iir滤波器均衡扬声器系统的声学响应的方法和装置 |
| TWI693594B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
| US10109284B2 (en) * | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
| KR102299193B1 (ko) | 2016-04-12 | 2021-09-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 상부 주파수 대역에서 검출된 피크 스펙트럼 영역을 고려하여 오디오 신호를 부호화하는 오디오 인코더, 오디오 신호를 부호화하는 방법, 및 컴퓨터 프로그램 |
| RU2676022C1 (ru) * | 2016-07-13 | 2018-12-25 | Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" | Способ повышения разборчивости речи |
| CN111128230B (zh) * | 2019-12-31 | 2022-03-04 | 广州市百果园信息技术有限公司 | 语音信号重建方法、装置、设备和存储介质 |
| US11270714B2 (en) | 2020-01-08 | 2022-03-08 | Digital Voice Systems, Inc. | Speech coding using time-varying interpolation |
| CN113053353B (zh) * | 2021-03-10 | 2022-10-04 | 度小满科技(北京)有限公司 | 一种语音合成模型的训练方法及装置 |
| US12254895B2 (en) | 2021-07-02 | 2025-03-18 | Digital Voice Systems, Inc. | Detecting and compensating for the presence of a speaker mask in a speech signal |
| US11990144B2 (en) | 2021-07-28 | 2024-05-21 | Digital Voice Systems, Inc. | Reducing perceived effects of non-voice data in digital speech |
| US12451151B2 (en) | 2022-04-08 | 2025-10-21 | Digital Voice Systems, Inc. | Tone frame detector for digital speech |
| US20240386899A1 (en) * | 2023-05-16 | 2024-11-21 | Apple Inc. | Downlink noise suppression |
| US12462814B2 (en) | 2023-10-06 | 2025-11-04 | Digital Voice Systems, Inc. | Bit error correction in digital speech |
| KR102874451B1 (ko) | 2024-04-25 | 2025-10-22 | 엘아이지넥스원 주식회사 | 수중 음향 기만용 노이즈 신호 최적화 방법 및 이를 위한 장치 |
| CN119229884B (zh) * | 2024-08-20 | 2025-12-19 | 北京达佳互联信息技术有限公司 | 一种语音处理方法、装置、电子设备及存储介质 |
Family Cites Families (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| SU447857A1 (ru) | 1971-09-07 | 1974-10-25 | Предприятие П/Я А-3103 | Устройство дл записи информации на термопластический носитель |
| SU447853A1 (ru) | 1972-12-01 | 1974-10-25 | Предприятие П/Я А-7306 | Устройство передачи и приема речевых сигналов |
| JPS6041077B2 (ja) * | 1976-09-06 | 1985-09-13 | 喜徳 喜谷 | 1,2‐ジアミノシクロヘキサン異性体のシス白金(2)錯体 |
| JP3137805B2 (ja) * | 1993-05-21 | 2001-02-26 | 三菱電機株式会社 | 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法 |
| JP3321971B2 (ja) * | 1994-03-10 | 2002-09-09 | ソニー株式会社 | 音声信号処理方法 |
| JP3062392B2 (ja) * | 1994-04-22 | 2000-07-10 | 株式会社河合楽器製作所 | 波形形成装置およびこの出力波形を用いた電子楽器 |
| IL114852A (en) * | 1994-08-08 | 2000-02-29 | Debiopharm Sa | Pharmaceutically stable preparation of oxaliplatinum |
| US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
| GB9512284D0 (en) | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
| US5864798A (en) * | 1995-09-18 | 1999-01-26 | Kabushiki Kaisha Toshiba | Method and apparatus for adjusting a spectrum shape of a speech signal |
| US5806025A (en) * | 1996-08-07 | 1998-09-08 | U S West, Inc. | Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank |
| SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
| US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
| GB9804013D0 (en) * | 1998-02-25 | 1998-04-22 | Sanofi Sa | Formulations |
| CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
| US7167828B2 (en) * | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
| JP3612260B2 (ja) * | 2000-02-29 | 2005-01-19 | 株式会社東芝 | 音声符号化方法及び装置並びに及び音声復号方法及び装置 |
| JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
| CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
| US6889182B2 (en) * | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
| US6937978B2 (en) * | 2001-10-30 | 2005-08-30 | Chungwa Telecom Co., Ltd. | Suppression system of background noise of speech signals and the method thereof |
| US6476068B1 (en) * | 2001-12-06 | 2002-11-05 | Pharmacia Italia, S.P.A. | Platinum derivative pharmaceutical formulations |
| CN101022790A (zh) * | 2003-08-28 | 2007-08-22 | 梅恩医药有限公司 | 含有酸的奥沙利铂制剂 |
-
2002
- 2002-05-31 CA CA002388352A patent/CA2388352A1/en not_active Abandoned
-
2003
- 2003-05-30 NZ NZ536237A patent/NZ536237A/en not_active IP Right Cessation
- 2003-05-30 BR BR0311314-0A patent/BR0311314A/pt active IP Right Grant
- 2003-05-30 DK DK03727092T patent/DK1509906T3/da active
- 2003-05-30 CA CA2483790A patent/CA2483790C/en not_active Expired - Lifetime
- 2003-05-30 JP JP2004509925A patent/JP4842538B2/ja not_active Expired - Lifetime
- 2003-05-30 ES ES03727092T patent/ES2309315T3/es not_active Expired - Lifetime
- 2003-05-30 RU RU2004138291/09A patent/RU2327230C2/ru active
- 2003-05-30 US US10/515,553 patent/US7529660B2/en not_active Expired - Lifetime
- 2003-05-30 MX MXPA04011845A patent/MXPA04011845A/es active IP Right Grant
- 2003-05-30 DE DE60321786T patent/DE60321786D1/de not_active Expired - Lifetime
- 2003-05-30 KR KR1020047019428A patent/KR101039343B1/ko not_active Expired - Lifetime
- 2003-05-30 CN CNB038125889A patent/CN100365706C/zh not_active Expired - Lifetime
- 2003-05-30 AU AU2003233722A patent/AU2003233722B2/en not_active Expired
- 2003-05-30 AT AT03727092T patent/ATE399361T1/de active
- 2003-05-30 BR BRPI0311314-0A patent/BRPI0311314B1/pt unknown
- 2003-05-30 PT PT03727092T patent/PT1509906E/pt unknown
- 2003-05-30 WO PCT/CA2003/000828 patent/WO2003102923A2/en not_active Ceased
- 2003-05-30 EP EP03727092A patent/EP1509906B1/en not_active Expired - Lifetime
- 2003-05-31 MY MYPI20032025A patent/MY140905A/en unknown
-
2004
- 2004-11-29 ZA ZA200409647A patent/ZA200409647B/en unknown
- 2004-12-30 NO NO20045717A patent/NO332045B1/no not_active IP Right Cessation
-
2008
- 2008-09-17 CY CY20081101002T patent/CY1110439T1/el unknown
Also Published As
| Publication number | Publication date |
|---|---|
| RU2004138291A (ru) | 2005-05-27 |
| ATE399361T1 (de) | 2008-07-15 |
| US7529660B2 (en) | 2009-05-05 |
| ZA200409647B (en) | 2006-06-28 |
| CN1659626A (zh) | 2005-08-24 |
| CY1110439T1 (el) | 2015-04-29 |
| CN100365706C (zh) | 2008-01-30 |
| EP1509906A2 (en) | 2005-03-02 |
| DE60321786D1 (de) | 2008-08-07 |
| NO20045717L (no) | 2004-12-30 |
| JP2005528647A (ja) | 2005-09-22 |
| RU2327230C2 (ru) | 2008-06-20 |
| CA2483790C (en) | 2011-12-20 |
| JP4842538B2 (ja) | 2011-12-21 |
| ES2309315T3 (es) | 2008-12-16 |
| EP1509906B1 (en) | 2008-06-25 |
| PT1509906E (pt) | 2008-11-13 |
| MXPA04011845A (es) | 2005-07-26 |
| US20050165603A1 (en) | 2005-07-28 |
| KR101039343B1 (ko) | 2011-06-08 |
| NO332045B1 (no) | 2012-06-11 |
| CA2483790A1 (en) | 2003-12-11 |
| MY140905A (en) | 2010-01-29 |
| BR0311314A (pt) | 2005-02-15 |
| DK1509906T3 (da) | 2008-10-20 |
| KR20050004897A (ko) | 2005-01-12 |
| HK1078978A1 (en) | 2006-03-24 |
| NZ536237A (en) | 2007-05-31 |
| WO2003102923A2 (en) | 2003-12-11 |
| WO2003102923A3 (en) | 2004-09-30 |
| CA2388352A1 (en) | 2003-11-30 |
| AU2003233722B2 (en) | 2009-06-04 |
| AU2003233722A1 (en) | 2003-12-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| BRPI0311314B1 (pt) | Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada | |
| EP1141946B1 (en) | Coded enhancement feature for improved performance in coding communication signals | |
| Chen et al. | Adaptive postfiltering for quality enhancement of coded speech | |
| US10269359B2 (en) | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal | |
| KR101344174B1 (ko) | 오디오 신호 처리 방법 및 오디오 디코더 장치 | |
| JP5149198B2 (ja) | 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス | |
| US7693710B2 (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs | |
| US10339946B2 (en) | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal | |
| RU2262748C2 (ru) | Многорежимное устройство кодирования | |
| JP3653826B2 (ja) | 音声復号化方法及び装置 | |
| KR101406742B1 (ko) | 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법 | |
| JP2004514182A (ja) | 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法 | |
| US9418671B2 (en) | Adaptive high-pass post-filter | |
| KR20220045260A (ko) | 음성 정보를 갖는 개선된 프레임 손실 보정 | |
| CN1650156A (zh) | 合成分析语音编码器中用于进行语音编码的方法和装置 | |
| JP2853170B2 (ja) | 音声符号化復号化方式 | |
| Wang | Low bit-rate vector excitation coding of phonetically classified speech | |
| Veeneman et al. | Enhancement of block-coded speech | |
| Yao | Low-delay speech coding | |
| How | Wideband speech and audio compression for wireless communications | |
| Ekeroth | Improvements of the voice activity detector in AMR-WB | |
| HK1078978B (en) | Method and device for pitch enhancement of decoded speech |