BRPI0311314B1 - Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada - Google Patents

Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada Download PDF

Info

Publication number
BRPI0311314B1
BRPI0311314B1 BRPI0311314-0A BRPI0311314A BRPI0311314B1 BR PI0311314 B1 BRPI0311314 B1 BR PI0311314B1 BR PI0311314 A BRPI0311314 A BR PI0311314A BR PI0311314 B1 BRPI0311314 B1 BR PI0311314B1
Authority
BR
Brazil
Prior art keywords
sound signal
decoded sound
decoded
signal
height
Prior art date
Application number
BRPI0311314-0A
Other languages
English (en)
Inventor
Bessette Bruno
Laflamme Claude
Jelinek Milan
Lefebvre Roch
Original Assignee
Voiceage Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=29589086&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0311314(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Voiceage Corporation filed Critical Voiceage Corporation
Publication of BRPI0311314B1 publication Critical patent/BRPI0311314B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Working-Up Tar And Pitch (AREA)
  • Inorganic Fibers (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

"método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada". a presente invenção refere-se a um método e dispositivo para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado, o sinal de som decodificado é dividido em uma pluralidade de sinais de freqüência de sub-banda e o processamento posterior é aplicado para pelo menos um dos sinais de freqüência de sub-banda. após o processamento posterior deste pelo menos um sinal de freqüência de sub-banda, os sinais de freqüência de sub-banda podem ser adicionados para produzir um sinal de som de saída decodificado processado posteriormente. desta maneira, o processamento posterior pode ser localizado para uma sub-banda ou para sub-bandas desejadas deixando outras sub-bandas virtualmente inalteradas.

Description

(54) Título: MÉTODO E DISPOSITIVO PARA APERFEIÇOAMENTO DA ALTURA DE SOM SELETIVO POR FREQÜÊNCIA DE FALA SINTETIZADA (51) Int.CI.: G10L 21/0364; G10L 21/0232 (52) CPC: G10L 21/0364,G10L 21/0232 (30) Prioridade Unionista: 31/05/2002 CA 2,388,352 (73) Titular(es): VOICEAGE CORPORATION (72) Inventor(es): BRUNO BESSETTE; CLAUDE LAFLAMME; MILAN JELINEK; ROCH LEFEBVRE
1/27
Relatório Descritivo da Patente de Invenção para MÉTODO E DISPOSITIVO PARA APERFEIÇOAMENTO DA ALTURA DE SOM SELETIVO POR FREQUÊNCIA DE FALA SINTETIZADA.
Antecedentes da Invenção
1. Campo da invenção:
[001] A presente invenção refere-se a um método e dispositivo para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado.
[002] Este método e dispositivo de processamento posterior podem ser aplicados, em particular mas não de forma exclusiva, à codificação digital de sinais de som (incluindo fala). Por exemplo, este método e dispositivo de processamento posterior também podem ser aplicados ao caso mais geral de aperfeiçoamento de sinal onde a fonte de ruído pode ser a partir de qualquer meio ou sistema, não necessariamente relacionado ao ruído de codificação ou de quantização.
2. Breve descrição da tecnologia atual:
2.1 Codificadores de fala [003] Os codificadores de fala são amplamente utilizados nos sistemas de comunicações digitais para de forma eficiente transmitir e / ou armazenar sinais de fala. Nos sistemas digitais, o sinal de fala de entrada analógico são primeiro amostrados em uma taxa de amostra apropriada e as amostras de fala sucessivas são adicionalmente processadas no domínio digital. Em particular, um codificador de fala recebe as amostras de fala como uma entrada e gera um fluxo de bits de saída comprimido para ser transmitido através de um canal ou armazenado em um meio de armazenamento apropriado. No receptor, um decodificador de fala recebe o fluxo de bits como uma entrada e produz um sinal de fala reconstruído de saída.
[004] Para ser útil, um codificador de fala deve produzir um fluxo
Petição 870170072504, de 27/09/2017, pág. 21/63
2/27 de bits comprimido com uma taxa de bits menor do que a taxa de bits do sinal de fala de entrada digital, amostrado. Os codificadores de fala do estado da técnica tipicamente alcançam uma taxa de compactação de pelo menos 16 até 1 e ainda permitem a decodificação de fala de alta qualidade. Vários destes codificadores de fala do estado da técnica são baseados no modelo CELP (Previsão Linear de Código Estimulado), com diferentes variantes, dependendo do algoritmo.
[005] Na codificação CELP, o sinal de fala digital é processado em blocos sucessivos de amostras de fala chamados quadros. Para cada quadro, o codificador extrai a partir das amostras de fala digitais uma série de parâmetros que são digitalmente codificados e então transmitidos e / ou armazenados. O decodificador é projetado para processar os parâmetros recebidos para reconstruir ou sintetizar o dado quadro do sinal de fala. Tipicamente, os seguintes parâmetros são extraídos a partir das amostras de fala digitais por um codificador CELP:
- Coeficientes de Previsão Linear (coeficientes LP), transmitidos em um domínio transformado tal como as Frequências Espectrais de Linha (LSF) ou Frequências de Emissão de Espectro (ISF);
- Parâmetros de altura de som, incluindo um atraso de altura de som (ou retardo) e um ganho de altura de som; e
- Parâmetros de excitação inovadores (índice e ganho de livro de código fixo).
[006] Os parâmetros de altura de som e os parâmetros de excitação inovadores juntos descrevem o que é chamado de sinal de excitação. Este sinal de excitação é fornecido como uma entrada para um filtro de Previsão Linear (LP) descrito pelos coeficientes LP. O filtro LP pode ser visto como um modelo do trato vocal, ao passo que o sinal de excitação pode ser visto como a saída da glote. Os coeficientes LP ou
Petição 870170072504, de 27/09/2017, pág. 22/63
3/27
LSF são tipicamente calculados e transmitidos em todos os quadros, ao passo que os parâmetros de altura de som e de excitação inovadora são calculados e transmitidos várias vezes por quadro. De forma mais específica, cada quadro é dividido em vários blocos de sinal denominados subquadros e os parâmetros de altura de som e os parâmetros de excitação inovadora são calculados e transmitidos em cada subquadro. Cada quadro tipicamente possui uma duração de 10 até 30 milissegundos, ao passo que um subquadro tipicamente possui uma duração de 5 milissegundos.
[007] Vários padrões de codificação de fala são baseados no modelo CELP Algébrico (ACELP) e de forma mais precisa no algoritmo ACELP. Uma dentre as principais características do ACELP é o uso de livros de código algébricos para codificar a excitação inovadora em cada subquadro. Um livro de código algébrico divide um subquadro em um conjunto de trilhas de posições de pulso intercaladas. Somente poucos pulsos por trilha de amplitude diferente de zero são permitidos e cada pulso de amplitude diferente de zero é restrito às posições da trilha correspondente. O codificador utiliza algoritmos de busca rápida para encontrar as posições e amplitudes ótimas de pulso para os pulsos de cada subquadro. Uma descrição do algoritmo ACELP pode ser encontrada no artigo de R. SALAMI et al., Design and description of CS-ACELP: a toll quality 8kb/s speech coder, IEEE Trans. On Speech and Audio Proc., Vol. 6, No. 2, páginas 116 à 130, Março de 1998, aqui dentro incorporado por referência e o qual descreve o algoritmo de codificação de fala de banda estreita ITU-T G.729 CS-ACELP em 8 kbits / segundo. Deve ser notado que existem várias variações da busca de livro de código de inovação ACELP, dependendo do padrão de conceito. A presente invenção não é dependente destas variações, desde que ela somente se aplica ao processamento posterior do sinal de fala decodificado (sintetizado).
Petição 870170072504, de 27/09/2017, pág. 23/63
4/27 [008] Um padrão recente baseado no algoritmo ACELP é o algoritmo de codificação de fala ETSI/3GPP AMR-WB, o qual também foi adotado pelo ITU-T (Setor de Padronização de Telecomunicação da ITU (União Internacional de Telecomunicação)) como recomendação G.722.2 [ Recomendação ITU-T G.722.2 Wideband coding of speech at around 16 kbits/s using Adaptive Multi-Rate Wideband (AMR-WB), Geneva, 2002], [3GPP TS 26.190, AMR Wideband Speech Codec: Transcoding Functions, Especificação Técnica 3GPP]. O AMR-WB é um algoritmo de múltiplas taxas projetado para operar em nove diferentes taxas de bits entre 6,6 e 23,85 kbits/segundo. Aqueles versados na técnica sabem que a qualidade de fala decodificada geralmente aumenta com a taxa de bits. O AMR-WB tem sido projetado para permitir aos sistemas de comunicação de celular reduzirem a taxa de bits do codificador de fala no caso de condições ruins de canal; os bits são convertidos em bits de codificação de canal para aumentar a proteção dos bits transmitidos. Desta maneira, a qualidade geral dos bits transmitidos pode ser mantida maior do que no caso onde o codificador de fala opera em uma taxa única de bit fixa.
[009] A Figura 7 é um diagrama de bloco esquemático apresentando o princípio do decodificador AMR-WB. De forma mais específica, a Figura 7 é uma representação de alto nível do decodificador, enfatizando o fato de que o fluxo de bits recebido codifica o sinal de fala somente até 6,4 kHz (frequência de amostra de 12,8 kHz) e as frequências maiores do que 6,4 kHz são sintetizadas no decodificador a partir dos parâmetros de banda inferior. Isto implica em que, no codificador, o sinal de fala amostrado em 16 kHz de banda larga original foi primeiro amostrado para baixo para a frequência de amostra de 12,8 kHz, utilizando técnicas de conversão de múltiplas taxas bem conhecidas para aqueles versados na técnica. O decodificador de parâmetro 701 e o decodificador de fala 702 da Figura 7 são análogos em relação ao
Petição 870170072504, de 27/09/2017, pág. 24/63
5/27 decodificador de parâmetro 106 e o decodificador fonte 107 da Figura 1. O fluxo de bits recebido 709 é primeiro decodificado pelo decodificador de parâmetro 701 para recuperar os parâmetros 710 fornecidos para o decodificador de fala 702 para ressintetizar novamente o sinal de fala. No caso específico do decodificador AMR-WB, estes parâmetros são:
- Coeficientes ISF para cada quadro de 20 milissegundos;
- Um atraso de altura de som inteiro T0, um valor de altura de som fracionário T0_frac ao redor de T0 e um ganho de altura de som para cada subquadro de 5 milissegundos; e
- Um formato de livro de código algébrico (posições e sinais de pulso) e ganho para cada subquadro de 5 milissegundos.
[0010] A partir dos parâmetros 710, o decodificador de fala 702 é projetado para sintetizar um dado quadro de sinal de fala para frequências iguais e inferiores à 6,4 kHz e deste modo produzir um sinal de fala sintetizado de banda baixa 712 na frequência de amostra de 12,8 kHz. Para recuperar o sinal de banda completo correspondendo à frequência de amostra de 16 kHz, o decodificador AMR-WB compreende um processador de ressíntese de banda alta 707 responsivo aos parâmetros decodificados 710 a partir do decodificador de parâmetro 701 para sintetizar novamente um sinal de banda alta 711 na frequência de amostra de 16kHz. Os detalhes do processador de ressíntese de sinal de banda alta 707 podem ser encontrados nas publicações seguintes que são aqui dentro incorporadas por referência:
- Recomendação ITU-T G.722.2 Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMRWB), Geneva, 2002; e
- 3GPP TS 26.190, AMR Wideband Speech Codec: Transcoding Functions, 3GPP Technical Specification.
[0011] A saída do processador de ressíntese de banda alta 707,
Petição 870170072504, de 27/09/2017, pág. 25/63
6/27 referida como o sinal de banda alta 711 da Figura 7 é um sinal na frequência de amostra de 16 kHz, possuindo uma energia concentrada acima de 6,4 kHz. O processador 708 soma o sinal de banda alta 711 com um sinal de fala de banda baixa amostrado para cima de 16-kHz 713 para formar o sinal de fala decodificado completo 714 do decodificador AMR-WB na frequência de amostra de 16 kHz.
2.2 Necessidade de processamento posterior [0012] Sempre que um codificador de fala é utilizado em um sistema de comunicação, o sinal sintetizado ou decodificado nunca é idêntico ao sinal de fala original mesmo na ausência de erros de transmissão. Quanto maior a taxa de compactação, maior a distorção introduzida pelo codificador. Esta distorção pode ser feita subjetivamente pequena utilizando diferentes maneiras de se abordar. Uma primeira maneira de se abordar é condicionar o sinal no codificador para melhor descrever, ou codificar, informação subjetivamente relevante no sinal de fala. O uso de um filtro de ponderação formante, geralmente representado como W(z) é um exemplo amplamente utilizado desta primeira maneira de se abordar [B, Kleijn e K. Paliwal editores, «Speech Coding and Synthesis, » Elsevier, 1995]. Este filtro W(z) é tipicamente feito adaptável e é calculado de modo tal que ele reduz a energia do sinal próxima aos formantes espectrais, deste modo aumentando a energia relativa das bandas de energia inferiores. O codificador pode então melhor quantizar bandas de energia inferior, o que de outro modo seria mascarado pelo ruído de codificação, aumentando a distorção percebida. Outro exemplo de condicionamento de sinal no codificador é o então denominado filtro de aguçamento de altura de som, o qual aperfeiçoa a estrutura harmônica do sinal de excitação no codificador. O aguçamento da altura de som almeja assegurar que o nível de ruído inter-harmônico seja mantido baixo o suficiente no senso de percepção.
Petição 870170072504, de 27/09/2017, pág. 26/63
7/27 [0013] Uma segunda maneira de se abordar para minimizar a distorção percebida introduzida por um codificador de fala é aplicar um então denominado algoritmo de processamento posterior. O processamento posterior é aplicado no decodificador, como apresentado na Figura 1. Na Figura 1, o codificador de fala 101 e o decodificador de fala 105 são divididos em dois módulos. No caso do codificador de fala 101, um codificador fonte 102 produz uma série de parâmetros de codificação de fala 109 para serem transmitidos ou armazenados. Estes parâmetros 109 são então codificados em binário pelo codificador de parâmetro 103 utilizando um método de codificação específico, dependendo do algoritmo de codificação de fala e dos parâmetros a serem codificados. O sinal de fala codificado (parâmetros codificados em binário) 110 é então transmitido para o decodificador através de um canal de comunicação 104. No decodificador, o fluxo de bits recebido 111 é primeiro analisado por um decodificador de parâmetro 106 para decodificar os parâmetros de codificação do sinal de som codificados, recebidos, os quais são então utilizados pelo decodificador fonte 107 para gerar o sinal de fala sintetizado 112. O objetivo do processamento posterior (ver processador posterior 108 da Figura 1) é para aperfeiçoar a informação de forma perceptiva relevante no sinal de fala sintetizado, ou de forma equivalente para reduzir ou remover a informação de forma perceptiva importuna. Duas formas comumente utilizadas de processamento posterior são o processamento posterior formante e o processamento posterior de altura de som. No primeiro caso, a estrutura formante do sinal de fala sintetizado é amplificada pelo uso de um filtro adaptável com uma resposta de frequência correlacionada com os formantes de fala. Os picos espectrais do sinal de fala sintetizado são então acentuados à custa dos vales espectrais cuja energia relativa se torna menor. No caso do processamento posterior de altura de som, um filtro adaptável também é aplicado para o sinal de fala sintetizado.
Petição 870170072504, de 27/09/2017, pág. 27/63
8/27
Entretanto, neste caso a resposta de frequência do filtro é correlacionada com a estrutura espectral fina, a saber, os harmônicos. Um filtro posterior de altura de som então acentua os harmônicos à custa da energia inter-harmônica, a qual se torna relativamente menor. Observe que a resposta de frequência de um filtro posterior de altura de som tipicamente abrange toda a faixa de frequência. O impacto é que uma estrutura harmônica é imposta na fala processada posteriormente mesmo em bandas de frequência que não exibem uma estrutura harmônica na fala decodificada. Esta não é uma maneira de se abordar de forma perceptiva ótima para a fala de banda larga (fala amostrada em 16 kHz), a qual raramente exibe uma estrutura periódica em toda a faixa de frequência.
Sumário da Invenção [0014] A presente invenção refere-se a um método para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado, compreendendo dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda e aplicar o processamento posterior para pelo um dos sinais de frequência de sub-banda, mas não para todos os sinais de frequência de sub-banda.
[0015] A presente invenção também envolve um dispositivo para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado, compreendendo dispositivo para dividir o sinal de som codificado em uma pluralidade de sinais de frequência de sub-banda e dispositivos para processar posteriormente pelo menos um dos sinais de frequência de sub-banda, mas não todos sinais de frequência de sub-banda. [0016] De acordo com uma modalidade ilustrativa, após o processamento posterior de pelo menos um sinal de sub-banda de frequência mencionado acima, os sinais de frequência de sub-banda são somaPetição 870170072504, de 27/09/2017, pág. 28/63
9/27 dos para produzir um sinal de som de saída decodificado processado posteriormente.
[0017] Por conseqüência, o método e dispositivo de processamento posterior tornam possível localizar o processamento posterior nas sub-bandas desejadas e deixar virtualmente inalteradas outras subbandas.
[0018] A presente invenção adicionalmente refere-se a um decodificador de sinal de som compreendendo uma entrada para receber um sinal de som codificado, um decodificador de parâmetro fornecido com o sinal de som codificado para decodificar os parâmetros de codificação de sinal de som, um decodificador de sinal de som fornecido com os parâmetros de codificação de sinal de som decodificados para produzir um sinal de som decodificado e um dispositivo de processamento posterior como descrito acima para processar posteriormente o sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado.
[0019] O dito acima e outros objetivos, vantagens e características da presente invenção irão se tornar mais aparentes quando da leitura da descrição não restritiva seguinte das modalidades ilustrativas da mesma, somente dadas à título de exemplo com referência aos desenhos acompanhantes.
Breve Descrição dos Desenhos nos desenhos anexos:
[0020] A Figura 1 é um diagrama de bloco esquemático da estrutura de alto nível de um exemplo de um sistema codificador / decodificador de fala utilizando processamento posterior no decodificador;
[0021] A Figura 2 é um diagrama de bloco esquemático apresentando o princípio geral de uma modalidade ilustrativa da presente invenção utilizando um banco de filtros adaptáveis e filtros de sub-banda, no qual a entrada dos filtros adaptáveis é o sinal (linha sólida) de fala
Petição 870170072504, de 27/09/2017, pág. 29/63
10/27 decodificado (sintetizado) e os parâmetros decodificados (linha pontilhada);
[0022] A Figura 3 é um diagrama de bloco esquemático de um aperfeiçoador de altura de som de duas bandas, o que constitui um caso especial da modalidade ilustrativa da Figura 2;
[0023] A Figura 4 é um diagrama de bloco esquemático de uma modalidade ilustrativa da presente invenção, como aplicado para o caso especial do decodificador de fala de banda larga AMR-WB;
[0024] A Figura 5 é um diagrama de bloco esquemático de uma implementação alternativa da modalidade ilustrativa da Figura 4;
[0025] A Figura 6a é um gráfico ilustrando um exemplo de espectro e de um sinal processado anteriormente;
[0026] A Figura 6b é um gráfico ilustrando um exemplo de espectro do sinal processado posteriormente obtido quando utilizando o método descrito na Figura 3;
[0027] A Figura 7 é um diagrama de bloco esquemático apresentando o princípio da operação do decodificador 3GPP AMR-WB;
[0028] As Figuras 8a e 8b são gráficos apresentando um exemplo da resposta de frequência de um filtro aperfeiçoador de altura de som como descrito pela Equação (1), com o caso especial de um período de altura de som de T=10 amostras;
[0029] A Figura 9a é um gráfico apresentando um exemplo de resposta de frequência para o filtro de banda baixa 404 da Figura 4;
[0030] A Figura 9b é um gráfico apresentando um exemplo de resposta de frequência para o filtro de banda de passagem 407 da Figura 4;
[0031] A Figura 9c é um gráfico apresentando um exemplo de resposta de frequência combinada para o filtro de banda baixa 404 e para os filtros de banda de passagem 407 da Figura 4; e [0032] A Figura 10 é um gráfico apresentando um exemplo da resPetição 870170072504, de 27/09/2017, pág. 30/63
11/27 posta de frequência de um filtro inter-harmônico como descrito pela Equação (2) e utilizada no filtro inter-harmônico 503 da Figura 5, para o caso específico de T = 10 amostras.
Descrição Detalhada das Modalidades Ilustrativas [0033] A Figura 2 é um diagrama de bloco esquemático ilustrando o princípio geral de uma modalidade ilustrativa da presente invenção. [0034] Na Figura 1, o sinal de entrada (sinal no qual o processamento posterior é aplicado) é o sinal de fala decodificado (sintetizado)
112 produzido pelo decodificador de fala 105 (Figura 1) no receptor de um sistema de comunicações (saída do decodificador fonte 107 da Figura 1). O objetivo é produzir um sinal de fala decodificado processado posteriormente na saída 113 do processador posterior 108 da Figura 1 (o qual também é a saída do processador 203 da Figura 2) com qualidade percebida aperfeiçoada. Isto é alcançado por se primeiro aplicar pelo menos uma e possivelmente mais do que uma, operação de filtragem adaptável para o sinal de entrada 112 (ver filtros adaptáveis 201a, 201b,.., 201N). Estes filtros adaptáveis serão descritos na descrição seguinte. Deve ser salientado aqui que alguns dos filtros adaptáveis 201a até 201N podem ser funções triviais, quando requeridas, por exemplo com a saída igual à entrada. A saída 204a, 204b,..., 204N de cada filtro adaptável 201a, 201b,..., 201N é então filtrada por banda de passagem através de um filtro de sub-banda 202a, 202b,..., 202N, respectivamente e o sinal de fala decodificado processado posteriormente
113 é obtido por adicionar através de um processador 203 as saídas resultantes respectivas 205a, 205b,..., 205N dos filtros de sub-banda 202a, 202b,..., 202N.
[0035] Em uma modalidade ilustrativa, uma decomposição de duas bandas é utilizada e a filtragem adaptável é aplicada somente para a banda inferior. Isto resulta em um processamento posterior total que é mais almejado e frequências próximas aos primeiros harmônicos do
Petição 870170072504, de 27/09/2017, pág. 31/63
12/27 sinal de fala sintetizado.
[0036] A Figura 3 é um diagrama de bloco esquemático de um aperfeiçoador de altura de som de duas bandas, o qual constitui um caso especial da modalidade ilustrativa da Figura 2. De forma mais específica, a Figura 3 apresenta as funções básicas de um processador posterior de duas bandas (ver o processador posterior 108 da Figura 1). De acordo com esta modalidade ilustrativa, somente o aperfeiçoamento de altura de som é considerado como processamento posterior, apesar de outros tipos de que processamento posterior poderiam ser contemplados. Na Figura 3, o sinal de fala decodificado (assumido para ser a saída 112 do decodificador 107 da Figura 1) é fornecido através de um par de sub-ramificações 308 e 309.
[0037] Na ramificação superior 308, o sinal de fala decodificado 112 é filtrado por um filtro de banda alta 301 para produzir o sinal de banda superior 310 (sH). Neste exemplo específico, nenhum filtro adaptável é utilizado na ramificação superior. Na ramificação inferior 309, o sinal de fala decodificado 112 é primeiro processado através de um filtro adaptável 307 compreendendo um filtro de banda baixa opcional 302, um módulo de rastreamento de altura de som 303 e um aperfeiçoador de altura de som 304 e então filtrado através de um filtro de banda baixa 305 para obter o sinal processado posteriormente de banda inferior 311 (slef). O sinal de fala decodificado processado posteriormente 113 é obtido por adicionar através de um adicionador 306 os sinais processados posteriormente de banda inferior 311 e superior 312 a partir da saída do filtro de banda baixa 305 e do filtro de banda alta 301, respectivamente. Deve ser salientado que os filtros de banda baixa 305 e de banda alta 301 poderiam ser de vários tipos diferentes, por exemplo, Resposta de Impulso Infinita (UR) ou Resposta de Impulso Finita (FIR). Nesta modalidade ilustrativa, os filtros FIR de fase linear são utilizados.
Petição 870170072504, de 27/09/2017, pág. 32/63
13/27 [0038] Portanto, o filtro adaptável 307 da Figura 3 é composto de dois e possivelmente de três processadores, o filtro de banda baixa opcional 302 similar em relação ao filtro de banda baixa 305, o módulo de rastreamento de altura de som 303 e o aperfeiçoador de altura de som 304.
[0039] O filtro de banda baixa 302 pode ser omitido, mas ele é incluído para permitir a visualização do processamento posterior da Figura 3 como uma decomposição de duas bandas seguida pela filtragem específica em cada sub-banda. Após a filtragem de banda baixa opcional (filtro 302) do sinal de fala decodificado 112 na banda inferior, o sinal resultante Sl é processado através do aperfeiçoador de altura de som 304. O objetivo do aperfeiçoador de altura de som 304 é reduzir o ruído inter-harmônico no sinal de fala decodificado. Na modalidade ilustrativa presente, o aperfeiçoador de altura de som 304 é alcançado por um filtro linear de tempo variante descrito pela seguinte equação:
*n}=(,4,+rB (1) onde a é um coeficiente que controla a atenuação inter-harmônica, T é o período de altura de som do sinal de entrada x[n], e y[n] é o sinal de saída do aperfeiçoador de altura de som. Uma equação mais geral também poderia ser utilizada onde as derivações do filtro em n-T e n+T poderiam ser em atrasos diferentes (por exemplo, n-T1 e n+T2). Os parâmetros T e a variam com o tempo e são dados pelo módulo de rastreamento de altura de som 303. Com um valor de a = 1, o ganho do filtro descrito pela Equação (1) é exatamente 0 em frequências 1/(2T),3/(2T), 5/(2T), etc., isto é, no ponto médio entre as frequências harmônicas 1/T, 3/T, 5/T, etc. Quando a aproxima-se de 0, a atenuação entre os harmônicos produzidos pelo filtro da Equação (1) reduzse. Com um valor de a = 0, a saída do filtro é igual à sua entrada. A
Petição 870170072504, de 27/09/2017, pág. 33/63
14/27
Figura 8 apresenta a resposta de frequência (em dB) do filtro descrito pela Equação (1) para os valores a = 0,8 e 1, quando o atraso de altura de som é (arbitrariamente) estabelecido em um valor de T = 10 amostras. O valor de a pode ser calculado utilizando várias maneiras de se abordar. Por exemplo, a correlação de altura de som normalizada, a qual é bem conhecida por aqueles versados na técnica, pode ser utilizada para controlar o coeficiente a: quanto maior a correlação de altura de som normalizada (quanto mais próximo de 1 ela estiver), maior o valor de a. Um sinal periódico x[n] com um período de T = 10 amostras teria harmônicos no máximo das respostas de frequência da Figura 8, isto é, em frequências normalizadas 0,2, 0,4, etc. É fácil entender a partir da Figura 8 que o aperfeiçoador de altura de som da Equação (1) atenuaria a energia de sinal somente entre seus harmônicos e que os componentes harmônicos não seriam alterados pelo filtro. A Figura 8 também apresenta que variar o parâmetro a permite o controle da quantidade de atenuação inter-harmônica proporcionada pelo filtro da Equação (1). Observe que a resposta de frequência do filtro da Equação (1), apresentada na Figura 8, estende-se para todas as frequências do espectro.
[0040] Desde que o período de altura de som de um sinal de fala varie com o tempo, o valor de altura de som T do aperfeiçoador de altura de som 304 por conseqüência tem que variar. O módulo de rastreamento de altura de som 303 é responsável por proporcionar o valor de altura de som adequado T para o aperfeiçoador de altura de som 304, para cada quadro do sinal de fala decodificado que tem que ser processado. Para este propósito, o módulo de rastreamento de altura de som 303 recebe como entrada não somente as amostras de fala decodificadas mas também os parâmetros decodificados 114 a partir do decodificador de parâmetro 106 da Figura 1.
[0041] Desde que um codificador de fala típico extraia, para cada
Petição 870170072504, de 27/09/2017, pág. 34/63
15/27 subquadro de fala, um atraso de altura de som que nós chamamos de To e possivelmente um valor fracionário Tü_frac utilizado para interpolar a contribuição de livro de código adaptável para a resolução de amostra fracionária, o módulo de rastreamento de altura de som 303 pode então utilizar este atraso de altura de som decodificado para focalizar o rastreamento de altura de som no decodificador. Uma possibilidade é utilizar T0 e T0_frac diretamente no aperfeiçoador de altura de som 304, explorando o fato de que o codificador já executou o rastreamento de altura de som. Outra possibilidade, utilizada nesta modalidade ilustrativa, é recalcular o rastreamento de altura de som no decodificador focalizando nos valores ao redor e nos múltiplos ou submúltiplos do valor de altura de som decodificado T0. O módulo de rastreamento de altura de som 303 então proporciona um atraso de altura de som T para o aperfeiçoador de altura de som 304, o qual utiliza este valor de T na Equação (1) para o quadro presente do sinal de fala decodificado. A saída é o sinal sLE.
[0042] O sinal aperfeiçoado de altura de som sLE é então filtrado por banda baixa através do filtro 305 para isolar as frequências baixas do sinal aperfeiçoado de altura de som sle e para remover os componentes de alta frequência que surgem quando o filtro aperfeiçoador de altura de som da Equação (1) é variado com o tempo, de acordo com o atraso de altura de som T, nos limites de quadro de fala decodificado. Isto produz o sinal processado posteriormente de banda inferior slef, o qual pode agora ser adicionado ao sinal de banda superior sH no adicionador 306. O resultado é o sinal de fala decodificado processado posteriormente 113, com ruído inter-harmônico reduzido na banda inferior. A banda de frequência onde o aperfeiçoamento de altura de som será aplicado depende da frequência de interrupção do filtro de banda baixa 305 (e opcionalmente no filtro de banda baixa 302).
[0043] As Figuras 6a e 6b apresentam um espectro de sinal ilustraPetição 870170072504, de 27/09/2017, pág. 35/63
16/27 tivo ilustrando o efeito do processamento posterior descrito na Figura
3. A Figura 6a é o espectro do sinal de entrada 112 do processador posterior 108 da Figura 1 (sinal de fala decodificado 112 na Figura 3). Neste exemplo ilustrativo, o sinal de entrada é composto de 20 harmônicos, com frequência fundamental fü = 373 Hz escolhida de forma arbitrária, com componentes «ruidosos» adicionados em frequências fo/2, 3fo/2 e 5fo/2. Estes três componentes ruidosos podem ser vistos entre os harmônicos de frequência baixa na Figura 6a. A frequência de amostra é assumida de ser 16 kHz neste exemplo. O aperfeiçoador de altura de som de duas bandas apresentado na Figura 3 e descrito acima é então aplicado ao sinal da Figura 6a. Com uma frequência de amostra de 16 kHz e um sinal periódico de frequência fundamental igual à 373 Hz como na Figura 6a, o módulo de rastreamento de altura de som 303 deve encontrar um período de T = 16000/373 » 43 amostras. Este é o valor que foi utilizado para o filtro aperfeiçoador de altura de som da Equação (1), aplicado para o aperfeiçoador de altura do som 304 da Figura 3. Um valor de a = 0,5 também foi utilizado. Os filtros de banda baixa 305 e de banda alta 301 são filtros FIR de fase linear, simétricos, com 31 derivações. A frequência de interrupção para este exemplo é escolhida como 2000 Hz. Estes valores específicos são dados somente como um exemplo ilustrativo.
[0044] O sinal de fala decodificado processado posteriormente 113 na saída do adicionador 306 possui um espectro apresentado na Figura 6b. Pode ser visto que os sinusóides inter-harmônicos na Figura 6a foram completamente removidos, enquanto os harmônicos do sinal foram praticamente inalterados. Também é observado que o efeito do aperfeiçoador de altura de som diminui à medida que a frequência aproxima-se da frequência de interrupção do filtro da banda baixa (2000 Hz neste exemplo). Então, somente a banda inferior é afetada pelo processamento posterior. Esta é uma característica chave desta
Petição 870170072504, de 27/09/2017, pág. 36/63
17/27 modalidade ilustrativa da presente invenção. Por variar as frequências de interrupção do filtro de banda baixa opcional 302, do filtro de banda baixa 305 e do filtro de banda alta 301, é possível controlar para qual frequência o aperfeiçoamento de altura de som é aplicado.
Aplicação para o decodificador de fala AMR-WB [0045] A presente invenção pode ser aplicada para qualquer sinal de fala sintetizado por um decodificador de fala, ou mesmo para qualquer sinal de fala corrompido por ruído inter-harmônico que precisa ser reduzido. Esta seção irá apresentar uma implementação ilustrativa específica da presente invenção para um sinal de fala decodificado AMRWB. O processamento posterior é aplicado para o sinal de fala sintetizado de banda baixa 712 da Figura 7, isto é, para a saída do decodificador de fala 702, o que produz uma fala sintetizada em uma frequência de amostragem de 12,8 kHz.
[0046] A Figura 4 apresenta o diagrama de bloco de um processador posterior de altura de som quando o sinal de entrada é um sinal de fala sintetizado de banda baixa AMR-WB na frequência de amostragem de 12,8 kHz. De forma mais precisa, o processador posterior apresentado na Figura 4 substitui a unidade de amostragem para cima 703, a qual compreende os processadores 704, 705 e 706. O processador posterior de altura de som da Figura 4 também poderia ser aplicado para o sinal de fala sintetizado amostrado para cima de 16 kHz, mas aplicá-lo para a amostragem para cima reduz o número de operações de filtragem no decodificador e assim reduz a complexidade. [0047] O sinal de entrada (fala sintetizada de banda baixa AMRWB (12,8 kHz)) da Figura 4 é designado como o sinal s. Neste exemplo específico, o sinal s é o sinal de fala sintetizado de banda baixa AMR-WB na frequência de amostragem de 12,8 kHz (saída do processador 702). O processador posterior da altura de som da Figura 4 compreende um módulo de rastreamento de altura de som 401 para
Petição 870170072504, de 27/09/2017, pág. 37/63
18/27 determinar, para cada subquadro de 5 milissegundos, o atraso de altura de som T utilizando os parâmetros decodificados, recebidos 114 (Figura 1) e o sinal de fala sintetizado s. Os parâmetros decodificados utilizados pelo módulo de rastreamento de altura de som são T0, o valor de altura de som inteiro para o subquadro e T0_frac, o valor de altura de som fracionário para a resolução de subamostra. O atraso de altura de som T calculado no módulo de rastreamento de altura de som 401 será utilizado nas próximas etapas para aperfeiçoamento da altura de som. Seria possível utilizar diretamente os parâmetros de altura de som decodificados, recebidos T0 e T0_frac para formar o atraso T utilizado pelo aperfeiçoador de altura de som no filtro de altura do som 402. Entretanto, o módulo de rastreamento de altura de som 401 é capaz de corrigir múltiplos ou submúltiplos de altura de som, o que poderia ter um efeito prejudicial no aperfeiçoamento da altura de som.
[0048] Uma modalidade ilustrativa do algoritmo de rastreamento de altura de som para o módulo 401 é o que se segue (os valores rastreados de altura de som e de limiares específicos são dados somente à título de exemplo):
- Em primeiro lugar, a informação de altura de som decodificada (atraso de altura de som T0) é comparada com um valor armazenado do atraso de altura de som decodificado T_prev do quadro anterior. O T_prev pode ter sido modificado por algumas das seguintes etapas de acordo com o algoritmo de rastreamento de altura de som. Por exemplo, se T0 < 1,16*T_prev então vá para caso 1 abaixo, senão se T0 > 1,16*T_prev, então estabeleça T_temp = T0 e vá para caso 2 abaixo.
[0049] Caso 1: Em primeiro lugar, calcular a correlação cruzada C2 (produto cruzado) entre o último subquadro sintetizado e o sinal de síntese iniciando em T0/2 amostras antes do começo do último subquadro (observe a correlação na metade do valor de altura de som
Petição 870170072504, de 27/09/2017, pág. 38/63
19/27 decodificado).
[0050] Então, calcular a correlação cruzada C3 (produto cruzado) entre o último subquadro sintetizado e o sinal de síntese iniciando em T0/3 amostras antes do começo do último subquadro (observe a correlação em um terço do valor de altura de som decodificado).
[0051] Então, selecione o valor máximo entre C2 e C3 e calcule a correlação normalizada Cn (versão normalizada de C2 ou C3) no submúltiplo correspondente de T0 (em T0/2 se C2 > C3 e em T0/3 se C3 > C2). Chamar T_new, o submúltiplo de altura de som correspondendo à maior correlação normalizada.
[0052] Se Cn > 0,95 (correlação normalizada forte), o novo período de altura de som é T_new (ao invés de T0). Emitir o valor T = T_new a partir do módulo de rastreamento de altura de som 401. Salvar T_prev = T para o próximo rastreamento de altura de som do subquadro e sair do módulo de rastreamento de altura de som 401.
[0053] Se 0,7 < Cn < 0,95, então salvar T_temp = T0/2 ou T0/3 (de acordo com C2 ou C3 acima) para comparações no caso 2 abaixo. Senão, se Cn < 0,7 salvar T_temp = T0.
[0054] Caso 2: Calcular todos os valores possíveis na taxa Tn = [T_temp/n], onde [x] significa a parte inteira de x e n = 1,2,3, etc. é um inteiro.
[0055] Calcular todos as correlações cruzadas Cn nos submúltiplos de atraso de altura de som Tn. Reter Cn_max como a correlação cruzada máxima dentre todos os Cn. Se n > 1 e Cn > 0,8, emitir Tn como a saída do período de altura de som T da unidade de rastreamento de altura de som 401. Senão, emitir T1 = T_temp. Aqui, o valor de T_temp irá depender dos cálculos no Caso 1 acima.
[0056] Deve ser notado que o exemplo acima do módulo de rastreamento de altura de som 401 é dado para propósito somente de ilustração. Qualquer outro método ou dispositivo de rastreamento de
Petição 870170072504, de 27/09/2017, pág. 39/63
20/27 altura de som poderia ser implementado no módulo 401 (ou 303 e 502) para garantir um melhor rastreamento de altura de som no decodificador.
[0057] Portanto, a saída do módulo de rastreamento de altura de som é o período T a ser utilizado no filtro de altura de som 402, o qual é descrito nesta modalidade preferida pelo filtro da Equação (1). Novamente, um valor de a = 0 implica em nenhuma filtragem (a saída do filtro de altura de som 402 é igual à sua entrada) e um valor de a = 1 corresponde à maior quantidade de aperfeiçoamento de altura de som. [0058] Uma vez que o sinal aperfeiçoado Se (Figura 4) é determinado, ele é combinado com o sinal de entrada s de modo que, como na Figura 3, somente a banda inferior seja sujeita ao aperfeiçoamento de altura de som. Na Figura 4, uma maneira de se abordar modificada é utilizada, comparada com a Figura 3. Desde que o processador posterior de altura de som da Figura 4 substitui a unidade de amostragem para cima 703 na Figura 7, os filtros de sub-banda 301 e 305 da Figura 3 são combinados com o filtro de interpolação 705 da Figura 7 para minimizar o número de operações de filtragem e o atraso da filtragem. De forma mais específica, os filtros 404 e 407 da Figura 4 agem tanto como filtros de banda de passagem (para separar as bandas de frequência) como filtros de interpolação (para amostragem para cima de 12,8 até 16 kHz). Estes filtros 404 e 407 poderiam ser adicionalmente projetados de modo que o filtro de banda de passagem 407 possua constrangimentos relaxados em sua banda de parada de frequência baixa (isto é, ele não tem que atenuar completamente o sinal em frequências baixas). Isto poderia ser alcançado por utilizar constrangimentos de projeto similares à estes apresentados na Figura 9. A Figura 9a é um exemplo de resposta de frequência para o filtro de banda baixa 404. Deve ser notado que o ganho DC (Corrente Direta) deste filtro é 5 (ao invés de 1), desde que este filtro também age como um
Petição 870170072504, de 27/09/2017, pág. 40/63
21/27 filtro de interpolação, com uma proporção de interpolação de 5/4, o que implica que o ganho do filtro deve ser 5 em 0 Hz. Então, a Figura 9b apresenta a resposta de frequência do filtro da banda de passagem 407 tornando este filtro 407 complementar, na banda baixa, para o filtro de banda baixa 404. Neste exemplo, o filtro 407 é um filtro de banda de passagem, não um filtro de banda alta tal como o filtro 301, desde que ele deve agir tanto como um filtro de banda alta (tal como o filtro 301) como um filtro de banda baixa (tal como o filtro de interpolação 705). Referindo-se novamente à Figura 9, será visto que os filtros de banda baixa e de banda de passagem 404 e 407 são complementares quando considerados em paralelo, como na Figura 4. Sua resposta de frequência combinada (quando utilizada em paralelo) é apresentada na Figura 9c.
[0059] Para melhor explicar, as tabelas dos coeficientes de filtro utilizados nesta modalidade ilustrativa dos filtros 404 e 407 são dadas abaixo. Sem dúvidas, estas tabelas de coeficientes de filtro são dadas somente a título de exemplo. Deve ser entendido que estes filtros podem ser substituídos sem modificar o escopo, espírito e natureza da presente invenção.
Tabela 1. Coeficientes de banda baixa do filtro 404
hlp[0] 0.04375000000000 hlp[30] 0.01998000000000
hlp[1] 0.04371500000000 hlp[3l] 0.01882400000000
hlp[2] 0.04361200000000 hlp[32] 0.01768200000000
hlp[3] 0.04344000000000 hlp[33] 0.01655700000000
hlp[4] 0.04320000000000 hlp[34] 0.01545100000000
hlp[5] 0.04289300000000 hlp[35] 0.01436900000000
hlp[6] 0.04252100000000 hlp[36] 0.01331200000000
hlp[7] 0.04208300000000 hlp[37] 0.01228400000000
hlp[8] 0.04158200000000 hlp[38] 0.01128600000000
Petição 870170072504, de 27/09/2017, pág. 41/63
22/27
hlp[9] 0.04102000000000 hlp[39] 0.01032300000000
hlp[10] 0.04039900000000 hlp[ 40] 0.00939500000000
hlp[11] 0.03972100000000 hlp[41] 0.00850500000000
hlp[12] 0.03898800000000 hlp[ 42] 0.00765500000000
hlp[13] 0.03820200000000 hlp[ 43] 0.00684600000000
hlp[14] 0.03736700000000 hlp[ 44] 0.00608100000000
hlp[15] 0.03648600000000 hlp[ 45] 0.00535900000000
hlp[16] 0.03556100000000 hlp[ 46] 0.00468200000000
hlp[17] 0.03459600000000 hlp[ 47] 0.00405100000000
hlp[18] 0.03359400000000 hlp[ 48] 0.00346700000000
hlp[19] 0.03255800000000 hlp[ 49] 0.00292900000000
hlp[20] 0.03149200000000 hlp[50] 0.00243900000000
hlp[21] 0.03039900000000 hlp[51] 0.00199500000000
hlp[22] 0.02928400000000 hlp[ 52] 0.00159900000000
hlp[23] 0.02814900000000 hlp[53] 0.00124800000000
hlp[24] 0.02699900000000 hlp[54] 0.00094400000000
hlp[25] 0.02583700000000 hlp[55] 0.00068400000000
hlp[26] 0.02466700000000 hlp[56] 0.00046800000000
hlp[27] 0.02349300000000 hlp[ 57] 0.00029500000000
hlp[28] 0.02231800000000 hlp[58] 0.00016300000000
hlp[29] 0.02114600000000 hlp[59] 0.00007100000000
hlp[ 60] 0.00001800000000
Tabela 2. Coeficientes de banda de passagem do filtro 407
hbp[0] 0.95625000000000 hbp[30] -0.01998000000000
hbp[1] 0.89115400000000 hbp[31] -0.00412400000000
hbp[2] 0.71120900000000 hbp[32] 0.00414300000000
hbp[3] 0.45810600000000 hbp[33] 0.00343300000000
hbp[4] 0.18819900000000 hbp[34] -0.00416100000000
hbp[5] -0.04289300000000 hbp[35] -0.01436900000000
Petição 870170072504, de 27/09/2017, pág. 42/63
23/27
hbp[6] -0.19474300000000 hbp[36] -0.02267300000000
hbp[7] -0.25136900000000 hbp[37] -0.02601800000000
hbp[8] -0.22287200000000 hbp[38] -0.02370000000000
hbp[9] -0.13948000000000 hbp[39] -0.01723200000000
hbp[10] -0.04039900000000 hbp[ 40] -0.00939500000000
hbp[11] 0.03868100000000 hbp[41] -0.00297000000000
hbp[12] 0.07548400000000 hbp[ 42] 0.00030500000000
hbp[13] 0.06566500000000 hbp[ 43] 0.00019000000000
hbp[14] 0.02113800000000 hbp[ 44] -0.00226000000000
hbp[15] -0.03648600000000 hbp[ 45] -0.00535900000000
hbp[16] -0.08465300000000 hbp[ 46] -0.00756800000000
hbp[17] -0.10763400000000 hbp[ 47] -0.00805800000000
hbp[18] -0.10087600000000 hbp[ 48] -0.00687000000000
hbp[19] -0.07091900000000 hbp[49] -0.00469500000000
hbp[20] -0.03149200000000 hbp[ 50] -0.00243900000000
hbp[21] 0.00234200000000 hbp[51] -0.00080600000000
hbp[22] 0.01970000000000 hbp[52] -0.00006300000000
hbp[23] 0.01715300000000 hbp[53] -0.00005300000000
hbp[24] -0.00110700000000 hbp[54] -0.00038700000000
hbp[25] -0.02583700000000 hbp[55] -0.00068400000000
hbp[26] -0.04678900000000 hbp[ 56] -0.00074400000000
hbp[27] -0.05654900000000 hbp[57] -0.00057600000000
hbp[28] -0.05281800000000 hbp[58] -0.00031900000000
hbp[29] -0.03851900000000 hbp[59] -0.00011300000000
hbp[60] -0.00001800000000
[0060] A saída do filtro de altura de som 402 da Figura 4 é chamada Se. Para ser recombinada com o sinal da ramificação superior, ela é primeiro amostrada para cima pelo processador 403, pelo filtro de banda baixa 404 e pelo processador 405 e adicionada através de um
Petição 870170072504, de 27/09/2017, pág. 43/63
24/27 adicionador 409 para o sinal de ramificação superior amostrado para cima 410. A operação de amostragem para cima na ramificação superior é executada pelo processador 406, pelo filtro de banda de passagem 407 e pelo processador 408.
[0061] Implementação alternativa do aperfeiçoador de altura de som proposto [0062] A Figura 5 apresenta uma implementação alternativa de um aperfeiçoador de altura de som de duas bandas de acordo com uma modalidade ilustrativa da presente invenção. Deve ser notado que a ramificação superior da Figura 5 não processa todo o sinal de entrada. Isto significa que, neste caso particular, os filtros na ramificação superior da Figura 2 (filtros adaptáveis 201a e 201b) possuem características triviais de entrada-saída (a saída é igual à entrada). Na ramificação inferior, o sinal de entrada (sinal a ser aperfeiçoado) é processado primeiro através de um filtro de banda baixa opcional 501, então através de um filtro linear denominado filtro inter-harmônico 503, definido pela seguinte equação:
y[n] = 2x[n]-1 {x[n - T]+ x[n + T]} (2) [0063] deve ser notado que o sinal negativo na frente do segundo termo no lado direito, comparado com a Equação (1). Também deve ser notado que o fator de aperfeiçoamento a não está incluído na Equação (2), mas ao invés disso ele é introduzido por meio de um ganho adaptável pelo processador 504 da Figura 5. O filtro interharmônico 503, descrito pela Equação (2), possui uma resposta de frequência de modo que ele completamente remova os harmônicos de um sinal periódico possuindo um período de T amostras e de modo que um sinusóide em uma frequência exatamente entre os harmônicos passe através do filtro inalterado em amplitude porém com uma inversão de fase de exatamente 180 graus (o mesmo que a inversão de siPetição 870170072504, de 27/09/2017, pág. 44/63
25/27 nal). Por exemplo, a Figura 10 apresenta a resposta de frequência do filtro descrito pela Equação (2) quando o período é escolhido (arbitrariamente) em T = 10 amostras. Um sinal periódico com período T = 10 amostras apresentaria harmônicos em frequências normalizadas 0,2, 0,4, 0,6, etc. e a Figura 10 apresenta que o filtro da Equação (2), com T = 10 amostras, removeria completamente estes harmônicos. Por outro lado, as frequências no ponto médio exato entre os harmônicos apareceriam na saída do filtro com a mesma amplitude porém com uma mudança de fase de 180°. Esta é a razão pela qual o filtro descrito pela Equação (2) e utilizado como filtro 503 é denominado filtro interharmônico.
[0064] O valor de altura de som T para uso no filtro inter-harmônico 503 é obtido de forma adaptável pelo módulo de rastreamento de altura de som 502. O módulo de rastreamento de altura de som 502 opera no sinal de fala decodificado e nos parâmetros decodificados, de forma similar em relação aos métodos revelados anteriormente como apresentado nas Figuras 3 e 4.
[0065] Então, a saída 507 do filtro inter-harmônico 503 é um sinal formado essencialmente da parte inter-harmônica do sinal decodificado de entrada 112, com mudança de fase de 180° no ponto médio entre os harmônicos do sinal. Então, a saída 507 do filtro inter-harmônico 503 é multiplicada por um ganho a (processador 504) e subsequentemente filtrada por banda baixa (filtro 505) para obter a modificação de banda de baixa frequência que é aplicada para o sinal de fala decodificado de entrada 112 da Figura 5, para obter o sinal decodificado processado posteriormente (sinal aperfeiçoado) 509. O coeficiente a no processador 504 controla a quantidade de aperfeiçoamento de altura de som ou de inter-harmônico. Quanto mais próxima de 1 estiver a, maior será o aperfeiçoamento. Quando a é igual a 0, nenhum aperfeiçoamento é obtido, isto é, a saída do adicionador 506 é exatamente
Petição 870170072504, de 27/09/2017, pág. 45/63
26/27 igual ao sinal de entrada (fala decodificada na Figura 5). O valor de a pode ser calculado utilizando várias maneiras de se abordar. Por exemplo, a correlação de altura de som normalizada, a qual é bemconhecida para aqueles versados na técnica, pode ser utilizada para controlar o coeficiente a: quanto maior a correlação de altura de som normalizada (quanto mais próxima de 1 ela estiver), maior o valor de a. [0066] O sinal de fala decodificado processado posteriormente final 509 é obtido por adicionar através de um adicionador 506 a saída do filtro de banda baixa 505 ao sinal de entrada (sinal de fala decodificado 112 da Figura 5). Dependendo da frequência de interrupção do filtro de banda baixa 505, o impacto deste processamento posterior será limitado para as frequências baixas do sinal de entrada 112, até uma dada frequência. As maiores frequências serão de forma eficaz não afetadas pelo processamento posterior.
[0067] Alternativa de uma banda utilizando um filtro de banda alta adaptável [0068] Uma última alternativa para implementar o processamento posterior de sub-banda para aperfeiçoar o sinal de síntese em frequências baixas é utilizar um filtro de banda alta adaptável, cuja frequência de interrupção é variada de acordo com o valor da altura de som do sinal de entrada. De forma específica e sem referir-se a qualquer desenho, o aperfeiçoamento de baixa frequência utilizando esta modalidade ilustrativa seria executado, em cada quadro de sinal de entrada, de acordo com as seguintes etapas:
[0069] Determinar o valor da altura de som do sinal de entrada (período de sinal) utilizando o sinal de entrada e possivelmente os parâmetros decodificados (saída do decodificador de fala 105) se processar posteriormente um sinal de fala decodificado; esta é uma operação similar em relação à operação de rastreamento de altura de som dos módulos 303, 401 e 502.
Petição 870170072504, de 27/09/2017, pág. 46/63
27/27 [0070] Calcular os coeficientes de um filtro de banda alta de modo que a frequência de interrupção esteja abaixo, porém próxima à frequência fundamental do sinal de entrada; de forma alternativa, interpolar entre os filtros de banda alta armazenados, pré-calculados, de frequências de interrupção conhecidas (a interpolação pode ser feita do domínio de derivações de filtro, ou no domínio de pólo zero, ou em algum outro domínio transformado tal como o LSF (Frequências Espectrais de Linha) do domínio ISF (Frequências de Emissão de Espectro)). [0071] Filtrar o quadro do sinal de entrada com o filtro de banda alta calculado, para obter o sinal processado posteriormente para este quadro.
[0072] Deve ser salientado que a presente modalidade ilustrativa da presente invenção é equivalente a utilizar somente uma ramificação de processamento na Figura 2 e definir o filtro adaptável desta ramificação como um filtro de banda alta controlado por altura de som. O processamento posterior alcançado com esta maneira de se abordar somente irá afetar a faixa de frequência abaixo do primeiro harmônico e não a energia inter-harmônica acima do primeiro harmônico.
[0073] Apesar da presente invenção ter sido descrita na descrição precedente com referência às modalidades ilustrativas da mesma, estas modalidades podem ser modificadas à vontade, dentro do escopo das reivindicações anexas sem se afastar do espírito e natureza da presente invenção. Por exemplo, apesar das modalidades ilustrativas terem sido descritas em relação a um sinal de fala decodificado, aqueles versados na técnica irão apreciar que os conceitos da presente invenção podem ser aplicados para outros tipos de sinais decodificados, em particular mas não exclusivamente para outros tipos de sinais de som decodificados.
Petição 870170072504, de 27/09/2017, pág. 47/63
1/15

Claims (57)

  1. REIVINDICAÇÕES
    1. Método para processar posteriormente um sinal de som decodificado (112) em vista de aperfeiçoar uma qualidade percebida do sinal de som decodificado (112) compreendendo as etapas de:
    dividir (301,305,407,404,505) o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda; e aplicar o processamento posterior (307,401,402,503,504,502) para somente uma parte dos sinais de frequência de sub-banda;
    caracterizado pelo fato de que ainda aplicar o processamento posterior para somente uma parte dos sinais de frequência de sub-banda compreende aperfeiçoar a altura (304, 402, 503, 504) dos sinais de frequência de sub-banda apenas em uma banda de frequência inferior do sinal de som decodificado (112).
  2. 2. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende somar (306,409,506) os sinais de frequência de sub-banda, após o processamento posterior de parte dos sinais de sub-banda de frequência para produzir um sinal de som de saída decodificado processado posteriormente (113,509).
  3. 3. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que aperfeiçoar a altura compreende filtrar de forma adaptável (307) a parte dos sinais de subbanda de frequência.
  4. 4. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que dividir o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de subbanda compreende filtrar por sub-banda (301,305,407,404,505) o sinal de som decodificado (112) para produzir a pluralidade de sinais de sub-banda de frequência.
    Petição 870170072504, de 27/09/2017, pág. 48/63
    2/15
  5. 5. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que para a parte dos sinais de frequência de sub-banda:
    aperfeiçoar a altura compreende filtrar de forma adaptável (307,401,402,503,504,502) o sinal de som decodificado (112); e dividir o sinal de som decodificado (112) compreende filtrar por sub-banda (301,305,407,404,505) o sinal de som decodificado de forma adaptável filtrado.
  6. 6. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:
    dividir o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda compreende:
    - uma filtragem de banda alta (301) do sinal de som decodificado (112) para produzir um sinal de banda de frequência alta (310); e
    - uma primeira filtragem de banda baixa (305) do sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa (311); e aperfeiçoar a altura compreende:
    - aperfeiçoar a altura (304) do sinal de som decodificado (112) antes da primeira filtragem de banda baixa (305) do sinal de som decodificado (112) para produzir o sinal de frequência de banda baixa (311).
  7. 7. Método de processamento posterior, de acordo com a reivindicação 6, caracterizado pelo fato de que ainda compreende uma segunda filtragem de banda baixa (302) do sinal de som decodificado (112) antes de aperfeiçoar a altura (304) do sinal de som decodificado (112).
  8. 8. Método de processamento posterior, de acordo com a reivindicação 6, caracterizado pelo fato de que ainda compreende
    Petição 870170072504, de 27/09/2017, pág. 49/63
    3/15 somar (306) os sinais de frequência de banda alta (310) e de banda baixa (311) para produzir um sinal de som de saída decodificado processado posteriormente (113).
  9. 9. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:
    dividir o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda compreende:
    - filtragem de banda de passagem (407) do sinal de som decodificado (112) para produzir um sinal de frequência de banda superior (410); e
    - filtragem de banda baixa (404) do sinal de som decodificado (112) para produzir um sinal de frequência de banda inferior; e aperfeiçoar a altura compreende:
    - aperfeiçoar a altura (402) do sinal de som decodificado (112) antes da filtragem de banda baixa (305) do sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa.
  10. 10. Método de processamento posterior, de acordo com a reivindicação 9, caracterizado pelo fato de que ainda compreende somar (409) os sinais de frequência de banda superior (410) e de banda inferior para produzir um sinal de som de saída decodificado processado posteriormente.
  11. 11. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:
    dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda compreende:
    - filtragem de banda baixa (505) do sinal de som decodificado para produzir um sinal de frequência de banda baixa; e aperfeiçoar a altura compreende:
    Petição 870170072504, de 27/09/2017, pág. 50/63
    4/15
    - aperfeiçoar a altura (503,504) do sinal de frequência de banda baixa.
  12. 12. Método de processamento posterior, de acordo com a reivindicação 11, caracterizado pelo fato de que aperfeiçoar a altura compreende processar o sinal de som decodificado através de um filtro inter-harmônico (503) para atenuação inter-harmônica do sinal de som decodificado (112).
  13. 13. Método de processamento posterior, de acordo com a reivindicação 12, caracterizado pelo fato de que aperfeiçoar a altura compreende multiplicar (504) o sinal de som decodificado filtrado interharmônico (507) por um ganho de aperfeiçoamento de altura de som adaptável.
  14. 14. Método de processamento posterior, de acordo com a reivindicação 12, caracterizado pelo fato de que ainda compreende filtragem de banda baixa (501) do sinal de som decodificado (112) antes de processar o sinal de som decodificado através do filtro interharmônico (503).
  15. 15. Método de processamento posterior, de acordo com a reivindicação 11, caracterizado pelo fato de que ainda compreende somar (506) o sinal de som decodificado (112) e o sinal de frequência de banda baixa (508) para produzir um sinal de som de saída decodificado processado posteriormente (509).
  16. 16. Método de processamento posterior, de acordo com a reivindicação 11, caracterizado pelo fato de que aperfeiçoar a altura (503,504) compreende processar o sinal de som decodificado (112) através de um filtro inter-harmônico (503) possuindo a seguinte função de transferência:
    y\n\ = 2 XM -1 M - T]+ x[n + T]} para atenuação inter-harmônica do sinal de som decodificado (112),
    Petição 870170072504, de 27/09/2017, pág. 51/63
    5/15 onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado filtrado inter-harmônico (507) em uma dada sub-banda e T é um atraso de altura de som do sinal de som decodificado (112).
  17. 17. Método de processamento posterior, de acordo com a reivindicação 16, caracterizado pelo fato de que ainda compreende somar (506) o sinal de som decodificado não processado e o sinal de frequência de banda baixa filtrado inter-harmônico (508) para produzir um sinal de som de saída decodificado processado posteriormente (509).
  18. 18. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que aperfeiçoar a altura compreende aperfeiçoar a altura (304) do sinal de som decodificado (112) utilizando a seguinte equação:
    y[n]=(l--a ]+Xn+T ]} onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
  19. 19. Método de processamento posterior, de acordo com a reivindicação 18, caracterizado pelo fato de que compreende receber (106) o atraso de altura de som T através de um fluxo de bits (111).
  20. 20. Método de processamento posterior, de acordo com a reivindicação 18, caracterizado pelo fato de que compreende decodificar (106) o atraso de altura de som T a partir de um fluxo de bits codificado recebido (111).
  21. 21. Método de processamento posterior, de acordo com a reivindicação 18, caracterizado pelo fato de que compreende calcular (303) o atraso de altura do som T em resposta ao sinal de som dePetição 870170072504, de 27/09/2017, pág. 52/63
    6/15 codificado (112) para um rastreamento de altura aperfeiçoado.
  22. 22. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que durante a codificação, o sinal de som é amostrado para baixo a partir de uma frequência de amostragem superior até uma frequência de amostragem inferior, e em que dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda compreende amostrar para cima (403.405.406.408) o sinal de som decodificado (112) a partir da frequência de amostragem inferior até a frequência de amostragem superior.
  23. 23. Método de processamento posterior, de acordo com a reivindicação 22, caracterizado pelo fato de que dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de subbanda compreende filtragem de sub-banda (407) do sinal de som decodificado (112) e em que a amostragem para cima (406,408) do sinal de som decodificado (112) a partir da frequência de amostragem inferior até a frequência de amostragem superior é combinada com a filtragem de sub-banda (407).
  24. 24. Método de processamento posterior, de acordo com a reivindicação 22, caracterizado pelo fato de que compreende:
    filtragem de banda de passagem (407) do sinal de som decodificado (112) para produzir um sinal de frequência de banda superior (410), a filtragem de banda de passagem (407) do sinal de som decodificado (112) sendo combinada com a amostragem para cima (406.408) do sinal de som decodificado (112) a partir da frequência de amostragem inferior até a frequência de amostragem superior; e aperfeiçoamento de altura (402) do sinal de som decodificado (112) e aplicação de filtragem de banda baixa (404) para o sinal de som decodificado com aperfeiçoamento o de altura para produzir um sinal de frequência de banda inferior, a filtragem de banda baixa
    Petição 870170072504, de 27/09/2017, pág. 53/63
    7/15 (404) do sinal de som decodificado com aperfeiçoamento de altura sendo combinada com a amostragem para cima (403,405) do sinal de som decodificado a partir da frequência de amostragem inferior até a frequência de amostragem superior.
  25. 25. Método de processamento posterior, de acordo com a reivindicação 24, caracterizado pelo fato de que ainda compreende adicionar (409) o sinal de frequência de banda superior (401) com o sinal de frequência de banda inferior para formar um sinal de som decodificado processado posteriormente e amostrado para cima de saída.
  26. 26. Método de processamento posterior, de acordo com a reivindicação 24, caracterizado pelo fato de que aperfeiçoar a altura (402) do sinal de som decodificado (112) compreende processar o sinal de som decodificado (112) por meio da seguinte equação:
    y[n]=(l--a ]+Xn+T ]} onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
  27. 27. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:
    dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda compreende dividir (301,305,407,404,505) o sinal de som decodificado (112) em um sinal de frequência de banda superior (310,410) e um sinal de frequência de banda inferior (311,508); e aperfeiçoar a altura compreende aperfeiçoar a altura (304,402,503,504) do sinal de frequência de banda inferior (301,508).
    Petição 870170072504, de 27/09/2017, pág. 54/63
    8/15
  28. 28. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que aperfeiçoar a altura compreende:
    determinar um valor de altura do sinal de som decodificado (112);
    calcular, em relação ao valor de altura de som determinado, um filtro de banda alta com uma frequência de interrupção abaixo de uma frequência fundamental do sinal de som decodificado (112); e processar o sinal de som decodificado (112) através do filtro de banda alta calculado.
  29. 29. Dispositivo para processar posteriormente (108) um sinal de som decodificado (112) em vista de aperfeiçoar uma qualidade percebida do sinal de som decodificado compreendendo:
    um divisor (301,305,407,404,505) do sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda; e um processador posterior (307,401,402,503,504,502) de somente uma parte dos sinais de frequência de sub-banda;
    caracterizado pelo fato de que o processador posterior compreende um aperfeiçoador de altura (304,402,503,504) dos sinais de frequência de sub-banda apenas em uma banda de frequência inferior do sinal de som decodificado (112).
  30. 30. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que ainda compreende um adicionador (306,409,506) para somar os sinais de frequência de sub-banda, após o processamento posterior de parte dos sinais de frequência de sub-banda, para produzir um sinal de som de saída decodificado processado posteriormente (113,509).
  31. 31. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o processador
    Petição 870170072504, de 27/09/2017, pág. 55/63
    9/15 posterior compreende um filtro adaptável (307) fornecido com o sinal de som decodificado (112).
  32. 32. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o divisor compreende um filtro de sub-banda (301,305,407,404,505) fornecido com o sinal de som decodificado.
  33. 33. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que para a parte dos sinais de frequência de sub-banda:
    o processador posterior compreende um filtro adaptável (307,401,402,503,504,502) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado de forma adaptável filtrado; e o divisor compreende um filtro de sub-banda (301,305,407,404,505) fornecido com o sinal de som decodificado de forma adaptável filtrado.
  34. 34. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o divisor compreende:
    - um filtro de banda alta (301) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda alta (310); e
    - um primeiro filtro de banda baixa (305) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa; e o aperfeiçoador de altura (304) aperfeiçoa o sinal de som decodificado antes da filtragem de banda baixa do sinal de som decodificado (112) através do primeiro filtro de banda baixa (305).
  35. 35. Dispositivo de processamento posterior, de acordo com a reivindicação 34, caracterizado pelo fato de que o processador
    Petição 870170072504, de 27/09/2017, pág. 56/63
    10/15 posterior ainda compreende um segundo filtro de banda baixa (302) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado filtrado de banda baixa fornecido para o aperfeiçoador de altura (304).
  36. 36. Dispositivo de processamento posterior, de acordo com a reivindicação 34, caracterizado pelo fato de que ainda compreende um adicionador (306) para somar os sinais de frequência de banda alta (310) e de banda baixa para produzir um sinal de som de saída decodificado processado posteriormente (113).
  37. 37. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que:
    o divisor compreende:
    - um filtro de banda de passagem (407) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda superior; e
    - um filtro de banda baixa (404) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda inferior; e o aperfeiçoador de altura (402) aperfeiçoa o sinal de som decodificado (112) antes da filtragem de banda baixa do sinal de som decodificado através do filtro de banda baixa (404) para produzir o sinal de frequência de banda inferior.
  38. 38. Dispositivo de processamento posterior, de acordo com a reivindicação 37, caracterizado pelo fato de que o aperfeiçoador de altura compreende um filtro de altura (402) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado com a altura aperfeiçoada fornecido para o filtro de banda baixa (404).
  39. 39. Dispositivo de processamento posterior, de acordo com a reivindicação 37, caracterizado pelo fato de que ainda compreende um adicionador (409) para somar os sinais de frequência de banda suPetição 870170072504, de 27/09/2017, pág. 57/63
    11/15 perior (410) e de banda inferior para produzir um sinal de som de saída decodificado processado posteriormente.
  40. 40. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que:
    o divisor compreende:
    - um filtro de banda baixa (505) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa (508); e o aperfeiçoador de altura (503,504) aperfeiçoa o sinal de som decodificado (112) para produzir um sinal de som decodificado com a altura aperfeiçoada fornecido para o filtro de banda baixa (505).
  41. 41. Dispositivo de processamento posterior, de acordo com a reivindicação 40, caracterizado pelo fato de que o aperfeiçoador de altura compreende um filtro inter-harmônico (503) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado atenuado, inter-harmônico (507).
  42. 42. Dispositivo de processamento posterior, de acordo com a reivindicação 41, caracterizado pelo fato de que o aperfeiçoador de altura compreende um multiplicador (504) para multiplicar o sinal de som decodificado atenuado, inter-harmônico (507) por um ganho de aperfeiçoamento de altura de som adaptável.
  43. 43. Dispositivo de processamento posterior, de acordo com a reivindicação 41, caracterizado pelo fato de que ainda compreende um filtro de banda baixa (501) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado filtrado de banda baixa fornecido para o filtro inter-harmônico (503).
  44. 44. Dispositivo de processamento posterior, de acordo com a reivindicação 40, caracterizado pelo fato de que ainda compreende um adicionador (506) para somar o sinal de som decodificado (112) e o sinal de frequência de banda baixa (508) para produzir um sinal de
    Petição 870170072504, de 27/09/2017, pág. 58/63
    12/15 som de saída decodificado processado posteriormente (509).
  45. 45. Dispositivo de processamento posterior, de acordo com a reivindicação 40, caracterizado pelo fato de que o aperfeiçoador de altura compreende um filtro inter-harmônico (503) possuindo a seguinte função de transferência:
    y\n\ = 2 XM -1 {χ[η - T]+ x[n + T]} para atenuação inter-harmônica do sinal de som decodificado (112), onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado inter-harmonicamente filtrado (507) em uma dada sub-banda e T é um atraso de altura de som do sinal de som decodificado (112).
  46. 46. Dispositivo de processamento posterior, de acordo com a reivindicação 45, caracterizado pelo fato de que ainda compreende um adicionador (506) para somar o sinal de som decodificado não processado e o sinal de frequência de banda baixa inter-harmonicamente filtrado (508) para produzir um sinal de som de saída decodificado processado posteriormente (509).
  47. 47. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o aperfeiçoador de altura (304) do sinal de som decodificado (112) utiliza a seguinte equação:
    y[n]=(l--a η-τ ]+ χη+τ ]} onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
  48. 48. Dispositivo de processamento posterior, de acordo com a reivindicação 47, caracterizado pelo fato de que compreende um receptor (106) do atraso de altura T através de um fluxo de bits (111).
    Petição 870170072504, de 27/09/2017, pág. 59/63
    13/15
  49. 49. Dispositivo de processamento posterior, de acordo com a reivindicação 47, caracterizado pelo fato de que compreende um decodificado (106) do atraso da altura T a partir de um fluxo de bits codificado recebido (111).
  50. 50. Dispositivo de processamento posterior, de acordo com a reivindicação 47, caracterizado pelo fato de que compreende uma calculadora (303) do atraso de altura de som T em resposta ao sinal de som decodificado (112) para um rastreamento de altura aperfeiçoado.
  51. 51. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que, durante a codificação, o sinal de som é amostrado para baixo a partir de uma frequência de amostragem superior até uma frequência de amostragem inferior, e em que o divisor compreende um amostrador para cima (403,405,406,408) do sinal de som decodificado a partir da frequência de amostragem inferior até a frequência de amostragem superior.
  52. 52. Dispositivo de processamento posterior, de acordo com a reivindicação 51, caracterizado pelo fato de que o divisor compreende um filtro de sub-banda (407) fornecido com o sinal de som decodificado (112) e em que o amostrador para cima (406,408) é combinado com o filtro de sub-banda (407).
  53. 53. Dispositivo de processamento posterior, de acordo com a reivindicação 51, caracterizado pelo fato de que:
    o aperfeiçoador de altura (402) aperfeiçoa o sinal de som decodificado; e o divisor compreende:
    - um filtro de banda de passagem (407) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda superior (410), o filtro de banda de passagem (407) sendo combinado com o amostrador para cima (406,408); e
    - um filtro de banda baixa (404) fornecido com o siPetição 870170072504, de 27/09/2017, pág. 60/63
    14/15 nal de som decodificado com altura aperfeiçoada para produzir um sinal de frequência de banda inferior, o filtro de banda baixa (404) sendo combinado com o amostrador para cima (403,405).
  54. 54. Dispositivo de processamento posterior, de acordo com a reivindicação 53, caracterizado pelo fato de que ainda compreende um adicionador (409) para somar o sinal de frequência de banda superior (410) com o sinal de frequência de banda inferior para formar um sinal de som de saída decodificado com altura aperfeiçoada e amostrado para cima.
  55. 55. Dispositivo de processamento posterior, de acordo com a reivindicação 53, caracterizado pelo fato de que o aperfeiçoador de altura (402) usa a seguinte equação:
    y[n]=(l--a {X[II-T ]+ Xn+T D onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
  56. 56. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que:
    o divisor (301,305,407,404,505) divide o sinal de som decodificado (112) em um sinal de frequência de banda superior (310,410) e um sinal de frequência de banda inferior (311,508); e o aperfeiçoador de altura (304,402,503,504) aperfeiçoa o sinal de frequência de banda inferior (311,508).
  57. 57. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o aperfeiçoador de altura:
    determina um valor de altura do sinal de som decodificado
    Petição 870170072504, de 27/09/2017, pág. 61/63
    15/15 (112);
    calcula, em relação ao valor de altura de som determinado, um filtro de banda alta com uma frequência de interrupção abaixo de uma frequência fundamental do sinal de som decodificado (112); e processa o sinal de som decodificado (112) através do filtro de banda alta calculado.
    Petição 870170072504, de 27/09/2017, pág. 62/63
    1/11
    112
    I
    Petição 870170072504, de 27/09/2017, pág. 3/63 à
    2/11
    Petição 870170072504, de 27/09/2017, pág. 4/63
    3/11 η cn
    307
    Petição 870170072504, de 27/09/2017, pág. 5/63
    4/11 to ο
    •sí·
    114
    Petição 870170072504, de 27/09/2017, pág. 6/63
    5/11
    Petição 870170072504, de 27/09/2017, pág. 7/63
    6/11
    Petição 870170072504, de 27/09/2017, pág. 8/63
    7/11
    IQ
    Η •l·
    Petição 870170072504, de 27/09/2017, pág. 9/63
    8/11
    Petição 870170072504, de 27/09/2017, pág. 10/63
    9/11
    Petição 870170072504, de 27/09/2017, pág. 11/63
    10/11
    Petição 870170072504, de 27/09/2017, pág. 12/63
    11/11 .ID
    Petição 870170072504, de 27/09/2017, pág. 13/63
BRPI0311314-0A 2002-05-31 2003-05-30 Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada BRPI0311314B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA2,388,352 2002-05-31
CA002388352A CA2388352A1 (en) 2002-05-31 2002-05-31 A method and device for frequency-selective pitch enhancement of synthesized speed
PCT/CA2003/000828 WO2003102923A2 (en) 2002-05-31 2003-05-30 Methode and device for pitch enhancement of decoded speech

Publications (1)

Publication Number Publication Date
BRPI0311314B1 true BRPI0311314B1 (pt) 2018-02-14

Family

ID=29589086

Family Applications (2)

Application Number Title Priority Date Filing Date
BR0311314-0A BR0311314A (pt) 2002-05-31 2003-05-30 Método e dispositivo para aperfeiçoamento da altura de som seletivo por frequência de fala sintetizada
BRPI0311314-0A BRPI0311314B1 (pt) 2002-05-31 2003-05-30 Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BR0311314-0A BR0311314A (pt) 2002-05-31 2003-05-30 Método e dispositivo para aperfeiçoamento da altura de som seletivo por frequência de fala sintetizada

Country Status (21)

Country Link
US (1) US7529660B2 (pt)
EP (1) EP1509906B1 (pt)
JP (1) JP4842538B2 (pt)
KR (1) KR101039343B1 (pt)
CN (1) CN100365706C (pt)
AT (1) ATE399361T1 (pt)
AU (1) AU2003233722B2 (pt)
BR (2) BR0311314A (pt)
CA (2) CA2388352A1 (pt)
CY (1) CY1110439T1 (pt)
DE (1) DE60321786D1 (pt)
DK (1) DK1509906T3 (pt)
ES (1) ES2309315T3 (pt)
MX (1) MXPA04011845A (pt)
MY (1) MY140905A (pt)
NO (1) NO332045B1 (pt)
NZ (1) NZ536237A (pt)
PT (1) PT1509906E (pt)
RU (1) RU2327230C2 (pt)
WO (1) WO2003102923A2 (pt)
ZA (1) ZA200409647B (pt)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6315985B1 (en) * 1999-06-18 2001-11-13 3M Innovative Properties Company C-17/21 OH 20-ketosteroid solution aerosol products with enhanced chemical stability
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
FR2861491B1 (fr) * 2003-10-24 2006-01-06 Thales Sa Procede de selection d'unites de synthese
DE102004007184B3 (de) * 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007191B3 (de) * 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
EP1744139B1 (en) * 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Decoding apparatus and method thereof
US8463602B2 (en) * 2004-05-19 2013-06-11 Panasonic Corporation Encoding device, decoding device, and method thereof
CN101006495A (zh) * 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
JP4407538B2 (ja) * 2005-03-03 2010-02-03 ヤマハ株式会社 マイクロフォンアレー用信号処理装置およびマイクロフォンアレーシステム
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US8346546B2 (en) * 2006-08-15 2013-01-01 Broadcom Corporation Packet loss concealment based on forced waveform alignment after packet loss
US20100049512A1 (en) * 2006-12-15 2010-02-25 Panasonic Corporation Encoding device and encoding method
US8036886B2 (en) * 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
WO2008081920A1 (ja) * 2007-01-05 2008-07-10 Kyushu University, National University Corporation 音声強調処理装置
JP5046233B2 (ja) * 2007-01-05 2012-10-10 国立大学法人九州大学 音声強調処理装置
CN101622668B (zh) * 2007-03-02 2012-05-30 艾利森电话股份有限公司 电信网络中的方法和装置
CN101622666B (zh) * 2007-03-02 2012-08-15 艾利森电话股份有限公司 非因果后置滤波器
JP5255575B2 (ja) * 2007-03-02 2013-08-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) レイヤード・コーデックのためのポストフィルタ
CN101266797B (zh) * 2007-03-16 2011-06-01 展讯通信(上海)有限公司 语音信号后处理滤波方法
ES2598113T3 (es) * 2007-06-27 2017-01-25 Telefonaktiebolaget Lm Ericsson (Publ) Método y disposición para mejorar señales de audio espaciales
JPWO2009004718A1 (ja) * 2007-07-03 2010-08-26 パイオニア株式会社 楽音強調装置、楽音強調方法、楽音強調プログラムおよび記録媒体
JP2009044268A (ja) * 2007-08-06 2009-02-26 Sharp Corp 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、及び、記録媒体
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
KR101475724B1 (ko) * 2008-06-09 2014-12-30 삼성전자주식회사 오디오 신호 품질 향상 장치 및 방법
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
GB2466668A (en) * 2009-01-06 2010-07-07 Skype Ltd Speech filtering
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
GB2473266A (en) * 2009-09-07 2011-03-09 Nokia Corp An improved filter bank
JP5519230B2 (ja) * 2009-09-30 2014-06-11 パナソニック株式会社 オーディオエンコーダ及び音信号処理システム
HUE071544T2 (hu) 2009-10-21 2025-09-28 Dolby Int Ab Túlmintavételezés kombinált transzponáló szûrõbankban
WO2011062535A1 (en) * 2009-11-19 2011-05-26 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
ES2924180T3 (es) * 2009-12-14 2022-10-05 Fraunhofer Ges Forschung Dispositivo de cuantificación vectorial, dispositivo de codificación de habla, procedimiento de cuantificación vectorial y procedimiento de codificación de habla
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
US8793126B2 (en) 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US8423357B2 (en) * 2010-06-18 2013-04-16 Alon Konchitsky System and method for biometric acoustic noise reduction
EP3079153B1 (en) * 2010-07-02 2018-08-01 Dolby International AB Audio decoding with selective post filtering
WO2012110476A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Linear prediction based coding scheme using spectral domain noise shaping
JP5914527B2 (ja) 2011-02-14 2016-05-11 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 過渡検出及び品質結果を使用してオーディオ信号の一部分を符号化する装置及び方法
EP2676268B1 (en) * 2011-02-14 2014-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a decoded audio signal in a spectral domain
PL2550653T3 (pl) 2011-02-14 2014-09-30 Fraunhofer Ges Forschung Reprezentacja sygnału informacyjnego z użyciem transformacji zakładkowej
TR201903388T4 (tr) 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
WO2012110447A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
ES2689072T3 (es) * 2012-05-23 2018-11-08 Nippon Telegraph And Telephone Corporation Codificación de una señal de audio
FR3000328A1 (fr) * 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
US8927847B2 (en) * 2013-06-11 2015-01-06 The Board Of Trustees Of The Leland Stanford Junior University Glitch-free frequency modulation synthesis of sounds
US9418671B2 (en) 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
JP6220610B2 (ja) * 2013-09-12 2017-10-25 日本電信電話株式会社 信号処理装置、信号処理方法、プログラム、記録媒体
BR112016007515B1 (pt) 2013-10-18 2021-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Método de codificação de segmento de sinal de áudio, codificador de segmento de sinal de áudio, e, terminal de usuário.
LT3511935T (lt) 2014-04-17 2021-01-11 Voiceage Evs Llc Būdas, įrenginys ir kompiuteriu nuskaitoma neperkeliama atmintis garso signalų tiesinės prognozės kodavimui ir dekodavimui po perėjimo tarp kadrų su skirtingais mėginių ėmimo greičiais
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
CN107210718A (zh) * 2014-11-20 2017-09-26 迪芬尼香港有限公司 使用多速率fir和全通iir滤波器均衡扬声器系统的声学响应的方法和装置
TWI693594B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
KR102299193B1 (ko) 2016-04-12 2021-09-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 상부 주파수 대역에서 검출된 피크 스펙트럼 영역을 고려하여 오디오 신호를 부호화하는 오디오 인코더, 오디오 신호를 부호화하는 방법, 및 컴퓨터 프로그램
RU2676022C1 (ru) * 2016-07-13 2018-12-25 Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" Способ повышения разборчивости речи
CN111128230B (zh) * 2019-12-31 2022-03-04 广州市百果园信息技术有限公司 语音信号重建方法、装置、设备和存储介质
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
CN113053353B (zh) * 2021-03-10 2022-10-04 度小满科技(北京)有限公司 一种语音合成模型的训练方法及装置
US12254895B2 (en) 2021-07-02 2025-03-18 Digital Voice Systems, Inc. Detecting and compensating for the presence of a speaker mask in a speech signal
US11990144B2 (en) 2021-07-28 2024-05-21 Digital Voice Systems, Inc. Reducing perceived effects of non-voice data in digital speech
US12451151B2 (en) 2022-04-08 2025-10-21 Digital Voice Systems, Inc. Tone frame detector for digital speech
US20240386899A1 (en) * 2023-05-16 2024-11-21 Apple Inc. Downlink noise suppression
US12462814B2 (en) 2023-10-06 2025-11-04 Digital Voice Systems, Inc. Bit error correction in digital speech
KR102874451B1 (ko) 2024-04-25 2025-10-22 엘아이지넥스원 주식회사 수중 음향 기만용 노이즈 신호 최적화 방법 및 이를 위한 장치
CN119229884B (zh) * 2024-08-20 2025-12-19 北京达佳互联信息技术有限公司 一种语音处理方法、装置、电子设备及存储介质

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SU447857A1 (ru) 1971-09-07 1974-10-25 Предприятие П/Я А-3103 Устройство дл записи информации на термопластический носитель
SU447853A1 (ru) 1972-12-01 1974-10-25 Предприятие П/Я А-7306 Устройство передачи и приема речевых сигналов
JPS6041077B2 (ja) * 1976-09-06 1985-09-13 喜徳 喜谷 1,2‐ジアミノシクロヘキサン異性体のシス白金(2)錯体
JP3137805B2 (ja) * 1993-05-21 2001-02-26 三菱電機株式会社 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法
JP3321971B2 (ja) * 1994-03-10 2002-09-09 ソニー株式会社 音声信号処理方法
JP3062392B2 (ja) * 1994-04-22 2000-07-10 株式会社河合楽器製作所 波形形成装置およびこの出力波形を用いた電子楽器
IL114852A (en) * 1994-08-08 2000-02-29 Debiopharm Sa Pharmaceutically stable preparation of oxaliplatinum
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
GB9512284D0 (en) 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
GB9804013D0 (en) * 1998-02-25 1998-04-22 Sanofi Sa Formulations
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US7167828B2 (en) * 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
JP3612260B2 (ja) * 2000-02-29 2005-01-19 株式会社東芝 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6937978B2 (en) * 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
US6476068B1 (en) * 2001-12-06 2002-11-05 Pharmacia Italia, S.P.A. Platinum derivative pharmaceutical formulations
CN101022790A (zh) * 2003-08-28 2007-08-22 梅恩医药有限公司 含有酸的奥沙利铂制剂

Also Published As

Publication number Publication date
RU2004138291A (ru) 2005-05-27
ATE399361T1 (de) 2008-07-15
US7529660B2 (en) 2009-05-05
ZA200409647B (en) 2006-06-28
CN1659626A (zh) 2005-08-24
CY1110439T1 (el) 2015-04-29
CN100365706C (zh) 2008-01-30
EP1509906A2 (en) 2005-03-02
DE60321786D1 (de) 2008-08-07
NO20045717L (no) 2004-12-30
JP2005528647A (ja) 2005-09-22
RU2327230C2 (ru) 2008-06-20
CA2483790C (en) 2011-12-20
JP4842538B2 (ja) 2011-12-21
ES2309315T3 (es) 2008-12-16
EP1509906B1 (en) 2008-06-25
PT1509906E (pt) 2008-11-13
MXPA04011845A (es) 2005-07-26
US20050165603A1 (en) 2005-07-28
KR101039343B1 (ko) 2011-06-08
NO332045B1 (no) 2012-06-11
CA2483790A1 (en) 2003-12-11
MY140905A (en) 2010-01-29
BR0311314A (pt) 2005-02-15
DK1509906T3 (da) 2008-10-20
KR20050004897A (ko) 2005-01-12
HK1078978A1 (en) 2006-03-24
NZ536237A (en) 2007-05-31
WO2003102923A2 (en) 2003-12-11
WO2003102923A3 (en) 2004-09-30
CA2388352A1 (en) 2003-11-30
AU2003233722B2 (en) 2009-06-04
AU2003233722A1 (en) 2003-12-19

Similar Documents

Publication Publication Date Title
BRPI0311314B1 (pt) Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada
EP1141946B1 (en) Coded enhancement feature for improved performance in coding communication signals
Chen et al. Adaptive postfiltering for quality enhancement of coded speech
US10269359B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
JP5149198B2 (ja) 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス
US7693710B2 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
US10339946B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
RU2262748C2 (ru) Многорежимное устройство кодирования
JP3653826B2 (ja) 音声復号化方法及び装置
KR101406742B1 (ko) 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법
JP2004514182A (ja) 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法
US9418671B2 (en) Adaptive high-pass post-filter
KR20220045260A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
CN1650156A (zh) 合成分析语音编码器中用于进行语音编码的方法和装置
JP2853170B2 (ja) 音声符号化復号化方式
Wang Low bit-rate vector excitation coding of phonetically classified speech
Veeneman et al. Enhancement of block-coded speech
Yao Low-delay speech coding
How Wideband speech and audio compression for wireless communications
Ekeroth Improvements of the voice activity detector in AMR-WB
HK1078978B (en) Method and device for pitch enhancement of decoded speech