BRPI0311314B1

BRPI0311314B1 - Método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada

Info

Publication number: BRPI0311314B1
Application number: BRPI0311314-0A
Authority: BR
Inventors: Bessette Bruno; Laflamme Claude; Jelinek Milan; Lefebvre Roch
Original assignee: Voiceage Corporation
Priority date: 2002-05-31
Filing date: 2003-05-30
Publication date: 2018-02-14
Also published as: RU2004138291A; ATE399361T1; US7529660B2; ZA200409647B; CN1659626A; CY1110439T1; CN100365706C; EP1509906A2; DE60321786D1; NO20045717L; JP2005528647A; RU2327230C2; CA2483790C; JP4842538B2; ES2309315T3; EP1509906B1; PT1509906E; MXPA04011845A; US20050165603A1; KR101039343B1

Abstract

"método e dispositivo para aperfeiçoamento da altura de som seletivo por freqüência de fala sintetizada". a presente invenção refere-se a um método e dispositivo para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado, o sinal de som decodificado é dividido em uma pluralidade de sinais de freqüência de sub-banda e o processamento posterior é aplicado para pelo menos um dos sinais de freqüência de sub-banda. após o processamento posterior deste pelo menos um sinal de freqüência de sub-banda, os sinais de freqüência de sub-banda podem ser adicionados para produzir um sinal de som de saída decodificado processado posteriormente. desta maneira, o processamento posterior pode ser localizado para uma sub-banda ou para sub-bandas desejadas deixando outras sub-bandas virtualmente inalteradas.

Description

(54) Título: MÉTODO E DISPOSITIVO PARA APERFEIÇOAMENTO DA ALTURA DE SOM SELETIVO POR FREQÜÊNCIA DE FALA SINTETIZADA (51) Int.CI.: G10L 21/0364; G10L 21/0232 (52) CPC: G10L 21/0364,G10L 21/0232 (30) Prioridade Unionista: 31/05/2002 CA 2,388,352 (73) Titular(es): VOICEAGE CORPORATION (72) Inventor(es): BRUNO BESSETTE; CLAUDE LAFLAMME; MILAN JELINEK; ROCH LEFEBVRE

1/27

Relatório Descritivo da Patente de Invenção para MÉTODO E DISPOSITIVO PARA APERFEIÇOAMENTO DA ALTURA DE SOM SELETIVO POR FREQUÊNCIA DE FALA SINTETIZADA.

Antecedentes da Invenção

1. Campo da invenção:

[001] A presente invenção refere-se a um método e dispositivo para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado.

[002] Este método e dispositivo de processamento posterior podem ser aplicados, em particular mas não de forma exclusiva, à codificação digital de sinais de som (incluindo fala). Por exemplo, este método e dispositivo de processamento posterior também podem ser aplicados ao caso mais geral de aperfeiçoamento de sinal onde a fonte de ruído pode ser a partir de qualquer meio ou sistema, não necessariamente relacionado ao ruído de codificação ou de quantização.

2. Breve descrição da tecnologia atual:

2.1 Codificadores de fala [003] Os codificadores de fala são amplamente utilizados nos sistemas de comunicações digitais para de forma eficiente transmitir e / ou armazenar sinais de fala. Nos sistemas digitais, o sinal de fala de entrada analógico são primeiro amostrados em uma taxa de amostra apropriada e as amostras de fala sucessivas são adicionalmente processadas no domínio digital. Em particular, um codificador de fala recebe as amostras de fala como uma entrada e gera um fluxo de bits de saída comprimido para ser transmitido através de um canal ou armazenado em um meio de armazenamento apropriado. No receptor, um decodificador de fala recebe o fluxo de bits como uma entrada e produz um sinal de fala reconstruído de saída.

[004] Para ser útil, um codificador de fala deve produzir um fluxo

Petição 870170072504, de 27/09/2017, pág. 21/63

2/27 de bits comprimido com uma taxa de bits menor do que a taxa de bits do sinal de fala de entrada digital, amostrado. Os codificadores de fala do estado da técnica tipicamente alcançam uma taxa de compactação de pelo menos 16 até 1 e ainda permitem a decodificação de fala de alta qualidade. Vários destes codificadores de fala do estado da técnica são baseados no modelo CELP (Previsão Linear de Código Estimulado), com diferentes variantes, dependendo do algoritmo.

[005] Na codificação CELP, o sinal de fala digital é processado em blocos sucessivos de amostras de fala chamados quadros. Para cada quadro, o codificador extrai a partir das amostras de fala digitais uma série de parâmetros que são digitalmente codificados e então transmitidos e / ou armazenados. O decodificador é projetado para processar os parâmetros recebidos para reconstruir ou sintetizar o dado quadro do sinal de fala. Tipicamente, os seguintes parâmetros são extraídos a partir das amostras de fala digitais por um codificador CELP:

- Coeficientes de Previsão Linear (coeficientes LP), transmitidos em um domínio transformado tal como as Frequências Espectrais de Linha (LSF) ou Frequências de Emissão de Espectro (ISF);

- Parâmetros de altura de som, incluindo um atraso de altura de som (ou retardo) e um ganho de altura de som; e

- Parâmetros de excitação inovadores (índice e ganho de livro de código fixo).

[006] Os parâmetros de altura de som e os parâmetros de excitação inovadores juntos descrevem o que é chamado de sinal de excitação. Este sinal de excitação é fornecido como uma entrada para um filtro de Previsão Linear (LP) descrito pelos coeficientes LP. O filtro LP pode ser visto como um modelo do trato vocal, ao passo que o sinal de excitação pode ser visto como a saída da glote. Os coeficientes LP ou

Petição 870170072504, de 27/09/2017, pág. 22/63

3/27

LSF são tipicamente calculados e transmitidos em todos os quadros, ao passo que os parâmetros de altura de som e de excitação inovadora são calculados e transmitidos várias vezes por quadro. De forma mais específica, cada quadro é dividido em vários blocos de sinal denominados subquadros e os parâmetros de altura de som e os parâmetros de excitação inovadora são calculados e transmitidos em cada subquadro. Cada quadro tipicamente possui uma duração de 10 até 30 milissegundos, ao passo que um subquadro tipicamente possui uma duração de 5 milissegundos.

[007] Vários padrões de codificação de fala são baseados no modelo CELP Algébrico (ACELP) e de forma mais precisa no algoritmo ACELP. Uma dentre as principais características do ACELP é o uso de livros de código algébricos para codificar a excitação inovadora em cada subquadro. Um livro de código algébrico divide um subquadro em um conjunto de trilhas de posições de pulso intercaladas. Somente poucos pulsos por trilha de amplitude diferente de zero são permitidos e cada pulso de amplitude diferente de zero é restrito às posições da trilha correspondente. O codificador utiliza algoritmos de busca rápida para encontrar as posições e amplitudes ótimas de pulso para os pulsos de cada subquadro. Uma descrição do algoritmo ACELP pode ser encontrada no artigo de R. SALAMI et al., Design and description of CS-ACELP: a toll quality 8kb/s speech coder, IEEE Trans. On Speech and Audio Proc., Vol. 6, No. 2, páginas 116 à 130, Março de 1998, aqui dentro incorporado por referência e o qual descreve o algoritmo de codificação de fala de banda estreita ITU-T G.729 CS-ACELP em 8 kbits / segundo. Deve ser notado que existem várias variações da busca de livro de código de inovação ACELP, dependendo do padrão de conceito. A presente invenção não é dependente destas variações, desde que ela somente se aplica ao processamento posterior do sinal de fala decodificado (sintetizado).

Petição 870170072504, de 27/09/2017, pág. 23/63

4/27 [008] Um padrão recente baseado no algoritmo ACELP é o algoritmo de codificação de fala ETSI/3GPP AMR-WB, o qual também foi adotado pelo ITU-T (Setor de Padronização de Telecomunicação da ITU (União Internacional de Telecomunicação)) como recomendação G.722.2 [ Recomendação ITU-T G.722.2 Wideband coding of speech at around 16 kbits/s using Adaptive Multi-Rate Wideband (AMR-WB), Geneva, 2002], [3GPP TS 26.190, AMR Wideband Speech Codec: Transcoding Functions, Especificação Técnica 3GPP]. O AMR-WB é um algoritmo de múltiplas taxas projetado para operar em nove diferentes taxas de bits entre 6,6 e 23,85 kbits/segundo. Aqueles versados na técnica sabem que a qualidade de fala decodificada geralmente aumenta com a taxa de bits. O AMR-WB tem sido projetado para permitir aos sistemas de comunicação de celular reduzirem a taxa de bits do codificador de fala no caso de condições ruins de canal; os bits são convertidos em bits de codificação de canal para aumentar a proteção dos bits transmitidos. Desta maneira, a qualidade geral dos bits transmitidos pode ser mantida maior do que no caso onde o codificador de fala opera em uma taxa única de bit fixa.

[009] A Figura 7 é um diagrama de bloco esquemático apresentando o princípio do decodificador AMR-WB. De forma mais específica, a Figura 7 é uma representação de alto nível do decodificador, enfatizando o fato de que o fluxo de bits recebido codifica o sinal de fala somente até 6,4 kHz (frequência de amostra de 12,8 kHz) e as frequências maiores do que 6,4 kHz são sintetizadas no decodificador a partir dos parâmetros de banda inferior. Isto implica em que, no codificador, o sinal de fala amostrado em 16 kHz de banda larga original foi primeiro amostrado para baixo para a frequência de amostra de 12,8 kHz, utilizando técnicas de conversão de múltiplas taxas bem conhecidas para aqueles versados na técnica. O decodificador de parâmetro 701 e o decodificador de fala 702 da Figura 7 são análogos em relação ao

Petição 870170072504, de 27/09/2017, pág. 24/63

5/27 decodificador de parâmetro 106 e o decodificador fonte 107 da Figura 1. O fluxo de bits recebido 709 é primeiro decodificado pelo decodificador de parâmetro 701 para recuperar os parâmetros 710 fornecidos para o decodificador de fala 702 para ressintetizar novamente o sinal de fala. No caso específico do decodificador AMR-WB, estes parâmetros são:

- Coeficientes ISF para cada quadro de 20 milissegundos;

- Um atraso de altura de som inteiro T0, um valor de altura de som fracionário T0_frac ao redor de T0 e um ganho de altura de som para cada subquadro de 5 milissegundos; e

- Um formato de livro de código algébrico (posições e sinais de pulso) e ganho para cada subquadro de 5 milissegundos.

[0010] A partir dos parâmetros 710, o decodificador de fala 702 é projetado para sintetizar um dado quadro de sinal de fala para frequências iguais e inferiores à 6,4 kHz e deste modo produzir um sinal de fala sintetizado de banda baixa 712 na frequência de amostra de 12,8 kHz. Para recuperar o sinal de banda completo correspondendo à frequência de amostra de 16 kHz, o decodificador AMR-WB compreende um processador de ressíntese de banda alta 707 responsivo aos parâmetros decodificados 710 a partir do decodificador de parâmetro 701 para sintetizar novamente um sinal de banda alta 711 na frequência de amostra de 16kHz. Os detalhes do processador de ressíntese de sinal de banda alta 707 podem ser encontrados nas publicações seguintes que são aqui dentro incorporadas por referência:

- Recomendação ITU-T G.722.2 Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMRWB), Geneva, 2002; e

- 3GPP TS 26.190, AMR Wideband Speech Codec: Transcoding Functions, 3GPP Technical Specification.

[0011] A saída do processador de ressíntese de banda alta 707,

Petição 870170072504, de 27/09/2017, pág. 25/63

6/27 referida como o sinal de banda alta 711 da Figura 7 é um sinal na frequência de amostra de 16 kHz, possuindo uma energia concentrada acima de 6,4 kHz. O processador 708 soma o sinal de banda alta 711 com um sinal de fala de banda baixa amostrado para cima de 16-kHz 713 para formar o sinal de fala decodificado completo 714 do decodificador AMR-WB na frequência de amostra de 16 kHz.

2.2 Necessidade de processamento posterior [0012] Sempre que um codificador de fala é utilizado em um sistema de comunicação, o sinal sintetizado ou decodificado nunca é idêntico ao sinal de fala original mesmo na ausência de erros de transmissão. Quanto maior a taxa de compactação, maior a distorção introduzida pelo codificador. Esta distorção pode ser feita subjetivamente pequena utilizando diferentes maneiras de se abordar. Uma primeira maneira de se abordar é condicionar o sinal no codificador para melhor descrever, ou codificar, informação subjetivamente relevante no sinal de fala. O uso de um filtro de ponderação formante, geralmente representado como W(z) é um exemplo amplamente utilizado desta primeira maneira de se abordar [B, Kleijn e K. Paliwal editores, «Speech Coding and Synthesis, » Elsevier, 1995]. Este filtro W(z) é tipicamente feito adaptável e é calculado de modo tal que ele reduz a energia do sinal próxima aos formantes espectrais, deste modo aumentando a energia relativa das bandas de energia inferiores. O codificador pode então melhor quantizar bandas de energia inferior, o que de outro modo seria mascarado pelo ruído de codificação, aumentando a distorção percebida. Outro exemplo de condicionamento de sinal no codificador é o então denominado filtro de aguçamento de altura de som, o qual aperfeiçoa a estrutura harmônica do sinal de excitação no codificador. O aguçamento da altura de som almeja assegurar que o nível de ruído inter-harmônico seja mantido baixo o suficiente no senso de percepção.

Petição 870170072504, de 27/09/2017, pág. 26/63

7/27 [0013] Uma segunda maneira de se abordar para minimizar a distorção percebida introduzida por um codificador de fala é aplicar um então denominado algoritmo de processamento posterior. O processamento posterior é aplicado no decodificador, como apresentado na Figura 1. Na Figura 1, o codificador de fala 101 e o decodificador de fala 105 são divididos em dois módulos. No caso do codificador de fala 101, um codificador fonte 102 produz uma série de parâmetros de codificação de fala 109 para serem transmitidos ou armazenados. Estes parâmetros 109 são então codificados em binário pelo codificador de parâmetro 103 utilizando um método de codificação específico, dependendo do algoritmo de codificação de fala e dos parâmetros a serem codificados. O sinal de fala codificado (parâmetros codificados em binário) 110 é então transmitido para o decodificador através de um canal de comunicação 104. No decodificador, o fluxo de bits recebido 111 é primeiro analisado por um decodificador de parâmetro 106 para decodificar os parâmetros de codificação do sinal de som codificados, recebidos, os quais são então utilizados pelo decodificador fonte 107 para gerar o sinal de fala sintetizado 112. O objetivo do processamento posterior (ver processador posterior 108 da Figura 1) é para aperfeiçoar a informação de forma perceptiva relevante no sinal de fala sintetizado, ou de forma equivalente para reduzir ou remover a informação de forma perceptiva importuna. Duas formas comumente utilizadas de processamento posterior são o processamento posterior formante e o processamento posterior de altura de som. No primeiro caso, a estrutura formante do sinal de fala sintetizado é amplificada pelo uso de um filtro adaptável com uma resposta de frequência correlacionada com os formantes de fala. Os picos espectrais do sinal de fala sintetizado são então acentuados à custa dos vales espectrais cuja energia relativa se torna menor. No caso do processamento posterior de altura de som, um filtro adaptável também é aplicado para o sinal de fala sintetizado.

Petição 870170072504, de 27/09/2017, pág. 27/63

8/27

Entretanto, neste caso a resposta de frequência do filtro é correlacionada com a estrutura espectral fina, a saber, os harmônicos. Um filtro posterior de altura de som então acentua os harmônicos à custa da energia inter-harmônica, a qual se torna relativamente menor. Observe que a resposta de frequência de um filtro posterior de altura de som tipicamente abrange toda a faixa de frequência. O impacto é que uma estrutura harmônica é imposta na fala processada posteriormente mesmo em bandas de frequência que não exibem uma estrutura harmônica na fala decodificada. Esta não é uma maneira de se abordar de forma perceptiva ótima para a fala de banda larga (fala amostrada em 16 kHz), a qual raramente exibe uma estrutura periódica em toda a faixa de frequência.

Sumário da Invenção [0014] A presente invenção refere-se a um método para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado, compreendendo dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda e aplicar o processamento posterior para pelo um dos sinais de frequência de sub-banda, mas não para todos os sinais de frequência de sub-banda.

[0015] A presente invenção também envolve um dispositivo para processar posteriormente um sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado, compreendendo dispositivo para dividir o sinal de som codificado em uma pluralidade de sinais de frequência de sub-banda e dispositivos para processar posteriormente pelo menos um dos sinais de frequência de sub-banda, mas não todos sinais de frequência de sub-banda. [0016] De acordo com uma modalidade ilustrativa, após o processamento posterior de pelo menos um sinal de sub-banda de frequência mencionado acima, os sinais de frequência de sub-banda são somaPetição 870170072504, de 27/09/2017, pág. 28/63

9/27 dos para produzir um sinal de som de saída decodificado processado posteriormente.

[0017] Por conseqüência, o método e dispositivo de processamento posterior tornam possível localizar o processamento posterior nas sub-bandas desejadas e deixar virtualmente inalteradas outras subbandas.

[0018] A presente invenção adicionalmente refere-se a um decodificador de sinal de som compreendendo uma entrada para receber um sinal de som codificado, um decodificador de parâmetro fornecido com o sinal de som codificado para decodificar os parâmetros de codificação de sinal de som, um decodificador de sinal de som fornecido com os parâmetros de codificação de sinal de som decodificados para produzir um sinal de som decodificado e um dispositivo de processamento posterior como descrito acima para processar posteriormente o sinal de som decodificado em vista de aperfeiçoar uma qualidade percebida deste sinal de som decodificado.

[0019] O dito acima e outros objetivos, vantagens e características da presente invenção irão se tornar mais aparentes quando da leitura da descrição não restritiva seguinte das modalidades ilustrativas da mesma, somente dadas à título de exemplo com referência aos desenhos acompanhantes.

Breve Descrição dos Desenhos nos desenhos anexos:

[0020] A Figura 1 é um diagrama de bloco esquemático da estrutura de alto nível de um exemplo de um sistema codificador / decodificador de fala utilizando processamento posterior no decodificador;

[0021] A Figura 2 é um diagrama de bloco esquemático apresentando o princípio geral de uma modalidade ilustrativa da presente invenção utilizando um banco de filtros adaptáveis e filtros de sub-banda, no qual a entrada dos filtros adaptáveis é o sinal (linha sólida) de fala

Petição 870170072504, de 27/09/2017, pág. 29/63

10/27 decodificado (sintetizado) e os parâmetros decodificados (linha pontilhada);

[0022] A Figura 3 é um diagrama de bloco esquemático de um aperfeiçoador de altura de som de duas bandas, o que constitui um caso especial da modalidade ilustrativa da Figura 2;

[0023] A Figura 4 é um diagrama de bloco esquemático de uma modalidade ilustrativa da presente invenção, como aplicado para o caso especial do decodificador de fala de banda larga AMR-WB;

[0024] A Figura 5 é um diagrama de bloco esquemático de uma implementação alternativa da modalidade ilustrativa da Figura 4;

[0025] A Figura 6a é um gráfico ilustrando um exemplo de espectro e de um sinal processado anteriormente;

[0026] A Figura 6b é um gráfico ilustrando um exemplo de espectro do sinal processado posteriormente obtido quando utilizando o método descrito na Figura 3;

[0027] A Figura 7 é um diagrama de bloco esquemático apresentando o princípio da operação do decodificador 3GPP AMR-WB;

[0028] As Figuras 8a e 8b são gráficos apresentando um exemplo da resposta de frequência de um filtro aperfeiçoador de altura de som como descrito pela Equação (1), com o caso especial de um período de altura de som de T=10 amostras;

[0029] A Figura 9a é um gráfico apresentando um exemplo de resposta de frequência para o filtro de banda baixa 404 da Figura 4;

[0030] A Figura 9b é um gráfico apresentando um exemplo de resposta de frequência para o filtro de banda de passagem 407 da Figura 4;

[0031] A Figura 9c é um gráfico apresentando um exemplo de resposta de frequência combinada para o filtro de banda baixa 404 e para os filtros de banda de passagem 407 da Figura 4; e [0032] A Figura 10 é um gráfico apresentando um exemplo da resPetição 870170072504, de 27/09/2017, pág. 30/63

11/27 posta de frequência de um filtro inter-harmônico como descrito pela Equação (2) e utilizada no filtro inter-harmônico 503 da Figura 5, para o caso específico de T = 10 amostras.

Descrição Detalhada das Modalidades Ilustrativas [0033] A Figura 2 é um diagrama de bloco esquemático ilustrando o princípio geral de uma modalidade ilustrativa da presente invenção. [0034] Na Figura 1, o sinal de entrada (sinal no qual o processamento posterior é aplicado) é o sinal de fala decodificado (sintetizado)

112 produzido pelo decodificador de fala 105 (Figura 1) no receptor de um sistema de comunicações (saída do decodificador fonte 107 da Figura 1). O objetivo é produzir um sinal de fala decodificado processado posteriormente na saída 113 do processador posterior 108 da Figura 1 (o qual também é a saída do processador 203 da Figura 2) com qualidade percebida aperfeiçoada. Isto é alcançado por se primeiro aplicar pelo menos uma e possivelmente mais do que uma, operação de filtragem adaptável para o sinal de entrada 112 (ver filtros adaptáveis 201a, 201b,.., 201N). Estes filtros adaptáveis serão descritos na descrição seguinte. Deve ser salientado aqui que alguns dos filtros adaptáveis 201a até 201N podem ser funções triviais, quando requeridas, por exemplo com a saída igual à entrada. A saída 204a, 204b,..., 204N de cada filtro adaptável 201a, 201b,..., 201N é então filtrada por banda de passagem através de um filtro de sub-banda 202a, 202b,..., 202N, respectivamente e o sinal de fala decodificado processado posteriormente

113 é obtido por adicionar através de um processador 203 as saídas resultantes respectivas 205a, 205b,..., 205N dos filtros de sub-banda 202a, 202b,..., 202N.

[0035] Em uma modalidade ilustrativa, uma decomposição de duas bandas é utilizada e a filtragem adaptável é aplicada somente para a banda inferior. Isto resulta em um processamento posterior total que é mais almejado e frequências próximas aos primeiros harmônicos do

Petição 870170072504, de 27/09/2017, pág. 31/63

12/27 sinal de fala sintetizado.

[0036] A Figura 3 é um diagrama de bloco esquemático de um aperfeiçoador de altura de som de duas bandas, o qual constitui um caso especial da modalidade ilustrativa da Figura 2. De forma mais específica, a Figura 3 apresenta as funções básicas de um processador posterior de duas bandas (ver o processador posterior 108 da Figura 1). De acordo com esta modalidade ilustrativa, somente o aperfeiçoamento de altura de som é considerado como processamento posterior, apesar de outros tipos de que processamento posterior poderiam ser contemplados. Na Figura 3, o sinal de fala decodificado (assumido para ser a saída 112 do decodificador 107 da Figura 1) é fornecido através de um par de sub-ramificações 308 e 309.

[0037] Na ramificação superior 308, o sinal de fala decodificado 112 é filtrado por um filtro de banda alta 301 para produzir o sinal de banda superior 310 (sH). Neste exemplo específico, nenhum filtro adaptável é utilizado na ramificação superior. Na ramificação inferior 309, o sinal de fala decodificado 112 é primeiro processado através de um filtro adaptável 307 compreendendo um filtro de banda baixa opcional 302, um módulo de rastreamento de altura de som 303 e um aperfeiçoador de altura de som 304 e então filtrado através de um filtro de banda baixa 305 para obter o sinal processado posteriormente de banda inferior 311 (slef). O sinal de fala decodificado processado posteriormente 113 é obtido por adicionar através de um adicionador 306 os sinais processados posteriormente de banda inferior 311 e superior 312 a partir da saída do filtro de banda baixa 305 e do filtro de banda alta 301, respectivamente. Deve ser salientado que os filtros de banda baixa 305 e de banda alta 301 poderiam ser de vários tipos diferentes, por exemplo, Resposta de Impulso Infinita (UR) ou Resposta de Impulso Finita (FIR). Nesta modalidade ilustrativa, os filtros FIR de fase linear são utilizados.

Petição 870170072504, de 27/09/2017, pág. 32/63

13/27 [0038] Portanto, o filtro adaptável 307 da Figura 3 é composto de dois e possivelmente de três processadores, o filtro de banda baixa opcional 302 similar em relação ao filtro de banda baixa 305, o módulo de rastreamento de altura de som 303 e o aperfeiçoador de altura de som 304.

[0039] O filtro de banda baixa 302 pode ser omitido, mas ele é incluído para permitir a visualização do processamento posterior da Figura 3 como uma decomposição de duas bandas seguida pela filtragem específica em cada sub-banda. Após a filtragem de banda baixa opcional (filtro 302) do sinal de fala decodificado 112 na banda inferior, o sinal resultante Sl é processado através do aperfeiçoador de altura de som 304. O objetivo do aperfeiçoador de altura de som 304 é reduzir o ruído inter-harmônico no sinal de fala decodificado. Na modalidade ilustrativa presente, o aperfeiçoador de altura de som 304 é alcançado por um filtro linear de tempo variante descrito pela seguinte equação:

*^n}=(,4,+rB (1) onde a é um coeficiente que controla a atenuação inter-harmônica, T é o período de altura de som do sinal de entrada x[n], e y[n] é o sinal de saída do aperfeiçoador de altura de som. Uma equação mais geral também poderia ser utilizada onde as derivações do filtro em n-T e n+T poderiam ser em atrasos diferentes (por exemplo, n-T1 e n+T2). Os parâmetros T e a variam com o tempo e são dados pelo módulo de rastreamento de altura de som 303. Com um valor de a = 1, o ganho do filtro descrito pela Equação (1) é exatamente 0 em frequências 1/(2T),3/(2T), 5/(2T), etc., isto é, no ponto médio entre as frequências harmônicas 1/T, 3/T, 5/T, etc. Quando a aproxima-se de 0, a atenuação entre os harmônicos produzidos pelo filtro da Equação (1) reduzse. Com um valor de a = 0, a saída do filtro é igual à sua entrada. A

Petição 870170072504, de 27/09/2017, pág. 33/63

14/27

Figura 8 apresenta a resposta de frequência (em dB) do filtro descrito pela Equação (1) para os valores a = 0,8 e 1, quando o atraso de altura de som é (arbitrariamente) estabelecido em um valor de T = 10 amostras. O valor de a pode ser calculado utilizando várias maneiras de se abordar. Por exemplo, a correlação de altura de som normalizada, a qual é bem conhecida por aqueles versados na técnica, pode ser utilizada para controlar o coeficiente a: quanto maior a correlação de altura de som normalizada (quanto mais próximo de 1 ela estiver), maior o valor de a. Um sinal periódico x[n] com um período de T = 10 amostras teria harmônicos no máximo das respostas de frequência da Figura 8, isto é, em frequências normalizadas 0,2, 0,4, etc. É fácil entender a partir da Figura 8 que o aperfeiçoador de altura de som da Equação (1) atenuaria a energia de sinal somente entre seus harmônicos e que os componentes harmônicos não seriam alterados pelo filtro. A Figura 8 também apresenta que variar o parâmetro a permite o controle da quantidade de atenuação inter-harmônica proporcionada pelo filtro da Equação (1). Observe que a resposta de frequência do filtro da Equação (1), apresentada na Figura 8, estende-se para todas as frequências do espectro.

[0040] Desde que o período de altura de som de um sinal de fala varie com o tempo, o valor de altura de som T do aperfeiçoador de altura de som 304 por conseqüência tem que variar. O módulo de rastreamento de altura de som 303 é responsável por proporcionar o valor de altura de som adequado T para o aperfeiçoador de altura de som 304, para cada quadro do sinal de fala decodificado que tem que ser processado. Para este propósito, o módulo de rastreamento de altura de som 303 recebe como entrada não somente as amostras de fala decodificadas mas também os parâmetros decodificados 114 a partir do decodificador de parâmetro 106 da Figura 1.

[0041] Desde que um codificador de fala típico extraia, para cada

Petição 870170072504, de 27/09/2017, pág. 34/63

15/27 subquadro de fala, um atraso de altura de som que nós chamamos de To e possivelmente um valor fracionário Tü_f_rac utilizado para interpolar a contribuição de livro de código adaptável para a resolução de amostra fracionária, o módulo de rastreamento de altura de som 303 pode então utilizar este atraso de altura de som decodificado para focalizar o rastreamento de altura de som no decodificador. Uma possibilidade é utilizar T0 e T0_frac diretamente no aperfeiçoador de altura de som 304, explorando o fato de que o codificador já executou o rastreamento de altura de som. Outra possibilidade, utilizada nesta modalidade ilustrativa, é recalcular o rastreamento de altura de som no decodificador focalizando nos valores ao redor e nos múltiplos ou submúltiplos do valor de altura de som decodificado T0. O módulo de rastreamento de altura de som 303 então proporciona um atraso de altura de som T para o aperfeiçoador de altura de som 304, o qual utiliza este valor de T na Equação (1) para o quadro presente do sinal de fala decodificado. A saída é o sinal sLE.

[0042] O sinal aperfeiçoado de altura de som sLE é então filtrado por banda baixa através do filtro 305 para isolar as frequências baixas do sinal aperfeiçoado de altura de som sle e para remover os componentes de alta frequência que surgem quando o filtro aperfeiçoador de altura de som da Equação (1) é variado com o tempo, de acordo com o atraso de altura de som T, nos limites de quadro de fala decodificado. Isto produz o sinal processado posteriormente de banda inferior slef, o qual pode agora ser adicionado ao sinal de banda superior sH no adicionador 306. O resultado é o sinal de fala decodificado processado posteriormente 113, com ruído inter-harmônico reduzido na banda inferior. A banda de frequência onde o aperfeiçoamento de altura de som será aplicado depende da frequência de interrupção do filtro de banda baixa 305 (e opcionalmente no filtro de banda baixa 302).

[0043] As Figuras 6a e 6b apresentam um espectro de sinal ilustraPetição 870170072504, de 27/09/2017, pág. 35/63

16/27 tivo ilustrando o efeito do processamento posterior descrito na Figura

3. A Figura 6a é o espectro do sinal de entrada 112 do processador posterior 108 da Figura 1 (sinal de fala decodificado 112 na Figura 3). Neste exemplo ilustrativo, o sinal de entrada é composto de 20 harmônicos, com frequência fundamental fü = 373 Hz escolhida de forma arbitrária, com componentes «ruidosos» adicionados em frequências fo/2, 3fo/2 e 5fo/2. Estes três componentes ruidosos podem ser vistos entre os harmônicos de frequência baixa na Figura 6a. A frequência de amostra é assumida de ser 16 kHz neste exemplo. O aperfeiçoador de altura de som de duas bandas apresentado na Figura 3 e descrito acima é então aplicado ao sinal da Figura 6a. Com uma frequência de amostra de 16 kHz e um sinal periódico de frequência fundamental igual à 373 Hz como na Figura 6a, o módulo de rastreamento de altura de som 303 deve encontrar um período de T = 16000/373 » 43 amostras. Este é o valor que foi utilizado para o filtro aperfeiçoador de altura de som da Equação (1), aplicado para o aperfeiçoador de altura do som 304 da Figura 3. Um valor de a = 0,5 também foi utilizado. Os filtros de banda baixa 305 e de banda alta 301 são filtros FIR de fase linear, simétricos, com 31 derivações. A frequência de interrupção para este exemplo é escolhida como 2000 Hz. Estes valores específicos são dados somente como um exemplo ilustrativo.

[0044] O sinal de fala decodificado processado posteriormente 113 na saída do adicionador 306 possui um espectro apresentado na Figura 6b. Pode ser visto que os sinusóides inter-harmônicos na Figura 6a foram completamente removidos, enquanto os harmônicos do sinal foram praticamente inalterados. Também é observado que o efeito do aperfeiçoador de altura de som diminui à medida que a frequência aproxima-se da frequência de interrupção do filtro da banda baixa (2000 Hz neste exemplo). Então, somente a banda inferior é afetada pelo processamento posterior. Esta é uma característica chave desta

Petição 870170072504, de 27/09/2017, pág. 36/63

17/27 modalidade ilustrativa da presente invenção. Por variar as frequências de interrupção do filtro de banda baixa opcional 302, do filtro de banda baixa 305 e do filtro de banda alta 301, é possível controlar para qual frequência o aperfeiçoamento de altura de som é aplicado.

Aplicação para o decodificador de fala AMR-WB [0045] A presente invenção pode ser aplicada para qualquer sinal de fala sintetizado por um decodificador de fala, ou mesmo para qualquer sinal de fala corrompido por ruído inter-harmônico que precisa ser reduzido. Esta seção irá apresentar uma implementação ilustrativa específica da presente invenção para um sinal de fala decodificado AMRWB. O processamento posterior é aplicado para o sinal de fala sintetizado de banda baixa 712 da Figura 7, isto é, para a saída do decodificador de fala 702, o que produz uma fala sintetizada em uma frequência de amostragem de 12,8 kHz.

[0046] A Figura 4 apresenta o diagrama de bloco de um processador posterior de altura de som quando o sinal de entrada é um sinal de fala sintetizado de banda baixa AMR-WB na frequência de amostragem de 12,8 kHz. De forma mais precisa, o processador posterior apresentado na Figura 4 substitui a unidade de amostragem para cima 703, a qual compreende os processadores 704, 705 e 706. O processador posterior de altura de som da Figura 4 também poderia ser aplicado para o sinal de fala sintetizado amostrado para cima de 16 kHz, mas aplicá-lo para a amostragem para cima reduz o número de operações de filtragem no decodificador e assim reduz a complexidade. [0047] O sinal de entrada (fala sintetizada de banda baixa AMRWB (12,8 kHz)) da Figura 4 é designado como o sinal s. Neste exemplo específico, o sinal s é o sinal de fala sintetizado de banda baixa AMR-WB na frequência de amostragem de 12,8 kHz (saída do processador 702). O processador posterior da altura de som da Figura 4 compreende um módulo de rastreamento de altura de som 401 para

Petição 870170072504, de 27/09/2017, pág. 37/63

18/27 determinar, para cada subquadro de 5 milissegundos, o atraso de altura de som T utilizando os parâmetros decodificados, recebidos 114 (Figura 1) e o sinal de fala sintetizado s. Os parâmetros decodificados utilizados pelo módulo de rastreamento de altura de som são T0, o valor de altura de som inteiro para o subquadro e T0_frac, o valor de altura de som fracionário para a resolução de subamostra. O atraso de altura de som T calculado no módulo de rastreamento de altura de som 401 será utilizado nas próximas etapas para aperfeiçoamento da altura de som. Seria possível utilizar diretamente os parâmetros de altura de som decodificados, recebidos T0 e T0_frac para formar o atraso T utilizado pelo aperfeiçoador de altura de som no filtro de altura do som 402. Entretanto, o módulo de rastreamento de altura de som 401 é capaz de corrigir múltiplos ou submúltiplos de altura de som, o que poderia ter um efeito prejudicial no aperfeiçoamento da altura de som.

[0048] Uma modalidade ilustrativa do algoritmo de rastreamento de altura de som para o módulo 401 é o que se segue (os valores rastreados de altura de som e de limiares específicos são dados somente à título de exemplo):

- Em primeiro lugar, a informação de altura de som decodificada (atraso de altura de som T0) é comparada com um valor armazenado do atraso de altura de som decodificado T_prev do quadro anterior. O T_prev pode ter sido modificado por algumas das seguintes etapas de acordo com o algoritmo de rastreamento de altura de som. Por exemplo, se T0 < 1,16*T_prev então vá para caso 1 abaixo, senão se T0 > 1,16*T_prev, então estabeleça T_temp = T0 e vá para caso 2 abaixo.

[0049] Caso 1: Em primeiro lugar, calcular a correlação cruzada C2 (produto cruzado) entre o último subquadro sintetizado e o sinal de síntese iniciando em T0/2 amostras antes do começo do último subquadro (observe a correlação na metade do valor de altura de som

Petição 870170072504, de 27/09/2017, pág. 38/63

19/27 decodificado).

[0050] Então, calcular a correlação cruzada C3 (produto cruzado) entre o último subquadro sintetizado e o sinal de síntese iniciando em T0/3 amostras antes do começo do último subquadro (observe a correlação em um terço do valor de altura de som decodificado).

[0051] Então, selecione o valor máximo entre C2 e C3 e calcule a correlação normalizada Cn (versão normalizada de C2 ou C3) no submúltiplo correspondente de T0 (em T0/2 se C2 > C3 e em T0/3 se C3 > C2). Chamar T_new, o submúltiplo de altura de som correspondendo à maior correlação normalizada.

[0052] Se Cn > 0,95 (correlação normalizada forte), o novo período de altura de som é T_new (ao invés de T0). Emitir o valor T = T_new a partir do módulo de rastreamento de altura de som 401. Salvar T_prev = T para o próximo rastreamento de altura de som do subquadro e sair do módulo de rastreamento de altura de som 401.

[0053] Se 0,7 < Cn < 0,95, então salvar T_temp = T0/2 ou T0/3 (de acordo com C2 ou C3 acima) para comparações no caso 2 abaixo. Senão, se Cn < 0,7 salvar T_temp = T0.

[0054] Caso 2: Calcular todos os valores possíveis na taxa Tn = [T_temp/n], onde [x] significa a parte inteira de x e n = 1,2,3, etc. é um inteiro.

[0055] Calcular todos as correlações cruzadas Cn nos submúltiplos de atraso de altura de som Tn. Reter Cn_max como a correlação cruzada máxima dentre todos os Cn. Se n > 1 e Cn > 0,8, emitir Tn como a saída do período de altura de som T da unidade de rastreamento de altura de som 401. Senão, emitir T1 = T_temp. Aqui, o valor de T_temp irá depender dos cálculos no Caso 1 acima.

[0056] Deve ser notado que o exemplo acima do módulo de rastreamento de altura de som 401 é dado para propósito somente de ilustração. Qualquer outro método ou dispositivo de rastreamento de

Petição 870170072504, de 27/09/2017, pág. 39/63

20/27 altura de som poderia ser implementado no módulo 401 (ou 303 e 502) para garantir um melhor rastreamento de altura de som no decodificador.

[0057] Portanto, a saída do módulo de rastreamento de altura de som é o período T a ser utilizado no filtro de altura de som 402, o qual é descrito nesta modalidade preferida pelo filtro da Equação (1). Novamente, um valor de a = 0 implica em nenhuma filtragem (a saída do filtro de altura de som 402 é igual à sua entrada) e um valor de a = 1 corresponde à maior quantidade de aperfeiçoamento de altura de som. [0058] Uma vez que o sinal aperfeiçoado Se (Figura 4) é determinado, ele é combinado com o sinal de entrada s de modo que, como na Figura 3, somente a banda inferior seja sujeita ao aperfeiçoamento de altura de som. Na Figura 4, uma maneira de se abordar modificada é utilizada, comparada com a Figura 3. Desde que o processador posterior de altura de som da Figura 4 substitui a unidade de amostragem para cima 703 na Figura 7, os filtros de sub-banda 301 e 305 da Figura 3 são combinados com o filtro de interpolação 705 da Figura 7 para minimizar o número de operações de filtragem e o atraso da filtragem. De forma mais específica, os filtros 404 e 407 da Figura 4 agem tanto como filtros de banda de passagem (para separar as bandas de frequência) como filtros de interpolação (para amostragem para cima de 12,8 até 16 kHz). Estes filtros 404 e 407 poderiam ser adicionalmente projetados de modo que o filtro de banda de passagem 407 possua constrangimentos relaxados em sua banda de parada de frequência baixa (isto é, ele não tem que atenuar completamente o sinal em frequências baixas). Isto poderia ser alcançado por utilizar constrangimentos de projeto similares à estes apresentados na Figura 9. A Figura 9a é um exemplo de resposta de frequência para o filtro de banda baixa 404. Deve ser notado que o ganho DC (Corrente Direta) deste filtro é 5 (ao invés de 1), desde que este filtro também age como um

Petição 870170072504, de 27/09/2017, pág. 40/63

21/27 filtro de interpolação, com uma proporção de interpolação de 5/4, o que implica que o ganho do filtro deve ser 5 em 0 Hz. Então, a Figura 9b apresenta a resposta de frequência do filtro da banda de passagem 407 tornando este filtro 407 complementar, na banda baixa, para o filtro de banda baixa 404. Neste exemplo, o filtro 407 é um filtro de banda de passagem, não um filtro de banda alta tal como o filtro 301, desde que ele deve agir tanto como um filtro de banda alta (tal como o filtro 301) como um filtro de banda baixa (tal como o filtro de interpolação 705). Referindo-se novamente à Figura 9, será visto que os filtros de banda baixa e de banda de passagem 404 e 407 são complementares quando considerados em paralelo, como na Figura 4. Sua resposta de frequência combinada (quando utilizada em paralelo) é apresentada na Figura 9c.

[0059] Para melhor explicar, as tabelas dos coeficientes de filtro utilizados nesta modalidade ilustrativa dos filtros 404 e 407 são dadas abaixo. Sem dúvidas, estas tabelas de coeficientes de filtro são dadas somente a título de exemplo. Deve ser entendido que estes filtros podem ser substituídos sem modificar o escopo, espírito e natureza da presente invenção.

Tabela 1. Coeficientes de banda baixa do filtro 404

hlp[0]	0.04375000000000	hlp[30]	0.01998000000000
hlp[1]	0.04371500000000	hlp[3l]	0.01882400000000
hlp[2]	0.04361200000000	hlp[32]	0.01768200000000
hlp[3]	0.04344000000000	hlp[33]	0.01655700000000
hlp[4]	0.04320000000000	hlp[34]	0.01545100000000
hlp[5]	0.04289300000000	hlp[35]	0.01436900000000
hlp[6]	0.04252100000000	hlp[36]	0.01331200000000
hlp[7]	0.04208300000000	hlp[37]	0.01228400000000
hlp[8]	0.04158200000000	hlp[38]	0.01128600000000

Petição 870170072504, de 27/09/2017, pág. 41/63

22/27

hlp[9]	0.04102000000000	hlp[39]	0.01032300000000
hlp[10]	0.04039900000000	hlp[ 40]	0.00939500000000
hlp[11]	0.03972100000000	hlp[41]	0.00850500000000
hlp[12]	0.03898800000000	hlp[ 42]	0.00765500000000
hlp[13]	0.03820200000000	hlp[ 43]	0.00684600000000
hlp[14]	0.03736700000000	hlp[ 44]	0.00608100000000
hlp[15]	0.03648600000000	hlp[ 45]	0.00535900000000
hlp[16]	0.03556100000000	hlp[ 46]	0.00468200000000
hlp[17]	0.03459600000000	hlp[ 47]	0.00405100000000
hlp[18]	0.03359400000000	hlp[ 48]	0.00346700000000
hlp[19]	0.03255800000000	hlp[ 49]	0.00292900000000
hlp[20]	0.03149200000000	hlp[50]	0.00243900000000
hlp[21]	0.03039900000000	hlp[51]	0.00199500000000
hlp[22]	0.02928400000000	hlp[ 52]	0.00159900000000
hlp[23]	0.02814900000000	hlp[53]	0.00124800000000
hlp[24]	0.02699900000000	hlp[54]	0.00094400000000
hlp[25]	0.02583700000000	hlp[55]	0.00068400000000
hlp[26]	0.02466700000000	hlp[56]	0.00046800000000
hlp[27]	0.02349300000000	hlp[ 57]	0.00029500000000
hlp[28]	0.02231800000000	hlp[58]	0.00016300000000
hlp[29]	0.02114600000000	hlp[59]	0.00007100000000
		hlp[ 60]	0.00001800000000

Tabela 2. Coeficientes de banda de passagem do filtro 407

hbp[0]	0.95625000000000	hbp[30]	-0.01998000000000
hbp[1]	0.89115400000000	hbp[31]	-0.00412400000000
hbp[2]	0.71120900000000	hbp[32]	0.00414300000000
hbp[3]	0.45810600000000	hbp[33]	0.00343300000000
hbp[4]	0.18819900000000	hbp[34]	-0.00416100000000
hbp[5]	-0.04289300000000	hbp[35]	-0.01436900000000

Petição 870170072504, de 27/09/2017, pág. 42/63

23/27

hbp[6]	-0.19474300000000	hbp[36]	-0.02267300000000
hbp[7]	-0.25136900000000	hbp[37]	-0.02601800000000
hbp[8]	-0.22287200000000	hbp[38]	-0.02370000000000
hbp[9]	-0.13948000000000	hbp[39]	-0.01723200000000
hbp[10]	-0.04039900000000	hbp[ 40]	-0.00939500000000
hbp[11]	0.03868100000000	hbp[41]	-0.00297000000000
hbp[12]	0.07548400000000	hbp[ 42]	0.00030500000000
hbp[13]	0.06566500000000	hbp[ 43]	0.00019000000000
hbp[14]	0.02113800000000	hbp[ 44]	-0.00226000000000
hbp[15]	-0.03648600000000	hbp[ 45]	-0.00535900000000
hbp[16]	-0.08465300000000	hbp[ 46]	-0.00756800000000
hbp[17]	-0.10763400000000	hbp[ 47]	-0.00805800000000
hbp[18]	-0.10087600000000	hbp[ 48]	-0.00687000000000
hbp[19]	-0.07091900000000	hbp[49]	-0.00469500000000
hbp[20]	-0.03149200000000	hbp[ 50]	-0.00243900000000
hbp[21]	0.00234200000000	hbp[51]	-0.00080600000000
hbp[22]	0.01970000000000	hbp[52]	-0.00006300000000
hbp[23]	0.01715300000000	hbp[53]	-0.00005300000000
hbp[24]	-0.00110700000000	hbp[54]	-0.00038700000000
hbp[25]	-0.02583700000000	hbp[55]	-0.00068400000000
hbp[26]	-0.04678900000000	hbp[ 56]	-0.00074400000000
hbp[27]	-0.05654900000000	hbp[57]	-0.00057600000000
hbp[28]	-0.05281800000000	hbp[58]	-0.00031900000000
hbp[29]	-0.03851900000000	hbp[59]	-0.00011300000000
		hbp[60]	-0.00001800000000

[0060] A saída do filtro de altura de som 402 da Figura 4 é chamada Se. Para ser recombinada com o sinal da ramificação superior, ela é primeiro amostrada para cima pelo processador 403, pelo filtro de banda baixa 404 e pelo processador 405 e adicionada através de um

Petição 870170072504, de 27/09/2017, pág. 43/63

24/27 adicionador 409 para o sinal de ramificação superior amostrado para cima 410. A operação de amostragem para cima na ramificação superior é executada pelo processador 406, pelo filtro de banda de passagem 407 e pelo processador 408.

[0061] Implementação alternativa do aperfeiçoador de altura de som proposto [0062] A Figura 5 apresenta uma implementação alternativa de um aperfeiçoador de altura de som de duas bandas de acordo com uma modalidade ilustrativa da presente invenção. Deve ser notado que a ramificação superior da Figura 5 não processa todo o sinal de entrada. Isto significa que, neste caso particular, os filtros na ramificação superior da Figura 2 (filtros adaptáveis 201a e 201b) possuem características triviais de entrada-saída (a saída é igual à entrada). Na ramificação inferior, o sinal de entrada (sinal a ser aperfeiçoado) é processado primeiro através de um filtro de banda baixa opcional 501, então através de um filtro linear denominado filtro inter-harmônico 503, definido pela seguinte equação:

y[n] = 2x[n]-¹ {x[n - T]+ x[n + T]} (2) [0063] deve ser notado que o sinal negativo na frente do segundo termo no lado direito, comparado com a Equação (1). Também deve ser notado que o fator de aperfeiçoamento a não está incluído na Equação (2), mas ao invés disso ele é introduzido por meio de um ganho adaptável pelo processador 504 da Figura 5. O filtro interharmônico 503, descrito pela Equação (2), possui uma resposta de frequência de modo que ele completamente remova os harmônicos de um sinal periódico possuindo um período de T amostras e de modo que um sinusóide em uma frequência exatamente entre os harmônicos passe através do filtro inalterado em amplitude porém com uma inversão de fase de exatamente 180 graus (o mesmo que a inversão de siPetição 870170072504, de 27/09/2017, pág. 44/63

25/27 nal). Por exemplo, a Figura 10 apresenta a resposta de frequência do filtro descrito pela Equação (2) quando o período é escolhido (arbitrariamente) em T = 10 amostras. Um sinal periódico com período T = 10 amostras apresentaria harmônicos em frequências normalizadas 0,2, 0,4, 0,6, etc. e a Figura 10 apresenta que o filtro da Equação (2), com T = 10 amostras, removeria completamente estes harmônicos. Por outro lado, as frequências no ponto médio exato entre os harmônicos apareceriam na saída do filtro com a mesma amplitude porém com uma mudança de fase de 180°. Esta é a razão pela qual o filtro descrito pela Equação (2) e utilizado como filtro 503 é denominado filtro interharmônico.

[0064] O valor de altura de som T para uso no filtro inter-harmônico 503 é obtido de forma adaptável pelo módulo de rastreamento de altura de som 502. O módulo de rastreamento de altura de som 502 opera no sinal de fala decodificado e nos parâmetros decodificados, de forma similar em relação aos métodos revelados anteriormente como apresentado nas Figuras 3 e 4.

[0065] Então, a saída 507 do filtro inter-harmônico 503 é um sinal formado essencialmente da parte inter-harmônica do sinal decodificado de entrada 112, com mudança de fase de 180° no ponto médio entre os harmônicos do sinal. Então, a saída 507 do filtro inter-harmônico 503 é multiplicada por um ganho a (processador 504) e subsequentemente filtrada por banda baixa (filtro 505) para obter a modificação de banda de baixa frequência que é aplicada para o sinal de fala decodificado de entrada 112 da Figura 5, para obter o sinal decodificado processado posteriormente (sinal aperfeiçoado) 509. O coeficiente a no processador 504 controla a quantidade de aperfeiçoamento de altura de som ou de inter-harmônico. Quanto mais próxima de 1 estiver a, maior será o aperfeiçoamento. Quando a é igual a 0, nenhum aperfeiçoamento é obtido, isto é, a saída do adicionador 506 é exatamente

Petição 870170072504, de 27/09/2017, pág. 45/63

26/27 igual ao sinal de entrada (fala decodificada na Figura 5). O valor de a pode ser calculado utilizando várias maneiras de se abordar. Por exemplo, a correlação de altura de som normalizada, a qual é bemconhecida para aqueles versados na técnica, pode ser utilizada para controlar o coeficiente a: quanto maior a correlação de altura de som normalizada (quanto mais próxima de 1 ela estiver), maior o valor de a. [0066] O sinal de fala decodificado processado posteriormente final 509 é obtido por adicionar através de um adicionador 506 a saída do filtro de banda baixa 505 ao sinal de entrada (sinal de fala decodificado 112 da Figura 5). Dependendo da frequência de interrupção do filtro de banda baixa 505, o impacto deste processamento posterior será limitado para as frequências baixas do sinal de entrada 112, até uma dada frequência. As maiores frequências serão de forma eficaz não afetadas pelo processamento posterior.

[0067] Alternativa de uma banda utilizando um filtro de banda alta adaptável [0068] Uma última alternativa para implementar o processamento posterior de sub-banda para aperfeiçoar o sinal de síntese em frequências baixas é utilizar um filtro de banda alta adaptável, cuja frequência de interrupção é variada de acordo com o valor da altura de som do sinal de entrada. De forma específica e sem referir-se a qualquer desenho, o aperfeiçoamento de baixa frequência utilizando esta modalidade ilustrativa seria executado, em cada quadro de sinal de entrada, de acordo com as seguintes etapas:

[0069] Determinar o valor da altura de som do sinal de entrada (período de sinal) utilizando o sinal de entrada e possivelmente os parâmetros decodificados (saída do decodificador de fala 105) se processar posteriormente um sinal de fala decodificado; esta é uma operação similar em relação à operação de rastreamento de altura de som dos módulos 303, 401 e 502.

Petição 870170072504, de 27/09/2017, pág. 46/63

27/27 [0070] Calcular os coeficientes de um filtro de banda alta de modo que a frequência de interrupção esteja abaixo, porém próxima à frequência fundamental do sinal de entrada; de forma alternativa, interpolar entre os filtros de banda alta armazenados, pré-calculados, de frequências de interrupção conhecidas (a interpolação pode ser feita do domínio de derivações de filtro, ou no domínio de pólo zero, ou em algum outro domínio transformado tal como o LSF (Frequências Espectrais de Linha) do domínio ISF (Frequências de Emissão de Espectro)). [0071] Filtrar o quadro do sinal de entrada com o filtro de banda alta calculado, para obter o sinal processado posteriormente para este quadro.

[0072] Deve ser salientado que a presente modalidade ilustrativa da presente invenção é equivalente a utilizar somente uma ramificação de processamento na Figura 2 e definir o filtro adaptável desta ramificação como um filtro de banda alta controlado por altura de som. O processamento posterior alcançado com esta maneira de se abordar somente irá afetar a faixa de frequência abaixo do primeiro harmônico e não a energia inter-harmônica acima do primeiro harmônico.

[0073] Apesar da presente invenção ter sido descrita na descrição precedente com referência às modalidades ilustrativas da mesma, estas modalidades podem ser modificadas à vontade, dentro do escopo das reivindicações anexas sem se afastar do espírito e natureza da presente invenção. Por exemplo, apesar das modalidades ilustrativas terem sido descritas em relação a um sinal de fala decodificado, aqueles versados na técnica irão apreciar que os conceitos da presente invenção podem ser aplicados para outros tipos de sinais decodificados, em particular mas não exclusivamente para outros tipos de sinais de som decodificados.

Petição 870170072504, de 27/09/2017, pág. 47/63

1/15

Claims

REIVINDICAÇÕES

1. Método para processar posteriormente um sinal de som decodificado (112) em vista de aperfeiçoar uma qualidade percebida do sinal de som decodificado (112) compreendendo as etapas de:

dividir (301,305,407,404,505) o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda; e aplicar o processamento posterior (307,401,402,503,504,502) para somente uma parte dos sinais de frequência de sub-banda;

caracterizado pelo fato de que ainda aplicar o processamento posterior para somente uma parte dos sinais de frequência de sub-banda compreende aperfeiçoar a altura (304, 402, 503, 504) dos sinais de frequência de sub-banda apenas em uma banda de frequência inferior do sinal de som decodificado (112).
2. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que ainda compreende somar (306,409,506) os sinais de frequência de sub-banda, após o processamento posterior de parte dos sinais de sub-banda de frequência para produzir um sinal de som de saída decodificado processado posteriormente (113,509).
3. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que aperfeiçoar a altura compreende filtrar de forma adaptável (307) a parte dos sinais de subbanda de frequência.
4. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que dividir o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de subbanda compreende filtrar por sub-banda (301,305,407,404,505) o sinal de som decodificado (112) para produzir a pluralidade de sinais de sub-banda de frequência.

Petição 870170072504, de 27/09/2017, pág. 48/63

2/15
5. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que para a parte dos sinais de frequência de sub-banda:

aperfeiçoar a altura compreende filtrar de forma adaptável (307,401,402,503,504,502) o sinal de som decodificado (112); e dividir o sinal de som decodificado (112) compreende filtrar por sub-banda (301,305,407,404,505) o sinal de som decodificado de forma adaptável filtrado.
6. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:

dividir o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda compreende:

- uma filtragem de banda alta (301) do sinal de som decodificado (112) para produzir um sinal de banda de frequência alta (310); e

- uma primeira filtragem de banda baixa (305) do sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa (311); e aperfeiçoar a altura compreende:

- aperfeiçoar a altura (304) do sinal de som decodificado (112) antes da primeira filtragem de banda baixa (305) do sinal de som decodificado (112) para produzir o sinal de frequência de banda baixa (311).
7. Método de processamento posterior, de acordo com a reivindicação 6, caracterizado pelo fato de que ainda compreende uma segunda filtragem de banda baixa (302) do sinal de som decodificado (112) antes de aperfeiçoar a altura (304) do sinal de som decodificado (112).
8. Método de processamento posterior, de acordo com a reivindicação 6, caracterizado pelo fato de que ainda compreende

Petição 870170072504, de 27/09/2017, pág. 49/63

3/15 somar (306) os sinais de frequência de banda alta (310) e de banda baixa (311) para produzir um sinal de som de saída decodificado processado posteriormente (113).
9. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:

dividir o sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda compreende:

- filtragem de banda de passagem (407) do sinal de som decodificado (112) para produzir um sinal de frequência de banda superior (410); e

- filtragem de banda baixa (404) do sinal de som decodificado (112) para produzir um sinal de frequência de banda inferior; e aperfeiçoar a altura compreende:

- aperfeiçoar a altura (402) do sinal de som decodificado (112) antes da filtragem de banda baixa (305) do sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa.
10. Método de processamento posterior, de acordo com a reivindicação 9, caracterizado pelo fato de que ainda compreende somar (409) os sinais de frequência de banda superior (410) e de banda inferior para produzir um sinal de som de saída decodificado processado posteriormente.
11. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:

dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda compreende:

- filtragem de banda baixa (505) do sinal de som decodificado para produzir um sinal de frequência de banda baixa; e aperfeiçoar a altura compreende:

Petição 870170072504, de 27/09/2017, pág. 50/63

4/15

- aperfeiçoar a altura (503,504) do sinal de frequência de banda baixa.
12. Método de processamento posterior, de acordo com a reivindicação 11, caracterizado pelo fato de que aperfeiçoar a altura compreende processar o sinal de som decodificado através de um filtro inter-harmônico (503) para atenuação inter-harmônica do sinal de som decodificado (112).
13. Método de processamento posterior, de acordo com a reivindicação 12, caracterizado pelo fato de que aperfeiçoar a altura compreende multiplicar (504) o sinal de som decodificado filtrado interharmônico (507) por um ganho de aperfeiçoamento de altura de som adaptável.
14. Método de processamento posterior, de acordo com a reivindicação 12, caracterizado pelo fato de que ainda compreende filtragem de banda baixa (501) do sinal de som decodificado (112) antes de processar o sinal de som decodificado através do filtro interharmônico (503).
15. Método de processamento posterior, de acordo com a reivindicação 11, caracterizado pelo fato de que ainda compreende somar (506) o sinal de som decodificado (112) e o sinal de frequência de banda baixa (508) para produzir um sinal de som de saída decodificado processado posteriormente (509).
16. Método de processamento posterior, de acordo com a reivindicação 11, caracterizado pelo fato de que aperfeiçoar a altura (503,504) compreende processar o sinal de som decodificado (112) através de um filtro inter-harmônico (503) possuindo a seguinte função de transferência:

y\n\ = 2 ^XM -¹ M - T]+ x[n + T]} para atenuação inter-harmônica do sinal de som decodificado (112),

Petição 870170072504, de 27/09/2017, pág. 51/63

5/15 onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado filtrado inter-harmônico (507) em uma dada sub-banda e T é um atraso de altura de som do sinal de som decodificado (112).
17. Método de processamento posterior, de acordo com a reivindicação 16, caracterizado pelo fato de que ainda compreende somar (506) o sinal de som decodificado não processado e o sinal de frequência de banda baixa filtrado inter-harmônico (508) para produzir um sinal de som de saída decodificado processado posteriormente (509).
18. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que aperfeiçoar a altura compreende aperfeiçoar a altura (304) do sinal de som decodificado (112) utilizando a seguinte equação:

y[ⁿ]=(l--a ]+^Xn+^T ]} onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
19. Método de processamento posterior, de acordo com a reivindicação 18, caracterizado pelo fato de que compreende receber (106) o atraso de altura de som T através de um fluxo de bits (111).
20. Método de processamento posterior, de acordo com a reivindicação 18, caracterizado pelo fato de que compreende decodificar (106) o atraso de altura de som T a partir de um fluxo de bits codificado recebido (111).
21. Método de processamento posterior, de acordo com a reivindicação 18, caracterizado pelo fato de que compreende calcular (303) o atraso de altura do som T em resposta ao sinal de som dePetição 870170072504, de 27/09/2017, pág. 52/63

6/15 codificado (112) para um rastreamento de altura aperfeiçoado.
22. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que durante a codificação, o sinal de som é amostrado para baixo a partir de uma frequência de amostragem superior até uma frequência de amostragem inferior, e em que dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda compreende amostrar para cima (403.405.406.408) o sinal de som decodificado (112) a partir da frequência de amostragem inferior até a frequência de amostragem superior.
23. Método de processamento posterior, de acordo com a reivindicação 22, caracterizado pelo fato de que dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de subbanda compreende filtragem de sub-banda (407) do sinal de som decodificado (112) e em que a amostragem para cima (406,408) do sinal de som decodificado (112) a partir da frequência de amostragem inferior até a frequência de amostragem superior é combinada com a filtragem de sub-banda (407).
24. Método de processamento posterior, de acordo com a reivindicação 22, caracterizado pelo fato de que compreende:

filtragem de banda de passagem (407) do sinal de som decodificado (112) para produzir um sinal de frequência de banda superior (410), a filtragem de banda de passagem (407) do sinal de som decodificado (112) sendo combinada com a amostragem para cima (406.408) do sinal de som decodificado (112) a partir da frequência de amostragem inferior até a frequência de amostragem superior; e aperfeiçoamento de altura (402) do sinal de som decodificado (112) e aplicação de filtragem de banda baixa (404) para o sinal de som decodificado com aperfeiçoamento o de altura para produzir um sinal de frequência de banda inferior, a filtragem de banda baixa

Petição 870170072504, de 27/09/2017, pág. 53/63

7/15 (404) do sinal de som decodificado com aperfeiçoamento de altura sendo combinada com a amostragem para cima (403,405) do sinal de som decodificado a partir da frequência de amostragem inferior até a frequência de amostragem superior.
25. Método de processamento posterior, de acordo com a reivindicação 24, caracterizado pelo fato de que ainda compreende adicionar (409) o sinal de frequência de banda superior (401) com o sinal de frequência de banda inferior para formar um sinal de som decodificado processado posteriormente e amostrado para cima de saída.
26. Método de processamento posterior, de acordo com a reivindicação 24, caracterizado pelo fato de que aperfeiçoar a altura (402) do sinal de som decodificado (112) compreende processar o sinal de som decodificado (112) por meio da seguinte equação:

y[ⁿ]=(l--a ]+^Xn+^T ]} onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
27. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que:

dividir o sinal de som decodificado em uma pluralidade de sinais de frequência de sub-banda compreende dividir (301,305,407,404,505) o sinal de som decodificado (112) em um sinal de frequência de banda superior (310,410) e um sinal de frequência de banda inferior (311,508); e aperfeiçoar a altura compreende aperfeiçoar a altura (304,402,503,504) do sinal de frequência de banda inferior (301,508).

Petição 870170072504, de 27/09/2017, pág. 54/63

8/15
28. Método de processamento posterior, de acordo com a reivindicação 1, caracterizado pelo fato de que aperfeiçoar a altura compreende:

determinar um valor de altura do sinal de som decodificado (112);

calcular, em relação ao valor de altura de som determinado, um filtro de banda alta com uma frequência de interrupção abaixo de uma frequência fundamental do sinal de som decodificado (112); e processar o sinal de som decodificado (112) através do filtro de banda alta calculado.
29. Dispositivo para processar posteriormente (108) um sinal de som decodificado (112) em vista de aperfeiçoar uma qualidade percebida do sinal de som decodificado compreendendo:

um divisor (301,305,407,404,505) do sinal de som decodificado (112) em uma pluralidade de sinais de frequência de sub-banda; e um processador posterior (307,401,402,503,504,502) de somente uma parte dos sinais de frequência de sub-banda;

caracterizado pelo fato de que o processador posterior compreende um aperfeiçoador de altura (304,402,503,504) dos sinais de frequência de sub-banda apenas em uma banda de frequência inferior do sinal de som decodificado (112).
30. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que ainda compreende um adicionador (306,409,506) para somar os sinais de frequência de sub-banda, após o processamento posterior de parte dos sinais de frequência de sub-banda, para produzir um sinal de som de saída decodificado processado posteriormente (113,509).
31. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o processador

Petição 870170072504, de 27/09/2017, pág. 55/63

9/15 posterior compreende um filtro adaptável (307) fornecido com o sinal de som decodificado (112).
32. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o divisor compreende um filtro de sub-banda (301,305,407,404,505) fornecido com o sinal de som decodificado.
33. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que para a parte dos sinais de frequência de sub-banda:

o processador posterior compreende um filtro adaptável (307,401,402,503,504,502) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado de forma adaptável filtrado; e o divisor compreende um filtro de sub-banda (301,305,407,404,505) fornecido com o sinal de som decodificado de forma adaptável filtrado.
34. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o divisor compreende:

- um filtro de banda alta (301) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda alta (310); e

- um primeiro filtro de banda baixa (305) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa; e o aperfeiçoador de altura (304) aperfeiçoa o sinal de som decodificado antes da filtragem de banda baixa do sinal de som decodificado (112) através do primeiro filtro de banda baixa (305).
35. Dispositivo de processamento posterior, de acordo com a reivindicação 34, caracterizado pelo fato de que o processador

Petição 870170072504, de 27/09/2017, pág. 56/63

10/15 posterior ainda compreende um segundo filtro de banda baixa (302) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado filtrado de banda baixa fornecido para o aperfeiçoador de altura (304).
36. Dispositivo de processamento posterior, de acordo com a reivindicação 34, caracterizado pelo fato de que ainda compreende um adicionador (306) para somar os sinais de frequência de banda alta (310) e de banda baixa para produzir um sinal de som de saída decodificado processado posteriormente (113).
37. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que:

o divisor compreende:

- um filtro de banda de passagem (407) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda superior; e

- um filtro de banda baixa (404) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda inferior; e o aperfeiçoador de altura (402) aperfeiçoa o sinal de som decodificado (112) antes da filtragem de banda baixa do sinal de som decodificado através do filtro de banda baixa (404) para produzir o sinal de frequência de banda inferior.
38. Dispositivo de processamento posterior, de acordo com a reivindicação 37, caracterizado pelo fato de que o aperfeiçoador de altura compreende um filtro de altura (402) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado com a altura aperfeiçoada fornecido para o filtro de banda baixa (404).
39. Dispositivo de processamento posterior, de acordo com a reivindicação 37, caracterizado pelo fato de que ainda compreende um adicionador (409) para somar os sinais de frequência de banda suPetição 870170072504, de 27/09/2017, pág. 57/63

11/15 perior (410) e de banda inferior para produzir um sinal de som de saída decodificado processado posteriormente.
40. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que:

o divisor compreende:

- um filtro de banda baixa (505) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda baixa (508); e o aperfeiçoador de altura (503,504) aperfeiçoa o sinal de som decodificado (112) para produzir um sinal de som decodificado com a altura aperfeiçoada fornecido para o filtro de banda baixa (505).
41. Dispositivo de processamento posterior, de acordo com a reivindicação 40, caracterizado pelo fato de que o aperfeiçoador de altura compreende um filtro inter-harmônico (503) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado atenuado, inter-harmônico (507).
42. Dispositivo de processamento posterior, de acordo com a reivindicação 41, caracterizado pelo fato de que o aperfeiçoador de altura compreende um multiplicador (504) para multiplicar o sinal de som decodificado atenuado, inter-harmônico (507) por um ganho de aperfeiçoamento de altura de som adaptável.
43. Dispositivo de processamento posterior, de acordo com a reivindicação 41, caracterizado pelo fato de que ainda compreende um filtro de banda baixa (501) fornecido com o sinal de som decodificado (112) para produzir um sinal de som decodificado filtrado de banda baixa fornecido para o filtro inter-harmônico (503).
44. Dispositivo de processamento posterior, de acordo com a reivindicação 40, caracterizado pelo fato de que ainda compreende um adicionador (506) para somar o sinal de som decodificado (112) e o sinal de frequência de banda baixa (508) para produzir um sinal de

Petição 870170072504, de 27/09/2017, pág. 58/63

12/15 som de saída decodificado processado posteriormente (509).
45. Dispositivo de processamento posterior, de acordo com a reivindicação 40, caracterizado pelo fato de que o aperfeiçoador de altura compreende um filtro inter-harmônico (503) possuindo a seguinte função de transferência:

y\n\ = 2 ^XM -¹ {^χ[η - T]+ x[n + T]} para atenuação inter-harmônica do sinal de som decodificado (112), onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado inter-harmonicamente filtrado (507) em uma dada sub-banda e T é um atraso de altura de som do sinal de som decodificado (112).
46. Dispositivo de processamento posterior, de acordo com a reivindicação 45, caracterizado pelo fato de que ainda compreende um adicionador (506) para somar o sinal de som decodificado não processado e o sinal de frequência de banda baixa inter-harmonicamente filtrado (508) para produzir um sinal de som de saída decodificado processado posteriormente (509).
47. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o aperfeiçoador de altura (304) do sinal de som decodificado (112) utiliza a seguinte equação:

y[ⁿ]=(l^--a ^{χη^{-τ ]}+ ^χη+^{τ ]}} onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
48. Dispositivo de processamento posterior, de acordo com a reivindicação 47, caracterizado pelo fato de que compreende um receptor (106) do atraso de altura T através de um fluxo de bits (111).

Petição 870170072504, de 27/09/2017, pág. 59/63

13/15
49. Dispositivo de processamento posterior, de acordo com a reivindicação 47, caracterizado pelo fato de que compreende um decodificado (106) do atraso da altura T a partir de um fluxo de bits codificado recebido (111).
50. Dispositivo de processamento posterior, de acordo com a reivindicação 47, caracterizado pelo fato de que compreende uma calculadora (303) do atraso de altura de som T em resposta ao sinal de som decodificado (112) para um rastreamento de altura aperfeiçoado.
51. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que, durante a codificação, o sinal de som é amostrado para baixo a partir de uma frequência de amostragem superior até uma frequência de amostragem inferior, e em que o divisor compreende um amostrador para cima (403,405,406,408) do sinal de som decodificado a partir da frequência de amostragem inferior até a frequência de amostragem superior.
52. Dispositivo de processamento posterior, de acordo com a reivindicação 51, caracterizado pelo fato de que o divisor compreende um filtro de sub-banda (407) fornecido com o sinal de som decodificado (112) e em que o amostrador para cima (406,408) é combinado com o filtro de sub-banda (407).
53. Dispositivo de processamento posterior, de acordo com a reivindicação 51, caracterizado pelo fato de que:

o aperfeiçoador de altura (402) aperfeiçoa o sinal de som decodificado; e o divisor compreende:

- um filtro de banda de passagem (407) fornecido com o sinal de som decodificado (112) para produzir um sinal de frequência de banda superior (410), o filtro de banda de passagem (407) sendo combinado com o amostrador para cima (406,408); e

- um filtro de banda baixa (404) fornecido com o siPetição 870170072504, de 27/09/2017, pág. 60/63

14/15 nal de som decodificado com altura aperfeiçoada para produzir um sinal de frequência de banda inferior, o filtro de banda baixa (404) sendo combinado com o amostrador para cima (403,405).
54. Dispositivo de processamento posterior, de acordo com a reivindicação 53, caracterizado pelo fato de que ainda compreende um adicionador (409) para somar o sinal de frequência de banda superior (410) com o sinal de frequência de banda inferior para formar um sinal de som de saída decodificado com altura aperfeiçoada e amostrado para cima.
55. Dispositivo de processamento posterior, de acordo com a reivindicação 53, caracterizado pelo fato de que o aperfeiçoador de altura (402) usa a seguinte equação:

y[ⁿ]=(l--a ^{X[^II-T ]+ ^Xn+^T D onde x[n] é o sinal de som decodificado, y[n] é o sinal de som decodificado com a altura de som aperfeiçoada em uma dada sub-banda, T é um atraso de altura de som do sinal de som decodificado (112) e a é um coeficiente variando entre 0 e 1 para controlar uma quantidade de atenuação inter-harmônica do sinal de som decodificado (112).
56. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que:

o divisor (301,305,407,404,505) divide o sinal de som decodificado (112) em um sinal de frequência de banda superior (310,410) e um sinal de frequência de banda inferior (311,508); e o aperfeiçoador de altura (304,402,503,504) aperfeiçoa o sinal de frequência de banda inferior (311,508).
57. Dispositivo de processamento posterior, de acordo com a reivindicação 29, caracterizado pelo fato de que o aperfeiçoador de altura:

determina um valor de altura do sinal de som decodificado

Petição 870170072504, de 27/09/2017, pág. 61/63

15/15 (112);

calcula, em relação ao valor de altura de som determinado, um filtro de banda alta com uma frequência de interrupção abaixo de uma frequência fundamental do sinal de som decodificado (112); e processa o sinal de som decodificado (112) através do filtro de banda alta calculado.

Petição 870170072504, de 27/09/2017, pág. 62/63

1/11

112

I

Petição 870170072504, de 27/09/2017, pág. 3/63 à

2/11

Petição 870170072504, de 27/09/2017, pág. 4/63

3/11 η cn

307

Petição 870170072504, de 27/09/2017, pág. 5/63

4/11 to ο

•sí·

114

Petição 870170072504, de 27/09/2017, pág. 6/63

5/11

Petição 870170072504, de 27/09/2017, pág. 7/63

6/11

Petição 870170072504, de 27/09/2017, pág. 8/63

7/11

IQ

Η •l·

Petição 870170072504, de 27/09/2017, pág. 9/63

8/11

Petição 870170072504, de 27/09/2017, pág. 10/63

9/11

Petição 870170072504, de 27/09/2017, pág. 11/63

10/11

Petição 870170072504, de 27/09/2017, pág. 12/63

11/11 .ID

Petição 870170072504, de 27/09/2017, pág. 13/63