BRPI0616624A2

BRPI0616624A2 - aparelho de codificação de fala e método de codificação de fala

Info

Publication number: BRPI0616624A2
Application number: BRPI0616624-5A
Authority: BR
Inventors: Oshikiri Masahiro
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2005-09-30
Filing date: 2006-09-29
Publication date: 2011-06-28
Also published as: CN101273404B; EP1926083A1; CN101273404A; KR20080049085A; RU2008112137A; US8396717B2; JP5089394B2; JPWO2007037361A1; EP1926083A4; US20090157413A1; WO2007037361A1

Abstract

APARELHO DE CODIFICAçãO DE FALA E MéTODO DE CODIFICAçãO DE FALA. é provido um dispositivo de codificação de áudio capaz de manter uma continuidade de espectro de energia e prevenir uma degradação de qualidade de áudio, mesmo quando um espectro de uma faixa baixa de um sinal de áudio for copiado a uma faixa alta uma pluralidade de vezes, O dispositivo de codificação de áudio (100) inclui: uma unidade de quantificação de LPC (102) para a quantificação de um coeficiente de LPC; uma unidade de decodificação de LPC (103) para a decodificação do coeficiente de LPC quantificado; uma unidade de filtro inverso (104) para achatamento do espectro do sinal de áudio de entrada pelo filtro inverso configurado pelo uso do coeficiente de LPC de decodificação; uma unidade de conversão de região de freqúéncia (105) para análise de freqúência do espectro achatado; uma unidade de codificação de primeira camada (106) para a codificação da faixa baixa do espectro achatado para a geração de dados codificados de primeira camada; uma unidade de decodificação de primeira camada (107) para decodificação dos dados codificados de primeira camada para a geração de um espectro decodificado de primeira camada, e uma unidade de codificação de segunda camada (108) para codificação.

Description

Relatório Descritivo da Patente de Invenção para "APARELHODE CODIFICAÇÃO DE FALA E MÉTODO DE CODIFICAÇÃO DE FALA".

Campo Técnico

A presente invenção se refere a um aparelho de codificação defala e a um método de codificação de fala.

Técnica Antecedente

Um sistema de comunicação móvel é requerido para a compres-são de um sinal de fala para uma taxa de bit baixa para um uso efetivo derecursos de rádio.

Ainda, um melhoramento de qualidade de fala e uma realizaçãode um serviço de comunicação de alta qualidade são demandados. Para seadequar a estas demandas, é preferível tornar a qualidade dos sinais de falaalta e codificar outros sinais além dos sinais de fala, tais como sinais de áu-dio em bandas mais largas, com alta qualidade.

Uma técnica para integração de uma pluralidade de técnicas decodificação em camadas para estas demandas contraditórias é consideradapromissora. Para se ser mais específico, esta técnica se refere à integraçãoem camadas da primeira camada em que um sinal de entrada de acordocom um modelo adequado para um sinal de fala é codificado a uma taxa debit baixa e a segunda camada em que um sinal diferencial entre o sinal deentrada e o sinal decodificado de primeira camada é codificado de acordocom um modelo adequado para outros sinais além dos de fala. Um esquemade ação de controle de alinhamento com uma estrutura em camada comoessa inclui recursos que, mesmo se uma porção de um fluxo de bit codifica-do for descartada, o sinal decodificado poderá ser obtido a partir do restanteda informação, isto é, uma escalonabilidade, e assim é referida como uma"codificação escalonável". Com base nestes recursos, uma codificação esca-lonável pode suportar de forma flexível uma comunicação entre redes detaxas de bit diferentes. Ainda, estes recursos são adequados para o ambien-te de rede no futuro, em que várias redes são integradas através do protoco-lo de IP.

Parte da codificação escalonável convencional emprega umatécnica padronizada com MPEG-4 (Grupo de Especialistas em Filmes defase 4) (por exemplo, veja o Documento Não de Patente 1). Em uma codifi-cação escalonável mostrada no Documento Não de Patente 1, uma CELr(predição linear excitada por código) adequada para sinais de fala é usadana primeira camada e uma codificação de transformada, tal como AAC (codi-ficador de áudio avançado) e TwinVQ (quantificação de vetor de entrelaça-mento ponderado de domínio de transformada) é usada na segunda cama-da, quando da codificação do sinal residual obtido pela remoção do sinaldecodificado de primeira camada a partir do sinal original.

Por outro lado, na codificação de transformada, há uma técnicapara a codificação de um espectro eficientemente (por exemplo, veja o Do-cumento de Patente 1). A técnica mostrada no Documento de Patente 1 serefere à divisão da banda de freqüência de um sinal de fala em duas sub-bandas de uma banda baixa e uma banda alta, à duplicação do espectro debanda baixa para a banda alta e à obtenção do espectro de banda alta pelamodificação do espectro duplicado. Neste caso, é possível realizar uma taxade bit mais baixa pela informação de modificação de codificação com umnúmero de bits pequeno.

Documento Não de Patente 1: "Everything about MPEG-4"(MPEG-4 no subete), a primeira edição, escrita e editada por Sukeichi MIKI,Kogyo Chosakai Publishing, Inc., 30 de setembro de 1998, páginas 126 a 127.

Documento de Patente: tradução japonesa de um Pedido PCTAberto NQ 2001-521648.

Exposição da Invenção

Problemas a Serem Resolvidos pela Invenção

Geralmente, o espectro de um sinal de fala ou de um sinal deáudio é representado pelo produto do componente (envoltória espectral) quemuda moderadamente com a freqüência e a componente (estrutura fina es-pectral) que mostra mudanças rápidas. Como um exemplo, a FIG. 1 mostrao espectro de um sinal de fala, a FIG. 2 mostra a envoltória espectral e aFIG. 3 mostra a estrutura fina espectral. Esta envoltória espectral (FIG. 2) écalculada usando-se coeficientes de LPC (Codificação de Predição Linear)de ordem dez. De acordo com estes desenhos, o produto da envoltória es-pectral (FIG. 2) e da estrutura fina espectral (FIG. 3) é o espectro de um si-nal de fala (FIG. 1).

Aqui, quando o espectro de banda alta é gerado pela duplicaçãodo espectro de banda baixa, se a'largura de banda da banda alta, a qual é odestino de duplicação, for mais largo do que a largura de banda da bandabaixa, a qual é a origem de duplicação, o espectro de banda baixa será du-plicado para a banda alta duas vezes ou mais. Por exemplo, quando o es-pectro de banda baixa (0 a FL) da FIG. 1 é duplicado para a banda alta (FL aFH), neste exemplo FH = 2 * FL, e, assim, o espectro de banda baixa preci-sa ser duplicado para a banda alta duas vezes. Quando o espectro de bandabaixa é duplicado para a banda alta uma pluralidade de vezes desta forma,conforme mostrado na FIG. 4, uma descontinuidade na energia espectralocorre em uma porção de conexão do espectro no destino de duplicação. Aenvoltória espectral causa essa descontinuidade. Conforme mostrado naFIG. 2, na envoltória espectral, quando a freqüência aumenta, a energia di-minui, e, assim, a inclinação espectral é gerada. Há uma inclinação espectralcomo essa e, conseqüentemente, quando o espectro de banda baixa é du-plicado para a banda alta uma pluralidade de vezes, uma descontinuidadena energia espectral ocorre e a qualidade de fala se deteriora. É possívelcorrigir esta descontinuidade por um ajuste de ganho, mas um ajuste de ga-nho requer um grande número de bits para a obtenção de um efeito satisfa-tório.

É um objetivo da presente invenção prover um aparelho de codi-ficação de fala e um método de codificação de fala que, quando o espectrode banda baixa for duplicado para a banda alta uma pluralidade de vezes,mantenha a continuidade na energia espectral e impeça uma deterioraçãode qualidade de fala.

Meios para Resolução do Problema

O aparelho de codificação de fala de acordo com a presente in-venção emprega uma configuração que inclui: uma primeira seção de codifi-cação que codifica um espectro de banda baixa compreendendo uma bandamais baixa do que uma freqüência de limite de um sinal de fala; uma seçãode achatamento que achata o espectro de banda baixa usando um filtro in-verso com características inversas de uma envoltória espectral do sinal defala; e uma segunda seção de codificação que codifica um espectro de ban-da alta compreendendo uma banda mais alta do que a freqüência de limitedo sinal de fala usando ó espectro de banda baixa achatado.Efeito Vantajoso da Invenção

A presente invenção é capaz de manter uma continuidade naenergia espectral e prevenir uma deterioração de qualidade de fala.

Breve Descrição dos Desenhos

A FIG. 1 mostra um espectro (convencional) de um sinal de fala;

a FIG. 2 mostra uma envoltória espectral (convencional);

a FIG. 3 mostra uma estrutura fina espectral (convencional);

a FIG. 4 mostra o espectro (convencional) quando o espectro debanda baixa é duplicado para a banda alta uma pluralidade de vezes;

a FIG. 5A ilustra o princípio de operação de acordo com a pre-sente invenção (isto é, um espectro decodificado de banda baixa);

a FIG. 5B ilustra o princípio de operação de acordo com a pre-sente invenção (isto é, o espectro que passou através de um filtro inverso);

a FIG. 5C ilustra o princípio de operação de acordo com a pre-sente invenção (isto é, a codificação da banda alta);

a FIG. 5D ilustra o princípio de operação de acordo com a pre-sente invenção (isto é, o espectro de um sinal decodificado);

a FIG. 6 é um diagrama de blocos de configuração mostrandoum aparelho de codificação de fala de acordo com a Modalidade 1 da pre-sente invenção;

a FIG. 7 é um diagrama de blocos de configuração que mostrauma seção de codificação de segunda camada do aparelho de codificaçãode fala acima;

a FIG. 8 ilustra a operação de uma seção de filtração de acordocom a Modalidade 1 da presente invenção;a FIG. 9 é um diagrama de blocos de configuração mostrandoum aparelho de decodificação de fala de acordo com a Modalidade 1 da pre-sente invenção;

a FIG. 10 é um diagrama de blocos de configuração que mostrauma seção de decodificação de segunda camada do aparelho de decodifica-ção de fala acima;

a FIG. 11 é urri diagrama de blocos de configuração mostrando oaparelho de codificação de fala de acordo com a Modalidade 2 da presenteinvenção;

a FIG. 12 é um diagrama de blocos de configuração que mostrao aparelho de decodificação de fala de acordo com a Modalidade 2 da pre-sente invenção;

a FIG. 13 é um diagrama de blocos de configuração que mostrao aparelho de codificação de fala de acordo com a Modalidade 3 da presenteinvenção;

a FIG. 14 é um diagrama de blocos de configuração que mostrao aparelho de decodificação de fala de acordo com a Modalidade 3 da pre-sente invenção;

a FIG. 15 é um diagrama de blocos de configuração que mostrao aparelho de codificação de fala de acordo com a Modalidade 4 da presenteinvenção;

a FIG. 16 é um diagrama de blocos de configuração que mostrao aparelho de decodificação de fala de acordo com a Modalidade 4 da pre-sente invenção;

a FIG. 17 é um diagrama de blocos de configuração que mostrao aparelho de codificação de fala de acordo com a Modalidade 5 da presenteinvenção;

a FIG. 18 é um diagrama de blocos de configuração que mostrao aparelho de decodificação de fala de acordo com a Modalidade 5 da pre-sente invenção;

a FIG. 19 é um diagrama de blocos de configuração que mostrao aparelho de codificação de fala de acordo com a Modalidade 5 da presenteinvenção (exemplo modificado 1);

a FIG. 20 é um diagrama de blocos de configuração que mostrao aparelho de codificação de fala de acordo com a Modalidade 5 da presenteinvenção (exemplo modificado 2);

a FIG. 21 é um diagrama de blocos de configuração que mostrao aparelho de decodificação de fala de acordo com a Modalidade 5 da pre-sente invenção (exemplo modificado 1);

a FIG. 22 é um diagrama de blocos de configuração que mostraa seção de codificação de segunda camada de acordo com a Modalidade 6da presente invenção;

a FIG. 23 é um diagrama de blocos de configuração que mostrauma seção de modificação de espectro de acordo com a Modalidade 6 dapresente invenção;

a FIG. 24 é um diagrama de blocos de configuração que mostraa seção de decodificação de segunda camada de acordo com a Modalidade6 da presente invenção;

a FIG. 25 é um diagrama de blocos de configuração que mostrauma seção de modificação de espectro de acordo com a Modalidade 7 dapresente invenção;

a FIG. 26 é um diagrama de blocos de configuração que mostrauma seção de modificação de espectro de acordo com a Modalidade 8 dapresente invenção;

a FIG. 27 é um diagrama de blocos de configuração que mostrauma seção de modificação de espectro de acordo com a Modalidade 9 da presente invenção;

a FIG. 28 é um diagrama de blocos de configuração que mostrauma seção de codificação de segunda camada de acordo com a Modalidadeda presente invenção;

a FIG. 29 é um diagrama de blocos de configuração que mostrauma seção de decodificação de segunda camada de acordo com a Modali-dade 10 da presente invenção;

a FIG. 30 é um diagrama de blocos de configuração que mostrauma seção de codificação de segunda camada de acordo com a Modalidade11 da presente invenção;

a FIG. 31 é um diagrama de blocos de configuração que mostrauma seção de decodificação de segunda camada de acordo com a Modali-dade 11 da presente invenção;

a FIG. 32 é um diagrama de blocos de configuração que mostrauma seção de codificação de segunda camada de acordo com a Modalidade12 da presente invenção; e

a FIG. 33 é um diagrama de blocos de configuração que mostrauma seção de decodificação de segunda camada de acordo com a Modali-dade 12 da presente invenção;Melhor Modo para Realização da Invenção

Quando realiza uma codificação da banda alta utilizando-se oespectro de banda baixa, a presente invenção achata o espectro pela remo-ção da influência da envoltória espectral do espectro de banda baixa e codi-fica o espectro de banda alta usando o espectro achatado.

Em primeiro lugar, o princípio de operação da presente invençãoserá descrito com referência às FIG. 5A a D.

Nas FIG. 5A a D, com FL como a freqüência de limite, de 0 a FLé a banda baixa e de FL a FH é a banda alta.

A FIG. 5A mostra um espectro decodificado de banda baixa ob-tido pelo processamento convencional de codificação/decodificação. A FIG.5B mostra o espectro obtido pela filtração do espectro decodificado mostra-do na FIG. 5A através de um filtro inverso com características inversas daenvoltória espectral. Desta forma, pela filtração do espectro decodificado debanda baixa através do filtro inverso com as características inversas da en-voltória espectral, o espectro de banda baixa é achatado. Então, conformemostrado na FIG. 5C, o espectro de banda baixa é duplicado para a bandaalta uma pluralidade de vezes (aqui, duas vezes), e a banda alta é codifica-da. O espectro de banda baixa já está achatado, conforme mostrado na FIG.5B, e, assim, quando a banda alta é codificada, uma descontinuidade naenergia espectral causada pela envoltória espectral, tal como descrito acima,não ocorre. Então, pela adição da envoltória espectral ao espectro com umabanda de sinal estendida para de O a FH, o espectro de um sinal decodifica-do, conforme mostrado na FIG. 5D, pode ser obtido.

Ainda, como um método de codificação da banda alta, pode serempregado um método para estimativa do espectro de banda alta pelo usodo espectro de banda baixa para o estado interno de um filtro de passo epela realização de um processamento de filtro de passo na ordem da fre-qüência mais baixa para a freqüência mais alta no domínio de freqüência.

De acordo com este método de codificação, quando a banda alta é codifica-da, apenas uma informação de filtro do filtro de passo precisa ser codificada,de modo que é possível realizar uma taxa de bit mais baixa.

A partir deste ponto, as modalidades da presente invenção serãodescritas em detalhes com referência aos desenhos associados.

(Modalidade 1)

Será descrito um caso aqui com esta modalidade, em que umacodificação de domínio de freqüência é realizada para a primeira camada epara a segunda camada. Ainda, nesta modalidade, após o espectro de ban-da baixa ser achatado, o espectro de banda alta é codificado pela utilizaçãorepetidamente do espectro achatado.

A FIG. 6 mostra a configuração de um aparelho de codificaçãode fala de acordo com a Modalidade 1 da presente invenção.

No aparelho de codificação de fala 100 mostrado na FIG. 6, aseção de análise de LPC 101 realiza uma análise de LPC de um sinal de falade entrada e calcula coeficientes de LPC a(i)(1 □ i □ NP). Aqui, NP é a or-dem dos coeficientes de LPC e, por exemplo, de 10 a 18 é selecionado. Oscoeficientes de LPC calculados são introduzidos na seção de quantificaçãode LPC 102.

A seção de quantificação de LPC 102 quantifica os coeficientesde LPC. Para eficiência e julgamento de estabilidade na quantificação, apósos coeficientes de LPC serem convertidos em parâmetros de LSP (Par Es-pectral de Linha), a seção de quantificação de LPC 102 quantifica os parâ-metros de LSP e extrai dados codificados de coeficiente de LPC. Os dadoscodificados de coeficiente de LPC são introduzidos na seção de decodifica-ção de LPC 103 e na seção de multiplexação 109.

A seção de decodificação de LPC 103 gera coeficientes de LPCdecodificados aq(i)(1 < i < NP) pela decodificação dos dados codificados decoeficiente de LPC e extrai coeficientes de LPC decodificados aq(i)(1 < i <NP) para a seção de filtro inverso 104.

A seção de filtro inverso 104 forma um filtro inverso usando oscoeficientes de LPC decodificados e achata o espectro do sinal de fala deentrada pela filtração do sinal de fala de entrada através deste filtro inverso.

O filtro inverso é representado pela equação 1 ou pela equação2. A equação 2 mostra o filtro inverso quando um coeficiente de supressãode ressonância γ (0 < γ < 1) para controle do grau de achatamento é usado.

<formula>formula see original document page 10</formula>

(Equação 1)

<formula>formula see original document page 10</formula>

(Equação 2)

Então, o sinal de saída e(n) obtido quando o sinal de fala s(n) éintroduzido no filtro inverso representado pela equação 1 é representadopela equação 3.

<formula>formula see original document page 10</formula>

(Equação 3)

De modo similar, o sinal de saída e(n) obtido quando o sinal defala s(n) é introduzido no filtro inverso representado pela equação 2 é repre-sentado pela equação 4.

<formula>formula see original document page 10</formula>

(Equação 4)

Desta forma, o espectro do sinal de fala de entrada é achatadopor este processamento de filtro inverso. Ainda, na descrição a seguir, umsinal de saída de seção de filtro inverso 104 (sinal de fala em que o espectroé achatado) é referido como um "sinal residual de predição".

A seção de transformação de domínio de freqüência 105 realizauma análise de freqüência do sinal residual de predição extraído a partir daseção de filtro inverso 104 e encontra um espectro residual como coeficien-tes de transformada. A seção de transformação de domínio de freqüência105 transforma um sinal de domínio de tempo em um sinal de domínio defreqüência usando, por exemplo, a MDCT (Transformada de Co-seno Dis-creta Modificada). O espectro residual é introduzido na seção de codificaçãode primeira camada 106 e na seção de codificação de segunda camada 108.

A seção de codificação de primeira camada 106 codifica a bandabaixa do espectro residual usando, por exemplo, TwinVQ e extrai os dadoscodificados de primeira camada obtidos por esta codificação para a seção dedecodificação de primeira camada 107 e a seção de multiplexação 109.

A seção de decodificação de primeira camada 107 gera um es-pectro decodificado de primeira camada pela decodificação dos dados codi-ficados de primeira camada e extrai o espectro decodificado de primeira ca-mada para a seção de codificação de segunda camada 108. Ainda, a seçãode decodificação de primeira camada 107 extrai o espectro decodificado deprimeira camada antes da transformada para o domínio de tempo.

A seção de codificação de segunda camada 108 codifica a ban-da alta do espectro residual usando o espectro decodificado de primeira ca-mada obtido na seção de decodificação de primeira camada 107, e extrai osdados codificados de segunda camada obtidos por esta codificação para aseção de multiplexação 109. A seção de codificação de segunda camada108 usa o espectro decodificado de primeira camada para o estado internodo filtro de passo, e estima a banda alta do espectro residual pelo proces-samento de filtração de passo. Neste momento, a seção de codificação desegunda camada 108 estima a banda alta do espectro residual de modo quea estrutura de harmônica espectral não se rompa. Ainda, a seção de codifi-cação de segunda camada 108 codifica a informação de filtro do filtro depasso. Mais ainda, a seção de codificação de segunda camada 108 estima abanda alta do espectro residual usando o espectro residual onde o espectroé achatado. Por esta razão, quando a banda alta é estimada pelo uso repeti-do do espectro de forma recursiva pelo processamento de filtração, é possí-vel prevenir uma descontinuidade na energia espectral. Desta forma, de a-cordo com esta modalidade, é possível realizar uma qualidade de fala alta auma taxa de bit baixa. Ainda, a seção de codificação de segunda camada108 será descrita em detalhes mais tarde.

A seção de multiplexação 109 gera um fluxo de bit pela multiple-xação dos dados codificados de primeira camada, pelos dados codificadosde segunda camada e pelos dados codificados de coeficiente de LPC, e ex-trai o fluxo de bit.

Em seguida, a seção de codificação de segunda camada 108será descrita em detalhes mais tarde. A FIG. 7 mostra a configuração daseção de codificação de segunda camada 108.

A seção de regulagem de estado interno 1081 recebe uma en-trada de espectro decodificado de primeira camada S1 (k)(0 < k < FL) a partirda seção de decodificação de primeira camada 107. A seção de regulagemde estado interno 1081 regula o estado interno de um filtro usado na seçãode filtração 1082 usando este espectro decodificado de primeira camada.

A seção de regulagem de coeficiente de passo 1084 extrai o co-eficiente de passo T seqüencialmente para a seção de filtração 1082 de a-cordo com um controle pela seção de busca 1083 pela mudança do coefici-ente de passo T pouco a pouco em uma faixa de busca predeterminada Tmina Tmax-

A seção de filtração 1082 filtra o espectro decodificado de pri-meira camada com base no estado interno da regulagem de filtro na seçãode regulagem de estado interno 1081 e no coeficiente de filtro T extraído ápartir da seção de regulagem de coeficiente de passo 1084, e calcula umvalor estimado S2'(k) do espectro residual. Este processamento de filtraçãoserá descrito em detalhes mais tarde.

A seção de busca 1083 calcula uma similaridade, a qual é umparâmetro que representa a similaridade do espectro residual S2(k)(0 < k <FH) introduzido a partir da seção de transformação de domínio de freqüência105 e o valor estimado S2'(k) introduzido a partir da seção de filtração 1082.Este processamento de cálculo de similaridade é realizado a cada vez emque o coeficiente de passo T é dado a partir da seção de regulagem de coe-ficiente de passo 1084, e o coeficiente de passo (coeficiente ótimo) T1 (o qualestá na faixa de Tmin a Tmax) que maximiza a similaridade calculada, é extraí-do para a seção de multiplexação 1086. Ainda, a seção de busca 1083 extraio valor estimado S2'(k) do espectro residual gerado pelo uso deste coeficien-te de passo T', para a seção de codificação de ganho 1085.

A seção de codificação de ganho 1085 calcula uma informaçãode ganho de espectro residual S2(k) com base no espectro residual S2(k)(0< k < FH) introduzido a partir da seção de transformação de domínio de fre-qüência 105. Ainda, será descrito um caso aqui como um exemplo em queesta informação de ganho é representada pela potência espectral de cadasub-banda e a banda de freqüência FL < k < FH é dividida em J sub-bandas.

Então, a potência espectral B(j) da j-ésima sub-banda é representada pelaequação 5. Na equação 5, BL(j) é a freqüência mínima da j-ésima sub-bandae BH(j) é a freqüência máxima da j-ésima sub-banda. A informação de sub-banda do espectro residual determinada desta forma é considerada comouma informação de ganho.

<formula>formula see original document page 13</formula>

(Equação 5)

Ainda, da mesma forma, a seção de codificação de ganho 1085calcula uma informação de sub-banda B'(j) de valor estimado S2'(k) do es-pectro residual de acordo com a equação (6), e calcula a quantidade de flu-tuação V(j) em uma base por sub-banda, de acordo com a equação 7.

<formula>formula see original document page 13</formula>

(Equação 6)

<formula>formula see original document page 13</formula>

(Equação 7)

Em seguida, a seção de codificação de ganho 1085 encontra aquantidade de flutuação Vq(j) após a codificação da quantidade de flutuaçãoV(j) e extrai um índice para a seção de multiplexação 1086.

A seção de multiplexação 1086 multiplexa o coeficiente de passoótimo T1 introduzido a partir da seção de busca 1083 com o índice da quanti-dade de flutuação V(j) introduzido a partir da seção de codificação de ganho1085, e extrai o resultado como os dados codificados de segunda camadapara a seção de multiplexação 109.

Em seguida, o processamento de filtração na seção de filtração1082 será descrito em detalhes. A FIG. 8 mostra como um espectro de ban-da FL < k < FH é gerado usando-se o coeficiente de passo T introduzido apartir da seção de regulagem de coeficiente de passo 1084. Aqui, o espectroda banda de freqüência inteira (0 < k < FH) é referido como "S(k)" para facili-dade de descrição, e a função de filtro representada pela equação 8 é usa-da. Nesta equação, T é o coeficiente de passo dado pela seção de regula-gem de coeficiente de passo 1084, e M é 1.

<formula>formula see original document page 14</formula>

Na banda 0 < k < FL de S(k), o espectro decodificado de primei-ra camada S1(k) é armazenado como o estado interno do filtro. Por outrolado, na banda FL < k < FH de S(k), o valor estimado S2'(k) do espectro re-sidual determinado nas etapas seguintes é armazenado.

O espectro obtido pela adição de todos os valores espectrais β, ·S(k - T - i) obtido pela multiplicação dos valores espectrais vizinhos S(k - T -i), o que é espaçado por i do espectro S(k - T) da freqüência diminuída por Ta partir de k como o centro, pelo coeficiente de ponderação predeterminadoβ,, isto é, o espectro representado pela equação 9, é dado para S2'(k) peloprocessamento de filtração. Então, esta operação é realizada pela mudançade k a partir da freqüência mais baixa (k = FL) na faixa de FL < k < FH, e,conseqüentemente, o valor estimado S2'(k) do espectro residual na faixa deFL < k < FH é calculado.<formula>formula see original document page 15</formula>

No processamento de filtração acima, a cada vez em que o coe-ficiente de passo T é dado a partir da seção de regulagem de coeficiente depasso 1084, S(k) é submetido a uma limpeza para zero na faixa de FL < k <FH. Isto é, a cada vez em que o coeficiente de passo T muda, S(k) é calcu-lado e extraído para a seção de busca 1083.

Aqui, no exemplo mostrado na FIG. 8, o valor de coeficiente depasso T é menor do que a banda de FL a FH, e, assim, um espectro de ban-da alta (FL < k < FH) é gerado pelo uso de um espectro de banda baixa (0 <k < FL) de forma recursiva. O espectro de banda baixa é achatado, conformedescrito acima, e, assim, mesmo quando o espectro de banda alta for gera-do pelo uso recursivo do espectro de banda baixa pelo processamento defiltração, uma descontinuidade na energia de espectro de banda alta nãoocorre.

Desta forma, de acordo com esta modalidade, é possível preve-nir uma descontinuidade na energia espectral, a qual ocorre na banda alta,devido à influência da envoltória espectral, e melhorar a qualidade de fala.

Em seguida, o aparelho de decodificação de fala de acordo comesta modalidade será descrito. A FIG. 9 mostra a configuração do aparelhode decodificação de fala de acordo com a Modalidade 1 da presente inven-ção. Este aparelho de decodificação de fala 200 recebe um fluxo de bittransmitido a partir do aparelho de codificação de fala 100 mostrado na FIG.6.

No aparelho de decodificação de fala 200 mostrado na FIG. 9, aseção de demultiplexação 201 de multiplexa o fluxo de bit recebido a partirdo aparelho de codificação de fala 100 mostrado na FIG. 6, para os dadoscodificados de primeira camada, os dados codificados de segunda camada eos dados codificados de coeficiente de LPC1 e extrai os dados codificados deprimeira camada para a seção de decodificação de primeira camada 202, osdados codificados de segunda camada para a seção de decodificação desegunda camada 203 e os dados codificados de coeficiente de LPC para aseção de decodificação de LPC 204. Ainda, a seção de demultiplexação 201extrai a informação de camada (isto é, uma informação mostrando qual fluxode bit inclui dados codificados de qual camada) para a seção de decisão 205.

A seção de decodificação de primeira camada 202 gera o espec-tro decodificado de primeira camada pela realização de um processamentode decodificação usando os dados codificados de primeira camada, e extraio espectro decodificado de primeira camada para a seção de decodificaçãode segunda camada 203 e a seção de decisão 205.

A seção de decodificação de segunda camada 203 gera o es-pectro decodificado de segunda camada usando os dados codificados desegunda camada e o espectro decodificado de primeira camada, e extrai oespectro decodificado de segunda camada para a seção de decisão 205.Ainda, a seção de decodificação de segunda camada 203 será descrita emdetalhes mais tarde.

A seção de decodificação de LPC 204 extrai os coeficientes deLPC decodificados obtidos pela decodificação dos dados codificados de coe-ficiente de LPC, para a seção de filtro de síntese 207.

Aqui, embora o aparelho de codificação de fala 100 transmita ofluxo de bit incluindo os dados codificados de primeira camada e os dadoscodificados de segunda camada, ocorrem casos em que os dados codifica-dos de segunda camada são descartados em qualquer lugar no percurso detransmissão. Então, a seção de decisão 205 decide se os dados codificadosde segunda camada estão ou não incluídos no fluxo de bit, com base na in-formação de camada. Ainda, quando os dados codificados de segunda ca-mada não estão incluídos no fluxo de bit, a seção de decodificação de se-gunda camada 203 não gera o espectro decodificado de segunda camada e,então, a seção de decisão 205 extrai o espectro decodificado de primeiracamada para a seção de transformação de domínio de tempo 206. Contudo,neste caso, para combinação da ordem com um espectro decodificado dequando os dados codificados de segunda camada estão incluídos, a seçãode decisão 205 estende a ordem do espectro decodificado de primeira ca-mada para FH e extrai o espectro de FL a FH como "zero". Por outro lado,quando os dados codificados de primeira camada e os dados codificados desegunda camada estão ambos incluídos no fluxo de bit, a seção de decisão205 extrai o espectro decodificado de segunda camada para a seção detransformação de domínio de tempo 206.

A seção de transformação de domínio de tempo 206 gera umsinal residual decodificado pela transformação do espectro residual decodifi-cado a partir da seção de decisão 205, para um sinal de domínio e extrai osinal para a seção de filtro de síntese 207.

A seção de filtro de síntese 207 forma um filtro de síntese usan-do os coeficientes de LPC decodificados aq(i)(1 < i < NP) introduzidos a par-tir da seção de decodificação de LPC 204.

O filtro de síntese H(z) é representado pela equação 10 ou pelaequação 11. Ainda, na equação 11, γ (0 < γ < 1)éo coeficiente de supres-são de ressonância.

<formula>formula see original document page 17</formula>

(Equação 10)

<formula>formula see original document page 17</formula>

(Equação 11)

Ainda, pela introdução do sinal residual decodificado dado naseção de transformação de domínio de tempo 206 como eq(n) para o filtro desíntese 207, quando um filtro de síntese representado pela equação 10 éusado, o sinal decodificado sq(n) extraído é representado pela equação 12.

<formula>formula see original document page 17</formula>

(Equação 12)

De modo similar, quando um filtro de síntese representado pelaequação 11 é usado, o sinal decodificado sq(n) é representado pela equação 13.<formula>formula see original document page 18</formula>

Em seguida, a seção de decodificação de segunda camada 203será descrita em deiaihes. A FiG. 10 mostra a configuração da seção de de-codificação de segunda camada 203.

A seção de regulagem de estado interno 2031 recebe uma en-trada do espectro decodificado de primeira camada a partir da seção de de-codificação de primeira camada 202. A seção de regulagem de estado inter-no 2031 regula o estado interno do filtro usado na seção de filtração 2033pelo uso do espectro decodificado de primeira camada S1 (k).

Por outro lado, a seção de demultiplexação 2032 recebe umaentrada dos dados codificados de segunda camada a partir da seção de de-multiplexação 201. A seção de demultiplexação 2032 demultiplexa os dadoscodificados de segunda camada para uma informação relacionada ao coefi-ciente de filtração (coeficiente de passo ótimo T') e a informação relacionadaao ganho (o índice da quantidade de flutuação V(j)), e extrai uma informaçãorelacionada ao coeficiente de filtração para a seção de filtração 2033 e umainformação relacionada ao ganho para a seção de decodificação de ganho2034.

A seção de filtração 2033 filtra o espectro decodificado de pri-meira camada S1(k) com base no estado internõ^da regulagem de filtro naseção de regulagem de estado interno 2031 e no coeficiente de passo T1introduzido a partir da seção de demultiplexação 2032, e calcula o valor es-timado S2'(k) do espectro residual. A função de filtro mostrada na equação 8é usada na seção de filtração 2033.

A seção de decodificação de ganho 2034 decodifica uma infor-mação de ganho introduzida a partir da seção de demultiplexação 2032 eencontra a quantidade de flutuação Vq(j) obtida pela quantidade de flutuaçãoV(j).

A seção de ajuste de espectro 2035 ajusta o formato espectralda banda de freqüência FL < k < FH de espectro decodificado S'(k) pela mul-tiplicação de acordo com a equação 14 do espectro decodificado S'(k) intro-duzido a partir da seção de filtração 2033 pela quantidade decodificada deflutuação Vq(j) de cada sub-banda introduzida a partir da seção de decodifi-cação de ganho 2034, e gera o espectro decodificado S3(k) após o ajuste.Este espectro decodificado S3(k) após o ajuste é extraído para a seção dedecisão 205 como o espectro decodificado de segunda camada.

<formula>formula see original document page 19</formula>

Desta forma, o aparelho de decodificação de fala 200 é capaz dedecodificar um fluxo de bit transmitido a partir do aparelho de codificação defala 100 mostrado na FIG. 6.(Modalidade 2)

Será descrito aqui um caso com esta modalidade em que umacodificação de domínio de tempo (por exemplo, uma codificação de CELP) érealizada na primeira camada. Ainda, nesta modalidade, o espectro do sinaldecodificado de primeira camada é achatado usando-se os coeficientes deLPC decodificados determinados durante um processamento de codificaçãona primeira camada.

A FIG. 11 mostra a configuração do aparelho de codificação defala de acordo com a Modalidade 2 da presente invenção. Na FIG. 11, aosmesmos componentes que na Modalidade 1 (FIG. 6) serão atribuídos osmesmos números de referência, e uma repetição da descrição será omitida.

No aparelho de codificação de fala 300 mostrado na FIG. 11, aseção de redução de amostragem 301 reduz a amostragem de uma taxa deamostragem para um sinal de fala de entrada e extrai um sinal de fala deuma taxa de amostragem desejada para a seção de codificação de primeiracamada 302.

A seção de codificação de primeira camada 302 gera os dadoscodificados de primeira camada pela codificação do sinal de fala de amos-tragem reduzida para a taxa de amostragem desejada e extrai os dados co-dificados de primeira camada para a seção de decodificação de primeiracamada 303 e a seção de multiplexação 109. A seção de codificação deprimeira camada 302 usa, por exemplo, uma codificação de CELP. Quandoos coeficientes de LPC são codificados em uma codificação de CELP, a se-ção de codificação de primeira camada 302 é capaz de gerar coeficientes deLPC decodificados durante este processamento de codificação. Então, aseção de codificação de primeira camada 302 extrai os coeficientes de LPCdecodificados de primeira camada gerados durante o processamento de co-dificação para a seção de filtro inverso 304.

A seção de decodificação de primeira camada 303 gera o sinaldecodificado de primeira camada pela realização de um processamento dedecodificação usando os dados codificados de primeira camada, e extraieste sinal para a seção de filtro inverso 304.

A seção de filtro inverso 304 forma um filtro inverso usando oscoeficientes de LPC decodificados de primeira camada introduzidos a partirda seção de codificação de primeira camada 302 e achata o espectro dosinal decodificado de primeira camada pela filtração do sinal decodificado deprimeira camada através deste filtro inverso. Ainda, os detalhes do filtro in-verso são os mesmos que na Modalidade 1 e, assim, uma repetição da des-crição é omitida. Mais ainda, na descrição a seguir, um sinal de saída deseção de filtro inverso 304 (isto é, o sinal decodificado de primeira camadaem que o espectro é achatado) é referido como um "sinal residual decodifi-cado de primeira camada".

A seção de transformação de domínio de freqüência 305 o es-pectro decodificado de primeira camada pela realização de uma análise defreqüência do sinal residual decodificado de primeira camada extraído a par-tir da seção de filtro inverso 304 e extrai o espectro decodificado de primeiracamada para a seção de codificação de segunda camada 108.

Ainda, a seção de atraso 306 adiciona um período de atrasopredeterminado ao sinal de fala de entrada. A quantidade deste atraso as-sume o mesmo valor que o tempo de atraso que ocorre quando o sinal defala de entrada passa através da seção de redução de amostragem 301, daseção de codificação de primeira camada 302, da seção de decodificação deprimeira camada 303, da seção de filtro inverso 304 e da seção de transfor-mação de domínio de freqüência 305.Desta forma, de acordo com esta modalidade, o espectro do si-nal decodificado de primeira camada é achatado usando-se os coeficientesde LPC decodificados (coeficientes de LPC decodificados de primeira cama-da) determinados durante o processamento de codificação na primeira ca-mada, de modo que seja possível achatar o espectro do sinal decodificadode primeira camada usando-se uma informação dos dados codificados deprimeira camada. Conseqüentemente, de acordo com esta modalidade, oscoeficientes de LPC para achatamento do espectro do sinal decodificado deprimeira camada não requererão bits codificados, de modo que seja possívelachatar o espectro sem aumentar a quantidade de informação.

Em seguida, o aparelho de decodificação de fala de acordo comesta modalidade será descrito. A FIG. 12 mostra a configuração do aparelhode decodificação de fala de acordo com a Modalidade 2 da presente inven-ção. Este aparelho de decodificação de fala 400 recebe um fluxo de bittransmitido a partir do aparelho de codificação de fala 300 mostrado na FIG. 11.

No aparelho de decodificação de fala 400 mostrado na FIG. 12,a seção de demultiplexação 401 demultiplexa o fluxo de bit recebido a partirdo aparelho de codificação de fala 300 mostrado na FIG. 11, para os dadoscodificados de primeira camada, os dados codificados de segunda camada eos dados codificados de coeficiente de LPC, e extrai os dados codificados deprimeira camada para a seção de decodificação de primeira camada 402, osdados codificados de segunda camada para a seção de decodificação desegunda camada 405 e os dados codificados de coeficiente de LPC para aseção de decodificação de LPC 407. Ainda, a seção de decodificação deespectro de primeira camada 401 extrai a informação de camada (isto é, ainformação mostrando qual fluxo de bit inclui os dados codificados de cadacamada) para a seção de decisão 413.

A seção de decodificação de primeira camada 402 gera ρ sinaldecodificado de primeira camada pela realização de um processamento dedecodificação usando os dados codificados de primeira camada e extrai osinal decodificado de primeira camada para a seção de filtro inverso 403 e aseção de aumento de amostragem 410. Ainda, a seção de decodificação deprimeira camada 402 extrai os coeficientes de LPC decodificados de primei-ra camada durante o processamento de decodificação, para a seção de filtroinverso 403.

A seção de aumento de amostragem 410 aumenta a amostra-gem da taxa de amostragem para o sinal decodificado de primeira camadapara a mesma taxa de amostragem para o sinal de fala de entrada da FIG.11, e extrai o sinal decodificado de primeira camada para a seção de filtro depassa baixa 411 e a seção de decisão 413.

A seção de filtro de passa baixa 411 regula uma banda de pas-sagem de 0 a FL de antemão, gera um sinal de banda baixa pela passagemdo sinal decodificado de primeira camada de amostragem aumentada debanda de freqüência de 0 a FL e extrai o sinal de banda baixa para a seçãode adição 412.

A seção de filtro inverso 403 forma um filtro inverso usando oscoeficientes de LPC decodificados de primeira camada introduzidos a partirda seção de decodificação de primeira camada 402, gera o sinal residualdecodificado de primeira camada através deste filtro inverso e extrai o sinalresidual decodificado de primeira camada para a seção de transformação dedomínio de freqüência 404.

A seção de transformação de domínio de freqüência 404 gera oespectro decodificado de primeira camada pela realização de uma análisede freqüência do sinal residual decodificado de primeira camada extraído apartir da seção de filtro inverso 403 e extrai o espectro decodificado de pri-meira camada para a seção de decodificação de segunda camada 405.

A seção de decodificação de segunda camada 405 gera o es-pectro decodificado de segunda camada usando os dados codificados desegunda camada e o espectro decodificado de primeira camada e extrai oespectro decodificado de segunda camada para a seção de transformaçãode domínio de tempo 406. Ainda, os detalhes da seção de decodificação desegunda camada 405 são os mesmos que os da seção de decodificação desegunda camada 203 (FIG. 9) da Modalidade 1 e, assim, uma repetição dedescrição é omitida.

A seção de transformação de domínio de tempo 406 gera o sinalresidual decodificado de segunda camada pela transformação do espectrodecodificado de segunda camada em um sinal de domínio de tempo e extraio sinal residual decodificado de segunda camada para a seção de filtro desíntese 408.

A seção de decodificação de LPC 407 extrai os coeficientes deLPC decodificados obtidos pela decodificação dos dados codificados de coe-ficiente de LPC para a seção de filtro de síntese 408.

A seção de filtro de síntese 408 forma um filtro de síntese usan-do os coeficientes de LPC decodificados introduzidos a partir da seção dedecodificação de LPC 407. Ainda, os detalhes do filtro de síntese 408 são osmesmos que os da seção de filtro de síntese 207 (FIG. 9) da Modalidade 1e, assim, uma repetição da descrição é omitida. A seção de filtro de síntese408 gera um sinal sintetizado de segunda camada sq(n) como na Modalida-de 1 e extrai este sinal para a seção de filtro de passa alta 409.

A seção de filtro de passa alta 409 regula a banda de passagempara de FL a FH de antemão, gera um sinal de banda alta pela passagem dosinal sintetizado de segunda camada de banda de freqüência de FL a FH eextrai o sinal de banda alta para a seção de adição 412.

A seção de adição 412 gera o sinal decodificado de segundacamada pela adição do sinal de banda baixa e do sinal de banda alta e extraio sinal decodificado de segunda camada para a seção de decisão 413.

A seção de decisão 413 decide se os dados codificados de se-gunda camada estão incluídos no fluxo de bit com base em uma informaçãode camada introduzida a partir da seção de decodificação de espectro deprimeira camada 401, seleciona o sinal decodificado de primeira camada ouo sinal decodificado de segunda camada, e extrai este sinal como um sinaldecodificado. Se os dados codificados de segunda camada não estiveremincluídos no fluxo de bit, a seção de decisão 413 extrairá o sinal decodificadode primeira camada e, se ambos os dados codificados de primeira camada eos dados codificados de segunda camada estiverem incluídos, extrairá osinal decodificado de segunda camada.

Ainda, a seção de filtro de passa baixa 411 e a seção de filtro depassa alta 409 são usadas para facilitação da influência do sinal de bandabaixa e do sinal de banda alta sobre cada outro. Conseqüentemente, quandoa influência do sinal de banda baixa do sinal de banda alta sobre cada outroé menor, uma configuração não usando estes filtros pode ser possível.Quando estes filtros não são usados, uma operação de acordo com umafiltração não é necessária, de modo que é possível reduzir a quantidade deoperação.

Desta forma, o aparelho de decodificação de fala 400 é capaz dedecodificar um fluxo de bit transmitido a partir do aparelho de codificação defala 300 mostrado na FIG. 11.

(Modalidade 3)

O espectro do sinal de excitação de primeira camada é achatadoda mesma forma que o espectro do espectro residual de predição, onde ainfluência da envoltória espectral é removida do sinal de fala de entrada. En-tão, com esta modalidade, o sinal de excitação de primeira camada determi-nado durante um processamento de codificação na primeira camada é pro-cessado como um sinal em que o espectro é achatado (sito é, o sinal residu-al decodificado de primeira camada da Modalidade 2).

A FIG. 13 mostra a configuração do aparelho de codificação defala de acordo com a Modalidade 3 da presente invenção. Na FIG. 13, aosmesmos componentes que na Modalidade 2 (FIG. 11) serão atribuídos osmesmos números de referência e uma repetição da descrição será omitida.

A seção de codificação de primeira camada 501 gera os dadoscodificados de primeira camada pela codificação de um sinal de fala de a-mostragem reduzida para uma taxa de amostragem desejada, e extrai osdados codificados de primeira camada para a seção de multiplexação 109. Aseção de codificação de primeira camada 501 usa, por exemplo, uma codifi-cação de CELP. Ainda, a seção de codificação de primeira camada 501 ex-trai o sinal de excitação de primeira camada gerado durante o processamen-to de codificação para a seção de transformação de domínio de freqüência502. Mais ainda, o que é referido como um "sinal de excitação" aqui é umsinal introduzido em um filtro de síntese (ou um filtro de síntese de pondera-ção perceptivo) dentro da seção de codificação de primeira camada 501 querealiza uma codificação de CELP, e também é referido como um "sinal deexcitação".

A seção de transformação de domínio de freqüência 502 gera oespectro decodificado de primeira camada pela realização de uma análisede freqüência do sinal de excitação de primeira camada, e extrai o sinal de-codificado de primeira camada para a seção de codificação de segunda ca-mada108.

Ainda, a quantidade de atraso de seção de atraso 503 assume omesmo valor que o tempo de atraso que ocorre quando o sinal de fala deentrada passa através da seção de redução de amostragem 301, da seçãode codificação de primeira camada 501 e da seção de transformação dedomínio de freqüência 502.

Desta forma, de acordo com esta modalidade, a seção de deco-dificação de primeira camada 303 e a seção de filtro inverso 304 não sãonecessárias, se comparado com a Modalidade 2 (FIG. 11), de modo que épossível reduzir a quantidade de operação.

Em seguida, o aparelho de decodificação de fala de acordo comesta modalidade será descrito. A FIG. 14 mostra a configuração do aparelhode decodificação de fala de acordo com a Modalidade 3 da presente inven-ção. Este aparelho de decodificação de fala 600 recebe um fluxo de bittransmitido a partir do aparelho de codificação de fala 500 mostrado na FIG.13. Na FIG. 14, aos mesmos componentes que na Modalidade 2 (FIG. 12)serão atribuídos os mesmos números de referência e uma repetição da des-crição será omitida.

A seção de decodificação de primeira camada 601 gera o sinaldecodificado de primeira camada pela realização de um processamento dedecodificação usando os dados codificados de primeira camada, e extrai osinal decodificado de primeira camada para a seção de aumento de amos-tragem 410. Ainda, a seção de decodificação de primeira camada 601 extraio sinal de excitação de primeira camada gerado durante um processamentode decodificação para a seção de transformação de domínio de freqüência 602.

A seção de transformação de domínio de freqüência 602 gera oespectro decodificado de primeira camada pela realização de uma análisede freqüência do sinal de excitação de primeira camada, e extrai o espectrodecodificado de primeira camada para a seção de decodificação de segundacamada 405.

Desta forma, o aparelho de decodificação de fala 600 é capaz dedecodificar um fluxo de bit transmitido a partir do aparelho de codificação defala 500 mostrado na FIG. 13.

(Modalidade 4)

Nesta modalidade, os espectros do sinal decodificado de primei-ra camada e um sinal de fala de entrada são achatados usando-se os coefi-cientes de LPC decodificados de segunda camada determinados na segun-da camada.

A FIG. 15 mostra a configuração do aparelho de codificação defala 700 de acordo com a Modalidade 4 da presente invenção. Na FIG. 15,aos mesmos componentes que na Modalidade 2 (FIG. 11) serão atribuídosos mesmos números de referência, e uma repetição da descrição será omitida.

A seção de codificação de primeira camada 701 gera os dadoscodificados de primeira camada pela codificação do sinal de fala de entradade amostragem reduzida para a taxa de amostragem desejada, e extrai osdados codificados de primeira camada para a seção de decodificação deprimeira camada 702 e para a seção de multiplexação 109. A seção de codi-ficação de primeira camada 701 usa, por exemplo, uma codificação deCELP.

A seção de decodificação de primeira camada 702 gera o sinaldecodificado de primeira camada pela realização de um processamento dedecodificação usando os dados codificados de primeira camada, e extraieste sinal para a seção de aumento de amostragem 703.A seção de aumento de amostragem 703 aumenta a amostra-gem de uma taxa de amostragem para o sinal decodificado de primeira ca-mada para a mesma taxa de amostragem para o sinal de fala de entrada, eextrai o sinal decodificado de primeira camada para a seção de filtro inverso 704.

De modo similar à seção de filtro inverso 104, a seção de filtroinverso 704 recebe os coeficientes de LPC a partir da seção de decodifica-ção de LPC 103. A seção de filtro inverso 704 forma um filtro inverso usandoos coeficientes de LPC decodificados e achata o espectro do sinal decodifi-cado de primeira camada pela filtração do sinal decodificado de primeiracamada através deste filtro inverso. Ainda, na descrição a seguir, um sinalde saída de seção de filtro inverso 704 (sinal decodificado de primeira ca-mada, onde o espectro é achatado) é referido como o "sinal residual decodi-ficado de primeira camada".

A seção de transformação de domínio de freqüência 705 gera oespectro decodificado de primeira camada pela realização de uma análisede freqüência do sinal residual decodificado de primeira camada extraído apartir da seção de filtro inverso 704, e extrai o espectro decodificado de pri-meira camada para a seção de codificação de segunda camada 108.

Ainda, a quantidade de atraso de seção de atraso 706 assume omesmo valor que o tempo de atraso que ocorre quando o sinal de fala deentrada passa através da seção de redução de amostragem 301, da seçãode codificação de primeira camada 701, da seção de decodificação de pri-meira camada 702, da seção de aumento de amostragem 703, da seção defiltro inverso 704 e da seção de transformação de domínio de freqüência 705.

Em seguida, o aparelho de decodificação de fala de acordo comesta modalidade será descrito. A FIG. 16 mostra a configuração do aparelhode decodificação de fala de acordo com a Modalidade 4 da presente inven-ção. Este aparelho de decodificação de fala 800 recebe um fluxo de bittransmitido a partir do aparelho de codificação de fala 700 mostrado na FIG.15. Na FIG. 16, aos mesmos componentes que na Modalidade 2 (FIG. 12)serão atribuídos os mesmos números de referência e uma repetição da des-crição será omitida.

A seção de decodificação de primeira camada 801 gera o sinaldecodificado de primeira camada pela realização de um processamento dedecodificação usando-se os dados codificados de primeira camada e extraieste sinal para a seção de aumento de amostragem 802.

A seção de aumento de amostragem 802 aumenta a amostra-gem da taxa de amostragem para o sinal decodificado de primeira camadapara a mesma taxa de amostragem para o sinal de fala de entrada da FIG.15, e extrai o sinal decodificado de primeira camada para a seção de filtroinverso 803 e a seção de decisão 413.

De modo similar à seção de filtro de síntese 408, a seção de fil-tro inverso 803 recebe os coeficientes de LPC decodificados a partir da se-ção de decodificação de LPC 407. A seção de filtro inverso 803 forma umfiltro inverso usando os coeficientes de LPC decodificados, achata o espec-tro do sinal decodificado de primeira camada pela filtração do sinal decodifi-cado de primeira camada de amostragem aumentada através deste filtroinverso, e extrai o sinal residual decodificado de primeira camada para a se-ção de transformação de domínio de freqüência 804.

A seção de transformação de domínio de freqüência 804 gera oespectro decodificado de primeira camada pela realização de uma análisede freqüência do sinal residual decodificado de primeira camada extraído apartir da seção de filtro inverso 803, e extrai o espectro decodificado de pri-meira camada para a seção de decodificação de segunda camada 405.

Desta forma, o aparelho de decodificação de fala 800 é capaz dedecodificar um fluxo de bit transmitido a partir do aparelho de codificação défala 700 mostrado na FIG. 15.

Desta forma, de acordo com esta modalidade, o aparelho de co-dificação de fala achata os espectros do sinal decodificado de primeira ca-mada e um sinal de fala de entrada usando os coeficientes de LPC decodifi-cados de segunda camada determinados na segunda camada, de modo queseja possível encontrar o espectro decodificado de primeira camada usando-se coeficientes de LPC que sejam comuns entre o aparelho de decodificaçãode fala e o aparelho de codificação de fala. Portanto, de acordo com estamodalidade, quando o aparelho de decodificação de fala gera um sinal de-codificado, um processamento em separado para a banda baixa e a bandaalta, conforme descrito nas Modalidades 2 e 3, não é mais necessário, demodo que um filtro de passa baixa e um filtro de passa alta não são neces-sários, uma configuração de um aparelho se torna mais simples e é possívelreduzir a quantidade de operação de processamento de filtração.

(Modalidade 5)

Nesta modalidade, o grau de achatamento é controlado pelamudança de forma adaptativa de um coeficiente de supressão de ressonân-cia de um filtro inverso para achatamento de um espectro de acordo com ascaracterísticas de um sinal de fala de entrada.

A FIG. 17 mostra a configuração de um aparelho de codificaçãode fala 900 de acordo com a Modalidade 5 da presente invenção. Na FIG.17, aos mesmos componentes que na Modalidade 4 (FIG. 15) serão atribuí-dos os mesmos números de referência, e uma repetição de descrição seráomitida.

No aparelho de codificação de fala 900, as seções de filtro inver-so 904 e 905 são representadas pela equação 2.

A seção de análise de quantidade de recurso 901 calcula aquantidade de recurso pela análise do sinal de fala de entrada, e extrai aquantidade de recurso para a seção de codificação de quantidade de recur-so 902. Como a quantidade de recurso, um parâmetro representando a in-tensidade de um espectro de fala com respeito à ressonância é usado. Parase ser mais específico, por exemplo, a distância entre parâmetros de LSPadjacentes é usada. Geralmente, quando esta distância é mais curta, o graude ressonância é mais forte e a energia do espectro correspondente à fre-qüência de ressonância é maior. Em um período de fala, quando uma resso-nância é mais forte, o espectro é atenuado demais nas vizinhanças da fre-qüência de ressonância e, assim, a qualidade de fala se deteriora. Para seprevenir isto, o grau de achatamento é regulado pequeno pela regulagemacima do coeficiente de supressão de ressonância γ (0 < γ < 1) pouco emum período de fala em que a ressonância é mais forte. Por meio disto, épossível prevenir uma atenuação de espectro excessiva na vizinhança dafreqüência de ressonância pelo processamento de achatamento e preveniruma deterioração de qualidade de fala.

A seção de codificação de quantidade de recurso 902 gera da-dos codificados de quantidade de recurso pela codificação da quantidade derecurso introduzida a partir da seção de análise de quantidade de recurso901, e extrai os dados codificados de quantidade de recurso para a seção dedecodificação de quantidade de recurso 903 e a seção de multiplexação 906.

A seção de decodificação de quantidade de recurso 903 decodi-fica a quantidade de recurso usando os dados codificados de quantidade derecurso, determina o coeficiente de supressão de ressonância γ usado nasseções de filtro inverso 904 e 905 de acordo com a decodificação de quanti-dade de recurso e extrai o coeficiente de supressão de ressonância γ paraas seções de filtro inverso 904 e 905. Quando um parâmetro representandoo grau da periodicidade é usado como a quantidade de recurso, o coeficientede supressão de ressonância γ é regulado maior se a periodicidade de umsinal de fala de entrada for maior, e o coeficiente de supressão de ressonân-cia γ é regulado menor, se a periodicidade do sinal de entrada for menor.

Pelo controle do coeficiente de supressão de ressonância γ dessa forma, ograu de achatamento do espectro é maior na parte com voz, e é menor naparte sem voz. Desta forma, é possível prevenir um achatamento de espec-tro excessivo na parte sem voz e prevenir uma deterioração de qualidade de fala.

As seções de filtro inverso 904 e 905 realizam um processamen-to de filtro inverso com base em um coeficiente de supressão de ressonânciaγ controlado na seção de decodificação de quantidade de recurso 903 deacordo com a equação 2.

A seção de multiplexação 906 gera um fluxo de bit pela multiple-xação dos dados codificados de primeira camada, dos dados codificados desegunda camada, dos dados codificados de coeficiente de LPC e dos dadoscodificados de quantidade de recurso, e extrai o fluxo de bit.

Ainda, a quantidade de atraso de seção de atraso 907 assume omesmo valor que o tempo de atraso que ocorre quando o sinal de fala deentrada passa através da seção de redução de amostragem 301, da seçãode codificação de primeira camada 701, da seção de decodificação de pri-meira camada 702, da seção de aumento de amostragem 703, da seção defiltro inverso 905 e da seção de transformação de domínio de freqüência705.

Em seguida, o aparelho de decodificação de fala de acordo comesta modalidade será descrito. A FIG. 18 mostra a configuração do aparelhode decodificação de fala de acordo com a Modalidade 5 da presente inven-ção. Este aparelho de decodificação de fala 1000 recebe um fluxo de bittransmitido a partir do aparelho de codificação de fala 900 mostrado na FIG.17. Na FIG. 18, aos mesmos componentes que na Modalidade 4 (FIG. 16)serão atribuídos os mesmos números de referência e uma repetição da des-crição será omitida.

No aparelho de decodificação de fala 1000, a seção de filtro in-verso 1003 é representada pela equação 2.

A seção de demultiplexação 1001 demultiplexa o fluxo de bit re-cebido a partir do aparelho de codificação de fala 900 mostrado na FIG. 17para os dados codificados de primeira camada, os dados codificados de se-gunda camada, os dados codificados de coeficiente de LPC e os dados codi-ficados de quantidade de recurso, e extrai os dados codificados de primeiracamada para a seção de decodificação de primeira camada 801, os dadoscodificados de segunda camada para a seção de decodificação de segundacamada 405, os dados codificados de coeficiente de LPC para a seção dedecodificação de LPC 407 e os dados codificados de quantidade de recursopara a seção de decodificação de quantidade de recurso 1002. Ainda, a se-ção de demultiplexação 1001 extrai uma informação de camada (isto é, umainformação mostrando qual fluxo de bit inclui dados codificados de qual ca-mada) que é extraída para a seção de decisão 413.De modo similar à seção de decodificação de quantidade de re-curso 903 (FIG. 17), a seção de decodificação de quantidade de recurso1002 decodifica a quantidade de recurso usando os dados codificados dequantidade de recurso, determina o coeficiente de supressão de ressonânciaγ usado na seção de filtro inverso 1003 de acordo com a decodificação daquantidade de recurso e extrai o coeficiente de supressão de ressonância γpara a seção de filtro inverso 1003.

A seção de filtro inverso 1003 realiza um processamento de fil-tração inversa com base no coeficiente de supressão de ressonância γ con-trolado na seção de decodificação de quantidade de recurso 1002 de acordocom a equação 2.

Desta forma, o aparelho de decodificação de fala 1000 é capazde decodificar um fluxo de bit transmitido a partir do aparelho de codificaçãode fala 900 mostrado na FIG. 17.

Ainda, conforme descrito acima, a seção de quantificação deLPC 102 (FIG. 17) converte os coeficientes de LPC em parâmetros de LSPprimeiramente, e quantifica os parâmetros de LSP. Então, nesta modalidade,uma configuração do aparelho de codificação de fala pode ser conformemostrado na FIG. 19. Isto é, no aparelho de codificação de fala 1100 mos-trado na FIG. 19, uma seção de análise de quantidade de recurso 901 não éprovida, e a seção de quantificação de LPC 102 calcula a distância entre osparâmetros de LSP e extrai a distância para a seção de codificação de quan-tidade de recurso 902.

Ainda, quando a seção de quantificação de LPC 102 gera osparâmetros de LSP decodificados, a configuração do aparelho de codifica-ção de fala pode ser conforme mostrado na FIG. 20. Isto é, no aparelho decodificação de fala 1300 mostrado na FIG. 20, a seção de análise de quanti-dade de recurso 901, a seção de codificação de quantidade de recurso 902e a seção de decodificação de quantidade de recurso 903 não são providas,e a seção de quantificação de LPC 102 gera os parâmetros de LSP decodifi-cados, calcula a distância entre os parâmetros de LSP decodificados e extraia distância para a seções de filtro inverso 904 e 905.Ainda, a FIG. 21 mostra a configuração do aparelho de decodifi-cação de fala 1400 que decodifica um fluxo de bit transmitido a partir do apa-relho de codificação de fala 1300 mostrado na FIG. 20. Na FIG. 21, a seçãode decodificação de LPC 407 ainda calcula a distância entre os parâmetrosde LSP decodificados e extrai a distância para a seção de filtro inverso 1003.

(Modalidade 6)

Com os sinais de fala ou sinais de áudio, freqüentemente ocor-rem casos em que a faixa dinâmica (isto é, a relação do valor máximo daamplitude do espectro para o valor mínimo) de um espectro de banda baixa,o qual é a origem de duplicação, torna-se maior do que a faixa dinâmica deum espectro de banda alta, o qual é o destino de duplicação. Sob uma cir-cunstância como essa, quando o espectro de banda baixa é duplicado paraa obtenção do espectro de banda alta, um pico indesejável no espectro debanda alta ocorre. Então, no sinal decodificado obtido pela transformação doespectro com esse pico indesejável para o domínio de tempo, um ruído quesoa como o tinido de um sino ocorre e, conseqüentemente, a qualidade sub-jetiva se deteriora.

Em contraste com isto, para melhoria da qualidade subjetiva, éproposta uma técnica para modificação de um espectro de banda baixa eajuste da faixa dinâmica do espectro de banda baixa mais próximo da faixadinâmica do espectro de banda alta (por exemplo, veja "Improvement of thesuper-wideband scalable coder using pitch filtering based on spectrum co-ding," Oshikiri, Ehara, e Yoshida, 2004 Autumnal Acoustic Society PaperCollection 2-4-13, pp. 297 a 298, setembro de 2004). Com esta técnica, énecessário transmitir uma informação de modificação mostrando como oespectro de banda baixa é modificado, a partir do aparelho de codificação defala para o aparelho de decodificação de fala.

Aqui, quando esta informação de modificação é codificada noaparelho de codificação de fala, se o número de candidatos de codificaçãonão for suficiente, isto é, se a taxa de bit for baixa, um erro de quantificaçãogrande ocorrerá. Então, se um erro de quantificação grande como esse ocor-rer, a faixa dinâmica do espectro de banda baixa não será suficientementeajustada, devido ao erro de quantificação, e, como resultado, uma deteriora-ção de qualidade ocorrerá. Particularmente, quando um candidato de codifi-cação mostrando uma faixa dinâmica maior do que a faixa dinâmica maiordo que faixa dinâmica do espectro de banda alta é selecionado, um pico in-desejável no espectro de banda alta tem probabilidade de ocorrer, e ocorremcasos em que uma deterioração de qualidade se mostra notadamente.

Então, de acordo com esta modalidade, em um caso em que atécnica para ajuste da faixa dinâmica do espectro de banda baixa mais pró-xima da faixa dinâmica da banda alta é aplicada às modalidades acima,quando a seção de codificação de segunda camada 108 codifica uma infor-mação de modificação, um candidato de codificação que diminui uma faixadinâmica tem maior probabilidade de ser selecionado do que um candidatode codificação que aumente uma faixa dinâmica.

A FIG. 22 mostra a configuração de seção de codificação de se-gunda camada 108 de acordo com a Modalidade 6 da presente invenção. NaFIG. 22, aos mesmos componentes que na Modalidade 1 (FIG. 7) serão atri-buídos os mesmos números de referência, e uma repetição de descriçãoserá omitida.

Na seção de codificação de segunda camada 108 mostrada naFIG. 22, a seção de modificação de espectro 1087 recebe uma entrada deespectro decodificado de primeira camada S1(k)(0 < k < FL) a partir da se-ção de decodificação de primeira camada 107 e uma entrada de espectroresidual S2(k)(0 < k < FH) a partir da seção de transformação de domínio defreqüência 105. A seção de modificação de espectro 1087 muda a faixa di-nâmica de espectro decodificado S1 (k) pela modificação do espectro decodi-ficado S1(k) de modo que a faixa dinâmica de espectro decodificado S1(k)seja ajustada para uma faixa dinâmica adequada. Então, a seção de modifi-cação de espectro 1087 codifica uma informação de modificação mostrandocomo o espectro decodificado S1(k) é modificado, e extrai a informação demodificação codificada para a seção de multiplexação 1086. Ainda, a seçãode modificação de espectro 1087 extrai o espectro decodificado modificado(espectro decodificado modificado) S1'(j, k) para a seção de regulagem deestado interno 1081.

A FIG. 23 mostra a configuração de seção de modificação deespectro 1087. A seção de modificação de espectro 1087 modifica o espec-tro decodificado S1(k) e ajusta a faixa dinâmica de espectro decodificadoS1(k) mais próxima da faixa dinâmica da banda alta (FL < k < FH) de espec-tro residual S2(k). Ainda, a seção de modificação de espectro 1087 codificaa informação de modificação e extrai a informação de modificação codifica-da.

Na seção de modificação de espectro 1087 mostrada na FIG.23, a seção de geração de espectro modificado 1101 gera o espectro deco-dificado modificado S1'(j, k) pela modificação do espectro decodificado S1(k)e extrai o espectro decodificado modificado S1'(j, k) para a seção de cálculode energia de sub-banda 1102. Aqui, j é um índice para a identificação decada candidato de codificação (cada informação de modificação) de livro decódigo 1111, e a seção de geração de espectro modificado 1101 modifica oespectro decodificado S1(k) usando cada candidato de codificação (cadainformação de modificação) incluída no livro de código 1111. Aqui, será des-crito um caso como um exemplo em que um espectro é modificado usando-se uma função exponencial. Por exemplo, quando os candidatos de codifica-ção incluídos no livro de código 1111 são representados como a(j), cadacandidato de codificação a(j) está na faixa de 0 < a(j) < 1. Desta forma, oespectro decodificado modificado S1'(j, k) é representado pela equação 15.

[15]

Sl'{j,k) = sign{Sl{k))- \ Sl(*)|e(y) (Equação 15)

Aqui, sign() é a função para retorno de um sinal positivo ou ne-gativo. Conseqüentemente, quando um candidato de codificação a(j) assu-me um valor próximo de "zero," a faixa dinâmica do espectro decodificadomodificado S1 '(j, k) se torna menor.

A seção de cálculo de energia de sub-banda 1102 divide a ban-da de freqüência de espectro decodificado modificado S1'(j, k) em uma plu-ralidade de sub-bandas, calcula a energia média (energia de sub-banda)P1(j, n) de cada sub-banda, e extrai a energia média P1(j, n) para a seçãode cálculo de variância 1103. Aqui, η é um número de sub-banda.

A seção de cálculo de variância 1103 calcula a variância o1(j)2de energia de sub-banda P1(j, n) para mostrar o grau de dispersão de ener-gia de sub-banda P1(j, n). Então, a seção de cálculo de variância 1103 extraiuma variância o1(j)2 de candidato de codificação (informação de modifica-ção) j para a seção de subtração 1106.

Por outro lado, a seção de cálculo de energia de sub-banda1104 divide a banda alta de espectro residual S2(k) em uma pluralidade desub-bandas, calcula a energia média (energia de sub-banda) P2(n) de cadasub-banda e extrai a energia média P2 para a seção de cálculo de variância1105.

Para se mostrar o grau de dispersão de energia de sub-bandaP2(n), a seção de cálculo de variância 1105 calcula a variância σ22 de ener-gia de sub-banda P2(n), e extrai a variância σ22 de energia de sub-bandaP2(n) para a seção de subtração 1106.

A seção de subtração 1106 subtrai a variância a1(j)2 da variân-cia σ22 e extrai um sinal de erro obtido por esta subtração para a seção dedecisão 1107 e a seção de cálculo de erro ponderado 1108.

A seção de decisão 1107 decide um sinal (positivo ou negativo)do sinal de erro e determina o peso dado à seção de cálculo de erro ponde-rado 1108, com base no resultado de decisão. Se o sinal do sinal de erro forpositivo, a seção de decisão 1107 selecionará wpos, e se o sinal do sinal deerro for negativo, selecionará wneg como o peso, e extrairá o peso para a se-ção de cálculo de erro ponderado 1108. A relação mostrada na equação 16se mantém entre wpos e wneg.

<formula>formula see original document page 36</formula>

Em primeiro lugar, a seção de cálculo de erro ponderado 1108calcula o valor quadrado do sinal de erro introduzido a partir da seção desubtração 1106, então, calcula o erro ao quadrado ponderado E pela multi-plicação do valor ao quadrado do sinal de erro pelo peso W (wpos ou wneg)introduzido a partir da seção de decisão 1107 e extrai o erro ao quadradoponderado E para a seção de busca 1109. O erro ao quadrado ponderado Eé representado pela equação 17.

<formula>formula see original document page 37</formula>

(Equaçao 17)

A seção de busca 1109 controla o livro de código 1111 para aextração de candidatos de codificação (informação de modificação) armaze-nados no livro de código 1111 seqüencialmente para a seção de geração deespectro modificado 1101 e busca pelo candidato de codificação (informaçãode modificação) que minimize o erro ao quadrado ponderado E. Então, aseção de busca 1109 extrai um índice jopt do candidato de codificação queminimiza o erro ao quadrado ponderado E como a informação de modifica-ção ótima para a seção de geração de espectro modificado 1110 e a seçãode multiplexação 1086.

A seção de geração de espectro modificado 1110 gera o espec-tro decodificado modificado S1 '(j0pt, k) correspondente à informação de modi-ficação ótima jopt pela modificação do espectro decodificado S1(k) e extrai oespectro decodificado modificado S1'(jopt, k) para a seção de regulagem deestado interno 1081.

Em seguida, a seção de decodificação de segunda camada 203do aparelho de decodificação de fala de acordo com esta modalidade serádescrita. A FIG. 24 mostra a configuração da seção de decodificação de se-gunda camada 203 de acordo com a Modalidade 6 da presente invenção. NaFIG. 24, aos mesmos componentes que na Modalidade 1 (FIG. 10) serãoatribuídos os mesmos números de referência e uma repetição de descriçãoserá omitida.

Na seção de decodificação de segunda camada 203, a seção degeração de espectro modificado 2036 gera um espectro decodificado modifi-cado S1'(joPt, k) pela modificação do espectro decodificado de primeira ca-mada S1(k) introduzido a partir da seção de decodificação de primeira ca-mada 202, com base na informação de modificação ótima jopt introduzida apartir da seção de demultiplexação 2032, e extrai o espectro decodificadomodificado S1'(j0pt, k) para a seção de regulagem de estado interno 2031.Isto é, â seção de geração de espectro modificado 2036 é provida em rela-ção à seção de geração de espectro modificado 1110 no lado de aparelhode codificação de fala e realiza o mesmo processamento que na seção degeração de espectro modificado 1110.

Conforme descrito acima, um caso em que o peso para o cálculodo erro ao quadrado ponderado é determinado de acordo com o sinal dosinal de erro e o peso inclui uma relação mostrada na equação 16 pode serdescrito, conforme se segue.

Isto é, um caso em que o sinal de erro é positivo se refere a umcaso em que o grau de dispersão de espectro decodificado modificado S1'se torna menor do que o grau de dispersão de espectro residual S2 como ovalor alvo. Isto é, isto corresponde a um caso em que a faixa dinâmica deespectro decodificado modificado SV gerado no lado de aparelho de decodi-ficação de fala se torna menor do que a faixa dinâmica de espectro residual S2.

Por outro lado, um caso em que o sinal de erro é negativo serefere a um caso em que o grau de dispersão de espectro decodificado mo-dificado SV é maior do que o grau de dispersão de espectro residual S2, oqual é maior do que o valor alvo. Isto é, isto corresponde a um caso em quea faixa dinâmica de espectro decodificado modificado SV gerada no lado deaparelho de decodificação de fala se torna maior do que a faixa dinâmicagerada no lado de aparelho de decodificação de fala se torna maior do que afaixa dinâmica de espectro residual S2.

Conseqüentemente, conforme mostrado na equação 16, pelaregulagem do peso wpos em um caso em que o sinal de erro é positivo, me-nor do que wneg em um caso em que o sinal de erro é negativo, quando oerro ao quadrado é quase do mesmo valor, os candidatos de codificação quegeram o espectro decodificado modificado SV com uma menor faixa dinâmi-ca do que a faixa dinâmica de espectro residual S2 tem maior probabilidadede serem selecionados. Istoé, os candidatos de codificação que suprimem afaixa dinâmica preferencialmente são selecionados. Conseqüentemente, afaixa dinâmica de um espectro estimado gerado no aparelho de decodifica-ção de fala menos freqüentemente se torna maior do que a faixa dinâmicada banda alta do espectro residual.

Aqui, quando a faixa dinâmica de espectro decodificado modifi-cado S1' se torna maior do que a faixa dinâmica alvo do espectro, um picoindesejável ocorre no espectro estimado no aparelho de decodificação defala e se torna mais perceptível para os ouvidos humanos como uma deterio-ração de qualidade. Por outro lado, quando a faixa dinâmica de espectrodecodificado modificado S1' se torna menor do que a faixa dinâmica alvo doespectro, um pico indesejável, conforme descrito acima, tem menos probabi-lidade de correr no espectro estimado no aparelho de decodificação de fala.Isto é, de acordo com esta modalidade, em um caso em que uma técnicapara ajuste da faixa dinâmica do espectro de banda baixa para a faixa dinâ-mica do espectro de banda alta é aplicada à Modalidade 1, é possível pre-venir uma deterioração de qualidade perceptiva.

Ainda, embora um exemplo tenha sido descrito com a descriçãoacima em que a função exponencial é usada como um método de modifica-ção de espectro, esta modalidade não está limitada a isto, e outros métodosde modificação de espectro, por exemplo, um método de modificação deespectro usando a função logarítmica, pode ser usado.

Ainda, embora tenha sido descrito um caso com a descrição a-cima em que a variância de energia de sub-banda média é usada, a presen-te invenção não está limitada à variância de energia de sub-banda média,desde que índices mostrando a quantidade da faixa dinâmica de um espec-tro sejam usados.

(Modalidade 7)

A FIG. 25 mostra a configuração de seção de modificação deespectro 1087 de acordo com a Modalidade 7 da presente invenção. Na FIG.25, aos mesmos componentes que na Modalidade 6 (FIG. 23) serão atribuí-dos os mesmos números de referência, e uma repetição de descrição seráomitida.

Na seção de modificação de espectro 1087 mostrada na FIG.25, a seção de cálculo de grau de dispersão 1112-1 calcula o grau de dis-persão de espectro decodificado S1(k) a partir da distribuição de valores nabanda baixa de espectro decodificado S1(k), e extrai o grau de dispersãopara as seções de regulagem de limite 1113-1 e 1113-2. Para se ser maisespecífica, o grau de dispersão é um desvio padrão σ1 de espectro decodifi-cado S1(k).

A seção de regulagem de limite 1113-1 encontra um primeirolimite TH1 usando um desvio padrão σ1 e extrai o limite TH1 para a seçãode cálculo de espectro médio 1114-1 e a seção de geração de espectro mo-dificado 1110. Aqui, o primeiro limite TH1 se refere a um limite para a especi-ficação dos valores espectrais com amplitude comparativamente alta dentreo espectro decodificado S1(k), e usa o valor obtido pela multiplicação dodesvio padrão σ1 por uma constante predeterminada a.

A seção de regulagem de limite 1113-2 encontra um segundolimite TH2 usando um desvio padrão σ1 e extrai o segundo limite TH2 para aseção de cálculo de espectro médio 1114-2 e a seção de geração de espec-tro modificado 1110. Aqui, o segundo limite TH2 é um limite para especifica-ção dos valores espectrais com amplitude comparativamente baixa dentre abanda baixa de espectro decodificado S1(k), e usa o valor obtido pela multi-plicação do desvio padrão σ1 por uma constante predeterminada b (<a).

A seção de cálculo de espectro médio 1114-1 calcula um valorde amplitude médio de um espectro com amplitude mais alta do que um pri-meiro limite TH1 (a partir deste ponto, "primeiro valor médio") e extrai o valorde amplitude médio para a seção de cálculo de vetor modificado 1115. Parase ser mais específico, a seção de cálculo de espectro médio 1114-1 compa-ra o valor espectral da banda baixa do espectro decodificado S1(k) com òvalor (m1 + TH1) obtido pela adição do primeiro limite TH1 a um valor médiom1 de espectro decodificado S1(k), e especifica os valores espectrais comvalores mais altos do que este valor (etapa 1). Em seguida, a seção de cál-culo de espectro médio 1114-1 compara o valor espectral da banda baixa deespectro decodificado S1(k) com o valor (m1 - TH1) obtido pela subtração doprimeiro limite TH1 do valor médio m1 de espectro decodificado S1(k), e es-pecifica os valores espectrais com valores mais baixos do que este valor(etapa 2). Então, a seção de cálculo de espectro médio 1114-1 calcula umvalor de amplitude médio dos valores espectrais determinados na etapa 1 ena etapa 2, e extrai o valor de amplitude médio dos valores espectrais para aseção de cálculo de vetor modificado 1115.

A seção de cálculo de espectro médio 1114-2 calcula um valorde amplitude médio (a partir deste ponto, um "segundo valor médio") dosvalores espectrais com amplitude mais baixa do que o segundo limite TH2, eextrai o valor de amplitude médio para a seção de cálculo de vetor modifica-do 1115. Para se ser mais específico, a seção de cálculo de espectro médio1114-2 compara o valor espectral da banda baixa de espectro decodificadoS1(k) com o valor (m1 + TH2) obtido pela adição do segundo limite TH2 aovalor médio m1 de espectro decodificado Sl (k), e especifica os valores es-pectrais com os valores mais baixos do que este valor (etapa 1). Em segui-da, a seção de cálculo de espectro médio 1114-2 compara o valor espectralda banda baixa do espectro decodificado S1(k) com o valor (m1 - TH2) obti-do pela subtração do segundo limite TH2 do valor médio m1 de espectrodecodificado S1(k), e especifica os valores espectrais com valores mais altosdo que este valor (etapa 2). Então, a seção de cálculo de espectro médio1114-2 calcula um valor de amplitude médio dos valores espectrais determi-nados na etapa 1 e na etapa 2, e extrai o valor de amplitude médio do es-pectro para a seção de cálculo de vetor modificado 1115.

Por outro lado, a seção de cálculo de grau de dispersão 1112-2calcula o grau de dispersão do espectro residual S2(k) a partir da distribui-ção de valores na banda alta de espectro residual S2(k) e extrai o grau dedispersão para as seções de regulagem de limite 1113-3 e 1113-4. Para seser mais específico, o grau de dispersão é um desvio padrão σ2 de espectroresidual S2(k).

A seção de regulagem de limite 1113-3 encontra um terceiro li-mite TH3 usando o desvio padrão σ2 e extrai o terceiro limite TH3 para aseção de cálculo de espectro médio 1114-3. Aqui, o terceiro limite TH3 é umlimite para especificação dos valores espectrais com amplitude comparati-vãmente alta dentre a banda alta de espectro residual S2(k), e usa o valorobtido pela multiplicação do desvio padrão σ2 por uma constante predeter-minada c.

A seção de regulagem de limite 1113-4 encontra um quarto Iimi-te TH4 usando o desvio padrão σ2 e extrai o quarto limite TH4 para a seçãode cálculo de espectro médio 1114-4. Aqui, o quarto limite TH4 é um limitepara especificação dos valores espectrais com amplitude comparativamentebaixa dentre a banda alta de espectro residual S2(k) e o valor obtido pelamultiplicação do desvio padrão σ2 por uma constante predeterminada d (<c)é usado.

A seção de cálculo de espectro médio 1114-3 calcula um valorde amplitude médio (a partir deste ponto, um "terceiro valor médio") dos va-lores espectrais com amplitude mais alta do que o terceiro limite TH3 e extraio valor de amplitude médio para a seção de cálculo de vetor modificado1115. Para se ser mais específico, a seção de cálculo de espectro médio1114-3 compara o valor espectral da banda alta de espectro residual S2(k)com o valor (m3 + TH3) obtido pela adição do terceiro limite TH3 ao valormédio m3 de espectro residual S2(k), e especifica os valores espectrais comvalores mais altos do que este valor (etapa 1). Em seguida, a seção de cál-culo de espectro médio 1114-3 compara o valor espectral da banda alta deespectro residual S2(k) com o valor (m3 - TH3) obtido pela subtração do ter-ceiro limite TH3 do valor médio m3 de espectro residual S2(k), e especificaos valores espectrais com valores mais baixos do que este valor (etapa 2).

Então, a seção de cálculo de espectro médio 1114-3 calcula um valor deamplitude médio dos valores espectrais determinados na etapa 1 e na etapa2, e extrai o valor de amplitude médio do espectro para a seção de cálculode vetor modificado 1115.

A seção de cálculo de espectro médio 1114-4 calcula um valorde amplitude médio (a partir deste ponto, um "quarto valor médio") dos valo-res espectrais com amplitude mais alta do que o quarto limite TH4 e extrai ovalor de amplitude médio para a seção de cálculo de vetor modificado 1115.Para se ser mais específico, a seção de cálculo de espectro médio 1114-4compara o valor espectral da banda alta de espectro residual S2(k) com ovalor (m3 + TH4) obtido pela adição do quarto limite TH4 ao valor médio m3de espectro residual S2(k), e especifica os valores espectrais com valoresmais altos do que este valor (etapa 1). Em seguida, a seção de cálculo deespectro médio 1114-4 compara o valor espectral da banda alta de espectroresidual S2(k) com o valor (m3 - TH4) obtido pela subtração do quarto limiteTH4 do valor médio m3 de espectro residual S2(k), e especifica os valoresespectrais com valores mais baixos do que este valor (etapa 2). Então, aseção de cálculo de espectro médio 1114-4 calcula um valor de amplitude médio dos valores espectrais determinados na etapa 1 e na etapa 2, e extraio valor de amplitude médio do espectro para a seção de cálculo de vetormodificado 1115.

A seção de cálculo de vetor modificado 1115 calcula um vetormodificado conforme descrito abaixo usando o primeiro valor médio, o se-gundo valor médio, o terceiro valor médio e o quarto valor médio.

Isto é, a seção de cálculo de vetor modificado 1115 calcula arelação do terceiro valor médio para o primeiro valor médio (a partir desteponto, o "primeiro ganho") e a relação do quarto valor médio para o segundovalor médio (a partir deste ponto, o "segundo ganho"), e extrai o primeiroganho e o segundo ganho para a seção de subtração 1106 como vetoresmodificados. A partir deste ponto, um vetor modificado é representado comog(i) (i = 1, 2). Isto é, g(1) é o primeiro ganho e g(2) é o segundo ganho.

A seção de subtração 1106 subtrai os candidatos de codificaçãoque pertencem ao livro de código de vetor modificado 1116 do vetor modifi-cado g(i), e extrai o sinal de erro obtido a partir desta subtração para a seçãode decisão 1107 e a seção de cálculo de erro ponderado 1108. A partir desteponto, os candidatos de codificação são representados como v(j, i). Aqui, j éum índice para a identificação de cada candidato de codificação (cada infor-mação de modificação) de livro de código de vetor modificado 1116.

A seção de decisão 1107 decide o sinal de um sinal de erro (po-sitivo ou negativo), e determina um peso dado à seção de cálculo de erroponderado 1108 para o primeiro ganho g(1) e o segundo ganho g(2), respec-tivamente, com base no resultado de decisão. Com respeito ao primeiro ga-nho g(1), se o sinal do sinal de erro for positivo, a seção de decisão 1107selecionará W|ight como o peso e, se o sinal do sinal de erro for negativo, se-lecionará Wheavy como o peso, e extrairá o resultado para a seção de cálculode erro ponderado 1108. Por outro lado, com respeito ao segundo ganhog(2), se o sinal do sinal de erro for positivo, a seção de decisão 1107 sele-cionará Wheavy como o peso e, se o sinal do sinal de erro for negativo, sele-cionará Whght como o peso, e extrairá o resultado para a seção de cálculo deerro ponderado 1108. A relação mostrada na equação 18 se mantém entreWiight e Wheavy.

<formula>formula see original document page 44</formula>

(Equação 18)

Em primeiro lugar, a seção de cálculo de erro ponderado 1108calcula o valor ao quadrado do sinal de erro introduzido a partir da seção desubtração 1106, então, calcula o erro ao quadrado ponderado E pelo cálculoda soma do produto do valor ao quadrado do sinal de erro e de cada peso(Wüght ou Wheavy) introduzido a partir da seção de decisão 1107 para o primei-ro ganho g(1) e o segundo ganho g(2) e extrai o erro ao quadrado pondera-do E para a seção de busca 1109. O erro ao quadrado ponderado E é repre-sentado pela equação 19.

<formula>formula see original document page 44</formula>

(Equaçao 19)

A seção de busca 1109 controla o livro de código de vetor modi-ficado 1116, e busca pelo candidato de codificação (informação de modifica-ção) que minimize o erro ao quadrado ponderado E. Então, a seção de bus-ca 1109 extrai o índice jopt do candidato de codificação que minimiza o erroao quadrado ponderado E para a seção de geração de espectro modificado1110 e a seção de multiplexação 1086 como a informação de modificaçãoótima.

A seção de geração de espectro modificado 1110 gera o espec-tro decodificado modificado S1'(j, k) cor à informação de modificação ótimajopt pela modificação do espectro decodificado S1(k) usando o primeiro limiteTH1, o segundo limite TH2 e a informação de modificação ótima jopt e extraio espectro decodificado modificado S1'(j0pt, k) para a seção de regulagem deestado interno 1081.

A seção de geração de espectro modificado 1110, em primeirolugar, gera um valor decodificado (a partir deste ponto, o "primeiro ganhodecodificado") da relação do terceiro valor médio para o primeiro valor médioe um valor decodificado (a partir deste ponto, o "segundo ganho decodifica-do") da relação do quarto valor médio para o segundo valor médio usando ainformação de modificação ótima jopt.

Em seguida, a seção de geração de espectro modificado 1110compara o valor de amplitude do espectro decodificado S1 (k) com o primeirolimite TH1, especifica os valores espectrais com amplitude mais alta do queo primeiro limite TH1 e gera o espectro decodificado modificado S1'(j0pt, k)pela multiplicação destes valores espectrais pelo primeiro ganho decodifica-do. De modo similar, a seção de geração de espectro modificado 1110 com-para o valor de amplitude do espectro decodificado S1(k) com o segundolimite TH2, especifica valores espectrais com amplitude mais baixa do que osegundo limite TH2 e gera o espectro decodificado modificado S1'(jopt, k)pela multiplicação destes valores espectrais pelo segundo ganho decodificado.

Ainda, dentre o espectro decodificado S1(k), não há uma infor-mação de codificação do espectro tendo valores de espectro entre o primeirolimite TH1 e o segundo limite TH2. Então, a seção de geração de espectromodificado 1110 usa um ganho de um valor intermediário entre o primeiroganho decodificado e o segundo ganho decodificado. Por exemplo, a seçãode geração de espectro modificado 1110 encontra o ganho decodificado ycorrespondente a uma dada amplitude χ a partir de uma curva característicacom base no primeiro ganho decodificado, no segundo ganho decodificado,no primeiro limite TH1 e no segundo limite TH2, e multiplica a amplitude doespectro decodificado S1(k) por este ganho decodificado y. Isto é, o ganhodecodificado y é um valor de interpolação linear do primeiro ganho decodifi-cado e do segundo ganho decodificado.

Desta forma, de acordo com esta modalidade, é possível adquiriro mesmo efeito e a vantagem que na Modalidade 6.

(Modalidade 8)

A FIG. 26 mostra a configuração de seção de modificação deespectro 1087 de acordo com a Modalidade 8 da presente invenção. Na FIG.26, aos mesmos componentes que na Modalidade 6 (FIG. 23) serão atribuí-dos os mesmos números de referência e uma repetição de descrição seráomitida.

Na seção de modificação de espectro 1087 mostrada na FIG.26, a seção de correção 1117 recebe uma entrada de variância σ22 a partirda seção de cálculo de variância 1105.

A seção de correção 1117 realiza um processamento de corre-ção, de modo que o valor de variância σ22 se torne menor, e extrai o resul-tado para a seção de subtração 1106. Para se ser mais específico, a seçãode correção 1117 multiplica a variância σ22 por um valor igual a ou maior doque O e menor do que 1.

A seção de subtração 1106 subtrai a variância o1(j)2 da variân-cia após o processamento de correção, e extrai o sinal de erro obtido poresta subtração para a seção de cálculo de erro 1118.

A seção de cálculo de erro 1118 calcula o valor ao quadrado (er-ro ao quadrado) do sinal de erro introduzido a partir da seção de subtração1106 e extrai o valor ao quadrado para a seção de busca 1109.

A seção de busca 1109 controla o livro de código 1111 para ex-trair candidatos de codificação (informação de modificação) armazenados nolivro de código 1111 seqüencialmente para a seção de geração de espectromodificado 1101, e busca o candidato de codificação (informação de modifi-cação) que minimize o erro ao quadrado. Então, a seção de busca 1109 ex-trai um índice jopt do candidato de codificação que minimiza o erro ao qua-drado para a seção de geração de espectro modificado 1110 e a seção demultiplexação 1086 como uma informação de modificação ótima.

Desta forma, de acordo com esta modalidade, após o proces-samento de correção na seção de correção 1117, na seção de busca 1109,a busca candidato de codificação é realizada, de modo que a variância apóso processamento de correção, isto é, a variância com um valor regulado me-nor seja um valor alvo. Conseqüentemente, o aparelho de decodificação defala é capaz de suprimir a faixa dinâmica de um espectro estimado, de modoque seja possível reduzir mais a freqüência de ocorrências de um pico inde-sejável, conforme descrito acima.

Ainda, de acordo com as características de um sinal de fala deentrada, a seção de correção 1117 pode mudar o valor a ser multiplicadopela variância σ22. O grau de periodicidade de passo de um sinal de fala deentrada é usado como uma característica. Isto é, se a periodicidade de pas-so do sinal de fala de entrada for baixa (por exemplo, um ganho de passo ébaixo), a seção de correção 1117 poderá regular um valor a ser multiplicadopela variância σ22 maior, e, se a periodicidade de passo do sinal de fala deentrada for alta (por exemplo, um ganho de passo é alto), poderá regular umvalor a ser multiplicado pela variância σ22 menor. De acordo com esta adap-tação, um pico espectral indesejável tem menor probabilidade de ocorrerapenas com respeito a sinais quando a periodicidade de passo for alta (porexemplo, a parte de vogai) e, como resultado, é possível melhorar a qualida-de de fala perceptiva.

(Modalidade 9)

A FIG. 27 mostra a configuração de seção de modificação deespectro 1087 de acordo com a Modalidade 9 da presente invenção. Na FIG.27, aos mesmos componentes que na Modalidade 7 (FIG. 25) serão atribuí-dos os mesmos números de referência e uma repetição de descrição seráomitida.

Na seção de modificação de espectro 1087 mostrada na FIG.27, a seção de correção 1117 recebe uma entrada de vetor modificado g(i) apartir da seção de cálculo de vetor modificado 1115.

A seção de correção 1117 realiza pelo menos um processamen-to de correção, de modo que o valor do primeiro ganho g(1) se torne menore um processamento de correção de modo que o valor de segundo ganhog(2) se torne maior, e extrai o resultado para a seção de subtração 1106.Para se ser mais específico, a seção de correção 1117 multiplica o primeiroganho g(1) por um valor igual a ou maior do que 0 e menor do que 1, e mul-tiplica o segundo ganho g(2) por um valor mais alto do que 1.

A seção de subtração 1106 subtrai os candidatos de codificaçãoque pertençam a um livro de código de vetor modificado 1116 do vetor modi-ficado após o processamento de correção, e extrai um sinal de erro obtidopor esta subtração para a seção de cálculo de erro 1118.

A seção de busca 1109 controla o livro de código de vetor modi-ficado 1116 para extrair candidatos de codificação (informação de modifica-ção) armazenados no livro de código de vetor modificado 1116 seqüencial-mente para a seção de subtração 1106, e busca pelo candidato de codifica-ção (informação de modificação) que minimize o erro ao quadrado. Então, aseção de busca 1109 extrai o índice jopt do candidato de codificação que mi-nimiza o erro ao quadrado para a seção de geração de espectro modificado1110 e a seção de multiplexação 1086 como uma informação de modifica-ção ótima.

Desta forma, de acordo com esta modalidade, após o proces-samento de correção na seção de correção 1117, na seção de busca 1109,a busca por candidato de codificação é realizada de modo que um vetor mo-dificado após o processamento de correção, isto é, um vetor modificado quediminua uma faixa dinâmica, seja um valor alvo. Conseqüentemente, o apa-relho de decodificação de fala é capaz de suprimir a faixa dinâmica do es-pectro estimado, de modo que seja possível reduzir mais a freqüência deocorrências de um pico indesejável, conforme descrito acima.

Ainda, de modo similar à Modalidade 8, nesta modalidade, o va-lor a ser multiplicado pelo vetor modificado g(i) pode ser mudado na seçãode correção 1117 de acordo com as características de um sinal de fala deentrada. De acordo com essa adaptação, de modo similar à Modalidade 8,um pico espectral indesejável tem menos probabilidade de ocorrer apenascom respeito a sinais em que a periodicidade de passo é alta (por exemplo,a parte de vogai) e, como resultado, é possível melhorar a qualidade de falaperceptiva.

(Modalidade 10)

A FIG. 28 mostra a configuração de uma seção de codificaçãode segunda camada 108 de acordo com a Modalidade 10 da presente in-venção. Na FIG. 28, aos mesmos componentes que na Modalidade 6 (FIG.22) serão atribuídos os mesmos números de referência, e uma repetição dedescrição será omitida.

Na seção de codificação de segunda camada 108 mostrada naFIG. 28, a seção de modificação de espectro 1088 recebe uma entrada deespectro residual S2(k) a partir da seção de transformação de domínio defreqüência 105 e uma entrada de um valor estimado do espectro residual(espectro residual estimado) S2'(k) a partir da seção de busca 1083.

Com referência à faixa dinâmica da banda alta de espectro resi-dual S2(k), a seção de modificação de espectro 1088 muda a faixa dinâmicade espectro residual estimado S2'(k) pela modificação do espectro estimadoS2'(k). Então, a seção de modificação de espectro 1088 codifica a informa-ção de modificação mostrando como o espectro residual estimado S2'(k) émodificado, e extrai a informação de modificação para a seção de multiple-xação 1086. Ainda, a seção de modificação de espectro 1088 extrai o espec-tro residual estimado (espectro residual modificado) para a seção de codifi-cação de ganho 1085. Ainda, uma configuração interna de seção de modifi-cação de espectro 1088 é a mesma que a da seção de modificação de es-pectro 1087, e uma descrição detalhada é omitida.

No processamento na seção de codificação de ganho 1085, o"valor estimado S2'(k) de um espectro residual" na Modalidade 1 é lido comoum "espectro residual modificado" e, assim, uma descrição detalhada é omitida.

Em seguida, a seção de decodificação de segunda camada 203do aparelho de decodificação de fala de acordo com esta modalidade serádescrita. A FIG. 29 mostra a configuração de seção de decodificação de se-gunda camada 203 de acordo com a Modalidade 10 da presente invenção.Na FIG. 29, aos mesmos componentes que na Modalidade 6 (FIG. 24) serãoatribuídos os mesmos números de referência, e uma repetição de descriçãoserá omitida.

Na seção de decodificação de segunda camada 203, a seção degeração de espectro modificado 2037 modifica o espectro decodificado S'(k)introduzido a partir da seção de filtração 2033, com base na informação demodificação ótima jopt introduzida a partir da seção de demuítiplexação 2032,isto é, com base na informação de modificação ótima jopt relacionada ao es-pectro residual modificado, e extrai o espectro decodificado S'(k) para a se-ção de ajuste de espectro 2035. Isto é, a seção de geração de espectro mo-dificado 2037 é provida correspondendo à seção de modificação de espectro1088 no lado de aparelho de codificação de fala, e realiza o mesmo proces-samento da seção de modificação de espectro 1088.

Desta forma, de acordo com esta modalidade, o espectro resi-dual estimado S2'(k) é modificado além do espectro decodificado S1(k), demodo que seja possível gerar um espectro residual estimado com uma faixadinâmica adequada.

(Modalidade 11)

A FIG. 30 mostra a configuração de seção de codificação de se-gunda camada 108 de acordo com a Modalidade 11 da presente invenção.Na FIG. 30, aos mesmos componentes que na Modalidade 6 (FIG. 22) serãoatribuídos os mesmos números de referência e uma repetição de descriçãoserá omitida.

Na seção de codificação de segunda camada 108 mostrada naFIG. 30, a seção de modificação de espectro 1087 modifica o espectro de-codificado S1(k) de acordo com uma informação de modificação predetermi-nada que é comum entre o aparelho de codificação de fala e o aparelho dedecodificação de fala, e muda a faixa dinâmica de espectro decodificadoS1(k). Então, a seção de modificação de espectro 1087 extrai o espectrodecodificado modificado S1'(j, k) para a seção de regulagem de estado in-terno 1081.

Em seguida, a seção de decodificação de segunda camada 203do aparelho de decodificação de fala de acordo com a presente invençãoserá descrita. A FIG. 31 mostra a configuração de seção de decodificação desegunda camada 203 de acordo com a Modalidade 1 í da presente inven-ção. Na FIG. 31, aos mesmos componentes que na Modalidade 6 (FIG. 24)serão atribuídos os mesmos números de referência e uma repetição de des-crição será omitida.

Na seção de decodificação dé segunda camada 203, a seção degeração de espectro modificado 2036 modifica o espectro decodificado deprimeira camada S1(k) introduzido a partir da seção de decodificação deprimeira camada 202 de acordo com uma informação de modificação prede-terminada que é comum entre o aparelho de decodificação de fala e o apare-lho de codificação de fala, isto é, de acordo com a mesma informação demodificação que a informação de modificação predeterminada usada na se-ção de modificação de espectro 1087 da FIG. 30, e extrai o espectro decodi-ficado de primeira camada S1(k) para a seção de regulagem de estado in-terno 2031.

Desta forma, de acordo com esta modalidade, a seção de modi-ficação de espectro 1087 do aparelho de codificação de fala e a seção degeração de espectro modificado 2036 do aparelho de decodificação de falarealizam um processamento de modificação de acordo com a mesma infor-mação de modificação predeterminada, de modo que não é necessáriotransmitir a informação de modificação a partir do aparelho de codificação defala para o aparelho de decodificação de fala. Conseqüentemente, de acordocom esta modalidade, é possível reduzir a taxa de bit, se comparado com aModalidade 6.

Ainda, a seção de modificação de espectro 1088 mostrada naFIG. 28 e a seção de geração de espectro modificado 2037 mostrada naFIG. 29 podem realizar um processamento de modificação de acordo com amesma informação de modificação predeterminada. Por meio disto, é possí-vel reduzir adicionalmente a taxa de bit.(Modalidade 12)

A seção de codificação de segunda camada 108 da Modalidade10 pode empregar uma configuração sem a seção de modificação de espec-tro 1087. Então, a FIG. 32 mostra a configuração da seção de codificação desegunda camada 108 de acordo com a Modalidade 12.

Ainda, se a seção de codificação de segunda camada 108 nãoincluir a seção de modificação de espectro 1087, a seção de geração de es-pectro modificado 2036, a qual é correspondente à seção de modificação deespectro 1087, não será necessária no aparelho de decodificação de fala.Então, a FIG. 33 mostra a configuração da seção de decodificação de se-gunda camada 203 de acordo com a Modalidade 12.

As modalidades da presente invenção foram descritas.

Ainda, a seção de codificação de segunda camada 108 de acor-do com as Modalidades 6 a 12 pode ser empregada na Modalidade 2 (FIG.11), na Modalidade 3 (FIG. 13), na Modalidade 4 (FIG. 15) e na Modalidade5 (FIG. 17). Neste caso, nas Modalidades 4 e 5 (FIG. 15 e 17), o sinal deco-dificado de primeira camada tem a amostragem aumentada e, então, étransformado no domínio de freqüência, e, assim, a banda de freqüência deespectro decodificado de primeira camada S 1(k) é 0 < k < FH. Contudo, osinal decodificado de primeira camada tem a amostragem aumentada sim-plesmente e, então, é transformado no domínio de freqüência, e, assim, abanda FL < k < FH não inclui uma componente de sinal efetiva. Conseqüen-temente, com estas modalidades, a banda de espectro decodificado de pri-meira camada S1 (k) é usada como 0 < k < FL.

Ainda, a seção de codificação de segunda camada 108 de acor-do com as Modalidades 6 a 12 pode ser usada quando uma codificação forrealizada na segunda camada do aparelho de codificação de fala além doaparelho de codificação de fala descrito nas Modalidades 2 a 5.

Ainda, embora tenham sido descritos casos com as modalidadesacima em que, após um coeficiente de passo ou um índice ser multiplexadona seção de multiplexação 1086 na seção de codificação de segunda cama-da 108 e o sinal multiplexado ser extraído como dados codificados de se-gunda camada, um fluxo de bit é gerado pela multiplexação dos dados codi-ficados de primeira camada, dos dados codificados de segunda camada edos dados codificados de coeficiente de LPC na seção de multiplexação109, as modalidades não estão limitadas a isto, e um coeficiente de passoou um índice por ser introduzido diretamente na seção de multiplexação 109e multiplexado por, por exemplo, os dados codificados de primeira camada,sem a provisão da seção de multiplexação 1086 na seção de codificação desegunda camada 108. Ainda, embora na seção de decodificação de segun-da camada 203 os dados codificados de segunda camada multiplexadosuma vez a partir de um fluxo de bit e gerados na seção de demultiplexação201 sejam introduzidos na seção de demultiplexação 2032 na seção de de-codificação de segunda camada 203 e ainda sejam multiplexados para ocoeficiente de passo e o índice, a seção de decodificação de segunda ca-mada 203 não está limitada a isto, e um fluxo de bit pode ser diretamentemultiplexado ao coeficiente de passo ou ao índice e introduzido na seção dedecodificação de segunda camada 203, sem a provisão da seção de demul-tiplexação 2032 na seção de decodificação de segunda camada 203.

Ainda, embora tenham sido descritos casos com as modalidadesacima em que o número de camadas na codificação escalonável seja dois,as modalidades não estão limitadas a isto, e a presente invenção pode seraplicada a uma codificação escalonável com três ou mais camadas.

Ainda, embora tenham sido descritos casos com as modalidadesacima em que uma MDCT é empregada como o esquema de codificação detransformada na segunda camada, as modalidades não estão limitadas aisto, e outros esquemas de codificação de transformada, tais como FFT,DFT, DCT, banco de filtro ou transformada de ondulação, podem ser empre-gados na presente invenção.

Ainda, embora tenham sido descritos casos com as modalidadesacima em que um sinal de entrada é um sinal de fala, as modalidades nãoestão limitadas a isto, e a presente invenção pode ser aplicada a um sinal deáudio.

Ainda, é possível evitar uma deterioração de qualidade de falaem uma comunicação móvel pela provisão do aparelho de codificação defala e do aparelho de decodificação de fala de acordo com as modalidadesacima em aparelhos de estação rádio móvel e um aparelho de estação basede comunicação por rádio usados em um sistema de comunicação móvel.

Mais ainda, nas modalidades acima, também, o aparelho de estação móvelde comunicação por rádio e o aparelho de estação base de comunicação porrádio podem ser referidos como UE e Nó B, respectivamente.

Também, embora tenham sido descritos casos com a modalida-de acima como exemplos em que a presente invenção é configurada porhardware, contudo, a presente invenção também pode ser realizada porsoftware.

Cada bloco de função empregado na descrição de cada umadas modalidades mencionadas anteriormente tipicamente pode ser imple-mentado como um LSI constituído por um circuito integrado. Estes podemser chips individuais ou podem estar parcial ou totalmente contidos em umchip único. Um "LSI" é adotado aqui, mais este também pode ser referidocomo "IC", "LSI de sistema", "super-LSI" ou "ultra-LSI", dependendo de ex-tensões diferentes de integração.

Ainda, o método de integração de circuito não está limitado aLSI's, e uma implementação usando um circuito dedicado ou processadoresde finalidade geral também é possível. Após a fabricação de um LSI, a utili-zação de um FPGA (Arranjo de Porta Programável de Campo) ou um pro-cessador reconfigurável em que conexões e regulagens de células de circui-to dentro de um LSI podem ser reconfiguradas também é possível.

Ainda, se uma tecnologia de circuito integrado vier a substituir osLSI1S como resultado do avanço da tecnologia ou um derivado de outra tec-nologia, naturalmente também é possível realizar uma integração de blocode circuito usando-se esta tecnologia. Uma aplicação em biotecnologia tam-bém é possível.

O presente pedido é baseado no pedido de patente japonesa N92005-286533, depositado em 30 de setembro de 2005 e no pedido de paten-te japonesa N- 2006-199616, depositado em 21 de julho de 2006, cujo con-teúdo inteiro é expressamente incorporado como referência aqui.Aplicabilidade Industrial

A presente invenção pode ser aplicada para uso em um apare-lho de estação móvel de comunicação por rádio ou um aparelho de estaçãobase de comunicação por rádio usado em um sistema de comunicação móvel.

Claims

1. Aparelho de codificação de fala, que compreende:uma primeira seção de codificação que codifica um espectro debanda baixa compreendendo uma banda mais baixa do que uma freqüênciade limite de um sinal de fala;uma seção de achatamento, que achata o espectro de bandabaixa usando um filtro inverso com características inversas de uma envoltó-ria espectral do sinal de fala; euma segunda seção de codificação que codifica um espectro debanda alta compreendendo uma banda mais alta do que a freqüência delimite do sinal de fala usando o espectro de banda baixa achatado.

2. Aparelho de codificação de fala, de acordo com a reivindica-ção 1, onde a seção de achatamento forma o filtro inverso usando coeficien-tes de codificação de predição linear do sinal de fala.

3. Aparelho de codificação de fala, de acordo com a reivindica-ção 1, onde a seção de achatamento muda um grau de achatamento de a-cordo com um grau de ressonância do sinal de fala.

4. Aparelho de codificação de fala, de acordo com a reivindica-ção 3, onde, quando o grau de ressonância é maior, a seção de achátamen-to regula o grau de achatamento mais baixo.

5. Aparelho de codificação de fala, de acordo com a reivindica-ção 1, onde a segunda seção de codificação modifica o espectro de bandabaixa achatado e codifica o espectro de banda alta usando o espectro debanda baixa modificado.

6. Aparelho de codificação de fala, de acordo com a reivindica-ção 5, onde a segunda seção de codificação modifica o espectro de bandabaixa achatado de modo que uma faixa dinâmica do espectro de banda bai-xa achatado seja ajustada mais próxima de uma faixa dinâmica do espectrode banda alta.

7. Aparelho de codificação de fala, de acordo com a reivindica-ção 6, onde a segunda seção de codificação modifica o espectro de bandabaixa achatado modifica o espectro de banda baixa achatado usando umcandidato de codificação que diminui uma faixa dinâmica preferencialmenteem relação a um candidato de codificação que aumenta a faixa dinâmica,dentre uma pluralidade de candidatos de codificação.

8. Aparelho de codificação de fala, de acordo com a reivindica-ção 7, onde a segunda seção de codificação realiza uma correção de modoque um valor alvo de busca de candidato de codificação se torne menor e,com base no valor alvo corrigido, busca um candidato de codificação usadopara modificação do espectro de banda baixa achatado dentre a pluralidadede candidatos de codificação.

9. Aparelho de codificação de fala, de acordo com a reivindica-ção 5, onde a segunda seção de codificação estima o espectro de bandaalta a partir do espectro de banda baixa modificado, modifica o espectro debanda alta estimado e codifica o espectro de banda alta do sinal de fala pelouso do espectro de banda alta modificado.

10. Aparelho de codificação de fala, de acordo com a reivindica-ção 1, onde a segunda seção de codificação estima o espectro de bandaalta a partir do espectro de banda baixa achatado, modifica o espectro debanda alta estimado e codifica o espectro de banda alta do sinal de fala pelouso do espectro de banda alta modificado.

11. Aparelho de estação móvel de comunicação por rádio quecompreende o aparelho de codificação de fala de acordo com a reivindicação 1.

12. Aparelho de estação base de comunicação por rádio quecompreende o aparelho de codificação de fala de acordo com a reivindicação 1.

13. Método de codificação de fala, que compreende:uma primeira etapa de codificação de codificação de um espec-tro de banda baixa compreendendo uma banda mais baixa do que uma fre-qüência de limite de um sinal de fala;uma etapa de achatamento de achatamento do espectro debanda baixa usando-se um filtro inverso com características inversas parauma envoltória espectral do sinal de fala; euma segunda etapa de codificação de codificação de um espec-tro de banda alta compreendendo uma banda mais alta do que a freqüênciade limite do sinal de fala usando-se o espectro de banda baixa achatado.