BRPI0721079A2

BRPI0721079A2 - Dispositivo de codificação, dispositivo de decodificação e método dos mesmos

Info

Publication number: BRPI0721079A2
Application number: BRPI0721079-5A
Authority: BR
Inventors: Tomofumi Yamanashi; Masahiro Oshikiri
Original assignee: Panasonic Corp
Priority date: 2006-12-13
Filing date: 2007-12-12
Publication date: 2014-07-01
Also published as: EP2101318A1; JPWO2008072670A1; SG170078A1; US20100169081A1; WO2008072670A1; KR20090087920A; AU2007332508A1; EP2101318B1; KR101412255B1; AU2007332508B2; CN101548316B; AU2007332508A2; CN101548316A; EP2101318A4; JP5328368B2; ES2474915T3; US8352258B2

Description

Relatório Descritivo da Patente de Invenção para "DISPOSITIVO DE CODIFICAÇÃO, DISPOSITIVO DE DECODIFICAÇÃO E MÉTODO DOS MESMOS".

Campo Técnico

A presente invenção se refere a um aparelho de codifica

ção/aparelho de decodificação e a um método de codificação/método de decodificação usados em um sistema de comunicação no qual um sinal é codificado e transmitido e recebido e decodificado.

Técnica Antecedente Quando um sinal de fala/áudio é transmitido em um sistema de

comunicação móvel ou um sistema de comunicação de pacote tipificado por uma comunicação pela Internet, uma tecnologia de compressão/codificação freqüentemente é usada de modo a se aumentar a eficiência de transmissão de fala/áudio. Também, nos últimos anos, um método de codifica15 ção/decodificação escalonável foi desenvolvido que permite que um sinal decodificado de boa qualidade seja obtido da parte de uma informação codificada, mesmo se um erro de transmissão ocorrer durante uma transmissão.

Uma tecnologia de compressão/codificação descrita acima é uma tecnologia de codificação preditiva de domínio de tempo que aumenta a eficiência de compressão pelo uso da correlação temporal de um sinal de fala e/ou de um sinal de áudio (a partir deste ponto, referido como "sinal de fala/áudio"). Por exemplo, no Documento de Patente 1, um sinal de quadro atual é predito a partir de um sinal de quadro passado, e o método de codificação preditiva é comutado de acordo com o erro de predição. Também, no Documento Não de Patente 1, uma tecnologia é descrita, por meio da qual um método de codificação preditiva é comutado de acordo com o grau de mudança no domínio de tempo de um parâmetro de fala, tal como LSF (Freqüência Espectral de Linha) e o estado de ocorrência de erro de quadro. Documento de Patente 1: Pedido de Patente Japonesa Aberto N0 HEI 8- 211900.

Documento Não de Patente: Thomas Eriksson1 Jan Linden, e Jan Skoglund, "Exploiting Inter-frame Correlation In Spectral Quantization", "Acoustics, Speech, and Signal Processing", 1996. ICASSP-96. Conference Proceedings, 7-10 maio de 1996, página(s): 765 - 768 vol. 2.

Exposição da Invenção Problemas a Serem Resolvidos pela Invenção 5 Contudo, com qualquer uma das tecnologias acima, uma codifi

cação preditiva é realizada com base em um parâmetro de domínio de tempo em uma base quadro a quadro, e uma codificação preditiva com base em um parâmetro de domínio de tempo tal como um parâmetro de domínio de freqüência não é mencionada. Se um método de codificação preditiva com 10 base em um parâmetro de domínio de tempo, tal como descrito acima for simplesmente aplicado à codificação de parâmetro de domínio de freqüência, não haverá problema se uma banda alvo de quantificação for a mesma em um quadro passado e em um quadro atual, mas se a banda alvo de quantificação for diferente no quadro passado e no quadro atual, um erro de 15 codificação e uma degradação de qualidade de áudio de sinal decodificado aumentam grandemente, e um sinal de fala/áudio não pode ser capaz de ser codificado.

É um objetivo da presente invenção prover um aparelho de codificação e assim por diante capaz de reduzir a quantidade de informação co20 dificada de um sinal de fala/áudio, e também capaz de reduzir o erro de codificação de sinal de fala/áudio e a degradação de qualidade de áudio de sinal decodificado, quando uma componente de freqüência de uma banda diferente é tornada um alvo de quantificação em cada quadro.

Meios para Resolução dos Problemas Um aparelho de codificação da presente invenção emprega uma

configuração que tem: uma seção de transformação que transforma um sinal de entrada para o domínio de freqüência para a obtenção de um parâmetro de domínio de freqüência; uma seção de seleção que seleciona uma banda alvo de quantificação a partir de dentre uma pluralidade de sub-bandas obti30 das pela divisão do domínio de freqüência, e gera uma informação de banda indicando a banda alvo de quantificação; uma seção de quantificação de formato que quantifica o formato do parâmetro de domínio de freqüência na banda alvo de quantificação; e uma seção de quantificação de ganho que codifica o ganho de um parâmetro de domínio de freqüência na banda alvo de quantificação para a obtenção de uma informação codificada de ganho.

Um aparelho de decodificação da presente invenção emprega uma configuração que tem: uma seção de recepção que recebe uma informação indicando uma banda alvo de quantificação selecionada a partir de dentre uma pluralidade de sub-bandas obtidas pela divisão de um domínio de freqüência de um sinal de entrada; uma seção de desquantificação de formato que decodifica a informação codificada de formato na qual o formato de um parâmetro de domínio de freqüência na banda alvo de quantificação é quantificado, para a geração de um formato decodificado; uma seção de desquantificação de ganho que decodifica a informação codificada de ganho, na qual o ganho de um parâmetro de domínio de freqüência na banda alvo de quantificação é codificado, para a geração de um ganho decodificado, e decodifica um parâmetro de freqüência usando o formato decodificado e o ganho decodificado para a geração de um parâmetro de domínio de freqüência decodificado; e uma seção de transformação de domínio de tempo que transforma o parâmetro de domínio de freqüência decodificado para o domínio de tempo para a obtenção de um sinal decodificado de domínio de tempo.

Um método de codificação da presente invenção tem: uma etapa de transformação de um sinal de entrada para o domínio de freqüência para a obtenção de um parâmetro de domínio de freqüência; uma etapa de seleção de uma banda alvo de quantificação a partir de dentre uma pluralidade 25 de sub-bandas obtidas pela divisão do domínio de freqüência e geração da informação de banda indicando a banda alvo de quantificação; e uma etapa de quantificação do formato do parâmetro de domínio de freqüência na banda alvo de quantificação para a obtenção da informação codificada de formato; e uma codificação de ganho de um parâmetro de domínio de freqüência 30 na banda alvo de quantificação, para a obtenção de uma informação codificada de ganho.

Um método de decodificação da presente invenção tem: uma etapa de recebimento de uma informação indicando uma banda alvo de quantificação selecionada a partir de dentre uma pluralidade de sub-bandas obtidas pela divisão de um domínio de freqüência de um sinal de entrada; uma etapa de decodificação de uma informação codificada de formato na 5 qual o formato de um parâmetro de domínio de freqüência na banda alvo de quantificação é quantificado, para a geração de um formato decodificado; uma etapa de decodificação de informação codificada de ganho, na qual um ganho de um parâmetro de domínio de freqüência na banda alvo de quantificação é quantificado, para a geração de um ganho decodificado, e a decodi10 ficação de um parâmetro de domínio de freqüência usando-se o formato decodificado e o ganho decodificado para a geração de um parâmetro de domínio de freqüência decodificado; e uma etapa de transformação do parâmetro de domínio de freqüência decodificado para um domínio de tempo para a obtenção de um sinal decodificado de domínio de tempo.

Efeito Vantajoso da Invenção

A presente invenção reduz a quantidade de informação codificada de um sinal de fala/áudio ou similar, e também pode impedir uma degradação de qualidade de nitidez de um sinal decodificado, uma fala decodificada e assim por diante, e pode reduzir o erro de decodificação de um sinal 20 de fala/áudio ou similar e a degradação de qualidade de sinal decodificado. Breve Descrição dos Desenhos

A figura 1 é um diagrama de blocos que mostra a configuração principal de um aparelho de codificação de fala de acordo com a Modalidade

1 da presente invenção;

a figura 2 é um desenho que mostra um exemplo da configura

ção de regiões obtidas por uma seção de seleção de banda de acordo com a Modalidade 1 da presente invenção;

a figura 3 é um diagrama de blocos que mostra a configuração principal de um aparelho de decodificação de fala de acordo com a Modalidade 1 da presente invenção;

a figura 4 é um diagrama de blocos que mostra a configuração principal de uma variação de um aparelho de codificação de fala de acordo com a Modalidade 1 da presente invenção;

a figura 5 é um diagrama de blocos que mostra a configuração principal de uma variação de um aparelho de decodificação de fala de acordo com a Modalidade 1 da presente invenção;

a figura 6 é um diagrama de blocos que mostra a configuração

principal de um aparelho de codificação de fala de acordo com a Modalidade

2 da presente invenção;

a figura 7 é um diagrama de blocos que mostra a configuração principal do interior de uma seção de codificação de segunda camada de acordo com a Modalidade 2 da presente invenção;

a figura 8 é um diagrama de blocos que mostra a configuração principal de um aparelho de decodificação de fala de acordo com a Modalidade 2 da presente invenção;

a figura 9 é um diagrama de blocos que mostra a configuração principal do interior de uma seção de decodificação de segunda camada de acordo com a Modalidade 2 da presente invenção;

a figura 10 é um diagrama de blocos que mostra a configuração principal de um aparelho de codificação de fala de acordo com a Modalidade

3 da presente invenção;

a figura 11 é um diagrama de blocos que mostra a configuração

principal de um aparelho de decodificação de fala de acordo com a Modalidade 3 da presente invenção;

a figura 12 é um diagrama de blocos que mostra a configuração principal de um aparelho de codificação de fala de acordo com a Modalidade 4 da presente invenção;

a figura 13 é um diagrama de blocos que mostra a configuração principal de um aparelho de decodificação de fala de acordo com a Modalidade 4 da presente invenção;

a figura 14 é um diagrama de blocos que mostra a configuração principal de um aparelho de codificação de fala de acordo com a Modalidade da presente invenção;

a figura 15 é um diagrama de blocos que mostra a configuração principal do interior de uma seção de codificação de melhoria de banda de acordo com a Modalidade 5 da presente invenção;

a figura 16 é um diagrama de blocos que mostra a configuração principal do interior de uma seção de codificação de fator de escala corretivo de acordo com a Modalidade 5 da presente invenção;

a figura 17 é um diagrama de blocos que mostra a configuração principal do interior de uma seção de codificação de segunda camada de acordo com a Modalidade 5 da presente invenção;

a figura 18 é um diagrama de blocos que mostra a configuração principal de um aparelho de decodificação de fala de acordo com a Modalidade 5 da presente invenção;

a figura 19 é um diagrama de blocos que mostra a configuração principal do interior de uma seção de decodificação de melhoria de banda de acordo com a Modalidade 5 da presente invenção;

a figura 20 é um diagrama de blocos que mostra a configuração

principal do interior de uma seção de decodificação de segunda camada de acordo com a Modalidade 5 da presente invenção;

a figura 21 é um diagrama de blocos que mostra a configuração principal de um aparelho de codificação de fala de acordo com a Modalidade 6 da presente invenção;

a figura 22 é um diagrama de blocos que mostra a configuração principal do interior de uma seção de codificação de segunda camada de acordo com a Modalidade 6 da presente invenção;

a figura 23 é um desenho que mostra um exemplo da configuração de regiões obtida por uma seção de seleção de banda de acordo com a Modalidade 6 da presente invenção;

a figura 24 é um diagrama de blocos que mostra a configuração principal de um aparelho de decodificação de fala de acordo com a Modalidade 6 da presente invenção;

a figura 25 é um diagrama de blocos que mostra a configuração

principal do interior de uma seção de decodificação de segunda camada de acordo com a Modalidade 6 da presente invenção; a figura 26 é um diagrama de blocos que mostra a configuração principal de um aparelho de codificação de fala de acordo com a Modalidade 7 da presente invenção;

a figura 27 é um diagrama de blocos que mostra a configuração principal do interior de uma seção de codificação de segunda camada de acordo com a Modalidade 7 da presente invenção;

a figura 28 é um diagrama de blocos que mostra a configuração principal de um aparelho de decodificação de fala de acordo com a Modalidade 7 da presente invenção;

a figura 29 é um diagrama de blocos que mostra a configuração

principal do interior de uma seção de decodificação de segunda camada de acordo com a Modalidade 7 da presente invenção.

Melhor Modo para Realização da Invenção

Como uma visão geral de um exemplo da presente invenção, na quantificação de uma componente de freqüência de uma banda diferente em cada quadro, se o número de sub-bandas comuns a uma banda alvo de quantificação de quadro passado e uma banda alvo de quantificação de quadro atual for determinado como sendo maior do que ou igual a um valor predeterminado, uma codificação preditiva é realizada em um parâmetro de domínio de freqüência, e se o número de sub-bandas comum for determinado como sendo menor do que o valor predeterminado, um parâmetro de domínio de freqüência será codificado diretamente. Por meio disto, a quantidade de informação codificada de um sinal de fala/áudio ou similar é reduzida, e também a degradação de qualidade de nitidez de um sinal decodificado, uma fala decodificada e assim por diante, pode ser impedida, e um erro de codificação de um sinal de fala/áudio ou similar e degradação de qualidade de sinal decodificado - e degradação de qualidade de áudio de fala decodificado - podem ser reduzidos.

As modalidades da presente invenção serão descritas, agora, em detalhes, com referência aos desenhos associados. Nas descrições a seguir, um aparelho de codificação de fala e um aparelho de decodificação de fala são usados como exemplos de um aparelho de codificação e de um aparelho de decodificação da presente invenção.

(Modalidade 1)

A figura 1 é um diagrama de blocos que mostra a configuração principal de um aparelho de codificação de fala 100 de acordo com a ModaIidade 1 da presente invenção.

Nesta figura, o aparelho de codificação de fala 100 é equipado com uma seção de transformação de domínio de freqüência 101, uma seção de seleção de banda 102, uma seção de quantificação de formato 103, uma seção de decisão de execução/não execução de codificação preditiva 104, 10 uma seção de quantificação de ganho 105 e uma seção de multiplexação 106.

A seção de transformação de domínio de freqüência 101 realiza uma Transformada de Co-seno Discreta Modificada (MDCT) usando um sinal de entrada, para o cálculo de um coeficiente de MDCT, o qual é um parâmetro de domínio de freqüência, e extrai isto para a seção de seleção de banda 102.

A seção de seleção de banda 102 divide a entrada de coeficiente de MDCT da seção de transformação de domínio de freqüência 101 em uma pluralidade de sub-bandas, seleciona uma banda como uma banda alvo 20 de quantificação a partir da pluralidade de sub-bandas, e extrai uma informação de banda indicando a banda selecionada para a seção de quantificação de formato 103, a seção de decisão de execução/não execução de codificação preditiva 104 e a seção de multiplexação 106. Além disso, a seção de seleção de banda 102 extrai o coeficiente de MDCT para a seção de 25 quantificação de formato 103. A entrada de coeficiente de MDCT na seção de quantificação de formato 103 também pode ser realizada diretamente a partir da seção de transformação de domínio de freqüência 101 separadamente da entrada a partir da seção de transformação de domínio de freqüência 101 para a seção de seleção de banda 102.

A seção de quantificação de formato 103 realiza uma quantifica

ção de formato usando um coeficiente de MDCT correspondente a uma banda indicada pela entrada de informação de banda a partir da seção de seleção de banda 102 a partir de dentre os coeficientes de MDCT introduzidos a partir da seção de seleção de banda 102, e extrai uma informação codificada de formato obtida para a seção de multiplexação 106. Além disso, seção de quantificação de formato 103 encontra um valor de ganho ideal de 5 quantificação de formato, e extrai o valor de ganho ideal obtido para a seção de quantificação de ganho 105.

A seção de decisão de execução/não execução de codificação preditiva 104 encontra um número de sub-bandas comuns a uma banda alvo de quantificação de quadro atual e uma banda alvo de quantificação de quadro passado usando a informação de banda introduzida a partir da seção de seleção de banda 102. Então, a seção de decisão de execução/não execução de codificação preditiva 104 determina que uma codificação preditiva é para ser realizada no coeficiente de MDCT da banda alvo de quantificação indicada pela informação de banda, se o número de sub-bandas comuns for maior do que ou igual a um valor predeterminado, ou determina que uma codificação preditiva não é para ser realizada no coeficiente de MDCT da banda alvo de quantificação indicada pela informação de banda, se o número de sub-bandas comuns for menor do que o valor predeterminado. A seção de decisão de execução/não execução de codificação preditiva 104 extrai o resultado desta determinação para a seção de quantificação de ganho 105.

Se o resultado da determinação introduzido a partir da seção de decisão de execução/não execução de codificação preditiva 104 indicar que uma codificação preditiva é para ser realizada, a seção de quantificação de ganho 105 realizará a codificação preditiva de banda alvo de quantificação 25 de quadro atual usando o valor de ganho de quantificação de quadro passado em um buffer interno e um livro de código de ganho interno, para a obtenção da informação codificada de ganho. Por outro lado, se o resultado de determinação introduzido a partir da seção de decisão de execução/não execução de codificação preditiva 104 indicar que uma codificação preditiva 30 não é para ser realizada, a seção de quantificação de ganho 105 obterá a informação codificada de ganho pela quantificação direta do valor de ganho ideal introduzido a partir da seção de quantificação de formato 103. A seção de quantificação de ganho 105 extrai a informação codificada de ganho obtida para a seção de multiplexação 106.

A seção de multiplexação 106 multiplexa a informação de banda introduzida a partir da seção de seleção de banda 102, a informação codificada de formato introduzida a partir da seção de quantificação de formato

103 e a informação codificada de ganho introduzida a partir da seção de quantificação de ganho 105, e transmite o fluxo de bit obtido para um aparelho de decodificação de fala.

O aparelho de codificação de fala 100 que tem uma configura10 ção tal como descrito acima separa um sinal de entrada em seções de N amostras (onde N é um número natural), e realiza uma codificação em uma base quadro a quadro com N amostras como um quadro. A operação de cada seção de aparelho de codificação de fala 100 é descrita em detalhes abaixo. Na descrição a seguir, um sinal de entrada de um quadro que é um 15 alvo de codificação é representado por xn (onde n = 0, 1, ..., N-1). Aqui, n indica o índice de cada amostra em um quadro que é um alvo de codificação.

A seção de transformação de domínio de freqüência 101 tem N buffers internos, e primeiramente inicializa cada buffer usando um valor de 0 de acordo com a Equação (1) abaixo.

bn/„~o (n«o,!,···,W-i) ... (Equação 1)

Nesta equação, bufn (n = 0, ..., N-1) indica o (n+1)-ésimo dos N buffers na seção de transformação de domínio de freqüência 101.

Em seguida, a seção de transformação de domínio de freqüência 101 encontra o coeficiente de MDCT Xk pela realização de uma transformada de co-seno discreta modificada (MDCT) do sinal de entrada xn de acordo com a Equação (2) abaixo:

x>-Ie^cos

«MtlJ

ZN-I

(2n+\ + N)(2k + i}T

4 N

... (Equação 2)

Nesta equação, k indica o índice de cada amostra em um quadro e x’n é um vetor que liga o sinal de entrada xn e bufn de acordo com a Equação (3) abaixo. ... (Equação 3)

Em seguida, a seção de transformação de domínio de freqüên

cia 101 atualiza bufn (n = 0, ..., N-1) conforme mostrado na Equação (4) abaixo:

(n=o,-"jV-i) ..(Equação 4)

Então, a seção de transformação de domínio de freqüência 101 extrai o coeficiente de MDCT encontrado Xk para a seção de seleção de banda 102.

A seção de seleção de banda 102 primeiramente divide o coeficiente de MDCT Xk em uma pluralidade de sub-bandas. Aqui, uma descrição será dada tomando-se um caso no qual o coeficiente de MDCT Xk é dividido 10 igualmente em J sub-bandas (onde J é um número natural) como um exemplo. Então, a seção de seleção de banda 102 seleciona L sub-bandas consecutivas (onde L é um número natural) dentre as J sub-bandas, e obtém M tipos de grupos de sub-banda (onde M é um número natural). Abaixo, estes M tipos de grupos de sub-banda são denominados regiões.

A figura 2 é um desenho que mostra um exemplo da configura

ção de regiões obtida pela seção de seleção de banda 102.

de tipos de regiões é oito (M = 8), e cada região é composta por cinco subbandas consecutivas (L = 5). Destas, por exemplo, a região 4 é composta pelas sub-bandas 6 a 10.

nergia média E(m) de cada um dos M tipos de regiões de acordo com a Equação (5) abaixo.

Nesta equação, j indica o índice de cada uma das J sub-bandas, m indica o índice de cada um dos M tipos de regiões ns, S(m) indica o valor mínimo dentre os índices de L sub-bandas compondo a região m, B(j) indica o valor mínimo dentre os índices de uma pluralidade de coeficientes de

Nesta figura, o número de sub-bandas é 17 (J = 17), o número

Em seguida, uma seção de seleção de banda 102 calcula a e

...(Equação 5) MDCT compondo a sub-banda j, e W(j) indica a largura de banda da subbanda j. Na descrição a seguir, um caso no qual as larguras de banda das J sub-bandas são todas iguais - isto é, um caso em que W(j) é uma constante - será descrito como um exemplo.

região - por exemplo, uma banda comporta por sub-bandas j" a j" + L - 1 para a qual a energia média E(m) é um máximo como uma banda que é um alvo de quantificação (uma banda alvo de quantificação), e extrai o índice m max indicando esta região como uma informação de banda para a seção 10 de quantificação de formato 103, a seção de decisão de execução/não execução de codificação preditiva 104 e a seção de multiplexação 106. A seção de seleção de banda 102 também extrai o coeficiente de MDCT Xk para a seção de quantificação de formato 103. Na descrição a seguir, os índices de banda indicando uma banda alvo de quantificação selecionada pela seção 15 de seleção de banda 102 são assumidos como sendo de j" a j" + L -1.

ção de formato em uma base de sub-banda por sub-banda em um coeficiente de MDCT correspondente à banda indicada pela informação de banda mjnax introduzida a partir da seção de seleção de banda 102. Especifica20 mente, a seção de quantificação de formato 103 busca um livro de código de formato interno composto pela quantidade SQ de vetores de código de formato para cada uma das L sub-bandas, e encontra o índice de vetor de código de formato para o qual o resultado da Equação (6) abaixo é um máximo.

pondo um livro de código de formato, i indica um índice de vetor de código

5

Em seguida, a seção de seleção de banda 102 seleciona uma

A seção de quantificação de formato 103 realiza uma quantifica

Shape q(i) =

0=./\ ”/+£-1, í=O,-,

yscksc‘t

...(Equação 6)

25

Nesta equação, SC1k indica um vetor de código de formato com

de formato e k indica o índice de um elemento de vetor de código de forma

to.

A seção de quantificação de formato 103 extrai um índice de vetor de código de formato S_max para o qual o resultado da Equação (6) acima é um máximo para a seção de multiplexação 106 como uma informação codificada de formato. A seção de quantificação de formato 103 também calcula um valor de ganho ideal Gain_i(j) de acordo com a Equação (7) abai5 xo, e extrai este para a seção de quantificação de ganho 105.

wW). ·.

Gain_i(j) =- (j = ...(Equação 7)

Σίγ ’ Λ’ _ max Cy ’ 5 _ max à^k + BU) '^k + BU)

k=0

A seção de decisão de execução/não execução de codificação preditiva 104 tem um buffer interno que armazena uma informação de banda m_max introduzida a partir da seção de seleção de banda 102 em um quadro passado. Aqui, será descrito um caso a título de exemplo, no qual a se10 ção de decisão de execução/não execução de codificação preditiva 104 tem um buffer interno que armazena uma informação de banda m_max para os três quadros passados. A seção de decisão de execução/não execução de codificação preditiva 104 primeiramente encontra um número de sub-bandas comuns a uma banda alvo de quantificação de quadro passado e uma banda 15 alvo de quantificação de quadro atual usando a informação de banda m_max introduzida a partir da seção de seleção de banda 102 em um quadro passado e uma informação de banda m_max introduzida a partir da seção de seleção de banda 102 no quadro atual. Então, a seção de decisão de execução/não execução de codificação preditiva 104 determina que uma codifica20 ção preditiva é para ser realizada, se o número de sub-bandas comuns for maior do que ou igual a um valor predeterminado, ou determina que uma codificação preditiva não é para ser realizada se o número de sub-bandas comuns for menor do que o valor predeterminado. Especificamente, L subbandas indicadas pela informação de banda mmax introduzida a partir da 25 seção de seleção de banda 102 um quadro para trás no tempo são comparadas com, L sub-bandas indicadas pela informação de banda m_max introduzida a partir da seção de seleção de banda 102 no quadro atual, e ela determina que uma codificação preditiva é para ser realizada, se o número de sub-bandas comuns for P ou mais, ou ela determina que uma codificação preditiva não é para ser realizada, se o número de sub-bandas comuns for menor do que P. A seção de decisão de execução/não execução de codificação preditiva 104 extrai o resultado desta determinação para a seção de quantificação de ganho 105. Então, a seção de decisão de execução/não 5 execução de codificação preditiva 104 atualiza o buffer interno armazenando uma informação de banda usando a informação de banda m max introduzida a partir da seção de seleção de banda 102 no quadro atual.

A seção de quantificação de ganho 105 tem um buffer interno que armazena um valor de ganho de quantificação obtido em um quadro 10 passado. Se um resultado de determinação introduzido a partir da seção de decisão de execução/não execução de codificação preditiva 104 indicar que uma codificação preditiva é para ser realizada, a seção de quantificação de ganho 105 realizará uma quantificação pela predição de um valor de ganho de quadro atual usando o valor de ganho de quantificação de quadro passa15 do Clj armazenado no buffer interno. Especificamente, a seção de quantificação de ganho 105 busca um livro de código de ganho interno composto pela quantidade GQ de vetores de código de ganho para cada uma das L subbandas, e encontra um índice de um vetor de código de ganho para o qual o resultado da Equação (8) abaixo é um mínimo.

Gain_q(Í) = Y\Gain_i{j+r)-Yja, 'C; 'GC"! (i =0,-,GQ-l) -(Equação 8)

J=O [ Í=1 J

Nesta equação, GCj indica um vetor de código de ganho com

pondo um livro de código de ganho, i indica um índice de vetor de código de ganho, e j indica um índice de um elemento de vetor de código de ganho. Por exemplo, se o número de sub-bandas compondo uma região for cinco (L = 5), j terá um valor de 0 a 4. Aqui, CtJ indica um valor de ganho de t quadros 25 antes no tempo, de modo que quando t = 1, por exemplo, Ctj indique um valor de ganho de um quadro antes no tempo. Também, α é o coeficiente de predição linear de 4a ordem armazenado na seção de quantificação de ganho 105. A seção de quantificação de ganho 105 trata L sub-bandas em uma região como um vetor L-dimensional, e realiza uma quantificação de vetor.

A seção de quantificação de ganho 105 extrai um índice de vetor

de código de ganho G_min para o qual o resultado da Equação (8) acima é um mínimo para a seção de multiplexação 106 como uma informação codificada de ganho. Se não houver um valor de ganho de uma sub-banda correspondente a um quadro passado no buffer interno, a seção de quantificação de ganho 105 substituirá o valor de ganho da sub-banda mais próxima na freqüência no buffer interno na Equação (8) acima.

Por outro lado, se o resultado de determinação introduzido a partir da seção de decisão de execução/não execução de codificação preditiva

104 indicar que uma codificação preditiva não é para ser realizada, a seção de quantificação de ganho 105 quantificará diretamente o valor de ganho 10 ideal Gain_i(j) introduzido a partir da seção de quantificação de formato 103 de acordo com a Equação (9) abaixo. Aqui, a seção de quantificação de ganho 105 trata um valor de ganho ideal como um vetor L-dimensional e realiza uma quantificação de vetor.

Gain _ q(i) = Ipain _ i(j + j") - GCj} (/ = 0, · · ·, GQ -1) ...(Equação 9)

7=0

Aqui, um índice de livro de código que torna a Equação (9) acima um mínimo é denotado por G_min.

A seção de quantificação de ganho 105 extrai G_min para G_min para a seção de multiplexação 106 como uma informação codificada de ganho. A seção de quantificação de ganho 105 também atualiza o buffer interno de acordo com a Equação (10) abaixo, usando a informação codifi20 cada de ganho G_min e o valor de ganho de quantificação Ct, obtido no quadro atual.

C3 = C2

7+7 7+7”

' C72+7· = C7+7" 0' = 0,···,Ζ-1) ...(Equação 10)

C)+r = GCj-"""

A seção de multiplexação 106 multiplexa a informação de banda m max introduzida a partir da seção de seleção de banda 102, a informação codificada de formato Sjnax introduzida a partir da seção de quantificação 25 de formato 103, e uma informação codificada de ganho G_min introduzida a partir da seção de quantificação de ganho 105, e transmite o fluxo de bit obtido para um aparelho de decodificação de fala. A figura 3 é um diagrama de blocos que mostra a configuração principal de um aparelho de decodificação de fala 200 de acordo com esta modalidade.

Nesta figura, o aparelho de decodificação de fala 200 é equipado 5 com uma seção de demultiplexação 201, uma seção de desquantificação de formato 202, uma seção de decisão de execução/não execução de decodificação preditiva 203, uma seção de desquantificação de ganho 204 e uma seção de transformação de domínio de tempo 205.

A seção de demultiplexação 201 demultiplexa uma informação 10 de banda, uma informação codificada de formato e uma informação codificada de ganho a partir de um fluxo de bit transmitido a partir do aparelho de codificação de fala 100, extrai a informação de banda obtida para a seção de desquantificação de formato 202 e a seção de decisão de execução/não execução de decodificação preditiva 203, extrai a informação codificada de 15 formato obtida para a seção de desquantificação de formato 202, e extrai a informação codificada de ganho obtida para a seção de desquantificação de ganho 204.

A seção de desquantificação de formato 202 encontra o valor de formato de um coeficiente de MDCT correspondente a uma banda alvo de 20 quantificação indicada pela informação de banda introduzida a partir da seção de demultiplexação 201 pela realização de uma desquantificação de informação codificada de formato introduzida a partir da seção de demultiplexação 201, e extrai o valor de formato encontrado para a seção de desquantificação de ganho 204.

A seção de decisão de execução/não execução de decodifica

ção preditiva 203 encontra um número de sub-bandas comuns a uma banda alvo de quantificação de quadro atual e uma banda alvo de quantificação de quadro passado usando a informação de banda introduzida a partir da seção de demultiplexação 201. Então, a seção de decisão de execução/não execu30 ção de decodificação preditiva 203 determina que uma decodificação preditiva é para ser realizada no coeficiente de MDCT da banda alvo de quantificação indicada pela informação de banda, se o número de sub-bandas comuns for maior do que ou igual a um valor predeterminado, ou determina que uma decodificação preditiva não é para ser realizada no coeficiente de MDCT da banda alvo de quantificação indicada pela informação de banda, se o número de sub-bandas comuns for menor do que o valor predeterminado. A seção 5 de decisão de execução/não execução de decodificação preditiva 203 extrai o resultado desta determinação para a seção de desquantificação de ganho 204.

Se o resultado de determinação introduzido a partir da seção de decisão de execução/não execução de decodificação preditiva 203 indicar que uma decodificação preditiva é para ser realizada, a seção de desquantificação de ganho 204 realiza uma decodificação preditiva na informação codificada de ganho introduzida a partir da seção de demultiplexação 201 usando um valor de ganho de quadro passado armazenado em um buffer interno e um livro de código de ganho interno, para a obtenção de um valor de ganho. Por outro lado, se o resultado de determinação introduzido a partir da seção de decisão de execução/não execução de decodificação preditiva 203 indicar que uma decodificação preditiva não é para ser realizada, a seção de desquantificação de ganho 204 obterá um valor de ganho pela realização direta de uma desquantificação de informação codificada de ganho introduzida a partir da seção de demultiplexação 201, usando o livro de código de ganho interno. A seção de desquantificação de ganho 204 extrai o valor de ganho obtido para a seção de transformação de domínio de tempo 205. A seção de desquantificação de ganho 204 também encontra um coeficiente de MDCT da banda alvo de quantificação usando o valor de ganho obtido e um valor de formato introduzido a partir da seção de desquantificação de formato 202, e extrai isto para a seção de transformação de domínio de tempo 205 como um coeficiente de MDCT decodificado.

A seção de transformação de domínio de tempo 205 realiza uma Transformada Inversa de Co-seno Discreta Modificada (IMDCT) no coeficiente de MDCT decodificado introduzido a partir da seção de desquantificação de ganho 204 para a geração de um sinal de domínio de tempo, e extrai isto como um sinal decodificado. O aparelho de decodificação de fala 200 tendo a configuração tal como descrito acima realiza as operações a seguir.

A seção de demultiplexação 201 demultiplexa a informação de banda m_max, a informação codificada de formato S_max e a informação 5 codificada de ganho G_min de um fluxo de bit transmitido a partir do aparelho de codificação de fala 100, extrai a informação de banda m max obtida para a seção de desquantificação de formato 202 e a seção de decisão de execução/não execução de decodificação preditiva 203, extrai a informação codificada de formato Sjnax obtida para a seção de desquantificação de 10 formato 202, e extrai a informação codificada de ganho G_min obtida para a seção de desquantificação de ganho 204.

A seção de desquantificação de formato 202 tem um livro de código de formato interno similar ao livro de código de formato com o qual a seção de quantificação de formato 103 de aparelho de codificação de fala 15 100 é provida, e busca um vetor de código de formato para o qual a informação codificada de formato S_max introduzida a partir da seção de demultiplexação 201 é um índice. A seção de desquantificação de formato 202 extrai um vetor de código buscado para a seção de desquantificação de ganho 204 como o valor de formato de um coeficiente de MDCT de uma banda alvo 20 de quantificação indicada pela informação de banda m_max introduzida a partir da seção de demultiplexação 201. Aqui, um vetor de código de formato buscado como um valor de formato é denotado por Shape_q(k) (k = B(j"), B(jM+L)-1).

A seção de decisão de execução/não execução de decodifica25 ção preditiva 203 tem um buffer interno que armazena uma informação de banda m max introduzida a partir da seção de demultiplexação 201 em um quadro passado. Aqui, será descrito um caso a título de exemplo no qual a seção de decisão de execução/não execução de decodificação preditiva 203 tem um buffer interno que armazena uma informação de banda m_max para 30 os três quadros passados. A seção de decisão de execução/não execução de decodificação preditiva 203 primeiramente encontra um número de subbandas comuns a uma banda alvo de quantificação de quadro passado e uma banda alvo de quantificação de quadro atual usando a informação de banda mjnax introduzida a partir da seção de demultiplexação 201 no quadro atual. Então, a seção de decisão de execução/não execução de decodificação preditiva 203 determina que uma decodificação preditiva é para ser 5 realizada, se o número de sub-bandas comuns for maior do que ou igual a um valor predeterminado, ou determina que uma decodificação preditiva não é para ser realizada se o número de sub-bandas comuns for menor do que o valor predeterminado. Especificamente, a seção de decisão de execução/não execução de decodificação preditiva 203 compara L sub-bandas 10 indicadas pela informação de banda m max introduzida a partir da seção de demultiplexação 201 um quadro para trás no tempo com L sub-bandas indicadas pela informação de banda m_max introduzida a partir da seção de demultiplexação 201 no quadro atual, e determina que uma decodificação preditiva é para ser realizada, se o número de sub-bandas comuns for P ou 15 mais, ou determina que uma decodificação preditiva não é para ser realizada, se o número de sub-bandas comuns for menor do que P. A seção de decisão de execução/não execução de decodificação preditiva 203 extrai o resultado desta determinação para a seção de desquantificação de ganho 204. Então, a seção de decisão de execução/não execução de decodificação 20 preditiva 203 atualiza o buffer interno que armazena a informação de banda usando a informação de banda mjnax introduzida a partir da seção de demultiplexação 201 no quadro atual.

A seção de desquantificação de ganho 204 tem um buffer interno que armazena um valor de ganho obtido em um quadro passado. Se um 25 resultado de determinação introduzido a partir da seção de decisão de execução/não execução de decodificação preditiva 203 indicar que uma decodificação preditiva é para ser realizada, a seção de desquantificação de ganho 204 realiza uma desquantificação pela predição de um valor de ganho de quadro atual usando um valor de ganho de quadro passado armazenado no 30 buffer interno. Especificamente, a seção de desquantificação de ganho 204 tem o mesmo tipo de livro de código de ganho interno que a seção de quantificação de ganho 105 do aparelho de codificação de fala 100, e obtém o valor de ganho Gain_q’ pela realização de uma desquantificação de ganho de acordo com a Equação (11) abaixo. Aqui, C"' indica um valor de ganho de t quadros antes no tempo, de modo que quando t = 1, por exemplo, C"* indique um valor de ganho de um quadro antes no tempo. Também, α é o 5 coeficiente de predição linear de 4a ordem armazenado na seção de desquantificação de ganho 204. A seção de desquantificação de ganho 204 trata L sub-bandas em uma região como um vetor L dimensional, e realiza uma desquantificação de vetor.

Gai"_«'0+/0=Z(“.'C"v)+«.-Gcí'-”" O=», ·,£-!) ...(EquaçâO 11)

/=1

Se não houver um valor de ganho de uma sub-banda correspondente a um quadro passado no buffer interno, a seção de desquantificação de ganho 204 substituirá o valor de ganho da sub-banda mais próxima na freqüência no buffer interno na Equação (11) acima.

Por outro lado, se o resultado de determinação introduzido a partir da seção de decisão de execução/não execução de decodificação prediti15 va 203 indicar que uma decodificação preditiva não é para ser realizada, a seção de desquantificação de ganho 204 realizará uma desquantificação de um valor de ganho de acordo com a Equação (12) abaixo, usando o livro de código de ganho descrito acima. Aqui, um valor de ganho é tratado como um vetor L-dimensional, e a desquantificação de vetor é realizada. Quer dizer, 20 quando uma decodificação preditiva não é realizada, o valor de ganho de ganho GCjG-min correspondente a uma informação codificada de ganho

G_min é tomado diretamente como um valor de ganho.

Gam_q‘(j + r) = GC;!-'~ (j = 0,-,i-l) ...(Equação 12)

Em seguida, a seção de desquantificação de ganho 204 calcula um coeficiente de MDCT decodificado de acordo com a Equação (13) abai25 xo, usando um valor de ganho obtido pela desquantificação de quadro atual e um valor de formato introduzido a partir da seção de desquantificação de formato 202, e atualiza o buffer interno de acordo com a Equação (14) abaixo. Aqui, um coeficiente de MDCT decodificado calculado é denotado por X"k. Também, em uma desquantificação de coeficiente de MDCT, se k estiver presente em B(j") a B(j"+1)-1, o valor de ganho Gain_q’(j) assume o valor de Gain_q’(j").

í 7, _ Ui .·»1\ D/ .-'I , T\ l\

X'\ = Gain _ q'(j) ■ Shape _ q' (k)

...(Equação 13)

k = B{j"),-,B(j"+L)-\' y = f,-,f+L-1

Tti3_ s~i\yl

' J~ ^ j

Caj = C") (j = ff+L-l) ...(Equação 14)

C') = Gain _q' (J)

A seção de desquantificação de ganho 204 extrai o coeficiente de MDCT X"k calculado de acordo com a Equação (13) acima para a seção 5 de transformação de domínio de tempo 205.

A seção de transformação de domínio de tempo 205 primeiramente inicializa o buffer interno bufk para um valor de zero, de acordo com a Equação (15) abaixo.

h»/;-o (*.G,-,w-i) ...(Equação 15)

Então, a seção de transformação de domínio de tempo 205 en10 contra o sinal decodificado Yn de acordo com a Equação (16) abaixo, usando o coeficiente de MDCT decodificado Χ\ input introduzido a partir da seção

de desquantificação de ganho 204.

(2 n +1 + N^lk + ί)π . 4N .

Nesta equação, X2"k é um vetor que liga o coeficiente de MDCT

decodificado Χ\ e o buffer bufk.

íbuf'k (k = 0,··· N — í)

X2"k = \ Jk \ ' ...(Equação 17)

* [X'\ (k = Ν,···2Ν - \)

Em seguida, a seção de transformação de domínio de tempo

205 atualiza o buffer bufk de acordo com a Equação (18) abaixo.

buf\ = X"k (k = 0,---N-\) ...(Equação 18)

A seção de transformação de domínio de tempo 205 extrai o sinal decodificado obtido Yn como um sinal de saída.

Assim, de acordo com esta modalidade, uma banda de energia 20 alta é selecionada em cada quadro como uma banda alvo de quantificação e um parâmetro de domínio de freqüência é quantificado, permitindo que uma orientação seja criada em uma distribuição de valor de ganho quantificado, e

9 2/V-I

Yn =—y XT

kcos

(n = 0, ··· ,N-í) ...(Equação 16) que uma performance de quantificação de vetor seja melhorada.

Também, de acordo com esta modalidade, em uma quantificação de parâmetro de domínio de freqüência de uma banda alvo de quantificação diferente de cada quadro, uma codificação preditiva é realizada em 5 um parâmetro de domínio de freqüência se o número de sub-bandas comuns para uma banda alvo de quantificação de quadro passado e uma banda alvo de quantificação de quadro atual for determinado como sendo maior do que ou igual a um valor predeterminado, e um parâmetro de domínio de freqüência é codificado diretamente, se o número de sub-bandas comuns for 10 determinado como sendo menor do que o valor predeterminado. Conseqüentemente, a quantidade de informação codificada em uma codificação de fala é reduzida, e também uma degradação de fala nítida pode ser impedida, e um erro de codificação de sinal de fala/áudio e a degradação de qualidade de áudio de sinal decodificado podem ser reduzidos.

Misturas ainda, de acordo com esta modalidade, no lado de co

dificação, uma banda alvo de quantificação pode ser decidida, e uma quantificação de parâmetro de domínio de freqüência realizada, em unidades de região, cada uma composta por uma pluralidade de sub-bandas, e uma informação quanto a um parâmetro de domínio de freqüência de qual região 20 se tornou um alvo de quantificação pode ser transmitida para o lado de decodificação. Conseqüentemente, uma eficiência de quantificação pode ser melhorada e a quantidade de informação codificada transmitida para o lado de decodificação pode ser adicionalmente reduzida, se comparado com decidir se uma codificação preditiva é ou não para ser usada em uma base de 25 sub-banda por sub-banda e transmitindo uma informação quanto a qual subbanda se tornou um alvo de quantificação para o lado de decodificação.

Nesta modalidade, foi descrito um caso a título de exemplo no qual a quantificação de ganho é realizada em unidades de região compostas por uma pluralidade de sub-bandas, mas a presente invenção não está Iimi30 tada a isto, e um alvo de quantificação também pode ser selecionado em uma base de sub-banda por sub-banda, isto é, uma determinação de se uma quantificação preditiva é ou não para ser realizada também pode ser feita em uma base de sub-banda por sub-banda.

Nesta modalidade, foi descrito um caso a título de exemplo no qual o método de quantificação preditiva de ganho é realizar uma predição linear no domínio de tempo para um ganho da mesma banda de freqüência, 5 mas a presente invenção não está limitada a isto, e a predição linear também pode ser realizada no domínio de tempo para um ganho de bandas de freqüência diferentes.

Nesta modalidade, foi descrito um caso no qual um sinal de fala/áudio comum é tomado como um exemplo de um sinal que se torna um 10 alvo de quantificação, mas a presente invenção não está limitada a isto, e um sinal de excitação obtido pelo processamento de um sinal de fala/áudio por meio de um filtro inverso de LPC (Coeficiente de Predição Linear) também pode ser usado como um alvo de quantificação.

Nesta modalidade, foi descrito um caso a título de exemplo no qual uma região para a qual a magnitude de energia de região individual isto é, uma significância percentual - é maior é selecionada como uma referência para a seleção de uma banda alvo de quantificação, mas a presente invenção não está limitada a isto, e, além da significância perceptiva, uma correlação de freqüência com uma banda selecionada em um quadro passado também pode ser levada em consideração ao mesmo tempo. Quer dizer, se existirem bandas candidatas para as quais o número de sub-bandas comuns para uma banda alvo de quantificação selecionada no passado for maior do que ou igual a um valor predeterminado e a energia for maior do que ou igual a um valor predeterminado, a banda com a energia mais alta dentre as bandas candidatas poderá ser selecionada como a banda alvo de quantificação e, se nenhuma banda candidata como essa existir, a banda com a energia mais alta dentre todas as bandas de freqüência poderá ser selecionada como a banda alvo de quantificação. Por exemplo, se uma subbanda comum à região de energia mais alta e uma banda selecionada em um quadro passado não existir, o número de sub-bandas comuns à região de segunda energia mais alta e uma banda selecionada em um quadro passado for maior do que ou igual a um valor de limite predeterminado, e a energia da região de segunda energia mais alta for maior do que ou igual a um valor de limite predeterminado, a região de segunda energia mais alta será selecionada, ao invés da região de energia mais alta. Também, uma seção de seleção de banda de acordo com esta modalidade seleciona uma 5 região mais próxima de uma banda alvo de quantificação selecionada no passado a partir de dentre as regiões cuja energia é maior do que ou igual a um valor predeterminado como uma banda alvo de quantificação.

Nesta modalidade, uma quantificação de coeficiente de MDCT pode ser realizada após uma interpolação ser realizada, usando-se um quadro passado. Por exemplo, será descrito um caso com referência à figura 2 no qual uma banda alvo de quantificação de quadro passado é a região 3 (isto é, as sub-bandas 5 a 9), uma banda alvo de quantificação de quadro atual é a região 4 (isto é, as sub-bandas 6 a 10), e uma codificação preditiva de quadro atual é realizada usando-se um resultado de quantificação de quadro passado. Em um caso como esse, uma codificação preditiva é realizada nas sub-bandas de quadro atual 6 a 9 usando-se as sub-bandas de quadro passado 6 a 9, e para a sub-banda de quadro atual 10, a sub-banda de quadro passado 10 é interpolada usando-se as sub-bandas de quadro passado 6 a 9 e, então, uma codificação preditiva é realizada usando-se a sub-banda de quadro passado 10 obtida por interpolação.

Nesta modalidade, foi descrito um caso a título de exemplo no qual todas as larguras de sub-banda são as mesmas, mas a presente invenção não está limitada a isto, e larguras de sub-banda individuais também podem diferir.

Nesta modalidade, foi descrito um caso no qual o mesmo livro

de código é usado para todas as sub-bandas na quantificação de ganho e na quantificação de formato, mas a presente invenção não está limitada a isto, e livros de código diferentes também podem ser usados em uma base de sub-banda por sub-banda na quantificação de ganho e na quantificação de formato.

Nesta modalidade, foi descrito um caso a título de exemplo no qual sub-bandas consecutivas são selecionadas como uma banda alvo de quantificação, mas presente invenção não está limitada a isto, e uma pluralidade não consecutiva de sub-bandas também pode ser selecionada como uma banda alvo de quantificação. Nesse caso, uma eficiência de codificação de fala pode ser adicionalmente melhorada pela interpolação de um valor de sub-banda não selecionado usando-se valores de sub-banda adjacentes.

Nesta modalidade, foi descrito um caso a título de exemplo no qual um aparelho de codificação de fala 100 é equipado com uma seção de decisão de execução/não execução de codificação preditiva 104, mas o aparelho de codificação de fala de acordo com a presente invenção não está 10 limitado a isto, e também pode ter uma configuração na qual a seção de decisão de execução/não execução de codificação preditiva 104 não é provida e uma quantificação preditiva nem sempre é realizada pela seção de quantificação de ganho 105, conforme ilustrado pelo aparelho de codificação de fala 100a mostrado na figura 4. Neste caso, conforme mostrado na figura 4, 15 o aparelho de codificação de fala 100a é equipado com uma seção de transformação de domínio de freqüência 101, uma seção de seleção de banda 102, uma seção de quantificação de formato 103, uma seção de quantificação de ganho 105 e uma seção de multiplexação 106. A figura 5 é um diagrama de blocos que mostra a configuração do aparelho de decodificação de 20 fala 200a correspondente ao aparelho de codificação de fala 100a, o aparelho de decodificação de fala 200a sendo equipado com uma seção de demultiplexação 201, uma seção de desquantificação de formato 202, uma seção de desquantificação de ganho 204 e uma seção de transformação de domínio de tempo 205. Nesse caso, o aparelho de codificação de fala 100a 25 realiza uma seleção parcial de uma banda a ser quantificada a partir de dentre todas as bandas, ainda divide a banda selecionada em uma pluralidade de sub-bandas e quantifica o ganho de cada sub-banda. Por meio disto, uma quantificação pode ser realizada a uma taxa de bit mais baixa do que com um método por meio do qual as componentes de todas as bandas são quan30 tificados e a eficiência de codificação pode ser melhorada. Também, uma codificação de eficiência pode ser adicionalmente provida pela quantificação de um valor de ganho usando-se uma correlação de ganho no domínio de freqüência.

Um aparelho de codificação de fala de acordo com a presente invenção também pode ter uma configuração na qual a seção de decisão de execução/não execução de codificação preditiva 104 não é provida e uma 5 quantificação preditiva é sempre realizada pela seção de quantificação de ganho 105, conforme ilustrado pelo aparelho de codificação de fala 100a mostrado na figura 4. A configuração do aparelho de decodificação de fala 200a correspondente a este tipo de aparelho de codificação de fala 100a é mostrada na figura 5. Nesse caso, o aparelho de codificação de fala 100a 10 realiza uma seleção parcial de uma banda a ser quantificada dentre todas as bandas, ainda divide a banda selecionada em uma pluralidade de subbandas, e realiza uma quantificação de banho para cada sub-banda. Por meio disto, uma quantificação pode ser realizada a uma taxa de bit mais baixa do que com um método por meio do qual as componentes de todas as 15 bandas são quantificadas, e uma eficiência de codificação pode ser melhorada. Também, uma eficiência de codificação pode ser adicionalmente melhorada pela quantificação preditiva de um valor de ganho, usando-se uma correlação de ganho no domínio de tempo.

Nesta modalidade, foi descrito um caso a título de exemplo no qual o método de seleção de uma banda alvo de quantificação em uma seção de seleção de banda é selecionar a região com a energia mais alta em todas as bandas, mas a presente invenção não está limitada a isto, e uma seleção também pode ser realizada usando-se uma informação de uma banda selecionada em um quadro temporalmente precedente, além do critério acima. Por exemplo, um método possível é selecionar uma região a ser quantificada após a temperatura de uma multiplicação por um peso, de modo que uma região que inclua uma banda na vizinhança de uma banda selecionada em um quadro temporalmente precedente se torne propensa a uma seleção. Também, se houver uma pluralidade de camadas nas quais uma banda a ser quantificada é selecionada, uma banda quantificada em uma camada superior pode ser selecionada usando-se uma informação de uma banda selecionada em uma camada inferior. Por exemplo, um método possível é selecionar uma região a ser quantificada após a realização de uma multiplicação por um peso, de modo que uma região que inclua uma banda na vizinhança de uma banda selecionada em uma camada inferior se torne propensa à seleção.

Nesta modalidade, foi descrito um caso a título de exemplo no

qual o método de seleção de uma banda alvo de quantificação é selecionar a região com a energia mais alta em todas as bandas, mas a presente invenção não está limitada a isto, e uma certa banda também pode ser selecionada de forma preliminar de antemão, após o que uma banda alvo de 10 quantificação é finalmente selecionada na banda selecionada preliminarmente. Nesse caso, uma banda selecionada preliminarmente pode ser decidida de acordo com a taxa de amostragem de sinal de entrada, a taxa de bit de codificação ou similar. Por exemplo, um método é selecionar uma banda baixa preliminarmente, quando a taxa de bit ou a taxa de amostragem for 15 baixa.

Por exemplo, é possível que um método seja empregado em uma seção de seleção de banda 102, por meio do que uma região a ser quantificada é decidida pelo cálculo de uma energia de região após uma limitação de regiões selecionáveis a partir de dentre todas as regiões candida20 tas selecionáveis. Como um exemplo disto, um método possível é realizar uma limitação para cinco candidatas a partir do lado de banda baixa a partir de dentre um total de oito regiões candidatas mostradas na figura 2, e selecionar a região com a energia mais alta dentre estas. Alternativamente, a seção de seleção de banda 102 pode comparar as energias após a multipli25 cação da energia por um peso, de modo que uma região de área mais baixa se torne proporcionalmente mais propensa a uma seleção. Uma outra possibilidade é que a seção de seleção de banda 102 selecione uma sub-banda de lado de banda baixa fixa. Um recurso de um sinal de fala é que a estrutura harmônica se torna proporcionalmente mais forte em direção ao lado de 30 banda baixa, como resultado do que um pico forte está presente no lado de banda baixa. Como este pico forte é difícil de mascarar, é propenso a ser percebido como ruído. Aqui, pelo aumento da probabilidade de seleção em direção ao lado de banda baixa ao invés de simplesmente se selecionar uma região com base na magnitude de energia, a possibilidade de uma região que inclui um pico forte ser selecionada é aumentada, e uma sensação de ruído é reduzida como resultado. Assim, a qualidade de um sinal decodifica5 do pode ser melhorada pela limitação de regiões selecionadas para o lado de banda baixa, ou realizando-se uma multiplicação por um peso de modo que a probabilidade de seleção aumente em direção ao lado de banda baixa, desta forma.

Um aparelho de codificação de fala de acordo com a presente 10 invenção foi descrito em termos de uma configuração, por meio do que uma quantificação de formato (informação de formato) é primeiramente realizada em uma componente de uma banda a ser quantificada, seguida por uma quantificação de ganho (informação de ganho), mas presente invenção não está limitada a isto, e uma configuração também pode ser usada por meio do 15 que uma quantificação de ganho é realizada primeiramente, seguida pela quantificação de formato.

(Modalidade 2)

A figura 6 é um diagrama de blocos que mostra a configuração principal de aparelho de codificação de fala 300 de acordo com a Modalidade 2 da presente invenção.

Nesta figura, o aparelho de codificação de fala 300 é equipado com uma seção de amostragem para baixo 301, uma seção de codificação de primeira camada 302, uma seção de decodificação de primeira camada 303, uma seção de amostragem para cima 304, uma primeira seção de 25 transformação de domínio de freqüência 305, uma seção de atraso 306, uma segunda seção de transformação de domínio de freqüência 307, uma seção de codificação de segunda camada 308 e uma seção de multiplexação 309, e tem uma configuração escalonável compreendendo duas camadas. Na primeira camada, um método de codificação de fala de CELP (Predição Li30 near Excitada por Código) é aplicada, e na segunda camada o método de codificação de fala descrito na Modalidade 1 da presente invenção é aplicado. A seção de amostragem para baixo 301 realiza um processamento de amostragem para baixo em um sinal de fala/áudio, para conversão da taxa de amostragem de sinal de fala/áudio da Taxa 1 para a Taxa 2 (onde Taxa 1 > Taxa 2), e extrai este sinal para a seção de codificação de primeira camada 302.

A seção de codificação de primeira camada 302 realiza uma codificação de fala de CELP no sinal de fala/áudio pós-amostragem para baixo introduzido a partir da seção de amostragem para baixo 301, e extrai a informação codificada de primeira camada obtida a partir da seção de decodi10 ficação de primeira camada 303 e da seção de multiplexação 309. Especificamente, a seção de codificação de primeira camada 302 codifica um sinal de fala compreendendo uma informação de trato vocal e uma informação de excitação ao encontrar um parâmetro de LPC para a informação de trato vocal, e para a informação de excitação, realiza uma codificação ao encon15 trar um índice que identifica qual modelo de fala previamente armazenado é para ser usado - isto é, um índice que identifica qual vetor de excitação de um livro de código adaptativo e de um livro de código fixo é para ser gerado.

A seção de decodificação de primeira camada 303 realiza uma decodificação de fala de CELP na informação codificada de primeira camada introduzida a partir da seção de codificação de primeira camada 302, e extrai um sinal decodificado de primeira camada obtido para a seção de amostragem para cima 304.

A seção de amostragem para cima 304 realiza um processamento de amostragem para cima no sinal decodificado de primeira camada 25 introduzido a partir da seção de decodificação de primeira camada 303, para conversão da taxa de amostragem de sinal decodificado de primeira camada da Taxa 2 para a Taxa 1, e extrai este sinal para a primeira seção de transformação de domínio de freqüência 305.

A primeira seção de transformação de domínio de freqüência 305 realiza uma MDCT no sinal decodificado de primeira camada pósamostragem apara cima introduzido a partir da seção de amostragem para cima 304, e extrai um coeficiente de MDCT de primeira camada obtido como um parâmetro de domínio de freqüência para a seção de codificação de segunda camada 308. O método de transformação real usado na primeira seção de transformação de domínio de freqüência 305 é similar ao método de transformação usado na seção de transformação de domínio de freqüência 5 101 de aparelho de codificação de fala 100 de acordo com a Modalidade 1 da presente invenção e, portanto, uma descrição do mesmo é omitida aqui.

A seção de atraso 306 extrai um sinal de fala/áudio atrasado para a segunda seção de transformação de domínio de freqüência 307 pela extração de um sinal de fala/áudio de entrada após o armazenamento da10 quele sinal de entrada em um buffer interno por um tempo predeterminado. O tempo de atraso predeterminado aqui é um tempo que leva em consideração um atraso de algoritmo que surge na seção de amostragem para baixo 301, na seção de codificação de primeira camada 302, na seção de decodificação de primeira camada 303, na seção de amostragem para cima 304, na 15 primeira seção de transformação de domínio de freqüência 305 e na segunda seção de transformação de domínio de freqüência 307.

A segunda seção de transformação de domínio de freqüência 307 realiza uma MDCT no sinal de fala/áudio atrasado introduzido a partir da seção de atraso 306, e extrai um coeficiente de MDCT de segunda camada 20 obtido como um parâmetro de domínio de freqüência para a seção de codificação de segunda camada 308. O método de transformação real usado na segunda seção de transformação de domínio de freqüência 307 é similar ao método de transformação usado na seção de transformação de domínio de freqüência 101 do aparelho de codificação de fala 100 de acordo com a Mo25 dalidade 1 da presente invenção e, portanto, uma descrição do mesmo é omitida.

A seção de codificação de segunda camada 308 realiza uma codificação de segunda camada usando o coeficiente de MDCT de primeira camada introduzido a partir da primeira seção de transformação de domínio 30 de freqüência 305 e o coeficiente de MDCT de segunda camada introduzido a partir da segunda seção de transformação de domínio de freqüência 307, e extrai a informação codificada de segunda camada obtida para a seção de multiplexação 309. A configuração interna principal e a operação real da seção de codificação de segunda camada 308 serão descritas mais tarde aqui.

A seção de multiplexação 309 multiplexa a informação codificada de primeira camada introduzida a partir da seção de codificação de pri5 meira camada 302 e a informação codificada de segunda camada introduzida a partir da seção de codificação de segunda camada 308, e transmite o fluxo de bit obtido para um aparelho de decodificação de fala.

A figura 7 é um diagrama de blocos que mostra a configuração principal do interior da seção de codificação de segunda camada 308. A se10 ção de codificação de segunda camada 308 tem uma configuração básica similar àquela do aparelho de codificação de fala 100 de acordo com a Modalidade 1 (veja a figura 1), e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência, e as descrições dos mesmos são omitidas.

A seção de codificação de segunda camada 308 difere do apare

lho de codificação de fala 100 pelo fato de ser equipada com a seção de cálculo de coeficiente de MDCT residual 381, ao invés da seção de transformação de domínio de freqüência 101. O processamento pela seção de multiplexação 106 é similar ao processamento pela seção de multiplexação 106 20 do aparelho de codificação de fala 100, e, em nome da descrição, o nome de um sinal extraído a partir da seção de multiplexação 106 de acordo com esta modalidade é dado como "informação codificada de segunda camada".

A informação de banda, a informação codificada de formato e a informação codificada de ganho também podem ser introduzidas diretamente na seção de multiplexação 309 e multiplexadas com a informação codificada de primeira camada, sem passarem através da seção de multiplexação 106.

A seção de cálculo de coeficiente de MDCT residual 381 encontra um resíduo do coeficiente de MDCT de primeira camada introduzido a partir da primeira seção de transformação de domínio de freqüência 305 e o coeficiente de MDCT de segunda camada introduzido a partir da segunda seção de transformação de domínio de freqüência 307, e extrai isto para a seção de seleção de banda 102 como um coeficiente de MDCT residual.

A figura 8 é um diagrama de blocos que mostra a configuração principal de aparelho de decodificação de fala 400 de acordo com a Modalidade 2 da presente invenção.

5 Nesta figura, o aparelho de decodificação de fala 400 é equipado

com uma seção de controle 401, uma seção de decodificação de primeira camada 402, uma seção de amostragem para cima 403, uma seção de transformação de domínio de freqüência 404, uma seção de decodificação de segunda camada 405, uma seção de transformação de domínio de tempo 406 e um comutador 407.

A seção de controle 401 analisa os elementos de configuração de um fluxo de bit transmitido a partir do aparelho de codificação de fala 300, e de acordo com estes elementos de configuração de fluxo de bit extrai de forma adaptativa uma informação codificada apropriada para a seção de decodificação de primeira camada 402 e a seção de decodificação de segunda camada 405, e também extrai uma informação de controle para o comutador 407. Especificamente, se o fluxo de bit compreender uma informação codificada de primeira camada e uma informação codificada de segunda camada, a seção de controle 401 extrairá a informação codificada de primeira camada para a seção de decodificação de primeira camada 402 e extrairá a informação codificada de segunda camada para a seção de decodificação de segunda camada 405, ao passo que se o fluxo de bit compreender apenas a informação codificada de primeira camada, a seção de controle 401 extrairá esta informação codificada de primeira camada para a seção de decodificação de primeira camada 402.

A seção de decodificação de primeira camada 402 realiza uma decodificação de CELP na informação codificada de primeira camada introduzida a partir da seção de controle 401, e extrai o sinal decodificado de primeira camada obtido para a seção de amostragem para cima 403 e o comutador407.

A seção de amostragem para cima 403 realiza um processamento de amostragem para cima no sinal decodificado de primeira camada introduzido a partir da seção de decodificação de primeira camada 402, para converter a taxa de amostragem de sinal decodificado de primeira camada da Taxa 2 para a Taxa 1, e extrai este sinal para a seção de transformação de domínio de freqüência 404.

A seção de transformação de domínio de freqüência 404 realiza

um MDCT no sinal decodificado de primeira camada pós-amostragem para cima introduzido a partir da seção de amostragem para cima 403, e extrai um coeficiente de MDCT decodificado de primeira camada obtido como um parâmetro de domínio de freqüência para a seção de decodificação de seIO gunda camada 405. O método de transformação real usado na seção de transformação de domínio de freqüência 404 é similar ao método de transformação usado na seção de transformação de domínio de freqüência 101 do aparelho de codificação de fala 100 de acordo com a Modalidade 1, e, portanto, uma descrição do mesmo é omitida aqui.

A seção de decodificação de segunda camada 405 realiza uma

desquantificação de ganho e uma desquantificação de formato usando a informação codificada de segunda camada introduzida a partir da seção de controle 401 e da seção de transformação de domínio de freqüência 404, para a obtenção de um coeficiente de MDCT decodificado de segunda ca>0 mada. A seção de decodificação de segunda camada 405 adiciona em conjunto o coeficiente de MDCT decodificado de segunda camada e o coeficiente de MDCT decodificado de primeira camada obtidos, e extrai o resultado de adição obtido para a seção de transformação de domínio de tempo 406 como um coeficiente de MDCT de adição. A configuração interna principal e 15 a operação real da seção de decodificação de segunda camada 405 serão descritas mais tarde aqui.

A seção de transformação de domínio de tempo 406 realiza uma IMDCT no coeficiente de MDCT de adição introduzido a partir da seção de decodificação de segunda camada 405, e extrai um sinal decodificado de JO segunda camada obtido como uma componente de domínio de tempo para o comutador 407.

Com base na informação de controle introduzida a partir da seção de controle 401, se o fluxo de bit introduzido no aparelho de decodificação de fala 400 compreender uma informação codificada de primeira camada e uma informação codificada de segunda camada, o comutador 407 extrairá o sinal decodificado de segunda camada introduzido a partir da seção 5 de transformação de domínio de tempo 406 como um sinal de saída, ao passo que se o fluxo de bit compreender apenas a informação codificada de primeira camada, o comutador 407 extrairá o sinal decodificado de primeira camada a partir da seção de decodificação de primeira camada 402 como um sinal de saída.

A figura 9 é um diagrama de blocos que mostra a configuração

principal do interior da seção de decodificação de segunda camada 405. A seção de decodificação de segunda camada 405 tem uma configuração básica similar àquela do aparelho de decodificação de fala 200 de acordo com a Modalidade 1 (veja a figura 3), e, portanto, a elementos de configuração 15 idênticos são atribuídos os mesmos códigos de referência e as descrições dos mesmos são omitidas aqui.

A seção de decodificação de segunda camada 405 difere do aparelho de decodificação de fala 200 ao ser adicionalmente equipada com a seção de cálculo de coeficiente de MDCT de adição 452. Também, o pro20 cessamento difere em parte entre a seção de multiplexação 451 da seção de decodificação de segunda camada 405 e a seção de demultiplexação 201 do aparelho de decodificação de fala 200, e um coeficiente de referência diferente é atribuído para se indicar isso.

A seção de multiplexação 451 demultiplexa a informação de 25 banda, a informação codificada de formato e a informação codificada de ganho a partir da informação codificada de segunda camada introduzida a partir da seção de controle 401, e extrai a informação de banda obtida para a seção de desquantificação de formato 202 e a seção de decisão de execução/não execução de decodificação preditiva 203, a informação codificada 30 de formato obtida para a seção de desquantificação de formato 202 e a informação codificada de ganho obtida para a seção de desquantificação de ganho 204. A seção de cálculo de coeficiente de MDCT de adição 452 adiciona em conjunto o coeficiente de MDCT decodificado de primeira camada introduzido a partir da seção de transformação de domínio de freqüência 404 e o coeficiente de MDCT decodificado de segunda camada introduzido a 5 partir da seção de desquantificação de ganho 204, e extrai o resultado de adição obtido para a seção de transformação de domínio de tempo 406 como um coeficiente de MDCT de adição.

Assim, de acordo com esta modalidade, quando uma componente de freqüência de uma banda diferente é tornado um alvo de quantificação 10 em cada quadro, uma codificação preditiva de parâmetro não temporal é realizada de forma adaptativa, além da aplicação de uma codificação escalonável, desse modo se permitindo que a quantidade de informação codificada em uma codificação de fala seja reduzida, e o erro de codificação de sinal de fala/áudio e a degradação de qualidade de áudio de sinal decodifi15 cado sejam reduzidos.

Nesta modalidade, foi descrito um caso a título de exemplo no qual a seção de codificação de segunda camada 308 toma uma componente de diferença de um coeficiente de MDCT de primeira camada e um coeficiente de MDCT de segunda camada como um alvo de catalisador, mas a pre20 sente invenção não está limitada a isto, e a seção de codificação de segunda camada 308 também pode tomar uma componente de diferença de um coeficiente de MDCT de primeira camada e um coeficiente de MDCT de segunda camada como um alvo de codificação para uma banda de uma freqüência predeterminada ou abaixo, ou pode assumir um coeficiente de 25 MDCT de sinal de entrada em si como um alvo de codificação para uma banda mais alta do que uma freqüência predeterminada. Quer dizer, uma comutação pode ser realizada entre o uso ou o não uso de uma componente de diferença de acordo com a banda.

Nesta modalidade, foi descrito um caso a título de exemplo no qual o método de seleção de uma banda alvo de quantificação de codificação de segunda camada é selecionar a região para a qual a energia de uma componente residual de um coeficiente de MDCT de primeira camada e de um coeficiente de MDCT de segunda camada é mais alta, mas a presente invenção não está limitada a isto, e a região para a qual a energia de coeficiente de MDCT de primeira camada é mais alta também pode ser selecionada. Por exemplo, a energia de cada sub-banda de coeficiente de MDCT de primeira camada pode ser calculada, após o que as energias de cada sub-banda são adicionadas em conjunto em uma base de região por região, e a região para a qual a energia é mais alta é selecionada como uma banda alvo de quantificação de codificação de segunda camada. No lado de aparelho de decodificação, a região para a qual a energia é mais alta dentre as regiões do coeficiente de MDCT decodificado de primeira camada obtido pela decodificação de primeira camada é selecionada como uma banda alvo de quantificação de decodificação de segunda camada. Por meio disto, a taxa de bit de codificação pode ser reduzida, uma vez que uma informação de banda relacionada a uma banda de quantificação de codificação de segunda camada não é transmitida a partir do lado de aparelho de codificação.

Nesta modalidade, foi descrito um caso a título de exemplo no qual a seção de codificação de segunda camada 308 seleciona e realiza uma quantificação em uma banda alvo de quantificação para uma componente residual de um coeficiente de MDCT de primeira camada e um coefici20 ente de MDCT de segunda camada, mas a presente invenção não está limitada a isto, e a seção de codificação de segunda camada 308 também pode predizer um coeficiente de MDCT de segunda camada a partir de um coeficiente de MDCT de primeira camada, e selecionar e realizar uma quantificação em uma banda alvo de quantificação para uma componente residual 25 daquele coeficiente de MDCT predito e um coeficiente de MDCT de segunda camada real. Isto permite que a eficiência de codificação seja adicionalmente melhorada pela utilização de uma correlação entre um coeficiente de MDCT de primeira camada e um coeficiente de MDCT de segunda camada. (Modalidade 3)

A figura 10 é um diagrama de blocos que mostra a configuração

principal do aparelho de codificação de fala 500 de acordo com a Modalidade 3 da presente invenção. O aparelho de codificação de fala 500 tem uma configuração básica similar àquela do aparelho de codificação de fala 100 mostrado na figura 1, e, portanto, a elementos de confinamento idêntica são atribuídos os mesmos códigos de referência e as descrições dos mesmos são omitidas aqui.

O aparelho de codificação de fala 500 difere do aparelho de co

dificação de fala 100 ao ser adicionalmente equipado com uma seção de cálculo de valor de interpolação 504. Também, o processamento difere em parte entre a seção de quantificação de ganho 505 do aparelho de codificação de fala 500 e a seção de quantificação de ganho 105 do aparelho de 10 codificação de fala 100, e um código de referência diferente é atribuído para se indicar isto.

A seção de cálculo de valor de interpolação 504 tem um buffer interno que armazena uma informação de banda indicando uma banda alvo de quantificação de um quadro passado. Usando um valor de ganho de 15 quantificação de uma banda alvo de quantificação de um quadro passado lido a partir da seção de quantificação de ganho 505, a seção de cálculo de valor de interpolação 504 interpola um valor de ganho de uma banda que não foi quantificada em um quadro passado dentre as bandas alvos de quantificação de quadro atual indicadas pela informação de banda introduzi20 da a partir da seção de seleção de banda 102. A seção de cálculo de valor de interpolação 504 extrai um valor de interpolação de ganho obtido para a seção de quantificação de ganho 505.

A seção de quantificação de ganho 505 difere da seção de quantificação de ganho 105 de aparelho de codificação de fala 100 no uso de um 25 valor de interpolação de ganho introduzido a partir da seção de cálculo de valor de interpolação 504 além de um valor de ganho de quantificação de quadro passado armazenado em um buffer interno e um livro de código de ganho interno quando da realização da codificação preditiva.

O método de interpolação de valor de ganho usado pela seção de cálculo de valor de interpolação 504 será descrito, agora, em detalhes.

A seção de cálculo de valor de interpolação 504 tem um buffer interno que armazena uma informação de banda m_max introduzida a partir da seção de seleção de banda 102 em um quadro passado. Aqui, será descrito um caso a título de exemplo no qual um buffer interno é provido, que armazena uma informação de banda m_max para os três quadros passados.

A seção de cálculo de valor de interpolação 504 primeiramente 5 calcula um outro valor de ganho além de uma banda indicada pela informação de banda m max para os três quadros passados pela realização de uma interpolação linear. Um valor de interpolação é calculado de acordo com a Equação (19) para um valor de ganho de uma banda mais baixa do que a banda indicada pela informação de banda mjnax, e um valor de interpola10 ção é calculado de acordo com a Equação (20) para um valor de ganho de uma banda mais alta do que a banda indicada pela informação de banda m_max.

Po +Λ·3Ί + Pi-Qi + Pi 'g = 0 -(Equação 19)

Po-Vo + PrQi + Pi-Qi + Pi'g = 0 -(Equação 20)

Na Equação (19) e na Equação (20), β, indica um coeficiente de interpolação, q, indica um valor de ganho de uma banda alvo de quantifica15 ção indicada pela informação de banda m_max de um quadro passado, e g indica um valor de interpolação de ganho de uma banda não quantificada adjacente a uma banda alvo de quantificação indicada pela informação de banda mjnax de um quadro passado. Aqui, um valor mais baixo de i indica uma banda de freqüência proporcionalmente mais baixa, e na Equação (19) 20 g indica um valor de interpolação de ganho de uma banda adjacente no lado de banda alta de uma banda alvo de quantificação indicada por uma informação de banda mjnax de um quadro passado, enquanto na Equação (20) g indica um valor de interpolação de ganho de uma banda adjacente no lado de banda baixa de uma banda alvo de quantificação indicada pela informa25 ção de banda mjnax de um quadro passado. Para o coeficiente de interpolação βί, um valor é assumido como sendo usado, que foi descoberto de antemão estatisticamente, de modo a se satisfazer à Equação (19) e à Equação (20), mas um conjunto similar de coeficientes de predição ai também pode ser usado na Equação (19) e na Equação (20).

Conforme mostrado na Equação (19) e na Equação (20), é possível interpolar um valor de ganho de uma banda no lado de banda alta ou no lado de banda baixa adjacente a uma banda alvo de quantificação indicada por uma informação de banda m_max de quadro passado de um quadro passado na seção de cálculo de valor de interpolação 504. A seção de cál5 culo de valor de interpolação 504 sucessivamente interpola valores de ganho de outras bandas além de uma banda indicada pela informação de banda m_max dos três quadros passados dentre as bandas alvos de quantificação de quadro atual indicadas pela informação de banda introduzida a partir da seção de seleção de banda 102, usando os valores de ganho quantificados 10 dos três quadros passados lidos a partir da seção de quantificação de ganho 505.

Em seguida, uma operação de codificação preditiva na seção de quantificação de ganho 505 será descrita.

A seção de quantificação de ganho 505 realiza uma quantifica15 ção pela predição de um valor de ganho de quadro atual usando um valor de ganho de quantificação de quadro passado armazenado, um valor de interpolação de ganho introduzido a partir da seção de cálculo de valor de interpolação 504 e um livro de código de ganho interno. Especificamente, a seção de quantificação de ganho 505 busca um livro de código de ganho inter20 no composto pela quantidade GQ de vetores de código de ganho para cada uma das L sub-bandas, e encontra um índice de um vetor de código de ganho para o qual o resultado da Equação (21) abaixo é um mínimo.

Gain_q(i) = ^j.Gain_i(j + /') -GCiX (i = o, -,GQ-\) ...(Equação 21)

J=o I ,=I J

Na Equação (21), GCj indica um vetor de código de ganho compondo um livro de código de ganho, i indica um índice de vetor de código de 25 ganho e j indica um índice de um elemento de vetor de código de ganho. Aqui, Clj indica um valor de ganho de quantificação de t quadros antes no tempo, de modo que quando t = 1, por exemplo, Ctj indique um valor de ganho de quantificação de um quadro antes no tempo. Também, α é o coeficiente de predição linear de 4a ordem armazenado na seção de quantificação 30 de ganho 505. Um valor de interpolação de ganho calculado de acordo com a Equação (19) e com a Equação (20) pela seção de cálculo de valor de interpolação 504 é usado como um valor de ganho de uma banda não selecionada como uma banda alvo de quantificação nos três quadros passados. A seção de quantificação de ganho 505 trata as L sub-bandas em uma região como um vetor L-dimensional, e realiza uma quantificação de vetor.

A seção de quantificação de ganho 505 extrai um índice de vetor de código de ganho G_min para o qual o resultado da Equação (21) acima é um mínimo para a seção de multiplexação 106 como uma informação codificada de ganho. A seção de quantificação de ganho 505 também atualiza o 10 buffer interno de acordo com a Equação (22) abaixo, usando a informação codificada de ganho G_min e o valor de ganho de quantificação Ctj obtido no quadro atual.

C3 = C2

j+j j+r

C]+J..=C)+r (j = 0,-,L-l) ...(Equação 22)

Cl /^/iG min

i>r=GCj

A figura 11 é um diagrama de blocos que mostra a configuração principal de aparelho de decodificação de fala 600 de acordo com a Modali15 dade 3 da presente invenção. O aparelho de decodificação de fala 600 tem uma configuração básica similar àquela do aparelho de decodificação de fala 200 mostrado na figura 3, e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência, e as descrições dos mesmos são omitidas.

O aparelho de decodificação de fala 600 difere do aparelho de

decodificação de fala 200 pelo fato de ainda ser equipado com a seção de cálculo de valor de interpolação 603. Também, o processamento difere em parte entre a seção de desquantificação de ganho 604 de aparelho de decodificação de fala 600 e a seção de desquantificação de ganho 204 de apare25 Iho de decodificação de fala 200, e um código de referência diferente é atribuído para se indicar isto.

A seção de cálculo de valor de interpolação 603 tem um buffer interno que armazena uma informação de banda indicando uma informação de banda desquantificada em um quadro passado. Usando um valor de ganho de uma banda desquantificada em um quadro passado lido a partir da seção de desquantificação de ganho 604, a seção de cálculo de valor de interpolação 603 interpola um valor de ganho de uma banda que não foi desquantificada em um quadro passado dentre as bandas alvos de quantifi5 cação de quadro atual indicadas pela informação de banda introduzida a partir da seção de demultiplexação 201. A seção de cálculo de valor de interpolação 603 extrai um valor de interpolação de ganho obtido para a seção de desquantificação de ganho 604.

A seção de desquantificação de ganho 604 difere da seção de 10 desquantificação de ganho 204 de aparelho de decodificação de fala 200 no uso de um valor de interpolação de ganho introduzido a partir da seção de cálculo de valor de interpolação 603 além de um valor de ganho desquantificado de quadro passado armazenado e um livro de código de ganho interno quando da realização da codificação preditiva.

O método de interpolação de valor de ganho usado pela seção

de cálculo de valor de interpolação 603 é similar ao método de interpolação de valor de ganho usado pela seção de cálculo de valor de interpolação 504, e, portanto, uma descrição detalhada do mesmo será omitida aqui.

Em seguida, uma operação de decodificação preditiva na seção de desquantificação de ganho 604 será descrita.

A seção de desquantificação de ganho 604 realiza uma desquantificação pela predição de um valor de ganho de quadro atual usando um valor de ganho armazenado desquantificado em um quadro passado, um valor de interpolação de ganho introduzido a partir da seção de cálculo de 25 valor de interpolação 603 e um livro de código de ganho interno. Especificamente, a seção de desquantificação de ganho 604 obtém o valor de ganho Gain q’ pela realização de uma desquantificação de ganho de acordo com a Equação (23) abaixo.

Gain _q'(j + j") -i(«,-cv)+«»-GCf-"" (j-β,-,Ι-1) ...(Equação 23)

I=1

Na Equação (23), Cntj indica um valor de ganho de t quadros antes no tempo, de modo que quando t = 1, por exemplo, CMtj indique um valor de ganho de um quadro antes. Também, α é o coeficiente de predição linear de 4a ordem armazenado na seção de desquantificação de ganho 604. Um valor de interpolação de ganho calculado pela seção de cálculo de valor de interpolação 603 é usado como um valor de ganho de uma banda não sele5 cionada como um alvo de quantificação nos três quadros passados. A seção de desquantificação de ganho 604 trata as L sub-bandas em uma região como um vetor L-dimensional, e realiza uma desquantificação de vetor.

Em seguida, a seção de desquantificação de ganho 604 calcula um coeficiente de MDCT decodificado de acordo com a Equação (24) abai10 xo, usando um valor de ganho obtido pela desquantificação de quadro atual e um valor de formato introduzido a partir da seção de desquantificação de formato 202, e atualiza o buffer interno de acordo com a Equação (25) abaixo. Aqui, um coeficiente de MDCT decodificado calculado é denotado por X"k. Também, na desquantificação de coeficiente de MDCT, se k estiver pre15 sente em B(j") a B(j"+1)-1, o valor de ganho Gain_q’(j) assumirá o valor de Gain_q’G").

= l)-l] /r_ _

...(Equaçao 24)

*mi3 _ x-fn 2

'J-^j

C-2J = C”) 0' = 1) ...(Equação 25)

C") = Gain_q"{j)

Assim, de acordo com esta modalidade, quando da realização de uma quantificação de parâmetro de domínio de freqüência em uma banda alvo de quantificação diferente de cada quadro, os valores de bandas não 20 quantificadas diferentes são sucessivamente interpolados a partir de um valor quantificado em um quadro passado, e uma quantificação preditiva é realizada usando-se um valor de interpolação. Conseqüentemente, a precisão de codificação de codificação de fala pode ser adicionalmente melhorada.

Nesta modalidade, foi descrito um caso a título de exemplo no qual um coeficiente de interpolação fixo β encontrado de antemão é usado quando do cálculo de um valor de interpolação de ganho, mas a presente invenção não está limitada a isto, e uma interpolação também pode ser rea

X"k = Gain_q\j)· Shape_q' (k) Iizada após se ajustar o coeficiente de interpolação previamente encontrado β. Por exemplo, um coeficiente de predição pode ser ajustado de acordo com a distribuição de ganho de uma banda quantificada em cada quadro. Seção de predição de erro, é possível melhorar a precisão de codificação de 5 codificação de fala pela realização de um ajuste, de modo que um coeficiente de predição seja enfraquecido e o peso do ganho de quadro atual seja aumentado, quando uma variação no ganho quantificado em cada quadro for grande.

Nesta modalidade, foi descrito um caso a título de exemplo no 10 qual uma pluralidade consecutiva de bandas (uma região) compreendendo uma banda quantificada em cada quadro é tornada um alvo, mas a presente invenção não está limitada a isto, e uma pluralidade de regiões também pode ser tornada um alvo de quantificação. Nesse caso, é possível melhorar a precisão de codificação de conjunto de atuação e distribuição e fala pelo 15 emprego de um método por meio do qual uma predição linear de valores finais da respectiva região é realizada para uma banda entre as regiões selecionadas, além do método de interpolação de acordo com a Equação (19) e a Equação (20).

(Modalidade 4)

A figura 12 é um diagrama de blocos que mostra a configuração

principal do aparelho de codificação de fala 700 de acordo com a Modalidade 4 da presente invenção. O aparelho de codificação de fala 700 tem uma configuração básica similar àquela do aparelho de codificação de fala 100 mostrado na figura 1, e, portanto, a elementos de configuração idênticos são 25 atribuídos os mesmos códigos de referência e as descrições dos mesmos são omitidas aqui.

O aparelho de codificação de fala 700 difere do aparelho de codificação de fala 100 pelo fato de ainda ser equipado com a seção de decisão de coeficiente de predição 704. Também, o processamento difere em 30 parte entre a seção de quantificação de ganho 705 de aparelho de codificação de fala 700 e a seção de quantificação de ganho 105 de aparelho de codificação de fala 100, e um código de referência diferente é atribuído para indicar isto.

A seção de decisão de coeficiente de predição 704 tem um buffer interno que armazena uma informação de banda indicando uma banda alvo de quantificação de um quadro passado, decide um coeficiente de pre5 dição a ser usado na seção de quantificação de ganho 705 em uma quantificação com base em uma informação de banda de quadro passado, e extrai um coeficiente de predição decidido para a seção de quantificação de ganho 705.

A seção de quantificação de ganho 705 difere da seção de quantificação de ganho 105 de aparelho de codificação de fala 100 no uso de um coeficiente de predição introduzido a partir da seção de decisão de coeficiente de predição 704, ao invés de um coeficiente de predição decidido de antemão quando da realização da codificação preditiva.

Uma operação de decisão de coeficiente de predição na seção de decisão de coeficiente de predição 704 agora será descrita.

A seção de decisão de coeficiente de predição 704 tem um buffer interno que armazena uma informação de banda m_max introduzida a partir da seção de seleção de banda 102 em um quadro passado. Aqui, será descrito um caso a título de exemplo no qual um buffer interno é provido, 20 que armazena a informação de banda m max para os três quadros passados.

Usando a informação de banda m_max armazenada no buffer interno e uma informação de banda m_max introduzida a partir da seção de seleção de banda 102 no quadro atual, a seção de decisão de coeficiente de 25 predição 704 encontra um número de sub-bandas comuns a uma banda alvo de quantificação de quadro atual e uma banda alvo de quantificação de quadro passado. A seção de decisão de coeficiente de predição 704 decide os coeficientes de predição como sendo o conjunto A e extrai isto para a seção de quantificação de ganho 705, se o número de sub-bandas comuns for 30 maior do que ou igual a um valor predeterminado, ou decide que os coeficientes de predição sejam o conjunto B, e extrai isto para a seção de quantificação de ganho 705, se o número de sub-bandas comuns for menor do que o valor predeterminado. Aqui, o conjunto de coeficiente de predição A é um parâmetro regulado que enfatiza mais um valor de quadro passado, e torna o peso de um valor de ganho de quadro passado maior, do que no caso do conjunto de coeficiente de predição B. Por exemplo, no caso de coeficientes 5 de predição de 4a ordem, é possível que o conjunto A seja decidido como (aa0=0,60, aa1=0,25, aa2=0,10, aa3=0,05), e que o conjunto B seja decidido como (ab0=0,80, ab1=0,10, ab2=0,05, ab3=0,05).

Então, a seção de decisão de coeficiente de predição 704 atualiza o buffer interno usando a informação de banda m_max introduzida a partir da seção de seleção de banda 102 no quadro atual.

Em seguida, uma operação de codificação preditiva na seção de quantificação de ganho 705 será descrita.

A seção de quantificação de ganho 705 tem um buffer interno que armazena um valor de ganho de quantificação obtido em um quadro passado. A seção de quantificação de ganho 705 realiza uma quantificação pela predição de um valor de ganho de quadro atual usando-se um coeficiente de predição introduzido a partir da seção de decisão de coeficiente de predição 704 e o valor de ganho de quantificação de quadro passado CtJ armazenado no buffer interno. Especificamente, a seção de quantificação de ganho 705 busca um livro de código de ganho interno composto pela quantidade GQ de vetores de código de ganho para cada uma das L sub-bandas, e encontra um índice de um vetor de código de ganho para o qual o resultado da Equação (26) abaixo é um mínimo, se um coeficiente de predição for regulado A, ou encontra um índice de um vetor de código de ganho para o qual o resultado da Equação (27) abaixo é um mínimo, se um coeficiente de predição for regulado B.

Gain_q{i) = YjIcainJU +/')

-±(aa,.C'j+r)-aa0.Gc\ (i = 0,-,GQ-l) -(EquaçãO 26)

J=O I I=I J

Gainq(i) = j,Gain_i(j+j") - Yjpb,-CjvSl-Ob0 ·οσ\ (i=o,..,oe-i) .(Equação 27)

>O l /=1 J

Na Equação (26) e na Equação (27), GC1j indica um vetor de código de ganho compondo um livro de código de ganho, i indica um índice de vetor de código de ganho, e j indica um índice de um elemento de vetor de código de ganho. Por exemplo, se o número de sub-bandas compondo uma região for cinco (L = 5), j terá um valor de O a 4. Aqui, Ctj indica um valor de ganho de t quadros antes no tempo, de modo que quando t = 1, por exemplo, Ctj indique um valor de ganho de um quadro antes no tempo. Também, 5 α é o coeficiente de predição linear de 4a ordem armazenado na seção de quantificação de ganho 705. A seção de quantificação de ganho 705 trata L sub-bandas em uma região como um vetor L-dimensional, e realiza uma quantificação de vetor. Se não houver um valor de ganho de uma sub-banda correspondente a um quadro passado no buffer interno, a seção de quantifi10 cação de ganho 705 substituirá o valor de ganho na sub-banda mais próxima na freqüência no buffer interno na Equação (26) ou na Equação (27) acima.

A figura 13 é um diagrama de blocos que mostra a configuração principal de um aparelho de decodificação de fala 800 de acordo com a Modalidade 4 da presente invenção. O aparelho de decodificação de fala 800 15 tem uma configuração básica similar àquela do aparelho de decodificação de fala 200 mostrado na figura 3, e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência, e as descrições dos mesmos são omitidas aqui.

O dispositivo móvel 80 difere do aparelho de decodificação de 20 fala 200 pelo fato de ser adicionalmente equipado com a seção de decisão de coeficiente de predição 803. Também, o processamento difere, em parte, entre a seção de desquantificação de ganho 804 de aparelho de decodificação de fala 800 e a seção de desquantificação de ganho 204 de aparelho de decodificação de fala 200, e um código de referência diferente é atribuído, 25 para se indicar isso.

A seção de decisão de coeficiente de predição 803 tem um buffer interno que armazena uma informação de banda introduzida a partir da seção de demultiplexação 201 em um quadro passado, decide um coeficiente de predição a ser usado na quantificação da seção de desquantificação 30 de ganho 804, com base em uma informação de banda de quadro passado, e extrai um coeficiente de predição decidido para a seção de desquantificação de ganho 804. A seção de desquantificação de ganho 804 difere da seção de desquantificação de ganho 204 de aparelho de decodificação de fala 200 no uso de um coeficiente de predição introduzido a partir da seção de decisão de coeficiente de predição 803, ao invés de um coeficiente de predição deci5 dido de antemão, quando da realização da decodificação preditiva.

O método de decisão de coeficiente de predição usado pela seção de decisão de coeficiente de predição 803 é similar ao método de decisão de coeficiente de predição usado pela seção de decisão de coeficiente de predição 704 de aparelho de codificação de fala 700 e, portanto, uma 10 descrição detalhada da operação da operação da seção de decisão de coeficiente de predição 803 é omitida aqui.

Em seguida, uma operação de decodificação preditiva na seção de desquantificação de ganho 804 será descrita.

A seção de desquantificação de ganho 804 tem um buffer interno que armazena um valor de ganho obtido em um quadro passado. A seção de desquantificação de ganho 804 realiza uma desquantificação pela predição de um valor de ganho de quadro atual usando um coeficiente de predição introduzido a partir da seção de decisão de coeficiente de predição 803 e um valor de ganho de quadro passado armazenado no buffer interno. Especificamente, a seção de desquantificação de ganho 804 tem o mesmo tipo de livro de código de ganho interno que a seção de quantificação de ganho 705 de aparelho de codificação de fala 700, e obtém um valor de ganho Gain_q’ pela realização de uma desquantificação de ganho de acordo com a Equação (28) abaixo, se um coeficiente de predição introduzido a partir da seção de decisão de coeficiente de predição 803 for regulado A, ou de acordo com a Equação (29) abaixo, se o coeficiente de predição for regulado B.

Gain _q'{j + Γ)=^(αα, ■ C'"j+j.)+Oa0-GC^-r^n {j = 0,-··,Ι-ΐ) ...(Equação 28) /=1

Gain_q'(j + Γ) = ^(αό, ■C',J+r)+ab0-GCj-mm (j = ...(Equação 29)

/=I

Na Equação (28) e na Equação (29), Cntj indica um valor de ganho de t quadros antes no tempo, de modo que quando t = 1, por exemplo, Cntj indique um valor de ganho de um quadro antes. Também, oca, e abj indicam um conjunto de coeficiente de predição A e um conjunto B introduzidos a partir da seção de decisão de coeficiente de predição 803. A seção de desquantificação de ganho 804 trata L sub-bandas em uma região como um vetor L-dimensional, e realiza uma desquantificação de vetor.

Assim, de acordo com esta modalidade, quando da realização

de uma quantificação de parâmetro de domínio de freqüência de uma banda alvo de quantificação diferente de cada quadro, uma codificação preditiva é realizada pela seleção, a partir de uma pluralidade de conjuntos de coeficiente de predição, de um conjunto de coeficiente de predição que torne o pe10 so de um valor de ganho de quadro passado proporcionalmente maior quanto maior o número de sub-bandas comuns para uma banda alvo de quantificação de quadro passado e uma banda alvo de quantificação de quadro atual. Conseqüentemente, a precisão de codificação de codificação de fala é adicionalmente melhorada.

Nesta modalidade, foi descrito um caso a título de exemplo no

qual dois tipos de conjuntos de coeficiente de predição são providos de antemão, e um coeficiente de predição usado na codificação preditiva é comutado de acordo com o número de sub-bandas comuns a uma banda alvo de quantificação de quadro passado e a uma banda alvo de quantificação de 20 quadro atual, mas a presente invenção não está limitada a isto, e três ou mais tipos de conjuntos de coeficiente de predição também podem ser providos de antemão.

Nesta modalidade, foi descrito um caso a título de exemplo no qual se uma banda alvo de quantificação no quadro atual não tiver sido 25 quantificada em um quadro passado, o valor da banda mais próxima em um quadro passado será substituído, mas a presente invenção não está limitada a isto, e se um valor de banda alvo de quantificação no quadro atual não tiver sido quantificado em um quadro passado, uma codificação preditiva também poderá ser realizada pela tomada do coeficiente de predição de 30 quadro passado relevante como zero, adicionando-se um coeficiente de predição daquele quadro a um coeficiente de predição de quadro atual, calculando-se um novo conjunto de coeficiente de predição, e usando-se aqueles coeficientes de predição. Por meio disto, o efeito de codificação preditiva pode ser comutado de forma mais flexível, e a precisão de codificação de codificação de fala pode ser adicionalmente melhorada.

(Modalidade 5)

A figura 14 é um diagrama de blocos que mostra a configuração

principal do aparelho de codificação de fala 1000 de acordo com a Modalidade 5 da presente invenção. O aparelho de codificação de fala 1000 tem uma configuração básica similar àquela do aparelho de codificação de fala 300 mostrado na figura 6, e, portanto, a elementos de configuração idênticos 10 são atribuídos os mesmos códigos de referência e as descrições dos mesmos são omitidas aqui.

O aparelho de codificação de fala 1000 difere do aparelho de codificação de fala 300 pelo fato de ser equipado com a seção de codificação de melhoramento de banda 1007. Também, um processamento difere 15 em parte entre a seção de codificação de segunda camada 1008 e a seção de multiplexação 1009 de aparelho de codificação de fala 1000 e a seção de codificação de segunda camada 308 e a seção de multiplexação 309 de aparelho de codificação de fala 300 e códigos de referência diferentes são atribuídos para indicação disto.

A seção de codificação de melhoramento de banda 1007 realiza

uma codificação de melhoramento de banda usando um coeficiente de MDCT de primeira camada introduzido a partir da primeira seção de transformação de domínio de freqüência 305 e um coeficiente de MDCT de entrada introduzido a partir da segunda seção de transformação de domínio de 25 freqüência 307, e extrai uma informação codificada de melhoramento de banda obtida para a seção de multiplexação 1009.

A seção de multiplexação 1009 difere da seção de multiplexação 309 apenas na multiplexação da informação codificada de melhoramento de banda além da informação codificada de primeira camada e da informação codificada de segunda camada.

A figura 15 é um diagrama de blocos que mostra a configuração principal do interior da seção de codificação de melhoramento de banda 1007.

Na figura 15, a seção de codificação de melhoramento de banda 1007 é equipada com a seção de estimativa de espectro de banda alta 1071 e a seção de codificação de fator de escala corretivo 1072.

A seção de estimativa de espectro de banda alta 1071 estima

um espectro de banda alta de bandas de sinal FL a FH usando um espectro de banda baixa de bandas de sinal 0 a FL de um coeficiente de MDCT de entrada introduzido a partir da segunda seção de transformação de domínio de freqüência 307 para a obtenção de um espectro estimado. O método de 10 derivação de espectro estimado é encontrar um espectro estimado de modo que o grau de similaridade com o espectro de banda alta se torne um máximo pela transformação do espectro de banda baixa com base neste espectro de banda baixa. A seção de estimativa de espectro de banda alta 1071 codifica uma informação relativa a este espectro estimado (informação de 15 estimativa), extrai um parâmetro de codificação obtido, e também provê o espectro estimado em si para a seção de codificação de fator de escala corretivo 1072.

Na descrição a seguir, um espectro estimado extraído a partir da seção de estimativa de espectro de banda alta 1071 é chamado um primeiro espectro, e o coeficiente de MDCT de primeira camada (espectro de banda alta) extraído a partir da primeira seção de transformação de domínio de freqüência 305 é chamado um segundo espectro.

Os tipos descritos acima de espectros e bandas de sinal correspondentes podem ser resumidos conforme se segue.

Espectro de banda estreita (espectro de banda baixa)... 0 a FL

Espectro de banda larga ... 0 a FH Primeiro espectro (espectro estimado) ... FL a FH Segundo espectro (espectro de banda alta)... FL a FH A seção de codificação de fator de escala corretivo 1072 corrige um fator de escala de primeiro espectro de modo que o fator de escala de primeiro espectro se aproxime de um fator de escala de segundo espectro, e codifica e extrai uma informação relativa a este fator de escala corretivo. A informação codificada de melhoramento de banda extraída a partir da seção de codificação de melhoramento de banda 1007 para a seção de multiplexação 1009 inclui uma um parâmetro de codificação de informação de estimativa extraído a partir da seção de estimativa de espectro 5 de banda alta 1071 e um parâmetro de codificação de fator de escala corretivo extraído a partir da seção de codificação de fator de escala corretivo 1072.

A figura 16 é um diagrama de blocos que mostra a configuração principal do interior da seção de codificação de fator de escala corretivo 1072.

A seção de codificação de fator de escala corretivo 1072 é equipada com as seções de cálculo de fator de escala 1721 e 1722, o livro de código de fator de escala corretivo 1723, o multiplicador 1724, o subtraidor 1725, a seção de determinação 1726, a seção de cálculo de erro de atribui15 ção de peso 1727 e uma seção de busca 1728. Estas seções realizam as operações a seguir.

A seção de cálculo de fator de escala 1721 divide as bandas de sinal de segundo espectro introduzidas FL a FH em uma pluralidade de subbandas, encontra o tamanho de um espectro incluído em cada sub-banda, e 20 extrai isto para o subtraidor 1725. Especificamente, a divisão em sub-bandas é realizada associada a uma banda crítica, e uma divisão é realizada em intervalos iguais na escala de Bark. Também, a seção de cálculo de fator de escala 1721 encontra a amplitude média de espectros incluídos nas subbandas, e toma isto como um segundo fator de escala SF2(k) {0<k<NB}, on25 de NB representa o número de sub-bandas. Um valor de amplitude máxima ou similar pode ser usado, ao invés de uma amplitude média.

A seção de cálculo de fator de escala 1722 divide as bandas de sinal de primeiro espectro introduzidas FL a FH em uma pluralidade de subbandas, calcula o primeiro fator de escala SF1(k) {0<k<NB} das sub-bandas, 30 e extrai isto para o multiplicador 1724. Como com a seção de cálculo de fator de escala 1721, um valor de amplitude máxima ou similar pode ser usado, ao invés de uma amplitude média. No processamento subseqüente, os parâmetros na pluralidade de sub-bandas são integrados em um valor de vetor. Por exemplo, a quantidade NB de fatores de escala é representada como um vetor. Será dada uma descrição tomando-se um caso no qual cada operação de processa5 mento é realizada para cada um destes vetores - isto é, um caso no qual uma quantificação de vetor é realizada - como um exemplo.

O livro de código de fator de escala corretivo 1723 armazena uma pluralidade de candidatos a fator de escala corretivo, e subseqüentemente extrai um dos candidatos de fator de escala corretivo para o multipli10 cador 1724, de acordo com uma diretiva da seção de busca 1728. A pluralidade de candidatos a fator de escala corretivo armazenados no livro de código de fator de escala corretivo 1723 é representada por um vetor.

O multiplicador 1724 multiplica um primeiro fator de escala extraído a partir da seção de cálculo de fator de escala 1722 por um candidato a fator de escala corretivo extraído a partir do livro de código de fator de escala corretivo 1723, e provê o resultado de multiplicação para o subtraidor 1725.

O subtraidor 1725 subtrai a saída de multiplicador 1724 - isto é, o produto do primeiro fator de escala e do fator de escala corretivo - a partir do segundo fator de escala extraído a partir da seção de cálculo de fator de escala 1721, e provê um sinal de erro obtido desse modo para a seção de cálculo de erro de atribuição de peso 1727 e a seção de determinação 1726.

A seção de determinação 1726 determina um vetor de atribuição de peso a ser provido para uma seção de cálculo de erro de atribuição de peso 1727 com base no sinal do sinal de erro provido a partir do subtraidor 1725. Especificamente, o sinal de erro d(k) provido a partir do subtraidor 1725 é representado pela Equação (30) abaixo.

d(k) = SF2(Jfc)-Vi(Jfc)-SFl(ifc) (0 <ifc < NB) ...(Equação 30)

Aqui, Vj(k) representa um iésimo candidato a fator de escala corretivo. A seção de determinação 1726 checa o sinal de d(k), seleciona wpos como um peso se d(k) for positivo, ou seleciona Wneg como um peso se d(k) for negativo, e extrai o vetor de atribuição de peso w(k) composto por estes para a seção de cálculo de erro de atribuição de peso 1727. Estes pesos têm a relação de tamanho relativo mostrada na Equação (31) abaixo.

0 <*%,<"W ... (Equação 31)

Por exemplo, se o número de sub-bandas for NB=4, e os sinais de d(k) forem {+, -, -, +}, o vetor de atribuição de peso w(k) extraído para a seção de cálculo de erro de atribuição de peso 1727 será representado por

W(k) — {Wpos, Wneg1 Wneg, Wp0s}·

A seção de cálculo de erro de atribuição de peso 1727 primeiramente calcula o quadrado do sinal de erro provido a partir do subtraidor 10 1725, e, então, multiplica o vetor de atribuição de peso w(k) provido a partir da seção de determinação 1726 pelo quadrado do sinal de erro para o cálculo do erro ao quadrado ponderado E, e provê o resultado deste cálculo para a seção de busca 1728. Aqui, o erro ao quadrado ponderado E é representado conforme mostrado na Equação (32) abaixo.

Nfí-\

Ε=Σ w(k)-d(k)2 ... (Equação 32)

k= 0

A seção de busca 1728 controla o livro de código de fator de

escala corretivo 1723 e seqüencialmente extrai os candidatos a fator de escala corretivo armazenados, e por meio de um processamento de laço fechado encontra um candidato a fator de escala corretivo para o qual o erro ao quadrado ponderado E extraído a partir da seção de cálculo de erro de 20 atribuição de peso 1727 é um mínimo. A seção de busca 1728 extrai um índice iopt do candidato a fator de escala corretivo encontrado como um parâmetro de codificação.

Quando um peso usado quando do cálculo do erro ao quadrado ponderado E é regulado de acordo com o sinal de um sinal de erro e o tipo de relação mostrado na Equação (30) se aplica àquele peso, conforme descrito acima, o tipo a seguir de efeito é obtido. Especificamente, um caso no qual o sinal de erro d(k) é positivo é um caso no qual um valor decodificado gerado no lado de decodificação (em termos do lado de codificação, um valor obtido pela multiplicação de um primeiro fator de escala por um fator de escala corretivo) é menor do que um segundo fator de escala, o qual é o va5 Ior alvo. Também, um caso no qual o sinal de erro d(k) é negativo é um caso no qual um valor decodificado gerado no lado de decodificação é maior do que um segundo fator de escala, o qual é o valor alvo. Portanto, pela regulagem de um peso quando o sinal de erro d(k) é positivo de modo a ser menor do que um peso quando um sinal de erro d(k) é negativo, quando os valores 10 de sinal de erro forem da mesma ordem que um candidato a fator de escala corretivo que gera um valor decodificado menor do que um segundo fator de escala se torna propenso a ser selecionado.

O tipo a seguir de efeito de melhoria é obtido pelo processamento da seção de codificação de melhoramento de banda 1007. Por exemplo, quando um espectro de banda alta é estimado usando-se um espectro de banda baixa, como nesta modalidade, uma taxa de bit mais baixa pode ser geralmente obtida. Contudo, embora uma taxa de bit mais baixa possa ser obtida, a precisão de um espectro estimado - isto é, a similaridade entre um espectro estimado e um espectro de banda alta - não pode ser dita como sendo suficientemente alta, conforme descrito acima. Nesse caso, se um valor decodificado de fator de escala se tornar maior do que um valor alvo, e um fator de escala pós-quantificação operar na direção de intensificação de um espectro estimado, a precisão baixa do espectro estimado tenderá a ser perceptiva para o ouvido humano como uma degradação de qualidade. Inversamente, quando um valor decodificado de fator de escala se torna menor do que um valor alvo, e um fator de escala pós-quantificação opera na direção de atenuação deste espectro estimado, uma precisão baixa do espectro estimado cessa de ser notável, e um efeito de melhoria da qualidade de áudio do sinal decodificado é obtido. Esta tendência também foi confirmada em uma simulação em computador.

A figura 17 é um diagrama de blocos que mostra a configuração principal do interior da seção de codificação de segunda camada 1008. A seção de codificação de segunda camada 1008 tem uma configuração básica similar àquela da seção de codificação de segunda camada 308 mostrada e vista na figura 7, e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência e as descrições dos mesmos 5 são omitidas aqui. O processamento difere em parte entre a seção de cálculo de coeficiente de MDCT residual 1081 da seção de codificação de segunda camada 1008 e a seção de cálculo de coeficiente de MDCT residual 381 da seção de codificação de segunda camada 308, e um código de referência diferente é atribuído para se indicar isso.

A seção de cálculo de coeficiente de MDCT residual 1081 calcu

la uma MDCT residual que é para ser um alvo de quantificação na seção de codificação de segunda camada a partir de um coeficiente de MDCT de entrada introduzido e do coeficiente de MDCT de melhoramento de primeira camada. A seção de cálculo de coeficiente de MDCT residual 1081 difere da 15 seção de cálculo de coeficiente de MDCT residual 381 de acordo com a Modalidade 2 ao tomar um resíduo do coeficiente de MDCT de entrada e o coeficiente de MDCT de melhoramento de primeira camada como um coeficiente de MDCT residual para uma banda não melhorada pela seção de codificação de melhoramento de banda 1007 e tomando um coeficiente de MDCT 20 de entrada em si, ao invés de um resíduo, como um coeficiente de MDCT residual para uma banda melhorada pela seção de codificação de melhoramento de banda 1007.

A figura 18 é um diagrama de blocos que mostra a configuração principal de aparelho de decodificação de fala 1010 de acordo com a Moda25 Iidade 5 da presente invenção. O aparelho de decodificação de fala 1010 tem uma configuração similar àquela do aparelho de decodificação de fala 400 mostrado na figura 8, e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência e descrições dos mesmos são omitidas aqui.

O aparelho de decodificação de fala 1010 difere do aparelho de

decodificação de fala 400 ao ser adicionalmente equipado com a seção de decodificação de melhoramento de banda 1012 e uma seção de transformação de domínio de tempo 1013. Também, o processamento difere, em parte entre a seção de controle 1011, a seção de decodificação de segunda camada 1015 e o comutador 1017 do aparelho de decodificação de fala 1010 e a seção de controle 401, a seção de decodificação de segunda camada 405 5 e o comutador 407 do aparelho de decodificação de fala 400, e códigos de referência diferentes são atribuídos para indicação disto.

A seção de controle 1011 analisa os elementos de configuração de um fluxo de bit transmitido a partir do aparelho de codificação de fala 1000 e, de acordo com estes elementos de configuração de fluxo de bit, extrai de forma adaptativa a informação codificada apropriada para a seção de decodificação de primeira camada 402, a seção de decodificação de melhoramento de banda 1012 e uma seção de decodificação de segunda camada 1015, e também extrai a informação de controle para o comutador 1017. Especificamente, se o fluxo de bit compreender uma informação codificada de primeira camada, uma informação codificada de melhoramento de banda, a seção de controle 1011 extrairá a informação codificada de primeira camada para a seção de decodificação de primeira camada 402, extrairá a informação codificada de melhoramento de banda para a seção de decodificação de melhoramento de banda 1012 e extrairá a informação codificada de segunda camada par a seção de decodificação de segunda camada 1015. Se o fluxo de bit compreender apenas a informação codificada de primeira camada e a informação codificada de melhoramento de banda, a seção de controle 1011 extrairá a informação codificada de primeira camada para a seção de decodificação de primeira camada 402 e extrairá a informação codificada de meIhoramento de banda para a seção de decodificação de melhoramento de banda 1012. Se o fluxo de bit compreender apenas a informação codificada de primeira camada, a seção de controle 1011 extrairá esta informação codificada de primeira camada para a seção de decodificação de primeira camada 402. Também, a seção de controle 1011 extrai uma informação de controle que controla o comutador 1017 para o comutador 1017.

A seção de decodificação de melhoramento de banda 1012 realiza um processamento de melhoramento de banda usando a informação codificada de melhoramento de banda introduzida a partir da seção de controle 1011 e um coeficiente de MDCT decodificado de primeira camada introduzido a partir da seção de transformação de domínio de freqüência 404, para a obtenção de um coeficiente de MDCT de melhoramento de primeira 5 camada. Então, a seção de decodificação de melhoramento de banda 1012 extrai o coeficiente de MDCT de melhoramento de primeira camada obtido para a seção de transformação de domínio de tempo 1013 e a seção de decodificação de segunda camada 1015. A configuração interna principal e a operação real da seção de decodificação de melhoramento de banda 1012 10 serão descritas mais tarde aqui.

A seção de transformação de domínio de tempo 1013 realiza uma IMDCT no coeficiente de MDCT de melhoramento de primeira camada introduzido a partir da seção de decodificação de melhoramento de banda 1012 e extrai um sinal decodificado de melhoramento de primeira camada obtido como uma componente de domínio de tempo para o comutador 1017.

A seção de decodificação de segunda camada 1015 realiza uma desquantificação de ganho de uma desquantificação de formato usando a informação codificada de segunda camada introduzida a partir da seção de controle 1011 e o coeficiente de MDCT de melhoramento de primeira cama20 da introduzido a partir da seção de decodificação de melhoramento de banda 1012, para a obtenção de um coeficiente de MDCT decodificado de segunda camada. A seção de decodificação de segunda camada 1015 adiciona em conjunto o coeficiente de MDCT decodificado de segunda camada e o coeficiente de MDCT decodificado de primeira camada e extrai o resultado 25 de adição obtido para a seção de transformação de domínio de tempo 406 como um coeficiente de MDCT de adição. A configuração interna principal e a operação real da seção de decodificação de segunda camada 1015 serão descritas mais tarde aqui.

Com base na informação de controle introduzida a partir da seção de controle 1011, se o fluxo de bit introduzido a partir do aparelho de decodificação de fala 1010 compreender uma informação codificada de primeira camada, uma informação codificada de melhoramento de banda e uma informação codificada de segunda camada, o comutador 1017 extrairá o sinal decodificado de segunda camada a partir da seção de transformação de domínio de tempo 406 como um sinal de saída. Se o fluxo de bit compreender apenas a informação codificada de primeira camada e a informação 5 codificada de melhoramento de banda, o comutador 1017 extrairá o sinal decodificado de melhoramento de primeira camada introduzido a partir da seção de transformação de domínio de tempo 1013 como um sinal de saída. Se o fluxo de bit compreender apenas a informação codificada de primeira camada, o comutador 1017 extrairá o sinal decodificado de primeira camada 10 introduzido a partir da seção de decodificação de primeira camada 402 como um sinal de saída.

A figura 19 é um diagrama de blocos que mostra a configuração principal do interior da seção de decodificação de melhoramento de banda 1012. A seção de decodificação de melhoramento de banda 1012 compre15 ende uma seção de decodificação de espectro de banda alta 1121, a seção de decodificação de fator de escala corretivo 1122, o multiplicador 1123 e a seção de ligação 1124.

A seção de decodificação de espectro de banda alta 1121 decodifica um espectro estimado (espectro fino) de bandas FL a FH, usando um 20 parâmetro de codificação de informação de estimativa e um primeiro espectro incluído na informação codificada de melhoramento de banda introduzida a partir da seção de controle 1011. O espectro estimado obtido é provido para o multiplicador 1123.

A seção de decodificação de fator de escala corretivo 1122 de25 codifica um fator de escala corretivo usando um parâmetro de codificação de fator de escala corretivo incluído na informação codificada de melhoramento de banda introduzida a partir da seção de controle 1011. Especificamente, a seção de decodificação de fator de escala corretivo 1122 referencia um livro de código de fator de escala corretivo interno (não mostrado) e extrai um 30 fator de escala corretivo correspondente para o multiplicador 1123.

O multiplicador 1123 multiplica o espectro estimado extraído a partir da seção de decodificação de espectro de banda alta 1121 pelo fator de escala corretivo extraído a partir da seção de decodificação de fator de escala corretivo 1122, e extrai o resultado de multiplicação para a seção de ligação 1124.

A seção de ligação 1124 liga o primeiro espectro e o espectro 5 estimado extraído a partir do multiplicador 1123 no domínio de freqüência, para a geração de um espectro decodificado de banda larga de bandas de sinal 0 a FH, e extrai isto para a seção de transformação de domínio de tempo 1013 como um coeficiente de MDCT de melhoramento de primeira camada.

Por meio da seção de decodificação de melhoramento de banda

1012, quando um sinal de entrada é transformado em um coeficiente de domínio de freqüência e um fator de escala é quantificado em uma codificação de confinamento de camada superior, uma quantificação de fator de escala é realizada usando-se uma escala de distorção ponderada, de modo que um 15 candidato de quantificação para o qual o fator de escala se torna pequeno se torne propenso a ser selecionado. Isto é, um candidato de quantificação por meio do qual o fator de escala após uma quantificação é menor do que o fator de escala antes de uma quantificação, é mais provável de ser selecionado. Assim, uma degradação de qualidade subjetiva perceptiva pode ser 20 suprimida, mesmo quando o número de bits alocados para quantificação de fator de escala for insuficiente.

A figura 20 é um diagrama de blocos que mostra a configuração principal do interior da seção de decodificação de segunda camada 1015. A seção de decodificação de segunda camada 1015 tem uma configuração 25 básica similar àquela da seção de decodificação de segunda camada 405 mostrada na figura 9 e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência e as descrições dos mesmos são omitidas aqui.

O processamento difere em parte entre a seção de cálculo de coeficiente de MDCT de adição 1151 da seção de decodificação de segunda camada 1015 e a seção de cálculo de coeficiente de MDCT de adição 452 de seção de decodificação de segunda camada 405, e um código de referência diferente é atribuído para se indicar isto.

A seção de cálculo de coeficiente de MDCT de adição 1151 tem um coeficiente de MDCT de melhoramento de primeira camada como uma entrada a partir da seção de decodificação de melhoramento de banda 1012, 5 e um coeficiente de MDCT decodificado de segunda camada como uma entrada a partir da seção de desquantificação de ganho 204. A seção de cálculo de coeficiente de MDCT de adição 1151 adiciona em conjunto o coeficiente de MDCT decodificado de primeira camada e o coeficiente de MDCT decodificado de segunda camada, e extrai um coeficiente de MDCT de adição. 10 Para uma banda de banda melhorada, o valor de coeficiente de MDCT de melhoramento de primeira camada é adicionado como zero na seção de cálculo de coeficiente de MDCT de adição 1151. Quer dizer, para uma banda de banda melhorada, o valor de coeficiente de MDCT decodificado de segunda camada é tomado como o valor de coeficiente de MDCT de adição.

Assim, de acordo com esta modalidade, quando uma componen

te de freqüência de uma banda diferente é tornado o alvo de quantificação em cada quadro, nenhuma codificação preditiva de parâmetro não temporal é realizada de forma adaptativa além da aplicação de uma codificação escalonável usando-se a tecnologia de melhoramento de banda. Conseqüente20 mente, a quantidade de informação codificada em uma codificação de fala pode ser reduzida, e um erro de codificação de sinal de fala/áudio e uma degradação de qualidade de áudio de sinal decodificado podem ser adicionalmente reduzidos.

Também, uma vez que um resíduo não é calculado para uma componente de uma banda melhorada por um método de codificação de melhoramento de banda, a energia de uma componente alvo de quantificação não diminui em uma camada superior, e a eficiência de quantificação pode ser melhorada.

Nesta modalidade, foi descrito um caso a título de exemplo no qual um método é aplicado, por meio do que uma informação codificada de melhoramento de banda é calculada em um aparelho de codificação usandose a correlação entre uma componente de banda baixa decodificada por uma seção de codificação de coeficiente de MDCT e uma componente de banda alta de um sinal de entrada, mas a presente invenção não está limitada a isto, e também pode ser aplicada de forma similar a uma configuração que empregue um método por meio do qual uma informação codificada de 5 melhoramento de banda não é calculada, e uma pseudogeração de uma banda alta é realizada por meio de uma componente de ruído, como com AMR-WB (Taxa Múltipla Adaptativa - Banda Larga). Alternativamente, um método de seleção de banda da presente invenção pode ser aplicado de forma similar ao método de codificação de melhoramento de banda descrito 10 neste exemplo, ou um método de codificação/decodificação escalonável que não emprega um método de geração de componente de banda alta também usado em AMR-WB.

(Modalidade 6)

A figura 21 é um diagrama de blocos que mostra a configuração principal de aparelho de codificação de fala 1100 de acordo com a Modalidade 6 da presente invenção.

Nesta figura, o aparelho de codificação de fala 1100 é equipado com a seção de amostragem para baixo 301, a seção de codificação de primeira camada 302, a seção de decodificação de primeira camada 303, a 20 seção de amostragem para cima 304, a primeira seção de transformação de domínio de freqüência 305, a seção de atraso 306, a segunda seção de transformação de domínio de freqüência 307, a seção de codificação de segunda camada 1108 e a seção de multiplexação 309, e tem uma configuração escalonável compreendendo duas camadas. Na primeira camada, um 25 método de codificação de fala de CELP é aplicado e na segunda camada o método de codificação de fala descrito na Modalidade 1 da presente invenção é aplicado.

Com exceção da seção de codificação de segunda camada 1108, os elementos de configuração no aparelho de codificação de fala 1100 mostrado na figura 21 são idênticos aos elementos de configuração de aparelho de codificação de fala 300 mostrado na figura 6, e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência e descrições dos mesmos são omitidas aqui.

A figura 22 é um diagrama de blocos que mostra a configuração principal do interior da seção de codificação de segunda camada 1108. A seção de codificação de segunda camada 1108 compreende principalmente 5 a seção de cálculo de coeficiente de MDCT residual 381, a seção de seleção de banda 1802, a seção de quantificação de formato 103, a seção de decisão de execução/não execução de codificação preditiva 104, a seção de quantificação de ganho 1805 e a seção de multiplexação 106. Com exceção da seção de seleção de banda 1802 e da seção de quantificação de ganho 10 1805, os elementos de configuração da seção de codificação de segunda camada 1108 são idênticos aos elementos de configuração da seção de codificação de segunda camada 308 mostrada na figura 7, e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência e descrições dos mesmos são omitidas aqui.

A seção de seleção de banda 1802 primeiramente divide o coe

ficiente de MDCT Xk em uma pluralidade de sub-bandas. Aqui, uma descrição será dada tomando-se um caso no qual o coeficiente de MDCT Xk é dividido igualmente em J sub-bandas (onde J é um número natural) como um exemplo. Então, a seção de seleção de banda 1802 seleciona L sub-bandas 20 (onde L é um número natural) a partir de dentre as J sub-bandas, e obtém M tipos de regiões (onde M é um número natural).

A figura 23 é um desenho que mostra um exemplo da configuração das regiões obtidas pela seção de seleção de banda 1802.

Nesta figura, o número de sub-bandas é 17 (J = 17), o número 25 de tipos de regiões é oito (M = 8), e cada região é composta por dois grupos de sub-banda (o número de bandas compondo estes dois grupos de subbanda sendo três e dois, respectivamente). Destes dois grupos de subbanda, o grupo de sub-banda compreendendo duas bandas localizadas no lado de banda alta é fixo por todos os quadros, os índices de sub-banda 30 sendo, por exemplo, 15 e 16. Por exemplo, a região 4 é composta pelas subbandas 8, 15 e 16.

Em seguida, a seção de seleção de banda 1802 calcula a energia média E(m) de cada um dos M tipos de regiões de acordo com a Equação (33) abaixo.

Σ Σ

E(m) = - (m = o, · · ·,M -1) ...(Equação 33)

Nesta equação, j’ indica o índice de cada uma das J sub-bandas, e m indica o índice de cada um dos M tipos de regiões. Region(m) significa 5 uma coleção de índices de L sub-bandas compondo a região m, e B(j’) indica o valor mínimo dentre os índices de uma pluralidade de coeficientes de MDCT compondo a sub-banda j’. W(j) indica a largura de banda de subbanda j’, e na descrição a seguir um caso no qual as larguras de banda das J sub-bandas são todas iguais - isto é, um caso no qual W(j’) é uma constan10 te - será descrito como um exemplo.

Em seguida, quando uma região para a qual a energia média E(m) é um máximo, por exemplo, a região m_max é selecionada, a seção de seleção de banda 1802 seleciona uma banda composta pelas j’e Region(m_max) sub-bandas como a banda alvo de quantificação, e extrai o índi

ce mmax indicando esta região com uma informação de banda para a seção de quantificação de formato 103, a seção de decisão de execução/não execução de codificação preditiva 104 e a seção de multiplexação 106. A seção de seleção de banda 1802 também extrai o coeficiente de MDCT residual Xr para a seção de quantificação de formato 103.

A seção de quantificação de ganho 1805 tem um buffer interno

que armazena um valor de ganho de quantificação obtido em um quadro passado. Se um resultado de determinação introduzido a partir da seção de decisão de execução/não execução de codificação preditiva 104 indicar que uma codificação preditiva é para ser realizada, a seção de quantificação de 25 ganho 1805 realizará uma quantificação pela predição de um valor de ganho de quadro atual usando-se o valor de ganho de quantificação de quadro passado Clj- armazenado no buffer interno. Especificamente, a seção de quantificação de ganho 1805 busca um livro de código de ganho interno composto pela quantidade GQ de vetores de código de ganho para cada 30 uma das L sub-bandas, e encontra um índice de um vetor de código de ganho para o qual o resultado da Equação (34) abaixo é um mínimo.

Σ W/</)-t(«,-Ç.)-a.-GC,í .(Equação 34)

feRegiorim_nax) {, /=I J ~~ ^

Nesta equação, GCk indica um vetor de código de ganho compondo um livro de código de ganho, i indica um índice de vetor de código de ganho, e k indica um índice de um elemento de vetor de código de ganho.

Por exemplo, se o número de sub-bandas compondo uma região for cinco (L = 5), k terá um valor de O a 4. Aqui, os ganhos de sub-bandas de uma região selecionada são ligados de modo que os índices de sub-banda estejam em ordem ascendente, os ganhos consecutivos sejam tratados como um vetor de código de ganho L-dimensional, e uma quantificação de vetor seja reali10 zada. Portanto, para se proporcionar uma descrição usando a figura 23, no caso da região 4, os valores de ganho dos índices de sub-banda 6, 7, 8, 15 e

16 serão ligados e tratados como um vetor de código de ganho de 5 dimensões. Também, C*· indica um valor de ganho de t quadros antes no tempo, de modo que quanto t = 1, por exemplo, C*- indique um valor de ganho de um quadro antes no tempo, eaéum coeficiente de predição linear de 4a ordem armazenado na seção de quantificação de ganho 1805.

A seção de quantificação de ganho 1805 extrai um índice de vetor de código de ganho G_min para o qual o resultado da Equação 934) acima é um mínimo para a seção de multiplexação 106 como uma informação 20 codificada de ganho. Se não houver um valor de ganho de uma sub-banda correspondente a um quadro passado no buffer interno, a seção de quantificação de ganho 1805 substituirá o valor de ganho da sub-banda mais próxima na freqüência no buffer interno na Equação (34) acima.

Por outro lado, se o resultado de determinação introduzido a par25 tir da seção de decisão de execução/não execução de codificação preditiva 104 indicar que uma codificação preditiva não é para ser realizada, a seção de quantificação de ganho 1805 quantificará diretamente o valor de ganho ideal Gain_i(j’) introduzido a partir da seção de quantificação de formato 103 de acordo com a Equação (35) abaixo. Aqui, a seção de quantificação de 30 ganho 1805 trata um valor de ganho ideal como um vetor L-dimensional, e realiza uma quantificação de vetor. Gain_q{i)= ^Gain_i(j')-GCik] í* °’ 1 ...(Equação 35)

j'eRegion(m_max) ^? * * *? *■ J

Aqui, um índice de livro de código que torne a Equação (35) acima de um mínimo é denotado G_min.

A seção de quantificação de ganho 1805 extrai G_min para a seção de multiplexação 106 como uma informação codificada de ganho. A 5 seção de quantificação de ganho 1805 também atualiza o buffer interno de acordo com a Equação (36) abaixo, usando a informação codificada de ganho G_min e o valor de ganho de quantificação Clj· obtido no quadro atual. Quer dizer, na Equação (36), um valor de C1j· é atualizado com um índice de elemento de vetor de código de ganho GCG-minj j e j’ satisfazendo a j’e Regi

on(mmax) respectivamente associados em ordem ascendente.

C3r =C\ f

y'e Region(m_max)

C =C

Cf=GCj

G min

...(Equação 36)

A figura 24 é um diagrama de blocos que mostra a configuração principal de aparelho de decodificação de fala 1200 de acordo com esta modalidade.

Nesta figura, o aparelho de decodificação de fala 1200 é equipa15 do com a seção de controle 401, a seção de decodificação de primeira camada 402, a seção de amostragem para cima 403, a seção de transformação de domínio de freqüência 404, a seção de codificação de segunda camada 1205, a seção de transformação de domínio de tempo 406 e o comutador 407.

Com exceção da seção de codificação de segunda camada

1205, os elementos de configuração no aparelho de decodificação de fala 1200 mostrado na figura 24 são idênticos aos elementos de configuração do aparelho de decodificação de fala 400 mostrado na figura 8 e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência e as descrições dos mesmos são omitidas aqui.

A figura 25 é um diagrama de blocos que mostra a configuração interna do interior da seção de codificação de segunda camada 1205. A seção de codificação de segunda camada 1205 compreende principalmente a seção de multiplexação 451, a seção de desquantificação de formato 202, a seção de decisão de execução/não execução de decodificação preditiva 203, a seção de desquantificação de ganho 2504 e a seção de cálculo de 5 coeficiente de MDCT de adição 452. Com exceção da seção de desquantificação de ganho 2504, os elementos de configuração na seção de codificação de segunda camada 1205 são idênticos aos elementos de configuração da seção de decodificação de segunda camada 405 mostrado na figura 9 e, portanto, a elementos de configuração idênticos são atribuídos os mesmos 10 códigos de referência e descrições dos mesmos são omitidas aqui.

A seção de desquantificação de ganho 2504 tem um buffer interno que armazena um valor de ganho obtido em um quadro passado. Se um resultado de determinação introduzido a partir da seção de decisão de execução/não execução de decodificação preditiva 203 indicar que uma de15 codificação preditiva é para ser realizada, a seção de desquantificação de ganho 2504 realiza uma desquantificação pela predição de um valor de ganho de quadro atual usando um valor de ganho de quadro passado armazenado no buffer interno. Especificamente, a seção de desquantificação de ganho 2504 realiza uma desquantificação pela predição de um valor de ga20 nho de quadro atual usando um valor de ganho de quadro passado armazenado no buffer interno. Especificamente, a seção de desquantificação de ganho 2504 tem o mesmo tipo de livro de código de ganho interno (GCG-mink, onde k indica um índice de elemento) como a seção de quantificação de ganho 105 de aparelho de codificação de fala 100, e obtém um valor de ganho 25 Gain_q’ pela realização de uma desquantificação de ganho de acordo com a Equação (37) abaixo. Aqui, C"*· indica um valor de ganho de t quadros antes no tempo, de modo que quando t = 1, por exemplo, CMtj· indique um valor de ganho de um quadro antes no tempo. Também, α é o coeficiente de predição linear de 4a na seção de desquantificação de ganho 2504. A seção de 30 desquantificação de ganho 2504 trata L sub-bandas em uma região como um vetor L-dimensional, e realiza uma desquantificação de vetor. Quer dizer, na Equação (37), um valor de Gain_q’G’) é calculado com os índices de elemento de vetor de código de ganho GCG-mink k e j’ satisfazendo a j’ e Regi on(m_max) respectivamente associados em ordem ascendente.

Οο«_?Ό") = Σ(α, 'C"'.)+ao-CCf-"*

j-s Region(m_max)') (Equaçã0 37)

(=1 — 0 ,"',L 1

Se não houver um valor de ganho de uma sub-banda correspondente a um quadro passado no buffer interno, a seção de desquantificação de ganho 2504 substitui o valor de ganho da sub-banda mais próxima na freqüência no buffer interno na Equação (37) acima.

Por outro lado, se o resultado de determinação introduzido a partir da seção de decisão de execução/não execução de decodificação preditiva 203 indica que uma decodificação preditiva não é para ser realizada, a 10 seção de desquantificação de ganho 2504 realizará uma desquantificação de um valor de ganho de acordo com a Equação (38) abaixo, usando o livro de código de ganho descrito acima. Aqui, um valor de ganho é tratado como um vetor L-dimensional, e uma desquantificação de vetor é realizado. Quer dizer, quando a decodificação preditiva não é realizada, a seção de des15 quantificação de ganho 2504 toma o vetor de código de ganho GCkG~min correspondente à informação codificada de ganho G_min diretamente como um valor de ganho. Na Equação (38), k e j’ são respectivamente associados em ordem ascendente da mesma forma que na Equação (37).

Gain _q'(Z) = GC1

G _ min k

Regionim ιηαχ)λ

...(Equação 38)

Jfc = O,--,Z-I

Em seguida, a seção de desquantificação de ganho 2504 calcula 20 um coeficiente de MDCT decodificado de acordo com a Equação (39) abaixo, usando um valor de ganho obtido pela desquantificação de quadro atual e um valor de formato introduzido a partir da seção de desquantificação de formato 202, e atualiza o buffer interno de acordo com a Equação (40) abaixo. Na Equação (40), um valor Cn1j é atualizado com j de valor de ganho 25 desquantificado Gain_q’(j) e j’ satisfazendo a j’ e Region(m_max) respectivamente associados em ordem ascendente. Aqui, um coeficiente de MDCT decodificado calculado é denotado por X"k. Também, em uma desquantificação de coeficiente de MDCT, se k estiver presente em B(j’) a B(j’+1)-1, o valor de ganho assumirá o valor de Gain_q’(j’). X" k = Gain _q' (/) ■ Shape _q' (k)

...(Equação 39)

...(Equação 40)

/ y"

C"). = Gain_q\j)

A seção de desquantificação de ganho 2504 extrai o coeficiente de MDCT decodificado X1V calculado de acordo com a Equação (39) acima para a seção de cálculo de coeficiente de MDCT de adição 452.

Assim, de acordo com esta modalidade, se comparada com a 5 seleção de uma região composta pelas sub-bandas adjacentes a partir de dentre todas as bandas como uma banda alvo de quantificação, uma pluralidade de bandas para as quais se deseja melhorar uma qualidade de áudio é regulada de antemão através de uma faixa ampla, e uma pluralidade não consecutiva de bandas cobrindo uma faixa ampla é selecionada como ban10 das alvos de quantificação. Conseqüentemente, uma qualidade de banda baixa e de banda alta pode ser melhorada ao mesmo tempo.

Nesta modalidade, a razão para sempre se fixarem as subbandas incluídas em uma banda alvo de quantificação no lado de banda alta, conforme mostrado na figura 23, é que uma distorção de codificação ain15 da é grande para uma banda alta na primeira camada de um codificador decodificador escalonável. Portanto, uma qualidade de áudio é melhorada por também se selecionar de forma fixa uma banda alta que não foi codificada com uma precisão muito alta pela primeira camada como um alvo de quantificação além da seleção de uma banda baixa ou média tendo uma 20 significância perceptiva para seleção como um alvo de quantificação na segunda camada.

Nesta modalidade, foi descrito um caso a título de exemplo no qual uma banda que se tornou um alvo de quantificação de banda alta é fixada pela inclusão das mesmas sub-bandas de banda alta (especificamente, 25 os índices de sub-banda 15 e 17) por todos os quadros, as uma presente invenção não está limitada a isto, e uma banda que se torne um alvo de quantificação de banda alta também pode ser selecionada a partir de dentre uma pluralidade de candidatos a banda alvo de quantificação para uma subbanda de banda alta da mesma forma que para uma sub-banda de banda alta. Nesse caso uma seleção pode ser realizada após uma multiplicação por um peso maior quanto mais alta for a área de sub-banda. Também é 5 possível que bandas que se tornam candidatas sejam mudadas de forma adaptativa de acordo com a taxa de amostragem de sinal de entrada, a taxa de bit de codificação e as características espectrais de sinal decodificado de primeira camada, ou as características espectrais de um sinal diferencial para um sinal de entrada e um sinal decodificado de primeira camada, ou 10 similar. Por exemplo, um método possível é dar prioridade como um candidato a banda alvo de quantificação a uma parte em que a distribuição de energia do espectro (coeficiente de MDCT residual) de um sinal diferencial para o sinal de entrada e o sinal decodificado de primeira camada seja alta.

Nesta modalidade, foi descrito um caso a título de exemplo no qual um grupo de sub-banda de lado de banda alta compondo uma região é fixo, e se uma codificação preditiva é para ser realizada ou não para uma seção de quantificação de ganho é determinado de acordo com o número de sub-bandas comuns a uma banda alvo de quantificação selecionada no quadro atual e uma banda alvo de quantificação selecionada em um quadro passado, mas a presente invenção não está limitada a isto, e uma codificação preditiva também sempre pode ser aplicada a um ganho de um grupo de sub-banda de lado de banda alta compondo uma região, com uma determinação quanto a se uma codificação preditiva é ou não para ser realizada sendo realizada apenas para um grupo de sub-banda de lado de banda baixa. Neste caso, o número de sub-bandas comuns a uma banda alvo de quantificação selecionada no quadro atual e uma banda alvo de quantificação selecionada em um quadro passado é levado em consideração apenas para um grupo de sub-banda de lado de banda baixa. Quer dizer, neste caso, um vetor de quantificação é quantificado após uma divisão em uma parte para a qual uma codificação preditiva é realizada e uma parte para a qual uma codificação preditiva não é realizada. Desta forma, uma vez que uma determinação quanto a se uma codificação preditiva é ou não necessária para um grupo de sub-banda fixo de lado de banda alta compondo uma região não é realizada, e uma codificação preditiva sempre é realizada, um ganho pode ser quantificado mais eficientemente.

Nesta modalidade, foi descrito um caso a título de exemplo no qual uma comutação é realizada entre uma aplicação e uma não aplicação de uma codificação preditiva em uma seção de quantificação de ganho de acordo com o número de sub-bandas comuns a uma banda alvo de quantificação selecionada no quadro atual e uma banda alvo de quantificação selecionada um quadro para trás no tempo, mas a presente invenção não está limitada a isto, e um número de sub-bandas comuns a uma banda alvo de quantificação selecionada no quadro atual e uma banda alvo de quantificação selecionada dois ou mais quadros para trás no tempo também podem ser usadas. Neste caso, mesmo se o número de sub-bandas comuns a uma banda alvo de quantificação selecionada no quadro atual e uma banda alvo de quantificação selecionada um quadro para trás no tempo for menor do que ou igual a um valor predeterminado, uma codificação preditiva poderá ser aplicada em uma seção de quantificação de ganho de acordo com o número de sub-bandas comuns a uma banda alvo de quantificação selecionada no quadro atual e uma banda alvo de quantificação selecionada dois ou mais quadros para trás no tempo.

Nesta modalidade, foi descrito um caso a título de exemplo, no qual uma região é composta por um grupo de sub-banda de lado de banda baixa e um grupo de sub-banda de lado de banda alta, mas a presente invenção não está limitada a isto, e, por exemplo, um grupo de sub-banda 25 também pode ser regulado em uma banda média, e uma região pode ser composta por três ou mais grupos de sub-banda. O número de grupos de sub-banda compondo uma região também pode ser mudado de forma adaptativa, de acordo com a taxa de amostragem de sinal de entrada, a taxa de bit de codificação e as características espectrais de sinal decodificado de 30 primeira camada, ou as características espectrais de um sinal diferencial para um sinal de entrada e um sinal decodificado de primeira camada, ou similar. Nesta modalidade, foi descrito um caso a título de exemplo no qual um grupo de sub-banda de lado de banda alta compondo uma região é fixo por todos os quadros, mas a presente invenção não está limitada a isto, e um grupo de sub-banda de lado de banda baixa compondo uma região 5 também pode ser fixo por todos os quadros, ou ambos os grupos de subbanda de lado de banda alta e de lado de banda baixa podem ser buscados e selecionados em uma base quadro por quadro. Mais ainda, os vários métodos descritos acima podem ser aplicados a três ou mais grupos de subbanda dentre os grupos de sub-banda compondo uma região.

Nesta modalidade, foi descrito um caso a título de exemplo no

qual das sub-bandas compondo uma região o número de sub-bandas compondo um grupo de sub-banda de lado de banda alta é menor do que o número de sub-bandas compondo um grupo de sub-banda de lado de banda baixa (o número de sub-bandas de grupo de sub-banda de lado de banda alta sendo dois, e o número de sub-bandas de grupo de sub-banda de lado de banda baixa sendo três), mas a presente invenção não está limitada a isto, e o número de sub-bandas compondo um grupo de sub-banda de lado de banda alta também pode ser igual a ou menor do que o número de subbandas compondo um grupo de sub-banda de lado de banda baixa. O número de sub-bandas compondo cada grupo de sub-banda também pode ser mudado de forma adaptativa, de acordo com a taxa de amostragem de sinal de entrada, a taxa de bit de codificação, as características espectrais de sinal decodificado de primeira camada, as características espectrais de um sinal diferencial para um sinal de entrada e um sinal decodificado de primeira camada, ou similar.

Nesta modalidade, foi descrito um caso a título de exemplo no qual uma codificação usando um método de codificação de CELP é realizada pela seção de codificação de primeira camada 302, mas a presente invenção não está limitada a isto, e uma codificação usando um outro método 30 de codificação além de CELP (tal como uma codificação de transformada, por exemplo) também pode ser realizada.

(Modalidade 7) A figura 26 é um diagrama de blocos que mostra a configuração principal de aparelho de codificação de fala 1300 de acordo com a Modalidade 7 da presente invenção.

Nesta figura, o aparelho de codificação de fala 1300 é equipado 5 com a seção de amostragem para baixo 301, a seção de codificação de primeira camada 302, a seção de decodificação de primeira camada 303, a seção de amostragem para cima 304, a primeira seção de transformação de domínio de freqüência 305, a seção de atraso 306, a segunda seção de transformação de domínio de freqüência 307, a seção de codificação de se10 gunda camada 1308 e a seção de multiplexação 309, e tem uma configuração escalonável compreendendo duas camadas. Na primeira camada, um método de codificação de fala de CELP é aplicado, e na segunda camada o método de codificação de fala descrito na Modalidade 1 da presente invenção é aplicado.

Com exceção da seção de codificação de segunda camada

1308, os elementos de configuração no aparelho de codificação de fala 1300 mostrado na figura 26 são idênticos aos elementos de configuração no aparelho de codificação de fala 300 mostrado na figura 6 e, portanto, aos elementos de configuração idênticos são atribuídos os mesmos códigos de referência e as descrições dos mesmos são omitidas aqui.

A figura 27 é um diagrama de blocos que mostra a configuração principal do interior da seção de codificação de segunda camada 1308. A seção de codificação de segunda camada 1308 compreende principalmente a seção de cálculo de coeficiente de MDCT residual 381, a seção de seleção 25 de banda 102, a seção de quantificação de formato 103, a seção de decisão de execução/não execução de codificação preditiva 3804, a seção de quantificação de ganho 3805 e a seção de multiplexação 106. Com exceção da seção de decisão de execução/não execução de codificação preditiva 3804 e da seção de quantificação de ganho 3805, os elementos de configuração 30 na seção de codificação de segunda camada 1308 são idênticos aos elementos de configuração de seção de codificação de segunda camada 308 na figura 7 e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência e as descrições dos mesmos são omitidas aqui.

A seção de decisão de execução/não execução de codificação preditiva 3804 tem um buffer interno que armazena uma informação de banda m_max introduzida a partir da seção de seleção de banda 102 em um quadro passado. Aqui, um caso será descrito a título de exemplo no qual a seção de decisão de execução/não execução de codificação preditiva 3804 tem um buffer interno que armazena uma informação de banda m_max para os três quadros passados. A seção de decisão de execução/não execução de codificação preditiva 3804 detecta uma sub-banda comum a uma banda alvo de quantificação de quadro passado e uma banda alvo de quantificação de quadro atual usando a informação de banda m_max introduzida a partir da seção de seleção de banda 102 em um quadro passado e uma informação de banda m_max introduzida a partir da seção de seleção de banda 102 no quadro atual. Das L sub-bandas indicadas pela informação de banda m_max introduzida a partir da seção de seleção de banda 102, a seção de decisão de execução/não execução de codificação preditiva 3804 determina que uma codificação preditiva é para ser aplicada, e regula Pred_Flag(j) = ON, para uma sub-banda selecionada como um alvo de quantificação um quadro para trás no tempo. Por outro lado, das L sub-bandas indicadas pela informação de banda m_max introduzida a partir da seção de seleção de banda 102, a seção de decisão de execução/não execução de codificação preditiva 3804 determina que uma codificação preditiva não é para ser aplicada, e regula PredFIagG) = OFF, para uma sub-banda não selecionada como um alvo de quantificação um quadro para trás no tempo. Aqui, Pred_Flag é um indicador indicando um resultado de determinação de aplicação/não aplicação de codificação preditiva para cada sub-banda, com um valor ON significando que uma codificação preditiva é para ser aplicada a um valor de ganho de sub-banda, e um valor OFF significando que uma codificação preditiva não é para ser aplicada a um valor de ganho de subbanda. A seção de decisão de execução/não execução de codificação preditiva 3804 extrai um resultado de determinação para cada sub-banda para a seção de quantificação de ganho 3805. Então, a seção de decisão de execução/não execução de codificação preditiva 3804 atualiza o buffer interno que armazena a informação de banda usando a informação de banda mmax introduzida a partir da seção de seleção de banda 102 no quadro 5 atual.

A seção de quantificação de ganho 3805 tem um buffer interno que armazena um valor de ganho de quantificação obtido em um quadro passado. A seção de quantificação de ganho 3805 comuta entre a execução/a não execução de aplicação de codificação preditiva em uma quantifi10 cação de valor de ganho de quadro atual de acordo com um resultado de determinação introduzido a partir da seção de decisão de execução/não execução de codificação preditiva 3804. Por exemplo, se uma codificação preditiva for para ser realizada, a seção de quantificação de ganho 3805 buscará um livro de código de ganho interno composto pela quantidade GQ 15 de vetores de código de ganho para cada uma das L sub-bandas, realizará um cálculo de distância correspondente ao resultado de determinação introduzido a partir da seção de decisão de execução/não execução de codificação preditiva 3804, e encontrará um índice de um vetor de código para o qual o resultado da Equação (41) abaixo é um mínimo. Na Equação (41), um 20 ou outro cálculo de distância é realizado de acordo com Pred_Flag(j) para todos os j satisfazendo a j e Region(m_max), e um índice de valor de ganho é encontrado para o qual o valor total do erro é um mínimo.

2 |θα,η_,'0)-ν(α, -GCt I (,/(Pred j) ^Om

Qf(PredJiIagj)^QFP)) )

***44.-,, ...(Equação 41)

Nesta equação, GCV indica um vetor de código de ganho compondo um livro de código de ganho, i indica um índice de vetor de código de 25 ganho e k indica um índice de um elemento de vetor de código de ganho. Por exemplo, se o número de sub-bandas compondo uma região for 5 (L = 5), k terá um valor de 0 a 4. Aqui, C* indica um valor de ganho de t quadros antes no tempo, de modo que quando t = 1, por exemplo, C* indique um valor de ganho de um quadro antes no tempo. Também, α é um coeficiente de 30 predição linear de 4a ordem armazenado na seção de quantificação de ganho 3805. A seção de quantificação de ganho 3805 trata L sub-bandas em uma região como um vetor L-dimensional, e realiza uma quantificação de vetor.

tor de código de ganho G_min para o qual o resultado da Equação (41) acima é um mínimo para a seção de multiplexação 106 como uma informação codificada de ganho.

seção de multiplexação 106 como uma informação codificada de ganho. A 10 seção de quantificação de ganho 3805 também atualiza o buffer interno de acordo com a Equação (42) abaixo, usando a informação codificada de ganho G_min e o valor de ganho de quantificação C* obtido no quadro atual. Na Equação (42), um valor de C1j· é atualizado com um índice de elemento de vetor de código de ganho GCG-minj j e j’ satisfazendo a j’ e Regi15 on(m_max) respectivamente associados em ordem ascendente

principal de aparelho de decodificação de fala 1400 de acordo com esta modalidade.

do com a seção de controle 401, a seção de decodificação de primeira camada 402, a seção de amostragem para cima 403, a seção de transformação de domínio de freqüência 404, a seção de decodificação de segunda camada 1405, a seção de transformação de domínio de tempo 406 e o comutador 407.

Com exceção da seção de decodificação de segunda camada

1405, os elementos de configuração no aparelho de decodificação de fala 1400 mostrado na figura 28 são idênticos aos elementos de configuração do aparelho de decodificação de fala 400 mostrado na figura 8 e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de

A seção de quantificação de ganho 3805 extrai um índice de ve

A seção de quantificação de ganho 3805 extrai G_min para a

'fe Region(m_ηιαχγ J = 0,---,L-I ,

...(Equação 42)

A figura28 é um diagrama de blocos que mostra a configuração

Nesta figura, o aparelho de decodificação de fala 1400 é equipareferência e as descrições dos mesmos são omitidas aqui.

A figura 29 é um diagrama de blocos que mostra a configuração principal do interior da seção de decodificação de segunda camada 1405. A seção de decodificação de segunda camada 1405 principalmente compreende a seção de multiplexação 451, a seção de desquantificação de formato 202, a seção de decisão de execução/não execução de decodificação preditiva 4503, a seção de quantificação de ganho 4504, e a seção de cálculo de coeficiente de MDCT de adição 452. Com exceção da seção de decisão de execução/não execução de decodificação preditiva 4503 e a seção de quantificação de ganho 4504, os elementos de configuração na seção de decodificação de segunda camada 1405 mostrada na figura 29 são idênticos aos elementos de configuração da seção de decodificação de segunda camada 405 mostrada na figura 9, e, portanto, a elementos de configuração idênticos são atribuídos os mesmos códigos de referência e as descrições dos mes- 15 mos são omitidas aqui.

A seção de decisão de execução/não execução de decodificação preditiva 4503 tem um buffer interno que armazena uma informação de banda m_max introduzida a partir da seção de multiplexação 451 em um quadro passado. Aqui, será descrito um caso a título de exemplo no qual a 20 seção de decisão de execução/não execução de decodificação preditiva 4503 tem um buffer interno que armazena uma informação de banda m_max para os três quadros passados. A seção de decisão de execução/não execução de decodificação preditiva 4503 primeiramente detecta uma subbanda comum a uma banda alvo de quantificação de quadro passado e a 25 uma banda alvo de quantificação de quadro atual usando a informação de banda mmax introduzida a partir da seção de multiplexação 451 em um quadro passado e a informação de banda m_max introduzida a partir da seção de multiplexação 451 no quadro atual. Das L sub-bandas indicadas pela informação de banda mjnax introduzida a partir da seção de multiplexação 30 451, a seção de decisão de execução/não execução de decodificação preditiva 4503 determina que uma decodificação preditiva é para ser aplicada, e regula Pred_Flag(j) = ON, para uma sub-banda selecionada como um alvo de quantificação um quadro para trás no tempo. Por outro lado, das L subbandas indicadas pela informação de banda m_max introduzida a partir da seção de multiplexação 451, a seção de decisão de execução/não execução de decodificação preditiva 4503 determina que uma decodificação preditiva 5 não é para ser aplicada, e regula Pred_Flag(j) = OFF, para uma sub-banda não selecionada como um alvo de quantificação um quadro para trás no tempo. Aqui, Pred_Flag é um indicador indicando um resultado de determinação de aplicação/não aplicação de codificação preditiva para cada subbanda, com um valor ON significando que uma codificação preditiva é para 10 ser aplicada a um valor de ganho de sub-banda, e um valor OFF significando que uma codificação preditiva não é para ser aplicada a um valor de ganho de sub-banda. Em seguida, a seção de decisão de execução/não execução de decodificação preditiva 4503 extrai um resultado de determinação para cada sub-banda para a seção de quantificação de ganho 4504. Então, a se15 ção de decisão de execução/não execução de decodificação preditiva 4503 atualiza o buffer interno que armazena a informação de banda usando uma informação de banda m_max introduzida a partir da seção de multiplexação 451 no quadro atual.

A seção de quantificação de ganho 4504 tem um buffer interno que armazena um valor de ganho obtido em um quadro passado, e comuta entre a execução/a não execução da aplicação de uma decodificação preditiva em uma decodificação de valor de ganho de quadro atual de acordo com um resultado de determinação introduzido a partir da seção de decisão de execução/não execução de decodificação preditiva 4503. A seção de quantificação de ganho 4504 tem o mesmo tipo de livro de código de ganho interno que a seção de quantificação de ganho 105 de aparelho de codificação de fala 100, e quando realiza uma decodificação preditiva, por exemplo, obtém um valor de ganho Gain_q’ pela realização de uma desquantificação de ganho de acordo com a Equação (43) abaixo. Aqui, Cntj indica um valor de ganho de t quadros antes no tempo, de modo que quando t = 1, por exemplo, CMtj indique um valor de ganho de um quadro antes. Também, α é o coeficiente de predição linear de 4a na seção de quantificação de ganho 4504. A 10

15

20

seção de quantificação de ganho 4504 trata as L sub-bandas em uma região como um vetor L-dimensional e realiza uma desquantificação de vetor. Na Equação (43), um valor de Gain_q’(j’) é calculado com os índices de elemento de vetor de código de ganho GCG-mink k e j’ satisfazendo a j’ e Region(m_max) respectivamente associados em ordem ascendente.

Gain _ q' (/") =

(if (Pred _ Flag(j') == ON)) /=1

(if (Pred _ Flag(j') == OFF))

fe Region(m _ ηιαχ)Λ k = 0,■··, L-\

...(Equação 43)

GCr

Em seguida, a seção de quantificação de ganho 4504 calcula um coeficiente de MDCT decodificado de acordo com a Equação (44) abaixo, usando um valor de ganho obtido pela desquantificação de quadro atual e um valor de formato introduzido a partir da seção de desquantificação de formato 202, e atualiza o buffer interno de acordo com a Equação (45) abaixo. Na Equação (45), um valor C1j é atualizado com j de valor de ganho desquantificado Gain_q’(j) e j’ satisfazendo a j’ e Region(m_max) respectivamente associados em ordem ascendente. Aqui, um coeficiente de MDCT decodificado calculado é denotado por XV Também, em uma desquantificação de coeficiente de MDCT, se k estiver presente em B(j’) a B(j’+1)-1, o valor de ganho assumirá o valor de Gain_q’(j’).

, (k = B(f),---,B(f+L)- 1Λ X'\ = Gain_q'(j') ■ Shape_q' (k)

n2

Ill

/-<- / -MlI

C . = Gain_q'(j)

fe Region(m _max)

f G Region(m _ max)Λ (J = 0,··-,Z-I

...(Equação 44)

...(Equação 45)

A seção de quantificação de ganho 4504 extrai o coeficiente de MDCT decodificado X"k calculado de acordo com a Equação (44) acima da seção de cálculo de coeficiente de MDCT de adição 452.

Assim, de acordo com esta modalidade, no momento da quantificação de ganho de uma banda alvo de quantificação selecionada em cada quadro, se cada sub-banda incluída em uma banda alvo de quantificação foi ou não quantificada em um quadro passado é detectado. Então, a quantificação de vetor é realizada, com uma codificação preditiva sendo aplicada a uma sub-banda quantificada em um quadro passado, e com uma codificação preditiva não sendo aplicada a uma sub-banda não quantificada em um quadro passado. Por meio disto, uma codificação de parâmetro de domínio de 5 freqüência pode ser realizada mais eficientemente do que com um método por meio do qual uma comutação de aplicação/não aplicação de codificação preditiva é realizada para um vetor inteiro.

Nesta modalidade, foi descrito um método por meio do qual uma comutação é realizada entre uma aplicação e uma não aplicação de uma 10 codificação preditiva em uma seção de quantificação de ganho de acordo com o número de sub-bandas comuns a uma banda alvo de quantificação selecionada um quadro para trás no tempo, mas a presente invenção não está limitada a isto, e um número de sub-bandas comuns a uma banda alvo de quantificação selecionada no quadro atual e uma banda alvo de quantifi15 cação selecionada dois ou mais quadros para trás no tempo também pode ser usada. Neste caso, mesmo se o número de sub-banda comuns a uma banda alvo de quantificação selecionada no quadro atual e uma banda alvo de quantificação selecionada um quadro para trás no tempo é menor do que ou igual a um valor predeterminado, uma codificação preditiva pode ser apli20 cada em uma seção de quantificação de ganho de acordo com o número de sub-bandas comuns para uma banda alvo de quantificação selecionada no quadro atual e uma banda alvo de quantificação selecionada dois ou mais quadros para trás no tempo.

Também é possível que o método de quantificação descrito nes25 ta modalidade seja combinado com o método de seleção de banda alvo de quantificação descrito na Modalidade 6. Será descrito um caso no qual, por exemplo, uma região que é uma banda alvo de quantificação é composta por um grupo de sub-banda de lado de banda baixa e um grupo de sub-banda de lado de banda alta, o grupo de sub-banda de lado de banda alta é fixado 30 por todos os quadros, e um vetor no qual o ganho de grupo de sub-banda de lado de banda baixa e o grupo de sub-banda de lado de banda alta são tornados consecutivos é quantificado. Neste caso, em um valor de ganho de banda alvo de quantificação, uma quantificação é realizada com uma codificação preditiva sempre sendo aplicada para um elemento indicando o ganho de grupo de sub-banda de lado de banda alta, e uma codificação preditiva não sendo aplicada para um elemento indicando um ganho de grupo de sub5 banda de lado de banda baixa. Por meio disto, uma quantificação de valor de ganho pode ser realizada mais eficientemente do que quando uma comutação de aplicação/não aplicação de codificação preditiva é realizada para um vetor inteiro. Neste momento, em um grupo de sub-banda de lado de banda baixa, um método por meio do qual uma quantificação de vetor é rea10 Iizada com uma codificação preditiva sendo aplicada a uma sub-banda quantificada em um quadro passado, e com uma codificação preditiva não sendo aplicada a uma sub-banda não quantificada em um quadro passado também é eficiente. Também, para um elemento indicando um ganho de grupo de sub-banda de lado de banda baixa, uma quantificação é realizada pela co15 mutação entre uma aplicação e uma não aplicação de uma codificação preditiva usando sub-bandas compondo uma banda alvo de quantificação selecionada em um quadro passado no tempo, conforme descrito na Modalidade

1. Por meio disto, a quantificação de vetor de ganho pode ser realizada ainda mais eficientemente. Também é possível que a presente invenção seja aplicada a uma configuração que combine com as configurações descritas acima.

Isto conclui a descrição de modalidades da presente invenção.

Nas modalidades acima, foram descritos casos a título de exemplo nos quais o método de seleção de uma banda alvo de quantificação é 25 para selecionar a região com a energia mais alta em todas as bandas, mas a presente invenção não está limitada a isto, e uma certa banda também pode ser selecionada de forma preliminar de antemão, após o que uma banda alvo de quantificação é finalmente selecionada na banda selecionada preliminarmente. Nesse caso, uma banda selecionada preliminarmente pode ser 30 decidida de acordo com a taxa de amostragem de sinal de entrada, a taxa de bit de codificação ou similares. Por exemplo, um método é para a seleção de uma banda baixa preliminarmente quando a taxa de amostragem for baixa.

Nas modalidades acima, a MDCT é usada como um método de codificação de transformada e, portanto, "coeficiente de MDCT" usado nas modalidades acima essencialmente significa "espectro". Portanto, a expres5 são "coeficiente de MDCT" pode ser substituída por "espectro".

Nas modalidades acima, foram mostrados exemplos nos quais os aparelhos de decodificação de fala 200, 200a, 400, 600, 800, 1010, 1200, e 1400 recebem como entrada e processam dados codificados transmitidos a partir dos aparelhos de codificação de fala 100, 100a, 300, 500, 700, 1000, 10 1100, and 1300, respectivamente, mas dados codificados extraídos por um aparelho de codificação de uma configuração diferente capaz de gerarem dados codificados tendo uma configuração similar também podem ser introduzidos e processados.

Um aparelho de codificação, de aparelho de decodificação e um 15 método dos mesmos de acordo com a presente invenção não estão limitados às modalidades descritas acima, e várias variações e modificações podem ser possíveis sem que se desvie do escopo da presente invenção. Por exemplo, é possível que as modalidades sejam implementadas ao serem combinadas apropriadamente.

É possível que um aparelho de codificação e um aparelho de

decodificação de acordo com a presente invenção sejam instalados em um aparelho terminal de comunicação e um aparelho de estação base em um sistema de comunicação móvel, desse modo se permitindo que um aparelho terminal de comunicação, um aparelho de estação base e um sistema de 25 comunicação móvel que tenham o mesmo tipo de efeitos operacionais conforme descrito acima sejam providos.

Foi descrito aqui um caso a título de exemplo, no qual a presente invenção é configurada como um hardware, mas também é possível que a presente invenção seja implementada por software. Por exemplo, o mesmo 30 tipo de funções que aquelas de um aparelho de codificação e de um aparelho de decodificação de acordo com a presente invenção pode ser realizado ao se escrever um algoritmo de um método de codificação e de um método de decodificação de acordo com a presente invenção em uma linguagem de programação, armazenando-se este programa na memória e tendo-o executado por um meio de processamento de informação.

Os blocos de função usados nas descrições das modalidades acima tipicamente são implementados como LSIs, os quais são circuitos integrados. Estes podem ser implementados individualmente como chips únicos, ou um chip único pode incorporar alguns ou todos eles.

Aqui, o termo LSI foi usado, mas os termos IC, LSI de sistema, super-LSI, ultra-LSI e assim por diante também podem ser usados de acordo com as diferenças no grau de integração.

O método de implementação de um circuito integrado não está limitado a um LSI, e uma implementação por meio de um circuito dedicado ou de um processador de finalidade geral também podem ser usados. Um FPGA (Arranjo de Porta Programável de Campo) para o qual uma progra15 mação é possível após uma fabricação de LSI ou um processador reconfigurável permitindo uma reconfiguração de conexões de célula de circuito e regulagens em um LSI também pode ser usado.

No caso da introdução de uma tecnologia de implementação de circuito integrado por meio do que o LSI é substituído por uma tecnologia 20 diferente como um avanço em ou uma derivação de uma tecnologia de semicondutor, uma integração dos blocos de função obviamente pode ser realizada usando-se aquela tecnologia. A aplicação em biotecnologia ou similar também é uma possibilidade.

As exposições do Pedido de Patente Japonesa N0 2006-336270, 25 depositado em 13 de dezembro de 2006, do Pedido de Patente Japonesa N0 2007-053499, depositado em 2 de março de 2007, do Pedido de Patente Japonesa N0 2007-132078, depositado em 17 de maio de 2007, e do Pedido de Patente Japonesa N0 2007-185078, depositado em 13 de julho de 2007, incluindo os relatórios descritivos, os desenhos e os resumos, são incorpo30 radas aqui como referência em sua totalidade.

Aplicabilidade Industrial

Um aparelho de codificação e assim por diante de acordo com a presente invenção é adequado para uso em um aparelho terminal de comunicação, um aparelho de estação base ou similar, em um sistema de comunicação móvel.

Claims

1. Aparelho de codificação, que compreende: uma seção de transformação que transforma um sinal de entrada para um domínio de freqüência para a obtenção de um parâmetro de domínio de freqüência; uma seção de seleção, que seleciona uma banda alvo de quantificação a partir de dentre uma pluralidade de sub-bandas obtidas pela divisão do domínio de freqüência, e gera uma informação de banda indicando a banda alvo de quantificação; uma seção de quantificação de formato que quantifica um formato do parâmetro de domínio de freqüência na banda alvo de quantificação; e uma seção de quantificação de ganho que codifica um ganho de um parâmetro de domínio de freqüência na banda alvo de quantificação para a obtenção de uma informação codificada de ganho.

2. Aparelho de codificação, de acordo com a reivindicação 1, que ainda compreende uma seção de determinação que determina se uma codificação preditiva é ou não para ser realizada com base em um número de sub-bandas comuns para a banda alvo de quantificação e uma banda alvo de quantificação selecionada no passado, onde a seção de quantificação de ganho codifica um ganho do parâmetro de domínio de freqüência de acordo com um resultado de determinação da seção de determinação.

3. Aparelho de codificação, de acordo com a reivindicação 2, que ainda compreende uma seção de determinação que determina que uma codificação preditiva é para ser realizada, quando um número de subbandas comuns à banda alvo de quantificação e uma banda alvo de quantificação selecionada no passado é maior do que ou igual a um valor predeterminado, e determina que uma codificação preditiva não é para ser realizada, quando o número de sub-bandas comuns for menor do que o valor predeterminado, onde a seção de quantificação de ganho obtém uma informação codificada de ganho pela realização de uma codificação preditiva em um ganho de um parâmetro de domínio de freqüência na banda alvo de quantificação usando uma informação codificada de ganho passado quando a seção de determinação determinar que a codificação preditiva é para ser realizada, e obtém uma informação codificada de ganho pela quantificação direta do ganho de um parâmetro de domínio de freqüência na banda alvo de quantificação, quando a seção de determinação determinar que uma codificação preditiva não é para ser realizada.

4. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de quantificação de ganho obtém a informação codificada de ganho pela realização de uma quantificação de vetor de ganho do parâmetro de domínio de freqüência.

5. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de quantificação de ganho obtém a informação codificada de ganho pela realização de uma quantificação preditiva do ganho usando um ganho de parâmetro de domínio de freqüência em um quadro passado.

6. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de seleção seleciona uma região para a qual a energia é mais alta dentre as regiões compostas por uma pluralidade de sub-bandas como uma banda alvo de quantificação.

7. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de seleção, quando existirem bandas candidatas para as quais um número de sub-bandas comuns a uma banda alvo de quantificação selecionada no passado é maior do que ou igual a um valor predeterminado e a energia é maior do que ou igual a um valor predeterminado, seleciona uma banda para a qual a energia é mais alta dentre as bandas candidatas como a banda alvo de quantificação, e quando as bandas candidatas não existem, seleciona uma banda para a qual a energia é mais alta em todas as bandas do domínio de freqüência como a banda alvo de quantificação.

8. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de seleção seleciona uma banda mais próxima de uma banda alvo de quantificação selecionada no passado dentre as bandas para as quais a energia é maior do que ou igual a um valor predeterminado como a banda alvo de quantificação.

9. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de seleção seleciona a banda alvo de quantificação após uma multiplicação por um peso que é maior do que mais em direção a um lado de banda baixa uma sub-banda o é.

10. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de seleção seleciona uma sub-banda fixada de lado de banda baixa como a banda alvo de quantificação.

11. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de seleção seleciona a banda alvo de quantificação após a multiplicação por um peso que é maior do que quanto mais alta a freqüência de seleção no passado de uma sub-banda o é.

12. Aparelho de codificação, de acordo com a reivindicação 2, que ainda compreende uma seção de interpolação que realiza uma interpolação em um ganho de um parâmetro de domínio de freqüência em uma sub-banda não quantificada no passado dentre as sub-bandas indicadas pela informação de banda usando uma informação codificada de ganho passado, para a obtenção de um valor de interpolação, onde a seção de quantificação de ganho também usa o valor de interpolação, quando realizando a codificação preditiva.

13. Aparelho de codificação, de acordo com a reivindicação 2, que ainda compreende uma seção de decisão que decide um coeficiente de predição de modo que um peso de um valor de ganho de um quadro passado seja maior do que quanto maior uma sub-banda comum a uma banda alvo de quantificação de um quadro passado e uma banda alvo de quantificação de um quadro atual o for, onde a seção de quantificação de ganho usa o coeficiente de predição quando realiza a codificação preditiva.

14. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de seleção seleciona de forma fixa uma sub-banda predeterminada como parte da banda alvo de quantificação.

15. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de seleção seleciona a banda alvo de quantificação após uma multiplicação por um peso que é maior do que quanto mais em direção a um lado de banda alta uma sub-banda o for em parte da banda alvo de quantificação.

16. Aparelho de codificação, de acordo com a reivindicação 2, onde a seção de quantificação de ganho realiza uma codificação preditiva em um ganho de um parâmetro de domínio de freqüência em parte da banda alvo de quantificação, e realiza uma quantificação direta em um ganho de um parâmetro de domínio de freqüência em uma parte remanescente.

17. Aparelho de codificação, de acordo com a reivindicação 1, onde a seção de quantificação de ganho realiza uma quantificação de vetor do ganho de uma pluralidade não consecutiva de sub-bandas.

18. Aparelho de decodificação, que compreende: uma seção de recepção que recebe uma informação indicando uma banda alvo de quantificação selecionada a partir de dentre uma pluralidade de sub-bandas obtidas pela divisão de um domínio de freqüência de um sinal de entrada; uma seção de desquantificação de formato que decodifica a informação codificada de formato na qual um formato de um parâmetro de domínio de freqüência na banda alvo de quantificação é quantificada, para a geração de um formato decodificado; uma seção de desquantificação de ganho que decodifica uma informação codificada de ganho na qual o ganho de um parâmetro de domínio de freqüência na banda alvo de quantificação é quantificado, para a geração de um ganho decodificado, e decodifica um parâmetro de freqüência usando o formato decodificado e o ganho decodificado para a geração de um parâmetro de domínio de freqüência decodificado; e uma seção de transformação de domínio de tempo que transforma o parâmetro de domínio de freqüência decodificado para o domínio de tempo e obtém um sinal decodificado de domínio de tempo.

19. Aparelho de decodificação, de acordo com a reivindicação18, que ainda compreende uma seção de determinação que determina se uma decodificação preditiva é para ser realizada com base em um número de sub-bandas comuns para a banda alvo de quantificação e uma banda alvo de quantificação selecionada no passado, onde a seção de desquantificação de ganho decodifica a informação codificada de ganho de acordo com um resultado de determinação da seção de determinação para a geração do ganho decodificado.

20. Aparelho de decodificação, de acordo com a reivindicação 19, que ainda compreende uma determinação que determina que a decodificação preditiva é para ser realizada, quando um número de sub-bandas comuns à banda alvo de quantificação e uma banda alvo de quantificação selecionada no passado é maior do que ou igual a um valor predeterminado, e determina que uma decodificação não é para ser realizada quando o número de sub-bandas comuns é menor do que o valor predeterminado, onde a seção de desquantificação de ganho realiza uma decodificação preditiva de ganho de um parâmetro de domínio de freqüência na banda alvo de quantificação usando um ganho obtido na decodificação de ganho passado, quando a seção de determinação determina que uma decodificação preditiva é para ser realizada, e realiza uma desquantificação direta de informação codificada de ganho, na qual um ganho de um parâmetro de domínio de freqüência é quantificado na banda alvo de quantificação, quando a seção de determinação determina que uma decodificação preditiva não é para ser realizada.

21. Método de decodificação, que compreende: uma etapa de transformação de um sinal de entrada para um domínio de freqüência para a obtenção de um parâmetro de domínio de freqüência; uma etapa de seleção de uma banda alvo de quantificação a partir de dentre uma pluralidade de sub-bandas obtidas pela divisão do domínio de freqüência, e a geração de uma informação de banda indicando a banda alvo de quantificação; uma etapa de quantificação de um formato do parâmetro de domínio de freqüência na banda alvo de quantificação, para a obtenção de uma informação codificada de formato; e uma etapa de codificação de ganho de um parâmetro de domínio de freqüência na banda alvo de quantificação para a obtenção de uma informação codificada de ganho.

22. Método de decodificação, que compreende: uma etapa de recebimento de informação indicando uma banda alvo de quantificação selecionada a partir de dentre uma pluralidade de subbandas obtidas pela divisão de um domínio de freqüência do sinal de entrada; uma etapa de decodificação de informação codificada de formato, na qual o formato de um parâmetro de domínio de freqüência na banda alvo de quantificação é quantificado, para a geração de um formato decodificado; uma etapa de decodificação de informação codificada de ganho, na qual um ganho de um parâmetro de domínio de freqüência na banda alvò de quantificação é quantificado, para a geração de um ganho decodificado, e a decodificação de um parâmetro de domínio de freqüência usando o formato decodificado e o ganho decodificado para a geração de um parâmetro de domínio de freqüência decodificado; e uma etapa de transformação do parâmetro de domínio de freqüência decodificado para um domínio de tempo, para a obtenção de um sinal decodificado de domínio de tempo.