BR122012021663B1 - voice decoding devices and methods - Google Patents

voice decoding devices and methods Download PDF

Info

Publication number
BR122012021663B1
BR122012021663B1 BR122012021663-1A BR122012021663A BR122012021663B1 BR 122012021663 B1 BR122012021663 B1 BR 122012021663B1 BR 122012021663 A BR122012021663 A BR 122012021663A BR 122012021663 B1 BR122012021663 B1 BR 122012021663B1
Authority
BR
Brazil
Prior art keywords
unit
voice
high frequency
bit stream
frequency
Prior art date
Application number
BR122012021663-1A
Other languages
Portuguese (pt)
Other versions
BR122012021663A2 (en
Inventor
Kosuke Tsujino
Kei Kikuiri
Nobuhiko Naka
Original Assignee
Ntt Docomo, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2010004419A external-priority patent/JP4932917B2/en
Application filed by Ntt Docomo, Inc. filed Critical Ntt Docomo, Inc.
Publication of BR122012021663A2 publication Critical patent/BR122012021663A2/en
Publication of BR122012021663B1 publication Critical patent/BR122012021663B1/en

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

DISPOSITIVO DE CODIFICAÇÃO DE VOZ, DISPOSITIVO DE DECODIFICAÇÃO DE VOZ, MÉTODO DE CODIFICAÇÃO DE VOZ, MÉTODO DE DECODIFICAÇÃO DE VOZ, PROGRAMA DE CODIFICAÇÃO DE VOZ E PROGRAMA DE DECODIFICAÇÃO DE VOZ. Um coeficiente de previsão linear de um sinal representado em um domínio de frequência é representado realizando-se a análise de previsão linear in a direção de frequência com uso de um método de covariância ou um método de auto-correlação. Após a resistência de filtro do coeficiente de previsão linear obtido ser ajustada, a filtragem é realizada na direção de frequência do sinal com uso do coeficiente ajustado, assim o envelope temporal do sinal é transformado. Isto reduz a ocorrência de pré-eco e pós-eco e melhora a qualidade subjetiva do sinal decodificado, sem aumentar significantemente a taxa de bit em uma técnica de extensão de banda no domínio de frequência representado por SBR.VOICE ENCODING DEVICE, VOICE DECODING DEVICE, VOICE ENCODING METHOD, VOICE DECODING METHOD, VOICE ENCODING PROGRAM AND VOICE DECODING PROGRAM. A linear forecast coefficient of a signal represented in a frequency domain is represented by performing the linear forecast analysis in the frequency direction using a covariance method or a self-correlation method. After the filter resistance of the obtained linear prediction coefficient is adjusted, the filtering is carried out in the frequency direction of the signal using the adjusted coefficient, so the temporal envelope of the signal is transformed. This reduces the occurrence of pre-echo and post-echo and improves the subjective quality of the decoded signal, without significantly increasing the bit rate in a band extension technique in the frequency domain represented by SBR.

Description

Pedido dividido do PI1015049-8, depositado em 02.04.2010.Split order from PI1015049-8, filed on 02.04.2010.

Campo técnicoTechnical field

A presente invenção se refere a um dispositivo de codificação de voz, um dispositivo de decodificação de voz, um método de codificação de voz, um método de decodificação de voz, um programa de codificação de voz e um programa de decodificação de voz.The present invention relates to a speech coding device, a speech decoding device, a speech coding method, a speech decoding method, a speech coding program and a speech decoding program.

Técnica anteriorPrior art

As técnicas de codificação de áudio de voz para compactar a quantidade de dados de sinais em poucos décimos removendo as informações não necessárias para percepção humana com uso de psicologia auditiva são extremamente importantes na transmissão e armazenamento de sinais. Os exemplos de técnicas de codificação de áudio perceptuais amplamente usadas incluem "MPEG4 AAC" padronizado por "ISO/IEC MPEG".Voice audio coding techniques to compress the amount of signal data in a few tenths of time by removing information not necessary for human perception using auditory psychology are extremely important in the transmission and storage of signals. Examples of widely used perceptual audio coding techniques include "MPEG4 AAC" standardized by "ISO / IEC MPEG".

Uma técnica de extensão de banda para gerar componentes de alta frequência com uso de componentes de baixa frequência de voz tem sido amplamente usada recentemente para aumentar o desempenho da codificação de e obter uma alta qualidade em uma baixa taxa de bit. Os exemplos típicos da técnica de extensão de banda incluem a técnica SBR (Replicação de Banda Espectral) usada em "MPEG4 AAC". Na SBR, um componente de alta frequência é gerado convertendo-se um sinal em uma região espectral com uso de um banco de filtro QMF (Filtro em Espelho de Quadratura) e copiando-se os coeficientes espectrais da uma banda de baixa frequência para uma banda de alta frequência com relação ao sinal convertido, e o componente de alta frequência é ajustado ajustando-se o envelope espectral e a tonalidade dos coeficientes copiados. Devido ao fato de que um método de codificação de voz com uso da técnica de extensão de banda pode reproduzir os componentes de alta frequência de um sinal com uso somente de uma pequena quantidade de informações suplementares, este é efetivo na redução da taxa de bit da codificação de voz.A bandwidth technique for generating high frequency components using low frequency voice components has been widely used recently to increase the encoding performance and achieve high quality at a low bit rate. Typical examples of the bandwidth technique include the SBR (Spectral Band Replication) technique used in "MPEG4 AAC". In SBR, a high frequency component is generated by converting a signal into a spectral region using a QMF filter bank (Quadrature Mirror Filter) and copying the spectral coefficients of a low frequency band to a band high frequency with respect to the converted signal, and the high frequency component is adjusted by adjusting the spectral envelope and the tone of the copied coefficients. Due to the fact that a voice encoding method using the bandwidth technique can reproduce the high frequency components of a signal using only a small amount of supplementary information, it is effective in reducing the bit rate of the signal. voice coding.

Na técnica de extensão de banda no domínio de frequência representado pela SBR, a tonalidade e envelope espectral do coeficiente espectral representado no domínio de frequência são ajustados realizando-se novamente o ajuste, realizando-se a filtragem inversa de previsão linear em uma direção temporal, e sobrepondo-se o ruído no coeficiente espectral. Como resultado deste processo de ajuste, mediante a codificação de um sinal que tem uma grande variação no envelope temporal tal como um sinal de voz, aplausos ou castanholas, um ruído de reverberação chamado de um pré-eco ou um pós-eco pode ser percebido no sinal decodificado. Este problema é causado devido ao fato de que o envelope temporal do componente de alta frequência é transformado durante o processo de ajuste, e em muitos casos, o envelope temporal é mais suave depois do processo de ajuste do que antes do processo de ajuste. O envelope temporal do componente de alta frequência após o processo de ajuste não combina com o envelope temporal do componente de alta frequência de um sinal original antes de ser codificado, assim causando o pré-eco e o pós-eco.In the band extension technique in the frequency domain represented by the SBR, the tonality and spectral envelope of the spectral coefficient represented in the frequency domain are adjusted by performing the adjustment again, by performing the reverse filtering of linear forecast in a temporal direction, and overlapping the noise in the spectral coefficient. As a result of this adjustment process, by encoding a signal that has a wide variation in the temporal envelope such as a voice signal, applause or castanets, a reverberation noise called a pre-echo or a post-echo can be perceived in the decoded signal. This problem is caused due to the fact that the time envelope of the high frequency component is transformed during the adjustment process, and in many cases, the time envelope is smoother after the adjustment process than before the adjustment process. The time envelope of the high frequency component after the adjustment process does not match the time envelope of the high frequency component of an original signal before being encoded, thus causing pre-echo and post-echo.

Um problema similar àquele do pré-eco e pós-eco também ocorre na codificação de áudio de múltiplos canais com uso de um processo paramétrico representado pelo "MPEG Surround" e um estéreo paramétrico. Um decodificador usado na codificação de áudio de múltiplos canais inclui um meio para realizar a decorrelação em um sinal decodificado com uso de um filtro de reverberação. No entanto, o envelope temporal do sinal é transformado durante a decorrelação, assim causando degradação de um sinal de reprodução similar àquele do pré-eco e pós-eco. As soluções para o problema incluem uma técnica de TES (Formatação de Envelope Temporal) (Literatura de Patente 1). Na técnica de TES, uma análise de previsão linear é realizada em uma direção de frequência em um sinal representado em um domínio de QMF em que a decorrelação não foi ainda realizada para se obter um coeficiente de previsão linear, e, com uso do coeficiente de previsão linear, a filtragem de síntese de previsão linear é realizada na direção de frequência no sinal em que a decorrelação foi realizada. Este processo permite que a técnica de TES extraia o envelope temporal de um sinal em que a decorrelação ainda não foi realizada, e em concordância com o envelope temporal extraído, ajustar o envelope temporal do sinal em que a decorrelação foi realizada. Devido ao fato de que o sinal em que a decorrelação não foi ainda realizada tem um envelope temporal menos distorcido, o envelope temporal do sinal em que a decorrelação foi realizada é ajustado para um formato menos distorcido, assim obtendo-se um sinal de reprodução em que o pré-eco e o pós-eco são melhorados.A problem similar to that of the pre-echo and post-echo also occurs in the encoding of audio of multiple channels using a parametric process represented by "MPEG Surround" and a parametric stereo. A decoder used in multi-channel audio encoding includes a means to carry out rippling on a decoded signal using a reverb filter. However, the temporal envelope of the signal is transformed during the delay, thus causing degradation of a reproduction signal similar to that of the pre-echo and post-echo. Solutions to the problem include a TES (Temporal Envelope Formatting) technique (Patent Literature 1). In the TES technique, a linear forecast analysis is performed in a frequency direction on a signal represented in a QMF domain in which the correlation has not yet been performed to obtain a linear forecast coefficient, and, using the coefficient of linear forecasting, linear forecasting synthesis filtering is performed in the direction of frequency in the signal in which the correlation was performed. This process allows the TES technique to extract the temporal envelope of a signal in which the delay has not yet been performed, and in accordance with the extracted temporal envelope, adjust the temporal envelope of the signal in which the delay was performed. Due to the fact that the signal in which the delay was not yet performed has a less distorted time envelope, the temporal envelope of the signal in which the delay was performed is adjusted to a less distorted format, thus obtaining a reproduction signal in that pre-echo and post-echo are improved.

Lista de CitaçãoCitation List Literatura de PatentePatent Literature

Literatura de Patente 1: Publicação de Pedido de Patente dos Estados Unidos N° 2006/0239473Patent Literature 1: United States Patent Application Publication No. 2006/0239473

Sumário da InvençãoSummary of the Invention Problema TécnicoTechnical problem

A técnica de TES descrita acima é uma técnica que utiliza o fato de que um sinal em que a decorrelação não foi realizada ainda tem um envelope temporal menos distorcido. No entanto, em um decodificador de SBR, o componente de alta frequência de um sinal é copiado do componente de baixa frequência do sinal. Da mesma forma, não é possível se obter um envelope temporal menos distorcido com relação ao componente de alta frequência. Uma das soluções para este problema é um método para analisar o componente de alta frequência de um sinal de entrada em um codificado de SBR, quantizer o coeficiente de previsão linear obtido como resultado da análise, e multiplexá-los em um fluxo de bit a ser transmitido. Este método permite que o decodificador de SBR para se obter um coeficiente de previsão linear que inclui informações com envelope temporal menos distorcido do componente de alta frequência. No entanto, neste caso, uma grande quantidade de informações é necessária para transmitir o coeficiente de previsão linear quantizado, assim aumentando significantemente a taxa de bit de todo o fluxo de bit codificado. Assim, a presente invenção pretende reduzir a ocorrência de pré-eco e pós-eco e melhorar a qualidade subjetiva do sinal decodificado, sem aumentar significantemente a taxa de bit na técnica de extensão de banda no domínio de frequência representado pela SBR.The TES technique described above is a technique that uses the fact that a signal in which the delay has not been performed still has a less distorted time envelope. However, in an SBR decoder, the high frequency component of a signal is copied from the low frequency component of the signal. Likewise, it is not possible to obtain a less distorted time envelope with respect to the high frequency component. One of the solutions to this problem is a method to analyze the high frequency component of an input signal in an SBR encoded, quantize the linear prediction coefficient obtained as a result of the analysis, and multiplex them in a bit stream to be transmitted. This method allows the SBR decoder to obtain a linear prediction coefficient that includes information with a less distorted time envelope of the high frequency component. However, in this case, a large amount of information is required to transmit the quantized linear prediction coefficient, thereby significantly increasing the bit rate of the entire encoded bit stream. Thus, the present invention aims to reduce the occurrence of pre-echo and post-echo and to improve the subjective quality of the decoded signal, without significantly increasing the bit rate in the band extension technique in the frequency domain represented by the SBR.

Solução do ProblemaSolution of the problem

Um dispositivo de codificação de voz da presente invenção é um dispositivo de codificação de voz para codificar um sinal de voz e inclui: meio de codificação central para codificar um componente de baixa frequência do sinal de voz; meio de cálculo de informações suplementares de envelope temporal para calcular as informações suplementares de envelope temporal para se obter uma aproximação de um envelope temporal de um componente de alta frequência do sinal de voz com uso de um envelope temporal do componente de baixa frequência do sinal de voz; e meio de multiplexação de fluxo de bit para gerar um fluxo de bit em que ao menos o componente de baixa frequência codificado pelo meio de codificação central e as informações suplementares de envelope temporal calculadas pelo meio de cálculo de informações suplementares de envelope temporal são multiplexados.A speech encoding device of the present invention is a speech encoding device for encoding a speech signal and includes: central encoding means for encoding a low frequency component of the speech signal; means of calculating supplementary temporal envelope information to calculate supplementary temporal envelope information to obtain an approximation of a temporal envelope of a high frequency component of the speech signal using a temporal envelope of the low frequency component of the voice signal voice; and bit stream multiplexing means to generate a bit stream in which at least the low frequency component encoded by the central encoding means and the supplemental temporal envelope information calculated by the supplementary temporal envelope information means are multiplexed.

No dispositivo de codificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente representam um parâmetro que indica uma sutileza de variação no envelope temporal do componente de alta frequência do sinal de voz em uma seção de análise predeterminada.In the speech encoding device of the present invention, the supplementary time envelope information preferably represents a parameter that indicates a subtlety of variation in the time envelope of the high frequency component of the voice signal in a predetermined analysis section.

É preferível que o dispositivo de codificação de voz da presente invenção ainda inclua um meio de conversão de frequência para converter o sinal de voz em um domínio de frequência, e o meio de cálculo de informações suplementares de envelope temporal calcule as informações suplementares de envelope temporal com base em um coeficiente de previsão linear de alta frequência obtido realizando-se a análise de previsão linear em uma direção de frequência em um coeficiente de lado de frequência do sinal de voz convertido no domínio de frequência pelo meio de conversão de frequência.It is preferable that the speech encoding device of the present invention further includes a frequency conversion means for converting the voice signal into a frequency domain, and the means for calculating supplemental time envelope information calculates supplemental time envelope information based on a high frequency linear prediction coefficient obtained by performing the linear prediction analysis in a frequency direction on a frequency side coefficient of the voice signal converted in the frequency domain by means of frequency conversion.

No dispositivo de codificação de voz da presente invenção, o meio de cálculo de informações suplementares de envelope temporal preferencialmente realiza a análise de previsão linear em uma direção de frequência em um coeficiente de lado de baixa frequência do sinal de voz convertido no domínio de frequência pelo meio de conversão de frequência para se obter um coeficiente de previsão linear de baixa frequência, e calcula as informações suplementares de envelope temporal com base no coeficiente de previsão linear de baixa frequência e no coeficiente de previsão linear de alta frequência.In the speech encoding device of the present invention, the means of calculating supplementary time envelope information preferably performs linear forecast analysis in a frequency direction on a low frequency side coefficient of the voice signal converted into the frequency domain by frequency conversion means to obtain a low frequency linear forecast coefficient, and calculates the supplementary time envelope information based on the low frequency linear forecast coefficient and the high frequency linear forecast coefficient.

No dispositivo de codificação de voz da presente invenção, o meio de cálculo de informações suplementares de envelope temporal preferencialmente obtém um ganho de previsão a partir de cada um dos coeficientes de previsão linear de baixa frequência e dos coeficientes de previsão linear de alta frequência, e calcula as informações suplementares de envelope temporal com base nas magnitudes dos dois ganhos de previsão.In the speech coding device of the present invention, the means of calculating supplementary time envelope information preferably obtains a forecast gain from each of the low frequency linear forecast coefficients and the high frequency linear forecast coefficients, and calculates the supplementary time envelope information based on the magnitudes of the two forecast gains.

No dispositivo de codificação de voz da presente invenção, o meio de cálculo de informações suplementares de envelope temporal preferencialmente separa o componente de alta frequência do sinal de voz, obtém as informações de envelope temporal representadas em um domínio de tempo do componente de alta frequência, e calcula as informações suplementares de envelope temporal com base na magnitude da variação temporal das informações de envelope temporal.In the speech coding device of the present invention, the means for calculating supplementary time envelope information preferably separates the high frequency component from the speech signal, obtains the time envelope information represented in a time domain from the high frequency component, and calculates the supplementary time envelope information based on the magnitude of the time variation of the time envelope information.

No dispositivo de codificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente incluem informações diferenciais para obter um coeficiente de previsão linear de alta frequência com uso de um coeficiente de previsão linear de baixa frequência obtido realizando-se a análise de previsão linear em uma direção de frequência no componente de baixa frequência do sinal de voz.In the speech encoding device of the present invention, the supplementary time envelope information preferably includes differential information to obtain a high frequency linear prediction coefficient using a low frequency linear prediction coefficient obtained by performing the linear prediction analysis. in a frequency direction in the low frequency component of the voice signal.

É preferível que o dispositivo de codificação de voz da presente invenção ainda inclua um meio de conversão de frequência para converter o sinal de voz em um domínio de frequência, e o meio de cálculo de informações suplementares de envelope temporal realize análise de previsão linear em uma direção de frequência em cada um dentre o componente de baixa frequência e o componente de alta frequência do sinal de voz convertido no domínio de frequência pelo meio de conversão de frequência para obter um coeficiente de previsão linear de baixa frequência e um coeficiente de previsão linear de alta frequência, e obter as informações diferenciais obtendo-se uma diferença entre o coeficiente de previsão linear de baixa frequência e o coeficiente de previsão linear de alta frequência.It is preferable that the speech encoding device of the present invention further includes a frequency conversion means for converting the voice signal into a frequency domain, and the means of calculating supplementary time envelope information performs linear forecast analysis on a frequency direction in each of the low frequency component and the high frequency component of the voice signal converted into the frequency domain by the frequency conversion medium to obtain a low frequency linear prediction coefficient and a linear prediction coefficient of high frequency, and obtain the differential information obtaining a difference between the low frequency linear forecast coefficient and the high frequency linear forecast coefficient.

No dispositivo de codificação de voz da presente invenção, as informações diferenciais preferencialmente representam uma diferença entre coeficientes de previsão linear em ao menos qualquer domínio dentre LSP (Par de Espectros Lineares), ISP (Par de Espectros de Imitância), LSF (Frequência de Espectro Linear), ISF (Frequência de Espectro de Imitância) e coeficiente PARCOR.In the speech coding device of the present invention, differential information preferably represents a difference between linear prediction coefficients in at least any domain within LSP (Linear Spectrum Pair), ISP (Imitance Spectrum Pair), LSF (Spectrum Frequency) Linear), ISF (Immitance Spectrum Frequency) and PARCOR coefficient.

Um dispositivo de codificação de voz da presente invenção é um dispositivo de codificação de voz para codificar um sinal de voz e inclui: meio de codificação central para codificar um componente de baixa frequência do sinal de voz; meio de conversão de frequência para converter o sinal de voz em um domínio de frequência; meio de análise de previsão linear para realizar análise de previsão linear em uma direção de frequência em um coeficiente de lado de alta frequência do sinal de voz convertido no domínio de frequência pelo meio de conversão de frequência para obter um coeficiente de previsão linear de alta frequência; meio de decimação de coeficiente de previsão para decimar o coeficiente de previsão linear de alta frequência obtido pelo meio análise de previsão linear em uma direção temporal; meio de quantização de coeficiente de previsão para quantizer o coeficiente de previsão linear de alta frequência decimado pelo meio de decimação de coeficiente de previsão; e meio de multiplexação de fluxo de bit para gerar um fluxo de bit em que ao menos o componente de baixa frequência codificado pelo meio de codificação central e o coeficiente de previsão linear de alta frequência quantizado pelo meio de quantização de coeficiente de previsão são multiplexados.A speech encoding device of the present invention is a speech encoding device for encoding a speech signal and includes: central encoding means for encoding a low frequency component of the speech signal; frequency conversion means for converting the voice signal into a frequency domain; linear forecast analysis means to perform linear forecast analysis in a frequency direction on a high frequency side coefficient of the voice signal converted in the frequency domain by the frequency conversion means to obtain a high frequency linear forecast coefficient ; means of decimating the forecast coefficient to decimate the high frequency linear forecast coefficient obtained by means of linear forecast analysis in a temporal direction; prediction coefficient quantization means to quantify the high frequency linear prediction coefficient decimated by the prediction coefficient decimation means; and bit stream multiplexing means to generate a bit stream in which at least the low frequency component encoded by the central coding means and the linear high frequency prediction coefficient quantized by the prediction coefficient quantization means are multiplexed.

Um dispositivo de decodificação de voz da presente invenção é um dispositivo de decodificação de voz para decodificar um sinal de voz codificado e inclui: meio de separação de fluxo de bit para separar um fluxo de bit recebido de fora do dispositivo de decodificação de voz que inclui o sinal .tai J de voz codificado em um fluxo de bit codificado e informações suplementares de envelope temporal; meio de decodificação central para decodificar o fluxo de bit codificado separado pelo meio de separação de fluxo de bit para obter um componente de baixa frequência; meio de conversão de frequência para converter o componente de baixa frequência obtido pelo meio de decodificação central para um domínio de frequência; meio de geração de alta frequência para gerar um componente de alta frequência copiando o componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência de uma banda de baixa frequência em uma banda de alta frequência; meio de análise de envelope temporal de baixa frequência para analisar o componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter as informações de envelope temporal; meio de ajuste de envelope temporal para ajustar as informações de envelope temporal obtidas pelo meio de análise de envelope temporal de baixa frequência com uso das informações suplementares de envelope temporal, e meio de transformação de envelope temporal para transformar um envelope temporal do componente de alta frequência gerado pelo meio de geração de alta frequência com uso das informações de envelope temporal ajustadas pelo meio de ajuste de envelope temporal.A speech decoding device of the present invention is a speech decoding device for decoding a coded speech signal and includes: bit stream separation means for separating a bit stream received from outside the speech decoding device that includes the voice signal .tai J encoded in an encoded bit stream and supplemental time envelope information; central decoding means for decoding the encoded bit stream separated by the bit stream separation means to obtain a low frequency component; frequency conversion means for converting the low frequency component obtained by the central decoding means to a frequency domain; high frequency generation means for generating a high frequency component by copying the low frequency component converted into the frequency domain by the frequency conversion means from a low frequency band to a high frequency band; low frequency time envelope analysis means to analyze the low frequency component converted in the frequency domain by the frequency conversion means to obtain the time envelope information; temporal envelope adjustment means to adjust the temporal envelope information obtained by means of low frequency temporal envelope analysis using supplementary temporal envelope information, and temporal envelope transformation medium to transform a high frequency component temporal envelope generated by means of high frequency generation using time envelope information adjusted by means of time envelope adjustment.

É preferível que o dispositivo de decodificação de voz da presente invenção ainda inclua meio de ajuste de alta frequência para ajustar o componente de alta frequência, e o meio de conversão de frequência pode ser um banco de filtro QMF de 64 divisões com um coeficiente real ou complexo, e o meio de conversão de frequência, o meio de geração de alta frequência e o meio de ajuste de alta frequência operam com base em um decodificador de Replicação de Banda Espectral (SBR) para o "MPEG4 AAC" definido em "ISO/IEC 14496-3".It is preferable that the voice decoding device of the present invention still includes high frequency adjustment means to adjust the high frequency component, and the frequency conversion means can be a 64-room QMF filter bank with an actual coefficient or complex, and the frequency conversion medium, the high frequency generation medium and the high frequency adjustment medium operate based on a Spectral Band Replication (SBR) decoder for the "MPEG4 AAC" defined in "ISO / IEC 14496-3 ".

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência realize a análise de previsão linear em uma direção de frequência no componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter um coeficiente de previsão linear de baixa frequência, o meio de ajuste de envelope temporal pode ajustar o coeficiente de previsão linear de baixa frequência com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal pode realizar filtragem de previsão linear em uma direção de frequência no componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência, com uso de um coeficiente de previsão linear ajustado pelo meio de ajuste de envelope temporal, para transformar um envelope temporal de um sinal de voz.In the speech decoding device of the present invention, it is preferable for the low frequency time envelope analysis medium to perform linear forecast analysis in a frequency direction on the low frequency component converted into the frequency domain by the frequency conversion medium. to obtain a low frequency linear forecast coefficient, the temporal envelope adjustment medium can adjust the low frequency linear forecast coefficient using supplemental temporal envelope information, and the temporal envelope transformation medium can perform forecast filtering. linear in a frequency direction in the high frequency component in the frequency domain generated by the high frequency generation medium, using a linear forecast coefficient adjusted by the temporal envelope adjustment means, to transform a temporal envelope from a voice.

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência obtenha as informações de envelope temporal de um sinal de voz obtendo força de cada abertura de tempo do componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência, o meio de ajuste de envelope temporal ajuste as informações de envelope temporal com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal sobreponha as informações de envelope temporal ajustadas no componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência para transformar um envelope temporal de um componente de alta frequência.In the speech decoding device of the present invention, it is preferable that the low frequency time envelope analysis medium obtains the time envelope information of a voice signal by obtaining strength from each time opening of the low frequency component converted into the voice domain. frequency by means of frequency conversion, the temporal envelope adjustment medium adjusts the temporal envelope information using the supplementary temporal envelope information, and the temporal envelope transformation medium superimposes the temporal envelope information adjusted on the high frequency component. in the frequency domain generated by the high frequency generation means to transform a time envelope of a high frequency component.

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência obtenha informações de envelope temporal de um sinal de voz obtendo força de cada amostra de sub-banda QMF do componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência, o meio de ajuste de envelope temporal ajuste as informações de envelope temporal com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal transforme um envelope temporal de um componente de alta frequência multiplicando as informações de envelope temporal ajustadas pelo componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência.In the speech decoding device of the present invention, it is preferable that the low frequency time envelope analysis medium obtains time envelope information from a voice signal by obtaining strength from each QMF subband sample of the low frequency component converted into the frequency domain by means of frequency conversion, the temporal envelope adjustment medium adjusts the temporal envelope information using supplemental temporal envelope information, and the temporal envelope transformation medium transforms a temporal envelope into a high frequency component multiplying the time envelope information adjusted by the high frequency component in the frequency domain generated by the high frequency generation medium.

No dispositivo de decodificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente representam um parâmetro de resistência de filtro a usado para ajustar a resistência de um coeficiente de previsão linear.In the speech decoding device of the present invention, the supplemental time envelope information preferably represents a filter resistance parameter a used to adjust the resistance of a linear prediction coefficient.

No dispositivo de decodificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente representam um parâmetro que indica a magnitude da variação temporal das informações de envelope temporal.In the speech decoding device of the present invention, the supplementary time envelope information preferably represents a parameter that indicates the magnitude of the time variation of the time envelope information.

No dispositivo de decodificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente includes informações diferenciais de um coeficiente de previsão linear com relação ao coeficiente de previsão linear de baixa frequência.In the speech decoding device of the present invention, the supplementary time envelope information preferably includes differential information of a linear prediction coefficient with respect to the low frequency linear prediction coefficient.

No dispositivo de decodificação de voz da presente invenção, as informações diferenciais preferencialmente representam uma diferença entre os coeficientes de previsão linear em ao menos qualquer domínio dentre LSP (Par de Espectros Lineares), ISP (Par de Espectros de Imitância), LSF (Frequência de Espectro Linear), ISF (Frequência de Espectro de Imitância), e coeficiente PARCOR.In the speech decoding device of the present invention, the differential information preferably represents a difference between the linear prediction coefficients in at least any domain within LSP (Linear Spectrum Pair), ISP (Imitance Spectrum Pair), LSF (Frequency of Linear Spectrum), ISF (Immitance Spectrum Frequency), and PARCOR coefficient.

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência realize a análise de previsão linear em uma direção de frequência no componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter o coeficiente de previsão linear de baixa frequência, e obter força de cada abertura de tempo do componente de baixa frequência no domínio de frequência para obter as informações de envelope temporal de um sinal de voz, o meio de ajuste de envelope temporal ajuste o coeficiente de previsão linear de baixa frequência com uso das informações suplementares de envelope temporal e ajuste as informações de envelope temporal com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal realize a filtragem de previsão linear em uma direção de frequência no componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência com uso do coeficiente de previsão linear ajustado pelo meio de ajuste de envelope temporal para transformar um envelope temporal de um sinal de voz, e transforme um envelope temporal do componente de alta frequência sobrepondo as informações de envelope temporal ajustadas pelo meio de ajuste de envelope temporal no componente de alta frequência no domínio de frequência.In the speech decoding device of the present invention, it is preferable for the low frequency time envelope analysis medium to perform linear forecast analysis in a frequency direction on the low frequency component converted into the frequency domain by the frequency conversion medium. to obtain the low frequency linear prediction coefficient, and obtain strength of each time opening of the low frequency component in the frequency domain to obtain the time envelope information of a voice signal, the time envelope adjustment means adjust the low frequency linear forecast coefficient using supplemental temporal envelope information and adjust temporal envelope information using supplementary temporal envelope information, and the temporal envelope transformation medium performs linear forecast filtering in a frequency direction in the high frequency component in the frequency domain generated by the means of generates high frequency definition using the linear forecast coefficient adjusted by means of temporal envelope adjustment to transform a temporal envelope from a voice signal, and transform a temporal envelope of the high frequency component by overlapping the temporal envelope information adjusted by means of temporal envelope adjustment in the high frequency component in the frequency domain.

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência realize a análise de previsão linear em uma direção de frequência no componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter o coeficiente de previsão linear de baixa frequência, e obtenha informações de envelope temporal de um sinal de voz obtendo força de cada amostra de sub-banda QMF do componente de baixa frequência no domínio de frequência, o meio de ajuste de envelope temporal ajuste o coeficiente de previsão linear de baixa frequência com uso das informações suplementares de envelope temporal e ajuste as informações de envelope temporal com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal realize ? filtragem de previsão linear em uma direção de frequência em um componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência com uso de um coeficiente de previsão linear ajustado pelo meio de ajuste de envelope temporal para transformar um envelope temporal de um sinal de voz, e transforme um envelope temporal do componente de alta frequência multiplicando as informações de envelope temporal ajustadas pelo meio de ajuste de envelope temporal pelo componente de alta frequência no domínio de frequência.In the speech decoding device of the present invention, it is preferable for the low frequency time envelope analysis medium to perform linear forecast analysis in a frequency direction on the low frequency component converted into the frequency domain by the frequency conversion medium. to obtain the low frequency linear prediction coefficient, and obtain temporal envelope information from a voice signal by obtaining strength from each QMF subband sample of the low frequency component in the frequency domain, the means of adjusting temporal envelope adjustment the low frequency linear forecast coefficient using supplementary temporal envelope information and adjusting temporal envelope information using supplementary temporal envelope information, and the means of temporal envelope transformation perform? linear forecast filtering in a frequency direction on a high frequency component in the frequency domain generated by the high frequency generation medium using a linear forecast coefficient adjusted by the temporal envelope adjustment means to transform a temporal envelope from one voice signal, and transform a time envelope of the high frequency component by multiplying the time envelope information adjusted by the time envelope adjustment means by the high frequency component in the frequency domain.

No dispositivo de decodificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente representam um parâmetro que indica tanto uma resistência de filtro de um coeficiente de previsão linear como uma magnitude de variação temporal das informações de envelope temporal.In the speech decoding device of the present invention, the supplementary time envelope information preferably represents a parameter that indicates both a filter resistance of a linear prediction coefficient and a time variation magnitude of the time envelope information.

Um dispositivo de decodificação de voz da presente invenção é um dispositivo de decodificação de voz para decodificar um sinal de voz codificado e inclui: meio de separação de fluxo de bit para separar um fluxo de bit recebido de fora do dispositivo de decodificação de voz que inclui o sinal de voz codificado em um fluxo de bit codificado e um coeficiente de previsão linear, coeficiente de previsão linear meio de interpolação/extrapolação para interpolar ou extrapolar o coeficiente de previsão linear em uma direção temporal, e meio de transformação de envelope temporal para realizar a filtragem de previsão linear em uma direção de frequência em um componente de alta frequência representado em um domínio de frequência com uso de um coeficiente de previsão linear interpolado ou extrapolado pelo meio de interpolação/extrapolação de coeficiente de previsão linear para transformar um envelope temporal de um sinal de voz.A speech decoding device of the present invention is a speech decoding device for decoding an encoded speech signal and includes: bit stream separation means for separating a bit stream received from outside the voice decoding device that includes the speech signal encoded in an encoded bit stream and a linear forecast coefficient, linear forecast coefficient means of interpolation / extrapolation to interpolate or extrapolate the linear forecast coefficient in a temporal direction, and means of temporal envelope transformation to perform filtering linear forecast in a frequency direction on a high frequency component represented in a frequency domain using a linear forecast coefficient interpolated or extrapolated by means of interpolation / extrapolation of linear forecast coefficient to transform a temporal envelope of a voice signal.

Um método de codificação de voz da presente invenção é um método de codificação de voz que usa um dispositivo de codificação de voz para codificar um sinal de voz e inclui: uma etapa de codificação central em que o dispositivo de codificação de voz codificada um componente de baixa frequência do sinal de voz; uma etapa de conversão de frequência em que o dispositivo de codificação de voz converte o sinal de voz em um domínio de frequência; uma etapa de análise de previsão linear em que o dispositivo de codificação de voz obtém coeficientes de previsão linear de alta frequência realizando a análise de previsão linear em uma direção de frequência em coeficientes de lado de alta frequência do sinal de voz convertido no domínio de frequência na etapa de conversão de frequência; uma etapa de decimação de coeficiente de previsão em que o dispositivo de codificação de voz decima o coeficiente de previsão linear de alta frequência obtido na etapa de análise de previsão linear em uma direção temporal; uma etapa de quantização de coeficiente de previsão em que o dispositivo de codificação de voz quantiza os coeficientes de previsão linear de alta frequência decimado na etapa de decimação de coeficiente de previsão; e uma etapa de multiplexação de fluxo de bit em que o dispositivo de codificação de voz gera um fluxo de bit em que ao menos o componente de baixa frequência codificado na etapa de codificação central e os coeficientes de previsão linear de alta frequência quantizados na etapa de quantização de coeficiente de previsão são multiplexados.A speech encoding method of the present invention is a speech encoding method that uses a speech encoding device to encode a speech signal and includes: a central encoding step in which the encoded speech encoding device is a component of speech. low frequency of the voice signal; a frequency conversion step in which the speech coding device converts the speech signal into a frequency domain; a linear prediction analysis step in which the voice coding device obtains high frequency linear prediction coefficients by performing linear prediction analysis in a frequency direction on high frequency side coefficients of the converted voice signal in the frequency domain in the frequency conversion step; a prediction coefficient decimation step in which the voice coding device decides the high frequency linear prediction coefficient obtained in the linear prediction analysis step in a temporal direction; a prediction coefficient quantization step in which the voice coding device quantizes the high frequency linear prediction coefficients decimated in the prediction coefficient decimation step; and a bit stream multiplexing step in which the speech coding device generates a bit stream in which at least the low frequency component encoded in the central coding step and the high frequency linear prediction coefficients quantized in the quantization of forecast coefficient are multiplexed.

Um dispositivo de decodificação de voz da presente invenção é um dispositivo de decodificação de voz para decodificar um sinal de voz codificado e inclui: meio de separação de fluxo de bit para separar um fluxo de bit recebido de fora do dispositivo de decodificação de voz que inclui o sinal de voz codificado em um fluxo de bit codificado e informações suplementares de envelope temporal; meio de decodificação central para decodificar o fluxo de bit codificado separado pelo meio de separação de fluxo de bit para obter um componente de baixa frequência; meio de conversão de frequência para converter o componente de baixa frequência obtido pelo meio de decodificação central para um domínio de frequência; meio de geração de alta frequência para gerar um componente de alta frequência copiando o componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência de uma banda de baixa frequência em uma banda de alta frequência; meio de análise de envelope temporal de baixa frequência para analisar o componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter as informações de envelope temporal; meio de ajuste de envelope temporal para ajustar as informações de envelope temporal obtidas pelo meio de análise de envelope temporal de baixa frequência com uso das informações suplementares de envelope temporal, e meio de transformação de envelope temporal para transformar um envelope temporal do componente de alta frequência gerado pelo meio de geração de alta frequência com uso das informações de envelope temporal ajustadas pelo meio de ajuste de envelope temporal.A speech decoding device of the present invention is a speech decoding device for decoding a coded speech signal and includes: bit stream separation means for separating a bit stream received from outside the speech decoding device that includes the speech signal encoded in an encoded bit stream and supplemental time envelope information; central decoding means for decoding the encoded bit stream separated by the bit stream separation means to obtain a low frequency component; frequency conversion means for converting the low frequency component obtained by the central decoding means to a frequency domain; high frequency generation means for generating a high frequency component by copying the low frequency component converted into the frequency domain by the frequency conversion means from a low frequency band to a high frequency band; low frequency time envelope analysis means to analyze the low frequency component converted in the frequency domain by the frequency conversion means to obtain the time envelope information; temporal envelope adjustment means to adjust the temporal envelope information obtained by means of low frequency temporal envelope analysis using supplementary temporal envelope information, and temporal envelope transformation medium to transform a high frequency component temporal envelope generated by means of high frequency generation using time envelope information adjusted by means of time envelope adjustment.

É preferível que o dispositivo de decodificação de voz da presente invenção ainda inclua meio de ajuste de alta frequência para ajustar o componente de alta frequência, e o meio de conversão de frequência pode ser um banco de filtro QMF de 64 divisões com um coeficiente real ou complexo, e o meio de conversão de frequência, o meio de geração de alta frequência e o meio de ajuste de alta frequência operam com base em um decodificador de Replicação de Banda Espectral (SBR) para o "MPEG4 AAC" definido em "ISO/IEC 14496-3".It is preferable that the voice decoding device of the present invention still includes high frequency adjustment means to adjust the high frequency component, and the frequency conversion means can be a 64-room QMF filter bank with an actual coefficient or complex, and the frequency conversion medium, the high frequency generation medium and the high frequency adjustment medium operate based on a Spectral Band Replication (SBR) decoder for the "MPEG4 AAC" defined in "ISO / IEC 14496-3 ".

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência realize a análise de previsão linear em uma direção de frequência no componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter um coeficiente de previsão linear de baixa frequência, o meio de ajuste de envelope temporal pode ajustar o coeficiente de previsão linear de baixa frequência com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal pode realizar filtragem de previsão linear em uma direção de frequência no componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência, com uso de um coeficiente de previsão linear ajustado pelo meio de ajuste de envelope temporal, para transformar um envelope temporal de um sinal de voz.In the speech decoding device of the present invention, it is preferable for the low frequency time envelope analysis medium to perform linear forecast analysis in a frequency direction on the low frequency component converted into the frequency domain by the frequency conversion medium. to obtain a low frequency linear forecast coefficient, the temporal envelope adjustment medium can adjust the low frequency linear forecast coefficient using supplemental temporal envelope information, and the temporal envelope transformation medium can perform forecast filtering. linear in a frequency direction in the high frequency component in the frequency domain generated by the high frequency generation medium, using a linear forecast coefficient adjusted by the temporal envelope adjustment means, to transform a temporal envelope from a voice.

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência obtenha as informações de envelope temporal de um sinal de voz obtendo força de cada abertura de tempo do componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência, o meio de ajuste de envelope temporal ajuste as informações de envelope temporal com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal sobreponha as informações de envelope temporal ajustadas no componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência para transformar um envelope temporal de um componente de alta frequência.In the speech decoding device of the present invention, it is preferable that the low frequency time envelope analysis medium obtains the time envelope information of a voice signal by obtaining strength from each time opening of the low frequency component converted into the voice domain. frequency by means of frequency conversion, the temporal envelope adjustment medium adjusts the temporal envelope information using the supplementary temporal envelope information, and the temporal envelope transformation medium superimposes the temporal envelope information adjusted on the high frequency component. in the frequency domain generated by the high frequency generation means to transform a time envelope of a high frequency component.

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência obtenha informações de envelope temporal de um sinal de voz obtendo força de cada amostra de sub-banda QMF do componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência, o meio de ajuste de envelope temporal ajuste as informações de envelope temporal com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal transforme um envelope temporal de um componente de alta frequência multiplicando as informações de envelope temporal ajustadas pelo componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência.In the speech decoding device of the present invention, it is preferable that the low frequency time envelope analysis medium obtains time envelope information from a voice signal by obtaining strength from each QMF subband sample of the low frequency component converted into the frequency domain by means of frequency conversion, the temporal envelope adjustment medium adjusts the temporal envelope information using supplemental temporal envelope information, and the temporal envelope transformation medium transforms a temporal envelope into a high frequency component multiplying the time envelope information adjusted by the high frequency component in the frequency domain generated by the high frequency generation medium.

No dispositivo de decodificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente representam um parâmetro de resistência de filtro a usado para ajustar a resistência de um coeficiente de previsão linear.In the speech decoding device of the present invention, the supplemental time envelope information preferably represents a filter resistance parameter a used to adjust the resistance of a linear prediction coefficient.

No dispositivo de decodificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente representam um parâmetro que indica a magnitude da variação temporal das informações de envelope temporal.In the speech decoding device of the present invention, the supplementary time envelope information preferably represents a parameter that indicates the magnitude of the time variation of the time envelope information.

No dispositivo de decodificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente includes informações diferenciais de um coeficiente de previsão linear com relação ao coeficiente de previsão linear de baixa frequência.In the speech decoding device of the present invention, the supplementary time envelope information preferably includes differential information of a linear prediction coefficient with respect to the low frequency linear prediction coefficient.

No dispositivo de decodificação de voz da presente invenção, as informações diferenciais preferencialmente representam uma diferença entre os coeficientes de previsão linear em ao menos qualquer domínio dentre LSP (Par de Espectros Lineares), ISP (Par de Espectros de Imitância), LSF (Frequência de Espectro Linear), ISF (Frequência de Espectro de Imitância), e coeficiente PARCOR.In the speech decoding device of the present invention, the differential information preferably represents a difference between the linear prediction coefficients in at least any domain within LSP (Linear Spectrum Pair), ISP (Imitance Spectrum Pair), LSF (Frequency of Linear Spectrum), ISF (Immitance Spectrum Frequency), and PARCOR coefficient.

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência realize a análise de previsão linear em uma direção de frequência no componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter o coeficiente de previsão linear de baixa frequência, e obter força de cada abertura de tempo do componente de baixa frequência no domínio de frequência para obter as informações de envelope temporal de um sinal de voz, o meio de ajuste de envelope temporal ajuste o coeficiente de previsão linear de baixa frequência com uso das informações suplementares de envelope temporal e ajuste as informações de envelope temporal com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal realize a filtragem de previsão linear em uma direção de frequência no componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência com uso do coeficiente de previsão linear ajustado pelo meio de ajuste de envelope temporal para transformar um envelope temporal de um sinal de voz, e transforme um envelope temporal do componente de alta frequência sobrepondo as informações de envelope temporal ajustadas pelo meio de ajuste de envelope temporal no componente de alta frequência no domínio de frequência.In the speech decoding device of the present invention, it is preferable for the low frequency time envelope analysis medium to perform linear forecast analysis in a frequency direction on the low frequency component converted into the frequency domain by the frequency conversion medium. to obtain the low frequency linear prediction coefficient, and obtain strength of each time opening of the low frequency component in the frequency domain to obtain the time envelope information of a voice signal, the time envelope adjustment means adjust the low frequency linear forecast coefficient using supplemental temporal envelope information and adjust temporal envelope information using supplementary temporal envelope information, and the temporal envelope transformation medium performs linear forecast filtering in a frequency direction in the high frequency component in the frequency domain generated by the means of generates high frequency definition using the linear forecast coefficient adjusted by means of temporal envelope adjustment to transform a temporal envelope from a voice signal, and transform a temporal envelope of the high frequency component by overlapping the temporal envelope information adjusted by means of temporal envelope adjustment in the high frequency component in the frequency domain.

No dispositivo de decodificação de voz da presente invenção, é preferível que o meio de análise de envelope temporal de baixa frequência realize a análise de previsão linear em uma direção de frequência no componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter o coeficiente de previsão linear de baixa frequência, e obtenha informações de envelope temporal de um sinal de voz obtendo força de cada amostra de sub-banda QMF do componente de baixa frequência no domínio de frequência, o meio de ajuste de envelope temporal ajuste o coeficiente de previsão linear de baixa frequência com uso das informações suplementares de envelope temporal e ajuste as informações de envelope temporal com uso das informações suplementares de envelope temporal, e o meio de transformação de envelope temporal realize filtragem de previsão linear em uma direção de frequência em um componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência com uso de um coeficiente de previsão linear ajustado pelo meio de ajuste de envelope temporal para transformar um envelope temporal de um sinal de voz, e transforme um envelope temporal do componente de alta frequência multiplicando as informações de envelope temporal ajustadas pelo meio de ajuste de envelope temporal pelo componente de alta frequência no domínio de frequência.In the speech decoding device of the present invention, it is preferable for the low frequency time envelope analysis medium to perform linear forecast analysis in a frequency direction on the low frequency component converted into the frequency domain by the frequency conversion medium. to obtain the low frequency linear prediction coefficient, and obtain temporal envelope information from a voice signal by obtaining strength from each QMF subband sample of the low frequency component in the frequency domain, the means of adjusting temporal envelope adjustment the low frequency linear forecast coefficient using supplementary temporal envelope information and adjust the temporal envelope information using supplementary temporal envelope information, and the temporal envelope transformation medium performs linear forecast filtering in a frequency direction into a high frequency component in the frequency domain generated by the medium high frequency generation with the use of a linear forecast coefficient adjusted by means of temporal envelope adjustment to transform a temporal envelope from a voice signal, and transform a temporal envelope of the high frequency component by multiplying the middle envelope information adjusted by the medium of temporal envelope adjustment by the high frequency component in the frequency domain.

No dispositivo de decodificação de voz da presente invenção, as informações suplementares de envelope temporal preferencialmente representam um parâmetro que indica tanto uma resistência de filtro de um coeficiente de previsão linear como uma magnitude de variação temporal das informações de envelope temporal.In the speech decoding device of the present invention, the supplementary time envelope information preferably represents a parameter that indicates both a filter resistance of a linear prediction coefficient and a time variation magnitude of the time envelope information.

Um dispositivo de decodificação de voz da presente invenção é um dispositivo de decodificação de voz para decodificar um sinal de voz codificado e inclui: meio de separação de fluxo de bit para separar um fluxo de bit recebido de fora do dispositivo de decodificação de voz que inclui o sinal de voz codificado em um fluxo de bit codificado e um coeficiente de previsão linear, coeficiente de previsão linear meio de interpolação/extrapolação para interpolar ou extrapolar o coeficiente de previsão linear em uma direção temporal, e meio de transformação de envelope temporal para realizar a filtragem de previsão linear em uma direção de frequência em um componente de alta frequência representado em um domínio de frequência com uso de um coeficiente de previsão linear interpolado ou extrapolado pelo meio de interpolação/extrapolação de coeficiente de previsão linear para transformar um envelope temporal de um sinal de voz.A speech decoding device of the present invention is a speech decoding device for decoding an encoded speech signal and includes: bit stream separation means for separating a bit stream received from outside the voice decoding device that includes the speech signal encoded in an encoded bit stream and a linear forecast coefficient, linear forecast coefficient means of interpolation / extrapolation to interpolate or extrapolate the linear forecast coefficient in a temporal direction, and means of temporal envelope transformation to perform filtering linear forecast in a frequency direction on a high frequency component represented in a frequency domain using a linear forecast coefficient interpolated or extrapolated by means of interpolation / extrapolation of linear forecast coefficient to transform a temporal envelope of a voice signal.

Um método de codificação de voz da presente invenção é um método de codificação de voz que usa um dispositivo de codificação de voz para codificar um sinal de voz e inclui: uma etapa de codificação núcleo em que o dispositivo de codificação de voz codificada um componente de baixa frequência do sinal de voz; uma etapa de cálculo de informações suplementares de envelope temporal em que o dispositivo de codificação de voz calcula informações suplementares de envelope temporal para obter uma aproximação de um envelope temporal de um componente de alta frequência do sinal de voz com uso de um envelope temporal de um componente de baixa frequência do sinal de voz; e uma etapa de multiplexação de fluxo de bit em que o dispositivo de codificação de voz gera um fluxo de bit em que ao menos o componente de baixa frequência codificado na etapa de codificação central e as informações suplementares de envelope temporal calculadas na etapa de cálculo de informações suplementares de envelope temporal são multiplexados.A speech encoding method of the present invention is a speech encoding method that uses a speech encoding device to encode a speech signal and includes: a core encoding step in which the encoded speech encoding device is a component of low frequency of the voice signal; a step of calculating supplementary time envelope information in which the voice coding device calculates supplementary time envelope information to obtain an approximation of a time envelope of a high frequency component of the voice signal using a time envelope of a low frequency component of the voice signal; and a bit stream multiplexing step in which the voice coding device generates a bit stream in which at least the low frequency component encoded in the central coding step and the supplemental time envelope information calculated in the calculation step of supplemental time envelope information is multiplexed.

Um método de codificação de voz da presente invenção é um método de codificação de voz que usa um dispositivo de codificação de voz para codificar um sinal de voz e inclui: uma etapa de codificação central em que o dispositivo de codificação de voz codificada um componente de baixa frequência do sinal de voz; uma etapa de conversão de frequência em que o dispositivo de codificação de voz converte o sinal de voz em um domínio de frequência; uma etapa de análise de previsão linear em que o dispositivo de codificação de voz obtém coeficientes de previsão linear de alta frequência realizando a análise de previsão linear em uma direção de frequência em coeficientes de lado de alta frequência do sinal de voz convertido no domínio de frequência na etapa de conversão de frequência; uma etapa de decimação de coeficiente de previsão em que o dispositivo de codificação de voz decima o coeficiente de previsão linear de alta frequência obtido na etapa de meio de análise de previsão linear em uma direção temporal; uma etapa de quantização de coeficiente de previsão em que o dispositivo de codificação de voz quantiza os coeficientes de previsão linear de alta frequência decimados na etapa de meio de decimação de coeficiente de previsão; e uma etapa de multiplexação de fluxo de bit em que o dispositivo de codificação de voz gera um fluxo de bit em que ao menos o componente de baixa frequência codificado na etapa de codificação central e os coeficientes de previsão linear de alta frequência quantizados na etapa de quantização de coeficiente de previsão são multiplexados.A speech encoding method of the present invention is a speech encoding method that uses a speech encoding device to encode a speech signal and includes: a central encoding step in which the encoded speech encoding device is a component of speech. low frequency of the voice signal; a frequency conversion step in which the speech coding device converts the speech signal into a frequency domain; a linear prediction analysis step in which the voice coding device obtains high frequency linear prediction coefficients by performing linear prediction analysis in a frequency direction on high frequency side coefficients of the converted voice signal in the frequency domain in the frequency conversion step; a prediction coefficient decimation step in which the voice coding device decimates the high frequency linear prediction coefficient obtained in the linear prediction analysis medium step in a temporal direction; a prediction coefficient quantization step in which the speech coding device quantizes the high frequency linear prediction coefficients decimated in the prediction coefficient decimation medium step; and a bit stream multiplexing step in which the speech coding device generates a bit stream in which at least the low frequency component encoded in the central coding step and the high frequency linear prediction coefficients quantized in the quantization of forecast coefficient are multiplexed.

Um método de decodificação de voz da presente invenção é um método de decodificação de voz que usa um dispositivo de decodificação de voz par decodificar um sinal de voz codificado e inclui: uma etapa de separação de fluxo de bit em que o dispositivo de decodificação de voz separa um fluxo de bit recebido de fora do dispositivo de decodificação de voz que inclui o sinal de voz codificado em um fluxo de bit codificado e informações suplementares de envelope temporal; uma etapa de decodificação central em que o dispositivo de decodificação de voz obtém um componente de baixa frequência decodificando o fluxo de bit codificado separado na etapa de separação de fluxo de bit; uma etapa de conversão de frequência em que o dispositivo de decodificação de voz converte o componente de baixa frequência obtido na etapa de decodificação central em um domínio de frequência; uma etapa de geração de alta frequência em que o dispositivo de decodificação de voz gera um componente de alta frequência copiando o componente de baixa frequência convertido no domínio de frequência na etapa de conversão de frequência de uma banda de baixa frequência para uma banda de alta frequência; uma etapa de análise de envelope temporal de baixa frequência em que o dispositivo de decodificação de voz obtém informações de envelope temporal analisando o componente de baixa frequência convertido no domínio de frequência na etapa de conversão de frequência; uma etapa de ajuste de envelope temporal em que o dispositivo de decodificação de voz ajusta as informações de envelope temporal obtidas na etapa de análise de envelope temporal de baixa frequência com uso das informações suplementares de envelope temporal; e uma etapa de transformação de envelope temporal em que o dispositivo de decodificação de voz transforma um envelope temporal do componente de alta frequência gerado na etapa de geração de alta frequência com uso das informações de envelope temporal ajustadas na etapa de ajuste de envelope temporal.A speech decoding method of the present invention is a speech decoding method that uses a speech decoding device to decode an encoded speech signal and includes: a bit stream separation step in which the speech decoding device separates a bit stream received from outside the voice decoding device that includes the voice signal encoded in an encoded bit stream and supplemental time envelope information; a central decoding step in which the speech decoding device obtains a low frequency component by decoding the separate encoded bit stream in the bit stream separation step; a frequency conversion step in which the voice decoding device converts the low frequency component obtained in the central decoding step into a frequency domain; a high frequency generation step in which the voice decoding device generates a high frequency component by copying the low frequency component converted into the frequency domain in the frequency conversion step from a low frequency band to a high frequency band ; a low frequency time envelope analysis step in which the voice decoding device obtains time envelope information by analyzing the low frequency component converted to the frequency domain in the frequency conversion step; a time envelope adjustment step in which the voice decoding device adjusts the time envelope information obtained in the low frequency time envelope analysis step using supplemental time envelope information; and a time envelope transformation step in which the voice decoding device transforms a time envelope from the high frequency component generated in the high frequency generation step using the time envelope information set in the time envelope adjustment step.

Um método de decodificação de voz da presente invenção é um método de decodificação de voz que usa um dispositivo de decodificação de voz for que decodifica um sinal de voz codificado e inclui: uma etapa de separação de fluxo de bit em que o dispositivo de decodificação de voz separa um fluxo de bit recebido de fora do dispositivo de decodificação de voz que inclui o sinal de voz codificado em um fluxo de bit codificado e um coeficiente de previsão linear; uma etapa de interpolação/extrapolação de coeficiente de previsão linear em que o dispositivo de decodificação de voz interpola ou extrapola o coeficiente de previsão linear em uma direção temporal; e uma etapa de transformação de envelope temporal em que o dispositivo de decodificação de voz transforma um envelope temporal de um sinal de voz realizando a filtragem de previsão linear em uma direção de frequência em um componente de alta frequência representado em um domínio de frequência com uso do coeficiente de previsão linear interpolado ou extrapolado na etapa de interpolação/extrapolação de coeficiente de previsão linear.A speech decoding method of the present invention is a speech decoding method that uses a for voice decoding device that decodes an encoded speech signal and includes: a bit stream separation step in which the decoding device of speech separates a bit stream received from outside the voice decoding device that includes the speech signal encoded in an encoded bit stream and a linear prediction coefficient; a step of interpolation / extrapolation of linear prediction coefficient in which the voice decoding device interpolates or extrapolates the linear prediction coefficient in a temporal direction; and a time envelope transformation step in which the voice decoding device transforms a time envelope of a voice signal by performing linear prediction filtering in a frequency direction into a high frequency component represented in a frequency domain in use of the linear forecast coefficient interpolated or extrapolated in the interpolation / extrapolation step of linear forecast coefficient.

Um programa de codificação de voz da presente invenção para codificar um sinal de voz faz com que um dispositivo de computador funcione como: meio de codificação central para codificar um componente de baixa frequência do sinal de voz; meio de cálculo de informações suplementares de envelope temporal para calcular informações suplementares de envelope temporal para obter uma aproximação de um envelope temporal de um componente de alta frequência do sinal de voz com uso de um envelope temporal do componente de baixa frequência do sinal de voz; e meio de multiplexação de fluxo de bit para gerar um fluxo de bit em que ao menos o componente de baixa frequência codificado pelo meio de codificação central e as informações suplementares de envelope temporal calculadas pelo meio de cálculo de informações suplementares de envelope temporal são multiplexados.A speech encoding program of the present invention to encode a speech signal causes a computer device to function as: a central encoding means for encoding a low frequency component of the speech signal; means for calculating supplementary temporal envelope information to calculate supplementary temporal envelope information to obtain an approximation of a temporal envelope of a high frequency component of the speech signal using a temporal envelope of the low frequency component of the speech signal; and bit stream multiplexing means to generate a bit stream in which at least the low frequency component encoded by the central encoding means and the supplemental temporal envelope information calculated by the supplementary temporal envelope information means are multiplexed.

Um programa de codificação de voz da presente invenção para codificar um sinal de voz que faz com que um dispositivo de computador funcione como: meio de codificação central para codificar um componente de baixa frequência do sinal de voz; meio de conversão de frequência para converter o sinal de voz em um domínio de frequência; meio de análise de previsão linear para realizar a análise de previsão linear em uma direção de frequência em coeficientes de lado de alta frequência do sinal de voz convertido no domínio de frequência pelo meio de conversão de frequência para obter coeficientes de previsão linear de alta frequência; meio de decimação de coeficiente de previsão para decimar coeficientes de previsão linear de alta frequência obtidos pelo meio de análise de previsão linear em uma direção temporal; meio de quantização de coeficiente de previsão para quantizar o coeficiente de previsão linear de alta frequências decimado pelo meio de decimação de coeficiente de previsão; e meio de multiplexação de fluxo de bit para gerar um fluxo de bit em que ao menos o componente de baixa frequência codificado pelo meio de codificação central e coeficientes de previsão linear de alta frequência quantizados pelo meio de quantização de coeficiente de previsão são multiplexados.A speech encoding program of the present invention for encoding a speech signal that causes a computer device to function as: a central encoding means for encoding a low frequency component of the speech signal; frequency conversion means for converting the voice signal into a frequency domain; linear forecast analysis means to carry out linear forecast analysis in a frequency direction on high frequency side coefficients of the voice signal converted in the frequency domain by the frequency conversion means to obtain high frequency linear forecast coefficients; means of decimating the forecast coefficient to decimate high frequency linear forecast coefficients obtained by means of linear forecast analysis in a temporal direction; prediction coefficient quantization means to quantify the high frequency linear prediction coefficient decimated by the prediction coefficient decimation means; and bit stream multiplexing means to generate a bit stream in which at least the low frequency component encoded by the central coding means and high frequency linear prediction coefficients quantized by the prediction coefficient quantization means are multiplexed.

Um programa de decodificação de voz da presente invenção para decodificar um sinal de voz codificado faz com que um dispositivo de computador funcione como: meio de separação de fluxo de bit para separar um fluxo de bit recebido de fora do programa de decodificação de voz que inclui o sinal de voz codificado em um fluxo de bit codificado e informações suplementares de envelope temporal; meio de decodificação central para decodificar o fluxo de bit codificado separado pelo meio de separação de fluxo de bit para obter um componente de baixa frequência; meio de conversão de frequência para converter o componente de baixa frequência obtido pelo meio de decodificação central em um domínio de frequência; meio de geração de alta frequência para gerar um componente de alta frequência copiando o componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência de uma banda de baixa frequência para uma banda de alta frequência; meio de análise de envelope temporal de baixa frequência para analisar o componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter informações de envelope temporal; meio de ajuste de envelope temporal para ajustar as informações de envelope temporal obtidas pelo meio de análise de envelope temporal de baixa frequência com uso das informações suplementares de envelope temporal; e meio de transformação de envelope temporal para transformar um envelope temporal do componente de alta frequência gerado pelo meio de geração de alta frequência com uso das informações de envelope temporal ajustadas pelo meio de ajuste de envelope temporal.A speech decoding program of the present invention for decoding an encoded speech signal causes a computer device to function as: bit stream separation means to separate a bit stream received from outside the voice decoding program that includes the speech signal encoded in an encoded bit stream and supplemental time envelope information; central decoding means for decoding the encoded bit stream separated by the bit stream separation means to obtain a low frequency component; frequency conversion means for converting the low frequency component obtained by the central decoding means into a frequency domain; high frequency generation means for generating a high frequency component by copying the low frequency component converted into the frequency domain by the frequency conversion means from a low frequency band to a high frequency band; low frequency time envelope analysis means to analyze the low frequency component converted in the frequency domain by the frequency conversion means to obtain time envelope information; temporal envelope adjustment means to adjust the temporal envelope information obtained by means of low frequency temporal envelope analysis using supplemental temporal envelope information; and time envelope transformation means for transforming a time envelope of the high frequency component generated by the high frequency generation means using the time envelope information adjusted by the time envelope adjustment means.

Um programa de decodificação de voz da presente invenção para decodificar um sinal de voz codificado faz com que um dispositivo de computador funcione como: meio de separação de fluxo de bit para separar um fluxo de bit que inclui o sinal de voz codificado em um fluxo de bit codificado e um coeficiente de previsão linear. O fluxo de bit recebido de cora do programa de decodificação de voz. Em adição, o programa de decodificação de voz ainda faz com que um dispositivo de computador funcione como; meio de interpolação/extrapolação de coeficiente de previsão linear para interpolar ou extrapolar o coeficiente de previsão linear em uma direção temporal; e meio de transformação de envelope temporal para realizar a filtragem de previsão linear em uma direção de frequência em um componente de alta frequência representado em um domínio de frequência com uso de um coeficiente de previsão linear interpolado ou extrapolado pelo meio de interpolação/extrapolação de coeficiente de previsão linear parra transformar um envelope temporal de um sinal de voz.A speech decoding program of the present invention to decode an encoded speech signal causes a computer device to function as: bit stream separation means for separating a bit stream that includes the encoded speech signal into a stream of coded bit and a linear prediction coefficient. The bit stream received from the voice decoding program. In addition, the voice decoding program still makes a computer device function like; means of interpolating / extrapolating the linear forecast coefficient to interpolate or extrapolate the linear forecast coefficient in a temporal direction; and time envelope transformation means to perform linear forecast filtering in a frequency direction on a high frequency component represented in a frequency domain using an interpolated or extrapolated linear forecast coefficient by means of coefficient interpolation / extrapolation linear prediction to transform a time envelope from a voice signal.

No dispositivo de decodificação de voz da presente invenção, o meio de transformação de envelope temporal, após realizar a filtragem de previsão linear na direção de frequência no componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência, preferencialmente ajusta a força de um componente de alta frequência obtido como resultado da filtragem de previsão linear em um valor equivalente àquele antes da filtragem de previsão linear.In the speech decoding device of the present invention, the temporal envelope transformation medium, after performing linear prediction filtering in the frequency direction on the high frequency component in the frequency domain generated by the high frequency generation means, preferably adjusts the strength of a high frequency component obtained as a result of linear forecast filtering at a value equivalent to that before linear forecast filtering.

No dispositivo de decodificação de voz da presente invenção, o meio de transformação de envelope temporal, após realizar a filtragem de previsão linear na direção de frequência no componente de alta frequência no domínio de frequência gerado pelo meio de geração de alta frequência, preferencialmente ajusta a força em uma certa faixa de frequência de um componente de alta frequência obtido como resultado da filtragem de previsão linear em um valor equivalente àquele antes da filtragem de previsão linear.In the speech decoding device of the present invention, the time envelope transformation medium, after performing linear prediction filtering in the frequency direction on the high frequency component in the frequency domain generated by the high frequency generation means, preferably adjusts the strength over a certain frequency range of a high frequency component obtained as a result of linear forecast filtering at a value equivalent to that before linear forecast filtering.

No dispositivo de decodificação de voz da presente invenção, as informações suplementares de envelope temporal são preferencialmente uma razão de um valor mínimo para um valor médio das informações de envelope temporal ajustadas.In the speech decoding device of the present invention, the supplemental time envelope information is preferably a ratio of a minimum value to an average value of the adjusted time envelope information.

No dispositivo de decodificação de voz da presente invenção, o meio de transformação de envelope temporal, após controlar o ganho do envelope temporal ajustado de forma que a força do componente de alta frequência no domínio de frequência em um segmento de tempo de envelope de SBR seja equivalente antes e depois da transformação do envelope temporal, preferencialmente transforma um envelope temporal do componente de alta frequência multiplicando o envelope temporal cujo ganho é controlado pelo componente de alta frequência no domínio de frequência.In the speech decoding device of the present invention, the temporal envelope transformation means, after controlling the gain of the adjusted temporal envelope so that the strength of the high frequency component in the frequency domain in an SBR envelope time segment is equivalent before and after the transformation of the temporal envelope, preferably transforms a temporal envelope of the high frequency component by multiplying the temporal envelope whose gain is controlled by the high frequency component in the frequency domain.

No dispositivo de decodificação de voz da presente invenção, o meio de análise de envelope temporal de baixa frequência preferencialmente obtém força de cada amostra de sub-banda de QMF do componente de baixa frequência convertido ao domínio de frequência pelo meio de conversão de frequência, e obtém as informações de envelope temporal representadas como um coeficiente de ganho a ser multiplicado por cada uma das amostras de sub-banda de QMF, normalizando a força de cada uma das amostras de sub-banda de QMF com uso de uma força média em um segmento de tempo de envelope de SBR.In the speech decoding device of the present invention, the low frequency time envelope analysis means preferably obtains strength from each QMF subband sample of the low frequency component converted to the frequency domain by the frequency conversion means, and obtains the time envelope information represented as a gain coefficient to be multiplied by each of the QMF subband samples, normalizing the strength of each of the QMF subband samples using an average force in a segment of SBR envelope time.

Um dispositivo de decodificação de voz da presente invenção é um dispositivo de decodificação de voz para decodificar um sinal de voz codificado e inclui: meio de decodificação central para obter um componente de baixa frequência decodificando um fluxo de bit recebido de fora do dispositivo de decodificação que inclui o sinal de voz codificado; meio de conversão de frequência para converter o componente de baixa frequência obtido pelo meio de decodificação central em um domínio de frequência; meio de geração de alta frequência para gerar um componente de alta frequência copiando o componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência de uma banda de baixa frequência para uma banda de alta frequência; meio de análise de envelope temporal de baixa frequência para analisar o componente de baixa frequência convertido no domínio de frequência pelo meio de conversão de frequência para obter informações de envelope temporal; meio de geração de informações suplementares de envelope temporal para analisar o fluxo de bit para gerar informações suplementares de envelope temporal; meio de ajuste de envelope temporal para ajustar as informações de envelope temporal obtidas pelo meio de análise de envelope temporal de baixa frequência com uso das informações suplementares de envelope temporal; e meio de transformação de envelope temporal para transformar um envelope temporal do componente de alta frequência gerado pelo meio de geração de alta frequência com uso das informações de envelope temporal ajustadas pelo meio de ajuste de envelope temporal.A speech decoding device of the present invention is a speech decoding device for decoding a coded speech signal and includes: central decoding means for obtaining a low frequency component decoding a bit stream received from outside the decoding device that includes the encoded voice signal; frequency conversion means for converting the low frequency component obtained by the central decoding means into a frequency domain; high frequency generation means for generating a high frequency component by copying the low frequency component converted into the frequency domain by the frequency conversion means from a low frequency band to a high frequency band; low frequency time envelope analysis means to analyze the low frequency component converted in the frequency domain by the frequency conversion means to obtain time envelope information; means of generating supplemental temporal envelope information to analyze the bit stream to generate supplementary temporal envelope information; temporal envelope adjustment means to adjust the temporal envelope information obtained by means of low frequency temporal envelope analysis using supplemental temporal envelope information; and time envelope transformation means for transforming a time envelope of the high frequency component generated by the high frequency generation means using the time envelope information adjusted by the time envelope adjustment means.

É preferível que o dispositivo de decodificação de voz da presente invenção inclua um meio de ajuste de alta frequência primário e um meio de ajuste de alta frequência secundário, ambos correspondendo ao meio de ajuste de alta frequência, o meio de ajuste de alta frequência primário pode executar um processo que inclui uma parte de um processo que corresponde ao meio de ajuste de alta frequência, o meio de transformação de envelope temporal pode transformar um envelope temporal de um sinal de sápida do meio de ajuste de alta frequência primário, o meio de ajuste de alta frequência secundário pode executar um processo não executado pelo meio de ajuste de alta frequência primário dentro os processos que correspondem ao meio de ajuste de alta frequência em um sinal de sápida do meio de transformação de envelope temporal, e o meio de ajuste de alta frequência secundário pode ser um processo de adição de uma onda de seno durante a decodificação de SBR.It is preferable that the speech decoding device of the present invention includes a primary high frequency adjustment means and a secondary high frequency adjustment means, both corresponding to the high frequency adjustment means, the primary high frequency adjustment means may performing a process that includes a part of a process that corresponds to the high frequency adjustment medium, the temporal envelope transformation medium can transform a temporal envelope from a primary signal of the primary high frequency adjustment medium, the adjustment medium secondary high frequency can perform a process not performed by the primary high frequency tuning medium within the processes that correspond to the high frequency tuning medium in a flash signal of the temporal envelope transformation medium, and the high tuning medium Secondary frequency can be a process of adding a sine wave during SBR decoding.

Efeitos Vantajosos da InvençãoAdvantageous Effects of the Invention

De acordo com a presente invenção, a ocorrência de pré-eco e pós-eco pode ser reduzida e a qualidade subjetiva de um sinal decodificado pode ser melhorada sem aumentar significantemente a taxa de bit na técnica de extensão de banda no domínio de frequência representado pela SBR. Breve Descrição dos Desenhos A figura 1 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com uma primeira modalidade; A figura 2 é um fluxograma para descrever uma operação do dispositivo de codificação de voz de acordo com a primeira modalidade; A figura 3 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com a primeira modalidade; A figura 4 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a primeira modalidade; A figura 5 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com uma primeira modificação da primeira modalidade; A figura 6 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com uma segunda modalidade; A figura 7 é um fluxograma para descrever uma operação do dispositivo de codificação de voz de acordo com a segunda modalidade; A figura 8 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com a segunda modalidade; A figura 9 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a segunda modalidade; A figura 10 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com uma terceira modalidade; A figura 11 é um fluxograma para descrever uma operação do dispositivo de codificação de voz de acordo com a terceira modalidade; A figura 12 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com a terceira modalidade; A figura 13 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a terceira modalidade; A figura 14 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com uma quarta modalidade; A figura 15 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com uma modificação da quarta modalidade; A figura 16 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 17 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da quarta modalidade; A figura 18 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da primeira modalidade; A figura 19 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da primeira modalidade; A figura 20 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da primeira modalidade; A figura 21 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da primeira modalidade. A figura 22 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com uma modificação da segunda modalidade; A figura 23 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da segunda modalidade; A figura 24 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da segunda modalidade; A figura 25 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da segunda modalidade; A figura 26 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 27 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da quarta modalidade; A figura 28 é um diagrama de um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 29 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da quarta modalidade; A figura 30 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 31 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 32 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da quarta modalidade; A figura 33 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 34 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da quarta modalidade; A figura 35 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 36 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da quarta modalidade; A figura 37 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 38 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 39 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da quarta modalidade; A figura 40 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 41 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da quarta modalidade; A figura 42 é um diagrama que ilustra um dispositivo de decodificação de voz de acordo com outra modificação da quarta modalidade; A figura 43 é um fluxograma para descrever uma operação do dispositivo de decodificação de voz de acordo com a outra modificação da quarta modalidade; A figura 44 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com outra modificação da primeira modalidade; A figura 45 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com still outra modificação da primeira modalidade; A figura 46 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com uma modificação da segunda modalidade; A figura 47 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com outra modificação da segunda modalidade; A figura 48 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com a quarta modalidade; A figura 49 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com uma modificação da quarta modalidade; e A figura 50 é um diagrama que ilustra um dispositivo de codificação de voz de acordo com outra modificação da quarta modalidade.According to the present invention, the occurrence of pre-echo and post-echo can be reduced and the subjective quality of a decoded signal can be improved without significantly increasing the bit rate in the bandwidth technique in the frequency domain represented by SBR. Brief Description of the Drawings Figure 1 is a diagram illustrating a speech coding device according to a first embodiment; Figure 2 is a flow chart for describing an operation of the voice coding device according to the first embodiment; Figure 3 is a diagram illustrating a voice decoding device according to the first embodiment; Figure 4 is a flow chart for describing an operation of the voice decoding device according to the first embodiment; Figure 5 is a diagram illustrating a speech coding device according to a first modification of the first embodiment; Figure 6 is a diagram illustrating a speech coding device according to a second embodiment; Figure 7 is a flow chart for describing an operation of the speech coding device according to the second embodiment; Figure 8 is a diagram illustrating a voice decoding device according to the second embodiment; Figure 9 is a flow chart for describing an operation of the voice decoding device according to the second embodiment; Figure 10 is a diagram illustrating a speech coding device according to a third embodiment; Fig. 11 is a flow chart for describing an operation of the speech coding device according to the third embodiment; Figure 12 is a diagram illustrating a voice decoding device according to the third embodiment; Figure 13 is a flow chart for describing an operation of the voice decoding device according to the third embodiment; Figure 14 is a diagram illustrating a voice decoding device according to a fourth embodiment; Fig. 15 is a diagram illustrating a voice decoding device according to a modification of the fourth embodiment; Fig. 16 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Figure 17 is a flow chart for describing an operation of the voice decoding device according to the other modification of the fourth embodiment; Fig. 18 is a diagram illustrating a voice decoding device according to another modification of the first embodiment; Figure 19 is a flow chart for describing an operation of the voice decoding device according to the other modification of the first embodiment; Fig. 20 is a diagram illustrating a voice decoding device according to another modification of the first embodiment; Fig. 21 is a flow chart for describing an operation of the voice decoding device according to the other modification of the first embodiment. Fig. 22 is a diagram illustrating a speech decoding device according to a modification of the second embodiment; Fig. 23 is a flow chart for describing an operation of the speech decoding device according to the other modification of the second embodiment; Fig. 24 is a diagram illustrating a voice decoding device according to another modification of the second embodiment; Fig. 25 is a flow chart for describing an operation of the speech decoding device according to the other modification of the second embodiment; Figure 26 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Fig. 27 is a flow chart for describing an operation of the voice decoding device according to the other modification of the fourth embodiment; Fig. 28 is a diagram of a voice decoding device according to another modification of the fourth embodiment; Fig. 29 is a flow chart for describing an operation of the voice decoding device according to the other modification of the fourth embodiment; Fig. 30 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Fig. 31 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Fig. 32 is a flow chart for describing an operation of the voice decoding device according to the other modification of the fourth embodiment; Fig. 33 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Fig. 34 is a flow chart for describing an operation of the voice decoding device according to the other modification of the fourth embodiment; Fig. 35 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Fig. 36 is a flow chart for describing an operation of the voice decoding device according to the other modification of the fourth embodiment; Fig. 37 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Fig. 38 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Fig. 39 is a flow chart for describing an operation of the voice decoding device according to the other modification of the fourth embodiment; Fig. 40 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Fig. 41 is a flow chart for describing an operation of the voice decoding device according to the other modification of the fourth embodiment; Fig. 42 is a diagram illustrating a voice decoding device according to another modification of the fourth embodiment; Fig. 43 is a flow chart for describing an operation of the voice decoding device according to the other modification of the fourth embodiment; Fig. 44 is a diagram showing a voice coding device according to another modification of the first embodiment; Fig. 45 is a diagram illustrating a voice coding device according to yet another modification of the first modality; Fig. 46 is a diagram showing a voice coding device according to a modification of the second embodiment; Fig. 47 is a diagram showing a voice coding device according to another modification of the second embodiment; Fig. 48 is a diagram showing a voice coding device according to the fourth embodiment; Fig. 49 is a diagram illustrating a speech coding device according to a modification of the fourth embodiment; and Fig. 50 is a diagram illustrating a speech coding device according to another modification of the fourth embodiment.

Descrição das ModalidadesDescription of Modalities

As modalidades preferenciais de acordo com a presente invenção são descritas abaixo em detalhe com referência aos desenhos anexos. Na descrição dos desenhos, os elementos que são os mesmos são indicados com os mesmos símbolos de referência e a descrição duplicada dos mesmos é omitida, se aplicável.Preferred embodiments according to the present invention are described below in detail with reference to the accompanying drawings. In the description of the drawings, the elements that are the same are indicated with the same reference symbols and their duplicate description is omitted, if applicable.

(Primeira modalidade)(First modality)

A figura 1 é um diagrama que ilustra um dispositivo de codificação de voz 11 de acordo com a primeira modalidade. O dispositivo de codificação de voz 11 inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 11 carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 2) armazenado em uma memória interna do dispositivo de codificação de voz 11 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 11 recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 11, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 11.Figure 1 is a diagram illustrating a voice coding device 11 according to the first embodiment. The voice encoding device 11 physically includes a CPU, ROM, RAM, communication device and the like, which are not illustrated, and the CPU fully controls the voice encoding device 11 by loading and running a predetermined computer program. (such as a computer program to perform the processes illustrated in the flowchart of figure 2) stored in an internal memory of the voice coding device 11 such as the ROM in RAM. The communication device of the speech coding device 11 receives a speech signal to be encoded from outside the speech coding device 11, and emits a multiplexed bit stream encoded out of the speech coding device 11.

O dispositivo de codificação de voz 11 funcionalmente inclui uma unidade de conversão de frequência 1a (meio de conversão de frequência), uma unidade de conversão inversa de frequência 1b, a unidade de codificação de codec central 1c (meio de codificação central), uma unidade de codificação de SBR 1 d, uma unidade de análise de previsão linear 1e (meio de cálculo de informações suplementares de envelope temporal), uma unidade de cálculo de parâmetro de resistência de filtro 1f (meio de cálculo de informações suplementares de envelope temporal), e uma unidade de multiplexação de fluxo de bit 1g (meio de multiplexação de fluxo de bit). A unidade de conversão de frequência 1a à unidade de multiplexação de fluxo de bit 1g do dispositivo de codificação de voz 11 ilustradas na figura 1 são funções realizadas quando a CPU do dispositivo de codificação de voz 11 executa o programa de computador armazenado na memória interna do dispositivo de codificação de voz 11. A CPU do dispositivo de codificação de voz 11 sequencialmente executa processos (processos da Etapa Sa1 à Etapa Sa7) ilustrados no fluxograma da figura 2, executando o programa de computador (ou usando a unidade de conversão de frequência 1a à unidade de multiplexação de fluxo de bit 1g ilustradas na figura 1). Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados para executar o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de codificação de voz 11.The voice coding device 11 functionally includes a frequency conversion unit 1a (frequency conversion means), a frequency reverse conversion unit 1b, the central codec encoding unit 1c (central encoding means), a unit coding of SBR 1 d, a linear forecast analysis unit 1e (means of calculating supplementary information of temporal envelope), a unit of calculation of parameter of resistance of filter 1f (means of calculating supplementary information of temporal envelope), and a 1g bit stream multiplexing unit (bit stream multiplexing means). The frequency conversion unit 1a to the bit stream multiplexing unit 1g of the voice coding device 11 illustrated in figure 1 are functions performed when the CPU of the voice coding device 11 executes the computer program stored in the internal memory of the voice coding device 11. The CPU of the voice coding device 11 sequentially executes processes (processes from Step Sa1 to Step Sa7) illustrated in the flowchart of figure 2, running the computer program (or using the frequency conversion unit 1a to the 1g bit stream multiplexing unit illustrated in figure 1). Various types of data needed to run the computer program and various types of data generated to run the computer program are all stored in internal memory such as the ROM and RAM of the voice coding device 11.

A unidade de conversão de frequência 1a analisa um sinal de entrada recebido de fora do dispositivo de codificação de voz 11 por meio do dispositivo de comunicação do dispositivo de codificação de voz 11 com uso de um banco de filtro de QMF de múltiplas divisões para obter um sinal q (k, r) em um domínio de QMF (processo na Etapa Sa1). Nota-se que k (0<k<63) é um índice em uma direção de frequência, e r é um índice que indica uma abertura de tempo. A unidade de conversão inversa de frequência 1b sintetiza uma metade dos coeficientes no lado de baixa frequência do domínio de QMF obtidos pela unidade de conversão de frequência 1a com uso do banco de filtro de QMF para obter um sinal de domínio de tempo de resolução reduzida que inclui somente componentes de baixa frequência do sinal de entrada (processo na Etapa Sa2). A unidade de codificação de codec central 1c codificada o sinal de domínio de resolução reduzida para obter um fluxo de bit codificado (processo na Etapa Sa3). A codificação realizada pela unidade de codificação de codec central 1c pode estar baseada em um método de codificação de voz representado por um método CELP ou pode estar baseada em uma codificação de transformação representada por AAC ou uma codificação de som tal como um método de TCX (Excitação Codificada de Transformação).The frequency conversion unit 1a analyzes an input signal received from outside the voice coding device 11 via the communication device of the voice coding device 11 using a multi-room QMF filter bank to obtain a q (k, r) sign in a QMF domain (process in Step Sa1). Note that k (0 <k <63) is an index in a frequency direction, and r is an index that indicates a time gap. The frequency inversion conversion unit 1b synthesizes half of the coefficients on the low frequency side of the QMF domain obtained by the frequency conversion unit 1a using the QMF filter bank to obtain a reduced resolution time domain signal that includes only low frequency components of the input signal (process in Step Sa2). The central codec encoding unit 1c encodes the reduced resolution domain signal to obtain an encoded bit stream (process in Step Sa3). The coding performed by the central codec coding unit 1c can be based on a voice coding method represented by a CELP method or it can be based on a transformation coding represented by AAC or a sound coding such as a TCX method ( Coded Excitation of Transformation).

A unidade de codificação de SBR 1d recebe o sinal no domínio de QMF a partir da unidade de conversão de frequência 1a, e realiza a codificação de SBR com base na análise da força, alteração de sinal, tonalidade e similares dos componentes de alta frequência para obter informações suplementares de SBR (processo na Etapa Sa4). O método de análise de QMF na unidade de conversão de frequência 1a e o método de codificação de SBR na unidade de codificação de SBR 1d são descritos em detalhe, por exemplo, em uma Literatura "3GPP TS 26.404: Enhanced aacPIus encoder SBR part".The SBR coding unit 1d receives the signal in the QMF domain from the frequency conversion unit 1a, and performs the SBR coding based on the analysis of the strength, signal change, tone and the like of the high frequency components for obtain supplementary SBR information (process in Step Sa4). The QMF analysis method in the frequency conversion unit 1a and the SBR encoding method in the SBR 1d encoding unit are described in detail, for example, in a literature "3GPP TS 26.404: Enhanced aacPIus encoder SBR part".

A unidade de análise de previsão linear 1e recebe o sinal no domínio de QMF a partir da unidade de conversão de frequência 1a, e realiza a análise de previsão linear na direção de frequência nos componentes de alta frequência do sinal para obter coeficientes de previsão linear de alta frequência an (n, r) (1<n<N) (processo na Etapa Sa5). Nota-se que N é uma ordem de previsão linear. O índice r é um índice em uma direção temporal para uma sub-amostra dos sinais no domínio de QMF. Um método de covariância ou um método de auto-correlação podem ser usados para a análise de previsão linear de sinal. A análise de previsão linear para obter an (n, r) é realizada nos componentes de alta frequência que satisfazem kx<k<63 em q (k, r). Nota-se que kx é um índice de frequência que corresponde a uma frequência de limite superior da banda de frequência codificadada pela unidade de codificação de codec central 1c. A unidade de análise de previsão linear 1e pode também realizar a análise de previsão linear em componentes de baixa frequência diferentes daqueles analisados quando an (n, r) são obtidos para obter coeficientes de previsão linear de baixa frequência aL (n, r) diferentes de aH (n, r) (coeficientes de previsão linear de acordo com tais componentes de baixa frequência correspondem às informações de envelope temporal, e é o mesmo na primeira modalidade conforme abaixo). A análise de previsão linear para obter aL (n, r) é realizada em componentes de baixa frequência que satisfazem 0<k<kx. A análise de previsão linear pode ser também realizada em uma parte banda de frequência incluída em uma seção de 0<k<kx.The linear prediction analysis unit 1e receives the signal in the QMF domain from the frequency conversion unit 1a, and performs linear prediction analysis in the frequency direction on the high frequency components of the signal to obtain linear prediction coefficients of high frequency an (n, r) (1 <n <N) (process in Step Sa5). Note that N is a linear forecast order. The index r is an index in a time direction for a subsample of the signals in the QMF domain. A covariance method or a self-correlation method can be used for the analysis of linear signal prediction. The linear prediction analysis to obtain an (n, r) is performed on the high frequency components that satisfy kx <k <63 in q (k, r). Note that kx is a frequency index that corresponds to an upper limit frequency of the frequency band encoded by the central codec coding unit 1c. The linear forecast analysis unit 1e can also perform linear forecast analysis on low frequency components different from those analyzed when an (n, r) is obtained to obtain aL (n, r) low frequency linear forecast coefficients different from aH (n, r) (linear forecast coefficients according to such low frequency components correspond to the time envelope information, and it is the same in the first modality as shown below). The linear forecast analysis to obtain aL (n, r) is performed on low frequency components that satisfy 0 <k <kx. Linear forecast analysis can also be performed on a part of the frequency band included in a section of 0 <k <kx.

A unidade de cálculo de parâmetro de resistência de filtro 1 f, por exemplo, utiliza os coeficientes de previsão linear obtidos pela unidade de análise de previsão linear 1e para calcular um parâmetro de resistência de filtro (o parâmetro de resistência de filtro corresponde às informações suplementares de envelope temporal e é o mesmo na primeira modalidade conforme mostrado abaixo) (processo na Etapa Sa6). Um ganho de previsão GH(r) é o primeiro calculado a partir de aH (n, r). O método para calcular o ganho de previsão é, por exemplo, descrito em detalhe em "Speech Coding, Takehiro Moriya, The Institute of Electronics, Information and Communication Engineers". Se aL(n, r) foi calculado, um ganho de previsão GL(0 é calculado similarmente. O parâmetro de resistência de filtro K(r) é um parâmetro que aumenta conforme GH(r) é aumentado, e, por exemplo, pode ser obtido de acordo com a seguinte expressão (1). Aqui, max (a, b) indica o valor máximo de a e b, e min (a, b) indica o valor mínimo de a e b.

Figure img0001
The filter resistance parameter calculation unit 1 f, for example, uses the linear forecast coefficients obtained by the linear forecast analysis unit 1e to calculate a filter resistance parameter (the filter resistance parameter corresponds to supplementary information time envelope and is the same in the first modality as shown below) (process in Step Sa6). A GH (r) forecast gain is the first one calculated from aH (n, r). The method for calculating the forecast gain is, for example, described in detail in "Speech Coding, Takehiro Moriya, The Institute of Electronics, Information and Communication Engineers". If aL (n, r) was calculated, a prediction gain GL (0 is calculated similarly. The filter resistance parameter K (r) is a parameter that increases as GH (r) is increased, and, for example, can be obtained according to the following expression (1): Here, max (a, b) indicates the maximum value of a and b, and min (a, b) indicates the minimum value of a and b.
Figure img0001

Se GL(r) foi calculado, K(r) pode ser obtido como um parâmetro que aumenta conforme GH(r) é aumentado, e diminui conforme GL(r) é aumentado. Neste caso, por exemplo, K pode ser obtido de acordo com a seguinte expressão (2).

Figure img0002
K(r) é um parâmetro que indica a resistência para ajustar o envelope temporal dos componentes de alta frequência durante a decodificação de SBR. Um valor do ganho de previsão com relação aos coeficientes de previsão linear na direção de frequência é aumentado conforme a variação do envelope temporal de um sinal na seção analisada se torna agudo. K(r) é um parâmetro para instruir um decodificador a reforçar o processo para alterar intensamente o envelope temporal dos componentes de alta frequência gerados por SBR, com o aumento de seu valor. K(r) pode ser também um parâmetro para instruir um decodificador (tal como um dispositivo de decodificação de voz 21) a enfraquecer o processo para variar intensamente o envelope temporal dos componentes de alta frequência gerados por SBR, com a diminuição de seu valor, ou pode incluir um valor para não executar o processo para variar intensamente o envelope temporal. Ao invés de transmitir K(r) para cada abertura de tempo, K(r) que represente uma pluralidade de aberturas de tempo pode ser transmitido. Para determinar as seções de abertura de tempo que compartilham o mesmo valor de K(r), é preferível usar as informações de limite de tempo de envelope de SBR incluídas nas informações suplementares de SBR. K(r) é transmitido à unidade de multiplexação de fluxo de bit 1g após ser quantizado. É preferível calcular K(r) que representa a pluralidade de aberturas de tempo, por exemplo, tomando uma média de K(r) de uma pluralidade de aberturas de tempo r antes de a quantização ser realizada. Para transmitir K(r) que representa a pluralidade de aberturas de tempo, K(r) pode ser também obtido a partir do resultado da análise de todas as seções formadas da pluralidade de aberturas de tempo, ao invés de independentemente calcular K(r) a partir do resultado da análise de cada abertura de tempo tal como a expressão (2). Neste caso, K(r) pode ser calculado, por exemplo, de acordo com a seguinte expressão (3). Aqui, mean (•) indica um valor médio nas seções de abertura de tempo representadas por K(r).
Figure img0003
K(r) pode ser exclusivamente transmitido com informações de modo de filtro inverso incluídas nas informações suplementares de SBR descritas em "ISO/IEC 14496-3 subpart 4 General Audio Coding". Em outras palavras, K(r) não é transmitido para a abertura de tempo para transmitir as informações de modo de filtro inverso nas informações suplementares de SBR, e as informações de modo de filtro inverso (bs#invf#mode em "ISO/IEC 14496-3 subpart 4 General Audio Coding") nas informações suplementares de SBR não precisam ser transmitidas para a abertura de tempo para transmitir K(r). As informações que indicam se tanto K(r) ou as informações de modo de filtro inverso incluídas nas informações suplementares de SBR são transmitidas podem ser também adicionadas. K(r) e as informações de modo de filtro inverso incluídas nas informações suplementares de SBR podem ser combinadas para funcionarem como informações de vetor, e realizarem codificação de entropia no vetor. Neste caso, a combinação de K(r) e o valor das informações de modo de filtro inverso incluídas nas informações suplementares de SBR podem ser restringidos.If GL (r) was calculated, K (r) can be obtained as a parameter that increases as GH (r) is increased, and decreases as GL (r) is increased. In this case, for example, K can be obtained according to the following expression (2).
Figure img0002
K (r) is a parameter that indicates the resistance to adjust the time envelope of the high frequency components during SBR decoding. A forecast gain value with respect to the linear forecast coefficients in the frequency direction is increased as the variation of the temporal envelope of a signal in the analyzed section becomes acute. K (r) is a parameter to instruct a decoder to reinforce the process to intensively alter the time envelope of the high frequency components generated by SBR, with an increase in their value. K (r) can also be a parameter to instruct a decoder (such as a voice decoding device 21) to weaken the process to vary the time envelope of high frequency components generated by SBR intensely, with a decrease in their value, or you can include a value for not running the process to vary the time envelope intensely. Instead of transmitting K (r) for each time slot, K (r) representing a plurality of time slots can be transmitted. To determine the opening time sections that share the same K (r) value, it is preferable to use the SBR envelope time limit information included in the supplementary SBR information. K (r) is transmitted to the 1g bit stream multiplexing unit after being quantized. It is preferable to calculate K (r) which represents the plurality of time openings, for example, by taking an average of K (r) from a plurality of time openings r before quantization is performed. To transmit K (r) which represents the plurality of time gaps, K (r) can also be obtained from the result of analyzing all sections formed from the plurality of time gaps, instead of independently calculating K (r) from the result of the analysis of each opening of time as the expression (2). In this case, K (r) can be calculated, for example, according to the following expression (3). Here, mean (•) indicates an average value in the time opening sections represented by K (r).
Figure img0003
K (r) can only be transmitted with reverse filter mode information included in the supplementary SBR information described in "ISO / IEC 14496-3 subpart 4 General Audio Coding". In other words, K (r) is not transmitted for opening time to transmit the reverse filter mode information in the supplementary SBR information, and the reverse filter mode information (bs # invf # mode in "ISO / IEC 14496-3 subpart 4 General Audio Coding ") in the supplementary SBR information does not need to be transmitted for the opening time to transmit K (r). Information indicating whether either K (r) or the reverse filter mode information included in the supplementary SBR information is transmitted can also be added. K (r) and the reverse filter mode information included in the supplementary SBR information can be combined to function as vector information, and perform entropy coding on the vector. In this case, the combination of K (r) and the value of the reverse filter mode information included in the supplementary SBR information can be restricted.

A unidade de multiplexação de fluxo de bit 1g multiplexa o fluxo de bit codificado calculado pela unidade de codificação de codec central 1c, as informações suplementares de SBR calculadas pela unidade de codificação de SBR 1d, e K(r) calculado pela unidade de cálculo de parâmetro de resistência de filtro 1f, e emite um fluxo de bit multiplexado (fluxo de bit multiplexado codificado) através do dispositivo de comunicação do dispositivo de codificação de voz 11 (processo na Etapa Sa7).The 1g bit stream multiplexing unit multiplexes the encoded bit stream calculated by the central codec coding unit 1c, the supplementary SBR information calculated by the SBR coding unit 1d, and K (r) calculated by the calculation unit of filter resistance parameter 1f, and outputs a multiplexed bit stream (encoded multiplexed bit stream) through the communication device of the voice coding device 11 (process in Step Sa7).

A figura 3 é um diagrama que ilustra um dispositivo de decodificação de voz 21 de acordo com a primeira modalidade. O dispositivo de decodificação de voz 21 fisicamente inclui uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU integralmente controla o dispositivo de decodificação de voz 21 carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 4) armazenado em uma memória interna do dispositivo de decodificação de voz 21 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 21 recebe a saída de fluxo de bit multiplexado a partir do dispositivo de codificação de voz 11, um dispositivo de codificação de voz 11a de uma modificação 1, que será descrito adiante, ou um dispositivo de codificação de voz de uma modificação 2, que será descrito adiante, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 21. O dispositivo de decodificação de voz 21, conforme ilustrado na figura 3, funcionalmente inclui uma unidade de separação de fluxo de bit 2a (meio de separação de fluxo de bit), uma unidade de decodificação de codec central 2b (meio de decodificação central), uma unidade de conversão de frequência 2c (meio de conversão de frequência), uma unidade de análise de previsão linear de baixa frequência 2d (meio de análise de envelope temporal de baixa frequência), uma unidade de detecção de sinal 2e, uma unidade de ajuste de resistência de filtro 2f (meio de ajuste de envelope temporal), uma unidade de geração de alta frequência 2g (meio de geração de alta frequência), uma unidade de análise de previsão linear de alta frequência 2h, uma unidade de filtro inverso de previsão linear 2i, uma unidade de ajuste de alta frequência 2j (meio de ajuste de alta frequência), uma unidade de filtro de previsão linear 2k (meio de transformação de envelope temporal), uma unidade de adição de coeficiente 2m e uma unidade de conversão inversa de frequência 2n. A unidade de separação de fluxo de bit 2a a uma unidade de transformação inversa de frequência 2n do dispositivo de decodificação de voz 21 ilustrado na figura 3 são funções realizadas quando a CPU do dispositivo de decodificação de voz 21 executa o programa de computador armazenado na memória interna do dispositivo de decodificação de voz 21. A CPU do dispositivo de decodificação de voz 21 sequencialmente executa os processos (processos da Etapa Sb1 à Etapa Sb11) ilustrados no fluxograma da figura 4, executando o programa de computador (ou com uso da unidade de separação de fluxo de bit 2a à unidade de transformação inversa de frequência 2n ilustrada na figura 3). Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados executando-se o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de decodificação de voz 21.Figure 3 is a diagram illustrating a voice decoding device 21 according to the first embodiment. The voice decoding device 21 physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice decoding device 21 by loading and running a computer program. predetermined (such as a computer program to perform the processes illustrated in the flowchart of figure 4) stored in an internal memory of the voice decoding device 21 such as the ROM in RAM. The communication device of the voice decoding device 21 receives the output of multiplexed bit stream from the speech coding device 11, a speech coding device 11a of a modification 1, which will be described below, or a communication device. speech coding of a modification 2, which will be described below, and outputting a decoded speech signal out of the speech decoding device 21. The speech decoding device 21, as illustrated in figure 3, functionally includes a separation unit bit stream 2a (bit stream separation means), a central codec decoding unit 2b (central decoding means), a frequency conversion unit 2c (frequency conversion means), a data analysis unit 2d low frequency linear forecast (low frequency time envelope analysis medium), a signal detection unit 2e, a filter resistance adjustment unit 2f ( time envelope), a 2g high frequency generation unit (high frequency generation medium), a 2h high frequency linear forecast analysis unit, a 2i linear forecast reverse filter unit, a high frequency adjustment unit 2j (high frequency adjustment medium), a 2k linear forecast filter unit (time envelope transformation medium), a 2m coefficient addition unit and a 2n frequency conversion unit. The bit stream separation unit 2a to a 2n frequency reverse transformation unit of the voice decoding device 21 illustrated in figure 3 are functions performed when the CPU of the voice decoding device 21 executes the computer program stored in memory internal voice decoding device 21. The CPU of the voice decoding device 21 sequentially executes the processes (processes from Step Sb1 to Step Sb11) illustrated in the flowchart of figure 4, running the computer program (or using the bit stream separation 2a to the 2n frequency reverse transformation unit shown in figure 3). Various types of data needed to run the computer program and various types of data generated by running the computer program are all stored in internal memory such as the ROM and RAM of the voice decoding device 21.

A unidade de separação de fluxo de bit 2a separa o fluxo de bit multiplexado fornecido através do dispositivo de comunicação do dispositivo de decodificação de voz 21 em um parâmetro de resistência de filtro, informações suplementares de SBR e o fluxo de bit codificado. A unidade de decodificação de codec central 2b decodifica o fluxo de bit codificado recebido a partir da unidade de separação de fluxo de bit 2a para obter um sinal decodificado que inclui somente os componentes de baixa frequência (processo na Etapa Sb1). Neste momento, o método de decodificação pode ser baseado no método de codificação de voz representado pelo método CELP, ou pode ser baseado em decodificação de som tal como o método AAC ou o TCX (Excitação Codificada de Transformação).The bit stream separation unit 2a separates the multiplexed bit stream provided through the communication device of the voice decoding device 21 into a filter resistance parameter, supplementary SBR information and the encoded bit stream. The central codec decoding unit 2b decodes the encoded bit stream received from the bit stream separation unit 2a to obtain a decoded signal that includes only the low frequency components (process in Step Sb1). At this time, the decoding method can be based on the voice coding method represented by the CELP method, or it can be based on sound decoding such as the AAC method or the TCX (Coded Transformation Excitation).

A unidade de conversão de frequência 2c analisa o sinal decodificado recebido a partir da unidade de decodificação de codec central 2b com uso do banco de filtro de QMF de múltiplas divisões para obter um sinal qdec (k, r) no domínio de QMF (processo na Etapa Sb2). Nota-se que k (0<k<63) é um índice na direção de frequência, e r é um índice que indica um índice para a sub-amostra do sinal no domínio de QMF na direção temporal.The frequency conversion unit 2c analyzes the decoded signal received from the central codec decoding unit 2b using the multi-room QMF filter bank to obtain a qdec (k, r) signal in the QMF domain (process in Step Sb2). Note that k (0 <k <63) is an index in the frequency direction, and r is an index that indicates an index for the subsample of the signal in the QMF domain in the temporal direction.

A unidade de análise de previsão linear de baixa frequência 2d realiza a análise de previsão linear na direção de frequência em qdec (k, r) de cada abertura de tempo r, obtida a partir da unidade de conversão de frequência 2c, para obter coeficientes de previsão linear de baixa frequência adec (n, r) (processo na Etapa Sb3). A análise de previsão linear é realizada para um faixa de 0<k<kx que corresponde a uma banda de sinal do sinal decodificado obtido a partir da unidade de decodificação de codec central 2b. A análise de previsão linear pode ser realizada em uma parte da banda de frequência incluída na seção de 0<k<kx.The low frequency linear prediction analysis unit 2d performs linear forecast analysis in the frequency direction in qdec (k, r) of each time slot r, obtained from the frequency conversion unit 2c, to obtain coefficients of adec (n, r) low frequency linear forecast (process in Step Sb3). The linear prediction analysis is performed for a range of 0 <k <kx which corresponds to a signal band of the decoded signal obtained from the central codec decoding unit 2b. The linear forecast analysis can be performed on a part of the frequency band included in the section of 0 <k <kx.

A unidade de detecção de sinal 2e detecta a variação temporal do sinal no domínio de QMF recebido a partir da unidade de conversão de frequência 2c, e emite-o como um resultado de detecção T(r). A alteração de sinal pode ser detectada, por exemplo, com uso do método descrito abaixo. 1. A força de período curto p(r) de um sinal na abertura de tempo r é obtida de acordo com a seguinte expressão (4).

Figure img0004
2. Um envelope penv(r) obtido suavizando-se p(r) é obtido de acordo com a seguinte expressão (5). Note-se que oc é uma constante que satisfaz 0<cc<1.
Figure img0005
3. T(r) é obtido de acordo com a seguinte expressão (6) com uso de p(r) e penv(r), θm que β é uma constante.
Figure img0006
The signal detection unit 2e detects the time variation of the signal in the QMF domain received from the frequency conversion unit 2c, and outputs it as a result of detection T (r). The signal change can be detected, for example, using the method described below. 1. The short period force p (r) of a signal at the time gap r is obtained according to the following expression (4).
Figure img0004
2. A penv (r) envelope obtained by softening p (r) is obtained according to the following expression (5). Note that c is a constant that satisfies 0 <cc <1.
Figure img0005
3. T (r) is obtained according to the following expression (6) using p (r) and penv (r), θm that β is a constant.
Figure img0006

Os métodos descritos acima são simples exemplos para detectar a alteração de sinal baseada na alteração na força, e a alteração de sinal pode ser detectada com uso de outros métodos mais sofisticados. Em adição, a unidade de detecção de sinal 2e pode ser omitida.The methods described above are simple examples for detecting the change in signal based on the change in strength, and the change in signal can be detected using other, more sophisticated methods. In addition, signal detection unit 2e can be omitted.

A unidade de ajuste de resistência de filtro 2f ajusta a resistência de filtro com relação a adec (n, r) obtido a partir da unidade de análise de previsão linear de baixa frequência 2d para obter um coeficiente de previsão linear ajustado aadj (n, r), (processo na Etapa Sb4). A resistência de filtro é ajustada, por exemplo, de acordo com a seguinte expressão (7), com uso de um parâmetro de resistência de filtro K recebido através da unidade de separação de fluxo de bit 2a.

Figure img0007
The filter resistance adjustment unit 2f adjusts the filter resistance with respect to adec (n, r) obtained from the low frequency linear prediction analysis unit 2d to obtain an adjusted linear prediction coefficient aadj (n, r ), (process in Step Sb4). The filter resistance is adjusted, for example, according to the following expression (7), using a filter resistance parameter K received through the bit flow separation unit 2a.
Figure img0007

Se uma saída T(r) é obtida a partir da unidade de detecção de sinal 2e, a resistência pode ser ajustada de acordo com a seguinte expressão (8).

Figure img0008
If an output T (r) is obtained from the signal detection unit 2e, the resistance can be adjusted according to the following expression (8).
Figure img0008

A unidade de geração de alta frequência 2g copia o sinal no domínio de QMF obtido a partir da unidade de conversão de frequência 2c a partir da banda de baixa frequência para a banda de alta frequência para gerar um sinal qexp (k, r) no domínio de QMF dos componentes de alta frequência (processo na Etapa Sb5). Os componentes de alta frequência são gerados de acordo com o método de geração HF em SBR em "MPEG4 AAC" ("ISO/IEC 14496-3 subpart 4 General Audio Coding").The high frequency generation unit 2g copies the signal in the QMF domain obtained from the frequency conversion unit 2c from the low frequency band to the high frequency band to generate a qexp (k, r) signal in the domain of QMF of the high frequency components (process in Step Sb5). The high frequency components are generated according to the HF generation method in SBR in "MPEG4 AAC" ("ISO / IEC 14496-3 subpart 4 General Audio Coding").

A unidade de análise de previsão linear de alta frequência 2h realiza a análise de previsão linear na direção de frequência em qexp (k, r) de cada uma das aberturas de tempo r geradas pela unidade de geração de alta frequência 2g para obter os coeficientes de previsão linear de alta frequência aexp (n, r) (processo na Etapa Sb6). A análise de previsão linear é realizada para uma faixa de kx<k<63 que corresponde aos componentes de alta frequência gerados pela unidade de geração de alta frequência 2g.The 2h high frequency linear forecast analysis unit performs the linear forecast analysis in the frequency direction in qexp (k, r) of each of the time openings r generated by the high frequency generation unit 2g to obtain the coefficients of high frequency linear forecast aexp (n, r) (process in Step Sb6). The linear forecast analysis is performed for a range of kx <k <63 that corresponds to the high frequency components generated by the high frequency generation unit 2g.

A unidade de filtro inverso de previsão linear 2i realiza a filtragem inversa de previsão linear na direção de frequência em um sinal no domínio de QMF da banda de alta frequência gerada pela unidade de geração de alta frequência 2g, com uso de aexp (n, r) como coeficientes (processo na Etapa Sb7). A função de transferência do filtro inverso de previsão linear pode ser expressa ° coniiinto avnmeccin /Q\

Figure img0009
The linear prediction inverse filter unit 2i performs linear prediction reverse filtering in the frequency direction on a signal in the QMF domain of the high frequency band generated by the high frequency generation unit 2g, using aexp (n, r ) as coefficients (process in Step Sb7). The transfer function of the inverse linear prediction filter can be expressed ° coniiinto avnmeccin / Q \
Figure img0009

A filtragem inversa de previsão linear pode ser realizada a partir do coeficiente no lado de baixa frequência em direção ao coeficiente no lado de alta frequência, ou pode ser realizada na direção oposta. A filtragem inversa de previsão linear é um processo para temporariamente suavizar o envelope temporal dos componentes de alta frequência, antes da transformação do envelope temporal ser realizada no estágio subsequente, e a unidade de filtro inverso de previsão linear 2i pode ser omitida. É também possível realizar a análise de previsão linear e filtragem inversa em saídas da unidade de ajuste de alta frequência 2j, que será descrita adiante, pela unidade de análise de previsão linear de alta frequência 2ha e pela unidade de filtro inverso de previsão linear 2i, ao invés de realizar a análise de previsão linear e filtragem inversa nos componentes de alta frequência das saídas da unidade de geração de alta frequência 2g. Os coeficientes de previsão linear usados para a filtragem inversa de previsão linear podem ser também adec(n, r) ou aadj (n, r), ao invés de aexp (n, r). Os coeficientes de previsão linear usados para a filtragem inversa de previsão linear podem ser também coeficientes de previsão linear aexp,adj (n, r) obtidos realizando-se o ajuste de resistência de filtro em aexp (n, r). O ajuste de resistência é realizado de acordo com a seguinte expressão (10), similar àquela em que aadj (n, r) é obtido.

Figure img0010
The inverse filtering of linear prediction can be performed from the coefficient on the low frequency side towards the coefficient on the high frequency side, or it can be performed in the opposite direction. Linear forecast reverse filtering is a process for temporarily smoothing the time envelope of the high frequency components, before the transformation of the time envelope is carried out in the subsequent stage, and the linear forecast reverse filter unit 2i can be omitted. It is also possible to perform linear forecast analysis and reverse filtering on outputs of the high frequency adjustment unit 2j, which will be described below, by the high frequency linear forecast analysis unit 2ha and the linear forecast reverse filter unit 2i, instead of performing linear prediction analysis and reverse filtering on the high frequency components of the outputs of the 2g high frequency generation unit. The linear prediction coefficients used for inverse linear prediction filtering can also be adec (n, r) or aadj (n, r), instead of aexp (n, r). The linear prediction coefficients used for inverse linear prediction filtering can also be linear prediction coefficients aexp, adj (n, r) obtained by performing the filter resistance adjustment in aexp (n, r). The resistance adjustment is performed according to the following expression (10), similar to that in which aadj (n, r) is obtained.
Figure img0010

A unidade de ajuste de alta frequência 2j ajusta as características de frequência e tonalidade dos componentes de alta frequência de uma saída da unidade de filtro inverso de previsão linear 2i (processo na Etapa Sb8). O ajuste é realizado de acordo com as informações suplementares de SBR recebidas a partir da unidade de separação de fluxo de bit 2a. O processamento pela unidade de ajuste de alta frequência 2j é realizado de acordo com etapa de "ajuste HF" em SBR em "MPEG4 AAC", e é ajustado realizando-se a filtragem inversa de previsão linear na direção temporal, o ajuste de ganho, e a superposição de ruído no sinal do domínio de QMF da banda de alta frequência. Os detalhes dos processos nas etapas descritas acima são descritos em "ISO/IEC 14496-3 subpart 4 General Audio Coding". Conforme descrito acima, a unidade de conversão de frequência 2c, a unidade de geração de alta frequência 2g, e a unidade de ajuste de alta frequência 2j todas operam de acordo com o decodificador SBR em "MPEG4 AAC" definido em "ISO/IEC 14496-3".The high frequency adjustment unit 2j adjusts the frequency and hue characteristics of the high frequency components of an output of the linear prediction reverse filter unit 2i (process in Step Sb8). The adjustment is performed according to the supplementary SBR information received from the bit stream separation unit 2a. The processing by the high frequency adjustment unit 2j is carried out according to the "HF adjustment" step in SBR in "MPEG4 AAC", and is adjusted by performing the linear forecasting reverse filtering in the temporal direction, the gain adjustment, and the superposition of noise in the signal of the QMF domain of the high frequency band. The details of the processes in the steps described above are described in "ISO / IEC 14496-3 subpart 4 General Audio Coding". As described above, the frequency conversion unit 2c, the high frequency generation unit 2g, and the high frequency adjustment unit 2j all operate according to the SBR decoder in "MPEG4 AAC" defined in "ISO / IEC 14496 -3 ".

A unidade de filtro de previsão linear 2k realiza filtragem de síntese de previsão linear na direção de frequência em componentes de alta frequência qadj (n, r) de um sinal na saída de domínio de QMF a partir da unidade de ajuste de alta frequência 2j, com uso de aadj (n, r) obtido a partir da unidade de ajuste de resistência de filtro 2f (processo na Etapa Sb9). A função de transferência na filtragem de síntese de previsão linear pode ser expressa como a seguinte expressão (11).

Figure img0011
The 2k linear forecast filter unit performs linear forecast synthesis filtering in the frequency direction on high frequency components qadj (n, r) of a signal at the QMF domain output from the high frequency tuning unit 2j, using aadj (n, r) obtained from the filter resistance adjustment unit 2f (process in Step Sb9). The transfer function in the linear forecast synthesis filtering can be expressed as the following expression (11).
Figure img0011

Realizando-se a filtragem de síntese de previsão linear, a unidade de filtro de previsão linear 2k transforma o envelope temporal dos componentes de alta frequência gerados com base em SBR.Performing the linear forecast synthesis filtering, the 2k linear forecast filter unit transforms the time envelope of the high frequency components generated based on SBR.

A unidade de adição de coeficiente 2m adiciona um sinal no domínio de QMF que inclui a saída dos componentes de baixa frequência da unidade de conversão de frequência 2c e um sinal no domínio de QMF que inclui a sápida dos componentes de alta frequência da unidade de filtro de previsão linear 2k, e emite um sinal no domínio de QMF que inclui ambos os componentes de baixa frequência e os componentes de alta frequência (processo na Etapa Sb10).The coefficient addition unit 2m adds a signal in the QMF domain which includes the output of the low frequency components of the frequency conversion unit 2c and a signal in the QMF domain which includes the output of the high frequency components of the filter unit linear prediction 2k, and output a signal in the QMF domain that includes both low frequency components and high frequency components (process in Step Sb10).

A unidade de conversão inversa de frequência 2n processa o sinal no domínio de QMF obtido a partir da unidade de adição de coeficiente 2m com uso de um banco de filtro de síntese de QMF. Desta forma, um domínio de tempo decodificou um sinal de voz que inclui ambos os componentes de baixa frequência obtidos sendo decodificados pelo codec central e os componentes de alta frequência gerados por SBR e cujo envelope temporal é transformado pelo filtro de previsão linear é obtido, e o sinal obtido de voz é emitido para fora do dispositivo de decodificação de voz 21 através do dispositivo de comunicação interno (processo na Etapa Sb11). Se K(r) e as informações de modo de filtro inverso das informações suplementares de SBR descritas em "ISO/IEC 14496-3 subpart 4 General Audio Coding" forem exclusivamente transmitidas, as unidade de conversão inversa de frequência 2n pode gerar informações de modo de filtro inverso das informações suplementares de SBR para uma abertura de tempo para a qual K(r) é transmitido, mas as informações de modo de filtro inverso das informações suplementares de SBR não são transmitidas, com uso das informações de modo de filtro inverso das informações suplementares de SBR com relação a ao menos uma abertura de tempo da abertura de tempos entre a abertura de tempos antes e após a abertura de tempo. É também possível definir as informações de modo de filtro inverso das informações suplementares de SBR da abertura de tempo em um modo predeterminado antecipadamente. A unidade de conversão inversa de frequência 2n pode gerar K(r) para uma abertura de tempo para a qual os dados de filtro inverso das informações suplementares de SBR são transmitidos, mas K(r) não é transmitido, com uso de K(r) para ao menos uma abertura de tempo entre a abertura de tempos antes e após a abertura de tempo. É também possível definir K(r) da abertura de tempo em um valor predeterminado antecipadamente. A unidade de conversão inversa de frequência 2n pode determinar também se as informações transmitidas são K(r) ou as informações de modo de filtro inverso das informações suplementares de SBR, com base nas informações que indicam se K(r) ou as informações de modo de filtro inverso das informações suplementares de SBR são transmitidos.The frequency conversion unit 2n processes the signal in the QMF domain obtained from the coefficient addition unit 2m using a QMF synthesis filter bank. In this way, a time domain has decoded a voice signal that includes both the low frequency components obtained being decoded by the central codec and the high frequency components generated by SBR and whose time envelope is transformed by the linear forecast filter is obtained, and the obtained voice signal is output from the voice decoding device 21 via the internal communication device (process in Step Sb11). If K (r) and the reverse filter mode information from the supplementary SBR information described in "ISO / IEC 14496-3 subpart 4 General Audio Coding" are transmitted exclusively, the 2n frequency conversion units can generate information in a reverse filter information from the SBR supplemental information for a time slot to which K (r) is transmitted, but the reverse filter mode information from the supplementary SBR information is not transmitted, using the reverse filter mode information from the supplementary SBR information with respect to at least one opening time between the opening time before and after opening time. It is also possible to define the reverse filter mode information of the supplementary SBR information of the time slot in a predetermined mode in advance. The 2n frequency reverse conversion unit can generate K (r) for a time slot to which the reverse filter data from the supplementary SBR information is transmitted, but K (r) is not transmitted, using K (r ) for at least one time gap between the time gap before and after the time gap. It is also possible to set K (r) of the time gap to a predetermined value in advance. The frequency conversion unit 2n can also determine whether the transmitted information is K (r) or the reverse filter mode information of the supplementary SBR information, based on the information indicating whether K (r) or the mode information reverse filter of supplementary SBR information is transmitted.

(Modificação 1 da Primeira Modalidade)(Modification 1 of the First Mode)

A figura 5 é um diagrama que ilustra a modificação (dispositivo de codificação de voz 11a) do dispositivo de codificação de voz de acordo com a primeira modalidade. O dispositivo de codificação de voz 11a fisicamente inclui uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 11a carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz 11a tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 11a recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 11a, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 11a.Figure 5 is a diagram illustrating the modification (speech coding device 11a) of the speech coding device according to the first embodiment. The voice coding device 11a physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the voice coding device 11a by loading and running a computer program. predetermined data stored in an internal memory of the voice coding device 11a such as the ROM in RAM. The communication device of the speech coding device 11a receives a speech signal to be encoded from outside the speech coding device 11a, and emits a multiplexed bit stream encoded out of the speech coding device 11a.

O dispositivo de codificação de voz 11a, conforme ilustrado na figura 5, funcionalmente inclui uma unidade de conversão inversa de alta frequência 1 h, uma unidade de cálculo de força de período curto 1i (meio de cálculo de informações suplementares de envelope temporal), uma unidade de cálculo de parâmetro de resistência de filtro 1f1 (meio de cálculo de informações suplementares de envelope temporal), e uma unidade de multiplexação de fluxo de bit 1g 1 (meio de multiplexação de fluxo de bit), ao invés da unidade de análise de previsão linear 1e, da unidade de cálculo de parâmetro de resistência de filtro 1f, e da unidade de multiplexação de fluxo de bit 1g do dispositivo de codificação de voz 11. A unidade de multiplexação de fluxo de bit 1 g1 tem a mesma função que a da unidade de multiplexação de fluxo de bit 1g. A unidade de conversão de frequência 1a à unidade de codificação de SBR 1d, a unidade de conversão inversa de alta frequência 1 h, a unidade de cálculo de força de período curto 1 i, a unidade de cálculo de parâmetro de resistência de filtro 1f1, e a unidade de multiplexação de fluxo de bit 1g1 do dispositivo de codificação de voz 11a ilustradas na figura 5 são funções realizadas quando a CPU do dispositivo de codificação de voz 11a executa o programa de computador armazenado na memória interna do dispositivo de codificação de voz 11a. Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados executando-se o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de codificação de voz 11a.The voice coding device 11a, as shown in figure 5, functionally includes a high frequency reverse conversion unit 1 h, a short period force calculation unit 1i (means of calculating supplementary time envelope information), a filter resistance parameter calculation unit 1f1 (means of calculating supplemental time envelope information), and a 1g bit stream multiplexing unit (bit stream multiplexing means), instead of the linear prediction 1e, the filter resistance parameter calculation unit 1f, and the 1g bit stream multiplexing unit of the voice coding device 11. The 1 g1 bit stream multiplexing unit has the same function as the of the 1g bit stream multiplexing unit. The frequency conversion unit 1a to the SBR coding unit 1d, the high frequency reverse conversion unit 1h, the short period force calculation unit 1i, the filter resistance parameter calculation unit 1f1, and the bit stream multiplexing unit 1g1 of the speech coding device 11a illustrated in figure 5 are functions performed when the CPU of the speech coding device 11a executes the computer program stored in the internal memory of the speech coding device 11a . Various types of data needed to run the computer program and various types of data generated by running the computer program are all stored in internal memory such as the ROM and RAM of the voice coding device 11a.

A unidade de conversão inversa de alta frequência 1h converte, no sinal no domínio de QMF obtido a partir da unidade de conversão de frequência 1a, coeficientes que correspondem aos componentes de baixa frequência codificado pela unidade de codificação de codec central 1c para "0", para obter um sinal de domínio de tempo que inclui somente os componentes de alta frequência, e processar o sinal convertido com uso do banco de filtro de síntese de QMF. A unidade de cálculo de força de período curto 1i divide os componentes de alta frequência no domínio de tempo obtido a partir da unidade de conversão inversa de alta frequência 1 h em seções curtas, calcula a força, e calcula p(r). Como um método alternativo, a força de período curto pode ser também calculada de acordo com a seguinte expressão (12) com uso do sinal no domínio de QMF.

Figure img0012
The high frequency reverse conversion unit 1h converts, in the signal in the QMF domain obtained from the frequency conversion unit 1a, coefficients that correspond to the low frequency components encoded by the central codec coding unit 1c to "0", to obtain a time domain signal that includes only the high frequency components, and to process the converted signal using the QMF synthesis filter bank. The short period force calculation unit 1i divides the high frequency components in the time domain obtained from the high frequency reverse conversion unit 1 h into short sections, calculates the force, and calculates p (r). As an alternative method, the short period strength can also be calculated according to the following expression (12) using the signal in the QMF domain.
Figure img0012

A unidade de cálculo de parâmetro de resistência de filtro 1 f 1 detecta a porção alterada de p(r), e determina um valor de K(r), de forma que K(r) seja aumentado com a alteração grande. O valor de K(r), por exemplo, pode ser também calculado pelo mesmo método que aquele para calcular T(r) pela unidade de detecção de sinal 2e do dispositivo de decodificação de voz 21. A alteração de sinal pode ser também detectada com uso de outros métodos mais sofisticados. A unidade de cálculo de parâmetro de resistência de filtro 1 f 1 pode também obter força de período curto de cada um dos componentes de baixa frequência e dos componentes de alta frequência, obter alterações de sinal Tr(r) e Th(r) de cada um dos componentes de baixa frequência e dos componentes de alta frequência com uso do mesmo método que aquele para calcular T(r) pela unidade de detecção de sinal 2e do dispositivo de decodificação de voz 21, e determina o valor de K(r) com uso do mesmo. Neste caso, por exemplo, K(r) pode ser obtido de acordo com a seguinte expressão (13), em que ε é uma constante tal como 3,0.

Figure img0013
The filter resistance parameter calculation unit 1 f 1 detects the altered portion of p (r), and determines a value of K (r), so that K (r) is increased with the large change. The value of K (r), for example, can also be calculated by the same method as that for calculating T (r) by the signal detection unit 2e of the voice decoding device 21. The change in signal can also be detected with use of other, more sophisticated methods. The filter resistance parameter calculation unit 1 f 1 can also obtain short period strength from each of the low frequency components and the high frequency components, obtain signal changes Tr (r) and Th (r) from each one of the low frequency components and the high frequency components using the same method as that for calculating T (r) by the signal detection unit 2e of the voice decoding device 21, and determines the value of K (r) with use of it. In this case, for example, K (r) can be obtained according to the following expression (13), where ε is a constant such as 3.0.
Figure img0013

(Modificação 2 da Primeira Modalidade)(Modification 2 of the First Mode)

Um dispositivo de codificação de voz (não ilustrado) de uma modificação 2 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz da modificação 2 carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz da modificação 2 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz da modificação 2 recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz.A voice coding device (not shown) of a modification 2 of the first embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the coding device modification 2 voice record by loading and running a predetermined computer program stored in an internal memory of the modification 2 voice coding device such as ROM in RAM. The communication device of the modification 2 speech coding device receives a speech signal to be scrambled from outside the speech scrambling device, and outputs a scrambled multiplexed bit stream out of the speech scrambling device.

O dispositivo de codificação de voz da modificação 2 funcionalmente inclui uma unidade diferencial de codificação de coeficiente de previsão linear (meio de cálculo de informações suplementares de envelope temporal) e uma unidade de multiplexação de fluxo de bit (meio de multiplexação de fluxo de bit) que recebe uma saída a partir da unidade de codificação diferencial de coeficiente de previsão linear, que não são ilustradas, ao invés da unidade de cálculo de parâmetro de resistência de filtro 1f e da unidade de multiplexação de fluxo de bit 1g do dispositivo de codificação de voz 11. A unidade de conversão de frequência 1a à unidade de análise de previsão linear 1e, a unidade de codificação diferencial de coeficiente de previsão linear, e a unidade de multiplexação de fluxo de bit do dispositivo de codificação de voz da modificação 2 são funções realizadas quando a CPU do dispositivo de codificação de voz da modificação 2 executa o programa de computador armazenado na memória interna do dispositivo de codificação de voz da modificação 2. Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados executando-se o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de codificação de voz da modificação 2.The voice coding device of modification 2 functionally includes a differential encoding unit of linear prediction coefficient (means of calculating supplementary information of temporal envelope) and a bit stream multiplexing unit (bit stream multiplexing means) which receives an output from the linear encoding coefficient differential encoding unit, which are not illustrated, instead of the filter resistance parameter calculation unit 1f and the bit stream multiplexing unit 1g of the encoding device voice 11. The frequency conversion unit 1a to the linear prediction analysis unit 1e, the linear prediction coefficient differential encoding unit, and the bit stream multiplexing unit of the modification 2 speech encoding device are functions performed when the CPU of the modification 2 voice coding device executes the computer program stored in the internal memory of the voice coding device of modification 2. Various types of data needed to run the computer program and various types of data generated by running the computer program are all stored in internal memory such as the ROM and RAM of the device. voice coding of modification 2.

A unidade de codificação diferencial de coeficiente de previsão linear calcula valores diferenciais aD (n, r) do coeficiente de previsão linear de acordo com a seguinte expressão (14), com uso de aH (n, r) do sinal de entrada e ai_(n, r) do sinal de entrada.

Figure img0014
The linear prediction coefficient differential encoding unit calculates differential values aD (n, r) of the linear prediction coefficient according to the following expression (14), using aH (n, r) of the input signal and ai_ ( n, r) of the input signal.
Figure img0014

A unidade de codificação diferencial de coeficiente de previsão linear quando quantiza aD(n, r), e transmite-os para a unidade de multiplexação de fluxo de bit (estrutura que corresponde à unidade de multiplexação de fluxo de bit 1g). A unidade de multiplexação de fluxo de bit multiplexa ao (n, r) no fluxo de bit ao invés de K(r), e emite o fluxo de bit multiplexado para fora do dispositivo de codificação de voz através do dispositivo de comunicação interno.The linear prediction coefficient differential encoding unit when quantizes aD (n, r), and transmits them to the bit stream multiplexing unit (structure that corresponds to the 1g bit stream multiplexing unit). The bitstream multiplexing unit multiplexes to (n, r) in the bit stream instead of K (r), and outputs the multiplexed bit stream out of the speech coding device through the internal communication device.

Um dispositivo de decodificação de voz (não ilustrado) da modificação 2 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz da modificação 2 carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de decodificação de voz da modificação 2 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz da modificação 2 recebe o fluxo de bit multiplexado codificado emitido a partir do dispositivo de codificação de voz 11, o dispositivo de codificação de voz 11a de acordo com a modificação 1, ou o dispositivo de codificação de voz de acordo com a modificação 2, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz.A voice decoding device (not shown) of modification 2 of the first modality physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not shown, and the CPU fully controls the decoding device of voice of modification 2 loading and executing a predetermined computer program stored in an internal memory of the voice decoding device of modification 2 such as ROM in RAM. The communication device of the modification 2 speech decoding device receives the encoded multiplexed bit stream emitted from the speech coding device 11, the speech coding device 11a according to modification 1, or the coding device voice in accordance with modification 2, and output a decoded speech signal out of the speech decoding device.

O dispositivo de decodificação de voz da modificação 2 funcionalmente inclui uma unidade de decodificação diferencial de coeficiente de previsão linear, que não é ilustrada, ao invés da unidade de ajuste de resistência de filtro 2f do dispositivo de decodificação de voz 21. A unidade de separação de fluxo de bit 2a à unidade de detecção de sinal 2e, a unidade de decodificação diferencial de coeficiente de previsão linear, e a unidade de geração de alta frequência 2g à unidade de conversão inversa de frequência 2n do dispositivo de decodificação de voz da modificação 2 são funções realizadas quando a CPU do dispositivo de decodificação de voz da modificação 2 executa o programa de computador armazenado na memória interna do dispositivo de decodificação de voz da modificação 2. Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados executando-se o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de decodificação de voz da modificação 2.The modification 2 voice decoding device functionally includes a linear prediction coefficient differential decoding unit, which is not shown, instead of the filter resistance adjustment unit 2f of the speech decoding device 21. The separation unit bit flow rate 2a to the signal detection unit 2e, the linear prediction coefficient differential decoding unit, and the high frequency generation unit 2g to the 2n frequency reverse conversion unit of the modification 2 voice decoding device are functions performed when the CPU of the modification 2 voice decoding device executes the computer program stored in the internal memory of the modification 2 voice decoding device. Various types of data needed to run the computer program and various types of data generated by running the computer program are all stored in the internal memory such as the ROM and RAM of the di voice decoding device for modification 2.

A unidade de decodificação diferencial de coeficiente de previsão linear obtém aadj (n, r) diferencialmente decodificado de acordo com a seguinte expressão (15), com uso de aL (n, r) obtido a partir da unidade de análise de previsão linear de baixa frequência 2d e aD (n, r) recebido a partir da unidade de separação de fluxo de bit 2a.

Figure img0015
The linear decoding coefficient differential decoding unit obtains aadj (n, r) differentially decoded according to the following expression (15), using aL (n, r) obtained from the low linear prediction analysis unit frequency 2d and aD (n, r) received from the bit stream separation unit 2a.
Figure img0015

A unidade de decodificação diferencial de coeficiente de previsão linear transmite aadj (n, r) diferencialmente decodificado desta maneira para a unidade de filtro de previsão linear 2k. ao (n, r) pode ser um valor diferencial no domínio de coeficientes de previsão conforme ilustrado na expressão (14), mas pode ser um valor que toma uma diferença após converter um coeficiente de previsão à outra forma de expressão tal como LSP (Par de Espectros Lineares), ISP (Par de Espectros de Imitância), LSF (Frequência de Espectro Linear), ISF (Frequência de Espectro de Imitância), e coeficiente PARCOR. Neste caso, a decodificação diferencial também tem a mesma forma de expressão.The linear prediction coefficient differential decoding unit transmits aadj (n, r) differentially decoded in this way to the 2k linear prediction filter unit. ao (n, r) can be a differential value in the domain of forecast coefficients as illustrated in expression (14), but it can be a value that takes a difference after converting a forecast coefficient to another form of expression such as LSP (Par of Linear Spectra), ISP (Impairment Spectrum Pair), LSF (Linear Spectrum Frequency), ISF (Immitance Spectrum Frequency), and PARCOR coefficient. In this case, differential decoding also has the same form of expression.

(Segunda modalidade)(Second modality)

A figura 6 é um diagrama que ilustra um dispositivo de codificação de voz 12 de acordo com a segunda modalidade. O dispositivo de codificação de voz 12 inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 12 carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 7) armazenado em uma memória interna do dispositivo de codificação de voz 12 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 12 recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 12, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 12.Fig. 6 is a diagram illustrating a voice coding device 12 according to the second embodiment. Voice encoding device 12 physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls voice encoding device 12 by loading and running a computer program. predetermined (such as a computer program to perform the processes illustrated in the flowchart of figure 7) stored in an internal memory of the voice coding device 12 such as the ROM in RAM. The communication device of the voice coding device 12 receives a speech signal to be encoded from outside the speech coding device 12, and emits a multiplexed bit stream encoded out of the speech coding device 12.

O dispositivo de codificação de voz 12 funcionalmente inclui uma unidade de decimação de coeficiente de previsão linear 1j (meio de decimação de coeficiente de previsão), uma unidade de quantização de coeficiente de previsão 1k (meio de quantização de coeficiente de previsão), e a unidade de multiplexação de fluxo de bit 1g2 (meio de multiplexação de fluxo de bit), ao invés da unidade de cálculo de parâmetro de resistência de filtro 1f e da unidade de multiplexação de fluxo de bit 1g do dispositivo de codificação de voz 11. A unidade de conversão de frequência 1a à unidade de análise de previsão linear 1e (meio de análise de previsão linear), a unidade de decimação de coeficiente de previsão linear 1 j, a unidade de quantização de coeficiente de previsão 1 k, e a unidade de multiplexação de fluxo de bit 1g2 do dispositivo de codificação de voz 12 ilustradas na figura 6 são funções realizadas quando a CPU do dispositivo de codificação de voz 12 executa o programa de computador armazenado na memória interna do dispositivo de codificação de voz 12. A CPU do dispositivo de codificação de voz 12 sequencialmente executa processos (processos da Etapa Sa1 à Etapa Sa5, e processos da Etapa Sc1 à Etapa Sc3) ilustrados no fluxograma da figura 7, executando-se o programa de computador (ou com uso da unidade de conversão de frequência 1a à unidade de análise de previsão linear 1e, a unidade de decimação de coeficiente de previsão linear 1 j, a unidade de quantiza- ção de coeficiente de previsão 1 k, e a unidade de multiplexação de fluxo de bit 1g2 do dispositivo de codificação de voz 12 ilustrado na figura 6). Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados executando-se o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de codificação de voz 12.The voice coding device 12 functionally includes a linear prediction coefficient decimation unit 1j (prediction coefficient decimation medium), a prediction coefficient quantization unit 1k (prediction coefficient quantization means), and the 1g2 bit stream multiplexing unit (bit stream multiplexing medium), instead of the filter resistance parameter calculation unit 1f and the 1g bit stream multiplexing unit of the voice coding device 11. A frequency conversion unit 1a to linear prediction analysis unit 1e (linear prediction analysis medium), linear prediction coefficient decimation unit 1 j, prediction coefficient quantization unit 1 k, and multiplexing bit stream 1g2 of the voice coding device 12 illustrated in figure 6 are functions performed when the CPU of the voice coding device 12 executes the stored computer program o in the internal memory of the voice coding device 12. The CPU of the voice coding device 12 sequentially executes processes (processes from Step Sa1 to Step Sa5, and processes from Step Sc1 to Step Sc3) illustrated in the flowchart of figure 7, executing the computer program (or using the frequency conversion unit 1a to the linear prediction analysis unit 1e, the linear prediction coefficient decimation unit 1 j, the prediction coefficient quantization unit 1 k , and the bit stream multiplexing unit 1g2 of the voice coding device 12 shown in figure 6). Various types of data needed to run the computer program and various types of data generated by running the computer program are all stored in the internal memory such as the ROM and RAM of the voice coding device 12.

A unidade de decimação de coeficiente de previsão linear 1j decima an (n, r) obtido a partir da unidade de análise de previsão linear 1e na direção temporal, e transmite um valor para uma parte da abertura de tempo n e um valor que corresponde a n, em an (n, r) para a unidade de quantização de coeficiente de previsão 1k (processo na Etapa Sc1). Nota-se que 0<i<Nts, e Nts é o número de aberturas de tempo às quais aH (n, r) é transmitido em um quadro. A decimação dos coeficientes de previsão linear pode ser realizada em um intervalo de tempo predeterminado, ou pode ser realizada em um intervalo de tempo irregular baseado nas características de an (n, r). Por exemplo, um método é possível em que GH(r) de aH (n, r) é comparado em um quadro que tem um certo comprimento, e aH (n, r) é quantizado, se GH(r) exceder um certo valor. Se o intervalo de decimação do coeficiente de previsão linear for um intervalo predeterminado ao invés de usar as características de an (n, r), an (n, r) não precisa ser calculado para a abertura de tempo para a qual a transmissão não é realizada.The linear prediction coefficient decimation unit 1j decima n (n, r) obtained from the linear prediction analysis unit 1e in the temporal direction, and transmits a value for a part of the time gap n and a value corresponding to n, in an (n, r) for the 1k forecasting coefficient quantization unit (process in Step Sc1). Note that 0 <i <Nts, and Nts is the number of time slots to which aH (n, r) is transmitted in a frame. Decimation of the linear prediction coefficients can be performed in a predetermined time interval, or it can be performed in an irregular time interval based on the characteristics of an (n, r). For example, a method is possible in which GH (r) of aH (n, r) is compared in a frame that has a certain length, and aH (n, r) is quantized, if GH (r) exceeds a certain value . If the linear prediction coefficient decimation interval is a predetermined interval instead of using the characteristics of an (n, r), an (n, r) does not need to be calculated for the time gap for which the transmission is not fulfilled.

A unidade de quantização de coeficiente de previsão 1k quantiza o coeficiente de previsão linear de alta frequência decimado aH (n, n) recebido a partir da unidade de decimação de coeficiente de previsão linear 1j e um índice n da abertura de tempo correspondente, e transmite para a unidade de multiplexação de fluxo de bit 1 g2 (processo na Etapa Sc2). Como uma estrutura alternativa, ao invés de quantizar aH (n, n), um valor diferencial aD (n, n) dos coeficientes de previsão linear pode ser quantizado como o dispositivo de codificação de voz de acordo com a modificação 2 da primeira modalidade.The prediction coefficient quantization unit 1k quantizes the linear high frequency prediction coefficient decimated aH (n, n) received from the linear prediction coefficient decimation unit 1j and an index n of the corresponding time gap, and transmits for bit stream multiplexing unit 1 g2 (process in Step Sc2). As an alternative structure, instead of quantizing aH (n, n), a differential value aD (n, n) of the linear prediction coefficients can be quantized as the voice coding device according to modification 2 of the first modality.

A unidade de multiplexação de fluxo de bit 1g2 multiplexa o fluxo de bit codificado calculado pela unidade de codificação de codec central 1c, as informações suplementares de SBR calculadas pela unidade de codificação de SBR 1d, e um índice {n} de uma abertura de tempo que corresponde a aH (n, n) que é quantizado e recebido a partir da unidade de quantização de coeficiente de previsão 1k em um fluxo de bit, e emite o fluxo de bit multi5 plexado através do dispositivo de comunicação do dispositivo de codificação de voz 12 (processo na Etapa Sc3).The bit stream multiplexing unit 1g2 multiplexes the encoded bit stream calculated by the central codec coding unit 1c, the supplementary SBR information calculated by the SBR coding unit 1d, and a time slot index {n} which corresponds to H (n, n) which is quantized and received from the prediction coefficient quantization unit 1k in a bit stream, and outputs the multi5 bit stream plexed through the communication device of the voice coding device 12 (process in Step Sc3).

A figura 8 é um diagrama que ilustra o dispositivo de decodificação de voz 22 de acordo com a segunda modalidade. O dispositivo de decodificação de voz 22 inclui fisicamente uma CPU, uma ROM, uma RAM, um 10 dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz 22 carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 9) armazenado em uma memória interna do dispositivo de decodifi15 cação de voz 22 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 22 recebe o fluxo de bit multiplexado codificado emitido a partir do dispositivo de codificação de voz 12, e emite um sinal de voz decodificado para fora do dispositivo de codificação de voz 12. 20 O dispositivo de decodificação de voz 22 funcionalmente inclui uma unidade de separação de fluxo de bit 2a1 (meio de separação de fluxo de bit), uma unidade de interpolação/extrapolação de coeficiente de previsão linear 2p (meio de interpolação/extrapolação de coeficiente de previsão linear), e uma unidade de filtro de previsão linear 2k1 (meio de transformação de 25 envelope temporal) ao invés da unidade de separação de fluxo de bit 2a, da unidade de análise de previsão linear de baixa frequência 2d, da unidade de detecção de sinal 2e, da unidade de ajuste de resistência de filtro 2f, e da unidade de filtro de previsão linear 2k do dispositivo de decodificação de voz 21. A unidade de separação de fluxo de bit 2a1, a unidade de decodificação 30 de codec central 2b, a unidade de conversão de frequência 2c, a unidade de geração de alta frequência 2g à unidade de ajuste de alta frequência 2j, a unidade de filtro de previsão linear 2k1, a unidade de adição de coeficiente 2m, a unidade de conversão inversa de frequência 2n, e a unidade de interpolação/extrapolação de coeficiente de previsão linear 2p do dispositivo de decodificação de voz 22 ilustrado na figura 8 são funções realizadas quando a CPU do dispositivo de codificação de voz 22 executa o programa de com5 putador armazenado na memória interna do dispositivo de codificação de voz 22. A CPU do dispositivo de decodificação de voz 22 sequencialmente executa os processos (processos da Etapa Sb1 à Etapa Sd2, Etapa Sd1, da Etapa Sb5 á Etapa Sb8, Etapa Sd2, e da Etapa Sb10 à Etapa Sb11) ilustrados no fluxograma da figura 9, executando o programa de computador (ou 10 com uso da unidade de separação de fluxo de bit 2a1, da unidade de decodificação de codec central 2b, da unidade de conversão de frequência 2c, da unidade de geração de alta frequência 2g à unidade de ajuste de alta frequência 2j, da unidade de filtro de previsão linear 2k1, da unidade de adição de coeficiente 2m, da unidade de conversão inversa de frequência 2n, e da 15 unidade de interpolação/extrapolação de coeficiente de previsão linear 2p ilustrado na figura 8). Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados executando-se o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de decodificação de voz 22. 20 O dispositivo de decodificação de voz 22 inclui a unidade de separação de fluxo de bit 2a1, a unidade de interpolação/extrapolação de coeficiente de previsão linear 2p, e a unidade de filtro de previsão linear 2k1, ao invés da unidade de separação de fluxo de bit 2a, da unidade de análise de previsão linear de baixa frequência 2d, da unidade de detecção de sinal 2e, 25 da unidade de ajuste de resistência de filtro 2f, e da unidade de filtro de previsão linear 2k do dispositivo de decodificação de voz 22.Figure 8 is a diagram illustrating the voice decoding device 22 according to the second embodiment. The voice decoding device 22 physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice decoding device 22 by loading and running a voice program. predetermined computer (such as a computer program to perform the processes illustrated in the flowchart of figure 9) stored in an internal memory of the voice decoding device 22 such as the ROM in RAM. The communication device of the voice decoding device 22 receives the encoded multiplexed bit stream emitted from the speech coding device 12, and outputs a decoded speech signal out of the speech coding device 12. 20 The decoding device speech decoding 22 functionally includes a bit stream separation unit 2a1 (bit stream separation means), a linear prediction coefficient interpolation / extrapolation unit 2p (linear prediction coefficient interpolation / extrapolation means), and a linear prediction filter unit 2k1 (25 time envelope transformation medium) instead of the bit stream separation unit 2a, the low frequency linear prediction analysis unit 2d, the signal detection unit 2e, the filter resistance adjustment unit 2f, and the linear prediction filter unit 2k of the voice decoder 21. The bit stream separation unit 2a1, the central codec decoding unit 2b, the frequency conversion unit 2c, the high frequency generation unit 2g to the high frequency adjustment unit 2j, the linear prediction filter unit 2k1, the coefficient addition unit 2m, the 2n frequency inverse conversion unit, and the linear prediction coefficient 2p interpolation / extrapolation unit of the voice decoding device 22 illustrated in figure 8 are functions performed when the CPU of the voice coding device 22 executes the voice program com5 puter stored in the internal memory of the voice coding device 22. The CPU of the voice decoding device 22 sequentially executes the processes (processes from Step Sb1 to Step Sd2, Step Sd1, from Step Sb5 to Step Sb8, Step Sd2, and from Step Sb10 to Step Sb11) illustrated in the flowchart of figure 9, running the computer program (or 10 using the bit stream separation unit 2a1, the codec cent decoding unit ral 2b, from the frequency conversion unit 2c, from the high frequency generation unit 2g to the high frequency adjustment unit 2j, from the linear forecast filter unit 2k1, from the coefficient addition unit 2m, from the reverse conversion unit frequency 2n, and the linear prediction coefficient 2p interpolation / extrapolation unit illustrated in figure 8). Various types of data needed to run the computer program and various types of data generated by running the computer program are all stored in the internal memory such as the ROM and RAM of the voice decoding device 22. 20 The decoding device voice 22 includes the bit stream separation unit 2a1, the linear prediction coefficient interpolation / extrapolation unit 2p, and the linear prediction filter unit 2k1, instead of the bit stream separation unit 2a, from low frequency linear prediction analysis unit 2d, signal detection unit 2e, 25 of filter resistance adjustment unit 2f, and linear prediction filter unit 2k of voice decoding device 22.

A unidade de separação de fluxo de bit 2a1 separa o fluxo de bit multiplexado fornecido através do dispositivo de comunicação do dispositivo de decodificação de voz 22 no índice r, da abertura de tempo que corres30 ponde a aH (n, n) que é quantizado, as informações suplementares de SBR, e o fluxo de bit codificado.The bit stream separation unit 2a1 separates the multiplexed bit stream provided through the communication device of the voice decoding device 22 at index r, from the time slot corresponding to the aH (n, n) which is quantized, supplementary SBR information, and the encoded bit stream.

A unidade de interpolação/extrapolação de coeficiente de previsão linear 2p recebe o indice r, da abertura de tempo que corresponde a aH (n, π) que é quantizada a partir da unidade de separação de fluxo de bit 2a1, e obtém an (n, r) que corresponde à abertura de tempo para a qual o coeficiente de previsão linear não é transmitido, por interpolação ou extrapolação (processos na Etapa Sd1). A unidade de interpolação/extrapolação de coeficiente de previsão linear 2p pode extrapolar o coeficiente de previsão linear, por exemplo, de acordo com a seguinte expressão (16).

Figure img0016
em que ri0 é o valor mais próximo de r na abertura de tempo {n} para a qual o coeficiente de previsão linear é transmitido, δ é uma constante que satisfaz 0<δ<1.The linear prediction coefficient interpolation / extrapolation unit 2p receives the index r, of the time gap that corresponds to H (n, π) which is quantized from the bit stream separation unit 2a1, and obtains an (n , r) which corresponds to the time gap for which the linear forecast coefficient is not transmitted, by interpolation or extrapolation (processes in Step Sd1). The linear prediction coefficient 2p interpolation / extrapolation unit can extrapolate the linear prediction coefficient, for example, according to the following expression (16).
Figure img0016
where ri0 is the closest value to r at the time opening {n} for which the linear forecast coefficient is transmitted, δ is a constant that satisfies 0 <δ <1.

A unidade de interpolação/extrapolação de coeficiente de previsão linear 2p pode interpolar o coeficiente de previsão linear, por exemplo, de acordo com a seguinte expressão (17), em que rjo<r<rjO+i é satisfeito.

Figure img0017
The linear prediction coefficient 2p interpolation / extrapolation unit can interpolate the linear prediction coefficient, for example, according to the following expression (17), in which rjo <r <rjO + i is satisfied.
Figure img0017

A unidade de interpolação/extrapolação de coeficiente de previsão linear 2p pode converter o coeficiente de previsão linear em outras formas de expressão tal como LSP (Par de Espectros Lineares), ISP (Par de Espectros de Imitância), LSF (Frequência de Espectro Linear), ISF (Frequência de Espectro de Imitância), e coeficiente PARCOR, interpolar ou extrapolar este, e converter o valor obtido no coeficiente de previsão linear a ser usado, an (n, r) que é interpolado ou extrapolado é transmitido para a unidade de filtro de previsão linear 2k1 e usado como um coeficiente de previsão linear para a filtragem de síntese de previsão linear, mas pode ser também usado como um coeficiente de previsão linear na unidade de filtro inverso de previsão linear 2i. Se ao (n, n) for multiplexado em um fluxo de bit ao invés de aH (n, r), a unidade de interpolação/extrapolação de coeficiente de previsão linear 2p realiza a decodificação diferencial similar àquela do dispositivo de decodificação de voz de acordo com a modificação 2 da primeira modalidade, antes de realizar o processo de interpolação ou extrapolação descrito acima.The linear prediction coefficient 2p interpolation / extrapolation unit can convert the linear prediction coefficient into other forms of expression such as LSP (Linear Spectrum Pair), ISP (Immittance Spectrum Pair), LSF (Linear Spectrum Frequency) , ISF (Immitance Spectrum Frequency), and PARCOR coefficient, interpolate or extrapolate this, and convert the value obtained into the linear forecast coefficient to be used, an (n, r) that is interpolated or extrapolated is transmitted to the linear forecast filter 2k1 and used as a linear forecast coefficient for linear forecast synthesis filtering, but it can also be used as a linear forecast coefficient in the linear prediction 2i reverse filter unit. If ao (n, n) is multiplexed in a bit stream instead of aH (n, r), the linear prediction coefficient 2p interpolation / extrapolation unit performs differential decoding similar to that of the voice decoding device accordingly with modification 2 of the first modality, before carrying out the interpolation or extrapolation process described above.

A unidade de filtro de previsão linear 2k1 realiza a filtragem de síntese de previsão linear na direção de frequência em qadJ (n, r) emitido a partir da unidade de ajuste de alta frequência 2j, com uso de an (n, r) que é interpolado ou extrapolado obtido a partir da unidade de interpolação/extrapolação de coeficiente de previsão linear 2p (processo na Etapa Sd2). Uma função de transferência da unidade de filtro de previsão linear 2k1 pode ser expressa como a seguinte expressão (18). A unidade de filtro de previsão linear 2k1 transforma o envelope temporal dos componentes de alta frequência gerados pela SBR realizando a filtragem de síntese de previsão linear, como a unidade de filtro de previsão linear 2k do dispositivo de decodificação de voz 21.

Figure img0018
The 2k1 linear forecast filter unit performs linear forecast synthesis filtering in the frequency direction in qadJ (n, r) emitted from the high frequency adjustment unit 2j, using an (n, r) which is interpolated or extrapolated obtained from the linear prediction coefficient 2p interpolation / extrapolation unit (process in Step Sd2). A transfer function of the linear prediction filter unit 2k1 can be expressed as the following expression (18). The 2k1 linear forecast filter unit transforms the time envelope of the high frequency components generated by SBR by performing the linear forecast synthesis filtering, such as the 2k linear forecast filter unit of the voice decoding device 21.
Figure img0018

(Terceira modalidade)(Third modality)

Afigura 10 é um diagrama que ilustra um dispositivo de codificação de voz 13 de acordo com a terceira modalidade. O dispositivo de codificação de voz 13 inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 13 carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 11) armazenado em uma memória interna do dispositivo de codificação de voz 13 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 13 recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 13, e outputs um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 13.Figure 10 is a diagram illustrating a voice coding device 13 according to the third embodiment. The voice encoding device 13 physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the voice encoding device 13 by loading and running a computer program. predetermined (such as a computer program to perform the processes illustrated in the flowchart of figure 11) stored in an internal memory of the voice coding device 13 such as the ROM in RAM. The communication device of the speech coding device 13 receives a speech signal to be encoded from outside the speech coding device 13, and outputs a multiplexed bit stream encoded out of the speech coding device 13.

O dispositivo de codificação de voz 13 funcionalmente inclui uma unidade de cálculo de envelope temporal 1m (meio de cálculo de informações suplementares de envelope temporal), uma unidade de cálculo de parâmetro de formato de envelope 1n (meio de cálculo de informações suplementares de envelope temporal), e uma unidade de multiplexação de fluxo de bit 1g3 (meio de multiplexação de fluxo de bit), ao invés da unidade de análise de previsão linear 1e, da unidade de cálculo de parâmetro de resistência de filtro 1f, e da unidade de multiplexação de fluxo de bit 1g do dispositivo de codificação de voz 11. A unidade de conversão de frequência 1a à unidade de codificação de SBR 1 d, a unidade de cálculo de envelope temporal 1m, a unidade de cálculo de parâmetro de formato de envelope 1n, e a unidade de multiplexação de fluxo de bit 1g3 do dispositivo de codificação de voz 13 ilustrado na figura 10 são funções realizadas quando a CPU do dispositivo de codificação de voz 13 executa o programa de computador armazenado na memória interna do dispositivo de codificação de voz 13. A CPU do dispositivo de codificação de voz 13 sequencialmente executa os processos (processos da Etapa Sa1 à Etapa Sa 4 e da Etapa Se1 à Etapa Se3) ilustrados no fluxograma da figura 11, executando o programa de computador (ou com uso da unidade de conversão de frequência 1a à unidade de codificação de SBR 1d, a unidade de cálculo de envelope temporal 1m, a unidade de cálculo de parâmetro de formato de envelope 1n, e a unidade de multiplexação de fluxo de bit 1g3 do dispositivo de codificação de voz 13 ilustrado na figura 10). Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados executando-se o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de codificação de voz 13.The voice encoding device 13 functionally includes a 1m time envelope calculation unit (means of calculating supplemental time envelope information), a 1n envelope format parameter calculation unit (means of calculating supplemental time envelope information) ), and a 1g3 bit stream multiplexing unit (bit stream multiplexing medium), instead of the linear forecast analysis unit 1e, the filter resistance parameter calculation unit 1f, and the multiplexing unit bit flow rate 1g from the voice coding device 11. The frequency conversion unit 1a to the SBR coding unit 1d, the time envelope calculation unit 1m, the envelope format parameter calculation unit 1n, and the bit stream multiplexing unit 1g3 of the voice coding device 13 illustrated in figure 10 are functions performed when the CPU of the voice coding device 13 executes the program d and computer stored in the internal memory of the voice coding device 13. The CPU of the voice coding device 13 sequentially executes the processes (processes from Step Sa1 to Step Sa 4 and from Step Se1 to Step Se3) illustrated in the flowchart of figure 11 running the computer program (or using the frequency conversion unit 1a to the SBR coding unit 1d, the temporal envelope calculation unit 1m, the envelope format parameter calculation unit 1n, and the multiplexing bit stream 1g3 of the voice coding device 13 shown in figure 10). Various types of data needed to run the computer program and various types of data generated by running the computer program are all stored in internal memory such as the ROM and RAM of the voice encoding device 13.

A unidade de cálculo de envelope temporal 1m recebe q (k, r), e, por exemplo, obtém informações de envelope temporal e(r) dos componentes de alta frequência de um sinal, obtendo a força de cada abertura de tempo de q (k, r) (processo na Etapa Se1). Neste caso, e(r) é obtido de acordo com a seguinte expressão (19).

Figure img0019
The time envelope calculation unit 1m receives q (k, r), and, for example, obtains time envelope information and (r) from the high frequency components of a signal, obtaining the strength of each time gap of q ( k, r) (process in Step Se1). In this case, e (r) is obtained according to the following expression (19).
Figure img0019

A unidade de cálculo de parâmetro de formato de envelope 1n recebe e(r) a partir da unidade de cálculo de envelope temporal 1m e recebe uma borda de tempo de envelope de SBR {bi} a partir da unidade de codificação de SBR 1d. Nota-se que 0<i<Ne, e Ne é o número de envelopes de SBR no quadro codificado. A unidade de cálculo de parâmetro de formato de envelope 1 n obtém um parâmetro de formato de envelope s(i) (0<i<Ne) de cada urn dos envelopes de SBR no quadro codificado de acordo com a seguinte expressão (20) (processo na Etapa Se2). O parâmetro de formato de envelope s(i) corresponde às informações suplementares de envelope temporal, e é similar na terceira modalidade.

Figure img0020
Nota-se que:
Figure img0021
em que s(i) na expressão acima é um parâmetro que indica a magnitude da variação de e(r) no i° envelope de SBR que satisfaz bj<r<bj+i, e e(r) toma um número maior conforme a variação do envelope temporal é aumentado. As expressões (20) e (21) descritas acima são exemplos de método para calcular s(i), e, por exemplo, s(i) pode ser também obtido com uso de, por exemplo, SMF (Medida de Planeza Espectral) de e(r), uma razão do valor máximo para p valor mínimo, e similares. s(i) é então quantizado e transmitido para a unidade de multiplexação de fluxo de bit 1g3.The envelope format parameter calculation unit 1n receives e (r) from the temporal envelope calculation unit 1m and receives an SBR {bi} envelope time edge from the SBR encoding unit 1d. Note that 0 <i <Ne, and Ne is the number of SBR envelopes in the coded frame. The envelope format parameter calculation unit 1 n obtains an envelope format parameter s (i) (0 <i <Ne) from each of the SBR envelopes in the coded table according to the following expression (20) ( process in Step Se2). The envelope format parameter s (i) corresponds to the supplementary temporal envelope information, and is similar in the third modality.
Figure img0020
Note that:
Figure img0021
where s (i) in the above expression is a parameter that indicates the magnitude of the variation of e (r) in the 1st SBR envelope that satisfies bj <r <bj + i, and e (r) takes a larger number according to the variation of the temporal envelope is increased. The expressions (20) and (21) described above are examples of a method for calculating s (i), and, for example, s (i) can also be obtained using, for example, SMF (Spectral Flatness Measure) of and (r), a ratio of the maximum value to the minimum value, and the like. s (i) is then quantized and transmitted to the 1g3 bit stream multiplexing unit.

A unidade de multiplexação de fluxo de bit 1g3 multiplexa o fluxo de bit codificado calculado pela unidade de codificação de codec central 1c, as informações suplementares de SBR calculadas peça unidade de codificação de SBR 1 d, e s(i) em um fluxo de bit, e emite o fluxo de bit multiplexado através do dispositivo de comunicação do dispositivo de codificação de voz 13 (processo na Etapa Se3). Afigura 12 é um diagrama que ilustra um dispositivo de decodificação de voz 23 de acordo com a terceira modalidade. O dispositivo de decodificação de voz 23 inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz 23 carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 13) armazenado em uma memória interna do dispositivo de decodificação de voz 23 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 23 recebe o fluxo de bit multiplexado codificado emitido a partir do dispositivo de codificação de voz 13, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 13.The 1g3 bit stream multiplexing unit multiplexes the encoded bit stream calculated by the central codec coding unit 1c, the supplementary SBR information calculated by the SBR coding unit 1 d, es (i) in a bit stream, and outputs the multiplexed bit stream through the communication device of the voice coding device 13 (process in Step Se3). Figure 12 is a diagram illustrating a voice decoding device 23 according to the third embodiment. The voice decoding device 23 physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice decoding device 23 by loading and running a computer program. predetermined (such as a computer program to perform the processes illustrated in the flowchart of figure 13) stored in an internal memory of the voice decoding device 23 such as the ROM in RAM. The communication device of the voice decoding device 23 receives the encoded multiplexed bit stream emitted from the speech coding device 13, and outputs a decoded speech signal out of the speech decoding device 13.

O dispositivo de decodificação de voz 23 funcionalmente inclui uma unidade de separação de fluxo de bit 2a2 (meio de separação de fluxo de bit), uma unidade de cálculo de envelope temporal de baixa frequência 2r (meio de análise de envelope temporal de baixa frequência), uma unidade de ajuste de formato de envelope 2s (meio de ajuste de envelope temporal), uma unidade de cálculo de envelope temporal de alta frequência 2t, uma unidade de suavização de envelope temporal 2u, e uma unidade de transformação de envelope temporal 2v (meio de transformação de envelope temporal), ao invés da unidade de separação de fluxo de bit 2a, da unidade de análise de previsão linear de baixa frequência 2d, da unidade de detecção de sinal 2e, da unidade de ajuste de resistência de filtro 2f, a unidade de análise de previsão linear de alta frequência 2h, da unidade de filtro inverso de previsão linear 2i, e a unidade de filtro de previsão linear 2k do dispositivo de decodificação de voz 21. A unidade de separação de fluxo de bit 2a2, a unidade de decodificação de codec central 2b à unidade de conversão de frequência 2c, a unidade de geração de alta frequência 2g, a unidade de ajuste de alta frequência 2j, a unidade de adição de coeficiente 2m, a unidade de conversão inversa de frequência 2n, e a unidade de cálculo de envelope temporal de baixa frequência 2r à unidade de transformação de envelope temporal 2v do dispositivo de decodificação de voz 23 ilustradas na figura 12 são funções realizadas quando a CPU do dispositivo de codificação de voz 23 executa o programa de computador armazenado na memória interna do dispositivo de codificação de voz 23. A CPU do dispositivo de decodificação de voz 23 sequencialmente executa os processos (processos da Etapa Sb1 à Etapa Sb2, da Etapa Sf1 à Etapa Sf2, Etapa Sb5, da Etapa Sf3 à Etapa Sf4, Etapa Sb8, Etapa Sf5, e da Etapa Sb10 à Etapa Sb11) ilustrados no fluxograma da figura 13, executando o programa de computador (ou com uso da unidade de separação de fluxo de bit 2a2, da unidade de decodificação de codec central 2b à unidade de conversão de frequência 2c, da unidade de geração de alta frequência 2g, da unidade de ajuste de alta frequência 2j, da unidade de adição de coeficiente 2m, da unidade de conversão inversa de frequência 2n, e da unidade de cálculo de envelope temporal de baixa frequência 2r à unidade de transformação de envelope temporal 2v do dispositivo de decodificação de voz 23 ilustradas na figura 12). Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados executando-se o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de decodificação de voz 23.The voice decoding device 23 functionally includes a bit stream separation unit 2a2 (bit stream separation means), a low frequency time envelope calculation unit 2r (low frequency time envelope analysis means) , a 2s envelope shape adjustment unit (time envelope adjustment means), a 2t high frequency time envelope calculation unit, a 2u time envelope smoothing unit, and a 2v time envelope transformation unit ( time envelope transformation means), instead of the bit flow separation unit 2a, the low frequency linear prediction analysis unit 2d, the signal detection unit 2e, the filter resistance adjustment unit 2f, the 2h high frequency linear prediction analysis unit, the 2i linear prediction reverse filter unit, and the 2k linear prediction filter unit of the voice decoding device 21. The sep unit bit stream ar2a2, the central codec decoding unit 2b to the frequency conversion unit 2c, the high frequency generation unit 2g, the high frequency adjustment unit 2j, the coefficient addition unit 2m, the frequency inversion conversion unit 2n, and the low frequency temporal envelope calculation unit 2r to the temporal envelope transformation unit 2v of the voice decoding device 23 illustrated in figure 12 are functions performed when the CPU of the voice encoding device voice 23 executes the computer program stored in the internal memory of the voice coding device 23. The CPU of the voice decoding device 23 sequentially executes the processes (processes from Step Sb1 to Step Sb2, from Step Sf1 to Step Sf2, Step Sb5 , from Step Sf3 to Step Sf4, Step Sb8, Step Sf5, and from Step Sb10 to Step Sb11) illustrated in the flowchart of figure 13, running the computer program (or using the separation unit) bit flow rate 2a2, from the central codec decoding unit 2b to the frequency conversion unit 2c, the high frequency generation unit 2g, the high frequency adjustment unit 2j, the coefficient addition unit 2m, the frequency inversion conversion unit 2n, and the low frequency temporal envelope calculation unit 2r to the temporal envelope transformation unit 2v of the voice decoding device 23 illustrated in figure 12). Various types of data needed to run the computer program and various types of data generated by running the computer program are all stored in internal memory such as the ROM and RAM of the voice decoding device 23.

A unidade de separação de fluxo de bit 2a2 separa o fluxo de bit multiplexado fornecido através do dispositivo de comunicação do dispositivo de decodificação de voz 23 em s(i), as informações suplementares de SBR e o fluxo de bit codificado. A unidade de cálculo de envelope temporal de baixa frequência 2r recebe qdec (k, r) que inclui os componentes de baixa frequência a partir da unidade de conversão de frequência 2c, e obtém e(r) de acordo com a seguinte expressão (22) (processo na Etapa Sf1).

Figure img0022
The bit stream separation unit 2a2 separates the multiplexed bit stream provided through the communication device of the voice decoding device 23 in s (i), the supplementary SBR information and the encoded bit stream. The low frequency temporal envelope calculation unit 2r receives qdec (k, r) which includes the low frequency components from the frequency conversion unit 2c, and obtains e (r) according to the following expression (22) (process in Step Sf1).
Figure img0022

A unidade de ajuste de formato de envelope 2s ajusta e(r) com uso de s(i), e obtém as informações de envelope temporal ajustadas eacij(r) (processo na Etapa Sf2). e(r) pode ser ajustado, por exemplo, de acordo com as seguintes expressões (23) a (25).

Figure img0023
Nota-se que:
Figure img0024
The envelope format adjustment unit 2s adjusts e (r) using s (i), and obtains the adjusted time envelope information eacij (r) (process in Step Sf2). and (r) can be adjusted, for example, according to the following expressions (23) to (25).
Figure img0023
Note that:
Figure img0024

As expressões (23) a (25) descritas acima são um exemplo de um método de ajuste, e o outro método de ajuste para o qual o formato de eacij(r) se torna similar ao formato ilustrado por(i) pode ser também usado.The expressions (23) to (25) described above are an example of an adjustment method, and the other adjustment method for which the eacij (r) format becomes similar to the format illustrated by (i) can also be used .

A unidade de cálculo de envelope temporal de alta frequência 2t calcula um envelope temporal eexp(r) com uso de qexp (k, r) obtido a partir da unidade de geração de alta frequência 2g, de acordo com a seguinte expressão (26) (processo na Etapa Sf3).

Figure img0025
The high frequency 2t time envelope calculation unit calculates an eexp (r) time envelope using qexp (k, r) obtained from the 2g high frequency generation unit, according to the following expression (26) ( process in Step Sf3).
Figure img0025

A unidade de suavização de envelope temporal 2u suaviza o envelope temporal de qexp (k, r) obtido a partir da unidade de geração de alta frequência 2g de acordo com a seguinte expressão (27), e transmite o sinal obtido qfiat (k, r) no domínio de QMF para a unidade de ajuste de alta frequência 2j (processo na Etapa Sf4).

Figure img0026
The time envelope smoothing unit 2u smooths the time envelope of qexp (k, r) obtained from the high frequency generation unit 2g according to the following expression (27), and transmits the obtained signal qfiat (k, r ) in the QMF domain for the high frequency tuning unit 2j (process in Step Sf4).
Figure img0026

A suavização do envelope temporal pela unidade de suavização de envelope temporal 2u pode ser também omitida. Ao invés de calcular o envelope temporal dos componentes de alta frequência da saída a partir da unidade de geração de alta frequência 2g e suavizar o envelope temporal da mesma, o envelope temporal dos componentes de alta frequência de uma saída a partir da unidade de ajuste de alta frequência 2j pode ser calculado, e o envelope temporal dos mesmos podem ser suavizados. O envelope temporal usado na unidade de suavização de envelope temporal 2u pode ser também eacij(r) obtido a partir da unidade de ajuste de formato de envelope 2s, ao invés de eexp(r) obtido a partir da unidade de cálculo de envelope temporal de alta frequência 2t.The time envelope smoothing by the time envelope smoothing unit 2u can also be omitted. Instead of calculating the time envelope of the high frequency components of the output from the high frequency generation unit 2g and smoothing the time envelope of the same, the time envelope of the high frequency components of an output from the adjustment unit of high frequency 2j can be calculated, and their time envelope can be smoothed. The time envelope used in the time envelope smoothing unit 2u can also be obtained from the envelope format adjustment unit 2s, instead of eexp (r) obtained from the time envelope calculation unit. high frequency 2t.

A unidade de transformação de envelope temporal 2v transforma o Aadj (k, 0 obtido a partir da unidade de ajuste de alta frequência 2j com uso de eadj(r) obtido a partir da unidade de transformação de envelope temporal 2v, e obtém um sinal qθnvadj (k, r) no domínio de QMF em que o envelope temporal é transformado (processo na Etapa Sf5). A transformação é realizada de acordo com a seguinte expressão (28). qθnvadj (k, r) é transmitido para a unidade de adição de coeficiente 2m como um sinal no domínio de QMF que corresponde aos componentes de alta frequência.

Figure img0027
The temporal envelope transformation unit 2v transforms the Aadj (k, 0 obtained from the high frequency adjustment unit 2j using eadj (r) obtained from the temporal envelope transformation unit 2v, and obtains a signal qθnvadj (k, r) in the QMF domain in which the time envelope is transformed (process in Step Sf5) The transformation is performed according to the following expression (28). qθnvadj (k, r) is transmitted to the addition unit coefficient 2m as a signal in the QMF domain that corresponds to the high frequency components.
Figure img0027

(Quarta modalidade)(Fourth modality)

Afigura 14 é um diagrama que ilustra um dispositivo de decodificação de voz 24 de acordo com a quarta modalidade. O dispositivo de decodificação de voz 24 inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz 24 carregando e executando a programa de computador predeterminado armazenado em uma memória interna do dispositivo de decodificação de voz 24 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 24 recebe o fluxo de bit multiplexado codificado emitido a partir do dispositivo de codificação de voz 11 ou do dispositivo de codificação de voz 13, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 24.Figure 14 is a diagram illustrating a voice decoding device 24 according to the fourth embodiment. The voice decoding device 24 physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the voice decoding device 24 by loading and running the computer program. predetermined data stored in an internal memory of the voice decoding device 24 such as ROM in RAM. The communication device of the voice decoding device 24 receives the encoded multiplexed bit stream emitted from the voice coding device 11 or the voice coding device 13, and outputs a decoded speech signal out of the decoding device of voice 24.

O dispositivo de decodificação de voz 24 funcionalmente inclui a estrutura do dispositivo de decodificação de voz 21 (a unidade de decodificação de codec central 2b, a unidade de conversão de frequência 2c, a unidade de análise de previsão linear de baixa frequência 2d, a unidade de detecção de sinal 2e, a unidade de ajuste de resistência de filtro 2f, a unidade de geração de alta frequência 2g, a unidade de análise de previsão linear de alta frequência 2h, a unidade de filtro inverso de previsão linear 2i, a unidade de ajuste de alta frequência 2j, a unidade de filtro de previsão linear 2k, a unidade de adição de coeficiente 2m, e a unidade de conversão inversa de frequência 2n) e a estrutura do dispositivo de decodificação de voz 23 (a unidade de cálculo de envelope temporal de baixa frequência 2r, a unidade de ajuste de formato de envelope 2s, e a unidade de transformação de envelope temporal 2v). O dispositivo de decodificação de voz 24 também inclui uma unidade de separação de fluxo de bit 2a3 (meio de separação de fluxo de bit) e uma unidade de conversão de informações suplementares 2w. A ordem da unidade de filtro de previsão linear 2k e da unidade de transformação de envelope temporal 2v pode ser oposta àquela ilustrada na figura 14. O dispositivo de decodificação de voz 24 preferencialmente recebe o fluxo de bit codificado pelo dispositivo de codificação de voz 11 ou pelo dispositivo de codificação de voz 13. A estrutura do dispositivo de decodificação de voz 24 ilustrada na figura 14 é uma função realizada quando a CPU do dispositivo de decodificação de voz 24 executa o programa de computador armazenado na memória interna do dispositivo de decodificação de voz 24. Vários tipos de dados necessários para executar o programa de computador e vários tipos de dados gerados executando-se o programa de computador são todos armazenados na memória interna tal como a ROM e a RAM do dispositivo de decodificação de voz 24.The voice decoding device 24 functionally includes the structure of the voice decoding device 21 (the central codec decoding unit 2b, the frequency conversion unit 2c, the low frequency linear prediction analysis unit 2d, the unit signal detection unit 2e, the filter resistance adjustment unit 2f, the high frequency generation unit 2g, the high frequency linear forecast analysis unit 2h, the linear forecast reverse filter unit 2i, the high frequency adjustment 2j, the linear prediction filter unit 2k, the coefficient addition unit 2m, and the frequency inversion conversion unit 2n) and the structure of the voice decoding device 23 (the envelope calculation unit low-frequency temporal 2r, the envelope format adjustment unit 2s, and the temporal envelope transformation unit 2v). The voice decoding device 24 also includes a bit stream separation unit 2a3 (bit stream separation means) and a supplementary information conversion unit 2w. The order of the linear prediction filter unit 2k and the temporal envelope transformation unit 2v can be opposite to that shown in figure 14. The voice decoding device 24 preferably receives the bit stream encoded by the voice coding device 11 or by the voice coding device 13. The structure of the voice decoding device 24 illustrated in figure 14 is a function performed when the CPU of the voice decoding device 24 executes the computer program stored in the internal memory of the voice decoding device 24. Various types of data needed to run the computer program and various types of data generated by running the computer program are all stored in internal memory such as the ROM and RAM of the voice decoding device 24.

A unidade de separação de fluxo de bit 2a3 separa o fluxo de bit multiplexado fornecido através do dispositivo de comunicação do dispositivo de decodificação de voz 24 nas informações suplementares de envelope temporal, nas informações suplementares de SBR, e o fluxo de bit codificado. As informações suplementares de envelope temporal pode ser também K(r) descrito na primeira modalidade ou s(i) descrito na terceira modalidade. As informações suplementares de envelope temporal podem ser também outro parâmetro X(r) que não é nem K(r) nem s(i).The bit stream separation unit 2a3 separates the multiplexed bit stream provided through the communication device of the voice decoding device 24 into the supplementary time envelope information, the supplementary SBR information, and the encoded bit stream. Supplementary time envelope information can also be K (r) described in the first modality or s (i) described in the third modality. Supplementary time envelope information can also be another parameter X (r) that is neither K (r) nor s (i).

A unidade de conversão de informações suplementares 2w converte as informações suplementares de envelope temporal fornecidas para obter K(r) e s(i). Se as informações suplementares de envelope temporal for K(r), a unidade de conversão de informações suplementares 2w converte K(r) em s(i). A unidade de conversão de informações suplementares 2w pode também obter, por exemplo, um valor médio de K(r) em uma seção de bj<r<bi+1

Figure img0028
e converter o valor médio representado na expressão (29) em s(i) com uso de uma tabela predeterminada. Se as informações suplementares de envelope temporal forem s(i), a unidade de conversão de informações suplementares 2w converte s(i) em K(r). A unidade de conversão de informações suplementares 2w pode também realizar a conversão convertendo s(i) em K(r), por exemplo, com uso de uma tabela predeterminada. Nota-se que i e r estão associados entre si assim como para satisfazer a relação de bi<r<bi+1.The supplementary information conversion unit 2w converts the supplemental time envelope information provided to obtain K (r) and (i). If the supplementary time envelope information is K (r), the supplementary information conversion unit 2w converts K (r) to s (i). The additional information conversion unit 2w can also obtain, for example, an average value of K (r) in a section of bj <r <bi + 1
Figure img0028
and converting the average value represented in expression (29) into s (i) using a predetermined table. If the supplementary time envelope information is s (i), the supplementary information conversion unit 2w converts s (i) to K (r). The additional information conversion unit 2w can also perform the conversion by converting s (i) to K (r), for example, using a predetermined table. Note that ier are associated with each other as well as to satisfy the bi <r <bi + 1 ratio.

Se as informações suplementares de envelope temporal forem um parâmetro X(r) que não é nem s(i) nem K(r), a unidade de conversão de informações suplementares 2w converte X(r) em K(r) e s(i). É preferível que a unidade de conversão de informações suplementares 2w converta X(r) em K(r) e s(i), por exemplo, com uso de uma tabela predeterminada. É também preferível que a unidade de conversão de informações suplementares 2w transmita X(r) para cada envelope de SBR como um valor representativo. As tabelas para converter X(r) em K(r) e s(i) podem ser diferentes uma da outra.If supplemental time envelope information is an X (r) parameter that is neither s (i) nor K (r), the 2w supplementary information conversion unit converts X (r) to K (r) and es (i) . It is preferable that the supplementary information conversion unit 2w converts X (r) to K (r) and s (i), for example, using a predetermined table. It is also preferred that the supplementary information conversion unit 2w transmit X (r) to each SBR envelope as a representative value. The tables for converting X (r) to K (r) and s (i) can be different from each other.

(Modificação 3 da Primeira modalidade)(Modification 3 of the First modality)

No dispositivo de decodificação de voz 21 da primeira modalidade, a unidade de filtro de previsão linear 2k do dispositivo de decodificação de voz 21 pode incluir um processo de controle de ganho automático. O processo de controle de ganho automático é um processo para ajustar a força do sinal no domínio de QMF emitido a partir da unidade de filtro de previsão linear 2k para a força do sinal no domínio de QMF que é fornecido. Em geral, um sinal qsyn,pow (n, r) no domínio de QMF cujo ganho foi controlado é realizado pela seguinte expressão.

Figure img0029
In the voice decoding device 21 of the first embodiment, the linear prediction filter unit 2k of the voice decoding device 21 may include an automatic gain control process. The automatic gain control process is a process for adjusting the signal strength in the QMF domain emitted from the linear prediction filter unit 2k for the signal strength in the QMF domain that is provided. In general, a qsyn, pow (n, r) signal in the QMF domain whose gain has been controlled is realized by the following expression.
Figure img0029

Aqui, P0(r) e Pi(r) são expressos pela seguinte expressão (31) e a expressão (32).

Figure img0030
Here, P0 (r) and Pi (r) are expressed by the following expression (31) and the expression (32).
Figure img0030

Executando o processo de controle de ganho automático, a força dos componentes de alta frequência do sinal emitido a partir da unidade de filtro de previsão linear 2k é ajustada em um valor equivalente àquele antes da filtragem de previsão linear. Como resultado, no sinal emitido da unidade de filtro de previsão linear 2k em que o envelope temporal dos componentes de alta frequência gerados com base em SBR é transformado, o efeito do ajuste da força do sinal de alta frequência realizado pela unidade de ajuste de alta frequência 2j pode ser mantido. O processo de controle de ganho automático pode ser também realizado individualmente em uma certa faixa de frequência do sinal no domínio de QMF. O processo realizado na faixa de frequência individual pode ser realizado limitando-se n na expressão (30), a expressão (31), e a expressão (32) dentro de uma certa faixa de frequência. Por exemplo, a i° faixa de frequência pode ser expressa como Fj<n<Fi+1 (neste caso, i é um índice que indica o número de uma certa faixa de frequência do sinal no domínio de QMF). Fj indica o limite da faixa de frequência, e é preferível que Fi seja uma tabela de limite de frequência de um fator de escala de envelope definido em SBR em "MPEG4 AAC". A tabela de limite de frequência é definida pela unidade de geração de alta frequência 2g com base na definição de SBR em "MPEG4 AAC". Realizando-se o processo de controle de ganho automático, a força do sinal emitido a partir da unidade de filtro de previsão linear 2k em uma certa faixa de frequência dos componentes de alta frequência é ajustada em um valor equivalente àquele antes da filtragem de previsão linear. Como resultado, o efeito para ajustar a força do sinal de alta frequência realizado pela unidade de ajuste de alta frequência 2j no sinal emitido a partir da unidade de filtro de previsão linear 2k em que o envelope temporal dos componentes de alta frequência gerados com base em SBR é transformado, é mantido por unidade de faixa de frequência. As alterações feitas na presente modificação 3 da primeira modalidade podem também ser feitas na unidade de filtro de previsão linear 2k da quarta modalidade.By executing the automatic gain control process, the strength of the high frequency components of the signal emitted from the 2k linear forecast filter unit is adjusted to a value equivalent to that before the linear forecast filter. As a result, in the signal emitted from the linear prediction filter unit 2k in which the time envelope of the high frequency components generated on the basis of SBR is transformed, the effect of the high frequency signal strength adjustment carried out by the high frequency adjustment unit frequency 2j can be maintained. The automatic gain control process can also be performed individually over a certain frequency range of the signal in the QMF domain. The process performed in the individual frequency range can be performed by limiting n in expression (30), expression (31), and expression (32) within a certain frequency range. For example, the 1st frequency range can be expressed as Fj <n <Fi + 1 (in this case, i is an index that indicates the number of a certain frequency range of the signal in the QMF domain). Fj indicates the limit of the frequency range, and it is preferable that Fi be a frequency scale table of an envelope scale factor defined in SBR in "MPEG4 AAC". The frequency cap table is defined by the 2g high frequency generation unit based on the definition of SBR in "MPEG4 AAC". By carrying out the automatic gain control process, the signal strength emitted from the linear prediction filter unit 2k in a certain frequency range of the high frequency components is adjusted to a value equivalent to that before the linear prediction filtering . As a result, the effect of adjusting the high frequency signal strength performed by the high frequency adjustment unit 2j on the signal emitted from the linear prediction filter unit 2k in which the time envelope of the high frequency components generated based on SBR is transformed, is maintained per unit of frequency range. The changes made in the present modification 3 of the first modality can also be made in the linear prediction filter unit 2k of the fourth modality.

[Modificação 1 da Terceira modalidade][Modification 1 of the Third modality]

A unidade de cálculo de parâmetro de formato de envelope 1 n no dispositivo de codificação de voz 13 da terceira modalidade pode ser também realizada pelos seguintes processos. A unidade de cálculo de parâmetro de formato de envelope 1 n obtém um parâmetro de formato de envelope s(i) (0<i<Ne) de acordo com a seguinte expressão (33) para cada envelope de SBR no quadro codificado.

Figure img0031
Nota-se que:
Figure img0032
é um valor médio de e(r) no envelope de SBR, e o método de cálculo é baseado na expressão (21). Nota-se que o envelope de SBR indica a faixa de tempo que satisfaz bj<r<bi+i. {b,} é a borda de tempo de envelope de SBR incluída nas informações suplementares de SBR como as informações, e é o limite da faixa de tempo para a qual o fator de escala de envelope de SBR que representa a energia de sinal média em uma certa faixa de tempo e uma certa faixa de frequência é dada, min (•) representa o valor mínimo dentro da faixa de bj<r<bj+i. Desta forma, neste caso, o parâmetro de formato de envelope s(i) é um parâmetro para indicar uma razão do valor mínimo para o valor médio no envelope de SBR das informações de envelope temporal ajustadas. A unidade de ajuste de formato de envelope 2s no dispositivo de decodificação de voz 23 da terceira modalidade pode ser também realizada pelo seguinte processo. A unidade de ajuste de formato de envelope 2s ajusta e(r) com uso de s(i) para obter as informações de envelope temporal ajustadas eadj(r). O método de ajuste é baseado na seguinte expressão (35) ou expressão (36).
Figure img0033
The envelope format parameter calculation unit 1 n in the voice coding device 13 of the third embodiment can also be performed by the following methods. The envelope format parameter calculation unit 1 n obtains an envelope format parameter s (i) (0 <i <Ne) according to the following expression (33) for each SBR envelope in the coded frame.
Figure img0031
Note that:
Figure img0032
is an average value of e (r) in the SBR envelope, and the calculation method is based on the expression (21). Note that the SBR envelope indicates the time range that satisfies bj <r <bi + i. {b,} is the SBR envelope time edge included in the supplementary SBR information as the information, and is the limit of the time range for which the SBR envelope scaling factor that represents the average signal energy in a certain time range and a certain frequency range is given, min (•) represents the minimum value within the range of bj <r <bj + i. Thus, in this case, the envelope format parameter s (i) is a parameter to indicate a ratio of the minimum value to the average value in the SBR envelope of the adjusted time envelope information. The envelope format adjustment unit 2s in the voice decoding device 23 of the third embodiment can also be performed by the following process. The envelope format adjustment unit 2s adjusts e (r) with the use of s (i) to obtain the adjusted time envelope information eadj (r). The adjustment method is based on the following expression (35) or expression (36).
Figure img0033

A expressão 35 ajusta o formato do envelope de forma que a razão do valor mínimo para o valor médio no envelope de envelope de SBR das informações de envelope temporal ajustadas eacij(r) se torne equivalente ao valor do parâmetro de formato de envelope s(i). As alterações feitas na modificação 1 da terceira modalidade descritas acima podem ser também feitas na quarta modalidade.Expression 35 adjusts the envelope format so that the ratio of the minimum value to the average value in the SBR envelope envelope of the adjusted time envelope information eacij (r) becomes equivalent to the value of the envelope format parameter s (i ). The changes made in modification 1 of the third modality described above can also be made in the fourth modality.

[Modificação 2 da Terceira modalidade][Modification 2 of the Third modality]

A unidade de transformação de envelope temporal 2v pode também usar a seguinte expressão ao invés da expressão (28). Conforme indicado na expressão (37), eadj, scaied(r) é obtido controlando-se o ganho das informações de envelope temporal ajustadas eadj(r), de forma que a força de Çadj (k, r) e qenvadj (k,r) sejam equivalentes entre si no envelope de SBR. Conforme indicado na expressão (38), na presente modificação 2 da terceira modalidade, qenVadj (k, r) é obtido multiplicando-se eadj, Scaied(0 ao invés de eadj(r) pelo sinal qadj (k, r) no domínio de QMF. Da mesma forma, a unidade de transformação de envelope temporal 2v pode transformar o envelope temporal do sinal qadJ (k, r) no domínio de QMF, de forma que a força do sinal no envelope de SBR se torne equivalente antes e após a transformação do envelope temporal. Nota-se que o envelope de SBR indica a faixa de tempo que satisfaz bi<r<bj+i. {b,} é a borda de tempo de envelope de SBR incluída nas informações suplementares de SBR como as informações, e é o limite da faixa de tempo para a qual o fator de escala de envelope de SBR que representa a energia de sinal média de uma certa faixa de tempo e uma certa faixa de frequência é dada. A terminologia "envelope de SBR" nas modalidades da presente invenção corresponde à terminologia "segmento de tempo de envelope de SBR" em "MPEG4 AAC" definido em "ISO/IEC 14496-3", e o "envelope de SBR" tem os mesmo conteúdos que o "segmento de tempo de envelope de SBR" por todas as modalidades. dades da presente invenção corresponde à terminologia "segmento de tem po de envelope de SBR" em "MPEG4 AAC" definido em "ISO/IEC 14496-3", e o "envelope de SBR" tem os mesmo conteúdos que o "segmento de tempo de envelope de SBR" por todas as modalidades.

Figure img0034
The temporal envelope transformation unit 2v can also use the following expression instead of expression (28). As indicated in expression (37), eadj, scaied (r) is obtained by controlling the gain of the adjusted temporal envelope information eadj (r), so that the force of Çadj (k, r) and qenvadj (k, r ) are equivalent to each other in the SBR envelope. As indicated in expression (38), in the present modification 2 of the third modality, qenVadj (k, r) is obtained by multiplying eadj, Scaied (0 instead of eadj (r) by the sign qadj (k, r) in the domain of Similarly, the 2v time envelope transformation unit can transform the time envelope of the qadJ (k, r) signal into the QMF domain, so that the signal strength in the SBR envelope becomes equivalent before and after transformation of the temporal envelope. Note that the SBR envelope indicates the time range that satisfies bi <r <bj + i. {b,} is the SBR envelope time edge included in the supplementary SBR information as the information , and is the limit of the time range for which the SBR envelope scaling factor that represents the average signal energy for a certain time range and a certain frequency range is given. embodiments of the present invention correspond to the terminology "SBR envelope time segment" in "MPEG4 AAC" def started in "ISO / IEC 14496-3", and the "SBR envelope" has the same contents as the "SBR envelope time segment" by all modalities. of the present invention corresponds to the terminology "SBR envelope time segment" in "MPEG4 AAC" defined in "ISO / IEC 14496-3", and the "SBR envelope" has the same contents as the "time segment of SBR envelope "for all modalities.
Figure img0034

As alterações feitas na presente modificação 2 a terceira modalidade descritas acima podem ser também feitas na quarta modalidade. Modificação 3 da Terceira modalidade) A expressão (19) pode ser também a seguinte expressão (39).

Figure img0035
A expressão (26) pode ser também a seguinte expressão (41).
Figure img0036
Quando a expressão (39) e a expressão (40) são usadas, as informações de envelope temporal e(r) são informações em que a força de cada amostra de sub-banda de QMF é normalizada pela força média no envelope de SBR, e a raiz quadrada é extraída. No entanto, a amostra de subbanda de QMF é um vetor de sinal que corresponde ao índice de tempo "r" que é o mesmo no domínio de QMF sinal, e é uma sub-amostra no domínio de QMF. Em todas as modalidades da presente invenção, a terminologia "abertura de tempo" tem os mesmos conteúdos que a "amostra de subbanda de QMF". Neste caso, as informações de envelope temporal e(r) são um coeficiente de ganho que deve ser multiplicado por cada amostra de subbanda de QMF, e o mesmo se aplica às informações de envelope temporal ajustadas eacij(r).The changes made in the present modification 2 to the third modality described above can also be made in the fourth modality. Modification 3 of the Third modality) The expression (19) can also be the following expression (39).
Figure img0035
Expression (26) can also be the following expression (41).
Figure img0036
When expression (39) and expression (40) are used, the time envelope information and (r) are information in which the strength of each QMF subband sample is normalized by the average strength in the SBR envelope, and the square root is extracted. However, the QMF subband sample is a signal vector that corresponds to the time index "r" which is the same in the QMF signal domain, and is a sub-sample in the QMF domain. In all embodiments of the present invention, the terminology "time slot" has the same content as the "QMF subband sample". In this case, the time envelope information and (r) are a gain coefficient that must be multiplied by each QMF subband sample, and the same applies to the adjusted time envelope information eacij (r).

(Modificação 1 da Quarta modalidade)(Modification 1 of the Fourth modality)

Um dispositivo de decodificação de voz 24a (não ilustrado) de uma modificação 1 da quarta modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz 24a carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de decodificação de voz 24a tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 24a recebe o fluxo de bit multiplexado codificado emitido a partir do dispositivo de codificação de voz 11 ou do dispositivo de codificação de voz 13, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 24a. O dispositivo de decodificação de voz 24a funcionalmente inclui uma unidade de separação de fluxo de bit 2a4 (não ilustrado) ao invés da unidade de separação de fluxo de bit 2a3 do dispositivo de decodificação de voz 24, e também inclui a unidade de geração de informações suplementares de envelope temporal 2y (não ilustrado), ao invés da unidade de conversão de informações suplementares 2w. A unidade de separação de fluxo de bit 2a4 separa o fluxo de bit multiplexado nas informações de SBR e o fluxo de bit codificado. A unidade de geração de informações suplementares de envelope temporal 2y gera informações suplementares de envelope temporal com base nas informações incluídas no fluxo de bit codificado e as informações suplementares de SBR.A voice decoding device 24a (not shown) of a modification 1 of the fourth embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not shown, and the CPU fully controls the device. voice decoding 24a by loading and running a predetermined computer program stored in an internal memory of the voice decoding device 24a such as ROM in RAM. The communication device of the voice decoding device 24a receives the encoded multiplexed bit stream emitted from the speech coding device 11 or the speech coding device 13, and outputs a decoded speech signal out of the decoding device of voice 24a. The voice decoding device 24a functionally includes a bit stream separation unit 2a4 (not shown) instead of the bit stream separation unit 2a3 of the voice decoding device 24, and also includes the information generation unit additional 2y temporal envelope (not shown), instead of the 2w supplementary information conversion unit. The bit stream separation unit 2a4 separates the multiplexed bit stream in the SBR information and the encoded bit stream. The 2y temporal envelope supplemental information generation unit generates supplemental temporal envelope information based on the information included in the encoded bit stream and the supplementary SBR information.

Para gerar as informações suplementares de envelope temporal em um certo envelope de SBR, por exemplo, a largura de tempo (bj+i-b.) do envelope de SBR, uma classe de quadro, um parâmetro de resistência do filtro inverso, a base de ruído, a amplitude da força de alta frequência, uma razão da força de alta frequência para a força de baixa frequência, um coeficiente de auto-correlação ou um ganho de previsão obtido como resultado de realizar a análise de previsão linear na direção de frequência em um sinal de baixa frequência representado no domínio de QMF, e similares podem ser usados. As informações suplementares de envelope temporal podem ser geradas determinando K(r) ou s(i) com base em um ou uma pluralidade de valores dos parâmetros. Por exemplo, as informações suplementares de envelope temporal podem ser geradas determinando K(r) ou s(i) com base em (bj+1-bi) de forma que K(r) ou s(i) seja reduzido conforme a largura de tempo (bj+1—bi) do envelope de SBR é aumentada, ou K(r) ou s(i) seja aumentado conforme a largura de tempo (bj+i-b,) do envelope de SBR é aumentada. As alterações similares podem ser também feitas na primeira modalidade e na terceira modalidade.To generate the supplementary time envelope information in a certain SBR envelope, for example, the time width (bj + ib.) Of the SBR envelope, a frame class, an inverse filter resistance parameter, the noise basis , the amplitude of the high-frequency force, a ratio of the high-frequency force to the low-frequency force, a self-correlation coefficient, or a forecast gain obtained as a result of performing linear forecast analysis in the direction of frequency in a low frequency signal represented in the QMF domain, and the like can be used. Supplementary time envelope information can be generated by determining K (r) or s (i) based on one or a plurality of parameter values. For example, supplemental time envelope information can be generated by determining K (r) or s (i) based on (bj + 1-bi) so that K (r) or s (i) is reduced according to the width of time (bj + 1 — bi) of the SBR envelope is increased, or K (r) or s (i) is increased as the time width (bj + ib,) of the SBR envelope is increased. Similar changes can also be made in the first modality and the third modality.

(Modificação 2 da Quarta modalidade)(Modification 2 of the Fourth modality)

Um dispositivo de decodificação de voz 24b (vide a figura 15) de uma modificação 2 da quarta modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz 24b carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de decodificação de voz 24b tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 24b recebe o fluxo de bit multiplexado codificado emitido a partir do dispositivo de codificação de voz 11 ou do dispositivo de codificação de voz 13, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 24b. O dispositivo de decodificação de voz 24b, conforme ilustrado na figura 15, inclui uma unidade de ajuste de alta frequência primária 2j1 e uma unidade de ajuste de alta frequência secundária 2j2 ao invés da unidade de ajuste de alta frequência 2j.A voice decoding device 24b (see figure 15) of a modification 2 of the fourth modality physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice decoding device 24b by loading and running a predetermined computer program stored in an internal memory of the voice decoding device 24b such as ROM in RAM. The communication device of the voice decoding device 24b receives the encoded multiplexed bit stream emitted from the speech coding device 11 or the speech coding device 13, and outputs a decoded speech signal out of the decoding device of voice 24b. The voice decoding device 24b, as shown in figure 15, includes a primary high frequency adjustment unit 2j1 and a secondary high frequency adjustment unit 2j2 instead of the high frequency adjustment unit 2j.

Aqui, a unidade de ajuste de alta frequência primária 2j1 ajusta um sinal no domínio de QMF a banda de alta frequência realizando o ajuste, e a superposição de ruído, descrito na etapa de "ajuste de HF" em SBR em "MPEG4 AAC". Neste momento, o sinal emitido da unidade de ajuste de alta frequência primária 2j1 corresponde a um sinal W2 na descrição em "ferramenta de SBR" em "ISO/IEC 14496-3:2005", cláusulas 4.6.18.7.6 de "Sinais de HF de montagem". A unidade de filtro de previsão linear 2k (ou a unidade de filtro de previsão linear 2k1) e a unidade de transformação de envelope temporal 2v transformam o envelope temporal do sinal emitido a partir da unidade de ajuste de alta frequência primária. A unidade de ajuste de alta frequência secundária 2j2 realiza um processo de adição de onda de seno na etapa de "ajuste de HF" em SBR em "MPEG4 AAC". O processo da unidade de ajuste de alta frequência secundária corresponde a um processo para substituir o sinal W2 por um sinal emitido da unidade de transformação de envelope temporal 2v, em um processo para gerar um sinal Y a partir do sinal W2 na descrição em "ferramenta de SBR" em "ISO/IEC 14496-3:2005", cláusulas 4.6.18.7.6 de "Sinais de HF de montagem".Here, the primary high frequency adjustment unit 2j1 adjusts a signal in the QMF domain to the high frequency band performing the adjustment, and the noise superposition, described in the "HF adjustment" step in SBR in "MPEG4 AAC". At this moment, the signal emitted from the primary high frequency adjustment unit 2j1 corresponds to a W2 signal in the description in "SBR tool" in "ISO / IEC 14496-3: 2005", clauses 4.6.18.7.6 of "Signals of Mounting HF ". The 2k linear forecast filter unit (or the 2k1 linear forecast filter unit) and the 2v time envelope transformation unit transform the time envelope of the signal emitted from the primary high frequency adjustment unit. The secondary high frequency adjustment unit 2j2 performs a sine wave addition process in the "HF adjustment" step in SBR in "MPEG4 AAC". The secondary high frequency adjustment unit process corresponds to a process to replace the W2 signal with a signal emitted from the 2v time envelope transformation unit, in a process to generate a Y signal from the W2 signal in the description in "tool of SBR "in" ISO / IEC 14496-3: 2005 ", clauses 4.6.18.7.6 of" Assembly HF signals ".

Na descrição acima, somente o processo para adicionar ondas de seno é realizado pela unidade de ajuste de alta frequência secundária 2j2. No entanto, qualquer um dos processos na etapa de “ajuste de HF” pode ser realizado pela unidade de ajuste de alta frequência secundária 2j2. Modificações similares podem ser também feitas na primeira modalidade, na segunda modalidade e na terceira modalidade. Neste momento, a unidade de filtro de previsão linear (unidades de filtro de previsão linear 2k e 2k1) é incluída na primeira modalidade e na segunda modalidade, mas a unidade de transformação de envelope temporal não é incluída. Da mesma forma, um sinal emitido a partir da unidade de ajuste de alta frequência primária 2j 1 é processado pela unidade de filtro de previsão linear, e então um sinal emitido a partir da unidade de filtro de previsão linear é processado pela unidade de ajuste de alta frequência secundária 2j2.In the description above, only the process for adding sine waves is performed by the secondary high frequency adjustment unit 2j2. However, any of the processes in the “HF tuning” step can be performed by the secondary high frequency tuning unit 2j2. Similar modifications can also be made in the first modality, the second modality and the third modality. At this time, the linear forecast filter unit (linear forecast filter units 2k and 2k1) is included in the first modality and the second modality, but the time envelope transformation unit is not included. Likewise, a signal emitted from the primary high frequency tuning unit 2j 1 is processed by the linear forecast filter unit, and then a signal emitted from the linear forecast filter unit is processed by the secondary high frequency 2j2.

Na terceira modalidade, a unidade de transformação de envelope temporal 2v está incluída, mas a unidade de filtro de previsão linear não está incluída. Da mesma forma, um sinal emitido a partir da unidade de ajuste de alta frequência primária 2j1 é processado pela unidade de transformação de envelope temporal 2v, e então um sinal emitido a partir da unidade de transformação de envelope temporal 2v é processado pela unidade de ajuste de alta frequência secundária.In the third embodiment, the 2v time envelope transformation unit is included, but the linear forecast filter unit is not included. Likewise, a signal emitted from the primary high frequency adjustment unit 2j1 is processed by the temporal envelope transformation unit 2v, and then a signal emitted from the temporal envelope transformation unit 2v is processed by the adjustment unit. secondary high frequency.

No dispositivo de decodificação de voz (dispositivo de decodificação de voz 24, 24a, ou 24b) da quarta modalidade, a ordem de processamento da unidade de filtro de previsão linear 2k e da unidade de transformação de envelope temporal 2v pode ser revertida. Em outras palavras, um sinal emitido a partir da unidade de ajuste de alta frequência 2j ou da unidade de ajuste de alta frequência primária 2j1 pode ser processado primeiro pela unidade de transformação de envelope temporal 2v, e então um sinal emitido a partir da unidade de transformação de envelope temporal 2v pode ser processado pela unidade de filtro de previsão linear 2k.In the voice decoding device (voice decoding device 24, 24a, or 24b) of the fourth embodiment, the processing order of the linear prediction filter unit 2k and the temporal envelope transformation unit 2v can be reversed. In other words, a signal emitted from the high frequency adjustment unit 2j or the primary high frequency adjustment unit 2j1 can be processed first by the time envelope transformation unit 2v, and then a signal emitted from the 2v time envelope transformation can be processed by the 2k linear forecast filter unit.

Em adição, somente se as informações suplementares de envelope temporal incluir informações de controle binário para indicar se o processo é realizado pela unidade de filtro de previsão linear 2k ou pela unidade de transformação de envelope temporal 2v, e as informações de controle indicam para realizar o processo pela unidade de filtro de previsão linear 2k ou pela unidade de transformação de envelope temporal 2v, as informações suplementares de envelope temporal podem empregar uma forma que inclui ao menos um dentre o parâmetro de resistência de filtro K(r), o parâmetro de formato de envelope s(i), ou X(r) que é um parâmetro para determinar ambos K(r) e s(i) como informações.In addition, only if the supplemental time envelope information includes binary control information to indicate whether the process is performed by the 2k linear forecast filter unit or the 2v time envelope transformation unit, and the control information indicates to perform the process by the 2k linear forecast filter unit or the 2v time envelope transformation unit, the supplemental time envelope information may employ a shape that includes at least one of the K (r) filter resistance parameter, the format parameter envelope s (i), or X (r) which is a parameter to determine both K (r) and s (i) as information.

(Modificação 3 da Quarta modalidade)(Modification 3 of the Fourth modality)

Um dispositivo de decodificação de voz 24c (vide a figura 16) de uma modificação 3 da quarta modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz 24c carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 17) armazenado em uma memória interna do dispositivo de decodificação de voz 24c tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 24c recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 24c. Conforme ilustrado na figura 16, o dispositivo de decodificação de voz 24c inclui uma unidade de ajuste de alta frequência primária 2j3 e uma unidade de ajuste de alta frequência secundária 2j4 ao invés da unidade de ajuste de alta frequência 2j, e também inclui unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 ao invés da unidade de filtro de previsão linear 2k e da unidade de transformação de envelope temporal 2v (as unidades de ajuste de componente de sinal individual correspondem ao meio de transformação de envelope temporal).A voice decoding device 24c (see figure 16) of a modification 3 of the fourth modality physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice decoding device 24c loading and running a predetermined computer program (such as a computer program to perform the processes illustrated in the flowchart of figure 17) stored in an internal memory of the voice decoding device 24c such as ROM in RAM . The communication device of the voice decoding device 24c receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the speech decoding device 24c. As shown in figure 16, the voice decoding device 24c includes a primary high frequency adjustment unit 2j3 and a secondary high frequency adjustment unit 2j4 instead of the high frequency adjustment unit 2j, and also includes adjustment units of individual signal component 2z1, 2z2, and 2z3 instead of the linear forecast filter unit 2k and the temporal envelope transformation unit 2v (the individual signal component adjustment units correspond to the temporal envelope transformation medium).

A unidade de ajuste de alta frequência primária 2j3 emite um sinal no domínio de QMF da banda de alta frequência como um componente de sinal copiado. A unidade de ajuste de alta frequência primária 2j3 pode emitir um sinal em que ao menos um dentre a filtragem inversa de previsão linear na direção temporal e o ajuste de ganho (ajuste de características de frequência) é realizado no sinal no domínio de QMF da banda de alta frequência, com uso das informações suplementares de SBR recebidas a partir da unidade de separação de fluxo de bit 2a3, como um componente de sinal copiado. A unidade de ajuste de alta frequência primária 2j3 também gera um componente de sinal de ruído e um componente de sinal de onda de seno com uso das informações suplementares de SBR fornecidas a partir da unidade de separação de fluxo de bit 2a3, e emite cada um dentre o componente de sinal copiado, o componente de sinal de ruído, e o componente de sinal de onda de seno em uma forma separada (processo na Etapa Sg1). O componente de sinal de ruído e o componente de sinal de onda de seno podem não ser gerados, dependendo dos conteúdos das informações suplementares de SBR.The primary high frequency tuning unit 2j3 outputs a signal in the QMF domain of the high frequency band as a copied signal component. The primary high frequency tuning unit 2j3 can emit a signal in which at least one of the linear prediction inverse filtering in the temporal direction and the gain adjustment (frequency characteristic adjustment) is performed on the signal in the band's QMF domain high frequency, using supplementary SBR information received from the 2a3 bit stream separation unit, as a copied signal component. The primary high frequency tuning unit 2j3 also generates a noise signal component and a sine wave signal component using the supplementary SBR information provided from the bit stream separation unit 2a3, and emits each among the copied signal component, the noise signal component, and the sine wave signal component in a separate form (process in Step Sg1). The noise signal component and the sine wave signal component may not be generated, depending on the contents of the supplementary SBR information.

As unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 realizam o processamento em cada um na pluralidade de componentes de sinal incluídos na saída da unidade de ajuste de alta frequência primária (processo na Etapa Sg2). O processo com as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 pode ser filtragem de síntese de previsão linear na direção de frequência obtida a partir da unidade de ajuste de resistência de filtro 2f com uso do coeficiente de previsão linear, similar àquele da unidade de filtro de previsão linear 2k (processo 1). O processo com as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 pode ser também um processo para multiplicar um coeficiente de ganho por cada amostra de sub-banda de QMF com uso do envelope temporal obtido a partir da unidade de ajuste de formato de envelope 2s, similar àquele da unidade de transformação de envelope temporal 2v (processo 2). O processo com as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 podem ser também um processo para realizar a filtragem de síntese de previsão linear na direção de frequência no sinal de entrada com uso do coeficiente de previsão linear obtido a partir da unidade de ajuste de resistência de filtro 2f similar àquele da unidade de filtro de previsão linear 2k, e então multiplicar um coeficiente de ganho por cada amostra de subbanda de QMF com uso do envelope temporal obtido a partir da unidade de ajuste de formato de envelope 2s, similar àquele da unidade de transformação de envelope temporal 2v (processo 3). O processo com as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 pode ser também um processo para multiplicar um coeficiente de ganho por cada amostra de sub-banda de QMF com relação ao sinal de entrada com uso do envelope temporal obtido a partir da unidade de ajuste de formato de envelope 2s, similar àquele da unidade de transformação de envelope temporal 2v, e então realizar a filtragem de síntese de previsão linear na direção de frequência no sinal emitido com uso do coeficiente de previsão linear obtido a partir da unidade de ajuste de resistência de filtro 2f, similar àquele da unidade de filtro de previsão linear 2k (processo 4). As unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 podem não realizar o processo de transformação de envelope temporal no sinal de entrada, mas pode emitir o sinal de entrada como é (processo 5). O processo com as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 pode incluir qualquer processo para transformar o envelope temporal do sinal de entrada com uso de um método outro que os processos 1 a 5 (processo 6). O processo com as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 pode ser também um processo em que uma pluralidade de processos entre os processos 1 a 6 são combinados em uma ordem arbitrária (processo 7).The individual signal component adjustment units 2z1, 2z2, and 2z3 perform processing on each of the plurality of signal components included in the output of the primary high frequency adjustment unit (process in Step Sg2). The process with the individual signal component adjustment units 2z1, 2z2, and 2z3 can be filtering linear forecast synthesis in the direction of frequency obtained from the filter resistance adjustment unit 2f using the linear forecast coefficient, similar to that of the 2k linear forecast filter unit (process 1). The process with the individual signal component adjustment units 2z1, 2z2, and 2z3 can also be a process to multiply a gain coefficient for each QMF subband sample using the time envelope obtained from the adjustment unit 2s envelope format, similar to that of the 2v temporal envelope transformation unit (process 2). The process with the individual signal component adjustment units 2z1, 2z2, and 2z3 can also be a process for performing the linear forecast synthesis filtering in the frequency direction in the input signal using the linear forecast coefficient obtained from filter resistance adjustment unit 2f similar to that of the linear prediction filter unit 2k, and then multiply a gain coefficient for each QMF subband sample using the time envelope obtained from the envelope shape adjustment unit 2s, similar to that of the 2v temporal envelope transformation unit (process 3). The process with the individual signal component adjustment units 2z1, 2z2, and 2z3 can also be a process to multiply a gain coefficient for each QMF subband sample with respect to the input signal using the obtained time envelope from the 2s envelope format adjustment unit, similar to that of the 2v temporal envelope transformation unit, and then perform the linear forecast synthesis filtering in the frequency direction on the signal emitted using the linear forecast coefficient obtained from of the filter resistance adjustment unit 2f, similar to that of the linear forecast filter unit 2k (process 4). The individual signal component adjustment units 2z1, 2z2, and 2z3 may not perform the time envelope transformation process on the input signal, but can output the input signal as is (process 5). The process with the individual signal component adjustment units 2z1, 2z2, and 2z3 can include any process for transforming the temporal envelope of the input signal using a method other than processes 1 to 5 (process 6). The process with the individual signal component adjustment units 2z1, 2z2, and 2z3 can also be a process in which a plurality of processes between processes 1 to 6 are combined in an arbitrary order (process 7).

Os processos com as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 podem ser os mesmos, mas as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 podem transformar o envelope temporal de cada componente da pluralidade de componentes de sinal incluídos na saída da unidade de ajuste de alta frequência primária por diferentes métodos. Por exemplo, diferentes processos podem ser realizados no sinal copiado, no sinal de ruído, e no sinal de onda de seno, de tal maneira que a unidade de ajuste de componente de sinal individual 2z1 realize o processo 2 no sinal copiado fornecido, a unidade de ajuste de componente de sinal individual 2z2 realize o processo 3 no componente de sinal de ruído fornecido, e a unidade de ajuste de componente de sinal individual 2z3 realize o processo 5 no sinal de onda de seno fornecido. Neste momento, a unidade de ajuste de resistência de filtro 2f e a unidade de ajuste de formato de envelope 2s podem transmitir o mesmo coeficiente de previsão linear e o envelope temporal para as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3, mas podem também transmitir diferentes coeficientes de previsão linear e os envelopes temporais. É também possível transmitir o mesmo coeficiente de previsão linear e o envelope temporal para ao menos duas as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3. Devido ao fato de que ao menos um das unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 podem não realizar o processo de transformação de envelope temporal, mas emitirem o sinal de entrada como este é (processo 5), as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 realizam o processo de envelope temporal em ao menos um componente da pluralidade de componentes de sinal emitidos a partir da unidade de ajuste de alta frequência primária 2j3 como um todo (se todas as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 realizarem o processo 5, o processo de transformação de envelope temporal não é realizado em qualquer um dos componentes de sinal, e os efeitos da presente invenção não são exibidos).The processes with the individual signal component adjustment units 2z1, 2z2, and 2z3 can be the same, but the individual signal component adjustment units 2z1, 2z2, and 2z3 can transform the time envelope of each component from the plurality of signal components included in the output of the primary high frequency adjustment unit by different methods. For example, different processes can be performed on the copied signal, the noise signal, and the sine wave signal, in such a way that the individual signal component adjustment unit 2z1 performs process 2 on the supplied copied signal, the unit individual signal component adjustment unit 2z2 perform process 3 on the supplied noise signal component, and the individual signal component adjustment unit 2z3 perform process 5 on the supplied sine wave signal. At this time, the filter resistance adjustment unit 2f and the envelope shape adjustment unit 2s can transmit the same linear prediction coefficient and time envelope to the individual signal component adjustment units 2z1, 2z2, and 2z3 , but they can also transmit different linear forecast coefficients and time envelopes. It is also possible to transmit the same linear forecast coefficient and the time envelope to at least two individual signal component adjustment units 2z1, 2z2, and 2z3. Due to the fact that at least one of the individual signal component adjustment units 2z1, 2z2, and 2z3 may not perform the time envelope transformation process, but will emit the input signal as it is (process 5), the units individual signal component adjustment units 2z1, 2z2, and 2z3 perform the time envelope process on at least one component of the plurality of signal components emitted from the primary high frequency adjustment unit 2j3 as a whole (if all units of individual signal component adjustment 2z1, 2z2, and 2z3 perform process 5, the time envelope transformation process is not performed on any of the signal components, and the effects of the present invention are not displayed).

Os processos realizados por cada uma das unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 podem ser fixados em um dentre o processo 1 ao processo 7, mas podem ser dinamicamente determinado para realizar um dentre o processo 1 ao processo 7 com base nas informações de controle recebidas de fora do dispositivo de decodificação de voz 24c. Neste momento, é preferível que as informações de controle estejam incluídas no fluxo de bit multiplexado. As informações de controle podem ser uma instrução para realizar qualquer um dentre o processo 1 ao processo 7 em um segmento de tempo de envelope de SBR específico, o quadro codificado, ou na outra faixa de tempo, ou podem ser uma instrução para realizar qualquer um dentre o processo 1 ao processo 7 sem especificar a faixa de tempo de controle.The processes performed by each of the individual signal component adjustment units 2z1, 2z2, and 2z3 can be set in one of process 1 to process 7, but can be dynamically determined to perform one of process 1 to process 7 with based on control information received from outside the voice decoding device 24c. At this time, it is preferable that the control information is included in the multiplexed bit stream. The control information can be an instruction to perform any of process 1 through process 7 in a specific SBR envelope time segment, the encoded frame, or in the other time range, or it can be an instruction to perform either between process 1 to process 7 without specifying the control time range.

A unidade de ajuste de alta frequência secundária 2j4 adiciona os componentes de sinal processados emitidos a partir das unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3, e emite o resultado para a unidade de adição de coeficiente (processo na Etapa Sg3). A unidade de ajuste de alta frequência secundária 2j4 pode realizar ao menos um dentre a filtragem inversa de previsão linear na direção temporal e ajuste de ganho (ajuste de característica de frequência) no componente de sinal copiado, com uso das informações suplementares de SBR recebidas a partir da unidade de separação de fluxo de bit 2a3.The secondary high frequency adjustment unit 2j4 adds the processed signal components emitted from the individual signal component adjustment units 2z1, 2z2, and 2z3, and outputs the result to the coefficient addition unit (process in Step Sg3 ). The secondary high frequency adjustment unit 2j4 can perform at least one of the reverse filtering of linear forecast in the time direction and gain adjustment (frequency characteristic adjustment) in the copied signal component, using the supplementary SBR information received a from bit stream separation unit 2a3.

As unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 podem operar em cooperação entre si, e gerar um sinal omitido em um estágio intermediário adicionando ao menos dois componentes de sinal em que qualquer um dos processos 1 a 7 é realizado, e ainda realizar qualquer um dos processos 1 a 7 no sinal adicionado. Neste momento, a unidade de ajuste de alta frequência secundária 2j4 adiciona o sinal emitido no estágio intermediário e um componente de sinal que não foi ainda adicionado ao sinal emitido no estágio intermediário, e emite o resultado para a unidade de adição de coeficiente. Mais especificamente, é preferível gerar um sinal emitido no estágio intermediário realizando o processo 5 no componente de sinal copiado, aplicando o processo 1 no componente de ruído, adicionando dois componentes de sinal, e ainda aplicando o processo 2 no sinal adicionado. Neste momento, a unidade de ajuste de alta frequência secundária 2j4 adiciona o componente de sinal de onda de seno ao sinal emitido no estágio intermediário, e emite o resultado para a unidade de adição de coeficiente.The individual signal component adjustment units 2z1, 2z2, and 2z3 can operate in cooperation with each other, and generate an omitted signal at an intermediate stage by adding at least two signal components in which either process 1 to 7 is performed, and still perform any of processes 1 to 7 on the added signal. At this time, the secondary high frequency adjustment unit 2j4 adds the signal emitted in the intermediate stage and a signal component that has not yet been added to the signal emitted in the intermediate stage, and outputs the result to the coefficient addition unit. More specifically, it is preferable to generate a signal emitted in the intermediate stage by performing process 5 on the copied signal component, applying process 1 on the noise component, adding two signal components, and still applying process 2 on the added signal. At this time, the secondary high frequency adjustment unit 2j4 adds the sine wave signal component to the signal emitted in the intermediate stage, and outputs the result to the coefficient addition unit.

A unidade de ajuste de alta frequência primária 2j3 pode emitir qualquer um de uma pluralidade de componentes de sinal em uma forma separada entre si em adição aos três componentes de sinal do componente de sinal copiado, do componente de sinal de ruído, e do componente de sinal de onda de seno. Neste caso, o componente de sinal pode ser obtido adicionando-se ao menos dois dentre o componente de sinal copiado, o componente de sinal de ruído, e o componente de sinal de onda de seno. O componente de sinal pode ser também um sinal obtido dividindo-se a banda de um dentre o componente de sinal copiado, o componente de sinal de ruído, e o sinal de onda de seno. O número de componentes de sinal pode ser outro que não três, e neste caso, o número das unidades de ajuste de componente de sinal individual pode ser outro que não três.The primary high frequency tuning unit 2j3 can output any of a plurality of signal components in a separate form from each other in addition to the three signal components of the copied signal component, the noise signal component, and the signal component. sine wave signal. In this case, the signal component can be obtained by adding at least two of the copied signal component, the noise signal component, and the sine wave signal component. The signal component can also be a signal obtained by dividing the band of one of the copied signal component, the noise signal component, and the sine wave signal. The number of signal components can be other than three, in which case the number of individual signal component adjustment units can be other than three.

O sinal de alta frequência gerado por SBR é formado de três elementos do componente de sinal copiado obtido copiando da banda de baixa frequência para a banda de alta frequência, o sinal de ruído, e o sinal de onda de seno. Devido ao fato de que o sinal copiado, o sinal de ruído, e o sinal de onda de seno têm os envelopes temporais diferentes entre si, se o envelope temporal de cada um dos componentes de sinal for transformado com uso dos métodos diferentes como as unidades de ajuste de componente de sinal individual da presente modificação, é possível melhorar ainda mais a qualidade subjetiva do sinal decodificado comparado com as outras modalidades da presente invenção. Em particular, devido ao fato de que o sinal de ruído de forma geral tem um envelope temporal suave, e o sinal copiado tem um envelope temporal próximo àquele do sinal na banda de baixa frequência, os envelopes temporais do sinal copiado e o sinal de ruído podem ser independentemente controlados, tratando-os separadamente e aplicando diferentes processos a estes. Da mesma forma, é efetivo em melhorar a qualidade subjetiva do sinal decodificado. Mais especificamente, é preferível realizar um processo para transformar o envelope temporal no sinal de ruído (processo 3 ou processo 4), realizar um processo diferente daquele para o sinal de ruído no sinal copiado (processo 1 ou processo 2), e realizar o processo 5 no sinal de onda de seno (em outras palavras, o processo de transformação de envelope temporal não é realizado). É também preferível realizar um processo de transformação (processo 3 ou processo 4) do envelope temporal no sinal de ruído, e realizar o processo 5 no sinal copiado e o sinal de onda de seno (em outras palavras, o processo de transformação de envelope temporal não é realizado).The high frequency signal generated by SBR is formed by three elements of the copied signal component obtained by copying from the low frequency band to the high frequency band, the noise signal, and the sine wave signal. Due to the fact that the copied signal, the noise signal, and the sine wave signal have different temporal envelopes, if the temporal envelope of each of the signal components is transformed using different methods such as units of adjusting the individual signal component of the present modification, it is possible to further improve the subjective quality of the decoded signal compared to the other embodiments of the present invention. In particular, due to the fact that the noise signal in general has a smooth time envelope, and the copied signal has a time envelope close to that of the signal in the low frequency band, the time envelopes of the copied signal and the noise signal they can be independently controlled, treating them separately and applying different processes to them. Likewise, it is effective in improving the subjective quality of the decoded signal. More specifically, it is preferable to carry out a process to transform the temporal envelope into the noise signal (process 3 or process 4), to carry out a process different from that for the noise signal in the copied signal (process 1 or process 2), and to carry out the process 5 on the sine wave signal (in other words, the time envelope transformation process is not performed). It is also preferable to carry out a transformation process (process 3 or process 4) of the temporal envelope in the noise signal, and to carry out process 5 on the copied signal and the sine wave signal (in other words, the temporal envelope transformation process) not performed).

(Modificação 4 da Primeira modalidade)(Modification 4 of the First modality)

Um dispositivo de codificação de voz 11b (figura 44) de uma modificação 4 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 11b carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz 11b tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 11b recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 11b, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 11b. The dispositivo de codificação de voz 11b includes a unidade de análise de previsão linear 1e1 ao invés da unidade de análise de previsão linear 1e do dispositivo de codificação de voz 11, e ainda inclui uma unidade de seleção de abertura de tempo 1p.A voice coding device 11b (figure 44) of a modification 4 of the first embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice device. voice coding 11b by loading and running a predetermined computer program stored in an internal memory of the voice coding device 11b such as the ROM in RAM. The communication device of the speech coding device 11b receives a speech signal to be encoded from outside the speech coding device 11b, and emits a multiplexed bit stream encoded out of the speech coding device 11b. The voice coding device 11b includes the linear forecast analysis unit 1e1 instead of the linear forecast analysis unit 1e of the voice coding device 11, and even includes a time opening selection unit 1p.

A unidade de seleção de abertura de tempo 1 p recebe um sinal no domínio de QMF a partir da unidade de conversão de frequência 1a e seleciona uma abertura de tempo na qual a análise de previsão linear pela unidade de análise de previsão linear 1e1 é realizada. A unidade de análise de previsão linear 1e1 realiza a análise de previsão linear no sinal de domínio de QMF na abertura de tempo selecionada como a unidade de análise 5 de previsão linear 1e, com base no resultado de seleção transmitido a partir da unidade de seleção de abertura de tempo 1 p, para obter ao menos um dentre o coeficiente de previsão linear de alta frequência e o coeficiente de previsão linear de baixa frequência. A unidade de cálculo de parâmetro de resistência de filtro 1f calcula um parâmetro de resistência de filtro com uso 10 de um coeficiente de previsão linear da abertura de tempo selecionado pela unidade de seleção de abertura de tempo 1 p, obtido pela unidade de análise de previsão linear 1e1. Para selecionar uma abertura de tempo pela unidade de seleção de abertura de tempo 1 p, por exemplo, ao menos um dos métodos de seleção com uso da força de sinal do sinal de domínio de QMF dos 15 componentes de alta frequência, similares àqueles de uma unidade de seleção de abertura de tempo 3a em um dispositivo de decodificação 21a da presente modificação, que será descrito a diante, pode ser usado. Neste momento, é preferível que o sinal de domínio de QMF dos componentes de alta frequência na unidade de seleção de abertura de tempo 1p seja um 20 componente de frequência codificado pela unidade de codificação de SBR 1d, entre os sinais no domínio de QMF recebido a partir da unidade de conversão de frequência 1a. O método de seleção de abertura de tempo pode ser ao menos um dos métodos descritos acima, pode incluir ao menos um método diferente aqueles descritos acima, ou pode ser a combinação dos 25 mesmos.The time opening selection unit 1 p receives a signal in the QMF domain from the frequency conversion unit 1a and selects a time opening in which the linear forecast analysis by the linear forecast analysis unit 1e1 is performed. The linear forecast analysis unit 1e1 performs the linear forecast analysis on the QMF domain signal at the selected time slot as the linear forecast analysis unit 5e, based on the selection result transmitted from the selection unit of opening time 1 p, to obtain at least one of the high frequency linear forecast coefficient and the low frequency linear forecast coefficient. The filter resistance parameter calculation unit 1f calculates a filter resistance parameter using 10 of a linear prediction coefficient of the time gap selected by the time gap selection unit 1 p, obtained by the forecast analysis unit linear 1e1. To select a time slot by the 1 p time slot selection unit, for example, at least one of the selection methods using the signal strength of the QMF domain signal of the 15 high frequency components, similar to those of a time opening selection unit 3a in a decoding device 21a of the present modification, which will be described hereinafter, can be used. At this time, it is preferable that the QMF domain signal of the high frequency components in the time opening selection unit 1p is a frequency component encoded by the SBR coding unit 1d, among the signals in the QMF domain received at from the frequency conversion unit 1a. The time slot selection method can be at least one of the methods described above, it can include at least one method other than those described above, or it can be a combination of the same 25.

Um dispositivo de decodificação de voz 21a (vide a figura 18) da modificação 4 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de 30 voz 21a carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 19) armazenado em uma memória interna do dispositivo de decodificação de voz 21a tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 21a recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 21a. O dispositivo de decodificação de voz 21a, conforme ilustrado na figura 18, inclui uma unidade de análise de previsão linear de baixa frequência 2d1, uma unidade de detecção de sinal 2e1, uma unidade de análise de previsão linear de alta frequência 2h1, uma unidade de filtro inverso de previsão linear 2i1, e uma unidade de filtro de previsão linear 2k3 ao invés da unidade de análise de previsão linear de baixa frequência 2d, da unidade de detecção de sinal 2e, da unidade de análise de previsão linear de alta frequência 2h, da unidade de filtro inverso de previsão linear 2i, e a unidade de filtro de previsão linear 2k do dispositivo de decodificação de voz 21, e ainda inclui a unidade de seleção de abertura de tempo 3a.A voice decoding device 21a (see figure 18) of modification 4 of the first embodiment physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the device voice decoding system 21a loading and running a predetermined computer program (such as a computer program to perform the processes illustrated in the flowchart of figure 19) stored in an internal memory of the voice decoding device 21a such as ROM in RAM . The communication device of the voice decoding device 21a receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the speech decoding device 21a. The voice decoding device 21a, as shown in Figure 18, includes a low frequency linear prediction analysis unit 2d1, a signal detection unit 2e1, a high frequency linear prediction analysis unit 2h1, a inverse linear prediction filter 2i1, and a linear prediction filter unit 2k3 instead of the low frequency linear prediction analysis unit 2d, the signal detection unit 2e, the high frequency linear prediction analysis unit 2h, the linear prediction reverse filter unit 2i, and the linear prediction filter unit 2k of the voice decoding device 21, and further includes the time gap selection unit 3a.

A unidade de seleção de abertura de tempo 3a determina se a filtragem de síntese de previsão linear na unidade de filtro de previsão linear 2k deve ser realizada no sinal qexp (k, r) no domínio de QMF dos componentes de alta frequência da abertura de tempo r gerados pela unidade de geração de alta frequência 2g, e seleciona uma abertura de tempo em que a filtragem de síntese de previsão linear é realizada (processo na Etapa Sh1). A unidade de seleção de abertura de tempo 3a notifica, do resultado de seleção da abertura de tempo, a unidade de análise de previsão linear de baixa frequência 2d1, a unidade de detecção de sinal 2e1, a unidade de análise de previsão linear de alta frequência 2h1, a unidade de filtro inverso de previsão linear 2i1, e a unidade de filtro de previsão linear 2k3. A unidade de análise de previsão linear de baixa frequência 2d1 realiza a análise de previsão linear no sinal de domínio de QMF na abertura de tempo selecionada r1, da mesma maneira que a unidade de análise de previsão linear de baixa frequência 2d, com base no resultado de seleção transmitido a partir da unidade de seleção de abertura de tempo 3a, para obter um coeficiente de previsão linear de baixa frequência (processo na Etapa Sh2). A unidade de detecção de sinal 2e1 detecta a variação temporal no sinal de domínio de QMF na abertura de tempo selecionada, como a unidade de detecção de sinal 2e, com base no resultado de seleção transmitido a partir da unidade de seleção de abertura de tempo 3a, e emite um resultado de detecção T (r1).The time slot selection unit 3a determines whether the linear forecast synthesis filtering in the linear forecast filter unit 2k should be performed on the qexp (k, r) signal in the QMF domain of the high frequency time gap components r generated by the high frequency generation unit 2g, and selects a time slot in which the linear forecast synthesis filtering is performed (process in Step Sh1). The time gap selection unit 3a notifies the low frequency linear forecast analysis unit 2d1 of the time gap selection result, the signal detection unit 2e1, the high frequency linear forecast analysis unit 2h1, the linear prediction filter unit 2i1, and the linear prediction filter unit 2k3. The low frequency linear forecast analysis unit 2d1 performs linear forecast analysis on the QMF domain signal at the selected time slot r1, in the same way as the low frequency linear forecast analysis unit 2d, based on the result of selection transmitted from the time opening selection unit 3a, to obtain a low frequency linear forecast coefficient (process in Step Sh2). The signal detection unit 2e1 detects the time variation in the QMF domain signal at the selected time slot, like the signal detection unit 2e, based on the selection result transmitted from the time opening selection unit 3a , and issues a detection result T (r1).

A unidade de ajuste de resistência de filtro 2f realiza o ajuste de resistência de filtro no coeficiente de previsão linear de baixa frequência da abertura de tempo selecionada pela unidade de seleção de abertura de tempo 3a obtida pela unidade de análise de previsão linear de baixa frequência 2d1, para obter um coeficiente de previsão linear ajustado adec(n, r1). A unidade de análise de previsão linear de alta frequência 2h1 realiza a análise de previsão linear na direção de frequência no sinal de domínio de QMF dos componentes de alta frequência gerados pela unidade de geração de alta frequência 2g para a abertura de tempo selecionada r1, com base no resultado de seleção transmitido a partir da unidade de seleção de abertura de tempo 3a, como a unidade de análise de previsão linear de alta frequência 2h, para obter um coeficiente de previsão linear de alta frequência aeXp (n, r1) (processo na Etapa Sh3). A unidade de filtro inverso de previsão linear 2i1 realiza a filtragem inversa de previsão linear, em que aexp (n, r1) é um coeficiente, na direção de frequência no sinal qexp (k, r) no domínio de QMF dos componentes de alta frequência da abertura de tempo selecionada r1, como a unidade de filtro inverso de previsão linear 2i, com base no resultado de seleção transmitido a partir da unidade de seleção de abertura de tempo 3a (processo na Etapa Sh4).The filter resistance adjustment unit 2f performs the filter resistance adjustment on the low frequency linear forecast coefficient of the time gap selected by the time gap selection unit 3a obtained by the low frequency linear forecast analysis unit 2d1 , to obtain an adjusted linear forecast coefficient adec (n, r1). The 2h1 high frequency linear forecast analysis unit performs linear forecast analysis in the frequency direction on the QMF domain signal of the high frequency components generated by the high frequency generation unit 2g for the selected time slot r1, with based on the selection result transmitted from the time opening selection unit 3a, such as the 2h high frequency linear forecast analysis unit, to obtain a high frequency linear forecast coefficient aeXp (n, r1) (process in Step Sh3). The linear prediction inverse filter unit 2i1 performs inverse linear prediction filtering, where aexp (n, r1) is a coefficient, in the direction of frequency in the signal qexp (k, r) in the QMF domain of the high frequency components of the selected time slot r1, as the linear prediction inverse filter unit 2i, based on the selection result transmitted from the time slot selection unit 3a (process in Step Sh4).

A unidade de filtro de previsão linear 2k3 realiza a filtragem de síntese de previsão linear na direção de frequência em um sinal qadj(k, r1) no domínio de QMF dos componentes de alta frequência emitidos a partir da unidade de ajuste de alta frequência 2j na abertura de tempo selecionada r1 com uso de aadj (n, r1) obtido a partir da unidade de ajuste de resistência de filtro 2f, como a unidade de filtro de previsão linear 2k, com base no resultado de seleção transmitido a partir da unidade de seleção de abertura de tempo 3a (processo na Etapa Sh5). As alterações feitas na unidade de filtro de previsão linear 2k descrita na modificação 3 podem ser também feitas na unidade de filtro de previsão linear 2k3. Para selecionar uma abertura de tempo em que a filtragem de síntese de previsão linear é realizada, por exemplo, a unidade de seleção de abertura de tempo 3a pode selecionar ao menos uma abertura de tempo r em que a força de sinal do sinal de domínio de QMF qexp (k, r) dos componentes de alta frequência é maior que um valor predeterminado PexP,ThÉ preferível calcular a força de sinal de qeXp(k,r) de acordo com a seguinte expressão.

Figure img0037
em que M é um valor que representa uma faixa de frequência mais alta que uma frequência limite inferior kx dos componentes de alta frequência gerados pela unidade de geração de alta frequência 2g, e a faixa de frequência dos componentes de alta frequência gerados pela unidade de geração de alta frequência 2g pode ser representada como kx<k<kx+M. O valor predeterminado Pexp.Th pode ser também um valor médio de uma largura de tempo predeterminada Pexp(r) incluindo a abertura de tempo r. A largura de tempo predeterminada pode ser também o envelope de SBR.The 2k3 linear forecast filter unit performs linear forecast synthesis filtering in the frequency direction on a qadj signal (k, r1) in the QMF domain of the high frequency components emitted from the high frequency adjustment unit 2j on selected time slot r1 using aadj (n, r1) obtained from the filter resistance adjustment unit 2f, as the linear prediction filter unit 2k, based on the selection result transmitted from the selection unit opening time 3a (process in Step Sh5). Changes made to the linear forecast filter unit 2k described in modification 3 can also be made to the linear forecast filter unit 2k3. To select a time slot in which linear forecast synthesis filtering is performed, for example, the time slot selection unit 3a can select at least one time slot r in which the signal strength of the domain signal is QMF qexp (k, r) of the high frequency components is greater than a predetermined value PexP, It is preferable to calculate the signal strength of qeXp (k, r) according to the following expression.
Figure img0037
where M is a value that represents a frequency range higher than a lower limit frequency kx of the high frequency components generated by the high frequency generation unit 2g, and the frequency range of the high frequency components generated by the generation unit high frequency 2g can be represented as kx <k <kx + M. The predetermined value Pexp.Th can also be an average value of a predetermined time width Pexp (r) including time slot r. The predetermined time width can also be the SBR envelope.

A seleção pode ser também feita de forma a incluir uma abertura de tempo em que a força de sinal do sinal de domínio de QMF dos componentes de alta frequência alcance seu pico. A força de sinal de pico pode ser calculada, por exemplo, com uso de um valor de média em movimento:

Figure img0038
da força de sinal, e a força de sinal de pico pode ser a força de sinal no domínio de QMF dos componentes de alta frequência da abertura de tempo r em que o resultado de:
Figure img0039
altera do valor positivo para o valor negativo. O valor de média em movimento da força de sinal,
Figure img0040
por exemplo, pode ser calculada pela seguinte expressão.
Figure img0041
em que c é um valor predeterminado para definir uma faixa para calcular o valor médio. A força de sinal de pico pode ser calculada pelo método descrito acima, ou pode ser calculada por um método diferente.The selection can also be made to include a time gap in which the signal strength of the QMF domain signal of the high frequency components reaches its peak. The peak signal strength can be calculated, for example, using a moving average value:
Figure img0038
of the signal strength, and the peak signal strength may be the signal strength in the QMF domain of the high frequency components of the time gap r where the result of:
Figure img0039
changes from positive to negative value. The moving average value of the signal strength,
Figure img0040
for example, it can be calculated by the following expression.
Figure img0041
where c is a predetermined value for defining a range for calculating the average value. The peak signal strength can be calculated by the method described above, or it can be calculated by a different method.

Ao menos uma abertura de tempo pode ser selecionada a partir das aberturas de tempo incluídas em uma largura de tempo t durante a qual a força de sinal do sinal de domínio de QMF dos componentes de alta frequência é alterada de um estado estável com uma pequena variação para um estado transiente com uma grande variação, e que são menores que um valor predeterminado tthAo menos uma abertura de tempo pode ser também selecionada de aberturas de tempo incluídas em uma largura de tempo t durante a qual a força de sinal do sinal de domínio de QMF dos componentes de alta frequência é alterada de um estado transiente com uma grande variação para um estado estável com uma pequena variação, e que são maiores que o valor predeterminado tth. A abertura de tempo r em que |PexP(r+1)-Pexp(r)| é menor que um valor predeterminado (ou igual ou menor que um valor predeterminado) pode ser o estado estável, e a abertura de tempo r em que |Pexp(r+1)-Pexp(r)| é igual ou maior que um valor predeterminado (ou maior que um valor predeterminado) pode ser o estado transiente. A abertura de tempo r em que |Pexp,MA(r+1)-Pexp,MA(r)| é menor que um valor predeterminado (ou igual ou menor que um valor predeterminado) pode ser o estado estável, e a abertura de tempo r em que |PexP,MA(r+1)-Pexp,MA(r)| é igual ou maior que um valor predeterminado (ou maior que um valor predeterminado) pode ser o estado transiente. O estado transiente e o estado estável podem ser definidos com uso do método descrito acima, ou podem ser definidos com uso de diferentes métodos. O método de seleção de abertura de tempo pode ser ao menos um dos métodos descritos acima, pode incluir ao menos um método diferente daqueles descritos acima, ou pode ser a combinação dos mesmos.At least one time slot can be selected from the time slots included in a time width t during which the signal strength of the QMF domain signal of the high frequency components is changed from a steady state with a slight variation for a transient state with a wide variation, and which are less than a predetermined value tth At least one time slot can also be selected from time slots included in a time width t during which the signal strength of the domain signal of QMF of the high frequency components is changed from a transient state with a large variation to a stable state with a small variation, and that are greater than the predetermined value tth. The opening time r in which | PexP (r + 1) -Pexp (r) | is less than a predetermined value (or equal to or less than a predetermined value) can be the steady state, and the time gap r where | Pexp (r + 1) -Pexp (r) | is equal to or greater than a predetermined value (or greater than a predetermined value) can be the transient state. The opening time r in which | Pexp, MA (r + 1) -Pexp, MA (r) | is less than a predetermined value (or equal to or less than a predetermined value) can be the steady state, and the time gap r where | PexP, MA (r + 1) -Pexp, MA (r) | is equal to or greater than a predetermined value (or greater than a predetermined value) can be the transient state. The transient state and the steady state can be defined using the method described above, or they can be defined using different methods. The time slot selection method can be at least one of the methods described above, it can include at least one method different from those described above, or it can be a combination of them.

(Modificação 5 da Primeira modalidade)(Modification 5 of the First modality)

Um dispositivo de codificação de voz 11c (figura 45) de uma modificação 5 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 11c carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz 11c tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 11c recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 11c, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 11c. O dispositivo de codificação de voz 11c inclui uma unidade de seleção de abertura de tempo 1 p1 e uma unidade de multiplexação de fluxo de bit 1 g4, ao invés da unidade de seleção de abertura de tempo 1p e da unidade de multiplexação de fluxo de bit 1g do dispositivo de codificação de voz 11b da modificação 4.A voice coding device 11c (figure 45) of a modification 5 of the first embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice device. voice coding 11c by loading and running a predetermined computer program stored in an internal memory of the voice coding device 11c such as ROM in RAM. The communication device of the speech coding device 11c receives a speech signal to be encoded from outside the speech coding device 11c, and emits a multiplexed bit stream encoded out of the speech coding device 11c. The voice coding device 11c includes a 1 p1 time gap selection unit and a 1 g4 bit stream multiplexing unit, instead of the 1p time gap selection unit and bit stream multiplexing unit. 1g of voice coding device 11b of modification 4.

A unidade de seleção de abertura de tempo 1 p1 seleciona uma abertura de tempo como a unidade de seleção de abertura de tempo 1p descrita na modificação 4 da primeira modalidade, e transmite informações de seleção de tempo de abertura para a unidade de multiplexação de fluxo de bit 1g4. A unidade de multiplexação de fluxo de bit 1g4 multiplexa o fluxo de bit codificado calculado pela unidade de codificação de codec central 1c, as informações suplementares de SBR calculadas pela unidade de codificação de SBR 1 d, e o parâmetro de resistência de filtro calculado pela unidade de cálculo de parâmetro de resistência de filtro 1f como a unidade de multiplexação de fluxo de bit 1g, também multiplexa as informações de seleção de tempo de abertura recebidas a partir da unidade de seleção de abertura de tempo 1p1, e emite o fluxo de bit multiplexado através do dispositivo de comunicação do dispositivo de codificação de voz 11c. As informações de seleção de tempo de abertura são informações de seleção de tempo de abertura recebidas por uma unidade de seleção de abertura de tempo 3a1 em um dispositivo de decodificação de voz 21b, que será descrito adiante, e, por exemplo, um índice r1 de uma abertura de tempo a ser selecionada pode ser incluído. As informações de seleção de tempo de abertura podem ser também um método de seleção de parâmetro usado na abertura de tempo da unidade de seleção de abertura de tempo 3a1. O dispositivo de decodificação de voz 21b (vide a figura 20) da modificação 5 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz 21b carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma a figura 21) armazenado em uma memória interna do dispositivo de decodificação de voz 21b tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 21b recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 21b.The time opening selection unit 1 p1 selects a time opening as the time opening selection unit 1p described in modification 4 of the first modality, and transmits opening time selection information to the flow multiplexing unit bit 1g4. The 1g4 bit stream multiplexing unit multiplexes the encoded bit stream calculated by the central codec coding unit 1c, the supplementary SBR information calculated by the SBR coding unit 1 d, and the filter resistance parameter calculated by the unit of filter resistance parameter calculation 1f as the 1g bit stream multiplexing unit, also multiplexes the opening time selection information received from the 1p1 time opening selection unit, and outputs the multiplexed bit stream through the communication device of the voice coding device 11c. The opening time selection information is the opening time selection information received by a time opening selection unit 3a1 on a voice decoding device 21b, which will be described below, and, for example, an index r1 of a time slot to be selected can be included. The opening time selection information can also be a parameter selection method used in the time opening of the time opening selection unit 3a1. The voice decoding device 21b (see figure 20) of modification 5 of the first modality physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the device speech decoder 21b loading and executing a predetermined computer program (such as a computer program to perform the processes illustrated in the flow chart in figure 21) stored in an internal memory of the voice decoding device 21b such as the ROM in RAM. The communication device of the voice decoding device 21b receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the speech decoding device 21b.

O dispositivo de decodificação de voz 21b, conforme ilustrado na figura 20, inclui uma unidade de separação de fluxo de bit 2a5 e a unidade de seleção de abertura de tempo 3a1 ao invés da unidade de separação de fluxo de bit 2a e da unidade de seleção de abertura de tempo 3a do dispositivo de decodificação de voz 21a da modificação 4, e as informações de seleção de tempo de abertura são fornecidas para a unidade de seleção de abertura de tempo 3a1. A unidade de separação de fluxo de bit 2a5 separa o fluxo de bit multiplexado no parâmetro de resistência de filtro, as informações suplementares de SBR, e o fluxo de bit codificado como a unidade de separação de fluxo de bit 2a, e ainda separa as informações de seleção de tempo de abertura. A unidade de seleção de abertura de tempo 3a1 seleciona uma abertura de tempo com base nas informações de seleção de tempo de abertura transmitidas a partir da unidade de separação de fluxo de bit 2a5 (processo na Etapa Si1). As informações de seleção de tempo de abertura são informações usadas para selecionar uma abertura de tempo, e, por exemplo, pode incluir o índice r1 da abertura de tempo a ser selecionada. As informações de seleção de tempo de abertura podem ser também um parâmetro, por exemplo, usado no método de seleção de abertura de tempo na modificação 4. Neste caso, embora não ilustrado, o sinal de domínio de QMF dos componentes de alta frequência gerados pela unidade de geração de alta frequência 2g pode ser fornecido para a unidade de seleção de abertura de tempo 3a1, em adição às informações de seleção de tempo de abertura.The voice decoding device 21b, as shown in figure 20, includes a bit stream separation unit 2a5 and the time gap selection unit 3a1 instead of bit stream separation unit 2a and the selection unit opening time 3a of the voice decoding device 21a of modification 4, and opening time selection information is provided to the opening time selection unit 3a1. The bit stream separation unit 2a5 separates the multiplexed bit stream in the filter resistance parameter, the supplementary SBR information, and the bit stream encoded as the bit stream separation unit 2a, and further separates the information of opening time selection. The time opening selection unit 3a1 selects a time opening based on the opening time selection information transmitted from the bit stream separation unit 2a5 (process in Step Si1). The opening time selection information is information used to select an opening time, and, for example, can include the index r1 of the opening time to be selected. The opening time selection information can also be a parameter, for example, used in the time opening selection method in modification 4. In this case, although not illustrated, the QMF domain signal of the high frequency components generated by the 2g high frequency generation unit can be provided for the opening time selection unit 3a1, in addition to the opening time selection information.

O parâmetro pode ser também um valor predeterminado (tal como PeXp,Th θ t-Fh) usado para selecionar a abertura de tempo.The parameter can also be a predetermined value (such as PeXp, Th θ t-Fh) used to select the time gap.

(Modificação 6 da Primeira modalidade)(Modification 6 of the First modality)

Um dispositivo de codificação de voz 11 d (não ilustrado) de uma modificação 6 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 11 d carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz 11 d tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 11d recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 11 d, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 11 d. O dispositivo de codificação de voz 11 d inclui uma unidade de cálculo de força de período curto 1i1, que não é ilustrada, ao invés da unidade de cálculo de força de período curto 1i do dispositivo de codificação de voz 11a da modificação 1, e ainda inclui uma unidade de seleção de abertura de tempo 1p2.A voice coding device 11d (not shown) of a modification 6 of the first embodiment physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the device voice coding 11 d loading and running a predetermined computer program stored in an internal memory of the voice coding device 11 d such as ROM in RAM. The communication device of the speech coding device 11d receives a speech signal to be encoded from outside the speech coding device 11d, and outputs a multiplexed bit stream encoded out of the speech coding device 11d. The voice coding device 11 d includes a short-term force calculation unit 1i1, which is not illustrated, instead of the short-term strength calculation unit 1i of the voice coding device 11a of modification 1, and further includes a 1p2 time opening selection unit.

A unidade de seleção de abertura de tempo 1p2 recebe um sinal no domínio de QMF a partir da unidade de conversão de frequência 1a, e seleciona uma abertura de tempo que corresponde à seção de tempo em que o processo de cálculo de força de período curto é realizado pela unidade de cálculo de força de período curto 1i. A unidade de cálculo de força de período curto 1Í1 calcula a força de período curto de uma seção de tempo que corresponde à abertura de tempo selecionada com base no resultado de seleção transmitido a partir da unidade de seleção de abertura de tempo 1p2, como a unidade de cálculo de força de período curto 1i do dispositivo de codificação de voz 11a da modificação 1.The time gap selection unit 1p2 receives a signal in the QMF domain from the frequency conversion unit 1a, and selects a time gap that corresponds to the time section in which the short period strength calculation process is performed by the short period force calculation unit 1i. The short period force calculation unit 1Í1 calculates the short period force of a time section that corresponds to the selected time slot based on the selection result transmitted from the time gap selection unit 1p2, as the unit short-term force calculation method 1i of the voice coding device 11a of modification 1.

(Modificação 7 da Primeira modalidade)(Modification 7 of the First modality)

Um dispositivo de codificação de voz 11 e (não ilustrado) de uma modificação 7 a primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, u a dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 11e carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz 11e tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 11e recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 11e, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 11e. O dispositivo de codificação de voz 11e inclui uma unidade de seleção de abertura de tempo 1p3, que não é ilustrada, ao invés da unidade de seleção de abertura de tempo 1p2 do dispositivo de codificação de voz 11d da modificação 6. O dispositivo de codificação de voz 11e também inclui uma unidade de multiplexação de fluxo de bit que ainda recebe uma saída da unidade de seleção de abertura de tempo 1 p3, ao invés da unidade de multiplexação de fluxo de bit 1 g 1. A unidade de seleção de abertura de tempo 1p3 seleciona uma abertura de tempo como a unidade de seleção de abertura de tempo 1p2 descrita na modificação 6 da primeira modalidade, e transmite as informações de seleção de tempo de abertura para a unidade de multiplexação de fluxo de bit.A voice coding device 11 and (not shown) of a modification 7 the first embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the device voice coding 11e by loading and running a predetermined computer program stored in an internal memory of the voice coding device 11e such as ROM in RAM. The communication device of the speech coding device 11e receives a speech signal to be encoded from outside the speech coding device 11e, and emits a multiplexed bit stream encoded out of the speech coding device 11e. The voice coding device 11e includes a time opening selection unit 1p3, which is not illustrated, instead of the time opening selection unit 1p2 of the modification 6 voice coding device 11d. Voice 11e also includes a bit stream multiplexing unit that still receives an output from the 1 p3 time gap selection unit, instead of the 1 g bit stream multiplexing unit 1. The time gap selection unit 1p3 selects a time slot as the time slot selection unit 1p2 described in modification 6 of the first mode, and transmits the opening time selection information to the bit stream multiplexing unit.

(Modificação 8 da Primeira modalidade)(Modification 8 of the First modality)

Um dispositivo de codificação de voz (não ilustrado) de uma modificação 8 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz da modificação 8 carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz da modificação 8 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz da modificação 8 recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz. O dispositivo de codificação de voz da modificação 8 ainda inclui a unidade de seleção de abertura de tempo 1p em adição àquelas do dispositivo de codificação de voz descrito na modificação 2.A voice coding device (not shown) of a modification 8 of the first embodiment physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the coding device modification 8 voice program by loading and running a predetermined computer program stored in an internal memory of the modification 8 voice coding device such as ROM in RAM. The communication device of the modification 8 speech coding device receives a speech signal to be encoded from outside the speech coding device, and emits a coded multiplexed bit stream out of the speech coding device. The voice coding device of modification 8 further includes the time opening selection unit 1p in addition to those of the voice coding device described in modification 2.

Um dispositivo de decodificação de voz (não ilustrado) da modificação 8 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz da modificação 8 carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de decodificação de voz da modificação 8 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz da modificação 8 recebe o fluxo de bit multiplexado codificado, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz. O dispositivo de decodificação de voz da modificação 8 ainda inclui a unidade de análise de previsão linear de baixa frequência 2d1, a unidade de detecção de sinal 2e1, a unidade de análise de previsão linear de alta frequência 2h1, a unidade de filtro inverso de previsão linear 2i1, e a unidade de filtro de previsão linear 2k3, ao invés da unidade de análise de previsão linear de baixa frequência 2d, da unidade de detecção de sinal 2e, da unidade de análise de previsão linear de alta frequência 2h, da unidade de filtro inverso de previsão linear 2i, e da unidade de filtro de previsão linear 2k do dispositivo de decodificação de voz descrito na modificação 2, e ainda inclui a unidade de seleção de abertura de tempo 3a.A voice decoding device (not shown) of modification 8 of the first modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not shown, and the CPU fully controls the decoding device of voice of modification 8 loading and executing a predetermined computer program stored in an internal memory of the voice decoding device of modification 8 such as ROM in RAM. The communication device of the modification 8 voice decoding device receives the encoded multiplexed bit stream, and outputs a decoded speech signal out of the speech decoding device. The voice decoding device of modification 8 further includes the low frequency linear prediction analysis unit 2d1, the signal detection unit 2e1, the high frequency linear prediction analysis unit 2h1, the reverse forecast filter unit linear 2i1, and the linear prediction filter unit 2k3, instead of the low frequency linear prediction analysis unit 2d, the signal detection unit 2e, the high frequency linear prediction analysis unit 2h, the inverse linear prediction filter 2i, and the linear prediction filter unit 2k of the voice decoding device described in modification 2, and further includes the time gap selection unit 3a.

(Modificação 9 da Primeira modalidade)(Modification 9 of the First modality)

Um dispositivo de codificação de voz (não ilustrado) de uma modificação 9 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz da modificação 9 carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz da modificação 9 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz da modificação 9 recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz. O dispositivo de codificação de voz da modificação 9 inclui a unidade de seleção de abertura de tempo 1 p1 ao invés da unidade de seleção de abertura de tempo 1p do dispositivo de codificação de voz descrito na modificação 8. O dispositivo de codificação de voz da modificação 9 ainda inclui uma unidade de multiplexação de fluxo de bit que recebe uma saída da unidade de seleção de abertura de tempo 1p1 em adição para entrada fornecida para a unidade de multiplexação de fluxo de bit descrita na modificação 8, ao invés da unidade de multiplexação de fluxo de bit descrita na modificação 8.A voice encoding device (not shown) of a modification 9 of the first embodiment physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the encoding device modification 9 voice program by loading and running a predetermined computer program stored in an internal memory of the modification 9 voice coding device such as ROM in RAM. The communication device of the voice coding device of modification 9 receives a speech signal to be encoded from outside the speech coding device, and emits an encoded multiplexed bit stream out of the speech coding device. The voice coding device of modification 9 includes the time opening selection unit 1 p1 instead of the time opening selection unit 1p of the voice coding device described in modification 8. The voice coding device of the modification 9 further includes a bit stream multiplexing unit that receives an output from the 1p1 time slot selection unit in addition to the input provided for the bit stream multiplexing unit described in modification 8, instead of the bit multiplexing unit. bit stream described in modification 8.

Um dispositivo de decodificação de voz (não ilustrado) da modificação 9 da primeira modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz da modificação 9 carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de decodificação de voz da modificação 9 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz da modificação 9 recebe o fluxo de bit multiplexado codificado, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz. O dispositivo de decodificação de voz da modificação 9 inclui a unidade de seleção de abertura de tempo 3a1 ao invés da unidade de seleção de abertura de tempo 3a do dispositivo de decodificação de voz descrito na modificação 8. O dispositivo de decodificação de voz da modificação 9 ainda inclui uma unidade de separação de fluxo de bit que separa aD (n, r) descrito na modificação 2 ao invés do parâmetro de resistência de filtro da unidade de separação de fluxo de bit 2a5, ao invés da unidade de separação de fluxo de bit 2a. (Modificação 1 da Segunda modalidade)A voice decoding device (not shown) of modification 9 of the first embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not shown, and the CPU fully controls the decoding device of voice of modification 9 loading and executing a predetermined computer program stored in an internal memory of the voice decoding device of modification 9 such as ROM in RAM. The communication device of the voice decoding device of modification 9 receives the encoded multiplexed bit stream, and outputs a decoded speech signal out of the speech decoding device. The voice decoding device of modification 9 includes the time opening selection unit 3a1 instead of the time opening selection unit 3a of the voice decoding device described in modification 8. The voice decoding device of modification 9 further includes a bit stream separation unit that separates aD (n, r) described in modification 2 instead of the filter resistance parameter of bit stream separation unit 2a5, instead of the bit stream separation unit 2a. (Modification 1 of the Second modality)

Um dispositivo de codificação de voz 12a (figura 46) de uma modificação 1 da segunda modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 12a carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz 12a tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 12a recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 12a, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 12a.. O dispositivo de codificação de voz 12a inclui a unidade de análise de previsão linear 1e1 ao invés da unidade de análise de previsão linear 1e do dispositivo de codificação de voz 12, e ainda inclui a unidade de seleção de abertura de tempo 1p.A voice coding device 12a (figure 46) of a modification 1 of the second embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice device. voice coding 12a by loading and running a predetermined computer program stored in an internal memory of the voice coding device 12a such as the ROM in RAM. The communication device of the speech coding device 12a receives a speech signal to be encoded from outside the speech coding device 12a, and emits a multiplexed bit stream encoded out of the speech coding device 12a. speech coding unit 12a includes linear forecast analysis unit 1e1 instead of linear forecast analysis unit 1e of voice coding device 12, and further includes time opening selection unit 1p.

Um dispositivo de decodificação de voz 22a (vide a figura 22) da modificação 1 da segunda modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz 22a carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 23) armazenado em uma memória interna do dispositivo de decodificação de voz 22a tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 22a recebe o fluxo de bit multiplexado codificado, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 22a. O dispositivo de decodificação de voz 22a, conforme ilustrado na figura 22, inclui a unidade de análise de previsão linear de alta frequência 2h1, a unidade de filtro inverso de previsão linear 2i1, uma unidade de filtro de previsão linear 2k2, e uma unidade de interpolação/extrapolação de previsão linear 2p1, ao invés da unidade de análise de previsão linear de alta frequência 2h, a unidade de filtro inverso de previsão linear 2i, a unidade de filtro de previsão linear 2k1, e a unidade de interpolação/extrapolação de previsão linear 2p do dispositivo de decodificação de voz 22 da segunda modalidade, e ainda inclui a unidade de seleção de abertura de tempo 3a.A voice decoding device 22a (see figure 22) of modification 1 of the second embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the device speech decoder 22a loading and executing a predetermined computer program (such as a computer program to perform the processes illustrated in the flowchart of figure 23) stored in an internal memory of the voice decoding device 22a such as the ROM in RAM. The communication device of the voice decoding device 22a receives the encoded multiplexed bit stream, and emits a decoded speech signal out of the speech decoding device 22a. The voice decoding device 22a, as shown in figure 22, includes the high frequency linear prediction analysis unit 2h1, the linear prediction reverse filter unit 2i1, a linear prediction filter unit 2k2, and a linear prediction interpolation / extrapolation 2p1, instead of the high frequency linear prediction analysis unit 2h, the linear forecast reverse filter unit 2i, the linear prediction filter unit 2k1, and the forecast interpolation / extrapolation unit linear 2p of the voice decoding device 22 of the second mode, and also includes the time opening selection unit 3a.

A unidade de seleção de abertura de tempo 3a notifica, do resultado de seleção da abertura de tempo, a unidade de análise de previsão linear de alta frequência 2h1a a unidade de filtro inverso de previsão linear 2i1, a unidade de filtro de previsão linear 2k2, e a unidade de interpolação/extrapolação de coeficiente de previsão linear 2p1. A unidade de interpolação/extrapolação de coeficiente de previsão linear 2p1 obtém an (n, r) que corresponde à abertura de tempo r1 que é a abertura de tempo selecionada e para a qual um coeficiente de previsão linear não é transmitido por interpolação ou extrapolação, como a unidade de interpolação/extrapolação de coeficiente de previsão linear 2p, com base no resultado de seleção transmitido a partir da unidade de seleção de abertura de tempo 3a (processo na Etapa Sj1). A unidade de filtro de previsão linear 2k2 realiza a filtragem de síntese de previsão linear na direção de frequência em qadj (n, r1) emitido a partir da unidade de ajuste de alta frequência 2j para a abertura de tempo selecionada r1 com uso de an (n, r1) que é interpolado ou extrapolado e obtido a partir da unidade de interpolação/extrapolação de coeficiente de previsão linear 2p1, como a unidade de filtro de previsão linear 2k1 (processo na Etapa Sj2), com base no resultado de seleção transmitido a partir da unidade de seleção de abertura de tempo 3a. As alterações feitas na unidade de filtro de previsão linear 2k descrita na modificação 3 da primeira modalidade podem ser também feitas na unidade de filtro de previsão linear 2k2.The time gap selection unit 3a notifies the high frequency linear forecast analysis unit 2h1a of the linear forecast reverse filter unit 2i1, the linear forecast filter unit 2k2, of the time opening selection result 2h1, and the linear prediction coefficient 2p1 interpolation / extrapolation unit. The linear prediction coefficient 2p1 interpolation / extrapolation unit obtains an (n, r) which corresponds to the time gap r1 which is the selected time gap and for which a linear forecast coefficient is not transmitted by interpolation or extrapolation, as the linear prediction coefficient 2p interpolation / extrapolation unit, based on the selection result transmitted from the time gap selection unit 3a (process in Step Sj1). The 2k2 linear forecast filter unit performs linear forecast synthesis filtering in the frequency direction in qadj (n, r1) emitted from the high frequency adjustment unit 2j for the selected time slot r1 using an ( n, r1) that is interpolated or extrapolated and obtained from the linear prediction coefficient 2p1 interpolation / extrapolation unit, such as the linear prediction filter unit 2k1 (process in Step Sj2), based on the selection result transmitted to from the time opening selection unit 3a. Changes made to the linear forecast filter unit 2k described in modification 3 of the first modality can also be made to the linear forecast filter unit 2k2.

(Modificação 2 da Segunda modalidade)(Modification 2 of the Second modality)

Um dispositivo de codificação de voz 12b (figura 47) de uma modificação 2 da segunda modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 11b carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz 12b tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 12b recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 12b, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 12b. O dispositivo de codificação de voz 12b inclui a unidade de seleção de abertura de tempo 1 p1 e uma unidade de multiplexação de fluxo de bit 1g5 ao invés da unidade de seleção de abertura de tempo 1p e da unidade de multiplexação de fluxo de bit 1g2 do dispositivo de codificação de voz 12a da modificação 1. A unidade de multiplexação de fluxo de bit 1g5 multiplexa o fluxo de bit codificado calculado pela unidade de codificação de codec central 1c, as informações suplementares de SBR calculadas pela unidade de codificação de SBR 1d, e um índice da abertura de tempo que corresponde ao coeficiente de previsão linear quantizado recebido a partir da unidade de quantização de coeficiente de previsão 1k como a unidade de multiplexação de fluxo de bit 1g2, ainda multiplexa as informações de seleção de tempo de abertura recebidas a partir da unidade de seleção de abertura de tempo 1p1, e emite o fluxo de bit multiplexado através do dispositivo de comunicação do dispositivo de codificação de voz 12b.A voice coding device 12b (figure 47) of a modification 2 of the second embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice device. voice coding 11b by loading and running a predetermined computer program stored in an internal memory of the voice coding device 12b such as the ROM in RAM. The communication device of the speech coding device 12b receives a speech signal to be encoded from outside the speech coding device 12b, and outputs a multiplexed bit stream encoded out of the speech coding device 12b. The voice coding device 12b includes the 1p1 time gap selection unit and a 1g5 bit stream multiplexing unit instead of the 1p time gap selection unit and the 1g2 bit stream multiplexing unit of voice coding device 12a of the modification 1. The bit stream multiplexing unit 1g5 multiplexes the encoded bit stream calculated by the central codec coding unit 1c, the supplementary SBR information calculated by the SBR coding unit 1d, and a time gap index that corresponds to the quantized linear forecast coefficient received from the 1k forecast coefficient quantization unit as the 1g2 bit stream multiplexing unit, still multiplexing the open time selection information received from of the 1p1 time slot selection unit, and output the multiplexed bit stream through the communication device of the voice coding device 12b.

Um dispositivo de decodificação de voz 22b (vide a figura 24) da modificação 2 da segunda modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de decodificação de voz 22b carregando e executando um programa de computador predeterminado (tal como um programa de computador para realizar os processos ilustrados no fluxograma da figura 25) armazenado em uma memória interna do dispositivo de decodificação de voz 22b tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de decodificação de voz 22b recebe o fluxo de bit multiplexado codificado, e emite um sinal de voz decodificado para fora do dispositivo de decodificação de voz 22b. O dispositivo de decodificação de voz 22b, conforme ilustrado na figura 24, inclui uma unidade de separação de fluxo de bit 2a6 e a unidade de seleção de abertura de tempo 3a1 ao invés da unidade de separação de fluxo de bit 2a1 e da unidade de seleção de abertura de tempo 3a do dispositivo de decodificação de voz 22a descrito na modificação 1, e as informações de seleção de tempo de abertura são fornecidas para a unidade de seleção de abertura de tempo 3a1. A unidade de separação de fluxo de bit 2a6 separa o fluxo de bit multiplexado em aH (n, n) que é quantizado, o índice n da abertura de tempo correspondente, as informações suplementares de SBR, e o fluxo de bit codificado como a unidade de separação de fluxo de bit 2a1, e ainda separa as informações de seleção de tempo de abertura. (Modificação 4 da Terceira modalidade)

Figure img0042
descrita na modificação 1 da terceira modalidade pode ser um valor médio de e (r) no envelope de SBR, ou pode ser um valor definido de alguma outra maneira.A voice decoding device 22b (see figure 24) of modification 2 of the second embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the device speech decoder 22b by loading and executing a predetermined computer program (such as a computer program to perform the processes illustrated in the flow chart of figure 25) stored in an internal memory of the voice decoding device 22b such as the ROM in RAM. The communication device of the voice decoding device 22b receives the encoded multiplexed bit stream, and outputs a decoded speech signal out of the speech decoding device 22b. The voice decoding device 22b, as shown in Figure 24, includes a bit stream separation unit 2a6 and the time gap selection unit 3a1 instead of bit stream separation unit 2a1 and the selection unit opening time 3a of the voice decoding device 22a described in modification 1, and the opening time selection information is provided for the opening time selection unit 3a1. The bit stream separation unit 2a6 separates the multiplexed bit stream in aH (n, n) which is quantized, the index n of the corresponding time slot, the supplementary SBR information, and the bit stream encoded as the unit bit stream separation 2a1, and further separates the opening time selection information. (Modification 4 of the Third modality)
Figure img0042
described in modification 1 of the third modality can be an average value of e (r) in the SBR envelope, or it can be a value defined in some other way.

(Modificação 5 da Terceira modalidade)(Modification 5 of the Third modality)

Conforme descrito na modificação 3 da terceira modalidade, é preferível que a unidade de ajuste de formato de envelope 2s controle eadj(r) com uso de um valor predeterminado eadj,Th(r)> considerando-se que o envelope temporal ajustado eadj(r) é um coeficiente de ganho multiplicado pela amostra de sub-banda de QMF, por exemplo, como a expressão (28) e as expressões (37) e (38).

Figure img0043
As described in modification 3 of the third modality, it is preferable that the envelope format adjustment unit 2s control eadj (r) using a predetermined value eadj, Th (r)> considering that the adjusted time envelope eadj (r ) is a gain coefficient multiplied by the QMF subband sample, for example, as the expression (28) and the expressions (37) and (38).
Figure img0043

(Quarta modalidade)(Fourth modality)

Um dispositivo de codificação de voz 14 (FIGURA 48) da quarta modalidade inclui fisicamente uma CPU, uma ROM, uma RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo de codificação de voz 14 carregando e executando um programa de computador predeterminado armazenado em uma memória interna do dispositivo de codificação de voz 14 tal como a ROM na RAM. O dispositivo de comunicação do dispositivo de codificação de voz 14 recebe um sinal de voz a ser codificado de fora do dispositivo de codificação de voz 14, e emite um fluxo de bit multiplexado codificado para fora do dispositivo de codificação de voz 14. O dispositivo de codificação de voz 14 inclui uma unidade de multiplexação de fluxo de bit 1g7 ao invés da unidade de multiplexação de fluxo de bit 1g do dispositivo de codificação de voz 11b da modificação 4 da primeira modalidade, e ainda inclui a unidade de cálculo de envelope temporal 1m e a unidade de cálculo de formato de envelope 1n do dispositivo de codificação de voz 13.A voice coding device 14 (FIGURE 48) of the fourth embodiment physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the voice coding device 14 loading and running a predetermined computer program stored in an internal memory of the voice coding device 14 such as the ROM in RAM. The communication device of the speech coding device 14 receives a speech signal to be encoded from outside the speech coding device 14, and emits a multiplexed bit stream encoded out of the speech coding device 14. The communication device Voice coding 14 includes a bit stream multiplexing unit 1g7 instead of the bit stream multiplexing unit 1g of voice coding device 11b of modification 4 of the first modality, and further includes the 1m time envelope calculation unit and the envelope format calculation unit 1n of the voice coding device 13.

A unidade de multiplexação de fluxo de bit 1g7 multiplexa o fluxo de bit codificado calculado pela unidade de codificação de codec central 1c e as informações suplementares de SBR calculadas pela unidade de codificação de SBR 1d como a unidade de multiplexação de fluxo de bit 1 g, converte o parâmetro de resistência de filtro calculado pela unidade de cálculo de parâmetro de resistência de filtro e o parâmetro de formato de envelope calculado pela unidade de cálculo de parâmetro de formato de envelope 1 n nas informações suplementares de envelope temporal, multiplexa-os, e emite o fluxo de bit multiplexado (fluxo de bit multiplexado codificado) através do dispositivo de comunicação do dispositivo de codificação de voz 14.The 1g7 bit stream multiplexing unit multiplexes the encoded bit stream calculated by the central codec coding unit 1c and the supplementary SBR information calculated by the SBR 1d coding unit as the 1g bit stream multiplexing unit, converts the filter resistance parameter calculated by the filter resistance parameter calculation unit and the envelope shape parameter calculated by the envelope format parameter calculation unit 1 n into the supplemental time envelope information, multiplexes them, and emits the multiplexed bit stream (encoded multiplexed bit stream) through the communication device of the voice coding device 14.

(Modificação 4 da Quarta modalidade)(Modification 4 of the fourth modality)

Um dispositivo codificador de voz 14a (figura 49) de uma modificação 4 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e o CPU controla integralmente o dispositivo codificador de voz 14a ao carregar e executar um programa de computador predeterminado armazenado em uma memória embutida do dispositivo codificador de voz 14a como o ROM no RAM. O dispositivo de comunicação do dispositivo codificador de voz 14a recebe um sinal de voz a ser codificado a partir do lado de fora do dispositivo codificador de voz 14a, e emite um fluxo de bit multiplexado codificado para o lado de fora do dispositivo codificador de voz 14a. O dispositivo codificador de voz 14a inclui a unidade de análise de predição linear 1e1 ao invés da unidade de análise de predição linear 1e do dispositivo codificador de voz 14 da quarta modalidade, e adicionalmente inclui a unidade de seleção de abertura de tempo 1p.A speech encoding device 14a (figure 49) of a modification 4 of the fourth embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the speech encoding device. voice 14a when loading and running a predetermined computer program stored in a built-in memory of the voice encoding device 14a as the ROM in RAM. The communication device of the speech encoding device 14a receives a speech signal to be encoded from outside the speech encoding device 14a, and emits an encoded multiplexed bit stream outside the speech encoding device 14a . The speech encoding device 14a includes the linear prediction analysis unit 1e1 instead of the linear prediction analysis unit 1e of the speech encoding device 14 of the fourth embodiment, and additionally includes the time opening selection unit 1p.

Um dispositivo decodificador de voz 24d (ver figura 26) da modificação 4 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e o CPU controla integralmente o dispositivo decodificador de voz 24d ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 27) armazenado em uma memória embutida do dispositivo decodificador de voz 24d como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24d recebe o fluxo de bit multiplexado codificado, e emite um sinal de voz decodificado para o lado de fora do dispositivo decodificador de voz 24d. O dispositivo decodificador de voz 24d, conforme ilustrado na figura 26, inclui a unidade de análise de predição linear de baixa frequência 2d1, a unidade de detecção de mudança de sinal 2e1, a unidade de análise de predição linear de alta frequência 2h1, a unidade de filtro inverso de predição linear 2i1, e a unidade de filtro de predição linear 2k3 ao invés de unidade de análise de predição linear de baixa frequência 2d, a unidade de detecção de mudança de sinal 2e, a unidade de análise de predição linear de alta frequência 2h, a unidade de filtro inverso de predição linear 2i, e a unidade de filtro de predição linear 2k do dispositivo decodificador de voz 24, e adicionalmente inclui a unidade de seleção de abertura de tempo 3a. A unidade de transformação de envelope temporal 2v transforma o sinal no domínio QMF obtido a partir da unidade de filtro de predição linear 2k3 através do uso de informação de envelope temporal obtida a partir da unidade de ajuste do formato de envelope 2s, conforme a unidade de transformação de envelope temporal 2v da terceira modalidade, da quarta modalidade, e das modificações do presente documento (processo na Etapa Sk1).A voice decoder device 24d (see figure 26) of modification 4 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device. 24d voice when loading and executing a predetermined computer program (such as a computer program to perform processes illustrated in the flowchart of figure 27) stored in a built-in memory of the 24d voice decoder device such as ROM in RAM. The communication device of the 24d speech decoder device receives the encoded multiplexed bit stream, and outputs a decoded speech signal to the outside of the 24d speech decoder device. The voice decoder device 24d, as shown in figure 26, includes the low frequency linear prediction analysis unit 2d1, the signal shift detection unit 2e1, the high frequency linear prediction analysis unit 2h1, the unit linear prediction filter 2i1, and linear prediction filter unit 2k3 instead of low frequency linear prediction analysis unit 2d, signal change detection unit 2e, high linear prediction analysis unit frequency 2h, the linear prediction filter unit 2i, and the linear prediction filter unit 2k of the voice decoder device 24, and additionally includes the time gap selection unit 3a. The 2v temporal envelope transformation unit transforms the signal in the QMF domain obtained from the 2k3 linear prediction filter unit through the use of temporal envelope information obtained from the 2s envelope format adjustment unit, according to the transformation of temporal envelope 2v of the third modality, of the fourth modality, and of the modifications of this document (process in Step Sk1).

(Modificação 5 da Quarta modalidade)(Modification 5 of the Fourth modality)

Um dispositivo decodificador de voz 24e (ver figura 28) de uma modificação 5 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24e ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 29) armazenado em uma memória embutida do dispositivo decodificador de voz 24e como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24e recebe o fluxo de bit multiplexado codificado, e emite um sinal de voz decodificado para o lado de fora do dispositivo decodificador de voz 24e. Na modificação 5, conforme ilustrado na figura 28, o dispositivo decodificador de voz 24e omite a unidade de análise de predição linear de alta frequência 2h1 e a unidade de filtro inverso de predição linear 2i1 do dispositivo decodificador de voz 24d descritos na modificação 4 que podem ser omitidos durante toda a quarta modalidade conforme a primeira modalidade, e inclui uma unidade de seleção de abertura de tempo 3a2 e uma unidade de transformação de envelope temporal 2v1 ao invés de unidade de seleção de abertura de tempo 3a e a unidade de transformação de envelope temporal 2v do dispositivo decodificador de voz 24d. O dispositivo decodificador de voz 24e também muda a ordem da filtragem de síntese de predição linear desempenhada através da unidade de filtro de predição linear 2k3 e do processo de transformação de envelope temporal desempenhado através da unidade de transformação de envelope temporal 2v1 cuja ordem de processamento é intercambiável através da quarta modalidade.A voice decoder device 24e (see figure 28) of a modification 5 of the fourth modality physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the decoding device 24e when loading and running a predetermined computer program (such as a computer program to perform processes illustrated in the flowchart of figure 29) stored in a built-in memory of the voice decoder device 24e as the ROM in RAM. The communication device of the voice decoder device 24e receives the encoded multiplexed bit stream, and outputs a decoded voice signal to the outside of the voice decoder device 24e. In modification 5, as shown in figure 28, the voice decoder device 24e omits the high frequency linear prediction analysis unit 2h1 and the linear prediction reverse filter unit 2i1 of the voice decoder device 24d described in modification 4 be omitted throughout the fourth modality according to the first modality, and includes a time opening selection unit 3a2 and a time envelope transformation unit 2v1 instead of time opening selection unit 3a and the envelope transformation unit time 2v of the 24d voice decoder device. The speech decoder device 24e also changes the order of the linear prediction synthesis filtering performed through the linear prediction filter unit 2k3 and the temporal envelope transformation process performed through the temporal envelope transformation unit 2v1 whose processing order is interchangeable through the fourth mode.

A unidade de transformação de envelope temporal 2v1 transforma qadj (k, r) obtido a partir da unidade de ajuste de alta frequência 2j através do uso de eadj(r) obtido a partir da unidade de ajuste do formato de envelope 2s, conforme a unidade de transformação de envelope temporal 2v, e obtém um sinal qenVadj (k, r) no domínio QMF no qual o envelope temporal é transformado. A unidade de transformação de envelope temporal 2v1 também notifica a unidade de seleção de abertura de tempo 3a2 de um parâmetro obtido quando o envelope temporal está sendo transformado, ou um parâmetro calculado ao pelo menos usar o parâmetro obtido quando o envelope temporal está sendo transformado como informação de seleção de abertura de tempo. A informação de seleção de abertura de tempo pode ser e(r) da expressão (22) ou a expressão (40), ou |e(r)|2 para o qual a operação de raiz quadrada não é aplicada durante o processo de cálculo. Uma pluralidade de seções de abertura de tempo (como envelopes SBR)

Figure img0044
pode também ser usado, e a expressão (24) que é o valor médio do presente documento
Figure img0045
podem também ser usados como a informação de seleção de abertura de tempo. Note-se que:
Figure img0046
The 2v1 time envelope transformation unit transforms qadj (k, r) obtained from the high frequency adjustment unit 2j using eadj (r) obtained from the 2s envelope format adjustment unit, according to the unit transformation of temporal envelope 2v, and obtains a signal qenVadj (k, r) in the QMF domain in which the temporal envelope is transformed. The time envelope transformation unit 2v1 also notifies the time opening selection unit 3a2 of a parameter obtained when the time envelope is being transformed, or a parameter calculated by at least using the parameter obtained when the time envelope is being transformed as time opening selection information. The opening time selection information can be e (r) of the expression (22) or the expression (40), or | e (r) | 2 for which the square root operation is not applied during the calculation process . A plurality of time slot sections (such as SBR envelopes)
Figure img0044
can also be used, and the expression (24) which is the average value of this document
Figure img0045
can also be used as the time slot selection information. Note that:
Figure img0046

A informação de seleção de abertura de tempo pode também ser eeXp(r) da expressão (26) e a expressão (41), ou |eeXp(r)|2 para o qual a operação de raiz quadrada não é aplicada durante o processo de cálculo. Uma pluralidade de seções de abertura de tempo (como envelopes SBR)

Figure img0047
e o valor médio do presente documento
Figure img0048
podem também ser usados como a informação de seleção de abertura de tempo. Note-se que:
Figure img0049
The opening time selection information can also be eeXp (r) from expression (26) and expression (41), or | eeXp (r) | 2 for which the square root operation is not applied during the process of calculation. A plurality of time slot sections (such as SBR envelopes)
Figure img0047
and the average value of this document
Figure img0048
can also be used as the time slot selection information. Note that:
Figure img0049

A informação de seleção de abertura de tempo pode também ser eadj(r) da expressão (23), da expressão (35) ou da expressão (36), ou pode ser |eadj(r)|2 para o qual a operação de raiz quadrada não é aplicada durante o processo de cálculo. Uma pluralidade de seções de abertura de tempo (como envelopes SBR)

Figure img0050
e o valor médio do presente documento
Figure img0051
podem também ser usados como a informação de seleção de abertura de tempo. Note-se que:
Figure img0052
Figure img0053
The opening time selection information can also be eadj (r) of expression (23), expression (35) or expression (36), or it can be | eadj (r) | 2 for which the root operation square is not applied during the calculation process. A plurality of time slot sections (such as SBR envelopes)
Figure img0050
and the average value of this document
Figure img0051
can also be used as the time slot selection information. Note that:
Figure img0052
Figure img0053

A informação de seleção de abertura de tempo pode também ser θadj,scaied(r) da expressão (37), ou pode ser |eadj, Scaiθd(r)|2 para o qual a operação de raiz quadrada não é aplicada durante o processo de cálculo. Em uma pluralidade de seções de abertura de tempo (como envelopes SBR)

Figure img0054
e o valor médio do presente documento
Figure img0055
podem também ser usados como a informação de seleção de abertura de tempo. Note-se que:
Figure img0056
The opening time selection information can also be θadj, scaied (r) from expression (37), or it can be | eadj, Scaiθd (r) | 2 for which the square root operation is not applied during the process of calculation. In a plurality of time slot sections (such as SBR envelopes)
Figure img0054
and the average value of this document
Figure img0055
can also be used as the time slot selection information. Note that:
Figure img0056

A informação de seleção de abertura de tempo pode também ser uma força de sinal Penvadj(0 da abertura de tempo r do sinal de domínio QMF que corresponde aos componentes de alta frequência nos quais o envelope temporal é transformado ou um valor de amplitude de sinal do presente documento para o qual a operação de raiz quadrada é aplicada

Figure img0057
The time slot selection information can also be a Penvadj signal strength (0 of the time slot r of the QMF domain signal that corresponds to the high frequency components into which the time envelope is transformed or a signal amplitude value of the present document for which the square root operation is applied
Figure img0057

Em uma pluralidade de seções de abertura de tempo (como envelopes SBR)

Figure img0058
e o valor médio do presente documento
Figure img0059
podem também ser usados como a informação de seleção de abertura de tempo. Note-se que:
Figure img0060
M é um valor que representa uma faixa de frequência mais alta do que aquela da frequência de limite baixo kx dos componentes de alta frequência gerados através da unidade de geração de alta frequência 2g, e a faixa de frequência dos componentes de alta frequência gerada através da unidade de geração de alta frequência 2g pode também ser representada como kx<k<kx+M.In a plurality of time slot sections (such as SBR envelopes)
Figure img0058
and the average value of this document
Figure img0059
can also be used as the time slot selection information. Note that:
Figure img0060
M is a value that represents a frequency range higher than that of the low limit frequency kx of the high frequency components generated through the high frequency generation unit 2g, and the frequency range of the high frequency components generated through the 2g high frequency generation unit can also be represented as kx <k <kx + M.

A unidade de seleção de abertura de tempo 3a2 seleciona uma abertura de tempo na qual a filtragem de síntese de predição linear através da qual a unidade de filtro de predição linear 2k é desempenhada, ao determinar se a filtragem de síntese de predição linear é desempenhada no sinal qenvadj (k, r) no domínio QMF dos componentes de alta frequência da abertura de tempo r na qual o envelope temporal é transformado através da unidade de transformação de envelope temporal 2v1, com base na informação de seleção de abertura de tempo transmitida a partir da unidade de transformação de envelope temporal 2v1 (processo na Etapa Sp1).The time gap selection unit 3a2 selects a time gap in which the linear prediction synthesis filtering through which the linear prediction filter unit 2k is performed, when determining whether the linear prediction synthesis filtering is performed in the qenvadj signal (k, r) in the QMF domain of the high frequency components of the time slot r in which the time envelope is transformed through the time envelope transformation unit 2v1, based on the time slot selection information transmitted from of the 2v1 temporal envelope transformation unit (process in Step Sp1).

Para selecionar uma abertura de tempo na qual a filtragem de síntese de predição linear é desempenhada através da unidade de seleção de abertura de tempo 3a2 na presente modificação, pelo menos uma abertura de tempo r na qual um parâmetro u(r) incluído na informação de seleção de abertura de tempo transmitida a partir da unidade de transformação de envelope temporal 2v1 é maior do que um valor predeterminado u-m pode ser selecionado, ou pelo menos uma abertura de tempo r na qual u(r) é igual a ou maior do que um valor predeterminado uTh pode ser selecionada. u(r) pode incluir pelo menos um de e(r), |e(r)|2, eexp(r), |eexp(r)|2, eadj(r), |eadj(r)|2, eadj,scaled(0> lθadj,scaled(OI > θ Penvadj(0> descrito acima, e,

Figure img0061
e UTh pode incluir pelo menos um de;
Figure img0062
iiTh pode também ser um valor médio de u(r) de uma largura temporal predeterminada (como envelope SBR) incluindo a abertura de tempo r. A seleção pode também ser feita de forma que uma abertura de tempo na qual u(r) alcança seu pico seja incluída. O pico de u(r) pode ser calculado conforme o cálculo do pico da força de sinal no sinal de domínio QMF dos componentes de alta frequência na modificação 4 da primeira modalidade. O estado estável e o estado transitório na modificação 4 da primeira modalidade podem ser determinados de modo similar àqueles da modificação 4 da primeira modalidade através do uso de u(r), e uma abertura de tempo pode ser selecionada com base no mesmo. O método de seleção de abertura de tempo pode ser pelo menos um dos métodos descritos acima, pode incluir pelo menos um método diferente dos descritos acima, ou pode ser a combinação dos mesmos.To select a time slot in which the linear prediction synthesis filtering is performed via the time slot selection unit 3a2 in the present modification, at least one time slot r in which a parameter u (r) included in the information of time slot selection transmitted from the temporal envelope transformation unit 2v1 is greater than a predetermined value one can be selected, or at least one time slot r in which u (r) is equal to or greater than one predetermined value uTh can be selected. u (r) can include at least one of e (r), | e (r) | 2, eexp (r), | eexp (r) | 2, eadj (r), | eadj (r) | 2, eadj , scaled (0> lθadj, scaled (OI> θ Penvadj (0> described above, and,
Figure img0061
and UTh can include at least one of;
Figure img0062
iiTh can also be an average value of u (r) of a predetermined time width (such as SBR envelope) including time slot r. The selection can also be made so that a time slot in which u (r) reaches its peak is included. The peak of u (r) can be calculated according to the calculation of the peak signal strength in the QMF domain signal of the high frequency components in modification 4 of the first modality. The steady state and the transient state in modification 4 of the first modality can be determined similarly to those of modification 4 of the first modality using u (r), and a time slot can be selected based on it. The time slot selection method can be at least one of the methods described above, it can include at least one method other than those described above, or it can be a combination of them.

(Modificação 6 da Quarta modalidade)(Modification 6 of the Fourth modality)

Um dispositivo decodificador de voz 24f (ver figura 30) de uma modificação 6 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24f ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 29) armazenado em uma memória embutida do dispositivo decodificador de voz 24f como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24f recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24f. Na modificação 6, conforme ilustrado na figura 30, o dispositivo decodificador de voz 24f omite a unidade de detecção de mudança de sinal 2e1, a unidade de análise de predição linear de alta frequência 2h1, e a unidade de filtro inverso de predição linear 2i1 do dispositivo decodificador de voz 24d descrito na modificação 4 que pode ser omitida através da quarta modalidade conforme a primeira modalidade, e inclui a unidade de seleção de abertura de tempo 3a2 e a unidade de transformação de envelope temporal 2v1 ao invés de unidade de seleção de abertura de tempo 3a e a unidade de transformação de envelope temporal 2v do dispositivo decodificador de voz 24d. O dispositivo decodificador de voz 24f também muda a ordem da filtragem de síntese de predição linear desempenhada através da unidade de filtro de predição linear 2k3 e o processo de transformação de envelope temporal desempenhado através da unidade de transformação de envelope temporal 2v1 cuja ordem de processamento é intercambiável durante toda a quarta modalidade.A voice decoder device 24f (see figure 30) of a modification 6 of the fourth modality physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the decoding device of voice 24f when loading and executing a predetermined computer program (such as a computer program to perform processes illustrated in the flowchart of figure 29) stored in a built-in memory of the voice decoder device 24f as the ROM in RAM. The communication device of the voice decoder device 24f receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the voice decoder device 24f. In modification 6, as shown in figure 30, the voice decoder device 24f omits the signal shift detection unit 2e1, the high frequency linear prediction analysis unit 2h1, and the reverse linear prediction filter unit 2i1 of the voice decoder device 24d described in modification 4 which can be omitted through the fourth mode according to the first mode, and includes the time opening selection unit 3a2 and the time envelope transformation unit 2v1 instead of the opening selection unit of time 3a and the time envelope transformation unit 2v of the voice decoder device 24d. The speech decoder device 24f also changes the order of the linear prediction synthesis filtering performed through the linear prediction filter unit 2k3 and the time envelope transformation process performed through the time envelope transformation unit 2v1 whose processing order is interchangeable throughout the fourth modality.

A unidade de seleção de abertura de tempo 3a2 determina se a filtragem de síntese de predição linear é desempenhada através da unidade de filtro de predição linear 2k3, no sinal qθnvadj (k, r) no domínio QMF dos componentes de alta frequência da abertura de tempo r na qual o envelope temporal é transformado através da unidade de transformação de envelope temporal 2v1, com base na informação de seleção de abertura de tempo transmitida a partir da unidade de transformação de envelope temporal 2v1, seleciona a abertura de tempo na qual a filtragem de síntese de predição linear é desempenhada, e notifica, da abertura de tempo selecionada, a unidade de análise de predição linear de baixa frequência 2d1 e a unidade de filtro de predição linear 2k3.The time gap selection unit 3a2 determines whether linear prediction synthesis filtering is performed using the linear prediction filter unit 2k3, in the signal qθnvadj (k, r) in the QMF domain of the time gap high frequency components r in which the time envelope is transformed through the time envelope transformation unit 2v1, based on the time slot selection information transmitted from the time envelope transformation unit 2v1, selects the time opening in which the time filtering linear prediction synthesis is performed, and notifies, of the selected time slot, the low frequency linear prediction analysis unit 2d1 and the linear prediction filter unit 2k3.

(Modificação 7 da Quarta modalidade)(Modification 7 of the Fourth modality)

Um dispositivo codificador de voz 14b (figura 50) de uma modificação 7 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo codificador de voz 14b ao carregar e executar um programa de computador predeterminado armazenado na memória embutida do dispositivo codificador de voz 14b como o ROM no RAM. O dispositivo de comunicação do dispositivo codificador de voz 14b recebe um sinal de voz a ser codificado a partir do lado de fora o dispositivo codificador de voz 14b, e emite um fluxo de bit multiplexado codificado para o lado de fora do dispositivo codificador de voz 14b. O dispositivo codificador de voz 14b inclui uma unidade de multiplexação de fluxo de bit 1g6 e a unidade de seleção de abertura de tempo 1 p1 ao invés de unidade de multiplexação de fluxo de bit 1g7 e da unidade de seleção de abertura de tempo 1p do dispositivo codificador de voz 14a da modificação 4.A voice encoding device 14b (figure 50) of a modification 7 of the fourth embodiment physically includes a CPU, a ROM, a RAM, a communication device, and the like, which are not illustrated, and the CPU fully controls the voice encoding device. voice 14b when loading and running a predetermined computer program stored in the built-in memory of the voice encoding device 14b such as ROM in RAM. The communication device of the speech encoding device 14b receives a speech signal to be encoded from outside the speech encoding device 14b, and emits a multiplexed bit stream encoded outside the speech encoding device 14b . The voice encoding device 14b includes a 1g6 bit stream multiplexing unit and the 1p1 time gap selection unit instead of the 1g7 bit stream multiplexing unit and the 1p time gap selection unit of the device voice encoder 14a of modification 4.

A unidade de multiplexação de fluxo de bit 1g6 multiplexa o fluxo de bit codificado calculado através da unidade de codificação do codec central 1c, a Informação suplementar SBR calculada através da Unidade de codificação SBR 1 d, e a informação suplementar de envelope temporal na qual o parâmetro de resistência de filtro calculado através da unidade de cálculo de parâmetro de resistência de filtro e o parâmetro de formato de envelope calculado através da unidade de cálculo de parâmetro de formato de envelope 1n são convertidos, também multiplexa a informação de seleção de abertura de tempo recebida a partir da unidade de seleção de abertura de tempo 1 p1, e emite o fluxo de bit multiplexado (fluxo de bit multiplexado codificado) através do dispositivo de comunicação do dispositivo codificador de voz 14b.The bit stream multiplexing unit 1g6 multiplexes the encoded bit stream calculated using the central codec coding unit 1c, the supplementary SBR information calculated using the SBR coding unit 1 d, and the supplemental time envelope information in which the filter resistance parameter calculated using the filter resistance parameter calculation unit and the envelope format parameter calculated using the envelope format parameter calculation unit 1n are converted, also multiplexing the time slot selection information received from the time opening selection unit 1 p1, and outputs the multiplexed bit stream (encoded multiplexed bit stream) through the communication device of the voice encoding device 14b.

Um dispositivo decodificador de voz 24g (ver figura 31) da modificação 7 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24g ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 32) armazenado na memória embutida do dispositivo decodificador de voz 24g como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24g recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24g. O dispositivo decodificador de voz 24g inclui uma unidade de separação de fluxo de bit 2a7 e a unidade de seleção de abertura de tempo 3a1 ao invés de unidade de separação de fluxo de bit 2a3 e a unidade de seleção de abertura de tempo 3a do dispositivo decodificador de voz 24d descrito na modificação 4.A 24g voice decoder device (see figure 31) of modification 7 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device. 24g voice when loading and executing a predetermined computer program (such as a computer program to perform processes illustrated in the flowchart of figure 32) stored in the built-in memory of the 24g voice decoder device such as ROM in RAM. The communication device of the 24g speech decoder device receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the 24g speech decoder device. The speech decoder device 24g includes a bit stream separation unit 2a7 and the time gap selection unit 3a1 instead of bit stream separation unit 2a3 and the time gap selection unit 3a of the decoder device of voice 24d described in modification 4.

A unidade de separação de fluxo de bit 2a7 separa o fluxo de bit multiplexado abastecido através do dispositivo de comunicação do dispositivo decodificador de voz 24g para a informação suplementar de envelope temporal, a Informação suplementar SBR, e o fluxo de bit codificado, conforme a unidade de separação de fluxo de bit 2a3, e adicionalmente separa a informação de seleção de abertura de tempo.The bit stream separation unit 2a7 separates the multiplexed bit stream supplied through the communication device of the 24g speech decoder device for the time envelope supplementary information, the SBR Supplementary Information, and the encoded bit stream, as per the unit bit flow separation 2a3, and additionally separates the time slot selection information.

(Modificação 8 de Quarta modalidade)(Modification 8 of the fourth modality)

Um dispositivo decodificador de voz 24h (ver figura 33) de uma modificação 8 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24h ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 34) armazenado na memória embutida do dispositivo decodificador de voz 24h como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24h recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24h. O dispositivo decodificador de voz 24h, conforme ilustrado na figura 33, inclui a unidade de análise de predição linear de baixa frequência 2d1, a unidade de detecção de mudança de sinal 2e1, a unidade de análise de predição linear de alta frequência 2h1, a unidade de filtro inverso de predição linear 2i1, e a unidade de filtro de predição linear 2k3 ao invés de unidade de análise de predição linear de baixa frequência 2d, a unidade de detecção de mudança de sinal 2e, a unidade de análise de predição linear de alta frequência 2h, a unidade de filtro inverso de predição linear 2i, e a unidade de filtro de predição linear 2k do dispositivo decodificador de voz 24b da modificação 2, e adicionalmente inclui a unidade de seleção de abertura de tempo 3a. A unidade de ajuste de alta frequência primária 2j1 desempenha pelo menos um dos processos na etapa “Ajuste HF” em SBR em "MPEG-4 AAC", conforme a unidade de ajuste de alta frequência primária 2j1 da modificação 2 da quarta modalidade (processo na Etapa Sm1). A unidade de ajuste de alta frequência secundária 2j2 desempenha pelo menos um dos processos na etapa “Ajuste HF” em SBR em "MPEG-4 AAC", conforme a unidade de ajuste de alta frequência secundária 2j2 da modificação 2 da quarta modalidade (processo na Etapa Sm2). É preferível que o processo desempenhado através da unidade de ajuste de alta frequência secundária 2j2 seja um processo não desempenhado pela unidade de ajuste de alta frequência primária 2j1 entre os processos na etapa “Ajuste HF” em SBR em "MPEG-4 AAC".A 24h voice decoder device (see figure 33) of a modification 8 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device of 24h voice when loading and executing a predetermined computer program (such as a computer program to perform processes illustrated in the flow chart of figure 34) stored in the built-in memory of the 24h voice decoder device such as ROM in RAM. The communication device of the 24h speech decoder device receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the 24h speech decoder device. The 24h speech decoder device, as shown in figure 33, includes the low frequency linear prediction analysis unit 2d1, the signal shift detection unit 2e1, the high frequency linear prediction analysis unit 2h1, the unit linear prediction filter 2i1, and linear prediction filter unit 2k3 instead of low frequency linear prediction analysis unit 2d, signal change detection unit 2e, high linear prediction analysis unit frequency 2h, the linear prediction filter unit 2i, and the linear prediction filter unit 2k of the voice decoder device 24b of modification 2, and additionally includes the time opening selection unit 3a. The primary high frequency adjustment unit 2j1 performs at least one of the processes in the “HF Adjustment” step in SBR in "MPEG-4 AAC", according to the primary high frequency adjustment unit 2j1 of modification 2 of the fourth modality (process in Sm1 step). The secondary high frequency adjustment unit 2j2 performs at least one of the processes in the step “Adjustment HF” in SBR in "MPEG-4 AAC", according to the secondary high frequency adjustment unit 2j2 of modification 2 of the fourth modality (process in Sm2 Step). It is preferable that the process performed through the secondary high frequency adjustment unit 2j2 is a process not performed by the primary high frequency adjustment unit 2j1 between the processes in the step "Adjustment HF" in SBR in "MPEG-4 AAC".

(Modificação 9 da Quarta modalidade)(Modification 9 of the Fourth modality)

Um dispositivo decodificador de voz 24i (ver figura 35) da modificação 9 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24i ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 36) armazenado na memória embutida do dispositivo decodificador de voz 24i como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24i recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24i. O dispositivo decodificador de voz 24i, conforme ilustrado na figura 35, omite a unidade de análise de predição linear de alta frequência 2h1 e a unidade de filtro inverso de predição linear 2i 1 do dispositivo decodificador de voz 24h da modificação 8 que pode ser omitido durante toda a quarta modalidade conforme a primeira modalidade, e inclui a unidade de transformação de envelope temporal 2v1 e a unidade de seleção de abertura de tempo 3a2 ao invés de unidade de transformação de envelope temporal 2v e a unidade de seleção de abertura de tempo 3a do dispositivo decodificador de voz 24h da modificação 8. O dispositivo decodificador de voz 24i também muda a ordem da filtragem de síntese de predição linear desempenhada através da unidade de filtro de predição linear 2k3 e o processo de transformação de envelope temporal desempenhada através da unidade de transformação de envelope temporal 2v1 cuja ordem de processamento é intercambiável durante toda a quarta modalidade.A voice decoder device 24i (see figure 35) of modification 9 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device. voice 24i when loading and executing a predetermined computer program (such as a computer program to perform processes illustrated in the flow chart of figure 36) stored in the built-in memory of the voice decoder device 24i as the ROM in RAM. The communication device of the voice decoder device 24i receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the voice decoder device 24i. The 24i speech decoder device, as shown in figure 35, omits the high frequency linear prediction analysis unit 2h1 and the linear prediction reverse filter unit 2i 1 of the 24h voice decoder device of modification 8 that can be omitted during the entire fourth modality according to the first modality, and includes the time envelope transformation unit 2v1 and the time opening selection unit 3a2 instead of the time envelope transformation unit 2v and the time opening selection unit 3a of 24h speech decoder device from modification 8. The 24i speech decoder device also changes the order of linear prediction synthesis filtering performed through the linear prediction filter unit 2k3 and the time envelope transformation process performed through the transformation unit 2v1 time envelope whose processing order is interchangeable throughout the fourth modality.

(Modificação 10 da Quarta modalidade)(Modification 10 of the Fourth modality)

Um dispositivo decodificador de voz 24j (ver figura 37) de uma modificação 10 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24j ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 36) armazenado na memória embutida do dispositivo decodificador de voz 24j como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24j recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24j. O dispositivo decodificador de voz 24j, conforme ilustrado na figura 37, omite a unidade de detecção de mudança de sinal 2e1, a unidade de análise de predição linear de alta frequência 2h1, e a unidade de filtro inverso de predição linear 2i1 do dispositivo decodificador de voz 24h da modificação 8 que pode ser omitida durante toda a quarta modalidade conforme a primeira modalidade, e inclui a unidade de transformação de envelope temporal 2v1 e a unidade de seleção de abertura de tempo 3a2 ao invés de unidade de transformação de envelope temporal 2v e a unidade de seleção de abertura de tempo 3a do dispositivo decodificador de voz 24h da modificação 8. O dispositivo decodificador de voz 24j também muda a ordem da filtragem de síntese de predição linear desempenhada pela unidade de filtro de predição linear 2k3 e o processo de transformação de envelope temporal desempenhada através da unidade de transformação de envelope temporal 2v1 cuja ordem de processamento é intercambiável durante toda a quarta modalidade.A voice decoder device 24j (see figure 37) of a modification 10 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device. of voice 24j when loading and executing a predetermined computer program (such as a computer program to perform processes illustrated in the flow chart of figure 36) stored in the built-in memory of the voice decoder device 24j as the ROM in RAM. The communication device of the voice decoder device 24j receives the encoded multiplexed bit stream and outputs a decoded voice signal out of the voice decoder device 24j. The voice decoder device 24j, as shown in Figure 37, omits the signal shift detection unit 2e1, the high frequency linear prediction analysis unit 2h1, and the linear prediction reverse filter unit 2i1 of the signal decoder device. 24h voice of modification 8 that can be omitted throughout the fourth modality according to the first modality, and includes the time envelope transformation unit 2v1 and the time opening selection unit 3a2 instead of the time envelope transformation unit 2v and the time opening selection unit 3a of the 24h modification voice decoder device. The 24j speech decoder device also changes the order of the linear prediction synthesis filter performed by the linear prediction filter unit 2k3 and the transformation process envelope processing performed by the 2v1 temporal envelope transformation unit whose processing order is interchangeable during the whole fourth modality.

(Modificação 11 da Quarta modalidade)(Modification 11 of the fourth modality)

Um dispositivo decodificador de voz 24k (ver figura 38) de uma modificação 11 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24k ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 39) armazenado na memória embutida do dispositivo decodificador de voz 24k como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24k recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24k. O dispositivo decodificador de voz 24k, conforme ilustrado na figura 38, inclui a unidade de separação de fluxo de bit 2a7 e a unidade de seleção de abertura de tempo 3a1 ao invés de unidade de separação de fluxo de bit 2a3 e a unidade de seleção de abertura de tempo 3a do dispositivo decodificador de voz 24h da modificação 8.A 24k voice decoder device (see figure 38) of a modification 11 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device 24k voice output when loading and executing a predetermined computer program (such as a computer program to perform processes illustrated in the flowchart of figure 39) stored in the built-in memory of the 24k voice decoding device such as ROM in RAM. The communication device of the 24k speech decoder device receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the 24k speech decoder device. The 24k speech decoder device, as shown in figure 38, includes the bit stream separation unit 2a7 and the time gap selection unit 3a1 instead of bit stream separation unit 2a3 and the bit selection unit time opening 3a of the 24h speech decoder device for modification 8.

(Modificação 12 da Quarta modalidade)(Modification 12 of the Fourth modality)

Um dispositivo decodificador de voz 24q (ver figura 40) de uma modificação 12 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24q ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 41) armazenado na memória embutida do dispositivo decodificador de voz 24q como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24q recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24q. O dispositivo decodificador de voz 24q, conforme ilustrado na figura 40, inclui a unidade de análise de predição linear de baixa frequência 2d1, a unidade de detecção de mudança de sinal 2e1, a unidade de análise de predição linear de alta frequência 2h1, a unidade de filtro inverso de predição linear 2i1, e unidades de ajuste de componente de sinal individual 2z4, 2z5, e 2z6 (unidades de ajuste de componente de sinal individual correspondem aos meios de transformação de envelope temporal) ao invés de unidade de análise de predição linear de baixa frequência 2d, a unidade de detecção de mudança de sinal 2e, a unidade de análise de predição linear de alta frequência 2h, a unidade de filtro inverso de predição linear 2i, e as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 do dispositivo decodificador de voz 24c da modificação 3, e adicionalmente inclui a unidade de seleção de abertura de tempo 3a.A 24q voice decoder device (see figure 40) of a modification 12 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device of 24q voice when loading and executing a predetermined computer program (such as a computer program to perform processes illustrated in the flowchart of figure 41) stored in the built-in memory of the 24q voice decoder device such as ROM in RAM. The communication device of the 24q speech decoder device receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the 24q speech decoder device. The 24q speech decoder device, as shown in figure 40, includes the low frequency linear prediction analysis unit 2d1, the signal shift detection unit 2e1, the high frequency linear prediction analysis unit 2h1, the unit of linear prediction inverse filter 2i1, and individual signal component adjustment units 2z4, 2z5, and 2z6 (individual signal component adjustment units correspond to the time envelope transformation means) instead of linear prediction analysis unit low frequency 2d, signal shift detection unit 2e, high frequency linear prediction analysis unit 2h, linear prediction reverse filter unit 2i, and individual signal component adjustment units 2z1, 2z2 , and 2z3 of the voice decoder device 24c of modification 3, and additionally includes the time opening selection unit 3a.

Pelo menos uma das unidades de ajuste de componente de sinal individual 2z4, 2z5, e 2z6 desempenham processamento no sinal de domínio QMF da abertura de tempo selecionada, para o componente de sinal incluso na saída da unidade de ajuste de alta frequência primária, conforme as unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3, com base no resultado da seleção transmitida a partir da unidade de seleção de abertura de tempo 3a (processo na Etapa Sn1). É preferível que o processo que usa a informação de seleção de abertura de tempo inclua pelo menos um processo que inclui a filtragem de síntese de predição linear na direção de frequência, entre os processos das unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 descritas na modificação 3 da quarta modalidade.At least one of the individual signal component adjustment units 2z4, 2z5, and 2z6 perform processing on the QMF domain signal of the selected time slot, for the signal component included in the output of the primary high frequency adjustment unit, as per individual signal component adjustment units 2z1, 2z2, and 2z3, based on the result of the selection transmitted from the time opening selection unit 3a (process in Step Sn1). It is preferable that the process using the time slot selection information includes at least one process that includes filtering linear prediction synthesis in the frequency direction, among the processes of the individual signal component adjustment units 2z1, 2z2, and 2z3 described in modification 3 of the fourth modality.

Os processos desempenhados através das unidades de ajuste de componente de sinal individual 2z4, 2z5, e 2z6 podem ser os mesmos que os processos desempenhados através das unidades de ajuste de componente de sinal individual 2z1, 2z2, e 2z3 descritas na modificação 3 da quarta modalidade, mas as unidades de ajuste de componente de sinal individual 2z4, 2z5, e 2z6 podem transformar o envelope temporal de cada um de uma pluralidade de componentes de sinal inclusos na saída da unidade de ajuste de alta frequência primária através de diferentes métodos (se todas as unidades de ajuste de componente de sinal individual 2z4, 2z5, e 2z6 não desempenham processamento com base no resultado da seleção transmitida a partir da unidade de seleção de abertura de tempo 3a, será o mesmo que a modificação 3 da quarta modalidade da presente invenção).The processes performed through the individual signal component adjustment units 2z4, 2z5, and 2z6 can be the same as the processes performed through the individual signal component adjustment units 2z1, 2z2, and 2z3 described in modification 3 of the fourth modality , but the individual signal component adjustment units 2z4, 2z5, and 2z6 can transform the time envelope of each of a plurality of signal components included in the output of the primary high frequency adjustment unit by different methods (if all the individual signal component adjustment units 2z4, 2z5, and 2z6 do not process based on the result of the selection transmitted from the time opening selection unit 3a, it will be the same as modification 3 of the fourth embodiment of the present invention ).

Todos os resultados da seleção da abertura de tempo transmitida para as unidades de ajuste de componente de sinal individual 2z4, 2z5, e 2z6 a partir da unidade de seleção de abertura de tempo 3a não precisam ser os mesmos, e todo ou uma parte do presente documento pode ser diferente.All results of the selection of the transmitted time gap for the individual signal component adjustment units 2z4, 2z5, and 2z6 from the time gap selection unit 3a need not be the same, and all or part of this document may be different.

Na figura 40, o resultado da seleção da abertura de tempo é transmitida para as unidades de ajuste de componente de sinal individual 2z4, 2z5, e 2z6 a partir de uma unidade de seleção de abertura de tempo 3a. Entretanto, é possível incluir uma pluralidade de unidades de seleção de abertura de tempo para notificar, dos diferentes resultados da seleção da abertura de tempo, cada ou uma parte das unidades de ajuste de componente de sinal individual 2z4, 2z5, e 2z6. Neste momento, a unidade de seleção de abertura de tempo em relação à unidade de ajuste de componente de sinal individual entre as unidades de ajuste de componente de sinal individual 2z4, 2z5, e 2z6 que desempenham o processo 4 (o processo de multiplicar o coeficiente de ganho através de cada resolução de sub-banda QMF é desempenhada no sinal de entrada através do uso do envelope temporal obtido a partir da unidade de ajuste do formato de envelope 2s conforme a unidade de transformação de envelope temporal 2v, e então a filtragem de síntese de predição linear na direção de frequência é também desempenhada no sinal de saída através do uso do coeficiente de predição linear recebido a partir da unidade de ajuste de resistência de filtro 2f conforme a unidade de filtro de predição linear 2k) descrito na modificação 3 da quarta modalidade pode selecionar a abertura de tempo através do uso da informação de seleção de abertura de tempo abastecido a partir da unidade de transformação de envelope temporal.In figure 40, the result of the time gap selection is transmitted to the individual signal component adjustment units 2z4, 2z5, and 2z6 from a time gap selection unit 3a. However, it is possible to include a plurality of time slot selection units to notify, of the different time slot selection results, each or a part of the individual signal component adjustment units 2z4, 2z5, and 2z6. At this time, the time gap selection unit in relation to the individual signal component adjustment unit between the individual signal component adjustment units 2z4, 2z5, and 2z6 that perform process 4 (the process of multiplying the coefficient gain through each QMF subband resolution is performed on the input signal using the time envelope obtained from the 2s envelope format adjustment unit according to the 2v time envelope transformation unit, and then the filtering of synthesis of linear prediction in the frequency direction is also performed on the output signal using the linear prediction coefficient received from the filter resistance adjustment unit 2f according to the linear prediction filter unit 2k) described in modification 3 of fourth modality can select the time gap by using the time gap selection information supplied from the aging transformation unit temporal ope.

(Modificação 13 da Quarta modalidade)(Modification 13 of the fourth modality)

Um dispositivo decodificador de voz 24m (ver figura 42) de uma modificação 13 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24m ao carregar e executar um programa de computador predeterminado (como um programa de computador para desempenhar processos ilustrados no fluxograma da figura 43) armazenado na memória embutida do dispositivo decodificador de voz 24m como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24m recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24m. O dispositivo decodificador de voz 24m, conforme ilustrado na figura 42, inclui a unidade de separação de fluxo de bit 2a7 e a unidade de seleção de abertura de tempo 3a1 ao invés de unidade de separação de fluxo de bit 2a3 e a unidade de seleção de abertura de tempo 3a do dispositivo decodificador de voz 24q da modificação 12.A 24m voice decoder device (see figure 42) of a modification 13 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device of 24m voice when loading and running a predetermined computer program (such as a computer program to perform processes illustrated in the flowchart of figure 43) stored in the built-in memory of the 24m voice decoder device such as ROM in RAM. The communication device of the 24m speech decoder device receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the 24m speech decoder device. The 24m speech decoder device, as shown in figure 42, includes the bit stream separation unit 2a7 and the time gap selection unit 3a1 instead of bit stream separation unit 2a3 and the bit selection unit opening time 3a of the voice decoder device 24q of modification 12.

(Modificação 14 da Quarta modalidade)(Modification 14 of the Fourth modality)

Um dispositivo decodificador de voz 24n (não ilustrado) de uma modificação 14 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24n ao carregar e executar um programa de computador predeterminado armazenado na memória embutida do dispositivo decodificador de voz 24n como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24n recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24n. O dispositivo decodificador de voz 24n inclui funcionalmente a unidade de análise de predição linear de baixa frequência 2d1, a unidade de detecção de mudança de sinal 2e1, a unidade de análise de predição linear de alta frequência 2h1, a unidade de filtro inverso de predição linear 2i1, e a unidade de filtro de predição linear 2k3 ao invés de unidade de análise de predição linear de baixa frequência 2d, a unidade de detecção de mudança de sinal 2e, a unidade de análise de predição linear de alta frequência 2h, a unidade de filtro inverso de predição linear 2i, e a unidade de filtro de predição linear 2k do dispositivo decodificador de voz 24a da modificação 1, e adicionalmente inclui a unidade de seleção de abertura de tempo 3a.A voice decoder device 24n (not shown) of a modification 14 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device. 24n voice when loading and running a predetermined computer program stored in the built-in memory of the 24n voice decoder device such as ROM in RAM. The communication device of the 24n speech decoder device receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the 24n speech decoder device. The voice decoder device 24n functionally includes the low frequency linear prediction analysis unit 2d1, the signal shift detection unit 2e1, the high frequency linear prediction analysis unit 2h1, the linear prediction reverse filter unit 2i1, and the linear prediction filter unit 2k3 instead of the low frequency linear prediction analysis unit 2d, the signal shift detection unit 2e, the high frequency linear prediction analysis unit 2h, the inverse linear prediction filter 2i, and the linear prediction filter unit 2k of the voice decoder device 24a of modification 1, and additionally includes the time gap selection unit 3a.

(Modificação 15 da Quarta modalidade)(Modification 15 of the Fourth modality)

Um dispositivo decodificador de voz 24p (não ilustrado) de uma modificação 15 da quarta modalidade inclui fisicamente um CPU, um ROM, um RAM, um dispositivo de comunicação, e similares, que não são ilustrados, e a CPU controla integralmente o dispositivo decodificador de voz 24p ao carregar e executar um programa de computador predeterminado armazenado na memória embutida do dispositivo decodificador de voz 24p como o ROM no RAM. O dispositivo de comunicação do dispositivo decodificador de voz 24p recebe o fluxo de bit multiplexado codificado e emite um sinal de voz decodificado para fora do dispositivo decodificador de voz 24p. O dispositivo decodificador de voz 24p funcionalmente inclui a unidade de seleção de abertura de tempo 3a1 ao invés de unidade de seleção de abertura de tempo 3a do dispositivo decodificador de voz 24n da modificação 14. O dispositivo decodificador de voz 24p também inclui uma unidade de separação de fluxo de bit 2a8 (não ilustrado) ao invés de unidade de separação de fluxo de bit 2a4.A voice decoder device 24p (not shown) of a modification 15 of the fourth modality physically includes a CPU, ROM, RAM, communication device, and the like, which are not illustrated, and the CPU fully controls the decoder device. 24p voice when loading and running a predetermined computer program stored in the built-in memory of the 24p voice decoder device such as ROM in RAM. The communication device of the 24p speech decoder device receives the encoded multiplexed bit stream and outputs a decoded speech signal out of the 24p speech decoder device. The voice decoder device 24p functionally includes the time opening selection unit 3a1 instead of the time opening selection unit 3a of the 24n voice decoder device of modification 14. The voice decoder device 24p also includes a separation unit bit stream 2a8 (not shown) instead of bit stream separation unit 2a4.

A unidade de separação de fluxo de bit 2a8 separa o fluxo de bit multiplexado na informação suplementar SBR e o fluxo de bit codificado conforme a unidade de separação de fluxo de bit 2a4, e adicionalmente na informação de seleção de abertura de tempo.The bit stream separation unit 2a8 separates the multiplexed bit stream in the supplementary SBR information and the encoded bit stream according to the bit stream separation unit 2a4, and additionally in the time slot selection information.

Aplicabilidade IndustrialIndustrial Applicability

A presente invenção fornece uma técnica aplicável à técnica de extensão de banda no domínio de frequência representado por SBR, e para reduzir a ocorrência de pré-eco e pós-eco e melhora a qualidade subjetiva do sinal decodificado sem aumentar significativamente a taxa de bit. Lista de Signos de Referência 11, 11a, 11b, 11c, 12, 12a, 12b, 13, 14, 14a, 14b dispositivo de codificação de voz 1a unidade de conversão de frequência 1 b unidade de conversão inversa de frequência 1 c unidade de codificação de codec central 1 d unidade de codificação de SBR 1e, 1e1 unidade de análise de previsão linear 1f unidade de cálculo de parâmetro de resistência de filtro 1f1 unidade de cálculo de parâmetro de resistência de filtro 1g, 1g1, 1g2, 1g3, 1g4, 1g5, 1g6, 1g7 unidade de multiplexação de fluxo de bit 1h unidade de conversão inversa de alta frequência 1i unidade de cálculo de força de período curto 5 1j unidade de decimação de coeficiente de previsão linear 1k unidade de quantização de coeficiente de previsão 1m unidade de cálculo de envelope temporal 1n unidade de cálculo de parâmetro de formato de en10 velope 1 p, 1p1 unidade de seleção de abertura de tempo 21, 22, 23, 24, 24b, 24c dispositivo de decodificação de voz 2a, 2a1, 2a2, 2a3, 15 2a5, 2a6, 2a7 unidade de separação de fluxo de bit 2b unidade de decodificação de codec central 2c unidade de conversão de frequência 2d, 2d1 unidade de análise de previsão linear de baixa frequência 20 2e, 2e1 unidade de detecção de sinal 2f unidade de ajuste de resistência de filtro 2g unidade de geração de alta frequência 2h, 2h1 unidade de análise de previsão linear de alta frequência 25 2i, 2i1 unidade de filtro inverso de previsão linear 2j, 2j1, 2j2, 2j3, 2j4 unidade de ajuste de alta frequência 2k, 2k1, 2k2, 2k3 unidade de filtro de previsão linear 2m unidade de adição de coeficiente 2n unidade de conversão inversa de frequência 30 2p, 2p1 unidade de interpolação/extrapolação de coeficiente de previsão linear —Ji 2r unidade de cálculo de envelope temporal de baixa frequência 2s unidade de ajuste de formato de envelope 2t unidade de cálculo de envelope temporal de alta fre5 quência 2u unidade de suavização de envelope temporal 2v, 2v1 unidade de transformação de envelope temporal 2w unidade de conversão de informações suplementares 10 2z1, 2z2, 2z3, 2z4, 2z5, 2z6 unidade de ajuste de componente de sinal individual 3a, 3a1, 3a2 unidade de seleção de abertura de tempo i iThe present invention provides a technique applicable to the band extension technique in the frequency domain represented by SBR, and to reduce the occurrence of pre-echo and post-echo and improves the subjective quality of the decoded signal without significantly increasing the bit rate. List of Reference Signs 11, 11a, 11b, 11c, 12, 12a, 12b, 13, 14, 14a, 14b voice encoding device 1st frequency conversion unit 1 b frequency reverse conversion unit 1 c encoding unit central codec 1 d SBR coding unit 1e, 1e1 linear forecast analysis unit 1f filter resistance parameter calculation unit 1f1 filter resistance parameter calculation unit 1g, 1g1, 1g2, 1g3, 1g4, 1g5 , 1g6, 1g7 bit stream multiplexing unit 1h high frequency reverse conversion unit 1i short period force calculation unit 5 1j linear prediction coefficient decimation unit 1k prediction coefficient quantization unit 1m calculation unit time envelope 1n en10 format parameter calculation unit velope 1 p, 1p1 time opening selection unit 21, 22, 23, 24, 24b, 24c voice decoding device 2a, 2a1, 2a2, 2a3, 15 2a5, 2a6, 2a7 sepa unit bit stream ration 2b central codec decoding unit 2c frequency conversion unit 2d, 2d1 low frequency linear prediction analysis unit 20 2e, 2e1 signal detection unit 2f filter resistance adjustment unit 2g unit high frequency generation 2h, 2h1 high frequency linear prediction analysis unit 25 2i, 2i1 linear prediction reverse filter unit 2j, 2j1, 2j2, 2j3, 2j4 high frequency adjustment unit 2k, 2k1, 2k2, 2k3 unit linear prediction filter unit 2m coefficient addition unit 2n frequency reverse conversion unit 30 2p, 2p1 linear forecast coefficient interpolation / extrapolation unit —Ji 2r low frequency time envelope calculation unit 2s format adjustment unit 2t envelope 2h high frequency temporal envelope calculation unit 2u 2v temporal envelope smoothing unit, 2v1 2w temporal envelope transformation unit supplementary information 10 2z1, 2z2, 2z3, 2z4, 2z5, 2z6 individual signal component adjustment unit 3a, 3a1, 3a2 opening time selection unit i i

Claims (5)

1. Dispositivo de decodificação de voz para decodificar um sinal de voz codificado, o dispositivo de decodificação de voz caracterizado pelo fato de que compreende: meios de separação de fluxo de bit (2a3) para separar um fluxo de bit que inclui o sinal de voz codificado em um fluxo de bit codificado e informações suplementares de envelope temporal, o fluxo de bit recebido de fora do dispositivo de decodificação de voz; meios de decodificação central (2b) para decodificar o fluxo de bit codificado separado pelos meios de separação de fluxo de bit (2a3) para obter um componente de baixa frequência; meios de transformada de frequência (2c) para transformar o componente de baixa frequência obtido pelos meios de decodificação central (2b) para o domínio de frequência; meios de geração de alta frequência (2g) para gerar um componente de alta frequência copiando o componente de baixa frequência transformado para o domínio de frequência pelos meios de transformada de frequência (2c) a partir de uma banda de baixa frequência para uma banda de alta frequência; meios de ajuste de alta frequência (2j) para ajustar o componente de alta frequência gerado pelos meios de geração de alta frequência (2g) para gerar um componente de alta frequência ajustado; meios de análise de envelope temporal de baixa frequência (2r) para analisar o componente de baixa frequência transformado para o domínio de frequência pelos meios de transformada de frequência (2c) para obter as informações de envelope temporal, os meios de análise de envelope temporal de baixa frequência (2r) obtendo a informação de envelope temporal pela obtenção de potência de cada amostra de sub-banda QMF do componente de baixa frequência transformado para o domínio da frequência pelos meios de transformada de frequência (2c); meios de conversão de informação suplementar (2w) para converter a informação suplementar de envelope temporal em um parâmetro para ajustar a informação de envelope temporal; meios de ajuste de envelope temporal (2s) para ajustar as informações de envelope temporal obtidas pelos meios de análise de envelope temporal de baixa frequência (2r) para gerar informação de envelope temporal ajustada, os meios de ajuste de envelope temporal (2s) usando o parâmetro no ajuste da informação de envelope temporal; e meios de formatação de envelope temporal (2v) para formatar um envelope temporal do componente de alta frequência ajustado, usando a informação de envelope temporal ajustada.1. Voice decoding device for decoding an encoded speech signal, the speech decoding device characterized by the fact that it comprises: bit stream separation means (2a3) for separating a bit stream that includes the voice signal encoded in an encoded bit stream and supplemental temporal envelope information, the bit stream received from outside the voice decoding device; central decoding means (2b) for decoding the encoded bit stream separated by the bit stream separation means (2a3) to obtain a low frequency component; frequency transform means (2c) for transforming the low frequency component obtained by the central decoding means (2b) into the frequency domain; high frequency generation means (2g) for generating a high frequency component by copying the transformed low frequency component into the frequency domain by the frequency transform means (2c) from a low frequency band to a high band frequency; high frequency adjustment means (2j) to adjust the high frequency component generated by the high frequency generation means (2g) to generate an adjusted high frequency component; low frequency time envelope analysis means (2r) to analyze the transformed low frequency component for the frequency domain by the frequency transform means (2c) to obtain the time envelope information, the time envelope analysis means of low frequency (2r) obtaining the time envelope information by obtaining the power of each sample of sub-band QMF of the low frequency component transformed into the frequency domain by the frequency transform means (2c); means for converting supplementary information (2w) for converting supplementary temporal envelope information into a parameter for adjusting temporal envelope information; temporal envelope adjustment means (2s) to adjust the temporal envelope information obtained by the low frequency temporal envelope analysis means (2r) to generate adjusted temporal envelope information, the temporal envelope adjustment means (2s) using the parameter in the adjustment of the temporal envelope information; and time envelope formatting means (2v) for formatting a time envelope of the adjusted high frequency component, using the adjusted time envelope information. 2. Dispositivo de decodificação de voz para decodificar um sinal de voz codificado, o dispositivo de decodificação de voz caracterizado pelo fato de que compreende: meios de decodificação central (2b) para decodificar um fluxo de bit que inclui o sinal de voz codificado para obter um componente de baixa frequência, o fluxo de bit recebido de fora do dispositivo de decodificação de voz; meios de transformada de frequência (2c) para transformar o componente de baixa frequência obtido pelo meio de decodificação central para o domínio de frequência; meios de geração de alta frequência (2g) para gerar um componente de alta frequência copiando o componente de baixa frequência transformado para o domínio de frequência pelos meios de transformada de frequência (2c) a partir de uma banda de baixa frequência para uma banda de alta frequência; meios de ajuste de alta frequência (2j) para ajustar o componente de alta frequência gerado pelos meios de geração de alta frequência (2g) para gerar um componente de alta frequência ajustado; meios de análise de envelope temporal de baixa frequência (2r) para analisar o componente de baixa frequência transformado para o domínio de frequência pelos meios de transformada de frequência (2c) para obter as informações de envelope temporal, os meios de análise de envelope temporal de baixa frequência (2r) obtendo a informação de envelope temporal pela obtenção de potência de cada amostra de sub-banda QMF do componente de baixa frequência transformado para o domínio da frequência pelos meios de transformada de frequência (2c); unidades de geração de informações suplementares de envelope temporal para analisar o fluxo de bit para gerar um parâmetro para ajustar a informação de envelope temporal; meios de ajuste de envelope temporal (2s) para ajustar as informações de envelope temporal obtidas pelos meios de análise de envelope temporal de baixa frequência (2r) para gerar informação de envelope temporal ajustada, os meios de ajuste de envelope temporal (2s) usando o parâmetro no ajuste da informação de envelope temporal; meios de formatação de envelope temporal (2v) para formatar um envelope temporal do componente de alta frequência ajustado usando a informação de envelope temporal ajustada.2. Voice decoding device for decoding an encoded speech signal, the speech decoding device characterized by the fact that it comprises: central decoding means (2b) for decoding a bit stream that includes the encoded speech signal to obtain a low frequency component, the bit stream received from outside the voice decoding device; frequency transform means (2c) for transforming the low frequency component obtained by the central decoding means for the frequency domain; high frequency generation means (2g) for generating a high frequency component by copying the transformed low frequency component into the frequency domain by the frequency transform means (2c) from a low frequency band to a high band frequency; high frequency adjustment means (2j) to adjust the high frequency component generated by the high frequency generation means (2g) to generate an adjusted high frequency component; low frequency time envelope analysis means (2r) to analyze the transformed low frequency component for the frequency domain by the frequency transform means (2c) to obtain the time envelope information, the time envelope analysis means of low frequency (2r) obtaining the time envelope information by obtaining the power of each sample of sub-band QMF of the low frequency component transformed into the frequency domain by the frequency transform means (2c); generating units for supplemental temporal envelope information to analyze the bit stream to generate a parameter for adjusting the temporal envelope information; temporal envelope adjustment means (2s) to adjust the temporal envelope information obtained by the low frequency temporal envelope analysis means (2r) to generate adjusted temporal envelope information, the temporal envelope adjustment means (2s) using the parameter in the adjustment of the temporal envelope information; time envelope formatting means (2v) for formatting a time envelope of the adjusted high frequency component using the adjusted time envelope information. 3. Dispositivo de decodificação de voz, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que os meios de análise de envelope temporal de baixa frequência (2r) obtêm a informação de envelope temporal pela normalização da potência de cada amostra de sub-banda de QMF pelo uso de uma potência média em um segmento de tempo de envelope SBR.3. Voice decoding device, according to claim 1 or 2, characterized by the fact that the means of analysis of low frequency temporal envelope (2r) obtain the temporal envelope information by normalizing the power of each sample of sub -QMF band by using an average power in an SBR envelope time segment. 4. Método de decodificação de voz que usa um dispositivo de decodificação de voz para decodificar um sinal de voz codificado, o método de decodificação de voz caracterizado pelo fato de que compreende: uma etapa de separação de fluxo de bit em que o dispositivo de decodificação de voz separa um fluxo de bit que inclui o sinal de voz codificado em um fluxo de bit codificado e informações suplementares de envelope temporal, o fluxo de bit recebido de fora do dispositivo de decodificação de voz; uma etapa de decodificação central em que o dispositivo de decodificação de voz obtém um componente de baixa frequência decodificando o fluxo de bit codificado separado na etapa de separação de fluxo de bit; uma etapa de transformada de frequência em que o dispositivo de decodificação de voz transforma o componente de baixa frequência obtido na etapa de decodificação central para o domínio de frequência; uma etapa de geração de alta frequência em que o dispositivo de decodificação de voz gera um componente de alta frequência copiando o componente de baixa frequência transformado para o domínio de frequência na etapa de transformada de frequência a partir de uma banda de baixa frequência para uma banda de alta frequência; uma etapa de ajuste de alta frequência na qual o dispositivo de decodificação de voz ajusta o componente de alta frequência na etapa de geração de alta frequência para gerar um componente de alta frequência ajustado; uma etapa de análise de envelope temporal de baixa frequência em que o dispositivo de decodificação de voz obtém as informações de envelope temporal analisando o componente de baixa frequência transformado para o domínio de frequência na etapa de transformada de frequência, em que as informações de envelope temporal são obtidas pela obtenção da potência de cada amostra de sub-banda QMF do componente de baixa frequência transformado para o domínio da frequência na etapa de transformada de frequência; uma etapa de conversão de informação suplementar na qual o dispositivo de decodificação de voz converte a informação de envelope temporal suplementar em um parâmetro para ajustar a informação de envelope temporal; uma etapa de ajuste de envelope temporal em que o dispositivo de decodificação de voz ajusta as informações de envelope temporal obtidas na etapa de análise de envelope temporal de baixa frequência para gerar uma informação de envelope temporal ajustada em que o parâmetro é utilizado no ajuste da informação de envelope temporal; e uma etapa de formatação de envelope temporal em que o dispositivo de decodificação de voz formata um envelope temporal do componente de alta frequência ajustado usando as informações de envelope temporal ajustadas.4. Voice decoding method that uses a voice decoding device to decode an encoded voice signal, the voice decoding method characterized by the fact that it comprises: a bit stream separation step in which the decoding device speech separates a bit stream that includes the encoded voice signal into an encoded bit stream and supplemental time envelope information, the bit stream received from outside the voice decoding device; a central decoding step in which the speech decoding device obtains a low frequency component by decoding the separate encoded bit stream in the bit stream separation step; a frequency transform step in which the voice decoding device transforms the low frequency component obtained in the central decoding step into the frequency domain; a high frequency generation step in which the voice decoding device generates a high frequency component by copying the transformed low frequency component into the frequency domain in the frequency transformed step from a low frequency band to a band high frequency; a high frequency tuning step in which the voice decoding device adjusts the high frequency component in the high frequency generation step to generate an adjusted high frequency component; a low frequency temporal envelope analysis step in which the voice decoding device obtains the temporal envelope information by analyzing the low frequency component transformed to the frequency domain in the frequency transform step, in which the temporal envelope information they are obtained by obtaining the power of each QMF subband sample from the low frequency component transformed to the frequency domain in the frequency transform step; a step of converting supplementary information in which the speech decoding device converts the supplementary temporal envelope information into a parameter for adjusting the temporal envelope information; a time envelope adjustment step in which the voice decoding device adjusts the time envelope information obtained in the low frequency time envelope analysis step to generate an adjusted time envelope information in which the parameter is used to adjust the information temporal envelope; and a time envelope formatting step in which the voice decoding device formats a time envelope of the adjusted high-frequency component using the adjusted time envelope information. 5. Método de decodificação de voz que usa um dispositivo de decodificação de voz para decodificar um sinal de voz codificado, o método de decodificação de voz caracterizado pelo fato de que compreende: uma etapa de decodificação central na qual o dispositivo de decodificação de voz decodifica um fluxo de bits que inclui um sinal de voz codificado para obter um componente de baixa frequência, o fluxo de bit recebido a partir do lado de fora do dispositivo de decodificação de voz; uma etapa de transformada de frequência na qual o dispositivo de decodificação de voz transforma o componente de baixa frequência obtido na etapa de decodificação central para o domínio da frequência; uma etapa de geração de alta frequência na qual o dispositivo de codificação de voz gera um componente de alta frequência pela cópia do componente de baixa frequência transformado para o domínio da frequência na etapa de transformada de frequência a partir de uma banda de baixa frequência para uma banda de alta frequência; uma etapa de ajuste de alta frequência na qual o dispositivo de decodificação de voz ajusta o componente de alta frequência gerado na etapa de geração de alta frequência para gerar um componente de alta frequência ajustado; uma etapa de análise de envelope temporal de baixa frequência na qual o dispositivo de decodificação de voz obtém uma informação de envelope temporal pela análise do componente de baixa frequência transformado para o domínio da frequência na etapa de transformada de frequência, em que as informações de envelope temporal são obtidas pela obtenção da potência de cada amostra de sub-banda QMF do componente de baixa frequência transformado para o domínio da frequência pela etapa de transformada de frequência; uma etapa de geração de informação suplementar de envelope temporal na qual o dispositivo de decodificação de voz analisa o fluxo de bit para gerar um parâmetro para ajustar a informação de envelope temporal; uma etapa de ajuste de envelope temporal na qual o dispositivo de decodificação de voz ajusta a informação de envelope temporal obtida na etapa de análise de envelope temporal de baixa frequência para gerar uma informação de envelope temporal ajustada, em que o parâmetro é utilizado no ajuste da informação de envelope temporal; e uma etapa de formatação de envelope temporal na qual o dispositivo de decodificação de voz formata um envelope temporal do componente de alta frequência ajustado, usando a informação de envelope temporal ajustada.5. Voice decoding method that uses a voice decoding device to decode an encoded voice signal, the voice decoding method characterized by the fact that it comprises: a central decoding step in which the voice decoding device decodes a bit stream that includes a speech signal encoded to obtain a low frequency component, the bit stream received from outside the speech decoding device; a frequency transform step in which the speech decoding device transforms the low frequency component obtained in the central decoding step into the frequency domain; a high frequency generation step in which the voice coding device generates a high frequency component by copying the transformed low frequency component to the frequency domain in the frequency transformed step from a low frequency band to a high frequency band; a high frequency tuning step in which the voice decoding device adjusts the high frequency component generated in the high frequency generation step to generate an adjusted high frequency component; a low frequency time envelope analysis step in which the voice decoding device obtains time envelope information by analyzing the transformed low frequency component for the frequency domain in the frequency transform step, where the envelope information temporal are obtained by obtaining the power of each sample of sub-band QMF of the low frequency component transformed to the frequency domain by the frequency transform step; a step of generating supplemental time envelope information in which the voice decoding device analyzes the bit stream to generate a parameter for adjusting the time envelope information; a time envelope adjustment step in which the voice decoding device adjusts the time envelope information obtained in the low frequency time envelope analysis step to generate adjusted time envelope information, in which the parameter is used to adjust the temporal envelope information; and a time envelope formatting step in which the speech decoding device formats a time envelope of the adjusted high-frequency component, using the adjusted time envelope information.
BR122012021663-1A 2009-04-03 2010-04-02 voice decoding devices and methods BR122012021663B1 (en)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
JP2009091396 2009-04-03
JP2009-091396 2009-04-03
JP2009-146831 2009-06-19
JP2009146831 2009-06-19
JP2009162238 2009-07-08
JP2009-162238 2009-07-08
JP2010-004419 2010-01-12
JP2010004419A JP4932917B2 (en) 2009-04-03 2010-01-12 Speech decoding apparatus, speech decoding method, and speech decoding program
BRPI1015049-8A BRPI1015049B1 (en) 2009-04-03 2010-04-02 voice decoding devices and methods
PCT/JP2010/056077 WO2010114123A1 (en) 2009-04-03 2010-04-02 Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program

Publications (2)

Publication Number Publication Date
BR122012021663A2 BR122012021663A2 (en) 2019-07-30
BR122012021663B1 true BR122012021663B1 (en) 2020-12-22

Family

ID=67432450

Family Applications (4)

Application Number Title Priority Date Filing Date
BR122012021668-2A BR122012021668B1 (en) 2009-04-03 2010-04-02 VOICE DECODING DEVICES AND METHODS
BR122012021669-0A BR122012021669B1 (en) 2009-04-03 2010-04-02 devices and methods of decoding voice and memories capable of being read by computer
BR122012021665-8A BR122012021665B1 (en) 2009-04-03 2010-04-02 voice decoding devices and methods
BR122012021663-1A BR122012021663B1 (en) 2009-04-03 2010-04-02 voice decoding devices and methods

Family Applications Before (3)

Application Number Title Priority Date Filing Date
BR122012021668-2A BR122012021668B1 (en) 2009-04-03 2010-04-02 VOICE DECODING DEVICES AND METHODS
BR122012021669-0A BR122012021669B1 (en) 2009-04-03 2010-04-02 devices and methods of decoding voice and memories capable of being read by computer
BR122012021665-8A BR122012021665B1 (en) 2009-04-03 2010-04-02 voice decoding devices and methods

Country Status (1)

Country Link
BR (4) BR122012021668B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3786948A1 (en) * 2019-08-28 2021-03-03 Fraunhofer Gesellschaft zur Förderung der Angewand Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar

Also Published As

Publication number Publication date
BR122012021668B1 (en) 2020-12-15
BR122012021668A2 (en) 2019-07-30
BR122012021663A2 (en) 2019-07-30
BR122012021669B1 (en) 2021-01-12
BR122012021665A2 (en) 2019-07-30
BR122012021665B1 (en) 2020-12-22
BR122012021669A2 (en) 2019-07-30

Similar Documents

Publication Publication Date Title
BRPI1015049B1 (en) voice decoding devices and methods
JP5588547B2 (en) Speech decoding apparatus, speech decoding method, and speech decoding program
BR122012021663B1 (en) voice decoding devices and methods

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according art. 34 industrial property law
B03A Publication of an application: publication of a patent application or of a certificate of addition of invention
B06U Preliminary requirement: requests with searches performed by other patent offices: suspension of the patent application procedure
B06A Notification to applicant to reply to the report for non-patentability or inadequacy of the application according art. 36 industrial patent law
B09A Decision: intention to grant
B16A Patent or certificate of addition of invention granted

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 22/12/2020, OBSERVADAS AS CONDICOES LEGAIS.