JPH0736493A - Variable rate speech coder - Google Patents

Variable rate speech coder

Info

Publication number
JPH0736493A
JPH0736493A JP5181125A JP18112593A JPH0736493A JP H0736493 A JPH0736493 A JP H0736493A JP 5181125 A JP5181125 A JP 5181125A JP 18112593 A JP18112593 A JP 18112593A JP H0736493 A JPH0736493 A JP H0736493A
Authority
JP
Japan
Prior art keywords
linear prediction
order
prediction coefficient
linear
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5181125A
Other languages
Japanese (ja)
Inventor
Norio Nomura
規雄 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5181125A priority Critical patent/JPH0736493A/en
Publication of JPH0736493A publication Critical patent/JPH0736493A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 線形分析フィルタの次数をフレームごとに可
変化して、線形予測係数の量子化ビットを容易に可変で
きるようにする。 【構成】 フレーム切り出し部11が入力音声から1フ
レーム分の音声データを切り出し、この1フレーム分の
音声データにおけるPACOR係数を線形予測係数計算
部12で算出する。さらに、次数決定部13が線形予測
分析の次数pを決定する。線形予測係数計算部12から
次数pに対応した線形予測係数α1〜αpを線形分析フ
ィルタ14及び量子化部15に送出する。線形分析フィ
ルタ14は残差信号を算出し、量子化部15が線形予測
係数を符号化コードに量子化して送出する。これによっ
て、フレームごとに線形予測係数の次数pが可変とな
り、線形予測係数の可変レートによる処理が行われる。
(57) [Summary] [Purpose] The order of the linear analysis filter is made variable for each frame so that the quantization bit of the linear prediction coefficient can be easily changed. [Structure] A frame cutout unit 11 cuts out one frame of voice data from input voice, and a linear prediction coefficient calculation unit 12 calculates a PACOR coefficient in the one frame of voice data. Further, the order determining unit 13 determines the order p of the linear prediction analysis. The linear prediction coefficient calculation unit 12 sends the linear prediction coefficients α1 to αp corresponding to the order p to the linear analysis filter 14 and the quantization unit 15. The linear analysis filter 14 calculates the residual signal, and the quantizer 15 quantizes the linear prediction coefficient into a coded code and sends it out. As a result, the order p of the linear prediction coefficient becomes variable for each frame, and the processing at the variable rate of the linear prediction coefficient is performed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、ディジタル音声通信装
置、ディジタル音声蓄積装置などに利用し、符号化デー
タを可変レートで伝送する可変レート音声符号化装置に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a variable rate speech coding apparatus which is used in a digital speech communication apparatus, a digital speech storage apparatus or the like and which transmits coded data at a variable rate.

【0002】[0002]

【従来の技術】近年、音声符号化として可変レート音声
符号化処理の研究が行われている。この可変レート音声
符号化処理は、伝送情報量が固定である従来の固定レー
トの音声符号化処理と相違し、時間によって伝送情報量
が変化する。この場合、固定レート音声符号化処理に比
較して合計の伝送情報量を低減できる。また、可変レー
トの音声符号化処理、固定レートの音声符号化処理のい
ずれも音声の線形予測分析の次数は固定方式が主流であ
る。
2. Description of the Related Art In recent years, research on variable-rate speech coding processing has been conducted as speech coding. This variable-rate voice encoding process differs from the conventional fixed-rate voice encoding process in which the amount of transmission information is fixed, and the amount of transmission information changes with time. In this case, it is possible to reduce the total amount of transmission information as compared with the fixed rate speech coding process. Further, in both the variable rate speech coding processing and the fixed rate speech coding processing, the order of the linear prediction analysis of speech is mainly fixed.

【0003】図3は従来の可変レート音声符号化装置の
構成を示すブロック図である。図3において、この可変
レート音声符号化装置は、入力音声(信号)から1フレ
ーム長の音声データを切り出すフレーム切り出し部6
と、線形予測係数を算出する線形予測係数計算部7と、
残差信号を算出する線形分析フィルタ8と、線形予測係
数を符号化コードに量子化する量子化部9とを有してい
る。ここでの線形分析フィルタ8の次数は固定値であ
る。
FIG. 3 is a block diagram showing the structure of a conventional variable rate speech coding apparatus. In FIG. 3, the variable rate audio encoding device includes a frame cutout unit 6 that cuts out audio data of one frame length from input audio (signal).
And a linear prediction coefficient calculation unit 7 that calculates a linear prediction coefficient,
It has a linear analysis filter 8 for calculating a residual signal and a quantizer 9 for quantizing a linear prediction coefficient into an encoding code. The order of the linear analysis filter 8 here is a fixed value.

【0004】次に、この従来例の構成の動作について説
明する。フレーム切り出し部6は、1フレーム長の音声
データを切り出す。線形予測係数計算部7は、線形分析
フィルタ8の出力パワーが最小になるような線形予測係
数α1〜αpを算出する。線形分析フィルタ8では残差
信号が計算される。また、量子化部9では線形予測係数
α1〜αpを符号化コードに量子化する。
Next, the operation of this conventional configuration will be described. The frame cutout unit 6 cuts out audio data of one frame length. The linear prediction coefficient calculator 7 calculates the linear prediction coefficients α1 to αp such that the output power of the linear analysis filter 8 is minimized. The linear analysis filter 8 calculates the residual signal. Further, the quantizing unit 9 quantizes the linear prediction coefficients α1 to αp into coding codes.

【0005】[0005]

【発明が解決しようとする課題】このような上記の従来
の音声符号化処理では、線形分析フィルタ8の次数pが
固定であるため線形予測係数α1〜αpの量子化コード
のビット数を可変化し難いという問題を有していた。
In such a conventional speech coding process as described above, since the order p of the linear analysis filter 8 is fixed, the number of bits of the quantization code of the linear prediction coefficients α1 to αp is made variable. It had a problem that it was difficult to do.

【0006】本発明は、このような従来の問題を解決す
るものであり、線形分析フィルタの次数をフレームごと
に可変化して、線形予測係数の量子化ビットを容易に可
変できる優れた可変レート音声符号化装置の提供を目的
とする。
The present invention solves such a conventional problem, and makes it possible to easily change the quantization bit of the linear prediction coefficient by changing the order of the linear analysis filter for each frame. An object is to provide a speech encoding device.

【0007】[0007]

【課題を解決するための手段】上記目的を達成するため
に、本発明の可変レート音声符号化装置は、入力音声か
ら1フレーム分の音声データを切り出すフレーム切り出
し手段と、1フレーム分の音声データにおける係数を算
出する線形予測係数計算手段と、線形予測分析の次数を
決定する次数決定手段と、次数に対応した線形予測係数
を送出する線形予測係数計算手段と、残差信号を算出す
る可変次数の線形分析フィルタと、線形予測係数を符号
化コードに量子化して送出する量子化手段とを有し、フ
レームごとに線形予測係数の次数を可変して、線形予測
係数の可変レートによる処理を行う構成としている。
In order to achieve the above object, a variable rate speech coding apparatus according to the present invention is provided with a frame clipping means for clipping speech data of one frame from input speech and speech data of one frame. , A linear predictive coefficient calculating means for calculating the coefficient, an order determining means for determining the order of the linear predictive analysis, a linear predictive coefficient calculating means for sending a linear predictive coefficient corresponding to the order, and a variable order for calculating the residual signal. , And a quantizing means for quantizing and transmitting the linear prediction coefficient into a coded code. By varying the order of the linear prediction coefficient for each frame, processing is performed at a variable rate of the linear prediction coefficient. It is configured.

【0008】また、線形予測係数計算手段でPACOR
係数を算出し、かつ、線形分析フィルタは、次数に対す
る線形予測係数を使用し、出力パワー対入力パワー比を
示す予測ゲインを算出する構成としている。
In addition, the linear prediction coefficient calculation means uses PACOR.
The coefficient is calculated, and the linear analysis filter uses the linear prediction coefficient for the order to calculate the prediction gain indicating the output power to input power ratio.

【0009】[0009]

【作用】このような構成により、本発明の可変レート音
声符号化装置は、フレームごとに線形予測係数の次数、
すなわち、線形予測係数における数値が可変となり、線
形予測係数の量子化部での符号化コードのビット数が容
易に可変化される。
With such a configuration, the variable rate speech coding apparatus of the present invention has the order of the linear prediction coefficient for each frame,
That is, the numerical value of the linear prediction coefficient becomes variable, and the number of bits of the coding code in the quantizing unit of the linear prediction coefficient is easily variable.

【0010】[0010]

【実施例】以下、本発明の可変レート音声符号化装置の
実施例を図面を参照して詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT An embodiment of a variable rate speech coder according to the present invention will be described below in detail with reference to the drawings.

【0011】図1は本発明の可変レート音声符号化装置
の実施例における構成を示すブロック図である。図1に
おいて、この可変レート音声符号化装置は、入力音声
(信号)の1フレーム分の音声データを切り出すフレー
ム切り出し部11と、PACOR係数を算出する線形予
測係数計算部12とを有している。さらに、この可変レ
ート音声符号化装置は、次数pを決定する次数決定部1
3と、残差信号を算出する可変次数の線形分析フィルタ
14と、線形予測係数を符号化コードに量子化する量子
化部15とを有している。
FIG. 1 is a block diagram showing the configuration of an embodiment of a variable rate speech coding apparatus of the present invention. In FIG. 1, this variable rate speech coding apparatus has a frame cutout unit 11 that cuts out one frame of speech data of an input speech (signal), and a linear prediction coefficient calculation unit 12 that calculates a PACOR coefficient. . Further, this variable rate speech encoding apparatus has an order determining unit 1 for determining the order p.
3, a variable-order linear analysis filter 14 for calculating a residual signal, and a quantizer 15 for quantizing a linear prediction coefficient into an encoding code.

【0012】次に、この実施例の構成における動作につ
いて説明する。フレーム切り出し部11は、連続音声で
ある入力音声から1フレーム分の音声データを切り出
し、この切り出した1フレーム分の音声データにおける
PACOR係数k1〜kpmaxを線形予測係数計算部
12で計算する。ここで、pmaxは最大次数である。
そして、次数決定部13が次の処理手順を通じて次数p
を決定する。 (1)入力音声より各次数pにおけるPACOR係数k
i(1≦i≦pmax)を求める。 (2)各次数pにおける線形分析フィルタ14の予測ゲ
インui(0≦i≦pmax)を次式〔数1〕で算出す
る。予測ゲインuiは次数iに対する線形予測係数を使
用した線形分析フィルタ14における出力パワー対入力
パワー比を示す。
Next, the operation of the configuration of this embodiment will be described. The frame cutout unit 11 cuts out one frame of sound data from the input sound that is continuous sound, and the linear prediction coefficient calculation unit 12 calculates the PACOR coefficients k1 to kpmax in the cutout one frame of sound data. Here, pmax is the maximum order.
Then, the order determining unit 13 executes the order p through the following processing procedure.
To decide. (1) PACOR coefficient k at each order p from input speech
i (1 ≦ i ≦ pmax) is calculated. (2) The prediction gain ui (0 ≦ i ≦ pmax) of the linear analysis filter 14 at each order p is calculated by the following equation [Equation 1]. The prediction gain ui indicates the output power to input power ratio in the linear analysis filter 14 using the linear prediction coefficient for the order i.

【0013】[0013]

【数1】 [Equation 1]

【0014】(3)次の式(2)を用いて次数pを決定
する。 次数pは、ui<utを満たす最小のiの値(0≦i≦
pmax)ここで、 ut=upmax×(1+du/100) …(2) du:次数決定処理の動作を決定するパラメータ(%) (4)線形予測係数計算部12が次数pにおける次数に
対応した線形予測係数α1〜αpを算出する。 (5)線形予測係数計算部12で算出した線形予測係数
α1〜αpを使用して、線形分析フィルタ14が出力残
差を算出する。
(3) The order p is determined using the following equation (2). The order p is the minimum value of i satisfying ui <ut (0 ≦ i ≦
pmax) where ut = upmax × (1 + du / 100) (2) du: parameter that determines the operation of the order determination process (%) (4) The linear prediction coefficient calculation unit 12 corresponds to the order of the order p. The prediction coefficients α1 to αp are calculated. (5) Using the linear prediction coefficients α1 to αp calculated by the linear prediction coefficient calculation unit 12, the linear analysis filter 14 calculates the output residual.

【0015】この場合、入力音声によっては線形分析フ
ィルタ14の次数pを増加しても符号化の効果の無い信
号がある。例えば、ホワイトノイズは線形予測係が、い
ずれも0に近くなり、線形分析フィルタ14は意味がな
い。これは線形分析フィルタ14が、入力音声のスペク
トル包絡をフラットにする処理を行うためである。した
がって、ホワイトノイズのようなスペクトルがフラット
の信号に対しては線形分析フィルタ14は用いることが
出来ない。これは入力音声の性質によって線形分析フィ
ルタ14の次数pを小さくすれば良いことを意味する。
In this case, depending on the input voice, there is a signal that has no coding effect even if the order p of the linear analysis filter 14 is increased. For example, with respect to white noise, the linear predictors are close to 0, and the linear analysis filter 14 has no meaning. This is because the linear analysis filter 14 performs processing for flattening the spectral envelope of the input voice. Therefore, the linear analysis filter 14 cannot be used for a signal having a flat spectrum such as white noise. This means that the order p of the linear analysis filter 14 may be reduced depending on the nature of the input voice.

【0016】したがって、上記の線形予測係数の次数決
定処理では、予測ゲインが最大次数における予測ゲイン
に近いときの次数pを求めている。このとき、この次数
pで線形分析フィルタ14をかけた出力残差と、最大次
数で線形分析フィルタ14をかけたときの出力残差は同
様の波形となる。
Therefore, in the above-described linear prediction coefficient order determination process, the order p is calculated when the prediction gain is close to the prediction gain at the maximum order. At this time, the output residual when the linear analysis filter 14 is applied with the order p and the output residual when the linear analysis filter 14 is applied with the maximum order have the same waveform.

【0017】図2に実際の音声波形例を示す波形図であ
る。図2において、この例は、図2(a)に示す入力音
声に対する次数pが2の場合の波形を図2(b)に示し
ている。さらに図2(c)(d)(e)(f)にそれぞ
れ、次数pが4,5,8,10の場合の波形を示してい
る。
FIG. 2 is a waveform diagram showing an example of an actual voice waveform. In FIG. 2, in this example, the waveform when the order p of the input voice shown in FIG. 2 (a) is 2 is shown in FIG. 2 (b). 2 (c), (d), (e), and (f) show waveforms when the orders p are 4, 5, 8, and 10, respectively.

【0018】このように次数pをフレームごとに変化さ
せることにより、この音声符号化処理で伝送する線形予
測係数の個数は、固定レートの音声符号化処理での線形
予測係数の個数より少なくなる。
By changing the order p for each frame in this way, the number of linear prediction coefficients to be transmitted in this speech coding process becomes smaller than the number of linear prediction coefficients in the fixed rate speech coding process.

【0019】[0019]

【発明の効果】以上の説明から明らかなように、本発明
の可変レート音声符号化装置は、フレームごとに線形予
測係数の次数である線形予測係数における数値を可変に
しているため、線形予測係数の量子化部での符号化コー
ドのビット数を容易に可変化できるという効果を有す
る。
As is apparent from the above description, since the variable rate speech coding apparatus of the present invention makes the value of the linear prediction coefficient which is the order of the linear prediction coefficient variable for each frame, the linear prediction coefficient is changed. This has the effect that the number of bits of the encoded code in the quantization unit can be easily changed.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の可変レート音声符号化装置の実施例に
おける構成を示すブロック図
FIG. 1 is a block diagram showing the configuration of an embodiment of a variable rate speech coding apparatus of the present invention.

【図2】実施例における実際の音声波形例を示す波形図FIG. 2 is a waveform diagram showing an example of an actual voice waveform in the embodiment.

【図3】従来の可変レート音声符号化装置の構成を示す
ブロック図
FIG. 3 is a block diagram showing a configuration of a conventional variable rate speech coding apparatus.

【符号の説明】[Explanation of symbols]

11 フレーム切り出し部 12 線形予測係数計算部 13 次数決定部 14 線形分析フィルタ 15 量子化部 11 frame cutout unit 12 linear prediction coefficient calculation unit 13 order determination unit 14 linear analysis filter 15 quantization unit

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 入力音声から1フレーム分の音声データ
を切り出すフレーム切り出し手段と、上記1フレーム分
の音声データにおける係数を算出する線形予測係数計算
手段と、線形予測分析の次数を決定する次数決定手段
と、上記次数に対応した線形予測係数を送出する線形予
測係数計算手段と、残差信号を算出する可変次数の線形
分析フィルタと、線形予測係数を符号化コードに量子化
して送出する量子化手段とを有し、フレームごとに線形
予測係数の次数を可変して、線形予測係数の可変レート
による処理を行うことを特徴とする可変レート音声符号
化装置。
1. A frame cutout unit that cuts out one frame of voice data from an input voice, a linear prediction coefficient calculation unit that calculates a coefficient in the one frame of voice data, and an order determination unit that determines the order of linear prediction analysis. Means, a linear prediction coefficient calculation means for sending a linear prediction coefficient corresponding to the above-mentioned order, a variable-order linear analysis filter for calculating a residual signal, and a quantization for quantizing and sending the linear prediction coefficient into a coding code Means for varying the order of the linear prediction coefficient for each frame and performing processing at a variable rate of the linear prediction coefficient.
【請求項2】 線形予測係数計算手段でPACOR係数
を算出し、かつ、線形分析フィルタは、次数に対する線
形予測係数を使用し、出力パワー対入力パワー比を示す
予測ゲインを算出することを特徴とする請求項1記載の
可変レート音声符号化装置。
2. A linear prediction coefficient calculation means calculates a PACOR coefficient, and a linear analysis filter uses a linear prediction coefficient for an order to calculate a prediction gain indicating an output power to input power ratio. The variable rate speech coding apparatus according to claim 1.
JP5181125A 1993-07-22 1993-07-22 Variable rate speech coder Pending JPH0736493A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5181125A JPH0736493A (en) 1993-07-22 1993-07-22 Variable rate speech coder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5181125A JPH0736493A (en) 1993-07-22 1993-07-22 Variable rate speech coder

Publications (1)

Publication Number Publication Date
JPH0736493A true JPH0736493A (en) 1995-02-07

Family

ID=16095306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5181125A Pending JPH0736493A (en) 1993-07-22 1993-07-22 Variable rate speech coder

Country Status (1)

Country Link
JP (1) JPH0736493A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008532064A (en) * 2005-02-23 2008-08-14 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Optimizing fidelity and reducing signal transmission in multi-channel audio coding
JP2013120225A (en) * 2011-12-06 2013-06-17 Nippon Telegr & Teleph Corp <Ntt> Encoding method, encoding device, program, and recording medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008532064A (en) * 2005-02-23 2008-08-14 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Optimizing fidelity and reducing signal transmission in multi-channel audio coding
JP2013120225A (en) * 2011-12-06 2013-06-17 Nippon Telegr & Teleph Corp <Ntt> Encoding method, encoding device, program, and recording medium

Similar Documents

Publication Publication Date Title
US7457743B2 (en) Method for improving the coding efficiency of an audio signal
US6721700B1 (en) Audio coding method and apparatus
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
KR100923922B1 (en) Method and system for pitch contour quantization in audio coding
US5742733A (en) Parametric speech coding
KR100814673B1 (en) audio coding
US20070168186A1 (en) Audio coding apparatus, audio decoding apparatus, audio coding method and audio decoding method
EP2127088B1 (en) Audio quantization
JP3248215B2 (en) Audio coding device
WO2005033860A2 (en) A fast codebook selection method in audio encoding
JP4359949B2 (en) Signal encoding apparatus and method, and signal decoding apparatus and method
US6678647B1 (en) Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
KR100848370B1 (en) Audio Encoding
JPH10268897A (en) Signal coding method and device therefor
JPH0736493A (en) Variable rate speech coder
US20020184005A1 (en) Speech coding system
JP3496618B2 (en) Apparatus and method for speech encoding / decoding including speechless encoding operating at multiple rates
JP3294024B2 (en) Encoded transmission method of audio signal
JPS6333025A (en) Sound encoding method
JP3144213B2 (en) Speech parameter analyzer and speech coder
JP2001148632A (en) Encoding device, encoding method and recording medium
JPH08195722A (en) Audio signal transmission system using spectral parameter and audio parameter encoder and decoder used for same
KR0138868B1 (en) LS Frequency Quantization Method and Quantizer
Wang Speech coding
JP3273870B2 (en) Speech linear prediction parameter coding device