JPH0353300A

JPH0353300A - 音声符号化装置

Info

Publication number: JPH0353300A
Application number: JP1189084A
Authority: JP
Inventors: Kazunori Ozawa; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1989-07-20
Filing date: 1989-07-20
Publication date: 1991-03-07
Anticipated expiration: 2014-08-25
Also published as: JP2940005B2; EP0409239A3; EP0409239B1; EP0409239A2; US5142584A; DE69023402T2; DE69023402D1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、音声信号を低いビットレート、特に４．８ｋ
ｂ／ｓ以下で、比較的すくない演算量により高品質に符
号化するための音声符号化復号化方式に関する。

（従来の技術）音声信号を４．８ｋｂ／ｓ程度の低いビノｌ・レートで
符号化する方式としては、例えば特願昭６３−２０８２
０１号明細書（文献１）や、Ｍ．　Ｓｃｈｒｏｅｄｅｒ
　ａｎｄ　Ｂ．　Ａｔａ１氏による“Ｃｏｄｅ−ｅｘｃ
表すｅｄ　ｌｉｎｅａｒ　ｐｒｅｄｉｃｔｉｏｎ　：　
Ｈｉｇｈ　ｑｕａｌ表すｙｓｐｅｅｃｈ　ａｔ　ｖｅｒ
ｙ　ｌｏｗ　ｂ表す　ｒａｔｅｓ，”と題した論文（Ｉ
ＣＡＳＳＰ，ｐｐ．　９３７−９４０．　１９８５年）
（文献２）等に記載されている音声符号化方式が知られ
ている。

文献１の方法では、送信側では、フレーム毎の音声信号
から音声信号のスペクトル特性を表すスペクトルパラメ
ータとピンチを表すピンチパラメータを抽出し、音声信
号を音響的特徴を用いて複数種類（母音性、破裂性、摩
擦性など）に分類し、母音性区間では１フレームの音源
信号を改良ピッチ補間により次のように表す。１フレー
ムをピッチ区間毎に分割した複数個のピッチ区間のうち
の一つのピッチ区間（代表区間）についてマルチパルス
で表す。同じフレームの他のピノチ区間では、代表区間
におけるマルチパルスの振幅、位相を補正するだめの振
幅、位相補正係数を他のピノチ区間毎に求める。そして
代表区間のマルチパルスの振幅、位置、他のピンチ区間
での振幅、位相補正係数とスペクトル、ピッチパラメー
タを伝送する。また、破裂性区間ではフレーム全体でマ
ルチパルスを求める。また、摩擦性区間では、予め定め
られた種類の雑音信号からなるコードブノクから、雑音
信号により合威した信号と入力音声信号との誤差電力を
最小化するように一種類の雑音信号を選択するとともに
最適なゲインを計算する。そして雑音信号の種類を表す
インデクスとゲインを伝送する。受信側の説明は省略す
る。

（発明が解決しようとする課題）文献１に示した従来方式では、ピッチ周期の短い女性話
者に対しては、フレーム内に多くのピッチ区間がはいる
ので、改良ピッチ補間が効果的に動き、フレーム全体で
等価的に十分な個数のパルスが得られる。例えば、フレ
ーム長を２０ｍｓ、ピンチ周期を４ｍｓ、代表区間のパ
ルスの個数を４とすれば、改良ピソチ補間により、フレ
ーム全体ではパルスの個数は等価的に２０となる。

しかしながら、ビノチ周期の長い男声話者にヌ・１して
は、フレーム全体の等価的なパルス数は十分でないため
、改良ピソチ補間の効果が十分でなく音質的にも十分で
ないという問題点があった。例えば、ビノチ周期を１０
ｍｓとしピッチ当たりのパルス数を４とすると、フレー
ム全体のパルス数は８で、女性話者の場合に比べて著し
く少なかった。

これを改善するためにはピンチ当たりのパルス数を増や
す必要が生じるがビソトレートが増大するため、パルス
数を増やすことは困難である。

さらにこれらの問題点は、ビットレートを４．８ｋｂ／
ｓよりも低減し３ｋｂ／ｓや２．４ｋｂ／ｓとしたとき
には、ピッチ当たりのパルス数を２〜３パルスに低下さ
せる必要があるので、問題は、さらに大きくなってくる
。またこのようなビットレートでは女性話者に対しても
改良ピソチ補間の効果は不十分になってくる。

一方、文献２に示したＣＥＬＰ方式では、４．８ｋｂ／
ｓのビソトレートでは、ビットレートを低減したときに
コードブノクのビット数を低下させる必要があり、音質
が急激に低下していた。例えば、４．８ｋｂ／ｓでは一
般に５ｍｓのサブフレームに対して１０ビットのコード
ブソクを使用するが、ビノトレートを２．４ｋｂ／ｓと
すると、サブフレームを５ｍｓのままとするとコードブ
ックを５ビットとする必要がある。

５ビットでは音源信号のあらゆる種類を綱羅するために
は著しく不足するために、ビノトレートを４．８ｋｂ／
ｓ程度以下とすると音質が急激に低下していた。

本発明の目的は、上述した問題点を解決し、比較的少な
い演算量により４．８ｋｂ／ｓ以下で音質の良好な音声
符号化復号化方式を提供することにある。

（課題を解決するための手段）本発明による音声符号化復号化方式は、入力した離敗的
な音声信号からスペクトル包絡を表すスペクトルパラメ
ータとピンチを表すピノチパラメータを求め、前記フレ
ーム区間を前記ピッチパラメータに応じた小区間に分割
し、前記小区間の内の１つの区間において過去の音源信
号をもとに予測して求めた残差信号に対してマルチパル
スを求めて前記小区間の音源信号を求め、前記フレーム
内の他のピッチ区間では前記音源信号に関して振幅ある
いは位相の少なくとも一方を補正するだめの補正情報を
求めて出力することを特徴とする。

また本発明による音声符号化復号化方式は、入力した離
散的な音声信号からスペクトル包絡を表すスペクトルパ
ラメータとピッチを表すピンチパラメータを求め、前記
フレーム区間を前記ピッチパラメータに応じた小区間に
分割し、前記小区間の内の１つの区間において過去の音
源信号をもとに予測して求めた残差信号に対して予め定
められた種類の音源信号が格納されたコードブックから
一種類の音源信号を選択することにより前記小区間の音
源信号を求め、前記フレーム内のピッチ区間では前記音
源信号に関して振幅あるいは位相の少なくとも一方を補
正するための補正情報を求めて出力することを特徴とす
る。

（作用）本発明による音声符号化復号化方式の作用を説明する。

ピンチ毎の周期性のある有声区間では、あらかじめフレ
ーム内の音声信号からピッチ周期を表すピンチパラメー
タを求め、たとえば、第３図（ａ）に示すような音声波
形を、第３図（ｂ）のようにフレーム区間を前記ピッチ
周期毎の複数個のピンチ区間（サブフレーム）に分割す
る。次に、前記ピンチ区間のうちの１つのピッチ区間（
代表区間）について、過去の音源信号を用いて予測を行
い得た残差信号に対して、予め定められた個数のマルチ
パルスを求める。次に同一フレーム内の他のサブフレー
ムでは、代表区間のマルチパルスのゲイン、位相を補正
するゲイン、位相補正係数を求める。

まず予測の方法について以下で説明する。今、前フレー
ムで復元した駆動音源信号をｖ（ｎ）、予測の係数をｂ
、周期をＭとする。現フレームの代表区間を第３図（Ｃ
）の第■区間とし、この区間での音声信号をｘ１（ｎ）
とする。係数ｂ、周期Ｍは次式の誤差篭力を最小化する
ように計算する。

Ｅ＝Σ［｛ｘ１（ｎ）−　ｂ−ｖ（ｎ　−　Ｍ）＊ｈ（
ｎ））＊ｗ（ｎ）］２（１）ｎここでｗ（ｎ）は聴感重みずけフィルタのインパルス応
答を示し、具体的には、特願昭５７−２３１６０５号明
細書（文献３）等を参照できる。またｈ（ｎ）は現フレ
ームの音声から衆知の線形予測（ＬＰＣ）分析により求
めたスぺクトルパラメータを用いて構威される合或フィ
ルタのインパルス応答を示す。具体的な求め方は前記文
献３等を参照できる。記号＊は畳み込み和を示す。

（１）式を最小化するには、（１）式をｂで偏微分して
Ｏとおき次式を得る。

ただしｘＷ（ｎ）＝　ｂ−ｖ（ｎ　−　Ｍ）＊ｈ（ｎ）＊ｗ（
ｎ）　　　　　　　（３）（２）式を（１）式に代入し
て（４）式第１項は定数項であるので、（４）式の第２項
を最犬化することにより、（１）式は最小化される。従
って、種々のＭの値に対して（４）式第２項を計算して
これを最犬化するＭを求め、（２）式からｂの値を計算
する。

次に求めたｂ，　Ｍを用いて次式に従い区間のに対して
ピッチ予測を行い残差信号ｅ（ｎ）を求める。

ｅ（ｎ）　＝　ｘ１（ｎ）　一ｂ・ｖ（ｎ　−　Ｍ）＊
ｈ（ｎ）　　　　　　　　（５）ｅ（ｎ）の例を第３図
（ｃ）に示す。

次に残差信号ｅ（ｎ）に対して予め定められた個数のマ
ルチパルスを求める。マルチパルスの具体的な求め方は
相互相関関数Φｘｈと自己相関関数Ｒｈｈを用いて求め
る方法が知られており、これは例えば前記文献３や、Ａ
ｒａｓｅｋｉ，　Ｏｚａｗａ，　Ｏｎｏ，　Ｏｃｉｈａ
ｉ氏による“Ｍｕｌｔｉ−ｐｕｌｓｅ　Ｅｘｃ表すｅｄ
　Ｓｐｅｅｃｈ　Ｃｏｄｅｒ　Ｂａｓｅｄ　ｏｎＭａｘ
ｉｍｕｍ　Ｃｒｏｓｓ−ｃｏｒｒｅｌａｔｉｏｎ　Ｓｅ
ａｒｃｈ　Ａ　Ｉｇｏｒ表すｈｍ，”（ＧＬＯＢＥＣＯ
Ｍ　８３，　ＩＥＥＥ　Ｇｌｏｂａｌ　Ｔｅｌｅ−ｃｏ
ｍｍｕｎｉｃａｔｉｏｎｓＣｏｎｆｅｒｅｎｃｅ　，講
演番号２３．３、１９８３）（文献４）に記載されてい
るのでここでは説明を省略する。区間ので求めたマルチ
パルスの例を第３図（ｄ）に示す。図では２個のパルス
を求めている。

以上から次式により区間■の音源信号ｄ（ｎ）を求める
。

ｄ（ｎ）　＝　ｂ・ｖ（ｎ　−　Ｍ）　＋　ｇｉ・δ（
ｎ−ｍｉ）　　　　　　　　（６）ここでｇｉ，ｍｉは
ｉ番目のマルチパルスの振幅、位置を示す。

次に代表区間以外のピッチ区間では、代表区間の音源信
号のゲイン、位相を補正するゲイン補正係数、位相補正
係数を各区間毎に計算する。ｊ番目のピッチ区間におけ
るゲイン補正係数、位相補正係数をそれぞれＣｊ，ｄｊ
とすると、これらは次式を最小化するように計算できる
。

上式の具体的な解法は前記文献３等で詳細に説明されて
いるのでここでは説明を省略する。代表区間以外の各ピ
ッチ区間で（７）式をもとにゲイン、位相補正係数を求
めてフレームの音源信号を求める。

第３図（ｅ）に区間■以外のピッチ区間でゲイン、位相
補正係数を求め現在のフレームの駆動音源信号を復元し
た例を示す。

代表区間はここでは■番目のピッチ区間に固定して示し
たが、フレーム内のいくつかのピッチ区間を調べてフレ
ームの入力音声と合或音声との誤差電力を最も小さくす
るものを代表区間としてもよい。具体的な方法は前記文
献１等を参照できる。

伝送情報は、フレーム毎に音源情報として、代表区間の
フレーム内のピンチ区間の位置（代表区間が固定のとき
は必要なし）、代表区間の予測係数ｂ、周期Ｍ、マルチ
パルスの振幅、位置と同一フレームの他のピッチ区間に
おけるゲイン補正係数、位相補正係数を伝送する。

次に第２の発明では、代表区間で予測して得られた残差
信号ｅ（ｎ）に対して、マルチパルスを求めるかわりに
コードブックを用いベクｌ・ル量子化を行う。具体的な
方法を以下に示す。今、コードブックには２Ｂ種（Ｂは
音源のビット数）の音源信号ベクトル（コードベクトル
）が格納されているとする。コードブック中の一つの音
源信号ベクトルをｃ（ｎ）とすると、音源信号ベクトル
は次式を最小化するようにコードブックから選択する。

Ｅ＝Σ［｛ｅ（ｎ）−　ｇ−ｃ（ｎ）＊ｈ（ｎ））＊ｗ
（ｎ）］２（８）ｎここでｇは音源信号ベクトルのゲインを示す。（８）式
を最小化するには、（８）式をｇで偏微分してＯとおき
次式を得る。

ｇ＝Σｅｗ（ｎ）ｅｗ（ｎ）／Ｅｅｗ（ｎ）ｅｗ（ｎ）
　　　　　　　　　（９）ｎただしｅｗ（ｎ）＝ｅ（ｎ）＊ｈ（ｎ）　　　　　　　　　　
　　　　（１０）ｅｗ（ｎ）＝ｃ（ｎ）＊ｈ（ｎ）＊ｗ
（ｎ）　　　　　　　　　　（１１）である。（９）式
を（８）式に代入してとなる。ここで（１２）式第１項
は定数なので、全ての音源信号ベクトルｃ（ｎ）に対し
て第２項を計算しこれを最犬化するものを選択する。こ
のときのゲインは（９）式から求める。

コードブソクはあらかじめトレーニング信号を用いて学
習して作成しても良いし、例えばガウス件の乱数信号か
ら構成してもよい。前者の具体的な方法は、例えばＭａ
ｋｈｏｕ１氏らによる゛’ＶｅｃｔｏｒＱｕａｎｔｉｚ
ａｔｉｏｎ　ｉｎ　Ｓｐｅｅｃｈ　Ｃｏｄｉｎｇ，”　
（Ｐｒｏｃ．　ＩＥＥＥ，　ｖｏｌ．７３，　１１．　
１５５１−１５８８．　１９８５）（文献５）に記載さ
れている。

また後者の方法は前記文献２等に記載されている。

（実施例）第１図は第１の発明による音声符号化復号化方式の一実
施例を示すブロック図である。

図において、送信側では、入力端子１００から音声信号
を入力し、１フレーム分（例えば２０ｍｓ）の音声信号
をバッファメモリ１１０に格納する。

ＬＰＧ、ピノチ計算回路１３０は、フレームの音声信号
のスペクトル特性を表すパラメータとして、Ｋパラメー
タを前記フレームの音声信号から衆知のＬＰＣ分析を行
いあらかじめ定められた次数Ｐだけ計算する。この具体
的な計算法については前記文献ｌ、３のＫパラメータ計
算回路を参照することができる。

なお、ＫパラメータはＰＡＲＣＯＲ係数と同一のもので
ある。次にＫパラメータを予め定められた量子化ビット
数で量子化して得た符号１ｋをマルチプレクサ２６０へ
出力するとともに、これを復号化してさらに線形予測係
数ａｉ’（ｉ　＝　１〜Ｍ）に変換して重み付け回路２
００、インパルス応答計算回路１７０、合或フィルタ２
８１へ出力する。Ｋパラメータの符号化、Ｋパラメータ
から線形予測係数への変換の方法については前記文献ｌ
、３等を参照することかできる。さらにフレームの音声
信号から平均ピッチ周期Ｔを計算する。この方法として
は例えば自己相関法にもとづく方法が知られており、詳
細は前記文献１のピッチ抽出回路を参照することができ
る。また、この方法以外にも他の衆知な方法（例えば、
ケブストラム法、ＳＩＦＴ法、変相関法など）を用いる
ことができる。平均ピッチ周期Ｔをあらかじめ定められ
たビット数で量子化して得た符号をマルチプレクサ２６
０へ出力するとともに、これを復号化して得た復号ピッ
チ周期Ｔ”をサブフレーム分割回路１９５、駆動音源復
元回路２８３、ゲイン、位相補正計算回路２７０へ出力
する。

インパルス応答計算回路１７０は、前記線形予測係数ａ
ｉ”を用いて、聴感重みずけを行った合戒フィルタのイ
ンパルス応答ｈｗ（ｎ）を計算しこれを自己相関関数計
算回路１８０、相互相関関数計算回路２１０へ出力する
。

自己相関関数計算回路１８０は前記インパルス応答の自
己相関関数Ｒｈｈ（ｎ）を予め定められた遅れ時間まで
計算して出力する。インパルス応答計算回路１７０、自
己相関関数計算回路１８０の動作は前記文献１、３等を
参照することができる。

減算器１９０は、フレームの音声信号ｘ（ｎ）から合戒
フィルタ２８１の出力を１フレーム分減算し減算結果を
重み付け回路２００へ出力する。

重み付け回路２００は前記減算結果をインパルス応答が
ｗ（ｎ）で表される聴感重み付けフィルタに通し、重み
付け信号ｘＷ（ｎ）を得てこれを出力する。重み付けの
方法は前記文献１、３等を参照できる。

サブフレーム分割回路１９５は、復号ビソチ周期Ｔ′を
用いて、フレームの重み付け信号をＴ″毎のピッチ区間
に分割する。

予測係数計算回路２０６は、過去の復元した駆動音源信
号■（ｎ）とインパルス応答ｈｗ（ｎ）、前記Ｔ′毎に
分割した重み付け信号のうちの予め定められた代表区間
（例えば第３図（Ｃ）の区間■）における重み付け信号
を用いて、前記（１）−（４）式に従い予測係数ｂ、周
期Ｍを求める。そしてこれらの値を予め定められたビッ
ト数で量子化しｂ′、Ｍ′を求める。さらに予測係数計
算回路２０６は、予測音源信号ｖ’（ｎ）を次式に従い
計算し予測回路２０５へ出力する。

ｖ’（ｎ）＝ド−ｖ（ｎ−Ｍ’）　　　　　　　　　　
　　　（１３）予測回路２０５は、ｖ’（ｎ）を用いて
次式に従い予測を行い残差信号を前記代表区間（第３図
（Ｃ）の区間■）について求め出力する。

ｅｗ（ｎ）＝　ｘＷ（ｎ）−　ｖ’（ｎ）＊ｈｗ（ｎ）
　　　　　　　　（１４）相互相関関数計算回路２１０
は、ｅＷ（ｎ）とｈｗ（ｎ）を入力して相互相関関数Φ
ｘｈを予め定められた遅れ時間まで計算し出力する。こ
の計算法は前記文献１、３等を参照できる。

マルチパルス計算回路２２０では、（１４）式で求めた
、代表区間における差分信号に対して、相互相関関数、
自己相関関数を用いてマルチパルスの位置ｍｉと振幅ｇ
ｉを求める。

パルス符号器２２５は、代表区間のマルチパルスの振幅
ｇｉ、位置ｍｉを予め定められたビット数で符号化して
マルチプレクサ２６０へ出力するとともに、これらを復
号化して加算器２３５へ出力する。

加算器２３５は、復号化したマルチパルスと、予測係数
計算回路２０６の出力である予測音源信号ｖ’（ｎ）を
加算して、代表区間における音源信号ｄ（ｎ）を求める
。

次にゲイン、位相補正計算回路２７０は、作用の項で述
べたように、同一フレームの他のピンチ区間ｋにおける
音源信号復元のために、代表区間における音源信号ｄ（
ｎ）のゲイン補正係数Ｃｋ、位相補正係数ｄｋを計算し
出力する。具体的な方法は前記文献１を参照できる。

符号器２３０は、ゲイン補正係数Ｃｋ、位相補正係数ｄ
ｋを予め定められたビノト数で符号化してマルチプレク
サ２６０へ出力する。さらに、これらを復号化レＣ駆動
音源復元回路２８３へ出力する。

駆動音源復元回路２８３は、平均ピッチ周期Ｔ”を用い
てフレームを前記サブフレーム分割回路１９５と同様な
方法で分割し、代表区間に前記音源信号ｄ（ｎ）を発生
し、代表区間以外のピノチ区間では、前記代表区間の音
源信号と復号化されたゲイン桶正係数、復号化された位
相補正係数を用いて、次式に従いフレーム全体の駆動音
源信号ｖ（ｎ）を復元ずる。

ｖ（ｎ）　＝Σｃｋ４（ｎ　−Ｔ’−ｄｋ）＋ｄ（ｎ）
　　　　　　　（１５）ｋ合戊フィルタ２８１は、前記復元された駆動音源信号ｖ
（ｎ）を入力し、前記線形予測係数ａｉＩを入力して１
フレーム分の合成音声信号を求めるとともに、次のフレ
ームへの影響信号をｌフレーム分計算しこれを減算器１
９０へ出力する。なお、影響信号の計算法は文献３等を
参照できる。

マルチブレクサ２６０は、代表区間の予測係数、周期、
マルチパルスの振幅、位置を表す符号、ゲイン補正係数
、位相補正係数、平均ピッチ周期の符号、Ｋパラメータ
を表す符号を組み合せて出力する。

以上で第１の発明の送信側の説明を終える。

受信側では、デマルチプレクサ２９０は端子２８５から
前記組み合わされた符号を入力し、マルチパルスを表す
符号、ゲイン、位相補正係数を表す符号、予測係数、周
期を表す符号、平均ピッチ周期を表す符号、Ｋパラメー
タを表す符号を分離して出力する。

Ｋパラメータ、ピツチ復号回路３３０はＫパラメータを
表す符号、ピソチ周期を表ず符号を復号して復号したピ
ッチ周期Ｔ′を駆動音源復元回路３４０へ出力する。

パルス復号回路３００はマルチパルスを表す符号を復号
し、予め定められた代表区間にマルチパルスを発生して
加算器３３５へ出力する。

加算器３３５は、パルス復号回路３００と予測回路３４
５の出力である予測音源信号ｖ’（ｎ）を加算して代表
区間の音源信号ｄ（ｎ）を求める。

ゲイン、位相補正係数復号回路３１５は、ゲインネ！１
｝正係数、位相補正係数を表す符号を入力しこれらを復
号して出力する。

係数復号回路３２５は、予測係数、周期を表す符号を復
号して復号した予測係数ｂ′、復号した周期Ｍ′を出力
する。

予測回路３４５は、ｂ”、Ｍ′を用いて過去のフレーム
の駆動音源信号ｖ（ｎ）から前記（ｌ３）式にもとづき
予測音源信号ｖ’（ｎ）を計算し加算器３３５に出力す
る。

駆動音源復元回路３４０は、加算器３３５の出力、復号
したピッチ周期Ｔ′、復号化したゲイン補正係数、復号
化した位相補正係数を入力する。そして、送信側の駆動
音源復元回路２８３と同一の動作を行い１フレームの駆
動音源信号ｖ（ｎ）を復元して出力する。

合戊フィルタ３５０は、復元したフレームの駆動音源信
号と線形予測係数ａｉ＋を入力して１フレーム分の合成
音声ｘ（ｎ）を計算して端子３６０を通して出力する。

以上で第１の発明の受信側の説明を終える。

第２図は第２の発明の一実施例を示すブロック図である
。第２図において第１図と同一の番号を付した購成要素
は第１図と同一の動作を行うので、説明は省略する。

本実施例では、（１）−（４）及び（１４）式に従い計
算した予測残差信号に対して、コードブソク５２０から
最適なコードベクトルを選択し、コードベクトルのゲイ
ンｇを計算する。ここで（１４）式で求めたｅｗ（ｎ）
に対して、（８）式を最小化するようにコードベクトル
ｃ（ｎ）を選択しゲインｇを求める。今、コードブソク
のコードベクトルの次元数をＬ、コードベクトルの種類
を２Ｂとする。また、コードブックは前記文献２のよう
に、ガウス性のランダム信号から｛１ナ或されるものと
する。

相関関数計算回路５０５は、次式に従い相互相関関数Φ
、自己相関関数Ｒを計算する。

Φ＝ΣｅＷ（ｎ）〜（ｎ）（１６）ｎＲ＝Σ〜（ｎ）〜（ｎ）　　　　　　　　　　　　（１
７）ｎここで、ｅＷ（ｎ）、ｅ，（ｎ）は（１０）、（１１）
式に従い求める。また（１６）式、（１７）式は、（９
）式の分子、分母の項にそれぞれ相当する。（ｌ６）、
（１７）式は全てのコードベクトルに対して計算し、各
コードベクトルに対応したΦ、Ｒの値をコードブック選
択回路５００へ出力する。

コードブック選択回路５００は、前記（１２）式の第２
項を最大化するコードベクトルを選択する。（ｌ２）式
第２項は次式のように書き直せる。

Ｄ＝Φ２／Ｒ（１８）従って（１８）式を最犬化するコードベクトルを選択す
ればよい。選択されたコードベクトルに対してゲインｇ
は下式から計算できる。

ｇ＝ｏ／Ｒ　　　　　　　　　　　　　　　　　（１９
）コードブック選択回路５００は、選択されたコードブ
ックのインデクスを示す情報をマルチブレクサ２６０へ
出力し、求めたゲインｇをゲイン符号器５１０へ出力す
る。

ゲイン符号器５１０は、ゲインを予め定められた量子化
ビット数で量子化して符号をマルチプレクサ２６０へ出
力するとともに、復号した値ｇ′を用いて、選択された
コードベクトルによる音源信号ｚ（ｎ）を下式に従い求
め加算器５２５へ出力する。

ｚ（ｎ）　＝　ｇ’−ｃ（ｎ）　　　　　　　　　　　
　　　　（２０）加算器５２５は、（１３）式による予
測音源信号ｖ’（ｎ）とｚ（ｎ）を次式に従い加算して
代表区間の音源信号ｄ（ｎ）を求め、駆動音源復号回路
２８３、ゲイン、位相補正計算回路２７０へ出力する。

ｄ（ｎ）＝　ｖ’（ｎ）　＋　ｚ（ｎ）　　　　　　　
　　　　　　（２１）以上で本発明の実施例の送信側の
説明を終える。

次に受信側の説明を行う。ゲイン復号回路５３０は、ゲ
インを表す符号を復号化して復号化ゲインｇ′を出力す
る。発生回路５４０は、選択されたコードブックのイン
デクスを表す符号を入力し、コートブック５２０から前
記インデクスに従いコードベクトルｃ（ｎ）を選択する
。そして復号化ゲインｇ′を用いて（２０）式に従い音
源信号ｚ（ｎ）を発生し加算器５５０へ出力する。

加算器５５０は、送信側の加算器５２５と同一の動作を
行い、ｚ（ｎ）と予測回路３４５の出力である子ｉｎ１
１音源信号ｖ’（ｎ）を（２１）式に従い加算して代表
区間の音源信号ｄ（ｎ）を求めて駆動音源復元回路３４
０へ出力する。

以上で第２の発明の実施例の受信側の説明を終える。

上述した実施例はあくまで本発明の一構或に過ぎずその
変形例も種々考えられる。

第１の発明の実施例では、代表区間でピンチ予測残差に
対して求めたマルチパルスの振幅、位置はスカラ量子化
（ＳＱ）Ｌたが、さらに情報量を低減するために、ベク
トル量子化（ＶＱ）Ｌてもよい。例えば、位置のみをＶ
ＱＬて振幅はＳＱ、あるいは振幅をＳＱｔ，て位置はＶ
Ｑ、あるいは振幅、位置ともにＶＱずる組合せが考えら
れる。位置のＶＱの具体的な方法については、例えばＲ
．　Ｚｉｎｓｅｒ氏らによる“４８００ａｎｄ　７２０
０　ｂ表す／ｓｅｅ　Ｈｙｂｒｉｄ　Ｃｏｄｅｂｏｏｋ
　ＭｕｌｔｉｐｕｌｓｅＣｏｄｉｎｇ，”（ＩＣＡＳＳ
Ｐ，　ｐｐ．　７４７−７５０．１９８９Ｘ文献６）等
を参照できる。

また、第１の発明の実施例では、代表区間以外のピッチ
区間では、ゲイン補正係数Ｃｋと位相補正係数ｄｋを求
めて伝送したが、復号化した平均ピッチ周期Ｔ′を隣接
のピッチ周期を用いてピンチ区間毎に補間することによ
り位相補正係数を伝送しない構戊とすることもできる。

またゲイン補正係数はピンチ区間毎に伝送するのではな
くてピッチ区間毎に求めたゲイン補正係数の値を最小２
乗曲線あるいは最小２乗直線で近似して、前記曲線ある
いは直線の係数を符号化して伝送するような構戒にして
もよい。これらの方法は任意の組合せにより用いること
ができる。これらの構成より補正情報の伝送のための情
報量を低減することができる。

また位相補正係数として、例えばＯｎｏ，　Ｏｚａｗａ
氏ら　に　よ　る”２．４ｋｂｐｓ　Ｐ表すｃｈ　Ｐｒ
ｅｄｉｃｔｉｏｎ　Ｍｕｌｔｉ−ｐｕｌｓｅＳｐｅｅｃ
ｈ　Ｃｏｄｉｎｇ”と題した論文（Ｐｒｏｃ．　ＩＣＡ
ＳＳＰ　Ｓ４．９．１９８８）（文献７）に記載されて
いるように、フレームの端で線形位相項１を求め、これ
を各ピッチ区間に分配し、ピッチ区間毎には位相補正係
数を求めない構或とすることもできる。これ以外にも、
ピッチ区間毎に求めた位相補正係数の値を最小２乗直線
あるいは最小２乗曲線等で近似して、その係数を符号化
して伝送するようにしてもよい。

また、第１の発明の実施例では、文献１のように、フレ
ームの音声信号の特徴に応じて異なる音源信号を用いる
ようにすることもできる。例えば、音声信号を母音性、
鼻音性、摩擦性、破裂性などに分類し、母音性区間に第
ｌの発明による構或を用いるようにすることもできる。

また、第１、第２の発明の実施例では、スペクトルパラ
メータとしてＫパラメータを符号化し、その分析法とし
てＬＰＧ分析を用いたが、スペクトルパラメータとして
は他の衆知なパラメータ、例えばＬＳＰ，　ＬＰＣケプ
ストラム、ケプストラム、改良ケプスドラム、一般化ケ
プストラム、メルケプストラムなどを用いることもでき
る。また各パラメータに最適な分析法を用いることがで
きる。

また、第１、２の発明の実施例において、予測を行うと
きの代表区間をフレーム内の予め定められたピノチ区間
に固定したが、フレーム内の全てのピッチ区間の各々に
ついて、予測から、予測残差に対する音源信号の計算、
さらに他のピッチ区間でのゲイン、位相補正係数の計算
を行い、これにより再生したフレームの音声信号と入力
信号との重み付け誤差電力を計算し、これを最小にする
ピノチ区間を代表区間として選択するような構成として
もよい。具体的な方法は前記文献１を参照できる。この
ような構或とすると、演算量は増大し、代表区間のフレ
ーム内の位置を示す情報を追加伝送する必要があるが、
特性はさらに向上する。

また、サブフレーム分割回路１９５において、フレーム
をピンチ周期に等しい長さのピッチ区間に分割したが、
予め定められた長さ（例えば５ｍｓ）ごとに分割するよ
うにすることもできる。このような構戊ではピッチ周期
の抽出が不要となり演算量が低減するが、音質は若干低
下する。

また、演算量を低減するために、送信側では影響信号の
計算を省略することもできる。これによって、送信側に
おける駆動信号復元回路２８３、合或フィルタ２８１，
減算器１９０は不要となり演算量低減が可能となるが、
音質は低下する。

また、受信側で合戊フィルタ３５０の後ろに、量子化雑
音を整形することにより聴覚的にきき易くするために、
ビノチとスペクトル包絡の少なくとも１つについて動作
する適応形ポストフィルタを付加してもよい。適応型ポ
ストフィルタの構成については、例えば、Ｋｒｏｏｎ氏
らによる”Ａ　Ｃｌａｓｓ　ｏｆＡｎａｌｙｓｉｓ−ｂ
ｙ−ｓｙｎｔｈｅｓｉｓ　Ｐｒｅｄｉｃｔｉｖｅ　Ｃｏ
ｄｅｒｓ　ｆｏｒ　ＨｉｇｈＱｕａｌ表すｙ　Ｓｐｅｅ
ｃｈ　Ｃｏｄｉｎｇ　ａｔ　Ｒａｔｅｓ　ｂｅｔｗｅｅ
ｎ　４．８　ａｎｄ１６ｋｂ／ｓ，”　（ＩＥＥＥ　Ｊ
ＳＡＣ，　ｖｏｌ．　６，　２，　３５３−３６３，　
１９８８Ｘ文献８）等を参照できる。

なお、デジタル信号処理の分野でよく知られているよう
に、自己相関関数は周波数軸上でバワスベクトルに、相
互相関関数はクロスパワスペクトルに対応しているので
、これらから計算することもできる。これらの計算法に
ついては、Ｏｐｐｅｎｈｅｉｍ氏らによる”Ｄｉｇ表す
ａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ”（Ｐｒｅ
ｎｔｉｃｅ−Ｈａｌｌ，　１９７５）と題した単行本（
文献９）を参照できる。

（発明の効果）以上述べたように、本発明によれば、フレームをピッチ
煽期毎に分割し、一つのピッチ区間（代表区間）につい
て過去の音源信号から予測を行い予ｉｆｌｌＪ誤差をマ
ルチパルスか、音源信号ベクトル（コードベクトル）で
良好に表すことにより、代表区間の音源信号をきわめて
効率的に表している。さらに同一フレームの他のピッチ
区間では、代表区間の音源信号のゲイン、位相を補正し
ながらフレームの音源信号を復元しているので、きわめ
て少ない音源情報量でフレームの音声の音源信号を良好
に表すことが可能となる。従って従来方式に比べて、４
．８ｋｂ／ｓ以下のピットレートで、良好な音質の符号
化再生音声を得ることができるという大きな効果がある
。

【図面の簡単な説明】

第１図は第１の発明による音声符号化復号化方式の一実
施例を示すブロソク図、第２図は第２の発明による音声
符号化復号化方式の一実施例を示すブロック図、第３図
は本発明の作用を説明するための図である。図において、１１０はバノファメモリ、１３０はＬＰＣ
、ピッチ計算回路、１４０は量子化回路、１７０はイン
パルス応答計算回路、１８０は自己相関関数計算回路、
１９５はサブフレーム分割回路、２００は重み付け回路
、２０５、３４５は予厠回路、２０６は予測係数計算回
路、２２０はマルチパルス計算回路、２２５はパルス符
号化回路、２３０は符号器、２３５は加算器、２６０は
マルチプレクサ、２７０はゲイン、位相補正係数計算回
路、２８１、３５０は合威フィルタ、２８３、３４０は
駆動音源復元回路、２９０はデマルチプレクサ、３００
はパルス復号回路、３１５はゲイン、位相補正係数復号
回路、３２５は係数復号回路、３３０はＫパラメータ、
ビッチ復号回路、５００はコードブソク選択回路、５０
５は相関関数計算回路、５２０はコードブック、である
。

Claims

【特許請求の範囲】

（１）入力した離散的な音声信号からスペクトル包絡を
表すスペクトルパラメータとピッチを表すピッチパラメ
ータを求め、前記フレーム区間を前記ピッチパラメータ
に応じた小区間に分割し、前記小区間の内の１つの区間
において過去の音源信号をもとに予測して求めた残差信
号に対してマルチパルスを求めて前記小区間の音源信号
を求め、前記フレーム内の他のピッチ区間では前記音源
信号に関して振幅あるいは位相の少なくとも一方を補正
するための補正情報を求めて出力することを特徴とする
音声符号化方式。
（２）入力した離散的な音声信号からスペクトル包絡を
表すスペクトルパラメータとピッチを表すピッチパラメ
ータを求め、前記フレーム区間を前記ピッチパラメータ
に応じた小区間に分割し、前記小区間の内の１つの区間
において過去の音源信号をもとに予測して求めた残差信
号に対して予め定められた種類の音源信号が格納された
コードブックから一種類の音源信号を選択することによ
り前記小区間の音源信号を求め、前記フレーム内の他の
ピッチ区間では前記音源信号に関して振幅あるいは位相
の少なくとも一方を補正するための補正情報を求めて出
力することを特徴とする音声符号化方式。