JPH0473700A

JPH0473700A - 音声符号化方法

Info

Publication number: JPH0473700A
Application number: JP2184234A
Authority: JP
Inventors: Kazunori Ozawa; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1990-07-13
Filing date: 1990-07-13
Publication date: 1992-03-09
Anticipated expiration: 2015-10-23
Also published as: JP3102017B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、音声信号を低いビ・ントレート、特に８〜４
．８ｋｂ／ｓ程度で高品質に符号化するための音声符号
化方式に関する。

（従来の技術）音声信号を８〜４．８ｋｂ／ｓ程度の低いビットレート
で符号化する方式としては、例えば、Ｍ、５ｃｈｒｏｅ
ｄｅｒ　ａｎｄ　Ｂ、Ａｔａ１氏による”Ｃｏｄｅ−ｅ
ｘｃｉｔｅｄ　１ｉｎｅａｒｐｒｅｄｉｃｔ：ｏｎ：　
　ｌＩｉｇｈ　　ｑｕａｌｉｔｙ　　５ｐｅｅｃｈ　　
ａｔ　　ｖｅｒｙ　　ｌｏｗｂｉｔ　ｒａｔｅｓ″（Ｐ
ｒｏｃ、　ＴＣＡＳＳＰ、　ｐｐ、９３７−９４０．１
９８５年）と題した論文（文献１）等に記載されている
ＣＥＬＰ（Ｃｏｄｅ　Ｅｘｃｉｔｅｄ　ＬＰＣＣｏｄｉ
ｎｇ）が知られている。この方法では、送信側では、フ
レーム毎（例えば２゜ｍｓ）に音声信号から音声信号の
スペクトル特性を表すスペクトルパラメータを抽出し、
フレームをさらに小区間サブフレーム（例えば５　ｍｓ
）に分割し、サブフレーム毎に過去の音源信号をもとに
長時間相関（ピッチ相関）を表す適応コードブックのピ
ッチパラメータを抽出し、ピッチパラメータによりサブ
フレームの音声信号を長期予測し、長期予測して求めた
残差信号に対して、予め定められた種類の雑音信号から
なるコードブックから選択した信号により合成した信号
と、音声信号との誤差電力を最小化するように一種類の
雑音信号を選択するとともに、最適なゲインを計算する
。そして選択された雑音信号の種類を表すインデクスと
ゲイン、ならびに、前記スペクトルパラメータとピッチ
パラメータを伝送する。

〔発明が解決しようとする課題］上述した文献Ｉの従来方式では、高音質を得るためには
、一般に、雑音信号から構成されるコードブックのビッ
トサイズを１０ビット以上にきわめて大きくする必要が
あるため、コードブックを探索して最適な雑音信号（コ
ードワード）を求めるために膨大な演算量が必要である
という問題点があった。さらに、コードブックが基本的
に雑音信号から構成されるために、コードブックから選
択された音源信号により再生された再生音声の音質は雑
音域がともなうという問題点があった。さらにビットレ
ートを低減するためにコードブックのサイズを低減させ
ると音質は急速に劣化するという問題点があった。

本発明の目的は、上述した問題点を解決し、比較的少な
い演算量およびメモリ量により、８〜４．８ｋｂ／ｓ程
度で音質の良好な音声符号化方式を提供することにある
。

［課題を解決するための手段］第１の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号のスペク
トル包絡を表すスペクトルパラメータを求めて出力し、
前記フレームを予め定められた時間長の小区間に分割し
、過去の音源信号をもとに再生した信号が前記音声信号
に近くなるようにピッチパラメータを求め、前記音声信
号の音源信号を第１のコードブックから選択した信号と
第２のコードブックから選択した信号との線形結合によ
り表す音声符号化方式において、前記第２のコ−ドブツ
クから選択した信号をもとに前記第１のコードブックを
修正することを特徴とする。

第２の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号のスペク
トル包絡を表すスペクトルパラメータを求めて出力し、
前記フレームを予め定められた時間長の小区間に分割し
、過去の音源信号をもとに再生した信号が前記音声信号
に近くなるようにピッチパラメータを求め、前記音声信
号の音源信号を第１のコードブックから選択した信号と
第２のコードブックから選択した信号との線形結合によ
り表す音声符号化方式において、前記第１のコードブッ
クから選択した信号をもとに前記第２のコードブックを
修正することを特徴とする。

第３の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号のスペク
トル包絡を表すスペクトルパラメ−夕を求めて出力し、
前記フレームを予め定められた時間長の小区間に分割し
、前記小区間毎にピッチパラメータを求めてピッチ予測
音源信号を求め、前記ピッチ予測音源信号とコードブッ
クから選択した信号とにより前記音声信号の音源信号を
表す音声符号化方式において、前記ピッチ予測音源信号をもとに前記コードブックを修
正するか、あるいは、前記コードブックから選択した信
号により前記予測音源信号を修正することを特徴とする
。

〔作用］本発明による音声符号化方式の作用を示す。

第１の発明では、フレームを分割したサブフレーム毎に
、下式を最小化するように音源信号を求める。

Ｅ＝Σ　［（ｘ　　（ｎ）−βｖ　　（ｎ−Ｍ）　　＊
ｈ　　（ｎ）−ｄ　（ｎ）＊ｈ　　（ｎ）ｌ　　＊ｗ　
（ｎ）］・　・　・　（１）ここでβ１Ｍは長期相関にもとづくピッチ予測（適応コ
ードブック）のピッチパラメータ、すなわちゲインおよ
び遅延であり、ｖ　（ｎ）は過去の音源信号である。　
ｈ　（ｎ）はスペクトルパラメータにより構成される合
成フィルタのインパルス応答、ｗ　（ｎ）は聴感重み付
はフィルタのインパルス応答を示す。記号＊は畳み込み
演算を示す。なお、ｗ　（ｎ）の詳細については前記文
献１を参照できる。

また、ｄ　（ｎ）はコードブックにより表される音源信
号を示し、下式のように、第１のコードブックから選択
されたコードベクトルｃ、（ｎ）と第２のコードブック
から選択されたコードベクトルｃ−（ｎ）との線形結合
で表される。

ｄ　（ｎ）＝ΣＴｔＣｔ　（ｎ）　＝Ｔ＋Ｃ＋ｉ　（ｎ）　＋ｒｚ
ｃｚ；　（ｎ）・　・　・　（２）ここで、Ｔｔ＋７’ｚは、選択されたコードワードＣ１
（ｎ）、Ｃ２、（ｎ）のゲインを示す。従って、本発明
では、２種類のコードブックを分解して音源信号が表さ
れることになるため、各コードブックはコードブック全
体のビット数の１／２でよい。

例えばコードブック全体のビット数を１０ビツトとする
と、第１２のコードブックは例えば、５ピントずつでよ
く、コードブック探索の演算量を大幅に低減できる。

各コードブックとして前記文献ｌのような雑音コードブ
ックを用いる場合、（２）式のように分割すると、特性
的には１０ビット分のコードブックよりも劣化し全体で
７〜８ビット分の性能しか出せない。

そこで、高性能を得るために、第１のコードブックはト
レーニングデータを用いて予め学習させることにより構
成する。学習によるコードブックの構成法としては、例
えば、Ｌ　ｉ　ｎｄｅ　らによる“ＡｎＡｌｇｏｒｉｔ
ｈｍ　ｆｏｒ　Ｖｅｃｔｏｒ　Ｑｕａｎｔｉｚａｔｉｏ
ｎ　Ｄｅ−ｓｉｇｎ”と題した論文（ＩＥＥＥ　Ｔｒａ
ｎｓ、　Ｃ０Ｍ−２８，Ｉ）９．８４−９５１９８０年
）（文献２）等が知られている。

学習のときの距離尺度としては、通常、２乗距離（ユー
クリッド距離）が用いられるが、本発明では２乗距離よ
りも性能の良好な次式による聴感重み付は距離尺度を用
いる。

＝Σ　［（ｔ、（ｎ）　−Ｃ１（ｎ）＊　ｈ　　（ｎ）
）＊Ｗ　　（ｎ）　　）　　”　　　　　　　　　　　
　　（３）ここでｔＪ（ｎ）はｊ番目のトレーニングデ
ータ、ｃ、（ｎ）はクラスタ１のコードワードである。

クラスタｌのセントロイド（代表コードワード）は、ク
ラスタｌ内のトレーニングデータを用いて（４）式ある
いは（５）式を最小化するように求める。

一Σ　Σ　［（ｔｉｔ　（ｎ）　−３ｃＬ　（ｎ）　＊
　ｈ　　（ｎ）　１＊ｗ　　（ｎ）　　）　２（４）＝Σ　Σ　［（ｔｊＬ（ｎ）　　　ｇ−ｓｅｔ（ｎ）＊
ｈ＊ｗ　　（ｎ）　　）　”　　　　　　　　　　　（
５）（５）式において、ｇは最適ゲインを示す。

次に、第２のコードブックは、第１のコードブックによ
るトレーニングデータ依存性を救済するために、第１の
コードブックの寄与分を音源信号から減算した残りの信
号に対して、前記文献２の方法により学習により求めた
コードブックや、前（ｎ）記文献１のガウス性雑音信号のような予め統計的特性が
確定した雑音信号あるいは乱数信号からなるコードブッ
クや、他の特性を有するコードブックを使用する。なお
、雑音コードブックに対して、ある距離尺度のもとて学
習を行うことにより、さらに特性が改善される。詳細は
、Ｔ０Ｍｏｒｉｙａ氏らによる”Ｔｒａｎｓｆｏｒｍ　
Ｃｏｄｉｎｇ　ｏｆ　５ｐｅｅｃｈ　ｕｓｉｎｇ　ａ　
Ｗｅｉｇｈｔｅｄ　Ｖｅｃｔｏｒ　Ｑｕａｎｔｉｚｅｒ
、”と題した論文（ＩＥＥＥＪ、Ｓｅ１．＾ｒｅａｓ　
Ｃｏｍｍｕｎ、、　ｐｐ、４２５−４３Ｌ　１９Ｂ８年
）（文献３）等を参照することができる。

第１の発明では、第２のコードブックにより選択された
コードベクトルを用いて、第１のコードベクトルを修正
することに特徴がある。これは、第１のコードブックを
、入力信号の短時間特性に適応させ、少ないコードブッ
クサイズでより良好な特性を得るために行う。第１のコ
ードブックの修正は下式にしたがう。

Ｃ’ｌｊ　（ｎ） ”：（＋ｊ（ｎ）　＋ｓｉｇｎ　（ｒ＋）　　・ｓｉｇ
ｎ　（ｒｚ）　　・Ｂ°ｃｚ＋（ｎ）　　　　　　　　
　　　　　　　（６）ここでＢは収束を決める正の微小
量である。また、ｓｉｇｎ（Ｔ）はＴの符号を表す。（
６）式にしたがい、送信側、受信側共に第１のコードブ
ックを修正する。

また、伝送路誤りに強くすると共に誤った修正の影響を
防くために、（６）弐の代りに下式を用いることもでき
る。

ｃｌ　、　Ｊ（ｎ　） −（１−δ）−ｃ、、（ｎ）＋Ａ・δ’ｃｚ；（ｎ）・
・・　（７）ここでδは、誤った修正を防くと共に、伝送路誤りの影
響を低減させるための正の微小量（例えば１０４〜１０
−’）　、Ａは下式で決まる収束係数である。

Ａ−７２／　ｒ　＋　　　　　　　　　　　　　　　　
（８）ここで、入力ベクトルと１段目で選択したベクト
ルとの誤差が小さくなれば、１段目と２段目のゲインの
比Ｔｚ／Ｔ＋　は小さくなるので、修正が進みにくくな
る。

さらに、簡略化した（９）式や（１０）式を用いること
もできる。

Ｃ’、ｊ　（ｎ）＝（１−δ）・Ｃ１Ｊ（ｎ）十Ａ・δ　　　　　（９）
Ｃ’ｌｊ　（ｎ） −（１−δ）・ｃ＋Ｊ（ｎ）＋ｓｉｇｎ　（ｒ＋）　　・ｓｉｇｎ　（ｒｚ）　　・
δ　　　　（１０）次に、第２の発明では、第２のコー
ドブックを第１のコートフックから選択されたコードベ
クトルを用いて修正する。修正には（１１）式あるいは
、（１２）式を用いる。

Ｃ’ｚｉ（ｎ）＝ｓｉｇロ　（Ｔ＋）　　　・　ｓｉｇｎ　　（ｒｚ）
　　　・　Ｂ　　−Ｃ＋ｊ　　（ｎ）＋　Ｃｚｒ　（ｎ
　）　　　　　　　　　　　　　　　（１１）Ｃ’ｚｉ
（ｎ）＝Ａ・δ−Ｃ１ｊ　（ｎ）＋　（ｌ−δ）　　−Ｃｈｉ
　（ｒｌ）・・・（１２）また、簡略化した（１３）、　　（１４）式を用いるこ
ともできる。

Ｃ’ｚ（（ｎ）　−”δ＋（１−δ）　　・Ｃｈｉ　（
ｎ）・　・　・（１３）＋２゜（ｎ）＝ｓｉｇｎ　（ｒ＋）　　°ｓｉｇｎ　（Ｔ２）　　０
　δ＋　（１−δ）　　・Ｃｚｔ　（ｎ）　　　　　　
　　　　　（１４）さらに第３の発明では、音声信号の
音源信号を、前記文献１のように適応コードブックとコ
ートフックとで表す。適応コードブックにより過去の音
源信号をもとに求めたピッチ予測音源信号を用いて、コ
ードブックで選択されたコードベクトルを修正する。修
正は（１５）式あるいは（１６）式に従う。

Ｃ′、（ｎ）＝ｓｉｇｎ　（β）　　・ｓｉｇｎ　（７＋）　Ｂ−ｖ
　（ｎ　−Ｍ）±Ｃｊ　’（ｎ　）　　　　　　　　　
　　　　　　（１５）Ｃ′、（ｎ） −Ａ・δ−ｖ　（ｎ−Ｍ）　＋　（１−δ）−Ｃｊ（ｎ
）・・・（１６）ここでｖ（ｎ−Ｍ）は、適応コードブックで求めたピッ
チ予測音源信号である。また、ｃ＝（ｎ）はコードブッ
クから選択されたｊ番目のコードベクトルである。

また、簡略化した（１７）、　　（１８）式を用いるこ
ともできる。

Ｃ′、（ｎ）＝Ａ・δ＋（１−δ）　・ｃＪ（ｎ）　　　　　　（１
７）Ｃ’Ｊ（ｎ） −ｓｉｇｎ　（β）　　・ｓｉｇｎ（ｒ＋）　　Ｈδ＋
（１−δ）・Ｃ５（ｎ　）　　　　　　　　　　（１８
）また、コードブックから選択されたコードベクトルＣ
４（ｎ）を用いてピンチ予測音源信号を修正することも
できる。

［実施例］第１図は第１の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図である。

送信側では、入力端子１１０から音声信号を入力し、１
フレ一ム分（例えば２０ｍ５　）の音声信号をバッファ
メモリ１２０に格納する。

ＬＰＧ計算回路１３０は、フレームの音声信号のスペク
トル特性を表すパラメータとして、ＬＳＰパラメータを
フレームの音声信号から周知のＬＰＧ分析を行い、予め
定められた次数したけ計算する。この具体的な計算法に
ついては前記文献１を参照することかできる。

次にＬＳＰ量子化回路１４０は、ＬＳＰパラメータを予
め定められた量子化ビット数で量子化し、得た符号ｌｋ
をマルチプレクサ２６０へ出力するとともに、これを復
号化してさらに線形予測係数ａ；’（ｉ＝１〜Ｌ）に変
換して、重み付は回路２００．インパルス応答計算回路
１７０１合成フィルタ２８１へ出力する。ＬＳＰパラメ
ータの符号化、　ＬＳＰパラメータから線形予測係数へ
の変換の方法については、Ｓｕｇａｍｕｒａ氏らによる
Ｑｕａｎｔｉｚｅｒ　ｄｅｓｉｇｎ　ｉｎ　ＬＳＰ　５
ｐｅｅｃｈａｎａｌｙｓｉｓ−ｓｙｎｔｈｅｓｉｓ”と
題した論文（ＩＥＥＥ　Ｊ、Ｓｅｌ。

Ａｒｅａｓ　Ｃｏｍｍｕｎ、、　ｐｐ、４３２−４４０
．１９８８）　　（文献４）等を参照することができる
。

サブフレーム分割回路１５０は、フレームの音声信号を
サブフレームに分割する。ここで例えばフレーム長は２
０ｍ５、サブフレーム長は５ｍｓとする。

重み付は回路２００は、減算した信号に対して周知の聴
感重み付けを行う。聴感重み付は関数の詳細は、前記文
献ｌを参照できる。

減算器１９０は、サブフレームに分割された人力信号か
ら合成フィルタ２８１の出力を減算して出力する。

適応コードブック２１０は、合成フィルタ２８１　の人
力信号ｖ　（ｎ）を遅延回路２０６を介して入力し、さ
らにインパルス応答出力回路１７０から重み付はインパ
ルス応答ｈｗ　（ｎ）　、重み付は回路２００から重み
付は信号を入力し、長期相関にもとづくピンチ予測を行
い、ピッチパラメータとして遅延Ｍとゲインβを計算す
る。以下の説明では適応コードブックの予測次数は１と
するが、２次以上の高次とすることもできる。１次の適
応コードブックにおける遅延Ｍ、ゲインβの計算法は、
Ｋｌｅｉｊｉｎ″Ｉｍｐｒｏｖｅｄ　５ｐｅｅｃｈ　ｑ
ｕａｌｉｔｙ　ａｎｄ　ｅｆｆｉｃｉｅｎｔ　ｖｅｃｔ
ｏｒ　ｑｕａｎｔｉｚａｔｉｏｎ　ｉｎ　５ＥＬＰ”と
題した論文（Ｐｒｏｃ。

ＩＣＡＳＳＰ、　ｐｐ、１５５−１５８．１９８８年）
（文献５）等に記載されている。さらに求めたゲインβ
をゲイン量子化器により予め定められた量子化ビット数
で量子化復号化し、ゲインβ′を求め、これを用いて次
式により予測信号９ｗ（ｎ）を計算し減算器２０５に出
力する。また遅延Ｍをマルチプレクサ２６０へ出力する
。

ｘｗ（ｎ）−β’　−ｖ　（ｎ−Ｍ）　＊　ｈ、　（ｎ
）　　（１９）上式でｖ（ｎ−Ｍ）は過去の音源信号で
、合成フィルタ２８１の入力信号である。ｈ、（ｎ）は
インパルス応答計算回路１７０で求めた重み付はインパ
ルス応答である。

遅延回路２０６は、合成フィルタ入力信号ｖ　（ｎ）を
１サブフレ一ム分遅延させて適応コードブック２１０へ
出力する。

減算器２０５は、次式により重み付は回路２００の出力
信号から適応コードブック２１０の出力を減算し、残差
信号ｅ、（ｎ）を第１のコードブック探索回路２３０に
出力する。

ｅｌ、１（ｎ）＝ｘ、１（ｎ）−ｘ、（ｎ）　　　　　
　（２０）インパルス応答計算回路１７０は、聴感重み
付けした合成フィルタのインパルス応答ｈｌ、（ｎ）を
、予め定められたサンプル数りだけ計算する。具体的な
計算法は、前記文献１等を参照できる。

第１のコードブック探索回路２３０は、第１のコードブ
ック２３５を用いて最適なコードワードＣ１ｊ（ｎ）を
探索する。ここで作用の項に記したように、第１のコー
ドブックは、予めトレーニング信号を用いて学習してお
く。最適なコードベクトルＣ＋＝（ｎ）の探索法は、特
願平２−４２９５６号明細書（文献６）等を参照できる
。そして最適なゲインγ１を求め、これとＣ１ｊ（ｎ）
を用いて前記文献６の方法により重み付は再生信号ｙｗ
（ｎ）を求め出力する。

減算器２５５は、ｅｗ（ｎ）からｙ、（ｎ）を減算して
第２のコードブック探索回路２７０へ出力する。

第２のコードブック探索回路２７０は、第２のコードブ
ック２７５から最適なコードワードを計算する。第２の
コードブック探索回路の構成は、第１のコードブック探
索回路の構成と基本的に同一の構成を用いることができ
る。また、コードワードの探索法としては、第１のコー
ドブック２３５の探索と同一の方法を用いることができ
る。第２のコードブックの構成法としては、作用の項で
述べたように、学習コードブックの高効率を保ちながら
トレーニングデータ依存性を救済するために、乱数系列
からなるコードブックを用いる。乱数系列からなるコー
ドブックの構成法は前記文献１を参照できる。

また、コードブック探索の演算量の低減化のために、第
２のコードブック２７５として、重畳型（０νｅｒｌａ
ｐ）乱数コードブックを用いることができる。重畳型乱
数コードブックの構成法、コードワード探索法について
は前記文献５等を参照できる。

また、第１のコードブックと同様に予め学習して構成す
ることもできる。

ゲイン量子化器２８６は、作用に述べた方法により、予
め学習により（１２）、　（１３）式を用いて作成した
ゲインコードブンク２８７を用いて、ゲインγ、。

γ２をベクトル量子化する。詳細な前記文献６等を参照
できる。

修正回路２８０は、作用の項で述べた（６）〜（１０）
式を用いて、第１のコードブック探索回路２３０におい
て選択されたコードベクトルＣ１ｊ（ｎ）の修正を行う
。

加算器２９０は、適応コードブック２１０の予測音源信
号と、第１のコードブック探索回路２３０の出力音源信
号と、第２のコードブック探索回路２７０の出力音源信
号とを加算して合成フィルタ２８１へ出力する。

合成フィルタ２８１は、加算器２９０の出力ｖ　（ｎ）
を入力し、下式により合成音声を１フレーム分求め、さ
らにもう１フレ一ム分は０の系列をフィルタに入力して
応答信号系列を求め、１フレ一ム分の応答信号系列を減
算器１９０に出力する。

（０＜η＜　１　）　　　（２１）ただしマルチプレクサ２６０は、ＬＳＰ量子化回路１４０．適
応コードジンク２１０．第１のコードブック探索回路２
３０．第２のコードブック探索回路２７０．ゲイン量子
化器２８６の出力符号系列を組みあわせて出力する。

以上で第１の発明の詳細な説明を終える。

第２図は、第２の発明による音声符号化方式を実施する
音声符号化装置を示すブロック図である。

図において、第１図と同一の番号を付した構成要素は、
第１図の構成要素と同一の動作を行うので説明を省略す
る。

修正回路３８０は、第１のコードブック探索回路２３０
において選択されたコードベクトルＣ１ｊ（ｎ）を用い
て、作用の項で述べた（１１）〜（１４）式にもとづき
、第２のコードブック探索回路２７０において選択され
たコードベクトルＣｚ；（ｎ）の修正を行つ。

以上で第２の発明の説明を終える。

第３図は、第３の発明による音声符号化方式を実施する
音声符号化装置を示すブロック図である。

音源コードブック探索回路４３０は、第１のコードブッ
ク探索回路２３０と同一の動作を行い、最適な音源信号
を音源コードブック４３５から選択する。

修正回路４８０は、適応コードブック２１０で求められ
たピンチ予測音源信号ｖ（ｎ−Ｍ）を用いて、（１５）
〜（１８）式を用いて、音源コードブック探索回路４３
０により選択された音源信号Ｃ４、（ｎ）の修正を行う
。

以上により第３の発明の詳細な説明を終える。

修正回路における修正方法においては、実施例で述べた
方法以外に、下記の方法を用いることもできる。例えば
、第１の発明を例にとると、Ｃ’ｌｊ　（ｎ） −（１−δ）　　・Ｃ＋ｊ　（ｎ）　＋ｓｉｇｎ・ｌ　
Ｔ２／　’ｒ・δ・Ｃｚ＋　（ｎ）　　　　　　　　　
　　　　（２３）ここでｓｉｇｎは正あるいは負の符号
を示す。符号は次式を最小化する方を選択する。

Ｅ−Σ　［ｅｔ、＋　（ｎ）”−ＴＩＣ’ｌａ　（ｎ）
＊　ｈ、、（ｎ）］　２　　　　　　　　　　（２４）
ここでｅ、１（ｎ）は減算器２０５の出力信号である。

上式を最小化するには、上式をＴ１で偏微分してＯとお
いた下式を最小化すればよい。

−ｒ、Ｘ　ｅｗ　（ｎ）ｆｃ’＋；　（ｎ）＊ｈｗ（ｎ
）ｌ　ｋ　”／Σ　（Ｃ’＋ｉ　（ｎ）　　＊ｈｗ　（
ｎ））　　２　　　（２，１））従って、（２３）弐の
符号を正と負乙こした両者について（２５）式を計算し
、（２５）式がより大きな値をとる方の符号を１ピント
で伝送する。

第２および第３の発明においても上述と同様な構成をと
ることができる。

また、上述の実施例では、適応コートフ７・りのゲイン
、第１．第２のコードブックのゲイン、あるいは、適応
コードブックのゲインと音源コードブックのゲインには
同時最適化を施さなかったが、適応コードブック第１の
コードブック第２のコードブックのゲインについて、同
時最適化を行い、さらに特性を改善する。この同時最適
化は、第１．２のコードブックのコードベクトルを求め
るときになお、演算量の低減化のために、第１のコード
ブックのコードベクトル探索のときにのみゲイン最適化
を行い、第２のコードブックの探索のときには行わない
構成とすることもできる。

また、さらに演算量を低減するためには、コードブック
のコードへり！・ルの探索のときにはゲインの最適化を
行わずに、適応コードブックと第１のコードブックのゲ
インの同時最適化を行い、さらに、適応コードブックと
第１．２のコードブックのゲインを同時に最適化する構
成を用いることもできる。詳細は前記文献５等を参照で
きる。

また、さらに演算量を低減化するためには、第１．２の
コードブックのコードベクトルが選択された後に、適応
コードブックのゲインβと、第１２のコードブックのゲ
インＴ＋＋Ｔｚの３種を同時に最適化するような構成と
することもできる。詳細は前記文献６等を参照できる。

また、第１のコードブックの探索法は実施例の方法以外
にも他の周知な方法を用いることができる。例えば、前
記文献１に記載の方法や、予めコードブックの各コード
ワードＣ＋；（ｎ）の直交変換ＣＩ（ｋ）と求めて格納
しておき、サブフレーム毎に、重み付はインパルス応答
り。（ｎ）の直交変換Ｈ，（ｋ）と、残差信号ｅ、（ｎ
）の直交変換Ｅ１．１（ｋ）を予め定められた点数だけ
求め、周波数軸上で探索することもできる。詳細は前記
文献５等を参照できる。

また、第２のコードブックの探索法としては、前記実施
例の方法以外にも上記で示した方法や、前記文献６に記
載の方法や、他の周知な良好な方法を用いることができ
る。

また、第２のコードブックの構成法としては、前記実施
例に記載した方法以外に、例えば予め膨大な乱数系列を
コードブックとして用意して、それらを用いてトレーニ
ングデータに対して乱数系列の探索を行い、選択される
頻度が高いものからコードワードとして登録して第２の
コードブックを構成することもできる。なお、この構成
法は、第１のコードブックの構成にも適用することがで
きる。

また、上記実施例では、適応コードブックのゲインと第
１．第２のコードブックのゲインは別々ニヘクトル量子
化したが、３種のゲインβ、ＴＴ２あるいはβ、Ｔ１を
まとめてベクトル量子化するような構成をとることもで
きる。詳細は前記文献５や、１．Ｇｅｒｓｏｎ氏らによ
る”Ｖｅｃｔｏｒ　ｓｕｍ　ｅｘｃｉｔｅｄ　１ｉｎｅ
ａｒ　ｐｒｅｄｉｃｔｉｏｎ”　（ＶＳＥＬＰ）　５ｐ
ｅｅｃｈ　ｃｏｄｉｎｇａｔ　８ｋｂｐ／ｓ　”　と題
した１命文（Ｐｒｏｃ、　ＩＣＡＳＳＰ、　ｐｐ。

４６１−４６４．１９９０）　　（文献７）等を参照で
きる。

また、前記実施例では、適応コードブ・ンクの次数は１
次としたが、２次以上の高次とすることもできる。また
、次数は１次のままで遅延を整数値ではなく小数値とす
ることもできる。これらについての詳細は、例えばＰ、
Ｋｒｏｏｎ氏らによる’　Ｐ　ｉ　ｔｃｈｐｒｅｄｉｃ
ｔｏｒｓ　ｗｉｔｈ　ｈｉｇｈ　ｔｅｍｐｏｒａｌ　ｒ
ｅｓｏｌｕｔｉｏｎ”と題した論文（Ｐｒｏｃ、　ＩＣ
ＡＳＳＰ、　ｐｐ、６６１−６６４．１９９０）（文献
８）等を参照できる。以上のようにした方が特性は向上
するが、ゲインあるいは遅延の伝送に必要な情報量が若
干増大する。

また、前記の実施例では、スペクトルパラメータとして
にパラメータ、　ＬＳＰパラメータを符号化し、その分
析法としてＬＰＧ分析を用いたが、スペクトルパラメー
タとしては他の周知なパラメータ、例えばＬＰＣケプス
トラム、ケプストラム、改良ケプヌトラム、一般化ケプ
スドラム、メルケブストラムなどを用いることもできる
。また各パラメータに最適な分析法を用いることができ
る。

また、フレームで求めたＬＰＣ係数をＬＳＰ上や線形予
測係数上でサブフレーム毎に補関し、補間した係数を用
いて適応コードブック、第１．第２のコードブックの探
索を行う構成としてもよい。このような構成とすること
により、音質がさらに改善される。

また、ＬＳＰ係数は周知の方法により、ベクトル量子化
あるいはへクトルースカラ量子化することにより、さら
に効率的に符号化することができる。

ヘクトルースカラ量子化の方法については例えば前記文
献３等を参照できる。

また、受信側では、量子化雑音を整形することにより聴
覚的に聞き易くするために、ピッチとスペクトル包絡の
少なくとも１つについて動作する適応形ポストフィルタ
を付加してもよい。適応型ポストフィルタの構成につい
ては、例えば、Ｋｒｏｏｎ氏らによる”Ａ　Ｃ１ａｓｓ
　ｏｆ　Ａｎａｌｙｓｉｓ−ｂｙ−ｓｙｎｔｈｅｓｉｓ
Ｐｒｅｄｉｃｔｉｖｅ　　Ｃｏｄｅｒｓ　　ｆｏｒ　　
）ｆｉｇｈ　　［１ｕａｌｉｔｙ　　５ｐｅｅｃｈＣｏ
ｄｉｎ（Ｈａｔ　Ｒａｔｅｓ　　ｂｅｔｉｙｅｅｎ　４
．８　ａｎｄ　　１６ｋｂ／ｓ、”　　（ＪＥＥＥＪＳ
ＡＣ，ｖｏｌ、６．２．３５３−３６３．１９８８）　
（文献９）等を参照できる。

〔発明の効果〕

以上述べたように、本発明によれば、第１あるいは第２
のコードブックにより選択されたコードベクトルを、第
２あるいは第１のコードブックにより選択されたコード
ベクトルをもとに修正するか、あるいは、適応コードブ
ックにより選択されたピッチ予測音源信号をもとに音源
コードブ・ンクにより選択されたコードベクトルを修正
するか、あるいは、前記コードベクトルによりピッチ予
測音源信号を修正しているので、コードブックの特性を
人力信号の特性に適応化させることが可能となり、低ビ
ツトレートにおいてコードブックサイズを低減しても従
来方式よりも良好な特性が得られるという大きな効果が
ある。

【図面の簡単な説明】

第１図は第１の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図、第２図は第２の発明に
よる音声符号化方式を実施する音声符号化装置を示すブ
ロック図、第３図は第３の発明による音声符号化方式を
実施する音声符号化装置を示すブロック図である。１１０　　・・・・・バッファメモリ１３０　　・・・・・ＬＰＣ計算回路１４０　　・・・・・量子化回路１５０　　・・・・・サブフレーム分割回路１７０　　
・・・・・インパルス応答計算回路１９０、２０５．２
５５　　・・・減算器２００　　・・・・・重み付は回
路２０６　　・・・・・遅延回路２１０　　・・・・・適応コードブック２３０　　・・
・・・第１のコードブック探索回路２３５　　・・・・
・第１のコードブック２８１　　・・・・・合成フィル
タ２７０　　・・・・・第２のコードブック探索回路２７
５　　・・・・・第２のコードブンク３８０、４８０　
　・・・修正回路・・・・・ゲイン量子化器・　・・　・　・ゲインコードブック・・・・・音源コードブック探索回路・・・・・音源コードブック

Claims

【特許請求の範囲】

（１）入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号のスペクトル包絡
を表すスペクトルパラメータを求めて出力し、前記フレ
ームを予め定められた時間長の小区間に分割し、過去の
音源信号をもとに再生した信号が前記音声信号に近くな
るようにピッチパラメータを求め、前記音声信号の音源
信号を第１のコードブックから選択した信号と第２のコ
ードブックから選択した信号との線形結合により表す音
声符号化方式において、前記第２のコードブックから選択した信号をもとに前記
第１のコードブックを修正することを特徴とする音声符
号化方式。
（２）入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号のスペクトル包絡
を表すスペクトルパラメータを求めて出力し、前記フレ
ームを予め定められた時間長の小区間に分割し、過去の
音源信号をもとに再生した信号が前記音声信号に近くな
るようにピッチパラメータを求め、前記音声信号の音源
信号を第１のコードブックから選択した信号と第２のコ
ードブックから選択した信号との線形結合により表す音
声符号化方式において、前記第１のコードブックから選択した信号をもとに前記
第２のコードブックを修正することを特徴とする音声符
号化方式。
（３）入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号のスペクトル包絡
を表すスペクトルパラメータを求めて出力し、前記フレ
ームを予め定められた時間長の小区間に分割し、前記小
区間毎にピッチパラメータを求めてピッチ予測音源信号
を求め、前記ピッチ予測音源信号とコードブックから選
択した信号とにより前記音声信号の音源信号を表す音声
符号化方式において、前記ピッチ予測音源信号をもとに前記コードブックを修
正するか、あるいは、前記コードブックから選択した信
号により前記予測音源信号を修正することを特徴とする
音声符号化方式。