JPH02250100A

JPH02250100A - 音声符合化装置

Info

Publication number: JPH02250100A
Application number: JP1070399A
Authority: JP
Inventors: Koichi Shiraki; 宏一白木; Kunio Nakajima; 中島　邦男
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1989-03-24
Filing date: 1989-03-24
Publication date: 1990-10-05
Also published as: US5119423A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】【産業上の利用分野】

この発明は、音声信号を情報圧縮し、ディジタル伝送、
または蓄積を行う音声符号化装置に関するものである。

【従来の技術】

音声信号を合成フィルタを表すパラメータと音源を表す
パラメータとに分離することで情報圧縮を行う音声符号
化方式の中に、コード−エキサイテツド　リニア　プレ
ディクション（Ｃｏｄｅ−Ｅｘｃｉ　ｔｅｄｌｊｎｅａ
ｒ　Ｐｒｅｄｉｃｔｉｏｎ、以下ＣＥＬＰという）があ
る。このＣＥＬＰの一例としては、エム、アール。シュローダ、ビー、ニス、アタル、″コードーエキサイ
テツド　リニア　プレディクション（シーイーエルピー
）：ハイクラオリティー　スピーチアット　ベリー　ロ
ー　ビット　レイク”、プロシーデインゲス　アイイー
イーイー　インターナショナル　コンファレンス　オン
　アクスティックス、スピーチ、アンド　シグナル　プ
ロセッシング（Ｍ、Ｒ，５ｃｈｒｏｅｄｅｒ、　Ｂ、Ｓ
、Ａｔａｌ、　　”Ｃｏｄｅ−ＥｘｃｉｔｅｄＬｉｎｅ
ａｒ　　Ｐｒｅｄｉｃｔｉｏｎ（ＣＥ　　Ｌ　　Ｐ）：
旧ｇｈ−ｑｕａ１＋ｔｙｓｐｅｅｃｈ　ａｔ　ｖｅｒｙ
　１０％１　ｂｉｔ　ｒａｔｅｓ”、Ｐｒｏｃｅｅｄｉ
ｎｇｓＩＥＥＩｌ！　Ｉｎｔｅｒｎａｔｉｏｎａｌ　　
Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　　Ａｃｏｕｓｔｉｃｓ。５ｐｅｅｃｈ、ａｎｄ　Ｓｉｇｎａｌ　　Ｐｒｏｃｅｓ
ｓｉｎｇ）、ｐｐ、９３７−９４０（１９８５）があり
、合成フィルタを表すパラメータを１０ｍ５ｅｃ毎に分
析により求め、一方４０点（サンプリング周波数が１３
ｋＨｚのときは５ｍ）毎に区切られた音声に時間対応し
た音源を表すパラメータとして、乱数により生成した４
０点の雑音の時系列。すなわち４０次元のベクトル（以下、音源ベクトルとい
う）を用いている。上記引例で行っている音声符号化を、周波数領域で行う
装置として、アイ、エム、トランコッソ。ビー、ニス、アタル、“エフィシェント′　ブロシージ
ャーズ　フォー　ファインディング　ジオブティマム　
イノベイジョン　イン　ストカスティック　コーダーズ
”、ブロシーデインダスアイイーイーイー　インターナ
ショナル　コンファレンス　オン　アクスティックス、
スピーチ。アンド　シグナル　プロセッシング（１，Ｍ、Ｔｒａｎ
ｃｏｓｏ＋Ｂ、Ｓ、Ａｔａｌ、　　”Ｅｆｆｉｃｉｅｎ
ｔ　ｐｒｏｃｅｄｕｒｅｓ　ｆｏｒ　ｆｉｎｄｉｎｇｔ
ｈｅ　ｏｐｔｉａ＋ｕｍ　１ｎｎｏｖａｔｉｏｎ　ｉｎ
　５ｔｏｃｈａｓｔｉｃ　ｃｏｄｅｒｓ＋Ｐｒｏｃｅｅ
ｄｉｎｇｓ　　ＩＥＥＥ　Ｉｎｔｅｒｎａｔｉｏｎａｌ
　　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎＡｃｏｕｓｔｉｃｓ、
５ｐｅｅｃｈ　ａｎｄ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓ
ｉｎｇ）＋Ｉ）Ｉ）、２３７５−２３７８（１９８６）
に示された音声符号化装置がある（第３図）。図において、３は３点のサンプリング値系列である音源
ベクトルを２・Ｎ点離散フーリエ変換（以下ＤＦＴとい
う）して得られるＮ次元のＤＦＴ音源ベクトル、１はＬ
個のＤＦＴ音源ベクトルから構成される符号帳、５は前
記符号帳１に格納されるＤＦＴ音源ベクトル３を選択す
る切換スイッチ、１５は前記ＤＦ’Ｔ音源ベクトル３及
び合成フィルタのインパルス応答を２・Ｎ点ＤＦＴして
得られる周波数特性（以下、評価重みフィルタという）
の振幅項の２乗値１６　（以下、２乗評価重みという）
から歪計算の分母項１７を出力する分母項計算回路、８
は前記ＤＦＴ音源ベクトル３及び３点のサンプリング値
系列である入力音声を２・Ｎ点ＤＦＴしたものの共役複
素数と評価重みフィルタとの積（以下、重み付きＤＦＴ
入力音声７という）を入力し、歪計算の分子項ベクトル
積和１゜を出力するベクトル積和演算回路、１２は前記
分子項ベクトル積和１０及び分母項１７から周波数領域
における再生音声と入力音声の歪量１８を計算する歪量
最終計算回路、１９は前記歪量１８のうち最小値の音源
ベクトルに対応する音源ベクトルコード２０を選択する
最適音源ベクトル選択回路、Ａは歪量計算手段である。次に動作について第４図のフローチャートを用いて説明
する。符号帳１のＬ個のＤＦＴ音源ベクトル３のうちに番目を
用いた場合の歪量１８は、Ｘ　（ｉ）をＤＦＴ入力音声
のｉ番目の成分、　Ｈ（ｉ）を評価重みフィルタのｉ番
目の成分、　Ｃ（ｉ、ｋ）をに番目のＤＦＴ音源ベクト
ルのｉ番目の成分、　　ｇ　（ｋ）を歪量Ｅ　（ｋ）を
最小化する利得係数とする一般にであることが知られて
いる。まず、ベクトル積和演算回路８は、ＤＦＴ音源ベクトル
Ｃ（ｉ、ｋ）と重み付きＤＦＴ入力音声Ｙ　（ｉ）を入
力し、分子項ベクトル積和Ｐ　（ｋ）を出力する（ステ
ップ５ＴＩ）。ここで、Ｙ　（ｉ）”はＹ（ｉ）の共役
複素数を表わし、Ｙ　（ｉ）はＹ（ｉ）＝　Ｘ　（ｉ）
　　・Ｈ（ｉ）なる関係を満たしている。また、記号Ｒ
ｅ、は複素数の実数部、Ｉｎ、は複素数の虚数部を表す
ものとする。分母項計算回路１５はＤＦＴ音源ベクトルＣ（ｉｋ）と
２乗評価重みａ（ｉ）”を入力し、分母項１７Ｅａ（ｉ
）２・Ｉ　Ｃ（ｉ、ｋ）　　ｌ”　　−（３）を出力す
る（ステップ５Ｔ２）。ここで、ａ（ｉ）２、は評価重
みフィルタＨ（ｉ）の２乗値であるから、ａ　（ｉ）”
＝　ｌ　Ｈ（ｉ）　　ｌ　”の関係を満たす。次に最終歪量計算回路１２は、第２式で表される分子項
ベクトル積和Ｐ　（ｋ）と第３式で表される分母項１７
を入力して、歪量Ｅ　（ｋ）を出力する（ステップ５Ｔ
３）。ここで、第４式は第１式の歪量Ｅ　（ｋ）を最小
とする利得係数ｇ　（ｋ）を選ぶことで得られ、第４式
と等価であることは承知である。さらに、前記最終歪量計算回路１２では、Ｌ個のＤＦＴ
音源ベクトル３すべてについて歪量１８を計算すると（
ステップ５Ｔ４）　、最適音源ベクトル選択回路１９に
より、Ｌ個の歪量１８の内、最小値を与えるＤＦＴ音源
ベクトルの番号を最適音源ベクトルコード２０として選
択する（ステップ５Ｔ５）。

【発明が解決しようとする課題】

従来の音声符号化装置は以上のように構成されているの
で、Ｌ個の歪量を計算するために、ベクトル積和演算回
路の中でＬ個の分子項ベクトル積和の計算を行うが、十
分な品質（再生音声にノイズ等を含まない）で音声を符
号化するためにはＬを大きくとる（例えばＬ＝１０２４
）必要がある。Ｌを大きくとると、この歪量計算に要する演算量が莫大
となり、同時に符号帳に要するメモリ量も莫大となるた
め、装置化した場合の装置規模が非常に大きくなるとい
う課題があった。この発明は上記のような課題を解消するためになされた
もので、歪量計算に要する演算量を小さくするとともに
小規模な音声符号化装置を得ることを目的としている。

【課題を解決するための手段】

この発明に係る音声符号化装置は、符号帳から抽出した
複数の縮小符号帳と、この複数の縮小符号帳からそれぞ
れ選択された音源ベクトルを加算して１個の音源ベクト
ルを生成するベクトル加算器と、このベクトル加算器で
生成された音源ベクトルと、前記複数の縮小符号帳から
それぞれ選択された音源ベクトルから歪量を計算する歪
量計算手段を備えるようにしたものである。

【作　用】

この発明におけるベクトル加算器は、複数の縮小符号帳
からそれぞれ選択された音源ベクトルを加算して１個の
音源ベクトルを生成し、歪量計算手段は前記ベクトル加
算器により生成された音源ベクトルと複数の縮小符号帳
からそれぞれ選択された音源ベクトルから歪量を計算す
る。

【実施例】

以下、この発明の一実施例を図について説明する。第１
図は縮小符号帳を２個備えた周波数領域における音声符
号化装置の構成を示すブロック図であり、従来の周波数
領域における音声符号化装置（第３図）と同一部分には
同一符号を付して説明を省略する。図において、２ａ、２ｂはＭ個（ただしＬ−＝Ｍ”）の
ＤＦＴ音源ベクトルから構成される第１及び第２の縮小
符号帳、４ａ、４ｂは前記第１及び第２の縮小符号帳２
ａ、２ｂに格納されている第１及び第２のＤＦＴ音源ベ
クトル、５ａ、５ｂは前記第１及び第２の符号帳２ａ、
２ｂからそれぞれ第１・及び第２のＤＦＴ音源ベクトル
４ａ、４ｂを選択する第１及び第２の切換スイッチ、９
ａ、９ｂは前記第１及び第２のＤＦＴ音源ベクトル４ａ
。４ｂをそれぞれ入力し、重み付きＤＦＴ人力音声７との
分子項ベクトル積和をそれぞれ出力する第１及び第２の
ベクトル積和演算回路、１３は前記第１及び第２のＤＦ
Ｔ音源ベクトルを加算して、１個のＤＦＴ音源ベクトル
１４を生成するベクトル加算器である。次に第２図のフローチャートを用いて動作を説明する。まず、第１の縮小符号帳のに１番目及び第２の縮小符号
帳のに２番目のそれぞれの第１のＤＦＴ音源ベクトル及
び第２のＤＦＴ音源ベクトルを用いた場合、Ａ　（ｔ、
に、）をに０番目の第１のＤＦＴ音源ベクトルのｉ番目
成分、Ｂ　（ｉ、ｋｚ）をに２番目の第２のＤＦＴ音源
ベクトルのｉ番目成分とし、以下使用するパラメータは
従来技術の説明でのパラメータと同一であり、説明を省
略する。第１及び第２の切換スイッチ６ａ、６ｂにより選択され
た第１のＤＦＴ音源ベクトルＡ（ｉ、ｋｇ）と第２のＤ
ＦＴ音源ベクトルＢ（ｉ、ｋｔ）は、それぞれ第１のベ
クトル積和演算回路９ａにより第２式と同様に第１の分
子項ベクトル積和ｐ’（ｋＩ）をＭ個当力しくステップ
ＳＴ６，５Ｔ７）　、第２のベクトル積和演算回路９ｂ
により第２式と同様に第２の分子項ベクトルｑ’（ｋｚ
）をＭ個当力する（ステップＳＴ８，５Ｔ９）。ベクトル加算器１３は前記第１のＤＦＴ音源ベクトルＡ
（ｉ、に＋）と第２のＤＦＴ音源ベクトルＢ　（ｔ、　
　ｋｚ）を加算し、１個のＤＦＴ音源ベクトルＣ’　　
（ｉ、　ｋ）Ｃ”（ｉ　、　ｋ）　　＝　Ａ　（ｉ　、　ｋυ　十〇
（ｔｌｋｇ）　　　・・・　（７）回につきに２をＭ回
度化させるため１からＬまでのＬ個与えられることにな
り、よってＣ’　（ｉ＋　　ｋ）はＬ個生成される。さ
らに分母項計算回路１５は前記１個のＤＦＴ音源ベクト
ルＣ”（ｉ、　　ｋ）から第３式と同様に分母項１７Ｅａ（ｉ）”　Ｉｃ’（ｉ、ｋ）　　ｌ”　　−（８）
を出力する（ステップ５ＴＩＩ）。最終歪量計算回路１
２は前記第１の分子項ベクトル積和ｐ’（ｋＩ）、第２
の分子項ベクトル積和ｕ’（ｋｚ）、及び分母項１７か
ら第４式と同様に歪量Ｅ　（ｋ）を出力する（ステップ
５Ｔ１２）。ここで、第４式の分子項ベクトル積和は、
第７式の関係よりを生成する（ステップ５ＴＩＯ）。ｋ
は、ｋＩ　１から得られる。上記の計算により歪量Ｅ　（ｋ）がＬ個すべて得られる
と（ステップ５Ｔ１３）、最適音源ベクトル選択回路１
９により、Ｌ個の歪量１８の内、最小値を与えるＤＦＴ
音源ベクトルの番号を最適音源ベクトルコード２０とし
て選択する（ステップ５Ｔ１４）。この発明の特徴は、第４式の第２項分子全体に必要な演
算量が大幅に削減できる点であり、従来技術による第２
式のＬ回のベクトル積和演算が、この発明の第５及び第
６式による２Ｆ口（Ｌ＝Ｍ２より）回のベクトル積和演
算と、第９式の第２項分子のＥ「回のスカラー値加算に
なることで演算量が削減される。次に、演算量について比較を行う。まず、従来技術につ
いて述べる。ベクトル積和演算回路８の第２式の計算は、実際には次
の第１０式のように、また、分母項計算回路１５の第３
式の計算は、次の第１１式のように計算される。Ｉｍ、　（Ｃ（ｆ、ｋ）））このときに必要な演算量は第１０式では、乗算が２・Ｌ
−Ｎ回、加減算が２・Ｌ−Ｎ回であり、第１１式では、
乗算が３・Ｌ−Ｎ回、加算が２・Ｌ−Ｎ回である。そし
て、歪量最終計算回路１２では、第４式の第２項の２乗
のための乗算をＬ回。そして、除算をＬ回行う。なお、第４式の第１項はｋに
関係なく一定であるので、最適音源ベクトルの選択には
関係ないので計算は行わない。ここで、１回の乗算に要
する演算量をｐ、１回の加減算に要する演算量を（１，
１回の除算に要する演算量をｒとすると、第４式の第２
頂金体に必要な演算量は、（５・Ｌ−Ｎ＋Ｌ）　　・ｐ
＋４・Ｌ−Ｎ・ｑ＋Ｌ−ｒである。次にこの発明の場合について述べる。２つのベクトル積
和演算回路９ａ、９ｂの第５式および第６式の計算は、
実際には次の第１２式、第１３式のように、また、ベク
トル加算器１３および分母項計算回路１５の第７式、第
８式の計算は、次の第１４式のように計算される。１ｍ、（Ａ（ｉ、に＋）））木口゛（ｋｚ）＝Σ　（Ｒｅ、（Ｙ（ｉ）　　）ネ・Ｒｅ、　（Ｂ（ｉ、ｋｚ））　−１ｍ、　（Ｙ（ｉ）
　　）　・１ｍ、　（Ｂ（ｉ、ｋｚ））　　１このときに必要な演算量は、第１２及び第１３式では乗
算が４・［・Ｎ回、加減算が４・ｆｒ・Ｎ回であり、第
１４弐では、乗算が３・Ｌ−Ｎ回、加算が４・Ｌ−Ｎ回
であり、歪量最終計算回路１２では分子項ベクトル積和
と第２の分子項ベクトル積和との和のための加算がＬ回
、２乗のための乗算がＬ回、そして、除算がＬ回である
。よって、第９式の第２頂金体に必要な演算量は、（４
・匡・Ｎ＋３・Ｌ−Ｎ＋Ｌ）　　・ｐ＋（４・［−・Ｎ
＋４・Ｌ−Ｎ＋Ｌ）・ｑ＋Ｌ−ｒである。従って、Ｌが次式を満たし、かつ、ある整数の２乗であ
るとき、Ｌ〉１６・Ｎ２　・　（ｐ＋ｑ）／　（２・Ｎ−ｐ−ｑ
）２となり、この発明により演算量の削減が図れる。なお、上記実施例では、２つの符号帳内の音源ベクトル
数が等しい場合について述べたが、これが等しくない場
合で実現してもよい。また、上記実施例では、ベクトル加算器によりＤＦＴ加
算音源ベクトルを作成したが、これを符号帳内に持って
いてもよく、その場合は第７式の演算が不要となり、−
層の演算量削減が可能となる。また、上記実施例では、周波数領域での装置について説
明したが、ウオルシュアダマール変換領域も、また特異
値分解を用いる方法でも実現できる。さらに、上記実施
例では２個の縮小符号帳を用いたが、２個以上の符号帳
を用いても同様の効果を奏する。

【発明の効果】

以上のように、この発明によれば、ベクトル加算器によ
り複数の符号帳からそれぞれ選択された音源ベクトルを
加算し、１個の音源ベクトルを生成し、このベクトル加
算器で生成され音源ベクトルと前記複数の縮小符号帳か
らそれぞれ選択された音源ベクトルから歪量計算手段に
より、歪量を計算するようにしたので、大きな演算量の
必要なベクトル積和演算回路における分子項ベクトル積
和演算をＨｆ１Ｔ回行うのみでよいので、Ｌが大きいと
きは歪量計算に要する演算量が大幅に縮小される。また
、符号帳内のＤＦＴ音源ベクトルの数は２Ｆ「個であり
、必要なメモリ量は従来の２ｔ−１／Ｚ倍に縮小される
。この２点により小規模な装置規模でも十分大きなＬを
設定でき、十分な品質で音声を符号化することができる
。

【図面の簡単な説明】

第１図はこの発明の一実施例による音声符号化装置の構
成を示すブロック図、第２図はこの発明の一実施例によ
る動作を説明するフローチャート、第３図は従来の音声
符号化装置の構成を示すブロック図、第４図は従来の音
声符号化装置の動作を説明するフローチャートである。図において、１は符号帳、２ａ、２ｂは第１及び第２の
縮小符号帳、４ａ、４ｂは第１及び第２のＤＦＴ音源ベ
クトル、１３はベクトル加算器、Ａ、Ｂは歪量計算手段
である。なお、図中、同一符号は同一、または相当部分を示す。特　許　出　順　人　　三菱電機株式会社第図手続補正書（自発）６　。補正の内容 ■ 明細書第３頁第５行に「５ｍ」とあるのをｒ　５　ｍ５ｅｃＪと補正する。明細書筒５真第１５行に「とする一般に」とあるのを「とすると、一般に」と補正する。２、発明の名称明細書第２頁第１４行から第１６行に音声符号化装置３、補正をする者事件との関係　特許出願人住　所　　　　東京都千代田区丸の内二丁目２番３号名
　称　　（６０１）三菱電機株式会社代表者　志岐守哉とあるのを４、代理人住所郵便番号　１０５東京都港区西新橋１丁目４番１０号明細書の発明の詳細な説明の欄と補正する。明細書第７頁第２行に「２個以上の符号帳」とあるのを「２個以上の縮小符号帳」と補正する。以上

Claims

【特許請求の範囲】

予め複数の音源ベクトルを格納している符号帳と、前記
音源ベクトルを音源として、入力音声の分析により求め
られた合成フィルタを駆動させることで得られる再生音
声と前記入力音声との歪量を計算する歪量計算手段とを
備え、該歪量が最小となる前記音源ベクトルを選択する
音声符号化装置において、前記符号帳から抽出された複
数の縮小符号帳と、前記複数の縮小符号帳からそれぞれ
選択された音源ベクトルを加算し、１個の音源ベクトル
を生成するベクトル加算器と、前記ベクトル加算器から
生成された１個の音源ベクトルと前記複数の縮小符号帳
からそれぞれ選択された音源ベクトルから歪量を計算す
る歪量計算手段とを備えたことを特徴とする音声符号化
装置。