JPH0477800A

JPH0477800A - ベクトル量子化コードブック作成方式

Info

Publication number: JPH0477800A
Application number: JP2191595A
Authority: JP
Inventors: Toshiki Miyano; 俊樹宮野
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1990-07-19
Filing date: 1990-07-19
Publication date: 1992-03-11

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、音声信号の音源信号をヘクトル量子化するた
めのコードブックを作成するベクトル量子化コードブッ
ク作成方式に関するものである。

〔従来の技術〕

従来、ヘクトル量子化のためのコートブ・ツクを作成す
るベクトル量子化コー）゛ブック作成の基本方式として
、Ｙ、Ｌｉｎｄｅ、八、Ｂｕｚｏ　ａｎｄ　Ｒ，ｔ’１
．Ｇｒａｙによる　“八ｎ　　Ａｌｇｏｒｉｔｈｍ　　
ｆｏｒ　　Ｖｅｃｔｏｒ　　Ｑｕａｎｔｉｚｅｒ　　Ｄ
ｅｓｉｇｎ（ＩＥＥＥ　Ｔｒａｎｓ、　ｏｎ　Ｃｏｍｍ
ｕｎ、、　Ｖｏｌ、２Ｂ、　ｐｐ、８４−９５１．９８
０）　　と題した論文（文献１）に記載されているＬＢ
Ｇ法と呼ばれる方式が知られている。

［発明が解決しようとする課題〕しかしながら従来のＬＢＧ方式では、セントロイドの具
体的な計算法は示されてはいない。距離尺度が２乗距離
の時のセントロイドは単なる重心になることは容易に判
明するが、２乗距離以外の距離尺度に対するセンドロイ
ｌ′の具体的な計算法は明らかではなかった。特に、距
離尺度が、最適ゲインを用いた２乗距離、聴感重み付け
再生２乗距離、最適ゲインを用いた聴感重み付け再生２
乗距離の時のセントロイドの具体的な計算法は明らかで
はなかった。

本発明の目的は、上述した問題を解決し、音源信号をよ
り効率的にベクトル量子化するためのコードブックを作
成するベクトル量子化コードブ。

り作成方式を提供することにある。

（課題を解決するだめの手段〕第１の発明によるベクトル量子化コートブック作成方式
は、１〜レーニング用の音声信号に対し線形予測分析を施し
、線形予測残差から適応コードブックまたはピッチ予測
信号を引いた残差信号とセントロイトとの聴感重み付け
再生２乗距離をクラスクリングの距離尺度とし、クラス
タ内の前記残差信号と前記セントロイドとの聴感重み付
け再生２乗距離の総和を最小にするように前記セントロ
イトを計算することによりコードブックを作成すること
を特徴とする。

第２の発明によるベクトル量子化コートブック作成方式
は、ｌ・レーニング用の音声信号に対し線形予測分析を施し
、線形予測残差から適応コードブックまたはピッチ予測
信号を引いた残差信号と最適ゲインを掛けたセントロイ
トとの聴感重み付け再生２乗置陥（をクラスタリングの
距離尺度とし、クラスタ内の前記残差信号とクラスタリ
ング時の最適ゲインを掛けたセン）・ロイドとの２乗距
離の総和を最小にするように前記セン１ヘロイ１゛を計
算することによりコードブックを作成することを特徴と
する。

第３の発明によるベクトル量子化コートブック作成方式
は、トレーニング用の音声信号に対し線形予測分析を施し、
線形予測残差から適応コードブックまたはピンチ予測信
号を引いた残差信号と最適ゲインを掛けたセンドロイ１
′との聴感重み付け再生２乗距離をクラスタリングの距
離尺度とし、クラスタ内の前記残差信号とクラスタリン
グ時の最適ゲインを掛けたセントロイドとの聴感重み付
け再生２乗距離の総和を最小にするように前記セントロ
イドを計算することによりコードブックを作成すること
を特徴とする。

〔作用］本発明によるベクトル量子化コートブック作成方式の作
用を説明する。

まず、第１から第３までのどの発明も、予めトレーニン
グ用の音声信号に対し線形予測分析を施し、線形予測残
差から適応コードブックまたはピッチ予測信号を引いた
残差信号を、ＬＧＢ法のトレーニングデータとする。こ
こで適応コードブックまたはピッチ予測信号を求める方
法は、Ｋｌｅｉｊｎ。

Ｋｒａｓｉｎｓｋｉ　ａｎｄ　ＫｅｔｃｈｕｍによるＩ
ＩＩｍｐｒｏｖｅｄ　５ｐｅｅｃｈＱｕａｌｉｔｙ　ａ
ｎｄ　Ｅｆｆｉｃｉｅｎｔ　Ｖｅｃｔｏｒ　Ｑｕａｎｔ
ｉｚａｔｉｏｎ　ｉｎＳ　Ｅ　Ｌ　Ｐ″　　（Ｐｒｏｃ
、　　ＩＣＡＳＳＰ、　　ｐｐ、１５５−１５８．　１
９８８）　　　とにｎした論文（文献２）に記されてい
る。

ＬＢＧ法でのクラスタリングの時に用いる距離尺度は、
第１の発明では、トレーニングデータとセントロイドと
の聴感重み付け再生２乗距離、を用い、第２．３の発明
では、トレーニングデータと最適ゲインを掛けたセント
ロイドとの聴感重み付け再生２乗距離、丈　（ｈ＊ｘ　（ｎ）　−ｒ−ｈ＊ｃ、（ｎ））”　　
（２）を用いる。ここで、Ｘはトレーニングデータ、ｈ
はＸに対応した線形予測フィルタの聴感重み付けインパ
ルス応答、Ｃ４はｉ番目のセンドロイｌ、γはＸの聴感
重み付け再生信号に対するＣ３の最適ゲイン、ＮはＩ・
レーニングデータの次元である。

このとき、ｈ＊ｃＨ（ｒ＋）は、Ｘに対応した適応コー
トヘクトルでｈ＊ｃ、（ｎ）を直交化したものに、ゲイ
ンγはその直交化したものに対するゲインに取り替えて
もよい。ここで聴感重み付けインパルス応答は、前記文
献２に従い計算できる。

次に、第１の発明では、次式で表される歪を最小にする
ようにセントロイドを計算する。

・　・　・（３）ただし、ｈ”４はＸ”、に対応した線形予測フィルルタ
の聴感重み付けインパルス応答、Ｍはｉ番目のクラスタ
に属しているトレーニングデータの総数である。このセ
ントロイドを、具体的に求めるには、（３）式を各Ｃｉ
　（ｋ）で偏微分して、０（！：おくことにより、次の
連立方程式の解として求められる。

この式は、対称テープリンツ性を持っているので、高速
算法として知られているダービン・レビンソン算法を使
って求めることができる。ダービンレビンソン算法に関
しては、Ｌ、Ｒ，ＲａｂｉｎｅｒとＲ，Ｗ、　５ｃｈａ
ｆｅｒによる”ＤＩＧＩＴＡＬ　ＰＲＯｃＥｓｓＩＮＧ
　０ＦＳＰＥＥＣＨ５ＩＧＮＡＬＳ”　　（Ｐｒｅｎｔ
ｊｃｅ−ｆｌａｉｌ、　Ｉｎｃ、、　１９７８）と題し
た参考書（文献３）のＣｈａｐｔｅｒ８を参照できる。

Ｒ”４は、ｈ”４の自己相関関数である。つまり、Ｌを
インパルス応答長とすると、・　・（５）また、別の解法として、（４）弐を離散フーリエ変換す
ると、となる。ただし、Ｆ　［］は、離散フーリエ変換を表す
。従って、ｃ、（ｎ）求めるには、（８〕式を各ｃ、（ｋ）で偏微分して、０
とおくことにより、次式で求められる。

ｃ＝（ｎ、）・　・　・（９）第３の発明においては、次式で表される歪を最小にする
ようにセントロイドを計算する。

となる。Ｆ−’　［］は、逆離散フーリエ変換を表す。

このようにしても、セントロイドを求めることができる
。

第２の発明においては、次式で表される歪を最小にする
ようにセントロイドを計算する。

・　・　・（８）ここで、γ゛、は、Ｘ　１　、とｉ番目のクラスタ前の
セントロイドに対してクラスタリング時に求めた最適ゲ
インとする。このセントロイドを具体的にγ・　・ｈ’
Ｊ＊　ｃ、（ｎ））　２ただし、７　ｉ、は、Ｘ　１　、とｉ番目のクラスタ前
のセントロイドに対してクラスタリング時に求めた最適
ゲインとする。このセントロイドを、具体的に求めるに
は、００）式を各Ｃ！　（ｋ）で偏微分して、０とおく
ことにより、次の連立方程式の解として求められる。

・　・　・（１１）この式は、対称テープリッツ性を持っているので、高速
算法として知られているダービン・レビンソン算法を使
って求めることができる。

また、別の解決として、（１１）弐を離散フーリエ変換
すると、・Ｆ　　［Ｃｉ］　　（ｔ）・　・　・０２）となる。従って、求めたいセントロイドは、Ｃ１（ｒｌ
）・Ｆ［ｘ”ｊ］（Ｉｌ、））・　・　・０３）となる。このようにしても、セントロイドを求めること
ができる。

以上のようにして、コードブックを作成する。

また、こうして作成されたコードブックを用いて、符号
化を行い、そのときの適応コードブックを線形予測残差
から引いた信号をトレーニングデータとすることにより
、トレーニングを何度も繰り返し、クローズトループ学
習を行うこともできる。

（実施例〕第１図は本発明によるベクトル量子化ヨー１−フック作
成方弐の一実施例を示すフローチャートである。

トレーニング用の音声信号に対し線形予測分析を施し、
線形予測残差から適応コードブックまたはピッチ予測信
号を引いた残差信号をトレーニングデータとして入力す
る（ステップＳｌ）。

初期設定（ステップＳ２）では、最初のセントロイドを
トレーニングデータの重心とする。

スプリッティング（ステップＳ３）では、セントロイド
の各成分にある値を足すことと、引くことによりセント
ロイドを２倍に増やす。

クラスタリング（ステップＳ４）では、第１の発明に対
しては（１）式、第２，３の発明に対しては（２）式で
表された距離尺度によりトレーニングデータをクラスタ
に分割する。

歪み計算（ステップＳ５）では、各クラスタでの歪みを
、第１の発明に対しては（１）式、第２，３の発明に対
しては（２）弐で表された距離尺度により計算し、合計
する。ここで各クラスタでの歪みとは、各クラスタ内で
の全トレーニングデータとそのクラスタのセントロイド
との距離の総和のことである。

収束判定（ステップＳ６）では、現歪みと前歪みとの比
を計算し、定められた値より小さくなればビット数判定
を、小さくならなければセントロイド計算を行う。

セントロイド計算（ステップＳ７）では、各クラスタの
セントロイドを、第１の発明に対しては（４）式の解を
ダービン・レビンソン算法あるいは（６）。

（７）式により求め、第２の発明に対しては（９）式よ
り求め、第３の発明に対しては（ＩＩ）式の解をダービ
ン・レビンソン算法あるいは０２）、　０３）弐により
求め、クラスタリングに戻る。

ビット数判定（ステップＳ８）では、定められたビット
数に達しているかどうかを判定し、達していなければス
プリッティングに戻り、達していれば終了する。

第２図は、トレーニングデータ作成の一例を示す装置ブ
ロック図である。

入力端子１００より音声信号を入力し、１フレ一ム分（
例えば２０ｍ５　）の音声信号をＬＰＣ分析器１１０と
サブフレーム分割器１２０へ送る。

ＬＰＣ分析器１１０はＬＰＣ分析を行い、ＬＰＧバラメ
ークを逆フィルタ１３０と重み付けフィルタ１４０と適
応コードブック器１５０へ出力する。

サブフレーム分割器１２０は、入力した１フレ一ム分の
音声信号を４つのサブフレームに分割し、逆フィルタ１
３０と重み付けフィルタ１４０へ出力する。

逆フィルタ１３０は、ＬＰＧ分析器１１０からＬＰＣパ
ラメータを、サブフレーム分割５１２０から音声信号を
入力し、線形予測残差を出力する。

重み付けフィルタ１４０は、ＬＰＣ分析器１１０がらＬ
ＰＧパラメータを、サブフレーム分割器１２０から音声
信号を入力し、聴感重み付けを行う。

適応コードブック器１５０は、逆フィルタ１３０から入
力した線形予測残差を用いて適応コードブ・ンクを作り
、ＬＰＧ分析器１１０から入力したＬ　Ｐ　Ｇパラメー
タによって聴感重み付け再生をし、重み付けフィルタ１
４０から入力した聴感重み（＝ｊけ音声信号と最適ゲイ
ンをかけた適応コートヘクトルの聴感重み付け再生信号
との２乗距離が最小となる適応コードベクトルを探索し
、その適応コードヘクトルに最適ゲインをかけた信号を
出力する。

減算器１５５は、逆フィルタ１３０の出力から適応コー
ドブック器１５０の出力を減算した信号を出力端子１６
０へ出力する。

第３図は、クローズトループ学習法の場合のトレーニン
グデータ作成の一例を示す装置ブロック図である。

入力端子１７０より音声信号を入力し、１フレ一ム分（
例えば２０ｍ５　）の音声信号をＬ　Ｐ　Ｃ分析器１９
０とサブフレーム分割器１８０へ送る。

Ｌ　Ｐ　Ｃ分析器１９０はＩ−Ｐ　Ｃ分析を行い、ｉ−
ｐ　ｃパラメータを重み付けフィルタ２００．影響信Σ
減算器２１０．適応コードブンク器２２０３重み付け再
任。

フィルタ２３０．音源コードブ・７９８２４０５重み付
け再生フィルタ２５０．逆フィルタ２６０へ出力する。

サブフレーム分割器１８０は、入力した１フレ一ム分の
音声信号を４つのサブフレームに分割し、重み付けフィ
ルタ２００へ出力する。

重み付けフィルタ２００は、Ｌ　Ｐ　Ｃ分析器１９０か
らＬＰＣパラメータを、サブフレーム分割ｈｓｘｇ。

から音声信号を入力し、重み付け再生フィルタ２５０か
ら入力した前サブフレームの終わりのＬＰＧ次数分の重
み付け再生信号を初期値として聴感重み付けを行う。

影響信号減算器２１０は、重み付けフィルタ２００から
入力した重み付け信号から、重み付け再生フィルタ２５
０から入力した前サブフレームの終わりのＬＰＧ次数分
の重み付け再生信号による影啓信号を減算する。

適応コードブック器２２０は、過去の音源信号を用いて
適応コードブックを作り、影響信号減算器２１０から入
力した信号と最適ゲインをかけた適応コードブックトル
の聴感重み付け再生信号との２乗距離が最小となる適応
コードヘクトルを探索し、その適応コードベクトルに最
適ゲインをかけた信号を出力する。

重み付け再生フィルタ２３０は、適応コードブ・ツク器
２２０から人力した信号を聴感重み付け再生する。

減算器２３５は、影響信号減算器２１０の出力から重み
付け再生フィルタ２３０の出力を減算する。

音源コードブック器２４０は、減算した信号を人力し、
その入力信号と最適ゲインをかけた音源コードブックの
聴感重み付け再生信号との２乗距離が最小となる音源コ
ードベクトルを探索し、その音源コードベクトルに最適
ゲインをかけた信号を出力する。

加算器２４５は、適応コードブ・ツク器２２０の出力と
音源コードブック器２４０の出力の和を重み付け再生フ
ィルタ２５０へ出力する。

重み付け再生フィルタ２５０は、その入力信号の聴感重
み付け再生信号を重み付けフィルタ２００と影響信号減
算器２１０へ出力する。

逆フィルタ２６０は、減算器２３５の出力を入力し、そ
の入力信号の重み付けられたＬ　Ｐ　Ｇ係数による線形
予測残差を出力端子２７０へ出力する。

〔発明の効果〕

以上述べたように、本発明によれば、距離尺度として最
適ゲインを用いた２乗距離、あるいは聴感重み付け再生
２乗距離、あるいは最適ゲインを用いた聴感重み付け再
生２乗距離を用いたＬＢＧ法によって音源信号のコード
ブックを作成するので、通常の２乗距離を用いたり、　
Ｂ　Ｇ法によって作成されたコードブックに比べ、同し
コードブ・ツクサイズでより良好な音声が得られるとい
う大きな効果がある。

【図面の簡単な説明】

第１図は、本発明によるヘクトル量子化コードブック作
成方式の一実施例を示すブローチ＋−１−１第２図は、
トレーニングデータ作成の一例を示ず装置ブ【コック図
、第３図は、クローズトループ学習法の場合のトレーニン
グデータ作成の一例を示す装置ブロック図である。１１０　　・　・　・　・　・　Ｌ　　Ｐ　　Ｃ分羊斤
器１２０　　・・・・・サブフレーム分割器１３０　　
・　・　・　・　・逆フィルタ１４０　　・・・・・重
み付けフィルタ１５０　　・　・・　・　・適応コード
ブック器１８０　　・・・・・サブフレーム分割器１９
０　　・・・・・ＬＰＣ分析器２００　　・・・・・重み付けフィルタ２１０　　・・
・・・影口信号減算器２２０　　・　・　・　・　・適応コートブック器２３
０　　・・・・・重み付け再生フィルタ２４０　　・　
・　・　・　・音源コードブック器２５０　　・・・・
・重み付け再生フィルタ２６０　　・・・・・逆フィル
タ代理人　弁理士　　岩　佐　　義　幸Ｃフーゴしゝ−〇

Claims

【特許請求の範囲】

（１）トレーニング用の音声信号に対し線形予測分析を
施し、線形予測残差から適応コードブックまたはピッチ
予測信号を引いた残差信号とセントロイドとの聴感重み
付け再生２乗距離をクラスタリングの距離尺度とし、ク
ラスタ内の前記残差信号と前記セントロイドとの聴感重
み付け再生２乗距離の総和を最小にするように前記セン
トロイドを計算することによりコードブックを作成する
ことを特徴とするベクトル量子化コードブック作成方式
。
（２）トレーニング用の音声信号に対し線形予測分析を
施し、線形予測残差から適応コードブックまたはピッチ
予測信号を引いた残差信号と最適ゲインを掛けたセント
ロイドとの聴感重み付け再生２乗距離をクラスタリング
の距離尺度とし、クラスタ内の前記残差信号とクラスタ
リング時の最適ゲインを掛けたセントロイドとの２乗距
離の総和を最小にするように前記セントロイドを計算す
ることによりコードブックを作成することを特徴とする
ベクトル量子化コードブック作成方式。
（３）トレーニング用の音声信号に対し線形予測分析を
施し、線形予測残差から適応コードブックまたはピッチ
予測信号を引いた残差信号と最適ゲインを掛けたセント
ロイドとの聴感重み付け再生２乗距離をクラスタリング
の距離尺度とし、クラスタ内の前記残差信号とクラスタ
リング時の最適ゲインを掛けたセントロイドとの聴感重
み付け再生２乗距離の総和を最小にするように前記セン
トロイドを計算することによりコードブックを作成する
ことを特徴とするベクトル量子化コードブック作成方式
。