JPH04248722A

JPH04248722A - データ符号化方法

Info

Publication number: JPH04248722A
Application number: JP3014402A
Authority: JP
Inventors: Yasunaga Miyazawa; 宮沢康永
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1991-02-05
Filing date: 1991-02-05
Publication date: 1992-09-04

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データ圧縮を用いる、
音声認識装置、画像認識装置、ディジタル通信などの分
野に関する。

【０００２】

【従来の技術】従来、「Ａｎ　Ａｌｇｏｒｉｔｈｍ　ｆ
ｏｒ　Ｖｅｃｔｏｒ　Ｑｕａｎｔｉｚｅｒ　Ｄｅｓｉｇ
ｎ」（ＩＥＥＥ　ＴＲＡＳＡＣＴＩＯＮＳ　ＯＮＣＯＪ
ＭＭＵＮＩＣＡＴＩＯＮＳ，　ＶＯＬ．ＣＯＭ−２８，
ＮＯ．１，ＪＡＮＵＡＲＹ　１９８０．　ｂｙ　ＬＩＮ
ＤＥ，ＢＵＺＯ　ａｎｄ　ＧＲＡＹ）に記載されている
ように、ベクトル量子化による、ディジタル信号のデー
タ圧縮が知られていた。

【０００３】

【発明が解決しようとする課題】しかし、従来のベクト
ル量子化では、入力データを、コードブック中のＴ個の
コードベクトルのいづれかにコード化する際、入力デー
タとコードブック中の各コードベクトルとＴ回距離計算
をするため、コード化に時間がかかり、認識処理やデー
タ通信を実時間で処理することを困難にする、という問
題点があった。この問題点を解決し、データ圧縮処理の
計算時間を高速にすることが、本発明の課題である。

【０００４】

【課題を解決するための手段】本発明のデータ符号化方
法は、データ符号化方法において、コードブック中の、
Ｔ個の各コードベクトルを、第１段階の分類として、Ｍ
（１）種類の各カテゴリーに分割することと、第２段階
の分類として、前記第１段階の分類のＭ（１）種類の各
カテゴリーを、それぞれＭ（２）種類の各カテゴリーに
分割し、Ｍ（１）＊Ｍ（２）種類の各カテゴリーに分割
することと、前記の各段階の分類と同様にして、第Ｎ段
階の分類として、第Ｎ−１段階の分類のＭ（１）＊Ｍ（
２）＊・・・＊Ｍ（Ｎ−１）種類の各カテゴリーを、そ
れぞれＭ（Ｎ）種類の各カテゴリーに分割し、Ｍ（１）
＊Ｍ（２）＊・・・＊Ｍ（Ｎ）種類の各カテゴリーに分
割することと、前記段階数Ｎの値を３以上とすることと
、前記各カテゴリーの各特徴ベクトルを、前記各カテゴ
リーに含まれる前記各コードベクトルの重心ベクトルと
することと、入力データを前記コードブック中の前記コ
ードベクトルのいづれかに、コード化する際、第１探索
として、前記入力データと前記第１段階のＭ（１）種類
のカテゴリーの特徴ベクトルとの距離が最小となる、１
つの前記第１段階のカテゴリーを選択することと、第２
探索として、前記入力データと、選択された前記第１段
階のカテゴリーに属する前記Ｍ（２）種類のカテゴリー
の特徴ベクトルとの距離が最小となる、１つの前記第２
段階のカテゴリーを選択することと、前記の各探索と同
様にして、第Ｎ探索として、前記入力データと、選択さ
れた前記第Ｎ−１段階のカテゴリーに属する前記Ｍ（Ｎ
）種類のカテゴリーの特徴ベクトルとの距離が最小とな
る、１つの前記第Ｎ段階のカテゴリーを選択することと
、　　最終探索として、前記入力データと、選択された
前記第Ｎ段階のカテゴリーに属する前記コードベクトル
との距離が最小となる、１つの前記コードベクトルを選
択し、前記入力データを、選択された１つの前記コード
ベクトルのコードに対応づけることと、第ｎ探索（ｎ≦
Ｎ）において選択された第ｎ段階のカテゴリーに属する
前記コードベクトルが１個のみの時は、第ｎ探索を最終
探索として、その前記コードベクトルのコードに、前記
入力データを対応づけること、を特徴とする。

【０００５】

【実施例】（実施例１）本発明のデータ符号化方法を、
単語認識の音声認識装置に応用した場合の１実施例を図
面に沿って説明する。

【０００６】図１は、本発明のデータ符号化方法を用い
た音声認識装置のシステム構成図である。話者によって
発話された音声を、マイク１より入力し、Ａ／Ｄ変換部
２において、１６［ＫＨｚ］、１２ビットのディジタル
信号に変換し、特徴抽出部３において、２０［ｍｓ］を
１フレームとして、１フレーム毎に、ハミングウィンド
ウ処理、線形予測分析を行い、１４次ＬＰＣケプストラ
ム係数を特徴パラメータとして求める。この時、フレー
ムのシフト量は１０［ｍｓ］とする。このようにして得
た１４次の特徴パラメータを入力ベクトルとして、デー
タ圧縮部４において、本発明のデータ符号化方法を用い
て、コードブック５中のコードベクトルの１つのコード
ベクトルにコード化する。データ圧縮部４においてコー
ド化されたコードの時系列と、あらかじめ学習させてあ
るＸ個の単語の標準パターンとを、単語認識部５におい
てＨＭＭ法を用いてパターンマッチングを行うことによ
り、単語認識する。このときＸ個の単語の標準パターン
は単語辞書７に登録されている。

【０００７】本実施例においては、コードブック５中の
コードベクトルの総数は２５６個であり、６段階に分類
されている。また、このコードブック５中の２５６個の
コードベクトルは、２０人の話者により発話された音声
を、１６［ＫＨｚ］、１２ビットでサンプリングし、２
０［ｍｓ］を１フレーム、シフト量を１０［ｍｓ］とし
て、１フレーム毎に、ハミングウィンドウ処理、線形予
測分析を行い、１４次ＬＰＣケプストラム係数を特徴パ
ラメータとする数１０万フレームの特徴パラメータ群か
ら、ＬＢＧアルゴリズムを用いて求めたものであり、各
々のコードベクトルの次数は１４次である。このＬＢＧ
アルゴリズムとは、「ＡｎＡｌｇｏｒｉｔｈｍ　ｆｏｒ
Ｖｅｃｔｏｒ　Ｑｕａｎｔｉｚｅｒ　Ｄｅｓｉｇｎ」（
ＩＥＥＥ　ＴＲＡＳＡＣＴＩＯＮＳ　ＯＮ　ＣＯＭＭＵ
ＮＩＣＡＴＩＯＮＳ，ＶＯＬ．ＣＯＭ−２８，ＮＯ．１
，　ＪＡＮＵＡＲＹ　１９８０．　ｂｙ　ＬＩＮＤＥ，
ＢＵＺＯ　ａｎｄ　ＧＲＡＹ）に記載されているアルゴ
リズムである。

【０００８】コードブック５中のコードベクトルの６段
階の分類について、図３を用いて簡単に説明する。図３
において、カテゴリー（０、１）３０１は２５６個のコ
ードベクトルを全部含むカテゴリー、すなわちコードブ
ックそのものとする。このカテゴリー（０、１）３０１
中の２５６個のコードベクトルを、第１段階の分類によ
って、２種類のカテゴリー、カテゴリー（１、１）３０
２、カテゴリー（１、２）３０２、に分割する。カテゴ
リー３０２、３０３の特徴ベクトルは、各々のカテゴリ
に属するコードベクトルの重心ベクトルとする。第２段
階の分類として、第１段階の分類で分割された２種類の
カテゴリー３０２、３０３に属するコードベクトルを、
それぞれ２種類のカテゴリーに分割する。カテゴリー３
０２に属するコードベクトルを分割したカテゴリーが、
カテゴリー３０４、３０５であり、カテゴリー３０３に
属するコードブックを分割したカテゴリーが、カテゴリ
ー３０６、３０７である。このように、第２段階の分類
では、コードベクトルは４種類のカテゴリーに分割され
る。各々のカテゴリーの特徴ベクトルは、第１段階の分
類と同様に、各々のカテゴリーに属するコードベクトル
の重心ベクトルとする。同様にして第３段階の分類では
、コードベクトルは、カテゴリー（３、１）３０８から
カテゴリー（３、８）３０９までの８種類のカテゴリー
に分割される。本実施例では、同様にして、６段階の分
類まで行う。第６段階の分類では、コードベクトルは、
カテゴリー（６、１）３１０からカテゴリー（６、６４
）３１１までの６４種類のカテゴリーに分割される。カ
テゴリー３１０に属するコードベクトルは、コードベク
トル３１２、３１３、３１４、３１５の４個であり、カ
テゴリー３１０の特徴ベクトルは、コードベクトル３１
２、３１３、３１４、３１５の重心ベクトルである。

【０００９】この分類のアルゴリズムを図２を用いて説
明する。

【００１０】まず、記号を定義する。Ｎは分類の全段階
数とし、本実施例では６とする。ｎは分類の段階名とす
る。Ｉは第ｎ−１段階の分類におけるカテゴリー数、ｉ
はカテゴリー名とする。Ｃｎ（ｉ）は第ｎ段階の分類に
おいて新しくできたカテゴリーｉの重心ベクトル、すな
わち、第ｎ段階のｉカテゴリーの特徴ベクトルである。

【００１１】演算２１において、ｎとＩをそれぞれ１に
初期化する。これは、最初の分類が、第１段階の分類で
あることと、最初のカテゴリー数（第０段階の分類のカ
テゴリー数）は１種類（コードブックそのもの）である
ことを示す。

【００１２】ループ２２では、Ｉ種類のカテゴリーに属
するコードベクトルをそれぞれ２分割する計算を実行す
るために、演算２３から演算２７までをＩ回計算する。

【００１３】演算２３では、第ｎ−１段階のｉカテゴリ
ーに属するコードベクトルを２分割するための初期化と
して、第ｎ−１段階のｉカテゴリーに属するコードベク
トルのうち最も距離の離れた２個のコードベクトルを、
２個の重心ベクトルの初期値として選択する。

【００１４】演算２４では、第ｎ−１段階のｉカテゴリ
ーに属する各々のコードベクトルと２個の重心ベクトル
との距離計算をし、その距離が小さくなるように、各々
のコードベクトルを２種類のカテゴリーに分割する。

【００１５】演算２５では、演算２４で分類された２種
類のカテゴリー毎に、それぞれのカテゴリーに属するコ
ードベクトルの重心ベクトルを求める。

【００１６】分岐２６では、演算２４で分類された２種
類のカテゴリー毎に、演算２５で求めた重心ベクトルと
そのカテゴリーに属するコードベクトルとの距離の和の
値が、収束条件を満たすか、否かで、演算２７に進むか
、演算２４、２５を再計算するかを判断する。本実施例
での収束条件は、この距離の和がある一定値に収束した
時、収束したと判断し、収束した場合演算２７を実行す
る。

【００１７】演算２７では、演算２５で計算された２個
の重心ベクトルを、第ｎ段階の分類の（２＊ｉ−１）カ
テゴリーと（２＊ｉ）カテゴリーの特徴ベクトルとして
、記憶しておく。

【００１８】演算２８では、段階名ｎの値を１つ増やし
、第ｎ−１段階のカテゴリー数をＩに代入する。

【００１９】分岐２９では、ｎがＮ以下の場合、ループ
２２から演算２８を実行し、ｎがＮを越えた場合、分類
計算を終了とする。本実施例では、Ｎの値は６であるの
で、第６段階の分類まで計算を行い、各々のカテゴリー
の特徴ベクトルを求める。

【００２０】以上の計算で求めた各カテゴリーの特徴ベ
クトルを用いて、入力データの１フレームの入力ベクト
ルをコード化する方法を、図３を用いて説明する。

【００２１】第１の探索として、入力ベクトルと第１段
階の２種類のカテゴリー３０２、３０３の特徴ベクトル
Ｃ１（１）、Ｃ１（２）との距離が小さい方の、１つの
カテゴリーを選択する。

【００２２】第２の探索として、入力ベクトルと、選択
された第１段階のカテゴリーに属する２種類のカテゴリ
ーの特徴ベクトルとの距離が小さい方の、１つのカテゴ
リーを選択する。仮に第１の探索で、カテゴリー３０３
が選択された場合、第２の探索では、カテゴリー３０６
、３０７の特徴ベクトルＣ２（３）、Ｃ２（４）との距
離が小さい方の、１つのカテゴリーを選択することにな
る。

【００２３】同様にして、第６探索まで探索を行い、第
６段階の分類のカテゴリーを１つ選択する。

【００２４】最終探索として、入力ベクトルと選択され
た第６段階のカテゴリーに属するコードベクトルとの距
離が最小となる、１つのコードベクトルを選択し、入力
ベクトルを、選択されたコードベクトルのコードに対応
づけることにより、入力ベクトルのコード化が完了する
。

【００２５】第６段階の各カテゴリーに属するコードブ
ックの数は、平均４個である。よって、入力ベクトルを
コード化する際の距離計算の回数は、本実施例の場合、
各段階のカテゴリーの特徴ベクトルとの距離計算が２＊
６＝１２回、第６段階のカテゴリーに属するコードベク
トルとの距離計算が平均４回、合計平均１８回となる。従来の方法でコード化を行った場合、２５６個すべての
コードベクトルと距離計算を行うため、距離計算の回数
は２５６回となる。よって、本発明のデータ符号化方法
を用いると、この実施例では、従来方法の約１４倍の速
さでコード化が可能となる。

【００２６】また、第ｎ探索（ｎ≦Ｎ）において選択さ
れた第ｎ段階のカテゴリーに属するコードベクトルが１
個のみの時は、第ｎ探索を最終探索として、そのコード
ベクトルのコードに、入力ベクトルを対応づける。

【００２７】

【発明の効果】以上説明したように、本発明のデータ符
号化方法を用いることにより、入力データのコード化が
高速になるという効果がある。仮に、コードサイズを２
５６とし、本発明のデータ符号化方法の分類を６段階と
し、第ｎ段階の分類でのカテゴリー数を２ｎ個とした場
合、コード化の際、従来方法では２５６回の距離計算が
必要なのに対し、本発明のデータ符号化方法では平均１
０回の距離計算をするだけでよいので、約２５倍高速に
なる。

【００２８】また、このようにコード化が高速になるた
め、コードサイズを大きくして、コード化に生ずる量子
化誤差を小さくすることが可能となる。

【図面の簡単な説明】

【図１】本発明のデータ符号化方法を音声認識装置に応
用した場合のシステム構成図。

【図２】本発明のデータ符号化方法において、コードベ
クトルを分割するアルゴリズムを示す図。

【図３】本発明のデータ符号化方法における、コードベ
クトルの分類を示す図。

【符号の説明】

１　　マイク２　　Ａ／Ｄ変換部３　　特徴抽出部４　　データ圧縮部５　　コードブック６　　単語認識部７　　単語辞書２１　　演算２２　　ループ２３　　演算２４　　演算２５　　演算２６　　分岐２７　　演算２８　　演算２９　　分岐３０１　　カテゴリー３０２　　カテゴリー３０３　　カテゴリー３０４　　カテゴリー３０５　　カテゴリー３０６　　カテゴリー３０７　　カテゴリー３０８　　カテゴリー３０９　　カテゴリー３１０　　カテゴリー３１１　　カテゴリー３１２　　コードベクトル３１３　　コードベクトル３１４　　コードベクトル３１５　　コードベクトル

Claims

【特許請求の範囲】

【請求項１】　　データ符号化方法において、コードブ
ック中の、Ｔ個の各コードベクトルを、第１段階の分類
として、Ｍ（１）種類の各カテゴリーに分割することと
、第２段階の分類として、前記第１段階の分類のＭ（１
）種類の各カテゴリーを、それぞれＭ（２）種類の各カ
テゴリーに分割し、Ｍ（１）＊Ｍ（２）種類の各カテゴ
リーに分割することと、前記の各段階の分類と同様にし
て、第Ｎ段階の分類として、第Ｎ−１段階の分類のＭ（
１）＊Ｍ（２）＊・・・＊Ｍ（Ｎ−１）種類の各カテゴ
リーを、それぞれＭ（Ｎ）種類の各カテゴリーに分割し
、Ｍ（１）＊Ｍ（２）＊・・・＊Ｍ（Ｎ）種類の各カテ
ゴリーに分割することと、前記段階数Ｎの値を３以上と
することと、前記各カテゴリーの各特徴ベクトルを、前
記各カテゴリーに含まれる前記各コードベクトルの重心
ベクトルとすることと、入力データを前記コードブック
中の前記コードベクトルのいづれかに、コード化する際
、第１探索として、前記入力データと前記第１段階のＭ
（１）種類のカテゴリーの特徴ベクトルとの距離が最小
となる、１つの前記第１段階のカテゴリーを選択するこ
とと、第２探索として、前記入力データと、選択された
前記第１段階のカテゴリーに属する前記Ｍ（２）種類の
カテゴリーの特徴ベクトルとの距離が最小となる、１つ
の前記第２段階のカテゴリーを選択することと、前記の
各探索と同様にして、第Ｎ探索として、前記入力データ
と、選択された前記第Ｎ−１段階のカテゴリーに属する
前記Ｍ（Ｎ）　種類のカテゴリーの特徴ベクトルとの距
離が最小となる、１つの前記第Ｎ段階のカテゴリーを選
択することと、最終探索として、前記入力データと、選
択された前記第Ｎ段階のカテゴリーに属する前記コード
ベクトルとの距離が最小となる、１つの前記コードベク
トルを選択し、前記入力データを、選択された１つの前
記コードベクトルのコードに対応づけることと、第ｎ探
索（ｎ≦Ｎ）において選択された第ｎ段階のカテゴリー
に属する前記コードベクトルが１個のみの時は、第ｎ探
索を最終探索として、その前記コードベクトルのコード
に、前記入力データを対応づけること、を特徴とするデ
ータ符号化方法。
【請求項２】　　請求項１に記載したデータ符号化方法
において、コードブック中のコードベクトルを、学習デ
ータをＬＢＧアルゴリズムを用いて、ベクトル量子化し
たコードベクトルとすることを特徴とするデータ符号化
方法。