JPH04248722A - データ符号化方法 - Google Patents

データ符号化方法

Info

Publication number
JPH04248722A
JPH04248722A JP3014402A JP1440291A JPH04248722A JP H04248722 A JPH04248722 A JP H04248722A JP 3014402 A JP3014402 A JP 3014402A JP 1440291 A JP1440291 A JP 1440291A JP H04248722 A JPH04248722 A JP H04248722A
Authority
JP
Japan
Prior art keywords
category
categories
vector
stage
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3014402A
Other languages
English (en)
Inventor
Yasunaga Miyazawa
宮沢康永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP3014402A priority Critical patent/JPH04248722A/ja
Publication of JPH04248722A publication Critical patent/JPH04248722A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データ圧縮を用いる、
音声認識装置、画像認識装置、ディジタル通信などの分
野に関する。
【0002】
【従来の技術】従来、「An Algorithm f
or Vector Quantizer Desig
n」(IEEE TRASACTIONS ONCOJ
MMUNICATIONS, VOL.COM−28,
NO.1,JANUARY 1980. by LIN
DE,BUZO and GRAY)に記載されている
ように、ベクトル量子化による、ディジタル信号のデー
タ圧縮が知られていた。
【0003】
【発明が解決しようとする課題】しかし、従来のベクト
ル量子化では、入力データを、コードブック中のT個の
コードベクトルのいづれかにコード化する際、入力デー
タとコードブック中の各コードベクトルとT回距離計算
をするため、コード化に時間がかかり、認識処理やデー
タ通信を実時間で処理することを困難にする、という問
題点があった。この問題点を解決し、データ圧縮処理の
計算時間を高速にすることが、本発明の課題である。
【0004】
【課題を解決するための手段】本発明のデータ符号化方
法は、データ符号化方法において、コードブック中の、
T個の各コードベクトルを、第1段階の分類として、M
(1)種類の各カテゴリーに分割することと、第2段階
の分類として、前記第1段階の分類のM(1)種類の各
カテゴリーを、それぞれM(2)種類の各カテゴリーに
分割し、M(1)*M(2)種類の各カテゴリーに分割
することと、前記の各段階の分類と同様にして、第N段
階の分類として、第N−1段階の分類のM(1)*M(
2)*・・・*M(N−1)種類の各カテゴリーを、そ
れぞれM(N)種類の各カテゴリーに分割し、M(1)
*M(2)*・・・*M(N)種類の各カテゴリーに分
割することと、前記段階数Nの値を3以上とすることと
、前記各カテゴリーの各特徴ベクトルを、前記各カテゴ
リーに含まれる前記各コードベクトルの重心ベクトルと
することと、入力データを前記コードブック中の前記コ
ードベクトルのいづれかに、コード化する際、第1探索
として、前記入力データと前記第1段階のM(1)種類
のカテゴリーの特徴ベクトルとの距離が最小となる、1
つの前記第1段階のカテゴリーを選択することと、第2
探索として、前記入力データと、選択された前記第1段
階のカテゴリーに属する前記M(2)種類のカテゴリー
の特徴ベクトルとの距離が最小となる、1つの前記第2
段階のカテゴリーを選択することと、前記の各探索と同
様にして、第N探索として、前記入力データと、選択さ
れた前記第N−1段階のカテゴリーに属する前記M(N
)種類のカテゴリーの特徴ベクトルとの距離が最小とな
る、1つの前記第N段階のカテゴリーを選択することと
、  最終探索として、前記入力データと、選択された
前記第N段階のカテゴリーに属する前記コードベクトル
との距離が最小となる、1つの前記コードベクトルを選
択し、前記入力データを、選択された1つの前記コード
ベクトルのコードに対応づけることと、第n探索(n≦
N)において選択された第n段階のカテゴリーに属する
前記コードベクトルが1個のみの時は、第n探索を最終
探索として、その前記コードベクトルのコードに、前記
入力データを対応づけること、を特徴とする。
【0005】
【実施例】(実施例1)本発明のデータ符号化方法を、
単語認識の音声認識装置に応用した場合の1実施例を図
面に沿って説明する。
【0006】図1は、本発明のデータ符号化方法を用い
た音声認識装置のシステム構成図である。話者によって
発話された音声を、マイク1より入力し、A/D変換部
2において、16[KHz]、12ビットのディジタル
信号に変換し、特徴抽出部3において、20[ms]を
1フレームとして、1フレーム毎に、ハミングウィンド
ウ処理、線形予測分析を行い、14次LPCケプストラ
ム係数を特徴パラメータとして求める。この時、フレー
ムのシフト量は10[ms]とする。このようにして得
た14次の特徴パラメータを入力ベクトルとして、デー
タ圧縮部4において、本発明のデータ符号化方法を用い
て、コードブック5中のコードベクトルの1つのコード
ベクトルにコード化する。データ圧縮部4においてコー
ド化されたコードの時系列と、あらかじめ学習させてあ
るX個の単語の標準パターンとを、単語認識部5におい
てHMM法を用いてパターンマッチングを行うことによ
り、単語認識する。このときX個の単語の標準パターン
は単語辞書7に登録されている。
【0007】本実施例においては、コードブック5中の
コードベクトルの総数は256個であり、6段階に分類
されている。また、このコードブック5中の256個の
コードベクトルは、20人の話者により発話された音声
を、16[KHz]、12ビットでサンプリングし、2
0[ms]を1フレーム、シフト量を10[ms]とし
て、1フレーム毎に、ハミングウィンドウ処理、線形予
測分析を行い、14次LPCケプストラム係数を特徴パ
ラメータとする数10万フレームの特徴パラメータ群か
ら、LBGアルゴリズムを用いて求めたものであり、各
々のコードベクトルの次数は14次である。このLBG
アルゴリズムとは、「AnAlgorithm for
Vector Quantizer Design」(
IEEE TRASACTIONS ON COMMU
NICATIONS,VOL.COM−28,NO.1
, JANUARY 1980. by LINDE,
BUZO and GRAY)に記載されているアルゴ
リズムである。
【0008】コードブック5中のコードベクトルの6段
階の分類について、図3を用いて簡単に説明する。図3
において、カテゴリー(0、1)301は256個のコ
ードベクトルを全部含むカテゴリー、すなわちコードブ
ックそのものとする。このカテゴリー(0、1)301
中の256個のコードベクトルを、第1段階の分類によ
って、2種類のカテゴリー、カテゴリー(1、1)30
2、カテゴリー(1、2)302、に分割する。カテゴ
リー302、303の特徴ベクトルは、各々のカテゴリ
に属するコードベクトルの重心ベクトルとする。第2段
階の分類として、第1段階の分類で分割された2種類の
カテゴリー302、303に属するコードベクトルを、
それぞれ2種類のカテゴリーに分割する。カテゴリー3
02に属するコードベクトルを分割したカテゴリーが、
カテゴリー304、305であり、カテゴリー303に
属するコードブックを分割したカテゴリーが、カテゴリ
ー306、307である。このように、第2段階の分類
では、コードベクトルは4種類のカテゴリーに分割され
る。各々のカテゴリーの特徴ベクトルは、第1段階の分
類と同様に、各々のカテゴリーに属するコードベクトル
の重心ベクトルとする。同様にして第3段階の分類では
、コードベクトルは、カテゴリー(3、1)308から
カテゴリー(3、8)309までの8種類のカテゴリー
に分割される。本実施例では、同様にして、6段階の分
類まで行う。第6段階の分類では、コードベクトルは、
カテゴリー(6、1)310からカテゴリー(6、64
)311までの64種類のカテゴリーに分割される。カ
テゴリー310に属するコードベクトルは、コードベク
トル312、313、314、315の4個であり、カ
テゴリー310の特徴ベクトルは、コードベクトル31
2、313、314、315の重心ベクトルである。
【0009】この分類のアルゴリズムを図2を用いて説
明する。
【0010】まず、記号を定義する。Nは分類の全段階
数とし、本実施例では6とする。nは分類の段階名とす
る。Iは第n−1段階の分類におけるカテゴリー数、i
はカテゴリー名とする。Cn(i)は第n段階の分類に
おいて新しくできたカテゴリーiの重心ベクトル、すな
わち、第n段階のiカテゴリーの特徴ベクトルである。
【0011】演算21において、nとIをそれぞれ1に
初期化する。これは、最初の分類が、第1段階の分類で
あることと、最初のカテゴリー数(第0段階の分類のカ
テゴリー数)は1種類(コードブックそのもの)である
ことを示す。
【0012】ループ22では、I種類のカテゴリーに属
するコードベクトルをそれぞれ2分割する計算を実行す
るために、演算23から演算27までをI回計算する。
【0013】演算23では、第n−1段階のiカテゴリ
ーに属するコードベクトルを2分割するための初期化と
して、第n−1段階のiカテゴリーに属するコードベク
トルのうち最も距離の離れた2個のコードベクトルを、
2個の重心ベクトルの初期値として選択する。
【0014】演算24では、第n−1段階のiカテゴリ
ーに属する各々のコードベクトルと2個の重心ベクトル
との距離計算をし、その距離が小さくなるように、各々
のコードベクトルを2種類のカテゴリーに分割する。
【0015】演算25では、演算24で分類された2種
類のカテゴリー毎に、それぞれのカテゴリーに属するコ
ードベクトルの重心ベクトルを求める。
【0016】分岐26では、演算24で分類された2種
類のカテゴリー毎に、演算25で求めた重心ベクトルと
そのカテゴリーに属するコードベクトルとの距離の和の
値が、収束条件を満たすか、否かで、演算27に進むか
、演算24、25を再計算するかを判断する。本実施例
での収束条件は、この距離の和がある一定値に収束した
時、収束したと判断し、収束した場合演算27を実行す
る。
【0017】演算27では、演算25で計算された2個
の重心ベクトルを、第n段階の分類の(2*i−1)カ
テゴリーと(2*i)カテゴリーの特徴ベクトルとして
、記憶しておく。
【0018】演算28では、段階名nの値を1つ増やし
、第n−1段階のカテゴリー数をIに代入する。
【0019】分岐29では、nがN以下の場合、ループ
22から演算28を実行し、nがNを越えた場合、分類
計算を終了とする。本実施例では、Nの値は6であるの
で、第6段階の分類まで計算を行い、各々のカテゴリー
の特徴ベクトルを求める。
【0020】以上の計算で求めた各カテゴリーの特徴ベ
クトルを用いて、入力データの1フレームの入力ベクト
ルをコード化する方法を、図3を用いて説明する。
【0021】第1の探索として、入力ベクトルと第1段
階の2種類のカテゴリー302、303の特徴ベクトル
C1(1)、C1(2)との距離が小さい方の、1つの
カテゴリーを選択する。
【0022】第2の探索として、入力ベクトルと、選択
された第1段階のカテゴリーに属する2種類のカテゴリ
ーの特徴ベクトルとの距離が小さい方の、1つのカテゴ
リーを選択する。仮に第1の探索で、カテゴリー303
が選択された場合、第2の探索では、カテゴリー306
、307の特徴ベクトルC2(3)、C2(4)との距
離が小さい方の、1つのカテゴリーを選択することにな
る。
【0023】同様にして、第6探索まで探索を行い、第
6段階の分類のカテゴリーを1つ選択する。
【0024】最終探索として、入力ベクトルと選択され
た第6段階のカテゴリーに属するコードベクトルとの距
離が最小となる、1つのコードベクトルを選択し、入力
ベクトルを、選択されたコードベクトルのコードに対応
づけることにより、入力ベクトルのコード化が完了する
【0025】第6段階の各カテゴリーに属するコードブ
ックの数は、平均4個である。よって、入力ベクトルを
コード化する際の距離計算の回数は、本実施例の場合、
各段階のカテゴリーの特徴ベクトルとの距離計算が2*
6=12回、第6段階のカテゴリーに属するコードベク
トルとの距離計算が平均4回、合計平均18回となる。 従来の方法でコード化を行った場合、256個すべての
コードベクトルと距離計算を行うため、距離計算の回数
は256回となる。よって、本発明のデータ符号化方法
を用いると、この実施例では、従来方法の約14倍の速
さでコード化が可能となる。
【0026】また、第n探索(n≦N)において選択さ
れた第n段階のカテゴリーに属するコードベクトルが1
個のみの時は、第n探索を最終探索として、そのコード
ベクトルのコードに、入力ベクトルを対応づける。
【0027】
【発明の効果】以上説明したように、本発明のデータ符
号化方法を用いることにより、入力データのコード化が
高速になるという効果がある。仮に、コードサイズを2
56とし、本発明のデータ符号化方法の分類を6段階と
し、第n段階の分類でのカテゴリー数を2n個とした場
合、コード化の際、従来方法では256回の距離計算が
必要なのに対し、本発明のデータ符号化方法では平均1
0回の距離計算をするだけでよいので、約25倍高速に
なる。
【0028】また、このようにコード化が高速になるた
め、コードサイズを大きくして、コード化に生ずる量子
化誤差を小さくすることが可能となる。
【図面の簡単な説明】
【図1】本発明のデータ符号化方法を音声認識装置に応
用した場合のシステム構成図。
【図2】本発明のデータ符号化方法において、コードベ
クトルを分割するアルゴリズムを示す図。
【図3】本発明のデータ符号化方法における、コードベ
クトルの分類を示す図。
【符号の説明】
1  マイク 2  A/D変換部 3  特徴抽出部 4  データ圧縮部 5  コードブック 6  単語認識部 7  単語辞書 21  演算 22  ループ 23  演算 24  演算 25  演算 26  分岐 27  演算 28  演算 29  分岐 301  カテゴリー 302  カテゴリー 303  カテゴリー 304  カテゴリー 305  カテゴリー 306  カテゴリー 307  カテゴリー 308  カテゴリー 309  カテゴリー 310  カテゴリー 311  カテゴリー 312  コードベクトル 313  コードベクトル 314  コードベクトル 315  コードベクトル

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  データ符号化方法において、コードブ
    ック中の、T個の各コードベクトルを、第1段階の分類
    として、M(1)種類の各カテゴリーに分割することと
    、第2段階の分類として、前記第1段階の分類のM(1
    )種類の各カテゴリーを、それぞれM(2)種類の各カ
    テゴリーに分割し、M(1)*M(2)種類の各カテゴ
    リーに分割することと、前記の各段階の分類と同様にし
    て、第N段階の分類として、第N−1段階の分類のM(
    1)*M(2)*・・・*M(N−1)種類の各カテゴ
    リーを、それぞれM(N)種類の各カテゴリーに分割し
    、M(1)*M(2)*・・・*M(N)種類の各カテ
    ゴリーに分割することと、前記段階数Nの値を3以上と
    することと、前記各カテゴリーの各特徴ベクトルを、前
    記各カテゴリーに含まれる前記各コードベクトルの重心
    ベクトルとすることと、入力データを前記コードブック
    中の前記コードベクトルのいづれかに、コード化する際
    、第1探索として、前記入力データと前記第1段階のM
    (1)種類のカテゴリーの特徴ベクトルとの距離が最小
    となる、1つの前記第1段階のカテゴリーを選択するこ
    とと、第2探索として、前記入力データと、選択された
    前記第1段階のカテゴリーに属する前記M(2)種類の
    カテゴリーの特徴ベクトルとの距離が最小となる、1つ
    の前記第2段階のカテゴリーを選択することと、前記の
    各探索と同様にして、第N探索として、前記入力データ
    と、選択された前記第N−1段階のカテゴリーに属する
    前記M(N) 種類のカテゴリーの特徴ベクトルとの距
    離が最小となる、1つの前記第N段階のカテゴリーを選
    択することと、最終探索として、前記入力データと、選
    択された前記第N段階のカテゴリーに属する前記コード
    ベクトルとの距離が最小となる、1つの前記コードベク
    トルを選択し、前記入力データを、選択された1つの前
    記コードベクトルのコードに対応づけることと、第n探
    索(n≦N)において選択された第n段階のカテゴリー
    に属する前記コードベクトルが1個のみの時は、第n探
    索を最終探索として、その前記コードベクトルのコード
    に、前記入力データを対応づけること、を特徴とするデ
    ータ符号化方法。
  2. 【請求項2】  請求項1に記載したデータ符号化方法
    において、コードブック中のコードベクトルを、学習デ
    ータをLBGアルゴリズムを用いて、ベクトル量子化し
    たコードベクトルとすることを特徴とするデータ符号化
    方法。
JP3014402A 1991-02-05 1991-02-05 データ符号化方法 Pending JPH04248722A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3014402A JPH04248722A (ja) 1991-02-05 1991-02-05 データ符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3014402A JPH04248722A (ja) 1991-02-05 1991-02-05 データ符号化方法

Publications (1)

Publication Number Publication Date
JPH04248722A true JPH04248722A (ja) 1992-09-04

Family

ID=11860055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3014402A Pending JPH04248722A (ja) 1991-02-05 1991-02-05 データ符号化方法

Country Status (1)

Country Link
JP (1) JPH04248722A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07110695A (ja) * 1993-09-27 1995-04-25 Internatl Business Mach Corp <Ibm> 音声符号化装置および方法
US6112173A (en) * 1997-04-01 2000-08-29 Nec Corporation Pattern recognition device using tree structure data
JP2005182829A (ja) * 2003-12-23 2005-07-07 Genesis Microchip Inc 一時的動きベクトルフィルタリング

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07110695A (ja) * 1993-09-27 1995-04-25 Internatl Business Mach Corp <Ibm> 音声符号化装置および方法
US6112173A (en) * 1997-04-01 2000-08-29 Nec Corporation Pattern recognition device using tree structure data
JP2005182829A (ja) * 2003-12-23 2005-07-07 Genesis Microchip Inc 一時的動きベクトルフィルタリング

Similar Documents

Publication Publication Date Title
JP3707154B2 (ja) 音声符号化方法及び装置
JP4005154B2 (ja) 音声復号化方法及び装置
JPH01291298A (ja) 適応型音声認識装置
JPH1097298A (ja) ベクトル量子化方法、音声符号化方法及び装置
JPH04171500A (ja) 音声パラメータ符号化方法
US8510105B2 (en) Compression and decompression of data vectors
Sugamura et al. Isolated word recognition using phoneme-like templates
EP2260486A1 (en) Reduced-complexity vector indexing and de-indexing
US9792910B2 (en) Method and apparatus for improving speech recognition processing performance
Billi Vector quantization and Markov source models applied to speech recognition
JPH04248722A (ja) データ符号化方法
GB1597468A (en) Conversion between linear pcm representation and compressed pcm
JP2658816B2 (ja) 音声のピッチ符号化装置
US20080162150A1 (en) System and Method for a High Performance Audio Codec
Gadkari et al. Noisy channel relaxation for VQ design
JPH0764599A (ja) 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置
JP3228389B2 (ja) 利得形状ベクトル量子化装置
JP2004120623A (ja) 符号化装置、符号化方法、復号装置及び復号方法
JPH06175695A (ja) 音声パラメータの符号化方法および復号方法
JPH08234797A (ja) 音声パラメータ量子化装置およびベクトル量子化装置
Rebollo-Neira Trigonometric dictionary based codec for music compression with high quality recovery
Wu et al. Source coding and vector quantization with codebook-excited neural networks
Smith et al. Application of a sequential pattern learning system to connected speech recognition
JPH0728226B2 (ja) 入力適応型量子化器・逆量子化器
JP3675054B2 (ja) ベクトル量子化方法、音声符号化方法及び装置、並びに音声復号化方法