JPH021319B2

JPH021319B2 -

Info

Publication number: JPH021319B2
Application number: JP57079379A
Authority: JP
Inventors: Masao Watari
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1982-05-12
Filing date: 1982-05-12
Publication date: 1990-01-11
Also published as: US4837828A; JPS58196595A

Description

【発明の詳細な説明】本発明は、パターン認識のための特徴抽出を行
う装置に係り、直交変換と最小２乗近似直線を用
いた正規化により、正規化された特徴パラメータ
を求める装置の改良に関する。

従来、音声などにおける個人特性や伝送路特性
の正規化を行う方法としては、音声スペクトルの
最小２乗近似直線を求め、元の音声スペクトルよ
り差し引く方法があり、電子通信学会の信学技報
PRL79―４「非線形スペクトルマツチングによる
単語音声認識の一方式」1979年10月に記載されて
いる。その概要を次に述べる。

音声の個人特性には声道長の相違や放射特性の
相違などがあり、一方伝送路特性には電話回線特
性の相違などがあり、これらの特性を直線ａ・ｉ
＋ｂでモデル化することができる。第１図の原理
図に示すように音声スペクトルの最小２乗近似直
線を求め、元の音声スペクトルより最小２乗近似
直線を差し引くことにより、個人特性や伝送路特
性のバラツキを取り除いた正規化スペクトルを得
ることができる。以後正規化操作と称する。すな
わち、スペクトルをfi、最小２乗近似直線をａ・
ｉ＋ｂとすれば、正規化スペクトルgiは gi＝fi−（ａ・ｉ＋ｂ） ……(1) ただし、ｉ＝１，…，ｎで与えられる。また、最小２乗近似直線は誤差Ｅ
をＥ＝_o 〓ⁱ⁼¹ ｛fi−（ａ・ｉ＋ｂ）｝² ……(2) を最小とするａ，ｂによつて求められる。すなわ
ち ∂E／∂a＝０ ……(3) ∂E／∂b ……(4) によりａ，ｂが求められる。

一方、音声認識に用いる特徴抽出法は、コロナ
社出版の「パターン認識とその応用」の第21頁よ
り第28頁に記載されているように、フーリエ変
換、ウオルシユ・アダマール変換、KL変換
（Karhunen―Loeve変換）のような直交変換によ
る方法が知られている。フーリエ変換を用いる例
では、音声スペクトラムをフーリエ変換しケプス
トラム係数を求め、このケプストラム係数を入力
音声の特徴パラメータとする。

さらに、従来音声の個人特性や伝送路特性を正
規化した特徴パラメータを得る方法では、初めに
入力パターンの領域での最小２乗近似直線を求
め、入力パターンより最小２乗近似直線を差し引
き、その後直交変換を行つている。この時、最小
２乗近似直線の係数ａ，ｂは(2)，(3)，(4)式より求
められる。具体的にはによつて計算される。また、正規化のための計算
である最小２乗近似直線の差し引きは(1)式で与え
られる。この計算にはａ・ｉ＋ｂを前もつてテー
ブル化ておけばｎ＋１回の多量の減算を必要とす
る。

本発明の目的は、正規化のための最小２乗近似
直線の差し引きすなわち正規化操作を直交変換後
に行うことによつて計算量の少ないパターン特徴
抽出装置を提供することである。

次に本発明の原理について説明する。はじめに
加減算は直交変換によつて影響を受けないため、
直交変換をTkで表現すれば、 Tk｛fi−（ａ・ｉ＋ｂ）｝＝Tk（fi） −Tk｛（ａ・ｉ＋ｂ）｝ ……(7) ただし、ｋ＝１，…，ｍが成立する。直交変換Tkは特徴抽出する操作で
ある。直交係数はn′個存在するが通常特徴パラメ
ータとして使用される直交係数の数はｎより十分
小さいｍである。よつて(7)式は(1)式より計算量が
少ない。例えば音声認識では特徴パラメータとし
てケプストラム係数が用いられるが、その時Tk
はフーリエ変換でありｎ＝128、ｍ＝８程度で使
用されるため、(7)式の計算量は(1)式に比して１／
16である。さらにパーセバルの等式よりＥ＝_o 〓ⁱ⁼¹ ｜fi−（ａ・ｉ＋ｂ）｜² ＝_o′ 〓^K=1 ｜Tk｛fi−（ａ・ｉ＋ｂ）｝｜² ……(8) であり、線形操作は直交変換の影響を受けないた
めＥ＝_o′ 〓^K=1 ｜Tk（fi）−ａ・Tk（ｉ）−ｂ・Tk（１）｜² ＝_o′ 〓^K=1 〔〔Re｛Tk（fi）｝−ａ・Re｛Tk（ｉ）｝ −ｂ・Re｛Tk（１）｝〕² ＋〔Im｛Tk（fi）｝−ａ・Im｛Tk（ｉ）｝ −ｂ・Im｛Tk（１）｝〕₂〕 ……(9) ただしRe（ｘ），Im（ｘ）はそれぞれｘの実部、
虚部を意味する。

となり、(3)，(4)式より FI＝_o′ 〓〓^K=1 〔Re｛Tk（fi）｝・Re｛Tk（ｉ）｝＋Im｛Tk（fi）
｝・Im｛Tk（ｉ）｝〕……（10） FK＝_o′ 〓〓^K=1 〔Re｛Tk（fi）｝・Re｛Tk（１）｝＋Im｛Tk（fi）
｝・Im｛Tk（１）｝〕……（11） I2＝_o′ 〓^K=1 〔Re²｛Tk（ｉ）｝＋Im²｛Tk（ｉ）｝〕 ……（12） I₁＝_o′ 〓〓^K=1 〔Re｛Tk（ｉ）｝・Re｛Tk（１）｝＋Im｛Tk（ｉ）
｝・Im｛Tk（１）｝〕……（13） K2＝_o′ 〓^K=1 〔Re²｛Tk（１）｝＋Im²｛Tk（１）｝〕 ……（14）とすれば最小２乗直線のパラメータａ，ｂは FI−ａ・I2−ｂ・I1＝０ ……（15） FK−ａ・I1−ｂ・K2＝０ ……（16）にて求められる。ここで通常ｋの大きいTk（fi）
は、十分小さくするため、ｍより大きい項は省略
して FI≒_o 〓〓^K=1 〔Re｛Tk（fi）｝・Re｛Tk（ｉ）｝＋Im｛Tk（fi）
｝・Im｛Tk（ｉ）｝〕……（17） FK≒_o 〓〓^K=1 〔Re｛Tk（fi）｝・Re｛Tk（１）｝＋Im｛Tk（fi）
｝・Im｛Tk（１）｝〕……（18）を(10)，（11）式の代用とすることができる。

(7)，（15），（16）式より次のことが明らかであ
る。すなわち、入力パターンより最小２乗近似直
線を差し引き、直交変換し直交係数を求める従来
の方法は、入力パターン、最小２乗近似直線とも
に直交変換し、入力パターンの直交係数より最小
２乗近似直線の直交係数を差し引く方法と等価で
あり、後者は前者に比して計算量が少ない。ま
た、最小２乗近似直線のパラメータａ，ｂは前者
では(5)，(6)式にて与えられ、実際には変数がfiで
あるため_o 〓ⁱ⁼⁰ ・fiと_o 〓ⁱ⁼¹ fiを計算すればよい。一方、
後者では（15），（16）式にて与えられ、実際には
変数がTk（fi）であるため、（17），（18）式を計
算すればよい。多くの場合、Tk（１）＝０であり、
Re｛Tk（ｉ）｝とIm｛Tk（ｉ）｝はどちらかがゼロ
になる。また（17），（18）式は後述の（20），
（24）式のように変形でき、ｋまたはk²に反比例
するため近似的にはｍより小さなｐまで加算すれ
ば十分である。すなわち（20）′，（24）′式のよ
うになる。よつて計算量を比較すると後者は前者
のｐ／ｎと小さくなる。

以上述べたように、従来直交変換の前に行われ
ていた最小２乗直線を差し引く、すなわち正規化
操作を直交変換の後で行うことが可能であり、さ
らに計算量も少ない。

次に直交変換として具体的にフーリエ変換、
cos変換を用いる場合、直交変換後の正規化操作
(7)式と最小２乗近似直線のパラメータａ（15）式
の具体的な計算方法を述べる。始めに直交変換と
してフーリエ変換を用いる場合、すなわち Tk（fi）＝_o 〓〓ⁱ⁼¹ fi・（cos2kiπ／ｎ＋jsin2kiπ／ｎ）＝Re（C^f _k）
＋jIm（C^f _k）……（19）にて直交変換を行う場合、（17），（18），（12），
（13），（14）式は FI＝_o 〓^K=1 Im（C^f _k）・ｎ／ｋ FK＝０ I2＝_o 〓^K=1 n²／k² I1＝０ K2＝０となるので、（15）式へ代入してとなる。ここで（20）式の分子の項の１／ｋ
Im（C^f _k））はｋが大きくなればゼロに近づくため
近似的にはｍより小さなｐまで加算すれば十分で
ある。よつて（20）式はでおきかえることができる。最小２乗近似直線の
直交係数は、 Tk（ａ・ｉ＋ｂ）＝ｊｎ／ｋａ ……（21）となり、正規化特徴パラメータをC^g _kとすれば、
正規化操作(7)式は C^g _k＝C^f _k−ｊna／ｋ ……（22）となる。すなわち、最小２乗近似直線のパラメー
タａは（20）式にて計算され、最小２乗近似直線
の直交係数は（21）にて計算され正規化操作は
（22）式にて計算できる。

さらに、直交変換としてcos変換を用いる場合
すなわち Tk（fi）＝_o 〓ⁱ⁼¹ fi・coskiπ／ｎ＝C^f _k ……（23）にて直交変換を行う場合、（17），（18），（12），
（13），（14）式は FI＝_o 〓^K=1 C^f _k・ｎ／k²n・｛（−１）^k−１｝ FK＝０ I2＝_o 〓^K=1 n²／k⁴π²｛（−１）^k−１｝² I1＝０ K2＝０となるので、（15）式へ代入してとなる。ここで（24）式の分子の項のC_k／k²は
ｋが大きくなればゼロに近づくため近似的にはｍ
より小さなｐまで加算すれば十分である。よつて
（24）式はとなり、最小２乗近似直線の直交係数は Tk（ａ・ｉ＋ｂ）＝an／k²π｛（−１）^k−１｝ ……（25）となり、正規化操作(7)式は C^g _k＝C^f _k−an／k²π｛（−１）^k−１｝ ……（26）となる。すなわち、最小２乗近似直線のパラメー
タａは（24）式にて計算され、最小２乗近似直線
の直交係数は（25）式にて計算され、正規化操作
は（26）式にて計算できる。

本発明のパターン特徴抽出装置は最小２乗近似
直線にて正規化し、直交変換を行つて正規化特徴
パラメータを得る装置であるから次のような各部
を必要とする。すなわち、入力パターンを直交変
換し直交係数を求める直交変換部と、直交変換前
の領域における最小２乗近似直線の直交係数を求
める近似直交線計算部と、前記近似直線計算部よ
り得られる最小２乗近似直線の直交係数を入力パ
ターンの直交係数から減算する減算部を有してい
る。

次に本発明の装置の具体的構成を図面を参照し
ながら説明する。

第２図は本発明の第１と第２の実施例の共通の
ブロツク図である。

第１の実施例は直交変換としてリーフエ変換が
用いられる。はじめに直交変換部１では（19）式
のように入力パターンfiをフーリエ変換し、直交
係数である特徴パラメータRe（C^f _k）、Im（C^f _k）が
求められる。次に近似直線計算部２では（20）、
（21）式のように最小２乗近似直線の直交係数Tk
（ａ・ｉ＋ｂ）が、入力パターンの直交係数C^f _kよ
り求められる。さらに減算部３では、（22）式の
ように入力パターンの直交係数より最小２乗近似
直線の直交係数を差し引き、正規化特徴パラメー
タC^g _kが求められる。

第３図は直交変換部１としてフーリエ変換によ
る場合の具体的な一実施例を示すブロツク図であ
る。cosテーブル１１４はcos2kπ／ｎ，ｋ＝０〜ｎ −１すなわちcosの値をｎ個記憶しているテーブ
ルであり、sinテーブル１１８はsin2kπ／ｎ，ｋ＝０〜ｎ−１すなわちsinの値をｎ個記憶しているテ
ーブルであり、直交変換制御部１１９より示され
る信号によりcos又はsinの値を乗算器１１１又は
１１５へ出力する。始めに直交変換部１へ入力さ
れた入力パターンfi，ｉ＝１〜ｎは入力メモリ１
１０へ一時記憶される。記憶された後第４図に示
したタイミングチヤートに従つて直交変換制御部
１１９より信号ｉ，ki，clが出力される。ここで
信号ｉは１よりｎまで変化しそれがｍ回繰返され
る。さらに信号clは信号ｉが１となる直前に出さ
れる信号であり、信号kiにはＲ〔kxi，ｎ〕（ただ
しＲ〔〕はｎで割つた余りである）のｉ＝１〜ｎ，
ｋ＝１〜ｍまで変化した値が出力される。すなわ
ち１，２，…，２，３，…，３，６，…の値が出
力される。信号ｉに従つて入力メモリ１１０より
fiがｉ＝０よりｎ−１まで順に読み出され乗算器
１１１と１１５へ出力される。また、信号kiに従
つてcosテーブル１１４とsinテーブル１１８より
cos2kiπ／ｎとsin2kiπ／ｎがそれぞれ読み出され、乗
算器１１１と１１５へそれぞれ出力される。乗算器
１１１と１１５はそれぞれfi・cos2kiπ／ｎとfi・sin 2kiπ／ｎの乗算を行い、加算器１１２と１１６は乗算器１１１と１１５の出力より_o 〓ⁱ⁼¹ fi・cos2kiπ／ｎと_o 〓ⁱ⁼¹ fi・sin2kiπ／ｎをそれぞれ求める。すなわち、信号ｉの値がｎと一致した時点で、アキユムレータ
１１３と１１７にフーリエ係数の実部Re（C^f _k）と
虚部Im（C^f _k）が得られる。

第５図は近似直線計算部２の具体的構成を示す
ブロツク図である。直交変換部１よりの出力であ
るフーリエ係数の虚部Im（C^f _k）ｋ＝１よりｐまで
が、近似直線計算部２の入力メモリ２１０へ一時
記憶される。記憶された後、第６図に示したタイ
ミングチヤートに従つて近似直線計算制御部２１
７より信号ｋ，ｌ，clが出力される。ここで信号
ｋはｌよりｍまで変化し、信号ｌは１よりｍまで
変化する。信号clはアキユムレータ２１３をクリ
アする信号である。信号ｋに従つて入力メモリ２
１０よりIm（C^f _k）がｋ＝１〜ｐまで順に読み出さ
れ、割算器２１１によつてIm（C^f _k）／ｋが求めら
れ、加算器２１２とアキユムレータ２１３によつ
てその和である_n 〓^K=1 Im（C^f _k）／ｋが求められる。
さらに割算器２１４において定数メモリ２１５の
定数_n 〓^K=1 １／k²により割算され（20―ａ）式に示す近似直線のパラメータａのｎ倍すなわちnaが求め
られる。続いて信号ｌに従つて割算器２１６の除
算へｌが与えられその結果na／ｌがすなわち（21）式に示す近似直線の直交係数の虚部が求められ
る。一方、近似直線の直交係数の実部は（21）式
に示されるようにゼロである。

第７図は減算部３の具体的構成を示すブロツク
図である。減算部３は(7)式に示すように直交変換
部１より出力される直交係数Tk（fi）より最小２
乗近似直線の直交係数Tk（ａ・ｉ＋ｂ）を減算す
る部分である。はじめに直交係数Tk（fi）は直交
変換部１よりｍ個与えられ入力メモリ３１へ一時
記憶される。また直交係数Tk（ａ・ｉ＋ｂ）は近
似直線計算部２よりｍ個与えられ入力メモリ３２
へ一時記憶される。記憶された後、減算制御部３
４より出力される信号ｋによつて、入力メモリ３
１と３２よりそれぞれTk（fi）とTk（ａ・ｉ＋
ｂ）が読み出され、減算器３３にて減算され、正
規化されたパラメータTk（fi）−Tk（ａ・ｉ＋ｂ）
が出力される。

また、第２の実施例は直交変換としてcos変換
が用いられる。はじめに直交変換部１では（23）
式のように入力パターンfiをcos変換し、直交係
数である特徴パラメータC^f _kが求められる。次に
近似直線計算部２で（24），（25）式のように最小
２乗近似直線の直交係数Tk（ａ・ｉ＋ｂ）が、入
力パターンの直交係数C^f _kより求められる。さら
に減算部３では（26）式のように入力パターンの
直交係数より最小２乗近似直線の直交係数を差し
引き、正規化特徴パラメータC^k _gが求められる。

第８図はcos変換を行う直交変換部１の具体的
構成を示すブロツク図である。この実施例は、第
１の実施例におけるフーリエ変換を行う直交変換
部１のsinテーブル１１８、sinの演算用の乗算器
１１５、加算器１１６、アキユムレータ１１７を
除いた構成となつている。動作は第１の実施例に
おけるフーリエ変換を行う直交変換部１と以下に
示す２点を除き同じ動作をする。第１の相異点は
cosテーブルに記憶されるcosの値にある。すなわ
ち、cosテーブル２１４はcoskπ／ｎ，ｋ＝０〜2n− １の2n個のcosの値を記憶しているテーブルであ
る。第２の相異点は信号kiにある。すなわち信号
kiはＲ〔kxi，2n〕（ただしＲ〔〕は2nで割つた
余りである）のｉ＝１〜ｎ，ｋ＝１〜ｍまで変化
した値が出力される。

第９図は、近似直線計算部２の具体的構成を示
すブロツク図である。直交変換部１よりの出力で
ある直交係数の奇数項C^f _kｋ＝１，３，…，ｐま
でが入力メモリ２２０へ一時記憶される。記憶さ
れた後、第１０図に示したタイミングチヤートに
従つて近似直線計算制御部２２７より信号ｋ，
k2，l2が出力される。ここで信号ｋは１よりｐま
で奇数のみを取つて変化し、信号k2はk²の値が
出力され、信号l2にはｌ＝１〜ｍまで奇数のみ取
つて変化するl²の値が出力される。信号clはアキ
ユムレータ２２３をクリアする信号である。信号
ｋに従つて入力メモリ２２０よりC^f _kの奇数項が
ｋ＝１，３，…，ｐまで順に読み出され、割算器
２２１によつてC_k／k²が求められ、加算器２２
２とアキユムレータ２２３によつてその和である
_2P′_-1 〓〓^K ′⁼¹C_2k′−１／（2k′−１）²（ただしｋ＝2k′−１
，
ｍ＝2m′−１）が求められる。さらににに割算器
２２４において定数メモリ２２５の定数_o 〓^K=1 １／k⁴ ｛（−１）^k−１｝²により割算され（24）式に示す近
似直線のパラメータａの−ｎ／2π倍すなわち−na／2π が求められる。続いて信号l₂に従つて割算器２２
６の除数へl²が与えられその結果−an／2l²πすなわち（25）式に示す近似直線の直交係数の奇数項が求
められる。一方、近似直線の直交係数の偶数項は
（25）式に示されるようにゼロである。

さらに第２の実施例における減算部３は、第１
の実施例の減算部３と同一の構成をとることがで
きる。

以上本発明を実施例に基づき説明したが、これ
らの記載は本発明の範囲を限定するものではな
い。特に本発明の原理の説明では最小２乗近似直
線のパラメータａ，ｂを求める(10)〜（16）式にお
ける直交係数Tk（fi）と正規化操作を行う(7)式に
おける直交係数Tk（fi）は同一のものとしてある
が、最小２乗近似直線は複数の入力パターンの平
均より求める方法、すなわち(10)〜（16）式に用い
られるfiを複数の入力パターンの平均パターン
に置き換えて計算する方法も可能であることは明
白である。

【図面の簡単な説明】

第１図は本発明を説明するための原理図であ
り、第２図は本発明の実施例のブロツク図であ
り、第３図は第１の実施例の直交変換部１のブロ
ツク図であり、第４図は第３図に対応するタイミ
ングチヤートであり、第５図は第１の実施例の近
似直線計算部２のブロツク図であり、第６図は第
５図に対応するタイミングチヤートであり、第７
図は減算部３のブロツク図であり、第８図は第２
の実施例の直交変換部２のブロツク図であり、第
９図は第２の実施例の近似直線計算部２のブロツ
ク図であり、第１０図は第９図に対応するタイミ
ングチヤートである。図において１は直交変換部、２は近似直線計算
部、３は減算部であり、１１０と１２０は入力メ
モリ、１１１，１１５と１２１は乗算器、１１
２，１１６と１２２は加算器、１１３，１１７と
１２３はアキユムレータ、１１４と１２４はcos
テーブル、１１８はsinテーブル、１１９と１２
９は直交変換制御部であり、２１０と２２０は入
力メモリ、２１１，２１４，２１６，２２１，２
２４，２２６は割算器、２１２と２２２は加算
器、２１３と２２３はアキユムレータ、２１５と
２２５は定数メモリ、２１７と２２７は近似直線
制御部であり、３１と３２は入力メモリ、３３は
減算器、３４は減算制御部である。

Claims

【特許請求の範囲】

１ｎ次元の特徴パラメータからなる入力パター
ンを直交変換しｍ（ｍ＜ｎ）個の直交係数を求め
る直交変換部と、直交変換前の領域における最小
２乗近似直線の直交係数をｐ（ｐ＜ｍ）個の直交
係数より求める近似直線計算部と、前記近似直線
計算部より得られる最小２乗近似直線の直交係数
を入力パターンの直交係数から減算する減算部を
持つことを特徴とするパターン特徴抽出装置。