JPH0552517B2

JPH0552517B2 -

Info

Publication number: JPH0552517B2
Application number: JP58131438A
Authority: JP
Inventors: Hiroaki Sekoe
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1983-07-19
Filing date: 1983-07-19
Publication date: 1993-08-05
Also published as: EP0139875A1; US4670850A; JPS6022283A; DE3477858D1; CA1214560A; EP0139875B1

Description

【発明の詳細な説明】本発明は文字や音声の認識システムの主要部を
構成するパターンマツチング装置の改良に関す
る。本発明は時系列パターンのマツチング処理に広
く利用され得るものであるが、以下では特に音声
パターンに例をとつて説明を行う。音声パターンは特徴の時系列として表現され、
このようなパターン間の比較処理、すなわちパタ
ーンマツチングを行つて音声認識を行う方法が広
く行われている。高精度な認識のためにはパター
ン変動に対して安定な、すなわちパターン変動吸
収能力の高いマツチング主法が必要とされる。時間方法の伸縮歪に対しては特願昭45−53896
号明細書（特公昭50−23941号公報）に記載され
た動的計画法（Dynamic Programming，以下
DPと略す）を用いたりDPマツチング法が適用さ
れ効果が得られている。しかし、実際の音声パターンには、時間伸縮以
外に、例えば「日本音響学会音声研究会資料S83
−25（1983年６月24日）に“連続音声中の母音の
音形について”と題して発表された論文」に記さ
れている如く、長音化（例えばkinoｕ→kino
ｏ），鼻音化、無声化、脱落（arｕ hito→ar＿
hito）のように局所的な変形が生じる。しかも、
これらの変形は定常的に発生したり、発生しなか
つたりするのではなく、発生の速度や前後の音韻
や単語などの要因に応じて不確定的である。このような変形に対処しうるDPマツチング法
として「特願昭57−156413号明細書」（以下文献
(1)と呼ぶ）及び「日本音響学会音声研究会資料
S83−23に“DPマツチングのある一般化”と題
して発表された論文」（以下文献(2)と呼ぶ）に記
載されている。「スタツクDPマツチング」と呼ば
れる方法がある。この方法を実行する装置は、上
記文献(1)を引用すると、「特徴の時系列中に分岐
開始記号、分岐区切り記号、分岐終了記号及び省
略開始記号、省略終了記号等の制御記号を含んで
成る標準パタンを記憶する標準パタン記憶部と、
特徴の時系列として記述される入力パタンを保持
する入力パタンバツフアと、上記標準パタン中の
各要素を制御信号と特徴とに分類するデコーダと
複数の記憶番地を層として多層構成されるスタツ
クメモリーと、上記入力パタンの特徴と標準パタ
ンの特徴間の距離を算出する距離計算部と、上記
スタツクメモリより読み出される複数個の数値を
比較し、それらの最小値に前記距離計算部よりの
出力を加算し、前記スタツクメモリに書き込むと
いう動的計画演算を行なうマツチング処理部と、
前記デコーダーよりの制御信号に応じて前記スタ
ツクメモリーをプツシユ、ポツプ各層間の最小値
選択各層間のデーター転送を行なうスタツク演算
部とより構成される。」と定義される。このスタツクDPマツチング法では、標準パタ
ーンを特徴の単純な時系列と考えず、時系列中に
分岐や省略を許容している。すなわち、“｛”，
“／”“｝”なる制御子を時系列中に許し、“｛”と
“｝”で囲まれ“／”で区切られる複数個の部分時
系列は、いずれか一つのみが選択されるとしてい
る。また制御子“〔”と“〕”で囲まれる部分時系
列は省略可能であり、省略すべきか否かが選択さ
れる。このような標準パターンと特徴時系列とのDP
マツチングの実行のため、複数の記憶番地を一層
として、多層構成されるスタツクメモリを用い
る。上記制御子が標準パターン時系列中に出現す
るのに応じて、DP計算に使用するスタツクの層
をPUSHあるいはPOPすることによつて、分岐
や省略を最適決定するというアルゴリズムがスタ
ツクDPマツチング法である。この手法によつて分岐や省略の可能性を含んだ
時系列のパターンマツチングが可能であり、前記
の無声化、鼻音化、脱落等の音声パターン変形に
対処出来る。しかし、上記文献(1)の第１図に関連
して述べられているごとく、従来のスタツクDP
マツチング法は本質的に横形窓式のDPマツチン
グ法を改良したものであつて、スタツクメモリの
各層にある幅（整合窓と呼ばれる）分の記憶番地
が必要とされるためスタツクメモリー全体として
の記憶量が大きくなるという問題があつた。また
最近「日本音響学会音声研究会資料S81−65
（1981年12月）に“クロツク同期伝播DP法による
連続音声認識の検討”と題して発表された論文
（以下文献(3)と呼ぶ）」に記載されている効率良い
連続単語認識アルゴリズム（以下クロツクワイズ
DP法と略称）が実行できないという難点があつ
た。本発明の目的は、従来のスタツクDPマツチン
グと同等の機能を有しながら所要メモリが少なく
かつクロツクワイズDP法への組込みにも適した
パターンマツチング装置を実現することにある。特徴の時系列中に分岐や省略を制御するための
制御子を含んでなる標準パターンを供給する手段
と、順次供給される入力パターンの特徴と前記標
準パターンの特徴との間の距離を算出する距離計
算部と、前記標準パターンの時系列中の位置に対
応して番地指定されるメモリと、このメモリより
読み出される複数個の数値を比較しそれらの最小
値に前記距離計算部よりの出力を加算するDPマ
ツチング漸化式を計算し、その計算結果を前記メ
モリに転写する漸化式計算部と、前記標準パター
ンに含まれる前記制御子とその出現位置をプツシ
ユ／ポツプするスタツクと、前記制御子の種類を
判定し、その種類に応じて前記スタツクを操作
し、かつ前記漸化式計算部で計算するDPマツチ
ング漸化式を制御するスタツク制御部とより構成
され、前記入力パターンの特徴が入力されると、
これに同期的に前記DPマツチング漸化式の計算
を実行できることを特徴とするパターンマツチン
グ装置。以下に図面を参照しながら実施例にもとづいて
本発明の原理と構成を詳述する。第１図は本発明の一実施例を示すブロツク図で
ある。この装置は制御部１０よりのアドレス信号
やクロツクパルス等の制御のもとに動作するが、
図中には説明のために必要な制御信号のみを示し
ている。音声入力パターンは前記特願昭45−53896号明
細書（特公昭50−23941号公報）の場合と同様に
特徴ベクトルa_iの時系列として、Ａ＝a₁，a₂……a_i……a_I (1) と記述されているとする。第２図に示すようにこ
のような特徴ベクトルa_iが順次、このパターンマ
ツチング装置に与えられるとする。標準パターン
記憶部２０には認識対象となる単語ごとに標準パ
ターンが記憶される。いま、単語に番号ｎをつけ
て指定することとし、Ｎ語の単語セツト、 Σ＝｛ｎ｜ｎ＝１，２，……Ｎ｝ (2) を考えることとする。単語ｎには標準パターン Bⁿ＝bⁿ ₁，bⁿ ₂……bⁿ _j……bⁿ _jｎ (3) が記憶される。なお、標準パターンを一般的に取
扱うときには添字ｎを省略して、Ｂ＝b₁，b₂……b_j……b_J (4) なる表現を用いる。この標準パターン中には特徴b_jの他に分岐や省
略を示す次のような制御子が含まれる。分岐開始 “｛” 分岐区分 “／” 分岐終了 “｝” 省略開始 “〔” 省略終了 “〕” これらの意味は、前記文献(1)，(2)と同様であ
る。例えば、Ｂ＝b₁，b₂｛b₃，b₄／b₅，b₆，b₇／b₈，b₉｝＝b₁₀，b₁₁〔b₁₂，b₁₃，b₁₄〕b₁₅ (5) なる標準パターンにおいては、b₃，b₄，b₅，b₆，
b₇，b₈，b₉，の部分系列は、いずれか１個のみが
選択される。また、部分系列b₁₂，b₁₃，b₁₄は省略
されてよい。標準パターン記憶部２０の内部では、第３図の
ように表現される。すなわち、各特徴b_jに付随し
て必要に応じて制御子が書き込まれている。メモ
リ８０は単語指定信号ｎとアドレス信号ｊとによ
つて番地指定され、Gⁿ（ｊ）なる値が記憶される
ようになつている。以下に本装置の動作を説明する。まず、最初の
特徴ベクトルa₁が入力されると単語指定信号ｎが
１から3nまで変化されるのに応じて、 Gⁿ（１）＝ｄ（１，１） (6) なる初期設定がなされる。ここにｄ（１，１）は、
ベクトルa₁とbⁿ ₁間のユークリツド距離である。一般には、ｄ（ｉ，ｊ）＝‖a_i−bⁿ _j‖ (7) と定義される。この初期設定は文献(1)の(6)式と同
じ処理であつて、公知であり、またそのための操
作は簡単なので詳細は省略する。次に、一般的にベクトルa_iが入力された時の動
作を第２図を参照して説明する。 a_iが入力されると、単語指定信号ｎが１からＮ
まで変化される。単語指定信号が値ｎとなるとメ
モリ８０よりGⁿ（ｊ）がｊ＝１からJⁿまでワーク
メモリ５１にG₁（ｊ）として転写される。続い
て、アドレス信号ｊが１からJⁿまで順次カウント
アツプされる。このｊとｎによつて番地指定され
前記標準パターン記憶部２０より特徴ベクトルb_j
が信号線ｂに、また、このベクトルに付随する制
御子信号が信号線Ｃに出力される。制御子が無かつた場合には、漸化式計算部５０
で次のような通常のDPマツチング漸化式の計算
が実行される。ｇ（ｉ，ｊ）＝ｄ（ｉ，ｊ）＋minｇ（ｉ−１，ｊ）ｇ（ｉ−１，ｊ−１）ｇ（ｉ−１，ｊ−２） (8) すなわち、前記ワークメモリ５１よりG₁（ｊ），
G₁（ｊ−１），G₁（ｊ−２）としてｇ（ｉ−１，
ｊ），ｇ（ｉ−１，ｊ−１）ｇ（ｉ−１，ｊ−２）
が読み込まれ、それらが比較され最小値が決定さ
れる。他方距離計算部４０では入力の特徴ベクト
ルa_iと標準パターンのベクトルbⁿ _jとのユークリツ
ト距離ｄ（ｉ，ｊ）が算出され、信号ｄとして漸
化式計算部５０に与えられる。この距離ｄ（ｉ，
ｊ）は前記の最小値と加算される。かくして(8)式
の計算が終了する。かくして得られたｇ（ｉ，ｊ）
はレジスタ５２にG₂（ｊ）として記入される。か
くの如き漸化式計算処理は特願昭56−199098号明
細書の第１０図に示す回路構成によつて実行でき
るが、ここでは同種の原理をマイクロプロセツサ
によつて実行することにする。かくの如く、制御
子が付いていないときは、(8)式の基本的な漸化式
計算を繰返される。このときのDPバスは第６図
ａに参照数字１で示す如きである。特徴ベクトルb_jに制御子が付いて読み出された
ときの動作を第４図ａ，ｂを引用して説明する。
制御子は信号線Ｃを経由してレジスタ６１に送ら
れる。さらに信号線C₁を経由してスタツク制御
部６３に送られ、制御子の種類が判定される。ス
タツク処理部６０には、この他に制御子スタツク
６２とアドレススタツクとの２種が内蔵されてお
り、それぞれ第５図ａ，ｂのような構成になつて
いる。制御子スタツクは、スタツクカウンタｋで
番地指定され、アドレススタツクはスタツクカウ
ンタｌで番地指定される。これらのカウンタの初
期値は１である。分岐開始制御子“｛”が与えられると、スタツ
ク制御部６３より制御信号PP１，PP２が発生さ
れる。その指示によつて制御子スタツク６２の第
ｋ番地に“｛”及びその時点での前記アドレス信
号ｊとが書き込まれ、アドレススタツクの第ｌ番
地には前記アドレス信号ｊが書き込まれる。その
後、ｋ＋１→ｋ，ｌ＋１→ｌなるPUSH処理が行
われる。特徴ベクトルb_jに対しては(8)式の処理が
行われる。分岐区分制御子“／”が検知されたときは、制
御信号PP１の指示によつてスタツク６２の第ｋ
番地に“／”とその時点のアドレス信号ｊとが書
き込まれ、ｋ＋１→ｋなるPUSH処理が行われ
る。またスタツク６４の第（ｌ−１）番地の内容
が信号j′として読み出される。スタツク制御部６
３は、この信号j′を信号jjとして漸化式計算部５
０に転送する。そこではこの信号jjを基にして次
のようなDP漸化式処理が実行される。ｇ（ｉ，ｊ）＝ｄ（ｉ，ｊ）＋minｇ（ｉ−１，ｊ）ｇ（ｉ−１，jj）ｇ（ｉ−１，jj−１） (9) この計算に必要な右辺のｇはワークメモリ５１
より読み出され、結果として得られるｇ（ｉ，ｊ）
がワークメモリ５２に記入されるのは、(8)式の場
合と同様である。ここで(9)式の意味を説明しておく。アドレスス
タツク６４より読み出される信号jjは、その直前
に現われた分岐開始制御子“｛”のアドレスｊの
値である。したがつて(9)式の右辺にあるｇ（ｉ−
１，jj）とｇ（ｉ−１，jj−１）の項は、分岐開始
制御子“｛”の直前から現在のアドレスｊへの接
続を評価していることになる。(5)式及び第３図の
例の中でｊ＝５における“／”に対応しては、第
６図に参照数字２で示すような漸化式が計算され
る。すなわち、ｊ＝２からの接続が評価されること
になる。ｊ＝８に表われる分岐区分制御子に対し
ても同様な処理が行われる。次に分岐終了制御子“｝”が検出されたときの
動作を説明する。制御信号PP１の働きにより、
ｋ−１→ｋとして制御子スタツク６２の第ｋ番地
より制御子とアドレス信号をC_jとして読み出すと
いうPOP処理が行われる。スタツク制御子６０では制御子が判定され、分
岐区分制御子“／”であつたならば前記のアドレ
ス信号を信号jjとして漸化式計算部５０に送る。
この処理は分岐開始制御子“｛”が制御子スタツ
ク６２から読み出されるまで繰返され、最後に制
御信号PP２の働きにより、ｌ→１→ｌとアドレ
ススタツク６４もPOPされる。この間漸化式計
算部５０では、ワークメモリ５１より読み出され
るｇ（ｉ−１，ｊ）とｇ（ｉ−１，ｊ−１），ｇ（ｉ
−１，ｊ−２）、順次与えられる前記信号jjに対
応してワークメモリ５１から読み出されるｇ（ｉ
−１，jj−１），ｇ（ｉ−１，jj−２）の群の最小
値検出が行われ、最後に最小値にｄ（ｉ，ｊ）が
加算される。すなわち、順次与えられるjjをj₁，
j₂……とするとき、ｇ（ｉ，ｊ）＝ｄ（ｉ，ｊ）＋minｇ（ｉ−
１，ｊ）ｇ（ｉ−１，ｊ−１）ｇ（ｉ−１，ｊ−２）ｇ（ｉ−１，j₁−１）ｇ（ｉ−１，ｊ−２）ｇ（ｉ−１，j₂−１）ｇ（ｉ−１，j₂−２） (10) なる漸化式計算が行われる。(5)式及び第３図の例
では、j₁，j₂としては、この“｝”の前に現れた
“／”の位置に対応してj₁＝８，j₂＝５が読み出さ
れる。したがつて、ｊ＝10では、ｇ（ｉ，10）＝ｄ（ｉ，10）＋minｇ（ｉ−
１，10）ｇ（ｉ−１，９）ｇ（ｉ−１，８）ｇ（ｉ−１，７）ｇ（ｉ−１，６）ｇ（ｉ−１，４）ｇ（ｉ−１，３） (11) なるDP漸化式が計算されることになる。すなわ
ち、分岐区分制御子“／”で分けられた３個の部
分系列のいずれが最適かを決定したことになる。
なお、このときのDPバスは第６図ｂに参照数字
３で示すごときである。省略開始制御子“〔”が検出されたときは、制
御子PP１の働きによつて“〔”と現時点のアドレ
ス信号ｊとが制御子スタツク６２の第ｋ番地に書
き込まれ、ｋ＋１→ｋとするPUSH処理が行われ
る。 DP漸化式としては(8)式が実行される。省略終
了制御子“〕”が検出されたときは、ｋ−１→ｋ
として制御子スタツクの第ｋ番地より信号C_jが読
み出される。そのアドレス信号の部分が、スタツ
ク制御部６３によつて、信号jjとして漸化式計算
部５０に転送される。そこでは次の漸化式が計算
される。ｇ（ｉ，ｊ）＝ｄ（ｉ，ｊ）＋minｇ（ｉ−
１，ｊ）ｇ（ｉ−１，ｊ−１）ｇ（ｉ−１，ｊ−２）ｇ（ｉ−１，jj）ｇ（ｉ−１，jj−１） (12) これによつて、（jj＋１）から（ｊ−１）まで
の部分系列を省略すべきか否かの判定が行われる
ことになる。(5)式を第３図の例ではｊ＝15の点で
第６図ａに参照数字15で示すような漸化式が計算
されることになる。以上述べたスタツク処理部６０と漸化式計算部
５０での処理を第４図にフローチヤートで示す。
かくの如き処理をｊ＝１，２，……Jⁿに対して行
うことによつてワークメモリ５２にG₂（ｊ）とし
てｇ（ｉ，ｊ）がすべて得られる。この時点でワ
ークメモリ５２の内容G₂（ｊ）は、メモリ８０に
Gⁿ（ｊ）として転写される。単語ｎに対する上記処理はｎ＝１，２……Ｎな
るすべての単語に対して実行される。この処理が
終了とすると次の入力特徴ベクトルa_i+1が入力さ
れ同様の処理が繰返される。最後の入力特徴ベク
トルa_Iに対する処理が終了した時点でGⁿ（Jⁿ）と
して入力パターンＡと標準パターンBⁿとの距離
Ｄ（Ａ，Bⁿ）が得られる。本パターンマツチング装置を音声認識システム
として用いる場合には、この距離Ｄ（Ａ，Bⁿ）を
比較してその最小となる単語名ｎを決定すること
によつて認識処理が達成される。かくして標準パターン中に分岐や省略を許容す
る制御子が存在する場合でも入力特徴ベクトルa_i
の入力に同期的にDPマツチング処理を実行でき
ることになつた。本発明によると、前記特願昭57−156413号明細
書の第８図に示されるごとき大容量なスタツクメ
モリが不要であり、かつ、パターンＡの入力が完
了する以前に、a_iの入力に同期して処理が実行で
きるという効果が得られる。以上、実施例に基づいて本発明の原理を説明し
たが、これらの記載は本発明の権利範囲を限定す
るものではない。例えば、本実施例ではa_iとb_iとの類似性を距離
ｄ（ｉ，ｊ）で評価したが、相関のように距離と
大小関係が逆の量を用いてもよい。その場合には
(8)式等の最小値選択操作を最大値選択操作に置換
えれば本発明の原理が、そのまま適用される。また、距離ｄ（ｉ，ｊ）を直接計算せず、例え
ば「電子通信学会誌Vol.J65−Ｄ，No.8（1982年
８月）のP1042の図１に示されるSPLIT方式と同
様にテーブル参照方式によつてもよい。この場合
には特徴b_jはベクトルではなく擬音韻を指定する
番号となる。また、本発明によるパターンマツチング装置で
処理の対象とするパターンは音声に限定されるも
のではない。例えば特願昭57−156413号明細書の
実施例の如くオンライン文字認識の文字パターン
であつてもよい。制御子の定義とその具体的処理にも種々の変形
が考えられる。例えば、省略も一種の分岐と考え
て、“〔”や“〕”を用いず、“｛”と“｝”の間に
“／”が無い場合は“｛”と“｝”で囲まれる部分
は省略可能であると定義することもできる。その
場合も“｝”が出現したとき第７図のフローチヤ
ートで示すような処理を行うことによつて、スタ
ツクによる制御が可能である。また、分岐処理や
省略処理は“｝”や“〕“で必ず閉じなければなら
ないという性質のものではない。例えば、 ……｛……／……／…… のように分岐した状態のままで終了させ、３種の
分岐の結果を並列に外部に出力するようにしても
よい。また、本パターンマツチング原理を前記特願昭
56−199098号明細書の第７図のDPマツチング部
160に組み込んで連続音声認識装置を実現するこ
とができるが、そのような応用でもDPマツチン
グ部に関しては本発明の権利範囲に含まれるもの
である。また、(8)式のDP漸化式のかわりに、例えば、
IEEE TRANSACTION ON ACOUSTICS
SPEECH AND SIGNAL PROCESSING，
Vol.ASSP−26，No.１のP47に示されるような
種々の漸化式を用いてもよい。

【図面の簡単な説明】

第１図は本発明の実施例ブロツク図であり、第
２図から第７図は、その動作説明図である。図中、１０は制御部、２０は標準パターン記憶
部、４０は距離計算部、５０は漸化式計算部、５
１はワークメモリ、６０はスタツク処理部、６１
はレジスタ、６２は制御子スタツク、６３はスタ
ツク制御部、６４はアドレススタツク、５２はワ
ークメモリ、８０はメモリをそれぞれ示す。

Claims

【特許請求の範囲】

１特徴の時系列中に分岐や省略を制御するため
の制御子を含んでなる標準パターンを供給する手
段と、順次供給される入力パターンの特徴と前記
標準パターンの特徴との間の距離を算出する距離
計算部と、前記標準パターンの時系列中の位置に
対応して番地指定されるメモリと、このメモリよ
り読み出される複数個の数値を比較しそれらの最
小値に前記距離計算部よりの出力を加算するDP
マツチング漸化式を計算し、その計算結果を前記
メモリに転写する漸化式計算部と、前記標準パタ
ーンに含まれる前記制御子とその出現位置をプツ
シユ／ポツプするスタツクと、前記制御子の種類
を判定し、その種類に応じて前記スタツクを操作
し、かつ前記漸化式計算部で計算するDPマツチ
ング漸化式を制御するスタツク制御部とより構成
され、前記入力パターンの特徴が入力されると、
これに同期的に前記DPマツチング漸化式の計算
を実行できることを特徴とするパターンマツチン
グ装置。