JPH0552517B2 - - Google Patents
Info
- Publication number
- JPH0552517B2 JPH0552517B2 JP58131438A JP13143883A JPH0552517B2 JP H0552517 B2 JPH0552517 B2 JP H0552517B2 JP 58131438 A JP58131438 A JP 58131438A JP 13143883 A JP13143883 A JP 13143883A JP H0552517 B2 JPH0552517 B2 JP H0552517B2
- Authority
- JP
- Japan
- Prior art keywords
- stack
- recurrence formula
- matching
- memory
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
本発明は文字や音声の認識システムの主要部を
構成するパターンマツチング装置の改良に関す
る。 本発明は時系列パターンのマツチング処理に広
く利用され得るものであるが、以下では特に音声
パターンに例をとつて説明を行う。 音声パターンは特徴の時系列として表現され、
このようなパターン間の比較処理、すなわちパタ
ーンマツチングを行つて音声認識を行う方法が広
く行われている。高精度な認識のためにはパター
ン変動に対して安定な、すなわちパターン変動吸
収能力の高いマツチング主法が必要とされる。 時間方法の伸縮歪に対しては特願昭45−53896
号明細書(特公昭50−23941号公報)に記載され
た動的計画法(Dynamic Programming,以下
DPと略す)を用いたりDPマツチング法が適用さ
れ効果が得られている。 しかし、実際の音声パターンには、時間伸縮以
外に、例えば「日本音響学会音声研究会資料S83
−25(1983年6月24日)に“連続音声中の母音の
音形について”と題して発表された論文」に記さ
れている如く、長音化(例えばkinou→kino
o),鼻音化、無声化、脱落(aru hito→ar_
hito)のように局所的な変形が生じる。しかも、
これらの変形は定常的に発生したり、発生しなか
つたりするのではなく、発生の速度や前後の音韻
や単語などの要因に応じて不確定的である。 このような変形に対処しうるDPマツチング法
として「特願昭57−156413号明細書」(以下文献
(1)と呼ぶ)及び「日本音響学会音声研究会資料
S83−23に“DPマツチングのある一般化”と題
して発表された論文」(以下文献(2)と呼ぶ)に記
載されている。「スタツクDPマツチング」と呼ば
れる方法がある。この方法を実行する装置は、上
記文献(1)を引用すると、「特徴の時系列中に分岐
開始記号、分岐区切り記号、分岐終了記号及び省
略開始記号、省略終了記号等の制御記号を含んで
成る標準パタンを記憶する標準パタン記憶部と、
特徴の時系列として記述される入力パタンを保持
する入力パタンバツフアと、上記標準パタン中の
各要素を制御信号と特徴とに分類するデコーダと
複数の記憶番地を層として多層構成されるスタツ
クメモリーと、上記入力パタンの特徴と標準パタ
ンの特徴間の距離を算出する距離計算部と、上記
スタツクメモリより読み出される複数個の数値を
比較し、それらの最小値に前記距離計算部よりの
出力を加算し、前記スタツクメモリに書き込むと
いう動的計画演算を行なうマツチング処理部と、
前記デコーダーよりの制御信号に応じて前記スタ
ツクメモリーをプツシユ、ポツプ各層間の最小値
選択各層間のデーター転送を行なうスタツク演算
部とより構成される。」と定義される。 このスタツクDPマツチング法では、標準パタ
ーンを特徴の単純な時系列と考えず、時系列中に
分岐や省略を許容している。すなわち、“{”,
“/”“}”なる制御子を時系列中に許し、“{”と
“}”で囲まれ“/”で区切られる複数個の部分時
系列は、いずれか一つのみが選択されるとしてい
る。また制御子“〔”と“〕”で囲まれる部分時系
列は省略可能であり、省略すべきか否かが選択さ
れる。 このような標準パターンと特徴時系列とのDP
マツチングの実行のため、複数の記憶番地を一層
として、多層構成されるスタツクメモリを用い
る。上記制御子が標準パターン時系列中に出現す
るのに応じて、DP計算に使用するスタツクの層
をPUSHあるいはPOPすることによつて、分岐
や省略を最適決定するというアルゴリズムがスタ
ツクDPマツチング法である。 この手法によつて分岐や省略の可能性を含んだ
時系列のパターンマツチングが可能であり、前記
の無声化、鼻音化、脱落等の音声パターン変形に
対処出来る。しかし、上記文献(1)の第1図に関連
して述べられているごとく、従来のスタツクDP
マツチング法は本質的に横形窓式のDPマツチン
グ法を改良したものであつて、スタツクメモリの
各層にある幅(整合窓と呼ばれる)分の記憶番地
が必要とされるためスタツクメモリー全体として
の記憶量が大きくなるという問題があつた。また
最近「日本音響学会音声研究会資料S81−65
(1981年12月)に“クロツク同期伝播DP法による
連続音声認識の検討”と題して発表された論文
(以下文献(3)と呼ぶ)」に記載されている効率良い
連続単語認識アルゴリズム(以下クロツクワイズ
DP法と略称)が実行できないという難点があつ
た。 本発明の目的は、従来のスタツクDPマツチン
グと同等の機能を有しながら所要メモリが少なく
かつクロツクワイズDP法への組込みにも適した
パターンマツチング装置を実現することにある。 特徴の時系列中に分岐や省略を制御するための
制御子を含んでなる標準パターンを供給する手段
と、順次供給される入力パターンの特徴と前記標
準パターンの特徴との間の距離を算出する距離計
算部と、前記標準パターンの時系列中の位置に対
応して番地指定されるメモリと、このメモリより
読み出される複数個の数値を比較しそれらの最小
値に前記距離計算部よりの出力を加算するDPマ
ツチング漸化式を計算し、その計算結果を前記メ
モリに転写する漸化式計算部と、前記標準パター
ンに含まれる前記制御子とその出現位置をプツシ
ユ/ポツプするスタツクと、前記制御子の種類を
判定し、その種類に応じて前記スタツクを操作
し、かつ前記漸化式計算部で計算するDPマツチ
ング漸化式を制御するスタツク制御部とより構成
され、前記入力パターンの特徴が入力されると、
これに同期的に前記DPマツチング漸化式の計算
を実行できることを特徴とするパターンマツチン
グ装置。 以下に図面を参照しながら実施例にもとづいて
本発明の原理と構成を詳述する。 第1図は本発明の一実施例を示すブロツク図で
ある。この装置は制御部10よりのアドレス信号
やクロツクパルス等の制御のもとに動作するが、
図中には説明のために必要な制御信号のみを示し
ている。 音声入力パターンは前記特願昭45−53896号明
細書(特公昭50−23941号公報)の場合と同様に
特徴ベクトルaiの時系列として、 A=a1,a2……ai……aI (1) と記述されているとする。第2図に示すようにこ
のような特徴ベクトルaiが順次、このパターンマ
ツチング装置に与えられるとする。標準パターン
記憶部20には認識対象となる単語ごとに標準パ
ターンが記憶される。いま、単語に番号nをつけ
て指定することとし、N語の単語セツト、 Σ={n|n=1,2,……N} (2) を考えることとする。単語nには標準パターン Bn=bn 1,bn 2……bn j……bn jn (3) が記憶される。なお、標準パターンを一般的に取
扱うときには添字nを省略して、 B=b1,b2……bj……bJ (4) なる表現を用いる。 この標準パターン中には特徴bjの他に分岐や省
略を示す次のような制御子が含まれる。 分岐開始 “{” 分岐区分 “/” 分岐終了 “}” 省略開始 “〔” 省略終了 “〕” これらの意味は、前記文献(1),(2)と同様であ
る。 例えば、 B=b1,b2{b3,b4/b5,b6,b7/b8,b9} =b10,b11〔b12,b13,b14〕b15 (5) なる標準パターンにおいては、b3,b4,b5,b6,
b7,b8,b9,の部分系列は、いずれか1個のみが
選択される。また、部分系列b12,b13,b14は省略
されてよい。 標準パターン記憶部20の内部では、第3図の
ように表現される。すなわち、各特徴bjに付随し
て必要に応じて制御子が書き込まれている。メモ
リ80は単語指定信号nとアドレス信号jとによ
つて番地指定され、Gn(j)なる値が記憶される
ようになつている。 以下に本装置の動作を説明する。まず、最初の
特徴ベクトルa1が入力されると単語指定信号nが
1から3nまで変化されるのに応じて、 Gn(1)=d(1,1) (6) なる初期設定がなされる。ここにd(1,1)は、
ベクトルa1とbn 1間のユークリツド距離である。 一般には、 d(i,j)=‖ai−bn j‖ (7) と定義される。この初期設定は文献(1)の(6)式と同
じ処理であつて、公知であり、またそのための操
作は簡単なので詳細は省略する。 次に、一般的にベクトルaiが入力された時の動
作を第2図を参照して説明する。 aiが入力されると、単語指定信号nが1からN
まで変化される。単語指定信号が値nとなるとメ
モリ80よりGn(j)がj=1からJnまでワーク
メモリ51にG1(j)として転写される。続い
て、アドレス信号jが1からJnまで順次カウント
アツプされる。このjとnによつて番地指定され
前記標準パターン記憶部20より特徴ベクトルbj
が信号線bに、また、このベクトルに付随する制
御子信号が信号線Cに出力される。 制御子が無かつた場合には、漸化式計算部50
で次のような通常のDPマツチング漸化式の計算
が実行される。 g(i,j)=d(i,j)+ming(i−1,j) g(i−1,j−1) g(i−1,j−2) (8) すなわち、前記ワークメモリ51よりG1(j),
G1(j−1),G1(j−2)としてg(i−1,
j),g(i−1,j−1)g(i−1,j−2)
が読み込まれ、それらが比較され最小値が決定さ
れる。他方距離計算部40では入力の特徴ベクト
ルaiと標準パターンのベクトルbn jとのユークリツ
ト距離d(i,j)が算出され、信号dとして漸
化式計算部50に与えられる。この距離d(i,
j)は前記の最小値と加算される。かくして(8)式
の計算が終了する。かくして得られたg(i,j)
はレジスタ52にG2(j)として記入される。か
くの如き漸化式計算処理は特願昭56−199098号明
細書の第10図に示す回路構成によつて実行でき
るが、ここでは同種の原理をマイクロプロセツサ
によつて実行することにする。かくの如く、制御
子が付いていないときは、(8)式の基本的な漸化式
計算を繰返される。このときのDPバスは第6図
aに参照数字1で示す如きである。 特徴ベクトルbjに制御子が付いて読み出された
ときの動作を第4図a,bを引用して説明する。
制御子は信号線Cを経由してレジスタ61に送ら
れる。さらに信号線C1を経由してスタツク制御
部63に送られ、制御子の種類が判定される。ス
タツク処理部60には、この他に制御子スタツク
62とアドレススタツクとの2種が内蔵されてお
り、それぞれ第5図a,bのような構成になつて
いる。制御子スタツクは、スタツクカウンタkで
番地指定され、アドレススタツクはスタツクカウ
ンタlで番地指定される。これらのカウンタの初
期値は1である。 分岐開始制御子“{”が与えられると、スタツ
ク制御部63より制御信号PP1,PP2が発生さ
れる。その指示によつて制御子スタツク62の第
k番地に“{”及びその時点での前記アドレス信
号jとが書き込まれ、アドレススタツクの第l番
地には前記アドレス信号jが書き込まれる。その
後、k+1→k,l+1→lなるPUSH処理が行
われる。特徴ベクトルbjに対しては(8)式の処理が
行われる。 分岐区分制御子“/”が検知されたときは、制
御信号PP1の指示によつてスタツク62の第k
番地に“/”とその時点のアドレス信号jとが書
き込まれ、k+1→kなるPUSH処理が行われ
る。またスタツク64の第(l−1)番地の内容
が信号j′として読み出される。スタツク制御部6
3は、この信号j′を信号jjとして漸化式計算部5
0に転送する。そこではこの信号jjを基にして次
のようなDP漸化式処理が実行される。 g(i,j)=d(i,j)+ming(i−1,j) g(i−1,jj) g(i−1,jj−1) (9) この計算に必要な右辺のgはワークメモリ51
より読み出され、結果として得られるg(i,j)
がワークメモリ52に記入されるのは、(8)式の場
合と同様である。 ここで(9)式の意味を説明しておく。アドレスス
タツク64より読み出される信号jjは、その直前
に現われた分岐開始制御子“{”のアドレスjの
値である。したがつて(9)式の右辺にあるg(i−
1,jj)とg(i−1,jj−1)の項は、分岐開始
制御子“{”の直前から現在のアドレスjへの接
続を評価していることになる。(5)式及び第3図の
例の中でj=5における“/”に対応しては、第
6図に参照数字2で示すような漸化式が計算され
る。 すなわち、j=2からの接続が評価されること
になる。j=8に表われる分岐区分制御子に対し
ても同様な処理が行われる。 次に分岐終了制御子“}”が検出されたときの
動作を説明する。制御信号PP1の働きにより、
k−1→kとして制御子スタツク62の第k番地
より制御子とアドレス信号をCjとして読み出すと
いうPOP処理が行われる。 スタツク制御子60では制御子が判定され、分
岐区分制御子“/”であつたならば前記のアドレ
ス信号を信号jjとして漸化式計算部50に送る。
この処理は分岐開始制御子“{”が制御子スタツ
ク62から読み出されるまで繰返され、最後に制
御信号PP2の働きにより、l→1→lとアドレ
ススタツク64もPOPされる。この間漸化式計
算部50では、ワークメモリ51より読み出され
るg(i−1,j)とg(i−1,j−1),g(i
−1,j−2)、順次与えられる前記信号jjに対
応してワークメモリ51から読み出されるg(i
−1,jj−1),g(i−1,jj−2)の群の最小
値検出が行われ、最後に最小値にd(i,j)が
加算される。すなわち、順次与えられるjjをj1,
j2……とするとき、 g(i,j)=d(i,j)+ming(i−
1,j) g(i−1,j−1) g(i−1,j−2) g(i−1,j1−1) g(i−1,j−2) g(i−1,j2−1) g(i−1,j2−2) (10) なる漸化式計算が行われる。(5)式及び第3図の例
では、j1,j2としては、この“}”の前に現れた
“/”の位置に対応してj1=8,j2=5が読み出さ
れる。したがつて、j=10では、 g(i,10)=d(i,10)+ming(i−
1,10)g(i−1,9) g(i−1,8) g(i−1,7) g(i−1,6) g(i−1,4) g(i−1,3) (11) なるDP漸化式が計算されることになる。すなわ
ち、分岐区分制御子“/”で分けられた3個の部
分系列のいずれが最適かを決定したことになる。
なお、このときのDPバスは第6図bに参照数字
3で示すごときである。 省略開始制御子“〔”が検出されたときは、制
御子PP1の働きによつて“〔”と現時点のアドレ
ス信号jとが制御子スタツク62の第k番地に書
き込まれ、k+1→kとするPUSH処理が行われ
る。 DP漸化式としては(8)式が実行される。省略終
了制御子“〕”が検出されたときは、k−1→k
として制御子スタツクの第k番地より信号Cjが読
み出される。そのアドレス信号の部分が、スタツ
ク制御部63によつて、信号jjとして漸化式計算
部50に転送される。そこでは次の漸化式が計算
される。 g(i,j)=d(i,j)+ming(i−
1,j) g(i−1,j−1) g(i−1,j−2) g(i−1,jj) g(i−1,jj−1) (12) これによつて、(jj+1)から(j−1)まで
の部分系列を省略すべきか否かの判定が行われる
ことになる。(5)式を第3図の例ではj=15の点で
第6図aに参照数字15で示すような漸化式が計算
されることになる。 以上述べたスタツク処理部60と漸化式計算部
50での処理を第4図にフローチヤートで示す。
かくの如き処理をj=1,2,……Jnに対して行
うことによつてワークメモリ52にG2(j)とし
てg(i,j)がすべて得られる。この時点でワ
ークメモリ52の内容G2(j)は、メモリ80に
Gn(j)として転写される。 単語nに対する上記処理はn=1,2……Nな
るすべての単語に対して実行される。この処理が
終了とすると次の入力特徴ベクトルai+1が入力さ
れ同様の処理が繰返される。最後の入力特徴ベク
トルaIに対する処理が終了した時点でGn(Jn)と
して入力パターンAと標準パターンBnとの距離
D(A,Bn)が得られる。 本パターンマツチング装置を音声認識システム
として用いる場合には、この距離D(A,Bn)を
比較してその最小となる単語名nを決定すること
によつて認識処理が達成される。 かくして標準パターン中に分岐や省略を許容す
る制御子が存在する場合でも入力特徴ベクトルai
の入力に同期的にDPマツチング処理を実行でき
ることになつた。 本発明によると、前記特願昭57−156413号明細
書の第8図に示されるごとき大容量なスタツクメ
モリが不要であり、かつ、パターンAの入力が完
了する以前に、aiの入力に同期して処理が実行で
きるという効果が得られる。 以上、実施例に基づいて本発明の原理を説明し
たが、これらの記載は本発明の権利範囲を限定す
るものではない。 例えば、本実施例ではaiとbiとの類似性を距離
d(i,j)で評価したが、相関のように距離と
大小関係が逆の量を用いてもよい。その場合には
(8)式等の最小値選択操作を最大値選択操作に置換
えれば本発明の原理が、そのまま適用される。 また、距離d(i,j)を直接計算せず、例え
ば「電子通信学会誌Vol.J65−D,No.8(1982年
8月)のP1042の図1に示されるSPLIT方式と同
様にテーブル参照方式によつてもよい。この場合
には特徴bjはベクトルではなく擬音韻を指定する
番号となる。 また、本発明によるパターンマツチング装置で
処理の対象とするパターンは音声に限定されるも
のではない。例えば特願昭57−156413号明細書の
実施例の如くオンライン文字認識の文字パターン
であつてもよい。 制御子の定義とその具体的処理にも種々の変形
が考えられる。例えば、省略も一種の分岐と考え
て、“〔”や“〕”を用いず、“{”と“}”の間に
“/”が無い場合は“{”と“}”で囲まれる部分
は省略可能であると定義することもできる。その
場合も“}”が出現したとき第7図のフローチヤ
ートで示すような処理を行うことによつて、スタ
ツクによる制御が可能である。また、分岐処理や
省略処理は“}”や“〕“で必ず閉じなければなら
ないという性質のものではない。例えば、 ……{……/……/…… のように分岐した状態のままで終了させ、3種の
分岐の結果を並列に外部に出力するようにしても
よい。 また、本パターンマツチング原理を前記特願昭
56−199098号明細書の第7図のDPマツチング部
160に組み込んで連続音声認識装置を実現するこ
とができるが、そのような応用でもDPマツチン
グ部に関しては本発明の権利範囲に含まれるもの
である。 また、(8)式のDP漸化式のかわりに、例えば、
IEEE TRANSACTION ON ACOUSTICS
SPEECH AND SIGNAL PROCESSING,
Vol.ASSP−26,No.1のP47に示されるような
種々の漸化式を用いてもよい。
構成するパターンマツチング装置の改良に関す
る。 本発明は時系列パターンのマツチング処理に広
く利用され得るものであるが、以下では特に音声
パターンに例をとつて説明を行う。 音声パターンは特徴の時系列として表現され、
このようなパターン間の比較処理、すなわちパタ
ーンマツチングを行つて音声認識を行う方法が広
く行われている。高精度な認識のためにはパター
ン変動に対して安定な、すなわちパターン変動吸
収能力の高いマツチング主法が必要とされる。 時間方法の伸縮歪に対しては特願昭45−53896
号明細書(特公昭50−23941号公報)に記載され
た動的計画法(Dynamic Programming,以下
DPと略す)を用いたりDPマツチング法が適用さ
れ効果が得られている。 しかし、実際の音声パターンには、時間伸縮以
外に、例えば「日本音響学会音声研究会資料S83
−25(1983年6月24日)に“連続音声中の母音の
音形について”と題して発表された論文」に記さ
れている如く、長音化(例えばkinou→kino
o),鼻音化、無声化、脱落(aru hito→ar_
hito)のように局所的な変形が生じる。しかも、
これらの変形は定常的に発生したり、発生しなか
つたりするのではなく、発生の速度や前後の音韻
や単語などの要因に応じて不確定的である。 このような変形に対処しうるDPマツチング法
として「特願昭57−156413号明細書」(以下文献
(1)と呼ぶ)及び「日本音響学会音声研究会資料
S83−23に“DPマツチングのある一般化”と題
して発表された論文」(以下文献(2)と呼ぶ)に記
載されている。「スタツクDPマツチング」と呼ば
れる方法がある。この方法を実行する装置は、上
記文献(1)を引用すると、「特徴の時系列中に分岐
開始記号、分岐区切り記号、分岐終了記号及び省
略開始記号、省略終了記号等の制御記号を含んで
成る標準パタンを記憶する標準パタン記憶部と、
特徴の時系列として記述される入力パタンを保持
する入力パタンバツフアと、上記標準パタン中の
各要素を制御信号と特徴とに分類するデコーダと
複数の記憶番地を層として多層構成されるスタツ
クメモリーと、上記入力パタンの特徴と標準パタ
ンの特徴間の距離を算出する距離計算部と、上記
スタツクメモリより読み出される複数個の数値を
比較し、それらの最小値に前記距離計算部よりの
出力を加算し、前記スタツクメモリに書き込むと
いう動的計画演算を行なうマツチング処理部と、
前記デコーダーよりの制御信号に応じて前記スタ
ツクメモリーをプツシユ、ポツプ各層間の最小値
選択各層間のデーター転送を行なうスタツク演算
部とより構成される。」と定義される。 このスタツクDPマツチング法では、標準パタ
ーンを特徴の単純な時系列と考えず、時系列中に
分岐や省略を許容している。すなわち、“{”,
“/”“}”なる制御子を時系列中に許し、“{”と
“}”で囲まれ“/”で区切られる複数個の部分時
系列は、いずれか一つのみが選択されるとしてい
る。また制御子“〔”と“〕”で囲まれる部分時系
列は省略可能であり、省略すべきか否かが選択さ
れる。 このような標準パターンと特徴時系列とのDP
マツチングの実行のため、複数の記憶番地を一層
として、多層構成されるスタツクメモリを用い
る。上記制御子が標準パターン時系列中に出現す
るのに応じて、DP計算に使用するスタツクの層
をPUSHあるいはPOPすることによつて、分岐
や省略を最適決定するというアルゴリズムがスタ
ツクDPマツチング法である。 この手法によつて分岐や省略の可能性を含んだ
時系列のパターンマツチングが可能であり、前記
の無声化、鼻音化、脱落等の音声パターン変形に
対処出来る。しかし、上記文献(1)の第1図に関連
して述べられているごとく、従来のスタツクDP
マツチング法は本質的に横形窓式のDPマツチン
グ法を改良したものであつて、スタツクメモリの
各層にある幅(整合窓と呼ばれる)分の記憶番地
が必要とされるためスタツクメモリー全体として
の記憶量が大きくなるという問題があつた。また
最近「日本音響学会音声研究会資料S81−65
(1981年12月)に“クロツク同期伝播DP法による
連続音声認識の検討”と題して発表された論文
(以下文献(3)と呼ぶ)」に記載されている効率良い
連続単語認識アルゴリズム(以下クロツクワイズ
DP法と略称)が実行できないという難点があつ
た。 本発明の目的は、従来のスタツクDPマツチン
グと同等の機能を有しながら所要メモリが少なく
かつクロツクワイズDP法への組込みにも適した
パターンマツチング装置を実現することにある。 特徴の時系列中に分岐や省略を制御するための
制御子を含んでなる標準パターンを供給する手段
と、順次供給される入力パターンの特徴と前記標
準パターンの特徴との間の距離を算出する距離計
算部と、前記標準パターンの時系列中の位置に対
応して番地指定されるメモリと、このメモリより
読み出される複数個の数値を比較しそれらの最小
値に前記距離計算部よりの出力を加算するDPマ
ツチング漸化式を計算し、その計算結果を前記メ
モリに転写する漸化式計算部と、前記標準パター
ンに含まれる前記制御子とその出現位置をプツシ
ユ/ポツプするスタツクと、前記制御子の種類を
判定し、その種類に応じて前記スタツクを操作
し、かつ前記漸化式計算部で計算するDPマツチ
ング漸化式を制御するスタツク制御部とより構成
され、前記入力パターンの特徴が入力されると、
これに同期的に前記DPマツチング漸化式の計算
を実行できることを特徴とするパターンマツチン
グ装置。 以下に図面を参照しながら実施例にもとづいて
本発明の原理と構成を詳述する。 第1図は本発明の一実施例を示すブロツク図で
ある。この装置は制御部10よりのアドレス信号
やクロツクパルス等の制御のもとに動作するが、
図中には説明のために必要な制御信号のみを示し
ている。 音声入力パターンは前記特願昭45−53896号明
細書(特公昭50−23941号公報)の場合と同様に
特徴ベクトルaiの時系列として、 A=a1,a2……ai……aI (1) と記述されているとする。第2図に示すようにこ
のような特徴ベクトルaiが順次、このパターンマ
ツチング装置に与えられるとする。標準パターン
記憶部20には認識対象となる単語ごとに標準パ
ターンが記憶される。いま、単語に番号nをつけ
て指定することとし、N語の単語セツト、 Σ={n|n=1,2,……N} (2) を考えることとする。単語nには標準パターン Bn=bn 1,bn 2……bn j……bn jn (3) が記憶される。なお、標準パターンを一般的に取
扱うときには添字nを省略して、 B=b1,b2……bj……bJ (4) なる表現を用いる。 この標準パターン中には特徴bjの他に分岐や省
略を示す次のような制御子が含まれる。 分岐開始 “{” 分岐区分 “/” 分岐終了 “}” 省略開始 “〔” 省略終了 “〕” これらの意味は、前記文献(1),(2)と同様であ
る。 例えば、 B=b1,b2{b3,b4/b5,b6,b7/b8,b9} =b10,b11〔b12,b13,b14〕b15 (5) なる標準パターンにおいては、b3,b4,b5,b6,
b7,b8,b9,の部分系列は、いずれか1個のみが
選択される。また、部分系列b12,b13,b14は省略
されてよい。 標準パターン記憶部20の内部では、第3図の
ように表現される。すなわち、各特徴bjに付随し
て必要に応じて制御子が書き込まれている。メモ
リ80は単語指定信号nとアドレス信号jとによ
つて番地指定され、Gn(j)なる値が記憶される
ようになつている。 以下に本装置の動作を説明する。まず、最初の
特徴ベクトルa1が入力されると単語指定信号nが
1から3nまで変化されるのに応じて、 Gn(1)=d(1,1) (6) なる初期設定がなされる。ここにd(1,1)は、
ベクトルa1とbn 1間のユークリツド距離である。 一般には、 d(i,j)=‖ai−bn j‖ (7) と定義される。この初期設定は文献(1)の(6)式と同
じ処理であつて、公知であり、またそのための操
作は簡単なので詳細は省略する。 次に、一般的にベクトルaiが入力された時の動
作を第2図を参照して説明する。 aiが入力されると、単語指定信号nが1からN
まで変化される。単語指定信号が値nとなるとメ
モリ80よりGn(j)がj=1からJnまでワーク
メモリ51にG1(j)として転写される。続い
て、アドレス信号jが1からJnまで順次カウント
アツプされる。このjとnによつて番地指定され
前記標準パターン記憶部20より特徴ベクトルbj
が信号線bに、また、このベクトルに付随する制
御子信号が信号線Cに出力される。 制御子が無かつた場合には、漸化式計算部50
で次のような通常のDPマツチング漸化式の計算
が実行される。 g(i,j)=d(i,j)+ming(i−1,j) g(i−1,j−1) g(i−1,j−2) (8) すなわち、前記ワークメモリ51よりG1(j),
G1(j−1),G1(j−2)としてg(i−1,
j),g(i−1,j−1)g(i−1,j−2)
が読み込まれ、それらが比較され最小値が決定さ
れる。他方距離計算部40では入力の特徴ベクト
ルaiと標準パターンのベクトルbn jとのユークリツ
ト距離d(i,j)が算出され、信号dとして漸
化式計算部50に与えられる。この距離d(i,
j)は前記の最小値と加算される。かくして(8)式
の計算が終了する。かくして得られたg(i,j)
はレジスタ52にG2(j)として記入される。か
くの如き漸化式計算処理は特願昭56−199098号明
細書の第10図に示す回路構成によつて実行でき
るが、ここでは同種の原理をマイクロプロセツサ
によつて実行することにする。かくの如く、制御
子が付いていないときは、(8)式の基本的な漸化式
計算を繰返される。このときのDPバスは第6図
aに参照数字1で示す如きである。 特徴ベクトルbjに制御子が付いて読み出された
ときの動作を第4図a,bを引用して説明する。
制御子は信号線Cを経由してレジスタ61に送ら
れる。さらに信号線C1を経由してスタツク制御
部63に送られ、制御子の種類が判定される。ス
タツク処理部60には、この他に制御子スタツク
62とアドレススタツクとの2種が内蔵されてお
り、それぞれ第5図a,bのような構成になつて
いる。制御子スタツクは、スタツクカウンタkで
番地指定され、アドレススタツクはスタツクカウ
ンタlで番地指定される。これらのカウンタの初
期値は1である。 分岐開始制御子“{”が与えられると、スタツ
ク制御部63より制御信号PP1,PP2が発生さ
れる。その指示によつて制御子スタツク62の第
k番地に“{”及びその時点での前記アドレス信
号jとが書き込まれ、アドレススタツクの第l番
地には前記アドレス信号jが書き込まれる。その
後、k+1→k,l+1→lなるPUSH処理が行
われる。特徴ベクトルbjに対しては(8)式の処理が
行われる。 分岐区分制御子“/”が検知されたときは、制
御信号PP1の指示によつてスタツク62の第k
番地に“/”とその時点のアドレス信号jとが書
き込まれ、k+1→kなるPUSH処理が行われ
る。またスタツク64の第(l−1)番地の内容
が信号j′として読み出される。スタツク制御部6
3は、この信号j′を信号jjとして漸化式計算部5
0に転送する。そこではこの信号jjを基にして次
のようなDP漸化式処理が実行される。 g(i,j)=d(i,j)+ming(i−1,j) g(i−1,jj) g(i−1,jj−1) (9) この計算に必要な右辺のgはワークメモリ51
より読み出され、結果として得られるg(i,j)
がワークメモリ52に記入されるのは、(8)式の場
合と同様である。 ここで(9)式の意味を説明しておく。アドレスス
タツク64より読み出される信号jjは、その直前
に現われた分岐開始制御子“{”のアドレスjの
値である。したがつて(9)式の右辺にあるg(i−
1,jj)とg(i−1,jj−1)の項は、分岐開始
制御子“{”の直前から現在のアドレスjへの接
続を評価していることになる。(5)式及び第3図の
例の中でj=5における“/”に対応しては、第
6図に参照数字2で示すような漸化式が計算され
る。 すなわち、j=2からの接続が評価されること
になる。j=8に表われる分岐区分制御子に対し
ても同様な処理が行われる。 次に分岐終了制御子“}”が検出されたときの
動作を説明する。制御信号PP1の働きにより、
k−1→kとして制御子スタツク62の第k番地
より制御子とアドレス信号をCjとして読み出すと
いうPOP処理が行われる。 スタツク制御子60では制御子が判定され、分
岐区分制御子“/”であつたならば前記のアドレ
ス信号を信号jjとして漸化式計算部50に送る。
この処理は分岐開始制御子“{”が制御子スタツ
ク62から読み出されるまで繰返され、最後に制
御信号PP2の働きにより、l→1→lとアドレ
ススタツク64もPOPされる。この間漸化式計
算部50では、ワークメモリ51より読み出され
るg(i−1,j)とg(i−1,j−1),g(i
−1,j−2)、順次与えられる前記信号jjに対
応してワークメモリ51から読み出されるg(i
−1,jj−1),g(i−1,jj−2)の群の最小
値検出が行われ、最後に最小値にd(i,j)が
加算される。すなわち、順次与えられるjjをj1,
j2……とするとき、 g(i,j)=d(i,j)+ming(i−
1,j) g(i−1,j−1) g(i−1,j−2) g(i−1,j1−1) g(i−1,j−2) g(i−1,j2−1) g(i−1,j2−2) (10) なる漸化式計算が行われる。(5)式及び第3図の例
では、j1,j2としては、この“}”の前に現れた
“/”の位置に対応してj1=8,j2=5が読み出さ
れる。したがつて、j=10では、 g(i,10)=d(i,10)+ming(i−
1,10)g(i−1,9) g(i−1,8) g(i−1,7) g(i−1,6) g(i−1,4) g(i−1,3) (11) なるDP漸化式が計算されることになる。すなわ
ち、分岐区分制御子“/”で分けられた3個の部
分系列のいずれが最適かを決定したことになる。
なお、このときのDPバスは第6図bに参照数字
3で示すごときである。 省略開始制御子“〔”が検出されたときは、制
御子PP1の働きによつて“〔”と現時点のアドレ
ス信号jとが制御子スタツク62の第k番地に書
き込まれ、k+1→kとするPUSH処理が行われ
る。 DP漸化式としては(8)式が実行される。省略終
了制御子“〕”が検出されたときは、k−1→k
として制御子スタツクの第k番地より信号Cjが読
み出される。そのアドレス信号の部分が、スタツ
ク制御部63によつて、信号jjとして漸化式計算
部50に転送される。そこでは次の漸化式が計算
される。 g(i,j)=d(i,j)+ming(i−
1,j) g(i−1,j−1) g(i−1,j−2) g(i−1,jj) g(i−1,jj−1) (12) これによつて、(jj+1)から(j−1)まで
の部分系列を省略すべきか否かの判定が行われる
ことになる。(5)式を第3図の例ではj=15の点で
第6図aに参照数字15で示すような漸化式が計算
されることになる。 以上述べたスタツク処理部60と漸化式計算部
50での処理を第4図にフローチヤートで示す。
かくの如き処理をj=1,2,……Jnに対して行
うことによつてワークメモリ52にG2(j)とし
てg(i,j)がすべて得られる。この時点でワ
ークメモリ52の内容G2(j)は、メモリ80に
Gn(j)として転写される。 単語nに対する上記処理はn=1,2……Nな
るすべての単語に対して実行される。この処理が
終了とすると次の入力特徴ベクトルai+1が入力さ
れ同様の処理が繰返される。最後の入力特徴ベク
トルaIに対する処理が終了した時点でGn(Jn)と
して入力パターンAと標準パターンBnとの距離
D(A,Bn)が得られる。 本パターンマツチング装置を音声認識システム
として用いる場合には、この距離D(A,Bn)を
比較してその最小となる単語名nを決定すること
によつて認識処理が達成される。 かくして標準パターン中に分岐や省略を許容す
る制御子が存在する場合でも入力特徴ベクトルai
の入力に同期的にDPマツチング処理を実行でき
ることになつた。 本発明によると、前記特願昭57−156413号明細
書の第8図に示されるごとき大容量なスタツクメ
モリが不要であり、かつ、パターンAの入力が完
了する以前に、aiの入力に同期して処理が実行で
きるという効果が得られる。 以上、実施例に基づいて本発明の原理を説明し
たが、これらの記載は本発明の権利範囲を限定す
るものではない。 例えば、本実施例ではaiとbiとの類似性を距離
d(i,j)で評価したが、相関のように距離と
大小関係が逆の量を用いてもよい。その場合には
(8)式等の最小値選択操作を最大値選択操作に置換
えれば本発明の原理が、そのまま適用される。 また、距離d(i,j)を直接計算せず、例え
ば「電子通信学会誌Vol.J65−D,No.8(1982年
8月)のP1042の図1に示されるSPLIT方式と同
様にテーブル参照方式によつてもよい。この場合
には特徴bjはベクトルではなく擬音韻を指定する
番号となる。 また、本発明によるパターンマツチング装置で
処理の対象とするパターンは音声に限定されるも
のではない。例えば特願昭57−156413号明細書の
実施例の如くオンライン文字認識の文字パターン
であつてもよい。 制御子の定義とその具体的処理にも種々の変形
が考えられる。例えば、省略も一種の分岐と考え
て、“〔”や“〕”を用いず、“{”と“}”の間に
“/”が無い場合は“{”と“}”で囲まれる部分
は省略可能であると定義することもできる。その
場合も“}”が出現したとき第7図のフローチヤ
ートで示すような処理を行うことによつて、スタ
ツクによる制御が可能である。また、分岐処理や
省略処理は“}”や“〕“で必ず閉じなければなら
ないという性質のものではない。例えば、 ……{……/……/…… のように分岐した状態のままで終了させ、3種の
分岐の結果を並列に外部に出力するようにしても
よい。 また、本パターンマツチング原理を前記特願昭
56−199098号明細書の第7図のDPマツチング部
160に組み込んで連続音声認識装置を実現するこ
とができるが、そのような応用でもDPマツチン
グ部に関しては本発明の権利範囲に含まれるもの
である。 また、(8)式のDP漸化式のかわりに、例えば、
IEEE TRANSACTION ON ACOUSTICS
SPEECH AND SIGNAL PROCESSING,
Vol.ASSP−26,No.1のP47に示されるような
種々の漸化式を用いてもよい。
第1図は本発明の実施例ブロツク図であり、第
2図から第7図は、その動作説明図である。 図中、10は制御部、20は標準パターン記憶
部、40は距離計算部、50は漸化式計算部、5
1はワークメモリ、60はスタツク処理部、61
はレジスタ、62は制御子スタツク、63はスタ
ツク制御部、64はアドレススタツク、52はワ
ークメモリ、80はメモリをそれぞれ示す。
2図から第7図は、その動作説明図である。 図中、10は制御部、20は標準パターン記憶
部、40は距離計算部、50は漸化式計算部、5
1はワークメモリ、60はスタツク処理部、61
はレジスタ、62は制御子スタツク、63はスタ
ツク制御部、64はアドレススタツク、52はワ
ークメモリ、80はメモリをそれぞれ示す。
Claims (1)
- 1 特徴の時系列中に分岐や省略を制御するため
の制御子を含んでなる標準パターンを供給する手
段と、順次供給される入力パターンの特徴と前記
標準パターンの特徴との間の距離を算出する距離
計算部と、前記標準パターンの時系列中の位置に
対応して番地指定されるメモリと、このメモリよ
り読み出される複数個の数値を比較しそれらの最
小値に前記距離計算部よりの出力を加算するDP
マツチング漸化式を計算し、その計算結果を前記
メモリに転写する漸化式計算部と、前記標準パタ
ーンに含まれる前記制御子とその出現位置をプツ
シユ/ポツプするスタツクと、前記制御子の種類
を判定し、その種類に応じて前記スタツクを操作
し、かつ前記漸化式計算部で計算するDPマツチ
ング漸化式を制御するスタツク制御部とより構成
され、前記入力パターンの特徴が入力されると、
これに同期的に前記DPマツチング漸化式の計算
を実行できることを特徴とするパターンマツチン
グ装置。
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58131438A JPS6022283A (ja) | 1983-07-19 | 1983-07-19 | パタ−ンマツチング装置 |
| US06/631,692 US4670850A (en) | 1983-07-19 | 1984-07-17 | Pattern matching apparatus |
| EP84108509A EP0139875B1 (en) | 1983-07-19 | 1984-07-18 | Pattern matching apparatus |
| DE8484108509T DE3477858D1 (en) | 1983-07-19 | 1984-07-18 | Pattern matching apparatus |
| CA000459125A CA1214560A (en) | 1983-07-19 | 1984-07-18 | Pattern matching apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58131438A JPS6022283A (ja) | 1983-07-19 | 1983-07-19 | パタ−ンマツチング装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6022283A JPS6022283A (ja) | 1985-02-04 |
| JPH0552517B2 true JPH0552517B2 (ja) | 1993-08-05 |
Family
ID=15057963
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58131438A Granted JPS6022283A (ja) | 1983-07-19 | 1983-07-19 | パタ−ンマツチング装置 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US4670850A (ja) |
| EP (1) | EP0139875B1 (ja) |
| JP (1) | JPS6022283A (ja) |
| CA (1) | CA1214560A (ja) |
| DE (1) | DE3477858D1 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6077280A (ja) * | 1983-10-04 | 1985-05-01 | Nec Corp | パタ−ンマツチング装置 |
| JP2847715B2 (ja) * | 1988-08-30 | 1999-01-20 | ソニー株式会社 | 文字認識装置及び文字認識方法 |
| US5189709A (en) * | 1991-08-26 | 1993-02-23 | The United States Of America As Represented By The United States National Aeronautics And Space Administration | Dynamic pattern matcher using incomplete data |
| US5960395A (en) * | 1996-02-09 | 1999-09-28 | Canon Kabushiki Kaisha | Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming |
| DE102010002317B4 (de) * | 2010-02-24 | 2018-06-14 | Apologistics Gmbh | System und Verfahren zur Vereinzelung und Kommissionierung von Artikeln |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4181821A (en) * | 1978-10-31 | 1980-01-01 | Bell Telephone Laboratories, Incorporated | Multiple template speech recognition system |
| US4475238A (en) * | 1982-04-05 | 1984-10-02 | Everhart Glenn C | Magnetoresistive image correlation device |
| JPH0310146A (ja) * | 1989-06-08 | 1991-01-17 | Okawara Mfg Co Ltd | 反射型光ファイバー式赤外線水分計 |
-
1983
- 1983-07-19 JP JP58131438A patent/JPS6022283A/ja active Granted
-
1984
- 1984-07-17 US US06/631,692 patent/US4670850A/en not_active Expired - Lifetime
- 1984-07-18 DE DE8484108509T patent/DE3477858D1/de not_active Expired
- 1984-07-18 CA CA000459125A patent/CA1214560A/en not_active Expired
- 1984-07-18 EP EP84108509A patent/EP0139875B1/en not_active Expired
Also Published As
| Publication number | Publication date |
|---|---|
| EP0139875A1 (en) | 1985-05-08 |
| US4670850A (en) | 1987-06-02 |
| JPS6022283A (ja) | 1985-02-04 |
| DE3477858D1 (en) | 1989-05-24 |
| CA1214560A (en) | 1986-11-25 |
| EP0139875B1 (en) | 1989-04-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5583968A (en) | Noise reduction for speech recognition | |
| EP0103245B1 (en) | Pattern matching apparatus | |
| JPS6223320B2 (ja) | ||
| US4901352A (en) | Pattern matching method using restricted matching paths and apparatus therefor | |
| JPS58192100A (ja) | 第1の音声パタ−ンを第2の音声パタ−ンと時間的に整列させる方法とその装置 | |
| JP2980026B2 (ja) | 音声認識装置 | |
| US5864807A (en) | Method and apparatus for training a speaker recognition system | |
| JPH0552517B2 (ja) | ||
| JPH02186398A (ja) | 連続音声認識装置 | |
| Zweig et al. | Structurally discriminative Graphical Models for automatic speech recognition-Results from the 2001 Johns Hopkins summer workshop | |
| JPH0346839B2 (ja) | ||
| US4872201A (en) | Pattern matching apparatus employing compensation for pattern deformation | |
| Guo et al. | R-bi: Regularized batched inputs enhance incremental decoding framework for low-latency simultaneous speech translation | |
| JP3094473B2 (ja) | 動的計画法照合装置 | |
| JP3348735B2 (ja) | パターン照合方式 | |
| JPH01241667A (ja) | 学習機構を有するダイナミック・ニユーラル・ネットワーク | |
| JP3052520B2 (ja) | パターン分類装置 | |
| JPS59172693A (ja) | 連続単語音声認識方法 | |
| JPH0436400B2 (ja) | ||
| JPS63125999A (ja) | 音声認識方法 | |
| JPS5972498A (ja) | パタ−ン比較装置 | |
| JPH0247758B2 (ja) | ||
| JPH0355836B2 (ja) | ||
| Ackenhusen | The CDTWP: A programmable processor for connected word recognition | |
| JPS638886A (ja) | オンライン連続文字認識装置 |