JPS6265090A - パタ−ン比較装置 - Google Patents

パタ−ン比較装置

Info

Publication number
JPS6265090A
JPS6265090A JP60205756A JP20575685A JPS6265090A JP S6265090 A JPS6265090 A JP S6265090A JP 60205756 A JP60205756 A JP 60205756A JP 20575685 A JP20575685 A JP 20575685A JP S6265090 A JPS6265090 A JP S6265090A
Authority
JP
Japan
Prior art keywords
frame
pattern
input
calculation
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60205756A
Other languages
English (en)
Other versions
JPH0646358B2 (ja
Inventor
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60205756A priority Critical patent/JPH0646358B2/ja
Publication of JPS6265090A publication Critical patent/JPS6265090A/ja
Publication of JPH0646358B2 publication Critical patent/JPH0646358B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、特徴ベクトルの系列で表わされた複数種類の
標準パターンと入力パターンとの比較を行ない、入力パ
ターンの識別を行なうパターン比較装置に関し、特に連
続して発声した単語音声の認識などに適用可能なパター
ン比較装置に関する。
従来の技術 人間にとって最も自然な情報発生手段である音声が、人
間−機械系の入力手段として使用出来れば、その効果は
非常に大きい。その場合、音声認識装置としては、より
自然な発声で認識出来る条件として、連続して発声した
音声の認識が出来ることが望ましい。
連続して発声した単語音声の認識に有効なパターン比較
装置として、動的計画法(以下DPと呼ぶ)を2段階用
いたいわゆる2段DP法を用いたパターン比較装置が既
に実用化されている。
しかし、この2段DP法は重複した計算が多く計算量が
膨大で、従ってこの方法を用いた実時間処理が可能なパ
ターン比較装置は極めて高速の処理が要求され、装置も
複雑で、高価なものとならざるを得ない。
以上の欠点を除去するために、大幅に計算量の少ないパ
ターン比較装置として、○(N)DP法。
CWDP法、ACDP法等を用いたパターン比較装置が
提案されている。しかし、これ等の方法を−・−ドウエ
ア的に実現するためには、高速にアクセス可能な大容量
のメモリを必要とする欠点がある。
本発明は、これ等の欠点を除去したパターン比軸装置を
提供するものであって、特に、特願昭58−48600
号明細書に記載されている前記A CD P (Aug
mented Continuous DPMatch
ing)法に適用することを目的とする。この方法は単
語数未知、単語数既知、何れの場合にも適用可能であり
、オートマトン制御も可能である。
本発明を説明するに先だって次にACDP法について説
明する。以後、ここでは簡単のために単語数未知の場合
について説明する。壕だ、本発明のパターン比較装置は
、種々の入力パターンの認識に用いることが出来るが、
以下、連続して発声される連続単語音声を例に説明する
人間によ゛り発声される音声は人により1だ時により変
化し、基準となる標準パターンに対し時間的に非線形に
伸縮したものとなっている。この非線形に伸縮している
入力パターンと標準パターンとを比較し、入力音声の認
識を行なうためには、入力パターンと標準パターンの各
特徴ベクトルの対応付けを非線形に行ない、入力パター
ンがどの標準パターンと最も類似しているかを計算する
必要がある。しかし、この入力音声は非線形に伸縮する
とはいっても、異常に長く伸びたり、短くなったりする
ことはない。
このような入力パターンの物理的な特徴に注目し、入力
パターンと標準パターンを比較する際には無制限にすべ
ての可能性について比較するのではなく、入力パターン
の物理的な性質により定する妥当と考えられる範囲につ
いて比較を行なうようにする。
入力音声信号はパターン比較装置において、周波数分析
、LPC分析、PARCOR分析、相関分析等により、
いくつかの数値の組(特徴ベク)/りの系列に変換され
、この入力パターンの特徴ベクトルの系列と比較の対象
となる標準パターンの特徴ベクトルの系列とが各ベクト
ル毎に比較される。
この各ベクトル毎の比較値、すなわちベクトル間の距離
を合計した累積距離というものをパターンの類似の尺度
に用いる。この累積距離を計算する場合、各ベクトル毎
の比較をすべての組合せについて行なうのは計n量が膨
大となり、パターン比較装置として実用化することが出
来ない。
入力パターンを一方の軸に、標準パターンを他方の軸と
する平面(以下、i−j平面という)を考えると、入力
パターンおよび標準パターンの各ベクトルの組合せと言
うのは、i−j平面上の各格子点(以下、単に点という
)により示すことが出来る。従って、前記あらゆる組合
せについて各ベクトル間の距離を計算するとは、各点に
おけるベクトル間の距離を計算することであり、累積距
離を計算するとは、入力パターンの特徴ベクトルと、そ
れに対応する標準パターンの特徴ベクトルとのベクトル
間距離を順次計算し、合計していくことである。この累
積距離を計算する過程で選択された、入力パターンと標
準パターンの特徴ベクトルの対応、即ち点列を径路と言
う。前記した入力パターンの物理的な性質を考慮して比
較の範囲を限定すると言うことは、径路の選択に拘束条
件を設けると言うことである。ここで、以後の説明にお
いて用いる用語および記号について説明する。
A:入力パターン(A−al、a2.・・・、ao、・
・・。
al) al:入力パターンAの第iフレームの特徴ベクトル I :入力パターンのフレーム数 Rn:第nm準バター 7 (Hn=bnj 、bn2
.、、、、bnj 。
・・・、bnyn) bnj=第n標準パターンの第】フレームの特徴ベクト
ル 1”:第n標準パターンのフレーム数 n:単語名(単語番号)1≦n≦N N:標準パターンの総数 dn(i、i): 第n標準パターンの第jフレームの
特徴ベクトルbnjと入カッリー ンの第iフレームの特徴ベクトル a・ とのベクトル間距離 Dn(s:t):入力パターンの部分ノ(ターンa3〜
atと標準パターンRn との最小 累積距離(以下、部分累積距離と 呼ぶ) D(i) :第1〜第iフレームまでの入カッくターン
と、各標準パターンの最適な組合せの結合パターンとの
パターン間の距離(以下、終端累積距離と呼ぶ) N(i):  第1〜第iフレームまでの入力パターン
に対する各標準パターンの最適な組合せの結合パターン
を求めたときの当該結合パターンを構成する最後尾標準
パターンを示す番号(以下、最後尾単語名と呼ぶ)B(
i) :  N(i)の始点フレームの1つ手前のフレ
ームを示すフレーム番号(以下、パックポインタと呼ぶ
) Dn(i、j):入力パターンの部分パターンam+1
〜a、と標準パターンRnの部分パタ −ンbn1〜bnj  との最小累積距離のmについて
の最小値(以下、途中累 積距離と呼ぶ) B”(i、i): Dn(i+i)  ヲ満fcf入カ
バター ンcD始点位置(以下、途中バックポイン タと呼ぶ) ただし、DPマツチングの径路は、Dn(s:t)。
D(i)については入力パターン側の軸を基本軸とする
径路であって、Dn(i、i)については標準パターン
側の軸を基本軸とする径路である。
DPマツチングによる連続単語音声認識は次なる漸化式
を計算することによって効率的に実行される。即ち B(i)=ビ N(i)=n“ ただし、m”、n’は式(1)を満たすm 、 nをi
=1〜工について順次計算すればN(I)、N(B(I
)) 、N(B(B(I)) ) 、・・・、N(B(
J・・・B(I)・・)))によって入力された単語が
逆の順序で求められる。
第2図は式(1)の計算の物理的意味を説明する図であ
る。bはDn(m:i)を計算する場合の径路の拘束条
件の一実施例である。即ち、点(’+j)に至る径路は
点(i−2,1−1)、(i−1,j−1)。
(’−’ r j−2)を必ず通り、累積距離が計算さ
れる際、選択された径路に応じて各点のベクトル間距離
に径路上に示した数字で表わされる重み付けがなされる
。このような重みの与え方をすれば同図に示す径路の拘
束条件の許では如何なる径路が選ばれようとも、その径
路に沿う重みの和は入力パターンのフレーム数に等しく
なり一定となる。
aは入力パターンの第n + 1フレームから第iフレ
ームまでの部分パターンと第n標準パターンHnとのマ
ツチングの様子を示している。直線1は傾斜が%であっ
て、直線2は傾斜が2であり、DPマツチングの径路は
bの拘束条件の許では両直線に挾まれる領域に限定され
る。3は選ばれたマツチング径路の一例である。
式(1)を計算するためには、Dn(m+1 : i 
)をn=1〜Nについて、iと10 に関係したmのあ
る範囲に渡って、i=1〜Iのそれぞれについて計算し
なければならない。即ち、第2図aの例で言えば、iが
変わる毎に直線1.2で囲まれる三角形の領域内の全格
子点についてベクトル間距離及び累積距離を計算しなけ
ればならない。
ACDP法は、このDn(m+1 : i )の計算を
ワードスポツティングの考え方を導入して近似的に行な
うことにより、その計算量を大幅に減らすものである。
第3図はACDP法の概念を説明する図である。
aは径路の拘束条件の一例を示す図である。即ち、点(
’+1)に至る径路は点(i−2,j−1)、(1−1
、j−1)、(i−1,j−2)を必ず通り、径路上に
示した数字はこの重みを表わす。第2図すに示すものと
の本質的な違いは、このような重みの与え方をすれば同
図に示す径路の拘束条件の許では如何なる径路が選ばれ
ようとも、その径路に沿う重みの和は標準パターンのフ
レーム数に等しくなり一定となると言う点にある。
ACDP法の考え方を要約すれば、 (1)第3図aの如き標準パターン側の軸を基本軸とす
る径路の拘束条件に従ってDn(i+ Jn) +Bn
(i、Jn)を計算する。
j2)  m+1−n=(i、In)とおいて1)n(
t、■”)からDn(m−r+1:i) 〜Dn(m+
r+1:i)を近似的に推定する。即ち、 Dn(m+1:1)=Dn(i、In)拳−Jn となる。ここで、rはD”(m+1 : i )の推定
の範囲である。
(1) 、 (2)より、結局 B”(111)−”1m+1≦Bn(ijn)+rの任
意の点を始点、lを終点とするDn(m+1:i)を近
似的に推定出来たことになる。
この方法を連続単語音声認識に適用すると次のようにな
る。
(1)初期条件 りゆ)=Q、13ゆ)=0 Dn(−1、1)=Dn(o、 j)=oo、for 
n==1−N、 j=1〜J”(2)i=1〜Iについ
て(3)〜(′7)を実行ゆ) n=1〜Nについて(
4)〜(6)を実行(4)初期値Dn(l、1)−dn
(i、1)(5)i=3〜Jnについて (6)r’=o〜rについて m+1=Bn(i、Jn) (D(m’)+rf′(m’+1 :1)1(7四゛)
−07=1゜−0,。。70.。−14,N、3(8)
判定処理(前記の如< B(i)、 N(i)から単語
列を逆の順序で求める) 以上の処理からも明らかなように、ACDP法によれば
、最も計算量の多いdn(l++)の計算を含むステッ
プ(41、((へ)の計算は各i、nについて1回行な
うのみでよいから、通常の2段DPに比べると計算量が
大幅に減少するものである。
ところが、前記ベクトル間距離dn(i++)、途中累
積距離Dn(111)を7 V −ムi毎にn=1〜N
j=1〜Jn について求めるためには、標準パターン
記憶用メモリとして、かなり高速なアクセスが要求され
ることになる。例えば、フレーム周期を5m5ec  
、標準パターン数N=300.標準パターンの平均フレ
ーム数1 =30とすれば、入力パターンのフレーム当
たりの計算すべき平均の格子点数はN 1 =9000
であり、特徴ベクトルの次元数を15とすれば、入力パ
ターンのフレーム当たりの標準パターン記憶用メモリに
対するアクセス回数は9000X15=135000回
となる。
これを5mBeC内に行なうためには、アクセスタイム
37 n5ec以下が要求される。また、標準パターン
の記憶に必要とされるメモリ量は、特徴ベクトルの1要
素を1バイトで表現するものとすれば、1sskBとな
り、37 n5ec以下でアクセスできる高速メモリが
、135kBも必要ということになり、装置として大変
高価なものになる。
発明が解決しようとする問題点 本発明は、前記ACDP法による連続的ノ(ターンの比
較装置において、高速アクセスが要求されるメモリの数
を大幅に減少させることを目的とする。
問題点を解決するだめの手段 本発明のパターン比較装置は、入力信号を特徴ベクトル
a 1 、 a 2 r・・・+ a 1 r・・・、
aIの系列に変換する特徴抽出手段と、特徴ベクトルの
系列bn1.bn2゜・・・、bn3.・・・、bn■
nから成る標準パターンHn(ただし、n=1〜N)を
記憶する標準パターン記憶手段と、入力のフレームiを
横軸に、標準パターンのフレームjを縦軸とする格子グ
ラフにおいて、標準パターンHn とマツチングすると
きは、入力パターンのフレームに対してWフレーム隔た
った直線で挾まれる領域の格子点に対して、標準パター
ンの各フレームjの特徴ベクトルbnjのそれぞれに対
してi軸方向に前記Wの幅でDPマツチングをj=1〜
■0の順に行ない、1つの領域の計算が完了すると次の
相隣る前記と同様な領域の計算を同様に行なうというよ
うに、入力パターンの全範囲に渡って前記マツチング計
算を行なうDPマツチング手段を備えている。
作  用 入力信号を特徴ベクトルa1 、 a2 、・・・、a
、、・・・ 。
aIの系列に変換し、特徴ベクトルの系列bn1゜bn
3.・・・、bnj、・・・、bnInカラ成ル標準ハ
ターンRn(ただし、n=1〜N)と、入力のフレーム
iを横軸に、標準パターンのフレームjを縦軸とする格
子グラフにおいて、標準パターンRnとマツチングする
ときは、入力パターンのフレームに対してWフレーム隔
たった直線で挾まれる領域の格子点に対して、標準パタ
ーンの各フレームjの特徴ベクトルbnjのそれぞれに
対してi軸方向に前記】 Wの幅でDPマツチングをj=1〜■0の順に行ない、
1つの領域の計算が完了すると次の相隣る前記と同様な
領域の計算を同様に行なうというように、入力パターン
の全範囲に渡って前記マツチング計算を行なう。
実施例 第4図は本発明の原理を示す図である。径路の制限条件
を第3図のように選べば、8.9をj軸に平行で互いに
W(≦In/2)フレーム隔たった直線とすれば、直線
8上の途中累積距離Dn(i。
))が求まっておれば、両直線で挾まれる領域(斜線部
分)の途中累積距離Dn(i、i)は計算することが出
来、さらに、直線8と直線t、)n  との交点を10
.直線9と直線j=J” との交点を11とすれば、1
0〜11に含まれる各格子点までの終端累積距離D(i
)は直線8以前の終端累積距離が求まっておれば計算出
来る。途中の計算は矢印12に示すように横方向に順次
下から上へ計算を進めて行くことが出来る。このように
して、フレーム周期をTとするとき、時間WTの間に斜
線部Aの計算を以上のように行ない、次のWTの間に斜
線部Bの計算を以上のように行なうと言うように、以上
に述べた計算を時間WJ毎に順次進めてゆくこ・とが出
来る。
このようにすると、標準パターンの第jフレームは、W
フレームの入力パターンと照合する間一定で良いから、
標準パターン用メモリに対して要求されるアクセスタイ
ムを遅くすることが出来る。
即ち、各斜線部の格子点の数はWJであって、この各格
子点に対する計算をTWの間に行なう必要があるが(T
はフレームの周期とする)、このとき、標準パターンの
1フレームに対して許容される計算時間はTW/INと
なり、これは、標準パターンの1フレ一ム分のデータを
読み出す時間に等しく、前記の数値を当てはめれば、W
=J/2であるからT (1/2 )/ TN−=T/
2N =5msec/2X300:8.3μsec で
あり、特徴ベクトルの次数を以前と同じく16次とすれ
ば、標準パターンの1つのベクトルの要素を読み出すた
めに許されるアクセスタイムは8.3 psec /1
5=553nsecとなり、従来例で要求された値に比
べると約16倍のアクセスタイムで良いことになる。但
し、今度は入力パターンを記憶するためのメモリに高速
性が要求されるが(標準パターンの第1フレームに対し
て、NW回の読み出しを時間TW/Jの間に行なわなけ
ればならない。前記の例に対しては、TW/T/NW=
T/NT=5msec/300X30=0.561ts
ecの間に16個の特徴ベクトルを読み出す必要がある
。従って、ベクトルの1つの要素を読み出すのに許され
るアクセスタイムは37 n5ecとなる。その必要と
される容量は、前記の例に対しては、平均15W=15
X30=450  バイトで良いことになり、大幅なコ
ストダウンにつながる。
以上が本発明の原理であるが、Wは固定とすることも可
変とすることも出来る。Wを固定とする場合は基本的に
は工0の最小値を■□とするとき、W≦J 、 /2 
 とするのが最も簡単であるが、工0礼! として非常に短いものが含まれるときはあまり効果的で
ない。但し、メモリを用いれば、W>Jll。
/′2の場合でも以上のような考え方により計算を行な
うことが出来る。即ち、Do(i、In)自体は)玉章
の入力フレームの幅で計算が可能であるが、これからD
n(i)を求めるためには、i−J、7/2までの経端
累積距離が求まっている必要がある。従って、W)T、
/2としたときは、Dn(1)を計算すシラ るiでW−IJ2フv一部分のD”(t、In)。
Bn(i、■”)を記憶しておけば良い。また、前記欠
点を補うには、Jnに応じてWを可変とすることも可能
である。
本実施例ではInに応じてWを可変とする場合について
説明する。
第6図は本発明の詳細な説明する詳細図である。
い捷、入力パターンが第1フレームのときの処理を説明
する。前記斜線A、B等のそれぞれをブロックと呼ぶこ
とにする。このとき、Dn(i−IJ”/2〕)が求ま
っていなければ、同図における○で示す格子点について
前記の計算を行ない、Dn(i−[:In/2) )、
Dn(i −(In/2) +1 )、 ・、Dn(i
)を求める。・はこのブロックの1つ前のブロックのi
=1.2.・・・ Jnにおける格子点でこれらの点に
おける途中累積距離Dn(’++)は、本ブロックにお
ける途中累積距離Dn(’++)の初期値となるもので
ある。Dn(i−CI”/2)’)が求まっているとき
は、このnに対応する標準・ぐターンに対する計算はス
キップすることになる。
以上のようにすれば、各標準パターンRnに対する前記
ブロックの幅をn毎にWn=(In/2)+1として計
算したことになる。Dn(i−(In/2))が求まっ
ているか否かを決定するには、最初にDn(i−[:I
n/2) ) to アルイハcx:□に初期化t、テ
おけば、求まっているときは、0あるいは(1)以外の
有限の値になっているはずであることから判断が可能で
ある。または、Dn(i)が求まっているときはGn(
i)−〇、求まッテイナイときはGn(i) = 1と
設定されるフラグGn(1)を設け、初期値をG”(i
) =1 for  i=1〜Iと設定しておき、Dn
(i)が求まる毎にG ”(i) −〇とすることにす
れば、G”(i)を見ることにより、Dn(i)が求ま
っているか否かが判定出来る。
第1図は、以上の原理に基づく本発明の実施例徴抽出部
であって、入力音声信号を特徴ベクトルa、の系列Aに
変換する。102は単語標準・(り一ン記憶部であって
、認識給食たるN個の単語がそれぞれ標準パターンRn
 = b nl、・・・Br)、、・・・。
bnIn(1≦n≦N)として特徴ベクトルの形で予め
登録されている。103はベクトル間距離計算部であっ
て、入力パターンの第1フレームにおけル特徴ベクトル
ai とn番目の単語標準ノζターンHnの特徴ベクト
ルb、  との距離dn(mr + )を求め、必要が
無くなるまで記憶する。本例においては部分累積距離を
計算しているフレームの1つ前のフレームおよび当該フ
レームのベクトル間距離を当該フレームの途中累積距離
を計算するまで記憶する。dn(m、))は、例えば〜
とbnjの市街距離として定義できる。即ち、ベクトル
の次元をLとし、輻=(aml、aXn2.・・・、a
mL)、bnj=(bo、1゜bnj2. ・・、 、
bnjL)とするどき” (mr + )=  Σ D
mk−bnjk’に=1 となる。また、本実施例では計算の方向が1軸方向であ
って、第n標準パターンHnの第jフレームのベクトル
b、に対し、1−(Tn/2)≦m≦iの範囲の入力パ
ターンに対しdn(m、j)を求める。
104は途中累積距離計算部であって、前記cl”(m
、j)と同様の範囲で途中累積距離D”(m、j)。
途中バックポインタBn(m、j)を求める。113は
終端累積距離計算部であって、D(ホ)、B(ホ)、N
−を前記d0(m++)と同様の範囲で求める。第3図
aに示したマツチング径路の拘束条件が採用されると、
Dn(m、j)、B”(m、j)は途中累積距離計算部
104においてつぎのように求まる。
j=1のとき Dn(m、1)dn(m、j) B”(m、1)=m )≧3のとき ただし p(ホ)、B(ホ)、Nに)は終端累積距離計算部11
3において次のようにして求まる。
即ち、 p=Bn(m 、 5 ) m’=p−r+++p+rのm′についてを計算し、 なる漸化式によって Bに)=m″ N輛−nl として求まる。但し、m”、n”は式(2)を満たすm
′。
nである。
112は前記ベクトル間距離の計算と、累積距離の計算
の実行範囲を各nについて決定するものであって、D(
1−(Jn/2) )が求まっていないとき、前記mの
範囲でd”(m、j)、Dn(m、j)の計算をそれぞ
れベクトル間距離計算部103.途中累積距離計算部1
04.終端累積距離計算部113に指示する。
以上のようにして求められた終端累積距離D−は終端累
積距離記憶部105に、バンクポインタB(ホ)はバッ
クポインタ記憶部106に、最後尾単語番号Nに)は最
後尾単語記憶部107に記憶される。
なお、Dn(m+i)+Bn(m、j)(ただし、j=
12 + ”’ + 1 ” ; n=1.2 + ・
・・+ N )は必要が無くなるまで、部分累積距離計
算部104に一時的に記憶′される。本実施例において
は途中累積距離を計算しているフレームの1つ前および
2つ前のフレームの途中累積距離を計算するまで記憶す
る。
また、終端累積距離記憶部105に記憶される終端累積
距離りに)は式(1)の初期値で必要なものであり、D
に)についてはDn(m+1.1 )を求めるまで記憶
しておけばよい。
108は音声区間検出部であって、入力信号の大きさ等
から音声区間を判定するものである。音声区間検出部1
08が、音声入力が開始されたことを検出するとフレー
ム数計数部109はフレーム毎に計数を始める。前記の
処理は第iフレームについての処理であったが、このフ
レーム数計数部109の計数値が即ちとのiを設定して
いる。
従って、前記と同様の処理が、フレームが1進む毎に行
なわれることになる。フレーム数計数部109は音声区
間が検出されると計数を始め、音声区間が終了するとリ
セットされる。最後尾単語記憶部107.パックポイン
タ記憶部106には、従って、N(i) 、 B(i)
がi=1.2.・・・、■について3己憶されることに
なる。
セグメンテーンヨン部110はパックポインタ記憶部1
06に対し、所定のパックポインタを読出すべき命令を
発するものである。即ち、セグメンテー/ヨン部110
がiなる値をパックポインタ記憶部106に発すると、
パックポインタ記憶部106からはパックポインタB(
1)が読出される。
セグメンテー7.Jン部110はパックポインタ記憶部
106からB (i)なる値を受は取ると、その同じ値
をバンクポインタ記憶部106に発する。従っ−C1音
声区間検出部108が音声入力の終了を検知すると、フ
レーム数計数部109の最終値Iがセグメンテーンヨン
部110に供給され、セグメンテーンヨン部110は先
ず工なる値をバンクポインタ記憶部10らに発する。以
後、前記説明の動作に従って、パックポインタ記憶部1
06から、B(I)、B (B(I)、 B (B (
B(I)))) 、−=、o  なる出力が頃次得られ
ることになる。これらの値は最後から2番目の単語の終
わりのフレーム、同3番目の単語の終わりのフレーム、
同4番目の単語の終わりのフレーム、・・・・・という
ものであり、N(i)はlフレームで終わる単語であっ
たから、この値をそのまま最後尾単語記憶部107に与
えると、最後の単語から逆の順序で認識結果が得られる
なお、認識結果が本来の順序で得られるようにするため
には、この順序の変換をツクツクポインタ記憶部106
の出力に対して行なうか最後尾単語記憶部107の出力
に対して行なえばよい。
以上の実施例においては、説明の便宜のために、点(m
、j)におけるベクトル間距離、途中累積距離、途中パ
ックポインタ等はそれぞれdn(”+ 1 ) +シ(
mIIL”(”+])等と表記したが、これらの記憶領
域はi、i、nの全範囲に渡って準備する必要は無く、
第1段の格子点におけるDn(” + l ) +” 
(mI ] )の計算には、前記漸化式からも明らかな
ように、第3図の径路に対しては第i−1段。
についてはdn(m+]  ’)(但し、In ” l
 −102〜l)についてのみ記憶していればよい。ま
た、n毎にj=1〜Jnについてこれらの値を計算する
ことにすれば、”(m++)、Bn(l++)について
ばnに関して一旦一つのブロックについて計算してしま
うことになるので、何時迄も記憶しておく必要はない。
この考え方に基づいて、さらに詳細な説明を第6図に従
って説明する。ソフトウェアにより実現する場合もこれ
に従えばよいのは勿論である。同図において NDDO なる記法はXが満足される間Yを実行することをNDD
O なる記法はXなる条件が満足されるまでYを実行するこ
とを LSE ENDIFなる記法はXなる条件が満足されればYを、
そうでなければ、Zを実行することをそれぞれ意味する
ものとする。
また、途中累積距離、途中パックポインタ、ベクトル間
距離等に関する記法を次のように変更する。即ち、第3
図に示した径路を用いるときは、第1段の途中累積距離
と途中パックポインタの計算は第i−1段と第1−2段
の途中累積距離と途中パックポインタと、第j−1段の
ベクトル間距離が記憶されておればよく、前記ブロック
の最初の入力パターンのフレームにおける途中累積距離
と途中パンクポインタの計算は1フレーム前と2フレー
ム前の途中累積距離と途中パックポインタ、1フレーム
前のベクトル間距離が記憶されておればよい。結局、必
要なメモリは” (il ] ) 。
Nn(i、+)については1=−1〜工。+1 の範囲
で3段分、dn(i、i)についてはi=0〜1o+1
の範囲で2段分(但し、−1は直前のブロックの最終フ
レームの1つ前のフレーム、0は直前のブロックの最終
フレームを意味する。)、各ブロックの最終フレームの
1つ前のフレームと最終フレームニオけるDn(’I]
LE3n(lIIL各)07りの最終フレームにおける
dn(i、i)がそれぞれ記憶されておれば漸化式の計
算は出来るものであり、各単語n毎に1ブロック分の計
算を行なうことにすれば、1=−1〜J0+1の3段分
の”(’l])。
Bn(’l])は1=−1〜J−+1とすることによっ
てすべてのnについて共通に用いることが出来るから、
これらをそれぞれD(io、k)、B(io、k)(但
し、1o=−1〜Ifn+1 、にmo 〜2 )、i
=0〜工。+1の2段分(7)dn(i、+)は1=o
−IIn+1 とすることによってすべてのnについて
共通に用いることが出来るから、これをd (io 、
 k ) (但し、10=0〜7  +1.に=o〜2
)とし、次のブロックの初期値を記憶しておくだめのメ
モリとして、各ブロックの最終フレームの1つ前のフレ
ームと最終フレームニオけるDn(1+l)+Bn(’
+I)、各プロyりの最終フレームにおけるd”(’+
+)をそれぞれDn(’ l ])lBn(’ l I
Ldn(])(但し、i=o 〜1゜j=1〜■0 で
あって、i=oは最終フレーム、i = 1 ハ最iフ
レームの1つ前のフレーム)トスることが出来、メモリ
の大幅な節約が図れる。
第6図において、ステップ201.202は初期化を行
なう部分である。ステップ203は入力の第iフレーム
における処理を行なう部分である。
ステップ204は前記ブロック内の各格子点に対し、第
1〜N標準パターンと入力パターンとのマツチングを行
なう処理である。ステップ206は第n標準パターンに
対する前記ブロックの幅を求めている。ステップ206
は入力の第iフレームにおいて、第1  Toフレーム
〜第iフレームの終端累積距離り一が求まっているか否
かを前記フラグGn(ホ)の状態から判断し、求まって
いないときはそのブロックの計算を行ない、求まってい
るときはn=n+1の処理ヘスキップする処理である。
ステップ2o了は該当する前記ブロックが未だ計算され
ていないことが判明したとき、以下のステップでそのブ
ロックの計算を行なうのであるから、前取てそこに含ま
れるフレームについてフラグG0(ホ)を0とおいて計
算済みの状態にしている。ステップ208では後の計算
の便宜のために計算すべきブロックの開始フレーム−1
をmoとして算出しておく。ステップ209はj=1.
2百(io、J)(但し、10=1〜工。+1)を計算
している。ステップ211は入力パターンの第1フレー
ムからのフレームの通し番号を求めている。ステップ2
12は入力パターンの第m番のベクトル輻と標準パター
ンの第1番のベクトルbn1とのベクトル間距離を求め
ている。ステップ213はこの値を基にj=1について
D(to、i)+B(’o。
J)(但し、10=1〜■。+1)を計算している。
ステップ214,215はj=2,1o=1〜T o 
+1におけるベクトル間距離d (io 、 2 )を
求めている。
ステップ216はこの値を基にi=2におけるD(io
、i)、百(io、i)(但し、10=1〜工。+1)
を計算している。ステップ217は次のブロックの計算
に使うためにd’(2)=d(J。+1.2)なる置き
換えを行なっている。
ステップ218はj=3〜J0におけるD(10゜k)
 、B (io 、 k ) (但し、10=1〜工。
+1)を計算している。ステップ219はD(五〇、k
)、B(io。
k ) + d (t o 、 k )  なるメモl
J’を巡回的に用いるためにkの値tiの値に応じて設
定している。ステノブ220は直前のブロックの値から
初期値を設定している。ステップ221は第3段におけ
るベクトル間距離を計算している。ステップ222はこ
の値を基に第】段におけるD(10,J)、B(10゜
))(但し、1゜−1〜T o + 1 )を旧線して
いる。ステップ223は次のブロックの計算に使うだめ
の置き換えを行なっている。
ステップ224は以上のようにして求めたから、前記説
明に従って、D(ホ)、B(ホ)、N(ホ)を計算して
おり、nが変わる毎に以前に計算した値と比較し、段縫
的に最小値が求められる。
ステップ203の処理が終了すると判定処理に入る。即
ち、ステップ230においてi = Iとおいて前記説
明に従ってステップ231で求めるべき単語列が逆の順
序で求められる。
本実施例においては、第3図に示すような径路の拘束条
件を用いたため径路の最大の傾斜は2と全るので、ブロ
ックの幅は(Jn/2)+1となったし゛が、径路の拘
束条件としては、これ以外にも種々溝えられ、例えば、
第7図のような場合は、最大の傾斜が3となるからこの
場合のブロックの幅は2−4l−(In−1)/3]と
なる。一般に径路の最大の傾斜がkのときは、ブロック
の幅Wば2−(1−、−(In−1)/に’l以下であ
れば良いことになる(k= 2 (’)場合1d、 C
Jn/2) +1 ト2−(1−(J”−1)/2)と
は■1 が整数の場合は等しい)。
発明の効果 以上のように、本発明によれば、ACDP法のように、
DPマツチングを高速に連続して行なう方法においては
、高速、大容量のメモリが必要であったのが、高速性を
要求されるメモリ数を大幅に減らす事が出来、安価な装
置の実現が可能となったものである。
【図面の簡単な説明】
第1図は本発明の原理を示すブロック図、第2図はDP
マツチングにより連続パターンを認識する原理を説明す
るだめの説明図、第3図は本発明が適用さるべきACD
P法を説明するだめの説明図、第4図は本発明の原理の
考え方を説明するための説明図、第5図は本発明の詳細
な説明するだめの詳細説明図、第6図は本発明の処理手
順を詳細(で説明するための処理手順図、第7図は径路
の拘束条件の他の例を説明するための説明図である。 101・・・・特徴抽出部、102・・・・・単語標準
パターン記憶部、103・・・・・・ベクトル間距離計
算部、104・・・・・途中累積距離計算部、105・
・・・・・終端素晴距離記憶部、106・・・・・バッ
クポインタ記憶部、107・・・・・・最後尾単語記憶
部、108・・印・音声区間検出部、109 ・・フレ
ーム数計数部、110・・・・・セダメンテーショ7部
、112・・・・・マノナング計算実行範囲決定部。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第4
図 第5図 第6図 (f/)す 2DI  、L−[Jll、ヮ/2] アイゴ7 i Σ 第6図 (+04) ア“ イ″ ゲ 230   i=I 第7図

Claims (1)

    【特許請求の範囲】
  1. 入力信号を特徴ベクトルa_1、a_2、・・・、a_
    i、・・・、a_Iの系列に変換する特徴抽出手段と、
    特徴ベクトルの系列b^n_1、b^n_2、・・・、
    b^n_j、・・・、b^n_(J^n)から成る標準
    パターンR^n(ただし、n=1〜N)を記憶する標準
    パターン記憶手段と、入力のフレームiを横軸に、標準
    パターンのフレームjを縦軸とする格子グラフにおいて
    、標準パターンR^nとマッチングするときは、入力パ
    ターンのフレームに対して互いにWフレーム隔たった直
    線で挾まれる領域の格子点に対して、標準パターンの各
    フレームjの特徴ベクトルb^n_jのそれぞれに対し
    てi軸方向に前記Wの幅でDPマッチングをj=1〜J
    ^nの順に行ない、1つの領域の計算が完了すると次の
    相隣る前記と同様な領域の計算を同様に行なうというよ
    うに、入力パターンの全範囲に渡って前記マッチング計
    算を行なうDPマッチング手段とを備えたことを特徴と
    するパターン比較装置。
JP60205756A 1985-09-18 1985-09-18 パタ−ン比較装置 Expired - Fee Related JPH0646358B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60205756A JPH0646358B2 (ja) 1985-09-18 1985-09-18 パタ−ン比較装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60205756A JPH0646358B2 (ja) 1985-09-18 1985-09-18 パタ−ン比較装置

Publications (2)

Publication Number Publication Date
JPS6265090A true JPS6265090A (ja) 1987-03-24
JPH0646358B2 JPH0646358B2 (ja) 1994-06-15

Family

ID=16512139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60205756A Expired - Fee Related JPH0646358B2 (ja) 1985-09-18 1985-09-18 パタ−ン比較装置

Country Status (1)

Country Link
JP (1) JPH0646358B2 (ja)

Also Published As

Publication number Publication date
JPH0646358B2 (ja) 1994-06-15

Similar Documents

Publication Publication Date Title
US4962535A (en) Voice recognition system
JPH029359B2 (ja)
JPH0673080B2 (ja) 連続音声認識方式
JPH0247760B2 (ja)
JPS6265090A (ja) パタ−ン比較装置
JP2964881B2 (ja) 音声認識装置
JPS5972498A (ja) パタ−ン比較装置
JPS6073698A (ja) パタ−ン比較装置
JPS63188199A (ja) パタンマッチング装置
JPH0361957B2 (ja)
JPH0449718B2 (ja)
JPS60203993A (ja) 音声認識方法
JP3009962B2 (ja) 音声認識装置
JPS60203992A (ja) 音声認識方法
JPS59172698A (ja) 音声認識装置
JPS60203994A (ja) 音声認識方法
JPS6283798A (ja) 連続音声認識装置
JPS59200A (ja) パタ−ンマツチング装置
JPS62111295A (ja) 音声認識装置
JPS62299999A (ja) パタ−ン比較装置
JPS61102697A (ja) パタ−ン比較装置
JPS60201395A (ja) 音声認識方法
JPS617893A (ja) 大語彙単語音声認識方式
JPS6247100A (ja) 音声認識装置
JPH0534680B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees