JPH0134399B2 - - Google Patents

Info

Publication number
JPH0134399B2
JPH0134399B2 JP56197841A JP19784181A JPH0134399B2 JP H0134399 B2 JPH0134399 B2 JP H0134399B2 JP 56197841 A JP56197841 A JP 56197841A JP 19784181 A JP19784181 A JP 19784181A JP H0134399 B2 JPH0134399 B2 JP H0134399B2
Authority
JP
Japan
Prior art keywords
digit
dissimilarity
word
input pattern
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56197841A
Other languages
English (en)
Other versions
JPS5898796A (ja
Inventor
Masao Watari
Hiroaki Sekoe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56197841A priority Critical patent/JPS5898796A/ja
Priority to US06/447,829 priority patent/US4592086A/en
Priority to EP82306577A priority patent/EP0081390B1/en
Priority to DE8282306577T priority patent/DE3267835D1/de
Priority to CA000417329A priority patent/CA1193013A/en
Publication of JPS5898796A publication Critical patent/JPS5898796A/ja
Publication of JPH0134399B2 publication Critical patent/JPH0134399B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は1個以上の単語を連続して発声した連
続音声を自動的に認識する連続音声認識装置に関
する。
音声認識の手段としては従来から種々の方法が
試みられている。それらの中で最も簡単、かつ有
効な方法としてパタンマツチング法があげられ
る。この方法は、認識すべき語彙の各単語に標準
的なパタン(以下単語標準パタンと称する)を用
意しておき、入力された未知の音声パタン(以下
入力パタンと称する)との間で比較操作(すなわ
ちパタンマツチング)を行つて相互で異なる度合
を表わす量(以下相異度と称する)を算出し、最
も相異の少ないすなわち相異度が最小になる単語
標準パタンと同じ単語に属すると判定する方法で
ある。
特開昭51−104204号公報には上記パタンマツチ
ング法を基礎として動作する連続音声認識装置の
動作原理が記載されている。この原理は大略次の
ようである。すなわち、何個かの単語標準パタン
をあらゆる順列で接続することによつて得られる
パタンを連続音声の標準パタン(以下連続音声標
準パタンと称す)と考えて、入力パタン全体との
マツチングを行う。全体としての相異度が最小と
なるように単語標準パタンの個数と単語標準パタ
ンの順列を定めることによつて認識を行なう。実
際には上記最小化を単語単位での最小化と全体と
しての最小化の2段階に分割し、それぞれの最小
化を動的計画法を利用して実行する(以下動的計
画法を用いたマツチングをDPマツチングと称す
る)。
上記公開公報記載の装置では単語単位での最小
化において、入力パタンを単語単位にあらゆる可
能な分割をし、そのすべてに対して単語標準パタ
ンとのDPマツチングを行つている。すなわち入
力パタン長をMとし、単語標準パタン数をVとす
ればM・V回のDPマツチングを必要とする。
ところで、上記のDPマツチングの回数を
Lmax・V回(入力パタンの最大可能桁数を
Lmaxとする)にする方法がIEEE
TRANSACTIONS ON ACOUSTICS.
SPEECH.AND SIGNAL PROCESSLING.
VOL ASSP−29 No.2APRIL 1981第284頁から
第297頁に記載されている。次にこの方法(以下
HLB法と称する)の大略を述べる。入力パタン
Aと連続音声標準パタンC=Bv1,Bv2,……,
Bvl,……,BvLmaxとの相異度は次のようにして
求める。入力パタンの時間点mと連続音声標準パ
タンの時間点nを第1図に示したような最適な単
調増加で非線形関数n=n(m)(以下時間正規化
関数という)にて対応づけを行い、その対応づけ
られた時間点における特徴ベクトル間の距離d
(m、n)を時間正規化関数に沿つて加算したも
のを相異度S(A、C)と定義する。
S(A、C)= minn(m) Mm=1 d(m、n(m)) ……(1) n=n(m) ……(2) ここで距離d(m、n)は例えば(3)式にて求める
ことができる。
d(m、n)=Dis(an、bv o)=Rr=1 |〓nr−〓v or
……(3) ただし〓n=(an1、an2、……、anR) 〓v o=(bv o1、bv o2、……、bv oR) (1)式の最小化を次のような動的計画の手法で行
う。すなわち、初期条件 D(0、0)=0 ……(4) D(m、0)=∞ m=0〜M ……(5) F(m、0)=m m=0〜M ……(6) のもとに漸化式 D(m、n)=d(m、n)+D(m−1、n^)
……(7) F(m、n)=F(m−1、n^) ……(8) ただし n^=argmin〔D(m−1、n′)〕n−2n′n
……(9) をn=L(m)〜U(m)、m=1〜Mについてす
なわち第1図の斜線部分について求める。
U(m)=2m−1 ……(10) L(m)=(m+1)/2……(11) ここでargmin xEXyはxEXの条件のもとでyを最小と
するxを意味している。すなわち(9)式はn−2
n′nのもとでD(m−1、n′)を最小とする
n′をn^としている。また、(7)式は第2図に示す3
つの経路より最小を選択することを示しており、
許される経路を3つに制限したのは時間正規化関
数による対応づけが必要以上に歪むことを防ぐた
めである。ここで相異度を求める時用いた最小値
を選択した経路をマツチング経路と呼び、(8)式の
F(m、n)を経路情報と呼ぶ。前記漸化式(7)、
(8)、(9)を入力パタンの終端M、連続音声標準パタ
ンの終端Nまで計算して得られるD(M、N)が
前記(1)式の相異度S(A、C)である。
ところで、全体の最小相異度を求めた時得られ
たマツチング経路(m,n(m))上のある点
(ml、nl)において、始端よりそのマツチング経
路に沿つてその点(ml、nl)まで得られた部分
相異度は、その点(ml、nl)を通るすべてマツ
チング経路に沿つて得られる部分相異度の最小値
である。すなわちある点(ml、nl)を通るすべ
てのマツチング経路に沿つて得られる全体相異度
の最小値は始端よりその点(ml、nl)までの部
分相異度とその点(ml、nl)より終端までの部
分相異度のそれぞれの最小値の和で与えられる。
すなわち S(A、C)= minn(m) Mm=1 d(m、n) = minn(m) nlm=1 d(m、n)+Mm=ml+1 d(m、n) ……(12) ただし(ml、nl)はS(A、C)が得られたマ
ツチング経路上の点である。今、連続音声標準パ
タンの各桁ごとの区切れ目の点を考え、それぞれ
の桁で最小の部分相異度を求め、その和として最
小の全体相異度を得ることができる。従つて、入
力パタンAと連続音声標準パタンC=Bv1、Bv2
…、Bvl、…、BvLmaxとの最小相異度は次のよう
にして求めることができる。初めに、連続音声標
準パタンの第1桁目の各単語標準パタンと入力パ
タンとのマツチングを行い、相異度の最小値を求
め、その結果を第2桁目のマツチングの切期値と
して第2桁目の各単語標準パタンと入力パタンと
のマツチングを行う。第Lmax桁までマツチング
を行つた後、入力パタンの終端Mにおける各桁ご
との相異度の最小値を求め、最適な桁数Lを得
る。第L桁の相異度が得られたマツチング経路を
逆にたどつて順次各桁での認識カテゴリを得る。
次にHLB法の計算手順を第3図〜第6図を用
いて説明する。第3図は相異度計算の進行順序を
示す図、第4図は第l桁目の相異度計算を示す
図、第5図は桁経路情報FB(l、m)、桁認識カ
テゴリW(l、m)より判定計算順序を示す図、
第6図は前記引用文献の第289頁から第290頁に記
載されているアルゴリズム5をフローチヤートで
表わしたものである。ここで、mは入力パタンの
時間点、nは標準パタンの時間点、vは単語、l
は桁、Mは入力パタンの終端、Nvは第v番目の
単語標準パタンの終端、Vは単語標準パタン数、
Lminは入力パタンの最小桁数、Lmaxは最大桁
数である。相異度計算は、初期条件(4)、(5)、(6)式
のもとで漸化式(7)、(8)、(9)を第3図に示す領域1
より領域Lmaxまですなわち連続音声標準パタン
の各桁ごとに順に求めることである。初期条件の
設定は第6図ブロツク1で行われる。次に第l桁
目における相異度計算は以下のようにして行われ
る。相異度D(m、0)の初期値として前の桁の
結果である桁相異度DB(l−1、m)をセツト
し(第6図のブロツク2で行われる)、(7)、(8)、
(9)式に示す漸化式を第4図に示すように上限U
(m)と下限L(m)でかこまれた部分について計
算する。(第6図のブロツク3,4で行われる)。
ここで上限U(m)は第4図の左側の線分AB((10)
式に示されている)および上側の線分BEを意味
し、下限L(m)は下側の線分ACおよび右側の線
分CE((11)式に示されている)を意味する。単語標
準パタンの終端Nvまで計算を行い、その終端Nv
での相異度D(m、Nv)を単語相異度D〓(v、m)
とする(第6図のブロツク5で行われる。V個の
単語標準パタンと計算した後単語相異度D〓(v、
m)の最小値を求め、その最小値を桁相異度DB
(l、m)とし、その最小値が得られた単語標準
パタンの属するカテゴリv^を桁認識カテゴリW
(l、m)とし、その最小値が得られたマツチン
グ経路情報F〓(v、m)を桁経路情報FB(l、m)
とする(第6図のブロツク6で行われる)。この
ようにして第1桁目より第Lmax桁目まで相異度
計算を行つた後、得られた桁経路情報FB(l、
m)と桁認識カテゴリW(l、m)より入力パタ
ンの判定を行う。まず、入力パタンの終端Mにお
ける各桁の桁相異度DB(l、M)より、許され
た桁すなわちLmin桁よりLmax桁の間で最小値
を求め、(第6図のブロツク7で行われる)、最小
値の得られた桁Lが入力パタンの最終的に決定さ
れた桁数である。つづいて、第5図に示すように
第L桁目の認識結果R(L)をW(L、M)より得、
また入力パタンの終端Mでの桁経路情報FB(L、
M)より第L−1桁目の終端を得る(第6図のブ
ロツク8で行われる)。前記操作を順にくり返す
ことによつて、各桁での認識結果R(l)が得られ
る。
以上説明したように、HLB法では各桁でV回
のDPマツチングを行えばよいので、全体で
Lmax・V回のDPマツチングを必要としている。
一方、特開昭51−104204号公報の方法ではM・V
回のDPマツチングが必要である。通常、入力パ
タンの最大桁数Lmaxが5程度ある場合には、フ
レーム周期を20msと想定すると、入力パタン長
Mは100程度となり、HLB法の計算量は大幅に少
ないことになる。
音声認識装置において認識応答時間は、音声の
終端が検出されてから認識結果を出力するまでの
時間である。ところで、HLB法においては、第
1桁目のマツチングに必要な入力パタンが得られ
た後、第1行目のマツチングが開始され、順次第
Lmax桁目までマツチングを行い、認識結果が得
られる。その途中の第l桁目に関しては、第4図
に示した右上隅のE点(me、ne)まで入力パタ
ンが得られた時、すなわち連続音声標準パタンの
第l桁目までの最大パタン長をne、単語標準パタ
ンの最大パタン長をNmaxとすれば、E点の座標
の関係より ne=L(me) ……(14) であり ne=Nmax・l、L(me)=me+1/2 ……(15) であるので me=2・Nmax・l−1 ……(16) となり、2・Nmax・l−1点まで入力パタンが
得られた時第l桁目のマツチングを行うことがで
きる。今、入力パタンはL桁で各桁の平均単語長
をとし、=1/2Nmax、L=Lmaxと仮定す れば、(16)式へme=L・を代入するとl≒
1/4Lmaxとなり、入力音声の終端が検出された 時点では1/4Lmax桁までの計算しか進めること はできず、残りの3/4Lmax桁に関してはその後 で計算することになり、この3/4Lmax桁分の計 算時間が認識応答時間となり、大きな遅れを持つ
ことになる。一方、この認識応答時間を短くする
ためには、並列処理やパイプライン処理ができる
複雑な高速演算器を必要とする。
本発明の目的は、上記HLB法を改良すること
により、認識応答時間を短縮させ、さらに全体の
計算量を少なくし、これにより経済的な連続音声
認識装置を提供することにある。
このためHLB法の計算順序を入れ換えて、本
発明の原理であるVLB法と呼ぶ新規な計算原理
を導出する。HLB法においては第6図のフロー
チヤートに示すように、各単語標準パタンと入力
パタンとの相異度の計算は、初めに各単語標準パ
タンと入力パタンと計算を行い、次に桁を1つ上
げ同様の計算を行つている。すなわち第6図のブ
ロツク3と4に示す計算のループの順序は一番内
側より、単語標準パタンの時間点n、入力パタン
の時間点m、単語標準パタンの番号v、桁の番号
lである。ここで前記計算のループの順序を入れ
換え、第7図のフローチヤートに示すように、一
番外側を入力パタンの時間点mにすることが可能
であることを示す。DPマツチングの時間正規化
関数n(m)は単調増加関数であるので、第l桁
目の初期値DB(l−1、m−1)は、入力パタ
ン時間点m−1以前のデータによつて決定されて
いる。すなわち入力パタンの時間点m−1以前の
すべての点において相異度計算が終了しているな
らば、入力パタンの時間点mにおける相異度計算
を行うことができる。すなわち、第8図の斜線部
分に示すようにn軸に平行で各桁を含む縦1列の
相異度計算を行うことができる。この各桁を含む
縦1列の相異度計算には各桁での初期値DB(l
−1、m−1)と各桁のm−1点における相異度
D(m−1、n)が必要であり、これらはm−1
点での計算にて求められている。ただし、m−1
点における相異度D(m−1、n)および経路情
報F(m−1、n)を各桁l各単語vについて記
憶しておく必要がある。このため桁l、単語vに
おける相異度D(m−1、n)およびF(m−1、
n)をそれぞれD(l、v、n)およびF(l、
v、n)で示す。このD(l、v、n)とF(l、
v、n)の構成を第15図に示す。
このように計算順序を入れ換えたVLB法の計
算手順を第7図と第8図を用いて説明する。相異
度計算は、動的計画の漸化式を第8図に示すよう
に上限U(m)と下限L(m)の間の領域内で入力
パタンの時間軸mの順に求めることである。
VLB法における相異度計算の初期条件は D(l、v、n)=∞ ……(17) l=1〜Lmax、v=1〜V、n=1〜Nv DB(l、m)=∞ ……(18) l=0〜Lmax、m=0〜M DB(0、0)=0
……(19) であり、第7図のブロツク1で行われる。次に入
力パタンの時間点mにおけるn軸に平行な縦1列
の相異度計算は以下のように行われる。初めに入
力パタンの時間点mの特徴ベクトル〓nと第v番
目の単語標準パタン〓o vとの間のベクトル距離を
(3)式により求める(第7図のブロツク2で行われ
る)。つづいて各桁において縦1列の相異度計算
を行う。この縦1列の相異度計算は、初期値を D(l、v、0)=DB(l-1、m-1) ……(20) F(l、v、0)=m−1 ……(21) として(第7図のブロツク3で行われる)、漸化
式 D(l、v、n)=d(n)+D(l、v、n^)……(22) F(l、v、n)=F(l、v、n^) ……(23) ただし n^=argmin〔D(l、v、n′)〕n−2n′n
……(24) をU(m)とL(m)の間でnを減少させる方向で
計算する(第7図のブロツク4で行われる)。第
2図に示すように(m、n)点の計算は(m−
1、n)、(m−1、n−1)、(m−1、n−2)
の3点の相異度より求められる。次の(m、n−
1)点の計算は(m−1、n−1)、(m−1、n
−2)、(m−1、n−3)の3点の相異度より求
められ(m−1、n)点の相異度は使用しないの
で(m、n)点の計算結果を(m−1、n)点へ
記憶しても(m、n−1)点の計算に影響を与え
ない。ゆえにnを減少させる方向で計算を進めれ
ば、m−1点の相異度とm点の相異度の記憶エリ
アを共有することができる。上記漸化式計算を縦
1列実行した後、単語標準パタンの終端Nvにお
ける相異度D(l、v、Nv)とそれまで計算され
た最小単語相異度である桁相異度DB(l、m)
と比較し、得られた相異度D(l、v、Nv)の方
が小さい場合は、その相異度D(l、v、Nv)を
桁相異度DB(l、m)とし、その単語標準パタ
ンの属するカテゴリvを桁認識カテゴリW(l、
m)とし、その相異度D(l、v、Nv)が得られ
たマツチング経路情報F(l、v、Nv)を桁経路
情報FB(l、m)とする(第7図のブロツク5で
行われる)。このようにして行われる縦1列の相
異度計算(第7図のブロツク2,3,4,5の計
算)をV個の単語標準パタンについて実行する。
次に入力パタンの時間点mを1つ増加して同様の
縦1列の相異度計算をV個の単語標準パタンにつ
いて実行し、入力パタンの終端Mまで求める。最
後に桁経路情報FB(l、m)と桁認識カテゴリW
(l、m)より入力パタンの判定を行う。この判
定の方法はHLB法の判定方法と同様である。ま
ず、入力パタンの終端Mにおける各桁の桁相異度
DB(l、M)より許された桁すなわちLmin桁よ
りLmax桁の間で最小値を求め(第7図のブロツ
ク6で行われる)、最小値の得られた桁Lが入力
パタンの桁数である。さらに第L桁目の認識結果
R(L)をW(L、M)より得、また桁経路情報FB
(L、M)より第L−1桁目の終端を得る(第7
図のブロツク7で行われる)。前記操作を順にく
りすことによつて各桁での認識結果R(l)が得られ
る。
本発明の連続音声認識装置は前記のVLB法を
実行する装置であるから次のような各部を必要と
する。すなわち、入力パタンAと連続音声標準パ
タンC=Bv1、Bv2、……、Bvl、……、BvLmaxと、
以下の各部に対して入力パタンの時間点を示す信
号mを1からMまで変化させ、各mに関して単語
を示す信号vを1からVまで変化させ、さらに各
vに関して桁を示す信号lを1からLmaxまでお
よび標準パタンの時間点を示す信号nを1から
Nvまで変化させて与える制御部と、上記制御部
の信号l、v、nによつて番地指定される相異度
メモリ部D(l、v、n)と、経路情報メモリ部
F(l、v、n)とを有し、各時間点mにおいて
前記制御部より順次指定される単語vの単語標準
パタン〓o v、n=1〜Nvと入力パタン〓nとのベ
クトル間距離d(〓n、〓o v)n=1〜Nvを求め
る距離計算部と;この距離を記憶する距離メモリ
部d(n)と、各時間点mにおいて、各桁l、お
よび各単語vに関して最初に初期条件を時間点m
−1の結果である桁相異度DB(l−1、m−1)
と桁経路情報FB(l−1、m−1)により与え、
前記距離d(n)と時間点m−1における相異度
D(l、v、n)と経路情報F(l、v、n)とを
参照して動的計画の漸化式を計算し時間点mにお
ける相異度D(l、v、n)と経路情報F(l、
v、n)を順次求め、単語相異度D(l、v、
Nv)と単語経路情報F(l、v、Nv)を求める
漸化式計算部と;各時間点mにおいて、各桁lに
関して前記漸化式計算部で求められた各単語相異
度D(l、v、Nv)の中より最小を求め、これを
桁相異度DB(l、m)とし、これに対応した単
語経路情報F(l、v、Nv)を桁経路情報FB
(l、m)とし、最小値が得られた単語各vを桁
認識カテゴリW(l、m)とする桁相異度計算部
と;これらを記憶するための桁相異度メモリ部
DB(l、m)と桁経路情報メモリ部FB(l、m)
と、桁認識カテゴリメモリ部W(l、m)と;桁
経路情報FB(l、m)と桁認識カテゴリW(l、
m)に基づいて逆順に入力パタンの各桁のカテゴ
リを判定し出力する判定部とを有している。
このように本発明の原理であるVLB法を用い
れば相異度計算を入力パタンの時間軸方向に進め
ることができる。これによつて音声の入力が検出
されるとすぐ計算を開始し、音声の入力に同期し
て順次計算することができるので音声の終了と同
時に第7図のブロツク6,7の判定処理を始める
ことができる。したがつて従来技術であるHLB
法に比較し、認識応答時間が短縮できることにな
る。また、距離計算は、HLB法では第6図のブ
ロツク3に示すようにn、m、v、lのループで
囲まれているが、VLB法では第7図のブロツク
3で示すようにn、v、mのループで囲まれてい
る。すなわちHLB法における距離計算の回数は
Nv、M・V・Lmaxであり、VLB法における距
離計算の回数はNv・V・Mである。したがつて
従来技術であるHLB法に比較し、距離計算の計
算量が1/Lmaxに減少できることになる。
次に本発明の装置の具体的構成を図面を参照し
ながら説明する。第9図は、本発明の一構成例を
示すブロツク図であり、第10図は制御指令信号
のタイムチヤートである。制御部10は、m1、
n1、v1などの制御指令信号を第10図に示すよ
うに発することによつて、他の各部を制御する機
能を持つが、その詳細は他の各部の動作に関連し
てその都度説明する。入力部11は、信号
Speech inで与えられる入力音声を分析し一定時
間ごとに特徴ベクトルを出力する。この音声分析
は例えば、多チヤンネルのフイルタより構成され
るフイルタバンクによる周波数分析などがある。
また入力部11には入力音声のレベルを監視し、
音声の始端、終端を検出する機能を持ち、その検
出した時点を制御部10へ信号SPにより伝える。
入力パタンバツフア12は、音声の始端が検出さ
れた後、信号m3に従つて入力部11より与えら
れる特徴ベクトルanを記憶する。信号m3は入力
パタンの時間点mに対応した信号である。標準パ
タンメモリ部13は、V個の単語標準パタンB1
B2、……、Bvを記憶し、標準パタン長メモリ部
14は単語標準パタンBvの長さNvを記憶してい
る。信号v1は連続音声標準パタンの単語vに対
応する信号であり、制御部10は、信号v1に従
つて、標準パタン長メモリ部14より単語標準パ
タンBvの長さNvを読み出し、単語標準パタンの
時間点nに対応する信号n1を発生する。信号n1
に従つて入力パタンバツフア12より入力パタン
の特徴ベクトル〓nが読み出され、標準パタンメ
モリ部より〓1 v、〓2 v、……、〓v Nvが順次読み出
され距離計算部15において(3)式が計算され、距
離d(n)、n=1,2……Nvが距離メモリ部1
6へ記憶される。
距離計算部15において第11図に示すように
初めに信号Cl153にてアキユムレータ153がク
リヤされ、入力パタンバツフア12と標準パタン
メモリ部13より信号r1に従つてr個のデータが
読み込まれ、絶対値回路151にて差の絶対値を
求め、加算器152にて加算され、(3)式の距離
Dis(〓n、〓v o)がアキユレータ153にて求ま
り、この距離が距離メモリ部16へ出力される。
漸化式計算の初期値のセツトは音声の入力され
る前に制御部10の信号CLにより行われ、相異
度メモリ部18、桁相異度メモリ部21へ(17)、
(18)、(19)式で示した値がセツトされる。
漸化式計算部17は、第7図のブロツク4を行
う部分であ、漸化式(22)、(23)、(24)を実行す
る。すなわち、漸化式計算部17は、第12図に
示すように3つの相異度レジスタD1、D2、D3
と、その3つのレジスタD1、D2、D3の最小値を
計算する比較回路171と、加算器172と、3
つの経路レジスタF1、F2、F3より構成される。
制御部10より発せられた信号n2、n21、n22に
よつて相異度メモリ部18と経路メモリ部19よ
り3つの相異度D(l、v、n)、D(l、v、n
−1)、D(l、v、n−2)と3つの経路情報F
(l、v、n)、F(l、v、n−1)、F(l、v、
n−2)を読み出しそれぞれ相異度レジスタD1、
D2、D3と経路レジスタF1、F2、F3へ格納する。
比較回路171は相異度レジスタD1,D2,D3よ
り最小値を検出し、その最小値が得られた相異度
レジスタDn^(n^は1、2、3のどれか)に対応し
た経路レジスタFn^を選択するゲート信号n^を発す
る。前記ゲート信号n^により選択された経路レジ
スタFn^の内容が経路メモリ部19のF(l、v、
n)へ格納される。また、比較回路171より出
力された相異度の最小値D(l、v、n^)は、距
離メモリ部16より読み出された距離d(n)と
加算器172によつて加算され、相異度メモリ部
18のD(l、v、n)へ格納される。
この漸化式計算がn=U(m)よりL(m)まで
算出され、この結果である単語相異度D(l、v、
Nv)が各々vおよび各lに対して算出される。
桁相異度計算部20は、第7図のブロツク5を
行う部分であり、V個の単語相異度D(l、v、
Nv)の最小値を逐次求める。すなわち、桁相異
度計算部20は第13図に示すように、比較回路
201と、単語相異度D(l、v、Nv)を保持す
るレジスタ202と、単語標準パタンの属するカ
テゴリvを保持するレジスタ203と、経路情報
F(l、v、Nv)を保持するレジスタ204より
構成される。信号l1は信号v11つの区間にLmax
個発生される。この信号l1は、連続音声標準パタ
ンの桁lに対応する信号である。制御部10より
発せられた信号l1に従い、相異度メモリ部18と
経路メモリ部19より単語相異度D(l、v、
Nv)と単語経路情報F(l、v、Nv)が読み出
され、それぞれレジスタ202と204へ格納さ
れ、単語標準パタンの属するカテゴリvをレジス
タ203へ格納される。一方、比較回路201は
前記単語相異度D(l、v、Nv)と桁相異度メモ
リ部21より読み出された桁相異度DB(l、m)
と比較し、単語相異度D(l、v、Nv)がより小
さいと判定するとゲート信号v^を発生する。ゲー
ト信号v^に従つてレジスタ202,203,20
4に保持されていた単語相異度D(l、v、Nv)、
カテゴリv単語経路情報F(l、v、Nv)がそれ
ぞれ桁相異度メモリ部21のDB(l、m)、桁認
識カテゴリメモリ部22のW(l、m)、桁経路メ
モリ部23のFB(l、m)へ格納される。さらに
制御部10より信号Cl2によつて第7図のブロツ
ク3にて行われる部分である縦1列の相異度計算
の(20)、(21)式に示した初期セツトが行われ
る。すなわち桁相異度メモリ部21よりDB(l
−1、m−1)が読み出され、相異度メモリ部1
8のD(l、v、0)へ格納され、経路メモリ部
のF(l、v、0)へm−1が格納される。判定
部24は、第7図のブロツク6,7を行う部分で
あり、桁経路情報FB(l、m)と桁認識カテゴリ
W(l、m)より入力パタンの各桁の認識結果R
(l)を出力する。すなわち判定部24は第14図に
示すように、比較回路241と、最小桁相異度を
保持するレジスタ242と、桁数を保持するレジ
スタ243と、桁経路情報F(l、m)を保持す
るレジスタ244と認識結果を保持するレジスタ
245より構成される。音声の終端が検出される
と入力部11より信号SPによつて制御部10に
通知され、つづいて制御部10は判定部24へ信
号m1を発し、判定部24は判定処理を開始する。
判定制御部246は信号m1を受けた後、信号l3
を桁相異度メモリ部21へ発する。信号l3に従つ
て、桁相異度メモリ部21より入力パタンの終端
Mでの桁相異度DB(l、M)が順次読み出され、
比較回路241によつて逐次最小値を求めレジス
タ242へ格納され、その時の桁数lがレジスタ
243へ格納される。信号l3に従つて、Lmax個
の桁相異度が読み出された後、レジスタ243の
内容が入力パタンの桁数を示している。判定制御
部246はl=L、m=Mとしてアドレス信号
l4、m2を桁経路メモリ部23と桁認識カテゴリ
メモリ部22へ発し、FB(L、M)とW(L、M)
が読み出され、レジスタ244とレジスタ245
へ格納される。レジスタ245の内容が認識結果
として出力される。さらに判定制御部246はl
=l−1、m=(レジスタ244の内容)として
アドレス信号m2を桁経路メモリ部23と桁桁認
識カテゴリメモリ部22へ発し、FB(l、m)と
W(l、m)が読み出されレジスタ244とレジ
スタ245に格納される。この処理を順次Lより
1まで操り返すことによりL桁の認識結果がレジ
スタRより出力される。
以上、本発明の原理とその一構成例を説明した
が、これらの記載は本発明の範囲を限定するもの
ではない。特に本発明の原理であるVLB法の説
明において計算のループの順序を一番内側により
n、l、v、mとしたが、l、n、v、mするこ
ともVLB法を導出した同様な理由により可能で
ある。
また、桁相異度DB(l、m)、桁経路情報FB
(l、m)、桁認識カテゴリW(l、m)より入力
パタンの判定を行う部分の説明において、DB
(l、M)の最小値を求め入力パタンの桁数を判
定しているが、IEEE TRANSACTIONS ON
ACOUSTICS、SPEECH.AND SIGNAL
PROCESSING、VOL ASSP−27、
DECEMBER 1979 第588頁より第595頁に記載
されているような制約条件のもとで入力パタンの
桁数を判定する方法も可能である。
さらに、入力パタン〓nと標準パタン〓v oとの距
離を(3)式のような距離尺度を用いて説明したが、
このかわりに(25)式のようなユークリツド距
離、(26)式のような内積等を用いてよい。
d(m、n)=Rr=1 (anr−bv or2 ……(25) d(m、n)=−Rr=1 (anr×bv or) ……(26) また、相異度を計算するための漸化式は(22)、
(23)、(24)式の形の他にも種々考えられ、この
(22)、(23)、(24)式の代わりに特公告56−28278
号に記載されている形も使用できることは明白で
ある。
【図面の簡単な説明】
第1図は相異度計算を行う範囲および、マツチ
ング経路の例を示した図であり、第2図は漸化式
において許されているマツチング経路を示した図
であり、第3図はHLB法の計算順辱を示した図
であり、第4図はHLB法における第l桁目の計
算順序を示した図であり、第5図は、判定処理の
計算順序を示した図であり、第6図1および2は
HLB法の計算手順を示すフローチヤートであり、
第7図1および2は本発明の原理であるVLB法
の計算手順を示すフローチヤートであり、第8図
はVLB法の計算順序を示した図であり、第9図
は本発明の一実施例の構成図であり、第10図は
本発明の実施例の動作を説明するためのタイムチ
ヤートであり、第11図は本発明の一構成要素の
一つである距離計算部の構成図であり、第12図
は漸化式計算部の構成図であり、第13図は桁相
異度計算部の構成図であり、第14図は判定部の
構成図であり、第15図は相異度メモリ部、経路
情報メモリ部の構成図であり、第16図は桁相異
度メモリ部、桁経路情報メモリ部、桁認識カテゴ
リメモリ部の構成図である。 第9図、第11図、第12図、第13図、第1
4図において、10……制御部、11……入力
部、12……入力パタンバツフア、13……標準
パタンメモリ部、14……標準パタン長メモリ
部、15……距離計算部、16……距離メモリ
部、17……漸化式計算部、18……相異度メモ
リ部、19……経路情報メモリ部、20……桁相
異度計算部、21……桁相異度メモリ部、22…
…桁認識カテゴリメモリ部、23……桁経路情報
メモリ部、24……判定部、151……絶対値回
路、152……加算器、153……アキユムレー
タ、171……比較回路、172……加算器、
D1,D2,D3……相異度を保持するレジスタ、
F1,F2、F3……経路を保持するレジスタ、20
1……比較回路、202……単語相異度を保持す
るレジスタ、203……カテゴリを保持するレジ
スタ、204……経路情報を保持するレジスタ、
241……比較回路、242……最小桁相異度を
保持するレジスタ、243……桁数を保持するレ
ジスタ、244……桁経路情報を保持するレジス
タ、245……認識結果を保持し出力するレジス
タ、246……判定制御部である。

Claims (1)

    【特許請求の範囲】
  1. 1 特徴ベクトルの時系列である1個以上の単語
    よりなる入力パタンA=〓1、〓2、……、〓n
    ……、〓Mとあらかじめ記憶されているV個の単
    語標準パタンBV=〓1 V、〓2 V、……、〓V o、……
    V NV(v=1、2、……、V)を組合せて得られ
    る最大Lmax桁の連続音声標準パタンC=Bv1
    Bv2、……、Bvl、……、BvLmaxとの間で入力パタ
    ンの時間軸mと連続音声標準パタンの時間軸nと
    を対応させる時間関数n(m)の上の入力パタン
    nと連続音声標準パタン〓oとのベクトル間距離
    d(〓n、〓o)の和として定義される相異度の最
    小値を求めるために、連続音声標準パタンC=
    Bv1、Bv2、……、Bvl、……、BvLmaxを各桁ごと
    に分割し、第l桁目における最適な時間関数n
    (m)によつて与えられるベクトル間距離の最小
    累積量を示す桁相異度DB(l、m)と、この時
    間関数の先頭時間点を示す桁経路情報FB(l、
    m)と、この時間関数上において最小累積距離を
    与えた単語名vである桁認識カテゴリW(l、m)
    とを、桁lおよび入力パタンの時間点mに対して
    順次求め、最後に入力パタンの桁数および各桁の
    認識結果を判定する連続音声認識装置において、
    入力パタンの時間点を示す信号mを1からMまで
    変化させ、各mに関して単語を示す信号vを1か
    らVまで変化させ、さらに各vに関して桁を示す
    信号lを1からLmaxまでおよび標準パタンの時
    間点を示す信号nを1からNvまで変化させて与
    える制御部と;前記制御部の信号l、v、nによ
    つて番地指定される相異度メモリ部D(l、v、
    n)と経路情報メモリ部F(l、v、n)と;各
    時間点mにおいて前記制御部より順次指定される
    単語vの単語標準パタン〓o v、n=1〜Nvと入
    力パタン〓nとのベクトル間距離d(〓n、〓o v
    n=1〜Nvを求める距離計算部と;この距離を
    記憶する距離メモリ部d(n)と;各時間点mに
    おいて、各桁l、および各単語vに関して最初に
    初期条件を時間点m−1の結果である桁相異度
    DB(l−1、m−1)と桁経路情報FB(l−1、
    m−1)により与え、前記距離d(n)と時間点
    m−1における相異度D(l、v、n)と経路情
    報F(l、v、n)とを参照して動的計画の漸化
    式を計算し時間点mにおける相異度D(l、v、
    n)と経路情報F(l、v、n)を順次求め、単
    語相異度D(l、v、Nv)と単語経路情報F(l、
    v、Nv)を求める漸化式計算部と;各時間点m
    において、各桁lに関して前記漸化式計算部で求
    められた各単語相異度D(l、v、Nv)の中より
    最小を求め、これを桁相異度DB(l、m)とし、
    これに対応した単語経路情報F(l、v、Nv)を
    桁経路情報FB(l、m)とし、最小値が得られた
    単語名vを桁認識カテゴリW(l、m)とする桁
    相異度計算部と;これらを記憶するための桁相異
    度メモリ部DB(l、m)と桁経路情報メモリ部
    FB(l、m)と、桁認識カテゴリメモリ部W(l、
    m)と;桁経路情報FB(l、m)と桁認識カテゴ
    リW(l、m)に基づいて逆順に入力パタンの各
    桁のカテゴリを判定し出力する判定部とを有する
    ことを特徴とする連続音声認識装置。
JP56197841A 1981-12-09 1981-12-09 連続音声認識装置 Granted JPS5898796A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP56197841A JPS5898796A (ja) 1981-12-09 1981-12-09 連続音声認識装置
US06/447,829 US4592086A (en) 1981-12-09 1982-12-08 Continuous speech recognition system
EP82306577A EP0081390B1 (en) 1981-12-09 1982-12-09 Continuous speech recognition system
DE8282306577T DE3267835D1 (en) 1981-12-09 1982-12-09 Continuous speech recognition system
CA000417329A CA1193013A (en) 1981-12-09 1982-12-09 Continuous speech recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56197841A JPS5898796A (ja) 1981-12-09 1981-12-09 連続音声認識装置

Publications (2)

Publication Number Publication Date
JPS5898796A JPS5898796A (ja) 1983-06-11
JPH0134399B2 true JPH0134399B2 (ja) 1989-07-19

Family

ID=16381225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56197841A Granted JPS5898796A (ja) 1981-12-09 1981-12-09 連続音声認識装置

Country Status (1)

Country Link
JP (1) JPS5898796A (ja)

Also Published As

Publication number Publication date
JPS5898796A (ja) 1983-06-11

Similar Documents

Publication Publication Date Title
US4592086A (en) Continuous speech recognition system
JPH0159600B2 (ja)
US5621849A (en) Voice recognizing method and apparatus
EP0144689B1 (en) Pattern matching system
EP0086081B1 (en) Continuous speech recognition system
EP0162255B1 (en) Pattern matching method and apparatus therefor
JPH0247760B2 (ja)
JPH0134399B2 (ja)
US6195638B1 (en) Pattern recognition system
JPH0134400B2 (ja)
JPH0575117B2 (ja)
JPH024919B2 (ja)
JPH0436400B2 (ja)
JPH0355836B2 (ja)
JPH0223876B2 (ja)
JPH0336436B2 (ja)
JP3009962B2 (ja) 音声認識装置
JP2785939B2 (ja) 連続音声認識装置
JPH0449954B2 (ja)
JPH04128800A (ja) パターンマッチング制御回路
JPH0577080B2 (ja)
JPH0570838B2 (ja)
JPH044600B2 (ja)
JPH0325798B2 (ja)
JPS6122350B2 (ja)