JPH0636155B2 - パタ−ン比較装置 - Google Patents

パタ−ン比較装置

Info

Publication number
JPH0636155B2
JPH0636155B2 JP60151731A JP15173185A JPH0636155B2 JP H0636155 B2 JPH0636155 B2 JP H0636155B2 JP 60151731 A JP60151731 A JP 60151731A JP 15173185 A JP15173185 A JP 15173185A JP H0636155 B2 JPH0636155 B2 JP H0636155B2
Authority
JP
Japan
Prior art keywords
pattern
frame
input
word
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP60151731A
Other languages
English (en)
Other versions
JPS6210698A (ja
Inventor
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60151731A priority Critical patent/JPH0636155B2/ja
Publication of JPS6210698A publication Critical patent/JPS6210698A/ja
Publication of JPH0636155B2 publication Critical patent/JPH0636155B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、登録された複数種類のパターンと入力パター
ンとの比較を行い、入力パターンの識別を行うパターン
比較装置、特に連続して発声した単語音声の認識などに
適用可能なパターン比較装置に関する。
従来の技術 人間にとって最も自然な情報発生手段である音声が、人
間−機械系の入力手段として真価が発揮されるために
は、話者を限定せず連続的な通常の会話音声の認識が可
能なことが望ましい。
第2図は単語単位を認識単位とする音声認識装置のブロ
ック図である。(21)は音声信号の入力端子、(22)は入力
音声信号を周波数分析、LPC分析、PARCOR分析、相関分
析等により幾つかの数値の組(特徴ベクトル)の系列に
変換する音響分析部、(23)は認識すべき単語が前記特徴
ベクトルの系列として登録されている標準パターン記憶
部、(24)は音響分析部(22)で分析された認識すべき入力
音声信号に対する前記特徴ベクトルの系列と前記標準パ
ターンのそれぞれとを比較し、両者の距離あるいは類似
度を計算するパターンマッチング部、(25)はパターンマ
ッチング部(24)の計算結果に基づいて前記入力音声パタ
ーンに最も近い標準パターンに対応する単語を認識結果
として判定する判定部であり、(26)はこの認識結果を出
力する出力端子である。このような構成による音声認識
装置において、パターンマッチングの方法として、動的
計画法による時間軸非線形伸縮によりマッチング(DPマ
ッチング)を行う方法が優れている。
本発明装置による連続単語認識においては、このDPマッ
チングを用いている。次にDPマッチングのアルゴリズム
について簡単に説明する。いま を2つの音声パターンとする。すなわち、それらの音声
パターンは、それぞれに対する特徴ベクトルai,bjの系
列で表される。
ベクトルaiとbjの距離をd(i,j)とするとき、前記両系列
を構成するベクトルの種々の対応づけに対し、d(i,j)の
荷重平均を求め、それが最小になる対応づけを両系列間
の最適な対応づけとし、そのときの荷重平均を両系列間
の距離D(A,B)とするのであるが、この手続きを動的計画
法を用いて効率よく行うのがDPマッチングである。な
お、d(i,j)は通常ベクトルaiとbjのユークリッド距離ま
たは市街距離が用いられる。
第3図はこれを二次元的に図示したもので、A,B両パ
ターンの時間の対応すなわち時間変換函数j(i)はi−j
平面上の格子点c(K)=(i(K),j(K))の系列 F=c(1)c(2)…c(k)…c(K)…(2) (i(K)=I,j(k)=J) で表わされる。このとき、D(A,B)は次のように定義され
る。
ここに、w(K)は非負の定数で、その値は時間変換函数j
(i)を点列で近似するときの方式によって定められる。
ここで、式(3)の分母をFに依存しない定数 とすれば、D(A,B)は動的計画法により効率的に求められ
る。すなわち、 であるから、g(c(1))=g(1,1)=d(1,1)として、漸化式
(4)を解き、g(c(K))=g(I,J)が求められれば としてD(A,B)が求められる。
式(3)の分母を定数化する方法として、M=I+Jとなるよ
うにする方法(対称型)と、M=IまたはJとなるよう
にする方法(非対称型)がある。第4図(a)〜(f)は点列
Fを選ぶ際の拘束条件の例を示しており、点(i,j)に至
る経路は図の矢線で示される経路のみとり得る。また各
線分上に示された数字はその線分が経路として選ばれた
場合の荷重w(K)を示している。(a)(b)は前記対称型の例
でM=I+Jとなり、(c)〜(f)は前記非対称型の例でM=
Iとなる。
このようなマッチング法を用いて単語音声の認識をする
には次のようにする。認識の対象となっている単語クラ
スをn(n=1〜N)、その標準パターンをBで表わ
す。入力Aと各標準パターンBとの距離D=D(A,
Bn)を上記の方法で計算し、 を与えるクラスn0をAに対する認識結果とする。
前記非対称型のDPマッチングでM=Iとなるようにすれ
ば、Mは入力パターン長にのみ関係する量となり、式
(5)において何れの標準パターンに対してもMは一定で
あるから、 と定義できる。第4図(c)の拘束条件のもとに式(6)を求
める場合には次の漸化式(7)を計算すればよい。
初期条件 g(1,1)=d(1,1) 次に連続単語音声の認識について説明する。連続単語音
声認識は次のように定式化できる。いまX個の単語q
(1),q(2),…q(x)を連続して発声したときの音声パター
ンをAで表わす。
A=a1a2…ai…aI……(8) 単語q(x)の標準パターンを とするとき、x個の単語Bq(1),Bq(2),…Bq(x)を接続し
て得られる標準パターンは で表わされる。ここではパターンの連続を表わす。
そこで、連続単語音声認識は、このと入力音声パター
ンAとの間でDPマッチングを実行し、その際得られるD
(A,)が最小になるように、xとq(x)(x=1,2,…,
x)を決めるという問題になる。すなわち を計算し、Tが最小になる条件を求めればよい。式(11)
の計算をまともに実行しようとすると、膨大な計算量が
必要となる。すなわち、入力音声パターンにおいて連続
発声の単語数の最大値をK、単語標準パターンの数をN
とすれば、N回の計算を実行することになる。そこ
で、実際にはこの問題を次の漸化式を解く問題に帰着さ
せている。
入力音声パターンAにおて、i=l+1からi=mまでの
部分区間を、部分パターンA(l,m)で定義する。
A(l,m)=al+1al+2…a……(12) このとき、式(6)によりパターン間の距離を定義すれば
次のことが言える。
このことを用いれば式(11)は次のように解ける。
ここで以後用いる記号の意味を第1表にまとめて示す。
なる漸化式の解を求めれば、認識結果は第5図に示すフ
ローチャートにより、X単語列の最後尾単語名とセグメ
ンテーション結果から先頭単語名とセグメンテーション
結果まで順次求まる。
ii)入力単語数Xが未知の場合 なる漸化式の解から第6図のフローチャートにより認識
結果が得られる。
以上の考え方を実現するのに2段DP法が提案されてい
る。次の2段DP法について概略を説明する。
2段DP法は、先ずDn 0(s:t)をあらゆるs,tの組合せに対
してDPで求めておき、その後D(i)をDPで求める方法で、
DPを2段にしているのが特徴である。この2段DP法とし
ては前向きアルゴリズムと後向きアルゴリズムが提案さ
れているが、ここでは後向きアルゴリズムについて説明
する。
入力パターンのフレームi−1に対して、D(i-1),N(i
-1),B(i-1)は求まっているとする。
単語n(n=1,2…N)の標準パターンと入力パターン
を、iを始点として逆時間向きにDPマッチングする。従
って、経路の拘束条件は第4図(c)(d)(e)(f)に対応し
て、第8図(a)(b)(c)(d)となる。マッチング範囲は、整
合窓幅Rで行うことも考えられるが、ここでは傾き1/2
〜2の範囲(傾斜制限内、第7図の斜線部)で行うもの
とする。このマッチングを終端フリーとして行う。その
結果、Dn 0(s:t)が求まる。ただし、i-2Jn+1≦s≦i−
(1/2)Jnである。
式(15)のD(i),N(i),B(i)を求める。
i=i+1としてへもどる。
以上の考え方は、マッチング経路の拘束条件が、第4図
(c)〜(f)に示すように非対称型であって、前記正規化系
数Mが入力パターンのフレーム数(より一般的には、入
力パターンの各フレームに適当に重みを導入した場合の
その重みの総和)にのみ依存する場合に成立するのであ
って、第4図(a)(b)のような対称型のパスの場合は前記
正規化係数は標準パターンのフレーム数にも依存してし
まい、漸化式(14)(15)等が成立しなくなる。
次にその理由を説明する。この場合は、標準パターン長
によっても累積照合距離が変るので、どの標準パターン
が最も良く適合するかを評価するためには前記の如く入
力パターン長と標準パターン長の和で両パターン間の累
積照合距離を割る(正規化する)必要があった。
いま、入力パターンAの部分パターンA(0,m)に最も良く
適合する標準パターンがB、その長さがb、その他
の任意の標準パターンがB、その長さがbであった
とすると次式が成立する。
但し、ここでD(P,Q)は正規化する前のパターンPとパタ
ーンQの累積照合距離を表わすものとしている。
入力が第iフレームの時点で式(14)(15)に基づいて(勿
論入力パターン長と標準パターン長で正規化するとし
て)バッタポインタと最後尾単語(単音節)を探索する
場合を考える。最後尾単語をX、その長さをx、バック
ポインタをmと仮定したとき、BとXを結合した標準
パターンと入力の部分パターンA(0,i)の累積照合距離を
入力パターン長と標準パターン長の和で正規化したもの
で表わされる。mおよびXを式(14)(15)により探索する
ためには、αは当然次の値よりも小さくなければならな
い。
すなわち、もしβ<αが成立すれば、式(15)におけるD
(m)として、第mフレーム目で求めたD(m)を用いること
ができなくなるからである。
ところが、α<βは一般には成立しない。例えば D(A(0,m),B1)=10,D(A(0,m),B2)=20 m=20,b=10,b=20 とすれば式(16)において 左辺=10/(20+10)=1/3 右辺=20/(20+20)=1/2 となり、上記の数値は式(16)を満足する。しかし i=40,x=10,D(A(m+1,i),X)=60 とすれば α=(10+60)/(40+10+10)=7/6 β=(20+60)/(40+20+10)=8/7 であるから α>β となり、もはや式(16)は満足されなくなる。
ところが入力パターン長のみに依存する前記非対称型の
DP法の場合は であれば は明らかであるから矛盾なく式(14)(15)が使える。
以上のように、対称型のDPパスを用いたときは、そのま
までは前記定式化に基づく連続単語音声認識はできない
ことになる。
問題点を解決するための手段 本発明は上記問題点を解決するために、入力信号を特徴
ベクトルの系列 に変換する特徴抽出手段と、特徴ベクトルの系列 からなる標準パターンB(ただし、n=1,2,…,N)
を一定のフレーム数Jの特徴ベクトルの系列 に変換する標準パターン正規化手段と、該正規化された
標準パターンを記憶する正規化標準パターン記憶手段
と、入力パターンの第1フレームから第mフレームまで
の部分パターンA(0,m)と前記正規化標準パターンをx-1
個最適に連結することによって得られる連結パターンと
の最小累積照合距離Dx-1(m)と、入力パターンの第m+
1フレームから第iフレームまでの部分パターンA(m,i)
と前記正規化標準パターン との最小累積照合距離Dn x(m+1:i)との和をn,mについて
最小化することにより、入力パターンの第1フレームか
ら第iフレームまでの最小累積照合距離Dx(i)を計算す
る累積照合距離計算手段と、そのときのm,nをBx(i),N
x(i)として記憶するバックポインタ記憶手段および最後
尾単語記憶手段と、入力が完了した時点で入力の最終フ
レームをIとするとき、入力がx単語から成るとした場
合、最終の単語はNx(I)、最終から2番目の単語はN
x-1(Bx(I))、最終から3番目の単語はNx-2(Bx-1(B
x(I)))…というように逆の順序で連続入力された単語音
声を認識する手段とを備えたもので、入力の単語数を指
定するとき、入力がその指定された単語数であると仮定
したときの最適の単語列を出力するものである。
作用 この構成により、特徴ベクトルの系列 から成る標準パターンB(ただし、n=1,2,…,N)
を一定のフレーム数Jの正規化標準パターン に変換し、入力パターンの第1フレームから第mフレー
ムまでの部分パターンと、前記正規化標準パターンを最
適にx-1個連結することによって得られる連結パターン
との最小累積照合距離Dx-1(m)と、入力パターンの第m+1
フレムから第iフレームまでの部分パターンと前記正規
化標準パターンとの最小累積照合距離Dn x(m+1:i)
との和をn,mについて最小化したものとして、入力ター
ンの第1フレームから第iフレームまでの最小累積照合
距離Dx(i)を計算し、そのときのmをバックポインタD
x(i)として、nを入力が第iフレームで終端するとした
ときの最後尾単語名Nx(i)とし、i=1、2…I,x=1,2,
……Xについて順次Bx(i),Nx(i)を求め、入力が完了す
ると(i=Iになると)、入力が、x単語から成るとし
た場合は、最終の単語はNx(i)、最終から2番目の単語
はNx-1(Bx(I))、最終から3番目の単語はNx-2(Bx-1(B
x(I)))…というように逆の順序で連続入力された単語音
声を認識する。
実施例 以下本発明の一実施例を図面に基づいて説明する。第1
図は本発明の連続音声認識装置の一実施例を示すブロッ
ク図である。第1図において、Iは音声信号の入力端
子、(1)はフィルタバンク等で構成された特徴抽出であ
って、入力音声信号を特徴ベクトル の系列Aに変換する。(2)は単語標準パターン記憶部で
あって、認識語彙たるN個の単語が、それぞれ標準パタ
ーン (n=1,2…,N)として特徴ベクトルの系列の形で予
め登録されている。(3)は標準パターン正規化部であっ
て、単語標準パターン記憶部(2)に保持されているパタ
ーンBの第jフレームを線形伸縮によって第 フレームに対応せしめ、フレーム数Jのパターンをフ
レーム数Jのパターンに変換する時間軸正規化を行なう
ものである。ここにJは定数である。第9図はこの変換
方法を説明する図である。第9図(a)は単語標準パター
ンBのフレームjが に変換される様子を示している。(100)は横軸をx、縦
軸をyとすると で与えられる直線である。実際には、jは整数値しか取
り得ないから によりjと を対応づける。ここに、〔Z〕はZ以下の整数でZに最
も近いものを表わす。第9図(b)は特徴ベクトルの系列
で表わされるパターンBにおいて、第jフレームのベ
クトルを とするとき時間軸正規化する前のベクトル と時間軸正規化後のベクトル の関係を説明するものである。式(20))によれば と対応するjは なる直線と、直線(100)との交点(102)の下側にあって、
その交点に最も近い 上の格子点(103)のyの座標として対応づけられるそこ
で、 は、 上にあって、前記交点(102)より上側でその交点に最も
近い格子点(101)のy座標におけるベクトル とから線形補間により求める。即ち、格子点(101)と格
子点(103)を交点(102)が1-S対Sに分けるものとすれば で与えられる。Sは式(19)において を代入して得られたyから、式(20)で与えられるjを引
くことによって得られる。即ち となる。
(4)は正規化標準パターン記憶部であって、標準パター
ン正規化部(3)で時間軸が正規化された特徴ベクトルの
系列を標準パターンとして記憶する。このように、標準
パターンのフレーム数を単語に依らずに一定にすれば、
前記対称型のDPパスを用いても式(14)は成立する。即
ち、前記の例において、b=b=c=J(const)と
すれば、式(17)(18)に対応して となるから、式(16)に対応して が成立すればα<βが必ず言えるからである。ただしこ
れらの分母は単語数が同じとした場合に等しくなって上
記のことが言えるのであるが、異なる単語数に対して比
較しなければならない式(15)の場合のように単語数が未
知の場合には用いることができない。従って、本発明は
単語数が既知とした場合には適用可能なものである。
(5)はベクトル間距離計算部であって、入力パターンの
第iフレームにおける特徴ベクトル とn番目の単語標準パターン の特徴ベクトル との距離dn(i,j)をj=1,2,…,Jについて求めるもの
である。本実施例では第4図(b)のマッチング経路を用
いるものとすれば、dn(i,j)は計算の都度次の計算に1
回用いられるのみであるから、本実施例の方法によれ
ば、1回用いられると以後記憶しておく必要はない。従
って、ここではd=dn(i,j)とすることができる。dn(i,
j)は例えば との市街地距離として定義できる。即ち、ベクトルの次
元をlとし とするとき 等である。
(6)は累積距離計算部であって、経路の拘束条件が、第
4図(b)の場合について漸化式(14)の解を求める部分で
ある。第iフレームについて中間累積距離Dn x(i,j)、
終端累積距離Dx(i)、中間バックポインタDn x(i,j)、バ
ックポインタBx(i)をj=1,2,…J;n=1,2,…Nにつ
いて求め、iを終端フレームとしたときの最後尾の単語
を示すNx(i)を求める。本実施例におけるマッチング経
路の拘束条件によれば、Dn x(i,j),Dx(i)はj=1,2,…
…Jについて順次次の漸化式を計算することにより求ま
る。
初期条件 Dn x(i-1,0)=Dx-1(i-1) n x(i,j),Bn x(i)は次の式から求まる。
初期条件 Dn x(i-1,0)=i-1 また である。
式(24)〜(28)の計算をx=1,2,…Xのそれぞれについて
行ない、各フレームについて、最終的にDx(i),Bx(i),Nx
(i)を得る。ここでDx(i)は次のフレームの計算の際にの
み必要であるから、Dx=Dx(i)とすることができる。即
ちD1,D2,…Dxのみ記憶しておけば良い。
以上のようにして求められた終端累積距離Dx、バックポ
インタBx(i)、最後尾単語名Nx(i)はそれぞれx=1,2,
…,Xについて、終端累積距離記憶部(7)、バックポイ
ンタ記憶部(8)、最後尾単語名記憶部(9)に記憶される。
なお、Dn(i,j),Bn(i,j)(j=1,2,…J;n=1,2,…N)
は必要がなくなるまで累積距離計算部(6)の内部のメモ
リに一時的に記憶されるのであるが、本実施例において
は、第iフレームのそれらの計算には1フレーム前と現
フレームの値のみ必要であるから、2フレーム分のみ記
憶すれが良い。即ち、k=0.1についてDn(k,j),Bn(k,j)
を準備しておき、例えば入力の奇数番目のフレームにお
いてはk=0を前フレーム、k=1を現フレームとして
計算し、入力の偶数フレームにおいてはk=1を前フレ
ーム、k=0を現フレームとして計算すれば良い。
(10)は音声区間検出部であって、入力信号の大きさ等か
ら音声区間を判定するものである。音声区間検出部(10)
が、音声入力が開始されたことを検出するとフレーム数
計数部(11)はフレーム毎に計数をはじめる。前記の処理
は第iフレームについての処理であったが、このフレー
ム数計数部(11)の計数値がすなわちこのiを設定してい
る。従って、前記と同様の処理が、フレームが1進む毎
に行われることになる。フレーム数計数部(11)は音声区
間が検出されると計数を始め、音声区間が終了するとリ
セットされる。従って、最後尾単語記憶部(9)、バック
ポインタ記憶部(8)には、Nx(i),Bx(i)がi=1,2,…I;
x=1,2,…Xについて記憶されることになる。
セグメンテーション部(12)はバックポイント記憶部(8)
に対し、所定のバックポインタを読出すべき命令を発す
るものである。すなわち、セグメンテーション部(12)が
Bx(i)なる値をバックポインタ記憶部(8)に発すると、バ
ックポインタ記憶部(8)からはバックポインタBx-1(B
x(i))が読出される。セグメンテーション部(12)はバッ
クポインタ記憶部(8)からBx-1(Bx(i))なる値を受け取る
と、その同じ値をバックポインタ記憶部(8)に発する。
従って、音声区間検出部(10)が音声入力の終了を検知す
ると、フレーム数計数部(11)の最終地Iと単語数Xがセ
グメンテーション部(12)に供給され、セグメンテーショ
ン部(12)は先ずI,Xなる値をバックポインタ記憶部(8)に
発する。以後、前記説明の動作に従って、バックポイン
タ記憶部(8)からBx(I),Bx-1(Bx(I)),Bx-2(Bx-1(B
x(I))),…0なる出力が順次得られることになる。これ
らの値は最後から2番目の単語の終りのフレーム、同3
番目の終りのフレーム、同4番目の終りのフレーム、…
というものであり、Nx(i)はiフレームで終わる単語で
あったから、この値をそのまま最後尾単語記憶部(9)に
与えると、最後の単語から逆の順序で認識結果が得られ
る。なお認識結果が逆の順序で得られないようにするた
めには、この順序の変換をバックポインタ記憶部(8)の
出力に対して行うか最後尾単語記憶部(9)の出力に対し
て行えばよい。
第10図は前記実施例装置の機能をソフトウエアで実現
した場合のフローチャートであり、以下前記実施例装置
の各部の動作と結びつけて説明する。
ステップ(100)〜(105)は累積距離Dx、中間累積距離Dn x
(i,j)、バックポインタBx(i)、中間バックポインタDn x
(i,j)の初期化を行う部分である。
ステップ(107)〜(117)は第iフレームのときに実行する
処理である。ステップ(111)は第iフレームにおける中
間累積距離と中間バックポインタの初期値を与える部分
である。ステップ(114)〜(117)の処理は、主として累積
距離計算部(6)で行われる処理である。ステップ(116)に
おける記法 はDn x(k,Jn)を最小にするnを とおくという意味である。ステップ(114)は中間累積距
離Dn x(k,j)、中間バックポインタBn x(k,j)を求めてい
る。ステップ(116)はステップ(114)の計算をn=1,2,
…,Nについて行った結果入力の第iフレームを入力の
終端としたとき、累積距離Dn x(k,Jn)が最小となる最後
尾単語 を求める処理である。ステップ(117)はステップ(116)で
求まった最適の単語 に対し、 としてそれぞれメモリに記憶することを示しており、そ
れらのメモリは最後尾単語記憶部(9)、累積距離記憶部
(7)、バックポインタ記憶部(8)に対応している。
ステップ(106)(108)によってiが奇数のときは、k=
1,iが偶数のときにはk=0となり、前記のように中
間累積距離Dn x(k,j)、中間バックポインタBn x(k,j)を
記憶するためのメモリは、フレームが切り替る毎に、直
前のフレームに対する記憶用と現フレームに対する記憶
用とに交互に切り替ることになる。即ち、ステップ(11
1)(114)(116)(117)において、kは現フレーム、は直
前のフレームを意味することになる。
ステップ(118)〜(120)は以上のようにして求められたNx
(i),Bx(i)から逆の順序で単語の認識結果を求める部分
で、セグメンテーション部(12)、バックポインタ記憶部
(8)、最後尾単語記憶部(9)の間で行われる処理に対応し
ている。
ステップ(118)のxとしては、種々の値を設定できる。
例えばx=5として計算しておけば、入力単語数が、1
〜5のそれぞれを仮定した場合についてDx(I)が求まっ
ているから、x=1〜5について を計算し、x=からステップ(118)〜(200)の計算をす
ることにすればx=1〜5について入力単語数未知の場
合も認識も可能となる。
本実施例では、連続して発声された単語を認識する場合
を述べたが、単語の代りに単音節等であってもよく、そ
の他の連続するパターンの認識にも適用できるものであ
る。
また、経路の拘束条件として第4図(b)に示したものと
用いたが、他の拘束条件、例えば第4図(a)に示すよう
な拘束条件を用いてもよく、入力パターンの物理的性質
に応じて適当に設定することができる。
さらに、本実施例では距離を用いて説明したが、相関等
を用いると類似度によって、ベクトル間の近さを定義す
ることができ、距離で最小化する代りに類似度で最大化
するという方法も全く同様な扱いで実現できる。
発明の効果 以上のように本発明によれば、連続して発声された音声
を対称型のDPパスを用いて認識することができ、認識精
度の高い連続音声認識装置を実現することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
音声認識装置の原理的説明を行うブロック図、第3図は
孤立単語音声認識における非線形伸縮マッチングを説明
する図、第4図はDPマッチングにおける経路の制限条件
の例を示す図、第5図は連続単語音声認識を単語数既知
とした場合の単語決定段階における処理の流れを示すフ
ローチャート、第6図は同様に単語数未知の場合のフロ
ーチャート、第7図は連続単語音声認識を行う場合のマ
ッチングの範囲を示す図、第8図は逆時間DPマッチング
を行う場合の経路の制限条件の例を示す図、第9図は標
準パターンの長さを一定値に交換して正規化標準パター
ンを作り出す方法を説明する図、第10図は上記実施例
をソフトウエアで実現する場合の方法を説明するNSチャ
ートである。 (1)……特徴抽出部、(2)……単語標準パターン記憶部、
(3)……標準パターン正規化部、(4)正規化標準パターン
記憶部、(5)……ベクトル間距離計算部、(6)……累積距
離計算部、(7)……終端累積距離記憶部、(8)……パック
ポインタ記憶部、(9)……最後尾単語記憶部、(10)……
音声区間検出部、(11)……フレーム数計数部、(12)……
セグメンテーション部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力信号を特徴ベクトルの系列a
    に変換する特徴抽出手段と、特徴ベクトルの系列 から成る標準パターンB(ただし、n=1,2,…,N)
    を一定のフレーム数Jの特徴ベクトルの系列 に変換する標準パターン正規化手段と、該正規化された
    標準パターンを記憶する正規化標準パターン記憶手段
    と、入力パターンの第1フレームから第mフレームまで
    の部分パターンA(0,m)と前記正規化標準パターンをx−
    1個最適に連結することによって得られる連結パターン
    との最小累積照合距離(または最大累積照合類似度)D
    x-1(m)と、入力パターンの第m+1フレームから第iフ
    レームまでの部分パターンA(m,i)と前記正規化標準パタ
    ーン との最小累積照合距離(または最大累積照合類似度)D
    n x(m+1:i)との和をn,mについて最小(最大)化すること
    により、入力パターンの第1フレームから第iフレーム
    までの部分パターンA(0,i)と前記正規化標準パターンの
    x個の結合パターンとの距離(類似度)が最小(最大)
    となる最小累積照合距離(または最大累積照合類似度)
    Dx(i)を計算する累積照合距離(または累積照合類似
    度)計算手段と、そのときのmをBx(i)として記憶する
    バックポインタ記憶手段と、そのときのnをNx(i)とし
    て記憶する最後尾単語名記憶手段と、入力が完了した時
    点で入力の最終フレームをIとするとき、入力がx単語
    から成るとした場合、最終の単語はNx(I)、最終から2
    番目の単語はNx-1(Bx(I))、最終から3番目の単語はN
    x-2(Bx-1(Bx(I)))…というように逆の順序で連続入力さ
    れた単語音声を認識する手段とを備えたパターン比較装
    置。
JP60151731A 1985-07-09 1985-07-09 パタ−ン比較装置 Expired - Fee Related JPH0636155B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60151731A JPH0636155B2 (ja) 1985-07-09 1985-07-09 パタ−ン比較装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60151731A JPH0636155B2 (ja) 1985-07-09 1985-07-09 パタ−ン比較装置

Publications (2)

Publication Number Publication Date
JPS6210698A JPS6210698A (ja) 1987-01-19
JPH0636155B2 true JPH0636155B2 (ja) 1994-05-11

Family

ID=15525056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60151731A Expired - Fee Related JPH0636155B2 (ja) 1985-07-09 1985-07-09 パタ−ン比較装置

Country Status (1)

Country Link
JP (1) JPH0636155B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60180704A (ja) * 1984-02-27 1985-09-14 Yunipooto Trading Kk チップブレーカホルダ

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
日本音響学会講演論文集昭59年3月1−3−21P.89−90

Also Published As

Publication number Publication date
JPS6210698A (ja) 1987-01-19

Similar Documents

Publication Publication Date Title
JP2595495B2 (ja) パタンマッチング装置
US4570232A (en) Speech recognition apparatus
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
US4901352A (en) Pattern matching method using restricted matching paths and apparatus therefor
JPH0247760B2 (ja)
JPH0636155B2 (ja) パタ−ン比較装置
US6195638B1 (en) Pattern recognition system
JPH0247758B2 (ja)
JP3477751B2 (ja) 連続単語音声認識装置
JPH0823758B2 (ja) 話者適応形音声認識装置
KR100293465B1 (ko) 음성인식방법
JPS6073698A (ja) パタ−ン比較装置
JPH0320759B2 (ja)
JPH0361957B2 (ja)
JP3008520B2 (ja) 標準パタン作成装置
JP2574242B2 (ja) 音声入力装置
JPS6131878B2 (ja)
JPH0247759B2 (ja)
JPH022159B2 (ja)
JPH0449718B2 (ja)
JPH09305195A (ja) 音声認識装置および音声認識方法
JPS59195699A (ja) 単語音声認識装置
JPH0449719B2 (ja)
JPS62299999A (ja) パタ−ン比較装置
JPH067354B2 (ja) パタ−ン比較装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees