JPH0247755B2 - - Google Patents

Info

Publication number
JPH0247755B2
JPH0247755B2 JP57002565A JP256582A JPH0247755B2 JP H0247755 B2 JPH0247755 B2 JP H0247755B2 JP 57002565 A JP57002565 A JP 57002565A JP 256582 A JP256582 A JP 256582A JP H0247755 B2 JPH0247755 B2 JP H0247755B2
Authority
JP
Japan
Prior art keywords
matching
distance
value
sequence
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57002565A
Other languages
English (en)
Other versions
JPS58120296A (ja
Inventor
Kyohiro Kano
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57002565A priority Critical patent/JPS58120296A/ja
Priority to US06/448,085 priority patent/US4570232A/en
Priority to FR8221431A priority patent/FR2518783A1/fr
Priority to DE19823247229 priority patent/DE3247229A1/de
Publication of JPS58120296A publication Critical patent/JPS58120296A/ja
Publication of JPH0247755B2 publication Critical patent/JPH0247755B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 この発明は例えば音声認識等の分野で、系列パ
ターンのマツチングによつてパターン認識する場
合に用いられ、系列間の距離又は類似度を動的計
画法を用いた非線形正規化マツチングにより二つ
の系列パターンの距離又は類似度を求める系列パ
ターン・マツチング方法に関する。
この発明による系列パターン・マツチング方法
で取り扱える系列は、特徴量の系列であつて、特
徴量間の距離や類似度が定義されていれば、どの
ような対象からの系列でもよいが、以下では代表
的な系列の例として音声の時系列を対象とする系
列パターン・マツチング方法について説明する。
スペクトル時系列の動的計画法を用いたマツチ
ング(以下、DPマツチングと記す)は、単語音
声認識装置などに用いられ、広く使われはじめて
いる。従来のDPマツチングは、音声区間の切り
出しのあいまいさのない入力音声の時系列A′=
a1,a2……aoと標準パターンの時系列B′=b1b2
…bnとの間で、時間軸の非線形伸縮を許して要
素間の対応づけを行い、系列間の距離(スコア)
を計算するものであつた。従来からのDPマツチ
ングの代表的な例を第1図に示す。即ち従来の
DPマツチングでは系列A′,B′の要素間の距離マ
トリツクスD′(dij)(dijは要素aiとbjの距離)は行
方向に入力音声パターンAの要素番号iが、列方
向に標準パターンBの要素番号jがとられ、その
各格子点(i,j)11が距離dijであり、i+
j=2+1を満す各格子点111について動的計
画法のくり返し逐次演算を実行し、次にi+j=
2+2を満す各格子点112について動的計画法
のくり返し逐次演算を実行し、以下同様にしてi
+j=2+3,i+j=2+4,…を満す各格子
点について動的計画法のくり返し逐次演算を実行
する。これらのくり返し逐次演算の漸化式として
は例えば次式が用いられる。
g(i,j)=ming(i−1,j−2)+2
dij-1+dij g(i−1,j−1)+2dij g(i−2,j−1)+2di-1j+dij (1) このDPマツチングのくり返し逐次演算は窓制限
12内の格子点について実行する。このような従
来DPマツチングでは、音声の始端(1,1)の
切り出し点の要素a1,b1よりも後の要素ai,bj(1
≦i≦n,1≦j≦m)から計算できる距離マト
リツクスD′=(dij)の上でのみのDPマツチングを
実行していた。
この発明によるDPマツチングでは、音声区間
の切り出し点(始端)の要素a1,b1以前の系列情
報ao′…a0,bn′…b0(n′≦0,m′≦0)から計算
できる要素間の距離も利用して、DPマツチング
のスコアを求め、スコアが最小になるように始端
を事後的に決める。終端においても、終端の要素
ao,bn以後の系列情報ao+1…ao″,bn+1…bn
(n″>n,m″>m)も利用して、距離マトリツク
スD(dij)(n′≦i≦n″,m′≦j≦m″)上でDPマ
ツチングのスコアが最小になるように終端の位置
が事後的に決められる。
このようにこの発明では、切り出しのあいまい
さをもつたままの時系列間のDPマツチングが実
行できるので、従来のDPマツチングがこうむつ
ていた音声区間の切り出しの誤りに起因する認識
誤りを大幅に削減することができる。
第2図は音声認識装置の一般的構成を示し、入
力端子14からの入力音声は特徴パラメータの抽
出部15で入力音声の特徴パラメータの時系列A
に変換される。一方、標準パターン記憶部16に
あらかじめ標準パターンの特徴パラメータの時系
列Bが蓄えられている。距離計算部17で入力音
声の時系列Aと標準パターンの特徴パラメータの
時系列Bとの距離マトリツクスDが計算される。
この距離マトリツクスはDPマツチング部18で
各標準パターンBについてのマツチングスコアが
DPマツチングにより計算され、その最小のスコ
アが単語決定部19で決定され、その決定された
単語名が端子21から出力される。
この発明でのDPマツチングについて説明する
前に、DPマツチングでの距離マトリツクス上の
距離の定義及びDPマツチングの段の進め方につ
いて簡単に説明する。
DPマツチングの段を規定する距離としては、
第3図に示すような各種の距離を考える。第3図
Aは通常のDPマツチングで用いられている市街
化距離に基づく段を規定する距離である。つまり
縦パス22、横パス23、斜めパス24をとり、
すべての格子点について演算を行い、その演算段
は線25で示される。第3図B,Cは傾斜制限を
考慮し、かつ、DPの段数を削減することを目的
として考え出された距離であり、演算段25はN
段ごとであり、斜めパスのみである。これらの距
離を用いる場合には、距離マトリツクスD′=
(dij)上での演算段を第3図に示すようにi+j
=Nl+2(たゞし、N≧1の正整数で、l=0,
1,2…lnax)を満す格子点(i,j)上で、動
的計画法のくり返し逐次演算を行い、l=0,
1,2,…,とlnax(lnax=〔n+m N〕)まで演算段を
順次進める。
この発明によるDPマツチングにおいてはその
入力は、切り出しのあいまいな系列、A=ao′…
a0,a1…ao…ao″とB=bn′…b0,b1…bn…bn″が
用いられる。従来のDPマツチングでは、a1,b1
の始点(格子点(1,1))から終端ao,bn(格子
点(n,m))までを、くり返し逐次演算を順次
くり返し、スコアが最小になるように非線形伸縮
を行う。この様子は第1図に示した通りである。
この発明のDPマツチングでは始端においては、
a1あるいはb1より前の要素からの距離の値dijも用
いる。そのためDPマツチングの段の格子点を第
4図に示すようにa1あるいはb1より前の要素の領
域まで拡張する。よつて始端は従来のDPマツチ
ングでは(1,1)の格子点だけであつたが、窓
制限内のi,j=2を満す格子点(i,j)の集
合に拡張される。この始端の格子点(i,j)εi
+j=2の集合におけるDPマツチングのくり返
し逐次演算の初期値をg(0,k)=0(たゞし、
k=j−i)とする。
同様に、終端は格子点(n,m)を、窓制限内
のi+j=lnaxN+2を満す第lnax段の格子点の
集合(i,j)に拡張する。この始端の格子点の
集合からDPマツチングのくり返し逐次演算を
lnax段までくり返せば、系列間の距離(スコア)
S(A,B) S(A,B)=1/n+mmin k g(lnax,k)εk=j−i が求まる。
第5図はこの発明を第4図のN=3の場合に適
用した一実施例を示す。まず、バツフア26に標
準パターンの特徴パラメータの時系列B=bn′…
b0,b1…bn…bn′が、バツフア27に入力音声の
特徴パラメータの時系列A=ao′…a0a1…ao
ao″がそれぞれ記憶される。くり返し逐次計算値
のバツフアレジスタG28の初期値が初期値設定
部29により決定され、端点フリー領域のレジス
タGの値は0に、その他の領域では、大きな値に
設定される。また、設定端子31より、第1段目
(i+j=M:M=5)の格子点(i,j)で第
4図に示す窓制限内のjのものとも大きい格子点
(i,j)が選らばれ、その値が設定される。第
5図の場合にはj=4、i=1と設定される。こ
の(i,j)に対応してくり返し逐次計算値のバ
ツフアレジスタG28の番号kの値が設定され
る。第5図の場合には、k=j−i=4−1=3
となる。
次に、要素間距離計算部32で、バツフア26
のj〜j−2番目の要素bj,bj-1,bj-2と、バツ
フア27のi〜i−2番目の要素ai,ai-1,ai-2
を読み出し、これらの要素間の距離dij,di,j-1
di-1,j,di-1,j-1,di-2,j-2を計算する。この
距離の値と前段までのくり返し逐次演算値g(k
−1),g(k),g(k+1)とからくり返し逐次
計算値の候補の計算部33で、候補値a,b,c
を次のように計算する。
a=g(k−1)+di,j-1+dij b=g(k)+(di-2,j-2+di-1 ,j-1+di,j)×4/3 c=g(k+1)di-1,j+dij その後、決定部34で候補値a,b,cのうち
の最小値を求め、その値を通路35を通じてバツ
フアレジスタ28のk番目のG(k)に書き込む。
次に(i,j)設定部36で、同じ演算段での次
の格子点(i,j)の値及びkの値を設定する。
つまり、jの値をj−1に、iの値をi+1に
し、kの値をk−2に設定する。このようにして
更新されたi,jによる格子点(i,j)が窓制
限内に依然として存在しているときには、この
i,jの値を通路37を通じてバツフア26,2
7に送り、かつ、kの値を通路38を通じてバツ
フアレジスタ28に送り、計算部32,33、決
定部34で同様の処理を行つてくり返し逐次計算
を実行する。
(i,j)設定部36で更新した格子点(i,
j)が窓制限内に存在していない場合には、次段
設定部39でMの値をM+3にし、i+j=Mを
満す格子点(i,j)で窓制限内のjのもつとも
大きな値の格子点の値にi,jを設定する。更に
kの値をj−iに設定する。この設定した演算段
が終了すべき段でないときには、通路37を通じ
てj,iの値をバツフア26,27に送り、通路
38を通じてkの値をバツフアレジスタ28に送
つた後、計算部32,33、決定部34での各処
理を行つてくり返し逐次計算を実行する。次段設
定部39で設定した演算段が終了すべき段である
ときには、計算部41でバツフアレジスタ28の
値から単語間距離を計算し、単語決定部に送る。
以下、第3図B、第4図に示したN=3の場合
を例にとりあげ、認識実験の結果も含めて説明す
る。N=3の場合のDPマツチングのくり返し逐
次演算は、次式のように表わされる。
たゞし、g(l,k)は、第l段のくり返し逐
次演算値を示し、kは窓制限内のk=j−iを満
足する値である。
次に認識実験の結果について述べる。認識対象
は男性4名が2回ずつ発声した641都市名単語音
声データである。単語音声認識の方法としては昭
和55年10月日本音響学会秋期発表会講演論文集1
−1−17に記載されているSPLIT法を用いた。
DPマツチングの手法としては、N=3の場合に
ついて、昭和55年10月日本音響学会秋期発表会講
演論文集1−1−10に記載した擬似端点フリーの
手法(従来の手法と呼ぶ)と、この発明の端点フ
リーの手法をとりあげた。端点フリーマツチング
を行うために、入力音声データのao′…a0と標準
パターンのbn′…b0の特徴パラメータは、a1及び
b1の特徴パラメータで代用した。同様にao+1
ao″,bn+1…bn″の特徴パラメータもao,bnで代用
した。従来の方法の4名の発声者での平均の単語
認識率は96.2%であり、第2位以内に正しい単語
名の入る確率は98.3%となつた。この発明の端点
フリーDPマツチングを用いた場合には、単語認
識率が96.7%に、第2位以内に正しい単語名の入
る確率が99.0%となり、性能が向上した。更にパ
ワー情報を用いてこの発明のDPマツチングの始
端と終端の端点フリーの領域を制限した場合に
は、単語認識率がさらに向上して97.4%となつ
た。これにより、この発明の端点フリのDPマツ
チングアルゴリズムの有効性が実証できた。前述
のようにao′…a0,bn′…b0をそれぞれa1,b1で代
用し、またao+1…ao″,bn+1…bn″をそれぞれao
bnで代用しても前述のように認識率が向上して
おり、このような代用をしなければ一層認識率が
向上する。
以上のDPマツチングの説明では、特徴パラメ
ータ間の距離をもとにしたDPマツチングの手法
について述べてきたが、特徴パラメータ間の類似
度に対しても、同様に定式化でき、その場合は前
記式でminをmaxとすればよい。
以上述べたように、この発明によるDPマツチ
ングの手段を用いれば、切り出し点があいまいで
ある2個の系列のマツチングが行えるようにな
る。よつて、従来のDPマツチングを用いた認識
装置で生じていた、切り出しの誤りによる認識誤
りを大幅に削減することができる。この発明の
DPマツチングは音声認識以外にも、系列の切り
出しのあいまいさをもつ様々な分野での系列マツ
チングの手段として適用可能である。
【図面の簡単な説明】
第1図は従来のDPマツチングにおける距離マ
トリツクスを示す図、第2図はDPマツチングに
よる単語音声認識システムの一構成例を示すブロ
ツク図、第3図はDPマツチングにおける段を規
定する距離の説明と従来からのDPマツチングの
パスの例を示す図、第4図はこの発明における
DPマツチングのN=3の場合の説明図、第5図
はこの発明の実施例を示すブロツク図である。 11:格子点、14:音声入力端子、15:特
徴パラメータ抽出部、16:標準パターン記憶
部、17:距離計算部、18:DPマツチング部、
19:単語決定部、21:単語名出力端子。

Claims (1)

    【特許請求の範囲】
  1. 1 2個の特徴パラメータの系列A=ao′…a0
    a1…ao…ao″とB=bn′…b0,b1…bn…bn″(a1
    b1はA,Bの始端の候補、ao,bnはA,Bの終端
    の候補)の系列パターン間の距離又は類似度を、
    上記系列の要素間のマトリツクスD=(dij)(dij
    は系列Aの要素aiと系列Bの要素bjとの距離又は
    類似度を表わす)上でi+j=M+lN(Mは定
    数、N≧3、lは整数)を満すすべての格子点に
    ついて、(l+1)段のくり返し逐次演算の漸化
    式の値g(l+1,k)をk=j−iとしてNが
    奇数の場合g(l,k−1),g(l−1,k),g
    (l,k+1)と上記マトリツクスDで、Nが偶
    数の場合g(l,k−2),g(l,k),g(l,
    k+2)と上記マトリツクスDで動的計画法のく
    り返し逐次演算をl=0,1,……,lnaxに対し
    て実行する動的計画法を用いた非線形伸縮正規化
    マツチングにより上記二つの系列の距離又は類似
    度を求める系列パターン・マツチング方法におい
    て、上記始端候補a1,b1より前の系列情報ao′…
    a0,bn′…b0の要素間dijを上記演算の実行に用
    い、かつ上記終端の候補ao,bnより後の系列情報
    ao+1…ao″,bn+1…bn″の要素間dijを上記演算の実
    行に用いることを特徴とする系列パターン・マツ
    チング方法。
JP57002565A 1981-12-21 1982-01-11 系列パターン・マッチング方法 Granted JPS58120296A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP57002565A JPS58120296A (ja) 1982-01-11 1982-01-11 系列パターン・マッチング方法
US06/448,085 US4570232A (en) 1981-12-21 1982-12-09 Speech recognition apparatus
FR8221431A FR2518783A1 (fr) 1981-12-21 1982-12-21 Appareil pour realiser la comparaison de formes de sequences
DE19823247229 DE3247229A1 (de) 1981-12-21 1982-12-21 Anpasseinrichtung fuer sequenzmuster

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57002565A JPS58120296A (ja) 1982-01-11 1982-01-11 系列パターン・マッチング方法

Publications (2)

Publication Number Publication Date
JPS58120296A JPS58120296A (ja) 1983-07-18
JPH0247755B2 true JPH0247755B2 (ja) 1990-10-22

Family

ID=11532889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57002565A Granted JPS58120296A (ja) 1981-12-21 1982-01-11 系列パターン・マッチング方法

Country Status (1)

Country Link
JP (1) JPS58120296A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4244524B2 (ja) * 2001-02-16 2009-03-25 カシオ計算機株式会社 音声認証装置、音声認証方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4097976A (en) * 1976-06-23 1978-07-04 The Terrell Machine Company Spinning tube stripping means
JPS5485639A (en) * 1977-12-20 1979-07-07 Nec Corp Pattern matching device
JPS58106599A (ja) * 1981-12-21 1983-06-24 日本電信電話株式会社 系列パタ−ン・マツチング処理方法

Also Published As

Publication number Publication date
JPS58120296A (ja) 1983-07-18

Similar Documents

Publication Publication Date Title
JP2595495B2 (ja) パタンマッチング装置
JPS6336675B2 (ja)
JPS60211498A (ja) 連続音声認識装置
JPS6360920B2 (ja)
JPH06208392A (ja) パターン認識方法および装置
JPH0247755B2 (ja)
JP2964881B2 (ja) 音声認識装置
JP3006507B2 (ja) パターン間距離計算装置
JPH0420197B2 (ja)
JP2518871B2 (ja) パタン比較器
JPH0247754B2 (ja)
JP2738403B2 (ja) 音声認識装置
JP3011984B2 (ja) パターン照合方法
JPH022159B2 (ja)
JPH0418685A (ja) 画像処理方式
JP2785939B2 (ja) 連続音声認識装置
JPS62144200A (ja) 連続音声認識装置
JPS60111300A (ja) 連続単語音声認識方法
JPH0786935B2 (ja) 輪郭データ圧縮方法
JPS61198381A (ja) ストロ−ク間距離計算方式
JPS6339092A (ja) 辞書検索方式
JPS5975298A (ja) 音声認識方法
JPH0577080B2 (ja)
JPH0565908B2 (ja)
JPH1165599A (ja) 音声圧縮伸張方法および装置並びに音声圧縮伸張処理プログラムを記憶する記憶媒体