JPH0449718B2 - - Google Patents
Info
- Publication number
- JPH0449718B2 JPH0449718B2 JP58048105A JP4810583A JPH0449718B2 JP H0449718 B2 JPH0449718 B2 JP H0449718B2 JP 58048105 A JP58048105 A JP 58048105A JP 4810583 A JP4810583 A JP 4810583A JP H0449718 B2 JPH0449718 B2 JP H0449718B2
- Authority
- JP
- Japan
- Prior art keywords
- distance
- pattern
- inter
- frame
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 239000013598 vector Substances 0.000 claims description 38
- 230000001186 cumulative effect Effects 0.000 claims description 33
- 238000000605 extraction Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 101100371857 Caenorhabditis elegans unc-71 gene Proteins 0.000 description 5
- 238000010606 normalization Methods 0.000 description 4
- 101000796953 Homo sapiens Protein ADM2 Proteins 0.000 description 3
- 102100032586 Protein ADM2 Human genes 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
産業上の利用分野
本発明はパターン比較装置、特に音声認識に応
用可能なパターン比較装置に関する。 従来例の構成とその問題点 パターンマツチングによる音声認識装置の一般
的な構成は次のようなものである。 入力音声信号を、フイルタアンバンク、周波数
分析LPU分析等によつて特徴ベクトルの系孔に
変換する特徴抽出手段と、予め発声され、この特
徴抽出手段により抽出された特徴ベクトルの系列
を認識単語全部について標準パターンとして登録
しておく標準パターン記憶手段と、認識させるべ
く発声され、前記特徴抽出手段により抽出された
入力パターンと前記標準パターン記憶手段に記憶
されている標準パターンの全てと特徴ベクトルと
の系列としての類似度あるいは距離を計算するパ
ターン比較手段と、パターン比較の結果、最も類
似度の高かつた(距離の小さかつた)標準パター
ンに対応する単語を認識結果として判定出力する
判定手段からなる。 このとき、同一話者が同一の単語を発声しても
発声の都度、その発声時間長が異るので、前記パ
ターン比較手段で標準パターンと入力パターンの
比較を行う際には、両者の時間軸を伸縮させ、両
者のパターン長を揃えて比較する必要がある。そ
の際、発声時間長の変化は、発声単語の各部で一
様に生じているわけではないので、各部を不均一
に伸縮する必要がある。その伸縮は比較すべき両
者のパターンの類似度が最大になる(距離が最小
になる。以下距離で説明する。)ように行われる
のが最も良い結果が得られている。このようなマ
ツチングを効率的に行うのに動的計画法を用いる
装置が一般的である(以下このマツチングをDP
マツチングと称する)。 DPマツチングの方法は格子グラフによつて説
明できる。第1図は格子グラフであつて、横軸は
入力パターンT=a1 a2……aIに対応するi座標、
縦軸は標準パターンRn=bn 1、bn 2……bn Joに対応す
るj座標を表している。入力パターンTと標準パ
ターンを時間軸を非線形に伸縮してマツチングす
るとは、この格子グラフ上において、両パターン
の各特徴ベクトルの対応関係を示す経路1を何ら
かの標価基準によつて決定し、この経路に関して
両パターンの距離を評価することである。この経
路を決定する際には音声の性質を考慮して制限条
件を設ける。第2図aは経路選択の制限条件の一
例である。即ち、この例では点(i、j)へ至る
経路は、点(i−2、j−1)から点(i−1、
j)を通る経路2か、点(i−1、j−1)から
来る経路3か、点(i−1、j−1)から点
(i、j−1)を通る経路4かの何れかしか取り
得ないということを意味している。このとき、入
力パターンと標準パターンの始端は必ず対応させ
るという条件をつければ、前記マツチングの経路
は第1図の斜線の部分に制限される。この制限
は、いかに時間軸が伸縮するといつても、同一単
語に対してはそれ程極端に伸縮するはずはないと
いう事実からあまり極端な対応づけが生じないよ
うにするためである。 aiとbn jのベクトル間距離をdn(i、j)とすれ
ば、入力パターンTと標準パターンRnのパター
ン間の前記経路に沿う距離は、その経路に沿うdn
(i、j)の荷重平均として定義される。第2図
の経路上のa、b、c、d、eはそれに対応する
経路が選ばれたときの荷重である。DPマツチン
グが適用できるためにはこの荷重の決め方は、格
子グラフ上で前記制限条件の下でいかなる経路が
選ばれようともその経路に沿う荷重の和が一定に
なるように決めれば良い。a=c=e=2、b=
d=1とすれば、この荷重の和はI+Jn、a=b
=c=1、d=e=0.5とすれば、この荷重の和
はJnとなり経路の選ばれ方によらず一定となる。
これらは共によく用いられる。また、前記荷重の
和一定という条件の下でこの荷重をjに関するこ
とにより、より重視してマツチングしたい経路上
の部分の荷重を重くする等の操作も可能である。 入力パターンTと標準パターンRnの距離は、
前記制限条件の下で、前記ベクトル間距離dn(i、
j)の荷重平均の最小値として定義される。即
ち、次の漸化式を解くことによつて前記荷重平均
の最小値とその最小値を与える経路が決定され得
る。 g=(i、j)=mingn(i−2、j−1)+adn(i−
1、j)+bdn(i、j) gn(i−1、j−1)+cdn(i、j) gn(i−1、j−1)+cdn(i、j) gn(i−1、j−2)+edn(i、j−1)+ddn(i、
j)……(1) (初期条件 gn(1、1)=dn(1、1)、D(T、
R)=gn(I、Jn)/(荷重の和) ここにgn(i、j)は始点から点(i、j)に
至る、ベクトル間距離dn(i、j)の荷重和の最
小値、D(T、Rn)入力パターンTと標準パター
ンRnの距離である。) 経路選択の条件としては他にも種々考えられ
る。第2図b〜j等は他の例である。この他にも
さらに種々の変形が考えられ得る。これら経路に
選択条件に伴つて前記漸化式は対応するものに書
き換えられる。 前記のように、荷重をjに関する関数として、
マツチング経路上の一部のマツチング結果を重視
するには、例えば経路上の重みを第3図のように
すれば良い。同図aの場合はマツチングの始点か
ら終点までの経路上の和はI+Jo 〓j=1 Wnjであり、
bの場合はJo 〓j=1 Wnjである。即ち、経路に沿う重
み和はaは入力パターン長と標準パターン長の両
方に依存し、bは標準パターン長にのみ依存す
る。ここで、前記説明に従つてJo 〓j=1 Wnjは経路の
選び方によらず一定である。 このとき、例えば、aに対する累積距離算出の
前記式(1)に関する漸化式は、式(1)において a=1+1/2Wnj、b=1+1/2Wnj、c=1 +Wnj、d=1/2Wnj、e=1+1/2Wnj となる。入力パターンTと標準パターンRnの距
離は、 となる。 n^ argminn 〔D(T、Rn)〕 を求め、標準パターンRnに対応する単語を認識
結果とする。 argminn 〔f(x)〕なる記法は、f
(x)を最小にするxのことを意味する。このと
き、単語の子音部を重視したマツチングを行いた
ければ、標準パターンの子音部に接当するフレー
ムjの重みWnjを大きくしておけばよい。Wnj
はフレーム毎に決定できるから、それぞれの標準
パターンに最も適した重み付をきめ細かく行うこ
とができる。nにかかわらずJo 〓j=1 Wnjが一定であ
るようにすれば、式(2)は D(T、Rn)=g(I、Jn) とすることもできる。 重み付DPマツチングは、以上のように、すべ
てのフレームを平等に評価する通常のDPマツチ
ングに比べて、すぐれた特徴をもつ。しかし、次
のような問題点を有する。 即ち、例えば、子音部を重視した場合のマツチ
ングの経路と、すべてのフレームを平等に評価し
た場合のマツチング経路は一般に異なり、両者の
場合の認識結果も異ることが予想される。すべて
のフレームを平等に評価することは、単語全体と
して最も良くマツチングする場合の距離を、ま
た、子音部を重視したマツチングは局部的に最も
良くマツチングする場合の距離を求めていること
になり、全体として距離的に最も近い標準パター
ンと、局部的にみて最も近い標準パターンが一般
には異るということである。したがつて、単に重
み付の方法を導入するだけでは必ずしも認識率の
向上に結びつくとは限らない。 発明の目的 本発明は、上記欠点を解決し、精度の高い認識
結果を得ることができるパターン比較装置を提供
することを目的とする。 発明の構成 本発明のパターン比較装置は、複数種類の重み
付についてマツチングを行い、それぞれのマツチ
ング結果を総合的に判断することによつて認識を
行うように構成したもので、各重み付についてマ
ツチング経路を独立に求めそれぞれの経路に沿う
マツチング結果から認識したり、ある特定の重み
付法についての経路を求め、この求めた経路に沿
い、重み付法を種々変えた場合の標準パターンと
入力パターンの距離とから認識したりすることが
でき、また、複数のマツチング結果からの総合評
価の方法も、前記種々の重み付法によつて得られ
た結果の重み付平均を最終的な距離として、その
距離の最小のものを認識結果とする方法や、ある
特定の重み付法によつていくつかの認識結果の候
補を選んでおき、得られたそれぞれの候補につい
て、他の重み寸法によつて最終的な認識結果を得
る方法等を用いることができ、入力フレーム毎に
全ての重み付法により得られる累積距離を求める
ようにすることにより、ベクトル間距離dn(i、
j)の計算が各格子点について一回のみで済み、
また入力が終了すると同時に認識結果を得ること
ができる。 実施例の説明 第4図に本発明の第1の実施例を示す。図にお
いて、5は音声信号の入力端子、6は特徴抽出部
であつて、前記入力音声信号を特徴ベクトルの系
列に変換する。7は標準パターン記憶部で、特徴
抽出部6で得られた各認識単語に対する特徴ベク
トルの系列を標準パターンとして認識に先立つて
予め記憶している。8はベクトル間距離計算部で
あつて、入力の第iフレームにおいてn=1、
2、……、N;j=1、2、……Jnについて、前
記ベクトル間距離dn(i、j)を求める。dn(i、
j)としては最も簡単には市街地距離とすること
ができる。即ち、ai=(ai1、ai2、……、ain)、bn j
=(bn j1、bn j2、……、bn jn)とするとき、 dn(i、j)=n 〓k=1 |aik−bn jk| となし得る。9はベクトル間距離記憶部であつ
て、ベクトル間距離計算部8で計算されたベクト
ル間距離dn(i、j)をn=1、2、……、N;
j、1、2、……Jnについても必要がなくなるま
で記憶している。即ち、経路の制限条件を第3図
の如く選ぶときは2フレーム分のベクトル間距離
を記憶している。ベクトル間距離記憶部9は
VDM1とVDM2の2つの記憶領域から構成さ
れ、VDM1は現フレームiのベクトル間距離、
VDM2は前フレームのベクトル間距離が記憶
し、入力フレームが1つ更新されるとVDM1の
内容はVDM2に移され、新たなベクトル間距離
がVDM1に記憶される。10は重み係数記憶部
であつて、本実施例では第3図aのように重み付
けられる場合について説明する。1つの標準パタ
ーンとマツチングする重み付の種類をK種類と
し、第n単語の標準パターンの第jフレームに対
応する第k番目の重みをWn kjとする。重み係数
記憶部10はn=1、2……、N;k=1、2、
……、K:j=1、2、……、Jnについての重み
係数Wn kjを記憶している。11〜13はK種類のそ
れぞれの重み係数による累積距離計算部である。
累種距離計算部k(k=1、2、……、K)は始
点(1、1)から(i、j)までの重み係数Wn k
jについてのベクトル間距離の重み和gn k(i、j)
をn=1、2、……、Nについて計算する。即
ち、第3図aの拘束条件のもとでは次の漸化式計
算することになる。 第5図は累積距離計算部kの詳細な構成を示し
ている。漸化式計算部103は式(3)の計算を行う
部分である。101,102はベクトル間距離記
憶部9の内容が入力される端子、100は重み係
数記憶部10の内容が入力される端子、104は
累積距離記憶部であつて漸化式計算部103にお
ける漸化式の計算の必要がなくなるまで、その計
算に必要な漸化式の値を記憶しておくところで、
ADM1は現フレームiにおける累積距離g(i、
j)(n=1、2、……、N;j=1、2、……
Jn)を記憶しており、ADM2は前フレームi−
1における累積距離g(i−1、j)(n=1、
2、……、N;j=1、2、……Jn)を記憶して
いる。入力フレームが1つ更新されるとADM1
の内容はADM2に移され、ADM1には新たに
計算された累積距離が記憶される。漸化式計算部
103では、このADM1,ADM2に記憶され
ている累積距離と、VDM1、VDM2に記憶さ
れているベクトル間距離から式(3)の漸化式を計算
する。 以上のようにベクトル間距離計算部8、累積距
離計算部11〜13におけるベクトル間距離、累
積距離の計算は、n=1、2、……、N;j=
1、2、……Jnについて1フレーム毎に行われ、
入力が完了するとと同時に、n=1、2、……、
Nに対して、K積類の重み付法による最終の累積
距離、gn k(I、Jn)が累積距離記憶部104の
ADM1に記憶されることになる。第5図におい
て、105はこのようにして得られたgn k(I、Jn)
を正規化する累積距離正規化部である。端子10
7に音声入力終了の旨が、また端子108に全フ
レーム数が通知されると、ADM1の内容が正規
化され、端子106から次段の判定部14へ正規
化された結果が出力される。正規化された結果
は、 となる。 第4図において、16は音声区間検出部であつ
て、入力音声の開始時点と終了時点を検出するも
ので、入力音声の電力等から公知の方法が適用で
きる。17はフレーム数計数部であつて、音声区
間の開始以後、1フレーム毎に計数を行い、音声
区間長を最終的に得るものである。 14は以上のようにして得られた正規化累積距
離Dn k(I、Jn)から最終的な認識結果を得る判定
部である。判定の方法としては次のような方法が
可能である。 () 入力信号の標準パターンRnに対する距離Dn
を 即ち、Dn k(I、Jn)のkについての第2の重
み係数akの重み付平均をDnとし、Dnを最小に
するnに対する標準パターンRnに対応する単
語を認識結果とする。 () 標準パターンRnに対する重み係数Wn ko(j)に
よる正規化累積距離Dn ko(I、Jn)について、最
小値から第l番目の最小値を与える標準パター
ンRq(1)、Rq(2)、……、Rqlを求め、得られた標
準パターンRq(1)、Rq(2)、……、Rqlについて、
Dn ko(I、Jn)を含んであるいは除いて、Dn k
(I、Jn)の()において説明したのと同様
の重み付平均が最小になる標準パターンに対応
する単語を認識結果とする。 以上の実施例においては、標準パターンRnに
対して計算される重みWn kjについてのマツチン
グ経路は、kに関してそれぞれ独立に求めたが、
これを、標準パターンnについては、重みWn koj
について計算されるマツチング経路に沿つて、他
の重みWn kjによる累積距離をめるようにするこ
ともできる。このとき、式(3)の漸化式は次のよう
に変更される。
用可能なパターン比較装置に関する。 従来例の構成とその問題点 パターンマツチングによる音声認識装置の一般
的な構成は次のようなものである。 入力音声信号を、フイルタアンバンク、周波数
分析LPU分析等によつて特徴ベクトルの系孔に
変換する特徴抽出手段と、予め発声され、この特
徴抽出手段により抽出された特徴ベクトルの系列
を認識単語全部について標準パターンとして登録
しておく標準パターン記憶手段と、認識させるべ
く発声され、前記特徴抽出手段により抽出された
入力パターンと前記標準パターン記憶手段に記憶
されている標準パターンの全てと特徴ベクトルと
の系列としての類似度あるいは距離を計算するパ
ターン比較手段と、パターン比較の結果、最も類
似度の高かつた(距離の小さかつた)標準パター
ンに対応する単語を認識結果として判定出力する
判定手段からなる。 このとき、同一話者が同一の単語を発声しても
発声の都度、その発声時間長が異るので、前記パ
ターン比較手段で標準パターンと入力パターンの
比較を行う際には、両者の時間軸を伸縮させ、両
者のパターン長を揃えて比較する必要がある。そ
の際、発声時間長の変化は、発声単語の各部で一
様に生じているわけではないので、各部を不均一
に伸縮する必要がある。その伸縮は比較すべき両
者のパターンの類似度が最大になる(距離が最小
になる。以下距離で説明する。)ように行われる
のが最も良い結果が得られている。このようなマ
ツチングを効率的に行うのに動的計画法を用いる
装置が一般的である(以下このマツチングをDP
マツチングと称する)。 DPマツチングの方法は格子グラフによつて説
明できる。第1図は格子グラフであつて、横軸は
入力パターンT=a1 a2……aIに対応するi座標、
縦軸は標準パターンRn=bn 1、bn 2……bn Joに対応す
るj座標を表している。入力パターンTと標準パ
ターンを時間軸を非線形に伸縮してマツチングす
るとは、この格子グラフ上において、両パターン
の各特徴ベクトルの対応関係を示す経路1を何ら
かの標価基準によつて決定し、この経路に関して
両パターンの距離を評価することである。この経
路を決定する際には音声の性質を考慮して制限条
件を設ける。第2図aは経路選択の制限条件の一
例である。即ち、この例では点(i、j)へ至る
経路は、点(i−2、j−1)から点(i−1、
j)を通る経路2か、点(i−1、j−1)から
来る経路3か、点(i−1、j−1)から点
(i、j−1)を通る経路4かの何れかしか取り
得ないということを意味している。このとき、入
力パターンと標準パターンの始端は必ず対応させ
るという条件をつければ、前記マツチングの経路
は第1図の斜線の部分に制限される。この制限
は、いかに時間軸が伸縮するといつても、同一単
語に対してはそれ程極端に伸縮するはずはないと
いう事実からあまり極端な対応づけが生じないよ
うにするためである。 aiとbn jのベクトル間距離をdn(i、j)とすれ
ば、入力パターンTと標準パターンRnのパター
ン間の前記経路に沿う距離は、その経路に沿うdn
(i、j)の荷重平均として定義される。第2図
の経路上のa、b、c、d、eはそれに対応する
経路が選ばれたときの荷重である。DPマツチン
グが適用できるためにはこの荷重の決め方は、格
子グラフ上で前記制限条件の下でいかなる経路が
選ばれようともその経路に沿う荷重の和が一定に
なるように決めれば良い。a=c=e=2、b=
d=1とすれば、この荷重の和はI+Jn、a=b
=c=1、d=e=0.5とすれば、この荷重の和
はJnとなり経路の選ばれ方によらず一定となる。
これらは共によく用いられる。また、前記荷重の
和一定という条件の下でこの荷重をjに関するこ
とにより、より重視してマツチングしたい経路上
の部分の荷重を重くする等の操作も可能である。 入力パターンTと標準パターンRnの距離は、
前記制限条件の下で、前記ベクトル間距離dn(i、
j)の荷重平均の最小値として定義される。即
ち、次の漸化式を解くことによつて前記荷重平均
の最小値とその最小値を与える経路が決定され得
る。 g=(i、j)=mingn(i−2、j−1)+adn(i−
1、j)+bdn(i、j) gn(i−1、j−1)+cdn(i、j) gn(i−1、j−1)+cdn(i、j) gn(i−1、j−2)+edn(i、j−1)+ddn(i、
j)……(1) (初期条件 gn(1、1)=dn(1、1)、D(T、
R)=gn(I、Jn)/(荷重の和) ここにgn(i、j)は始点から点(i、j)に
至る、ベクトル間距離dn(i、j)の荷重和の最
小値、D(T、Rn)入力パターンTと標準パター
ンRnの距離である。) 経路選択の条件としては他にも種々考えられ
る。第2図b〜j等は他の例である。この他にも
さらに種々の変形が考えられ得る。これら経路に
選択条件に伴つて前記漸化式は対応するものに書
き換えられる。 前記のように、荷重をjに関する関数として、
マツチング経路上の一部のマツチング結果を重視
するには、例えば経路上の重みを第3図のように
すれば良い。同図aの場合はマツチングの始点か
ら終点までの経路上の和はI+Jo 〓j=1 Wnjであり、
bの場合はJo 〓j=1 Wnjである。即ち、経路に沿う重
み和はaは入力パターン長と標準パターン長の両
方に依存し、bは標準パターン長にのみ依存す
る。ここで、前記説明に従つてJo 〓j=1 Wnjは経路の
選び方によらず一定である。 このとき、例えば、aに対する累積距離算出の
前記式(1)に関する漸化式は、式(1)において a=1+1/2Wnj、b=1+1/2Wnj、c=1 +Wnj、d=1/2Wnj、e=1+1/2Wnj となる。入力パターンTと標準パターンRnの距
離は、 となる。 n^ argminn 〔D(T、Rn)〕 を求め、標準パターンRnに対応する単語を認識
結果とする。 argminn 〔f(x)〕なる記法は、f
(x)を最小にするxのことを意味する。このと
き、単語の子音部を重視したマツチングを行いた
ければ、標準パターンの子音部に接当するフレー
ムjの重みWnjを大きくしておけばよい。Wnj
はフレーム毎に決定できるから、それぞれの標準
パターンに最も適した重み付をきめ細かく行うこ
とができる。nにかかわらずJo 〓j=1 Wnjが一定であ
るようにすれば、式(2)は D(T、Rn)=g(I、Jn) とすることもできる。 重み付DPマツチングは、以上のように、すべ
てのフレームを平等に評価する通常のDPマツチ
ングに比べて、すぐれた特徴をもつ。しかし、次
のような問題点を有する。 即ち、例えば、子音部を重視した場合のマツチ
ングの経路と、すべてのフレームを平等に評価し
た場合のマツチング経路は一般に異なり、両者の
場合の認識結果も異ることが予想される。すべて
のフレームを平等に評価することは、単語全体と
して最も良くマツチングする場合の距離を、ま
た、子音部を重視したマツチングは局部的に最も
良くマツチングする場合の距離を求めていること
になり、全体として距離的に最も近い標準パター
ンと、局部的にみて最も近い標準パターンが一般
には異るということである。したがつて、単に重
み付の方法を導入するだけでは必ずしも認識率の
向上に結びつくとは限らない。 発明の目的 本発明は、上記欠点を解決し、精度の高い認識
結果を得ることができるパターン比較装置を提供
することを目的とする。 発明の構成 本発明のパターン比較装置は、複数種類の重み
付についてマツチングを行い、それぞれのマツチ
ング結果を総合的に判断することによつて認識を
行うように構成したもので、各重み付についてマ
ツチング経路を独立に求めそれぞれの経路に沿う
マツチング結果から認識したり、ある特定の重み
付法についての経路を求め、この求めた経路に沿
い、重み付法を種々変えた場合の標準パターンと
入力パターンの距離とから認識したりすることが
でき、また、複数のマツチング結果からの総合評
価の方法も、前記種々の重み付法によつて得られ
た結果の重み付平均を最終的な距離として、その
距離の最小のものを認識結果とする方法や、ある
特定の重み付法によつていくつかの認識結果の候
補を選んでおき、得られたそれぞれの候補につい
て、他の重み寸法によつて最終的な認識結果を得
る方法等を用いることができ、入力フレーム毎に
全ての重み付法により得られる累積距離を求める
ようにすることにより、ベクトル間距離dn(i、
j)の計算が各格子点について一回のみで済み、
また入力が終了すると同時に認識結果を得ること
ができる。 実施例の説明 第4図に本発明の第1の実施例を示す。図にお
いて、5は音声信号の入力端子、6は特徴抽出部
であつて、前記入力音声信号を特徴ベクトルの系
列に変換する。7は標準パターン記憶部で、特徴
抽出部6で得られた各認識単語に対する特徴ベク
トルの系列を標準パターンとして認識に先立つて
予め記憶している。8はベクトル間距離計算部で
あつて、入力の第iフレームにおいてn=1、
2、……、N;j=1、2、……Jnについて、前
記ベクトル間距離dn(i、j)を求める。dn(i、
j)としては最も簡単には市街地距離とすること
ができる。即ち、ai=(ai1、ai2、……、ain)、bn j
=(bn j1、bn j2、……、bn jn)とするとき、 dn(i、j)=n 〓k=1 |aik−bn jk| となし得る。9はベクトル間距離記憶部であつ
て、ベクトル間距離計算部8で計算されたベクト
ル間距離dn(i、j)をn=1、2、……、N;
j、1、2、……Jnについても必要がなくなるま
で記憶している。即ち、経路の制限条件を第3図
の如く選ぶときは2フレーム分のベクトル間距離
を記憶している。ベクトル間距離記憶部9は
VDM1とVDM2の2つの記憶領域から構成さ
れ、VDM1は現フレームiのベクトル間距離、
VDM2は前フレームのベクトル間距離が記憶
し、入力フレームが1つ更新されるとVDM1の
内容はVDM2に移され、新たなベクトル間距離
がVDM1に記憶される。10は重み係数記憶部
であつて、本実施例では第3図aのように重み付
けられる場合について説明する。1つの標準パタ
ーンとマツチングする重み付の種類をK種類と
し、第n単語の標準パターンの第jフレームに対
応する第k番目の重みをWn kjとする。重み係数
記憶部10はn=1、2……、N;k=1、2、
……、K:j=1、2、……、Jnについての重み
係数Wn kjを記憶している。11〜13はK種類のそ
れぞれの重み係数による累積距離計算部である。
累種距離計算部k(k=1、2、……、K)は始
点(1、1)から(i、j)までの重み係数Wn k
jについてのベクトル間距離の重み和gn k(i、j)
をn=1、2、……、Nについて計算する。即
ち、第3図aの拘束条件のもとでは次の漸化式計
算することになる。 第5図は累積距離計算部kの詳細な構成を示し
ている。漸化式計算部103は式(3)の計算を行う
部分である。101,102はベクトル間距離記
憶部9の内容が入力される端子、100は重み係
数記憶部10の内容が入力される端子、104は
累積距離記憶部であつて漸化式計算部103にお
ける漸化式の計算の必要がなくなるまで、その計
算に必要な漸化式の値を記憶しておくところで、
ADM1は現フレームiにおける累積距離g(i、
j)(n=1、2、……、N;j=1、2、……
Jn)を記憶しており、ADM2は前フレームi−
1における累積距離g(i−1、j)(n=1、
2、……、N;j=1、2、……Jn)を記憶して
いる。入力フレームが1つ更新されるとADM1
の内容はADM2に移され、ADM1には新たに
計算された累積距離が記憶される。漸化式計算部
103では、このADM1,ADM2に記憶され
ている累積距離と、VDM1、VDM2に記憶さ
れているベクトル間距離から式(3)の漸化式を計算
する。 以上のようにベクトル間距離計算部8、累積距
離計算部11〜13におけるベクトル間距離、累
積距離の計算は、n=1、2、……、N;j=
1、2、……Jnについて1フレーム毎に行われ、
入力が完了するとと同時に、n=1、2、……、
Nに対して、K積類の重み付法による最終の累積
距離、gn k(I、Jn)が累積距離記憶部104の
ADM1に記憶されることになる。第5図におい
て、105はこのようにして得られたgn k(I、Jn)
を正規化する累積距離正規化部である。端子10
7に音声入力終了の旨が、また端子108に全フ
レーム数が通知されると、ADM1の内容が正規
化され、端子106から次段の判定部14へ正規
化された結果が出力される。正規化された結果
は、 となる。 第4図において、16は音声区間検出部であつ
て、入力音声の開始時点と終了時点を検出するも
ので、入力音声の電力等から公知の方法が適用で
きる。17はフレーム数計数部であつて、音声区
間の開始以後、1フレーム毎に計数を行い、音声
区間長を最終的に得るものである。 14は以上のようにして得られた正規化累積距
離Dn k(I、Jn)から最終的な認識結果を得る判定
部である。判定の方法としては次のような方法が
可能である。 () 入力信号の標準パターンRnに対する距離Dn
を 即ち、Dn k(I、Jn)のkについての第2の重
み係数akの重み付平均をDnとし、Dnを最小に
するnに対する標準パターンRnに対応する単
語を認識結果とする。 () 標準パターンRnに対する重み係数Wn ko(j)に
よる正規化累積距離Dn ko(I、Jn)について、最
小値から第l番目の最小値を与える標準パター
ンRq(1)、Rq(2)、……、Rqlを求め、得られた標
準パターンRq(1)、Rq(2)、……、Rqlについて、
Dn ko(I、Jn)を含んであるいは除いて、Dn k
(I、Jn)の()において説明したのと同様
の重み付平均が最小になる標準パターンに対応
する単語を認識結果とする。 以上の実施例においては、標準パターンRnに
対して計算される重みWn kjについてのマツチン
グ経路は、kに関してそれぞれ独立に求めたが、
これを、標準パターンnについては、重みWn koj
について計算されるマツチング経路に沿つて、他
の重みWn kjによる累積距離をめるようにするこ
ともできる。このとき、式(3)の漸化式は次のよう
に変更される。
【表】
このとき、第4図の構成は、累積距離計算部1
1で式(4)を計算するようになし、そこで得られた
経路を他の累積距離計算部12〜13へ通知する
信号線18を追加し、累積距離計算部12〜13
は式(5)を計算するように変更すればよい。判定処
理は、()の場合と同様である。 第6図は以上の動作をプログラムで表現したも
のであつて重み係数の種類毎に独立に累積距離を
計算する場合である。ソフトウエアで実現すると
きもこのプログラムに従えばよい。 なお、プログラムの記載において、 なる表記法の意味は、Aが真である間Bを実行す
るということである。 ステツプ200は漸化式計算部103における漸
化式に計算するに先立ち、初期化する部分であ
る。ステツプ201に入力パターンと全ての標準パ
ターンとのマツチングを行う部分であつて、入力
パターンとそれぞれの標準パターンとの累積距離
が重み係数の付け方毎に得られる。ステツプ202
は経路に沿う重み係数の総和で、前記累積距離を
正規化する部分であつて、前記実施例の累積距離
正規化部105で行われる処理に担当する。 ステツプ203は入力のフレーム毎に行われる処
理で、全ての標準パターンn=1、2、……、N
について、標準パターンの全フレームにおけるベ
クトル間距離、重み係数の種類毎の累積距離が求
められる。前記実施例のベクトル間距離計算部
8、累積距離件算部11〜13で行われる処理で
ある。 第7図は、マツチングの経路は各標準パターン
について、ある重み係数について求めたものに固
定して、重み係数のに種々変えて累積距離を計算
する場合である。この例において、第6図と同じ
番号を付したステツプは、第6図の場合と同様の
機能を表す。異るところは、ステツプ203の内
容のみであつて、既に説明したところである。 なお、本実施例では、累積距離正規化部105
を設けたが、Jo 〓j=1 Wnj=一定となるように重み係
数を決めておけば、この正規化の必要はない。 発明の効果 本発明のパターン比較装置は、マツチング経路
に種々の重み係数を導入し、その結果を総合的に
判断するように構成したので、単語に依つて、局
部的に重視すべきところは重視し、また全体とし
てのマツチング結果も考慮するところにより、よ
り精度の高い認識結果を得ることができ、また、
あらゆる認識単語、重み係数について、入力フレ
ーム毎に計算を完了することにより、実時間処理
が可能となつたものである。
1で式(4)を計算するようになし、そこで得られた
経路を他の累積距離計算部12〜13へ通知する
信号線18を追加し、累積距離計算部12〜13
は式(5)を計算するように変更すればよい。判定処
理は、()の場合と同様である。 第6図は以上の動作をプログラムで表現したも
のであつて重み係数の種類毎に独立に累積距離を
計算する場合である。ソフトウエアで実現すると
きもこのプログラムに従えばよい。 なお、プログラムの記載において、 なる表記法の意味は、Aが真である間Bを実行す
るということである。 ステツプ200は漸化式計算部103における漸
化式に計算するに先立ち、初期化する部分であ
る。ステツプ201に入力パターンと全ての標準パ
ターンとのマツチングを行う部分であつて、入力
パターンとそれぞれの標準パターンとの累積距離
が重み係数の付け方毎に得られる。ステツプ202
は経路に沿う重み係数の総和で、前記累積距離を
正規化する部分であつて、前記実施例の累積距離
正規化部105で行われる処理に担当する。 ステツプ203は入力のフレーム毎に行われる処
理で、全ての標準パターンn=1、2、……、N
について、標準パターンの全フレームにおけるベ
クトル間距離、重み係数の種類毎の累積距離が求
められる。前記実施例のベクトル間距離計算部
8、累積距離件算部11〜13で行われる処理で
ある。 第7図は、マツチングの経路は各標準パターン
について、ある重み係数について求めたものに固
定して、重み係数のに種々変えて累積距離を計算
する場合である。この例において、第6図と同じ
番号を付したステツプは、第6図の場合と同様の
機能を表す。異るところは、ステツプ203の内
容のみであつて、既に説明したところである。 なお、本実施例では、累積距離正規化部105
を設けたが、Jo 〓j=1 Wnj=一定となるように重み係
数を決めておけば、この正規化の必要はない。 発明の効果 本発明のパターン比較装置は、マツチング経路
に種々の重み係数を導入し、その結果を総合的に
判断するように構成したので、単語に依つて、局
部的に重視すべきところは重視し、また全体とし
てのマツチング結果も考慮するところにより、よ
り精度の高い認識結果を得ることができ、また、
あらゆる認識単語、重み係数について、入力フレ
ーム毎に計算を完了することにより、実時間処理
が可能となつたものである。
第1図はDPマツチングを説明する図、第2図
a〜jはDPマツチングにおけるマツチング経路
の拘束条件の例を示す図、第3図は局部的に重視
したDPマツチングを行うためのマツチング経路
に対する重み付の一例を示す図、第4図は本発明
における一実施例のパターン比較装置の構成を示
すブロツク図、第5図は同実施例における累積距
離計算部の詳細を示すブロツク図、第6図は同実
施例における動作をプログラムで示した図、第7
図は別の実施例における動作をプログラムで示し
た図である。 6……特徴抽出部、7……標準パターン記憶
部、8……ベクトル間距離計算部、9……ベクト
ル間距離記憶部、10……重み係数記憶部、11
〜13……累積距離計算部、14……判定部、1
03……漸化式計算部、104……累積距離記憶
部。
a〜jはDPマツチングにおけるマツチング経路
の拘束条件の例を示す図、第3図は局部的に重視
したDPマツチングを行うためのマツチング経路
に対する重み付の一例を示す図、第4図は本発明
における一実施例のパターン比較装置の構成を示
すブロツク図、第5図は同実施例における累積距
離計算部の詳細を示すブロツク図、第6図は同実
施例における動作をプログラムで示した図、第7
図は別の実施例における動作をプログラムで示し
た図である。 6……特徴抽出部、7……標準パターン記憶
部、8……ベクトル間距離計算部、9……ベクト
ル間距離記憶部、10……重み係数記憶部、11
〜13……累積距離計算部、14……判定部、1
03……漸化式計算部、104……累積距離記憶
部。
Claims (1)
- 【特許請求の範囲】 1 入力信号を特徴ベクトルの系列a1、a2、……
a1……aIよりなる入力パターンTに変換する特徴
抽出手段と、特徴ベクトルの系列bn 1、bn 2……bn j…
…bn Joからなる標準パターンRn(ただし、n=1、
2、……、N)を記憶する標準パターン記憶手段
と、前記標準パターンRnに付随する複数種類の
重み係数Wn 1(1)、Wn 1(2)、……、Wn 1(Jn);Wn 2(1)、
Wn 2(2)、……、Wn 2(Jn);……;Wn k(1)、……、Wn k
(Jn)を記憶する重み係数記憶手段と、前記入力
パターンTのフレームを横軸に、前記標準パター
ンRnのフレームを縦軸にとつた格子グラフにお
いて、aiとbjのベクトル間距離dn(i、j)を求め
るベクトル間距離計算手段と、このベクトル間距
離を記憶するベクトル間距離記憶手段と、前記複
数種類の重み係数を用いて入力パターンと標準パ
ターンについての複数種類の累積距離を求める漸
化式計算手段と、前記漸化式計算手段で求められ
た複数種類の累積距離を記憶する累積距離記憶手
段と、前記複数の累積距離から最終の認識結果を
得る判定手段を設けたことを特徴とするパターン
比較装置。 2 ベクトル間距離計算手段は、入力パターンと
標準パターンのベクトル間距離を、入力パターン
の各フレーム毎に、全標準パターンの各フレーム
について求め、漸化式計算手段は、入力パターン
と標準パターンの累積距離を、入力パターンの各
フレーム毎に、全標準パターンの各フレームにつ
いて求めることを特徴とする特許請求の範囲第1
項記載のパターン比較装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58048105A JPS59173883A (ja) | 1983-03-22 | 1983-03-22 | パタ−ン比較装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58048105A JPS59173883A (ja) | 1983-03-22 | 1983-03-22 | パタ−ン比較装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS59173883A JPS59173883A (ja) | 1984-10-02 |
| JPH0449718B2 true JPH0449718B2 (ja) | 1992-08-12 |
Family
ID=12794031
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58048105A Granted JPS59173883A (ja) | 1983-03-22 | 1983-03-22 | パタ−ン比較装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59173883A (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6358400A (ja) * | 1986-08-28 | 1988-03-14 | 日本電気株式会社 | 連続単語音声認識装置 |
| US4885697A (en) * | 1988-09-01 | 1989-12-05 | E. I. Du Pont De Nemours And Company | Method of identifying spectra |
-
1983
- 1983-03-22 JP JP58048105A patent/JPS59173883A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS59173883A (ja) | 1984-10-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4400828A (en) | Word recognizer | |
| JPH0554959B2 (ja) | ||
| JP4246703B2 (ja) | 自動音声認識の方法 | |
| JPS58192100A (ja) | 第1の音声パタ−ンを第2の音声パタ−ンと時間的に整列させる方法とその装置 | |
| JPH0247760B2 (ja) | ||
| JPH0449718B2 (ja) | ||
| JP3914709B2 (ja) | 音声認識方法およびシステム | |
| JP2000200098A (ja) | 学習装置および学習方法、並びに認識装置および認識方法 | |
| JP2015152661A (ja) | 重み付き有限状態オートマトン作成装置、記号列変換装置、音声認識装置、それらの方法、及びプログラム | |
| JPH0823758B2 (ja) | 話者適応形音声認識装置 | |
| JP2853418B2 (ja) | 音声認識方法 | |
| JPH0247758B2 (ja) | ||
| JPH024919B2 (ja) | ||
| JP2001005483A (ja) | 単語音声認識方法及び単語音声認識装置 | |
| JP6748607B2 (ja) | 音声合成学習装置、音声合成装置、これらの方法及びプログラム | |
| JP3859884B2 (ja) | 話者認識方法および話者認識装置 | |
| JPH0320759B2 (ja) | ||
| JPH05197397A (ja) | 音声認識方法及びその装置 | |
| US20070271096A1 (en) | Voice Recognition Method And System Based On The Contexual Modeling Of Voice Units | |
| JP2574242B2 (ja) | 音声入力装置 | |
| JPS6247100A (ja) | 音声認識装置 | |
| JP3448371B2 (ja) | Hmmの学習装置 | |
| JPS59195699A (ja) | 単語音声認識装置 | |
| JPS5972578A (ja) | パタ−ン比較装置 | |
| JPS6129897A (ja) | パタ−ン比較装置 |