JPH0449718B2 - - Google Patents

Info

Publication number
JPH0449718B2
JPH0449718B2 JP58048105A JP4810583A JPH0449718B2 JP H0449718 B2 JPH0449718 B2 JP H0449718B2 JP 58048105 A JP58048105 A JP 58048105A JP 4810583 A JP4810583 A JP 4810583A JP H0449718 B2 JPH0449718 B2 JP H0449718B2
Authority
JP
Japan
Prior art keywords
distance
pattern
inter
frame
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58048105A
Other languages
Japanese (ja)
Other versions
JPS59173883A (en
Inventor
Seiichi Nakagawa
Hidekazu Tsuboka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58048105A priority Critical patent/JPS59173883A/en
Publication of JPS59173883A publication Critical patent/JPS59173883A/en
Publication of JPH0449718B2 publication Critical patent/JPH0449718B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】[Detailed description of the invention]

産業上の利用分野 本発明はパターン比較装置、特に音声認識に応
用可能なパターン比較装置に関する。 従来例の構成とその問題点 パターンマツチングによる音声認識装置の一般
的な構成は次のようなものである。 入力音声信号を、フイルタアンバンク、周波数
分析LPU分析等によつて特徴ベクトルの系孔に
変換する特徴抽出手段と、予め発声され、この特
徴抽出手段により抽出された特徴ベクトルの系列
を認識単語全部について標準パターンとして登録
しておく標準パターン記憶手段と、認識させるべ
く発声され、前記特徴抽出手段により抽出された
入力パターンと前記標準パターン記憶手段に記憶
されている標準パターンの全てと特徴ベクトルと
の系列としての類似度あるいは距離を計算するパ
ターン比較手段と、パターン比較の結果、最も類
似度の高かつた(距離の小さかつた)標準パター
ンに対応する単語を認識結果として判定出力する
判定手段からなる。 このとき、同一話者が同一の単語を発声しても
発声の都度、その発声時間長が異るので、前記パ
ターン比較手段で標準パターンと入力パターンの
比較を行う際には、両者の時間軸を伸縮させ、両
者のパターン長を揃えて比較する必要がある。そ
の際、発声時間長の変化は、発声単語の各部で一
様に生じているわけではないので、各部を不均一
に伸縮する必要がある。その伸縮は比較すべき両
者のパターンの類似度が最大になる(距離が最小
になる。以下距離で説明する。)ように行われる
のが最も良い結果が得られている。このようなマ
ツチングを効率的に行うのに動的計画法を用いる
装置が一般的である(以下このマツチングをDP
マツチングと称する)。 DPマツチングの方法は格子グラフによつて説
明できる。第1図は格子グラフであつて、横軸は
入力パターンT=a1 a2……aIに対応するi座標、
縦軸は標準パターンRn=bn 1、bn 2……bn Joに対応す
るj座標を表している。入力パターンTと標準パ
ターンを時間軸を非線形に伸縮してマツチングす
るとは、この格子グラフ上において、両パターン
の各特徴ベクトルの対応関係を示す経路1を何ら
かの標価基準によつて決定し、この経路に関して
両パターンの距離を評価することである。この経
路を決定する際には音声の性質を考慮して制限条
件を設ける。第2図aは経路選択の制限条件の一
例である。即ち、この例では点(i、j)へ至る
経路は、点(i−2、j−1)から点(i−1、
j)を通る経路2か、点(i−1、j−1)から
来る経路3か、点(i−1、j−1)から点
(i、j−1)を通る経路4かの何れかしか取り
得ないということを意味している。このとき、入
力パターンと標準パターンの始端は必ず対応させ
るという条件をつければ、前記マツチングの経路
は第1図の斜線の部分に制限される。この制限
は、いかに時間軸が伸縮するといつても、同一単
語に対してはそれ程極端に伸縮するはずはないと
いう事実からあまり極端な対応づけが生じないよ
うにするためである。 aiとbn jのベクトル間距離をdn(i、j)とすれ
ば、入力パターンTと標準パターンRnのパター
ン間の前記経路に沿う距離は、その経路に沿うdn
(i、j)の荷重平均として定義される。第2図
の経路上のa、b、c、d、eはそれに対応する
経路が選ばれたときの荷重である。DPマツチン
グが適用できるためにはこの荷重の決め方は、格
子グラフ上で前記制限条件の下でいかなる経路が
選ばれようともその経路に沿う荷重の和が一定に
なるように決めれば良い。a=c=e=2、b=
d=1とすれば、この荷重の和はI+Jn、a=b
=c=1、d=e=0.5とすれば、この荷重の和
はJnとなり経路の選ばれ方によらず一定となる。
これらは共によく用いられる。また、前記荷重の
和一定という条件の下でこの荷重をjに関するこ
とにより、より重視してマツチングしたい経路上
の部分の荷重を重くする等の操作も可能である。 入力パターンTと標準パターンRnの距離は、
前記制限条件の下で、前記ベクトル間距離dn(i、
j)の荷重平均の最小値として定義される。即
ち、次の漸化式を解くことによつて前記荷重平均
の最小値とその最小値を与える経路が決定され得
る。 g=(i、j)=mingn(i−2、j−1)+adn(i−
1、j)+bdn(i、j) gn(i−1、j−1)+cdn(i、j) gn(i−1、j−1)+cdn(i、j) gn(i−1、j−2)+edn(i、j−1)+ddn(i、
j)……(1) (初期条件 gn(1、1)=dn(1、1)、D(T、
R)=gn(I、Jn)/(荷重の和) ここにgn(i、j)は始点から点(i、j)に
至る、ベクトル間距離dn(i、j)の荷重和の最
小値、D(T、Rn)入力パターンTと標準パター
ンRnの距離である。) 経路選択の条件としては他にも種々考えられ
る。第2図b〜j等は他の例である。この他にも
さらに種々の変形が考えられ得る。これら経路に
選択条件に伴つて前記漸化式は対応するものに書
き換えられる。 前記のように、荷重をjに関する関数として、
マツチング経路上の一部のマツチング結果を重視
するには、例えば経路上の重みを第3図のように
すれば良い。同図aの場合はマツチングの始点か
ら終点までの経路上の和はI+Joj=1 Wnjであり、
bの場合はJoj=1 Wnjである。即ち、経路に沿う重
み和はaは入力パターン長と標準パターン長の両
方に依存し、bは標準パターン長にのみ依存す
る。ここで、前記説明に従つてJoj=1 Wnjは経路の
選び方によらず一定である。 このとき、例えば、aに対する累積距離算出の
前記式(1)に関する漸化式は、式(1)において a=1+1/2Wnj、b=1+1/2Wnj、c=1 +Wnj、d=1/2Wnj、e=1+1/2Wnj となる。入力パターンTと標準パターンRnの距
離は、 となる。 n^ argminn 〔D(T、Rn)〕 を求め、標準パターンRnに対応する単語を認識
結果とする。 argminn 〔f(x)〕なる記法は、f
(x)を最小にするxのことを意味する。このと
き、単語の子音部を重視したマツチングを行いた
ければ、標準パターンの子音部に接当するフレー
ムjの重みWnjを大きくしておけばよい。Wn
はフレーム毎に決定できるから、それぞれの標準
パターンに最も適した重み付をきめ細かく行うこ
とができる。nにかかわらずJoj=1 Wnjが一定であ
るようにすれば、式(2)は D(T、Rn)=g(I、Jn) とすることもできる。 重み付DPマツチングは、以上のように、すべ
てのフレームを平等に評価する通常のDPマツチ
ングに比べて、すぐれた特徴をもつ。しかし、次
のような問題点を有する。 即ち、例えば、子音部を重視した場合のマツチ
ングの経路と、すべてのフレームを平等に評価し
た場合のマツチング経路は一般に異なり、両者の
場合の認識結果も異ることが予想される。すべて
のフレームを平等に評価することは、単語全体と
して最も良くマツチングする場合の距離を、ま
た、子音部を重視したマツチングは局部的に最も
良くマツチングする場合の距離を求めていること
になり、全体として距離的に最も近い標準パター
ンと、局部的にみて最も近い標準パターンが一般
には異るということである。したがつて、単に重
み付の方法を導入するだけでは必ずしも認識率の
向上に結びつくとは限らない。 発明の目的 本発明は、上記欠点を解決し、精度の高い認識
結果を得ることができるパターン比較装置を提供
することを目的とする。 発明の構成 本発明のパターン比較装置は、複数種類の重み
付についてマツチングを行い、それぞれのマツチ
ング結果を総合的に判断することによつて認識を
行うように構成したもので、各重み付についてマ
ツチング経路を独立に求めそれぞれの経路に沿う
マツチング結果から認識したり、ある特定の重み
付法についての経路を求め、この求めた経路に沿
い、重み付法を種々変えた場合の標準パターンと
入力パターンの距離とから認識したりすることが
でき、また、複数のマツチング結果からの総合評
価の方法も、前記種々の重み付法によつて得られ
た結果の重み付平均を最終的な距離として、その
距離の最小のものを認識結果とする方法や、ある
特定の重み付法によつていくつかの認識結果の候
補を選んでおき、得られたそれぞれの候補につい
て、他の重み寸法によつて最終的な認識結果を得
る方法等を用いることができ、入力フレーム毎に
全ての重み付法により得られる累積距離を求める
ようにすることにより、ベクトル間距離dn(i、
j)の計算が各格子点について一回のみで済み、
また入力が終了すると同時に認識結果を得ること
ができる。 実施例の説明 第4図に本発明の第1の実施例を示す。図にお
いて、5は音声信号の入力端子、6は特徴抽出部
であつて、前記入力音声信号を特徴ベクトルの系
列に変換する。7は標準パターン記憶部で、特徴
抽出部6で得られた各認識単語に対する特徴ベク
トルの系列を標準パターンとして認識に先立つて
予め記憶している。8はベクトル間距離計算部で
あつて、入力の第iフレームにおいてn=1、
2、……、N;j=1、2、……Jnについて、前
記ベクトル間距離dn(i、j)を求める。dn(i、
j)としては最も簡単には市街地距離とすること
ができる。即ち、ai=(ai1、ai2、……、ain)、bn j
=(bn j1、bn j2、……、bn jn)とするとき、 dn(i、j)=nk=1 |aik−bn jk| となし得る。9はベクトル間距離記憶部であつ
て、ベクトル間距離計算部8で計算されたベクト
ル間距離dn(i、j)をn=1、2、……、N;
j、1、2、……Jnについても必要がなくなるま
で記憶している。即ち、経路の制限条件を第3図
の如く選ぶときは2フレーム分のベクトル間距離
を記憶している。ベクトル間距離記憶部9は
VDM1とVDM2の2つの記憶領域から構成さ
れ、VDM1は現フレームiのベクトル間距離、
VDM2は前フレームのベクトル間距離が記憶
し、入力フレームが1つ更新されるとVDM1の
内容はVDM2に移され、新たなベクトル間距離
がVDM1に記憶される。10は重み係数記憶部
であつて、本実施例では第3図aのように重み付
けられる場合について説明する。1つの標準パタ
ーンとマツチングする重み付の種類をK種類と
し、第n単語の標準パターンの第jフレームに対
応する第k番目の重みをWn kjとする。重み係数
記憶部10はn=1、2……、N;k=1、2、
……、K:j=1、2、……、Jnについての重み
係数Wn kjを記憶している。11〜13はK種類のそ
れぞれの重み係数による累積距離計算部である。
累種距離計算部k(k=1、2、……、K)は始
点(1、1)から(i、j)までの重み係数Wn k
jについてのベクトル間距離の重み和gn k(i、j)
をn=1、2、……、Nについて計算する。即
ち、第3図aの拘束条件のもとでは次の漸化式計
算することになる。 第5図は累積距離計算部kの詳細な構成を示し
ている。漸化式計算部103は式(3)の計算を行う
部分である。101,102はベクトル間距離記
憶部9の内容が入力される端子、100は重み係
数記憶部10の内容が入力される端子、104は
累積距離記憶部であつて漸化式計算部103にお
ける漸化式の計算の必要がなくなるまで、その計
算に必要な漸化式の値を記憶しておくところで、
ADM1は現フレームiにおける累積距離g(i、
j)(n=1、2、……、N;j=1、2、……
Jn)を記憶しており、ADM2は前フレームi−
1における累積距離g(i−1、j)(n=1、
2、……、N;j=1、2、……Jn)を記憶して
いる。入力フレームが1つ更新されるとADM1
の内容はADM2に移され、ADM1には新たに
計算された累積距離が記憶される。漸化式計算部
103では、このADM1,ADM2に記憶され
ている累積距離と、VDM1、VDM2に記憶さ
れているベクトル間距離から式(3)の漸化式を計算
する。 以上のようにベクトル間距離計算部8、累積距
離計算部11〜13におけるベクトル間距離、累
積距離の計算は、n=1、2、……、N;j=
1、2、……Jnについて1フレーム毎に行われ、
入力が完了するとと同時に、n=1、2、……、
Nに対して、K積類の重み付法による最終の累積
距離、gn k(I、Jn)が累積距離記憶部104の
ADM1に記憶されることになる。第5図におい
て、105はこのようにして得られたgn k(I、Jn
を正規化する累積距離正規化部である。端子10
7に音声入力終了の旨が、また端子108に全フ
レーム数が通知されると、ADM1の内容が正規
化され、端子106から次段の判定部14へ正規
化された結果が出力される。正規化された結果
は、 となる。 第4図において、16は音声区間検出部であつ
て、入力音声の開始時点と終了時点を検出するも
ので、入力音声の電力等から公知の方法が適用で
きる。17はフレーム数計数部であつて、音声区
間の開始以後、1フレーム毎に計数を行い、音声
区間長を最終的に得るものである。 14は以上のようにして得られた正規化累積距
離Dn k(I、Jn)から最終的な認識結果を得る判定
部である。判定の方法としては次のような方法が
可能である。 () 入力信号の標準パターンRnに対する距離Dn
即ち、Dn k(I、Jn)のkについての第2の重
み係数akの重み付平均をDnとし、Dnを最小に
するnに対する標準パターンRnに対応する単
語を認識結果とする。 () 標準パターンRnに対する重み係数Wn ko(j)に
よる正規化累積距離Dn ko(I、Jn)について、最
小値から第l番目の最小値を与える標準パター
ンRq(1)、Rq(2)、……、Rqlを求め、得られた標
準パターンRq(1)、Rq(2)、……、Rqlについて、
Dn ko(I、Jn)を含んであるいは除いて、Dn k
(I、Jn)の()において説明したのと同様
の重み付平均が最小になる標準パターンに対応
する単語を認識結果とする。 以上の実施例においては、標準パターンRn
対して計算される重みWn kjについてのマツチン
グ経路は、kに関してそれぞれ独立に求めたが、
これを、標準パターンnについては、重みWn ko
について計算されるマツチング経路に沿つて、他
の重みWn kjによる累積距離をめるようにするこ
ともできる。このとき、式(3)の漸化式は次のよう
に変更される。
INDUSTRIAL APPLICATION FIELD The present invention relates to a pattern comparison device, and particularly to a pattern comparison device applicable to speech recognition. Conventional configuration and its problems The general configuration of a speech recognition device using pattern matching is as follows. A feature extraction means converts the input speech signal into a system of feature vectors by filter unbanking, frequency analysis LPU analysis, etc., and a feature vector sequence that is uttered in advance and extracted by the feature extraction means is used to recognize all words. A standard pattern storage means for registering as a standard pattern, an input pattern uttered for recognition and extracted by the feature extraction means, all standard patterns stored in the standard pattern storage means, and a feature vector. A pattern comparison means that calculates the similarity or distance as a series, and a determination means that determines and outputs the word corresponding to the standard pattern with the highest degree of similarity (smallest distance) as a recognition result as a result of the pattern comparison. Become. At this time, even if the same speaker utters the same word, the duration of the utterance differs each time, so when comparing the standard pattern and the input pattern using the pattern comparison means, the time axis of both It is necessary to expand and contract the pattern lengths of the two to make them the same and then compare them. At this time, since the utterance time length does not change uniformly in each part of the uttered word, it is necessary to expand and contract each part non-uniformly. The best results have been obtained when the expansion/contraction is performed in such a way that the similarity between the two patterns to be compared is maximized (the distance is minimized; this will be explained in terms of distance below). Devices that use dynamic programming are generally used to perform this kind of matching efficiently (hereinafter referred to as DP).
(referred to as matching). The DP matching method can be explained using a grid graph. Figure 1 is a grid graph, and the horizontal axis is the i coordinate corresponding to the input pattern T = a 1 a 2 ...a I ,
The vertical axis represents the j coordinate corresponding to the standard pattern R n =b n 1 , b n 2 . . . b n Jo . Matching the input pattern T and the standard pattern by non-linearly expanding and contracting the time axis means that on this lattice graph, path 1 indicating the correspondence between the feature vectors of both patterns is determined by some price standard, and this The purpose is to evaluate the distance between both patterns with respect to the route. When determining this route, limiting conditions are set in consideration of the nature of the voice. FIG. 2a shows an example of restrictive conditions for route selection. That is, in this example, the path to point (i, j) is from point (i-2, j-1) to point (i-1,
path 2 passing through point j), path 3 coming from point (i-1, j-1), or path 4 passing from point (i-1, j-1) to point (i, j-1). This means that only Kakashi can be taken. At this time, if the condition is that the starting ends of the input pattern and the standard pattern must correspond, the matching path is limited to the shaded area in FIG. This restriction is made to prevent extreme correspondences from occurring due to the fact that no matter how much the time axis expands or contracts, the same word cannot be expanded or contracted so drastically. If the distance between the vectors a i and b n j is d n (i, j), then the distance along the path between the input pattern T and the standard pattern R n is d n along that path.
It is defined as the weighted average of (i,j). A, b, c, d, and e on the route in FIG. 2 are the loads when the corresponding route is selected. In order for DP matching to be applicable, this load should be determined in such a way that no matter what path is selected on the lattice graph under the above-mentioned limiting conditions, the sum of the loads along that path will be constant. a=c=e=2, b=
If d=1, the sum of these loads is I+J n , a=b
If =c=1 and d=e=0.5, the sum of these loads will be J n and will be constant regardless of how the route is chosen.
Both of these are commonly used. Furthermore, by relating this load to j under the condition that the sum of the loads is constant, it is also possible to perform operations such as increasing the load on a portion of the route that is to be matched with greater emphasis. The distance between the input pattern T and the standard pattern R n is
Under the limiting conditions, the distance between the vectors d n (i,
j) is defined as the minimum value of the weighted average of j). That is, by solving the following recurrence formula, the minimum value of the weighted average and the path that provides the minimum value can be determined. g = (i, j) = ming n (i-2, j-1) + ad n (i-
1, j) + bd n (i, j) g n (i-1, j-1) + cd n (i, j) g n (i-1, j-1) + cd n (i, j) g n ( i-1, j-2)+ed n (i, j-1)+dd n (i,
j)...(1) (Initial condition g n (1, 1) = d n (1, 1), D(T,
R) = g n (I, J n )/(sum of loads) where g n (i, j) is the load of the vector distance d n (i, j) from the starting point to the point (i, j) The minimum value of the sum, D(T, R n ) is the distance between the input pattern T and the standard pattern R n . ) Various other conditions can be considered for route selection. FIGS. 2b to 2j, etc. are other examples. In addition to this, various other modifications can be considered. The recurrence formula is rewritten to correspond to these route selection conditions. As mentioned above, as a function of the load with respect to j,
In order to give importance to a part of the matching results on the matching route, the weights on the route may be set as shown in FIG. 3, for example. In the case of a in the same figure, the sum on the path from the matching starting point to the ending point is I+ Joj=1 W n j,
In the case of b, Joj=1 W n j. That is, the weight sum along the path a depends on both the input pattern length and the standard pattern length, and b depends only on the standard pattern length. Here, according to the above explanation, Joj=1 W n j is constant regardless of how the route is selected. At this time, for example, the recurrence formula for the above equation (1) for calculating the cumulative distance for a is as follows in equation (1): a=1+1/2W n j, b=1+1/2 W n j, c=1 +W n j, d=1/2W n j and e=1+1/2W n j . The distance between the input pattern T and the standard pattern R n is becomes. n^ argmin n [D(T, R n )] is determined, and the word corresponding to the standard pattern R n is taken as the recognition result. The notation argmin n [f(x)] is f
It means x that minimizes (x). At this time, if it is desired to perform matching that emphasizes the consonant part of the word, it is sufficient to increase the weight W n j of the frame j that abuts the consonant part of the standard pattern. W n j
can be determined for each frame, so it is possible to finely assign weights that are most suitable for each standard pattern. If Joj=1 W n j is kept constant regardless of n, equation (2) can also be changed to D(T, R n )=g(I, J n ). As described above, weighted DP matching has superior features compared to normal DP matching, which evaluates all frames equally. However, it has the following problems. That is, for example, the matching path when emphasis is placed on consonant parts and the matching path when all frames are evaluated equally are generally different, and it is expected that the recognition results will be different in both cases. Evaluating all frames equally means finding the distance that best matches the word as a whole, and for matching that emphasizes consonants, finding the distance that matches best locally. This means that the standard pattern that is closest in distance as a whole and the standard pattern that is locally closest are generally different. Therefore, simply introducing a weighting method does not necessarily lead to an improvement in the recognition rate. OBJECTS OF THE INVENTION It is an object of the present invention to provide a pattern comparison device that can solve the above drawbacks and obtain highly accurate recognition results. Structure of the Invention The pattern comparison device of the present invention is configured to perform recognition by performing matching for multiple types of weighting and comprehensively judging each matching result. Standard patterns and input patterns when paths are determined independently and recognized from the matching results along each path, or when a path is determined using a certain weighting method and the weighting method is varied along the determined path. In addition, a comprehensive evaluation method based on multiple matching results uses the weighted average of the results obtained by the various weighting methods as the final distance. Select several recognition result candidates using a method that uses the minimum distance as the recognition result or a certain weighting method, and then select each candidate using other weight dimensions. The distance between vectors d n (i,
j) only needs to be calculated once for each grid point,
Furthermore, the recognition result can be obtained at the same time as the input is completed. DESCRIPTION OF EMBODIMENTS FIG. 4 shows a first embodiment of the present invention. In the figure, 5 is an input terminal for an audio signal, and 6 is a feature extractor that converts the input audio signal into a series of feature vectors. Reference numeral 7 denotes a standard pattern storage unit which stores in advance a series of feature vectors for each recognized word obtained by the feature extraction unit 6 as a standard pattern prior to recognition. 8 is an inter-vector distance calculation unit, and in the i-th input frame, n=1,
2, . . . , N; j=1, 2, . . . J n , the intervector distance d n (i, j) is determined. d n (i,
j) can most easily be city distance. That is, a i = (a i1 , a i2 , ..., a in ), b n j
= (b n j1 , b n j2 , ..., b n jn ), it can be done as d n (i, j) = nk=1 | a ikb n jk |. 9 is an inter-vector distance storage unit which stores the inter-vector distances d n (i, j) calculated by the inter-vector distance calculation unit 8 as n=1, 2, . . . , N;
j, 1, 2, . . . J n is also memorized until it is no longer needed. That is, when selecting the route restriction conditions as shown in FIG. 3, the distance between vectors for two frames is stored. The inter-vector distance storage unit 9 is
It is composed of two storage areas, VDM1 and VDM2, and VDM1 is the distance between vectors of the current frame i,
VDM2 stores the distance between vectors of the previous frame, and when one input frame is updated, the contents of VDM1 are transferred to VDM2, and the new distance between vectors is stored in VDM1. 10 is a weighting coefficient storage unit, and in this embodiment, a case where weighting is performed as shown in FIG. 3a will be explained. It is assumed that there are K types of weights that are matched with one standard pattern, and that the k-th weight corresponding to the j-th frame of the standard pattern of the n-th word is W n k j. The weighting coefficient storage unit 10 has n=1, 2..., N; k=1, 2,
..., K: j=1, 2, ..., weighting coefficients W n k j for J n are stored. 11 to 13 are cumulative distance calculation units using K types of weighting coefficients.
The cumulative distance calculation unit k (k=1, 2, ..., K) calculates the weighting coefficient W n k from the starting point (1, 1) to (i, j).
Weighted sum of distances between vectors for j g n k (i, j)
is calculated for n=1, 2, ..., N. That is, under the constraint conditions shown in FIG. 3a, the following recurrence formula is calculated. FIG. 5 shows the detailed configuration of the cumulative distance calculating section k. The recurrence formula calculation unit 103 is a part that calculates equation (3). 101 and 102 are terminals into which the contents of the inter-vector distance storage section 9 are input, 100 is a terminal into which the contents of the weighting coefficient storage section 10 are input, and 104 is a cumulative distance storage section which is used to input the contents of the inter-vector distance storage section 9. The value of the recurrence formula necessary for the calculation is memorized until the calculation of the formula is no longer necessary.
ADM 1 is the cumulative distance g(i,
j) (n=1, 2,..., N; j=1, 2,...
J n ), and ADM2 stores the previous frame i-
Cumulative distance g(i-1,j)(n=1,
2,...,N;j=1,2,... Jn ). ADM1 when one input frame is updated
The contents of are transferred to ADM2, and the newly calculated cumulative distance is stored in ADM1. The recurrence formula calculation unit 103 calculates the recurrence formula of equation (3) from the cumulative distances stored in ADM1 and ADM2 and the inter-vector distances stored in VDM1 and VDM2. As described above, the inter-vector distance calculation unit 8 and the cumulative distance calculation units 11 to 13 calculate the inter-vector distance and cumulative distance using n=1, 2, ..., N; j=
1, 2, ...J n is performed every frame,
As soon as the input is completed, n=1, 2,...
For N, the final cumulative distance g n k (I, J n ) by the K product class weighting method is stored in the cumulative distance storage unit 104.
It will be stored in ADM1. In Fig. 5, 105 is g n k (I, J n ) obtained in this way.
This is the cumulative distance normalization unit that normalizes the . terminal 10
When the end of audio input is notified to terminal 7 and the total number of frames is notified to terminal 108, the contents of ADM1 are normalized, and the normalized result is output from terminal 106 to determination section 14 at the next stage. The normalized result is becomes. In FIG. 4, reference numeral 16 denotes a voice section detecting section, which detects the start and end points of the input voice, and a known method can be applied based on the power of the input voice, etc. Reference numeral 17 is a frame number counting section which counts every frame after the start of the voice section and finally obtains the length of the voice section. 14 is a determination unit that obtains the final recognition result from the normalized cumulative distance D n k (I, J n ) obtained in the above manner. The following methods can be used for determination. () Distance D n with respect to the standard pattern R n of the input signal
of That is, let D n be the weighted average of the second weighting coefficient a k for k of D n k (I, J n ) , and use the word corresponding to the standard pattern R n for n that minimizes D n as the recognition result. shall be. () Standard pattern R q (1) that gives the l-th minimum value from the minimum value for the normalized cumulative distance D n ko (I, J n ) using the weighting coefficient W n ko (j) for the standard pattern R n , R q(2) ,..., R ql is calculated, and for the obtained standard pattern R q(1) , R q(2) ,..., R ql ,
D n k with or without D n ko (I, J n )
The word corresponding to the standard pattern with the minimum weighted average as explained in () of (I, J n ) is taken as the recognition result. In the above embodiment, the matching paths for the weights W n k j calculated for the standard pattern R n were obtained independently with respect to k.
For the standard pattern n, the weight W n ko j
It is also possible to calculate the cumulative distance by other weights W n k j along the matching path calculated for . At this time, the recurrence formula of equation (3) is changed as follows.

【表】 このとき、第4図の構成は、累積距離計算部1
1で式(4)を計算するようになし、そこで得られた
経路を他の累積距離計算部12〜13へ通知する
信号線18を追加し、累積距離計算部12〜13
は式(5)を計算するように変更すればよい。判定処
理は、()の場合と同様である。 第6図は以上の動作をプログラムで表現したも
のであつて重み係数の種類毎に独立に累積距離を
計算する場合である。ソフトウエアで実現すると
きもこのプログラムに従えばよい。 なお、プログラムの記載において、 なる表記法の意味は、Aが真である間Bを実行す
るということである。 ステツプ200は漸化式計算部103における漸
化式に計算するに先立ち、初期化する部分であ
る。ステツプ201に入力パターンと全ての標準パ
ターンとのマツチングを行う部分であつて、入力
パターンとそれぞれの標準パターンとの累積距離
が重み係数の付け方毎に得られる。ステツプ202
は経路に沿う重み係数の総和で、前記累積距離を
正規化する部分であつて、前記実施例の累積距離
正規化部105で行われる処理に担当する。 ステツプ203は入力のフレーム毎に行われる処
理で、全ての標準パターンn=1、2、……、N
について、標準パターンの全フレームにおけるベ
クトル間距離、重み係数の種類毎の累積距離が求
められる。前記実施例のベクトル間距離計算部
8、累積距離件算部11〜13で行われる処理で
ある。 第7図は、マツチングの経路は各標準パターン
について、ある重み係数について求めたものに固
定して、重み係数のに種々変えて累積距離を計算
する場合である。この例において、第6図と同じ
番号を付したステツプは、第6図の場合と同様の
機能を表す。異るところは、ステツプ203の内
容のみであつて、既に説明したところである。 なお、本実施例では、累積距離正規化部105
を設けたが、Joj=1 Wnj=一定となるように重み係
数を決めておけば、この正規化の必要はない。 発明の効果 本発明のパターン比較装置は、マツチング経路
に種々の重み係数を導入し、その結果を総合的に
判断するように構成したので、単語に依つて、局
部的に重視すべきところは重視し、また全体とし
てのマツチング結果も考慮するところにより、よ
り精度の高い認識結果を得ることができ、また、
あらゆる認識単語、重み係数について、入力フレ
ーム毎に計算を完了することにより、実時間処理
が可能となつたものである。
[Table] At this time, the configuration shown in FIG.
1 to calculate the formula (4), and add a signal line 18 that notifies the other cumulative distance calculation units 12 to 13 of the route obtained there, and the cumulative distance calculation units 12 to 13
can be changed to calculate equation (5). The determination process is the same as in the case of (). FIG. 6 shows the above operation expressed by a program, in which cumulative distances are calculated independently for each type of weighting coefficient. You can also follow this program when implementing it with software. In addition, in the program description, The meaning of the notation is to execute B while A is true. Step 200 is a part for initializing before the recurrence formula calculation unit 103 calculates the recurrence formula. In step 201, the input pattern is matched with all standard patterns, and the cumulative distance between the input pattern and each standard pattern is obtained for each weighting coefficient. Step 202
is the sum of weighting coefficients along the route, which is a part that normalizes the cumulative distance, and is responsible for the processing performed by the cumulative distance normalization unit 105 of the embodiment. Step 203 is a process performed for each input frame, and all standard patterns n = 1, 2, ..., N
, the distance between vectors in all frames of the standard pattern and the cumulative distance for each type of weighting coefficient are determined. This is a process performed by the inter-vector distance calculation unit 8 and the cumulative distance calculation units 11 to 13 of the embodiment. FIG. 7 shows a case where the matching path is fixed to the one determined with respect to a certain weighting coefficient for each standard pattern, and the cumulative distance is calculated by varying the weighting coefficient. In this example, steps numbered the same as in FIG. 6 represent similar functions as in FIG. The only difference is the content of step 203, which has already been explained. Note that in this embodiment, the cumulative distance normalization unit 105
However, if the weighting coefficients are determined so that Joj=1 W n j=constant, there is no need for this normalization. Effects of the Invention The pattern comparison device of the present invention is configured to introduce various weighting coefficients into the matching path and comprehensively judge the results. However, by considering the overall matching result, more accurate recognition results can be obtained, and
By completing calculations for each input frame for all recognized words and weighting coefficients, real-time processing is possible.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はDPマツチングを説明する図、第2図
a〜jはDPマツチングにおけるマツチング経路
の拘束条件の例を示す図、第3図は局部的に重視
したDPマツチングを行うためのマツチング経路
に対する重み付の一例を示す図、第4図は本発明
における一実施例のパターン比較装置の構成を示
すブロツク図、第5図は同実施例における累積距
離計算部の詳細を示すブロツク図、第6図は同実
施例における動作をプログラムで示した図、第7
図は別の実施例における動作をプログラムで示し
た図である。 6……特徴抽出部、7……標準パターン記憶
部、8……ベクトル間距離計算部、9……ベクト
ル間距離記憶部、10……重み係数記憶部、11
〜13……累積距離計算部、14……判定部、1
03……漸化式計算部、104……累積距離記憶
部。
Figure 1 is a diagram explaining DP matching, Figures 2 a to j are diagrams showing examples of constraint conditions for matching paths in DP matching, and Figure 3 is a diagram for explaining matching paths for performing DP matching with local emphasis. FIG. 4 is a block diagram showing the configuration of a pattern comparison device according to an embodiment of the present invention, FIG. 5 is a block diagram showing details of the cumulative distance calculating section in the same embodiment, and FIG. The figure is a diagram showing the operation in the same embodiment as a program.
The figure is a program diagram showing the operation in another embodiment. 6...Feature extraction unit, 7...Standard pattern storage unit, 8...Vector distance calculation unit, 9...Vector distance storage unit, 10...Weighting coefficient storage unit, 11
~13... Cumulative distance calculation unit, 14... Judgment unit, 1
03... Recurrence formula calculation unit, 104... Cumulative distance storage unit.

Claims (1)

【特許請求の範囲】 1 入力信号を特徴ベクトルの系列a1、a2、……
a1……aIよりなる入力パターンTに変換する特徴
抽出手段と、特徴ベクトルの系列bn 1、bn 2……bn j
…bn Joからなる標準パターンRn(ただし、n=1、
2、……、N)を記憶する標準パターン記憶手段
と、前記標準パターンRnに付随する複数種類の
重み係数Wn 1(1)、Wn 1(2)、……、Wn 1(Jn);Wn 2(1)、
Wn 2(2)、……、Wn 2(Jn);……;Wn k(1)、……、Wn k
(Jn)を記憶する重み係数記憶手段と、前記入力
パターンTのフレームを横軸に、前記標準パター
ンRnのフレームを縦軸にとつた格子グラフにお
いて、aiとbjのベクトル間距離dn(i、j)を求め
るベクトル間距離計算手段と、このベクトル間距
離を記憶するベクトル間距離記憶手段と、前記複
数種類の重み係数を用いて入力パターンと標準パ
ターンについての複数種類の累積距離を求める漸
化式計算手段と、前記漸化式計算手段で求められ
た複数種類の累積距離を記憶する累積距離記憶手
段と、前記複数の累積距離から最終の認識結果を
得る判定手段を設けたことを特徴とするパターン
比較装置。 2 ベクトル間距離計算手段は、入力パターンと
標準パターンのベクトル間距離を、入力パターン
の各フレーム毎に、全標準パターンの各フレーム
について求め、漸化式計算手段は、入力パターン
と標準パターンの累積距離を、入力パターンの各
フレーム毎に、全標準パターンの各フレームにつ
いて求めることを特徴とする特許請求の範囲第1
項記載のパターン比較装置。
[Claims] 1. An input signal is converted into a series of feature vectors a 1 , a 2 , . . .
a feature extraction means for converting into an input pattern T consisting of a 1 ... a I , and a series of feature vectors b n 1 , b n 2 ... b n j ...
...b n Standard pattern R n consisting of Jo (where n=1,
2, ..., N), and a plurality of types of weighting coefficients W n 1 (1), W n 1 (2), ..., W n 1 ( J n ); W n 2 (1),
W n 2 (2), ..., W n 2 (J n ); ...; W n k (1), ..., W n k
(J n ), and a distance between vectors a i and b j in a lattice graph with the frame of the input pattern T on the horizontal axis and the frame of the standard pattern R n on the vertical axis. inter-vector distance calculation means for calculating d n (i, j); inter-vector distance storage means for storing this inter-vector distance; A recurrence formula calculation means for calculating a distance, a cumulative distance storage means for storing a plurality of types of cumulative distances obtained by the recurrence formula calculation means, and a determination means for obtaining a final recognition result from the plurality of cumulative distances. A pattern comparison device characterized by: 2. The inter-vector distance calculation means calculates the inter-vector distance between the input pattern and the standard pattern for each frame of the input pattern and for each frame of all standard patterns, and the recurrence formula calculation means calculates the inter-vector distance between the input pattern and the standard pattern. Claim 1, characterized in that the distance is determined for each frame of the input pattern and for each frame of all standard patterns.
The pattern comparison device described in Section 1.
JP58048105A 1983-03-22 1983-03-22 Pattern comparator Granted JPS59173883A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58048105A JPS59173883A (en) 1983-03-22 1983-03-22 Pattern comparator

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58048105A JPS59173883A (en) 1983-03-22 1983-03-22 Pattern comparator

Publications (2)

Publication Number Publication Date
JPS59173883A JPS59173883A (en) 1984-10-02
JPH0449718B2 true JPH0449718B2 (en) 1992-08-12

Family

ID=12794031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58048105A Granted JPS59173883A (en) 1983-03-22 1983-03-22 Pattern comparator

Country Status (1)

Country Link
JP (1) JPS59173883A (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358400A (en) * 1986-08-28 1988-03-14 日本電気株式会社 Continuous word voice recognition equipment
US4885697A (en) * 1988-09-01 1989-12-05 E. I. Du Pont De Nemours And Company Method of identifying spectra

Also Published As

Publication number Publication date
JPS59173883A (en) 1984-10-02

Similar Documents

Publication Publication Date Title
US4400828A (en) Word recognizer
JPH0554959B2 (en)
JP4246703B2 (en) Automatic speech recognition method
JPS58192100A (en) Hourly alignment of first and second voice pattern and apparatus therefor
JPH0247760B2 (en)
JPH0449718B2 (en)
JP3914709B2 (en) Speech recognition method and system
JP2000200098A (en) Learning device and learning method, and recognition device and recognition method
JP2015152661A (en) Weighted finite state automaton creation device, symbol string conversion device, speech recognition device, method and program thereof
JPH0823758B2 (en) Speaker-adaptive speech recognizer
JP2853418B2 (en) Voice recognition method
JPH0247758B2 (en)
JPH024919B2 (en)
JP2001005483A (en) Word voice recognizing method and word voice recognition device
JP6748607B2 (en) Speech synthesis learning apparatus, speech synthesis apparatus, method and program thereof
JP3859884B2 (en) Speaker recognition method and speaker recognition apparatus
JPH0320759B2 (en)
JPH05197397A (en) Speech recognition method and apparatus thereof
US20070271096A1 (en) Voice Recognition Method And System Based On The Contexual Modeling Of Voice Units
JP2574242B2 (en) Voice input device
JPS6247100A (en) Voice recognition equipment
JP3448371B2 (en) HMM learning device
JPS59195699A (en) word speech recognizer
JPS5972578A (en) pattern comparison device
JPS6129897A (en) Pattern comparator