JPH0449718B2

JPH0449718B2 -

Info

Publication number: JPH0449718B2
Application number: JP58048105A
Authority: JP
Inventors: Seiichi Nakagawa; Hidekazu Tsuboka
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1983-03-22
Filing date: 1983-03-22
Publication date: 1992-08-12
Also published as: JPS59173883A

Description

【発明の詳細な説明】

産業上の利用分野本発明はパターン比較装置、特に音声認識に応
用可能なパターン比較装置に関する。従来例の構成とその問題点パターンマツチングによる音声認識装置の一般
的な構成は次のようなものである。入力音声信号を、フイルタアンバンク、周波数
分析LPU分析等によつて特徴ベクトルの系孔に
変換する特徴抽出手段と、予め発声され、この特
徴抽出手段により抽出された特徴ベクトルの系列
を認識単語全部について標準パターンとして登録
しておく標準パターン記憶手段と、認識させるべ
く発声され、前記特徴抽出手段により抽出された
入力パターンと前記標準パターン記憶手段に記憶
されている標準パターンの全てと特徴ベクトルと
の系列としての類似度あるいは距離を計算するパ
ターン比較手段と、パターン比較の結果、最も類
似度の高かつた（距離の小さかつた）標準パター
ンに対応する単語を認識結果として判定出力する
判定手段からなる。このとき、同一話者が同一の単語を発声しても
発声の都度、その発声時間長が異るので、前記パ
ターン比較手段で標準パターンと入力パターンの
比較を行う際には、両者の時間軸を伸縮させ、両
者のパターン長を揃えて比較する必要がある。そ
の際、発声時間長の変化は、発声単語の各部で一
様に生じているわけではないので、各部を不均一
に伸縮する必要がある。その伸縮は比較すべき両
者のパターンの類似度が最大になる（距離が最小
になる。以下距離で説明する。）ように行われる
のが最も良い結果が得られている。このようなマ
ツチングを効率的に行うのに動的計画法を用いる
装置が一般的である（以下このマツチングをDP
マツチングと称する）。 DPマツチングの方法は格子グラフによつて説
明できる。第１図は格子グラフであつて、横軸は
入力パターンＴ＝a₁ a₂……a_Iに対応するｉ座標、
縦軸は標準パターンRⁿ＝bⁿ ₁、bⁿ ₂……bⁿ _Joに対応す
るｊ座標を表している。入力パターンＴと標準パ
ターンを時間軸を非線形に伸縮してマツチングす
るとは、この格子グラフ上において、両パターン
の各特徴ベクトルの対応関係を示す経路１を何ら
かの標価基準によつて決定し、この経路に関して
両パターンの距離を評価することである。この経
路を決定する際には音声の性質を考慮して制限条
件を設ける。第２図ａは経路選択の制限条件の一
例である。即ち、この例では点（ｉ、ｊ）へ至る
経路は、点（ｉ−２、ｊ−１）から点（ｉ−１、
ｊ）を通る経路２か、点（ｉ−１、ｊ−１）から
来る経路３か、点（ｉ−１、ｊ−１）から点
（ｉ、ｊ−１）を通る経路４かの何れかしか取り
得ないということを意味している。このとき、入
力パターンと標準パターンの始端は必ず対応させ
るという条件をつければ、前記マツチングの経路
は第１図の斜線の部分に制限される。この制限
は、いかに時間軸が伸縮するといつても、同一単
語に対してはそれ程極端に伸縮するはずはないと
いう事実からあまり極端な対応づけが生じないよ
うにするためである。 a_iとbⁿ _jのベクトル間距離をdⁿ（ｉ、ｊ）とすれ
ば、入力パターンＴと標準パターンRⁿのパター
ン間の前記経路に沿う距離は、その経路に沿うdⁿ
（ｉ、ｊ）の荷重平均として定義される。第２図
の経路上のａ、ｂ、ｃ、ｄ、ｅはそれに対応する
経路が選ばれたときの荷重である。DPマツチン
グが適用できるためにはこの荷重の決め方は、格
子グラフ上で前記制限条件の下でいかなる経路が
選ばれようともその経路に沿う荷重の和が一定に
なるように決めれば良い。ａ＝ｃ＝ｅ＝２、ｂ＝
ｄ＝１とすれば、この荷重の和はＩ＋Jⁿ、ａ＝ｂ
＝ｃ＝１、ｄ＝ｅ＝0.5とすれば、この荷重の和
はJⁿとなり経路の選ばれ方によらず一定となる。
これらは共によく用いられる。また、前記荷重の
和一定という条件の下でこの荷重をｊに関するこ
とにより、より重視してマツチングしたい経路上
の部分の荷重を重くする等の操作も可能である。入力パターンＴと標準パターンRⁿの距離は、
前記制限条件の下で、前記ベクトル間距離dⁿ（ｉ、
ｊ）の荷重平均の最小値として定義される。即
ち、次の漸化式を解くことによつて前記荷重平均
の最小値とその最小値を与える経路が決定され得
る。ｇ＝（ｉ、ｊ）＝mingⁿ（ｉ−２、ｊ−１）＋adⁿ（ｉ−
１、ｊ）＋bdⁿ（ｉ、ｊ） gⁿ（ｉ−１、ｊ−１）＋cdⁿ（ｉ、ｊ） gⁿ（ｉ−１、ｊ−１）＋cdⁿ（ｉ、ｊ） gⁿ（ｉ−１、ｊ−２）＋edⁿ（ｉ、ｊ−１）＋ddⁿ（ｉ、
ｊ）……(1) （初期条件 gⁿ（１、１）＝dⁿ（１、１）、Ｄ（Ｔ、
Ｒ）＝gⁿ（Ｉ、Jⁿ）／（荷重の和）ここにgⁿ（ｉ、ｊ）は始点から点（ｉ、ｊ）に
至る、ベクトル間距離dⁿ（ｉ、ｊ）の荷重和の最
小値、Ｄ（Ｔ、Rⁿ）入力パターンＴと標準パター
ンRⁿの距離である。）経路選択の条件としては他にも種々考えられ
る。第２図ｂ〜ｊ等は他の例である。この他にも
さらに種々の変形が考えられ得る。これら経路に
選択条件に伴つて前記漸化式は対応するものに書
き換えられる。前記のように、荷重をｊに関する関数として、
マツチング経路上の一部のマツチング結果を重視
するには、例えば経路上の重みを第３図のように
すれば良い。同図ａの場合はマツチングの始点か
ら終点までの経路上の和はＩ＋_Jo 〓^j=1 Wⁿｊであり、
ｂの場合は_Jo 〓^j=1 Wⁿｊである。即ち、経路に沿う重
み和はａは入力パターン長と標準パターン長の両
方に依存し、ｂは標準パターン長にのみ依存す
る。ここで、前記説明に従つて_Jo 〓^j=1 Wⁿｊは経路の
選び方によらず一定である。このとき、例えば、ａに対する累積距離算出の
前記式(1)に関する漸化式は、式(1)においてａ＝１＋１／２Wⁿｊ、ｂ＝１＋１／２Wⁿｊ、ｃ＝１＋Wⁿｊ、ｄ＝１／２Wⁿｊ、ｅ＝１＋１／２Wⁿｊとなる。入力パターンＴと標準パターンRⁿの距
離は、となる。 n^ argminⁿ 〔Ｄ（Ｔ、Rⁿ）〕を求め、標準パターンRⁿに対応する単語を認識
結果とする。 argminⁿ 〔ｆ（ｘ）〕なる記法は、ｆ
（ｘ）を最小にするｘのことを意味する。このと
き、単語の子音部を重視したマツチングを行いた
ければ、標準パターンの子音部に接当するフレー
ムｊの重みWⁿｊを大きくしておけばよい。Wⁿｊ
はフレーム毎に決定できるから、それぞれの標準
パターンに最も適した重み付をきめ細かく行うこ
とができる。ｎにかかわらず_Jo 〓^j=1 Wⁿｊが一定であ
るようにすれば、式(2)はＤ（Ｔ、Rⁿ）＝ｇ（Ｉ、Jⁿ）とすることもできる。重み付DPマツチングは、以上のように、すべ
てのフレームを平等に評価する通常のDPマツチ
ングに比べて、すぐれた特徴をもつ。しかし、次
のような問題点を有する。即ち、例えば、子音部を重視した場合のマツチ
ングの経路と、すべてのフレームを平等に評価し
た場合のマツチング経路は一般に異なり、両者の
場合の認識結果も異ることが予想される。すべて
のフレームを平等に評価することは、単語全体と
して最も良くマツチングする場合の距離を、ま
た、子音部を重視したマツチングは局部的に最も
良くマツチングする場合の距離を求めていること
になり、全体として距離的に最も近い標準パター
ンと、局部的にみて最も近い標準パターンが一般
には異るということである。したがつて、単に重
み付の方法を導入するだけでは必ずしも認識率の
向上に結びつくとは限らない。発明の目的本発明は、上記欠点を解決し、精度の高い認識
結果を得ることができるパターン比較装置を提供
することを目的とする。発明の構成本発明のパターン比較装置は、複数種類の重み
付についてマツチングを行い、それぞれのマツチ
ング結果を総合的に判断することによつて認識を
行うように構成したもので、各重み付についてマ
ツチング経路を独立に求めそれぞれの経路に沿う
マツチング結果から認識したり、ある特定の重み
付法についての経路を求め、この求めた経路に沿
い、重み付法を種々変えた場合の標準パターンと
入力パターンの距離とから認識したりすることが
でき、また、複数のマツチング結果からの総合評
価の方法も、前記種々の重み付法によつて得られ
た結果の重み付平均を最終的な距離として、その
距離の最小のものを認識結果とする方法や、ある
特定の重み付法によつていくつかの認識結果の候
補を選んでおき、得られたそれぞれの候補につい
て、他の重み寸法によつて最終的な認識結果を得
る方法等を用いることができ、入力フレーム毎に
全ての重み付法により得られる累積距離を求める
ようにすることにより、ベクトル間距離dⁿ（ｉ、
ｊ）の計算が各格子点について一回のみで済み、
また入力が終了すると同時に認識結果を得ること
ができる。実施例の説明第４図に本発明の第１の実施例を示す。図にお
いて、５は音声信号の入力端子、６は特徴抽出部
であつて、前記入力音声信号を特徴ベクトルの系
列に変換する。７は標準パターン記憶部で、特徴
抽出部６で得られた各認識単語に対する特徴ベク
トルの系列を標準パターンとして認識に先立つて
予め記憶している。８はベクトル間距離計算部で
あつて、入力の第ｉフレームにおいてｎ＝１、
２、……、Ｎ；ｊ＝１、２、……Jⁿについて、前
記ベクトル間距離dⁿ（ｉ、ｊ）を求める。dⁿ（ｉ、
ｊ）としては最も簡単には市街地距離とすること
ができる。即ち、a_i＝（a_i1、a_i2、……、a_in）、bⁿ _j
＝（bⁿ _j1、bⁿ _j2、……、bⁿ _jn）とするとき、 dⁿ（ｉ、ｊ）＝_n 〓^k=1 ｜a_ik−bⁿ _jk｜となし得る。９はベクトル間距離記憶部であつ
て、ベクトル間距離計算部８で計算されたベクト
ル間距離dⁿ（ｉ、ｊ）をｎ＝１、２、……、Ｎ；
ｊ、１、２、……Jⁿについても必要がなくなるま
で記憶している。即ち、経路の制限条件を第３図
の如く選ぶときは２フレーム分のベクトル間距離
を記憶している。ベクトル間距離記憶部９は
VDM１とVDM２の２つの記憶領域から構成さ
れ、VDM１は現フレームｉのベクトル間距離、
VDM２は前フレームのベクトル間距離が記憶
し、入力フレームが１つ更新されるとVDM１の
内容はVDM２に移され、新たなベクトル間距離
がVDM１に記憶される。１０は重み係数記憶部
であつて、本実施例では第３図ａのように重み付
けられる場合について説明する。１つの標準パタ
ーンとマツチングする重み付の種類をＫ種類と
し、第ｎ単語の標準パターンの第ｊフレームに対
応する第ｋ番目の重みをWⁿ _kｊとする。重み係数
記憶部１０はｎ＝１、２……、Ｎ；ｋ＝１、２、
……、Ｋ：ｊ＝１、２、……、Jⁿについての重み
係数Wⁿ _kｊを記憶している。11〜13はＫ種類のそ
れぞれの重み係数による累積距離計算部である。
累種距離計算部ｋ（ｋ＝１、２、……、Ｋ）は始
点（１、１）から（ｉ、ｊ）までの重み係数Wⁿ _k
ｊについてのベクトル間距離の重み和gⁿ _k（ｉ、ｊ）
をｎ＝１、２、……、Ｎについて計算する。即
ち、第３図ａの拘束条件のもとでは次の漸化式計
算することになる。第５図は累積距離計算部ｋの詳細な構成を示し
ている。漸化式計算部１０３は式(3)の計算を行う
部分である。１０１，１０２はベクトル間距離記
憶部９の内容が入力される端子、１００は重み係
数記憶部１０の内容が入力される端子、１０４は
累積距離記憶部であつて漸化式計算部１０３にお
ける漸化式の計算の必要がなくなるまで、その計
算に必要な漸化式の値を記憶しておくところで、
ADM₁は現フレームｉにおける累積距離ｇ（ｉ、
ｊ）（ｎ＝１、２、……、Ｎ；ｊ＝１、２、……
Jⁿ）を記憶しており、ADM２は前フレームｉ−
１における累積距離ｇ（ｉ−１、ｊ）（ｎ＝１、
２、……、Ｎ；ｊ＝１、２、……Jⁿ）を記憶して
いる。入力フレームが１つ更新されるとADM１
の内容はADM２に移され、ADM１には新たに
計算された累積距離が記憶される。漸化式計算部
１０３では、このADM１，ADM２に記憶され
ている累積距離と、VDM１、VDM２に記憶さ
れているベクトル間距離から式(3)の漸化式を計算
する。以上のようにベクトル間距離計算部８、累積距
離計算部１１〜１３におけるベクトル間距離、累
積距離の計算は、ｎ＝１、２、……、Ｎ；ｊ＝
１、２、……Jⁿについて１フレーム毎に行われ、
入力が完了するとと同時に、ｎ＝１、２、……、
Ｎに対して、Ｋ積類の重み付法による最終の累積
距離、gⁿ _k（Ｉ、Jⁿ）が累積距離記憶部１０４の
ADM１に記憶されることになる。第５図におい
て、１０５はこのようにして得られたgⁿ _k（Ｉ、Jⁿ）
を正規化する累積距離正規化部である。端子１０
７に音声入力終了の旨が、また端子１０８に全フ
レーム数が通知されると、ADM１の内容が正規
化され、端子１０６から次段の判定部１４へ正規
化された結果が出力される。正規化された結果
は、となる。第４図において、１６は音声区間検出部であつ
て、入力音声の開始時点と終了時点を検出するも
ので、入力音声の電力等から公知の方法が適用で
きる。１７はフレーム数計数部であつて、音声区
間の開始以後、１フレーム毎に計数を行い、音声
区間長を最終的に得るものである。１４は以上のようにして得られた正規化累積距
離Dⁿ _k（Ｉ、Jⁿ）から最終的な認識結果を得る判定
部である。判定の方法としては次のような方法が
可能である。 () 入力信号の標準パターンRⁿに対する距離Dⁿ
を即ち、Dⁿ _k（Ｉ、Jⁿ）のｋについての第２の重
み係数a_kの重み付平均をDⁿとし、Dⁿを最小に
するｎに対する標準パターンRⁿに対応する単
語を認識結果とする。 () 標準パターンRⁿに対する重み係数Wⁿ _ko(j)に
よる正規化累積距離Dⁿ _ko（Ｉ、Jⁿ）について、最
小値から第ｌ番目の最小値を与える標準パター
ンR^q(1)、R^q(2)、……、R^qlを求め、得られた標
準パターンR^q(1)、R^q(2)、……、R^qlについて、
Dⁿ _ko（Ｉ、Jⁿ）を含んであるいは除いて、Dⁿ _k
（Ｉ、Jⁿ）の（）において説明したのと同様
の重み付平均が最小になる標準パターンに対応
する単語を認識結果とする。以上の実施例においては、標準パターンRⁿに
対して計算される重みWⁿ _kｊについてのマツチン
グ経路は、ｋに関してそれぞれ独立に求めたが、
これを、標準パターンｎについては、重みWⁿ _koｊ
について計算されるマツチング経路に沿つて、他
の重みWⁿ _kｊによる累積距離をめるようにするこ
ともできる。このとき、式(3)の漸化式は次のよう
に変更される。

【表】このとき、第４図の構成は、累積距離計算部１
１で式(4)を計算するようになし、そこで得られた
経路を他の累積距離計算部１２〜１３へ通知する
信号線１８を追加し、累積距離計算部１２〜１３
は式(5)を計算するように変更すればよい。判定処
理は、（）の場合と同様である。第６図は以上の動作をプログラムで表現したも
のであつて重み係数の種類毎に独立に累積距離を
計算する場合である。ソフトウエアで実現すると
きもこのプログラムに従えばよい。なお、プログラムの記載において、なる表記法の意味は、Ａが真である間Ｂを実行す
るということである。ステツプ200は漸化式計算部１０３における漸
化式に計算するに先立ち、初期化する部分であ
る。ステツプ201に入力パターンと全ての標準パ
ターンとのマツチングを行う部分であつて、入力
パターンとそれぞれの標準パターンとの累積距離
が重み係数の付け方毎に得られる。ステツプ202
は経路に沿う重み係数の総和で、前記累積距離を
正規化する部分であつて、前記実施例の累積距離
正規化部１０５で行われる処理に担当する。ステツプ203は入力のフレーム毎に行われる処
理で、全ての標準パターンｎ＝１、２、……、Ｎ
について、標準パターンの全フレームにおけるベ
クトル間距離、重み係数の種類毎の累積距離が求
められる。前記実施例のベクトル間距離計算部
８、累積距離件算部１１〜１３で行われる処理で
ある。第７図は、マツチングの経路は各標準パターン
について、ある重み係数について求めたものに固
定して、重み係数のに種々変えて累積距離を計算
する場合である。この例において、第６図と同じ
番号を付したステツプは、第６図の場合と同様の
機能を表す。異るところは、ステツプ２０３の内
容のみであつて、既に説明したところである。なお、本実施例では、累積距離正規化部１０５
を設けたが、_Jo 〓^j=1 Wⁿｊ＝一定となるように重み係
数を決めておけば、この正規化の必要はない。発明の効果本発明のパターン比較装置は、マツチング経路
に種々の重み係数を導入し、その結果を総合的に
判断するように構成したので、単語に依つて、局
部的に重視すべきところは重視し、また全体とし
てのマツチング結果も考慮するところにより、よ
り精度の高い認識結果を得ることができ、また、
あらゆる認識単語、重み係数について、入力フレ
ーム毎に計算を完了することにより、実時間処理
が可能となつたものである。

【図面の簡単な説明】

第１図はDPマツチングを説明する図、第２図
ａ〜ｊはDPマツチングにおけるマツチング経路
の拘束条件の例を示す図、第３図は局部的に重視
したDPマツチングを行うためのマツチング経路
に対する重み付の一例を示す図、第４図は本発明
における一実施例のパターン比較装置の構成を示
すブロツク図、第５図は同実施例における累積距
離計算部の詳細を示すブロツク図、第６図は同実
施例における動作をプログラムで示した図、第７
図は別の実施例における動作をプログラムで示し
た図である。６……特徴抽出部、７……標準パターン記憶
部、８……ベクトル間距離計算部、９……ベクト
ル間距離記憶部、１０……重み係数記憶部、１１
〜１３……累積距離計算部、１４……判定部、１
０３……漸化式計算部、１０４……累積距離記憶
部。

Claims

【特許請求の範囲】１入力信号を特徴ベクトルの系列a₁、a₂、……
a₁……a_Iよりなる入力パターンＴに変換する特徴
抽出手段と、特徴ベクトルの系列bⁿ ₁、bⁿ ₂……bⁿ _j…
…bⁿ _Joからなる標準パターンRⁿ（ただし、ｎ＝１、
２、……、Ｎ）を記憶する標準パターン記憶手段
と、前記標準パターンRⁿに付随する複数種類の
重み係数Wⁿ ₁(1)、Wⁿ ₁(2)、……、Wⁿ ₁（Jⁿ）；Wⁿ ₂(1)、
Wⁿ ₂(2)、……、Wⁿ ₂（Jⁿ）；……；Wⁿ _k(1)、……、Wⁿ _k
（Jⁿ）を記憶する重み係数記憶手段と、前記入力
パターンＴのフレームを横軸に、前記標準パター
ンRⁿのフレームを縦軸にとつた格子グラフにお
いて、a_iとb_jのベクトル間距離dⁿ（ｉ、ｊ）を求め
るベクトル間距離計算手段と、このベクトル間距
離を記憶するベクトル間距離記憶手段と、前記複
数種類の重み係数を用いて入力パターンと標準パ
ターンについての複数種類の累積距離を求める漸
化式計算手段と、前記漸化式計算手段で求められ
た複数種類の累積距離を記憶する累積距離記憶手
段と、前記複数の累積距離から最終の認識結果を
得る判定手段を設けたことを特徴とするパターン
比較装置。２ベクトル間距離計算手段は、入力パターンと
標準パターンのベクトル間距離を、入力パターン
の各フレーム毎に、全標準パターンの各フレーム
について求め、漸化式計算手段は、入力パターン
と標準パターンの累積距離を、入力パターンの各
フレーム毎に、全標準パターンの各フレームにつ
いて求めることを特徴とする特許請求の範囲第１
項記載のパターン比較装置。