JPH0247759B2

JPH0247759B2 -

Info

Publication number: JPH0247759B2
Application number: JP57110530A
Authority: JP
Inventors: Seiichi Nakagawa
Original assignee: Individual
Current assignee: Individual
Priority date: 1982-06-25
Filing date: 1982-06-25
Publication date: 1990-10-22
Also published as: JPS592094A

Description

【発明の詳細な説明】

本発明は、登録された複数種類のパターンと入
力パターンとの比較を行い、入力パターンの識別
を行うパターン比較装置、特に連続して発声した
単語音声の認識などに適用可能なパターン比較装
置に関する。人間にとつて最も自然な情報発生手段である音
声が、人間−機械系の入力手段として真価が発揮
されるためには、話者を限定せず連続的な通常の
会話音声の認識が可能なことが望ましい。このう
ち第１図は単語単位を認識単位とする音声認識装
置のブロツク図である。１は音声信号の入力端
子、２は入力音声信号を周波数分析、LPC分析、
PARCOR分析、相関分析等により幾つかの数値
の組（特徴ベクトル）の系列に変換する音響分析
部３は認識すべき単語が前記特徴ベクトルの系列
として登録されている標準パターン記憶部、４は
音響分析部２で分析された認識すべき入力音声信
号に対する前記特徴ベクトルの系列と前記標準パ
ターンのそれぞれとを比較し、両者の距離あるい
は類似度を計算するパターンマツチング部、５は
パターンマツチング部４の計算結果に基づいて前
記入力音声パターンに最も近い標準パターンに対
応する単語を認識結果として判定する判定部であ
り、６はこの認識結果を出力する出力端子であ
る。このような構成による音声認識装置におい
て、パターンマツチングの方法として、動的計画
法による時間軸非線形伸縮によりマツチング
（DPマツチング）を行う方法が優れている。本発明装置による連続単語認識において、この
DPマツチングは中心的な役割を演ずる。次にDP
マツチングのアルゴリズムについて簡単に説明す
る。いま、Ａ＝a₁，a₂…a_I…A〓Ｂ＝b₁，b₂…b_j…b_J ……(1) を二つの音声パターンとする。すなわち、それら
の音声パターンは、それぞれに対する特徴ベクト
ルa_i，b_jの系列で表わされる。ベクトルa_iとb_jの距離をｄ（ｉ，ｊ）とすると
き、前記両系列を構成するベクトルの種々の対応
づけに対し、ｄ（ｉ，ｊ）の荷重平均を求め、そ
れが最小になる対応づけを両系列間の最適な対応
づけとし、そのときの荷重平均を両系列間の距離
Ｄ（Ａ，Ｂ）とするのであるが、この手続を動的
計画法を用いて効率よく行うのが、DPマツチン
グである。なお、ｄ（ｉ，ｊ）は通常ベクトルa_i
とb_jのユークリツド距離または市街距離が用いら
れる。第２図はこれを二次元的に図示したもので、
Ａ、Ｂ両パターンの時間の対応すなわち時間変換
亟数ｊ(i)は、ｉ−ｊ平面上の格子点ｃ（ｋ）＝（ｉ
（ｋ），ｊ（ｋ））のの系列Ｆ＝ｃ(1)，ｃ(2)…ｃ（ｋ）…ｃ（Ｋ） ……(2) （ｉ（Ｋ）＝Ｉ，ｉ（ｋ）＝Ｊ）で表わされる。このとき、Ｄ（Ａ，Ｂ）は次のよ
うに定義される。ここに、Ｗ（ｋ）は非負の定数で、その値は時
間変換凾数ｊ(i)を点列で近似するときの方式によ
つて定められる。ここで、式(3)の分母をＦに依存
しない定数Ｍ＝_K 〓^l=1 Ｗ（ｋ）とすれば、Ｄ（Ａ，Ｂ）
は動的計画法により効率的に求められる。すなわ
ち、ｇ（ｃ（ｋ））＝min ｃ（１）ｃ（２）…ｃ（ｋ）〔_K 〓^l=1 ｄ（ｃ（ｌ）Ｗ（ｌ）〕＝min ｃ（ｋ）〔min ｃ（１）ｃ（２）…ｃ（ｋ−１）〔_K 〓^l=1 ｄ（ｃ（ｌ））Ｗ（ｌ）〕＋ｄ（ｃ（ｋ））Ｗ（ｋ）〕＝min ＋ｄ（ｃ（ｋ））Ｗ（ｋ）〕＝min （CK）〔ｇ（ｃ（ｋ−１））＋ｄ（ｃ（ｋ））Ｗ（ｋ）
〕……(4) であるから、ｇ（ｃ(1)＝ｇ（１，１）＝ｄ（１，１）
として、漸化式(4)を解き、ｇ（ｃ（ｋ））＝ｇ（Ｉ，
Ｊ）が求められればＤ（Ａ，Ｂ）＝１／Ｍｇ（Ｉ，Ｊ） ……(5) としてＤ（Ａ，Ｂ）が求められる。式(3)の分母を定数化する方法として、Ｍ＝Ｉ＋
Ｊとなるようにする方法（対称型）と、Ｍ＝Ｉま
たはＪとなるようにする方法（非対称型）があ
る。第３図ａ〜ｆは点列Ｆを選ぶ際の拘束条件の
例を示しており、点（ｉ，ｊ）に至る径路は図の
矢線で示される径路のみとり得る。また、各線分
上に示された数字はその線分が径路として選ばれ
た場合の荷重Ｗ（ｋ）を示している。ａ、ｂは前
記対称型の例でＭ＝Ｉ＋Ｊとなり、ｃ〜ｆは前記
非対称型の例でＭ＝Ｉとなる。このようなマツチング法を用いて単語音声の認
識をするには次のようにする。認識の対象となつ
ている単語クラスをｎ（ｎ＝１〜Ｎ）、その標準パ
ターンをBⁿで表す。入力Ａと各標準パターンBⁿ
との距離D_o＝Ｄ（Ａ，Bⁿ）を上記の方法で計算
し、D_o0＝^min _o（D_o）を与えるクラスn₀をＡに対す
る認識結果とする。前記非対称型のDPマツチングでＭ＝Ｉとなる
ようにすれば、Ｍは入力パターン長にのみ関係す
る量となり、式(5)において何れの標準パターンに
対してもＭは一定であるから、Ｄ（Ａ，Ｂ）＝ｇ（Ｉ，Ｊ）＝min〔_I 〓ⁱ⁼¹ ｄ（ｉ，ｊ）〕 ……(6) と定義できる。以後、パターン間の距離は式(6)に
よるものとする。第３図ｃの拘束条件のもとに式
(6)を求める場合には次の漸化式(7)を計算すればよ
い。ｇ（ｉ，ｊ）＝ｄ（ｉ，ｊ）＋minｇ（ｉ−
１，ｊ）〔ｇ（ｉ−１，ｊ−１）ｇ（ｉ−１，ｊ−２）〕 ……(7) 初期条件ｇ（１，１）＝ｄ（１，１）次に連続単語音声の認識について説明する。連
続単語音声認識は次のように定式化できる。い
ま、Ｘ個の単語ｑ(1)，ｑ(2)，…ｑ（ｘ）を連続し
て発声したときの音声パターンをＡで表わす。Ａ＝a₁，a₂…ai…a₁ ……(8) 単語ｑ（ｘ）の標準パターンを B_q(x)＝b₁ ^q(x)b₂ ^q(x)…b^q(x) _j…b^q(x) _Jq(x) ……(9) とするとき、Ｘ個の単語B_q(1)，B_q(2)，…B_q(x)を接
続して得らたる標準パターンは＝B_q(1)B_q(2)…B_q(x) ＝b₁ ^q(1)b₂ ^q(1)…b^q(1) _Jq(1)，b₁ ^q(2)b₂ ^q(2)…b^q(2) _jq(
2)…b₁ ^q(x)
b₂ ^q(x)b^q(x) _jq(x) ……(10) で表わされる。ここではパターンの接続を表わ
す。そこで連続単語音声認識は、このと入力音声
パターンＡとの間でDPマツチングを実行し、そ
の際得られるＤ（Ａ，）が最小になるように、
Ｘとｑ（ｘ）（ｘ＝１，２，…，ｘ）を決めるとい
う問題になる。すなわち、Ｔ＝^min _X,q(x)〔Ｄ（Ａ，B_q(1)B_q(2)…B_q(x)〕
…(11) を計算し、Ｔが最小になる条件を求めればよい。
式(11)の計算をまともに実行しようとすると、膨大
な計算量が必要となる。すなわち、入力音声パタ
−ンにおいて連続発声の単語数の最大値をｋ、単
語標準パターンの数をＮとすれば、N^k回の計算
を実行することになる。そこで、実際にはこの問
題を次の漸化式を解く問題に帰着させている。入力音声パタ−ンＡにおいて、ｉ＝ｌ＋１から
ｉ＝ｍまでの部分区間を、部分パターンＡ（ｌ，
ｍ）で定義する。Ａ（ｌ，ｍ）＝a_l+1a_l+2…a_n ……(12) このとき、式(6)によりパターン間の距離を定義
すれば次のことが言える。Ｄ（Ａ，B₁B₂）＝min ｍ〔Ｄ（Ａ（ｏ，ｍ），B₁）＋Ｄ（Ａ（ｍ，Ｉ），B₂）〕 ……（13）このことを用いれば式(11)は次のように解ける。ここで以後用いる記号の意味を第１表にまとめ
て示す。

【表】入力単語数Ｘが既知の場合 D_x(i)＝min ｎ，ｍ〔D_x-1（ｍ）＋D₀ ⁿ（ｍ＋１：ｉ）〕 ……（14） N_x(i)＝ｎ，B_x(i)＝ｍ（n^，m^は式（14）を満たすｎとｍ）なる漸化式の解を求めれば、認識結果は第４図に
示すフローチヤートにより、Ｘ単語列の最後尾単
語名とセグメンテーシヨン結果から先頭単語名と
セグメンテーシヨン結果まで順次求まる。入力単語数Ｘが末知の場合Ｄ(i)＝min ｎ，ｍ，ｘ〔D_x（ｍ）＋D₀ ⁿ（ｍ＋１：ｉ）〕＝min〔Ｄ（ｍ）＋D₀ ⁿ（ｍ＋１：ｉ）〕
……（15）Ｎ(i)＝ｎ，Ｂ(i)＝ｍ（ｎ，ｍは式（15）を満さすｎとｍ）なる漸化式の解から第５図のフローチヤートによ
り認識結果が求まる。式（14），式（15）の計算において、問題とする
ところは (イ) 計算量が少いこと。 (ロ) 必要とする記憶容量がなるべく少いこと。 (ハ) 実時間向きアルゴリズムであること。である。(イ)に関し、解を求めるための主な計算
は、主にDⁿ ₀（ｓ：ｔ）とこれを求めるために必要
なdⁿ（ｉ，ｊ）である。特に、各レームは、通常
10次元以上のパラメータで表現されるものであ
り、この計算量をいかに減らすかが問題となる。次に、この計算方法として従来行われている２
段DP法について説明する。２段DP法は、先ずDⁿ ₀（ｓ：ｔ）をあらゆるｓ，
ｔの組合せに対してDPで求めておき、その後Ｄ
(i)をDPで求める方法で、DPを２段にしているの
が特徴である。この２段DP法としては前向きア
ルゴリズムと後向きアルゴリズムが提案されてい
るが、ここでは後向きアルゴリズムについて説明
する。入力パターンのフレームｉ−１に対して、Ｄ
（ｉ−１），Ｎ（ｉ−１），Ｂ（ｉ−１）は求まつ
ているとする。単語ｎ（ｎ＝１，２，…，Ｎ）の標準パター
ンと入力パターンを、i₀を始点として逆時間向
きにDPマツチングする。従つて、径路の拘束
条件は第３図ｃ、ｄ、ｅ、ｆに対応して、第７
図ａ、ｂ、ｃ、ｄとなる。マツチング範囲は、
整合窓幅Ｒで行うことも考えられるが、ここで
は傾き1/2〜２の範囲（傾斜制限内、第６図の
斜線部）で行うものとする。このマツチングを
終端フリーとして行う、その結果、Dⁿ ₀（ｓ：
ｉ）が求まる。ただし、ｉ−2Jⁿ＋１ｓｉ
−（1/2）Jⁿである。式（15）のＤ(i)，Ｎ(i)，Ｂ(i)を求める。ｉ＝ｉ＋１としてへもどる。この方法は、入力フレーム毎に各単語につきマ
ツチング範囲内で、フレーム間距離ｄと累積距離
Ｄを計算する必要がある。このため全体の計算回
数はフレーム間距離ｄ、累積距離Ｄ共にＮ・Ｉ・
３／４J²となる（整合窓幅ＲのときはＮ・Ｉ・Ｊ・
Ｒ）。以上が２段DPマツチング法であるが、この方
法の欠点はまだ計算回数が多いという点である。
その理由は各入力フレーム毎に各単語について3/
４J²回、ｄとＤを計算するためである。一方、最
も安易な計算回数の低減化方法は、一度計算した
ｄの値を必要がなくなるまですべて保存しておく
方法である。しかし、この方法であるとｄの計算
量はＮ・Ｉ・Ｊとなるが、この計算のために必要
な記憶量はかなり大きいものになる。しかもこの
方法であると、ｄの計算結果の記憶アドレスを入
力フレーム毎に変更する必要がある。本発明は以上の欠点を除去し、入力パターンと
標準パターンを比較する際に必要な計算量を、記
憶量をそれほど増すことなく大幅に減少し、計算
速度の速いパターン比較装置を提供することを目
的とする。この目的を達成するために本発明は、一定時間
毎に２段DP法の後向きアルゴリズムをまとめて
行うようにしたもので、以下、第８図を用いて本
発明の原理について説明する。第８図において、斜線部分は一回にｄを計算す
る領域（以下、領域Ａという）を示している。こ
の領域Ａは第６図において示した斜線部分の領域
（以下、領域Ｂという）にＷ×Ｊの領域（以下、
領域Ｃという）を付加したものになつている。Ｗ
はフレーム数であり、ｄの計算は以後、Ｗフレー
ムづつずらして行われる。こうすると、ｄの計算量は、Ｗフレーム毎に平
均J²＋Ｗ／２Ｊで済み、これを入力パターンのレーム数Ｉに対し、Ｉ／Ｗ回行うので、結局ｄの全体
の計算量はＮ・Ｉ・Ｊ（1/2＋Ｊ／Ｗ）となる。以下、上記原理を用いた本発明の実施例につい
て図面とともに説明する。第９図は本発明のパターン比較装置を音声認識
装置に適用した場合の一実施例を示すブロツク図
である。図において、１は音声信号の入力端子、２は連
続単語の入力音声信号を特徴ベクトルの系列に変
換し、入力パターンＡ＝a₁，a₂…a_Iとして出力す
る音響分析部である。この音響分析部２より出力
される入力パターンの長さをＩとする。すなわち
入力パターンはＩ個のフレームからなる。３は認
識すべき単語（単語数Ｎ）が特徴ベクトルの系列
Bⁿ＝b₁ ⁿb₂ ⁿ…bⁿ _Joとして記憶されている標準パター
ン記憶部で、この記憶内容は入力パターンとのフ
レーム間距離を計算する際に標準パターンとして
読み出される。この音響分析部２および標準パタ
ーン記憶部３は、第１図において示したものと同
様のものである。７はDPマツチング部で、標準パターンの特徴
ベクトルbⁿ _jと入力パターンの特徴ベクトルa₁との
フレーム間距離dⁿ（ｉ，ｊ）を計算するフレーム
間距離計算部７ａと、このフレーム間距離dⁿ（ｉ，
ｊ）を記憶するフレーム間距離記憶部７ｂと、こ
のフレーム間距離記憶部７ｂに記憶されているフ
レーム間距離dⁿ（ｉ，ｊ）を用いて単語ｎとフレ
ームi′〜ｉの入力パターンとの部分距離Dⁿ ₀（i′：
ｉ）を計算する部分距離計算部７ｃより構成され
る。８はDPマツチング部７におけるフレーム間距
離計算部７ａおよび部分距離計算部７ｃにマツチ
ングの開始フレーム情報を与えるマツチング開始
フレーム設定部で、開始フレームi₀は初期値が１
であり、以後、Ｗ＋１，2W＋１，…とＷフレー
ム毎の値が設定される。９は部分距離計算部７ｃで計算された部分距離
Dⁿ ₀（i′：ｉ）を記憶する部分距離記憶部である。
ただし、ｎ＝１，２，…，Ｎ，ｉ＝i₀，i₀＋１，
…，i₀＋Ｗ−１，i′はｉ−2Jⁿ＋１i′ｉ−1/2Jⁿ
の範囲である。１０は部分距離記憶部９に記憶されている部分
距離から、入力パターンのフレームｉで終端する
単語列の最小累積距離Ｄ(i)を、ｉ＝i₀，i₀＋１，
…，i₀＋Ｗ−１について求めるとともに、このＤ
(i)を与えるフレームｉで終端する単語列の最後尾
単語Ｎ(i)と、この単語Ｎ(i)の始端フレームより１
を減じたフレームを示すＢ(i)を計算する累積距離
計算部である。１１は累積距離計算部１０で計算されたＤ(i)，
Ｎ(i)，Ｂ(i)を記憶する累積距離情報記憶部であ
る。ただし、ｉ＝i₀，i₀＋１，…，i₀＋Ｗ−ｉ，i₀
＝１，Ｗ＋１，2W＋１，…，LW＋１であり、
Ｌ＝〔（Ｉ−１）／Ｗ〕である。なお〔Ｘ〕はＸの
整数部分を示す。１２は入力パターンの最終フレームＩまでの累
積距離の計算が終了した時点で、入力された連続
単語の単語境界を示すバツクポインタＢ（），Ｂ
（Ｂ（）），…，Ｂ（Ｂ（（…Ｂ（Ｂ（））…））
），０
を最終フレームの方から逆順に求めるセグメンテ
ーシヨン部である。１３はセグメンテーシヨン部１２で求められた
バクポインタをもとに当該境界フレームで終端す
る単語を順次累積距離情報記憶部１１から読み出
し、認識単語とする単語決定部である。以下、本実施例の動作について第８図、第９図
を用いて説明する。フレーム間距離計算部７ａは音響分析部２より
入力パターンが出力されると標準パターンの特徴
ベクトルと入力パターンの特徴ベクトルのフレー
ム間距離dⁿ（ｉ，ｊ）の計算を開始する。この計
算を行う範囲は、第８図において示される斜線部
分の領域Ａであり、この領域Ａは、マツチング開
始フレーム設定部８により開始フレームi₀ば１，
Ｗ＋１，…とＷの幅づつ順次変えられるごとにＷ
の幅で移動する。フレーム間距離dⁿ（ｉ，ｊ），部分距離Dⁿ ₀（i′：
ｉ）、最小累積距離Ｄ(i)の計算は、領域Ａ毎に同
じ手順で計算されるので、説明の簡略化のために
以下、開始フレームi₀についてのみ説明する。フレーム間距離dⁿ（ｉ，ｄ）は、標準パターン
記憶部３に記憶されているＮ個の単語に対し、順
次計算される。この計算は領域Ａ内について行わ
れる。なお領域Ａは標準パターン長Jⁿにより変化
する。例えば、１番目の単語（ｎ＝１）に対して
は、点（i₀，Jⁱ）、点（i₀−2J′＋１，１），点（i₀
＋Ｗ−ｉ，J¹）、点（i₀＋Ｗ−1/2J¹，１）の４点
を結んだ領域A₁となる。従つて、ｎ＝１に対し
て、領域A₁内の各点におけるフレーム間距離d¹
（ｉ，ｊ）が計算される。以下、同様にｎ＝２，
ｎ＝３，…，ｎ＝Ｎについて、フレーム間距離d²
（ｉ，ｊ），d³（ｉ，ｊ），…，d^N（ｉ，ｊ）が計算
される。なお、dⁿ（ｉ，ｊ）の計算はDⁿ ₀（i′：ｉ）
の計算と交互に行う。すなわち、ｎ＝１について
フレーム間距離d¹（ｉ，ｊ）の計算が終了すると、
次に部分距離D₀ ¹（i′：ｊ）の計算を行う。部分距離D₀ ¹（i′：ｊ）の計算は、先に求めたフ
レーム間距離d¹（ｉ：ｊ）を基にして行われる。
すなわち部分距離は、始点ｉ＝i₀，ｊ＝J¹より、
領域A₁内で、かつ第７図ａに示す拘束条件の下
で順次経路が選択され選択された経路上の点のフ
レーム間距離の利として求められる。前記拘束条
件上の３つの経路のうちどれを選択するかは、当
該点に到る一つ前の点における、それまでの経路
上のフレーム間距離の和が最小となる経路が選択
される。以上のようにして、始点ｉ＝i₀，ｊ＝J¹
より、終点ｉ＝j′，ｊ＝１までに到る経路が決定
され、部分距離D₀ ¹（i′：i₀）が求められる。なお、
i′はi₀−2J¹＋１i′i₀−1/2J¹の範囲値となる。この（i₀，J¹）を始点としたときの部分距離
D₀ ¹（i′：i₀）は、部分距離記憶部９に記憶される。以下、同様に（i₀＋ｉ，J₁），（i₀＋２，J₁），…
（i₀＋Ｗ−１）を始点とした部分距離D₀ ¹（i′：i₀＋
1D₀ ¹（i′：i₀＋２），…，D₀ ¹（i′：i₀＋Ｗ−１）を
計
算し、部分距離記憶部９に記憶させる。次に２番目の単語（ｎ＝２）について、同様に
フレーム間距離d²（ｉ，ｊ）を計算するとともに
部分距離D₀ ²（i′：ｉ）の計算を行う。以下、Ｎ番
目の単語（ｎ＝Ｎ）まで同様に計算するとともに
部分距離D₀ ²（i′：ｉ），…，D₀ ^N（i′：ｉ）を部分距
離記憶部９に記憶する。次に入力パターンのフレームｉで終端する単語
列の最小累積距離Ｄ(i)は、部分距離記憶部９に記
憶されている部分距離Dⁿ ₀（i′：ｉ）を用いて、累
積距離計算部１０において求められる。すなわち
累積距離計算部１０おいては、フレームi′〜ｉの
入力パターンと単語ｎの標準パターンとの部分距
離Dⁿ ₀（i′：ｉ）と、入力パターンのフレームi′−１
で終端する単語列の最小累積距離Ｄ（i′：１）と
の和を求めるとともに前記和のｎおよびi′に関し
て最小となる累積距離Ｄ(i)を求める。累積距離計
算部１０は前記Ｄ(i)を入力パターンのフレームｉ
で終端する単語例の最小累積距離として累積距離
情報記憶部１１に記憶させる。また累積距離計算
部１０は、前記Ｄ(i)を求めたときのｎ，ｉをそれ
ぞれｎ，i′とするとき、Ｎ(i)＝ｎ，Ｂ(i)＝i′−１
として、この認識候補単語Ｎ(i)、単語境界を示す
バツクポインタＢ(i)をＤ(i)とともに累積距離情報
記憶部１１に記憶さする。 DPマツチング部７および累積距離計算部１０
における以上の処理は、マツチング開始フレーム
設定部８により開始フレームi₀が変えられるごと
に繰り返される。マツチング開始フレーム設定部８により入力パ
ターンの最終フレームＩに相当する開始フレーム
が設定され、この開始フレームにより定まる領域
Ａについて累積距離計算部１０でＤ(i)、Ｎ(i)、Ｂ
(i)が求められ累積距離記憶部１１に記憶された
後、セグメンテーシヨン部１２で入力単語列の単
語境界を定める処理が行われる。この処理は、ま
ずフレームＩにおけるＢ(i)すなわちＢ（Ｉ）を累
積距離情報記憶部１１から読み出し、次にその読
み出したＢ（）の値をもとにフレームＢ（）に
おけるＢ(i)すなわちＢ（Ｂ（））を累積距離情報
記憶部１１から読み出す。以下、同様に読み出し
たＢ(i)の値をもとに順次単語境界として、Ｂ（Ｂ
（Ｂ（）），…，Ｂ（Ｂ（Ｂ（…Ｂ（Ｂ（））…）
）），
０が読み出される。なお０は入力パターンの入力
開始フレームの１つ手前のフレームということで
ある。以上のようにセグメンテーシヨン部１２に
より読み出されたＢ(i)は単語決定部１３に入力さ
れる。単語決定部１３は、このＢ(i)を基に累積距
離情報記憶部１１からＮ(i)を読み出す。すなわち
最初は最終フレームＩで終端する単語Ｎ（）を、
次はＢ（）フレームで終端する単語Ｎ（Ｂ（））
を、以下、同様に、Ｎ（Ｂ（Ｂ（））），…Ｎ（Ｂ（
Ｂ
（Ｂ（…Ｂ（Ｂ（））…））））を読み出す。この読
み
出された単語Ｎ(i)が端子６より認識結果として出
力される。第１０図は第９図に示した装置の機能をソフト
ウエアで実現する場合のフローチヤートを示して
いる。図において、ステツプ１００〜ステツプ１０２
は最小累積距離の初期値設定を行う部分である。
ステツプ１０５〜ステツプ１０７はフレーム間距
離を求める部分、ステツプ１０８〜ステツプ１１
４は部分距離を求める部分、ステツプ１０４はこ
れらをすべての単語について行うことを示してい
る。ステツプ１１５〜ステツプ１１６は最小累積
距離、認識単語、単語境界を求める部分であり、
ステツプ１０３は、ステツプ１０４〜ステツプ１
１６をＷフレーム毎に繰り返し行うことを示して
いる。ステツプ１１７〜ステツプ１２０は最終フ
レームＩまでの認識単語、単語境界が求まつた
後、最終フレームより逆順に単語境界、認識単語
を決定する部分である。第１１図は入力単語数が既知（Ｘ）の場合の実
施例についてソフトウエアで実現したときのフロ
ーチヤートを示している。その各ステツプは第１０図に示した入力単語数
が末知の場合とほとんど同じである。違いは、累
積距離を求める際に、そのフレームに到るまでの
入力単語の個数を仮定し、各単語数について累積
距離D_x(i)を求めるとともに、認識単語N_x(i)，単
語境界B_x(i)を求める点である。この場合、計算
量はＸの値に応じて増加する認識精度は向上す
る。第９図において示した実施例においては、Ｄ(i)
は、ｎ＝１〜Ｎのすべてに対するDⁿ ₀（i′：ｉ）を
計算したのちに求めたが、各ｎ毎に求めるように
しても良い。このようにした場合の実施例につい
てソフトウエアで実現したときのフローチヤート
を第１２図に示す。このフローチヤートにおい
て、第１０図のフローチヤートと異なるのはステ
ツプ１１５′および１１６′である。このようにス
テツプを変えることにより、累積距離Ｄ(i)を計算
するために必要な部分距離Dⁿ ₀（ｉ：ｉ）を記憶し
ておくためのメモリーを大幅に減らすことができ
る。また第９図に示した実施例において、累積距離
記憶部１１に記憶される認識候補単語Ｎ(i)として
は、最小累積距離Ｄ(i)に対応するもののみであつ
たが、最小累積距離Ｄ(i)の次に小さい累積距離
（以下、次最小累積距離という）に対応する認識
候補単語（以下、次認識候補単語N′(i)という）
をも累積距離情報記憶部１１に記憶させるように
してもよい。この場合、単語決定部１３として
は、累積距離情報記憶部１１から読み出されるＮ
(i)，N′(i)を基に各種の認識単語列を認識結果と
して出力することになる。認識単語列としては、
Ｎ(i)のみを用いたもの（第９図の実施例における
認識結果と同じ）、Ｎ(i)の単語列のうちの単語１
個をN′(i)で置換したもの、単語２個を置換した
ものなど種々考えられる。この場合、単語決定部
としては、例えばＮ(i)、N′(i)を記憶する記憶部
と、この記憶部から選択的にＮ(i)、N′(i)を読み
思す選択読出部とで構成できる。またマツチング計算を行う範囲としては第８図
に示す領域Ａとしたが、この領域Ａのうち領域Ｂ
に相当する部分を、第６図の破線で囲またた幅Ｒ
の領域との論理積をとつた領域（以下、領域
B′という）とし、新しい領域Ａとして、領域
B′をＷフレームずらして得られる領域としても
よい。このような領域の設定は必要とする認識精度、
計算速度などを考慮して行う。ところで、マツチ
ング計算の始端をフレームi₀とすると、その終端
フレームは、標準パターン長J_oに相当するフレー
ム長だけ始端フレームi₀より戻つた付近が最も終
端フレームの位置として妥当と考えられ、領域Ａ
の設定もこれらをもとに行われる。従つて、終端
フレームの位置は一般に標準パターン長Jⁿの凾数
として与えられる。すなわち始端フレームをi₀、
終端フレームをi′とすると、i₀＋R₁（Jⁿ）i′i₀
＋R₂（Jⁿ）となる。領域Ａにおいては始端は開始フレームi₀からフ
レームi₀＋Ｗ−１の範囲で変化するので終端i′は、
i₀＋R₁（Jⁿ）i′i₀＋R₂（Jⁿ）＋Ｗとなる。以上のように本発明のパターン比較装置はマツ
チング計算の開始フレームi₀をＷフレーム毎に設
定し、Ｗフレーム毎に定まるパターン比較領域に
ついてｄ（ｉ，ｊ）の計算をまとめて行うように
構成したので、従来の２段DP法を用いたパター
ン比較装置に較べ、フレーム間距離ｄ（ｉ，ｊ）
の計算回数を大幅に減少させることができる。例
えばＪ＝30、Ｗ＝10の場合、 3/4NIJ²／NIJ（1/2＋Ｊ／Ｗ）＝3/4Ｊ／（1/2＋Ｊ／Ｗ）≒6.4 となり、計算回数は約６分の１となる。一方、記
憶量としては、（3/4J²＋WJ）／3/4J² ＝１＋3/4・Ｗ／Ｊ≒1.4 となり４割増加するだけである。

【図面の簡単な説明】

第１図は従来の音声認識装置のブロツク図、第
２図はパターンＡ、Ｂの特徴ベクトルの対応関係
を示す図、第３図ａ〜ｆはｉ−ｊ平面上の格子点
を選ぶ際の拘束条件例を示す図、第４図および第
５図はそれぞれ入力単語数が既知の場合、未知の
場合の連続単語音声認識におけるセグメンテーシ
ヨンおよび認識単語の決定手順を示すフローチヤ
ート、第６図は２段DP法の後向きアルゴリズム
の説明図、第７図ａ〜ｄはｉ−ｊ平面上の格子点
を選ぶ際の拘束条件例を示す図、第８図は本発明
の原理説明図、第９図は本発明の一実施例のブロ
ツク図、第１０図は同実施例装置の機能を実現し
たソフトウエアのフローチヤート、第１１図、第
１２図は同じく他の実施例におけるフローチヤー
トである。１…音響分析部、３…標準パターン記憶部、７
…DPマツチング部、７ａ…フレーム間距離計算
部、７ｂ…フレーム間距離記憶部、７ｃ…部分距
離計算部、８…マツチング開始フレーム設定部、
９…部分距離記憶部、１０…累積距離計算部、１
１…累積距離情報記憶部、１２…セグメンテーシ
ヨン部、１３…単語決定部。

Claims

【特許請求の範囲】

１連続パターン入力信号を特徴ベクトルa_iの時
系列Ａ＝a₁，a₂…a_Iに変換する特徴抽出手段と、
標準パターンBⁿ＝bⁿ ₁，bⁿ ₂…bⁿJn（ｎ＝１，２，
…，Ｎ）を記憶する標準パターン記憶手段と、Jⁿ
のｎに関する最小値をJmin、横軸を入力パター
ン、縦軸を標準パターンとする格子グラフにおい
て、マツチング径路の最大傾斜をS_nax、最小傾斜
をS_nioとするとき、Ｗ≦J_nio／S_naxなるＷに対し、
前記時系列Ａに対しマツチング計算の開始フレー
ムi₀をＷフレーム毎に設定するマツチング開始フ
レーム設定手段と、高々前記格子グラフにおける
点（i_p，Jⁿ）、（i_p＋Ｗ−１，Jⁿ）、（i_p＋Ｗ−１，
１）、（i_p−Jⁿ／S_nio，１）で囲まれる台形内の格
子点に対してのみ標準パターンおよび入力パター
ンの特徴ベクトルのフレーム間距離dⁿ（ｉ，ｊ）
を前記開始フレームi_pが設定される毎に計算する
フレーム間距離計算手段と、該フレーム間距離計
算手段により計算されたフレーム間距離dⁿ（ｉ，
ｊ）を記憶するフレーム間距離記憶手段と、該フ
レーム間距離記憶手段に記憶されているフレーム
間距離を読み出し、フレームｉを始端とし、フー
レムi′を終端とする部分入力パターンと標準パタ
ーンBⁿとの部分距離Dⁿｏ（i′：ｉ）をｉ＝ioから
ｉ＝io＋Ｗ−１まで始端ｉを変化させて動的計画
法により計算する部分距離計算手段と、該部分距
離Dⁿｏ（i′：ｉ）を記憶する部分距離記憶手段と、
フレーi′−１までの累積距離Ｄ（I′−１）と前記部
分距離Dⁿｏ（i′：ｉ）の和をi′，ｎについて最小化
し、その結果フレームｉまでの累積距離Ｄ(i)を求
める累積距離計算手段と、前記累積距離Ｄ(i)と累
積距離Ｄ(i)を求める際に用いた前記ｎおよびi′に
対してＮ(i)＝ｎおよびＢ(i)＝i′−１とを記憶する
累積距離情報記憶手段と、最終フレームＩまでの
累積距離の計算が完了したとき、前記累積距離情
報記憶手段に記憶されているＢ(i)からＢ（）、Ｂ
（Ｂ（）），…，Ｂ（Ｂ（…Ｂ（））…）、Ｏすな
わ
ち連続して入力されたパターンの境界を逆順に求
めるセグメンテーシヨン手段と、前記セグメンテ
ーシヨン手段により求められたＢ（），Ｂ（Ｂ
（）），…，Ｂ（Ｂ（…Ｂ（））…），Ｏを用い、
前
記累積距離情報記憶手段から認識パターンとし
て、Ｎ（），Ｎ（Ｂ（）），…，Ｎ（Ｂ（…Ｂ（
））
…），…を逆順に求めるパターン決定手段とを備
えたことを特徴とするパターン比較装置。