JPH0420197B2 - - Google Patents

Info

Publication number
JPH0420197B2
JPH0420197B2 JP56206351A JP20635181A JPH0420197B2 JP H0420197 B2 JPH0420197 B2 JP H0420197B2 JP 56206351 A JP56206351 A JP 56206351A JP 20635181 A JP20635181 A JP 20635181A JP H0420197 B2 JPH0420197 B2 JP H0420197B2
Authority
JP
Japan
Prior art keywords
distance
sequence
coordinates
matching
processing method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56206351A
Other languages
English (en)
Other versions
JPS58106599A (ja
Inventor
Kyohiro Kano
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP56206351A priority Critical patent/JPS58106599A/ja
Priority to US06/448,085 priority patent/US4570232A/en
Priority to FR8221431A priority patent/FR2518783A1/fr
Priority to DE19823247229 priority patent/DE3247229A1/de
Publication of JPS58106599A publication Critical patent/JPS58106599A/ja
Publication of JPH0420197B2 publication Critical patent/JPH0420197B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
(1) 発明の属する分野の説明 本発明は、系列パターン・マツチング処理方
法、特に例えば音声等の系列マツチングによるパ
ターン認識装置の主要構成部分であるパターン・
マツチング処理方法に関するものである。 (2) 従来技術の説明 本発明による系列パターン・マツチング処理方
法で取り扱える系列は、系列データであれば、何
でもよいが、以下では、代表的な系列の例として
音声の時系列を対象とする系列パターン・マツチ
ング方法について説明する。 音声は人間にとつて最も容易に使いうる情報伝
達の手段であり、音声認識装置の実用化により、
音声によるデータ入力、機械との対話、音声によ
るダイアル等、数多くの分野での応用がある。 音声認識における動的計画法を利用したマツチ
ング(以下、DPマツチングと略す)は、入力音
声の時系列〓=a1a2…aoと標準パターンの特徴ベ
クトルの時系列〓=b1b2…bnとの間で時間軸の伸
縮を許して、要素間の対応づけを行い、系列間距
離を計算する際に用いられる。 従来、この種の動的計画法では、系列〓、〓の
要素間の距離マトリツクス〓=(dij)(dijはaiとbj
の距離)上で、第1図Aのような窓制限11内の
すべての格子点(i,j)でDPマツチングのく
り返し逐次計算を実行するためや、1つの要素を
2つ以上の要素に対応ずけるのを防ぐための制限
(傾斜制限)12のために多大な計算量を有する
という欠点や、DPマツチングの際の第1図B図
示の如き逐次計算値g(i,j)の記憶のためバ
ツフアメモリ13が大となるとする欠点をもつて
いた。即ち、従来の場合の手法においては、 (1) バスの傾斜に関する制限を例えば第1図A図
示の点線の如く与えた上で、当該範囲内のすべ
ての可能なバスを探すようにしている。換言す
れば、第1図A図示点線内のすべての格子点で
DP計算を行うことで、精密化をはかり、 (2) しかし、一方では、後述するように、斜めの
バスに対しては、縦や横のバスにくらべて大き
い重みをつける必要がある。換言すればバスの
比較に当つて公平が保たれていないという問題
をはらんでいる。 (3) 本発明の目的 本発明は、上記の欠点を大幅に除去するもので
あり、DPマツチングの逐次計算のくり返し計算
を3点ごとの格子点のみで行うために、計算のく
り返し回数が1/3に、かつ、傾斜制限のための1
回分の逐次計算の計算量も1/2以下にすることが
でき、かつ、g(i,j)の記憶のためのバツフ
アメモリも窓制限幅の2倍だけしか必要としない
という特徴を有している。よつて、従来からの
DPマツチング(例えば昭和55年10月 日本音響
学会秋期発表会講演論文集1−1−10に示すDP
マツチング)と比較して、計算量で1/6以下にす
ることが可能となる。即ち、間引いたバス計算を
行うという意味で簡略化をはかりながら、バスの
比較において従来の場合よりもより厳密に(同等
性を与えて)比較を行うようにすることとなる。 (4) 発明の構成および作用の説明 第2図は、本発明の一実施例であつて、1は入
力音声、2は特徴パラメータの抽出部、3は入力
音声の特徴パタメータ時系列〓=a1a2…ao、4は
あらかじめ蓄えられている標準パターンの特徴パ
ラメータの時系列〓=b1b2…bn、5は入力音声の
時系列〓=a1a2…aoと標準パターンの特徴パラメ
ータの時系列〓=b1b2…bnとの間の距離マトリツ
クス〓=(dij)を計算する距離計算部、6は距離
マトリツクス、7は本発明によるDPマツチング
部、8はマツチングスコア、9は最小のスコアの
単語を決定する単語決定部、10は単語名であ
る。 動的計画法は、第1図図示のような距離マトリ
ツクス〓=(dij)上で、始端(1,1)から終端
(n,m)まで格子点(i,j)の上をたどつて、
そのときの距離dijの和が最小になるときのスコア
を求めるものであり、例えば次の式のように表わ
される。
【表】 (1)
{ただし、{(i,j)}は(i1,j1)(i2,j2)…
(n,m)の系列を表わし、 |ik+1−ik|+|jk+1−jk|=1 (2) であり、最小値を与えるパスを最適パスと呼ぶ。} これは連続系で表わすと、距離関数d(x,y)
上で、(0,0)の点から(n,m)の点までの
もつとも小さい積分値を求める問題の近似解であ
る。
【表】 {ただし、cは(0,0)から(n,m)への単
調増加な積分路。} 距離マトリツクス上での最適パスには、通常次
の制約、がつけられている。 () パスのたどり方 通常、パス(1,1)(i1,j1)(i2,j2)…
(n,m)は(2)式のように、市街化距離が1に
なるようなパスが選ばれるか、あるいは、 max{|ik+1−ik|,|jk+1−jk|}=1 (4) になるようなパスが選ばれている。よつて、格
子点上で進むパスは、第3図図示矢印のような
パス14である。縦、横の長さのパスを「1」と
すると、斜めのパスは長さが「2」とされてい
る。実際の斜めの長さは、縦あるいは横の長さ
を「1」とすると√2であり、(3)式の連続系と
は、大幅な違いをもつことになつてしまう。 () 傾斜制限 極端にかたよつたマツチングを阻止するため
に、第4図のような傾斜制限をもつたパス15が
用いられる。この傾斜制限パスは、認識性能の
向上には寄与しているが、計算量を増大させて
いる。 本発明は、DPマツチングの()の縦・横の
パスの長さと斜めのパスの長さの違いの矛盾を軽
減し、()の傾斜制限を、計算量を増大させる
ことなく実現する手段に関してである。以下、詳
しく説明する。 傾斜制限を距離マトリツクス上で、自然に実現
するために、第5図のような例えば3点おきにず
らした格子点16を考える。すると第6図のよう
に、ずらした格子点間をひし形のパスで結ぶこと
ができ、すべてのパスの長さが等しくなる。よつ
て、()のパスの長さの矛盾が緩和される。ま
た、()のパスの傾斜制限も第6図のように自
然に導入できる。しかも、DPマツチングのくり
返し逐次計算は、3点おきに行えばよく、従来か
らのものに比べて1/3の段数になる。さらに、逐
次計算値g(i,j)を格納するバツフアメモリ
13も少なくてすむ。つまり、DPマツチングの
くり返し逐次計算を第7図のように、i+j=3l
+2を満す格子点(i,j)上で、l=0、1、
2、…の順序で行うとき、各段の格子点の数
(r)の2倍の第7図のようなバツフアメモリg
(−r)〜g(r)を用意すれば十分である。 以下、各格子点(i,j)でのくり返し逐次計
算を示す。ただし、格子点(i,j)に対応する
逐次計算値のバツフアメモリをg(p)とする。 (方法) g(p)=min{g(p−1),g(p+1)}+dij
(5) これは、第6図のパスを終端の点(i,j)の
dijで代用していることになる。(3)式の積分値によ
り近づけるためには、パスの近くの他の点の距離
の値も用いることにして、次の方法、方法が
考えられる。
【表】 (5)〜(6)式で、pの値は、p=j−iで決定され
る。方法の計算式は第1図図示のDPマツチン
グの式に比べて、1段当りの計算式の計算量は1/
4以下であり、DPマツチング全体では1/12以下と
なる。方法、は、第1図図示のDPマツチン
グの式に比べて、1段当りの計算量は1/2以下で
あり、全体では1/6以下になつている。 以上述べた方法〜方法のDPマツチングの
有効性を調べるために、従来からの第1図のDP
マツチング(従来の方法と呼ぶ)との処理時間お
よび認識性能の比較を行つた。認識対象は、男性
4名が2回ずつ発声した641都市名単語音声デー
タである。単語認識の方法としては昭和55年10月
日本音響学会秋期発表会講演論文集1−1−17
に示すSPLiT法を用いた。SPLiT法では、計算
量のほとんどがDPマツチング部についやされて
いる。 まず、処理時間の比較を行う。従来の方法で
641単語×64単語の認識実験をミニコンP.E.3240
で行つた場合、約8時間かかつた。同じ条件で方
法は、約60分、方法、は約70分であつた。
SPLiT法の計算量が全体で1/8近くになつている
ことがわかる。 次に、方法、方法の認識性能の評価を4人
の発声者の音声データを用いて行つた。従来の方
法では、4人の平均で96.3%の認識率が得られて
いる。方法では、94.7%、方法では、95.6%
の認識率が得られた。方法は、方法とほぼ同
じ性能である。認識性能で従来の方法より、若干
下まわるものの、かなり高い認識率が得られるこ
とが確かめられた。 以上の説明では、要素間の距離をもとにDPマ
ツチングの手法を述べてきたが、要素間の類似度
に対しても同様に定式化できる。 また、本発明では、DPマツチングのくり返し
逐次計算を3点おき、つまりi+j=3l+2の上
の点(i,j)のみで行うことを述べたが、Q点
おき、つまり、i+j=Q・l+2(ただし、Q
=5、7、9、…)の上の点(i,j)のみで行
うことにしても、さらに計算量が少なく、しか
も、傾斜制限の強いくり返し逐次計算を行なうこ
とができる。 (5) 効果の説明 以上述べたように、本発明によれば、従来の
DPマツチングの計算量に比らべ、1/6〜1/12以下
の計算量で、処理の厳密性を保ちつつ、DPマツ
チングを実行することができ、かつ、比較的高い
認識性能も達成することができる。また、DPマ
ツチングによる単語音声認識装置の簡易化が可能
である。更に、その他の分野での系列の非線形伸
縮マツチングにも本発明を用いることができるこ
とは言うまでもない。
【図面の簡単な説明】
第1図は、従来からのDPマツチングの例と距
離マトリツクスを示したもので、第2図は単語音
声認識システムの一実施例、第3図はDPマツチ
ングにおける縦、横、斜めのパスを表わす説明
図、第4図は代表的な傾斜制限パスを表わす説明
図、第5図は、本発明で考える3点おきにずらし
た距離マトリツクス上の格子点を表わす説明図、
第6図は本発明で考える長さが等しく、かつ、傾
斜制限のつけられたDPマツチングのパスを表わ
す説明図、第7図は本発明でのDPマツチングの
逐次計算値を蓄えるバツフアメモリについて説明
する説明図を示す。 図中、2は特徴パラメータ抽出部、4は標準パ
ターン、5は距離計算部、7はDPマツチング部、
9は単語決定部、13はバツフア・メモリ(又は
バツフアメモリ格納範囲)、17はパスを表わす。

Claims (1)

  1. 【特許請求の範囲】 1 2個の特徴パラメータの系列〓=a1,a2
    …,aoと〓=b1,b2,…,bnとの系列間の距離を
    動的計画法を用いた非線形正規化マツチングで求
    める系列パターン・マツチング処理方法におい
    て、系列の要素間の距離マトリクス〓=(dij)(但
    し、iは系列〓のi番目の要素aiを意味し、jは
    系列〓のj番目の要素bjを意味し、dijは要素ai
    要素bjとの距離を表わす)上のi+j=Q・l+
    c(但しQは3、cは正の整定数)に該当する点
    を抽出するとともに、該抽出された点について距
    離計算を行い、 座標(i、j)について、j−i=p 座標(i−1、j−2)について、(j−2)−
    (i−1)=j−i−1=p−1 座標(i−2、j−1)について、(j−1)−
    (i−2)=j−i+1=p+1 とおき、 該距離計算にあたつては動的計画法の繰り返し
    逐次演算の漸化式の値g(p)として、i+j=
    Q・(l−1)+cを満足する座標(i−1、j−
    2)上のg′(p−1)およびi+j=Q・(l−
    1)+cを満足する座標(i−2、j−1)上の
    g(p+1)を用いて、 g(p)=min{g(p−1)、g(p+1)}+dij の繰り返し逐次演算を、l=0、1、2、…の順
    序で逐次行なうことにより、系列間距離S(〓:
    〓)を計算することを特徴とする系列パターン・
    マツチング処理方法。 2 2個の特徴パラメータの系列〓=a1,a2
    …,aoと〓=b1,b2,…,bnとの系列間の距離を
    動的計画法を用いた非線形正規化マツチングで求
    める系列パターン・マツチング処理方法にあたつ
    ては、系列の要素間の距離マトリクス〓=(dij
    (但し、iは系列〓のi番目の要素aiを意味し、
    jは系列〓のj番目の要素bjを意味し、dijは要素
    aiと要素bjとの距離を表わす)上のi+j=Q・
    l+c(但しQは3、cは正の整定数)に該当す
    る点を抽出するとともに、該抽出された点につい
    て距離計算を行い、 座標(i、j)について、j−i=p 座標(i−1、j−2)について、(j−2)−
    (i−1)=j−i−1=p−1 座標(i−2、j−1)について、(j−1)−
    (i−2)=j−i+1=p+1 とおき、 該距離計算にあたつては動的計画法の繰り返し
    逐次演算の漸化式の値g(p)として、i+j=
    Q・(l−1)+cを満足する座標(i−1、j−
    2)上のg(p−1)およびi+j=Q・(l−
    1)+cを満足する座標(i−2、j−1)上の
    g(p+1)を用いて、 g(p)=min{g(p−1)+di,j-1, g(p+1)}+di-1,j}+di-1,j-1 の繰り返し逐次演算を、l=0、1、2、…の順
    序で逐次行なうことにより、系列間距離S(〓:
    〓)を計算することを特徴とする系列パターン・
    マツチング処理方法。 3 2個の特徴パラメータの系列〓=a1,a2
    …,aoと〓=b1,b2,…,bnとの系列間の距離を
    動的計画法を用いた非線形正規化マツチングで求
    める系列パターン・マツチング処理方法において
    は、系列の要素間の距離マトリクス〓=(dij)(但
    し、iは系列〓のi番目の要素aiを意味し、jは
    系列〓のj番目の要素bjを意味し、dijは要素ai
    要素bjとの距離を表わす)上のi+j=Q・l+
    c(但しQは3、cは正の整定数)に該当する点
    を抽出するとともに、該抽出された点について距
    離計算を行い、 座標(i、j)について、j−i=p 座標(i−1、j−2)について、(j−2)−
    (i−1)=j−i−1=p−1 座標(i−2、j−1)について、(j−1)−
    (i−2)=j−i+1=p+1 とおき、 該距離計算にあたつては動的計画法の繰り返し
    逐次演算の漸化式の値g(p)として、i+j=
    Q・(l−1)+cを満足する座標(i−1、j−
    2)上のg(p−1)およびi+j=Q・(l−
    1)+cを満足する座標(i−2、j−1)上の
    g(p+1)を用いて、 g(p)=min{g(p−1)+di,j-1, g(p+1)}+di-1,j}+dij の繰り返し逐次演算を、l=0、1、2、…の順
    序で逐次行なうことにより、系列間距離S(〓:
    〓)を計算することを特徴とする系列パターン・
    マツチング処理方法。
JP56206351A 1981-12-21 1981-12-21 系列パタ−ン・マツチング処理方法 Granted JPS58106599A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP56206351A JPS58106599A (ja) 1981-12-21 1981-12-21 系列パタ−ン・マツチング処理方法
US06/448,085 US4570232A (en) 1981-12-21 1982-12-09 Speech recognition apparatus
FR8221431A FR2518783A1 (fr) 1981-12-21 1982-12-21 Appareil pour realiser la comparaison de formes de sequences
DE19823247229 DE3247229A1 (de) 1981-12-21 1982-12-21 Anpasseinrichtung fuer sequenzmuster

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56206351A JPS58106599A (ja) 1981-12-21 1981-12-21 系列パタ−ン・マツチング処理方法

Publications (2)

Publication Number Publication Date
JPS58106599A JPS58106599A (ja) 1983-06-24
JPH0420197B2 true JPH0420197B2 (ja) 1992-03-31

Family

ID=16521866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56206351A Granted JPS58106599A (ja) 1981-12-21 1981-12-21 系列パタ−ン・マツチング処理方法

Country Status (1)

Country Link
JP (1) JPS58106599A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58120296A (ja) * 1982-01-11 1983-07-18 日本電信電話株式会社 系列パターン・マッチング方法
JPS58120295A (ja) * 1982-01-11 1983-07-18 日本電信電話株式会社 系列パターン・マッチング方法
CA3074822A1 (en) 2017-09-05 2019-03-14 Ihi Corporation Fluid machine

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5485639A (en) * 1977-12-20 1979-07-07 Nec Corp Pattern matching device

Also Published As

Publication number Publication date
JPS58106599A (ja) 1983-06-24

Similar Documents

Publication Publication Date Title
JP2595495B2 (ja) パタンマッチング装置
CN113591637B (zh) 对齐模型的训练方法、装置、计算机设备以及存储介质
JPS6360920B2 (ja)
JPH0420197B2 (ja)
JPS6360919B2 (ja)
EP4006775A1 (en) Method and device for object recognition
CN111860627A (zh) 一种特征对比方法、系统、设备以及介质
JP2003535376A (ja) 分類システムの反復訓練用の方法と装置
JPH07334187A (ja) 音声認識装置
JP3450522B2 (ja) 情報処理方法及び装置
JPH0247755B2 (ja)
CN114627342A (zh) 基于稀疏度的图像识别模型的训练方法、装置和设备
CN117633403B (zh) 一种辐射源目标稳健定位修正方法及装置
JPH0247754B2 (ja)
JP2518871B2 (ja) パタン比較器
JPS59195699A (ja) 単語音声認識装置
JPS60201398A (ja) 連続単語音声認識方式
JPS6237794B2 (ja)
JPH01121899A (ja) パタン比較器
JPS5936760B2 (ja) 非線形整合による認識方法
JPH022159B2 (ja)
JPS63188199A (ja) パタンマッチング装置
JPS6346496A (ja) 音声認識装置
JPS5830628B2 (ja) パタンルイジドケイサンソウチ
Denisov et al. Use of Internets-technologies for dynamic stochastic models identification