JPS592095A - パタ−ン比較装置 - Google Patents
パタ−ン比較装置Info
- Publication number
- JPS592095A JPS592095A JP57110531A JP11053182A JPS592095A JP S592095 A JPS592095 A JP S592095A JP 57110531 A JP57110531 A JP 57110531A JP 11053182 A JP11053182 A JP 11053182A JP S592095 A JPS592095 A JP S592095A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- pattern
- input
- distance
- cumulative distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001186 cumulative effect Effects 0.000 claims description 39
- 239000013598 vector Substances 0.000 claims description 34
- 238000004364 calculation method Methods 0.000 claims description 24
- 230000011218 segmentation Effects 0.000 claims description 8
- 235000008331 Pinus X rigitaeda Nutrition 0.000 claims 1
- 235000011613 Pinus brutia Nutrition 0.000 claims 1
- 241000018646 Pinus brutia Species 0.000 claims 1
- 108010076504 Protein Sorting Signals Proteins 0.000 claims 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims 1
- 239000010931 gold Substances 0.000 claims 1
- 229910052737 gold Inorganic materials 0.000 claims 1
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000000704 physical effect Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、特徴ベクトルの系列で表わされた複数種類の
標準パターンと入カバターンとの比較を行い、入カバタ
ーンの識別を行うバタ・−ン比較装置に関し、特に連続
して発声しrコ単語音声の認識などに適用可能なパター
ン比較装置に関する。
標準パターンと入カバターンとの比較を行い、入カバタ
ーンの識別を行うバタ・−ン比較装置に関し、特に連続
して発声しrコ単語音声の認識などに適用可能なパター
ン比較装置に関する。
人間にとつC最も自然な情報発生手段である音声が、人
間−機械系の入力手段とし゛C使用できれば、その効果
は非常に大きい。その場合、音声認識装置とし°Cは、
より自然な発声で認識できる条件とし゛C1連続しcH
声した音声の認識ができることが望ましい。
間−機械系の入力手段とし゛C使用できれば、その効果
は非常に大きい。その場合、音声認識装置とし°Cは、
より自然な発声で認識できる条件とし゛C1連続しcH
声した音声の認識ができることが望ましい。
連続し゛C発声したL11語音声の認識に有効なパター
ン比較装置とし゛C1動的計画法(以下DPというンを
2段回用いたいわゆる2段DP法を用いたパターン比較
装置が既に実用化されCいる。
ン比較装置とし゛C1動的計画法(以下DPというンを
2段回用いたいわゆる2段DP法を用いたパターン比較
装置が既に実用化されCいる。
しかし、この2段DP法は重復しtコ計算が多く計算量
が膨大で、従ってこの力演を用いた実時間処理が可能な
パターン比較装置は、極めC高速の処理が訣永され、装
置も複雑となり、高価なものとならざるを得ない。
が膨大で、従ってこの力演を用いた実時間処理が可能な
パターン比較装置は、極めC高速の処理が訣永され、装
置も複雑となり、高価なものとならざるを得ない。
本発明は以北の欠点を除去しtコバターン比較装置に関
するもので大幅に計算量を減らすことかできる。
するもので大幅に計算量を減らすことかできる。
以下、本発明に利用している原理につい゛C説明する。
本発明のパターン比較装置は、抽々の人カバターンの認
識に用いることができる。入カバターンのイ々つとしC
は、例えば連続してkAされる連続単語音用がある。
識に用いることができる。入カバターンのイ々つとしC
は、例えば連続してkAされる連続単語音用がある。
人間により発声される音声は人によりまた時により変化
し、基準となる標準パターンに対し時間的に非線形に伸
縮したものとなつ°Cいる。この非線形に伸縮しCいる
入カバターンと標準パターンとを比較し入力音声の認識
を行うためには、入カバターンと標準パターンの各特徴
ベクトルの対応付けを非線形に行い、入カバ・大−ンが
どの標準パ少−ンと最も類似しCいるかを計算する必要
がある。しかしこの人力音声は非線形に伸縮するとはい
つ°Cも異宮に長く伸びたり、短くなったりすることは
t2い。
し、基準となる標準パターンに対し時間的に非線形に伸
縮したものとなつ°Cいる。この非線形に伸縮しCいる
入カバターンと標準パターンとを比較し入力音声の認識
を行うためには、入カバターンと標準パターンの各特徴
ベクトルの対応付けを非線形に行い、入カバ・大−ンが
どの標準パ少−ンと最も類似しCいるかを計算する必要
がある。しかしこの人力音声は非線形に伸縮するとはい
つ°Cも異宮に長く伸びたり、短くなったりすることは
t2い。
本発明はこのような人カバターンの物理的な特徴に注目
し、入カバターンと標準パターンを比較する際には無制
限にすべ°Cの可能性につい′C比較するのではなく、
人カバターンの物理的な性質により定まるある妥当と考
えられる範囲につい′C比較を行うようにしたものであ
る。
し、入カバターンと標準パターンを比較する際には無制
限にすべ°Cの可能性につい′C比較するのではなく、
人カバターンの物理的な性質により定まるある妥当と考
えられる範囲につい′C比較を行うようにしたものであ
る。
入力音声信号はパターン比較装置において、周波数分析
、1.PC分析、PARCOR分析、相関分析等により
、いく一つかの数値の組(特徴ベクトル)の系列In変
換され、この入カバターンの特徴ベクトルと比較の対象
となる標準パターンの特徴ベクトルとが各ベクトル毎に
比較される。この各ベクトル毎の比較値、すなわちベク
トル間の距離を合計し?、−累積距離というものをパタ
ーンの類似の尺度)こ用いる。この累積距離を計算する
場合、各ベクトル毎の比較をすべCの組み合わせについ
0行うのは計amが膨大となり、パターン比較装置とし
゛C実用化することができない。
、1.PC分析、PARCOR分析、相関分析等により
、いく一つかの数値の組(特徴ベクトル)の系列In変
換され、この入カバターンの特徴ベクトルと比較の対象
となる標準パターンの特徴ベクトルとが各ベクトル毎に
比較される。この各ベクトル毎の比較値、すなわちベク
トル間の距離を合計し?、−累積距離というものをパタ
ーンの類似の尺度)こ用いる。この累積距離を計算する
場合、各ベクトル毎の比較をすべCの組み合わせについ
0行うのは計amが膨大となり、パターン比較装置とし
゛C実用化することができない。
入カバターンを一万の軸に、標準パターンを他方の軸と
する平面(以下、i−j平面という)を考えると、入カ
バターンおよび標準パターンの各ぺ、クトルの組み合わ
せというのは、i−j平面上の各格子点(以下、単に点
という)により示すことができる。従つ゛C前記あらゆ
る組み合わせについ′C各ベクトル間の距離を計算する
とは、各点におけるベクトル間の距離を計算することで
あり、累積距離を言1葬するとは、入カバターンの特徴
ベクトルと、それに対応する標準パターンの特徴ベクト
ルのベクトル間距離を順次計算し合計していくことであ
る。この累積距離を計算する過程で選択された、入カバ
ターンと標準パターンの特徴ベクトルの対応、すなわち
点列を径路という。
する平面(以下、i−j平面という)を考えると、入カ
バターンおよび標準パターンの各ぺ、クトルの組み合わ
せというのは、i−j平面上の各格子点(以下、単に点
という)により示すことができる。従つ゛C前記あらゆ
る組み合わせについ′C各ベクトル間の距離を計算する
とは、各点におけるベクトル間の距離を計算することで
あり、累積距離を言1葬するとは、入カバターンの特徴
ベクトルと、それに対応する標準パターンの特徴ベクト
ルのベクトル間距離を順次計算し合計していくことであ
る。この累積距離を計算する過程で選択された、入カバ
ターンと標準パターンの特徴ベクトルの対応、すなわち
点列を径路という。
前記した入カバターンの物理的な性質を考慮して比較の
範囲を限定するということは、本発明においCは径路の
選択に向未条件を設けるということである。
範囲を限定するということは、本発明においCは径路の
選択に向未条件を設けるということである。
ここで、以後の説明におい′C用いる用語おまひ記憶に
ついご説明する。
ついご説明する。
A:入カバターン(/1=a1a2−a1・・−al
)、a、は第iフレームの特徴ベク]・ル、1は入カバ
ターンのフレーム数 R″: 負= n jj;4 準ハ’il −ン(R”
=b、”h’: ・−bj’、、4.、”、 )bn3
は第n標準パターンの第jフレームの特徴ベクトル J”は第n標準パターンのフレーム数、Nを標準パター
ンの総数とするとき 1 < n < N d”(i、j) :第n標準パターンの第jフレームの
持依ベクトルbj と入カバターンの第iフレームの
特徴ベクトルaiとのベクトル間距離 D(i): 第1〜第iフレームまでの入カバターンと
、各機中パ・ターンの最適な和み合せの結合パターンと
のパターン間の距離(以下、終端累積距離という) N(i): 第1〜N4 r ′クレームまでの入カバ
ターンに対する各標準パターンの最適な和み合せの結合
パターンを求めたときの当該結合バシ・−ンを構成する
最後尾標準パターンを示す番号(以下、最後尾標準パや
−ン名]B (+) : N(i)の始点フ1/−ムの
1一つ手前のフレームを示す准号(以下、バックポイン
タという ) D”(i、J) :入カバターンの第1〜第iフレーム
までの部分パ・、ターンとR′″の第1〜第jフレーム
までの部分パターンのパターン間の距離(以下、部分累
慣距mDi/(i、j)という】と、D(i’−1)と
の和のi′につい′Cの最小値(以下、中間累積距離と
いう] B”(i= 3 ) : g 分IA’rl 距1’i
Drノ(r t J ) (!: IJ(+’−1)
トの和を最小にする1′を1/、すなわちす番号(以
下、中間バックポインタというンただし、argmin
□は0内の値を×について最小化したときの×の値を示
す。
)、a、は第iフレームの特徴ベク]・ル、1は入カバ
ターンのフレーム数 R″: 負= n jj;4 準ハ’il −ン(R”
=b、”h’: ・−bj’、、4.、”、 )bn3
は第n標準パターンの第jフレームの特徴ベクトル J”は第n標準パターンのフレーム数、Nを標準パター
ンの総数とするとき 1 < n < N d”(i、j) :第n標準パターンの第jフレームの
持依ベクトルbj と入カバターンの第iフレームの
特徴ベクトルaiとのベクトル間距離 D(i): 第1〜第iフレームまでの入カバターンと
、各機中パ・ターンの最適な和み合せの結合パターンと
のパターン間の距離(以下、終端累積距離という) N(i): 第1〜N4 r ′クレームまでの入カバ
ターンに対する各標準パターンの最適な和み合せの結合
パターンを求めたときの当該結合バシ・−ンを構成する
最後尾標準パターンを示す番号(以下、最後尾標準パや
−ン名]B (+) : N(i)の始点フ1/−ムの
1一つ手前のフレームを示す准号(以下、バックポイン
タという ) D”(i、J) :入カバターンの第1〜第iフレーム
までの部分パ・、ターンとR′″の第1〜第jフレーム
までの部分パターンのパターン間の距離(以下、部分累
慣距mDi/(i、j)という】と、D(i’−1)と
の和のi′につい′Cの最小値(以下、中間累積距離と
いう] B”(i= 3 ) : g 分IA’rl 距1’i
Drノ(r t J ) (!: IJ(+’−1)
トの和を最小にする1′を1/、すなわちす番号(以
下、中間バックポインタというンただし、argmin
□は0内の値を×について最小化したときの×の値を示
す。
I)”(i) : j=、T”のときの中間累積距離で
あり、D”(i)−D” (i 、 J”) ’?’
アル。
あり、D”(i)−D” (i 、 J”) ’?’
アル。
B”(il: j=s”のときの中間バックポインタで
あり、B”(i)=13”(ilJ”)でアル。
あり、B”(i)=13”(ilJ”)でアル。
本発明は、入カバターンか第1゜フレームで終了すると
仮定した場合、最後尾パターンをR1′としたときの「
1月1ん累梢距MtI)”(ia・)を求めるのに、i
′を始端フレームe’6・を終端フレームとする入カバ
ターンの部分パターンA(i’−1,i6・]と標準パ
ターンRnとのD I’マツチングを始端照自出、終端
点固定とし′C行うものであつC1始端点i′における
中間累積距1ffiの初期値D”(i’、1)と中間バ
ックポインタの初ILJI (iB” (i’ 、 o
)−t、−D”(1’、1) = D(i’−1)−
t−d”(i、1)B”(+’、す: B”(+’ −
1)とすることによつ゛C1第i’−1フレームまでの
DPマツチングの続きとしC部分バタ・−ンA(!’
1 、 i6・)色標準パターンRnのDP“マツチン
グを行うものである。このようにすることによって、例
えば、第1図に示すようなマツチング径路に対する拘束
条件のもとでは、取り得るマツチング径路は第2図のP
の領域内に制限され、D”(16“・)を求めるために
必要とされるd”(LJ) 、D”(i、 j)の計算
は領域1円の各点につい′Cそれぞれ1回行うのみでよ
い。第2図において横軸は入カバターン、縦軸は最後尾
標準パ李−ンRnである。領域Pは傾き1/2の直線P
、と傾き2の直線2とで囲まれた領域となつ′Cいいる
◎D”(1,j)を求めるには、第1図から明らかf!
J、 ウIc D”(i−2,j−IJ、D”(1−
1,j−1)、D”(1−1,j−2)。
仮定した場合、最後尾パターンをR1′としたときの「
1月1ん累梢距MtI)”(ia・)を求めるのに、i
′を始端フレームe’6・を終端フレームとする入カバ
ターンの部分パターンA(i’−1,i6・]と標準パ
ターンRnとのD I’マツチングを始端照自出、終端
点固定とし′C行うものであつC1始端点i′における
中間累積距1ffiの初期値D”(i’、1)と中間バ
ックポインタの初ILJI (iB” (i’ 、 o
)−t、−D”(1’、1) = D(i’−1)−
t−d”(i、1)B”(+’、す: B”(+’ −
1)とすることによつ゛C1第i’−1フレームまでの
DPマツチングの続きとしC部分バタ・−ンA(!’
1 、 i6・)色標準パターンRnのDP“マツチン
グを行うものである。このようにすることによって、例
えば、第1図に示すようなマツチング径路に対する拘束
条件のもとでは、取り得るマツチング径路は第2図のP
の領域内に制限され、D”(16“・)を求めるために
必要とされるd”(LJ) 、D”(i、 j)の計算
は領域1円の各点につい′Cそれぞれ1回行うのみでよ
い。第2図において横軸は入カバターン、縦軸は最後尾
標準パ李−ンRnである。領域Pは傾き1/2の直線P
、と傾き2の直線2とで囲まれた領域となつ′Cいいる
◎D”(1,j)を求めるには、第1図から明らかf!
J、 ウIc D”(i−2,j−IJ、D”(1−
1,j−1)、D”(1−1,j−2)。
d”(1−1,jLd”(1,j) CDhワb>”y
cイレj:! J: L”カラ、i3 iフレーム上の
中間累積距離Dn(16)、j)(ただしj”’ t
2#・・・、J″′ンを求めるには、第i−1フレーム
、第i −2フレーム上の中間累積距離D″’(1−1
,jJ。
cイレj:! J: L”カラ、i3 iフレーム上の
中間累積距離Dn(16)、j)(ただしj”’ t
2#・・・、J″′ンを求めるには、第i−1フレーム
、第i −2フレーム上の中間累積距離D″’(1−1
,jJ。
D”(1−2,j) J:i 、J: O’第i −1
7し” ム、1ilj i −) L/ −ム上のベク
トル間距Ml d″(1−1,jLd”(1,j) (
ただしj=x、2.・・・、 D>を記憶しCおくのみ
でJ二い。
7し” ム、1ilj i −) L/ −ム上のベク
トル間距Ml d″(1−1,jLd”(1,j) (
ただしj=x、2.・・・、 D>を記憶しCおくのみ
でJ二い。
このとき、D”(161ンは
pn(1,p)=D”(1b)、J”
とし′C求めることができる。
以上のように、入カバターンのフレームiが1フレーム
進む毎に、そのフレーム上の中間累積距離D”(i、j
) (ただし、j”’ e ” 、+++、 J” ;
n=1 *’L・・・、N)を1フレーム前と2フレ
ーム前の中間累槓距tl11. D”(i−i、j)、
D”(i−51,j)と1フレーム前および当g 7
v −ム(7)ヘク) ル問丸1 d”(i−1,j)
、d”(i、j)(ただしJ=’ −” e”’e J
”; n=1 、2 、=、N)b>ら求め、D (1
) = min (D″(i、J”ン〕 とし゛C第i
フレ゛−ムまでの終端累積距it求めることができる。
進む毎に、そのフレーム上の中間累積距離D”(i、j
) (ただし、j”’ e ” 、+++、 J” ;
n=1 *’L・・・、N)を1フレーム前と2フレ
ーム前の中間累槓距tl11. D”(i−i、j)、
D”(i−51,j)と1フレーム前および当g 7
v −ム(7)ヘク) ル問丸1 d”(i−1,j)
、d”(i、j)(ただしJ=’ −” e”’e J
”; n=1 、2 、=、N)b>ら求め、D (1
) = min (D″(i、J”ン〕 とし゛C第i
フレ゛−ムまでの終端累積距it求めることができる。
このよ’) +r シ’C求メラレt:、 D”(1,
j) (タrコl、 j=1.2.=・、J”。
j) (タrコl、 j=1.2.=・、J”。
1=l 、 2 、・・・、N)は必要がなくなるまで
すなわち次のフレームないしその次のフレームにおける
D”(i、j)@+誘終了まで記憶される。
すなわち次のフレームないしその次のフレームにおける
D”(i、j)@+誘終了まで記憶される。
また、D(1)に対するバックポインタ(D(i)に対
する始端点から1を差し引いた値)B(i)は次のよう
にし′C求まる。
する始端点から1を差し引いた値)B(i)は次のよう
にし′C求まる。
D”(’t3)に対する中間バックポインタをB”(1
,j)とするとき、 1)D′″(i、j)=D″(l−2,j−1)+d”
(1−t 、j)+d”(1,j)のときは B”(i、j)=B”(i−2,J−1)2) D”
(1,j)=D”(i−4,j−1)−1−d″(i、
j)ノド> ハB”(i 、 j )=B” (i
−1、1−1)8) デ(t 、j用D”(i −1、
j −2)+d’″(f、J)のときはB”(i 、
j )=B”(1−1、j−2)とおくことにより D(+)=D仝(i、J’) とすれば 旧:)=B1(I、J′l′) となる。従つ°C1B“(1,j)についても、1フレ
ーム前と2ヴレニム前のものを覚えておく。
,j)とするとき、 1)D′″(i、j)=D″(l−2,j−1)+d”
(1−t 、j)+d”(1,j)のときは B”(i、j)=B”(i−2,J−1)2) D”
(1,j)=D”(i−4,j−1)−1−d″(i、
j)ノド> ハB”(i 、 j )=B” (i
−1、1−1)8) デ(t 、j用D”(i −1、
j −2)+d’″(f、J)のときはB”(i 、
j )=B”(1−1、j−2)とおくことにより D(+)=D仝(i、J’) とすれば 旧:)=B1(I、J′l′) となる。従つ°C1B“(1,j)についても、1フレ
ーム前と2ヴレニム前のものを覚えておく。
なお、第8図のJ:うな径路の場合は、DI″(1,j
)・B”(1,j)は1フレーL前の値を覚えCおくt
ごはでよい。
)・B”(1,j)は1フレーL前の値を覚えCおくt
ごはでよい。
以上説明しt:原理を用いた本発明のパターン比較装置
の実施例につい°C説明する。第4図は本発明のパター
ン比較装置を連続単語認識に適用した場合の一実施例を
示すブロック図である。図において、 Inは音声信号
の入力端子、(1)はフィルタ1<ンク等で構成された
特徴抽出部であつC1人力音声信号を特徴ベクトルai
の系列Aに釣換する。(2)は単語標準パターン記憶部
であつ゛C4認識語索だるN個の単語がそれぞれ標準パ
ターンRfl=br・・・br;、。。
の実施例につい°C説明する。第4図は本発明のパター
ン比較装置を連続単語認識に適用した場合の一実施例を
示すブロック図である。図において、 Inは音声信号
の入力端子、(1)はフィルタ1<ンク等で構成された
特徴抽出部であつC1人力音声信号を特徴ベクトルai
の系列Aに釣換する。(2)は単語標準パターン記憶部
であつ゛C4認識語索だるN個の単語がそれぞれ標準パ
ターンRfl=br・・・br;、。。
Jn、(1≦n≦N)として特徴ベクトルの形で予め登
録されCいる。(3)はベクトル間距離計算部であつC
1入カバターンの第iフレームにおける¥’¥?l!!
ベクトルa・とn番目の単語標準パターンRnの特徴夏 ベクトルbi、との距ad”(i、j) f:、j=1
,2.−、J”についC求め、必要がなくなるまで記憶
する。本実施例においCは中間累積距離を計算しCいる
フレームの1つ前のフレームおよび当該フレームのベク
トル間距離を当該フレームの中間累積距離を計算するま
で記憶する。d”(i、1月は、例えばajとbjの市
街距離とし゛C定義できる。すなわち、ベクトルの次元
をlとし、al=(ailya12p”’+ailL”
j=(b”3uば2.°°・、b″31)とするとき(
4)は累積距離計算部であつ゛C1第iフレームにライ
゛r 中1141累m距Hf D”((、j) 、 終
端累積h’Jilint D (i)。
録されCいる。(3)はベクトル間距離計算部であつC
1入カバターンの第iフレームにおける¥’¥?l!!
ベクトルa・とn番目の単語標準パターンRnの特徴夏 ベクトルbi、との距ad”(i、j) f:、j=1
,2.−、J”についC求め、必要がなくなるまで記憶
する。本実施例においCは中間累積距離を計算しCいる
フレームの1つ前のフレームおよび当該フレームのベク
トル間距離を当該フレームの中間累積距離を計算するま
で記憶する。d”(i、1月は、例えばajとbjの市
街距離とし゛C定義できる。すなわち、ベクトルの次元
をlとし、al=(ailya12p”’+ailL”
j=(b”3uば2.°°・、b″31)とするとき(
4)は累積距離計算部であつ゛C1第iフレームにライ
゛r 中1141累m距Hf D”((、j) 、 終
端累積h’Jilint D (i)。
中間バックポインタB”(’tJ) tバックポイン9
B(i)をj=1 r 2 t ”’ + J ”
; n =1 p 2p ”・p Nについ°C求め、
最後尾の単語を示すN (i)を求める。第1図に示し
たマツチング径路の拘束条件が採用されると、D”(i
、j)、D(i)は次の式から求まる。
B(i)をj=1 r 2 t ”’ + J ”
; n =1 p 2p ”・p Nについ°C求め、
最後尾の単語を示すN (i)を求める。第1図に示し
たマツチング径路の拘束条件が採用されると、D”(i
、j)、D(i)は次の式から求まる。
D(i)=min (D”(i、、r”))B”(i、
j)、B (i)1.t 次CD式カラ求t ル。BI
ll(i、j) i、tB”(t、0)=B”(i −
1) を初期条件(!: 1./ ’C1) D”(
i、j)=D”(i−2,j−1)+d”(i、j)+
d”(i−1,j)のときは B111(i 、 j )= li”(i−2,j−1
) ”’ (2)2) D”(i、
j)−I)”(i−1,j−1)+d”(i、j)ノド
akLtB”(i#j)=B’″(i −1、j−1)
−+3)8) D”(i、j)−D”(
i−1,j−2)+dr′(i、j)(7)ト&ハ13
”(i 、 j)=B”(i −1、j −2)
−(4)としC求まり、B (f)は式(1
)を満足する単語番号をnとすれは B (i) −B会に、、r’> ・・
・(5)となる。また N (i) =台 である、。
j)、B (i)1.t 次CD式カラ求t ル。BI
ll(i、j) i、tB”(t、0)=B”(i −
1) を初期条件(!: 1./ ’C1) D”(
i、j)=D”(i−2,j−1)+d”(i、j)+
d”(i−1,j)のときは B111(i 、 j )= li”(i−2,j−1
) ”’ (2)2) D”(i、
j)−I)”(i−1,j−1)+d”(i、j)ノド
akLtB”(i#j)=B’″(i −1、j−1)
−+3)8) D”(i、j)−D”(
i−1,j−2)+dr′(i、j)(7)ト&ハ13
”(i 、 j)=B”(i −1、j −2)
−(4)としC求まり、B (f)は式(1
)を満足する単語番号をnとすれは B (i) −B会に、、r’> ・・
・(5)となる。また N (i) =台 である、。
以上のようにし°C求められた終端累積距離Q 会
D(i)=D (i、J)は終端累積距離記憶部(5
)に、パックポインタB(i)=B”(i、J”)1よ
パックボイアン記憶部(6)に、最後尾単語番号N(i
)=nは最後尾単語記憶部(7)に記憶される。
)に、パックポインタB(i)=B”(i、J”)1よ
パックボイアン記憶部(6)に、最後尾単語番号N(i
)=nは最後尾単語記憶部(7)に記憶される。
ft オD”(it j) 、B”(i、j) (f:
? シj=L2+”−tJ”;n=1.2.・・−N
)は必要がなくなるまで、累梢距離計算部Q4に一時的
に記憶される。本実施例におい°Cは中間累積距離を計
算し°Cいるフレームの1つ前および2つ前のフレーム
の中間累積距離を当該フレームの中間累積距離を計算す
るまで記憶する。
? シj=L2+”−tJ”;n=1.2.・・−N
)は必要がなくなるまで、累梢距離計算部Q4に一時的
に記憶される。本実施例におい°Cは中間累積距離を計
算し°Cいるフレームの1つ前および2つ前のフレーム
の中間累積距離を当該フレームの中間累積距離を計算す
るまで記憶する。
また終端累積距離記憶部(5目こ記憶される終端累積距
離D (i)は、式(])の初期条件を求めるために必
要ナモノテアリ、D(i)ニツイ’r l、t D”(
i+1.1) f求めるまで記憶されCおればよい。
離D (i)は、式(])の初期条件を求めるために必
要ナモノテアリ、D(i)ニツイ’r l、t D”(
i+1.1) f求めるまで記憶されCおればよい。
(8)は音声区間検出部であっ゛C1入方信号の大きさ
等から音声区間を判定するものである。音声区間検出部
(8)が、音声大刀が開始されたことを検出するとフレ
ーム数計数m1(9)はフレーム毎に計数をはじめる。
等から音声区間を判定するものである。音声区間検出部
(8)が、音声大刀が開始されたことを検出するとフレ
ーム数計数m1(9)はフレーム毎に計数をはじめる。
前記の処理は第iフレームについての処理であったが、
このフレーム数計数部19)+7) +vl−数値がす
なわちこのiを設定し′Cいる。従っ゛c1前記と同様
の処理が、フレームが1進む毎ニ行われることになる。
このフレーム数計数部19)+7) +vl−数値がす
なわちこのiを設定し′Cいる。従っ゛c1前記と同様
の処理が、フレームが1進む毎ニ行われることになる。
フレーム数計数部19)は音声区間が検出されると計数
を始め、音声区間が終了するとリセットされる。最後尾
単語記憶部(7)、バックポインタ記憶部(6)には、
従っで、N (i) 、 B (i)が1=1.2.・
・・、1につい°C記憶されることになる。
を始め、音声区間が終了するとリセットされる。最後尾
単語記憶部(7)、バックポインタ記憶部(6)には、
従っで、N (i) 、 B (i)が1=1.2.・
・・、1につい°C記憶されることになる。
セグメンテーション部110はバックポインタ記憶部(
6)に対し、所定のパックポインタを読出すべき命令を
発するものである。すなわち、セグメンテーション部+
I4がiなる値をバックポインタ記憶部(6)に発する
と、パックポインタ配備部(6)からはパックポインタ
B(i)が読出される。セグメンテーション部QOはバ
ックポインタ記憶部(6)がらB (i)なる値を受は
取ると、その同じイ的をバックポインタ記憶部(6)に
発する。従って、tN声区間検出部(8)が石川入力の
終了を検知すると、〜フレ、−ム数計数部(9)の最終
値■がセグメンテーション部u1に供給すrt。
6)に対し、所定のパックポインタを読出すべき命令を
発するものである。すなわち、セグメンテーション部+
I4がiなる値をバックポインタ記憶部(6)に発する
と、パックポインタ配備部(6)からはパックポインタ
B(i)が読出される。セグメンテーション部QOはバ
ックポインタ記憶部(6)がらB (i)なる値を受は
取ると、その同じイ的をバックポインタ記憶部(6)に
発する。従って、tN声区間検出部(8)が石川入力の
終了を検知すると、〜フレ、−ム数計数部(9)の最終
値■がセグメンテーション部u1に供給すrt。
セグメンテーション部01は先ずIなる伯をバックポイ
ンタ記憶部(6)に発する。以後、Flit記説明の動
作に従って、パックポイン4I記憶部(6〉がら、B(
i)B(B(1)) 、B(B(+3(I)ンンs”p
Oft ル用カがI!Il’i ’?A 1%られる
こ2゛にl(る。これらの値は最後から2番目の単語の
終りのフレーム、同8番目の終りのフレーノ・、同4番
目の終りのフレーム、・・・というモノであり、N (
i)はiフレームで終る単語であったがら、この値をそ
のまま最後尾単語記憶部(7)に与えると、最後の単語
から逆の順序で認識結果が得られる。なお認識結果が逆
のj、li’l序で得られないようlこするためには、
この順序の変換をバックポインタ記憶部(0)の出刃に
対し°C行うが最後尾単語記憶部(7)の出力に対して
行えばよい。
ンタ記憶部(6)に発する。以後、Flit記説明の動
作に従って、パックポイン4I記憶部(6〉がら、B(
i)B(B(1)) 、B(B(+3(I)ンンs”p
Oft ル用カがI!Il’i ’?A 1%られる
こ2゛にl(る。これらの値は最後から2番目の単語の
終りのフレーム、同8番目の終りのフレーノ・、同4番
目の終りのフレーム、・・・というモノであり、N (
i)はiフレームで終る単語であったがら、この値をそ
のまま最後尾単語記憶部(7)に与えると、最後の単語
から逆の順序で認識結果が得られる。なお認識結果が逆
のj、li’l序で得られないようlこするためには、
この順序の変換をバックポインタ記憶部(0)の出刃に
対し°C行うが最後尾単語記憶部(7)の出力に対して
行えばよい。
第5図は前記実施例装置の機能をソフトウェアで実現し
た場合のフローチャートであり、以下前記実施個装Yη
1の各部の動作と結びっけ゛C説明する。
た場合のフローチャートであり、以下前記実施個装Yη
1の各部の動作と結びっけ゛C説明する。
ステップ100〜104は累積距離1) (i) 、中
間累積距離”(’pJ) *バックポイノ月3(i)、
中間バラ・クボインタB”(i、jJの初期化を行う部
分である。
間累積距離”(’pJ) *バックポイノ月3(i)、
中間バラ・クボインタB”(i、jJの初期化を行う部
分である。
ステップ亙o6〜111は第iフレームのトキに実行す
る処理である。ステップ亙07は第iフレームにおける
中間累積距離と中間バックポインタのυ期値を与える部
分である。ステップjo9〜111 (7)処J」は、
主とし°C累梢距離計算部(4)で行われる処理である
。ステップ110における記法n=argmin(D”
(i、J”))i、tl)”(i、J”) ヲf#を小
j’−スルn ヲQ トオくという意味である。ステッ
プ109は中間累積距離D”(j、j)、中間バックポ
インタB”(i、j)を求めている。ステップ110は
ステップ109の計算をn=1.2.・・・、Nにつぃ
C行った結果入力の第iフレームを入力の終端としたと
き、累積距離D”(i、J”)が最小となる最後尾単語
合を求める処理である。ステップ111はステップ11
0で求まった最適の単語賃ハ 令 に対し、 N(i):= n 、 D(n= p”ci
、r )、B(i)=B”C4,J)としてそれぞれメ
モリに記憶すると、とを示しておリ、それらのメモリは
最後尾単語t【i項部(7)l累積距離記憶部(5)、
バックボインシ記gi部(6)に対応し′Cいる。
る処理である。ステップ亙07は第iフレームにおける
中間累積距離と中間バックポインタのυ期値を与える部
分である。ステップjo9〜111 (7)処J」は、
主とし°C累梢距離計算部(4)で行われる処理である
。ステップ110における記法n=argmin(D”
(i、J”))i、tl)”(i、J”) ヲf#を小
j’−スルn ヲQ トオくという意味である。ステッ
プ109は中間累積距離D”(j、j)、中間バックポ
インタB”(i、j)を求めている。ステップ110は
ステップ109の計算をn=1.2.・・・、Nにつぃ
C行った結果入力の第iフレームを入力の終端としたと
き、累積距離D”(i、J”)が最小となる最後尾単語
合を求める処理である。ステップ111はステップ11
0で求まった最適の単語賃ハ 令 に対し、 N(i):= n 、 D(n= p”ci
、r )、B(i)=B”C4,J)としてそれぞれメ
モリに記憶すると、とを示しておリ、それらのメモリは
最後尾単語t【i項部(7)l累積距離記憶部(5)、
バックボインシ記gi部(6)に対応し′Cいる。
ステップ112〜116は以上のようにし′C求めら。
れたN (i) 、 B fi)から逆の11序で単語
の認識結果を求める部分で、セグメンテーション部(1
0,パツクボインク記憶部(6)、最後尾単語記憶部(
7)の門で行われる処理に対応し°Cいる。
の認識結果を求める部分で、セグメンテーション部(1
0,パツクボインク記憶部(6)、最後尾単語記憶部(
7)の門で行われる処理に対応し°Cいる。
本実施例装館における最終フレーム■までの総dl算回
数は j −j I?:間の各点におけるベクトル間距
離(t(tpjL中間累積距離”(’ l j)の計算
を各点竹にただ1回1′jうのみなので平均フレーム敬
ヲJとするといすねもNIJとなる。従来の2段DP法
ると#F幻回数は1/(−7J月こなる。いまフレーム
長が10ms e cで単語長が平均0.5secであ
ったとすれば標準バク′−ンの平均フレームf& Jは
、J=50であるから、il算回数は、1/87.5に
なる。また幅Rの窓(計算制限領域)を設けた場合の計
算回数NIJRと比べ°Cも1/Rとなり、Rは大体2
0(\1であるがら計算回数は1/20となる。
数は j −j I?:間の各点におけるベクトル間距
離(t(tpjL中間累積距離”(’ l j)の計算
を各点竹にただ1回1′jうのみなので平均フレーム敬
ヲJとするといすねもNIJとなる。従来の2段DP法
ると#F幻回数は1/(−7J月こなる。いまフレーム
長が10ms e cで単語長が平均0.5secであ
ったとすれば標準バク′−ンの平均フレームf& Jは
、J=50であるから、il算回数は、1/87.5に
なる。また幅Rの窓(計算制限領域)を設けた場合の計
算回数NIJRと比べ°Cも1/Rとなり、Rは大体2
0(\1であるがら計算回数は1/20となる。
以上のように本実施例におい°Cは、連続し゛C発声さ
れた音声を従来の装置よりもはるかに少いa1算回数、
で認識することができ、認識速度の速い連゛晋音声認識
装置を実現することができる。また本実施例においCは
入力フレーム毎に処理が可能であるから、実時間で動作
する認識装置が可能となる。
れた音声を従来の装置よりもはるかに少いa1算回数、
で認識することができ、認識速度の速い連゛晋音声認識
装置を実現することができる。また本実施例においCは
入力フレーム毎に処理が可能であるから、実時間で動作
する認識装置が可能となる。
なお、本実施例では、連続し′C発声された単語を認識
する場合を述べたが、単語の代りに単音節などであつ°
Cもよく、その池の速読するパターンの認識にも)運用
でλるものである。
する場合を述べたが、単語の代りに単音節などであつ°
Cもよく、その池の速読するパターンの認識にも)運用
でλるものである。
また径路の拘束条件とし°C第1図に示したものを用い
たが、他の拘束条件、例えば第8図に示すような拘束条
件を、用いCもよく、入カバターンの物理的性質に応じ
゛C適当に設定することができる。
たが、他の拘束条件、例えば第8図に示すような拘束条
件を、用いCもよく、入カバターンの物理的性質に応じ
゛C適当に設定することができる。
以上のように本発明は入カバターンの+≠分各フレーA
毎に最後尾1”A準バ々−ンの全フレームに対する中間
累積距離を求め、次段以降のフレーム(こおける中間累
積距離の計算にAi1段フレームまでの計瑯値を用いる
ようにしたので、重複(〕だ計算をなくし、1算凧の少
ない、処理:Ia: rtの速いパターン比較装置を提
供することができ、その実用的価値は高い。
毎に最後尾1”A準バ々−ンの全フレームに対する中間
累積距離を求め、次段以降のフレーム(こおける中間累
積距離の計算にAi1段フレームまでの計瑯値を用いる
ようにしたので、重複(〕だ計算をなくし、1算凧の少
ない、処理:Ia: rtの速いパターン比較装置を提
供することができ、その実用的価値は高い。
第1図はマツチング計算径路の拘束条件を示す図、第2
図はマツチ−・グ、?tJI1.を行う領域を示す図、
第8図はマツチング計算径路の別の拘束条件を示す図、
第4図は本発明における一実施例の音声認識装置のフロ
ック図、第5図は同実施例装置の機能をソフトウェアで
実現したときのフローチャートである。 (す・・・特徴抽出部、(2)・・・単語標準パターン
記憶n1;。 (3)・・・ベクトル間距離計算部、(4)・・・累積
「1」離計算部。 (5)・・・終端累積距離記憶部、(6)・・・バソク
ポインク記憶部、(71・・・最後尾単語記憶部、(8
)・・・音声区間検出部、 (9)・・・フレーム数計
数部、 (11・・・セグメンテーション部 代理人 行 本 尭 弘
図はマツチ−・グ、?tJI1.を行う領域を示す図、
第8図はマツチング計算径路の別の拘束条件を示す図、
第4図は本発明における一実施例の音声認識装置のフロ
ック図、第5図は同実施例装置の機能をソフトウェアで
実現したときのフローチャートである。 (す・・・特徴抽出部、(2)・・・単語標準パターン
記憶n1;。 (3)・・・ベクトル間距離計算部、(4)・・・累積
「1」離計算部。 (5)・・・終端累積距離記憶部、(6)・・・バソク
ポインク記憶部、(71・・・最後尾単語記憶部、(8
)・・・音声区間検出部、 (9)・・・フレーム数計
数部、 (11・・・セグメンテーション部 代理人 行 本 尭 弘
Claims (1)
- 【特許請求の範囲】 1、 入力信列を特徴ベクトルala2・・・al・・
・a工の系列に変換する特徴抽出手段と、特徴ベクトル
の系列bτb;・・・n、 m bll、、から成る標
準パターン長1(ただしn=1.2.・・・N)、金、
記憶する標準パターン記憶手段と、入カバターンの第i
フレームにおい’C前記IP#vhベクトルaiとbj
との距@d”(i、j)をjle2.・・・、J”;n
=1.2.−、Hにつぃ゛c計算し必要がなくなるまで
一時的に記憶するベクトル間距離計算手段と、入カパク
ーンの第iげフレームにおい乙 j=x、2.・・・、
J”;n=1.2゜−、N につい゛C中間累檀距離D
(i、j迭中間バックポインタB″’(i、j)とを
求め、それらを必要がなくなるまでHE!憶する′と共
に% ”” 1 * 2 g・・・、Nについ°C中間
累積距距離”(i、j’)を最小にするn=Qと、”n
/?I その最小値D (!、])、それに対する中間バックポ
インDB<’a、J力を求める累積距離計算手段と、前
記D’(i #J’)を終端累積距離D (i)とし゛
Cフレーム毎に記憶する終端累積距離記憶手段と、前記
B”(i、J”)を終端バックポインタB(i)とし゛
Cフレーム毎に記憶する終端バックポインタ記憶手段と
、前記nを第iフレームで終端する最後尾パターンN
(i)とし“Cフレーム毎に記憶する最後尾パi−ン記
憶手段と、入カバターンの最終フレームlで入力が完r
したとき、前記終端バックポイン・り記憶手段からB(
1) 、 B (B(1) r 、・・・、0すなわち
連続し゛C入力されたパターンの境界を逆の順゛序で求
めるセグメンテーション手段と、入カバターンが存在す
る区間を検出する入カバターン区間検出手段と、この入
カバターン区間検出手段により入カバターンが存在しC
いないと判定されたときリセットされ、入カバ・ターン
が存在しCいると判定されCいる門人カバターンのフレ
ーム数を計数し、前記入力フレーム番号iを得るフレー
ム数計数手段とを備え、前記入カバターン区間検出手段
により入カバターンが終Iしたことが検出されると、前
記計数手段のその時の値1と前記セグメンテーション手
段の出力とから前記最後尾バタン記憶手段に記憶“され
Cいる1谷N(1) 、 N (B(I) ) 、 N
(B(B(1)υ。 ・・・を順次読み出すことを特徴とするパターン比較装
置a0
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57110531A JPS592095A (ja) | 1982-06-25 | 1982-06-25 | パタ−ン比較装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57110531A JPS592095A (ja) | 1982-06-25 | 1982-06-25 | パタ−ン比較装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS592095A true JPS592095A (ja) | 1984-01-07 |
Family
ID=14538163
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57110531A Pending JPS592095A (ja) | 1982-06-25 | 1982-06-25 | パタ−ン比較装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS592095A (ja) |
-
1982
- 1982-06-25 JP JP57110531A patent/JPS592095A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Soong et al. | A Tree. Trellis based fast search for finding the n best sentence hypotheses in continuous speech recognition | |
| US4624011A (en) | Speech recognition system | |
| US5056150A (en) | Method and apparatus for real time speech recognition with and without speaker dependency | |
| AU682177B2 (en) | Speech processing | |
| CN111724770B (zh) | 一种基于深度卷积生成对抗网络的音频关键词识别方法 | |
| WO1994023425A1 (en) | Connected speech recognition | |
| JP2980026B2 (ja) | 音声認識装置 | |
| JPH03201079A (ja) | パターンマッチング装置 | |
| JP2003535376A (ja) | 分類システムの反復訓練用の方法と装置 | |
| JPS592095A (ja) | パタ−ン比較装置 | |
| McInnes et al. | Unsupervised extraction of recurring words from infant-directed speech | |
| JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
| JPH0823758B2 (ja) | 話者適応形音声認識装置 | |
| Anitha et al. | Outerproduct of trajectory matrix for acoustic modeling using support vector machines | |
| US20240144934A1 (en) | Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium | |
| JPS59198A (ja) | パタ−ン比較装置 | |
| JPS60164800A (ja) | 音声認識装置 | |
| Hosom et al. | A diphone-based digit recognition system using neural networks | |
| JP3009709B2 (ja) | 日本語音声認識方法 | |
| JP2996417B2 (ja) | 音声認識方法 | |
| JPS6073698A (ja) | パタ−ン比較装置 | |
| JPS62111295A (ja) | 音声認識装置 | |
| JPS63104098A (ja) | 音声認識装置 | |
| CN120108373A (zh) | 一种基于注意力机制的长音频语音摹刻方法及系统 | |
| JPH0552516B2 (ja) |