JPH0465396B2 - - Google Patents
Info
- Publication number
- JPH0465396B2 JPH0465396B2 JP62061735A JP6173587A JPH0465396B2 JP H0465396 B2 JPH0465396 B2 JP H0465396B2 JP 62061735 A JP62061735 A JP 62061735A JP 6173587 A JP6173587 A JP 6173587A JP H0465396 B2 JPH0465396 B2 JP H0465396B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- point
- cumulative value
- recurrence formula
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Landscapes
- Image Processing (AREA)
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は人間が発声した音声を自動認識する音
声認識等の主要処理であるパタースマツチング方
式に関する。
声認識等の主要処理であるパタースマツチング方
式に関する。
(従来の技術)
音声認識のパターンマツチングに関しては種々
の技術が開発されているが、それらの中で最も重
用されているものの一つとして「日本音響学会誌
第42巻9号(昭和61年9月発行の第725頁」に記
載される如きDPマツチング法がある。これは音
声の時間軸歪を整合する手法として極めて有効と
されている。また、DPマツチング法を連続単語
認識に拡張したものとして、特願昭56−199098号
明細書に記載されるが如きクロツクワイズDP法
がある。この手法は構文制御を有する連続単語認
識法として説明されているが、その特殊形として
当然離散単語認識をも包含している。ここでは簡
単のため離散単語認識の形式で、クロツクワイズ
DP法の要部を説明する。
の技術が開発されているが、それらの中で最も重
用されているものの一つとして「日本音響学会誌
第42巻9号(昭和61年9月発行の第725頁」に記
載される如きDPマツチング法がある。これは音
声の時間軸歪を整合する手法として極めて有効と
されている。また、DPマツチング法を連続単語
認識に拡張したものとして、特願昭56−199098号
明細書に記載されるが如きクロツクワイズDP法
がある。この手法は構文制御を有する連続単語認
識法として説明されているが、その特殊形として
当然離散単語認識をも包含している。ここでは簡
単のため離散単語認識の形式で、クロツクワイズ
DP法の要部を説明する。
単語名を番号nで指定することとして
{n|n=1、2、…N}
なる単語セツトを認識対象とする。各単語に標準
パターン Bn=〓1 n、〓2 n、…〓j n…〓n Jo を考える。ここにjは時刻を示し、〓j nは標準パ
ターンBnの時刻jの特徴を意味する。入力音声
パターンを同様に A=a|1、a|2…a|i…a|I と示す。
パターン Bn=〓1 n、〓2 n、…〓j n…〓n Jo を考える。ここにjは時刻を示し、〓j nは標準パ
ターンBnの時刻jの特徴を意味する。入力音声
パターンを同様に A=a|1、a|2…a|i…a|I と示す。
音声認識は、入力パターンAと標準パターン
Bnとのパターン間距離D(A、Bn)を求め、それ
が最小となるnを定め、認識結果とすることによ
つて行なわれる。
Bnとのパターン間距離D(A、Bn)を求め、それ
が最小となるnを定め、認識結果とすることによ
つて行なわれる。
DPマツチングではこのパターン間距離の計算
を一例として次のような動的計画法計算によつて
行なう。
を一例として次のような動的計画法計算によつて
行なう。
Γ初期条件
gn(1、1)=dn(1、1) ……(1)
Γ漸化式
gn(i、j)=dn(i、j)+mingn(i−1
、j) gn(i−1、j−1) gn(i−1、j−2) ……(2) i=1、2、…I j=1、2、…J Γパターン間距離 D(A、Bn)=gn(I、Jn) ……(3) ここにdn(i、j)は特徴a|iと〓j nの距離dn
(i、j)=‖a|i−〓j n‖である。これを積分した
形式となる。gn(i、j)を最適累積距離と呼ぶ。
、j) gn(i−1、j−1) gn(i−1、j−2) ……(2) i=1、2、…I j=1、2、…J Γパターン間距離 D(A、Bn)=gn(I、Jn) ……(3) ここにdn(i、j)は特徴a|iと〓j nの距離dn
(i、j)=‖a|i−〓j n‖である。これを積分した
形式となる。gn(i、j)を最適累積距離と呼ぶ。
このDPマツチング処理は当初、単語ごとに実
行されていたが、クロツクワイズDP法では各単
語に対して並列的に実行される形式に改良され
た。すなわち、第1図のような、i,j,nが張
る空間において入力パターンの各時刻iにおい
て、各標準パターンBnの指定nと、それらの中
のjのすべての組み合わせで指定されるn、に対
してgn(i、j)なる最適累積値を計算し、しか
る後に時刻iを進めて処理を実行するという方式
になつている。
行されていたが、クロツクワイズDP法では各単
語に対して並列的に実行される形式に改良され
た。すなわち、第1図のような、i,j,nが張
る空間において入力パターンの各時刻iにおい
て、各標準パターンBnの指定nと、それらの中
のjのすべての組み合わせで指定されるn、に対
してgn(i、j)なる最適累積値を計算し、しか
る後に時刻iを進めて処理を実行するという方式
になつている。
実際の計算においては図の空間のすべてのワー
クエリアを用意する必要はなく、i方向に関して
は、時刻iとi−1の2時刻分があれば(2)式の計
算を進めることができる。このような方法は、入
力パターンの特徴a|iの入力に同期して処理を進
めることができるので、発声と並行して認識のた
めの計算を進行することができ、実時間性が良い
とされている。
クエリアを用意する必要はなく、i方向に関して
は、時刻iとi−1の2時刻分があれば(2)式の計
算を進めることができる。このような方法は、入
力パターンの特徴a|iの入力に同期して処理を進
めることができるので、発声と並行して認識のた
めの計算を進行することができ、実時間性が良い
とされている。
(発明が解決しようとする問題点)
しかし、この方法を大語いの認識に適用しよう
とすると計算量が大となるという問題がある。(2)
式の漸化式はiの1サイクル内で、nとjのすべ
ての組合せについて実行しなくてはならない。標
準パターン長がJn=30で、1000語を認識しようと
すると、3×104の点で(2)式を計算することにな
る。1点あたり10μsで実行したとしても300ms
を要する。通常の音声認識ではiの量子化は20μs
程度で行なわれるので、このような大語いでは実
時間実行はとても不可能である。
とすると計算量が大となるという問題がある。(2)
式の漸化式はiの1サイクル内で、nとjのすべ
ての組合せについて実行しなくてはならない。標
準パターン長がJn=30で、1000語を認識しようと
すると、3×104の点で(2)式を計算することにな
る。1点あたり10μsで実行したとしても300ms
を要する。通常の音声認識ではiの量子化は20μs
程度で行なわれるので、このような大語いでは実
時間実行はとても不可能である。
本発明はクロツクワイズ型DPマツチングの有
する計算量が多いという上記欠点を改良して、高
速で大語い認識が可能でありながら低価格な音声
認識装置のパターンマツチング方式を提供するこ
とを目的とする。
する計算量が多いという上記欠点を改良して、高
速で大語い認識が可能でありながら低価格な音声
認識装置のパターンマツチング方式を提供するこ
とを目的とする。
(問題点を解決するための手段)
本発明によるパターンマツチング方式は、上記
クロツクワイズ型のDPマツチングの(2)式の漸化
式計算を実行するに当り、過去に計算された最適
累積値に基づいて新たな最適累積値gn(i、j)
を計算する点(n、j)を制限し、かつ各(n、
j)点における漸化式計算処理を、その近傍で計
算が実行された点(n′、j′)との相互関係に基づ
いて制御することを特徴とする。
クロツクワイズ型のDPマツチングの(2)式の漸化
式計算を実行するに当り、過去に計算された最適
累積値に基づいて新たな最適累積値gn(i、j)
を計算する点(n、j)を制限し、かつ各(n、
j)点における漸化式計算処理を、その近傍で計
算が実行された点(n′、j′)との相互関係に基づ
いて制御することを特徴とする。
(作用・原理)
元来DPマツチングは第1図の如きn、i、j
が張る空間において、各単語ごとに、(1、1)
点から(I、Jn)点に至る経路でdn(i、j)の
総和、すなわち累積値が最小となるものを探索す
るものである。この過程で計算される最適累積値
gn(i、j)は、単語nの(1、1)点から(i、
j)点に至る距離dn(i、j)の累積値を与えて
いる。したがつてgn(i、j)の値が大であると
いうことはこの点(i、j)が最適経路上にある
可能性が低いことを意味する。本発明の第1の特
徴はgn(i、j)が大となると予測される場合に
は、DPの漸化式計算を省略することによつて高
速化を図る点にある。
が張る空間において、各単語ごとに、(1、1)
点から(I、Jn)点に至る経路でdn(i、j)の
総和、すなわち累積値が最小となるものを探索す
るものである。この過程で計算される最適累積値
gn(i、j)は、単語nの(1、1)点から(i、
j)点に至る距離dn(i、j)の累積値を与えて
いる。したがつてgn(i、j)の値が大であると
いうことはこの点(i、j)が最適経路上にある
可能性が低いことを意味する。本発明の第1の特
徴はgn(i、j)が大となると予測される場合に
は、DPの漸化式計算を省略することによつて高
速化を図る点にある。
具体的には第2図に示すように、過去のクロツ
ク(i−1)で計算された最適累積値gn(i、j)
を所定の基準で検定し、その値が小である(n、
j)の点の集合w(図に○で表示)を定め、新た
な最適累積値gn(i、j)を算出するための(2)式
の漸化式計算は、これらの点の近傍のみで行なう
ものとする。
ク(i−1)で計算された最適累積値gn(i、j)
を所定の基準で検定し、その値が小である(n、
j)の点の集合w(図に○で表示)を定め、新た
な最適累積値gn(i、j)を算出するための(2)式
の漸化式計算は、これらの点の近傍のみで行なう
ものとする。
しかし、この方法をこのまま実行しようとする
第3図のような問題が残る。この図は単語nの
(i、j)点の近傍を拡大した図である。参照数
字1で示す孤立した点gn(i−1、j)が集合w
に含まれていたとする。(2)式の漸化式計算を行な
うとすると、このgn(i−1、j)は参照数字2,
3,4で示す3点の最適累積値、すなわちgn(i、
j)、gn(i、j+1)、gn(i、j+2)に影響を
及ぼす。したがつて、これら3点での漸化式計算
を行なう必要があるが、(2)式をそのまま実行した
のでは効率が悪い。なぜならば(i−1、j)の
近傍ではこの点だけが集合wに含まれていること
から gn(i−1、j)<gn(i−1、k) ……(4) k=j−2、j−1、j+1、j+2 であり、(2)式の漸化式計算結果が gn(i、j)=dn(i、j)+gn(i−
1、j) gn(i、j)=dn(i、j)+gn(i−
1、j) gn(i、j+1)=dn(i、j+1)+gn(i−1
、j) gn(i、j)=dn(i、j)+gn(i−
1、j) gn(i、j+1)=dn(i、j+1)+gn(i−1
、j) gn(i、j+2)=dn(i、j+2)+gn(i−1
、j)……(5) となるのは自明であるからである。それにもかか
わらず、(2)式をそのまま計算するのは不利であ
り、特に参照数字5,6,1,7,8のgn(i−
1、k)に対する3×3=9回のメモリアクセス
は処理速度を低下させる。
第3図のような問題が残る。この図は単語nの
(i、j)点の近傍を拡大した図である。参照数
字1で示す孤立した点gn(i−1、j)が集合w
に含まれていたとする。(2)式の漸化式計算を行な
うとすると、このgn(i−1、j)は参照数字2,
3,4で示す3点の最適累積値、すなわちgn(i、
j)、gn(i、j+1)、gn(i、j+2)に影響を
及ぼす。したがつて、これら3点での漸化式計算
を行なう必要があるが、(2)式をそのまま実行した
のでは効率が悪い。なぜならば(i−1、j)の
近傍ではこの点だけが集合wに含まれていること
から gn(i−1、j)<gn(i−1、k) ……(4) k=j−2、j−1、j+1、j+2 であり、(2)式の漸化式計算結果が gn(i、j)=dn(i、j)+gn(i−
1、j) gn(i、j)=dn(i、j)+gn(i−
1、j) gn(i、j+1)=dn(i、j+1)+gn(i−1
、j) gn(i、j)=dn(i、j)+gn(i−
1、j) gn(i、j+1)=dn(i、j+1)+gn(i−1
、j) gn(i、j+2)=dn(i、j+2)+gn(i−1
、j)……(5) となるのは自明であるからである。それにもかか
わらず、(2)式をそのまま計算するのは不利であ
り、特に参照数字5,6,1,7,8のgn(i−
1、k)に対する3×3=9回のメモリアクセス
は処理速度を低下させる。
以上では集合wに含まれる点がその近傍で完全
に孤立している場合の例を上げたが、同様のこと
は、集合wに含まれる点の近傍の点との関係にお
いて、程度の差こそあれ生じる。本発明は集合w
に含まれる点の近傍の相互関係によつて漸化式計
算を制御することによつて効率良くクロツクワイ
ズ型のDPマツチングを実行することを第2の特
徴とする。
に孤立している場合の例を上げたが、同様のこと
は、集合wに含まれる点の近傍の点との関係にお
いて、程度の差こそあれ生じる。本発明は集合w
に含まれる点の近傍の相互関係によつて漸化式計
算を制御することによつて効率良くクロツクワイ
ズ型のDPマツチングを実行することを第2の特
徴とする。
DP漸化式の例とし(2)式を考える。(n、j)∈
wとし、その直前に処理を行なつた点を(n′、j′)
∈wとする。いま漸化式計算を実行するプロセツ
サに密に結合されたレジスタR0、R1とR2をワー
クエリアとして考える。このとき(n、j)と
(n′、j′)との相互関係によつて制御される計算処
理の例は次のごとくである。
wとし、その直前に処理を行なつた点を(n′、j′)
∈wとする。いま漸化式計算を実行するプロセツ
サに密に結合されたレジスタR0、R1とR2をワー
クエリアとして考える。このとき(n、j)と
(n′、j′)との相互関係によつて制御される計算処
理の例は次のごとくである。
(A) n≠n′のとき
(A) n≠n′のとき
min(R1、R2)+dn′(i、j′+1)→gn′(i、
j′+1) R1+dn′(i、j′+2)→gn′(i、j′+2) gn(i−1、j)→R1 R1+dn(i、j)→gn(i、j) ∞→R2 n→n′、j→j′ ……(6−1) (B) n−n′、j−j′>2のとき (B) n−n′、j−j′>2のとき min(R1、R2)+dn(i、j′+1)→gn′(i、j
′+1) R1+dn(i、j′+2)→gn′(i、j′+2) gn′(i−1、j)→R1 R1+dn(i、j)→gn(i、j) ∞→R2 j→j′ ……(6−2) (C) n=n′、j−j′=2のとき (C) n=n′、j−j′=2のとき min(R1、R2)+dn(i、j′+1)→gn(i、j′
+1) gn(i−j、j)→R0 min(R0、R1)+dn(i、j)→gn(i、j) R0→R1 ∞→R2 j→j′ ……(6−3) (D) j−j′=1のとき gn(i−1、j)→R0 min(R0、R1、R2)+dn(i、j)→gn(i、j) R1→R2 R0→R1 j→j′ ……(6−4) 以上の各処理の始まる時点では、手続(6−
1)における、、、手続(6−2)におけ
る、、、手続(6−3)における、、
、手続(6−4)における、、の処理か
ら分るように、n′、j′には前回処理を行なつた
(n′、j′)点の情報が含まれ、R1にはgn(i−1、
j′)、R2にはgn′(i−1、j′−1)が記憶された状
態になつている。
j′+1) R1+dn′(i、j′+2)→gn′(i、j′+2) gn(i−1、j)→R1 R1+dn(i、j)→gn(i、j) ∞→R2 n→n′、j→j′ ……(6−1) (B) n−n′、j−j′>2のとき (B) n−n′、j−j′>2のとき min(R1、R2)+dn(i、j′+1)→gn′(i、j
′+1) R1+dn(i、j′+2)→gn′(i、j′+2) gn′(i−1、j)→R1 R1+dn(i、j)→gn(i、j) ∞→R2 j→j′ ……(6−2) (C) n=n′、j−j′=2のとき (C) n=n′、j−j′=2のとき min(R1、R2)+dn(i、j′+1)→gn(i、j′
+1) gn(i−j、j)→R0 min(R0、R1)+dn(i、j)→gn(i、j) R0→R1 ∞→R2 j→j′ ……(6−3) (D) j−j′=1のとき gn(i−1、j)→R0 min(R0、R1、R2)+dn(i、j)→gn(i、j) R1→R2 R0→R1 j→j′ ……(6−4) 以上の各処理の始まる時点では、手続(6−
1)における、、、手続(6−2)におけ
る、、、手続(6−3)における、、
、手続(6−4)における、、の処理か
ら分るように、n′、j′には前回処理を行なつた
(n′、j′)点の情報が含まれ、R1にはgn(i−1、
j′)、R2にはgn′(i−1、j′−1)が記憶された状
態になつている。
上記(A)は単語が切り替つた場合の処理で、直前
に処理していた単語n′に対して手続(6−1)の
、の処理を行なう。このとき、R1にはgn(i
−1、j′)が、R2にはgn(i−1、j′−1)が含ま
れている。(2)式に照し合わせて、これらのデータ
から計算可能なのはgn′(i、j′+1)とgn′(i、
j′+2)であることが分かる。それゆえ、これら
のレジスタ内のデータを基にして、 gn′(i、j′+1)=dn(i、j′+1)+
mingn′(i、j′) gn′(i、j′−1) ……(7) と、 gn′(i、j′+2)=dn(i、j′+2)+gn′(i、j′) ……(8) なる形で(2)式を簡略化して計算を行なう。続いて
(n、j)点に対する処理を行なう。R1にgn(i
−1、を読み出す。(n、j−1)、(n、j−2)
は集合wに含まれていないので、gn(i、j)は
このデータのみで確定するとしてが実行され
る。やはり、(n、j−1)が集合wに含まれて
いないことからgn(i−1、j−1)=∞とみなし
てR2には∞をセツトしておく。
に処理していた単語n′に対して手続(6−1)の
、の処理を行なう。このとき、R1にはgn(i
−1、j′)が、R2にはgn(i−1、j′−1)が含ま
れている。(2)式に照し合わせて、これらのデータ
から計算可能なのはgn′(i、j′+1)とgn′(i、
j′+2)であることが分かる。それゆえ、これら
のレジスタ内のデータを基にして、 gn′(i、j′+1)=dn(i、j′+1)+
mingn′(i、j′) gn′(i、j′−1) ……(7) と、 gn′(i、j′+2)=dn(i、j′+2)+gn′(i、j′) ……(8) なる形で(2)式を簡略化して計算を行なう。続いて
(n、j)点に対する処理を行なう。R1にgn(i
−1、を読み出す。(n、j−1)、(n、j−2)
は集合wに含まれていないので、gn(i、j)は
このデータのみで確定するとしてが実行され
る。やはり、(n、j−1)が集合wに含まれて
いないことからgn(i−1、j−1)=∞とみなし
てR2には∞をセツトしておく。
上記(B)は同一単語でjがj′より2以上離れてい
る場合であるが、処理の内容は(a)の場合と類似し
ている。(n=n′とすればまつたく同じ)ので説
明を省略する。
る場合であるが、処理の内容は(a)の場合と類似し
ている。(n=n′とすればまつたく同じ)ので説
明を省略する。
上記の(C)は同一単語でjがj′と2だけ離れてい
る場合である。このときR1にはgn(i−1、j′)、
R2にはgn(i−1、j′−1)が記憶されている。
(n、j′+1)が集合wに含まれないことから、
gn(i、j′+1)はこれらの2データより決定さ
れるゆえによつて gn(i、j′+1)=mingn(i−1、j′) gn(i−1、j′−1)
……(9) なる形で(2)式を簡略化して実行する。次いでR0
にgn(i、j)を読み出す。(n、j−1)が集合
wに含まれていないこと、R1にgn(i−1、j′)
としてgn(i−1、j−2)が記憶されているこ
とからによつて gn(i、j)=mingn(i−1、j) gn(i−1、j−2) ……(10) なる(2)式の簡略形を実行する。によつてR1に
gn(i−1、j)をセツトし、によつて集合w
に含まれないgn(i−1、j−1)に代わるもの
として∞をR2にセツトする。
る場合である。このときR1にはgn(i−1、j′)、
R2にはgn(i−1、j′−1)が記憶されている。
(n、j′+1)が集合wに含まれないことから、
gn(i、j′+1)はこれらの2データより決定さ
れるゆえによつて gn(i、j′+1)=mingn(i−1、j′) gn(i−1、j′−1)
……(9) なる形で(2)式を簡略化して実行する。次いでR0
にgn(i、j)を読み出す。(n、j−1)が集合
wに含まれていないこと、R1にgn(i−1、j′)
としてgn(i−1、j−2)が記憶されているこ
とからによつて gn(i、j)=mingn(i−1、j) gn(i−1、j−2) ……(10) なる(2)式の簡略形を実行する。によつてR1に
gn(i−1、j)をセツトし、によつて集合w
に含まれないgn(i−1、j−1)に代わるもの
として∞をR2にセツトする。
最後の(D)は、同一単語でjとj′が1だけ離れて
いる場合、すなわち連続している場合である。
によつてR0にgn(i−1、j)を読み出した後、
によつて(2)式をそのまま実行する。、によ
つてR1にはgn(i−1、j)が、R2にはgn(i−
1、j−1)がセツトされる。
いる場合、すなわち連続している場合である。
によつてR0にgn(i−1、j)を読み出した後、
によつて(2)式をそのまま実行する。、によ
つてR1にはgn(i−1、j)が、R2にはgn(i−
1、j−1)がセツトされる。
以上述べた方法によると、多くの場合漸化式(2)
を(7)〜(10)式のように簡略化して計算することがで
き、第3図のような不利を避けることができる。
しかもgn(i−1、j)のメモリへのアクセスは
上記(A)〜(D)のいずれのケースでも各1回であり、
実効的な高速化が可能となる。
を(7)〜(10)式のように簡略化して計算することがで
き、第3図のような不利を避けることができる。
しかもgn(i−1、j)のメモリへのアクセスは
上記(A)〜(D)のいずれのケースでも各1回であり、
実効的な高速化が可能となる。
(実施例)
第4図は本発明によるパターンマツチング方式
に基づいた離散単語型の音声認識装置の構成例を
示すブロツク図であり、第5図はその動作を示す
フローチヤートである。マイクロホン10より入
力された音声信号は分析部10によつて周波数分
析され、マイクロプロセツサ30に入力される。
マイクロプロセツサ30には前記の手続(6−
1)〜(6−4)で使用するためのレジスタR0、
R1、R2が内蔵されている。また外部には標準パ
ターンBn=〓1 n、…〓n j、…〓nJoを記憶するため
の標準パターン記憶部40と、gn(i、j)のワ
ークメモりとなるgメモリ50とが接続されてい
る。
に基づいた離散単語型の音声認識装置の構成例を
示すブロツク図であり、第5図はその動作を示す
フローチヤートである。マイクロホン10より入
力された音声信号は分析部10によつて周波数分
析され、マイクロプロセツサ30に入力される。
マイクロプロセツサ30には前記の手続(6−
1)〜(6−4)で使用するためのレジスタR0、
R1、R2が内蔵されている。また外部には標準パ
ターンBn=〓1 n、…〓n j、…〓nJoを記憶するため
の標準パターン記憶部40と、gn(i、j)のワ
ークメモりとなるgメモリ50とが接続されてい
る。
このgメモリ50は、gn(i−1、j)とgn
(i、j)のための2段分用意され、各単語nご
とにj=1、2、…Jn、Jn+1、Jn+2のアドレ
スを有している。この最後の2個は、手続(6−
1)の処理においてj′−Jn′であつたとき、が
空回りするためのエリアとなるものである。ま
た、n=0に対してはj=0、j=−1の2アド
レスが余分に用意されている。これについては後
で説明する。
(i、j)のための2段分用意され、各単語nご
とにj=1、2、…Jn、Jn+1、Jn+2のアドレ
スを有している。この最後の2個は、手続(6−
1)の処理においてj′−Jn′であつたとき、が
空回りするためのエリアとなるものである。ま
た、n=0に対してはj=0、j=−1の2アド
レスが余分に用意されている。これについては後
で説明する。
最初の入力ベクトルa|1が与えらえると、gメ
モリ50内のgn(i−1、j)に対して次のよう
な初期設定が行なわれる。
モリ50内のgn(i−1、j)に対して次のよう
な初期設定が行なわれる。
gn(1、1)=dn(1、1)
gn(1、j)=∞(j≠1) ……(11)
これらは特願56−199098号明細書第6図aの場
合と同様である。
合と同様である。
一般的に時刻iでは第5図に示す処理が実行さ
れる。まずa|iが入力されるとブロツク100により
gメモリ50内のgn(i、j)のテーブルを総て
∞でリセツトする。これは虫喰い的に漸化式計算
を行なうことにより生じる未定義の累積距離gn
(i、j)が次の時刻i+1で不都合を生じさせ
ないようにするためである。次にn=1、n′=
0、j′=−2なる初期設定がなされる。n′=0、
j′=−2とするのは、このiサイクルで最初に手
続(6−1)の処理が実行されるときとの処
理が、先に説明したg0(i、−1)とg0(i、0)
で空回りできるようにするためである。
れる。まずa|iが入力されるとブロツク100により
gメモリ50内のgn(i、j)のテーブルを総て
∞でリセツトする。これは虫喰い的に漸化式計算
を行なうことにより生じる未定義の累積距離gn
(i、j)が次の時刻i+1で不都合を生じさせ
ないようにするためである。次にn=1、n′=
0、j′=−2なる初期設定がなされる。n′=0、
j′=−2とするのは、このiサイクルで最初に手
続(6−1)の処理が実行されるときとの処
理が、先に説明したg0(i、−1)とg0(i、0)
で空回りできるようにするためである。
一般的な(n、j)に対しては、ブロツク120
でgn(i−1、j)をR0に読み出し、130で閾値
θ(i)との比較を行なう。これは先に述べた集合w
にこの(n、j)が含まれるか否かのテストであ
る。閾値θ(i)はiの単調増加関数として予かじめ
与えられている。R0>θ(i)のときは、このjに
対する処理はすべて省略される。R0<θ(i)のと
きはnとn′、jとj′の関係がテストされ、それぞ
れに応じて(6−1)、(6−3)、(6−4)のい
ずれかの処理がなされる。なお、(6−2)の処
理は本質的に同等な(6−1)とまとめてブロツ
ク140に示している。また、gn(i−1、j)は
120のブロツクでR0に読み出されているので、
(6−1)式の等はR0からの転送でよく、(6
−3)の等は省略してもよい。
でgn(i−1、j)をR0に読み出し、130で閾値
θ(i)との比較を行なう。これは先に述べた集合w
にこの(n、j)が含まれるか否かのテストであ
る。閾値θ(i)はiの単調増加関数として予かじめ
与えられている。R0>θ(i)のときは、このjに
対する処理はすべて省略される。R0<θ(i)のと
きはnとn′、jとj′の関係がテストされ、それぞ
れに応じて(6−1)、(6−3)、(6−4)のい
ずれかの処理がなされる。なお、(6−2)の処
理は本質的に同等な(6−1)とまとめてブロツ
ク140に示している。また、gn(i−1、j)は
120のブロツクでR0に読み出されているので、
(6−1)式の等はR0からの転送でよく、(6
−3)の等は省略してもよい。
以上の処理をn、jの2重ループとして回すこ
とによつて時刻iのサイクルは終了する。このサ
イクルで計算されたgn(i、j)を過去の最適累
積値gn(i−1、j)として切り替えて次のi+
1のサイクルに移行する。
とによつて時刻iのサイクルは終了する。このサ
イクルで計算されたgn(i、j)を過去の最適累
積値gn(i−1、j)として切り替えて次のi+
1のサイクルに移行する。
かくして時刻Iまでの処理が行なわれ、入力音
声が終了しi=I+1となつた時点では、各単語
nごとにgメモリ50内にgn(i−1、Jn)とし
てパターン間距離D(A、Bn)が得られる。これ
らを比較して最小となる単語n=n^として認識結
果を定め出力する。
声が終了しi=I+1となつた時点では、各単語
nごとにgメモリ50内にgn(i−1、Jn)とし
てパターン間距離D(A、Bn)が得られる。これ
らを比較して最小となる単語n=n^として認識結
果を定め出力する。
以上、本発明の原理を実施例に基づいて述べた
が、これらは本発明の範囲を限定するものではな
い。特に、第3図におけるブロツク130の判定処
理には種々の変形が考えられる。閾値θ(i)の定め
方に関しても、予じめ人手によつて定義しておく
方法の他に、gn(i−1、j)の最小値にリンク
させて設定するなどの変形が考えられ、本発明の
権利範囲に属するものである。
が、これらは本発明の範囲を限定するものではな
い。特に、第3図におけるブロツク130の判定処
理には種々の変形が考えられる。閾値θ(i)の定め
方に関しても、予じめ人手によつて定義しておく
方法の他に、gn(i−1、j)の最小値にリンク
させて設定するなどの変形が考えられ、本発明の
権利範囲に属するものである。
また以上の説明では、基本的な漸化式として(2)
式を用いたが、「日経エレクトロニクスの1983年
11月7日号第184頁の表1」に記載されるが如き、
種々の変形の漸化式についても本発明の原理は適
用される。さらに本発明は特願昭56−199098記載
のクロツクワイズDP法と同様連続単語認識に利
用できるものである。
式を用いたが、「日経エレクトロニクスの1983年
11月7日号第184頁の表1」に記載されるが如き、
種々の変形の漸化式についても本発明の原理は適
用される。さらに本発明は特願昭56−199098記載
のクロツクワイズDP法と同様連続単語認識に利
用できるものである。
(発明の効果)
以上述べた本発明の原理によるとDP漸化式の
計算を、必要な(n、j)点のみで、極めて無駄
なく実行することができ、安価かつ高速な音声認
識装置を実現・提供できる。
計算を、必要な(n、j)点のみで、極めて無駄
なく実行することができ、安価かつ高速な音声認
識装置を実現・提供できる。
第1図、第2図、第3図は本発明の原理説明
図、第4図は実施例ブロツク図、第5図はその動
作を説明するフローチヤートである。 10……マイクロホン、20……分析部、30
……マイクロプロセツサ、40……標準パターン
記憶部、50……gメモリ。
図、第4図は実施例ブロツク図、第5図はその動
作を説明するフローチヤートである。 10……マイクロホン、20……分析部、30
……マイクロプロセツサ、40……標準パターン
記憶部、50……gメモリ。
Claims (1)
- 1 各単語nの標準パターンを特徴〓j nの時系列
Bn=〓1 n…〓j n…〓n Joとして記憶する手段と、入
力音声パターンの特徴a|iを一時保存する手段と、
それぞれの単語nに対応して前記特徴a|iと〓j nと
の距離dn(i、j)の最適累積値gn(i、j)を動
的計画法の漸化式によつて計算する手段とを有
し、各時刻iにて、過去の最適累積値に基づいて
新たな最適累積値gn(i、j)を計算する(n、
j)を制限し、かつ各(n、j)点における漸化
式計算処理を、直前に計算されたnとjの点
(n′、j′)との相互関係で制御することを特徴とす
る高能率パターンマツチング方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62061735A JPS63226696A (ja) | 1987-03-16 | 1987-03-16 | 高能率パタ−ンマッチング方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62061735A JPS63226696A (ja) | 1987-03-16 | 1987-03-16 | 高能率パタ−ンマッチング方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS63226696A JPS63226696A (ja) | 1988-09-21 |
| JPH0465396B2 true JPH0465396B2 (ja) | 1992-10-19 |
Family
ID=13179751
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62061735A Granted JPS63226696A (ja) | 1987-03-16 | 1987-03-16 | 高能率パタ−ンマッチング方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS63226696A (ja) |
-
1987
- 1987-03-16 JP JP62061735A patent/JPS63226696A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS63226696A (ja) | 1988-09-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9196252B2 (en) | Selective enablement of speech recognition grammars | |
| JP3459712B2 (ja) | 音声認識方法及び装置及びコンピュータ制御装置 | |
| US5073939A (en) | Dynamic time warping (DTW) apparatus for use in speech recognition systems | |
| JPH0159600B2 (ja) | ||
| JPS6223320B2 (ja) | ||
| JP2004101901A (ja) | 音声対話装置及び音声対話プログラム | |
| JP2980026B2 (ja) | 音声認識装置 | |
| US6484141B1 (en) | Continuous speech recognition apparatus and method | |
| JPS60211498A (ja) | 連続音声認識装置 | |
| JPS61118850A (ja) | マイクロプロセツサ | |
| JPH0582599B2 (ja) | ||
| JPH0465396B2 (ja) | ||
| JP2000075879A (ja) | 音声合成方法及び装置 | |
| JPH0465397B2 (ja) | ||
| JP3094473B2 (ja) | 動的計画法照合装置 | |
| JPH0465395B2 (ja) | ||
| Janin et al. | Speechcorder, the portable meeting recorder | |
| US6452517B1 (en) | DSP for two clock cycle codebook search | |
| JP3348735B2 (ja) | パターン照合方式 | |
| JPH10260831A (ja) | 信号処理装置 | |
| JP2024151738A (ja) | プログラム、情報処理装置および情報処理方法 | |
| JPS59117632A (ja) | 音声入力方式 | |
| JP2000099077A (ja) | 音声認識装置 | |
| JPH09179582A (ja) | 音声認識装置 | |
| JPS6122350B2 (ja) |