JPH01159698A - パターン認識用モデル作成装置 - Google Patents
パターン認識用モデル作成装置Info
- Publication number
- JPH01159698A JPH01159698A JP62318141A JP31814187A JPH01159698A JP H01159698 A JPH01159698 A JP H01159698A JP 62318141 A JP62318141 A JP 62318141A JP 31814187 A JP31814187 A JP 31814187A JP H01159698 A JPH01159698 A JP H01159698A
- Authority
- JP
- Japan
- Prior art keywords
- hmm
- state
- transition
- probability
- series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は音声認識等のパターン認識に適用可能なパター
ン認識用モデル作成装置に間する。
ン認識用モデル作成装置に間する。
従来の技術
本発明は一般のパターン認識に適用可能なものであるが
、説明の便宜のために、以下、音声認識を例に説明する
。
、説明の便宜のために、以下、音声認識を例に説明する
。
音声認識装置について説明する。
第5図は、HMMを用いた音声認識装置のブロック図で
ある。
ある。
1’ 1は音声分析部であって、人力音声信号をフィル
タバンク、フーリエ変換、r、 p c分析等の周知の
方法により、一定時間間隔(フレームと呼ぶ)例えば1
0m5ec毎に特徴ベクトルに変換する。従って、人力
音声信号は特徴ベクトルの系列X+、X2、・・・、X
rに変換される。
タバンク、フーリエ変換、r、 p c分析等の周知の
方法により、一定時間間隔(フレームと呼ぶ)例えば1
0m5ec毎に特徴ベクトルに変換する。従って、人力
音声信号は特徴ベクトルの系列X+、X2、・・・、X
rに変換される。
14は旧dden Markov Model (以下
HMMと略記する)作成部であって、訓練データから認
識語倹たる各単語に対応するHMMを作成するものであ
る。即ち、惧語nに対応するHMMを作るには、先ず、
HMMの構造(状態数やそれら状態の間に許される遷移
規則)を適当に定め、然る後に前記の如くして単Mnを
多数回発声して得られた特徴ベクトルの系列から、それ
らベクトル系列の発声確率が出来るだけ高くなるように
、前記モデルニおける状態遷移確率や状態の遷移に伴っ
て発生するベクトルの発生確率を求めるものである。
HMMと略記する)作成部であって、訓練データから認
識語倹たる各単語に対応するHMMを作成するものであ
る。即ち、惧語nに対応するHMMを作るには、先ず、
HMMの構造(状態数やそれら状態の間に許される遷移
規則)を適当に定め、然る後に前記の如くして単Mnを
多数回発声して得られた特徴ベクトルの系列から、それ
らベクトル系列の発声確率が出来るだけ高くなるように
、前記モデルニおける状態遷移確率や状態の遷移に伴っ
て発生するベクトルの発生確率を求めるものである。
15はHMM記憶部であって、このようにして得られた
HMMを各単語毎に記憶するものである。
HMMを各単語毎に記憶するものである。
16は頻度計算部であって、認識すべき未知人力音声の
特徴ベクトル系列に対し、前記HMM記憶部15に記憶
されているそれぞれのモデルからそのベクトル系列の発
生する頻度を計算するものである。
特徴ベクトル系列に対し、前記HMM記憶部15に記憶
されているそれぞれのモデルからそのベクトル系列の発
生する頻度を計算するものである。
17は比較判定部であって頻度計算部16で得られた前
記それぞれのモデルに対する頻度を比較し、その最大値
を与えるモデルに対応するQIMを認識結果として判定
するものである。
記それぞれのモデルに対する頻度を比較し、その最大値
を与えるモデルに対応するQIMを認識結果として判定
するものである。
HMMによる認識は次のようにして行われる。
即ち、未知入力に対して得られた特徴ベクトル系列をX
” XI 、X2 、+++ 9XT % モデル
M(n)ニよす発生されるTの長さの任意の状態系列を
5=sl。
” XI 、X2 、+++ 9XT % モデル
M(n)ニよす発生されるTの長さの任意の状態系列を
5=sl。
s2.・・・、Srとするとき、 M(n)からベクト
ル系列Xの発生する頻度は 〔厳密解〕 L(n)=Σ Prob(X 、 S )〔近似解〕 1、(n) = max[Prob(X 、 S )]
または、対数をとって L(n) = may[log(Prob(X 、S
))]で与えられる。従って、 F+ = argmax[L(n)コとするとき、
5が認識結果となる。
ル系列Xの発生する頻度は 〔厳密解〕 L(n)=Σ Prob(X 、 S )〔近似解〕 1、(n) = max[Prob(X 、 S )]
または、対数をとって L(n) = may[log(Prob(X 、S
))]で与えられる。従って、 F+ = argmax[L(n)コとするとき、
5が認識結果となる。
ここで、argmax[L(n)]はL(n)を最大に
するnのことである。
するnのことである。
発明が解決しようとする問題点
従来、音声認識に用いられている典型的なHMMは第6
図に示されるようなものである。図において、ql は
i番目の状態、atjは状態q、から状態q、に遷移す
る遷移確率、bt(x)はラベルあるいは特徴ベクトル
X(以後、特徴ベクトルで説明する)の状態q1におい
て観測される確率である。
図に示されるようなものである。図において、ql は
i番目の状態、atjは状態q、から状態q、に遷移す
る遷移確率、bt(x)はラベルあるいは特徴ベクトル
X(以後、特徴ベクトルで説明する)の状態q1におい
て観測される確率である。
このとき、HMMの”状態”q+ は、そのHMMに対
応する音声の部分区閏(セグメント)iに対応している
と考えられる。従って、状態q1 において特徴ベクト
ルXの観測される確率b+ (x)は、セグメントiに
おいて特徴ベクトルXが発生する確率であり、遷移確率
at+は時刻tにおける特徴ベクトルxtがセグメント
iに含まれるとき、時刻1+1におけるベクトルXth
+が再びセグメントiに含まれる確率であると解される
。このような考えに立てば、従来のHMMにおける問題
点として次の2点が指摘できる。
応する音声の部分区閏(セグメント)iに対応している
と考えられる。従って、状態q1 において特徴ベクト
ルXの観測される確率b+ (x)は、セグメントiに
おいて特徴ベクトルXが発生する確率であり、遷移確率
at+は時刻tにおける特徴ベクトルxtがセグメント
iに含まれるとき、時刻1+1におけるベクトルXth
+が再びセグメントiに含まれる確率であると解される
。このような考えに立てば、従来のHMMにおける問題
点として次の2点が指摘できる。
(+) b;(x)は状態q、−に関して一定であると
しているので、それぞれのセグメントはその区問内にお
いては定常であるとみなしていることになる。
しているので、それぞれのセグメントはその区問内にお
いては定常であるとみなしていることになる。
従って、音韻によっては特徴ベクトルの時閉的な変化の
特徴(動的特徴)が重要であるにもかかわらず、従来の
モデルでは、その特徴が適切に表現できない。
特徴(動的特徴)が重要であるにもかかわらず、従来の
モデルでは、その特徴が適切に表現できない。
(2)セグメントiの長さてはある確率分布に従ってい
るものと考えられるが、従来のモデルでは、遷移確率a
++)aijは状態q、に関して一定であるとしている
ので、セグメントlの長さは指数分布に従うことになり
、その分布形状は現実を適切に表現するものとはなって
いない。
るものと考えられるが、従来のモデルでは、遷移確率a
++)aijは状態q、に関して一定であるとしている
ので、セグメントlの長さは指数分布に従うことになり
、その分布形状は現実を適切に表現するものとはなって
いない。
本発明は、(2)の問題に着目し、状B Qi におい
てq、→q、なる遷移に対する遷移確率がその回数に応
じて指数関数的に減少するようになしたHMMを構成す
ることによって、その問題の解決を図る方法を提供する
ものである。
てq、→q、なる遷移に対する遷移確率がその回数に応
じて指数関数的に減少するようになしたHMMを構成す
ることによって、その問題の解決を図る方法を提供する
ものである。
このようにすることによって状態の連の長さの分布をよ
り現実に近くすることが出来る。
り現実に近くすることが出来る。
問題点を解決するための手段
人力信号を特徴ベクトルの系列に変換する特徴抽出手段
と、カテゴリR(n)(n:1,2.・・・、N)のそ
れぞれに対し、予めR(n)に属することが分かってい
る、前記抽出された特徴ベクトルの系列から、11id
den Markov Model (HMM)を作成
するHMM作成手段を備え、このHMM作成手段は、そ
のHMMを構成するそれぞれの状態において同じ状態に
遷移する遷移確率が遷移回数に応じて指数関数的に減少
するようになしたものである。
と、カテゴリR(n)(n:1,2.・・・、N)のそ
れぞれに対し、予めR(n)に属することが分かってい
る、前記抽出された特徴ベクトルの系列から、11id
den Markov Model (HMM)を作成
するHMM作成手段を備え、このHMM作成手段は、そ
のHMMを構成するそれぞれの状態において同じ状態に
遷移する遷移確率が遷移回数に応じて指数関数的に減少
するようになしたものである。
作用
特徴抽出手段により入力信号を特徴ベクトルの系列に変
換し、Hidden Markov Model (H
MM)を作成するHMM作成手段により、カテゴリR(
n)(n=I、2.・・・、N)のそれぞれに対し、予
めR(n)に属することが分かっている、前記抽出され
た特徴ベクトルの系列からHMMを作成し、このHMM
作成手段は、そのHMMを構成するそれぞれの状態にお
いて同じ状態に遷移する遷移確率が遷移回数に応じて指
数間数的に減少するようになしたものである。
換し、Hidden Markov Model (H
MM)を作成するHMM作成手段により、カテゴリR(
n)(n=I、2.・・・、N)のそれぞれに対し、予
めR(n)に属することが分かっている、前記抽出され
た特徴ベクトルの系列からHMMを作成し、このHMM
作成手段は、そのHMMを構成するそれぞれの状態にお
いて同じ状態に遷移する遷移確率が遷移回数に応じて指
数間数的に減少するようになしたものである。
実施例
第1図はここで提案するHMMの概念を示す図である。
a+j(τ)は状態(Iがτ連続したとき次に状態q、
になる遷移確率、b + (x tτ)は状態q1がτ
連続したとき発生する特徴ベクトルXの確率密度関数で
ある。
になる遷移確率、b + (x tτ)は状態q1がτ
連続したとき発生する特徴ベクトルXの確率密度関数で
ある。
これは第2図のように等価な一重のマルコフモデルに書
き替えることが出来る。即ち、状態q1をq i Hq
i +・・・、ql、・・・に分け、状態q、がτ1
2 で連続したとき、状
態Q + Tに至るとするものである。
き替えることが出来る。即ち、状態q1をq i Hq
i +・・・、ql、・・・に分け、状態q、がτ1
2 で連続したとき、状
態Q + Tに至るとするものである。
従って、(λ態Q i rから状態q1□、1への遷移
確率a・、・7,1・伏Hqlrにおいて発生する特徴
ベクトルXの確率密度間数b+ (x)はそれぞれa+
、t、、、 ” a;t(r)、 biXX) ” b
+(xpr)となる。
確率a・、・7,1・伏Hqlrにおいて発生する特徴
ベクトルXの確率密度間数b+ (x)はそれぞれa+
、t、、、 ” a;t(r)、 biXX) ” b
+(xpr)となる。
第3図は、第2図に対応したHMMのトレリス線図であ
る。ここで提案するモデルにおいては、確率密度間数b
l T (X )の平均ベクトルはτに関する一次閏
数であって、τ=1の場合はその方向ベクトルは不定と
なって定義できないから、どの状態においても、常にτ
≧2となるべきであるから、この線図においてもて=1
の径路は省いである。
る。ここで提案するモデルにおいては、確率密度間数b
l T (X )の平均ベクトルはτに関する一次閏
数であって、τ=1の場合はその方向ベクトルは不定と
なって定義できないから、どの状態においても、常にτ
≧2となるべきであるから、この線図においてもて=1
の径路は省いである。
ここで、以後の議論の便宜のために以後用いる記号の定
義をまとめておく。
義をまとめておく。
q;: (qt tQ; j・・・):第1番の状態(
i=1.・・・tn)qi:状態用においてkの連が生
じたとき到達する状m<状態qrの副状態) 遷移確率 A =[at1]:遷移マトリクス a1:状態q、から状態(Hへの遷移確率b+ (xt
戸bり+、 (xt):状態橿の特徴ベク)ルxt″。
i=1.・・・tn)qi:状態用においてkの連が生
じたとき到達する状m<状態qrの副状態) 遷移確率 A =[at1]:遷移マトリクス a1:状態q、から状態(Hへの遷移確率b+ (xt
戸bり+、 (xt):状態橿の特徴ベク)ルxt″。
の確率密度間数
治:時刻tにおいて観測される特徴ベクトルX : X
1x2・・・xT:時刻1・・・Tにおいて観測される
特徴ベクトル系列 λ=(A、(u+>T o(ul)T 、(Σ、ど
t(7i)’ ):モデ+ −1+−1+1
+−1ルのパラメータ Prob(XIλ):特徴ベクトル系列Xがモデルλか
ら発生する確率 sL:時刻tにおける状態 qr:最終の状態(:5T−1) 通常のHMMの場合と同様にして、モデル入から観測系
列Xの発生する確率Prob(XIλ)は、前向きの累
積確率αt(i)、あるいは後向きの累積確率β=(i
)から漸化的に計算できる。即ち、αt(i) = P
rob(xyx2=xt−+、 st :qt Iλ
)Vaq1g2 tL+2(X2) a9253°”
a!t−2”t−1ybs (Xt−1) ast−
+41t −+ βr(i) = Prob(xtxt++°”XT
I St ” qi + λ)×kls (xt
−+)as s b、 (Xt+2)1+
+ 1をIt)2を争2xasl+
2’ti°= b9(XT) asyq。
1x2・・・xT:時刻1・・・Tにおいて観測される
特徴ベクトル系列 λ=(A、(u+>T o(ul)T 、(Σ、ど
t(7i)’ ):モデ+ −1+−1+1
+−1ルのパラメータ Prob(XIλ):特徴ベクトル系列Xがモデルλか
ら発生する確率 sL:時刻tにおける状態 qr:最終の状態(:5T−1) 通常のHMMの場合と同様にして、モデル入から観測系
列Xの発生する確率Prob(XIλ)は、前向きの累
積確率αt(i)、あるいは後向きの累積確率β=(i
)から漸化的に計算できる。即ち、αt(i) = P
rob(xyx2=xt−+、 st :qt Iλ
)Vaq1g2 tL+2(X2) a9253°”
a!t−2”t−1ybs (Xt−1) ast−
+41t −+ βr(i) = Prob(xtxt++°”XT
I St ” qi + λ)×kls (xt
−+)as s b、 (Xt+2)1+
+ 1をIt)2を争2xasl+
2’ti°= b9(XT) asyq。
とおけば、a++”l、α1(1)=l、a + (i
)=αt(1)1l =0 (for i≠l、t≠1)、βr、I(f):
lとしてゞ(+−a・7・□、、)a・1 xrI h、(xt−□−++k) ・・・・・・・
・・・・・・・・・・・■に−1k x rT b;、(xt−++k)βt−r(j)
−−=■であるから、 Prob(xyx2−xy、 st−+=q; lλ)
x(a+、β、(J) + Prob(xtlst−+=q:t、λ) aij
βt、+(J)+ Prob(xtxt、+ 1st
−+” Q〒λ)a−」βt÷2(j)+ Prob(
xt−xr−t 1st−+” qt、、λ)al β
r−+++’(j)) に注意すれは、結局、任意のtE[3,T]に対してX
Σ nat: 、87 k=、 k−1し ×(1−a:+ )aI」 IIII會1 ×■b+ (xt 7−1+、)β、−7□(j)k=
+ k ・・・・・・・・・■ となる。特に Prob(XIλ) ” ar、+(f) :Σ β1
(1)−二1 である。
)=αt(1)1l =0 (for i≠l、t≠1)、βr、I(f):
lとしてゞ(+−a・7・□、、)a・1 xrI h、(xt−□−++k) ・・・・・・・
・・・・・・・・・・・■に−1k x rT b;、(xt−++k)βt−r(j)
−−=■であるから、 Prob(xyx2−xy、 st−+=q; lλ)
x(a+、β、(J) + Prob(xtlst−+=q:t、λ) aij
βt、+(J)+ Prob(xtxt、+ 1st
−+” Q〒λ)a−」βt÷2(j)+ Prob(
xt−xr−t 1st−+” qt、、λ)al β
r−+++’(j)) に注意すれは、結局、任意のtE[3,T]に対してX
Σ nat: 、87 k=、 k−1し ×(1−a:+ )aI」 IIII會1 ×■b+ (xt 7−1+、)β、−7□(j)k=
+ k ・・・・・・・・・■ となる。特に Prob(XIλ) ” ar、+(f) :Σ β1
(1)−二1 である。
以後、表記の簡単化と、式の見通しを良くするために、
次のようにおく。
次のようにおく。
即ち、^(1,τ)は状態q1の連の長さがτである確
率、B (i + t + r)は状態系列5L−r”
’5L−1” qi ””q; 、1 τ St”Qj (j≠I)において、5t−r”・5t−
1に対応してXt−r・・・xt−+の観測される確率
、C(i 、 t、τ)はその同時確率である。
率、B (i + t + r)は状態系列5L−r”
’5L−1” qi ””q; 、1 τ St”Qj (j≠I)において、5t−r”・5t−
1に対応してXt−r・・・xt−+の観測される確率
、C(i 、 t、τ)はその同時確率である。
L工Ω1定
従来のモデルと同様に、遷移確率aiiは状態q。
を訪れる回数の期待値に対する状Bq、から状態q、へ
の遷移回数の期待値であって、 となる。ただし、第1図〜第3図、第6図で示されるモ
デルの場合はat 7”l (j=+ +l)、aI4
”0(J≠1+1)である。
の遷移回数の期待値であって、 となる。ただし、第1図〜第3図、第6図で示されるモ
デルの場合はat 7”l (j=+ +l)、aI4
”0(J≠1+1)である。
、′べ 、・・
特徴ベクトルの分布を正規分布とし、状態q、内におい
て、その平均値をμm、分散共分散行列をΣ、とする。
て、その平均値をμm、分散共分散行列をΣ、とする。
簡単のために、μmは状態q、内では時間に関わらず一
定であるとする。
定であるとする。
ユ」1淀
ば
Prob(XIλ):Σ Prob(X、Slλ)であ
って、弐〇は状態Q+を含む状態系列が対象になり、そ
れ以外の系列に対してはこの偏微分はOとなるから、結
局、式■は次のようになる。
って、弐〇は状態Q+を含む状態系列が対象になり、そ
れ以外の系列に対してはこの偏微分はOとなるから、結
局、式■は次のようになる。
故に、μmの推定値litは式■(表)のようになる。
式■において、右辺の分子は状Bq+ における観測ベ
クトルの総和の期待値、分母は状態q、の連の長さの期
待値であって、その比がμmの推定値となっている。従
って、 μmは状態q、における特徴ベクトルXの期待
値に相当する。
クトルの総和の期待値、分母は状態q、の連の長さの期
待値であって、その比がμmの推定値となっている。従
って、 μmは状態q、における特徴ベクトルXの期待
値に相当する。
1」ml定
μ、の推定式■において、ΣXt−r−1+にのかねに
鵞I りに におきかえることにより、同様にして弐〇(表)が得ら
れる。
鵞I りに におきかえることにより、同様にして弐〇(表)が得ら
れる。
L8 @ 0
式■の右辺の分子は状態q、における観測ベクトルの分
散共分散行列の期待値、分母は状態q1の連の長さの期
待値であって、その比がΣ1の推定値となる。
散共分散行列の期待値、分母は状態q1の連の長さの期
待値であって、その比がΣ1の推定値となる。
パ詮−−−ノ′定=
HMMの改良として、状態の連の長さをPolsson
分布で与える方法やr分布で与える方法等が提案されて
いる。ここでは、やや異なった観点から、状態の連の長
さを確率分布で表現する本発明方法について説明する。
分布で与える方法やr分布で与える方法等が提案されて
いる。ここでは、やや異なった観点から、状態の連の長
さを確率分布で表現する本発明方法について説明する。
第2図において、状態遷移確率a+ t は、状kk
◆1 態q+を訪れる確率のうち、状態”Klを訪れる確率の
割合であって、これは、状態q、の連の長さかに+1以
上である確率のに以上である確率に対する割合のことで
あると解される。 従って、tの連続間数Fi(t)を
状態q+の連の長さがt以下である確率□を表す分布関
数とすれば、であるから、状fJlq+の連の長さがτ
(正整数)である確率A(i、τ)は、Fi(0)=O
とすればA(i?T)=n at ;(1−at
+ )、 k−1k f 5に F1(τ+1)−Fi(τ) ・・・・・・・・・・
・・・・・・・・■となる。従って、分布間数Fi(t
)に対する確率密度関数をfi(t)とすれば、 A(i、τ)=Fi(τ+1)−Fi(τ)となる。
◆1 態q+を訪れる確率のうち、状態”Klを訪れる確率の
割合であって、これは、状態q、の連の長さかに+1以
上である確率のに以上である確率に対する割合のことで
あると解される。 従って、tの連続間数Fi(t)を
状態q+の連の長さがt以下である確率□を表す分布関
数とすれば、であるから、状fJlq+の連の長さがτ
(正整数)である確率A(i、τ)は、Fi(0)=O
とすればA(i?T)=n at ;(1−at
+ )、 k−1k f 5に F1(τ+1)−Fi(τ) ・・・・・・・・・・
・・・・・・・・■となる。従って、分布間数Fi(t
)に対する確率密度関数をfi(t)とすれば、 A(i、τ)=Fi(τ+1)−Fi(τ)となる。
fi(t)はt≧0の実数値に対する確率密度関数であ
るから、状態q1の連の長さτが離散値2以上の値を取
るときは、fi (t)を正の方向に2移動させて、式
[相]に示す近似を行うことになる。
るから、状態q1の連の長さτが離散値2以上の値を取
るときは、fi (t)を正の方向に2移動させて、式
[相]に示す近似を行うことになる。
状態遷移確率が状態の連の長さに応じて指数間数的に減
少する場合を考える。
少する場合を考える。
この場合は、状態の連の長さτに対する確率密度関数は
、従来のような単調減少ではなく最大値が存在し、より
現実に忠実なモデルに近いと考えられる。
、従来のような単調減少ではなく最大値が存在し、より
現実に忠実なモデルに近いと考えられる。
この場合は状態遷移確率は次式のようになる。
両辺の自然対数をとって
ζ。= Jog ct −Ft(n)]とおけば漸化式
%式%
が成立するから、この式をFi(0) = O,fi(
0) =0の条件で解けば、 となる。従って、τ≧2の場合は となる。
0) =0の条件で解けば、 となる。従って、τ≧2の場合は となる。
式0におけるγ1の推定は次のように行える。
x a+、 B(i、L、r)βt(j)= 0におい
て であるから、γ、は式@(表)により推定される。
て であるから、γ、は式@(表)により推定される。
第4図は、本発明の一実施例である。本実施例において
は、a、”l (for j=i+1)、 at7=o
(for j≠1+1)の場合について、以下図面に
従って説明する。
は、a、”l (for j=i+1)、 at7=o
(for j≠1+1)の場合について、以下図面に
従って説明する。
1は特徴抽出部であって、フィルタバンク、LPC分析
等周知の方法によって、人力音声信号を特徴ベクトルの
系列に変換するものである。
等周知の方法によって、人力音声信号を特徴ベクトルの
系列に変換するものである。
2は単語パターン記憶部であって、モデル入を作成すべ
き単語を特徴ベクトル系列の形で複数個記憶するもので
ある。
き単語を特徴ベクトル系列の形で複数個記憶するもので
ある。
3はバッファメモリであって、単語パターン記憶部2に
記憶されている単語パターンをll1語づつ取り出して
一時的に記憶するものである。
記憶されている単語パターンをll1語づつ取り出して
一時的に記憶するものである。
4.5は状Bq、におけるパラメータを推定する面詰式
■、■、■、■等の分母、分子をそれぞれ計算するもの
である。
■、■、■、■等の分母、分子をそれぞれ計算するもの
である。
6は累積和計算部であって、分母計算部4で計算された
値の累積和を計算するものである。
値の累積和を計算するものである。
7は累積和計算部であって、分子計算部5で計算された
イ1αの累積和を計算するものである。
イ1αの累積和を計算するものである。
8はパラメータ計算部であって、前記累積和計算部6.
7で計算されたそれぞれのパラメータの分子、分母の比
をとることにより、面詰それぞれのパラメータの推定値
を求めるものである。
7で計算されたそれぞれのパラメータの分子、分母の比
をとることにより、面詰それぞれのパラメータの推定値
を求めるものである。
9はパラメータ記憶部であって、前記推定されたパラメ
ータを記憶するものである。
ータを記憶するものである。
10は制御部であフて、単語パターン記憶部2に記憶さ
れている単語を一つづつ順次読みだし、バッフ7メモリ
3に転送するための学習単語読み出し指令、バッフ7メ
モリ3に記憶された単語パターンに対して、状態q1
に対応する候補区間の設定、累積和計算部6.7の出力
から、前記のパラメータを計算するパラメータ計算指令
、状態番号の設定等を行う。
れている単語を一つづつ順次読みだし、バッフ7メモリ
3に転送するための学習単語読み出し指令、バッフ7メ
モリ3に記憶された単語パターンに対して、状態q1
に対応する候補区間の設定、累積和計算部6.7の出力
から、前記のパラメータを計算するパラメータ計算指令
、状態番号の設定等を行う。
例えば単語rに対応するモデルλの作成は次のごとく行
われる。
われる。
単語rをW回発声し、特徴抽出部1て特徴ベクトル系列
に変換されたW個のパターンが単語パターン記憶部2に
記憶される。単語パターン記憶部2から制御部lOから
の学習単語読み出し指令によって、W番目(W=1〜W
)の単語が読み出され、バッフ7メモリ3に記憶される
。前記式〇、■、■、@等の計算におけるt、γが前記
制御部lOからの区間設定信号としてバッフ7メモリ3
に供給され、それに対応するバッファメモリ3に記憶さ
れた単語パターンの区間に対し、分母計算部4、分子計
算部5により、前記式〇、■、■・@等における分母、
分子がそれぞれ計算される。このとき、これら分母分子
に含まれるパラメータは、状態q、における初明値とし
て適当な値λ、=(μm、Ul、γ1.Σ1)が与えら
れている。累積和計算部6.7は前記学習単語w=1〜
−についての前記分母分子の累積和をそれぞれ計算する
。パラメータ計算部8はこのようにして求められた学習
単語讐=1〜Vの状態Q+についての前記分母分子の累
積和からその比をとって状態q1のパラメータの新たな
推定値を計算する。パラメータ記憶部9はこのようにし
て得られた状態q、のパラメータの推定値λ1を記憶す
る。
に変換されたW個のパターンが単語パターン記憶部2に
記憶される。単語パターン記憶部2から制御部lOから
の学習単語読み出し指令によって、W番目(W=1〜W
)の単語が読み出され、バッフ7メモリ3に記憶される
。前記式〇、■、■、@等の計算におけるt、γが前記
制御部lOからの区間設定信号としてバッフ7メモリ3
に供給され、それに対応するバッファメモリ3に記憶さ
れた単語パターンの区間に対し、分母計算部4、分子計
算部5により、前記式〇、■、■・@等における分母、
分子がそれぞれ計算される。このとき、これら分母分子
に含まれるパラメータは、状態q、における初明値とし
て適当な値λ、=(μm、Ul、γ1.Σ1)が与えら
れている。累積和計算部6.7は前記学習単語w=1〜
−についての前記分母分子の累積和をそれぞれ計算する
。パラメータ計算部8はこのようにして求められた学習
単語讐=1〜Vの状態Q+についての前記分母分子の累
積和からその比をとって状態q1のパラメータの新たな
推定値を計算する。パラメータ記憶部9はこのようにし
て得られた状態q、のパラメータの推定値λ1を記憶す
る。
1=1−nについて以上の計算を行い、λ1を新たなλ
、とじて同様な計算を繰り返すことによりλ、は一定の
値に収束し、それが求めるべきパラメータとなる。
、とじて同様な計算を繰り返すことによりλ、は一定の
値に収束し、それが求めるべきパラメータとなる。
発明の効果
以上のように本発明によれば、従来のHMMにおける各
状態において、同じ状態に遷移する確率が遷移回数に応
じて指数間数的に減少するようになしたので、従来HM
Mにおける問題とされていた認識すべきパターンの吠態
の連の長さをより現実に近い確率分布で表されることと
なり、認識精度の向上が可能となったものである。
状態において、同じ状態に遷移する確率が遷移回数に応
じて指数間数的に減少するようになしたので、従来HM
Mにおける問題とされていた認識すべきパターンの吠態
の連の長さをより現実に近い確率分布で表されることと
なり、認識精度の向上が可能となったものである。
第1図は本発明の一実施例のパターン認識用モデル作成
装置におけるHMMの概念を示す概念図、第2図は第1
図をそれと等価な一重のマルコフモデルで表したHMM
の概念図、第3図は第2図のHMMに対応するトレリス
線図、第4図は本発明の一実施例のパターン認識用モデ
ル作成装置のブロック図、第5図はHMMを用いた音声
認識装置のブロック図、第6図は従来の典型的なHMM
の概念を示す概念図である。 l・・・・・・特徴抽出部、2・・・・・・単語パター
ン記憶部、3・・・・・・バッファメモ菖ハ 4・・・
・・・分母計算部、5・・・・・・分子計算部、6・・
・・・・累積和計算部、7・・・・・・累積和計算部、
8・・・・・・パラメータ計算部、9・・・・・・パラ
メータ記憶部、10・・・・・・制御部。 代理人の氏名 弁理士 中尾敏男 はか1名第1図 (1++(r) (Ill(D (iil
(IJ (Ijj(U CLnR(τ2b
recx> b2eX、、”c) bL(x、
τ) bjtx、r) bnR,T)第2図 第3図 t2 3 ar6 7 B9 ノ。 // ノ
2 ノJ /4フレーA 第4図
装置におけるHMMの概念を示す概念図、第2図は第1
図をそれと等価な一重のマルコフモデルで表したHMM
の概念図、第3図は第2図のHMMに対応するトレリス
線図、第4図は本発明の一実施例のパターン認識用モデ
ル作成装置のブロック図、第5図はHMMを用いた音声
認識装置のブロック図、第6図は従来の典型的なHMM
の概念を示す概念図である。 l・・・・・・特徴抽出部、2・・・・・・単語パター
ン記憶部、3・・・・・・バッファメモ菖ハ 4・・・
・・・分母計算部、5・・・・・・分子計算部、6・・
・・・・累積和計算部、7・・・・・・累積和計算部、
8・・・・・・パラメータ計算部、9・・・・・・パラ
メータ記憶部、10・・・・・・制御部。 代理人の氏名 弁理士 中尾敏男 はか1名第1図 (1++(r) (Ill(D (iil
(IJ (Ijj(U CLnR(τ2b
recx> b2eX、、”c) bL(x、
τ) bjtx、r) bnR,T)第2図 第3図 t2 3 ar6 7 B9 ノ。 // ノ
2 ノJ /4フレーA 第4図
Claims (1)
- 入力信号を特徴ベクトルの系列に変換する特徴抽出手段
と、カテゴリR(n)(n=1、2、・・・、N)のそ
れぞれに対し、予めR(n)に属することが分かってい
る、前記抽出された特徴ベクトルの系列から、Hidd
en Markov Model(HMM)を作成する
HMM作成手段を備え、このHMM作成手段は、そのH
MMを構成するそれぞれの状態において同じ状態に遷移
する遷移確率が遷移回数に応じて指数関数的に減少する
ようになしたことを特徴とするパターン認識用モデル作
成装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62318141A JPH01159698A (ja) | 1987-12-16 | 1987-12-16 | パターン認識用モデル作成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62318141A JPH01159698A (ja) | 1987-12-16 | 1987-12-16 | パターン認識用モデル作成装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01159698A true JPH01159698A (ja) | 1989-06-22 |
Family
ID=18095957
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62318141A Pending JPH01159698A (ja) | 1987-12-16 | 1987-12-16 | パターン認識用モデル作成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01159698A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04313034A (ja) * | 1990-10-16 | 1992-11-05 | Internatl Business Mach Corp <Ibm> | 合成音声生成方法及びテキスト音声合成装置 |
-
1987
- 1987-12-16 JP JP62318141A patent/JPH01159698A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04313034A (ja) * | 1990-10-16 | 1992-11-05 | Internatl Business Mach Corp <Ibm> | 合成音声生成方法及びテキスト音声合成装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100397402B1 (ko) | 음성인식방법,정보형성방법,음성인식장치및기록매체 | |
| JP2964507B2 (ja) | Hmm装置 | |
| JP2986792B2 (ja) | 話者正規化処理装置及び音声認識装置 | |
| US8738381B2 (en) | Prosody generating devise, prosody generating method, and program | |
| US6041299A (en) | Apparatus for calculating a posterior probability of phoneme symbol, and speech recognition apparatus | |
| EP0706171A1 (en) | Speech recognition method and apparatus | |
| JP2005043666A (ja) | 音声認識装置 | |
| JPH07334184A (ja) | 音響カテゴリ平均値計算装置及び適応化装置 | |
| US4991216A (en) | Method for speech recognition | |
| EP1576580B1 (en) | Method of optimising the execution of a neural network in a speech recognition system through conditionally skipping a variable number of frames | |
| US6230126B1 (en) | Word-spotting speech recognition device and system | |
| CA2000033C (en) | Continuous speech recognition unit | |
| US8478595B2 (en) | Fundamental frequency pattern generation apparatus and fundamental frequency pattern generation method | |
| JPH01159698A (ja) | パターン認識用モデル作成装置 | |
| JP2982689B2 (ja) | 情報量基準を用いた標準パターン作成方式 | |
| JPH08123469A (ja) | 句境界確率計算装置および句境界確率利用連続音声認識装置 | |
| JP2600871B2 (ja) | Hmm作成装置及びそれを用いた尤度計算装置、時系列パターン認識装置 | |
| JP3033322B2 (ja) | 連続音声認識方法 | |
| JP2976795B2 (ja) | 話者適応化方式 | |
| JP3583299B2 (ja) | 連続音声認識用の探索装置および連続音声認識用の探索方法 | |
| JPH08202384A (ja) | 音声認識方法及び装置 | |
| JP2001282273A (ja) | 音声情報処理装置とその方法と記憶媒体 | |
| JP2926784B2 (ja) | Hmm作成装置 | |
| JP3576792B2 (ja) | 音声情報処理方法 | |
| Kim et al. | Deleted strategy for MMI-based HMM training |