JPH08248983A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH08248983A
JPH08248983A JP4975795A JP4975795A JPH08248983A JP H08248983 A JPH08248983 A JP H08248983A JP 4975795 A JP4975795 A JP 4975795A JP 4975795 A JP4975795 A JP 4975795A JP H08248983 A JPH08248983 A JP H08248983A
Authority
JP
Japan
Prior art keywords
candidate
duration
speech
voice
standard model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4975795A
Other languages
English (en)
Inventor
Jun Ishii
純 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP4975795A priority Critical patent/JPH08248983A/ja
Publication of JPH08248983A publication Critical patent/JPH08248983A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声認識において発声の速度が平均より速
い、又は遅い場合にも高い認識率を有する音声認識装置
を得る。 【構成】 対立候補音声標準モデル生成手段11は、尤
度最大基準で決定される認識結果7に対しての対立候補
10を記憶している対立候補記憶手段9を参照して、対
立候補10の音声標準モデル12を生成し、対立候補照
合手段13は、対立候補10の音声標準モデル12から
対立候補10の各音素の継続時間長14を求め、再検定
手段17は、予め推定し平均継続時間長記憶手段15に
記憶した平均継続時間長16と、尤度最大基準で決定さ
れる認識結果7の音素の継続時間長データ8と、対立候
補10の音素の継続時間長データ14とに基づいて認識
結果18を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、連続発声された音声
を認識する装置の改良に関する。
【0002】
【従来の技術】音声認識で有効な方式であるleft-to-ri
ght型のHMM(Hidden Markov Model)は図4の基本HM
Mの動作を説明する説明図に示すように幾つかの状態S
iと状態間を結ぶアークによって構成される。図4のai
jは状態iからjへのアーク遷移確率、bij(X)はiか
らjへのアーク上での音声の特徴ベクトルXの出力確率
である。HMMを用いた音声認識は、予め必要なカテゴ
リ数だけモデルを用意しておき、未知の入力音声特徴ベ
クトルに対してその尤度を最大にするカテゴリを認識結
果とするものである。基本HMMでは状態iにn時間留
まる確率は次の数式1で与えられ、nと共に指数関数的
に減少する。
【0003】
【数1】
【0004】母音等の音声の定常区間は類似した音響特
徴が連続する現象がある。このような定常区間では対応
する状態に長く留まるのが理想であり、数式1はこれを
うまく表現していない。これはHMMの大きな欠点の一
つであった。このため文献“確率モデルによる音声認
識”(中川聖一著、電子情報通信学会、平成4年4月1
日3版発行)で述べられている解決法としては、(1)
状態数を多くする方法、(2)後処理法、(3)継続時
間分布モデルを導入する方法がある。(1)の状態数を
多くする方法は、母音等の定常区間に対応する入力音声
には数多くの状態を対応させるものであり、例えば子音
区間には1〜3状態、母音区間には3〜8状態を対応さ
せる方法である。(2)の後処理法は、間接的に継続時
間を制御する方法である。これはビタビ演算によって最
適状態遷移系列を求めた後で、状態iに留まった継続時
間長からその継続時間の尤度を求めて、最適状態系列の
尤度に加えることで尤度を補正する方法である。(3)
の継続時間分布モデルを導入する方法は、音声の継続時
間長の確率分布モデルを最適状態遷移系列を求めるビタ
ビ演算中に組み入れて尤度の算出を行うことにより継続
時間を制御する方法である。確率分布としては、予め学
習によって推定された平均値、分散値で定義しているポ
アソン分布やガンマ分布を用いる。
【0005】図5は、これらの手法に基づく連続分布型
音素HMMを用いた音声認識装置の構成図の一例であ
る。図5において、1は音声の入力信号、2は入力信号
1を入力して音響分析を行なう音響分析手段、3は音響
分析手段2が出力する音声特徴ベクトル時系列、4は音
声標準モデルとして、学習用音声データを用いて学習し
た音素HMMと、その継続時間パラメータであるところ
の音素継続時間の平均と分散とが格納されている音声標
準モデル記憶手段、5は音声標準モデル記憶手段4から
入力する音声標準モデル、6は音声特徴ベクトル時系列
3と音声標準モデル5とを入力して、ビタビ演算によっ
て最適状態遷移系列を求め、尤度が最大である単語を認
識結果7として出力する照合手段である。
【0006】次に動作について、連続分布型音素HMM
による音声認識の場合を例にとり説明する。認識対象語
彙であるところの単語のモデルは音素HMMの連鎖の記
述で表現され、1音素に対し1状態が割り当てられてい
る。入力信号1は音響分析手段2によって音響分析さ
れ、音声特徴ベクトル時系列3に変換されて照合手段6
に入力される。照合手段6は、音声特徴ベクトル時系列
3に対して、前記音声標準モデル記憶手段4の出力であ
る音声標準モデル5を用いて生成した認識語彙の単語を
表す音素HMMの連鎖に従い、各単語に対する最適状態
遷移系列をビタビ演算により求め、この単語尤度が最大
となる音素HMMの連鎖を音素ラベル列に変換したもの
を尤度最大基準の認識結果7として出力する。前記文献
で述べている継続時間分布モデルを導入したビタビ演算
を下式に示す。
【0007】
【数2】
【0008】ここで、riは時間0における状態iの確
率、Ifは時間Tの時に留まっている状態の集合であ
る。f(i,t)は時刻tにおける状態iの尤度、aij は状
態iからjへの遷移確率、bij(yt)は状態iからjへ
のアーク上での時間tにおける音声特徴ベクトルyの出
力確率、di(τ)は状態iに留まる継続時間長τに対
する尤度であり、確率分布モデルを用いる。確率分布と
しては、音声標準モデル記憶手段5に記憶されている平
均値、分散値によって定義されているポアソン分布やガ
ンマ分布を用いる。この継続時間長の平均値、分散値
は、学習によって予め推定された値である。αは継続時
間長尤度とそれ以外の尤度との整合をとるための重み付
け係数である。認識対象の単語を表す音素HMMの連鎖
に対して以上の処理をそれぞれ行い、Lが最大である単
語を尤度最大基準の認識結果7として出力する。Lが最
大の単語に関して各f(i,t)毎でmaxを与えたiをポイン
タとして保存しておいて、逆時間方向へたどってiT,i
T-1,...,i0を求めれば、最適パスの状態系列がSi0,S
i2,...,Sitとして求まり、各音素の継続時間長が得ら
れる。例えば最適パスの状態系列がS1,S1,S1,S2,S
3,S3であったなら、継続時間長は第1音素が3、第2
音素が1、第3音素が2となる。以上の動作により、音
声認識が実行され、その認識結果が得られる。
【0009】
【発明が解決しようとする課題】従来の音声認識装置で
は、照合手段で継続時間長の尤度を求めるために用いる
音声標準モデルの継続時間長の平均値、分散値等のパラ
メータは、学習用音声データによって得られた固定値で
あるため、入力される音声の発声速度が学習用の平均的
なデータに比べ極端に速い、または遅い場合には、認識
性能が著しく劣化するという問題点があった。
【0010】この発明は上記のような問題点を解決する
ためになされたものであり、発声速度が平均より速い、
又は遅い場合にも高い認識率を有する音声認識装置を得
ることを目的としている。
【0011】
【課題を解決するための手段】この発明に係る音声認識
装置は、入力音声の音響分析を行なって得られた音声の
音響特徴ベクトル時系列に対して、予め用意した音声標
準モデルを用いて認識結果を決定する音声認識装置にお
いて、前記音響特徴ベクトル時系列を入力し、この入力
した前記音響特徴ベクトル時系列に対して尤度が最大で
ある前記音声標準モデルを選択して出力するとともに、
この選択した前記音声標準モデルを用いて前記音響特徴
ベクトル時系列を音声素片に分解し、この分解した各音
声素片の継続時間長を求める照合手段と、前記認識結果
に対する対立候補を予め記憶する対立候補記憶手段と、
前記照合手段が選択して出力した前記音声標準モデルと
前記対立候補記憶手段に記憶された前記対立候補とに基
づいて前記対立候補の音声標準モデルを生成する対立候
補音声標準モデル生成手段と、この生成した前記対立候
補の音声標準モデルと前記音響特徴ベクトル時系列とを
入力し、この入力した前記対立候補の音声標準モデルを
用いて前記音響特徴ベクトル時系列を音声素片に分解
し、この分解した各音声素片の継続時間長を求める対立
候補照合手段と、予め推定した音声素片の平均継続時間
長を記憶する平均継続時間長記憶手段と、前記照合手段
により求めた継続時間長と前記対立候補照合手段により
求めた継続時間長と前記平均継続時間長記憶手段に記憶
された平均継続時間長とに基づいて前記認識結果を決定
する再検定手段とを備えたものである。
【0012】
【作用】この発明に係る音声認識装置において、前記照
合手段は、音響特徴ベクトル時系列に対して尤度が最大
である音声標準モデルを選択して出力するとともに、こ
の選択した音声標準モデルを用いて前記音響特徴ベクト
ル時系列を音声素片に分解し、この分解した各音声素片
の継続時間長を求める。前記対立候補音声標準モデル生
成手段は、前記照合手段が選択して出力した尤度最大基
準の音声標準モデルを用い、この音声標準モデルに対し
ての対立候補を前記対立候補記憶手段から入力し、対立
候補の音声標準モデルを生成する。前記対立候補照合手
段は、前記対立候補の音声標準モデルを用いて前記音響
特徴ベクトル時系列を音声素片に分解し、前記対立候補
の音声素片の継続時間長を求める。前記再検定手段は、
前記照合手段により求めた継続時間長と前記対立候補照
合手段により求めた継続時間長と前記平均継続時間長記
憶手段に予め記憶された平均継続時間長とに基づいて前
記認識結果を決定する。
【0013】
【実施例】
実施例1.図1はこの発明の一実施例を示す音声認識装
置の構成図である。従来例と同様のものは同じ符号を付
し説明を省略する。6は音響特徴ベクトル時系列3を入
力し、この入力した音響特徴ベクトル時系列3に対して
尤度が最大である音声標準モデル5を選択し、この選択
した音声標準モデル5の連鎖を音素ラベルで表した尤度
最大基準の認識結果7を出力するとともに、選択した音
声標準モデル5を用いて音響特徴ベクトル時系列3を音
素に分解し、この分解した各音素の尤度最大基準の継続
時間長データ8を求める照合手段、9は認識誤りを生じ
易い単語、又は単語列の対である対立候補10を記憶し
ている対立候補記憶手段、11は照合手段6の出力であ
る尤度最大基準の認識結果7を入力し、対立候補10と
音声標準モデル5とを参照することで対立候補10の音
声標準モデル12を生成する対立候補音声標準モデル生
成手段、13は対立候補音声標準モデル生成手段11に
より出力される対立候補10の音声標準モデル12と音
響特徴ベクトル時系列3とを入力し、対立候補10の音
声標準モデル12である音素HMMの連鎖に従ってビタ
ビ演算によって最適状態遷移系列を求め、対立候補10
の各音素の継続時間長データ14を出力する対立候補照
合手段、15は予め推定した音素の平均継続時間長16
を記憶している平均継続時間長記憶手段、17は照合手
段6より出力される尤度最大基準の継続時間長データ8
と、対立候補照合手段13より出力される対立候補10
の継続時間長データ14と、平均継続時間長記憶手段1
5に記憶された平均継続時間長16とを入力し、平均継
続時間長16と尤度最大基準の継続時間長データ8の比
と、平均継続時間長16と対立候補10の継続時間長デ
ータ14の比とを比較することにより再検定認識結果1
8を決定する継続時間長による再検定手段である。
【0014】次に動作について説明する。但し従来例と
同様な処理を行なう部分については説明を省略する。対
立候補音声標準モデル生成手段11は、照合手段6によ
り尤度最大基準で決定された音素HMMの連鎖を音素ラ
ベルに変換した尤度最大基準の認識結果7に対して、対
立候補記憶手段9と音声標準モデル記憶手段4を参照す
ることで対立候補10の音声標準モデル12を生成す
る。対立候補記憶手段9は、上述のように予め誤り易い
単語、又は単語列の対を記憶しておくものであり、例え
ば、桁用語を含んだ連続数字の場合では、図2に示す対
立候補を音素ラベル表記で保持している。図2の左側に
記されている単語、又は単語列が尤度最大基準の認識結
果7内に含まれているならば、図2の右側に記されてい
る単語、又は単語列に置き換えたものが対立候補10と
なる。例えば、尤度最大基準の認識結果7が■seN hjak
u■であった場合は、■hjaku■の部分を■ni hjaku■で
置き換えた■seN ni hjaku■が対立候補10の音素ラベ
ルとなり、この対立候補10の音素ラベルを音素HMM
の連鎖の記述で表した音声標準モデル12が対立候補音
声標準モデル生成手段11の出力となる。
【0015】対立候補照合手段13は、音声特徴ベクト
ル時系列3に対し対立候補音声標準モデル生成手段11
によって出力される対立候補10の音声標準モデル12
の音素HMMの連鎖に従い、ビタビ演算によって対立候
補10の最適状態遷移系列を求め、対立候補10の音素
の継続時間長データ14を出力する。ビタビ演算は例え
ば前記数式2に示されている処理を行う。前記数式2を
用いたビタビ演算では、各音素の継続時間長は各f(i,
t)毎でmaxを与えたiをポインタとして保存しておい
て、逆時間方向へたどってiT,iT-1,...,i0を求め、
最適パスの状態系列Si0,Si2,...,Sitを得ることで抽
出される。
【0016】再検定手段17は、照合手段6より出力さ
れる尤度最大基準の継続時間長データ8と、対立候補照
合手段13より出力される対立候補10の継続時間長デ
ータ14と、平均継続時間長記憶手段15に記憶された
平均継続時間長16とを入力し、平均継続時間長16と
尤度最大基準の継続時間長データ8の比と、平均継続時
間長16と対立候補10の継続時間長データ14の比と
を比較することにより再検定認識結果18を出力する。
再検定認識結果18の決定は次式によって算出される数
値α及びβの大小関係で行う。α≦βなら照合手段6の
出力である尤度最大基準の認識結果7を、またα>βで
あるなら対立候補10の音声標準モデル12を再検定認
識結果18として出力する。
【0017】
【数3】
【0018】ここでUαは、尤度最大基準での認識結果
7の音素中で尤度最大基準の継続時間長データ8が対立
候補10の音素の継続時間長データ14と異なる音素の
集合、Uβは、対立候補10の音素中で継続時間長デー
タ14が尤度最大基準の継続時間長データ8と異なる音
素の集合、Uvは、Uα、Uβの前後の数個の音素であ
り、その継続時間長が尤度最大基準での認識結果7と対
立候補10において同一のものの集合、diは音素iの
継続時間長、Diは予め推定されている音素iの平均継
続時間長である。
【0019】図3に例をあげて説明する。この例は入力
音声は■seN ni hjaku■であるが、尤度最大基準では■
seN hjaku■(図3(a))と認識された場合である。この
とき対立候補音声標準モデル生成手段11によって対立
候補として■seN ni hjaku■(図3(b))という音声標
準モデル12が生成される。ここで上述した定義によっ
てUαに属する音素としては図3(a)におけるN、h、
j、またUβに属する音素としては、図3(b)における
N、n、i、h、jが抽出される。また、図3(a),(b)
では数式4で定義されているところの、予め推定された
音素iの平均継続時間長Diと、音素iの継続時間長di
との比をプロットしている。
【0020】
【数4】
【0021】数式4の値が1に近い程、予め推定されて
いた継続時間長に近いことになり、継続時間長に対する
尤度は大きくなる。従って、従来方法では図3の例の場
合、図3(b)が正解であるにもかかわらず図3(a)の方が
継続時間長の尤度が大きくなってしまい、図3(a)と誤
認識する。これは、入力音声の発話速度が学習データの
平均発話速度より速いために生じる。すなわち、図3
(a)のように■ni■を欠落させた候補の方が音素の数が
少ないので、図3(b)の■ni■の前後にあたる数個の音
素(図3(a)の例では、N、h、j)に割り当てられる
継続時間長が図3(b)のN、h、jより長くなり、結果
として図3(b)の場合よりも尤度が大きくなる。 これ
に対しこの実施例では、尤度最大基準の認識結果7及び
対立候補10の音声標準モデル12を構成する音素の正
規化継続時間長のばらつきの度合いを前記数式3によっ
て求め、再検定を行うものである。正規化継続時間長
は、入力音声と学習データの平均発話速度との比を表し
ており、一発話中では各音素毎の正規化継続時間はあま
りばらつかないという性質を利用したものである。図3
のような継続時間長の場合には前記数式3は図3(b)が
(a)よりも小さな値を示す。従って対立候補10の音声
標準モデル12である■seN ni hjaku■が再検定認識結
果18として出力され正しい認識結果が得られる。
【0022】以上のように、対立候補音声標準モデル生
成手段11は、尤度最大基準で決定される認識結果7に
対しての対立候補を記憶している対立候補記憶手段9を
参照し、対立候補10の音声標準モデル12を生成し、
対立候補照合手段13は、対立候補10の各音素の継続
時間長データ14を求め、再検定手段17は、予め推定
した音素の平均継続時間長16と尤度最大基準で決定さ
れる認識結果7の音素の継続時間長データ8の比と、前
記平均継続時間長16と対立候補10の音素の継続時間
長データ14の比を比較して再検定認識結果18を出力
するようにしたので、発声が速い、または遅い場合の継
続時間長の尤度の不整合による認識誤りを再検定でき、
認識精度の向上が得られる。
【0023】実施例2.実施例1では、継続時間を抽出
する音声素片単位を音素としたが、音声素片は音素片、
音節、単語のいずれでも良い。
【0024】実施例3.実施例1では、音素の正規化し
た継続時間長の値によって再検定を行なったが、音声の
スペクトル情報を加えた再検定を行なっても良い。
【0025】実施例4.実施例1では、尤度最大基準の
認識結果に対して対立候補を生成する方法であったが、
尤度の大きい上位の単語に対して、対立候補の生成を行
ない、それらを再検定の対象とし、再検定認識結果を出
力するようにしても良い。
【0026】
【発明の効果】この発明によれば、尤度最大基準で決定
される認識結果に対しての対立候補を記憶している対立
候補記憶手段を参照し、対立候補の音声標準モデルを生
成する対立候補音声標準モデル生成手段と、この生成し
た音声標準モデルの各音素の継続時間長を求める対立候
補照合手段と、前記尤度最大基準で決定される認識結果
の継続時間長、前記対立候補照合手段により求めた継続
時間長、及び、予め推定し平均継続時間長記憶手段に記
憶した平均継続時間長とに基づいて再検定認識結果を決
定する再検定手段とを備えたので、発声の速度が速い、
または遅い場合に生じる継続時間長の尤度の不整合によ
る誤認識を再検定でき、高精度の音声認識装置を得るこ
とができる。
【図面の簡単な説明】
【図1】 本発明の一実施例を示す音声認識装置の機能
ブロック構成図である。
【図2】 本発明の一実施例での対立候補記憶手段に記
憶されている対立候補の一例である。
【図3】 本発明の一実施例での再検定手段を説明する
ための図である。
【図4】 基本HMMの動作を説明する説明図である。
【図5】 従来の音声認識装置の機能ブロック構成図で
ある。
【符号の説明】
1 入力信号、2 音響分析手段、3 音声特徴ベクト
ル時系列、4 音声標準モデル記憶手段、5 音声標準
モデル、6 照合手段、7 尤度最大基準の認識結果、
8 尤度最大基準の継続時間長データ、9 対立候補記
憶手段、10対立候補、11 対立候補音声標準モデル
生成手段、12 対立候補の音声標準モデル、13 対
立候補照合手段、14 対立候補の継続時間長データ、
15平均継続時間長記憶手段、16 平均継続時間長、
17 再検定手段、18 再検定認識結果

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力音声の音響分析を行なって得られた
    音声の音響特徴ベクトル時系列に対して、予め用意した
    音声標準モデルを用いて認識結果を決定する音声認識装
    置において、 前記音響特徴ベクトル時系列を入力し、この入力した前
    記音響特徴ベクトル時系列に対して尤度が最大である前
    記音声標準モデルを選択して出力するとともに、この選
    択した前記音声標準モデルを用いて前記音響特徴ベクト
    ル時系列を音声素片に分解し、この分解した各音声素片
    の継続時間長を求める照合手段と、 前記認識結果に対する対立候補を予め記憶する対立候補
    記憶手段と、 前記照合手段が選択して出力した前記音声標準モデルと
    前記対立候補記憶手段に記憶された前記対立候補とに基
    づいて前記対立候補の音声標準モデルを生成する対立候
    補音声標準モデル生成手段と、 この生成した前記対立候補の音声標準モデルと前記音響
    特徴ベクトル時系列とを入力し、この入力した前記対立
    候補の音声標準モデルを用いて前記音響特徴ベクトル時
    系列を音声素片に分解し、この分解した各音声素片の継
    続時間長を求める対立候補照合手段と、 予め推定した音声素片の平均継続時間長を記憶する平均
    継続時間長記憶手段と、 前記照合手段により求めた継続時間長と前記対立候補照
    合手段により求めた継続時間長と前記平均継続時間長記
    憶手段に記憶された平均継続時間長とに基づいて前記認
    識結果を決定する再検定手段とを備えたことを特徴とす
    る音声認識装置。
JP4975795A 1995-03-09 1995-03-09 音声認識装置 Pending JPH08248983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4975795A JPH08248983A (ja) 1995-03-09 1995-03-09 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4975795A JPH08248983A (ja) 1995-03-09 1995-03-09 音声認識装置

Publications (1)

Publication Number Publication Date
JPH08248983A true JPH08248983A (ja) 1996-09-27

Family

ID=12840069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4975795A Pending JPH08248983A (ja) 1995-03-09 1995-03-09 音声認識装置

Country Status (1)

Country Link
JP (1) JPH08248983A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100682909B1 (ko) * 2004-12-23 2007-02-15 삼성전자주식회사 음성 인식 방법 및 장치
WO2012150658A1 (ja) * 2011-05-02 2012-11-08 旭化成株式会社 音声認識装置および音声認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100682909B1 (ko) * 2004-12-23 2007-02-15 삼성전자주식회사 음성 인식 방법 및 장치
WO2012150658A1 (ja) * 2011-05-02 2012-11-08 旭化成株式会社 音声認識装置および音声認識方法

Similar Documents

Publication Publication Date Title
JP2543148B2 (ja) 音声認識装置を学習させる装置
CN100559462C (zh) 语音处理装置、语音处理方法、程序、和记录介质
JPH0372998B2 (ja)
JPS62231996A (ja) 音声認識方法
JPH09127972A (ja) 連結数字の認識のための発声識別立証
CN1171592A (zh) 采用连续密度隐藏式马尔克夫模型的语音识别方法和系统
KR101014086B1 (ko) 음성 처리 장치 및 방법, 및 기록 매체
EP1576580B1 (en) Method of optimising the execution of a neural network in a speech recognition system through conditionally skipping a variable number of frames
JPH0962291A (ja) 記述長最小基準を用いたパターン適応化方式
JP2751856B2 (ja) 木構造を用いたパターン適応化方式
EP1701337B1 (en) Method of speech recognition
JP2002358097A (ja) 音声認識装置
JP3589044B2 (ja) 話者適応化装置
JP3628245B2 (ja) 言語モデル生成方法、音声認識方法及びそのプログラム記録媒体
JPH1097285A (ja) 音声認識装置
JPH08248983A (ja) 音声認識装置
JP2000075886A (ja) 統計的言語モデル生成装置及び音声認識装置
JP2005091504A (ja) 音声認識装置
JPH09160586A (ja) ヒドン・マルコフ・モデルの学習方法
JP4741452B2 (ja) 言語モデル作成装置及び言語モデル作成プログラム並びに音声認識装置及び音声認識プログラム
JP2003263187A (ja) 言語モデル学習方法、その装置、そのプログラムおよびそのプログラムの記録媒体ならびに言語モデル学習を用いた音声認識方法、その装置、そのプログラムおよびそのプログラムの記録媒体
Bourlard et al. Hidden markov models
JPH10254485A (ja) 話者正規化装置、話者適応化装置及び音声認識装置
JPH06175678A (ja) 音声認識装置
JP3917880B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム