JPS60182498A

JPS60182498A - 音節標準パタンを用いた音声認識処理方式

Info

Publication number: JPS60182498A
Application number: JP59038414A
Authority: JP
Inventors: 藤崎　博也; 広瀬　啓吉; 智博井上; 光則郡; 佐藤　泰雄
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1984-02-29
Filing date: 1984-02-29
Publication date: 1985-09-18
Also published as: JPH0331278B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（Ａ）発明の技術分野本発明は、音節標準バタンを用いた音声認識処理方式、
特に各音節標準バタンと入力バタンを構成する音節との
距離計算を行うと共に、上記音節標準バタンに該当する
ものである確率（事後確率）を得るようにし、その結果
得られた所の入力バタンについての音節確率時系列情報
にもとづいて。

単語辞書の内容との照合を効率よく行うようにした音声
認識処理方式に関するものである。

（Ｂ）技術の背景と問題点音声自動認識の究極的な目標は９語党・文型等に何らの
制約も課することなく、任意の内容の音声を言語記号に
正しく変換しうろことであり、これには音素を認識の単
位とすることが必要となる。

しかしながら、音素の特徴は、調音結合によっＣ大きく
変動するため、現在のところすべての音素を正確に認識
し得る手法は知られていない。

一方、給電を限定すれば、単語を認識単位とすることに
よってこの問題をほとんど回避することができ、高い認
識率を達成し得る方式がすでに実用化されている。しか
しながら後者の欠点は、対象となる給電が大きくなると
、記ｔ９容量・演算時間の両面での要求が過大となるこ
とである。音素または単語を単位とするこれらの方式の
問題点をある程度回避するには、音節またはそれと類似
のものを暴本的華位とすることが考えられる。特に日本
語では、他の言語と比べて基本となる音節の数がかなり
少ないという利点がある。

音節を認識の単位とする場合、未知入力音声を既知の音
節標準バタンと比較して、標準バタンを識別することに
より未知入力音声を認識することができる。この場合、
音節標準バタンか不正確なものでは未知入力音声に対す
る識別精度が低下する。このため、音節標準バタンをど
のようにして作成するかということは重要な問題となる
。

一般に音節標準バタンとして望まれる性質は。

音節標準バタンと同じ音節の入力に対して距離が小さく
、異なる音節の入力に対して距離が大きくなることであ
る。このような音節標準バタンを作成する方法としては
次のような手順に基づく方法を２本発明者等は先に提案
している。即ち、ｆｉｌ　用意した音声試料の中から１
つを選んで音節標準バタン候補とする。このとき、この
音節標準バタン候補と同一の音節のバタン群をＡ群とす
る。

例えば／ＫＥ／の音節標準バタンを作成するとき。

／Ｋ　Ｅ／を含む音節バタン群／へＫＥ／、／ＩＫＥ／
、／ＵＫＥ／、／ＥＫＥ／、１０ＫＥ／等がＡ群となる
。他方、／ＫＥ／を含まない音節バタン群をＢ群とする
。例えば、／ＫＥ／を含まない音節バタン群／ＡＳＡ／
、／ＩＳＥ／、／ＵＳＥ／、／ＥＳＥ／、１０ＳＥ／、
／ＴＡＢ　Ｉ／、／ＴＵＴＥ／等がＢ群となる。Ｂ群は
複数の音節から成っているのでその１つ１つをＢｉ群と
する。

（２）音節標準パワに候補に対して、始点、終点。

パワーの重み係数を仮に設定し、Ａ群およびＢｉ群の各
バタンとの距離を計算する。これにより。

第１図に示すようにＡ群とＢｉ群との距離分布が得られ
る。これらが第１図に示すように正規分布をなずものと
仮定すると、各分布の平均および標準偏差が得られ、こ
れらの値から各分布の確率密度を次式のよ・）に計算す
ることができる。

Ａ群とＢ群の分布の重なりを表す評価指標をＰｅとする
と、Ｐｅは次式によって与えられる。

Ｐ、、ｄχ□（３）ここでｔは次式で与えられる。

ｐ　（ｘ　ｌ　Ａ）　・ＰＡ　−Σｐ（ｘｌＢ；　）　
・Ｐｓｒ−０（４１（３）始点、終点、パワーの重み係
数のすべての組み合わせに対して、評価指標Ｐｅを計算
し、Ｐｅの最小値を与える組み合わせをめる。

（４）以上の手順を、その音節のすべての標準バタン候
補に対して行い、評価指標Ｐｅの最小値を与える標準バ
タン候補を選択して音節標準バタンとする。

このように標準バタン毎に最適化を行って標準バタンを
作成するのでＡ群、Ｂ群の分布が最もよく分離している
標準バタンを得ることができる。

例えば２以上のようにして作成された音節標準バタンを
認識の単位とする従来の音声認、織方式を。

第２図に示す。図中、１は特徴抽出部、２ば距離計算部
、３は音節標準バタン登録部、４は判別部である。この
従来方式によれは、未知入力音声の特定部分が特徴抽出
部１に供給されると、抽出部は特徴を抽出して距離計算
部２に送る。音節標準バタン登録部３には、すべての音
節標準バタンか登録されており３距離計算部２において
、前記特徴のバタンと登録部３に登録されている全部の
音節標準バタンとの間の距離を個々に計算する。その計
算結果は１判別部４に送られる。判別部４では距離の最
も小さい音節標準バタンか入力バタンに相当しているも
のと判別し９判別結果を出力する。すなわち、距離の大
小によってのみ音節の判別を行っている。

以上の手順を、未知人力音声の音節を単位として連続的
に行えば未知入力音声を認識することができる。

しかし、この従来の音声認識方式のみでは次のような欠
点がある。すなわち、前述したような音節標準バタンの
作成の方法では、他のバタンとの距離が全体的に小さい
もの、あるいは全体的に大きいものが生ずることがあり
、このため単純に距離の大小だけによって音節の判別を
行うと、距離の全体的に小さい方に判別結果が偏り、誤
識別が多くなる。−例を第３図に基づいて説明する。第
３図（ａｌは／Ｋ　Ｅ／の最適音節標準バタンに対する
Ａ−Ｂ群の分布である。第３図ｆｂｌは／Ｓ　Ｕ／の最
適音節標準バタンに対するＡ−Ｂ群の分布である。

ある入力バタン／ＳＵ／がある場合に、／ＫＥ／の音節
標準バタンとの距＾ＩＩがｘｌで、／ＳＵ／の音節標準
バタンとの距離がｘ２である場合に、第３図（δ）の分
布を見れば明らかなように、距離がｘｌのとき／Ｋ　Ｅ
／である確率はほぼ０であり、また第３図（ｂｌの分布
を見れば明らかなように、距離が。

ｘ２のとき／Ｓ　Ｕ／である確率はほぼ１であることが
わかり、正確に判別することができる。しかし、単純に
距離を比較した場合には＋　Ｘ　ｌ　〈ｘ２であるから
入力バタン／Ｓ　Ｕ／は／　Ｋ　Ｆ、　／であると誤っ
て判別されることとなる。

この点を解決するために成る種の対策を講することが必
要であり、また当該対策をとった場合においてデータ処
理量が適正な範囲におさまることが望まれる。

（Ｃ）発明の目的と構成本発明は上記の対策をとった音声認識処理方式を提供す
ることを目的とし、入力バタン上の音節と上記音節標準
バタンｉとの距離が計算されたとき、当該入力バタン上
の音節がその音節標準バタン１である確率を表す事後確
率を用い、単語辞書の内容と照合するようにした音声認
識処理方式を提供することを目的としている。そしてそ
のため。

本発明の音節標４！バタンを用いた音声認識処理方式は
、音節標準バタンか登録される音節標準バタン登録部。

上記音節標準バタンを作成する際に抽出される確率パラ
メータを格納する確率パラメータ格納部。

入力バタンと上記音節標準バタン登録部に登録されてい
る各音節標準バタンとの間の距離を計算する距離計算部
。

該距離計算部によって計算された上記距離と上記確率パ
ラメータ格納部に格納されている確率パラメータとから
、上記人力バタンか上記距離の計算された音節標準バタ
ンである確率を表す事後確率を上記個々の距離について
計算する事後確率計算部。

該事後確率計算部において上記入力バタンを構成する各
音節候補について得られた確率ラティスをデータ圧縮し
て、当該入力バタンを構成する音節確率時系列情報を得
るデータ圧縮部５標準単語についての音節情報が格納さ
れている単語辞書部。

および上記人力バタンから抽出された音節確率時系列情
報と上記単語辞書部から読み出された標準単語について
の音節情報との照合を行う単語マツチング処理部。

をそなえ、上記単語マツチング処理部は。

上記単語辞書部に格納されている各単語における音節系
列と対応する音節についての上記音節確率時系列情報中
の確率から得られる先度と上記単語辞書部に格納されて
いる当該各単語における少なくとも音節系列と対応する
音節についての上記音節確率時系列情報中の出現時間間
隔から得られる先度とから総合先度をめ、単語照合を行うことを特徴としてい
る。以下図面を参照しつつ説明する。

（Ｄ）発明の実施例第４図ｆａｔ　（ｂｌは入力バタン上の音節が成る音節
標準バタンＩである確率を表す事後確率について説明す
る説明図、第５図は本発明の音声認識処理方式の一実施
例を示すブロック図、第６図ｔａ）は本願にいう確率ラ
ティスを表す説明図、第６図（ｂｌは当８１６ｕ率ラテ
ィスから抽出されたシラブル・パラメータを表す説明図
、第７図は本発明に用いられる単語辞書部の内容を説明
する説明図、第８図は第５図図示の単語マツチング処理
部における処理を説明するための説明図、第９図は本発
明を通用した場合の認識率を説明する説明図を示す。

本発明の音声認識処理方式の場合には、第３図（ａｌや
第３図（ｂ１図示の如きＡ−８分布が上述の音節標準バ
タンを作成したときに得られていることを利用し１本発
明にいう事後確率を入力バタンに対する認識モード時に
簡単に得られるようにしている。即ち事後確率は＋１１
．　（２１式で定義されるｐ　（ｘＩＡ）、ｐ　（ｘ　
ｉＢ　ｉ）を用いて次式で表される。

第４図（ａｌおよび（ｂ）に−例として、Ａ−Ｂ群の分
布と、そのときの事後確率Ｐ（＾ｌｘ）をそれぞれ示す
。第４図（ｂ）において距離がｘ３より大きい場合には
、入力バタンか第４図ｔａ＋の音節標準バタンである確
率は０であり、距離がＸ、より小さくなるに従って確率
は増大する。したがって、第４図ｆｂ）の事後確率に基
づいて入力バタンの判別を行えば。

少なくとも距離がｘ３より大きい場合には、第４図（ａ
）の標準バタンであるとするような誤った判別をされる
おそれはなくなる。このため未知人力音声の認識率が非
常に高くなる。

第５図図示の一実施例ブロック図において、５は音節標
準バタン作成モード時の入力音声に対する特徴抽出部で
あって入力音声から特徴パラメータを抽出するもの、６
はセグメンテーション部であって上記（３１，＋４１式
に示した如き評価指標Ｐｅを用いて音節標イ１ζバタン
を抽出するもの、７は音節標準バタン登録部であって上
述の如く抽出された複数個の音節標準バタンか格納され
るもの、８は確率パラメータ格納部であって各音節標準
バタンに対応して上記（１）式、（２）式に関連するｐ
　（ｘ　ｌ　Ａ）やｐ　（ｘ　ｌ　Ｂｉ）を得るための
データや上記（５）式に関連するパラメータＰ　（Ａ）
　とＰ（Ｂｉ）　とＮなどが格納されるもの、９ば入力
バタンに対する認識モート時の入力音声に対する特徴抽
出部であって入力バタンから特徴パラメータを時系列に
抽出するもの。

１０は距離計算部であって後述する如く音節連続１合を
行って入力バタン上の各フレーム毎に音節標準バタンと
の距ｈ］計算を行うもの、１１ば事後確率計算部であっ
て上記（５）式に対応する事後確率を逐次計算して本発
明にいう確率ラティスを得るもの、１２はデータ圧縮部
であって上記確率ラティスから例えば第６図（ｂ１図示
の如きシラブル・パラメータ（本発明にいう音節確率時
系列情報の１実施例）を得るもの、１３ば単語辞書部で
あって各標準単語についての音節情報が格納されている
もの、１４は単語マツチング処理部を表している。

上記音節標準バタン登録部７においては上述した如き形
で得られた各音節標準バタンか登録されており、また確
率パラメータ格納部８においては各音節標準バタンに対
応した形でＬ記（１）式や（２）式に示ずｐ（×１＾）
とＩｌｌ　（ｘ　ｌ　Ｂｉ）とを得るに必要なパラメー
タや上記（５）式に関連するパラメータＰ　（Ａ）とＰ
（Ｂｉ）とＮとなどが登録されている。この状態の下で
、未知入力バタンか例えば１６ＫＨ２精度、１２ビット
でザンブリングされ、プリエンファシスの後に２０ｍ５
ｅｃのハミング窓で切り出され、１５次のＬＰ（Ｊプス
Ｉ・ラム係数に変換される。ケプストラム０次項は、パ
ワー成分として利用される。フレーム間陥は５　ｍ５ｅ
ｃとなっている。

図示実施例において、入力バタンは音節毎にセグメンテ
ーションすることなく入力バタン全体にわたって、距離
計算部１０において、各フレーム時点で、音節標準バタ
ンとの距離が計算される。

この状態を音節連続照合と呼んでいる。各フレーム毎に
行われる距離計算は次の如き式にしたかって行われる。

Ｄ（Ｘ、に、Ｓ）　−ΣΣ（Ｘｌ、３．Ｊ−３ＩＪ）２
・ω８Ｊ−（６）更に上記（６）式においてω、４は次
の如く与えられる。

上述の如く連続照合が行われ距離計算が行われるとき、
事後確率計算部１１において上記（５）式に示した如き
事後確率が計算される。当該事後確率は、入力バタンの
音節Ｘが成る１つの音節標準バタンに対応する上述のＡ
群に属する確率を表している。

このような事後確率が計算されると、事後確率計算部１
１においては、第６図（ａ）図示の如き確率ラティスが
抽出される。即ち、今人カバタンが／　ｔａ　ｋａ　ｍ
ａ　ｔｓｕ　／であったとしたとき、入力バタンの始点
から。

〔Ｉ〕　約２００ｍ５ｅｃ近傍において、　（１）音節
標準バタン／ｐａ／に対して値ＩＯ，ＩＪ程度の確率を
もち、（ｉｉ）音節標準バタン／Ｌａ／に対して値ｒ　
Ｏ，３Ｊ程度のるを率をもち、（ｉｉｉ）音節標イ１（
バタン／ｋａ／に対して値ｒ　Ｏ，１ｊ程度のモイ「率
をもつ音節が存在していること。

（ＩＩ）　約５００ｍ５ｅｃ近傍において、　（１）音
節標準バタン／ｋａ／に対して値ｒ　Ｏ，６Ｊ程度の確
率をもち、（ｉｉ）音節標準バタン／ｓａ／に対して埴
ｒＯ，０８Ｊ程度の確率をもつ音節が存在していること
。

（ＩＩＩ）　約７５０ｍ５ｅｃ近傍におい一〇　（１）
音節標準バタン／ｍａ／に対して値ｒｏ、０８Ｊ程度の
Ｕ（ｌ：率をもち、（ｉｉ）音節標準バタン／ｒａ／に
対して値ＩＯ，０５Ｊ程度の確率をもつ音節が存在して
いること。

（ＩＶ）　約１０００　ｍ５ｅｃ近傍において、　（１
）音節標準バタン／ｌｓｕ／に対して値Ｉ−０，９Ｊ程
度の偵「率をもち、（ｉｉ）音節標準バタン／ｓｕ／に
対して値ｒ　０．４　Ｊ程度の確率をもつ音節が存在し
Ｃいること。

が確率ラティス上に示される形となる。なお第６図（ａ
ｌにおいて各音節標準バタンに対する確率が時間を横軸
として誤差関数的になっているのは各時点毎の確率をプ
ロットしたとき誤差関数的なものとなっていることによ
る。

第６図（ａ１図示の如き確率ラティスが抽出されると、
当該確率ラティスを利用して、入力バタンか属する単語
を認識することができる。即ら、今。

認識対象の単語として第７図図示の如く地名を表す単語
が存在し３．＃語辞書部１３上に格納されているものと
するとき、上記入力バタンの確率ラティスにもとづいて
。

（ｉ）　／ｋａ／−／、ｓａ／−／ｍａ／　／ｌｓｕ　
／である確率（ｉｉ）　／ｋａ／−／ｒａ／　／ｌｓｕ　／である確
率（ｉｉｉ　）　／　ｔａ／　／ｋａ／　／　ｔｓｕ　
／である確率の如く、第５図図示の単語マツチング処理
部１４においてそれぞれの確率を計算して、所望の単語
認識を行えば足りる。しかし、第６図ｆａ１図示の確率
ラティスの場合には、入力バタンの全時点における確率
値が盛り込まれていて、辞書照合の対象としては冗長性
が大で処理量を増大させる原因となる。このために、第
５図図示実施例の場合には。

データ圧縮部１２において、第６図ｔａ＋図示の如き確
率ラティスから第６図（ｂ１図示の如き音節確率時系列
情報にデータ圧縮を行うようにしている。第６図（ｂ１
図示の場合には、第６図（ａ１図示の確率ラティスにお
いて、各可能性のある音節標準バタンに対しての確率の
ピーク点の時点と確率値とのみを抽出し、他の情報を切
り捨てるようにしている。

第６図ｆｂ）図示の如きデータ圧縮された情報を１本明
細書において、シラブル・パラメータとりんでいる。

第５図図実施例において、ｉ語辞書部１３上には第７図
図示の如き形で各単語が登録され”ζいる。そして、第
５図図示の単語マツチング処理部１４は、上記シラブル
・パラメータを用いて５図示の場合には合計９つの時点
についての確率４算処理を行って、単語認識を行うよう
にする。上記単語辞書部の内容と上記シラブル・ノ々ラ
メークとを用いて卑語認識を行う態様は任意に考えるこ
とができるが、最も簡単には１例えば単語／ｋａ／　−
／ｓａ／　／ｍａ／　／ｌｓｕ　／に対して、上記シラ
フ′ル・パラメータにおける第１音節が、／ｋａ／であ
る確率と第２音節が／ｓａ／である確率と第３音節が／
ｍａ／である確率と第４音節が／ｌｓｕ／である確率と
の相乗平均値を調べるようにすればよ０゜当該態様は、
当該態様にもとづ（尤度Ｌａ　として次の如く定められ
いるものと対応すると考えてよし）。

Ｌ　ａ　−（ＩＩ　Ｐ　ｉ　）　’　−（８１しかしこ
の態様のみにもとづく評価を行う場合には、辞書内の単
語／ｌａ／−／ｋａ／　／ｍａ／　／ｌｓｕ　／に対す
る先度（本来認識されるべき単語に対する尤度）が、上
記第６図（ｂ１図示のシラブル・バラメークの場合に値
ＩＯ，７１ｊであるのに対して９次の如き場合が生じる
。即ぢ、辞書内の単語／↓ａ／−／ｋａ／　／ｌｓｕ　
／に対して上記尤度が埴ｒｏ、７６ｊとなり、また辞書
内の単語／　ｔｓｕ　／に対して上記先度が値ｒＯ，９
０Ｊとなることか生じる。このために、上記単語／ｌｓ
ｕ／が最尤度をもつ単語として非所望に詞１されてしま
うことか生しる。

このような誤認識を生しるのは９例えは上記単語／ｌａ
／　／ｋａ／　／ｌｓｕ／につＵ）で言えしよ、当該単
語におりる音節系列中の音節／ｌｓｕ／’が非所望に遅
れて現れている点を無視したことも１つの原因である。

また上記単語／ｌｓｕ／についても同様なことが言える
。むしろこのような場合にはマイナス評価を行うべきで
ある。１４１１ら時間間隔の要素を考慮して評価すべき
である。これは、第１番目の音節が上記シラブル・パラ
メータ上で現れた後に第（ｉ÷１）番目の音節が上記シ
ラブル・ノくラメータ上で現れたとしても極端に早く現
れた場合や。

極端に遅く現れた場合には、多少マイナス評価を行うべ
きであることを意味している。

このために、第８図図示の如き評価関数Ｅ（ｔ）を考え
。

Ｅ（０）＝０かつＥ（ｏｏ）＝ＯかつＥ（ＴＳ）＝１な
る条件を満足すべきものとする。但し、’ｒｓは第（ｉ
＋１）番目の音節が現れるであろう標準時間間隔であり
、実際には発話速度のバラツキを考慮して、第８図図示
の如く。

Ｅ　（ｔ）＝ｔ／ＴＢ　（ｔ＜Ｔ、において）−１（Ｔ
Ｒ＜　ｔ　＜　”ｒｓ　／”ｒｎにおいて）このような
評価関数Ｅ　（ｔ）を考慮した態様は。

当該態様にもとづく先度し、として次の如く定めている
ものに対応すると考えてよい。

当該（１０）式にて示す尤度Ｌｂを上記尤度Ｌ８と一緒
に考慮して、総合尤度りとして α　β Ｌ　＝　Ｌ　ａ−Ｌｂ−’（１１）（但し、α、β、二重み）を定義し、当該総合尤度りのより高い単語を最尤度をも
つ単語として抽出することにより、更に優れた認識率を
得ることが可能となる。なお本発明の主張するところは
３本実施例に挙げた総合先度及び各個別尤度の関数に限
られないことは当然である。

第９図は２本発明を適用した場合の正答認識率を説明す
る説明図を示している。図示においては。

認識対象の単語数がｎ個存在しているとしたときの認識
率をプ四ノドしたものである。実験に当たっては１女性
話者１名がアナウンス・ブース内で。

日本語６８音節および１２拗音の４８０音節について、
Ｃ■音節については４回ずつ、ＶＣＶ音節については３
回ずつ発声した計１５２０サンプルを用意し、上記音節
標準バタンを作成した。そして。

日本の都市名を１０００隼語分用意して、単語辞書部に
登録した。該登録に当たって、認識対象単語数がｎ個と
は、上記１０００単語の中からｎ個を抽出して単語辞書
部に登録したことを意味している。認識シミュレーショ
ンにおいては、１００都市名を各２回ずつ３モ一ラ／秒
で発声した２００サンプルを用意した。

第９図図示曲ＶＡＡは上記（８）式による先度り、のみ
を用いて行った認識率を表し１曲線Ｂは上記（１１）式
による総合尤度りを用いて行った認識率を表している。

図から判る如く２曲線Ｂの場合に。

認識率が大幅に向上していることが判る。

（Ｅ　）発明の詳細な説明した如く１本発明によれば、認識モード時に効率
的に圧縮された音節確率時系列情報を得て、単語辞書中
の音節系列情報を有効に利用した照合を行うことにより
、処理量を大幅に増大せしめることなく適確な単語認識
を行うことが可能となる。

【図面の簡単な説明】

第１図はＡ群およびＢ１群の距離分布を示す図。第２図は従来の音声認識方式を示ずブｒ＋／り図。第３図は従来の音声認識方式の欠点を説明するだめのＡ
−Ｂ群の距離分布を示す図、第４図（ａｌ　ｔｂ＋は入
カバクン上の音節が成る音節標準パタンｌである確率を
表す事後確率について説明する説明図。第５図は本発明の音声認識処理方式の一実施例を示すブ
ロック図、第６図（ａ＋は本願にいう僅率うケイスを表
す説明図、第６図（ｂｌは当該確率ラティスから抽出さ
れたシラブル・パラメータを表す説明図、第７図は本発
明に用いられる単語辞賓部の内容を説明する説明図、第
８図は第５１２１図示の単語マツチング処理部における
処理を説明するための説明図、第９図は本発明を適用し
た場合の認識率を説明する説明図を示す。図中、５は特徴抽出部、６はセグメンテーソヨン部、７
は音節標準バタン登録部、８は６亀率パラメ一タ格納部
、９は特徴抽出部、１０は距離計算部、１１は事後確率
計算部、１２はデータ圧縮部１３は単語辞書部、１４は
単語マツチング処理部を表す。特許出願人　藤　崎　博　也（外１名）代理人弁理士　
森　１）　寛（外１名）了巨　ｉ＃　ヱ隼１　目第２凪１　エ第４０や−　− 才Ｇ図２７図千８ｍす９　（２）一嬰詐げ−を象ψ話跋（九）

Claims

【特許請求の範囲】音節標準バタンか登録される音節標準バタン登録部。上記音節標準バタンを作成する際に抽出される確率パラ
メータを格納する確率パラメータ格納部。入力バタンと上記音節標準バタン登録部に登録されてい
る各音節標準バタンとの間の距離を計算する距離計算部
。該距離計算部によって計算された上記距離と上記確率パ
ラメータ格納部に格納されている確率パラメータとから
、上記入力バタンか上記距離の言１算された音節標準バ
タンである確率を表す事後確率を上記価々の距離につい
て計算する事後確率計算部。該事後確率計算部において上記入力バタンを構成する各
音節候補について得られた確率ラティスをデータ圧縮し
て、当該入力バタンを構成する音節確率時系列情報を得
るデータ圧縮部。標準単語についての音節情報が格納されている単語辞書
部。および上記入力バタンから抽出された音節確率時系列情
報と上記単語辞書部から読み出された標準単語について
の音節情報との照合を行う単語マツチング処理部。をそなえ、」二記単語マツチング処理部は。上記単語辞書部に格納されている各単語における音節系
列と対応する音節についての上記音節確率時系列情報中
の確率から得られる先度と上記単語辞書部に格納されて
いる当該各ｊ１語における少なくとも音節系列と対応す
る音節についての上記音節確率時系列情報中の出現時間
間隔から得られる尤度とから総合尤度をめ、単語照合を行うことを特徴とする音
節標準バタンを用いた音声認識処理方式。