JPH0458636B2

JPH0458636B2 -

Info

Publication number: JPH0458636B2
Application number: JP59129854A
Authority: JP
Inventors: Takao Irumano; Hisanori Kanezashi; Kunio Akiba
Original assignee: Matsushita Communication Industrial Co Ltd
Current assignee: Panasonic Mobile Communications Co Ltd
Priority date: 1984-06-22
Filing date: 1984-06-22
Publication date: 1992-09-18
Also published as: JPS617894A

Description

【発明の詳細な説明】産業上の利用分野本発明は、入力音声と音素表記された単語辞書
を照合して単語を認識する音声認識方法に関する
ものである。

従来例の構成とその問題点従来の音声認識方法を図面とともに説明する。
図において、単語辞書は認識すべき全単語を音素
で表記したものであり、例えばアサヒ、ユーキ、
ユキは／ASAHI／、／JUUKI／、／JUKI／等
と表記されている。音素と標準パタンは、各音素
毎に予め予備実験等により作成しておく。

次に上記従来例の動作について説明する。入力
音声を10msのフレーム毎に分析し、パラメータ
を抽出してパラメータ時系列を作成する。パラメ
ータを予め計算しておくものである。次に、各辞
書項目毎に類似度を求めるのであるが、この類似
度計算時に、その辞書項目を構成する辞書音素系
列に従つて音素のセグメンテーシヨンを行ない、
そのセグメンテーシヨンされた音声区間が、その
音素を発声したものである確からしさを表わす尺
度である尤度を計算し、その辞書項目における各
音素の尤度の平均値として類似度を求め、類似度
が最大となる辞書項目をもつて認識単語とする。

ここで長母音、例えば／JUUKI／の／UU／
は、／Ｕ／と／Ｕ／の境界を見い出すことは通常
できないので、／UU／を１まとめにしてセグメ
ンテーシヨンし、尤度も１まとめにして計算す
る。なお、上記／UU／のような長母音は、長母
音であるところの１個の音素と考えることも可能
であるが本従来例では２個の音素／Ｕ／が続くも
のとして取り扱つている。従つて尤度も２音素分
の尤度の値を算出する。

本従来例において、辞書音素系列におけるｉ番
目の音素の尤度liは次式で表わされる。

li＝l_iO−l_iP …… ここでl_iOは、ゼグメンテーシヨンされた区間中
の各フレームにおけるパラメータが、その音素の
標準パタンにどれだけ合致するかを表わす尺度と
して計算される。また、l_iPは、セグメンテーシヨ
ンされた区間が長過ぎ、または短過ぎの場合の尤
度の減点を表わす。長母音は前記のように複数音
素をまとめて尤度計算を行なうので式とは若干
異なるが、基本的には同様で、標準パタンとの合
致度と、長さによる減点で尤度を決定する。ここ
で単語／JUUKI／と／JUKI／は、／Ｕ／が長母
音か短母音かという点のみ異なる。このような語
を識別するため、本従来例において、長母音、こ
の例では／UU／の尤度計算時に／UU／の区間
の長さが予め定められたスレツシヨルドより短い
場合には尤度の減点を行ない、一方、通常の短母
音、この例では／Ｕ／の尤度計算時に、／Ｕ／の
区間の長さがスレツシヨルドより長い場合には尤
度の減点を行なつている。

しかしながら、上記従来例においては以下のよ
うな欠点があつた。入力単語が／JUUKI／で、
辞書音素系列も／JUUKI／である場合、／Ｊ／
のセグメンテーシヨンにおいて、パラメータの変
動の大きい部分を／Ｊ／と／Ｕ／の境界としてい
るが、／Ｊ／の区間が非常に長くなり／UU／の
区間がその分短くなつてしまうことがしばしばあ
る。これは半母音に長母音が後続すると、短母音
が後続する場合と比べ、半母音特有のパラメータ
変化が長く続くからである。つまり聴感的に
は、／JUU／の／UU／は、／JU／の／Ｕ／よ
り明らかに長いのであるが、／JUU／の／UU／
は、単に／Ｕ／を引き伸ばしたものではなく、／
Ｊ／の性質が長く続いているということである。
よつて、前記のように／Ｊ／のセグメンテーシヨ
ンを行なうと、／JUU／が／JU／に比べ長くな
つた分を、／Ｊ／が長くなることによつて食つて
しまい、／Ｊ／を除いた／UU／の部分は長母音
にしては短いということが生じる。このような
時、入力／JUUKI／に対し、辞書項目／
JUUKI／において／UU／の尤度が短過ぎ減点の
ために低くなり、一方、辞書項目／JUKI／の／
Ｕ／は減点されないため、高い尤度となつて類似
度も／JUKI／の方が大となり、単語認識結果
が／JUKI／に誤つてしまう欠点があつた。

発明の目的本発明は、上記従来例の欠点を除去するもので
あり、類似度計算の精度を向上させ、それにより
単語認識率を向上させることを目的とする。

発明の構成本発明は、上記目的を達成するために、半母音
に後続する長母音又は短母音の長さの適否を判定
するにあたり、その長母音又はその短母音の区間
長と、先行する半母音の区間長の和を用いること
により、長母音の区間長が短い場合でも先行する
半母音の区間との和が長ければ、長母音の短過ぎ
による尤度の減点を行なわず、一方、短母音の区
間長が短い場合でも先行する半母音の区間との和
が長い時には尤度の減点を行ない、それにより尤
度、類似度計算の精度を向上させる効果を持つも
のである。

実施例の説明以下に本発明の一実施例について、図面ととも
に説明する。本実施例の基本構成は、前記従来例
と同様であり、また単語辞書、音素の標準パタン
も前記従来例と同様である。

本実施例の動作について説明する。本実施例の
前記従来例と異なる所は、半母音に後続する母音
の尤度計算法であり、他の部分は同様であるか
ら、その尤度計算法について述べる。なお、ここ
で半母音と言う場合、語頭や母音に挾まれた半母
音だけでなく、拗音における半母音部分、すなわ
ちリヤ（／RJA／）等の／Ｊ／も含む。尤度計
算は、前記従来例と同様、入力音声を辞書音素系
列に従つてセグメンテーシヨンし、式または長
母音の場合式に準じた式により尤度を求める。
しかし、本実施例において、尤度の減点、すなわ
ち式におけるl_iPの決め方が前記従来例と異な
る。本実施例における、半母音に後続する長母音
の尤度計算において、長母音の短過ぎの減点は、
長母音だけの区間の長さではなく、長母音の区間
と先行する半母音の区間の長さの和に対してスレ
ツシヨルドを設け、その和がスレツシヨルドより
短い場合に行なう。さらに、半母音に後続する短
母音の尤度計算において、短母音の長過ぎの減点
は、その母音だけの区間の長さではなく、短母音
の区間と先行する半母音の区間の長さの和に対し
てスレツシヨルドを設け、その和がスレツシヨル
ドより長い場合に行なう。

本実施例の効果の例を述べる。前記従来例と同
じ、図に示す入力単語／JUUKI／の場合を述べ
る。この入力例において、辞書項目も／
JUUKI／である時、セグメンテーシヨン結果は
前記従来例と同様／Ｊ／の区間が長く、／UU／
の区間は長母音にしては短いという結果になつ
た。しかし、本実施例では／UU／の区間に／
Ｊ／の区間を加えた長さの和をみるので、ここで
は／Ｊ／の区間が長いため、／UU／に対する短
過ぎの尤度の減点は無かつた。また、同じ入力／
JUUKI／に対し、辞書項目／JUKI／の場合、セ
グメンテーシヨン結果は／Ｊ／は／JUUKI／
の／Ｊ／と同じ区間、／Ｕ／は／JUUKI／の／
UU／と同じ区間となつた。ここで／Ｕ／の長さ
は、短母音の／Ｕ／として標準的な長さであつ
た。しかし、本実施例においては／Ｕ／の区間
に／Ｊ／の区間を加えた和をみるため、ここで
は／Ｊ／の区間が非常に長いため、その和がスレ
ツシヨルドを越え、／Ｕ／の尤度は長過ぎ減点さ
れた。この結果、この／JUUKI／の入力に対し、
辞書項目／JUUKI／における類似度は、前記従
来例の場合と比べ、／UU／の短過ぎ減点が無い
分だけ大きくなり、一方辞書項目／JUKI／にお
ける類似度は、前記従来例の場合と比べ、／Ｕ／
の長過ぎ減点の分だけ小さくなり、これらにより
単語認識結果は正しく／JUUKI／となつた。

本実施例においては、半母音に後続する長母音
の短過ぎに対する尤度の減点、及び半母音に後続
する短母音の長過ぎに対する尤度の減点を、それ
ら母音の区間と先行する半母音の区間の長さの和
に対してスレツシヨルドを設けて行なうことによ
り、半母音に後続する長母音、及び短母音の尤度
の減点を的確に行ない、尤度計算の精度を向上で
きる利点がある。

発明の効果本発明は上記のような構成であり、半母音に後
続する長母音の短過ぎの制限、半母音に後続する
短母音の長過ぎの制限を、それら母音の区間に先
行する半母音の区間の長さを加えた長さの和に対
し、スレツシヨルドを設けて尤度を減点すること
により行ない、長母音と短母音の識別度を上げる
方向に類似度計算の精度を向上させ、高い単語認
識率を得ることができる。

【図面の簡単な説明】

図は、従来及び本発明の一実施例における音声
認識方法を示す図である。

Claims

【特許請求の範囲】

１入力音声と、認識すべき単語を音素で表記し
た単語辞書の辞書項目とを照合し、各辞書項目を
構成する辞書音素系列に従い、各１音素毎に入力
音声をセグメンテーシヨンし、そのセグメンテー
シヨンされた音声の区間がその音素を発生したも
のである確からしさを示す尺度である尤度を計算
し、この尤度の値を用いて各辞書項目と入力音声
との類似度を求めて入力単語を認識するにあた
り、半母音に後続する長母音の短か過ぎ及び短母
音の長過ぎの制限を、その長母音又は短母音とそ
の前の半母音の長さの和をもとにして行うことを
特徴とする音声認識方法。