JPS595292A

JPS595292A - 単語音声認識方法

Info

Publication number: JPS595292A
Application number: JP57112492A
Authority: JP
Inventors: 入間野　孝雄; 秋場　国夫; 金指　久則
Original assignee: Computer Basic Technology Research Association Corp
Current assignee: Computer Basic Technology Research Association Corp
Priority date: 1982-07-01
Filing date: 1982-07-01
Publication date: 1984-01-12
Also published as: JPS6310439B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は、入力音声に対して先ず音素認識を行ない、こ
の認識音素系列を音素表記された単語辞書と照合して単
語を認識する単語音声認識方法に関し、従来よシ高い単
語認識率の得られる単語音声認識方法を提供するもので
ある。

従来の単語認識方法を第１図とともに説明する。

第１図に示すように、入力音声に対して先ず分析を行な
い、この入力単語音声の特徴を抽出して、入力単語音声
を構成する音素を認識する。この認識された音素系列を
、単語辞書中の各辞書項目の辞書音素系列と照合し、２
つの音素系列間の尤度を音素間のコンフユージヨンマト
リクス（Ｃｏｎｆ　ｕｓ　ｉｏｎＭａｔｒｉＸ　＋以下
Ｃ，Ｍ、と略す）を用いて、各音素毎の認識確率を求め
ることによシ算出し、音素系列間の尤度が最大となる辞
書項目をもって認識単語とするものである。

第１表は、前記単語音声認識方法に用いる単語辞書の一
例を示しておシ、各単語は第２表に示す音素表記法に従
って表記されている。第２図は前記Ｃ，Ｍ、の一部を示
す。第２図において、縦は単語辞書中の音素を示し、横
は認識音素を示している。

また第２図中の数字は単語辞書中の各音素がどのような
音素に認識されるかの確率をチで示したものである。例
えば第２図において、単語辞書中の音素工が工と認識さ
れる確率は７５％、ＵＫ認識される確率は５％、Ａに認
識される確率は０％、°脱落する確率は８％・・・等を
示している。

第　　　　１　　　　表第　　　２　　　　表音素認識率の低い音素を持つ単語の場合、その単語の入
力音声の認識音素系列と辞書音素系列との尤度は音素１
識結果が良好であっても低くなシ、他の単語の辞書項目
の辞書音素系列との尤度の差は小さくなる傾向にある。

このような単語においては、入力音声の音素認識に誤シ
があると、正解辞書項目（ある単語の入力音声に対し、
その単語の辞書項目を正解辞書項目と言う）よシ他の辞
書項目の方が音素系列間の尤度が高い状態が容易に生じ
、これは、従来の単語認識方法では全て単語誤認識とな
シ単語認識率低下の原因となっていた。

本発明は、上記従来例の欠点を大幅に改善するものであ
シ、以下に本発明の一実施例について説明する。

本実施例では、第１図に示す従来例と同様に、まず、入
力音声の音素認識を行ない、この認識音素系列と、単語
辞書中の各辞書項目の辞書音素系列とを照合し、尤度を
求める。ここまでは従来例と同様であるが、この尤度に
、各辞書項目毎に予め定めておいた尤度重み値を加算し
て重み付尤度値を算出し、この重み付尤度値が最大とな
る辞書項目をもって認識単語とする。即ち、尤度そのも
のではなく、重み付尤度値を用いて単語を認識するもの
である。

次に、本実施例における尤度重み値の定め方について説
明する。まず、従来の単語音声認識方法において、音声
データを用いて単語認識を行なう。

そして、単語認識結果が正しかった音声データのみ用い
て、各単語毎の認識音素系列と正解辞書項目の辞書音素
系列との間の尤度の平均を求める。

ここで求めた各単語毎の尤度平均値は、各単語毎の音素
認識の難易度を表わすものでおる。尤度平均値の低い単
語は、従来例の説明で述べたように、正解辞書項目より
も他の辞書項目の方が高い尤度を示す可能性が強い。な
お、尤度平均値を求めるのに、単語認識結果の正しかっ
た音声データのみを用いたのは、単語認識を誤まった音
声データは、データそのものが不良であることも多く、
そのようなデータを排除するためである。ところで、音
素系列間の尤度は、音素系列を構成する各音素毎の認識
確率を対数化して加算し、音素数にかかわらず９００点
満点と々るように正規化したものである。本実施例にお
いて、各単語辞書項目毎の尤度重み値は、次式で求めた
。

次に、本実施例による単語認識結果の一例を、従来例と
比較して示す。単語「マツバラ」（辞書音素系列ＭＡＣ
ＵＢＡＲＡ）のちる音声データの音素認識結果はＡ　Ｐ
　Ｕ　Ｂ　ＡＷＡであった。この時、正解辞書項目との
尤度は７８８点、辞書項目ＫＡＫＯＧ＊ＡＷＡ（カコガ
ワ）との尤度は７９０点であった。この場合、従来例に
よる単語認識結果は「カコガワ」であシ、単語誤認識で
あった。本実施例によれば、事前に定めだ尤度重み値は
ＭＡＣＵＢＡＲＡは７点、ＫＡＫＯＧ＊ＡＷＡは２点で
あるので、重み伺き尤度値は、ＭＡＣＵＢＡＲＡでは７
９５点、ＫＡＫＯＧ才ＡＷＡでは７９２点となって、正
しく単語認識されるようになる。

このように、本発明の単語音声認識方法によれば、従来
の方法で単語認識率の低かった単語の単語認識率を向上
させることができる利点を有するものでちる。

【図面の簡単な説明】

第１図は、従来例および本発明の一実施例における単語
音声認識方法を示す概略図、第２図は、従来例および本
発明の一実施例におけるＣ、Ｍ、の一部分を示す図であ
る。

Claims

【特許請求の範囲】

入力音声に対して音素認識を行なって認識音素系列を得
、この認識音素系列と、音素表記された単語辞書の各辞
書項目の辞書音素系列との尤度を計算して単語を認識す
るに際し、前記各辞書項目毎に予め尤度重み値を定めて
おき、この尤度重み値を前記音素系列間の尤度に加算ま
たは乗算して重み付尤度値を算出し、この重み付尤度値
が最大となる辞書項目をもって認識単語とすることを特
徴とする単語音声認識方法。