JPS595292A - 単語音声認識方法 - Google Patents
単語音声認識方法Info
- Publication number
- JPS595292A JPS595292A JP57112492A JP11249282A JPS595292A JP S595292 A JPS595292 A JP S595292A JP 57112492 A JP57112492 A JP 57112492A JP 11249282 A JP11249282 A JP 11249282A JP S595292 A JPS595292 A JP S595292A
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- phoneme
- likelihood
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 12
- 238000010586 diagram Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 241000609816 Pantholops hodgsonii Species 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、入力音声に対して先ず音素認識を行ない、こ
の認識音素系列を音素表記された単語辞書と照合して単
語を認識する単語音声認識方法に関し、従来よシ高い単
語認識率の得られる単語音声認識方法を提供するもので
ある。
の認識音素系列を音素表記された単語辞書と照合して単
語を認識する単語音声認識方法に関し、従来よシ高い単
語認識率の得られる単語音声認識方法を提供するもので
ある。
従来の単語認識方法を第1図とともに説明する。
第1図に示すように、入力音声に対して先ず分析を行な
い、この入力単語音声の特徴を抽出して、入力単語音声
を構成する音素を認識する。この認識された音素系列を
、単語辞書中の各辞書項目の辞書音素系列と照合し、2
つの音素系列間の尤度を音素間のコンフユージヨンマト
リクス(Conf us ionMatriX +以下
C,M、と略す)を用いて、各音素毎の認識確率を求め
ることによシ算出し、音素系列間の尤度が最大となる辞
書項目をもって認識単語とするものである。
い、この入力単語音声の特徴を抽出して、入力単語音声
を構成する音素を認識する。この認識された音素系列を
、単語辞書中の各辞書項目の辞書音素系列と照合し、2
つの音素系列間の尤度を音素間のコンフユージヨンマト
リクス(Conf us ionMatriX +以下
C,M、と略す)を用いて、各音素毎の認識確率を求め
ることによシ算出し、音素系列間の尤度が最大となる辞
書項目をもって認識単語とするものである。
第1表は、前記単語音声認識方法に用いる単語辞書の一
例を示しておシ、各単語は第2表に示す音素表記法に従
って表記されている。第2図は前記C,M、の一部を示
す。第2図において、縦は単語辞書中の音素を示し、横
は認識音素を示している。
例を示しておシ、各単語は第2表に示す音素表記法に従
って表記されている。第2図は前記C,M、の一部を示
す。第2図において、縦は単語辞書中の音素を示し、横
は認識音素を示している。
また第2図中の数字は単語辞書中の各音素がどのような
音素に認識されるかの確率をチで示したものである。例
えば第2図において、単語辞書中の音素工が工と認識さ
れる確率は75%、UK認識される確率は5%、Aに認
識される確率は0%、°脱落する確率は8%・・・等を
示している。
音素に認識されるかの確率をチで示したものである。例
えば第2図において、単語辞書中の音素工が工と認識さ
れる確率は75%、UK認識される確率は5%、Aに認
識される確率は0%、°脱落する確率は8%・・・等を
示している。
第 1 表
第 2 表
音素認識率の低い音素を持つ単語の場合、その単語の入
力音声の認識音素系列と辞書音素系列との尤度は音素1
識結果が良好であっても低くなシ、他の単語の辞書項目
の辞書音素系列との尤度の差は小さくなる傾向にある。
力音声の認識音素系列と辞書音素系列との尤度は音素1
識結果が良好であっても低くなシ、他の単語の辞書項目
の辞書音素系列との尤度の差は小さくなる傾向にある。
このような単語においては、入力音声の音素認識に誤シ
があると、正解辞書項目(ある単語の入力音声に対し、
その単語の辞書項目を正解辞書項目と言う)よシ他の辞
書項目の方が音素系列間の尤度が高い状態が容易に生じ
、これは、従来の単語認識方法では全て単語誤認識とな
シ単語認識率低下の原因となっていた。
があると、正解辞書項目(ある単語の入力音声に対し、
その単語の辞書項目を正解辞書項目と言う)よシ他の辞
書項目の方が音素系列間の尤度が高い状態が容易に生じ
、これは、従来の単語認識方法では全て単語誤認識とな
シ単語認識率低下の原因となっていた。
本発明は、上記従来例の欠点を大幅に改善するものであ
シ、以下に本発明の一実施例について説明する。
シ、以下に本発明の一実施例について説明する。
本実施例では、第1図に示す従来例と同様に、まず、入
力音声の音素認識を行ない、この認識音素系列と、単語
辞書中の各辞書項目の辞書音素系列とを照合し、尤度を
求める。ここまでは従来例と同様であるが、この尤度に
、各辞書項目毎に予め定めておいた尤度重み値を加算し
て重み付尤度値を算出し、この重み付尤度値が最大とな
る辞書項目をもって認識単語とする。即ち、尤度そのも
のではなく、重み付尤度値を用いて単語を認識するもの
である。
力音声の音素認識を行ない、この認識音素系列と、単語
辞書中の各辞書項目の辞書音素系列とを照合し、尤度を
求める。ここまでは従来例と同様であるが、この尤度に
、各辞書項目毎に予め定めておいた尤度重み値を加算し
て重み付尤度値を算出し、この重み付尤度値が最大とな
る辞書項目をもって認識単語とする。即ち、尤度そのも
のではなく、重み付尤度値を用いて単語を認識するもの
である。
次に、本実施例における尤度重み値の定め方について説
明する。まず、従来の単語音声認識方法において、音声
データを用いて単語認識を行なう。
明する。まず、従来の単語音声認識方法において、音声
データを用いて単語認識を行なう。
そして、単語認識結果が正しかった音声データのみ用い
て、各単語毎の認識音素系列と正解辞書項目の辞書音素
系列との間の尤度の平均を求める。
て、各単語毎の認識音素系列と正解辞書項目の辞書音素
系列との間の尤度の平均を求める。
ここで求めた各単語毎の尤度平均値は、各単語毎の音素
認識の難易度を表わすものでおる。尤度平均値の低い単
語は、従来例の説明で述べたように、正解辞書項目より
も他の辞書項目の方が高い尤度を示す可能性が強い。な
お、尤度平均値を求めるのに、単語認識結果の正しかっ
た音声データのみを用いたのは、単語認識を誤まった音
声データは、データそのものが不良であることも多く、
そのようなデータを排除するためである。ところで、音
素系列間の尤度は、音素系列を構成する各音素毎の認識
確率を対数化して加算し、音素数にかかわらず900点
満点と々るように正規化したものである。本実施例にお
いて、各単語辞書項目毎の尤度重み値は、次式で求めた
。
認識の難易度を表わすものでおる。尤度平均値の低い単
語は、従来例の説明で述べたように、正解辞書項目より
も他の辞書項目の方が高い尤度を示す可能性が強い。な
お、尤度平均値を求めるのに、単語認識結果の正しかっ
た音声データのみを用いたのは、単語認識を誤まった音
声データは、データそのものが不良であることも多く、
そのようなデータを排除するためである。ところで、音
素系列間の尤度は、音素系列を構成する各音素毎の認識
確率を対数化して加算し、音素数にかかわらず900点
満点と々るように正規化したものである。本実施例にお
いて、各単語辞書項目毎の尤度重み値は、次式で求めた
。
次に、本実施例による単語認識結果の一例を、従来例と
比較して示す。単語「マツバラ」(辞書音素系列MAC
UBARA)のちる音声データの音素認識結果はA P
U B AWAであった。この時、正解辞書項目との
尤度は788点、辞書項目KAKOG*AWA(カコガ
ワ)との尤度は790点であった。この場合、従来例に
よる単語認識結果は「カコガワ」であシ、単語誤認識で
あった。本実施例によれば、事前に定めだ尤度重み値は
MACUBARAは7点、KAKOG*AWAは2点で
あるので、重み伺き尤度値は、MACUBARAでは7
95点、KAKOG才AWAでは792点となって、正
しく単語認識されるようになる。
比較して示す。単語「マツバラ」(辞書音素系列MAC
UBARA)のちる音声データの音素認識結果はA P
U B AWAであった。この時、正解辞書項目との
尤度は788点、辞書項目KAKOG*AWA(カコガ
ワ)との尤度は790点であった。この場合、従来例に
よる単語認識結果は「カコガワ」であシ、単語誤認識で
あった。本実施例によれば、事前に定めだ尤度重み値は
MACUBARAは7点、KAKOG*AWAは2点で
あるので、重み伺き尤度値は、MACUBARAでは7
95点、KAKOG才AWAでは792点となって、正
しく単語認識されるようになる。
このように、本発明の単語音声認識方法によれば、従来
の方法で単語認識率の低かった単語の単語認識率を向上
させることができる利点を有するものでちる。
の方法で単語認識率の低かった単語の単語認識率を向上
させることができる利点を有するものでちる。
第1図は、従来例および本発明の一実施例における単語
音声認識方法を示す概略図、第2図は、従来例および本
発明の一実施例におけるC、M、の一部分を示す図であ
る。
音声認識方法を示す概略図、第2図は、従来例および本
発明の一実施例におけるC、M、の一部分を示す図であ
る。
Claims (1)
- 入力音声に対して音素認識を行なって認識音素系列を得
、この認識音素系列と、音素表記された単語辞書の各辞
書項目の辞書音素系列との尤度を計算して単語を認識す
るに際し、前記各辞書項目毎に予め尤度重み値を定めて
おき、この尤度重み値を前記音素系列間の尤度に加算ま
たは乗算して重み付尤度値を算出し、この重み付尤度値
が最大となる辞書項目をもって認識単語とすることを特
徴とする単語音声認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57112492A JPS595292A (ja) | 1982-07-01 | 1982-07-01 | 単語音声認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57112492A JPS595292A (ja) | 1982-07-01 | 1982-07-01 | 単語音声認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS595292A true JPS595292A (ja) | 1984-01-12 |
| JPS6310439B2 JPS6310439B2 (ja) | 1988-03-07 |
Family
ID=14587995
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57112492A Granted JPS595292A (ja) | 1982-07-01 | 1982-07-01 | 単語音声認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS595292A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6146995A (ja) * | 1984-08-11 | 1986-03-07 | 富士通株式会社 | 音声認識システム |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0523108U (ja) * | 1991-09-10 | 1993-03-26 | 三菱電線工業株式会社 | サンプル採取装置 |
-
1982
- 1982-07-01 JP JP57112492A patent/JPS595292A/ja active Granted
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6146995A (ja) * | 1984-08-11 | 1986-03-07 | 富士通株式会社 | 音声認識システム |
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6310439B2 (ja) | 1988-03-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH04362699A (ja) | 音声認識方法及び装置 | |
| KR102144345B1 (ko) | 사용자 정의 단어에 기초하여 음성 인식 결과의 보정 처리를 수행하는 음성 인식 처리 장치 및 그 동작 방법 | |
| JPS595292A (ja) | 単語音声認識方法 | |
| JP3444108B2 (ja) | 音声認識装置 | |
| JP6527000B2 (ja) | 発音誤り検出装置、方法およびプログラム | |
| JPS5968796A (ja) | 単語音声認識方法 | |
| JPH04296799A (ja) | 音声認識装置 | |
| JPH08314490A (ja) | ワードスポッティング型音声認識方法と装置 | |
| JPS5968794A (ja) | 単語音声認識方法 | |
| JPH0158519B2 (ja) | ||
| JPS5872996A (ja) | 単語音声認識方法 | |
| JPH1097284A (ja) | 音声認識方法,音声認識装置,及び記憶媒体 | |
| JPS5872995A (ja) | 単語音声認識方法 | |
| JPS59143200A (ja) | 連続音声認識装置 | |
| JPS617896A (ja) | 単語音声認識方法 | |
| JPS59189398A (ja) | 連続音声認識方式 | |
| JPS58159598A (ja) | 単音節音声認識方式 | |
| JPS63250698A (ja) | 音声認識装置 | |
| JPH0126080B2 (ja) | ||
| JPS60147799A (ja) | 音声認識方法 | |
| JPS5968797A (ja) | 単語音声認識方法 | |
| JPS6039692A (ja) | 単語音声認識方法 | |
| JPS5978399A (ja) | 単語音声認識方法 | |
| JPS62255999A (ja) | 単語音声認識装置 | |
| JPH0313600B2 (ja) |