JPS595292A - 単語音声認識方法 - Google Patents

単語音声認識方法

Info

Publication number
JPS595292A
JPS595292A JP57112492A JP11249282A JPS595292A JP S595292 A JPS595292 A JP S595292A JP 57112492 A JP57112492 A JP 57112492A JP 11249282 A JP11249282 A JP 11249282A JP S595292 A JPS595292 A JP S595292A
Authority
JP
Japan
Prior art keywords
word
dictionary
phoneme
likelihood
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57112492A
Other languages
English (en)
Other versions
JPS6310439B2 (ja
Inventor
入間野 孝雄
秋場 国夫
金指 久則
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP57112492A priority Critical patent/JPS595292A/ja
Publication of JPS595292A publication Critical patent/JPS595292A/ja
Publication of JPS6310439B2 publication Critical patent/JPS6310439B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、入力音声に対して先ず音素認識を行ない、こ
の認識音素系列を音素表記された単語辞書と照合して単
語を認識する単語音声認識方法に関し、従来よシ高い単
語認識率の得られる単語音声認識方法を提供するもので
ある。
従来の単語認識方法を第1図とともに説明する。
第1図に示すように、入力音声に対して先ず分析を行な
い、この入力単語音声の特徴を抽出して、入力単語音声
を構成する音素を認識する。この認識された音素系列を
、単語辞書中の各辞書項目の辞書音素系列と照合し、2
つの音素系列間の尤度を音素間のコンフユージヨンマト
リクス(Conf us ionMatriX +以下
C,M、と略す)を用いて、各音素毎の認識確率を求め
ることによシ算出し、音素系列間の尤度が最大となる辞
書項目をもって認識単語とするものである。
第1表は、前記単語音声認識方法に用いる単語辞書の一
例を示しておシ、各単語は第2表に示す音素表記法に従
って表記されている。第2図は前記C,M、の一部を示
す。第2図において、縦は単語辞書中の音素を示し、横
は認識音素を示している。
また第2図中の数字は単語辞書中の各音素がどのような
音素に認識されるかの確率をチで示したものである。例
えば第2図において、単語辞書中の音素工が工と認識さ
れる確率は75%、UK認識される確率は5%、Aに認
識される確率は0%、°脱落する確率は8%・・・等を
示している。
第    1    表 第   2    表 音素認識率の低い音素を持つ単語の場合、その単語の入
力音声の認識音素系列と辞書音素系列との尤度は音素1
識結果が良好であっても低くなシ、他の単語の辞書項目
の辞書音素系列との尤度の差は小さくなる傾向にある。
このような単語においては、入力音声の音素認識に誤シ
があると、正解辞書項目(ある単語の入力音声に対し、
その単語の辞書項目を正解辞書項目と言う)よシ他の辞
書項目の方が音素系列間の尤度が高い状態が容易に生じ
、これは、従来の単語認識方法では全て単語誤認識とな
シ単語認識率低下の原因となっていた。
本発明は、上記従来例の欠点を大幅に改善するものであ
シ、以下に本発明の一実施例について説明する。
本実施例では、第1図に示す従来例と同様に、まず、入
力音声の音素認識を行ない、この認識音素系列と、単語
辞書中の各辞書項目の辞書音素系列とを照合し、尤度を
求める。ここまでは従来例と同様であるが、この尤度に
、各辞書項目毎に予め定めておいた尤度重み値を加算し
て重み付尤度値を算出し、この重み付尤度値が最大とな
る辞書項目をもって認識単語とする。即ち、尤度そのも
のではなく、重み付尤度値を用いて単語を認識するもの
である。
次に、本実施例における尤度重み値の定め方について説
明する。まず、従来の単語音声認識方法において、音声
データを用いて単語認識を行なう。
そして、単語認識結果が正しかった音声データのみ用い
て、各単語毎の認識音素系列と正解辞書項目の辞書音素
系列との間の尤度の平均を求める。
ここで求めた各単語毎の尤度平均値は、各単語毎の音素
認識の難易度を表わすものでおる。尤度平均値の低い単
語は、従来例の説明で述べたように、正解辞書項目より
も他の辞書項目の方が高い尤度を示す可能性が強い。な
お、尤度平均値を求めるのに、単語認識結果の正しかっ
た音声データのみを用いたのは、単語認識を誤まった音
声データは、データそのものが不良であることも多く、
そのようなデータを排除するためである。ところで、音
素系列間の尤度は、音素系列を構成する各音素毎の認識
確率を対数化して加算し、音素数にかかわらず900点
満点と々るように正規化したものである。本実施例にお
いて、各単語辞書項目毎の尤度重み値は、次式で求めた
次に、本実施例による単語認識結果の一例を、従来例と
比較して示す。単語「マツバラ」(辞書音素系列MAC
UBARA)のちる音声データの音素認識結果はA P
 U B AWAであった。この時、正解辞書項目との
尤度は788点、辞書項目KAKOG*AWA(カコガ
ワ)との尤度は790点であった。この場合、従来例に
よる単語認識結果は「カコガワ」であシ、単語誤認識で
あった。本実施例によれば、事前に定めだ尤度重み値は
MACUBARAは7点、KAKOG*AWAは2点で
あるので、重み伺き尤度値は、MACUBARAでは7
95点、KAKOG才AWAでは792点となって、正
しく単語認識されるようになる。
このように、本発明の単語音声認識方法によれば、従来
の方法で単語認識率の低かった単語の単語認識率を向上
させることができる利点を有するものでちる。
【図面の簡単な説明】
第1図は、従来例および本発明の一実施例における単語
音声認識方法を示す概略図、第2図は、従来例および本
発明の一実施例におけるC、M、の一部分を示す図であ
る。

Claims (1)

    【特許請求の範囲】
  1. 入力音声に対して音素認識を行なって認識音素系列を得
    、この認識音素系列と、音素表記された単語辞書の各辞
    書項目の辞書音素系列との尤度を計算して単語を認識す
    るに際し、前記各辞書項目毎に予め尤度重み値を定めて
    おき、この尤度重み値を前記音素系列間の尤度に加算ま
    たは乗算して重み付尤度値を算出し、この重み付尤度値
    が最大となる辞書項目をもって認識単語とすることを特
    徴とする単語音声認識方法。
JP57112492A 1982-07-01 1982-07-01 単語音声認識方法 Granted JPS595292A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57112492A JPS595292A (ja) 1982-07-01 1982-07-01 単語音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57112492A JPS595292A (ja) 1982-07-01 1982-07-01 単語音声認識方法

Publications (2)

Publication Number Publication Date
JPS595292A true JPS595292A (ja) 1984-01-12
JPS6310439B2 JPS6310439B2 (ja) 1988-03-07

Family

ID=14587995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57112492A Granted JPS595292A (ja) 1982-07-01 1982-07-01 単語音声認識方法

Country Status (1)

Country Link
JP (1) JPS595292A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6146995A (ja) * 1984-08-11 1986-03-07 富士通株式会社 音声認識システム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0523108U (ja) * 1991-09-10 1993-03-26 三菱電線工業株式会社 サンプル採取装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6146995A (ja) * 1984-08-11 1986-03-07 富士通株式会社 音声認識システム

Also Published As

Publication number Publication date
JPS6310439B2 (ja) 1988-03-07

Similar Documents

Publication Publication Date Title
JPH04362699A (ja) 音声認識方法及び装置
KR102144345B1 (ko) 사용자 정의 단어에 기초하여 음성 인식 결과의 보정 처리를 수행하는 음성 인식 처리 장치 및 그 동작 방법
JPS595292A (ja) 単語音声認識方法
JP3444108B2 (ja) 音声認識装置
JP6527000B2 (ja) 発音誤り検出装置、方法およびプログラム
JPS5968796A (ja) 単語音声認識方法
JPH04296799A (ja) 音声認識装置
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JPS5968794A (ja) 単語音声認識方法
JPH0158519B2 (ja)
JPS5872996A (ja) 単語音声認識方法
JPH1097284A (ja) 音声認識方法,音声認識装置,及び記憶媒体
JPS5872995A (ja) 単語音声認識方法
JPS59143200A (ja) 連続音声認識装置
JPS617896A (ja) 単語音声認識方法
JPS59189398A (ja) 連続音声認識方式
JPS58159598A (ja) 単音節音声認識方式
JPS63250698A (ja) 音声認識装置
JPH0126080B2 (ja)
JPS60147799A (ja) 音声認識方法
JPS5968797A (ja) 単語音声認識方法
JPS6039692A (ja) 単語音声認識方法
JPS5978399A (ja) 単語音声認識方法
JPS62255999A (ja) 単語音声認識装置
JPH0313600B2 (ja)