JPS5872995A - 単語音声認識方法 - Google Patents

単語音声認識方法

Info

Publication number
JPS5872995A
JPS5872995A JP56171365A JP17136581A JPS5872995A JP S5872995 A JPS5872995 A JP S5872995A JP 56171365 A JP56171365 A JP 56171365A JP 17136581 A JP17136581 A JP 17136581A JP S5872995 A JPS5872995 A JP S5872995A
Authority
JP
Japan
Prior art keywords
phoneme
vowels
word
recognized
voiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56171365A
Other languages
English (en)
Inventor
入間野 孝雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP56171365A priority Critical patent/JPS5872995A/ja
Publication of JPS5872995A publication Critical patent/JPS5872995A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、入力音声に対して先ず音素認識を行ない、こ
の認識音素系列を、音素表記された単語辞書と照合して
単語を認識する単語音声認識方法に関し、特に無声化母
音と有声母音とを区別することにより単語認識率を向上
することを目的とするものである。
まず、従来のこの種の単語音声認識方法について第1図
とともに説明する。
第1図に示すように、入力単語音声を分析し、この入力
単語音声の特徴を抽出して入力単語音声を構成する音素
を認識し、この認識された音素系列を音素表記された単
語辞書中の各単語とコンフユージヨンマトリクス(Co
nfusion Matrixs以下C,M、と略す)
を用いて照合し、尤度を計算し、尤度の大きい単語を認
識単語とするものである。
第1表は上記音素表記された単語辞書(都市名)の−例
を示している。
第   1   表 また、第2表は単語辞書の音素表記法の一例を示してい
る。
第1表に示すように単語辞書の音素表記は、あたかもa
−〜字を書くかのごとく機械的になされ、無声化°よの
考慮はなかった。また従来例において音素認識段階(第
1図)において、音声のスペクトル等の物理的パラメー
タに基づいて音素認識を行なっており、その結果、非常
に長い持続時間を持つ無声子音が認識された場合には、
その子音を3個の音素、すなわち無声子音音素、無声化
母音音素、無声子音音素の連続したものと見なし、音声
系列を修正していた。例えば長い持続時間を持つ無声子
音CIBU のCが認識された場合、3個の音素CUI
C$連続したものと見なし音声系列をCUICIBU 
 に修正していた。通常無声化する母音は!又はUであ
るので、修正によシ加えられる母音は工とUの中間母音
UIである。
第2図は従来例におけるC、M、の一部を示している。
このC,M・中の数字は、単語辞書中のそれぞれの音素
−“Dが、どの音素Wに認識されるかの確率P(W/D
)をチで表わしたものである。C,M・中の認識音素U
Iには、物理的性質がUとIの中間である有声遍音と・
非常1長1持続i間を持9無声子音が認識された結果修
正された無声化母音とを含む。
日本語では、「ん」以外の子音は、必ず有声の母音又は
半母音が後続することが原則である。例えばNARA(
ナラ)K  J  OOT  O(キョート)等である
。この原則に基づく限り、前記従来の方法で認識される
ことはない。更に従来例でも一応修正による無声化対策
がなされていた。
しかしながら、実際には語中の■及びUは20チ程度無
声化が認められる。このため従来例では無声化対策が不
充分なため、単語を誤認識する欠点があった。
本発明は、上記従来例の欠点を除≠・するものであり、
以下に本発明の一実施例について説明する。
本実施例の単語辞書においては、無声化し易い母音には
予め無声化記号を付し、本来の有声母音とは異なる音素
表記にする。例えば都市名、府中「フチクー」は、従来
の単語辞書では第1表に示すように(HUCJUU  
 )と表記していたが、「フ」は無声化し易いので、本
実施例では()IU−CJIJU   )と表わし、U
−とUとを別の音素とする。
また、本実施例では、音素認識段階における無声化対策
として音素系列修正のために付加された母音とUI−と
表わし、有声のUIと区別するものである。
第3図は本実施例におけるC、M、の一部を示している
。第3図において、単語辞書中の音素IとI−tUとU
−がそれぞれどのように認識されたかを比べてみると、
有声音と無声音とが明らかに分離されていることがわか
る。また第3図から無声化し易い母音は、音素認識時に
脱・落し易いこともわかるO 従来の方法においては、例えば都市名、府中「フチュー
」(単語辞書では(I(UCJUU  ))の音素認識
結果が1.シばしば(SUISEU)と々す、この場合
の単語認識結果は「フチクー」ではなく「シンシーク」
(単語辞書では(SIN=ZJUKU  ))であった
。これに対して本実施例によれば「フチュー」(単語辞
書ではtHu−c  J uu))の従来例と同一デー
タの音素認識結果は(SUI−8EU   )となシ、
単語認識結果は正しく「フチュー」となった。これは従
来の認識音素(Ul)が、単語辞書のUとも■とも同程
度の尤度を持っていたのに対し、本実施例における認識
音素(UI−)は、「フチュー」の「フ」の(U−)と
は高い尤度を持ち、「シンノーク」の「シ」の+I)と
は低い尤度しか持たないからでさる。
なお上記実施例では、単語辞書の音素としてI−。
U−、を加えただけであるが、母音の無声化の頻度によ
り、更に細かく分けてもよい。寸たまれではあるが、E
、A、Oも無声化することがあり、これら無声化母音を
加えてもよい。また上記実施例では認識音素としてUI
−だけを加えているが、U−2■−の分離が可能になれ
ば、認識音素としてU−、I−を加えれば、さらに単語
認識率を向上することができるものである。
本発明は上記のように、無声化母音を本来の有声母音と
区別しているため、単語認識率を向上させることができ
る利点を有するものである。
【図面の簡単な説明】
第1図は単語音声認識方法の概略を示す図1第2図は従
来例におけるC、M、の一部を示す図、第3図は本発明
の一実施例における単語音声認識方法に用いるC、M、
の一部を示す図である。 第1図

Claims (2)

    【特許請求の範囲】
  1. (1)  入力音声に対して音素認識を行なって認識音
    素系列を得、この認識音素と音素表記された単語辞書の
    音素との尤度をコンフユージヨンマトリクスを用いて計
    算して単語を認識する単語音声認識方法において、上記
    単語辞書の母音を表記する音素記号を、正常に発生され
    る有声母音と無声化し易い母音とに区別して表記し、か
    つ上記コンフユージヨンマトリクスにおける辞書音素の
    項目として上記有声母音と無声化し易い母音とを別々に
    設けることを特徴とする単語音声認1方法。
  2. (2)前記単語音声認識方法において、音素認識の結果
    である認識音素の種類として、有声の母音と無声の母音
    とを区別し、かつコンフユージヨンマトリクスの認識音
    素項目を認識音素の種類に合わせて、有声母音と無声母
    音とを別々に設けてなることを特徴とする特許請求の範
    囲第(1)項記載の単語音声認識方法。
JP56171365A 1981-10-28 1981-10-28 単語音声認識方法 Pending JPS5872995A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56171365A JPS5872995A (ja) 1981-10-28 1981-10-28 単語音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56171365A JPS5872995A (ja) 1981-10-28 1981-10-28 単語音声認識方法

Publications (1)

Publication Number Publication Date
JPS5872995A true JPS5872995A (ja) 1983-05-02

Family

ID=15921825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56171365A Pending JPS5872995A (ja) 1981-10-28 1981-10-28 単語音声認識方法

Country Status (1)

Country Link
JP (1) JPS5872995A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6078495A (ja) * 1983-10-05 1985-05-04 松下電器産業株式会社 大語彙単語音声認識装置
JPS6146995A (ja) * 1984-08-11 1986-03-07 富士通株式会社 音声認識システム
JP2006522370A (ja) * 2003-03-31 2006-09-28 ノヴォーリス テクノロジーズ リミテッド 表音ベース音声認識システム及び方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6078495A (ja) * 1983-10-05 1985-05-04 松下電器産業株式会社 大語彙単語音声認識装置
JPS6146995A (ja) * 1984-08-11 1986-03-07 富士通株式会社 音声認識システム
JP2006522370A (ja) * 2003-03-31 2006-09-28 ノヴォーリス テクノロジーズ リミテッド 表音ベース音声認識システム及び方法

Similar Documents

Publication Publication Date Title
US5949961A (en) Word syllabification in speech synthesis system
JP3542026B2 (ja) 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
JP2001296880A (ja) 固有名の複数のもっともらしい発音を生成する方法および装置
JP2005517216A (ja) 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置
JPS5872995A (ja) 単語音声認識方法
JPS6316766B2 (ja)
JP2002278579A (ja) 音声データ検索装置
JP2004294542A (ja) 音声認識装置及びそのプログラム
JP4840051B2 (ja) 音声学習支援装置及び音声学習支援プログラム
Rao et al. Word boundary hypothesization in Hindi speech
Daly Recognition of words from their spellings: Integration of multiple knowledge sources
KR20010085219A (ko) 서브단어 메모리를 포함하는 음성인식 장치
JP2615643B2 (ja) 単語音声認識装置
JPS5968795A (ja) 単語音声認識方法
JPS5958493A (ja) 認識装置
JP2004301968A (ja) 発話処理装置、発話処理方法及び発話処理用プログラム
JP2006113269A (ja) 発音系列認識装置、発音系列認識方法及び発音系列認識プログラム
JPS6073697A (ja) 音韻辞書の作成方法
JPS63153596A (ja) 音声文章入力装置
KR20030097309A (ko) 한국어 철자 발화에 따른 음성인식 방법
JPS6132167A (ja) カナ漢字変換処理装置
JPH04296898A (ja) 音声認識装置
KR20040054354A (ko) 문자의 음성변환장치 및 방법
GB2292235A (en) Word syllabification.
JPS6120099A (ja) 音韻セグメンテ−シヨン装置