JPH0119599B2

JPH0119599B2 -

Info

Publication number: JPH0119599B2
Application number: JP57034713A
Authority: JP
Inventors: Yasuo Sato; Takayuki Ooyama; Takayuki Fujimoto; Tadayasu Sugita
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-03-05
Filing date: 1982-03-05
Publication date: 1989-04-12
Also published as: JPS58159600A

Description

【発明の詳細な説明】 (a) 発明の技術分野本発明は音声認識装置に係り、特に予め単音節
音声を音声認識装置に登録した話者の未知入力単
音節音声を認識させる単音節音声認識方式に関す
る。

(b) 技術の背景近年音声認識技術の向上に伴い、話者の音声を
認識する場合、認識誤りの少い音声認識装置の出
現が望まれている。音声認識方式は主として話者
の単音節音声を予め特徴パラメータに変換して記
憶させておき、未知入力単音節音声の特徴パラメ
ータと予め記憶させた特徴パラメータとを照合し
て最も似ているものを該当する単音節音声として
認識するものであるが、同じ単音節音声でも発声
の仕方では特徴パラメータは変化し、例え同一単
音節音声を何回か、発声方法を変えて登録してお
いても誤りを零にすることは困難である。特に認
識誤りを生じ易い特徴パラメータを有する単音節
音声は照合方法を考慮しないと認識率の向上を計
ることが出来ない。このため予め登録してある総
ての単音節音声と話者の単音節音声とを照合した
後、該照合結果に基づき未知入力単音節音声に最
も似ている単音節音声から順に順次複数の再照合
候補を登録済単音節音声より選出し、該複数の再
照合候補の組合せに応じて定まる再照合パラメー
タにより未知入力単音節音声と該複数の再照合候
補とを再照合して認識率の向上を計る単音節音声
認識方式が提案されている。しかし上記再照合方
式には改善の余地がありその対策が望まれてい
る。

(c) 発明の目的本発明の目的は上記要望に基づき上記再照合方
式の単音節音声認識方式に於て、再照合候補の数
を絞つて再照合に要する時間を短縮すると共に装
置の構成を簡易化し経済性の向上を計るものであ
る。

(d) 発明の構成本発明の構成は予め単音節音声を登録してお
き、未知入力単音節音声の特徴パラメータと予め
登録された総ての単音節音声の特徴パラメータを
DP照合して最も良く似ているものから上位順に
順次複数の再照合候補を該登録済単音節音声より
選別し、該複数の再照合候補の組合せに応じて定
まる再照合パラメータにより未知入力単音節音声
と該再照合候補とを再照合して、その結果最も良
く似ている再照合候補を該当単音節音声として認
識するが、該複数の再照合候補を選別する際に
DP照合時の類似度が第一位の再照合候補か又は
類似度が上位の複数の再照合候補の組合せが予め
定められているものであつた場合は再照合工程を
省略し、前記DP照合時の類似度が第一位の再照
合候補を認識結果として送出し単音節音声認識時
間の短縮と再照合回路の簡易化を計るものであ
る。

(e) 発明の実施例図は本発明の一実施例を示す回路のブロツク図
である。先ず話者は予め単音節音声を登録するた
め制御部８の制御により切替部３をパラメータ格
納部４に接続し、単音節音声を入力より加える。
前処理部１は音声レベル調整及びアナログデイジ
タル変換等を行ないパラメータ抽出部２へ送出
し、パラメータ抽出部２は前記単音節音声の特徴
パラメータを抽出しパラメータ格納部４へ格納す
る。次に単音節音声の認識を行なわせるため、話
者は制御部８の制御により切替部３を記憶部５へ
接続し、単音節音声を発声する。前記同様の動作
により前処理部１、パラメータ抽出部２、切替部
３を経て記憶部５へ入つた未知入力単音節音声の
特徴パラメータは制御部８の制御によりパラメー
タ格納部４に格納されている全単音節音声の特徴
パラメータと照合部６に於てDP照合され、該全
単音節音声の特徴パラメータ中で最も良く似た特
徴パラメータを持つ単音節音声が第一位の再照合
候補として選出され、続いて順次複数の再照合候
補が選出され判定部７へ送られる。判定部７では
該第一位の再照合候補又は上位複数の再照合候補
の組合せを、テーブルに予め格納されている候補
と比較し、同一のものが存在した場合は再照合工
程を省略し制御部８を経て前記照合部６で第一位
の再照合候補に選出されたものを認識結果として
選出する。照合部６で選出された第一位の再照合
候補又は上位複数の再照合候補の組合せが予め定
められたもの以外は再照合して認識するため判定
部７より制御部８へ送出される。制御部８は該再
照合候補に相当する特徴パラメータをパラメータ
格納部４より乗算器１０へ、記憶部５に入つてい
る未知入力単音節音声の特徴パラメータを乗算器
１１へ夫々送出させ、判定部７は該再照合候補に
より定まる再照合パラメータ、即ち再照合候補を
相互に識別するに適した周波数帯域の成分を強調
し、その他の周波数帯域成分を減少させたものを
周波数ウエイト記憶部１２より乗算器１０，１１
へ送出させる。又判定部７は該再照合候補に応じ
て定まる最適の照合区間を決定するパラメータで
ある閾値を閾値記憶部１３より再照合部９へ送出
させる。再照合部９は乗算器１０，１１の出力と
該閾値記憶部１３よりの閾値とにより再照合す
る。前記第一候補より順に複数の再照合候補が未
知入力単音節音声と再照合され最も良く似た再照
合候補が認識結果として制御部８より出力へ送出
される。

本実施例に於て判定部７の予め定められたテー
ブルに格納されている再照合工程を省略する候補
の一例を述べると、照合部６に於ける認識率が極めて良いもの、
即ち例えば第一位の再照合候補が下記の如きも
のワの如く子音が／ｗ／で始まる単音節音声
ヤ、ユヨの如く子音が／ｊ／で始まる単音節音
声第一位と第二位の再照合候補の組合せとして
出現する可能性の少いもの、例えば下記の如き
もの。

バとタの如く子音が／ｂ／と／ｔ／で始まる
単音節音声ダとカの如く子音が／ｄ／と／ｋ／で始まる
単音節音声マとハの如く子音が／ｍ／と／ｈ／で始まる単
音節音声ガとバの如く子音が／ｇ／と／ｐ／で始まる
単音節音声等である。

／ｂ／と／ｔ／、／ｄ／と／ｋ／、／ｍ／
と／ｈ／、／ｇ／と／ｐ／は相互に誤る可能性
が少く、該組合せとなる単音節音声は再照合を
行なう必要のない発声とみなして照合部６の結
果を用いるものである。

再照合の効果が小さいものラの如く子音が／ｒ／で始まる単音節音声／
ｒ／は不安定でバラツキが大きく他の種々の単
音節音声に誤る傾向があり再照合しても効果が
少く現状ではコストパフオーマンスが悪く再照
合を省略した方が有利である。

(f) 発明の効果以上説明した如く本発明は再照合方式を用いる
単音節音声認識方式に於て、再照合候補の数を絞
つて再照合に要する時間を短縮し、且つ再照合動
作に関連する構成機器を簡易化することが可能で
経済性を向上させることが出来るため、その効果
は大なるものがある。

【図面の簡単な説明】

図は本発明の一実施例を示す回路のブロツク図
である。１は前処理部、２はパラメータ抽出部、
３は切替部、４はパラメータ格納部、５は記憶
部、６は照合部、７は判定部、８は制御部、９は
再照合部、１０，１１は乗算器、１２は周波数ウ
エイト記憶部、１３は閾値記憶部である。

Claims

【特許請求の範囲】

１予め登録された総ての単音節音声と未知入力
単音節音声とを照合した後、該照合結果に基づき
複数の再照合候補を登録済の単音節音声より選出
し、該再照合候補の組合せごとに再照合パラメー
タを選定して未知入力単音節音声と再照合する音
声認識装置に於て、前記再照合候補を選出する際
に、類似度が第一位となつた再照合候補が予め定
められたものである場合および類似度が上位の複
数の再照合候補の組合せが予め定められたもので
ある場合は再照合を省略することを特徴とする単
音節音声認識方式。