JPH0119598B2

JPH0119598B2 -

Info

Publication number: JPH0119598B2
Application number: JP57022358A
Authority: JP
Inventors: Yasuo Sato; Takayuki Ooyama; Takayuki Fujimoto; Tadayasu Sugita
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-02-15
Filing date: 1982-02-15
Publication date: 1989-04-12
Also published as: JPS58159589A

Description

【発明の詳細な説明】 (a) 発明の技術分野本発明は音声認識装置に係り、特に予め単音節
音声を音声認識装置に登録した話者の入力音声を
高い認識率で認識させる単音節音声認識方式に関
する。

(b) 技術の背景近年音声認識技術の向上に伴い、話者の音声を
認識する場合、誤りの少い音声認識装置の出現が
望まれている。音声認識方式は主として話者の単
音節音声を予め特徴パラメータに変換して記憶さ
せておき、未知入力単音節音声の特徴パラメータ
と予め記憶された特徴パラメータとを照合し最も
似ているものを該当する単音節音声として認識す
るものであるが、同じ単音節音声でも発声の仕方
で特徴パラメータは変化し、例え同一単音節音声
を何回か発声方法を変えて登録しておいても誤り
を零にすることは困難である。特に認識誤りを生
じ易い特徴パラメータを有する単音節音声は照合
方法を考慮しないと認識率の向上を計ることが出
来ない。

(c) 発明の目的本発明の目的は上記要望に基き単音節音声認識
方式に於て、入力単音節音声の特徴パラメータを
予め登録しておいた特徴パラメータと比較照合し
て最も似ているものから順次複数の候補を選出
し、該複数の候補の組合せごとに再照合パラメー
タを変化させて未知入力単音節音声の特徴パラメ
ータと再照合を行ない、最も似ているものを該当
する単音節音声として認識する様にして音声認識
率の高い音声認識装置を提供することにある。又
再照合の方式は始めの照合と同一方法であるDP
照合で行なう事で装置の構成を容易にしたもので
ある。

(d) 発明の構成本発明の構成は予め単音節音声を登録してお
き、未知入力単音節音声の特徴パラメータと予め
登録された総ての単音節音声の特徴パラメータを
DP照合して最も似ているものから上位順に順次
複数の再照合候補を該登録済単音節音声より選別
し、該複数の再照合候補の組合せにより定まる再
照合パラメータにより未知入力単音節音声と該再
照合候補とを再照合して、その結果最も似ている
再照合候補を該当単音節音声と認識して送出する
ものであるが、前記再照合パラメータは周波数ス
ペクトルに特徴があるため単音節音声の周波数ス
ペクトルにウエイトをかけたものを用いるもので
ある。即ち或周波数帯域の成分を強調し、その他
の周波数成分は減少させたものである。又更に子
音には発声時のレベルに差があり音声と雑音とを
区分するための閾値を変えることで認識率が向上
するものがあり、雑音を拾う危険があつても閾値
を下げた方が良いものと、逆に閾値を上げて雑音
を拾わない方が良いものとがある。以上の条件を
選出された候補により夫々使い分けて再照合する
ものである。

(e) 発明の実施例図は本発明の一実施例を示す回路のブロツク図
である。

先ず話者は予め単音節音声を登録するため制御
部１２の制御により切替部３をパラメータ格納部
４に接続し、単音節音声を入力より加える。前処
理部１は音声レベル調整及びアナログデイジタル
変換等を行ないパラメータ抽出部２へ送出し、特
徴パラメータを抽出してパラメータ格納部４へ格
納する。次に音声認識を行なわせるため切替部３
を記憶部５へ接続し発声する。制御部１２の制御
によりパラメータ格納部４から格納されている全
特徴パラメータが読出され照合部８に於て、記憶
部５よりの特徴パラメータと照合される。パラメ
ータ格納部４より読出された特徴パラメータで記
憶部５よりの特徴パラメータに最も良く似た特徴
パラメータに該当する単音節音声の候補を第１と
し順次複数の候補を制御部１２は選定し、該候補
に相当する特徴パラメータをパラメータ格納部４
より乗算器９へ第１候補より入力する。同時に記
憶部５の特徴パラメータを乗算器１０に入力し、
周波数ウエイト記憶部６より、前記複数候補の組
合せにより定まる周波数ウエイト、即ち周波スペ
クトルにウエイトをかけ或る周波数帯域の成分を
強調し、その他の周波数帯域の成分は減少させた
ものを乗算器９，１０へ送る。又更に前記複数候
補の組合せにより閾値の変更を要するものは閾値
記憶部７より最適な閾値を再照合部１１へ送る。
再照合部１１は乗算器９，１０の出力と閾値記憶
部７よりの閾値により再照合する。第１候補より
順に複数の候補を再照合して最も似た特徴パラメ
ータに該当する単音節音声を認識結果として制御
部１２を経て出力より送出する。上記動作は話者
の単音節音声発声の都度繰り返され、その都度前
記再照合候補が選出され、同一単音節音声であつ
ても必ずしも再照合候補は同一組合せとはなら
ず、従つて再照合パラメータも再照合候補の組合
せごとに選定される。

本実施例に於て、サの如く子音が／ｓ／で始ま
る単音節音声とタの如き子音が／ｔ／で始まる単
音節音声の相互間を判別する場合、その判別誤り
を少くするには、該単音節音声の周波数スペクト
ル情報より約250Hz〜600Hzと3400Hz〜4500Hzの範
囲の成分を強調し、他の周波数成分は減少させ、
且つ音声始端検出レベルの閾値を低くすることに
よりすぐれた効果を得た。又バとパの如く子音
が／ｂ／と／ｐ／で始まる単音節音声、ザとサの
如く子音が／ｚ／と／ｓ／で始まる単音節音声は
約250Hz〜1300Hzの範囲の成分を強調することで、
ダとザの如く／ｄ／、／ｚ／で始まる単音節音声
は音声始端検出レベルの閾値を高くし音声始端の
雑音を除くことにより上記同様にすぐれた効果を
得た。

(f) 発明の効果以上説明した如く本発明は各単音節音声固有の
特徴パラメータが有する周波数スペクトルの特徴
を抽出して記憶させておき話者の単音節音声の特
徴パラメータを該周波数スペクトルの特徴により
再照合することで認識誤りを大幅に低下させるこ
とが出来るため、その効果は大なるものがある。
又照合の方式は制御部によるDP照合のため照合
部と再照合部は同じものでよく装置の構成も容易
である。

【図面の簡単な説明】

図は本発明の一実施例を示す回路のブロツク図
である。１は前処理部、２はパラメータ抽出部、３は切
替部、４はパラメータ格納部、５は記憶部、６は
周波数ウエイト記憶部、７は閾値記憶部、８は照
合部、９，１０は乗算器、１１は再照合部、１２
は制御部である。

Claims

【特許請求の範囲】１あらかじめ登録された単音節音声の特徴パラ
メータと未知入力単音節音声の特徴パラメータと
を照合して単音節音声を認識する音声認識装置に
於て、登録されたすべての単音節音声と未知入力
単音節音声とを照合した後、該照合結果に基き複
数の再照合候補を登録済みの単音節音声より選定
し、該再照合候補の組合せごとに再照合パラメー
タを選定して再照合する手段を設け単音節音声の
認識を行なう事を特徴とする単音節音声認識方
式。２単音節音声の周波数スペクトルに周波数ウエ
イトを乗じて得られる特徴パラメータおよび照合
区間を決定するための音声検出レベルの閾値を可
変にして得られる特徴パラメータのうちの少なく
とも一方の特徴パラメータを上記再照合パラメー
タとして選定することを特徴とする特許請求の範
囲第１項に記載の単音節音声認識方式。