JPH0119598B2 - - Google Patents
Info
- Publication number
- JPH0119598B2 JPH0119598B2 JP57022358A JP2235882A JPH0119598B2 JP H0119598 B2 JPH0119598 B2 JP H0119598B2 JP 57022358 A JP57022358 A JP 57022358A JP 2235882 A JP2235882 A JP 2235882A JP H0119598 B2 JPH0119598 B2 JP H0119598B2
- Authority
- JP
- Japan
- Prior art keywords
- monosyllabic
- speech
- matching
- feature parameters
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Description
【発明の詳細な説明】
(a) 発明の技術分野
本発明は音声認識装置に係り、特に予め単音節
音声を音声認識装置に登録した話者の入力音声を
高い認識率で認識させる単音節音声認識方式に関
する。
音声を音声認識装置に登録した話者の入力音声を
高い認識率で認識させる単音節音声認識方式に関
する。
(b) 技術の背景
近年音声認識技術の向上に伴い、話者の音声を
認識する場合、誤りの少い音声認識装置の出現が
望まれている。音声認識方式は主として話者の単
音節音声を予め特徴パラメータに変換して記憶さ
せておき、未知入力単音節音声の特徴パラメータ
と予め記憶された特徴パラメータとを照合し最も
似ているものを該当する単音節音声として認識す
るものであるが、同じ単音節音声でも発声の仕方
で特徴パラメータは変化し、例え同一単音節音声
を何回か発声方法を変えて登録しておいても誤り
を零にすることは困難である。特に認識誤りを生
じ易い特徴パラメータを有する単音節音声は照合
方法を考慮しないと認識率の向上を計ることが出
来ない。
認識する場合、誤りの少い音声認識装置の出現が
望まれている。音声認識方式は主として話者の単
音節音声を予め特徴パラメータに変換して記憶さ
せておき、未知入力単音節音声の特徴パラメータ
と予め記憶された特徴パラメータとを照合し最も
似ているものを該当する単音節音声として認識す
るものであるが、同じ単音節音声でも発声の仕方
で特徴パラメータは変化し、例え同一単音節音声
を何回か発声方法を変えて登録しておいても誤り
を零にすることは困難である。特に認識誤りを生
じ易い特徴パラメータを有する単音節音声は照合
方法を考慮しないと認識率の向上を計ることが出
来ない。
(c) 発明の目的
本発明の目的は上記要望に基き単音節音声認識
方式に於て、入力単音節音声の特徴パラメータを
予め登録しておいた特徴パラメータと比較照合し
て最も似ているものから順次複数の候補を選出
し、該複数の候補の組合せごとに再照合パラメー
タを変化させて未知入力単音節音声の特徴パラメ
ータと再照合を行ない、最も似ているものを該当
する単音節音声として認識する様にして音声認識
率の高い音声認識装置を提供することにある。又
再照合の方式は始めの照合と同一方法であるDP
照合で行なう事で装置の構成を容易にしたもので
ある。
方式に於て、入力単音節音声の特徴パラメータを
予め登録しておいた特徴パラメータと比較照合し
て最も似ているものから順次複数の候補を選出
し、該複数の候補の組合せごとに再照合パラメー
タを変化させて未知入力単音節音声の特徴パラメ
ータと再照合を行ない、最も似ているものを該当
する単音節音声として認識する様にして音声認識
率の高い音声認識装置を提供することにある。又
再照合の方式は始めの照合と同一方法であるDP
照合で行なう事で装置の構成を容易にしたもので
ある。
(d) 発明の構成
本発明の構成は予め単音節音声を登録してお
き、未知入力単音節音声の特徴パラメータと予め
登録された総ての単音節音声の特徴パラメータを
DP照合して最も似ているものから上位順に順次
複数の再照合候補を該登録済単音節音声より選別
し、該複数の再照合候補の組合せにより定まる再
照合パラメータにより未知入力単音節音声と該再
照合候補とを再照合して、その結果最も似ている
再照合候補を該当単音節音声と認識して送出する
ものであるが、前記再照合パラメータは周波数ス
ペクトルに特徴があるため単音節音声の周波数ス
ペクトルにウエイトをかけたものを用いるもので
ある。即ち或周波数帯域の成分を強調し、その他
の周波数成分は減少させたものである。又更に子
音には発声時のレベルに差があり音声と雑音とを
区分するための閾値を変えることで認識率が向上
するものがあり、雑音を拾う危険があつても閾値
を下げた方が良いものと、逆に閾値を上げて雑音
を拾わない方が良いものとがある。以上の条件を
選出された候補により夫々使い分けて再照合する
ものである。
き、未知入力単音節音声の特徴パラメータと予め
登録された総ての単音節音声の特徴パラメータを
DP照合して最も似ているものから上位順に順次
複数の再照合候補を該登録済単音節音声より選別
し、該複数の再照合候補の組合せにより定まる再
照合パラメータにより未知入力単音節音声と該再
照合候補とを再照合して、その結果最も似ている
再照合候補を該当単音節音声と認識して送出する
ものであるが、前記再照合パラメータは周波数ス
ペクトルに特徴があるため単音節音声の周波数ス
ペクトルにウエイトをかけたものを用いるもので
ある。即ち或周波数帯域の成分を強調し、その他
の周波数成分は減少させたものである。又更に子
音には発声時のレベルに差があり音声と雑音とを
区分するための閾値を変えることで認識率が向上
するものがあり、雑音を拾う危険があつても閾値
を下げた方が良いものと、逆に閾値を上げて雑音
を拾わない方が良いものとがある。以上の条件を
選出された候補により夫々使い分けて再照合する
ものである。
(e) 発明の実施例
図は本発明の一実施例を示す回路のブロツク図
である。
である。
先ず話者は予め単音節音声を登録するため制御
部12の制御により切替部3をパラメータ格納部
4に接続し、単音節音声を入力より加える。前処
理部1は音声レベル調整及びアナログデイジタル
変換等を行ないパラメータ抽出部2へ送出し、特
徴パラメータを抽出してパラメータ格納部4へ格
納する。次に音声認識を行なわせるため切替部3
を記憶部5へ接続し発声する。制御部12の制御
によりパラメータ格納部4から格納されている全
特徴パラメータが読出され照合部8に於て、記憶
部5よりの特徴パラメータと照合される。パラメ
ータ格納部4より読出された特徴パラメータで記
憶部5よりの特徴パラメータに最も良く似た特徴
パラメータに該当する単音節音声の候補を第1と
し順次複数の候補を制御部12は選定し、該候補
に相当する特徴パラメータをパラメータ格納部4
より乗算器9へ第1候補より入力する。同時に記
憶部5の特徴パラメータを乗算器10に入力し、
周波数ウエイト記憶部6より、前記複数候補の組
合せにより定まる周波数ウエイト、即ち周波スペ
クトルにウエイトをかけ或る周波数帯域の成分を
強調し、その他の周波数帯域の成分は減少させた
ものを乗算器9,10へ送る。又更に前記複数候
補の組合せにより閾値の変更を要するものは閾値
記憶部7より最適な閾値を再照合部11へ送る。
再照合部11は乗算器9,10の出力と閾値記憶
部7よりの閾値により再照合する。第1候補より
順に複数の候補を再照合して最も似た特徴パラメ
ータに該当する単音節音声を認識結果として制御
部12を経て出力より送出する。上記動作は話者
の単音節音声発声の都度繰り返され、その都度前
記再照合候補が選出され、同一単音節音声であつ
ても必ずしも再照合候補は同一組合せとはなら
ず、従つて再照合パラメータも再照合候補の組合
せごとに選定される。
部12の制御により切替部3をパラメータ格納部
4に接続し、単音節音声を入力より加える。前処
理部1は音声レベル調整及びアナログデイジタル
変換等を行ないパラメータ抽出部2へ送出し、特
徴パラメータを抽出してパラメータ格納部4へ格
納する。次に音声認識を行なわせるため切替部3
を記憶部5へ接続し発声する。制御部12の制御
によりパラメータ格納部4から格納されている全
特徴パラメータが読出され照合部8に於て、記憶
部5よりの特徴パラメータと照合される。パラメ
ータ格納部4より読出された特徴パラメータで記
憶部5よりの特徴パラメータに最も良く似た特徴
パラメータに該当する単音節音声の候補を第1と
し順次複数の候補を制御部12は選定し、該候補
に相当する特徴パラメータをパラメータ格納部4
より乗算器9へ第1候補より入力する。同時に記
憶部5の特徴パラメータを乗算器10に入力し、
周波数ウエイト記憶部6より、前記複数候補の組
合せにより定まる周波数ウエイト、即ち周波スペ
クトルにウエイトをかけ或る周波数帯域の成分を
強調し、その他の周波数帯域の成分は減少させた
ものを乗算器9,10へ送る。又更に前記複数候
補の組合せにより閾値の変更を要するものは閾値
記憶部7より最適な閾値を再照合部11へ送る。
再照合部11は乗算器9,10の出力と閾値記憶
部7よりの閾値により再照合する。第1候補より
順に複数の候補を再照合して最も似た特徴パラメ
ータに該当する単音節音声を認識結果として制御
部12を経て出力より送出する。上記動作は話者
の単音節音声発声の都度繰り返され、その都度前
記再照合候補が選出され、同一単音節音声であつ
ても必ずしも再照合候補は同一組合せとはなら
ず、従つて再照合パラメータも再照合候補の組合
せごとに選定される。
本実施例に於て、サの如く子音が/s/で始ま
る単音節音声とタの如き子音が/t/で始まる単
音節音声の相互間を判別する場合、その判別誤り
を少くするには、該単音節音声の周波数スペクト
ル情報より約250Hz〜600Hzと3400Hz〜4500Hzの範
囲の成分を強調し、他の周波数成分は減少させ、
且つ音声始端検出レベルの閾値を低くすることに
よりすぐれた効果を得た。又バとパの如く子音
が/b/と/p/で始まる単音節音声、ザとサの
如く子音が/z/と/s/で始まる単音節音声は
約250Hz〜1300Hzの範囲の成分を強調することで、
ダとザの如く/d/、/z/で始まる単音節音声
は音声始端検出レベルの閾値を高くし音声始端の
雑音を除くことにより上記同様にすぐれた効果を
得た。
る単音節音声とタの如き子音が/t/で始まる単
音節音声の相互間を判別する場合、その判別誤り
を少くするには、該単音節音声の周波数スペクト
ル情報より約250Hz〜600Hzと3400Hz〜4500Hzの範
囲の成分を強調し、他の周波数成分は減少させ、
且つ音声始端検出レベルの閾値を低くすることに
よりすぐれた効果を得た。又バとパの如く子音
が/b/と/p/で始まる単音節音声、ザとサの
如く子音が/z/と/s/で始まる単音節音声は
約250Hz〜1300Hzの範囲の成分を強調することで、
ダとザの如く/d/、/z/で始まる単音節音声
は音声始端検出レベルの閾値を高くし音声始端の
雑音を除くことにより上記同様にすぐれた効果を
得た。
(f) 発明の効果
以上説明した如く本発明は各単音節音声固有の
特徴パラメータが有する周波数スペクトルの特徴
を抽出して記憶させておき話者の単音節音声の特
徴パラメータを該周波数スペクトルの特徴により
再照合することで認識誤りを大幅に低下させるこ
とが出来るため、その効果は大なるものがある。
又照合の方式は制御部によるDP照合のため照合
部と再照合部は同じものでよく装置の構成も容易
である。
特徴パラメータが有する周波数スペクトルの特徴
を抽出して記憶させておき話者の単音節音声の特
徴パラメータを該周波数スペクトルの特徴により
再照合することで認識誤りを大幅に低下させるこ
とが出来るため、その効果は大なるものがある。
又照合の方式は制御部によるDP照合のため照合
部と再照合部は同じものでよく装置の構成も容易
である。
図は本発明の一実施例を示す回路のブロツク図
である。 1は前処理部、2はパラメータ抽出部、3は切
替部、4はパラメータ格納部、5は記憶部、6は
周波数ウエイト記憶部、7は閾値記憶部、8は照
合部、9,10は乗算器、11は再照合部、12
は制御部である。
である。 1は前処理部、2はパラメータ抽出部、3は切
替部、4はパラメータ格納部、5は記憶部、6は
周波数ウエイト記憶部、7は閾値記憶部、8は照
合部、9,10は乗算器、11は再照合部、12
は制御部である。
Claims (1)
- 【特許請求の範囲】 1 あらかじめ登録された単音節音声の特徴パラ
メータと未知入力単音節音声の特徴パラメータと
を照合して単音節音声を認識する音声認識装置に
於て、登録されたすべての単音節音声と未知入力
単音節音声とを照合した後、該照合結果に基き複
数の再照合候補を登録済みの単音節音声より選定
し、該再照合候補の組合せごとに再照合パラメー
タを選定して再照合する手段を設け単音節音声の
認識を行なう事を特徴とする単音節音声認識方
式。 2 単音節音声の周波数スペクトルに周波数ウエ
イトを乗じて得られる特徴パラメータおよび照合
区間を決定するための音声検出レベルの閾値を可
変にして得られる特徴パラメータのうちの少なく
とも一方の特徴パラメータを上記再照合パラメー
タとして選定することを特徴とする特許請求の範
囲第1項に記載の単音節音声認識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57022358A JPS58159589A (ja) | 1982-02-15 | 1982-02-15 | 単音節音声認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57022358A JPS58159589A (ja) | 1982-02-15 | 1982-02-15 | 単音節音声認識方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS58159589A JPS58159589A (ja) | 1983-09-21 |
| JPH0119598B2 true JPH0119598B2 (ja) | 1989-04-12 |
Family
ID=12080407
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57022358A Granted JPS58159589A (ja) | 1982-02-15 | 1982-02-15 | 単音節音声認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58159589A (ja) |
-
1982
- 1982-02-15 JP JP57022358A patent/JPS58159589A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS58159589A (ja) | 1983-09-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6922668B1 (en) | Speaker recognition | |
| US11081115B2 (en) | Speaker recognition | |
| US6574596B2 (en) | Voice recognition rejection scheme | |
| CN108335699A (zh) | 一种基于动态时间规整和语音活动检测的声纹识别方法 | |
| CN108847218A (zh) | 一种自适应门限整定语音端点检测方法,设备及可读存储介质 | |
| US7085718B2 (en) | Method for speaker-identification using application speech | |
| JPH0119598B2 (ja) | ||
| JP2001350494A (ja) | 照合装置及び照合方法 | |
| JP2001265387A (ja) | 話者照合装置及び方法 | |
| JPH0119599B2 (ja) | ||
| JPS58159598A (ja) | 単音節音声認識方式 | |
| JPS58159590A (ja) | 単音節音声認識方式 | |
| JPS58159599A (ja) | 単音節音声認識方式 | |
| JPS63213899A (ja) | 話者照合方式 | |
| JPS58159597A (ja) | 単音節音声認識方式 | |
| JP2891259B2 (ja) | 音声区間検出装置 | |
| JP2844592B2 (ja) | 離散単語音声認識装置 | |
| JPS63798B2 (ja) | ||
| JPS58159591A (ja) | 単音節音声認識方式 | |
| JPS6131878B2 (ja) | ||
| JPH0469959B2 (ja) | ||
| JPS62255999A (ja) | 単語音声認識装置 | |
| JPH09297596A (ja) | 音声認識装置 | |
| JPS6350898A (ja) | 音声認識装置 | |
| JPH07104675B2 (ja) | 音声認識方法 |