JPS6243698A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS6243698A JPS6243698A JP60183381A JP18338185A JPS6243698A JP S6243698 A JPS6243698 A JP S6243698A JP 60183381 A JP60183381 A JP 60183381A JP 18338185 A JP18338185 A JP 18338185A JP S6243698 A JPS6243698 A JP S6243698A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- section
- speech
- similarity
- feature parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 13
- 238000000034 method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声認識装置に関し、更に詳述すれば辞書部の
更新機能を自する音声認識装置に関する。
更新機能を自する音声認識装置に関する。
音声認識装置は特徴抽出部にて入力音声の特徴パラメー
タを抽出し、これを音声(単35)ごとに辞書部に予め
格納しておき、認識を行わせる際には特徴抽出部にて未
認識の入力音声の特徴パラメータを抽出し、これを辞書
部の複数の単語の特徴パラメータと比較し、最も類似す
る特徴パラメータの単語に相当する信号を出力すべくな
したものである。
タを抽出し、これを音声(単35)ごとに辞書部に予め
格納しておき、認識を行わせる際には特徴抽出部にて未
認識の入力音声の特徴パラメータを抽出し、これを辞書
部の複数の単語の特徴パラメータと比較し、最も類似す
る特徴パラメータの単語に相当する信号を出力すべくな
したものである。
さて一般に特定話者が同一単語の発声を行っても、その
音声はバラツキを自するから、辞書部に特徴パラメータ
を格納する際には同一の単語につき複数の音声を発せし
めて、それらの平均をとって得た特徴パラメータを格納
することにしている。
音声はバラツキを自するから、辞書部に特徴パラメータ
を格納する際には同一の単語につき複数の音声を発せし
めて、それらの平均をとって得た特徴パラメータを格納
することにしている。
ところが時間の経過に伴い同一話者による同一単語に対
する発声であってもその音声は徐々に変化していくから
、辞書部の内容を固定しておくと誤認識、又は認識不能
が頻発することとなる。このため時間経過に伴って辞書
を更新することが行われる。
する発声であってもその音声は徐々に変化していくから
、辞書部の内容を固定しておくと誤認識、又は認識不能
が頻発することとなる。このため時間経過に伴って辞書
を更新することが行われる。
辞書更新の方法としては、誤認識した単語の辞書部の内
容、つまり特徴パラメータをオペレータの操作にて更新
する方法、正しい認識をした場合であっても入力音声の
特徴パラメータと辞書部内の特徴パラメータとの間の類
似度がしきい値以・下となった場合に自動的に更新する
方法が知られている。
容、つまり特徴パラメータをオペレータの操作にて更新
する方法、正しい認識をした場合であっても入力音声の
特徴パラメータと辞書部内の特徴パラメータとの間の類
似度がしきい値以・下となった場合に自動的に更新する
方法が知られている。
しかしながら一1者の方法ではオペレータの操作ミスに
て辞書部が誤って更新されることがあり、また後者の方
法では入力音声に雑音が混血したために類似度が低くな
り、このために無用の更新が行われ、また更新が行われ
たために雑音が混入した特徴パラメータが辞書部に格納
される等の不都合がある。
て辞書部が誤って更新されることがあり、また後者の方
法では入力音声に雑音が混血したために類似度が低くな
り、このために無用の更新が行われ、また更新が行われ
たために雑音が混入した特徴パラメータが辞書部に格納
される等の不都合がある。
更に特開昭59−162600号には使用頻度の低い単
語については入力音声と辞書部との特徴パラメータの類
似度が小さくなるので、類似度の小さい入力音声に大き
な重みづけをして既格納済の辞書部の特徴パラメータと
上記入力音声の特徴パラメータとの平均をとるようにし
て辞書部を更新する方法が示されている。ところがこの
ような方法による場合も雑音の混在によって類似度が小
さくなった場合により多くの雑音が辞書に混入してしま
うという不都合があった。
語については入力音声と辞書部との特徴パラメータの類
似度が小さくなるので、類似度の小さい入力音声に大き
な重みづけをして既格納済の辞書部の特徴パラメータと
上記入力音声の特徴パラメータとの平均をとるようにし
て辞書部を更新する方法が示されている。ところがこの
ような方法による場合も雑音の混在によって類似度が小
さくなった場合により多くの雑音が辞書に混入してしま
うという不都合があった。
本発明は斯かる事情に漏みてなされたものであり、正し
く識別された場合において更新を行うべくなし、入力音
声の特徴パラメータと辞書部の特徴パラメータとの類似
度が大きい(小さい)はど入力音声の特徴パラメータの
重みづけを大きく(小さく)シて、辞書部の特徴パラメ
ータとmみづけした入力音声の特徴パラメータとを平均
するようにして辞書部を更新する手段を備えることによ
って雑音の混入なしに自効な辞書部更新が行えるように
なした音声認識装置を提供することを目的とする。
く識別された場合において更新を行うべくなし、入力音
声の特徴パラメータと辞書部の特徴パラメータとの類似
度が大きい(小さい)はど入力音声の特徴パラメータの
重みづけを大きく(小さく)シて、辞書部の特徴パラメ
ータとmみづけした入力音声の特徴パラメータとを平均
するようにして辞書部を更新する手段を備えることによ
って雑音の混入なしに自効な辞書部更新が行えるように
なした音声認識装置を提供することを目的とする。
本発明に係る音声認識装置は、入力音声の特徴パラメー
タを抽出する特徴抽出部、複数の音声につき抽出した特
徴パラメータを予め格納しておく辞書部及び特徴抽出部
にて抽出した未認識の音声の特徴パラメータと辞書部に
格納してある複数の音声の特徴パラメータとを比較して
類似度を求め、類似度が最大である、辞書部に格納して
ある音声に応じた信号を出力する識別部を具備する音声
認識装置において、前記識別部の出力が正しい場合に、
入力された音声の特徴パラメータを辞書部の該当音声の
特徴パラメータの修正に関与させ、またO;】記類似度
の大小に応じて関与の程度を大小に変じる辞書更新手段
を具備することを特徴とする。
タを抽出する特徴抽出部、複数の音声につき抽出した特
徴パラメータを予め格納しておく辞書部及び特徴抽出部
にて抽出した未認識の音声の特徴パラメータと辞書部に
格納してある複数の音声の特徴パラメータとを比較して
類似度を求め、類似度が最大である、辞書部に格納して
ある音声に応じた信号を出力する識別部を具備する音声
認識装置において、前記識別部の出力が正しい場合に、
入力された音声の特徴パラメータを辞書部の該当音声の
特徴パラメータの修正に関与させ、またO;】記類似度
の大小に応じて関与の程度を大小に変じる辞書更新手段
を具備することを特徴とする。
以下本発明をその実施例を示す図面に基づいて詳述する
。
。
マイクロフォンlに入力された音声の信号はi:1処理
部2にて高域強調等のi;ノ処理を施されて特徴抽出部
3へ入力され、ごごでその分析が行われて特徴が抽出さ
れる0本発明装置が登録モードにて動作している場合は
このようにして抽出された特徴、つまり特徴パラメータ
が辞書部4に各音声(単語)と対応づけて格納され°(
いく、このようにして特徴パラメータ(以下標準ベクト
ルという)a、b、t・・・が辞書部4に格納されたも
のとする。
部2にて高域強調等のi;ノ処理を施されて特徴抽出部
3へ入力され、ごごでその分析が行われて特徴が抽出さ
れる0本発明装置が登録モードにて動作している場合は
このようにして抽出された特徴、つまり特徴パラメータ
が辞書部4に各音声(単語)と対応づけて格納され°(
いく、このようにして特徴パラメータ(以下標準ベクト
ルという)a、b、t・・・が辞書部4に格納されたも
のとする。
次に認識モードにおいてもマイクロフォンlからの入力
音声は同様にして特徴パラメータが抽出される。この未
認識の音声の特徴パラメータを未知ヘクトルXとする。
音声は同様にして特徴パラメータが抽出される。この未
認識の音声の特徴パラメータを未知ヘクトルXとする。
類似度演算部5は未知ベクトルXと、辞書部4内の標準
ヘクトル21. b、 c・・・との類似度(又は
距離)を計算する。計算結果は最大類似度選出部6へ送
られ、最大類似度選出部6はここで類似度が最大のもの
(又は距離が最小のもの)を選出する0例えば未知ヘク
トルXと標準ベクトル社との類似度Sが標準ベクトルb
。
ヘクトル21. b、 c・・・との類似度(又は
距離)を計算する。計算結果は最大類似度選出部6へ送
られ、最大類似度選出部6はここで類似度が最大のもの
(又は距離が最小のもの)を選出する0例えば未知ヘク
トルXと標準ベクトル社との類似度Sが標準ベクトルb
。
C・・・等の類似度より大きい、つまりSが類似度の最
大値であったものとすると最大類似度選出部6は標準ベ
クトルaに相当する音声(単語)、例えば「アカ」に相
当する信号を出力部にて発し、これから「アカ」を表示
させるべき信号を表示部8へ出力せしめる。
大値であったものとすると最大類似度選出部6は標準ベ
クトルaに相当する音声(単語)、例えば「アカ」に相
当する信号を出力部にて発し、これから「アカ」を表示
させるべき信号を表示部8へ出力せしめる。
オペレータはごの表示「”7カ」が入力音声どおりであ
ればキーボード9にてその旨を入力する。
ればキーボード9にてその旨を入力する。
そしてこのような正しい認識が行われた場合はキーボー
ド9の操作によって辞書更新指示が行われる。この辞書
更新指示信号は平均演算部IOへ入力される。
ド9の操作によって辞書更新指示が行われる。この辞書
更新指示信号は平均演算部IOへ入力される。
なお、辞書更新指示信号はキーボード9からの指示によ
らず、次の音声入力に伴って発せられる構成としてもよ
い。
らず、次の音声入力に伴って発せられる構成としてもよ
い。
そして表示された内容が誤りであった場合はキーボード
9にて最大類似度選出部6に誤認識を報じ、Sに次いで
大きな類似度の標準ベクトルb。
9にて最大類似度選出部6に誤認識を報じ、Sに次いで
大きな類似度の標準ベクトルb。
C・・・に相当する信号を発せしめる。
最大類似度選出部6は未知ベタ1−ルXと標準ベクトル
社との類似度Sを関数発生器11へ出力する。
社との類似度Sを関数発生器11へ出力する。
関数発生器11は類似度Sの値を変数とする関数の値f
(S)を発する。
(S)を発する。
f (S)はSが大である程大きく、小である程小さ
い。
い。
平均演算部10は上述のf (S)並びに未知ベクト
ルX及び標準へクトル1に基づいて下記(11式の演算
を行い新たな標準へクトルd′を算出する。
ルX及び標準へクトル1に基づいて下記(11式の演算
を行い新たな標準へクトルd′を算出する。
つまりf (S)をXのmみづけ係数としてa。
Xの荷重平均を求めているのである。
このようにして計算された新たな標準ベクトルa′は辞
書部4へ標準ベクトルdに替えて格納される。
書部4へ標準ベクトルdに替えて格納される。
なお類似度を表わすものとして未知ベクトルXと標準ベ
クトルa、b、c・・・との距離を用いる場合は最小の
距離値りをとる標準ベクトル例えばaについて同様の処
理を行う。
クトルa、b、c・・・との距離を用いる場合は最小の
距離値りをとる標準ベクトル例えばaについて同様の処
理を行う。
以上の如き本発明による場合は入力音声中に雑音が多く
混入している場合はSが小さいからr (S)も小さ
く、従っ°((11式の((S) ・Xの項が小さく
なる。つまり雑音が混入している入力音声の特徴パラメ
ータが更新に関与する程度が低いのである。これに如′
シてSが大きい場合はf (S)も人きくなり入力音
声の特徴パラメータが更新に強く関与するのである。
混入している場合はSが小さいからr (S)も小さ
く、従っ°((11式の((S) ・Xの項が小さく
なる。つまり雑音が混入している入力音声の特徴パラメ
ータが更新に関与する程度が低いのである。これに如′
シてSが大きい場合はf (S)も人きくなり入力音
声の特徴パラメータが更新に強く関与するのである。
従っ゛ζ経時的に話者の発声が変わっていく場合にも好
適な辞書部更新が行われ、また雑音が混在する場合にも
辞書部の格納の内容を劣化させることがない等本発明は
優れた効果を奏する。
適な辞書部更新が行われ、また雑音が混在する場合にも
辞書部の格納の内容を劣化させることがない等本発明は
優れた効果を奏する。
図面は本発明の実hb例を示す回路図である。
1・・・マイクロフォン 2・・・iiI処理部 3・
・・特徴抽出部 4・・・辞書部 5・・・類似度演算
部 6・・・最大類似度算出部 9・・・キーボード
lO・・・平均演算部 11・・・関数発生器
・・特徴抽出部 4・・・辞書部 5・・・類似度演算
部 6・・・最大類似度算出部 9・・・キーボード
lO・・・平均演算部 11・・・関数発生器
Claims (1)
- 【特許請求の範囲】 1、入力音声の特徴パラメータを抽出する特徴抽出部、
複数の音声につき抽出した特徴パラメータを予め格納し
ておく辞書部及び特徴抽出部にて抽出した未認識の音声
の特徴パラメータと辞書部に格納してある複数の音声の
特徴パラメータとを比較して類似度を求め、類似度が最
大である、辞書部に格納してある音声に応じた信号を出
力する識別部を具備する音声認識装置において、 前記識別部の出力が正しい場合に、入力さ れた音声の特徴パラメータを辞書部の該当音声の特徴パ
ラメータの修正に関与させ、また前記類似度の大小に応
じて関与の程度を大小に変じる辞書更新手段を具備する
ことを特徴とする音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60183381A JPS6243698A (ja) | 1985-08-20 | 1985-08-20 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60183381A JPS6243698A (ja) | 1985-08-20 | 1985-08-20 | 音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6243698A true JPS6243698A (ja) | 1987-02-25 |
Family
ID=16134772
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60183381A Pending JPS6243698A (ja) | 1985-08-20 | 1985-08-20 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6243698A (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5766499A (en) * | 1980-10-14 | 1982-04-22 | Fujitsu Ltd | Reference voice registration pattern learning system |
| JPS59162600A (ja) * | 1983-03-07 | 1984-09-13 | 株式会社リコー | 音声認識装置 |
| JPS60182494A (ja) * | 1984-02-29 | 1985-09-18 | 松下電器産業株式会社 | 音声認識装置 |
-
1985
- 1985-08-20 JP JP60183381A patent/JPS6243698A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5766499A (en) * | 1980-10-14 | 1982-04-22 | Fujitsu Ltd | Reference voice registration pattern learning system |
| JPS59162600A (ja) * | 1983-03-07 | 1984-09-13 | 株式会社リコー | 音声認識装置 |
| JPS60182494A (ja) * | 1984-02-29 | 1985-09-18 | 松下電器産業株式会社 | 音声認識装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2739945B2 (ja) | 音声認識方法 | |
| JP3437492B2 (ja) | 音声認識方法及び装置 | |
| JPS6243698A (ja) | 音声認識装置 | |
| JPS6312312B2 (ja) | ||
| JPS63502304A (ja) | 高雑音環境における言語認識のためのフレ−ム比較法 | |
| JP2983364B2 (ja) | 隠れマルコフモデルと音声信号との類似度計算方法 | |
| JP3100180B2 (ja) | 音声認識方法 | |
| JP3400474B2 (ja) | 音声認識装置および音声認識方法 | |
| JP2005091758A (ja) | 話者認識システム及び方法 | |
| JP2989231B2 (ja) | 音声認識装置 | |
| JP3090204B2 (ja) | 音声モデル学習装置及び音声認識装置 | |
| JP2827590B2 (ja) | 音声認識装置 | |
| JP3357752B2 (ja) | パターンマッチング装置 | |
| JPH0736481A (ja) | 補完音声認識装置 | |
| JPH04267300A (ja) | 雑音除去と話者適応の機能を有する音声認識装置 | |
| JPH01319099A (ja) | 音声認識装置 | |
| JP2975808B2 (ja) | 音声認識装置 | |
| JPS58176699A (ja) | 音声標準パタ−ン登録方式 | |
| JPS6073592A (ja) | 特定話者用音声認識装置 | |
| JPH0197999A (ja) | 音声認識装置 | |
| JPS62226196A (ja) | 標準パタン逐次学習方式 | |
| JPH1097282A (ja) | 音声認識装置 | |
| JPH068998B2 (ja) | 音声認識装置 | |
| JPS62159200A (ja) | 特定話者用単語音声認識装置 | |
| JPS61279896A (ja) | 音声認識装置 |