JPS6243698A

JPS6243698A - 音声認識装置

Info

Publication number: JPS6243698A
Application number: JP60183381A
Authority: JP
Inventors: 正典宮武
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1985-08-20
Filing date: 1985-08-20
Publication date: 1987-02-25

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は音声認識装置に関し、更に詳述すれば辞書部の
更新機能を自する音声認識装置に関する。

〔従来技術〕

音声認識装置は特徴抽出部にて入力音声の特徴パラメー
タを抽出し、これを音声（単３５）ごとに辞書部に予め
格納しておき、認識を行わせる際には特徴抽出部にて未
認識の入力音声の特徴パラメータを抽出し、これを辞書
部の複数の単語の特徴パラメータと比較し、最も類似す
る特徴パラメータの単語に相当する信号を出力すべくな
したものである。

さて一般に特定話者が同一単語の発声を行っても、その
音声はバラツキを自するから、辞書部に特徴パラメータ
を格納する際には同一の単語につき複数の音声を発せし
めて、それらの平均をとって得た特徴パラメータを格納
することにしている。

ところが時間の経過に伴い同一話者による同一単語に対
する発声であってもその音声は徐々に変化していくから
、辞書部の内容を固定しておくと誤認識、又は認識不能
が頻発することとなる。このため時間経過に伴って辞書
を更新することが行われる。

辞書更新の方法としては、誤認識した単語の辞書部の内
容、つまり特徴パラメータをオペレータの操作にて更新
する方法、正しい認識をした場合であっても入力音声の
特徴パラメータと辞書部内の特徴パラメータとの間の類
似度がしきい値以・下となった場合に自動的に更新する
方法が知られている。

〔発明が解決しようとする問題点〕

しかしながら一１者の方法ではオペレータの操作ミスに
て辞書部が誤って更新されることがあり、また後者の方
法では入力音声に雑音が混血したために類似度が低くな
り、このために無用の更新が行われ、また更新が行われ
たために雑音が混入した特徴パラメータが辞書部に格納
される等の不都合がある。

更に特開昭５９−１６２６００号には使用頻度の低い単
語については入力音声と辞書部との特徴パラメータの類
似度が小さくなるので、類似度の小さい入力音声に大き
な重みづけをして既格納済の辞書部の特徴パラメータと
上記入力音声の特徴パラメータとの平均をとるようにし
て辞書部を更新する方法が示されている。ところがこの
ような方法による場合も雑音の混在によって類似度が小
さくなった場合により多くの雑音が辞書に混入してしま
うという不都合があった。

〔問題点を解決するための手段〕

本発明は斯かる事情に漏みてなされたものであり、正し
く識別された場合において更新を行うべくなし、入力音
声の特徴パラメータと辞書部の特徴パラメータとの類似
度が大きい（小さい）はど入力音声の特徴パラメータの
重みづけを大きく（小さく）シて、辞書部の特徴パラメ
ータとｍみづけした入力音声の特徴パラメータとを平均
するようにして辞書部を更新する手段を備えることによ
って雑音の混入なしに自効な辞書部更新が行えるように
なした音声認識装置を提供することを目的とする。

本発明に係る音声認識装置は、入力音声の特徴パラメー
タを抽出する特徴抽出部、複数の音声につき抽出した特
徴パラメータを予め格納しておく辞書部及び特徴抽出部
にて抽出した未認識の音声の特徴パラメータと辞書部に
格納してある複数の音声の特徴パラメータとを比較して
類似度を求め、類似度が最大である、辞書部に格納して
ある音声に応じた信号を出力する識別部を具備する音声
認識装置において、前記識別部の出力が正しい場合に、
入力された音声の特徴パラメータを辞書部の該当音声の
特徴パラメータの修正に関与させ、またＯ；】記類似度
の大小に応じて関与の程度を大小に変じる辞書更新手段
を具備することを特徴とする。

〔実ｓｂ例〕

以下本発明をその実施例を示す図面に基づいて詳述する
。

マイクロフォンｌに入力された音声の信号はｉ：１処理
部２にて高域強調等のｉ；ノ処理を施されて特徴抽出部
３へ入力され、ごごでその分析が行われて特徴が抽出さ
れる０本発明装置が登録モードにて動作している場合は
このようにして抽出された特徴、つまり特徴パラメータ
が辞書部４に各音声（単語）と対応づけて格納され°（
いく、このようにして特徴パラメータ（以下標準ベクト
ルという）ａ、ｂ、ｔ・・・が辞書部４に格納されたも
のとする。

次に認識モードにおいてもマイクロフォンｌからの入力
音声は同様にして特徴パラメータが抽出される。この未
認識の音声の特徴パラメータを未知ヘクトルＸとする。

類似度演算部５は未知ベクトルＸと、辞書部４内の標準
ヘクトル２１．　　ｂ、　　ｃ・・・との類似度（又は
距離）を計算する。計算結果は最大類似度選出部６へ送
られ、最大類似度選出部６はここで類似度が最大のもの
（又は距離が最小のもの）を選出する０例えば未知ヘク
トルＸと標準ベクトル社との類似度Ｓが標準ベクトルｂ
。

Ｃ・・・等の類似度より大きい、つまりＳが類似度の最
大値であったものとすると最大類似度選出部６は標準ベ
クトルａに相当する音声（単語）、例えば「アカ」に相
当する信号を出力部にて発し、これから「アカ」を表示
させるべき信号を表示部８へ出力せしめる。

オペレータはごの表示「”７カ」が入力音声どおりであ
ればキーボード９にてその旨を入力する。

そしてこのような正しい認識が行われた場合はキーボー
ド９の操作によって辞書更新指示が行われる。この辞書
更新指示信号は平均演算部ＩＯへ入力される。

なお、辞書更新指示信号はキーボード９からの指示によ
らず、次の音声入力に伴って発せられる構成としてもよ
い。

そして表示された内容が誤りであった場合はキーボード
９にて最大類似度選出部６に誤認識を報じ、Ｓに次いで
大きな類似度の標準ベクトルｂ。

Ｃ・・・に相当する信号を発せしめる。

最大類似度選出部６は未知ベタ１−ルＸと標準ベクトル
社との類似度Ｓを関数発生器１１へ出力する。

関数発生器１１は類似度Ｓの値を変数とする関数の値ｆ
　　（Ｓ）を発する。

ｆ　　（Ｓ）はＳが大である程大きく、小である程小さ
い。

平均演算部１０は上述のｆ　　（Ｓ）並びに未知ベクト
ルＸ及び標準へクトル１に基づいて下記（１１式の演算
を行い新たな標準へクトルｄ′を算出する。

つまりｆ　　（Ｓ）をＸのｍみづけ係数としてａ。

Ｘの荷重平均を求めているのである。

このようにして計算された新たな標準ベクトルａ′は辞
書部４へ標準ベクトルｄに替えて格納される。

なお類似度を表わすものとして未知ベクトルＸと標準ベ
クトルａ、ｂ、ｃ・・・との距離を用いる場合は最小の
距離値りをとる標準ベクトル例えばａについて同様の処
理を行う。

〔効果〕

以上の如き本発明による場合は入力音声中に雑音が多く
混入している場合はＳが小さいからｒ　　（Ｓ）も小さ
く、従っ°（（１１式の（（Ｓ）　　・Ｘの項が小さく
なる。つまり雑音が混入している入力音声の特徴パラメ
ータが更新に関与する程度が低いのである。これに如′
シてＳが大きい場合はｆ　　（Ｓ）も人きくなり入力音
声の特徴パラメータが更新に強く関与するのである。

従っ゛ζ経時的に話者の発声が変わっていく場合にも好
適な辞書部更新が行われ、また雑音が混在する場合にも
辞書部の格納の内容を劣化させることがない等本発明は
優れた効果を奏する。

【図面の簡単な説明】

図面は本発明の実ｈｂ例を示す回路図である。１・・・マイクロフォン　２・・・ｉｉＩ処理部　３・
・・特徴抽出部　４・・・辞書部　５・・・類似度演算
部　６・・・最大類似度算出部　９・・・キーボード　
ｌＯ・・・平均演算部　１１・・・関数発生器

Claims

【特許請求の範囲】１、入力音声の特徴パラメータを抽出する特徴抽出部、
複数の音声につき抽出した特徴パラメータを予め格納し
ておく辞書部及び特徴抽出部にて抽出した未認識の音声
の特徴パラメータと辞書部に格納してある複数の音声の
特徴パラメータとを比較して類似度を求め、類似度が最
大である、辞書部に格納してある音声に応じた信号を出
力する識別部を具備する音声認識装置において、前記識別部の出力が正しい場合に、入力された音声の特徴パラメータを辞書部の該当音声の特徴パ
ラメータの修正に関与させ、また前記類似度の大小に応
じて関与の程度を大小に変じる辞書更新手段を具備する
ことを特徴とする音声認識装置。