JPS6011897A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6011897A
JPS6011897A JP58119044A JP11904483A JPS6011897A JP S6011897 A JPS6011897 A JP S6011897A JP 58119044 A JP58119044 A JP 58119044A JP 11904483 A JP11904483 A JP 11904483A JP S6011897 A JPS6011897 A JP S6011897A
Authority
JP
Japan
Prior art keywords
dictionary
voice
recognition
learning
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58119044A
Other languages
English (en)
Other versions
JPH0362279B2 (ja
Inventor
桜庭 孝宏
杉原 澄子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58119044A priority Critical patent/JPS6011897A/ja
Publication of JPS6011897A publication Critical patent/JPS6011897A/ja
Publication of JPH0362279B2 publication Critical patent/JPH0362279B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)発明の技術分野 本発明は音声認識装置に係り、特にマルチテンプレート
方式に改良を加えた音声認識装置に関する。
(ロ)技術の背景 従来の音声認識装置には、使用者の音声を登録し、その
登録した音声と入力した音声とを照合して最も似ている
ものを認識結果として出力する特定話者音声認識装置が
ある。
この型式の音声認識装置には、1つの語に複数の辞書を
用意するマルチテンブレー1一方式のものや、これに学
習処理を導入して」−配力式を更に発展させたものがあ
るが、この後者の方式になるものであっても、その辞書
登録にお&Jる発声の態様や、発生される語の性質に対
する分析がいまだ十分でなく、その結果として、用意し
な番ノればならない辞書容量はなお多くにならざるを得
ないのみならず、そのために認識時間が長くなる等更に
改善すべき余地が残されている。
(ハ)従来技術と問題点 上述の特定話者音声認識装置の初期においては、1つの
語に1つの辞書を用意する場合に生ずる誤認識を回避せ
んとして発声のばらつきに対処する辞書、即ち1つの語
に複数の辞書を用意するいわゆるマルチテン−°レート
方式の音声認識装置が開発された。この装置においては
、各語毎にその語を発生した場合に生し得る各種音声を
十分に登録している場合にはその効果を期待出来る。し
かし、実際には、音声登録を続りて行なう場合が多く、
その登録の際の発声が同様なものになり易いため、マル
チテンプレート化の効果は稀釈化されてしまう。
そこで、登録が終了したら、入力音声と対応する語の辞
書の照合距離の近いものについて特定比率で入力音声と
登録音声とを合成して得た学習音声をその語の登録音声
として再登録を行なうという学習処理を行ない、徐々に
発声の異なる辞書にする手段を採用している。
このようにして、すべての語に複数の辞書を持たせでも
、その登録の際に同様な発声になる音声が登録される場
合には、依然として上述したと同様マルチテンプレート
化の効果を発揮出来ない。
又、語によっては発声し易くばらつきの出にくいものや
、類似語がなく誤認識しにくいものがある。このような
語について上述のようなマルチテンプレート化を行なう
必要性は乏しい。
仁)発明の目的 本発明は上述したような従来装置の有する欠点に鑑みて
創案されたもので、その目的は必要な辞書数の大幅な削
減をなして認識時間の短縮化を図った音声認識装置を提
供することにある。
(ホ)発明の構成 そして、この目的はマルチテンブレー1・方式の辞書を
有し、その辞刊内容を学習処理により更新する手段を有
する音声認識装置において、−ト記学習処理においてマ
ルチテンプレート化条件の発生を検出する手段と、その
発生まで上記学習処理を継続させ、その発生で入力音声
バラメークの上記辞書への追加登録処理に入る手段とを
備えて構成することによって、達成される。
(・)発明の実施例 以下、添付図面を参照して本発明の詳細な説明する。
添付図面は本発明の一実施例を示す。1は使用者Uから
発生された音声を受音するマイクロホンで、2はマイク
ロホン1に接続された音声特徴抽出部である。3ば音声
特徴抽出部2から出力された入力音声パラメータを格納
する入力音声パラメータ照合部ァである。入力音声パラ
メータバッファ3の出力は登録学習制御部4へ接続され
ると共に、パラメータ照合部5へ接続され、そこへの入
力音声バラメークは登録学習制御部4の制御の下にある
登録音声バラメーク辞書部6から出力される登録音声パ
ラメータとパラメータ照合部5で照合され、登録音声バ
ラメーク毎、に照合距離を認識制御部7へ与えるように
構成されている。又、登録音声パラメータ辞書部6の登
録音声パラメータ出力は登録学習制御部4へ接続され、
登録学習制御部4は後述するような学習処理結果の学習
音声パラメータ又は入力音声バラメークを登録音声パラ
メータ辞書部6に再登録又は追加登録するように構成さ
れている。
認識制御部7はパラメータ照合部5から照合距離を受番
ノて最も照合距離の近い辞書を認識結果の辞書とし、そ
の辞書情報を認識辞書情報として線8上に送出すると共
に、上記最も照合距離の近い辞書が何語であるかを示す
情報を登録学習制御部4の制御の下にある辞書ディレク
1−り部9からj↓Iて認識結果を線10上に送出し、
且つその時の照合距離を照合距離情報として線11上に
発生Jるように構成されている。
12は線11上の照合距離情報を受りてその順次の照合
距離間の関係が予め決められた関係、例えばそれら照合
距離間の差が基定値よりも小さい関係にあるとき、線1
3上に辞省追加要求信号を発生する辞書追加制御部であ
る。
線8及び13ば登録学習制御部4へ接続されている。
14は登録学習制御部4からの上述したような学習音声
パラメータ又は人力音声パラメータを格納するバッファ
である。
又、15は登録学習制御11部4及び認識制御部7へ接
続され、装置に登録モート、学習モード、又は認識モー
ドを設定し、又後述するような誤認識時に次候補のため
の要求信号を発生ずる操作パネルである。
次に、上述した構成の本発明装;6:の動作を説明する
本発明を実施する装置には、登録モード、学習モード、
又は認識モードがあっζ、装置は先ず、使用者Uによる
操作パネル15の装置により登録モーFに設定される。
この登録モードにおいて、使用者Uが登録すべき語をマ
イクロホンIへ向りて順次に発声する。
マイクl」ホンIから入力された音声は音声特徴抽出部
2で認識用音声バラメークに変換され、その入力音声パ
ラメータは入力音声パラメータバッファ3に格納される
。格納された入力音声パラメータは登録学習制御部4の
制御により登録音声パラメータ辞書部6に登録されると
共に、その登録された辞書と対応する辞書ディレクトリ
部9に登録語の識別情報が登録される。
このような処理が登録したいすべての語について行なわ
れる。
その終了後、使用者Uは操作パネル15から学習モード
を設定し、再び登録モードの場合と同様にして音声を入
力させる。その入力された音声は音声特徴抽出部2に与
えられ、そこで音声パラメータの抽出処理が行なわれる
。抽出された入力音声バラメークは入力音声パラメータ
バッファ3に格納される。
この入力音声パラメータバッファ3の入力音声パラメー
タは、登録学習制御部4の制御の下に登録音声バラメー
ク辞書部6に登録されているすべての登録音声バラメー
クと順番にパラメータ照合部5で照合され、その照合完
了の都度照合距離を認識制御部7へ送る。
これらの照合が終了すると、認識制御部7では、照合距
離の最も近い辞書を認識結果の辞書とすると共に、その
辞書が何語であるかを辞書ディレクトリ部9から得てそ
の認識結果を線10上に送出する。これと同時的に、認
識制御部7から線8上に認識辞書情報を、又線11上に
照合距離情報を発生ずる。
線11上の照合距離情報を受けた辞書追加制御部12は
照合距離情報が示す照合距離の間の比較、即ち1位の認
識結果における照合距離と2位の認識結果における照合
距離との比較を行ない、その差が予め決められた基定値
よりも小ざりれば誤認識する可能性が高いとして辞書追
加要求信号を発生ずることとなる。
上述のようにして、線10を経て出力される認識結果を
使用者Uがチェックし、その認識結果が誤認識のもので
ある場合には、使用者Uは操作パネルI5より認識のた
めの次候補を要求する。認識制御部7が次候補要求を受
け取ると、次に照合距離が近い別の語を新認識結果とし
゛で、認識制御部7から線lO上に出力する。又、その
ときの照合距離情報を線11上に、又認識辞書情報を線
8上に送出する。
辞書追加制御部12は第1位の候補の照合距離と新認識
結果の照合距離とを比較し、その差が基定値より小さけ
れば辞書追加要求信号を線13上に送出する。この場合
りこ、線13上に信号があれば、人力音声パラメータバ
ッファ3の入力音声パラメータを登録学習制御部4を介
してそのまま学習音声パラメータバッファJ4に格納す
るが、逆の場合には、線8上の認識辞書情報にも応答す
る登録学習制御部4が従来と同様に、入力音声パラメー
タと認識辞書の登録音声パラメータとを特定の比率で合
成して学習音声パラメータを作成し、これを学習音声バ
ラメークバッファ14に格納する。
このような過程を繰り返し又は繰り返せずして、認識結
果に正解が出たならば、使用者Uは次の語の学習に入る
ため、次の語をマイク1:]ホン1から入力させる。登
録学習制御部4ば次の語が入力されて来たことに応答し
て学習音声パラメータの登録音声バラメーク辞書部6へ
の登録処理に入る。
辞書追加要求が出ていない場合には、学習音声パラメー
タバッファ14の学習音声パラメータを登録音声パラメ
ータ辞書部6の認識辞書に再登録する。又、辞書追加要
求が出ている場合には、バッファ14に格納された入力
音声パラメータを登録音声バラメーク辞書部6の空辞書
に登録し且つその語の識別情報を上記空辞書に対応する
辞書ディレクトリ部9に登録する。
このようにして、照合距離の近いものについてのみマル
チテンプレート化が行なわれるなお、照合距離間の接近
度はそれぞれの語乃至語群に最適乃至これに準じて設定
されるのがよい。
())発明の効果 以上述べたように、本発明によれば、認識結果に正解が
出るまでの認識結果の照合距離相互間に予め決められた
関係が発生ずるまで従来と同様の学習処理を行ない、そ
の発生に応答して人力音声パラメータの辞書への追加登
録を行なうので、語認識しやすい類似語のある語や発声
のばらつきにより他の語と照合距離が近くなる語だけが
マルチテンプレート化されるようになる。従って、辞皆
容量の大幅な削減が可能になり、これにより照合時間の
短縮、ひいては認識時間を短くすることが出来る等の効
果が得られる。
【図面の簡単な説明】
添付図面は本発明の一実施例を示す。 図中、1はマイクロホン、2は音声特徴抽出部、3は入
力音声パラメータバッファ、4は登録学習制御部、5は
パラメータ照合部、6は登録音声パラメータ辞書部、7
は認識制御部、9は辞書ディレクトリ部、12は辞書追
加要求田;、14は学習音声パラメータバッファ、15
は操作パネルである。

Claims (2)

    【特許請求の範囲】
  1. (1)マルチテンプレート方式の辞書を有し、その辞書
    内容を学習処理により更新する手段を有する音声認識装
    置において、上記学習処理においてマルチテンプレート
    化条件の発生を検出する手段と、その発生まで上記学習
    処理を継続させ、その発生で入力音声パラメータの上記
    辞書−\の追加登録処理に入る手段とを備えて構成した
    ことを特徴とする音声認識装置。
  2. (2) 上記検出手段は」二記学習処理における久方音
    声パラメータと上記辞書内容の各々との間の照合距離を
    める手段と、その照合距離間に予め決められた関係が生
    じているが否かを調べる手段とを備え、上記予め決めら
    れた関係の発生を上記マルチテンブレ=1・化条件の発
    生とするように構成したことを特徴とする特許請求の範
    囲第1項記載の音声認識装置。
JP58119044A 1983-06-30 1983-06-30 音声認識装置 Granted JPS6011897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58119044A JPS6011897A (ja) 1983-06-30 1983-06-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58119044A JPS6011897A (ja) 1983-06-30 1983-06-30 音声認識装置

Publications (2)

Publication Number Publication Date
JPS6011897A true JPS6011897A (ja) 1985-01-22
JPH0362279B2 JPH0362279B2 (ja) 1991-09-25

Family

ID=14751536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58119044A Granted JPS6011897A (ja) 1983-06-30 1983-06-30 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6011897A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237351A (ja) * 2009-03-31 2010-10-21 Nec Corp ユーザ辞書作成システム、方法、及び、プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5766497A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice registration pattern adding system
JPS5766499A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Reference voice registration pattern learning system
JPS608898A (ja) * 1983-06-29 1985-01-17 富士通株式会社 音声認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5766497A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice registration pattern adding system
JPS5766499A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Reference voice registration pattern learning system
JPS608898A (ja) * 1983-06-29 1985-01-17 富士通株式会社 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237351A (ja) * 2009-03-31 2010-10-21 Nec Corp ユーザ辞書作成システム、方法、及び、プログラム

Also Published As

Publication number Publication date
JPH0362279B2 (ja) 1991-09-25

Similar Documents

Publication Publication Date Title
US5031113A (en) Text-processing system
JPH04362699A (ja) 音声認識方法及び装置
JPS6332394B2 (ja)
JP2002215184A (ja) 音声認識装置、及びプログラム
JPS6011897A (ja) 音声認識装置
JPS645320B2 (ja)
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPS608898A (ja) 音声認識装置
JPS599080B2 (ja) 音声認識方法
EP1426924A1 (en) Speaker recognition for rejecting background speakers
JPS6126678B2 (ja)
JPH03223799A (ja) 分離しているワード、特に非常に大きい語いの認識方法と装置
JPS60260094A (ja) 音声認識装置
JPS6239749B2 (ja)
JPH0236960B2 (ja)
JPS58130394A (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JPS6312000A (ja) 音声認識装置
JPH01290000A (ja) 音声認識方式
JPH079598B2 (ja) 音声認識装置における標準パラメ−タの修正方法
JPS637398B2 (ja)
JPS59126600A (ja) 音声認識装置
JPH0331274B2 (ja)
JPS6140686A (ja) 標準パタ−ン登録方式
JPS59147400A (ja) 音声認識装置