JPH0438358B2 - - Google Patents
Info
- Publication number
- JPH0438358B2 JPH0438358B2 JP59251902A JP25190284A JPH0438358B2 JP H0438358 B2 JPH0438358 B2 JP H0438358B2 JP 59251902 A JP59251902 A JP 59251902A JP 25190284 A JP25190284 A JP 25190284A JP H0438358 B2 JPH0438358 B2 JP H0438358B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speaker
- pattern
- speech
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は、人間の音声を認識する装置に係り、
特に、入力された音声情報を、予め登録された音
声パターンと照合して認識する複数の音声認識手
段を備えた音声認識装置の改良に関する。
特に、入力された音声情報を、予め登録された音
声パターンと照合して認識する複数の音声認識手
段を備えた音声認識装置の改良に関する。
例えば、特開昭51−28701号公報に開示されて
いるように、現在の音声認識精度は、不特定話者
では著しく低下するので、話者毎の特徴を抽出し
た音声パターンを予め登録しておき、これと音声
入力を照合して、それらの特徴の一致により認識
する手法が主流である。
いるように、現在の音声認識精度は、不特定話者
では著しく低下するので、話者毎の特徴を抽出し
た音声パターンを予め登録しておき、これと音声
入力を照合して、それらの特徴の一致により認識
する手法が主流である。
ところで、音声認識装置を、複数の話者で使用
したい要求が強く、この場合には、1台の音声認
識装置に、複数の話者(例えば20名など)の各単
語毎の音声パターンを予め記憶させておく。そし
て、使用者(話者)の発生した単語と、記憶され
た音声パターンとを照合し、最も近い、あるい
は、予定の誤差の範囲にある音声パターンに対応
する言葉であるものと認識する。
したい要求が強く、この場合には、1台の音声認
識装置に、複数の話者(例えば20名など)の各単
語毎の音声パターンを予め記憶させておく。そし
て、使用者(話者)の発生した単語と、記憶され
た音声パターンとを照合し、最も近い、あるい
は、予定の誤差の範囲にある音声パターンに対応
する言葉であるものと認識する。
しかし、多数の話者の多数の単語を記憶するた
めには大きな記憶容量を必要とし、また、その中
から一致する音声パターンを認識するためには、
認識時間が長くなるという欠点がある。
めには大きな記憶容量を必要とし、また、その中
から一致する音声パターンを認識するためには、
認識時間が長くなるという欠点がある。
このため、各話者の音声パターンを記憶させた
カセツト・メモリを各話者が所有し、音声認識装
置を使用するときに、上記カセツトをセツトする
手法も提案されている。
カセツト・メモリを各話者が所有し、音声認識装
置を使用するときに、上記カセツトをセツトする
手法も提案されている。
この手法によれば、メモリの総容量としては同
じであるが、特定話者の音声パターンのみとの照
合により、認識精度及び認識速度が向上する利点
がある。
じであるが、特定話者の音声パターンのみとの照
合により、認識精度及び認識速度が向上する利点
がある。
しかしながら、カセツト・メモリなどの紛失や
置場の問題が生じ、利用者にとつて不便である。
置場の問題が生じ、利用者にとつて不便である。
本発明の目的は、複数の音声認識装置を複数の
話者が使用する場合において、認識精度や認識速
度を損うことがなく、また、着脱メモリなどを必
要としない音声認識装置を提供することである。
話者が使用する場合において、認識精度や認識速
度を損うことがなく、また、着脱メモリなどを必
要としない音声認識装置を提供することである。
本発明の特徴とするところは、複数の音声認識
手段のうちの任意のものを使用する話者を識別す
る手段と、複数話者毎の音声パターンを記憶する
共通の補助記憶手段と、識別された話者に対応す
る音声パターンを上記補助記憶手段いから該当す
る音声認識手段の持つ音声パターン記憶手段へ読
出し格納する制御手段を設け、共通の補助記憶手
段には、(1)、話者識別用の音声パターン(話者交
代用語)と、(2)、作業用の音声パターン(命令語
や作業用語など)とを予め記憶させておき、各音
声認識手段の使用直前には、話者識別用の音声パ
ターンを各音声認識手段内の音声パターン記憶手
段に読出し格納しておく。
手段のうちの任意のものを使用する話者を識別す
る手段と、複数話者毎の音声パターンを記憶する
共通の補助記憶手段と、識別された話者に対応す
る音声パターンを上記補助記憶手段いから該当す
る音声認識手段の持つ音声パターン記憶手段へ読
出し格納する制御手段を設け、共通の補助記憶手
段には、(1)、話者識別用の音声パターン(話者交
代用語)と、(2)、作業用の音声パターン(命令語
や作業用語など)とを予め記憶させておき、各音
声認識手段の使用直前には、話者識別用の音声パ
ターンを各音声認識手段内の音声パターン記憶手
段に読出し格納しておく。
この状態で、任意の音声認識手段を例えば、A
太郎が使用を開始するとき、その氏名などの話者
識別用音声パターンと符号する定められた話者交
代用語を発声する。
太郎が使用を開始するとき、その氏名などの話者
識別用音声パターンと符号する定められた話者交
代用語を発声する。
これにより、話者が識別されると、制御手段
は、識別された話者に対応する作業用の音声パタ
ーンを共通の補助記憶手段から読出し、対応する
音声認識手段内の音声パターン記憶手段へ格納す
る。
は、識別された話者に対応する作業用の音声パタ
ーンを共通の補助記憶手段から読出し、対応する
音声認識手段内の音声パターン記憶手段へ格納す
る。
以後は、話者と1対1に対応した作業用の音声
パターンのみと、その話者の音声入力情報との照
合の下に音声認識が行われ、必要な作業が遂行さ
れる。
パターンのみと、その話者の音声入力情報との照
合の下に音声認識が行われ、必要な作業が遂行さ
れる。
この結果、着脱メモリなどを必要とせず、複数
の音声認識手段を夫々異る話者が同時に使用する
速度を損うこともない。
の音声認識手段を夫々異る話者が同時に使用する
速度を損うこともない。
以下、音声入力記憶装置に本発明を適用した一
実施例につき詳細に説明する。この実施例におい
ては、音声によるガイダンス、アンサーバツクを
行いつつ、作業者の作業とその結果を入力して記
憶する装置である。また、最初に行うべき、ある
いは新たな話者に対して行うべき音声パターンの
登録をも自由に行いうるものである。
実施例につき詳細に説明する。この実施例におい
ては、音声によるガイダンス、アンサーバツクを
行いつつ、作業者の作業とその結果を入力して記
憶する装置である。また、最初に行うべき、ある
いは新たな話者に対して行うべき音声パターンの
登録をも自由に行いうるものである。
第1図は本発明に係る音声情報入力記憶装置の
一実施例の構成を示す。同図において、2台の音
声認識装置1Aおよび1Bは音声入力用マイク6
Aおよび6Bの音声信号を増幅する増幅器11A
および11B、音声信号をデイジタル信号に変換
するA/D変換器12Aおよび12B、あらかじ
め音声パターンを記憶しておく音声パターンメモ
リ14Aおよび14B及び入力音声と音声パター
ンとを比較して音声認識をする音声認識制御回路
13Aおよび13Bによつて構成されている。
一実施例の構成を示す。同図において、2台の音
声認識装置1Aおよび1Bは音声入力用マイク6
Aおよび6Bの音声信号を増幅する増幅器11A
および11B、音声信号をデイジタル信号に変換
するA/D変換器12Aおよび12B、あらかじ
め音声パターンを記憶しておく音声パターンメモ
リ14Aおよび14B及び入力音声と音声パター
ンとを比較して音声認識をする音声認識制御回路
13Aおよび13Bによつて構成されている。
一方、音声出力装置2Aおよび2Bは音声出力
をするための音声を記憶しておく合成音声メモリ
22Aおよび22B、音声認識結果に応じて合成
音声メモリ22Aおよび22Bの記憶内容を選別
して出力する音声出力制御回路21Aおよび21
B、音声出力制御回路21Aおよび21Bの出力
信号をアナログ信号に変換するD/A変換器23
Aおよび23B、アナログ信号を増幅してスピー
カ(またはイヤホン)7Aおよび7Bからアンサ
ーバツクの音声を発声させる増幅器24Aおよび
24Bによつて構成されている。
をするための音声を記憶しておく合成音声メモリ
22Aおよび22B、音声認識結果に応じて合成
音声メモリ22Aおよび22Bの記憶内容を選別
して出力する音声出力制御回路21Aおよび21
B、音声出力制御回路21Aおよび21Bの出力
信号をアナログ信号に変換するD/A変換器23
Aおよび23B、アナログ信号を増幅してスピー
カ(またはイヤホン)7Aおよび7Bからアンサ
ーバツクの音声を発声させる増幅器24Aおよび
24Bによつて構成されている。
補助記憶装置8は、複数の音声認識装置1Aお
よび1Bに共通して使用されるもので、夫々の音
声パターンメモリ14Aおよび14Bへ格納すべ
き音声パターンを記憶するものである。
よび1Bに共通して使用されるもので、夫々の音
声パターンメモリ14Aおよび14Bへ格納すべ
き音声パターンを記憶するものである。
また制御回路3は音声認識装置1Aおよび1B
の音声認識制御回路13Aおよび13Bを制御し
て音声認識結果を取り込んだり、音声出力装置2
Aおよび2Bの音声出力制御回路21Aおよび2
1Bの制御をしてガイダンスやアンサーバツク音
をスピーカ7Aおよび7Bから出力させたり、音
声認識装置1Aおよび1Bの音声パターンメモリ
14Aおよび14Bの音声バターンを補助記憶装
置8に記憶させたり、逆に補助記憶装置8の音声
パターンを音声認識装置1Aおよび1Bあるいは
1Aまたは1Bの音声パターンメモリ14Aおよ
び14Bに移し換えたり、表示器(またはプリン
タ)5に制御状態や音声認識結果などを表示(ま
たはプリントアウト)したりする制御用コンピユ
ータである。この制御回路3は音声の他にキーボ
ード4によつても制御される。
の音声認識制御回路13Aおよび13Bを制御し
て音声認識結果を取り込んだり、音声出力装置2
Aおよび2Bの音声出力制御回路21Aおよび2
1Bの制御をしてガイダンスやアンサーバツク音
をスピーカ7Aおよび7Bから出力させたり、音
声認識装置1Aおよび1Bの音声パターンメモリ
14Aおよび14Bの音声バターンを補助記憶装
置8に記憶させたり、逆に補助記憶装置8の音声
パターンを音声認識装置1Aおよび1Bあるいは
1Aまたは1Bの音声パターンメモリ14Aおよ
び14Bに移し換えたり、表示器(またはプリン
タ)5に制御状態や音声認識結果などを表示(ま
たはプリントアウト)したりする制御用コンピユ
ータである。この制御回路3は音声の他にキーボ
ード4によつても制御される。
次に本発明の一実施例に使用する音声単語の一
例を第2図に示す。
例を第2図に示す。
音声単語は、話者交代をするための話者交代用
語(話者識別用の音声パターン)と、作業をする
ための作業用語ならびに作業に使用する命令語
(作業用の音声パターン)から成る。
語(話者識別用の音声パターン)と、作業をする
ための作業用語ならびに作業に使用する命令語
(作業用の音声パターン)から成る。
まず、音声パターンの登録は、話者がマイク6
Aまたは6Bを使つて音声単語を順次音声で読み
上げることによつて行なわれ、その音声は増幅器
11Aまたは11B、A/D変換器12Aまたは
12B、音声認識制御回路13Aまたは13Bを
介して音声パターンメモリ14Aまたは14Bに
記憶される。この音声パターンメモリ14Aまた
は14Bに記憶された音声パターンは補助記憶装
置8に話者毎に番地付けされて格納される。
Aまたは6Bを使つて音声単語を順次音声で読み
上げることによつて行なわれ、その音声は増幅器
11Aまたは11B、A/D変換器12Aまたは
12B、音声認識制御回路13Aまたは13Bを
介して音声パターンメモリ14Aまたは14Bに
記憶される。この音声パターンメモリ14Aまた
は14Bに記憶された音声パターンは補助記憶装
置8に話者毎に番地付けされて格納される。
音声パターンメモリ14Aおよび14Bへの音
声単語の記憶の番地付けは、命令語と作業用語に
ついては話者共通の同一番地とし、話者交代用語
は話者毎に相異した番地とする。そして話者交代
モード(使用開始時や交代命令があつたとき)に
おいては話者全員の話者交代用語の音声パターン
のみを、音声パターンメモリ14Aあるいは14
Bに収納しておき、話者交代完了後の作業モード
では、上記交代モードで識別された1人の話者の
命令語と作業用語の音声パターンを音声パターン
メモリ14Aまたは14Bに移して音声でデータ
の入力を行う。
声単語の記憶の番地付けは、命令語と作業用語に
ついては話者共通の同一番地とし、話者交代用語
は話者毎に相異した番地とする。そして話者交代
モード(使用開始時や交代命令があつたとき)に
おいては話者全員の話者交代用語の音声パターン
のみを、音声パターンメモリ14Aあるいは14
Bに収納しておき、話者交代完了後の作業モード
では、上記交代モードで識別された1人の話者の
命令語と作業用語の音声パターンを音声パターン
メモリ14Aまたは14Bに移して音声でデータ
の入力を行う。
次に本発明による音声情報入力の一実施例を第
3図を用いて説明する。
3図を用いて説明する。
スピーカ7Aからの音声ガイダンス「氏名
は?」に対し、A太郎が、マイク6Aから音声で
「A太郎」と発声すると、音声認識装置1Aの音
声認識制御回路13Aによつて音声パターンメモ
リ14Aに記憶されている話者交代用の音声単語
の中から、入力音声と一致する単語「A太郎」を
探し出して、その記憶番地あるいは対応するコー
ドを制御回路3に出力する。
は?」に対し、A太郎が、マイク6Aから音声で
「A太郎」と発声すると、音声認識装置1Aの音
声認識制御回路13Aによつて音声パターンメモ
リ14Aに記憶されている話者交代用の音声単語
の中から、入力音声と一致する単語「A太郎」を
探し出して、その記憶番地あるいは対応するコー
ドを制御回路3に出力する。
制御回路3は音声単語コードの入力によりデー
タとして取り込んだり表示器5に表示したりする
他に音声出力制御回路21Aにアンサーバツクさ
せるための指令を発する。音声出力制御回路21
Aは制御回路3のアンサーバツク指令により合成
音声メモリ22A内の音声データを出力してD/
A変換器23A、増幅器24Aを介してスピーカ
7Aから「A太郎」と発声させる。ここで、A太
郎がマイク6Aから「OK」と発声して入力する
と、音声認識装置1Aの音声認識制御回路13A
によつて音声パターンメモリ14Aの話者交代用
単語の中から、入力音声と一致する単語「OK」
を探し出してその番地あるいはコードを制御回路
3に出力する。制御回路3はこれにより、話者が
A太郎であることを識別し、補助記憶装置8に記
憶していたA太郎の作業用の音声パターンを音声
パターンメモリ14Aに読出して格納し、A太郎
の作業モードにするとともに、音声出力装置2A
を制御してスピーカ7Aから「作業は?」と音声
ガイダンスを発する。
タとして取り込んだり表示器5に表示したりする
他に音声出力制御回路21Aにアンサーバツクさ
せるための指令を発する。音声出力制御回路21
Aは制御回路3のアンサーバツク指令により合成
音声メモリ22A内の音声データを出力してD/
A変換器23A、増幅器24Aを介してスピーカ
7Aから「A太郎」と発声させる。ここで、A太
郎がマイク6Aから「OK」と発声して入力する
と、音声認識装置1Aの音声認識制御回路13A
によつて音声パターンメモリ14Aの話者交代用
単語の中から、入力音声と一致する単語「OK」
を探し出してその番地あるいはコードを制御回路
3に出力する。制御回路3はこれにより、話者が
A太郎であることを識別し、補助記憶装置8に記
憶していたA太郎の作業用の音声パターンを音声
パターンメモリ14Aに読出して格納し、A太郎
の作業モードにするとともに、音声出力装置2A
を制御してスピーカ7Aから「作業は?」と音声
ガイダンスを発する。
A太郎が「入庫」と音声入力すると、音声認識
の結果「品番は?」とスピーカ7Aからガイダン
スが返つてくるので、例えば「1、2、3」と音
声入力すると正しく認識されれば「1、2、3」
とアンサーバツクが返つてくる。次に「置場
は?」のガイダンスに対し「A」と音声入力する
と音声認識の結果「A」とアンサーバツクが返つ
てくる。
の結果「品番は?」とスピーカ7Aからガイダン
スが返つてくるので、例えば「1、2、3」と音
声入力すると正しく認識されれば「1、2、3」
とアンサーバツクが返つてくる。次に「置場
は?」のガイダンスに対し「A」と音声入力する
と音声認識の結果「A」とアンサーバツクが返つ
てくる。
以上により、A太郎は、A太郎の音声で自分の
作業用の音声パターンを補助記憶装置8から音声
認識装置1Aに移した上で、自分の作業用音声パ
ターンのみとの照合による精度の高い、かつ高速
の認識を用いて、「品番123と置場Aに入庫」とい
うデータを入力したことになる。
作業用の音声パターンを補助記憶装置8から音声
認識装置1Aに移した上で、自分の作業用音声パ
ターンのみとの照合による精度の高い、かつ高速
の認識を用いて、「品番123と置場Aに入庫」とい
うデータを入力したことになる。
A太郎が作業を終了するときは、「交代」とマ
イク6Aから入力すると作業モードから話者交代
モードに切り換る。すなわち、制御回路3は、補
助記憶装置8内の話者交代用音声パターンを読出
して、音声パターンメモリ14Aへ格納する。
イク6Aから入力すると作業モードから話者交代
モードに切り換る。すなわち、制御回路3は、補
助記憶装置8内の話者交代用音声パターンを読出
して、音声パターンメモリ14Aへ格納する。
以上はA太郎がマイク6Aから音声入力した場
合について説明したが、A太郎がマイク6Bから
音声入力した場合も全く同様である。スピーカ7
Bからの音声ガイダンス「氏名は?」に対して、
A太郎が、マイク6Bから音声で「A太郎」と発
声すると、音声認識装置1Bの音声認識制御回路
13Bによつて音声パターンメモリ14Bに記憶
されている音声単語の中から入力音声と一致する
単語「A太郎」を探し出してその記憶番地あるい
は対応するコードを制御回路3に出力する。制御
回路3の制御によつて音声出力装置2Bの増幅器
24Bを介してスピーカ7Bから「A太郎」と発
声させる。ここで、A太郎がマイク6Bから
「OK」と発声して入力すると、音声認識装置1
Bの音声認識制御回路13Bによつて登録音声メ
モリ14Bの単語の中から入力音声と一致する音
声単語である「OK」を探し出してその番地ある
いはコードを制御回路3に出力す。これにより、
制御回路3は補助記憶装置8に記憶していたA太
郎の作業用の音声パターンを音声パターンメモリ
14Bに移し換えて、A太郎の作業モードにする
とともに、音声出力装置2Bを制御してスピーカ
7Bから「作業は?」と音声ガイダンスを発す
る。以下マイク6Aからの音声入力時と全く同様
に作用する。
合について説明したが、A太郎がマイク6Bから
音声入力した場合も全く同様である。スピーカ7
Bからの音声ガイダンス「氏名は?」に対して、
A太郎が、マイク6Bから音声で「A太郎」と発
声すると、音声認識装置1Bの音声認識制御回路
13Bによつて音声パターンメモリ14Bに記憶
されている音声単語の中から入力音声と一致する
単語「A太郎」を探し出してその記憶番地あるい
は対応するコードを制御回路3に出力する。制御
回路3の制御によつて音声出力装置2Bの増幅器
24Bを介してスピーカ7Bから「A太郎」と発
声させる。ここで、A太郎がマイク6Bから
「OK」と発声して入力すると、音声認識装置1
Bの音声認識制御回路13Bによつて登録音声メ
モリ14Bの単語の中から入力音声と一致する音
声単語である「OK」を探し出してその番地ある
いはコードを制御回路3に出力す。これにより、
制御回路3は補助記憶装置8に記憶していたA太
郎の作業用の音声パターンを音声パターンメモリ
14Bに移し換えて、A太郎の作業モードにする
とともに、音声出力装置2Bを制御してスピーカ
7Bから「作業は?」と音声ガイダンスを発す
る。以下マイク6Aからの音声入力時と全く同様
に作用する。
今度はB太郎がマイク6A(または6B)から
「B太郎」と音声入力すると音声認識の結果、今
度は音声パターンメモリ14A(または14B)
には補助記憶装置8からB太郎の作業用音声パタ
ーンが入り、B太郎が音声データ入力をすること
ができるようになる。
「B太郎」と音声入力すると音声認識の結果、今
度は音声パターンメモリ14A(または14B)
には補助記憶装置8からB太郎の作業用音声パタ
ーンが入り、B太郎が音声データ入力をすること
ができるようになる。
以下同様にして、1組の補助記憶装置8に記憶
しておいた話者交代用並びに複数話者毎の作業用
の音声パターンを複数の音声認識装置1Aおよび
1Bに導き出して自由に音声で話者交代およびデ
ータ入力をすることができる。音声パターンの登
録は1組の音声認識装置から行ない補助記憶装置
を介して他の音声認識装置に移し換えても良く、
また各音声認識装置からそれぞれ登録しても良
い。
しておいた話者交代用並びに複数話者毎の作業用
の音声パターンを複数の音声認識装置1Aおよび
1Bに導き出して自由に音声で話者交代およびデ
ータ入力をすることができる。音声パターンの登
録は1組の音声認識装置から行ない補助記憶装置
を介して他の音声認識装置に移し換えても良く、
また各音声認識装置からそれぞれ登録しても良
い。
ここで補助記憶装置8は集積回路のRAMや
ROMとしても良く、また、バブルカセツト、カ
セツトテープ、フロツピーデイスクなどとしても
良い。但し、新たな話者の音声パターンを自由に
登録するためには、ROM以外の記憶手段を用い
る。
ROMとしても良く、また、バブルカセツト、カ
セツトテープ、フロツピーデイスクなどとしても
良い。但し、新たな話者の音声パターンを自由に
登録するためには、ROM以外の記憶手段を用い
る。
補助記憶装置8と登録音声メモリ14Aまたは
14Bの音声パターンの読出し格納は、音声入力
による他にキーボード4から行なうようにしても
良い。さらに、音声認識結果を表示器5に表示し
て、音声出力装置2Aおよび2Bを省略しても複
数の話者が複数の音声認識装置から交代して音声
情報を入力することができる。
14Bの音声パターンの読出し格納は、音声入力
による他にキーボード4から行なうようにしても
良い。さらに、音声認識結果を表示器5に表示し
て、音声出力装置2Aおよび2Bを省略しても複
数の話者が複数の音声認識装置から交代して音声
情報を入力することができる。
第4図は本発明に係る音声情報入力装置の他の
一実施例の構成を示したもので、第1図と同一符
号のものは同一機能を有する。同図において、無
線機移動局30Aおよび30Bはマイク6Aおよ
び6Bの入力音声をアンテナ33Aおよび33B
から電波を発射する送信機31Aおよび31B、
アンテナ33Aおよび33Bから電波を受信して
スピーカ7Aおよび7Bから音声ガイダンスやア
ンサーバツクを発生させる受信機32Aおよび3
2Bによつて構成されている。無線機固定局20
Aおよび20Bは無線機移動局30Aおよび30
Bの電波をアンテナ23Aおよび23Bを介して
受信して音声入出力装置10Aおよび10Bの音
声認識装置1Aおよび1Bに入力する受信機21
Aおよび21B、音声入出力装置10Aおよび1
0Bの音声出力装置2Aおよび2Bの出力音声を
アンテナ23Aおよび23Bを介して無線機移動
局30Aおよび30Bの受信機32Aおよび32
Bへ電波を発射する送信機22Aおよび22Bか
ら構成されている。音声パターンの登録はマイク
6Aまたは6Bから話者が音声単語を順次音声で
読み上げることによつて行なわれる。マイク6A
または6Bから入力された音声は無線機移動局3
0Aおよび30Bの送信機31Aまたは31Bか
らアンテナ33Aまたは33Bを介して電波が発
射される。この電波はアンテナ23Aまたは23
Bを介して無線機固定局20Aまたは20Bの受
信機21Aおよび21Bで受信して音声認識装置
1Aまたは1Bの登録音声メモリに登録される。
この登録音声メモリに登録された音声パターンは
補助記憶装置8に話者毎に番地付けされて格納さ
れる。また、補助記憶装置8に格納された音声パ
ターンはキーボード4の操作あるいは音声認識装
置1Aまたは1Bへの音声入力によつて音声認識
装置1Aまたは1Bそれぞれの音声パターンメモ
リに移される。マイク6Aまたは6Bから話者の
音声データが入力されると無線機移動局30Aま
たは30Bの送信機31Aまたは31Bから電波
をとおして無線機固定局20Aまたは20Bの受
信機21Aまたは21Bで受信し音声認識装置1
Aまたは1Bに入力される。音声認識結果のアン
サーバツクは音声出力装置2Aまたは2Bから発
せられ送信機22Aまたは22Bによつて電波と
なつて発射される。この電波は受信機32Aまた
は32Bによつて受信されスピーカ7Aまたは7
Bから発声される。話者はマイク6Aまたは6B
から音声でデータを入力するとスピーカ7Aまた
は7Bからアンサーバツクあるいはガイダンスが
発せられるのでこれを開きながら音声でデータを
入力する。
一実施例の構成を示したもので、第1図と同一符
号のものは同一機能を有する。同図において、無
線機移動局30Aおよび30Bはマイク6Aおよ
び6Bの入力音声をアンテナ33Aおよび33B
から電波を発射する送信機31Aおよび31B、
アンテナ33Aおよび33Bから電波を受信して
スピーカ7Aおよび7Bから音声ガイダンスやア
ンサーバツクを発生させる受信機32Aおよび3
2Bによつて構成されている。無線機固定局20
Aおよび20Bは無線機移動局30Aおよび30
Bの電波をアンテナ23Aおよび23Bを介して
受信して音声入出力装置10Aおよび10Bの音
声認識装置1Aおよび1Bに入力する受信機21
Aおよび21B、音声入出力装置10Aおよび1
0Bの音声出力装置2Aおよび2Bの出力音声を
アンテナ23Aおよび23Bを介して無線機移動
局30Aおよび30Bの受信機32Aおよび32
Bへ電波を発射する送信機22Aおよび22Bか
ら構成されている。音声パターンの登録はマイク
6Aまたは6Bから話者が音声単語を順次音声で
読み上げることによつて行なわれる。マイク6A
または6Bから入力された音声は無線機移動局3
0Aおよび30Bの送信機31Aまたは31Bか
らアンテナ33Aまたは33Bを介して電波が発
射される。この電波はアンテナ23Aまたは23
Bを介して無線機固定局20Aまたは20Bの受
信機21Aおよび21Bで受信して音声認識装置
1Aまたは1Bの登録音声メモリに登録される。
この登録音声メモリに登録された音声パターンは
補助記憶装置8に話者毎に番地付けされて格納さ
れる。また、補助記憶装置8に格納された音声パ
ターンはキーボード4の操作あるいは音声認識装
置1Aまたは1Bへの音声入力によつて音声認識
装置1Aまたは1Bそれぞれの音声パターンメモ
リに移される。マイク6Aまたは6Bから話者の
音声データが入力されると無線機移動局30Aま
たは30Bの送信機31Aまたは31Bから電波
をとおして無線機固定局20Aまたは20Bの受
信機21Aまたは21Bで受信し音声認識装置1
Aまたは1Bに入力される。音声認識結果のアン
サーバツクは音声出力装置2Aまたは2Bから発
せられ送信機22Aまたは22Bによつて電波と
なつて発射される。この電波は受信機32Aまた
は32Bによつて受信されスピーカ7Aまたは7
Bから発声される。話者はマイク6Aまたは6B
から音声でデータを入力するとスピーカ7Aまた
は7Bからアンサーバツクあるいはガイダンスが
発せられるのでこれを開きながら音声でデータを
入力する。
以上の実施例では、1組の音声認識装置で音声
パターンと登録をすれば他の音声認識装置への音
声パターンの登録は発声することなく補助記憶装
置を利用して行うことができる。
パターンと登録をすれば他の音声認識装置への音
声パターンの登録は発声することなく補助記憶装
置を利用して行うことができる。
以上の実施例では、話者交代用の音声パターン
をも、共通の補助記憶装置8に登録しておき、話
者交代モードでのみ、各音声認識装置1A,1B
内の音声パターンメモリ14A,14Bへ格納す
るようにしている。しかし、話者交代用の音声パ
ターンは、常時、各音声パターンメモリ14A,
14Bが記憶しておくようにすることができる。
この場合、各音声パターンメモリの他の番地に、
作業用の音声パターンのうち、識別された話者に
対応するパターンが選択的に格納されることとな
る。
をも、共通の補助記憶装置8に登録しておき、話
者交代モードでのみ、各音声認識装置1A,1B
内の音声パターンメモリ14A,14Bへ格納す
るようにしている。しかし、話者交代用の音声パ
ターンは、常時、各音声パターンメモリ14A,
14Bが記憶しておくようにすることができる。
この場合、各音声パターンメモリの他の番地に、
作業用の音声パターンのうち、識別された話者に
対応するパターンが選択的に格納されることとな
る。
また、話者の識別にも音声認識手段を利用する
ものにつき説明したが、これは話者別のコード
を、キーボードその他のいかなる入力手段によつ
て入力するようにしてもよく、この場合には、制
御回路が簡単に話者を識別できる。
ものにつき説明したが、これは話者別のコード
を、キーボードその他のいかなる入力手段によつ
て入力するようにしてもよく、この場合には、制
御回路が簡単に話者を識別できる。
本発明によれば、複数の音声認識装置を複数の
話者が自由に使用でき、話者の識別によつて該当
話者の音声パターンを対応する音声認識装置の音
声パターン記憶手段へ格納することにより、認識
精度に優れた音声認識装置を提供することができ
る。
話者が自由に使用でき、話者の識別によつて該当
話者の音声パターンを対応する音声認識装置の音
声パターン記憶手段へ格納することにより、認識
精度に優れた音声認識装置を提供することができ
る。
第1図は本発明の一実施例を示す音声情報入力
装置の構成を示すシステム構成図、第2図は第1
図に示した音声情報入力装置に使用する音声単語
の1例と、その記憶内容を示す図、第3図は話者
交代と作業の1例を示す音声情報入力の手順図、
第4図は本発明の他の一実施例を示す他の音声情
報入力装置の構成を示すシステム構成図である。 1A,1B……音声認識手段、2A,2B……
音声出力装置、3……制御手段、4……キーボー
ド、5……表示器またはプリンタ、6A,6B…
…マイク、7A,7B……スピーカ、8……補助
記憶手段、10A,10B……音声入出力装置、
20A,20B……無線機固定局、30A,30
B……無線機移動局、14A,14B……音声パ
ターンメモリ。
装置の構成を示すシステム構成図、第2図は第1
図に示した音声情報入力装置に使用する音声単語
の1例と、その記憶内容を示す図、第3図は話者
交代と作業の1例を示す音声情報入力の手順図、
第4図は本発明の他の一実施例を示す他の音声情
報入力装置の構成を示すシステム構成図である。 1A,1B……音声認識手段、2A,2B……
音声出力装置、3……制御手段、4……キーボー
ド、5……表示器またはプリンタ、6A,6B…
…マイク、7A,7B……スピーカ、8……補助
記憶手段、10A,10B……音声入出力装置、
20A,20B……無線機固定局、30A,30
B……無線機移動局、14A,14B……音声パ
ターンメモリ。
Claims (1)
- 【特許請求の範囲】 1 マイクと、音声パターンを記憶する音声パタ
ーン記憶手段と、この音声パターン記憶手段に記
憶された音声パターンと前記マイクからの音声入
力とを照合して音声を認識する音声認識手段とを
有する音声認識部と、話者毎の前記音声パターン
を記憶する補助記憶手段とを備えた音声認識装置
において、前記音声認識部を複数設け、前記補助
記憶手段をこの複数の音声認識部に対し共通と
し、この補助記憶手段に記憶される音声パターン
を話者識別用音声パターン及び作業用音声パター
ンとすると共に、この補助記憶手段に記憶された
前記話者識別用音声パターンを前記音声パターン
記憶手段に格納する手段と、この格納された話者
識別用音声パターンと前記マイクからの音声入力
とを照合し話者を識別する話者識別手段と、この
識別によつて特定された話者の作業用音声パター
ンを前記補助記憶手段から前記音声パターン記憶
手段に書き込む手段とを備えた音声認識装置。 2 特許請求の範囲第1項において、前記補助記
憶手段はフロツピデイスクである音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59251902A JPS61130999A (ja) | 1984-11-30 | 1984-11-30 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59251902A JPS61130999A (ja) | 1984-11-30 | 1984-11-30 | 音声認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS61130999A JPS61130999A (ja) | 1986-06-18 |
| JPH0438358B2 true JPH0438358B2 (ja) | 1992-06-24 |
Family
ID=17229652
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59251902A Granted JPS61130999A (ja) | 1984-11-30 | 1984-11-30 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS61130999A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11506845A (ja) * | 1995-09-11 | 1999-06-15 | ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト | 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置 |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| ATE328345T1 (de) * | 2000-09-19 | 2006-06-15 | Thomson Licensing | Sprachsteuerung von elektronischen geräten |
| JP2003099068A (ja) * | 2001-09-25 | 2003-04-04 | Maps:Kk | メガフォン、その製造方法及び発音装置 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS56119199A (en) * | 1980-02-26 | 1981-09-18 | Sanyo Electric Co | Voice identifying device |
| JPS57104193A (en) * | 1980-12-19 | 1982-06-29 | Matsushita Electric Industrial Co Ltd | Voice recognizer |
| JPS57139798A (en) * | 1981-02-24 | 1982-08-28 | Tokyo Shibaura Electric Co | Equipment operator by voice |
-
1984
- 1984-11-30 JP JP59251902A patent/JPS61130999A/ja active Granted
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11506845A (ja) * | 1995-09-11 | 1999-06-15 | ダイムラー−ベンツ エーロスペイス アクチエンゲゼルシャフト | 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPS61130999A (ja) | 1986-06-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5802251A (en) | Method and system for reducing perplexity in speech recognition via caller identification | |
| US5524169A (en) | Method and system for location-specific speech recognition | |
| JP3968133B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
| EP1348212B1 (en) | Mobile terminal controllable by spoken utterances | |
| US20030130852A1 (en) | Headset with radio communication function for speech processing system using speech recognition | |
| JPH0438358B2 (ja) | ||
| US7146317B2 (en) | Speech recognition device with reference transformation means | |
| JP2003029776A (ja) | 音声認識装置 | |
| JPH0225517B2 (ja) | ||
| JPS61138999A (ja) | 音声認識装置 | |
| JPH09179578A (ja) | 単音節認識装置 | |
| JPH10510081A (ja) | 装置及び機器の音声制御用装置 | |
| JPS626562A (ja) | 留守番電話装置 | |
| JPH07175495A (ja) | 音声認識方式 | |
| JP2007286376A (ja) | 音声案内システム | |
| JPS59201141A (ja) | 音声情報入力装置 | |
| JPH0619493A (ja) | 特定話者方式音声認識装置 | |
| JPS60241096A (ja) | 音声情報入出力装置 | |
| JP2000206985A (ja) | 音声認識装置 | |
| JPS61165796A (ja) | 音声認識装置 | |
| JPH04355555A (ja) | 音声伝送方法 | |
| JPS6032098A (ja) | 音声情報入力装置 | |
| JPH0567240B2 (ja) | ||
| JPS6175430A (ja) | 情報入力装置 | |
| JPS61250778A (ja) | 電子翻訳装置 |