JPH0451299A - 音声認識制御装置 - Google Patents
音声認識制御装置Info
- Publication number
- JPH0451299A JPH0451299A JP2159793A JP15979390A JPH0451299A JP H0451299 A JPH0451299 A JP H0451299A JP 2159793 A JP2159793 A JP 2159793A JP 15979390 A JP15979390 A JP 15979390A JP H0451299 A JPH0451299 A JP H0451299A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- user
- word
- audio
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Air Conditioning Control Device (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、利用者の操作に基づき装置の運転制御を行う
音声認識制御装置に係り、特に、利用者の発声入力に基
づいて1例えば空肩機等の装置の運転制御を行うのに好
適な音声認識制御装置に関するものである。
音声認識制御装置に係り、特に、利用者の発声入力に基
づいて1例えば空肩機等の装置の運転制御を行うのに好
適な音声認識制御装置に関するものである。
[従来の技術]
従来の音声認識制御装置は、例えば特開昭56−102
635号公報に記載された「空調機の制御装置」が知ら
れている。
635号公報に記載された「空調機の制御装置」が知ら
れている。
この従来例は、利用者があらかじめ運転命令語の音声を
発声して登録しておき、例えば空調機を操作するときは
、利用者が上記運転命令語を発声して、空調機がこれを
認識することにより行う。
発声して登録しておき、例えば空調機を操作するときは
、利用者が上記運転命令語を発声して、空調機がこれを
認識することにより行う。
つまり利用者が発声した音声と上記登録した音声とを比
較して、最も類似した音声の運転命令語を選択し、これ
に対応する動作を行う。
較して、最も類似した音声の運転命令語を選択し、これ
に対応する動作を行う。
また、利用者の手動による操作をも可能とし、音声によ
る操作と手動による操作との切り替えは、音声または手
動操作により行うことができる。
る操作と手動による操作との切り替えは、音声または手
動操作により行うことができる。
本従来例によれば、利用者は空調機の操作手段として、
音声入力または手動操作を自由に選択して用いる。こと
ができる。
音声入力または手動操作を自由に選択して用いる。こと
ができる。
[発明が解決しようとする課題]
上記従来技術は、利用者が登録した運転命令語を忘れた
り、利用者の発声の仕方が長期的に変動する場合につい
ての配慮がなされていなかった。
り、利用者の発声の仕方が長期的に変動する場合につい
ての配慮がなされていなかった。
つまり、利用者が登録した運転命令語と大きく異なる音
声を発声入力すると、空調機はどの登録音声とも類似し
ない音声として認識不能の応答をするか、他の運転命令
語と誤認識して利用者の意図しない動作をすることがあ
る。このような場合、および利用者が運転命令語を全く
忘れてしまった場合には、利用者は登録した運転命令語
の記録を見直すことになる。しかし、上記記録が残って
いない場合、あるいは同じ単語でも利用者の発声の仕方
が登録時と異なっていると思われる場合には、利用者は
あらためて運転命令語の音声を登録し直さなければなか
った。
声を発声入力すると、空調機はどの登録音声とも類似し
ない音声として認識不能の応答をするか、他の運転命令
語と誤認識して利用者の意図しない動作をすることがあ
る。このような場合、および利用者が運転命令語を全く
忘れてしまった場合には、利用者は登録した運転命令語
の記録を見直すことになる。しかし、上記記録が残って
いない場合、あるいは同じ単語でも利用者の発声の仕方
が登録時と異なっていると思われる場合には、利用者は
あらためて運転命令語の音声を登録し直さなければなか
った。
また、特定の話者が発声した運転命令語を最初から標準
音声として登録しておき、利用者毎の音声の登録は行わ
ず、上記標準音声を比較の対象として不特定の利用者が
発声する運転命令語を認識する方式とした場合には、利
用者に上記標準音声そのものを知らせることについての
配慮がなされていなかった。つまり、利用者が上記登録
されている運転命令語の音声を発声しても発声の仕方が
上記標準音声と大きく異なる場合には、その音声は正し
く認識されないおそれがある。このように利用者が発声
する運転命令語が何回も連続して正しく認識されない場
合、利用者は上記標準的音声、つまり正しく認識される
音声を知る手段が容易されていなかった。
音声として登録しておき、利用者毎の音声の登録は行わ
ず、上記標準音声を比較の対象として不特定の利用者が
発声する運転命令語を認識する方式とした場合には、利
用者に上記標準音声そのものを知らせることについての
配慮がなされていなかった。つまり、利用者が上記登録
されている運転命令語の音声を発声しても発声の仕方が
上記標準音声と大きく異なる場合には、その音声は正し
く認識されないおそれがある。このように利用者が発声
する運転命令語が何回も連続して正しく認識されない場
合、利用者は上記標準的音声、つまり正しく認識される
音声を知る手段が容易されていなかった。
さらに、上記従来技術は、利用者が任意の時点で、空調
機の動作設定状態を音声により知りたいという要望を満
たしていなかった。つまり、冷房。
機の動作設定状態を音声により知りたいという要望を満
たしていなかった。つまり、冷房。
送風等の運転状態や目標温度等の設定情報を、利用者が
要求した時点で音声により知らせる機能が備わっていな
かった。したがって、利用者はこれらの情報を知りたい
場合、空調機の本体または操作器の表示を見る必要があ
る。つまり操作を音声で行うことにより、盲人でも操作
ができ、暗がりでも操作ができるようになるが、操作に
必要な動作設定状態の情報は視覚により確認する必要が
あり、盲人の使用や暗がり等での使用には不便が生じる
という問題があった。
要求した時点で音声により知らせる機能が備わっていな
かった。したがって、利用者はこれらの情報を知りたい
場合、空調機の本体または操作器の表示を見る必要があ
る。つまり操作を音声で行うことにより、盲人でも操作
ができ、暗がりでも操作ができるようになるが、操作に
必要な動作設定状態の情報は視覚により確認する必要が
あり、盲人の使用や暗がり等での使用には不便が生じる
という問題があった。
本発明の目的は、上記従来技術の問題点を解決し、制御
すべき本体装置が認識の対象とする語句を、利用者の任
意の時点での要求により、認識の際に比較の標準とする
音声で利用者に知らせることができる音声認識制御装置
を提供することにある。
すべき本体装置が認識の対象とする語句を、利用者の任
意の時点での要求により、認識の際に比較の標準とする
音声で利用者に知らせることができる音声認識制御装置
を提供することにある。
また、本体装置の動作設定状態の情報を、利用者の任意
の時点での要求により音声で利用者に知らせることので
きる音声認識制御装置を提供することにある。
の時点での要求により音声で利用者に知らせることので
きる音声認識制御装置を提供することにある。
[課題を解決するための手段]
上記目的を達成するために1本発明に係る音声認識制御
装置のもっとも基本的な構成は、利用者の発声入力によ
る運転操作に基づき、制御すべき本体装置の運転制御を
行う音声認識制御装置において、利用者の発声する命令
語の音声を入力する音声入力手段と、その入力された音
声の特徴量を抽出し、あらかじめ登録されている命令語
の標準音声の特徴量と比較することにより、該命令語を
認識して認識結果を出力する音声認識手段と、前記認識
結果に基づいて前記本体装置の運転制御を行う制御手段
と、この制御手段からの指示信号に基づき前記標準音声
の再生を行う音声再生手段と、利用者が手動操作を行う
手動操作部と、その手動操作を表わす信号を前記制御手
段に出力する手動操作手段とを備え、利用者の特定の手
動操作により前記標準音声の再生を行うようにしたもの
である。
装置のもっとも基本的な構成は、利用者の発声入力によ
る運転操作に基づき、制御すべき本体装置の運転制御を
行う音声認識制御装置において、利用者の発声する命令
語の音声を入力する音声入力手段と、その入力された音
声の特徴量を抽出し、あらかじめ登録されている命令語
の標準音声の特徴量と比較することにより、該命令語を
認識して認識結果を出力する音声認識手段と、前記認識
結果に基づいて前記本体装置の運転制御を行う制御手段
と、この制御手段からの指示信号に基づき前記標準音声
の再生を行う音声再生手段と、利用者が手動操作を行う
手動操作部と、その手動操作を表わす信号を前記制御手
段に出力する手動操作手段とを備え、利用者の特定の手
動操作により前記標準音声の再生を行うようにしたもの
である。
より詳しく述べれば、上記目的は以下の手段により達成
できる。
できる。
音声認識制御装置の操作器に、認識対象とする語句の音
声再生、あるいは動作設定状態等の音声出力を利用者が
要求するための特定のスイッチ等を設ける。そして音声
認識制御装置の本体には上記認識対象語句の音声あるい
は上記動作設定状態等の情報を表現する音声を再生する
音声再生手段、および上記特定のスイッチ等の操作を検
知して上記音声再生手段を動作させる制御手段を設ける
。
声再生、あるいは動作設定状態等の音声出力を利用者が
要求するための特定のスイッチ等を設ける。そして音声
認識制御装置の本体には上記認識対象語句の音声あるい
は上記動作設定状態等の情報を表現する音声を再生する
音声再生手段、および上記特定のスイッチ等の操作を検
知して上記音声再生手段を動作させる制御手段を設ける
。
つまり、上記音声再生手段は、上記認識対象語句や上記
情報等を表現する音声の音声データを記録保持する記録
手段、外部からの制御信号に基づき上記音声データを選
択する選択手段、および該選択された音声データを音声
信号に復号化して出力する復号化手段からなる。
情報等を表現する音声の音声データを記録保持する記録
手段、外部からの制御信号に基づき上記音声データを選
択する選択手段、および該選択された音声データを音声
信号に復号化して出力する復号化手段からなる。
なお、上記認識対象語句の音声は、認識の際に利用者の
発声する入力音声と比較する標準音声としてあらかじめ
登録しである音声とする。
発声する入力音声と比較する標準音声としてあらかじめ
登録しである音声とする。
また、上記制御手段は、現時点の上記動作設定状態等を
常に保持し、上記スイッチ等の操作を検知すると上記保
持している動作設定状態等に基づき、これを表現する上
記音声データを選択して再生させる制御信号を上記音声
再生手段に出力する。
常に保持し、上記スイッチ等の操作を検知すると上記保
持している動作設定状態等に基づき、これを表現する上
記音声データを選択して再生させる制御信号を上記音声
再生手段に出力する。
利用者が上記音声出力の要求をする方法は、上記特定の
スイッチ等の操作による代わりに要求を示す特定の語句
を定め、利用者が該語句を発声し音声認識制御装置がこ
れを認識して上記音声出力を行う方法としてもよい、つ
まり、音声認識制御装置が有する音声認識手段に該語句
を認識したことを示す信号を出力する機能を設け、上記
制御手段が該信号を検知することにより上記音声出力を
行う構成とすればよい。
スイッチ等の操作による代わりに要求を示す特定の語句
を定め、利用者が該語句を発声し音声認識制御装置がこ
れを認識して上記音声出力を行う方法としてもよい、つ
まり、音声認識制御装置が有する音声認識手段に該語句
を認識したことを示す信号を出力する機能を設け、上記
制御手段が該信号を検知することにより上記音声出力を
行う構成とすればよい。
[作用]
利用者が認識対象語句の音声再生を要求して特定のスイ
ッチ等の操作を行うと、制御手段がこれを検知して該認
識対象語句の音声データを選択して再生させる制御信号
を音声再生手段に出力する。
ッチ等の操作を行うと、制御手段がこれを検知して該認
識対象語句の音声データを選択して再生させる制御信号
を音声再生手段に出力する。
この音声再生手段は、前記制御信号を入力し、これに基
づき前記認識対象語句の音声データを順次選択入力し、
これを復号化して音声信号として出力する。上記音声デ
ータは認識の際に利用者の発声する入力音声との比較に
用いる標準音声のデータとする。したがって、利用者は
任意の時点で認識対象語句の音声再生を要求することが
でき、かつ認識の際に標準音声として用いている音声を
知ることができる。
づき前記認識対象語句の音声データを順次選択入力し、
これを復号化して音声信号として出力する。上記音声デ
ータは認識の際に利用者の発声する入力音声との比較に
用いる標準音声のデータとする。したがって、利用者は
任意の時点で認識対象語句の音声再生を要求することが
でき、かつ認識の際に標準音声として用いている音声を
知ることができる。
また、利用者が動作設定状態等の音声出力を要求して上
記特定のスイッチ等の操作を行うと、上記制御手段がこ
れを検知して保持している現時点の動作設定状態等に基
づき、これを表現する音声データを選択して再生させる
制御信号を上記音声再生手段に出力する。上記音声再生
手段は該制御信号を入力し、これが示す音声データを順
次選択入力し、これを復号化して音声信号として出力す
る。したがって、利用者は任意の時点で操作設定情報等
を音声により知ることができる。
記特定のスイッチ等の操作を行うと、上記制御手段がこ
れを検知して保持している現時点の動作設定状態等に基
づき、これを表現する音声データを選択して再生させる
制御信号を上記音声再生手段に出力する。上記音声再生
手段は該制御信号を入力し、これが示す音声データを順
次選択入力し、これを復号化して音声信号として出力す
る。したがって、利用者は任意の時点で操作設定情報等
を音声により知ることができる。
さらに、利用者が上記音声出力を要求する手段として特
定のスイッチ等の操作の代わりに特定の語句を発声入力
する方式では1次のように動作する。すなわち、上記音
声認識手段は、通常、音声認識の動作中以外には利用者
の発声入力を待機している。利用者が上記特定の語句を
発声すると該音声!!識手段は該発声を入力して音声認
識の動作を行い、上記特定の語句を認識するとこれを示
す信号を出力する。上記制御手段は該信号を検知すると
上記特定のスイッチ等の操作を検知した場合と全く同様
の動作を行い、上記音声再生手段に所定の音声の出力を
行わせる。したがって、利用者は任意の時点で特定の語
句を発声することにより、認識対象の語句や、その時点
での動作設定状態の情報等を音声により知ることができ
る。なお、上記音声認識手段が利用者の発声入力を待機
していない期間、つまり音声認識の動作を行なっている
期間は、利用者が運転命令語等の語句を発声入力中か、
その直後の期間である。よってこの期間には、利用者は
認識対象の語句や動作設定状態等の音声出力を要求する
ことはなく、利用者が要求しうる任意の時点で上記音声
出力を行うことができる。
定のスイッチ等の操作の代わりに特定の語句を発声入力
する方式では1次のように動作する。すなわち、上記音
声認識手段は、通常、音声認識の動作中以外には利用者
の発声入力を待機している。利用者が上記特定の語句を
発声すると該音声!!識手段は該発声を入力して音声認
識の動作を行い、上記特定の語句を認識するとこれを示
す信号を出力する。上記制御手段は該信号を検知すると
上記特定のスイッチ等の操作を検知した場合と全く同様
の動作を行い、上記音声再生手段に所定の音声の出力を
行わせる。したがって、利用者は任意の時点で特定の語
句を発声することにより、認識対象の語句や、その時点
での動作設定状態の情報等を音声により知ることができ
る。なお、上記音声認識手段が利用者の発声入力を待機
していない期間、つまり音声認識の動作を行なっている
期間は、利用者が運転命令語等の語句を発声入力中か、
その直後の期間である。よってこの期間には、利用者は
認識対象の語句や動作設定状態等の音声出力を要求する
ことはなく、利用者が要求しうる任意の時点で上記音声
出力を行うことができる。
[実施例]
以下5本発明の各実施例を第1図ないし第16図を参照
して説明する。
して説明する。
まず、本発明による音声認識制御装置の一実施例として
、音声認識形空調機の制御装置の構成を第1図ないし第
5図を参照して説明する。
、音声認識形空調機の制御装置の構成を第1図ないし第
5図を参照して説明する。
第1図は、本発明の一実施例に係る音声認識形空調機の
制御系のブロック図、第2図は、第1図の空調機の外観
の一例を示す略示構成図、第3図は、第1図の音声認識
部の一構成例を示すブロック図、第4rMは、制御部の
一構成例を示すブロック図、第5図は、音声合成器の一
構成例を示すブロック図である。
制御系のブロック図、第2図は、第1図の空調機の外観
の一例を示す略示構成図、第3図は、第1図の音声認識
部の一構成例を示すブロック図、第4rMは、制御部の
一構成例を示すブロック図、第5図は、音声合成器の一
構成例を示すブロック図である。
第1図において、マイクロホン1は、利用者が空調器を
操作するために運転命令語を発声入力するものである0
発声入力された音声信号は増幅器2を介して音声認識部
3に入力される。音声認識部3は、アナログ音声信号を
入力し、その音声信号とあらかじめ登録されている語句
の標準音声との特徴量どうしを比較して、その音声信号
がどの語句のものであるかを認識して該語句の番号等を
制御部4に出力するものである。これは、市販の音声認
識LSI、あるいは汎用1チツプ型マイクロプロセツサ
等を用いて構成することができる。
操作するために運転命令語を発声入力するものである0
発声入力された音声信号は増幅器2を介して音声認識部
3に入力される。音声認識部3は、アナログ音声信号を
入力し、その音声信号とあらかじめ登録されている語句
の標準音声との特徴量どうしを比較して、その音声信号
がどの語句のものであるかを認識して該語句の番号等を
制御部4に出力するものである。これは、市販の音声認
識LSI、あるいは汎用1チツプ型マイクロプロセツサ
等を用いて構成することができる。
手動操作キー群14は、利用者が手動により空調機の操
作を行うためのキースイッチ等である。
作を行うためのキースイッチ等である。
これらの操作で生じる信号は第2のエンコーダ15を介
して制御部4に入力される。
して制御部4に入力される。
ヘルプキー5は、利用者が認識対象単語の標準音声の再
生や、設定温度等の空調機の動作状態等の情報の音声出
力を要求するために操作するキースイッチ等である。こ
の操作で生じうる信号は第1のエンコーダ6を介して制
御部4に入力される。
生や、設定温度等の空調機の動作状態等の情報の音声出
力を要求するために操作するキースイッチ等である。こ
の操作で生じうる信号は第1のエンコーダ6を介して制
御部4に入力される。
音声合成器7は、制御部4から語句の番号等を入力し、
あらかじめ内部のメモリに記録されている該番号に対応
する音声の符号化データを順次復号化し、アナログ音声
信号として出力するものである。これは市販の音声合成
LSI等を用いて構成することができる。上記音声信号
は増幅器8で増幅され、スピーカ9から音声として出力
される。
あらかじめ内部のメモリに記録されている該番号に対応
する音声の符号化データを順次復号化し、アナログ音声
信号として出力するものである。これは市販の音声合成
LSI等を用いて構成することができる。上記音声信号
は増幅器8で増幅され、スピーカ9から音声として出力
される。
制御部4は、利用者の発声入力やキー操作を表わす信号
、および温度、湿度等の情報を入力し。
、および温度、湿度等の情報を入力し。
これらに基づいて空調機の制御を行うものである。
これは、市販の汎用マイクロプロセッサ等を用いて構成
することができる。センサ11は、室内。
することができる。センサ11は、室内。
外の温度、湿度等を検知して電気信号に変換するもので
あり、その電気信号は第3のエンコーダIQを介して制
御部4に入力される6 空調機駆動回路12は、制御部4からの制御信号に基づ
き、空調機機構部13を駆動する電気信号を発声するも
のである。空調機機構部13は、空気圧縮機や送風ファ
ンなど、空調の動作を行う駆動部分である。
あり、その電気信号は第3のエンコーダIQを介して制
御部4に入力される6 空調機駆動回路12は、制御部4からの制御信号に基づ
き、空調機機構部13を駆動する電気信号を発声するも
のである。空調機機構部13は、空気圧縮機や送風ファ
ンなど、空調の動作を行う駆動部分である。
操作器16は、利用者が発声または手動により空調機の
操作を行う部分であり、空調機のリモートコントローラ
等である。この操作器16は、マイクロホン1.増幅器
2、ヘルプキー5、第1のエンコーダ6、手動操作キー
群14.第2のエンコーダ15により構成され、空調機
本体17と結線18により結合されている。
操作を行う部分であり、空調機のリモートコントローラ
等である。この操作器16は、マイクロホン1.増幅器
2、ヘルプキー5、第1のエンコーダ6、手動操作キー
群14.第2のエンコーダ15により構成され、空調機
本体17と結線18により結合されている。
第1図に示す音声認識形空調機の外観の一例を第2図に
示す。
示す。
次に、音声認識部3の一構成例を第3図に示して説明す
る。
る。
演算部31は、第2のメモリ33にあらかじめ記録され
たプログラムに従い、ディジタル信号を入力してこれに
演算を施し、結果をディジタル信号で出力するものであ
る。第1のメモリ32は。
たプログラムに従い、ディジタル信号を入力してこれに
演算を施し、結果をディジタル信号で出力するものであ
る。第1のメモリ32は。
演算部31が演算中に一時的にデータを記録する書き変
え可能なメモリであり、汎用RAM (ランダムアクセ
スメモリ)等である。第2のメモリ33は、プログラム
やデータを半永久的に記録する読み出し専用メモリであ
り、汎用FROM (プログラマプルリードオンリーメ
モリ)等である。これには、演算部31が音声認識のた
めの演算を行うプログラムや音声認識の際に参照する、
語句の標準音声の特徴量のデータ等を記録する。入出力
部34は、演算部31が外部との間で信号を入出力する
際に介するインタフェース回路であり、A/D (アナ
ログ−ディジタル)変換器、 D/A (ディジタル−
アナログ)変換器を含む。A/D端子35は入出力部3
4内のA/D変換器にアナログ信号を入力する端子であ
り、利用者の発声する音声信号を入力する。D/A端子
36は入出力部34内のD/A変換器からのアナログ信
号を出力する端子である。このアナログ信号は音声合成
器7と共用の増幅器8、スピーカ9により音声として出
力される0通信端子37は外部との間でディジタル信号
の入出力を行う端子であり、ここでは制御部4との間で
信号の入出力を行う。
え可能なメモリであり、汎用RAM (ランダムアクセ
スメモリ)等である。第2のメモリ33は、プログラム
やデータを半永久的に記録する読み出し専用メモリであ
り、汎用FROM (プログラマプルリードオンリーメ
モリ)等である。これには、演算部31が音声認識のた
めの演算を行うプログラムや音声認識の際に参照する、
語句の標準音声の特徴量のデータ等を記録する。入出力
部34は、演算部31が外部との間で信号を入出力する
際に介するインタフェース回路であり、A/D (アナ
ログ−ディジタル)変換器、 D/A (ディジタル−
アナログ)変換器を含む。A/D端子35は入出力部3
4内のA/D変換器にアナログ信号を入力する端子であ
り、利用者の発声する音声信号を入力する。D/A端子
36は入出力部34内のD/A変換器からのアナログ信
号を出力する端子である。このアナログ信号は音声合成
器7と共用の増幅器8、スピーカ9により音声として出
力される0通信端子37は外部との間でディジタル信号
の入出力を行う端子であり、ここでは制御部4との間で
信号の入出力を行う。
次に制御部4の一構成例を第4図に示して説明する。
演算部41は、第2のメモリ43にあらかじめ記録され
たプログラムに従い、ディジタル信号を入力してこれに
演算を施し、結果をディジタル信号で出力するものであ
る。第1のメモリ42は、演算部41が演算中に一時的
にデータを記録する書き変え可能なメモリであり、汎−
用RAM等である。第2のメモリ43はプログラムやデ
ータを半永久的に記録する読み出し専用メモリであり、
汎用FROM等である。
たプログラムに従い、ディジタル信号を入力してこれに
演算を施し、結果をディジタル信号で出力するものであ
る。第1のメモリ42は、演算部41が演算中に一時的
にデータを記録する書き変え可能なメモリであり、汎−
用RAM等である。第2のメモリ43はプログラムやデ
ータを半永久的に記録する読み出し専用メモリであり、
汎用FROM等である。
入出力部44は、演算部41が外部との間で信号を入出
力する際に介するインタフェース回路である。ここでは
第1のエンコーダ6、第2のエンコーダ15、第3のエ
ンコーダ10からの信号を入力し、音声合成器7、空調
機駆動回路12に信号を出力する。また、音声認識部3
との間で信号の入出力を行う。
力する際に介するインタフェース回路である。ここでは
第1のエンコーダ6、第2のエンコーダ15、第3のエ
ンコーダ10からの信号を入力し、音声合成器7、空調
機駆動回路12に信号を出力する。また、音声認識部3
との間で信号の入出力を行う。
通信端子45は、音声認識部3.音声合成器7との間で
信号の入出力を行う端子である。ここでは音声、単語の
番号等を出力し、認識結果の単語の番号等を入力する0
割込端子46は外部から割込信号を入力する端子であり
、その割り込み信号の入力により演算部41が割込演算
処理を行う。
信号の入出力を行う端子である。ここでは音声、単語の
番号等を出力し、認識結果の単語の番号等を入力する0
割込端子46は外部から割込信号を入力する端子であり
、その割り込み信号の入力により演算部41が割込演算
処理を行う。
次に、音声合成器7の一構成例を第5図に示して説明す
る。
る。
メモリ52は、データを半永久的に記録する読み出し専
用メモリであり、汎用FROM等である。
用メモリであり、汎用FROM等である。
メモリ52には語句の音声の符号化データがあらかじめ
記録されている。演算部51は音声出力する語句の番号
を外部から入力し、メモリ52上の該番号に対応する符
号化データを選択して順次読み出して、リアルタイムで
復号化する演算を行う。
記録されている。演算部51は音声出力する語句の番号
を外部から入力し、メモリ52上の該番号に対応する符
号化データを選択して順次読み出して、リアルタイムで
復号化する演算を行う。
その復号化した音声信号はD/A変換器54を介してア
ナログ音声信号として出力される。
ナログ音声信号として出力される。
次に、上記構成の音声認識形空調機の制御動作について
、利用者の操作とこれに対応する各部の動作を第6図な
いし第16図を参照して説明する。
、利用者の操作とこれに対応する各部の動作を第6図な
いし第16図を参照して説明する。
第6図は、空調機の運転開始から停止までの制御部4の
動作を示すフローチャート、第7図は、音声認識部3の
音声認識動作を示すフローチャート、第8図は、ヘルプ
キー5の操作による制御部4の割込処理を示すフローチ
ャート、第9図は、音声認識部3の標準音声再生の動作
を示すフローチャート、第10図は、発声によるヘルプ
要求の場合の音声認識部3の動作を示すフローチャート
、第11図は、音声出力の項目分類図、第12図は、音
声出力の順序の一例を示す説明図、第13図は。
動作を示すフローチャート、第7図は、音声認識部3の
音声認識動作を示すフローチャート、第8図は、ヘルプ
キー5の操作による制御部4の割込処理を示すフローチ
ャート、第9図は、音声認識部3の標準音声再生の動作
を示すフローチャート、第10図は、発声によるヘルプ
要求の場合の音声認識部3の動作を示すフローチャート
、第11図は、音声出力の項目分類図、第12図は、音
声出力の順序の一例を示す説明図、第13図は。
次のヘルプ要求までに時間制限を設ける動作のフローチ
ャート、第14図は、−室以上のりジェクト回数で認識
対象単語を自動再生する動作のフローチャート、第15
図は、一定時間内に次の発声入力がない場合のみガイダ
ンス音声を出力する動作のフローチャート、第16図は
、認識対象単語の音声再生中の発声入力により操作を行
うフローチャートである。
ャート、第14図は、−室以上のりジェクト回数で認識
対象単語を自動再生する動作のフローチャート、第15
図は、一定時間内に次の発声入力がない場合のみガイダ
ンス音声を出力する動作のフローチャート、第16図は
、認識対象単語の音声再生中の発声入力により操作を行
うフローチャートである。
まず、空調機の運転開始から停止までの間の利用者の操
作とこれに対応する制御部4の動作を第6図のフローチ
ャートを参照しながら説明する。
作とこれに対応する制御部4の動作を第6図のフローチ
ャートを参照しながら説明する。
空調機の電源が投入されると、制御部4は空調機の運転
を指示する単語、例えば「冷房」、「暖房」、「送風」
、「除湿」の単語番号を音声認識部3に送信する。音声
認識部3は、これらを認識対象単語の番号として受信し
、以後利用者の発声入力があれば、その発声が上記認識
対象単語のいずれの音声であるかの認識を行う(以上5
−1)。
を指示する単語、例えば「冷房」、「暖房」、「送風」
、「除湿」の単語番号を音声認識部3に送信する。音声
認識部3は、これらを認識対象単語の番号として受信し
、以後利用者の発声入力があれば、その発声が上記認識
対象単語のいずれの音声であるかの認識を行う(以上5
−1)。
利用者が、例えば「冷房」と発声すると音声認識部3は
上記認識の動作を行い、認識結果を認識単語番号として
受信する。つまり、正しく認識すれば「冷房」の単語番
号0を送信する。もし上記発声音声がいずれの認識対象
単語のものとも認識できない場合、音声認識部3は認識
不能を示すリジェクトコードを送信する。制御部4は上
記認識単語番号またはりジエクトコードを受信すると(
以上5−2)、リジェクトコードの場合は(s −3)
「もう−度お願いします6」等の利用者に再発声を促す
リジェクトメツセージの音声を出力する。つまり該リジ
ェクトメツセージの語句の番号を音声合成器7に送信し
、音声合成器7はこれを受信すると上記語句の音声を出
力する。そして再び利用者の発声を待機する(以上5−
4) 、認識単語番号の場合は(s−3)、制御部4は
空調機の運転、この例では冷房運転を開始し、「24度
、弱風で冷房します、」等のその時点での設定温度。
上記認識の動作を行い、認識結果を認識単語番号として
受信する。つまり、正しく認識すれば「冷房」の単語番
号0を送信する。もし上記発声音声がいずれの認識対象
単語のものとも認識できない場合、音声認識部3は認識
不能を示すリジェクトコードを送信する。制御部4は上
記認識単語番号またはりジエクトコードを受信すると(
以上5−2)、リジェクトコードの場合は(s −3)
「もう−度お願いします6」等の利用者に再発声を促す
リジェクトメツセージの音声を出力する。つまり該リジ
ェクトメツセージの語句の番号を音声合成器7に送信し
、音声合成器7はこれを受信すると上記語句の音声を出
力する。そして再び利用者の発声を待機する(以上5−
4) 、認識単語番号の場合は(s−3)、制御部4は
空調機の運転、この例では冷房運転を開始し、「24度
、弱風で冷房します、」等のその時点での設定温度。
風量など、空調機の動作設定状態を利用者に知らせるメ
ツセージを音声出力する(以上5−5) 。
ツセージを音声出力する(以上5−5) 。
そして動作設定状態の変更項目を指定する単語、例えば
「止まれ」、「温度」、「風」の単語番号を音声認識部
3に送信する(s−6) 、利用者が、例えば設定温度
を変更するために「温度」と発声すると、音声認識部3
は該発声を正しく認識すれば「温度」の単語番号5を送
信する。制御部4は上記認識単語番号またはりジェクト
コードを受信すると(以上5−7)、リジェクトコード
の場合は(s−8)、上記リジェクトメツセージの音声
を出力し、再び利用者の発声を待機する(s−9) 。
「止まれ」、「温度」、「風」の単語番号を音声認識部
3に送信する(s−6) 、利用者が、例えば設定温度
を変更するために「温度」と発声すると、音声認識部3
は該発声を正しく認識すれば「温度」の単語番号5を送
信する。制御部4は上記認識単語番号またはりジェクト
コードを受信すると(以上5−7)、リジェクトコード
の場合は(s−8)、上記リジェクトメツセージの音声
を出力し、再び利用者の発声を待機する(s−9) 。
認識単語番号の場合で(s−8)、これが「止まれ」の
場合には(s−10)、制御部は「停止します、」等の
メツセージを音声出力して(S−11)、空調機を停止
する(s−12)、r止まれ」以外の場合には、制御部
4は「温度を高くしますか、低くしますか、」等の、利
用者に設定変更の指示を促すガイダンス音声を出力する
(s−13)。
場合には(s−10)、制御部は「停止します、」等の
メツセージを音声出力して(S−11)、空調機を停止
する(s−12)、r止まれ」以外の場合には、制御部
4は「温度を高くしますか、低くしますか、」等の、利
用者に設定変更の指示を促すガイダンス音声を出力する
(s−13)。
そして設定変更を指示する単語、例えば「高く」、「低
く」の単語番号を音声認識部3に受信する(s−14)
、利用者が、例えば設定温度を低くするために「低く」
と発声すると、音声認識部3は該発声を正しく認識すれ
ば、「低く」の単語番号8を送信する。制御部4は上記
認識単語番号またはりジェクトコードを受信すると(以
上5−15)、リジェクトコードの場合は(s−16)
、上記リジェクトメツセージの音声を出力し、再び利用
者の発声を待機する(s−17)−1!識単語番号の場
合は(s−15)、制御部4は「23度、弱風で冷房し
ます、」等の、設定変更後の動作設定状態を利用者に知
らせるメツセージを音声出力する(以上5−18)、そ
して空調機の動作設定状態を変更する。この例では設定
温度を1度低くする(s−19)。
く」の単語番号を音声認識部3に受信する(s−14)
、利用者が、例えば設定温度を低くするために「低く」
と発声すると、音声認識部3は該発声を正しく認識すれ
ば、「低く」の単語番号8を送信する。制御部4は上記
認識単語番号またはりジェクトコードを受信すると(以
上5−15)、リジェクトコードの場合は(s−16)
、上記リジェクトメツセージの音声を出力し、再び利用
者の発声を待機する(s−17)−1!識単語番号の場
合は(s−15)、制御部4は「23度、弱風で冷房し
ます、」等の、設定変更後の動作設定状態を利用者に知
らせるメツセージを音声出力する(以上5−18)、そ
して空調機の動作設定状態を変更する。この例では設定
温度を1度低くする(s−19)。
なお、上記でガイダンス音声出力(s−13)またはり
ジェクトメッセージ音声出力(s −17)の後、利用
者が発声を行うまでの時間・に制限を設け、その制限時
間内利用者が発声を行わなかった場合には前の段階の発
声の認識結果(s−7)。
ジェクトメッセージ音声出力(s −17)の後、利用
者が発声を行うまでの時間・に制限を設け、その制限時
間内利用者が発声を行わなかった場合には前の段階の発
声の認識結果(s−7)。
つまり「温度」等も無効として再度、その発声を待機す
る段階(s−7)に戻る方式とすることもできる。
る段階(s−7)に戻る方式とすることもできる。
次に音声認識部3の音声認識動作、つまり発声入力され
た音声の単語を認識する動作を第7図のフローチャート
を参照しながら説明する。
た音声の単語を認識する動作を第7図のフローチャート
を参照しながら説明する。
音声認識部3は利用者の発声入力を待機している。音量
の変化等により発声入力の開始を検出すると(t−1)
、音声認識部3は音量の変化等をもとに発声入力の終了
を検出し、発声の開始から終了までの区間を単語音声と
して切り出す、同時に上記区間の単語音声の特徴量をリ
アルタイムで抽出し、これを第1のメモリ32上に記録
保持する(以上t−2)、次に、音声認識部3は、入力
音声つまり上記切り出した単語音声と、全認識対象単語
の標準音声との間で特徴量の比較演算を行う、つまり特
徴量どうしの相違度を計算する。上記認識対象単語は制
御部4から受信した単語番号に対応するものであり、1
同車語番号の組を受信する毎に認識対象単語をすべてこ
れらに対応するものに更新する(以上t−S)、そして
相違度の最小値を選出する(t−4) 、その最小値が
あらかじめ定めた所定のしきい値を超える場合は(を−
5)、上記入力音声はいずれの認識対象単語の音声でも
ないと見なして認識不能を示すリジェクトコードを制御
部4に送信する(t−7)、上記最小値が上記しきい値
以下の場合は(t−5)、その最小値を与える標準音声
の電話番号を認識結果として制御部4に送信する(t−
6)。
の変化等により発声入力の開始を検出すると(t−1)
、音声認識部3は音量の変化等をもとに発声入力の終了
を検出し、発声の開始から終了までの区間を単語音声と
して切り出す、同時に上記区間の単語音声の特徴量をリ
アルタイムで抽出し、これを第1のメモリ32上に記録
保持する(以上t−2)、次に、音声認識部3は、入力
音声つまり上記切り出した単語音声と、全認識対象単語
の標準音声との間で特徴量の比較演算を行う、つまり特
徴量どうしの相違度を計算する。上記認識対象単語は制
御部4から受信した単語番号に対応するものであり、1
同車語番号の組を受信する毎に認識対象単語をすべてこ
れらに対応するものに更新する(以上t−S)、そして
相違度の最小値を選出する(t−4) 、その最小値が
あらかじめ定めた所定のしきい値を超える場合は(を−
5)、上記入力音声はいずれの認識対象単語の音声でも
ないと見なして認識不能を示すリジェクトコードを制御
部4に送信する(t−7)、上記最小値が上記しきい値
以下の場合は(t−5)、その最小値を与える標準音声
の電話番号を認識結果として制御部4に送信する(t−
6)。
次に、利用者が認識対象単語や動作設定状態等を知りた
くて、これらの音声再生、音声出力を要求してヘルプキ
ー5を操作した場合の制御部4の動作を、第8図のフロ
ーチャートを参照しながら説明する。
くて、これらの音声再生、音声出力を要求してヘルプキ
ー5を操作した場合の制御部4の動作を、第8図のフロ
ーチャートを参照しながら説明する。
利用者が任意の時点で上記要求ができるようにするため
、第8図に示す制御部4の動作は割込処理とする。つま
り、第6図に示す動作中に割込処理を行う、利用者がヘ
ルプキー5の操作を行うことにより、第1のエンコーダ
6を介して制御部4の割込端子46に割込信号が入力さ
れる。
、第8図に示す制御部4の動作は割込処理とする。つま
り、第6図に示す動作中に割込処理を行う、利用者がヘ
ルプキー5の操作を行うことにより、第1のエンコーダ
6を介して制御部4の割込端子46に割込信号が入力さ
れる。
制御部4は該割込信号を検出すると、音声認識部3およ
び音声合成器7に、これらが音声再生。
び音声合成器7に、これらが音声再生。
音声出力中であればこれを中止させる再生中止コマンド
を送信する。なお、音声認識部3の音声再生動作につい
ては後で説明する(以上u−1)。
を送信する。なお、音声認識部3の音声再生動作につい
ては後で説明する(以上u−1)。
そして制御部4は、認識対象単語の標準音声を再生する
場合には音声認識部3に標準音声再生コマンドを送信し
、動作設定状態等の音声出力をする場合には該動作設定
状態等を表現する語句の番号を音声合成器7に送信する
。音声認識部3は該再生コマンドを受信すると、その時
点での認識対象単語の標準音声を順次再生する。また、
設定温度、風量等の動作設定状態を「温度24度、弱風
に設定されています。」等のように音声出力する場合に
は、例えば「温度」、「24度」、「弱風」、「冷房に
」、「設定されています、」の各語句の番号を順に音声
合成器7に送信する。これにより音声合成器7は上記語
句の音声を順次出力する。
場合には音声認識部3に標準音声再生コマンドを送信し
、動作設定状態等の音声出力をする場合には該動作設定
状態等を表現する語句の番号を音声合成器7に送信する
。音声認識部3は該再生コマンドを受信すると、その時
点での認識対象単語の標準音声を順次再生する。また、
設定温度、風量等の動作設定状態を「温度24度、弱風
に設定されています。」等のように音声出力する場合に
は、例えば「温度」、「24度」、「弱風」、「冷房に
」、「設定されています、」の各語句の番号を順に音声
合成器7に送信する。これにより音声合成器7は上記語
句の音声を順次出力する。
上記のように音声出力する情報は空調機の動作設定状態
の他に、現在の気温、湿度等の環境情報、直前のメツセ
ージ、ガイダンス音声を聞き返したい場合のためのこれ
らの繰り返し出力等が考えられる(以上u−2)、そし
て、ヘルプ回数カウンタを増加する。ただし、所定数に
達した場合はリセットする。つまり、上記の認識対象単
語、動作設定状態、環境情報、直前のメツセージ、ガイ
ダンスの各項目に順序を定め、利用者が一回ヘルプキー
5を操作する毎に該順序に従って一項目づつ音声再生、
音声出力を行う、つまり、上記ヘルプ回数カウンタは該
項目のカウンタである。したがって、全項目の音声再生
、出力を終了すれば該ヘルプ回数カウンタをリセットす
る(以上u−3)。
の他に、現在の気温、湿度等の環境情報、直前のメツセ
ージ、ガイダンス音声を聞き返したい場合のためのこれ
らの繰り返し出力等が考えられる(以上u−2)、そし
て、ヘルプ回数カウンタを増加する。ただし、所定数に
達した場合はリセットする。つまり、上記の認識対象単
語、動作設定状態、環境情報、直前のメツセージ、ガイ
ダンスの各項目に順序を定め、利用者が一回ヘルプキー
5を操作する毎に該順序に従って一項目づつ音声再生、
音声出力を行う、つまり、上記ヘルプ回数カウンタは該
項目のカウンタである。したがって、全項目の音声再生
、出力を終了すれば該ヘルプ回数カウンタをリセットす
る(以上u−3)。
以上で制御部4は、利用者のヘルプキー5操作に対する
割込処理を終了する。
割込処理を終了する。
なお、−回のヘルプキー5の操作につき上記複数の項目
の音声の再生、出力を連続して行ってもよいことはもち
ろんである。
の音声の再生、出力を連続して行ってもよいことはもち
ろんである。
次に、音声認識部3の認識対象単語の標準音声の再生動
作を、第9図のフローチャートを参照しながら説明する
。
作を、第9図のフローチャートを参照しながら説明する
。
音声認識部3は、標準音声の再生コマンドを制御部4か
ら受信すると、その時点での認識対象単語の番号をもと
に、第2のメモリ33上の該番号の単語の標準音声のデ
ータが記録されているアドレスを検知する(v−1)、
そして第2のメモリ33上の該アドレスのデータを順次
読み出し、必要によりリアルタイムで復号化して(v−
2)、入出力部34のD/A変換器によりアナログ音声
信号として増幅器8に出力し、スピーカ9から音声が出
力される(v−3)、上記(v−2)、(v−3)の動
作を繰り返し1つの単語の標準音声の再生を終わると(
v−5)、次の単語の標準音声の再生を行う、全認識対
象単語の標準音声を再生し終わるまで上記(v−2)か
ら(v−5)までの動作を繰り返す(v−6)、もし標
準音声の再生中に、利用者がヘルプキー5の操作を行っ
た場合には、制御部4から再生中止コマンドが送信され
、音声認識部3はこれを受信すると上記標準音声の再生
を中止する(v−4)。
ら受信すると、その時点での認識対象単語の番号をもと
に、第2のメモリ33上の該番号の単語の標準音声のデ
ータが記録されているアドレスを検知する(v−1)、
そして第2のメモリ33上の該アドレスのデータを順次
読み出し、必要によりリアルタイムで復号化して(v−
2)、入出力部34のD/A変換器によりアナログ音声
信号として増幅器8に出力し、スピーカ9から音声が出
力される(v−3)、上記(v−2)、(v−3)の動
作を繰り返し1つの単語の標準音声の再生を終わると(
v−5)、次の単語の標準音声の再生を行う、全認識対
象単語の標準音声を再生し終わるまで上記(v−2)か
ら(v−5)までの動作を繰り返す(v−6)、もし標
準音声の再生中に、利用者がヘルプキー5の操作を行っ
た場合には、制御部4から再生中止コマンドが送信され
、音声認識部3はこれを受信すると上記標準音声の再生
を中止する(v−4)。
なお、上記標準音声の音声データは通常、その標準音声
の特徴量とは別に、At)PCM (適応差分符号化)
データ等の音声再生に適した形で第2のメモリ33上に
記録しておく、場合によっては標準音声の特徴量から再
生用の音声データを算出してもよい。
の特徴量とは別に、At)PCM (適応差分符号化)
データ等の音声再生に適した形で第2のメモリ33上に
記録しておく、場合によっては標準音声の特徴量から再
生用の音声データを算出してもよい。
以上の標準音声の再生動作は利用者の任意の要求時点で
行うため、音声認識部3の割込処理とする。
行うため、音声認識部3の割込処理とする。
次に、利用者がヘルプキー5の操作の代わりに、「ヘル
プ」等の特定の単語の発声入力によって標準音声の再生
や動作設定状態等の音声出力を要求する例における音声
認識部3の動作を、第7図。
プ」等の特定の単語の発声入力によって標準音声の再生
や動作設定状態等の音声出力を要求する例における音声
認識部3の動作を、第7図。
第10図のフローチャートを参照しながら説明する。
第10図には、第7図からの変更点のみ記す。
ここでは上記特定の単語を「ヘルプ」とする例について
説明する。
説明する。
音声認識部3は、制御部4から送信される認識対象単語
の他に、通常rヘルプ」を認識対象単語とする。利用者
がrヘルプ」と発声すると、音声認識部3は該発声を入
力して、音声認識の動作を行う(第7図t−1からt−
5まで)、その発声音声と「ヘルプ」の標準音声との相
違度が最小であり、つまり該発声音声の認識結果が「ヘ
ルプ」であれば(t−8)、音声認識部3は制御部4の
割込端子46に割り込み信号を送信する。これにより制
御部4は第8図に示す、ヘルプボタン5の操作が行われ
たのと同じ動作を行う(t−9)。
の他に、通常rヘルプ」を認識対象単語とする。利用者
がrヘルプ」と発声すると、音声認識部3は該発声を入
力して、音声認識の動作を行う(第7図t−1からt−
5まで)、その発声音声と「ヘルプ」の標準音声との相
違度が最小であり、つまり該発声音声の認識結果が「ヘ
ルプ」であれば(t−8)、音声認識部3は制御部4の
割込端子46に割り込み信号を送信する。これにより制
御部4は第8図に示す、ヘルプボタン5の操作が行われ
たのと同じ動作を行う(t−9)。
上記認識結果が「ヘルプ」以外であれば(t−8)、音
声認識部3は制御部4の通信端子45に該認識結果を示
す単語番号を送信する(t−6) 。
声認識部3は制御部4の通信端子45に該認識結果を示
す単語番号を送信する(t−6) 。
ここで、利用者が音声再生、音声出力を要求する項目の
分類の一例を第11図に示す。
分類の一例を第11図に示す。
「■認識対象単語」は利用者がその時点で発声入力でき
る単語であり、音声認識部3は利用者の発声音声と該単
語の標準音声とを比較して該発声された単語を認識する
。
る単語であり、音声認識部3は利用者の発声音声と該単
語の標準音声とを比較して該発声された単語を認識する
。
「■動作設定状態」は、その時点での空調機の設定温度
、風量、および冷房、暖房等の運転状態等の情報である
。
、風量、および冷房、暖房等の運転状態等の情報である
。
「■環境情報」は、室内外の気温、湿度等の情報である
。上記■、■は利用者が空調機の運転。
。上記■、■は利用者が空調機の運転。
停止を行ったり、運転中に温度、風量等の設定を変更す
る際の参考にする。
る際の参考にする。
「■直前メツセージ」は利用者の発声入力による操作に
応じて制御部4が出力する音声であり。
応じて制御部4が出力する音声であり。
設定変更後の動作設定状態を表現する音声や、利用者の
発声を促すガイダンス音声等である。これは利用者が聞
き漏らし等で再度間きたい場合などに要求する。
発声を促すガイダンス音声等である。これは利用者が聞
き漏らし等で再度間きたい場合などに要求する。
利用者にとってどの項目が優先的に必要な情報であるか
は、運転中、停止中等の空調機の動作状態、リジェクト
(認識不能)後、ガイダンス音声出力後など利用者が次
に行うべき操作(発声入力)により異なる。そこで、空
調機の動作状態や利用者が行うべき操作に応じて各項目
の音声再生、音声出力の順序を適切に設定する。その−
例を第12図に示して説明する。
は、運転中、停止中等の空調機の動作状態、リジェクト
(認識不能)後、ガイダンス音声出力後など利用者が次
に行うべき操作(発声入力)により異なる。そこで、空
調機の動作状態や利用者が行うべき操作に応じて各項目
の音声再生、音声出力の順序を適切に設定する。その−
例を第12図に示して説明する。
空調機が電源投入後で停止中のときは、利用者が空調機
の運転を開始するために必要な情報は必要性の順に■認
識対象単語、つまり「冷房」等の運転を指示する単語、
■環境情報、つまり現在の気温等である。■動作設定状
態は「停止中です、」等の表現になる。よって音声再生
、音声出力の順序は■、■、■の順とする。したがって
、例えば利用者がヘルプキー5を操作すると制御部4は
最初に■認識対象単語の音声再生を行い、その後−定時
間内に再びヘルプキー5の操作が行われると。
の運転を開始するために必要な情報は必要性の順に■認
識対象単語、つまり「冷房」等の運転を指示する単語、
■環境情報、つまり現在の気温等である。■動作設定状
態は「停止中です、」等の表現になる。よって音声再生
、音声出力の順序は■、■、■の順とする。したがって
、例えば利用者がヘルプキー5を操作すると制御部4は
最初に■認識対象単語の音声再生を行い、その後−定時
間内に再びヘルプキー5の操作が行われると。
制御部4は■環境情報の音声出力を行う、その−定時間
内にヘルプキー5の操作が行われず、その後再び該操作
が行われた場合には、制御部4は改めて■の音声再生か
ら始める。
内にヘルプキー5の操作が行われず、その後再び該操作
が行われた場合には、制御部4は改めて■の音声再生か
ら始める。
利用者が「冷房」等の運転を指示する単語を発声入力し
、これが正しく認識されれば、制御部4は空調機の運転
を開始する。その発声がリジェクト(認識不能)となっ
た場合には利用者が誤った単語を発声しているか1発声
の仕方が標準音声と大きく異なっている場合もあり、必
要な情報は認識対象単語の標準音声であるので、音声再
生の項目は■認識対象単語のみとする。なお、リジェク
トとなってから利用者が発声入力をし直すまでに制限時
間を設けている場合には該時間内のみ上記■のみの再生
とする。以後のりジエクトの場合についてはすべて上記
と同様する。
、これが正しく認識されれば、制御部4は空調機の運転
を開始する。その発声がリジェクト(認識不能)となっ
た場合には利用者が誤った単語を発声しているか1発声
の仕方が標準音声と大きく異なっている場合もあり、必
要な情報は認識対象単語の標準音声であるので、音声再
生の項目は■認識対象単語のみとする。なお、リジェク
トとなってから利用者が発声入力をし直すまでに制限時
間を設けている場合には該時間内のみ上記■のみの再生
とする。以後のりジエクトの場合についてはすべて上記
と同様する。
空調機の運転開始時には、その時点での設定温度、風量
等を知らせるメツセージが出力される。
等を知らせるメツセージが出力される。
よって運転開始直後は利用者が該メツセージを聞き返し
たい場合があり、また、一定時間内は空調機の設定温度
、風量等の動作設定状態の変更が不可であり、利用者が
動作設定状態を変更する発声入力を行っても無効となる
。よって、該一定時間内は音声出力の項目は■直前のメ
ツセージ、つまり動作設定状態を知らせるメツセージの
みとする。
たい場合があり、また、一定時間内は空調機の設定温度
、風量等の動作設定状態の変更が不可であり、利用者が
動作設定状態を変更する発声入力を行っても無効となる
。よって、該一定時間内は音声出力の項目は■直前のメ
ツセージ、つまり動作設定状態を知らせるメツセージの
みとする。
上記一定時間が経過し空調機の動作設定状態の変更が可
となった後は、利用者が該変更を行うのに必要な情報は
必要性の順に■認識対象単語、■動作設定状態、■環境
情報であり、音声再生、音声出力の順序も上記のように
する。
となった後は、利用者が該変更を行うのに必要な情報は
必要性の順に■認識対象単語、■動作設定状態、■環境
情報であり、音声再生、音声出力の順序も上記のように
する。
利用者が「温度」等の動作設定状態の変更項目の単語を
発声しこれが正しく認識されれば、「温度を高くします
か、低くしますか、」等の変更の指示を促すガイダンス
音声が出力される。この時点で利用者が最も必要な情報
は、現在の設定温度等の動作設定状態であるので、音声
再生、音声出力の順序は■動作設定状態、■認識対象単
語、■環境情報の順とする。
発声しこれが正しく認識されれば、「温度を高くします
か、低くしますか、」等の変更の指示を促すガイダンス
音声が出力される。この時点で利用者が最も必要な情報
は、現在の設定温度等の動作設定状態であるので、音声
再生、音声出力の順序は■動作設定状態、■認識対象単
語、■環境情報の順とする。
利用者が「低く」等の変更の指示の発声入力を行いこれ
が正しく!!識されると、空調機の動作設定状態が変更
され、変更後の動作設定状態を知らせるメツセージが出
力される。この時点では運転開始直後と全く同様、動作
設定状態の変更が不可の期間中は音声出力の項目は■直
前のメツセージのみとし、該期間の経過後は■認識対象
単語、■動作設定状態、■環境情報の順とする。
が正しく!!識されると、空調機の動作設定状態が変更
され、変更後の動作設定状態を知らせるメツセージが出
力される。この時点では運転開始直後と全く同様、動作
設定状態の変更が不可の期間中は音声出力の項目は■直
前のメツセージのみとし、該期間の経過後は■認識対象
単語、■動作設定状態、■環境情報の順とする。
利用者が空調機の停止を指示する発声を行った場合にも
上記と同様に、運転再開不可の期間中は■空調機の停止
を知らせる直前のメツセージのみとし、該期間の経過後
は停止中であるので■認識対象単語、■環境情報、■動
作設定状態の順とする。
上記と同様に、運転再開不可の期間中は■空調機の停止
を知らせる直前のメツセージのみとし、該期間の経過後
は停止中であるので■認識対象単語、■環境情報、■動
作設定状態の順とする。
次に、1回のヘルプキー5の操作から次の該操作までの
間に時間制限を設ける例における制御部4の動作を、第
13図のフローチャートを参照しながら説明する。
間に時間制限を設ける例における制御部4の動作を、第
13図のフローチャートを参照しながら説明する。
利用者が1回のヘルプキー5の操作から一定時間内に次
のヘルプキー5の操作を行った場合には、次の順序の項
目の音声再生、音声出力を行い、その一定時間の経過後
改めてヘルプキー5の操作を行った場合には最初の項目
の音声再生、音声出力から始める。
のヘルプキー5の操作を行った場合には、次の順序の項
目の音声再生、音声出力を行い、その一定時間の経過後
改めてヘルプキー5の操作を行った場合には最初の項目
の音声再生、音声出力から始める。
利用者がヘルプキー5の操作を行うと、制御部4は上記
一定時間を測定するタイマをスタートさせる(u−6)
、そして1回の音声再生、音声出力を行い(u−2)、
ヘルプ回数カウンタを増加する(u−3)。
一定時間を測定するタイマをスタートさせる(u−6)
、そして1回の音声再生、音声出力を行い(u−2)、
ヘルプ回数カウンタを増加する(u−3)。
次に、利用者がヘルプキー5の操作を行うと制御部4は
上記タイマをチエツクし、上記一定時間が経過していれ
ばヘルプ回数カウンタをリセットする。よって最初の項
目の音声再生、音声出力が行われる。その一定時間が経
過していなければヘルプ回数カウンタは前回増加したま
まの状態であるから、次の項目の音声再生、音声出力が
行われる。このようにすれば利用者が前回のヘルプキー
5の操作の直後以外にヘルプキー5を操作すれば常に必
要性の高い順に音声再生、音声出力を得ることができ、
途中の項目から得ることが無い。そして現在行われてい
る音声再生、音声出力が不要な場合はヘルプキー5の操
作によりこれを途中で打ち切り、次の項目の音声再生、
音声出力を得ることができる。
上記タイマをチエツクし、上記一定時間が経過していれ
ばヘルプ回数カウンタをリセットする。よって最初の項
目の音声再生、音声出力が行われる。その一定時間が経
過していなければヘルプ回数カウンタは前回増加したま
まの状態であるから、次の項目の音声再生、音声出力が
行われる。このようにすれば利用者が前回のヘルプキー
5の操作の直後以外にヘルプキー5を操作すれば常に必
要性の高い順に音声再生、音声出力を得ることができ、
途中の項目から得ることが無い。そして現在行われてい
る音声再生、音声出力が不要な場合はヘルプキー5の操
作によりこれを途中で打ち切り、次の項目の音声再生、
音声出力を得ることができる。
なお、ヘルプキー5を一定時間以上押し続ける、一定の
短い時間内に複数回連続して操作する等の特定の操作を
定め、これによって現在行われている音声再生、音声出
力を中止し、次以降の項目の音声再生、音声出力もすべ
て中止することもできる。つまり該特定の操作により、
制御部4は再生中止コマンドのみを音声認識部3.音声
合成器7に送信し、次以降の項目に関する標準音声再生
コマンドまたは語句の番号を音声認識部3または音声合
成器7に送信しない。
短い時間内に複数回連続して操作する等の特定の操作を
定め、これによって現在行われている音声再生、音声出
力を中止し、次以降の項目の音声再生、音声出力もすべ
て中止することもできる。つまり該特定の操作により、
制御部4は再生中止コマンドのみを音声認識部3.音声
合成器7に送信し、次以降の項目に関する標準音声再生
コマンドまたは語句の番号を音声認識部3または音声合
成器7に送信しない。
また、ヘルプキー5の操作の代わりに「ヘルプ」等の特
定の語句の発声入力により音声認識部3が認識対象単語
の音声再生を行う場合には、該音声再生中に上記特定の
単語の発声入力を行っても、音声認識部3は認識動作を
行っていないので該特定の単語は認識されない、したが
って、この場合には音声認識部3に標準音声再生の終了
信号を制御部4に送信する機能を設け、制御部4は該終
了信号を受信してから上記一定時間内に該特定の単語の
発声入力が行われた場合には、次の項目の音声出力を行
う。
定の語句の発声入力により音声認識部3が認識対象単語
の音声再生を行う場合には、該音声再生中に上記特定の
単語の発声入力を行っても、音声認識部3は認識動作を
行っていないので該特定の単語は認識されない、したが
って、この場合には音声認識部3に標準音声再生の終了
信号を制御部4に送信する機能を設け、制御部4は該終
了信号を受信してから上記一定時間内に該特定の単語の
発声入力が行われた場合には、次の項目の音声出力を行
う。
次に、利用者の発声音声が一定回数以上リジエクト(認
識不能)となった場合に自動的に認識対象単語の標準音
声の再生を行う例における制御部4の動作を、第6図、
第14図のフローチャートを参照しながら説明する。第
14図には、第6図からの変更点のみを記す。
識不能)となった場合に自動的に認識対象単語の標準音
声の再生を行う例における制御部4の動作を、第6図、
第14図のフローチャートを参照しながら説明する。第
14図には、第6図からの変更点のみを記す。
利用者の発声音声がリジェクトとなると、制御部4はリ
ジェクトカウンタを増加する(s−20)。
ジェクトカウンタを増加する(s−20)。
リジェクトカウンタがあらかじめ定めた一定値を超える
と(s−21)、制御部4は音声認識部3に標準音声再
生コマンドを送信し、認識対象単語の標準音声が自動的
に再生される(s−22)。
と(s−21)、制御部4は音声認識部3に標準音声再
生コマンドを送信し、認識対象単語の標準音声が自動的
に再生される(s−22)。
この後、制御部4は上記リジェクトカウンタをリセット
する(s−23)、利用者の発声音声が正しく認識され
た場合は制御部4は上記リジェクトカウンタをリセット
しく5−24)、以後の動作を行う、このようにすれば
利用者の発声音声が何回もリジェクトとなった場合に、
利用者に特別な操作をさせずに、発声入力可能な単語を
正しい発声方法で音声利用者に知らせることができる。
する(s−23)、利用者の発声音声が正しく認識され
た場合は制御部4は上記リジェクトカウンタをリセット
しく5−24)、以後の動作を行う、このようにすれば
利用者の発声音声が何回もリジェクトとなった場合に、
利用者に特別な操作をさせずに、発声入力可能な単語を
正しい発声方法で音声利用者に知らせることができる。
また、第11図の■から■までの項目別、あるいは全項
目の音声再生、音声出力の頻度のカウンタを設け、つま
りカウンタとタイマとを連動させて一定期間あたりの回
数を数え、その頻度が一定値を超えた場合1項目別ある
いは全項目の音声出力する情報をより詳細な内容のもの
に自動的に切り替え、逆に該頻度が一定値以下となった
場合には上記情報をより簡略な内容のものに自動的に切
り替えることもできる。
目の音声再生、音声出力の頻度のカウンタを設け、つま
りカウンタとタイマとを連動させて一定期間あたりの回
数を数え、その頻度が一定値を超えた場合1項目別ある
いは全項目の音声出力する情報をより詳細な内容のもの
に自動的に切り替え、逆に該頻度が一定値以下となった
場合には上記情報をより簡略な内容のものに自動的に切
り替えることもできる。
例えば、■認識対象単語の標準音声については、ヘルプ
キー5の操作頻度が一定値を越えればr止めたいときは
止まれ、温度を変えたいときは温度、風の強さを変えた
いときは風と言って下さい、」など、発声方法を詳しく
説明するものに自動的に切り替え、ヘルプキー5の操作
頻度が上記一定値以下となれば「止まれ、温度、風」等
の簡単なものに自動的に切り替える。このようにすれば
利用者が操作方法に不慣れでヘルプキー5の操作が頻繁
な場合には、よりわかりやすい情報を利用者に提供する
ことができ、利用者が操作方法に慣れてきてヘルプキー
5の操作頻度が少なくなった場合には、不必要な情報を
利用者に聞かせることがない。
キー5の操作頻度が一定値を越えればr止めたいときは
止まれ、温度を変えたいときは温度、風の強さを変えた
いときは風と言って下さい、」など、発声方法を詳しく
説明するものに自動的に切り替え、ヘルプキー5の操作
頻度が上記一定値以下となれば「止まれ、温度、風」等
の簡単なものに自動的に切り替える。このようにすれば
利用者が操作方法に不慣れでヘルプキー5の操作が頻繁
な場合には、よりわかりやすい情報を利用者に提供する
ことができ、利用者が操作方法に慣れてきてヘルプキー
5の操作頻度が少なくなった場合には、不必要な情報を
利用者に聞かせることがない。
また、上記1項目の音声再生、音声出力開始直後に利用
者が該音声再生、音声出力を不必要として中止し、次の
項目の音声再生、音声出力を要求してヘルプキー5の操
作を行うことが゛頻繁に生じた場合、上記中止された項
目を必要性が高くない項目として自動的に音声再生、音
声出力の順序を後退せさることができる。つまり、上記
中止の頻度に応じて各項目の音声再生、音声出力の順序
を自動的に入れ替えることができる。これは1項目の音
声再生、音声出力開始からの経過時間を測定する前記タ
イマを利用し、その経過時間が一定値以下の場合の頻度
が一定値を越えた場合、自動的に該項目の音声再生、音
声出力の順序を後退させる。
者が該音声再生、音声出力を不必要として中止し、次の
項目の音声再生、音声出力を要求してヘルプキー5の操
作を行うことが゛頻繁に生じた場合、上記中止された項
目を必要性が高くない項目として自動的に音声再生、音
声出力の順序を後退せさることができる。つまり、上記
中止の頻度に応じて各項目の音声再生、音声出力の順序
を自動的に入れ替えることができる。これは1項目の音
声再生、音声出力開始からの経過時間を測定する前記タ
イマを利用し、その経過時間が一定値以下の場合の頻度
が一定値を越えた場合、自動的に該項目の音声再生、音
声出力の順序を後退させる。
次に設定温度を変更する場合のように利用者の2段階以
上の発声入力が必要な場合に、前段階の発声入力から一
定時間内に次段階の発声入力が行われない場合のみ利用
者の発声入力が促すガイダンス音声を出力する例におけ
る制御部4の動作を、第6図、第15図のフローチャー
トを参照しながら説明する。第15図には、第6図から
の変更点のみ記す。
上の発声入力が必要な場合に、前段階の発声入力から一
定時間内に次段階の発声入力が行われない場合のみ利用
者の発声入力が促すガイダンス音声を出力する例におけ
る制御部4の動作を、第6図、第15図のフローチャー
トを参照しながら説明する。第15図には、第6図から
の変更点のみ記す。
例えば利用者が設定温度を変更する場合、慣れた利用者
は「温度」、「低く」と続けて発声し。
は「温度」、「低く」と続けて発声し。
慣れない利用者は「温度」と発声して「温度を高くしま
すか、低くしますか、」等のガイダンス音声を聞いてか
ら「低く」と発声する方式である。
すか、低くしますか、」等のガイダンス音声を聞いてか
ら「低く」と発声する方式である。
利用者の「温度」または「風」の発声音声が正しく認識
されると(s−10)、制御部4は音声認識部3に「高
く」、「低く」等の設定変更の指示をする単語の番号を
送信する。音声認識部3は、これらの単語を認識対象単
語とする。利用者が一定時間内に発声を行えば(s−2
6,5−27)、その発声音声が正しく認識された場合
は(S−28)、制御部4は変更後の動作設定状態を知
らせるメツセージの音声を出力して動作設定状態を変更
する(s−18)、発声音声がリジェクトとなった場合
は(s−28)+制御部4は利用者に設定変更の指示を
促すガイダンス音声を出力する(s−13)。
されると(s−10)、制御部4は音声認識部3に「高
く」、「低く」等の設定変更の指示をする単語の番号を
送信する。音声認識部3は、これらの単語を認識対象単
語とする。利用者が一定時間内に発声を行えば(s−2
6,5−27)、その発声音声が正しく認識された場合
は(S−28)、制御部4は変更後の動作設定状態を知
らせるメツセージの音声を出力して動作設定状態を変更
する(s−18)、発声音声がリジェクトとなった場合
は(s−28)+制御部4は利用者に設定変更の指示を
促すガイダンス音声を出力する(s−13)。
利用者が上記一定時間内に設定変更指示の発声を行わな
ければ(s−27)、制御部4は該指示の発声を促すガ
イダンス音声を出力する(S−13)0例えば利用者が
「温度」から少し間をおいて「低く」と発声し、いずれ
も正しく認識された場合は設定温度が低くなり、「温度
」は正しく認識されたが「低く」はりジェクトとなった
場合は、「温度を高くしますか、低くしますか、」のガ
イダンス音声が出力される。
ければ(s−27)、制御部4は該指示の発声を促すガ
イダンス音声を出力する(S−13)0例えば利用者が
「温度」から少し間をおいて「低く」と発声し、いずれ
も正しく認識された場合は設定温度が低くなり、「温度
」は正しく認識されたが「低く」はりジェクトとなった
場合は、「温度を高くしますか、低くしますか、」のガ
イダンス音声が出力される。
次に、認識対象単語の音声再生中の利用者の発声により
空調機の操作を行う例における音声認識部3の動作を、
第9図、第16図のフローチャートを参照しながら説明
する。第16図には、第9図からの変更点のみ記す。
空調機の操作を行う例における音声認識部3の動作を、
第9図、第16図のフローチャートを参照しながら説明
する。第16図には、第9図からの変更点のみ記す。
利用者がヘルプキー5を操作し、音声認識部3が認識対
象単語の音声再生を行っている際に、利用者が目的の単
語の音声再生の直後から次の単語の音声再生終了までの
間に何らかの発声を行えば、音声認識部3が発声入力待
ちの状態で該目的の単語が発声入力されたと同じ動作を
行う。例えば音声認識部3が利用者の要求により「止ま
れ」、「温度」、・・・のように認識対象単語の音声再
生を行っていて、利用者が「止まれ」の音声再生直後か
ら次の「温度Jの音声再生終了までの間に「アラ」等の
何らかの発声を行えば、音声!!諏部3は以後の音声再
生を中止し、発声入力待ちの状態を「止まれ」の発声が
行われたのと同じ動作を行う、つまり、「止まれ」の単
語番号を制御部4に送信し、制御部4は空調機を停止す
る。
象単語の音声再生を行っている際に、利用者が目的の単
語の音声再生の直後から次の単語の音声再生終了までの
間に何らかの発声を行えば、音声認識部3が発声入力待
ちの状態で該目的の単語が発声入力されたと同じ動作を
行う。例えば音声認識部3が利用者の要求により「止ま
れ」、「温度」、・・・のように認識対象単語の音声再
生を行っていて、利用者が「止まれ」の音声再生直後か
ら次の「温度Jの音声再生終了までの間に「アラ」等の
何らかの発声を行えば、音声!!諏部3は以後の音声再
生を中止し、発声入力待ちの状態を「止まれ」の発声が
行われたのと同じ動作を行う、つまり、「止まれ」の単
語番号を制御部4に送信し、制御部4は空調機を停止す
る。
音声認識部3が1単語の音声再生中に利用者が何らかの
発声を行えば(v−7)、音声認識部3は該単語および
それ以降の単語の音声再生を中止し、したがって、最初
の単語音声再生に利用者が発声を行った場合にはこの動
作は行わない(以上v−8)、1単語の音声再生終了後
から次の単語の音声再生開始までの間に利用者が何らか
の発声を行えば(v−9からv−11まで)、音声認識
部3は以後の音声再生を中止し、直前に音声再生した単
語の番号を制御部4の通信端子45に送信する(v−1
2)、このようにすれば、利用者は目的の単語を知った
時点で空調機の操作を行うことができ、全単語の音声再
生が終わるのを待って改めて単語の発声入力を行う必要
がない。
発声を行えば(v−7)、音声認識部3は該単語および
それ以降の単語の音声再生を中止し、したがって、最初
の単語音声再生に利用者が発声を行った場合にはこの動
作は行わない(以上v−8)、1単語の音声再生終了後
から次の単語の音声再生開始までの間に利用者が何らか
の発声を行えば(v−9からv−11まで)、音声認識
部3は以後の音声再生を中止し、直前に音声再生した単
語の番号を制御部4の通信端子45に送信する(v−1
2)、このようにすれば、利用者は目的の単語を知った
時点で空調機の操作を行うことができ、全単語の音声再
生が終わるのを待って改めて単語の発声入力を行う必要
がない。
なお、上記の、「ヘルプ」等特定の単語の発声入力によ
り認識対象単語の標準音声再生を行う例においで、その
特定の単語を含めて複数の話者の標準音声が登録されて
いる場合には、その特定の単語の発声入力があれば、発
声音声と最も相違度の小さい標準音声を与える話者の標
準音声の再生を行う。
り認識対象単語の標準音声再生を行う例においで、その
特定の単語を含めて複数の話者の標準音声が登録されて
いる場合には、その特定の単語の発声入力があれば、発
声音声と最も相違度の小さい標準音声を与える話者の標
準音声の再生を行う。
例えば、認識対象単語の標準音声が話者A、B。
Cについて登録されている場合1話者りが「ヘルプ」等
と上記特定の単語を発声入力し、その発声音声と最も相
違度が小さい標準音声が話者Aの特定単語の標準音声で
あれば、音声認識部3は話者Aについて登録した認識対
象単語の標準音声の再生を行う、このようにすれば利用
者は自分の発声に最も近い標準音声を知ることができる
。
と上記特定の単語を発声入力し、その発声音声と最も相
違度が小さい標準音声が話者Aの特定単語の標準音声で
あれば、音声認識部3は話者Aについて登録した認識対
象単語の標準音声の再生を行う、このようにすれば利用
者は自分の発声に最も近い標準音声を知ることができる
。
[発明の効果]
以上詳細に説明したように、本発明によれば、音声認識
制御装置において利用者の特定の操作または特定の単語
の発声入力により、認識対象語句の標準音声の再生や、
装置の動作状態等を表現する音声の出力の動作を割込処
理により行なっているので、利用者は任意の時点で認識
対象語句の音声再生や、装置の動作状態等を表現する音
声の出力を要求することができる。したがって、利用者
は発声入力できる命令語や、運転操作に必要あるいは参
考となる情報が不明な場合に、これを視覚によらず音声
により知ることができ、特に盲人の使用あるいは暗がり
での使用に便利な音声認識制御装置を提供することがで
きる。
制御装置において利用者の特定の操作または特定の単語
の発声入力により、認識対象語句の標準音声の再生や、
装置の動作状態等を表現する音声の出力の動作を割込処
理により行なっているので、利用者は任意の時点で認識
対象語句の音声再生や、装置の動作状態等を表現する音
声の出力を要求することができる。したがって、利用者
は発声入力できる命令語や、運転操作に必要あるいは参
考となる情報が不明な場合に、これを視覚によらず音声
により知ることができ、特に盲人の使用あるいは暗がり
での使用に便利な音声認識制御装置を提供することがで
きる。
このとき、認識対象語句を知らせる音声は、利用者の発
声入力した語句を認識する際に、その発声音声と比較す
る標準音声を用いているので、利用者は正しく認識され
る発声方法を知ることができる。
声入力した語句を認識する際に、その発声音声と比較す
る標準音声を用いているので、利用者は正しく認識され
る発声方法を知ることができる。
また、上記認識対象語句や装置の動作状態等の音声出力
は、利用者が要求を行った時点において、つまり該時点
において可能な操作や該時点の装置の動作状態等に応じ
て、利用者にとって必要性の高い情報から順に音声出力
を行なってでいるので、利用者は該時点において必要性
の高い順に上記の情報を得ることができる。
は、利用者が要求を行った時点において、つまり該時点
において可能な操作や該時点の装置の動作状態等に応じ
て、利用者にとって必要性の高い情報から順に音声出力
を行なってでいるので、利用者は該時点において必要性
の高い順に上記の情報を得ることができる。
さらに、認識対象語句の音声出力中に、目的の語句の音
声出力から一定時間内に利用者が何らかの発声を行えば
、以後の音声出力を中止し、該語句の発声入力が行われ
てこれを正しく認識したのと同じ動作を行うこともでき
る。よって、利用者は目的の語句を知った後も不必要に
残りの音声出力を聞いたのち、改めて目的の語句の発声
入力を行う必要がない。
声出力から一定時間内に利用者が何らかの発声を行えば
、以後の音声出力を中止し、該語句の発声入力が行われ
てこれを正しく認識したのと同じ動作を行うこともでき
る。よって、利用者は目的の語句を知った後も不必要に
残りの音声出力を聞いたのち、改めて目的の語句の発声
入力を行う必要がない。
また、一つの操作のために複数段階の発声入力が必要な
場合には、全段階の発声入力が行われてから一定時間内
に次段階の発声入力が行われない場合にのみ、次の発声
入力を促す案内音声を出力することができるので、操作
に慣れた利用者が不必要に案内音声を聞かされることな
く、また操作に不慣れな利用者は必要な案内音声を得る
ことができる。
場合には、全段階の発声入力が行われてから一定時間内
に次段階の発声入力が行われない場合にのみ、次の発声
入力を促す案内音声を出力することができるので、操作
に慣れた利用者が不必要に案内音声を聞かされることな
く、また操作に不慣れな利用者は必要な案内音声を得る
ことができる。
上記を総合して1本発明によれば、制御すべき本体装置
が認識の対象とする語句を、利用者の任意の時点での要
求により、対象の際に比較の標準とする音声で利用者に
知らせることができる音声認識制御装置を提供すること
ができる。
が認識の対象とする語句を、利用者の任意の時点での要
求により、対象の際に比較の標準とする音声で利用者に
知らせることができる音声認識制御装置を提供すること
ができる。
また5本体装置の動作設定状態の情報を、利用者の任意
の時点での要求により音声で利用者に知らせることので
きる音声認識制御装置を提供することができる。
の時点での要求により音声で利用者に知らせることので
きる音声認識制御装置を提供することができる。
第1図は、本発明の一実施例に係る音声認識制御装置の
制御系のブロック図、第2図は、第1図の空調機の外観
の一例を示す略示構成図、第3図は、第1図の音声認識
部の一構成例を示すブロック図、第4図は、制御部の一
構成例を示すブロック図、第5図は、音声合成器の一構
成例を示すブロック図、第6図は、空調機の運転開始か
ら停止までの制御部4の動作を示すフローチャート、第
7図は、音声認識部3の音声認識動作を示すフローチャ
ート、第8図は、ヘルプキー5の操作による制御部4の
割込処理を示すフローチャート、第9図は、音声認識部
3の標準音声再生の動作を示すフローチャート、第10
図は、発声によるヘルプ要求の場合の音声認識部3の動
作を示すフローチャート、第11図は、音声出力の項目
分類、第12図は、音声出力の順序の一例を示す説明図
、第13図は1次のヘルプ要求までに時間制限を設ける
動作のフローチャート、第14図は、−室以上のりジェ
クト回数で認識対象単語を自動再生する動作のフローチ
ャート、第15図は、一定時間内に次の発声入力がない
場合のみガイダンス音声を出力する動作のフローチャー
ト、第16図は、認識対象単語の音声再生中の発声入力
により操作を行うフローチャートである。 1・・・マイクロホン、3・・・音声認識部、4・・・
制御部、5・・・ヘルプキー、7・・・音声合成器、9
・・・スピーカ、12・・・空調機駆動回路、14・・
・手動操作キ31・・・演算部、32・・・第1のメモ
リ、33・・・第2のメモリ、34・・・入出力部、4
1・・・演算部、42・・・第1のメモリ、43・・・
第2のメモリ、44・・・入出力部、51・・・演算部
、52・・・メモリ、53・・・デコーダ、54・・・
D/A変換器。
制御系のブロック図、第2図は、第1図の空調機の外観
の一例を示す略示構成図、第3図は、第1図の音声認識
部の一構成例を示すブロック図、第4図は、制御部の一
構成例を示すブロック図、第5図は、音声合成器の一構
成例を示すブロック図、第6図は、空調機の運転開始か
ら停止までの制御部4の動作を示すフローチャート、第
7図は、音声認識部3の音声認識動作を示すフローチャ
ート、第8図は、ヘルプキー5の操作による制御部4の
割込処理を示すフローチャート、第9図は、音声認識部
3の標準音声再生の動作を示すフローチャート、第10
図は、発声によるヘルプ要求の場合の音声認識部3の動
作を示すフローチャート、第11図は、音声出力の項目
分類、第12図は、音声出力の順序の一例を示す説明図
、第13図は1次のヘルプ要求までに時間制限を設ける
動作のフローチャート、第14図は、−室以上のりジェ
クト回数で認識対象単語を自動再生する動作のフローチ
ャート、第15図は、一定時間内に次の発声入力がない
場合のみガイダンス音声を出力する動作のフローチャー
ト、第16図は、認識対象単語の音声再生中の発声入力
により操作を行うフローチャートである。 1・・・マイクロホン、3・・・音声認識部、4・・・
制御部、5・・・ヘルプキー、7・・・音声合成器、9
・・・スピーカ、12・・・空調機駆動回路、14・・
・手動操作キ31・・・演算部、32・・・第1のメモ
リ、33・・・第2のメモリ、34・・・入出力部、4
1・・・演算部、42・・・第1のメモリ、43・・・
第2のメモリ、44・・・入出力部、51・・・演算部
、52・・・メモリ、53・・・デコーダ、54・・・
D/A変換器。
Claims (1)
- 【特許請求の範囲】 1、利用者の発声入力による運転操作に基づき、制御す
べき本体装置の運転制御を行う音声認識制御装置におい
て、 利用者の発声する命令語の音声を入力する音声入力手段
と、 その入力された音声の特徴量を抽出し、あらかじめ登録
されている命令語の標準音声の特徴量と比較することに
より、該命令語を認識して認識結果を出力する音声認識
手段と、 前記認識結果に基づいて前記本体装置の運転制御を行う
制御手段と、 この制御手段からの指示信号に基づき前記標準音声の再
生を行う第1の音声再生手段と、利用者が手動操作を行
う手動操作部と、その手動操作を表わす信号を前記制御
手段に出力する手動操作手段とを備え、 利用者の特定の手動操作により前記標準音声の再生を行
う ことを特徴とする音声認識制御装置。 2、第1の音声再生手段は、利用者の発声入力する特定
の語句を認識することにより、標準音声の再生を行うも
のであることを特徴とする請求項1記載の音声認識制御
装置。 3、第1の音声再生手段は、複数の話者について標準音
声およびその特徴量を登録しておき、特定語句の発声入
力があったときに、その発声入力の特徴量が前記登録さ
れた特徴量と最小相違度を与える発声を入力した話者に
ついて、該話者の命令語の標準音声の再生を行うもので
あることを特徴とする請求項2記載の音声認識制御装置
。 4、利用者の発声入力による運転操作に基づき、制御す
べき本体装置の運転制御を行う音声認識制御装置におい
て、 利用者の発声する命令語の音声を入力する音声入力手段
と、 その入力された音声の特徴量を抽出し、あらかじめ登録
されている命令語の標準音声の特徴量と比較することに
より、該命令語を認識して認識結果を出力する音声認識
手段と、 前記認識結果に基づいて前記本体装置の運転制御を行う
制御手段と、 この制御手段からの指示信号に基づき、あらかじめ記録
された情報語句の音声を選択して再生する第2の音声再
生手段と、 利用者が手動操作を行う手動操作部と、その手動操作を
表わす信号を前記制御手段に出力する手動操作手段とを
備え、 利用者の特定の手動操作または特定の語句の発声入力の
いずれかにより、その情報語句の音声を選択して再生を
行う ことを特徴とする音声認識制御装置。 5、第2の音声再生手段は、利用者の特定の手動操作ま
たは特定の語句の発声入力のいずれかが行われた時点に
おける、制御すべき本体装置の動作状態、および利用者
が行いうる操作に基づき、利用者の必要性に応じた順序
で、命令語の標準音声または情報語句の音声を選択して
再生を行うものであることを特徴とする請求項4記載の
音声認識制御装置。 6、第2の音声再生手段は、利用者の1回の特定の手動
操作または特定の語句の発声入力のいずれか毎に、利用
者の必要性に応じた順序に従い、命令語の標準音声また
は情報語句の音声の中から1項目の音声を選択して再生
を行い、その音声の再生の開始または終了のいずれかか
ら所定時間内に、特定の手動操作または特定の語句の発
声入力のいずれかが行われた場合にのみ、次の順序の一
項目の音声を選択して再生を行うものであることを特徴
とする請求項5記載の音声認識制御装置。 7、利用者の発声入力する語句が認識不足となる回数に
基づいて自動的に命令語の標準音声の再生を行うことを
特徴とする請求項1ないし6記載のいずれかの音声認識
制御装置。 8、利用者の特定の手動操作または特定の語句の発声入
力の頻度に基づき、あらかじめ記録された情報語句の音
声を選択して発声する該情報語句を自動的に変更するこ
とを特徴とする請求項4記載の音声認識制御装置。 9、音声再生中に、利用者が特定の手動操作または特定
の語句の発声入力のいずれかを行う頻度に基づき、各項
目の音声の選択再生順序を自動的に入れ替えることを特
徴とする請求項6記載の音声認識制御装置。 10、利用者の発声入力による運転操作に基づき、制御
すべき本体装置の運転制御を行う音声認識制御装置にお
いて、 利用者の発声する命令語の音声を入力する音声入力手段
と、 その入力された音声の特徴量を抽出し、あらかじめ登録
されている命令語の標準音声の特徴量と比較することに
より、該命令語を認識して認識結果を出力する音声認識
手段と、 前記認識結果に基づいて前記本体装置の運転制御を行う
制御手段と、 この制御手段からの指示信号に基づき前記標準音声の再
生を行う第1の音声再生手段と、利用者が手動操作を行
う手動操作部と、その手動操作を表わす信号を前記制御
手段に出力する手動操作手段とを備え、 利用者の複数段階の命令語の発声入力により1個の運転
操作を行う場合に、前段階の命令語の発声入力ののち、
一定時間内に次段階の命令語の発声入力がない場合にの
み、利用者に前記次段階の命令語の発声を促す内容の情
報音声の再生を行う ことを特徴とする音声認識制御装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2159793A JPH0451299A (ja) | 1990-06-20 | 1990-06-20 | 音声認識制御装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2159793A JPH0451299A (ja) | 1990-06-20 | 1990-06-20 | 音声認識制御装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0451299A true JPH0451299A (ja) | 1992-02-19 |
Family
ID=15701392
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2159793A Pending JPH0451299A (ja) | 1990-06-20 | 1990-06-20 | 音声認識制御装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0451299A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006154476A (ja) * | 2004-11-30 | 2006-06-15 | Mitsubishi Electric Corp | 音声認識装置 |
| JP2007163895A (ja) * | 2005-12-14 | 2007-06-28 | Mitsubishi Electric Corp | 音声認識装置 |
| JP4927951B2 (ja) * | 2006-12-01 | 2012-05-09 | リューディ、ライモンド | 便座および便座を備えた便器 |
| CN104422063A (zh) * | 2013-08-22 | 2015-03-18 | 珠海格力电器股份有限公司 | 空调的语音控制系统以及空调系统的控制方法 |
-
1990
- 1990-06-20 JP JP2159793A patent/JPH0451299A/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006154476A (ja) * | 2004-11-30 | 2006-06-15 | Mitsubishi Electric Corp | 音声認識装置 |
| JP2007163895A (ja) * | 2005-12-14 | 2007-06-28 | Mitsubishi Electric Corp | 音声認識装置 |
| JP4927951B2 (ja) * | 2006-12-01 | 2012-05-09 | リューディ、ライモンド | 便座および便座を備えた便器 |
| US8286272B2 (en) | 2006-12-01 | 2012-10-16 | Luedi Raymond | Toilet seat and toilet equipped therewith |
| CN104422063A (zh) * | 2013-08-22 | 2015-03-18 | 珠海格力电器股份有限公司 | 空调的语音控制系统以及空调系统的控制方法 |
| CN104422063B (zh) * | 2013-08-22 | 2017-11-17 | 珠海格力电器股份有限公司 | 空调的语音控制系统以及空调系统的控制方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3968133B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
| US20030138118A1 (en) | Method for control of a unit comprising an acoustic output device | |
| US6584439B1 (en) | Method and apparatus for controlling voice controlled devices | |
| US20020193989A1 (en) | Method and apparatus for identifying voice controlled devices | |
| JPH0782351B2 (ja) | 音声コマンドによりデジットシーケンスを入力するための方法 | |
| JP2002169584A (ja) | 音声操作システム | |
| WO2008001549A1 (fr) | Dispositif audio interactif, procédé audio interactif, et programme correspondant | |
| JP2009178783A (ja) | コミュニケーションロボット及びその制御方法 | |
| JP2000089781A (ja) | 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体 | |
| JPH0451299A (ja) | 音声認識制御装置 | |
| JP2001042887A (ja) | 自動音声認識器を訓練する方法 | |
| JP3001000B1 (ja) | 音声認識装置における連続単語認識方法および音声認識装置における連続単語認識処理プログラムを記録した記録媒体 | |
| JP4491438B2 (ja) | 音声対話装置、音声対話方法、およびプログラム | |
| JPS59137999A (ja) | 音声認識装置 | |
| JPH11175093A (ja) | 音声認識確認応答方法 | |
| WO1994002936A1 (en) | Voice recognition apparatus and method | |
| JP4765394B2 (ja) | 音声対話装置 | |
| JP2016009133A (ja) | 言語リハビリテーション支援装置及びその制御方法 | |
| JP3005330B2 (ja) | 音声認識装置 | |
| JP3045169B2 (ja) | 音声認識装置における連続単語認識方法および音声認識装置における連続単語認識処理プログラムを記録した記録媒体 | |
| JP7288530B1 (ja) | システムおよびプログラム | |
| JP2708566B2 (ja) | 音声認識制御装置 | |
| JPH04322686A (ja) | 会話型玩具 | |
| JPH02103599A (ja) | 音声認識装置 | |
| JP2002196789A (ja) | 音声対話装置 |