JP2000293193A - 音声入力装置、音声入力方法、及び記憶媒体 - Google Patents
音声入力装置、音声入力方法、及び記憶媒体Info
- Publication number
- JP2000293193A JP2000293193A JP11101351A JP10135199A JP2000293193A JP 2000293193 A JP2000293193 A JP 2000293193A JP 11101351 A JP11101351 A JP 11101351A JP 10135199 A JP10135199 A JP 10135199A JP 2000293193 A JP2000293193 A JP 2000293193A
- Authority
- JP
- Japan
- Prior art keywords
- input
- voice
- recognition
- recognition result
- routine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Abstract
(57)【要約】
【課題】 音声入力処理時の操作環境を良化させる。
【解決手段】 音声認識結果の正確度が低い場合に、そ
の音声認識結果を未確定状態で表示したままの状態で、
カーソルを次の入力位置(桁)に自動的に移動させるこ
とにより、次の入力を許可する。
の音声認識結果を未確定状態で表示したままの状態で、
カーソルを次の入力位置(桁)に自動的に移動させるこ
とにより、次の入力を許可する。
Description
【0001】
【発明の属する技術分野】本発明は、各種の情報を音声
で入力する音声入力技術に関する。
で入力する音声入力技術に関する。
【0002】
【従来の技術】従来、水道使用量メータの検針等に利用
されるハンディターミナルでは、音声認識機能を用いて
音声で情報を入力する音声入力機能が実現されている。
されるハンディターミナルでは、音声認識機能を用いて
音声で情報を入力する音声入力機能が実現されている。
【0003】この種の電子機器では、音声認識結果の正
確度が低くて不確定の場合には、複数の候補を表示して
その候補の中から選択させるか、或いは再入力させる等
して入力を確定した後に、次の入力に進むようにしてい
た。
確度が低くて不確定の場合には、複数の候補を表示して
その候補の中から選択させるか、或いは再入力させる等
して入力を確定した後に、次の入力に進むようにしてい
た。
【0004】
【発明が解決しようとする課題】しかし、表示画面に向
かって入力確定操作を行うことは容易だが、表示面面を
見ることができない状態や連続した入力を行ないたい場
合に、修正のための画面のチェックを音声認識結果の正
確度が低いエラー認識が発生する毎に行なう必要があ
り、使い勝手が悪かった。
かって入力確定操作を行うことは容易だが、表示面面を
見ることができない状態や連続した入力を行ないたい場
合に、修正のための画面のチェックを音声認識結果の正
確度が低いエラー認識が発生する毎に行なう必要があ
り、使い勝手が悪かった。
【0005】本発明は、このような背景の下になされた
もので、その課題は、音声入力処理時の操作環境を良化
させることにある。
もので、その課題は、音声入力処理時の操作環境を良化
させることにある。
【0006】
【課題を解決するための手段(及び作用)】上記課題を
解決するために、本発明は、入力された音声を認識する
認識手段と、前記認識手段による音声認識結果の正確度
が低い場合に、該音声認識結果を未確定状態で表示した
まま次の入力を許可する許可手段を備えている。
解決するために、本発明は、入力された音声を認識する
認識手段と、前記認識手段による音声認識結果の正確度
が低い場合に、該音声認識結果を未確定状態で表示した
まま次の入力を許可する許可手段を備えている。
【0007】また、本発明は、入力された音声を認識す
る認識工程と、前記認識工程による音声認識結果の正確
度が低い場合に、該音声認識結果を未確定状態で表示し
たまま次の入力を許可する許可工程を備えている。
る認識工程と、前記認識工程による音声認識結果の正確
度が低い場合に、該音声認識結果を未確定状態で表示し
たまま次の入力を許可する許可工程を備えている。
【0008】また、本発明は、音声入力処理用のプログ
ラムを記憶した記憶媒体であって、前記プログラムは、
入力された音声を認識する認識ルーチンと、前記認識ル
ーチンによる音声認識結果の正確度が低い場合に、該音
声認識結果を未確定状態で表示したまま次の入力を許可
する許可ルーチンを含んでいる。
ラムを記憶した記憶媒体であって、前記プログラムは、
入力された音声を認識する認識ルーチンと、前記認識ル
ーチンによる音声認識結果の正確度が低い場合に、該音
声認識結果を未確定状態で表示したまま次の入力を許可
する許可ルーチンを含んでいる。
【0009】また、本発明は、前記認識手段による音声
認識結果の正確度が低い場合に、対応する入力音声デー
タを保存する保存手段・工程・ルーチンと、前記保存手
段・工程・ルーチンにて保存された入力音声データを再
生する再生手段・工程・ルーチンとを備えている。
認識結果の正確度が低い場合に、対応する入力音声デー
タを保存する保存手段・工程・ルーチンと、前記保存手
段・工程・ルーチンにて保存された入力音声データを再
生する再生手段・工程・ルーチンとを備えている。
【0010】また、本発明は、前記認識手段・工程・ル
ーチンによる音声認識結果の正確度が低い場合が規定回
数より多く発生したときに、その旨を警告する警告手段
・工程・ルーチンを有している。
ーチンによる音声認識結果の正確度が低い場合が規定回
数より多く発生したときに、その旨を警告する警告手段
・工程・ルーチンを有している。
【0011】また、本発明は、入力確定処理に移行する
際に、前記未確定の音声認識結果の位置にカーソルを自
動的に移動させる移動手段・工程・ルーチンを有してい
る。
際に、前記未確定の音声認識結果の位置にカーソルを自
動的に移動させる移動手段・工程・ルーチンを有してい
る。
【0012】また、本発明は、入力確定処理時に、入力
順とは無関係に任意の未確定位置の確定処理を許可する
第2の許可手段・工程・ルーチンを有している。
順とは無関係に任意の未確定位置の確定処理を許可する
第2の許可手段・工程・ルーチンを有している。
【0013】また、本発明は、前記音声入力装置(音声
入力処理用のプログラム)は、水道使用料メータ等の検
針用に用いられるハンディターミナルに適用される。
入力処理用のプログラム)は、水道使用料メータ等の検
針用に用いられるハンディターミナルに適用される。
【0014】
【発明の実施の形態】次に、本発明の実施の形態を図面
を参照しながら説明する。
を参照しながら説明する。
【0015】図1は、本発明を適用した水道使用料メー
タの検針用のハンディターミナルの外観図である。図1
において、1はヘッドセットであり、マイク2とスピー
カ3により構成されている。4はコネクタであり、この
コネクタ4を介してヘッドセット1をハンディターミナ
ル5に着脱可能に接続できるようになっている。6は表
示部であり、図1では例として検針用のアプリケーショ
ンプログラムが動作している画面を示している。以下の
説明は、この検針用のプログラムを中心に行なう。7は
音声入力用の音声キーであり、8はカーソルキ−、9は
音声再生キー、10は訂正キー、11はENTキーであ
る。12は表示画面上に表示されている音声入力エリア
である。
タの検針用のハンディターミナルの外観図である。図1
において、1はヘッドセットであり、マイク2とスピー
カ3により構成されている。4はコネクタであり、この
コネクタ4を介してヘッドセット1をハンディターミナ
ル5に着脱可能に接続できるようになっている。6は表
示部であり、図1では例として検針用のアプリケーショ
ンプログラムが動作している画面を示している。以下の
説明は、この検針用のプログラムを中心に行なう。7は
音声入力用の音声キーであり、8はカーソルキ−、9は
音声再生キー、10は訂正キー、11はENTキーであ
る。12は表示画面上に表示されている音声入力エリア
である。
【0016】図2は、ハンディターミナル5の電気的な
概略構成を示すブロック図である。図2において、15
はプログラムの実行や音声認識、表示部6を制御する制
御部であり、CPU等により構成されている。ヘッドセ
ット1のマイク2から入力された音声信号は、コネクタ
4を介して本体内部に取り込まれ、アンプ13にて増幅
される。増幅された音声信号はADコンバータ14によ
りデジタル化されて制御部15に送られる。16はAD
コンバータ14ヘの変換開始コマンドやデータの送受信
の制御を行ったり、変換されたデータを制御部15に送
るための制御及びデータ線である。17はメモリであ
り、アプリケーションプログラムや音声認識プログラ
ム、音声認識用登録辞書、作業に用いるワークや音声デ
ータの保管に用いられ、ROMやフラッシュメモリ、R
AM等により構成されている。
概略構成を示すブロック図である。図2において、15
はプログラムの実行や音声認識、表示部6を制御する制
御部であり、CPU等により構成されている。ヘッドセ
ット1のマイク2から入力された音声信号は、コネクタ
4を介して本体内部に取り込まれ、アンプ13にて増幅
される。増幅された音声信号はADコンバータ14によ
りデジタル化されて制御部15に送られる。16はAD
コンバータ14ヘの変換開始コマンドやデータの送受信
の制御を行ったり、変換されたデータを制御部15に送
るための制御及びデータ線である。17はメモリであ
り、アプリケーションプログラムや音声認識プログラ
ム、音声認識用登録辞書、作業に用いるワークや音声デ
ータの保管に用いられ、ROMやフラッシュメモリ、R
AM等により構成されている。
【0017】18は入力部であリ、図1に示した各種キ
ーに相当する。20はDAコンバータであり、制御及び
データ線19を介して制御部15から送られた音声対応
のデジタルデータをアナログに変換するものである。D
Aコンバータ20で変換されたアナログ信号は、アンプ
21にて増幅された後、コネクタ4を介してヘッドセッ
ト1のスピーカ3に出力され、音声として聞くことがで
きる。
ーに相当する。20はDAコンバータであり、制御及び
データ線19を介して制御部15から送られた音声対応
のデジタルデータをアナログに変換するものである。D
Aコンバータ20で変換されたアナログ信号は、アンプ
21にて増幅された後、コネクタ4を介してヘッドセッ
ト1のスピーカ3に出力され、音声として聞くことがで
きる。
【0018】次に、音声認識処理を図3のフローチャー
トに基づいて説明する。
トに基づいて説明する。
【0019】ステップS1にて開音声認識処理が開始さ
れると、ADコンバータ14を介してマイク2から入力
されたデータのサンプリングを開始する(ステップS
2)。そして、サンプリングしたデータのレベルが一定
値以上か否かを判定するすることにより音声入力が行わ
れているか否かを判別する(ステップS3)。その結
果、音声入力が行われていれば、ステップS4の音声認
識プログラムヘ移行する。
れると、ADコンバータ14を介してマイク2から入力
されたデータのサンプリングを開始する(ステップS
2)。そして、サンプリングしたデータのレベルが一定
値以上か否かを判定するすることにより音声入力が行わ
れているか否かを判別する(ステップS3)。その結
果、音声入力が行われていれば、ステップS4の音声認
識プログラムヘ移行する。
【0020】音声認識プログラムのサブルーチンでは、
次のようにして、周期的に音声データのサンプリングを
行なう。すなわち、サンプリングしたデータ(AD変換
値)をメモリ17のワークエリアに一時保管すると共に
(ステップS5)、そのデータを音声認識プログラムに
渡す(ステップS5)。そして、音声入力の終わりを検
出するために一定時間の無音期間が発生したか否かをチ
ェックする(ステップS7)。その結果、一定時間以上
の無音期間が発生していなければステップS4の音声認
識プログラムへ戻る。一方、一定時間以上の無音期間が
発生して無音期間(音声入力の終了)と判断されたとき
は、周期的なサンプリングを停止すると共に(ステップ
S8)、認識処理プログラムにサンプリングの終了を通
知し(ステップS9)、ステップS4の音声認識プログ
ラムに戻る。
次のようにして、周期的に音声データのサンプリングを
行なう。すなわち、サンプリングしたデータ(AD変換
値)をメモリ17のワークエリアに一時保管すると共に
(ステップS5)、そのデータを音声認識プログラムに
渡す(ステップS5)。そして、音声入力の終わりを検
出するために一定時間の無音期間が発生したか否かをチ
ェックする(ステップS7)。その結果、一定時間以上
の無音期間が発生していなければステップS4の音声認
識プログラムへ戻る。一方、一定時間以上の無音期間が
発生して無音期間(音声入力の終了)と判断されたとき
は、周期的なサンプリングを停止すると共に(ステップ
S8)、認識処理プログラムにサンプリングの終了を通
知し(ステップS9)、ステップS4の音声認識プログ
ラムに戻る。
【0021】音声認識プログラムでは、サンプリングの
停止通知を受け、それまでのサンプリングデータに基づ
いて音声認識処理を行う。この音声認識処理の処理結果
は、図5のようなフォーマットで示される。すなわち、
図5に示した正常認識/エラー認識を示すフラグ22
と、23に示した第1候補から第5候補までの各々につ
いて、N1〜N5のナンバー24とd1〜d5のサンプ
リングデータからの距離25という項目で音声認識処理
の処理結果が示される。
停止通知を受け、それまでのサンプリングデータに基づ
いて音声認識処理を行う。この音声認識処理の処理結果
は、図5のようなフォーマットで示される。すなわち、
図5に示した正常認識/エラー認識を示すフラグ22
と、23に示した第1候補から第5候補までの各々につ
いて、N1〜N5のナンバー24とd1〜d5のサンプ
リングデータからの距離25という項目で音声認識処理
の処理結果が示される。
【0022】ここで、候補のナンバーは、メモリ17に
予め登録された辞書中のナンバーに相当し、辞書からそ
のナンバーに対応する数字・単語または連語を引くこと
ができる。距離は、認識した結果の「正確度」を示す数
値であり、この距離が小さいほど「正確」な音声認識と
いうことになる。
予め登録された辞書中のナンバーに相当し、辞書からそ
のナンバーに対応する数字・単語または連語を引くこと
ができる。距離は、認識した結果の「正確度」を示す数
値であり、この距離が小さいほど「正確」な音声認識と
いうことになる。
【0023】ステップS4での音声認識処理が終了する
と、認識結果として第1候補であるN1をセットし(ス
テップS10)、フラグ22により正常認識か否かをチ
ェックする(ステップS11)。その結果、エラー認識
の場合は、ステップS15のエラー処理に進む。正常認
識の場合は、第1候補の距離d1が予め定めた距離ds
より小さいか否かをチェックする(ステップS12)。
これは、第1候補が一定基準より「正確」かどうかをチ
ェックするものである。d1がdsより大きい場合、つ
まり「正確でない」と判断したときは、ステップS15
以降のエラー処理に進む。
と、認識結果として第1候補であるN1をセットし(ス
テップS10)、フラグ22により正常認識か否かをチ
ェックする(ステップS11)。その結果、エラー認識
の場合は、ステップS15のエラー処理に進む。正常認
識の場合は、第1候補の距離d1が予め定めた距離ds
より小さいか否かをチェックする(ステップS12)。
これは、第1候補が一定基準より「正確」かどうかをチ
ェックするものである。d1がdsより大きい場合、つ
まり「正確でない」と判断したときは、ステップS15
以降のエラー処理に進む。
【0024】一方、d1がdsより小さいとき、すなわ
ち「正確」であると判別したときは、ステップS13に
進み、第1候補と第2候補の距離の差が予め定めた距離
の差dtより大きいか否かを判定する。第1候補と第2
候補の差が大きいということは、第1候補の正確さが高
いことを意味し、第1候補と第2候補の差がさいという
ことは第1、第2候補が似ており識別し難いことを意味
し、正確さは低いということになる。従って、ステップ
S13でd2とd1の差がdt以下であると判定された
場合は、ステップS15以降のエラー処理に進む。一
方、ステップS13でd2とd1の差がdtより大きい
と判定された場合は、正常認識となり、第1候補N1が
音声認識結果として確定される(ステップS14)。
ち「正確」であると判別したときは、ステップS13に
進み、第1候補と第2候補の距離の差が予め定めた距離
の差dtより大きいか否かを判定する。第1候補と第2
候補の差が大きいということは、第1候補の正確さが高
いことを意味し、第1候補と第2候補の差がさいという
ことは第1、第2候補が似ており識別し難いことを意味
し、正確さは低いということになる。従って、ステップ
S13でd2とd1の差がdt以下であると判定された
場合は、ステップS15以降のエラー処理に進む。一
方、ステップS13でd2とd1の差がdtより大きい
と判定された場合は、正常認識となり、第1候補N1が
音声認識結果として確定される(ステップS14)。
【0025】エラー処理では、まず、図4のフラグ22
にエラーフラグをセットし(ステップS15)、エラー
ナンバーをセットする(ステップS16)。このエラー
ナンバーとは、音声保管データ等の今回発生したエラー
認識を識別するために付ける番号である。次に、ステッ
プS5でワークエリアに一時保管した音声データを、A
DPCM(Adaptive Differentia
l Pulse Code Modulation)等
の圧縮方法により圧縮して音声データエリアに保管し直
す(ステップS17)。そして、エラーインデックスを
セットして(ステップS18)、終了する(ステップS
19)。このエラーインデックスとは、エラーに係る音
声データを再生するのに必要な情報を保管するエリアで
あり、図6に示すように,エラーナンバーに対応して、
音声データを保管した開始アドレスとサンプリングした
データ数、その認識結果としての第1〜第5候補までの
ナンバーN1〜N5を保管するエリアである。
にエラーフラグをセットし(ステップS15)、エラー
ナンバーをセットする(ステップS16)。このエラー
ナンバーとは、音声保管データ等の今回発生したエラー
認識を識別するために付ける番号である。次に、ステッ
プS5でワークエリアに一時保管した音声データを、A
DPCM(Adaptive Differentia
l Pulse Code Modulation)等
の圧縮方法により圧縮して音声データエリアに保管し直
す(ステップS17)。そして、エラーインデックスを
セットして(ステップS18)、終了する(ステップS
19)。このエラーインデックスとは、エラーに係る音
声データを再生するのに必要な情報を保管するエリアで
あり、図6に示すように,エラーナンバーに対応して、
音声データを保管した開始アドレスとサンプリングした
データ数、その認識結果としての第1〜第5候補までの
ナンバーN1〜N5を保管するエリアである。
【0026】次に、前述した検針プログラムの一連の入
力処理を図7のフローチャートを用いて説明する。この
検針プログラムとは、図1の音声入力エリア12に6桁
のメータの数字、つまり6回の音声入力を行なうプログ
ラムである。
力処理を図7のフローチャートを用いて説明する。この
検針プログラムとは、図1の音声入力エリア12に6桁
のメータの数字、つまり6回の音声入力を行なうプログ
ラムである。
【0027】ステップS20にて入力処理を開始する
と、まず入力に必要な画面を表示し(ステップS2
1)、音声キー7が押下された否かをチェックする(ス
テップS22)。音声入力は、音声キー7が押下されて
いる時に有効となる。音声キー7が押下されている場合
には、音声入力処理へ移って、入力数nを“1”に初期
化し(ステップS23)、エラー回数Enを“0”に初
期化する(ステップS24)。次に、音声キー7が押下
されているか否かを判別し(ステップS25)、音声キ
ー7が離された場合は、入力を中断したものと見做し
て、ステップS38にて入力処理を終了する。
と、まず入力に必要な画面を表示し(ステップS2
1)、音声キー7が押下された否かをチェックする(ス
テップS22)。音声入力は、音声キー7が押下されて
いる時に有効となる。音声キー7が押下されている場合
には、音声入力処理へ移って、入力数nを“1”に初期
化し(ステップS23)、エラー回数Enを“0”に初
期化する(ステップS24)。次に、音声キー7が押下
されているか否かを判別し(ステップS25)、音声キ
ー7が離された場合は、入力を中断したものと見做し
て、ステップS38にて入力処理を終了する。
【0028】音声キー7が未だ押下されている場合は、
音声認識処理を行なう(ステップS26)。この音声認
識処理は、図3に示したフローチャートに従って行われ
る。音声認識処理が終了すると、図5に示したフォーマ
ットにて認識結果が返却される。次に、音声認識結果の
第1候補であるN1をデータD(n)にセットする(ス
テップS27)。ここで、nは6桁の数字の1〜6を意
味する。そして、音声認識結果を示すデータ中のフラグ
22により音声認識結果が正常認識か否かをチェックす
る(ステップS28)その結果、正常認識であれば、辞
書中のN1のナンバーに対応した単語を入力数nに対応
した表示位置に表示する(ステップS29)。そして、
正常認識か、エラー認識かを示す入力状態フラグF
(n)に正常フラグをセットし(ステップS30)、ス
テップS36に移行する。
音声認識処理を行なう(ステップS26)。この音声認
識処理は、図3に示したフローチャートに従って行われ
る。音声認識処理が終了すると、図5に示したフォーマ
ットにて認識結果が返却される。次に、音声認識結果の
第1候補であるN1をデータD(n)にセットする(ス
テップS27)。ここで、nは6桁の数字の1〜6を意
味する。そして、音声認識結果を示すデータ中のフラグ
22により音声認識結果が正常認識か否かをチェックす
る(ステップS28)その結果、正常認識であれば、辞
書中のN1のナンバーに対応した単語を入力数nに対応
した表示位置に表示する(ステップS29)。そして、
正常認識か、エラー認識かを示す入力状態フラグF
(n)に正常フラグをセットし(ステップS30)、ス
テップS36に移行する。
【0029】ステップS28にて音声認識結果がエラー
認識であると判別された場合は、その旨(すなわち、音
声認識結果が不正確である旨)を使用者に知らしめるべ
く、N1のナンバーに対応した単語を入力数nに対応し
た表示位置に反転表示する(ステップS31)。そし
て、返却されたエラーナンバーを入力状態フラグF
(n)にセットし(ステップS32)、エラー回数En
をカウントアップする(ステップS33)。
認識であると判別された場合は、その旨(すなわち、音
声認識結果が不正確である旨)を使用者に知らしめるべ
く、N1のナンバーに対応した単語を入力数nに対応し
た表示位置に反転表示する(ステップS31)。そし
て、返却されたエラーナンバーを入力状態フラグF
(n)にセットし(ステップS32)、エラー回数En
をカウントアップする(ステップS33)。
【0030】次に、エラー回数Enが予め定めた一定回
数Exを超えたか否かをチェックし(ステップS3
4)、超えていなければ、そのままステップS36に進
み、超えていれば、エラー回数が多いことを警告するブ
ザーを鳴らして(ステップS35)、ステップS36に
進む。なお、このようにエラー回数で警告音を発するこ
となく、正常認識した時にエラーカウントEnをクリア
するようにすれば、連続してエラー認識が一定回数Ex
を超えて発生した時に警告音を発するようにしてもよ
い。
数Exを超えたか否かをチェックし(ステップS3
4)、超えていなければ、そのままステップS36に進
み、超えていれば、エラー回数が多いことを警告するブ
ザーを鳴らして(ステップS35)、ステップS36に
進む。なお、このようにエラー回数で警告音を発するこ
となく、正常認識した時にエラーカウントEnをクリア
するようにすれば、連続してエラー認識が一定回数Ex
を超えて発生した時に警告音を発するようにしてもよ
い。
【0031】ステップS36では、入力数nをカウント
アップする。そして、入力数nが表示画面の入力エリア
12の桁数である“6”を超えたか否かを判別し(ステ
ップS37)、超えていなければステップS25に戻る
ことにより、次の桁へ入力ができるようにする。これ
は、n回目の入力を正常認識/エラー認識の区別なく終
了し、次の入力を行なえることを意味している。一方、
入力数nが表示画面の入力エリア12の桁数である
“6”を超えたときは、ステップS38にて入力処理を
終了する。
アップする。そして、入力数nが表示画面の入力エリア
12の桁数である“6”を超えたか否かを判別し(ステ
ップS37)、超えていなければステップS25に戻る
ことにより、次の桁へ入力ができるようにする。これ
は、n回目の入力を正常認識/エラー認識の区別なく終
了し、次の入力を行なえることを意味している。一方、
入力数nが表示画面の入力エリア12の桁数である
“6”を超えたときは、ステップS38にて入力処理を
終了する。
【0032】次に、図7のフローチャートで説明した処
理に対応する入力画面の変遷例を図8に基づいて説明す
る。表示部6に6桁の音声入力エリア12が表示されて
おり、この音声入力エリア12の表示状態は、例えば次
のように変遷する。まずステップS26で2重線で表す
カーソルが1桁目に表示され1桁目の入力であることが
示される。この状態で音声キー7を押下し、マイク2に
より音声で「イチ」と入力すると(ステップS27)、
音声認識結果として1桁目に“1”が表示され(ステッ
プS28)、カーソルは次の2桁目に移動する。続いて
ステップS29で「サン」と音声入力すると“3”が2
桁目に表示され(ステップS30)、カーソルは次の3
桁目に移動する。
理に対応する入力画面の変遷例を図8に基づいて説明す
る。表示部6に6桁の音声入力エリア12が表示されて
おり、この音声入力エリア12の表示状態は、例えば次
のように変遷する。まずステップS26で2重線で表す
カーソルが1桁目に表示され1桁目の入力であることが
示される。この状態で音声キー7を押下し、マイク2に
より音声で「イチ」と入力すると(ステップS27)、
音声認識結果として1桁目に“1”が表示され(ステッ
プS28)、カーソルは次の2桁目に移動する。続いて
ステップS29で「サン」と音声入力すると“3”が2
桁目に表示され(ステップS30)、カーソルは次の3
桁目に移動する。
【0033】次にステップS31で「イチ」と音声入力
したが、ステップS32では3桁目に“7”が表示さ
れ、これは音声認識結果としてエラー認識が発生したた
めに反転表示となっている。ただし、エラーが発生して
もカーソルは次の4桁目に移動し、次の桁の入力が可能
になっている。続いてステップS33で「ハチ」と音声
入力することにより、ステップS34で“8”が4桁目
に正常に表示され、カーソルは次の5桁目に移動してい
る。ステップS35では「ニー」と音声入力することに
より、ステップS36では“2”が表示され、カーソル
は次の6桁目に移動している。ただし、この“2”は音
声認識結果としては正しいが認識の正確度が低いためエ
ラー認識と判定されて反転表示になっている。次にステ
ップS37で「キュウ」と音声入力することにより、ス
テップS38で“9”が6桁目に正常に表示されてい
る。
したが、ステップS32では3桁目に“7”が表示さ
れ、これは音声認識結果としてエラー認識が発生したた
めに反転表示となっている。ただし、エラーが発生して
もカーソルは次の4桁目に移動し、次の桁の入力が可能
になっている。続いてステップS33で「ハチ」と音声
入力することにより、ステップS34で“8”が4桁目
に正常に表示され、カーソルは次の5桁目に移動してい
る。ステップS35では「ニー」と音声入力することに
より、ステップS36では“2”が表示され、カーソル
は次の6桁目に移動している。ただし、この“2”は音
声認識結果としては正しいが認識の正確度が低いためエ
ラー認識と判定されて反転表示になっている。次にステ
ップS37で「キュウ」と音声入力することにより、ス
テップS38で“9”が6桁目に正常に表示されてい
る。
【0034】次に、図7のフローチャートにおけるステ
ップS33、S34、S35のエラー処理の具体例を図
9に基づいて説明する。エラーの警告ブザーを鳴らすカ
ウント数Exを例えば“2”と設定したとすると、ステ
ップS39では既に許容限度の2回のエラー認識が発生
していることになる。この状態でステップS40「ニ
ー」と音声入力したとする。この場合、認識結果として
は“2”が正しく表示されたが、認識の正確度が低いた
めエラー認識と判定されて反転表示されると共に、エラ
ー回数がEx=2を超えて“3”になるので、ブザーが
警告音として“ピッピー”と鳴る。これは、エラー回数
が多い場合に、マイクの位置がずれている等の理由でエ
ラーを起こしている可能性を使用者に警告するものであ
る。ただし、カーソルは次の桁に移動し、入力の中断を
余儀なくされることはない。
ップS33、S34、S35のエラー処理の具体例を図
9に基づいて説明する。エラーの警告ブザーを鳴らすカ
ウント数Exを例えば“2”と設定したとすると、ステ
ップS39では既に許容限度の2回のエラー認識が発生
していることになる。この状態でステップS40「ニ
ー」と音声入力したとする。この場合、認識結果として
は“2”が正しく表示されたが、認識の正確度が低いた
めエラー認識と判定されて反転表示されると共に、エラ
ー回数がEx=2を超えて“3”になるので、ブザーが
警告音として“ピッピー”と鳴る。これは、エラー回数
が多い場合に、マイクの位置がずれている等の理由でエ
ラーを起こしている可能性を使用者に警告するものであ
る。ただし、カーソルは次の桁に移動し、入力の中断を
余儀なくされることはない。
【0035】次に、音声入力終了後の修正・確定動作を
図10に基づいて説明する。6桁の音声入力が終了する
と、ステップS41に示した修正画面が表示される。こ
の修正画面には、「全再入力」ボタンが表示される。未
確定部(エラー認識箇所)は反転表示のままである。2
重線で表すカーソルは、カ−ソルキー8で動かすことが
できる。ここで「全再入力」を選択すれば、全ての音声
認識結果を初期化して入力処理をやり直すことになる。
未確定の“7”の位置にカーソルを移動させて訂正キー
10を押下すると、入力状態フラグF(3)(3桁目の
ためn=3)が正常認識かエラー認識かをチェックし、
エラー認識の時には図6のエラーナンバーとエラーイン
デックスから保管したエラー情報を読出し、ステップS
42の個別修正画面が表示される。
図10に基づいて説明する。6桁の音声入力が終了する
と、ステップS41に示した修正画面が表示される。こ
の修正画面には、「全再入力」ボタンが表示される。未
確定部(エラー認識箇所)は反転表示のままである。2
重線で表すカーソルは、カ−ソルキー8で動かすことが
できる。ここで「全再入力」を選択すれば、全ての音声
認識結果を初期化して入力処理をやり直すことになる。
未確定の“7”の位置にカーソルを移動させて訂正キー
10を押下すると、入力状態フラグF(3)(3桁目の
ためn=3)が正常認識かエラー認識かをチェックし、
エラー認識の時には図6のエラーナンバーとエラーイン
デックスから保管したエラー情報を読出し、ステップS
42の個別修正画面が表示される。
【0036】なお、訂正キー10が押下された段階で、
エラー認識に係る桁にカーソルを自動的に移動させるよ
うにすれば、使い勝手が向上する。また、訂正順序につ
いては、必ずしも入力順に行う必要はなく、現在のカー
ソル位置に近い順に訂正することで、カーソルの移動量
を減らすことも可能である。
エラー認識に係る桁にカーソルを自動的に移動させるよ
うにすれば、使い勝手が向上する。また、訂正順序につ
いては、必ずしも入力順に行う必要はなく、現在のカー
ソル位置に近い順に訂正することで、カーソルの移動量
を減らすことも可能である。
【0037】ステップS42の個別修正面面では、未確
定の“7”に対応する第1候補から第5候補までが表示
されている。ここで音声再生キー9を押下すると、圧縮
保管した音声データが復元され、DAコンバータ20を
介してスピーカ3から未確定の“7”に対応する入力音
声が再生される。ここで自分の入力した音声を聞き、確
認して候補から選択してもよく、ステップS43では再
生音声を聞いた結果として“1”を選択し、ENTキー
11にて確定している。確定するとデータD(3)に
“1”がセットされ、入力状態フラグF(3)が正常認
識に変更され、エラーインデックスもクリアされ、ステ
ップS44に示すように反転表示から非反転表示に切り
替わり、エラーが解除されたことが示される。
定の“7”に対応する第1候補から第5候補までが表示
されている。ここで音声再生キー9を押下すると、圧縮
保管した音声データが復元され、DAコンバータ20を
介してスピーカ3から未確定の“7”に対応する入力音
声が再生される。ここで自分の入力した音声を聞き、確
認して候補から選択してもよく、ステップS43では再
生音声を聞いた結果として“1”を選択し、ENTキー
11にて確定している。確定するとデータD(3)に
“1”がセットされ、入力状態フラグF(3)が正常認
識に変更され、エラーインデックスもクリアされ、ステ
ップS44に示すように反転表示から非反転表示に切り
替わり、エラーが解除されたことが示される。
【0038】個別修正画面でなく修正画面の状態でEN
Tキー11を押下することは全確定を意味するものであ
り、ステップS44で5桁目の“2”がまだ未確定の状
態でENTキー11を押下すると、ステップS45に示
す確認画面が表示される。ここで、“2”のままで良け
れば、ENTキー11を押下して全確定を実行させ、修
正を終了する。“2”が間違っている場合は訂正キー1
0を押下して修正画面に戻り、上記の個別修正を行う。
Tキー11を押下することは全確定を意味するものであ
り、ステップS44で5桁目の“2”がまだ未確定の状
態でENTキー11を押下すると、ステップS45に示
す確認画面が表示される。ここで、“2”のままで良け
れば、ENTキー11を押下して全確定を実行させ、修
正を終了する。“2”が間違っている場合は訂正キー1
0を押下して修正画面に戻り、上記の個別修正を行う。
【0039】次に、他の修正例を図11に基づいて説明
する。ステップS46は修正画面であるが、未確定頂目
はない状態である。ここでカーソルを6桁目の“9”に
合わせ、訂正キー10を押下する。つまり、エラー認識
は発生していないが音声認識結果が間違っている場合
や、言い間違えた場合の修正例である。この場合には、
入力状態フラグF(6)が正常終了となっており、入力
音声情報は保管されていないため、ステップS47に示
すように音声による再入力待ちとなる。なお、この時点
では元の“9”は消されていないため、訂正キー10を
押せば元の状態に戻る。
する。ステップS46は修正画面であるが、未確定頂目
はない状態である。ここでカーソルを6桁目の“9”に
合わせ、訂正キー10を押下する。つまり、エラー認識
は発生していないが音声認識結果が間違っている場合
や、言い間違えた場合の修正例である。この場合には、
入力状態フラグF(6)が正常終了となっており、入力
音声情報は保管されていないため、ステップS47に示
すように音声による再入力待ちとなる。なお、この時点
では元の“9”は消されていないため、訂正キー10を
押せば元の状態に戻る。
【0040】ここで、音声キー7を押下し、音声で「イ
チ」と入力すればステップS49の画面に移る。ここで
は、確実に入力するため、第1候補から第5候補を表示
し、カーソルにて選択して確定する。すなわち、ここで
第1候補の“1”を選択してENTキー11を押下する
ことにより6桁目が“1”に確定され、データD(6)
に“1”がセットされ、F(6)に正常認識がセットさ
れる。この状態、つまり未確定桁がない状熊でENTキ
ー11を押下すると、ステップS51に示すように音声
入力が確走される。
チ」と入力すればステップS49の画面に移る。ここで
は、確実に入力するため、第1候補から第5候補を表示
し、カーソルにて選択して確定する。すなわち、ここで
第1候補の“1”を選択してENTキー11を押下する
ことにより6桁目が“1”に確定され、データD(6)
に“1”がセットされ、F(6)に正常認識がセットさ
れる。この状態、つまり未確定桁がない状熊でENTキ
ー11を押下すると、ステップS51に示すように音声
入力が確走される。
【0041】このように、未確定のまま次の入力を行な
うことができるため、エラー認識により作業が中断され
ることはない。また、後でまとめて訂正を行なう時に、
入力した音声を用いて確認でき、訂正が容易である。さ
らに、−定回数以上のエラー認識が発生した時に警告が
なされるため、エラー認識の度に警告されることなく、
異常な入力環境を回避することができる。
うことができるため、エラー認識により作業が中断され
ることはない。また、後でまとめて訂正を行なう時に、
入力した音声を用いて確認でき、訂正が容易である。さ
らに、−定回数以上のエラー認識が発生した時に警告が
なされるため、エラー認識の度に警告されることなく、
異常な入力環境を回避することができる。
【0042】また、個別訂正を行う場合に必ずしも入力
順に訂正を行わなくてもよいため、現在のカーソルの位
置から近い順に訂正することができ、さらに、訂正キー
の押下に応答して個別訂正画面を表示する際に、エラー
認識箇所に自動的にカーソルを移動させることができる
など、使い勝手が向上する。
順に訂正を行わなくてもよいため、現在のカーソルの位
置から近い順に訂正することができ、さらに、訂正キー
の押下に応答して個別訂正画面を表示する際に、エラー
認識箇所に自動的にカーソルを移動させることができる
など、使い勝手が向上する。
【0043】なお、本発明は、上記の実施形態に限定さ
れることなく、例えば、音声入力機能を有するものであ
れば、水道や電力使用料メータの検針用のハンディター
ミナル以外の電子機器に適用することも可能である。
れることなく、例えば、音声入力機能を有するものであ
れば、水道や電力使用料メータの検針用のハンディター
ミナル以外の電子機器に適用することも可能である。
【0044】
【発明の効果】以上説明したように、当発明によれば、
入力された音声を認識する認識手段と、前記認識手段に
よる音声認識結果の正確度が低い場合に、該音声認識結
果を未確定状態で表示したまま次の入力を許可する許可
手段を備えたので、表示面面を見ることができない状態
や連続した入力を行ないたい場合に、修正のための画面
のチェックを音声認識結果の正確度が低いエラー認識が
発生する毎に行なう必要がなくなり、音声入力処理時の
操作環境を良化し、使い勝手が向上する。
入力された音声を認識する認識手段と、前記認識手段に
よる音声認識結果の正確度が低い場合に、該音声認識結
果を未確定状態で表示したまま次の入力を許可する許可
手段を備えたので、表示面面を見ることができない状態
や連続した入力を行ないたい場合に、修正のための画面
のチェックを音声認識結果の正確度が低いエラー認識が
発生する毎に行なう必要がなくなり、音声入力処理時の
操作環境を良化し、使い勝手が向上する。
【図1】本発明を適用したハンディターミナルの外観図
である。
である。
【図2】上記ハンディターミナルの電気的な概略構成を
示すブロック図である。
示すブロック図である。
【図3】音声認識処理を示すフローチャートである。
【図4】図3の続きのフローチャートである。
【図5】認識結果情報のフォーマットを示す概念図であ
る。
る。
【図6】エラーインデックスを示す概念図である。
【図7】音声入力処理を示すフローチャートである。
【図8】音声入力処理時の表示画面の変遷例を示す図で
ある。
ある。
【図9】エラー処理例を説明するための説明図である。
【図10】音声認識の確定操作例を説明するための説明
図である。
図である。
【図11】音声認識の他の確定操作例を説明するための
説明図である。
説明図である。
1:ヘッドセット 2:マイク 3:スピーカ 5:ハンディターミナル 6:表示部 7:音声キー 8:カーソルキー 9:音声再生キー 10:訂正キー 11:ENTキー 12:音声入力エリア 15:制御部 17:メモリ 18:入力部 22:正常認識/エラー認識を示すフラグ
Claims (18)
- 【請求項1】 入力された音声を認識する認識手段と、 前記認識手段による音声認識結果の正確度が低い場合
に、該音声認識結果を未確定状態で表示したまま次の入
力を許可する許可手段を備えたことを特徴とする音声入
力装置。 - 【請求項2】 前記認識手段による音声認識結果の正確
度が低い場合に、対応する入力音声データを保存する保
存手段と、 前記保存手段にて保存された入力音声データを再生する
再生手段と、 を備えたことを特徴とする請求項1記載の音声入力装
置。 - 【請求項3】 前記認識手段による音声認識結果の正確
度が低い場合が規定回数より多く発生したときに、その
旨を警告する警告手段を有することを特徴とする請求項
1、または請求項2記載の音声入力装置。 - 【請求項4】 入力確定処理に移行する際に、前記未確
定の音声認識結果の位置にカーソルを自動的に移動させ
る移動手段を有することを特徴とする請求項1〜3のい
ずれかに記載の音声入力装置。 - 【請求項5】 入力確定処理時に、入力順とは無関係に
任意の未確定位置の確定処理を許可する第2の許可手段
を有することを特徴とする請求項1〜4のいずれかに記
載の音声入力装置。 - 【請求項6】 前記音声入力装置は、水道使用料メータ
等の検針用に用いられるハンディターミナルに適用され
ることを特徴とする請求項1〜5のいずれかに記載の音
声入力装置。 - 【請求項7】 入力された音声を認識する認識工程と、 前記認識工程による音声認識結果の正確度が低い場合
に、該音声認識結果を未確定状態で表示したまま次の入
力を許可する許可工程を備えたことを特徴とする音声入
力方法。 - 【請求項8】 前記認識工程による音声認識結果の正確
度が低い場合に、対応する入力音声データを保存する保
存工程と、 前記保存工程にて保存された入力音声データを再生する
再生工程と、 を備えたことを特徴とする請求項7記載の音声入力方
法。 - 【請求項9】 前記認識工程による音声認識結果の正確
度が低い場合が規定回数より多く発生したときに、その
旨を警告する警告工程を有することを特徴とする請求項
7、または請求項8記載の音声入力方法。 - 【請求項10】 入力確定処理に移行する際に、前記未
確定の音声認識結果の位置にカーソルを自動的に移動さ
せる移動工程を有することを特徴とする請求項7〜9の
いずれかに記載の音声入力方法。 - 【請求項11】 入力確定処理時に、入力順とは無関係
に任意の未確定位置の確定処理を許可する第2の許可工
程を有することを特徴とする請求項7〜10のいずれか
に記載の音声入力方法。 - 【請求項12】 前記音声入力方法は、水道使用料メー
タ等の検針用に用いられるハンディターミナルに適用さ
れることを特徴とする請求項7〜11のいずれかに記載
の音声入力方法。 - 【請求項13】 音声入力処理用のプログラムを記憶し
た記憶媒体であって、前記プログラムは、 入力された音声を認識する認識ルーチンと、 前記認識ルーチンによる音声認識結果の正確度が低い場
合に、該音声認識結果を未確定状態で表示したまま次の
入力を許可する許可ルーチンを含むことを特徴とする記
憶媒体。 - 【請求項14】 前記認識ルーチンによる音声認識結果
の正確度が低い場合に、対応する入力音声データを保存
する保存ルーチンと、 前記保存ルーチンにて保存された入力音声データを再生
する再生ルーチンと、 を含むことを特徴とする請求項12記載の記憶媒体。 - 【請求項15】 前記認識ルーチンによる音声認識結果
の正確度が低い場合が規定回数より多く発生したとき
に、その旨を警告する警告ルーチンを含むことを特徴と
する請求項12、または請求項14記載の記憶媒体。 - 【請求項16】 入力確定処理に移行する際に、前記未
確定の音声認識結果の位置にカーソルを自動的に移動さ
せる移動ルーチンを含むことを特徴とする請求項13〜
15のいずれかに記載の記憶媒体。 - 【請求項17】 入力確定処理時に、入力順とは無関係
に任意の未確定位置の確定処理を許可する第2の許可ル
ーチンを含むことを特徴とする請求項13〜16のいず
れかに記載の記憶媒体。 - 【請求項18】 前記音声入力処理用のプログラムは、
水道使用料メータ等の検針用に用いられるハンディター
ミナルにて実行されることを特徴とする請求項13〜1
7のいずれかに記載の記憶媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11101351A JP2000293193A (ja) | 1999-04-08 | 1999-04-08 | 音声入力装置、音声入力方法、及び記憶媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11101351A JP2000293193A (ja) | 1999-04-08 | 1999-04-08 | 音声入力装置、音声入力方法、及び記憶媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000293193A true JP2000293193A (ja) | 2000-10-20 |
Family
ID=14298427
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11101351A Withdrawn JP2000293193A (ja) | 1999-04-08 | 1999-04-08 | 音声入力装置、音声入力方法、及び記憶媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000293193A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007509377A (ja) * | 2003-10-21 | 2007-04-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ユーザインタフェースを有するインテリジェント音声認識 |
| JP2010197669A (ja) * | 2009-02-25 | 2010-09-09 | Kyocera Corp | 携帯端末、編集誘導プログラムおよび編集装置 |
| WO2017191711A1 (ja) * | 2016-05-02 | 2017-11-09 | ソニー株式会社 | 制御装置、制御方法およびコンピュータプログラム |
| CN110161307A (zh) * | 2019-06-21 | 2019-08-23 | 广东电网有限责任公司 | 一种基于语音控制的电表 |
-
1999
- 1999-04-08 JP JP11101351A patent/JP2000293193A/ja not_active Withdrawn
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007509377A (ja) * | 2003-10-21 | 2007-04-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ユーザインタフェースを有するインテリジェント音声認識 |
| JP4864712B2 (ja) * | 2003-10-21 | 2012-02-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ユーザインタフェースを有するインテリジェント音声認識 |
| JP2010197669A (ja) * | 2009-02-25 | 2010-09-09 | Kyocera Corp | 携帯端末、編集誘導プログラムおよび編集装置 |
| WO2017191711A1 (ja) * | 2016-05-02 | 2017-11-09 | ソニー株式会社 | 制御装置、制御方法およびコンピュータプログラム |
| US11170180B2 (en) | 2016-05-02 | 2021-11-09 | Sony Corporation | Control device and control method |
| CN110161307A (zh) * | 2019-06-21 | 2019-08-23 | 广东电网有限责任公司 | 一种基于语音控制的电表 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8954172B2 (en) | Method and apparatus to process an audio user interface and audio device using the same | |
| RU2374780C2 (ru) | Обработка телефонных номеров в звуковых потоках | |
| US6470076B1 (en) | Portable telephone with voice-prompted menu screens | |
| US7682893B2 (en) | Method and apparatus for providing an instrument playing service | |
| US7130387B2 (en) | Communication terminal, communication method and program thereof | |
| JP2000293193A (ja) | 音声入力装置、音声入力方法、及び記憶媒体 | |
| US20060009264A1 (en) | Method for voice dialing of telephone number | |
| US20040015353A1 (en) | Voice recognition key input wireless terminal, method, and computer readable recording medium therefor | |
| FR2671924A1 (fr) | Telephone pour l'identification du destinataire. | |
| EP1432199B1 (en) | Grouping apparatus, grouping program of communication devices | |
| US9772739B2 (en) | Method for controlling a system, especially an electrical and/or electronic system comprising at least one application device | |
| KR100283167B1 (ko) | 음성인식전화기의음성메모장치 | |
| CN118069138A (zh) | 代码分析方法、装置、电子设备和存储介质 | |
| JPH11261683A (ja) | 電話装置、プログラムを記録した記録媒体及びデータを記録した記録媒体 | |
| KR20020050775A (ko) | 휴대폰의 버튼음 및 메뉴음 음성출력장치 | |
| KR100309377B1 (ko) | 무선 단말기에서 음성 다이얼링 방법 | |
| KR940006513B1 (ko) | 자동응답장치의 등록 전화번호 원격 확인방법 | |
| KR100214574B1 (ko) | 음성 인식 기기의 등록 여부알림 방법 | |
| KR850001416B1 (ko) | 전화 자동 응답방식 | |
| KR960011283B1 (ko) | 디지탈 음향 기기에서의 선곡번호 입력 방법 및 장치 | |
| JP2000032108A (ja) | 通信装置 | |
| JPH06225030A (ja) | 遊戯場管理情報提供方法および装置 | |
| JPH08161145A (ja) | マン・マシンマンインタフェース方法及び情報処理機器 | |
| JP2003167667A (ja) | 操作手順記憶機能付き携帯電話機、及びその操作手順記憶方法 | |
| JPS6390954A (ja) | パ−ソナルコンピユ−タ |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060210 |
|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060704 |