JPH04163618A - 音声操作コンピュータ - Google Patents
音声操作コンピュータInfo
- Publication number
- JPH04163618A JPH04163618A JP2290177A JP29017790A JPH04163618A JP H04163618 A JPH04163618 A JP H04163618A JP 2290177 A JP2290177 A JP 2290177A JP 29017790 A JP29017790 A JP 29017790A JP H04163618 A JPH04163618 A JP H04163618A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- command
- sound
- control device
- recognition device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011017 operating method Methods 0.000 description 2
- 101100120289 Drosophila melanogaster Flo1 gene Proteins 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
この発明は、音声認識装置を付加したコンピュータに関
するものである。
するものである。
(従来の技術)
従来、コンピュータの操作方法は次のようなものであっ
た。
た。
コンピュータは、あおよそ第2図(A)に示すように、
コンピュータ(こ対しでコマシトを入力するキーボード
205、プログラムを実行する制御装置2O6、実行中
のプログラムや処理中のデータを格納する主記憶装置2
0B、実行可能なプログラムや高速で処理する必要のな
い大量のデータを保存する2次記憶装[202を備えで
いてコマンド入力のための音声認識装置を備えていない
構成となっている。ここでは、その他の出力装置、通信
製Mなどについての図示と説明は省略する。
コンピュータ(こ対しでコマシトを入力するキーボード
205、プログラムを実行する制御装置2O6、実行中
のプログラムや処理中のデータを格納する主記憶装置2
0B、実行可能なプログラムや高速で処理する必要のな
い大量のデータを保存する2次記憶装[202を備えで
いてコマンド入力のための音声認識装置を備えていない
構成となっている。ここでは、その他の出力装置、通信
製Mなどについての図示と説明は省略する。
主記憶装置208の内部にはオペレーティングシステム
と呼ばれるプログラムか存在し、制御装置206の動作
手順を定めている。
と呼ばれるプログラムか存在し、制御装置206の動作
手順を定めている。
2次記惚装M2O2にはティレフト1ノ領域203と呼
ばれる記憶領域かあり、多数のファイルの名称(以降フ
ァイル名と称する)・属性・記憶場所などの管理情報2
07を保存している。ここではファイル名の例として実
行可能ファイルの属性を持つワードプロセッサのプログ
ラムファイルのファイル名「ワードプロセッサ」と、表
計算のプログラムファイルのファイル名「表計算」か示
されているとして、以下の説明を行う。
ばれる記憶領域かあり、多数のファイルの名称(以降フ
ァイル名と称する)・属性・記憶場所などの管理情報2
07を保存している。ここではファイル名の例として実
行可能ファイルの属性を持つワードプロセッサのプログ
ラムファイルのファイル名「ワードプロセッサ」と、表
計算のプログラムファイルのファイル名「表計算」か示
されているとして、以下の説明を行う。
先す、コンピュータをキーボード205によって操作す
る手順を第2図(B)および(C)を参照して説明する
。キーボード205によって使用者か例えば「表計算」
とコマンドを入力すると、制御表M2O6はオペレーテ
ィングシステム209のプログラムに基づいて、このコ
マンド名に対応したファイル名を持つ管理情報をディレ
クトリ指定(250)およびバス指定(251)に基づ
いてディレクトリ領域203の中から模索し、そのファ
イル名に対応した属性を読む(笥2図(B)に点線で示
す)。このファイル名のファイルか実行可能ファイルで
あるという属性を持っていれば、管理情報207の中の
記憶場所(図示せず)に基づいてファイル204(この
場合には表計算プログラムファイル)を読み出し、主記
憶装N2O3上に転送して、このファイル204内のプ
ログラムの美行を開始する(第2図(C)に点線で示す
)。
る手順を第2図(B)および(C)を参照して説明する
。キーボード205によって使用者か例えば「表計算」
とコマンドを入力すると、制御表M2O6はオペレーテ
ィングシステム209のプログラムに基づいて、このコ
マンド名に対応したファイル名を持つ管理情報をディレ
クトリ指定(250)およびバス指定(251)に基づ
いてディレクトリ領域203の中から模索し、そのファ
イル名に対応した属性を読む(笥2図(B)に点線で示
す)。このファイル名のファイルか実行可能ファイルで
あるという属性を持っていれば、管理情報207の中の
記憶場所(図示せず)に基づいてファイル204(この
場合には表計算プログラムファイル)を読み出し、主記
憶装N2O3上に転送して、このファイル204内のプ
ログラムの美行を開始する(第2図(C)に点線で示す
)。
尚、通常、上記ティレフト「ノ領域は他のディレクトリ
領域を参照できるようになっており、使用するティレフ
トリの変更もキーボードからのコマンドによって指定で
きるようになっている(この指定をディレクトリ指定2
50と称する)。また通常、上記ファイルの検索の検索
対象となるディレクトリ領域は任意に指定可能となって
いる(この指定をバス指定251と称する)。
領域を参照できるようになっており、使用するティレフ
トリの変更もキーボードからのコマンドによって指定で
きるようになっている(この指定をディレクトリ指定2
50と称する)。また通常、上記ファイルの検索の検索
対象となるディレクトリ領域は任意に指定可能となって
いる(この指定をバス指定251と称する)。
一方、内部コマンドと呼ばれるコマンドに対してはオペ
レーティングシステム209か処理を行い、必すしも上
記のような2次記憶装置202からの読み出しを必要と
じない。この内部コマンドの場合には一般にその実行手
順が主記憶装置208或いは制御表[206の中に存在
し、入力されたコマンドか内部コマシトである場合には
制御表M2O6か即座に天性を行う。
レーティングシステム209か処理を行い、必すしも上
記のような2次記憶装置202からの読み出しを必要と
じない。この内部コマンドの場合には一般にその実行手
順が主記憶装置208或いは制御表[206の中に存在
し、入力されたコマンドか内部コマシトである場合には
制御表M2O6か即座に天性を行う。
(発明か解決しようとする課題)
しかしながら、上述した従来の操作方法では、コマンド
入力の手段としでキーボードしかないため、キーボード
入力に手間力\かがり、操作までに時間かかかる。
入力の手段としでキーボードしかないため、キーボード
入力に手間力\かがり、操作までに時間かかかる。
また、従来構成のコンピュータでは、キーボード入力の
代わりに音声認識による入力によってファイルを指定し
て操作しようとするためには、全てのコマンド名やファ
イルの数の語索に対応できる大語業の、従って高性能な
音声認識装置か必要であった。
代わりに音声認識による入力によってファイルを指定し
て操作しようとするためには、全てのコマンド名やファ
イルの数の語索に対応できる大語業の、従って高性能な
音声認識装置か必要であった。
この発明の目的は、以上述べたキーボード入力によって
操作するまでに手間と時間がかかるという問題点を除去
し、少数の語業に対応した音声認識装置によって音声の
司令により操作できるコンピュータを提供することにあ
る。
操作するまでに手間と時間がかかるという問題点を除去
し、少数の語業に対応した音声認識装置によって音声の
司令により操作できるコンピュータを提供することにあ
る。
(課題を解決するための手段)
この目的の達成を図るため、この発明の音声操作コンピ
ュータによれば、 コマンドを入力するキーボードと、このキーボードと接
続されプログラムを実行する制御装置と、この制御装置
と接続され実行中のプログラムや処理中のデータを格納
する主記憶装置と、制御装置と接続され美行可能なプロ
グラムや高速で処理する必要のないデータを保存する2
次記憶装置と、制御装置と接続され発声音声の認識処理
を行って認識結果を制御装置へ出力する音声認識装置を
備えており、 2次記憶装苫は、オブジェクトの管理情報やそのデータ
構造自体(こ音声認識の性能の向上を図るための音声情
報を付加しで記憶してあり、制御装置は、キーボードか
ら入力したコマントに応じて現在の操作の対象となって
いるオブジェクト固有の音声情報を、認識のための基準
パターンとして、音声認識装置に伝達する機能を具えて
いることを特徴とする。
ュータによれば、 コマンドを入力するキーボードと、このキーボードと接
続されプログラムを実行する制御装置と、この制御装置
と接続され実行中のプログラムや処理中のデータを格納
する主記憶装置と、制御装置と接続され美行可能なプロ
グラムや高速で処理する必要のないデータを保存する2
次記憶装置と、制御装置と接続され発声音声の認識処理
を行って認識結果を制御装置へ出力する音声認識装置を
備えており、 2次記憶装苫は、オブジェクトの管理情報やそのデータ
構造自体(こ音声認識の性能の向上を図るための音声情
報を付加しで記憶してあり、制御装置は、キーボードか
ら入力したコマントに応じて現在の操作の対象となって
いるオブジェクト固有の音声情報を、認識のための基準
パターンとして、音声認識装置に伝達する機能を具えて
いることを特徴とする。
(作用)
コンピュータは通常、実行可能な全てのコマンド、プロ
グラムを操作の対象とはせず、サーチバスと呼ばれるコ
マンド・プログラムの探索領域指定を行ったり、カレン
トディレクトリを定めで使用者に表示するなど、操作の
対象となるデータ、プログラムなどを限定する手段を持
つ。
グラムを操作の対象とはせず、サーチバスと呼ばれるコ
マンド・プログラムの探索領域指定を行ったり、カレン
トディレクトリを定めで使用者に表示するなど、操作の
対象となるデータ、プログラムなどを限定する手段を持
つ。
この発明では使用者にとって現在の操作の対象となるデ
ータ、プログラム、絵文字(アイコン)、ボタンなどの
対象物(以降これをオブジェクトと称する)の管理情報
やそのデータ構造自体に、それぞれのオブジェクト固有
の、読み方・音声の特徴量・話者などの音声認識の性能
を向上させるための情報(以降これを音声情報と称する
)を付加してあき、現在の操作の対象となる複数のオブ
ジェクトが定まったときにオブジェクト固有の音声情報
を自動的に音声認識装置に伝達し、音声認識袋Nを動作
させる。音声認識装置はこのオブジェクト固有の音声情
報をもとに、認識対象の読み・特8!量・話者等を限定
し、音声認識を行う。音声が発声され、認識結果が得ら
れると、その認識結果は制御装置に入力され、コンピュ
ータはキーボードやマウスによるコマンド入力と同様の
処理によって操作される。
ータ、プログラム、絵文字(アイコン)、ボタンなどの
対象物(以降これをオブジェクトと称する)の管理情報
やそのデータ構造自体に、それぞれのオブジェクト固有
の、読み方・音声の特徴量・話者などの音声認識の性能
を向上させるための情報(以降これを音声情報と称する
)を付加してあき、現在の操作の対象となる複数のオブ
ジェクトが定まったときにオブジェクト固有の音声情報
を自動的に音声認識装置に伝達し、音声認識袋Nを動作
させる。音声認識装置はこのオブジェクト固有の音声情
報をもとに、認識対象の読み・特8!量・話者等を限定
し、音声認識を行う。音声が発声され、認識結果が得ら
れると、その認識結果は制御装置に入力され、コンピュ
ータはキーボードやマウスによるコマンド入力と同様の
処理によって操作される。
(実施例)
以下、図面を参照しで、この発明の実施例につき説明す
る。
る。
この発明の一実施例を第1図、第3図および第4図を用
いて説明する。
いて説明する。
この発明の音声操作コンピュータの全体の構成はおおよ
そ第1図(A)に示すような構成を持つ。このコンピュ
ータは、これに対してコマンドを入力するキーボード1
05、プログラムを実行する制御装置106、実行中の
プログラムや処理中のデータを格納する主記憶装置10
8、実行可能なプログラムや高速で処理する必要のない
大量のデータを保存する2次記憶装!102!備えでい
る。ここでは、その他の出力装置、通信装置は、この発
明とは直接間係ないのでこれらについての図示と説明は
省略する。2次記憶装M102には通常複数のディレク
トリ領域103と呼ばれる記憶領域かある。ここまでは
通常のコンピュータと同様の構成となっている。
そ第1図(A)に示すような構成を持つ。このコンピュ
ータは、これに対してコマンドを入力するキーボード1
05、プログラムを実行する制御装置106、実行中の
プログラムや処理中のデータを格納する主記憶装置10
8、実行可能なプログラムや高速で処理する必要のない
大量のデータを保存する2次記憶装!102!備えでい
る。ここでは、その他の出力装置、通信装置は、この発
明とは直接間係ないのでこれらについての図示と説明は
省略する。2次記憶装M102には通常複数のディレク
トリ領域103と呼ばれる記憶領域かある。ここまでは
通常のコンピュータと同様の構成となっている。
この発明では、入力装置としではキーホード]05のほ
かに音声認識装置701を備えている。この実施例にお
いては、音声認識装置1101は一例として単語単位の
音声認識装置%用いるとする。また、この発明では、フ
ァイルの名称・属性・記憶場所などの管理情報107に
は特別に音声認識の性能を向上させるための情報118
を保存している。
かに音声認識装置701を備えている。この実施例にお
いては、音声認識装置1101は一例として単語単位の
音声認識装置%用いるとする。また、この発明では、フ
ァイルの名称・属性・記憶場所などの管理情報107に
は特別に音声認識の性能を向上させるための情報118
を保存している。
また、第3図には制御表M106の詳細を示す構成図、
第4図には制御装置708の動作を示すフローを示す。
第4図には制御装置708の動作を示すフローを示す。
第3図において、301は内部コマンド記憶手段、30
2はコマンド模索手段、303はコマンド実行手段を示
す。内部コマンド記憶手段307は内部コマンドの名称
、美行手順などとともに、内部コマシト固有の音声特徴
パタンを記憶してあり、音声特徴バタンは音声認識装置
]01に必要に応しで転送される。コマンド検索手段3
02は入力されたコマンド8検索する。
2はコマンド模索手段、303はコマンド実行手段を示
す。内部コマンド記憶手段307は内部コマンドの名称
、美行手順などとともに、内部コマシト固有の音声特徴
パタンを記憶してあり、音声特徴バタンは音声認識装置
]01に必要に応しで転送される。コマンド検索手段3
02は入力されたコマンド8検索する。
コマンド検索手段302は、外部コマンドを検索するた
めに2次記憶装M]02と情報のやりとりができる構成
となっている。コマンド実行手段303はコマンドを実
行する。そのため、このコマンド実行手段303は、キ
ーボード105および音声認識装置101と情報のヤり
とりができる構成となっていると共に、2次記憶装置1
02および主記憶装置108と情報のやりとりができる
構成ともなっている。
めに2次記憶装M]02と情報のやりとりができる構成
となっている。コマンド実行手段303はコマンドを実
行する。そのため、このコマンド実行手段303は、キ
ーボード105および音声認識装置101と情報のヤり
とりができる構成となっていると共に、2次記憶装置1
02および主記憶装置108と情報のやりとりができる
構成ともなっている。
第4図においで(S])〜(Sl○)は制御装置106
の内部の処理ステップを示す。
の内部の処理ステップを示す。
ここで説明する実施例(こおいで、ある一つのディレク
トリ領域103の名称が[業務Jであるとする。また、
ファイル名「ワードプロセッサ」を持つワードプロセッ
サプログラムファイルに対しては単語音声「ワープロJ
の音声特徴バタンを管理情報107の中に保存し、ファ
イル名「表計算」を持つ表計算プログラムファイルに対
しては単語音声「表計算jの音声特徴バタンを管理情報
107の中に保存しておくとする。
トリ領域103の名称が[業務Jであるとする。また、
ファイル名「ワードプロセッサ」を持つワードプロセッ
サプログラムファイルに対しては単語音声「ワープロJ
の音声特徴バタンを管理情報107の中に保存し、ファ
イル名「表計算」を持つ表計算プログラムファイルに対
しては単語音声「表計算jの音声特徴バタンを管理情報
107の中に保存しておくとする。
また、第3図の内部コマンド記憶手段301にはオペレ
ーティングシステムの内部コマンド固有の名称およびそ
の操作に対応する音声特徴バタンか予め格納されている
とする。
ーティングシステムの内部コマンド固有の名称およびそ
の操作に対応する音声特徴バタンか予め格納されている
とする。
次に、このような情況下にある実施例における音声操作
コンピュータの動作例を、第1図(B)、(C)、(D
)、菓3図および第4図により説明する。
コンピュータの動作例を、第1図(B)、(C)、(D
)、菓3図および第4図により説明する。
〈音声特徴バタンの消去・書き換え〉
先ず、コンピュータの起動時における動作ヤコマントの
入力によってバス指定、ディレクトリ指定の設定・変更
を行う。このバス指定、ディレクトリ指定の設定・変更
の際、制御装置106は先ず、直前まで用いられていた
バス或いはディレクトリに対応した音声特徴バタンを消
去し、指定・変更後のバス指定、ディレクトリ指定に対
応し、現在の操作の対象となる可能性かあるファイルの
音声特徴バタンを音声認識装置101に送る。
入力によってバス指定、ディレクトリ指定の設定・変更
を行う。このバス指定、ディレクトリ指定の設定・変更
の際、制御装置106は先ず、直前まで用いられていた
バス或いはディレクトリに対応した音声特徴バタンを消
去し、指定・変更後のバス指定、ディレクトリ指定に対
応し、現在の操作の対象となる可能性かあるファイルの
音声特徴バタンを音声認識装置101に送る。
これにつき説明する、この実施例の場合、例えば、MS
−DO3と同様のコマンドを持つオペレーティングシス
テムとした場合には、オペレータは、通常、キーボード
操作によって”cd¥業務”かディレクトリ指定変更の
コマンドとして入力する。このとき、先ず制御装置10
6の内部のコマンド検索手段302か第4図における処
理ステップS1、S21経てこのコマンド行を入力する
。
−DO3と同様のコマンドを持つオペレーティングシス
テムとした場合には、オペレータは、通常、キーボード
操作によって”cd¥業務”かディレクトリ指定変更の
コマンドとして入力する。このとき、先ず制御装置10
6の内部のコマンド検索手段302か第4図における処
理ステップS1、S21経てこのコマンド行を入力する
。
コマンド検索手段302は処理ステップS3により、オ
ペレーティングシステムの内部コマンドとして内部コマ
ンド記憶手段301に予め記憶されでいる内部コマンド
特有の文字列との照合を行う。このコマンド”cd”は
内部コマンドの1 fi類であるので、照合は内部コマ
ンドと一致し、S4の判断により、処理ステップS5に
進む。もしも入力されたコマンドか外部コマンドであっ
たり、プログラムであった場合には、処理ステップS1
0により、外部コマンド或いはプログラムを実行して処
理ステップS2に戻る。
ペレーティングシステムの内部コマンドとして内部コマ
ンド記憶手段301に予め記憶されでいる内部コマンド
特有の文字列との照合を行う。このコマンド”cd”は
内部コマンドの1 fi類であるので、照合は内部コマ
ンドと一致し、S4の判断により、処理ステップS5に
進む。もしも入力されたコマンドか外部コマンドであっ
たり、プログラムであった場合には、処理ステップS1
0により、外部コマンド或いはプログラムを実行して処
理ステップS2に戻る。
処理ステップS5では、コマンド検索手段302におい
て、キーボード105から入力されたこの内部コマンド
かディレクトリ指定やバス指定の変更であるかどうかを
判断する。このコマンド″ccj″はディレクトリ指定
のコマンドなので、処理ステップ86に進む6もしも入
力されたコマンドがディレクトリ指定やバス指定の変更
でなければ、処理ステップS9で当該内部コマンドを実
行し、処理ステップS2に戻る。
て、キーボード105から入力されたこの内部コマンド
かディレクトリ指定やバス指定の変更であるかどうかを
判断する。このコマンド″ccj″はディレクトリ指定
のコマンドなので、処理ステップ86に進む6もしも入
力されたコマンドがディレクトリ指定やバス指定の変更
でなければ、処理ステップS9で当該内部コマンドを実
行し、処理ステップS2に戻る。
処理ステップS6では、コマンド実行手段303が音声
認識装置]01に対して音声認識装置101の内部にあ
る音声特徴バタンの消去を指示する。
認識装置]01に対して音声認識装置101の内部にあ
る音声特徴バタンの消去を指示する。
次に、処理ステップS7では、主記憶装百108の内部
のバス指定領域151およびディレクトリ指定領域11
0を入力されたコマンドの内容に従って変更する。ここ
では、ディレクトリ指定をディレクトリ名′°¥業務”
で書き換える。
のバス指定領域151およびディレクトリ指定領域11
0を入力されたコマンドの内容に従って変更する。ここ
では、ディレクトリ指定をディレクトリ名′°¥業務”
で書き換える。
次に、処理S8では、バス指定、ディレクトリ指定によ
って音声認識の対象となる内部コマンド、外部コマンド
、プログラムのディレクトリ領域から音声特徴バタンを
音声認識装置1101に転送する。そのため、ここでは
、先ず、内部コマンド記憶手段301の内部に蓄積され
でいる内部コマンドに対応した音声特徴バタンを音声認
識装置101に転送する。次に、ティレフトリ指定変更
後のカレントディレクトリ”¥業務”の情報%9照して
2次記憶装N102の中に存在するディレクトリ”¥業
務”の中に存在する、外部コマンドおよびプログラムの
ディレクトリ領t1i 103からそれぞれに対応した
音声特徴バタンを音声認識装置flO1に転送する。こ
こではディレクトリ”¥業務”の中に存在するプログラ
ム”ワードプロセッサパ、”表計算”104のディレク
トリ領域103に格納されでいる音声特徴バタン「ワー
プロ」、「表計算」118が音声認識装置101に転送
される。さらに、必要ならば、現在のバス指定によって
示されるディレクトリ内の外部コマンドおよびプログラ
ムのディレクトリ領域から音声認識装置101へ音声特
徴バタンを転送する。
って音声認識の対象となる内部コマンド、外部コマンド
、プログラムのディレクトリ領域から音声特徴バタンを
音声認識装置1101に転送する。そのため、ここでは
、先ず、内部コマンド記憶手段301の内部に蓄積され
でいる内部コマンドに対応した音声特徴バタンを音声認
識装置101に転送する。次に、ティレフトリ指定変更
後のカレントディレクトリ”¥業務”の情報%9照して
2次記憶装N102の中に存在するディレクトリ”¥業
務”の中に存在する、外部コマンドおよびプログラムの
ディレクトリ領t1i 103からそれぞれに対応した
音声特徴バタンを音声認識装置flO1に転送する。こ
こではディレクトリ”¥業務”の中に存在するプログラ
ム”ワードプロセッサパ、”表計算”104のディレク
トリ領域103に格納されでいる音声特徴バタン「ワー
プロ」、「表計算」118が音声認識装置101に転送
される。さらに、必要ならば、現在のバス指定によって
示されるディレクトリ内の外部コマンドおよびプログラ
ムのディレクトリ領域から音声認識装置101へ音声特
徴バタンを転送する。
以上で、現在操作の対象となるオブジェクトに対応した
音声特徴バタンか全て音声認識装置101に転送され、
次の操作を音声認識によって入力する準備か整ったので
、処理ステップS2に戻り、次のコマンドの入力と処理
を続ける。
音声特徴バタンか全て音声認識装置101に転送され、
次の操作を音声認識によって入力する準備か整ったので
、処理ステップS2に戻り、次のコマンドの入力と処理
を続ける。
このようにディレクトリ指定変更のコマンドに連動して
、音声認識装置101の認識対象となる音声はrワープ
ロJとr表計算Jとなる(第1図 。
、音声認識装置101の認識対象となる音声はrワープ
ロJとr表計算Jとなる(第1図 。
(B))。この実施例の場合にはディレクトリ指定の変
更時の動作について記したか、バス指定の変更時も同様
の動作を行う。
更時の動作について記したか、バス指定の変更時も同様
の動作を行う。
このように、音声認識装置101の標準バタンは、現在
の操作の対象となっているオブジェクト固有の音声に間
する情報(音声情報)によって自動的に書き換えられる
ため、音声認識装置101ヘマイクロホシ等の適当な音
声入力手段を介して発声音声を入力させ、この入力音声
によってコンピュータを操作するための音声認識の対象
となる音声は、現在のコンピュータの操作の対象となる
オブジェクトに関する音声に限定されることとなる。
の操作の対象となっているオブジェクト固有の音声に間
する情報(音声情報)によって自動的に書き換えられる
ため、音声認識装置101ヘマイクロホシ等の適当な音
声入力手段を介して発声音声を入力させ、この入力音声
によってコンピュータを操作するための音声認識の対象
となる音声は、現在のコンピュータの操作の対象となる
オブジェクトに関する音声に限定されることとなる。
〈音声認識装置による操作〉
次に、コンピュータを音声認識装置101によって操作
する手順を第1図(C)および(D)によって説明する
。音声認識装置tlO1に対して使用者がコマンドに対
応した音声、例えばr表計算Jを発声すると、音声認識
装置101は従来周知の認識処理を行って認識結果「表
計算Jを制御装置106に出力する。制御装置106は
第4図の処理フロー(32〜S4.510)に従ってこ
の認識結果に対応したプログラムのファイルをディレク
トリ領域103の中から検索しく第1図(C)に点線で
示す)、管理情報107の中の記憶場所に基づいて表計
算ファイル104を読み出し、主記憶装M108上に転
送して、このファイル104内のプログラムの実行を開
始する(第1図(D)に点線で示す)。また、発声内容
かプログラムに対応した音声ではなく、内部コマンドや
タト部コマンドに対応したものであれば、その発声内容
に対応した所望の動作が行われる。
する手順を第1図(C)および(D)によって説明する
。音声認識装置tlO1に対して使用者がコマンドに対
応した音声、例えばr表計算Jを発声すると、音声認識
装置101は従来周知の認識処理を行って認識結果「表
計算Jを制御装置106に出力する。制御装置106は
第4図の処理フロー(32〜S4.510)に従ってこ
の認識結果に対応したプログラムのファイルをディレク
トリ領域103の中から検索しく第1図(C)に点線で
示す)、管理情報107の中の記憶場所に基づいて表計
算ファイル104を読み出し、主記憶装M108上に転
送して、このファイル104内のプログラムの実行を開
始する(第1図(D)に点線で示す)。また、発声内容
かプログラムに対応した音声ではなく、内部コマンドや
タト部コマンドに対応したものであれば、その発声内容
に対応した所望の動作が行われる。
以上説明した実施例のように、2次記憶装置102の中
に存在するコマンド(通常、外部コマンドと呼ばれる)
のほかに、内部コマンドの実行も音声認識によって操作
できるように構成するのか好適である。この場合には、
内部コマンドに対応した音声特徴バタンか2次記憶装置
102の中に存在するオペレーティングシステムファイ
ルの管理情報(図示せず)とともに存在し、コンピュー
タの電源投入時にオペレーティングシステムファイル(
図示せず)が2次記憶装置102から制御装冨内の内部
コマンド記憶手段301に転送される際に音声特徴バタ
ンか音声認識装置101に転送するように構成するのか
好適である。
に存在するコマンド(通常、外部コマンドと呼ばれる)
のほかに、内部コマンドの実行も音声認識によって操作
できるように構成するのか好適である。この場合には、
内部コマンドに対応した音声特徴バタンか2次記憶装置
102の中に存在するオペレーティングシステムファイ
ルの管理情報(図示せず)とともに存在し、コンピュー
タの電源投入時にオペレーティングシステムファイル(
図示せず)が2次記憶装置102から制御装冨内の内部
コマンド記憶手段301に転送される際に音声特徴バタ
ンか音声認識装置101に転送するように構成するのか
好適である。
また、オペレーティングシステムに対するコマンドの指
定を音声認識で行うのと同様に、アプリケーションプロ
グラムに対するコマンドやファイルの指定を音声認識で
行う場合にも、音声特徴バタンかアプリケーションプロ
グラムファイルの管理領域ヤ揉作の対象となるファイル
の管理情報に付加しておくのが好適である。
定を音声認識で行うのと同様に、アプリケーションプロ
グラムに対するコマンドやファイルの指定を音声認識で
行う場合にも、音声特徴バタンかアプリケーションプロ
グラムファイルの管理領域ヤ揉作の対象となるファイル
の管理情報に付加しておくのが好適である。
さらに、上述した実施例では、音声認識装置として単語
音声認識袋Nを想定したか、この発明における音声認識
装置は必すしも単語単位の音声認識装置である必要はな
く、連続音声認識製雪であってもよい。この場合には、
管理情報の中には音声特徴バタンの代わりに、好ましく
は、ファイル固有の読み等の情報を音声に関する情報と
しで付加するのが良い。
音声認識袋Nを想定したか、この発明における音声認識
装置は必すしも単語単位の音声認識装置である必要はな
く、連続音声認識製雪であってもよい。この場合には、
管理情報の中には音声特徴バタンの代わりに、好ましく
は、ファイル固有の読み等の情報を音声に関する情報と
しで付加するのが良い。
ざらに、一般にコンピュータの操作の対象となる対象物
(以降これをオブジェクトと称する)は2次記憶装置上
のファイル、外部コマンドや制御装置内部の内部コマン
ドのみてはなく、C日Tティスプレィ上のカーソル、文
字、アイコン、ボタンを表現するデータ構造なども考え
られる。上述した実施例では内部コマンド、外部コマン
ドファイルやプログラムファイルをオブジェクトの一例
として挙げたか、オブジェクトは必すしもファイルのみ
に限定されるものではなく、例えば、マウス模作の対象
となるC日Tデイスプレィ上のアイコンやボタンを表現
するデータ構造をオブジェクトとして扱ってもよい。
(以降これをオブジェクトと称する)は2次記憶装置上
のファイル、外部コマンドや制御装置内部の内部コマン
ドのみてはなく、C日Tティスプレィ上のカーソル、文
字、アイコン、ボタンを表現するデータ構造なども考え
られる。上述した実施例では内部コマンド、外部コマン
ドファイルやプログラムファイルをオブジェクトの一例
として挙げたか、オブジェクトは必すしもファイルのみ
に限定されるものではなく、例えば、マウス模作の対象
となるC日Tデイスプレィ上のアイコンやボタンを表現
するデータ構造をオブジェクトとして扱ってもよい。
(発明の効果)
この発明によれば、音声認識装置によってコンピュータ
に対する操作を行う際に、認識対象となる音声を現在の
操作の対象となるオブジェクト(ファイル、データ構造
)に関連した音声に限定することかでき、音声認識の性
能か低く、少数の語粟しか認識できない場合でも容易に
コマンドの入力ができる。
に対する操作を行う際に、認識対象となる音声を現在の
操作の対象となるオブジェクト(ファイル、データ構造
)に関連した音声に限定することかでき、音声認識の性
能か低く、少数の語粟しか認識できない場合でも容易に
コマンドの入力ができる。
菓1図(A)〜(D)は、この発明の音声掃作コンピュ
ータの説明に供する図、 第2図(A)〜(C)は、従来のコシどユータの説明図
、 第3図は、この発明の音声操作コンピュータが備える制
御装置の説明に供する図、 笥4図は、第3図の動作フローである。 ]01・・・音声認識装置、102・・・2次記憶装冒
103−・・ディレクトリ領域 ]04・・・ファイル、 105・・・キーボード’
106・・・制御装置、 108・・・主記憶装置
]09・・・オへレーティングシステム]]○・・・デ
ィレクトリ指定 ]51・・・パス指定。
ータの説明に供する図、 第2図(A)〜(C)は、従来のコシどユータの説明図
、 第3図は、この発明の音声操作コンピュータが備える制
御装置の説明に供する図、 笥4図は、第3図の動作フローである。 ]01・・・音声認識装置、102・・・2次記憶装冒
103−・・ディレクトリ領域 ]04・・・ファイル、 105・・・キーボード’
106・・・制御装置、 108・・・主記憶装置
]09・・・オへレーティングシステム]]○・・・デ
ィレクトリ指定 ]51・・・パス指定。
Claims (1)
- (1)コマンドを入力するキーボードと、このキーボー
ドと接続されプログラムを実行する制御装置と、この制
御装置と接続され実行中のプログラムや処理中のデータ
を格納する主記憶装置と、前記制御装置と接続され実行
可能なプログラムや高速で処理する必要のないデータを
保存する2次記憶装置と、前記制御装置と接続され発声
音声の認識処理を行って認識結果を制御装置へ出力する
音声認識装置を備えており、 前記2次記憶装置は、オブジェクトの管理情報やそのデ
ータ構造自体に音声認識の性能の向上を図るための音声
情報を付加して記憶してあり、前記制御装置は、前記キ
ーボードから入力したコマンドに応じて現在の操作の対
象となっているオブジェクト固有の音声情報を、認識の
ための基準パターンとして、前記音声認識装置に伝達す
る機能を具えている ことを特徴とする音声操作コンピュータ。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2290177A JPH04163618A (ja) | 1990-10-26 | 1990-10-26 | 音声操作コンピュータ |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2290177A JPH04163618A (ja) | 1990-10-26 | 1990-10-26 | 音声操作コンピュータ |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04163618A true JPH04163618A (ja) | 1992-06-09 |
Family
ID=17752747
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2290177A Pending JPH04163618A (ja) | 1990-10-26 | 1990-10-26 | 音声操作コンピュータ |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04163618A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06348452A (ja) * | 1993-04-21 | 1994-12-22 | Internatl Business Mach Corp <Ibm> | 話されたコマンドを認識する対話式コンピュータ・システム |
-
1990
- 1990-10-26 JP JP2290177A patent/JPH04163618A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06348452A (ja) * | 1993-04-21 | 1994-12-22 | Internatl Business Mach Corp <Ibm> | 話されたコマンドを認識する対話式コンピュータ・システム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3725566B2 (ja) | 音声認識インターフェース | |
| US8831956B2 (en) | Speech command input recognition system for interactive computer display with interpretation of ancillary relevant speech query terms into commands | |
| US7177813B2 (en) | Middleware layer between speech related applications and engines | |
| JP3212618B2 (ja) | 対話処理装置 | |
| KR100438838B1 (ko) | 대화 포커스 추적 기능을 가진 음성명령 해석장치 및 방법 | |
| US5893063A (en) | Data processing system and method for dynamically accessing an application using a voice command | |
| JP2002116796A (ja) | 音声処理装置、音声処理方法及び記憶媒体 | |
| JPWO1998013771A1 (ja) | 対話処理装置 | |
| US6253177B1 (en) | Method and system for automatically determining whether to update a language model based upon user amendments to dictated text | |
| JP2005321730A (ja) | 対話システム、対話システム実行方法、及びコンピュータプログラム | |
| WO2019169722A1 (zh) | 快捷键识别方法、装置、设备以及计算机可读存储介质 | |
| JPH07222248A (ja) | 携帯型情報端末における音声情報の利用方式 | |
| US6275788B1 (en) | Interactive processing apparatus having natural language interfacing capability, utilizing goal frames, and judging action feasibility | |
| US7567904B2 (en) | Mobile listing system | |
| CN118278361B (zh) | 文档的生成方法、装置、电子设备和介质 | |
| KR102359964B1 (ko) | 음성인식 마우스를 이용한 사용자단말 제어 방법 | |
| CN112017647B (zh) | 一种结合语义的语音识别方法、装置和系统 | |
| JPH04163618A (ja) | 音声操作コンピュータ | |
| US6708271B1 (en) | Interactive multi-module system having a communication manager for achieving linked operation of plurality of modules and for defining whether and how an individual module can access a particular function | |
| WO2025138477A1 (zh) | 业务语料生成方法、装置、设备及计算机可读存储介质 | |
| JPH10133848A (ja) | パーソナルコンピュータおよびコマンド制御方法 | |
| JP3615309B2 (ja) | データ検索装置および方法、情報記憶媒体 | |
| JPH1124813A (ja) | マルチモーダル入力統合システム | |
| WO2022078189A1 (zh) | 一种支持动态意图的控制方法、装置及存储介质 | |
| KR20220043753A (ko) | 음성을 텍스트로 변환한 음성 기록에서 유사 발음의 단어를 포함하여 검색하는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체 |