JPH0876786A - 情報処理装置 - Google Patents
情報処理装置Info
- Publication number
- JPH0876786A JPH0876786A JP6212325A JP21232594A JPH0876786A JP H0876786 A JPH0876786 A JP H0876786A JP 6212325 A JP6212325 A JP 6212325A JP 21232594 A JP21232594 A JP 21232594A JP H0876786 A JPH0876786 A JP H0876786A
- Authority
- JP
- Japan
- Prior art keywords
- command
- voice
- input
- voice pattern
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】本発明の目的は、コマンドにたいする表現を覚
えておかなくても、同じ意味であれば、様々な表現の音
声入力でコマンド入力が可能な情報処理装置を提供する
ことにある。 【構成】キーボード、または、ポインティング入力装置
を介してコマンドを入力するコマンド入力手段と、コマ
ンドに対応する処理を実行するコマンド実行手段と、コ
マンドを表現する少なくとも一つ以上の単語の音声パタ
ーンデータおよび該音声パターンデータに対応するコマ
ンドを記憶する音声パターン辞書と、音声入力装置を介
して音声データを入力する音声入力手段と、入力される
音声データと上記音声パターン辞書とからコマンドを特
定し、上記コマンド実行手段に処理の実行を指示するコ
マンド実行指示手段を備える。
えておかなくても、同じ意味であれば、様々な表現の音
声入力でコマンド入力が可能な情報処理装置を提供する
ことにある。 【構成】キーボード、または、ポインティング入力装置
を介してコマンドを入力するコマンド入力手段と、コマ
ンドに対応する処理を実行するコマンド実行手段と、コ
マンドを表現する少なくとも一つ以上の単語の音声パタ
ーンデータおよび該音声パターンデータに対応するコマ
ンドを記憶する音声パターン辞書と、音声入力装置を介
して音声データを入力する音声入力手段と、入力される
音声データと上記音声パターン辞書とからコマンドを特
定し、上記コマンド実行手段に処理の実行を指示するコ
マンド実行指示手段を備える。
Description
【0001】
【産業上の利用分野】本発明は、パーソナルコンピュー
タ,ワークステーション,ワードプロセッサなどの情報
処理装置に係り、特に処理の実行を指示するコマンドを
音声入力装置を介して入力する情報処理装置に関する。
タ,ワークステーション,ワードプロセッサなどの情報
処理装置に係り、特に処理の実行を指示するコマンドを
音声入力装置を介して入力する情報処理装置に関する。
【0002】
【従来の技術】キーボード操作や、画面上のメニューを
ポインティングデバイスで指定する操作等によって、一
度に選択できるコマンドの数は、キーボードのキー数や
画面サイズで制限されるため、コマンドを階層的に構成
し、複数ステップの操作で所望のコマンドを入力しなけ
ればならないのに対し、音声によるコマンド入力はコマ
ンド数の制約がなくキーボードやポインティングデバイ
ス操作より短いステップで所望のコマンドを選ぶことが
できるという利点がある。つまり、キーボードやポイン
ティングデバイスでのコマンド入力手順を踏まなくても
よく、例えば、図形編集での線種変更の操作にしても、
変更する線種を指示する前に、線種変更を指示しなくて
も、直接変更する線種を音声で指示するような操作を提
供することができる。従来、音声入力装置を介してコマ
ンドを入力する方法としては、特開昭64−33682
号公報で、タッチパネル面の文字,記号,グラフィック
イメージ等の移動・拡大などを音声コマンドにより入力
する方法が述べられている。
ポインティングデバイスで指定する操作等によって、一
度に選択できるコマンドの数は、キーボードのキー数や
画面サイズで制限されるため、コマンドを階層的に構成
し、複数ステップの操作で所望のコマンドを入力しなけ
ればならないのに対し、音声によるコマンド入力はコマ
ンド数の制約がなくキーボードやポインティングデバイ
ス操作より短いステップで所望のコマンドを選ぶことが
できるという利点がある。つまり、キーボードやポイン
ティングデバイスでのコマンド入力手順を踏まなくても
よく、例えば、図形編集での線種変更の操作にしても、
変更する線種を指示する前に、線種変更を指示しなくて
も、直接変更する線種を音声で指示するような操作を提
供することができる。従来、音声入力装置を介してコマ
ンドを入力する方法としては、特開昭64−33682
号公報で、タッチパネル面の文字,記号,グラフィック
イメージ等の移動・拡大などを音声コマンドにより入力
する方法が述べられている。
【0003】
【発明が解決しようとする課題】上記従来技術などの音
声入力装置は、例えば、削除機能にたいして、「削除」
という表現で音声入力することになっており、音声で入
力するコマンドの表現に関して、配慮されていない。情
報処理装置においては、同じ機能にたいしても装置によ
ってはその表現が異なる場合があり、例えば、削除機能
でも、「削除」以外にも「消去」,「カット」等、様々
な表現が使われている。また、一般的にも一つの単語に
たいして、他の表現ができるため、人によってその表現
が異なる場合がある。したがって、操作する情報処理装
置になれていない操作者にとっては、事前にコマンドの
表現を調べておき覚えておく必要がある。あるいは、音
声入力した表現が受け付けられなければ表現を変えて入
力しなおさなければならないという使い勝手上の問題が
ある。
声入力装置は、例えば、削除機能にたいして、「削除」
という表現で音声入力することになっており、音声で入
力するコマンドの表現に関して、配慮されていない。情
報処理装置においては、同じ機能にたいしても装置によ
ってはその表現が異なる場合があり、例えば、削除機能
でも、「削除」以外にも「消去」,「カット」等、様々
な表現が使われている。また、一般的にも一つの単語に
たいして、他の表現ができるため、人によってその表現
が異なる場合がある。したがって、操作する情報処理装
置になれていない操作者にとっては、事前にコマンドの
表現を調べておき覚えておく必要がある。あるいは、音
声入力した表現が受け付けられなければ表現を変えて入
力しなおさなければならないという使い勝手上の問題が
ある。
【0004】本発明の目的は、コマンドにたいする表現
を覚えておかなくても、同じ意味であれば、様々な表現
の音声でコマンド入力が可能な情報処理装置を提供する
ことにある。
を覚えておかなくても、同じ意味であれば、様々な表現
の音声でコマンド入力が可能な情報処理装置を提供する
ことにある。
【0005】
【課題を解決するための手段】上記目的を達成するため
に本発明は、キーボード、または、ポインティング入力
装置を介してコマンドを入力するコマンド入力手段と、
コマンドに対応する処理を実行するコマンド実行手段
と、コマンドを表現する少なくとも一つ以上の単語の音
声パターンデータおよび該音声パターンデータに対応す
るコマンドを記憶する音声パターン辞書と、音声入力装
置を介して音声データを入力する音声入力手段と、入力
される音声データと上記音声パターン辞書とからコマン
ドを特定し、上記コマンド実行手段に処理の実行を指示
するコマンド実行指示手段を備える。
に本発明は、キーボード、または、ポインティング入力
装置を介してコマンドを入力するコマンド入力手段と、
コマンドに対応する処理を実行するコマンド実行手段
と、コマンドを表現する少なくとも一つ以上の単語の音
声パターンデータおよび該音声パターンデータに対応す
るコマンドを記憶する音声パターン辞書と、音声入力装
置を介して音声データを入力する音声入力手段と、入力
される音声データと上記音声パターン辞書とからコマン
ドを特定し、上記コマンド実行手段に処理の実行を指示
するコマンド実行指示手段を備える。
【0006】また、上記キーボード、ポインティング入
力装置、または、音声入力装置を介して、上記音声パタ
ーン辞書の音声パターンデータおよび該音声パターンデ
ータに対応するコマンドを登録する音声パターン登録手
段を備え、コマンドにたいして操作者が独自の表現を登
録するようにしてもよい。
力装置、または、音声入力装置を介して、上記音声パタ
ーン辞書の音声パターンデータおよび該音声パターンデ
ータに対応するコマンドを登録する音声パターン登録手
段を備え、コマンドにたいして操作者が独自の表現を登
録するようにしてもよい。
【0007】
【作用】音声入力装置を介して入力される音声データ
は、コマンド実行指示手段に送られ、音声パターン辞書
の音声パターンとのマッチングをおこなう。次に、マッ
チングにより特定される音声パターンに対応するコマン
ドは、コマンド実行手段に送られ、該当するコマンドに
対応する処理が実行される。
は、コマンド実行指示手段に送られ、音声パターン辞書
の音声パターンとのマッチングをおこなう。次に、マッ
チングにより特定される音声パターンに対応するコマン
ドは、コマンド実行手段に送られ、該当するコマンドに
対応する処理が実行される。
【0008】音声パターン辞書には、一つのコマンドに
たいして、少なくとも一つ以上のことなる表現の単語の
音声パターンを保持しているので、各コマンドにたいし
て操作者の知っている単語で入力することができる。
たいして、少なくとも一つ以上のことなる表現の単語の
音声パターンを保持しているので、各コマンドにたいし
て操作者の知っている単語で入力することができる。
【0009】
【実施例】以下、本発明の一実施例を図を用いて説明す
る。
る。
【0010】図1は、本実施例の情報処理装置の構成を
示すブロック図である。本発明の情報処理装置として
は、パーソナルコンピュータやワードプロセッサなどの
装置が主な対象となるが特にこれを限定するものではな
い。図1において、101は装置全体の制御を行うCP
U、102はプログラムやデータを記憶するメモリ、1
03は表示データを表示手段104に表示させる表示制
御手段、104は液晶ディスプレイやCRTなどの表示
手段、105は入力手段106を介してデータの入力制
御を行う入力制御手段、106はキーボードやマウス,
タブレットなどの入力手段、107は音声入力手段10
8を介して入力される音声をディジタルデータに変換す
るA/D変換器、108はマイクロフォンなどの音声入
力手段、109は記憶手段110に対するデータの記憶
制御を行う記憶制御手段、110はフロッピディスクや
ハードディスク,ICカードなどの記憶手段である。記
憶手段110には、上記各手段の動作を規定するプログ
ラムやデータ、音声パターン辞書を記憶しており、メモ
リ102に読み出される。
示すブロック図である。本発明の情報処理装置として
は、パーソナルコンピュータやワードプロセッサなどの
装置が主な対象となるが特にこれを限定するものではな
い。図1において、101は装置全体の制御を行うCP
U、102はプログラムやデータを記憶するメモリ、1
03は表示データを表示手段104に表示させる表示制
御手段、104は液晶ディスプレイやCRTなどの表示
手段、105は入力手段106を介してデータの入力制
御を行う入力制御手段、106はキーボードやマウス,
タブレットなどの入力手段、107は音声入力手段10
8を介して入力される音声をディジタルデータに変換す
るA/D変換器、108はマイクロフォンなどの音声入
力手段、109は記憶手段110に対するデータの記憶
制御を行う記憶制御手段、110はフロッピディスクや
ハードディスク,ICカードなどの記憶手段である。記
憶手段110には、上記各手段の動作を規定するプログ
ラムやデータ、音声パターン辞書を記憶しており、メモ
リ102に読み出される。
【0011】図2は、図1の情報処理装置の各構成手段
の動作からなる機能の構成と制御の流れを示す図であ
る。図2において、201は図1の103から108の
各手段などによりユーザと情報処理システムとの情報交
換方法を提供するユーザインタフェース部、202は、
ユーザの入力情報から処理すべきコマンドを判定するコ
マンド解析部、203は、入力が音声である場合にコマ
ンドとして判定するコマンド実行指示部、204は、コ
マンド解析部202あるいはコマンド実行指示部203
からの指示によりコマンドに対する処理を実行するコマ
ンド実行部である。該指示は、各コマンドに割り付けた
番号で行い、コマンド実行部203は、指示された番号
に該当する処理を実行する。また、ユーザから音声が入
力されると、ユーザインタフェース部201は音声入力
手段108を介して取り込み、A/D変換器107がデ
ィジタルデータに変換した後、コマンド解析部202に
音声入力があった由を通知する。該通知は、コマンド解
析部202を介して、コマンド実行指示部203に渡さ
れ、コマンド実行指示部203は、上記ディジタルデー
タから処理すべきコマンドを判定する。該判定処理を図
3を用いて説明する。
の動作からなる機能の構成と制御の流れを示す図であ
る。図2において、201は図1の103から108の
各手段などによりユーザと情報処理システムとの情報交
換方法を提供するユーザインタフェース部、202は、
ユーザの入力情報から処理すべきコマンドを判定するコ
マンド解析部、203は、入力が音声である場合にコマ
ンドとして判定するコマンド実行指示部、204は、コ
マンド解析部202あるいはコマンド実行指示部203
からの指示によりコマンドに対する処理を実行するコマ
ンド実行部である。該指示は、各コマンドに割り付けた
番号で行い、コマンド実行部203は、指示された番号
に該当する処理を実行する。また、ユーザから音声が入
力されると、ユーザインタフェース部201は音声入力
手段108を介して取り込み、A/D変換器107がデ
ィジタルデータに変換した後、コマンド解析部202に
音声入力があった由を通知する。該通知は、コマンド解
析部202を介して、コマンド実行指示部203に渡さ
れ、コマンド実行指示部203は、上記ディジタルデー
タから処理すべきコマンドを判定する。該判定処理を図
3を用いて説明する。
【0012】コマンド実行指示部203は、上記ディジ
タルデータを10msのフレーム周期で特徴ベクトルと
して、例えば、斎藤,中田「音声情報処理の基礎」(オ
ーム社、昭和56)記載のLPCケプストラム係数の時
系列に変換する(301)。ここでフレーム周期は10
msに限定されることなく、20ms,30msなど任
意に設定することができる。また、特徴ベクトルも、L
PCケプストラム係数のみに限定されず、バンドパスフ
ィルタの出力などを使用することも可能である。次に3
01で求めた特徴ベクトルを音声パターン辞書とのマッ
チングを行う(302)。音声パターン辞書は、図4に
示すように、コマンドを表現する少なくとも一つ以上の
単語の音声パターンデータ401と該当するコマンドの
コマンド番号402を1レコードとして記憶している。
例えば、「削除」,「消去」,「カット」という単語の
音声パターンデータに対するコマンド番号は同じコマン
ド番号が割り当てている。また、音声パターンデータ4
01は、301で求めた特徴ベクトルと同形式のデータ
であり、マッチングは該音声パターンデータ401で行
う。マッチングが成功した場合には、該当するコマンド
番号をコマンド実行部204に通知する。
タルデータを10msのフレーム周期で特徴ベクトルと
して、例えば、斎藤,中田「音声情報処理の基礎」(オ
ーム社、昭和56)記載のLPCケプストラム係数の時
系列に変換する(301)。ここでフレーム周期は10
msに限定されることなく、20ms,30msなど任
意に設定することができる。また、特徴ベクトルも、L
PCケプストラム係数のみに限定されず、バンドパスフ
ィルタの出力などを使用することも可能である。次に3
01で求めた特徴ベクトルを音声パターン辞書とのマッ
チングを行う(302)。音声パターン辞書は、図4に
示すように、コマンドを表現する少なくとも一つ以上の
単語の音声パターンデータ401と該当するコマンドの
コマンド番号402を1レコードとして記憶している。
例えば、「削除」,「消去」,「カット」という単語の
音声パターンデータに対するコマンド番号は同じコマン
ド番号が割り当てている。また、音声パターンデータ4
01は、301で求めた特徴ベクトルと同形式のデータ
であり、マッチングは該音声パターンデータ401で行
う。マッチングが成功した場合には、該当するコマンド
番号をコマンド実行部204に通知する。
【0013】上記動作と音声パターン辞書の構成によ
り、処理する意味が同じであれば、コマンドをいろいろ
な単語を用いて音声入力することができる。
り、処理する意味が同じであれば、コマンドをいろいろ
な単語を用いて音声入力することができる。
【0014】また、ユーザ固有の表現でコマンド入力で
きるように、上記音声パターン辞書の音声パターンデー
タ401および該音声パターンデータに対応するコマン
ド番号402は、上記入力手段106、または、音声入
力手段108を介して、登録できるようにしてもよい。
きるように、上記音声パターン辞書の音声パターンデー
タ401および該音声パターンデータに対応するコマン
ド番号402は、上記入力手段106、または、音声入
力手段108を介して、登録できるようにしてもよい。
【0015】
【発明の効果】本発明によれば、コマンドの表現が異な
る情報処理装置であっても、操作する情報処理装置にな
れていなくても、同じ意味であれば、様々な表現でコマ
ンド入力することができるので、事前にコマンドの表現
を調べておき覚えておく必要もなく、操作者の知ってい
る単語で入力することができる。
る情報処理装置であっても、操作する情報処理装置にな
れていなくても、同じ意味であれば、様々な表現でコマ
ンド入力することができるので、事前にコマンドの表現
を調べておき覚えておく必要もなく、操作者の知ってい
る単語で入力することができる。
【図1】本発明の情報処理装置の構成を示すブロック図
である。
である。
【図2】機能構成図である。
【図3】コマンド実行指示部の動作手順を示すフローチ
ャートである。
ャートである。
【図4】音声パターン辞書の構成例を示す図である。
101…CPU、102…メモリ、103…表示制御手
段、104…表示手段、105…入力制御手段、106
…入力手段、107…A/D変換器、108…音声入力
手段、109…記憶制御手段、110…記憶手段、20
1…ユーザインタフェース部、202…コマンド解析
部、203…コマンド実行指示部、204…コマンド実
行部。
段、104…表示手段、105…入力制御手段、106
…入力手段、107…A/D変換器、108…音声入力
手段、109…記憶制御手段、110…記憶手段、20
1…ユーザインタフェース部、202…コマンド解析
部、203…コマンド実行指示部、204…コマンド実
行部。
Claims (2)
- 【請求項1】キーボード、または、ポインティング入力
装置を介してコマンドを入力するコマンド入力手段と、
コマンドに対応する処理を実行するコマンド実行手段と
を備える情報処理装置であって、コマンドを表現する少
なくとも一つ以上の単語の音声パターンデータおよび該
音声パターンデータに対応するコマンドを記憶する音声
パターン辞書と、音声入力装置を介して音声データを入
力する音声入力手段と、入力される音声データと上記音
声パターン辞書とからコマンドを特定し、上記コマンド
実行手段に処理の実行を指示するコマンド実行指示手段
を備えたことを特徴とする情報処理装置。 - 【請求項2】請求項1記載の情報処理装置において、上
記キーボード、ポインティング入力装置、または、音声
入力装置を介して、上記音声パターン辞書の音声パター
ンデータおよび該音声パターンデータに対応するコマン
ドを登録する音声パターン登録手段を備えたことを特徴
とする情報処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6212325A JPH0876786A (ja) | 1994-09-06 | 1994-09-06 | 情報処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6212325A JPH0876786A (ja) | 1994-09-06 | 1994-09-06 | 情報処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0876786A true JPH0876786A (ja) | 1996-03-22 |
Family
ID=16620674
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6212325A Pending JPH0876786A (ja) | 1994-09-06 | 1994-09-06 | 情報処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0876786A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004523039A (ja) * | 2001-02-02 | 2004-07-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声xmlファイルを自動的に生成する方法およびシステム |
| WO2008004486A1 (en) * | 2006-07-06 | 2008-01-10 | Panasonic Corporation | Voice input device |
| JP2016502302A (ja) * | 2012-12-07 | 2016-01-21 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 音声によるバックグラウンド制御方法、移動体端末、及び非一時的なコンピュータ読み取り可能な記憶媒体 |
-
1994
- 1994-09-06 JP JP6212325A patent/JPH0876786A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004523039A (ja) * | 2001-02-02 | 2004-07-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声xmlファイルを自動的に生成する方法およびシステム |
| WO2008004486A1 (en) * | 2006-07-06 | 2008-01-10 | Panasonic Corporation | Voice input device |
| US8279171B2 (en) | 2006-07-06 | 2012-10-02 | Panasonic Corporation | Voice input device |
| JP2016502302A (ja) * | 2012-12-07 | 2016-01-21 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 音声によるバックグラウンド制御方法、移動体端末、及び非一時的なコンピュータ読み取り可能な記憶媒体 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH08123648A (ja) | 対話ボックスを持つデータ処理装置 | |
| JPH07222248A (ja) | 携帯型情報端末における音声情報の利用方式 | |
| JPH0876786A (ja) | 情報処理装置 | |
| CN115857782A (zh) | 一种基于人工智能的自动化信息录入方法和系统 | |
| JP2504779B2 (ja) | 音声入力機能付き文書処理装置 | |
| JPS60146327A (ja) | 計算機対話方法 | |
| JPH087121A (ja) | 情報処理装置、および、属性変更方法 | |
| JP2000020085A (ja) | 音声認識装置及び音声認識プログラムを記録した記録媒体 | |
| JP2001005806A (ja) | 文字入力装置及び入力制御方法 | |
| JPS6388627A (ja) | ユーザ定義コマンドの自動作成方式 | |
| JPH04130571A (ja) | 数値演算方式 | |
| JPH06149465A (ja) | 手書き入力装置 | |
| JPH05314328A (ja) | マニュアルカードおよび情報処理装置 | |
| JP2001273290A (ja) | 文字入力装置、文字入力方法及びコンピュータ読取り可能な記録媒体 | |
| JPH06175834A (ja) | アプリケーション開発支援装置 | |
| JP2002007015A (ja) | 情報処理装置およびコンピュータ読み取り可能な記憶媒体 | |
| JPH07334611A (ja) | 非認識文字の表示方法 | |
| JPH0695827A (ja) | ガイド装置 | |
| JP2755585B2 (ja) | 質問処理システム | |
| JPS61196360A (ja) | ワ−ドプロセツサ | |
| JPH04278620A (ja) | 文章読み上げ装置 | |
| JPH0922409A (ja) | 文書作成装置 | |
| JPH07282044A (ja) | 情報管理装置及び入力制御方法 | |
| JPH02125364A (ja) | 中国語入力装置 | |
| JPH08167045A (ja) | 図形処理装置およびその方法 |