JPH10275162A

JPH10275162A - プロセッサに基づくホスト・システムを制御する無線音声起動制御装置

Info

Publication number: JPH10275162A
Application number: JP10031975A
Authority: JP
Inventors: Phillip R Thrift; アール．スリフトフィリップ; Charles T Hemphill; ティー．ヘムフィルチャールズ
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1997-01-06
Filing date: 1998-01-06
Publication date: 1998-10-13
Also published as: EP0854417A2; SG72780A1; TW497044B; US6188985B1; EP0854417A3; KR19980070352A

Abstract

(57)【要約】【課題】ワールド・ワイド・ウェブに接続されたコン
ピュータのようなホスト・システムを制御する携帯無線
音声起動制御装置を提供する。【解決手段】携帯無線音声起動制御装置（１０）はデ
ィスプレイ（１０ａ）、前記オーディオ入力信号から導
き出したデータを前記ホスト・システムへ無線により送
信送信機（１０ｇ）と、前記ホスト・システムからイメ
ージ・データを無線により受信する受信機（１０ｈ）と
を有し、更にプロセッサ（１０ｅ）と、音声認識を実行
するメモリ（１０ｆ）とを有してもよい。無線音声起動
制御装置（２０）は、ウェブ・ブラウジング用に音声認
識とこの音声認識の結果の解釈との両方を実行するプロ
セッサ（２０ｅ）及びメモリ（２０ｆ）を有する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、概して音声認識装
置に関し、特にユーザが音声コマンドを有するワールド
・ワイド・ウェブ（ＷｏｒｌｄＷｉｄｅＷｅｂ）の
ようなハイパーメディア・ネットワークをブラウズ（検
索）できるようにさせた無線音声装置に関する。

【０００２】

【従来の技術】インターネットは世界中に及ぶコンピュ
ータ・ネットワークであり、より正確にはネットワーク
のうちのワールド・ワイド・ネットワークである。これ
は情報の交換を行わせると共に、広範なサービスを提供
する。今日、インターネットはあらゆる種類の施設、ビ
ジネス、更に人々の家庭での個人にまで及ぶように成長
した。

【０００３】ワールド・ワイド・ウェブ（“ＷＷＷ”又
は“Ｗｅｂ”）はインターネット上で利用可能なサービ
スのうちの一つである。これは、「ハイパーテキスト」
として知られている技術に基づいており、ドキュメント
がその他の部分に、又は他のドキュメントに対するリン
クを有する。ハイパーテキストは、イメージ及び音を含
め、コンピュータに記憶され得るどのような情報に対す
るリンクも包含するように拡張された。例えば、ウェブ
を用いてドキュメント内から要点のワード又は語句を選
択して世界の何処かに記憶されている定義、ソース又は
関連するドキュメントを得ることができる。

【０００４】ウェブにおける基本的な単位は、「ペー
ジ」であり、他のページに対してリンクを有する（通常
は）テキスト＋グラフのドキュメントである。ウェブを
「ナビゲートすること」は、主に、ページからページへ
と次々に移動することである。

【０００５】ウェブの背後にある考えは、あらゆる種類
のソースからあらゆる種類のデータを収集して、高性能
なサーバ及び高性能なクライアント・プログラムがデー
タのフォーマットを取り扱えるようにすることにより、
両立性がないという問題をなくすことである。適正な翻
訳コードがサーバ及びクライアントに付加されれば、複
数のフォーマットをうまく処理するこのような機能は、
マルチメディア・フォーマットを含め、ウェブがあらゆ
る種類のデータを受け取ることができるようにする。ウ
ェブ・クライアントは、ウェブ・サーバ上に位置するウ
ェブ・リソースに接続するために用いられ、またこのリ
ソースを用いるためのものである。

【０００６】

【発明が解決しようとする課題】ウェブをアクセスする
ために、またこれを使用するために用いられるクライア
ント・ソフトウェアの１形式は、「ウェブ・ブラウザ
（ｗｅｂｂｒｏｗｓｅｒ）」ソフトウェアと呼ばれて
いる。このソフトウェアは、ユーザのコンピュータにイ
ンストールされてグラフィック・インタフェースをさせ
てもよく、そこではマウス又は他の指示装置による選択
を容易にするためにリンクがハイライトされるか、又は
マークされる。

【０００７】

【課題を解決するための手段】本発明の１特徴は、ワー
ルド・ワイド・ウェブに接続されたコンピュータのよう
に、プロセッサに基づくホスト・システムを制御する無
線音声起動制御装置である。コンパクトな携帯装置がマ
イクロホン、無線オーディオ入力送信機、無線データ受
信機及びディスプレイを有する。このマイクロホンはユ
ーザからのボイス入力を受信して、オーディオ入力信号
として供給する。音声送信機はオーディオ入力信号から
導き出したデータをホスト・システムに無線により送信
する。ホスト・システムは、前記オーディオ入力信号に
対して作動した後、ある種の応答を受信機に無線により
送出されたイメージ・データ形式で送出する。ディスプ
レイはイメージ・データで表したイメージを発生して表
示する。

【０００８】無線音声起動制御装置の変形は、音声出力
情報用のスピーカを含むことができる。無線音声起動制
御装置は、更に、フロント・エンド・ボイス認識処理を
実行するプロセッサと、メモリとを有することもでき
る。

【０００９】本発明の効果は、ウェブ上の情報をよりア
クセスし易く、かつ有用にすることである。会話制御は
ウェブ・インタフェースに柔軟性を加えると共に機能性
を高めかつ情報に対するアクセスをより自然なものにす
る。

【００１０】

【発明の実施の形態】ここで説明する本発明は、プロセ
ッサに基づくホスト・システムを制御する無線音声起動
制御装置に関するものである。即ち、この無線音声起動
制御装置は音声起動遠方制御装置である。この説明例に
おいて、ホスト・システムはワールド・ワイド・ウェブ
に接続されたコンピュータであり、この無線音声起動制
御装置は音声制御されたウェブ・ブラウジングに用いら
れる。しかし、同一の概念は、表示又は音声情報を提供
するプロセッサに基づくシステム、例えばテレビジョン
を制御する音声制御装置に適用可能である。

【００１１】無線音声起動制御装置に関する種々の実施
例は、この装置に埋め込まれる「知能（ｉｎｔｅｌｌｉ
ｇｅｎｃｅ）」により異なる。本発明の目的のために、
通常のウェブ・ブラウザ・ソフトウェアが使用できるよ
うにオーディオ入力を認識するため及びオーディオ入力
を解釈するために使用されるプログラミングは、組み込
まれるプログラムの範囲が設計及びコストの問題に対応
した形式によりモジュール化される。

【００１２】図１は本発明による無線音声起動制御装置
（以下、制御装置という）１０の一実施例を示す。前述
のように、この説明のために、ホスト・システム１１は
コンピュータであり、ワールド・ワイド・ウェブとデー
タ通信をしている。

【００１３】制御装置１０はディスプレイ１０ａ及びマ
イクロホン１０ｂを有する。ディスプレイ１０ａはユー
ザから音声入力を受け取る。これは「ミュート（ｍｕｔ
ｅ）」スイッチ１０ｃを備えてもよく、従って制御装置
１０はイメージを表示することができ、更に音声認識を
実行することなく、キー・パッド（図示なし）のような
代替的な入力装置を介して非オーディオ入力を受け取る
こともできる。マイクロホン１０ｂはユーザの声を他の
音から区別する能力を強化するようにマイクロホン・ア
レーであってもよい。

【００１４】図１の実施例において、制御装置１０は音
声認識処理の全て又は一部を実行し、かつ会話データを
送信機１０ｇを介してホスト・システム１１に送出す
る。ホスト・システム１１は種々の音声制御解釈処理を
実行し、更にウェブ・ブラウザも遂行する。しかし、制
御装置はその最も簡単な形式により、マイクロホン１０
ｂからホスト・システム１１へオーディオ・データを直
接送信し、ホスト・システム１１が全ての処理を実行す
ることになる。

【００１５】制御装置１０が音声認識処理の全て又は一
部を実行する場合には、制御装置１０がプロセッサ１０
ｅを備えている。メモリ１０ｆはプロセッサ１０ｅが実
行する音声認識プログラミングを記憶している。スピー
チ認識に適したプロセッサ１０ｅの例は、信号プロセッ
サ、例えばテキサス・インスツルメンツ社により製造さ
れたものである。マイクロホン１０ｂがマイクロホン・
アレーである場合は、プロセッサ１０ｅがユーザの声を
目標にする計算を実行してもよい。

【００１６】制御装置は、いくつかの音声処理のみを実
行するのであれば、１又はそれより多くの「フロント・
エンド」処理、例えば線形予測符号（ＬＰＣ）解析又は
会話終了点指示を実行してもよい。

【００１７】制御装置１０が全ての音声認識処理を実行
するのであれば、メモリ１０ｆは（音声認識装置とし
て）これらの処理と共に、文法ファイルを記憶する。動
作において、音声認識装置はマイクロホン１０ｂからの
オーディオ入力を受け取り、かつ適当な文法ファイルを
アクセスする。文法ファイル・ハンドラは、文法を会話
レディー形式に変換して発音文法を作成して、文法を音
声認識装置にロードさせる。

【００１８】メモリ１０ｆにおける文法ファイルは予め
定められて記憶されても、又はダイナミックに作成され
ても、又は両形式の文法ファイルの組合わせであっても
よい。ダイナミック文法ファイルの作成例を以下に図５
と関連させて説明する。文法は文脈なし文法のバックス
・ナウア形式（Ｂａｃｋｕｓ−Ｎａｕｒｆｏｒｍｏｆ
ｃｏｎｔｅｘｔ−ｆｒｅｅｇｒａｍｍｅｒ）により
書き込まれたものであってもよく、かつカスタマイズさ
れてもよい。図１の実施例であって、制御装置１０をウ
ェブ・ブラウジングに用いる場合に、ホスト・システム
１１は現在表示されているウェブ・ページ用のＨＴＭＬ
（ｈｙｐｅｒｍａｒｋｕｐｌａｎｇｕａｇｅ）を制
御装置１０に送出する。メモリ１０ｆはダイナミックに
文法を発生する文法ファイル発生器を記憶している。ウ
ェブ・ブラウジングの他の実施例では、ホスト・システ
ム１１が文法をダイナミックに発生して、文法ファイル
を制御装置１０にダウンロードすることができる。

【００１９】音声認識装置の出力は会話データである。
この会話データは音声制御解釈処理を実行するホスト・
システム１１に送信される。音声制御されたウェブ・ブ
ラウジング用の種々の音声制御解釈処理は、「文法的な
メタデータを用いた音声起動ハイパーメディア・システ
ム（ＶｏｉｃｅＡｃｔｉｖａｔｅｄＨｙｐｅｒｍｅ
ｄｉａＳｙｓｔｅｍｓＵｓｉｎｇＧｒａｍｍａｔ
ｉｃａｌＭｅｔａｍｅｄｉａ）」と題してテキサス・
インスツルメント社に譲渡された米国特許出願第０８／
４１９、２２９号に説明されており、ここでは引用によ
って関連される。この解釈の結果として、ホスト・シス
テム１１はコマンドを実行することにより、又はハイパ
ーメディア（Ｗｅｂ）リンクを設けることにより、制御
装置１０に対する音声入力に応答してもよい。

【００２０】ウェブ・ブラウジング以外の音声制御解釈
例は、テレビジョンに対するコマンドに関するものであ
り、そこではホスト・システム１１がプロセッサに基づ
くテレビジョン・システムである。例えば、「今晩のテ
レビでは何が放送されますか」の音声コマンドは、テレ
ビジョン番組を表示する結果となる。ウェブ・ブラウジ
ング以外の他の音声制御解釈例は、コンピュータに基づ
く家事制御用のコマンドに関するものである。「スプリ
ンクラー予定を見せて下さい」の音声コマンドは、適当
な表示に帰結する。

【００２１】ホスト・システム１１が適当な操作を行っ
た後に、無線受信機１０ｈはホスト・システム１１から
データを受け取ってディスプレイ１０ａ上に表示する、
又はスピーカ１０ｂにより出力する。従って、ホスト・
システム１１から受け取ったデータは、画像（テキス
ト、グラフィック、イメージ及びビデオを含む）又は音
声であってもよい。

【００２２】図２は本発明の他の実施例、音声制御解釈
と共に音声認識を実行する無線音声起動制御装置（以
下、制御装置という。）２０を示す。音声制御の解釈
は、ウェブのようなハイパーメディア・リソースをブラ
ウザするために固有のものである。ホスト・システム２
１はハイパーメディア・リソースに接続される。

【００２３】制御装置２０は制御装置１０の構成要素と
同一のものを有する。しかし、そのプロセッサ２０ｅは
メモリ２０ｆに記憶された付加的なプログラミングを実
行する。特に、音声制御解釈処理は、会話可能コマンド
処理、会話可能ホットリスト処理、又は会話可能リンク
処理を備えるものであってもよい。これらの処理及びこ
れらに関連する文法ファイルは制御装置２０上に存在す
る。

【００２４】会話可能コマンド処理はディスプレイ２０
ａ上にコマンド・インタフェースを表示し、かつ種々の
ウェブ・ブラウジング・コマンドを受け付ける。この会
話可能コマンド処理はユーザが話すかも知れないワード
及び語句（ｐｈｒａｓｅ）に関連した文法ファイルを有
する。

【００２５】図３は音声制御解釈処理により得られたデ
ィスプレイ３０の例を示す。会話可能コマンドは、ボタ
ン３１により作動された「ヘルプ」コマンドである。応
答において、コマンド処理は音声制御のブラウジングを
どのように使用するのかを説明している「ヘルプ・ペー
ジ」を表示する。

【００２６】他の会話可能コマンドは、「私の会話可能
コマンド・リストを見せて下さい」である。このコマン
ドを話すと、それぞれ会話可能コマンドを表す一組の文
法をリストにしたページが示される。例えば、ページダ
ウン・コマンド、バック・コマンド及びヘルプ・コマン
ドがある。コマンド処理がこれらコマンドのうちの一つ
の翻訳を受け取ると、適当な操作を実行する。

【００２７】図３は更にウェブ・ブラウジングに特に有
用な音声認識装置の特徴を示す。ユーザは、ワード「Ｘ
ＹＺの株価はどうなっているか」と言った例である。音
声認識装置が発声を認識すると、これは時間及びメモリ
使用に対するスコア値、種々の統計とを決定する。以下
で説明するように、株価に対する要求はホットリスト項
目であってもよく、情報を配置するウェブ位置を確認す
ることなく、単純にユーザに要求を発声可能にさせる。

【００２８】他の会話可能なコマンドは、ボタン３３に
より作動される「私の会話可能ホットリストを見せて下
さい」の例である。「ホットリスト」は、選択されたリ
ソース・ロケータ（ＵＲＬ）の記憶リスト、例えば頻繁
に使用されるものである。ホットリストはブックマーク
としても知られている。ＵＲＬはウェブの周知の特徴で
あり、インターネット上の任意のリソースを命名するよ
うに短くかつ首尾一貫した方法を提供する。典型的なＵ
ＲＬは以下の形式：ｈｔｔｐ：／／ｗｗｗ．ｎｃｓａ．
ｕｉｉｃ．ｅｄｕ／Ｇｅｎｅｒａｌ／ＮＣＳＡＨｏｍ
ｅ．ｈｔｍｌを有する。ＵＲＬの種々の部分は、送信プ
ロトコル、コンピュータ・アドレス、及びそのアドレス
におけるディレクトリ・パスを識別する。ＵＲＬは「リ
ンク」及び「アンカ」としても知られている。

【００２９】会話可能ホットリスト処理は、ユーザに各
ホットリスト項目に対する文法を構築して文法をＵＲＬ
に関連可能にさせる。文法を作成するために、ユーザは
ＢＮＦ構文を用いた文法においてＡＳＣＩＩ文法ファイ
ル及び形式を編集することができる。例えば、天気予報
を検索する文法は、「今日の天気予報はどうなっている
か」及び「天気予報を教えて下さい」のような語句を定
義することができる。次いで、ユーザは適当なＵＲＬを
文法に関連させる。

【００３０】ホットリスト文法ファイルは音声により変
更されてもよい。例えば、カレント・ページはホットリ
スト項目として付け加えられてもよい。語句が音声で入
力されると、「このページを私のホットリストに付け加
えて下さい」は、文法にページのタイトルを付け加える
と共に、その文法をカレントＵＲＬに関連させる。「私
の会話可能ホットリストを編集して下さい」の語句が音
声で入力されると、音声によって検索する付加的な語句
を付け加えることにより、ユーザに文法を編集できるよ
うにさせる。

【００３１】会話可能ホットリスト処理は、音声認識装
置がホットリスト文法からホットリスト翻訳を認識した
ときに活性化されて、その翻訳をホットリスト処理に渡
す。ホットリストは関連するＵＲＬを参照する。これは
ＵＲＬを（無線通信を介して）ホスト・コンピュータ上
に存在するブラウザにＵＲＬを渡し、従ってウェブ・ペ
ージを検索して制御装置１０に送信し、ディスプレイ１
０ａ上に表示させることができる。

【００３２】会話可能コマンド及び会話可能ホットリス
トのような文法ファイルは、常時活性化している。これ
は、ユーザにコマンド又はホットリストを任意の文脈に
リンク可能にする。会話可能リンク処理は制御装置２０
のメモリ２０ｅにも存在し得る。ウェブ・ページにおい
て選択された情報は、他のウェブ・ページに対するアク
セス用のリンクとなるものでもよい。これらのリンク
は、例えばアンダーラインされ、ハイライトされ、異な
る色付けにされ、画像の場合のように輪郭が付けられる
ことにより、指示されるか、又は他の方法により認識さ
れる。制御装置１０のユーザは、リンクを選択するため
にマウス又は他の指示装置を用いる代わりに、ディスプ
レイ１０ａ上に表示されているページからのリンクを話
すものでもよい。

【００３３】図４はウェブ・ページ４０の一部及びその
リンクを示す。例えば、第２のヘッドライン４１は一つ
のリンクである。

【００３４】会話可能リンク用の文法には完全な語句と
共に変形が含まれる。話者は、完全な語句を話すことに
加えて、「ニューヨーク期間におけるダイアナ」（文字
通りの変形として）「ＮＹにおけるダイアナ」又は「ニ
ューヨークにおけるダイアナ」と言うこともできる。

【００３５】会話可能リンクを作成すると、まず、その
ウェブ・ページからリンク／ＵＲＬを得ることが必要で
ある。ＨＴＭＬ（ハイパーテキスト・マークアップ言
語）フォーマットにおけるウェブ・ページは、任意の長
さを有するものでもよいので、認識者がサーチする候補
リンク／ＵＲＬ対の数は、ディスプレイ２０ａのカレン
ト・スクリーン上で見えるものに限定されてもよい。
「スクロール・ダウン」のようなコマンドは、候補リン
ク／ＵＲＬ対を更新する。スクリーン用のリンク／ＵＲ
Ｌ対が得られると、文法がカレント・スクリーン上の全
てのリンクに対して作成される。次に、リンクにおける
トークンが認識され、そのトークンに関する文法が作成
される。これらの文法は認識者の文法ファイルに付け加
えられる。正しいトークン化は、リンク・フォーマット
が広範に変わり得るので、簡単ではない。リンクには、
番号、頭字語、創作した言葉、及び新しい句読点使用が
含まれていてもよい。

【００３６】会話可能リンクに関して簡単ではない他の
ものは、リンクの長さ、同一ページにおけるリンクのあ
いまいさ、及びビット・マップされたリンクを含むグラ
フィックである。長いリンクに対して、会話可能リンク
処理は、ユーザにＮワード語の任意時点でリンクにおけ
るワードを話すのを停止可能にさせる。あいまいさに対
して、この処理は、第１のＵＲＬに対するデフォールト
であっても、又はユーザに対するＵＲＬの選択を提供し
てもよい。ビット・マップされたリンクに対して、処理
はリンク情報を探すために＜ＡＬＴ＞タグを用いる。

【００３７】会話可能リンクに関する文法はダイナミッ
クに作成されので、カレント表示用の文法のみが活性で
あり、新しいカレント表示を発生すると更新される。更
に、ダイナミックな文法の作成は必要とするメモリ１０
ｆの量も減少させる。

【００３９】図５は文法ファイルをダイナミックに作成
する適当な処理を示す。これは図１及び図２のダイナミ
ック文法発生器により実施される処理である。以上で説
明したように、ダイナミック文法ファイルはカレント・
ウェブ・ページから作成されるので、会話可能リンクを
認識することができる。以上で引用により関連させた米
国特許出願第０８／４１９、２２６号は、更に、音声制
御されたホスト・システム１１に印加されたこの方法、
即ち別個のリモート制御装置である制御装置１０なしの
音声制御を説明している。

【００３９】図４のディスプレイ４０のようなディスプ
レイは、文法規約５２に影響する。文法規約５２は用語
集５４及びユーザ・エージェント６４に入力される。続
いて、用語集５４はオンライン辞書５６をフィードさ
せ、オンライン辞書５６が発音モジュール５８に入力す
る。発音モジュール５８と共に、話者一人による連続的
な会話音声モジュール６０は、ユーザ・エージェント６
４に入力する。加えて、会話モジュール６６はユーザの
会話をユーザ・エージェント６４に入力する。これに並
行して、ディスプレイ４０からの入力を文脈モジュール
６８が受け取って、ユーザ・エージェント６４に入力す
る。

【００４０】既存のＲＧＤＡＧ（ＲｅｇｕｌａｒＧｒ
ａｍｍｅｒＤｉｒｅｃｔｅｄＡｃｙｃｌｉｃＧｒ
ａｐｈ：標準文法指向の非周期グラフ）は、新しい構文
及び用語にダイナミックに適応させてもよい。ディスプ
レイ４０が変化する度に、ユーザ・エージェント６４は
アンダーラインされた現在可視的な複数の語句（複数の
リンク）を含む文法を発生する。この文法から、ユーザ
・エージェント６４は語句をトークン化して、例えば文
字の綴り及び削除または任意選択の句読を含むことがで
きる。ユーザ・エージェント６４は、概要辞書とテキス
ト対音素マッピングとの組合わせを用いて、これらのト
ークンから音声発音文法（ｐｈｏｎｅｔｉｃｐｒｏｎ
ｕｎｃｉａｔｉｏｎｇｒａｍｍｅｒｓ）を作成する。
次いで、音声認識処理が作成した文法を付け加える。こ
れには、どのシンボルが出力する「ワード」を表すのか
を識別することを含め、音声認識装置用のいくつかの簡
単な簿記作業が含まれている。最後に、大域的な変化を
実施して新しくまたは変化した文法に関連させる。この
ために、文法はＲＧＤＡＧ関係により接続される。加え
て、各シンボルに対する最大深さが計算される。更に、
音声認識装置は出力により祖先シンボルを探してパーズ
（ｐａｒｓｅ：品詞及び文法的な関係の）情報を必要と
する。その場合に、効果的なパーズ用の文法構造は同一
である。

【００４１】他の実施例特定の実施例を参照して本発明を説明したが、この説明
が限定的な意味で解釈されることを意図するものではな
い。開示した実施例の種々の変形と共に、他の実施例
は、当該技術分野に習熟する者に明らかである。従っ
て、特許請求の範囲は本発明の範囲内に包含される全て
の変形を含むことを意図している。

【００４２】以上の項に関して更に以下の項を開示す
る。

【００４３】（１）プロセスに基づくホスト・システム
を制御する無線音声起動制御装置において、ユーザから
の音声入力を受け取ることにより、オーディオ入力信号
を供給するように動作可能であるマイクロホンと、前記
オーディオ入力信号から導き出したデータを前記ホスト
・システムに無線により送信するように動作可能である
音声送信機と、前記ホスト・システムからイメージ・デ
ータを無線により受信するように動作可能であるデータ
受信機と、前記イメージ・データにより表されたイメー
ジを発生して表示するように動作可能であるディスプレ
イとを含む無線音声起動制御装置。

【００４４】（２）前記マイクロホンは前記ディスプレ
イから独立してオン状態又はオフ状態に切り換え可能で
ある第１項記載の無線音声起動制御装置。

【００４５】（３）前記マイクロホンは多重素子のマイ
クロホン・アレーである第１項記載の無線音声起動制御
装置。

【００４６】（４）更に、音声認識処理を実行するよう
に動作可能なプロセッサと、前記音声認識処理及び文法
ファイルを記憶するメモリとを含む第１項記載の無線音
声起動制御装置。

【００４７】（５）前記音声認識処理は線形予測符号解
析を含み、かつ前記送信機は前記解析の結果を送信する
ように動作可能である第４項記載の無線音声起動制御装
置。

【００４８】（６）前記音声認識処理は会話終了点の解
析を含み、かつ前記送信機は前記解析の結果を送信する
ように動作可能である第４項記載の無線音声起動制御装
置。

【００４９】（７）前記文法ファイルはダイナミックに
作成され、更に前記プロセッサは前記ダイナミック文法
発生処理を実行するように動作可能である第４項記載の
無線音声起動制御装置。

【００５０】（８）ハイパーメディア・リソースとのデ
ータ通信においてホスト・システムを音声制御する無線
音声起動制御装置において、ユーザからの音声入力を受
け取ることにより、オーディオ入力信号を発生するよう
に動作可能であるマイクロホンと、前記オーディオ入力
信号から導き出したデータを前記ホスト・システムに無
線により送信するように動作可能である音声送信機と、
前記ホスト・システムからイメージ・データを無線によ
り受信するように動作可能であるデータ受信機と、前記
イメージ・データにより表されすると共に、前記ホスト
・システムにより前記ハイパーメディアから検索された
イメージを発生して表示ように動作可能であるディスプ
レイとを含む無線音声起動制御装置。

【００５１】（９）更に、音声認識処理を実行するよう
に動作可能なプロセッサと、前記音声認識処理及び文法
ファイルを記憶するメモリとを含む第８項記載の無線音
声起動制御装置。

【００５２】（１０）前記音声認識処理は線形予測符号
解析を含み、かつ前記送信機は前記解析の結果を送信す
るように動作可能である第９項記載の無線音声起動制御
装置。

【００５３】（１１）前記音声認識処理は会話終了点の
解析を含み、かつ前記送信機は前記解析の結果を送信す
るように動作可能である第９項記載の無線音声起動制御
装置。

【００５４】（１２）前記文法ファイルはダイナミック
に作成され、更にプロセッサはダイナミックな文法発生
処理を実行するように動作可能である第９項記載の無線
音声起動制御装置。

【００５５】（１３）更に、音声制御処理を実行するよ
うに動作可能なプロセッサと、前記音声制御処理を記憶
するメモリとを含む第８項記載の無線音声起動制御装
置。

【００５６】（１４）前記音声制御処理は、前記ユーザ
が前記ホスト・システムの動作を音声により指令できる
ように、会話可能なコマンド処理を含む第１３項記載の
無線音声起動制御装置。

【００５７】（１５）前記音声制御処理は、前記ユーザ
が前記ホスト・システムにより検索されるべき前記リソ
ースのうちの特定の一つを音声により要求できるよう
に、会話可能なホットリスト処理を含む第１３項記載の
無線音声起動制御装置。

【００５８】（１６）前記音声制御処理は、前記ディス
プレイ上に表示されているカレント・ページ上のリンク
が前記ホスト・システムにより検索されるように、会話
可能なリンク処理を含む第１３項記載の無線音声起動制
御装置。

【００５９】（１７）更に、音声認識処理を実行し、か
つダイナミック文法発生処理を実行するように動作可能
なプロセッサと、前記処理を記憶するメモリとを含む第
８項記載の無線音声起動制御装置。

【００６０】（１８）ワールド・ワイド・ウェブに接続
されたコンピュータのようなホスト・システム１１を制
御する携帯無線音声起動制御装置１０。前記携帯無線音
声起動制御装置１０はディスプレイ１０ａ、送信機１０
ｇ及び受信機１０ｈを有する。前記携帯無線音声起動制
御装置１０は、更に、音声認識を実行するためにプロセ
ッサ１０ｅ及びメモリ１０ｆを有してもよい。装置２０
は、音声認識とこの音声認識の結果の解釈との両方を実
行するプロセッサ２０ｅ及びメモリ２０ｆを備えること
により、ウェブ・ブラウジング用に特に設計されてもよ
い。

【００６２】関連する特許出願この特許出願は、それぞれテキサス・インスツルメンツ
社に譲渡された以下の特許出願に関連する。「会話認識
における話者独立ダイナミック用語及び文法（Ｓｐｅａ
ｋｅｒ−ＩｎｄｅｐｅｎｄｅｎｔＤｙｎａｍｉｃＶ
ｏｃａｂｕｌａｒｌｙａｎｄＧｒａｍｍｅｒｉｎ
ＳｐｅｅｃｈＲｅｃｏｇｎｉｔｉｏｎ）」と題する
米国特許出願第０８／４１９、２２６号。「文法メタデ
ータを用いる音声作動ハイパーメディア・システム（Ｖ
ｏｉｃｅＡｃｔｉｖａｔｅｄＨｙｐｅｒｍｅｄｉａ
ＳｙｓｔｅｍＵｓｉｎｇＧｒａｍｍａｔｉｃａｌ
Ｍｅｔａｄａｔａ）」と題する米国特許出願第０８／４
１９、２２９号。

【図面の簡単な説明】

【図１】本発明による無線音声起動制御装置の一実施例
を示す図。

【図２】ユーザからの音声入力を翻訳し、かつ解釈する
ように特に構成された無線音声起動制御装置の他の実施
例を示す図。

【図３】会話可能コマンド処理により提供される表示の
一例を示す図。

【図４】ウェブ・ページの一部及びその会話可能リンク
を示す図。

【図５】図１及び図２の音声認識装置が用いる文法をダ
イナミックに作成する処理を示す図。

【符号の説明】

１０、２０無線音声起動制御装置１０ａ、２０ａディスプレイ１０ｂ、２０ｂマイクロホン１０ｅ、２０ｅプロセッサ１０ｆ、２０ｆメモリ１０ｇ送信機１０ｈ無線受信機１１、２１ホスト・システム

Claims

【特許請求の範囲】

【請求項１】プロセスに基づくホスト・システムを制
御する無線音声起動制御装置において、ユーザからの音声入力を受け取ることにより、オーディ
オ入力信号を供給するように動作可能なマイクロホン
と、前記オーディオ入力信号から導き出したデータを前記ホ
スト・システムに無線により送信するように動作可能な
音声送信機と、前記ホスト・システムからイメージ・データを無線によ
り受信するように動作可能なデータ受信機と、前記イメージ・データにより表されたイメージを発生し
て表示するように動作可能なディスプレイとを備えた無
線音声起動制御装置。