JPH10320168A - 音声コマンドを使用してネットワークをナビゲートするデータ処理システムおよび方法 - Google Patents

音声コマンドを使用してネットワークをナビゲートするデータ処理システムおよび方法

Info

Publication number
JPH10320168A
JPH10320168A JP10102434A JP10243498A JPH10320168A JP H10320168 A JPH10320168 A JP H10320168A JP 10102434 A JP10102434 A JP 10102434A JP 10243498 A JP10243498 A JP 10243498A JP H10320168 A JPH10320168 A JP H10320168A
Authority
JP
Japan
Prior art keywords
link
voice command
user input
central processing
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10102434A
Other languages
English (en)
Other versions
JP3378498B2 (ja
Inventor
Placid Jengara Paul
ポール・プラシド・ジエンガラ
Lynn Taylor James
ジェームズ・リン・テーラー
Joseph Tracey Ii William
ウィリアム・ジョセフ・トレーシー・セカンド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH10320168A publication Critical patent/JPH10320168A/ja
Application granted granted Critical
Publication of JP3378498B2 publication Critical patent/JP3378498B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 ワールド・ワイド・ウェブなどのコンピュー
タ・ネットワークの情報にアクセスする直観的で容易に
使用できるインタフェースを提供する。 【解決手段】 新しいウェブ・ページにアクセスしたと
きには、データ処理システムの中央処理装置が音声認識
ユニットに制御信号を供給し、音声認識ユニットに現在
記憶されている語彙リストをクリアする。続いてそのウ
ェブ・ページに対応するHTMLソース・コードの構文
解析を開始し、そのウェブ・ページがリンクを含むか否
かを判定する。含む場合には、構文解析動作中にそれら
のリンクを検出し、音声認識ユニットを使用可能状態に
して、そのリンクに対応し、外部ユーザに表示されてい
るテキストを、音声認識ユニットの特殊語彙リストに記
憶する。これによって、ユーザは、この特殊語彙リスト
中に記憶されたテキストを発話することによってそのリ
ンクにアクセスする音声コマンドを供給することができ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一般に、コンピュー
タの音声認識に関し、具体的にはコンピュータ・ネット
ワーク内で動作するクライアント・ブラウザに関係した
コンピュータの音声認識に関する。
【0002】
【従来の技術】「インターネット」として一般に知られ
るコンピュータの世界的なネットワークが最近数年間に
爆発的な成長を見せている。この成長は、シンプルなグ
ラフィカル・ユーザ・インタフェースを基にしてネット
ワーク・サーバにアクセスできるようにしたウェブ・ブ
ラウザの導入およびその使用の普及によって加速され
た。ネットワーク・サーバは、「ウェブ・ページ」とし
てフォーマットされたドキュメントをサポートする。
「ワールド・ワイド・ウェブ」(WWW)という用語
が、ハイパーテキスト・トランスファ・プロトコル(H
TTP)を利用するインターネット上のサーバの集合を
指すものとして一般に使用されている。HTTPは、ハ
イパーテキスト・マークアップ・ランゲージ(HTM
L)として知られる標準的なページ記述言語を使用し
て、テキスト、グラフィックス、サウンド、ビデオなど
を始めとする非常に多くのフォーマットを有するファイ
ル群へのアクセスをユーザに提供するアプリケーション
・プロトコルである。HTMLは、基本的なドキュメン
ト・フォーマッティングを提供し、開発者が、他のサー
バおよびファイルへの「リンク」を指定することを可能
にする。HTMLに準拠したクライアント・ブラウザの
使用は、必然的にユニフォーム・リソース・ロケータ
(URL)を介したリンクの指定を伴う。URLを介し
てリンクを指定すると、クライアントは、そのリンクで
識別されたサーバにtcp/ipリクエストを送り、そ
の応答として「ウェブ・ページ」を受け取る。「ウェブ
・ページ」は、HTMLに従ってフォーマットされたド
キュメントであることに留意されたい。
【0003】ウェブ・ブラウザに関連するグラフィカル
・ユーザ・インタフェースを、インターネットの初心者
ユーザにより易しく、より直感的にする試みのなかで、
音声コマンドに応答して、ワールド・ワイド・ウェブか
らウェブ・ページにアクセスするグラフィカル・ユーザ
・インタフェースが実現された。例えば、インターナシ
ョナル・ビジネス・マシーンズ社(International Busi
ness Machines Corporation)は、そのオペレーティン
グ・システムOS/2ワープ(OS/2 Warp)バージョン
4のOS/2ウェブエクスプローラ(OS/2 WebExplore
r)部分でワールド・ワイド・ウェブの音声ナビゲーシ
ョンを実現した。さらに、この音声ナビゲーション機能
は、OS/2オペレーティング・システム用のネットス
ケープ・ナビゲータ(Netscape Navigator)2.02で
も使用可能である。OS/2オペレーティング・システ
ムに利用される音声コマンド・インタフェースでは、話
者の音声および言語パターンが識別される。続いて、O
S/2オペレーティング・システムを利用したコンピュ
ータ・システムによって検出された音声がテキストに変
換される。したがって、「Jump to x home page」とい
った単純な文を発話することによって、OS/2オペレ
ーティング・システムは、ワールド・ワイド・ウェブお
よびユーザが望むウェブ・ページに自動的にアクセスす
る。しかし、OS/2オペレーティング・システムの音
声コマンド・インタフェースでは、所望のホームページ
が事前に定義されていることが必要である。例えば、ホ
ームページの定義は、音声コマンドの実行以前に、OS
/2オペレーティング・システムの音声認識ユニットに
よって認識される語のグループ内に手動で記憶されなけ
ればならない。これについては、1996年4月23日
火曜日付けニューヨーク・タイムズ紙(The New York T
imes)「New I.B.M. Software to Hear Commands」を参
照されたい。
【0004】
【発明が解決しようとする課題】その上、音声コマンド
を介して所望のホームページにアクセスできた場合であ
っても、ウェブ・ページ上の以降の操作では、ユーザ
は、マウスやキーボードなどのより伝統的な技術を使用
してウェブ・ページと対話しなければならない。したが
って、ウェブ・ページの初心者ユーザは、音声コマンド
・インタフェースによって提供された直観的で、容易に
理解できるインタフェースだけに頼ることができない。
よって、ワールド・ワイド・ウェブなどのコンピュータ
・ネットワークの情報にアクセスする直観的で容易に使
用できるインタフェースを提供するユーザ・インタフェ
ースが求められている。
【0005】
【課題を解決するための手段】先に述べた必要性は本発
明で満たされる。したがって、第1の形態として、デー
タ処理システムが提供される。このデータ処理システム
は、第1のユーザ入力を受け取る第1の入力回路および
第1の音声コマンドを受け取る第2の入力回路を含む。
中央処理装置が、第1のユーザ入力を受け取る第1の入
力回路に接続される。中央処理装置は、第1のユーザ入
力に応答して第1の動作を実行し、第1のユーザ入力に
対応する第1のリンク値を識別する。音声認識ユニット
が、第1のリンク値にアクセスし、第1のリンク値を第
1のメモリに記憶するために中央処理装置に接続され
る。音声認識ユニットは、第1の音声コマンドを受け取
る第2の入力手段に接続される。音声認識ユニットは、
第1の音声コマンドが第1のリンク値に対応しているか
どうかを判定する。
【0006】さらに、第2の形態として、通信ネットワ
ークにアクセスする方法が提供される。この方法は、第
1のユーザ・インタフェースで第1のユーザ入力を受け
取る段階を含む。中央処理装置が使用可能状態にされ、
第1のユーザ入力に応答して、第1のテキスト部分を含
む第1のアプリケーションにアクセスする。第1のテキ
スト部分が構文解析され、第2のアプリケーションに対
応する第1のリンクが識別される。第2のユーザ・イン
タフェースで第1の音声コマンドを受け取る。音声認識
ユニットが使用可能状態にされ、第1の音声コマンドを
認識し、第1の音声コマンドが第1のリンクに対応して
いるかどうかを判定する。
【0007】さらに、第3の形態として、データ処理シ
ステムにアクセスする方法段階を実行する、マシンが実
行可能な命令プログラムを明白に具現化したマシン可読
のプログラム記憶装置が提供される。前記方法段階は、
第1のユーザ・インタフェースで第1のユーザ入力を受
け取る段階、中央処理装置を使用可能状態にし、第1の
ユーザ入力に応答して、第1のテキスト部分を含む第1
のアプリケーションにアクセスする段階、および第1の
テキスト部分を構文解析して、第2のアプリケーション
に対応する第1のリンクを識別する段階を含む。前記方
法段階はさらに、第2のユーザ・インタフェースで第1
の音声コマンドを受け取る段階、および、音声認識ユニ
ットを使用可能状態にして、第1の音声コマンドを認識
し、第1の音声コマンドが第1のリンクに対応している
かどうかを判定する段階を含む。
【0008】
【発明の実施の形態】図1に、クライアント・サーバ・
モデルに基づくコンピュータ・ネットワークの概念モデ
ルを示す。インターネットは、このクライアント・サー
バ・モデルに基づく他の周知のコンピュータ・ネットワ
ークの1つである。概念上、インターネットは、複数の
クライアント12からアクセス可能なサーバ10の大規
模ネットワークを含む。複数のクライアント12のそれ
ぞれは一般に、パーソナル・コンピュータである。複数
のクライアント12はそれぞれが、インターネット・ア
メリカ(Internet America)などの民間のインターネッ
ト・アクセス・プロバイダ14または、アメリカ・オン
ライン(America On-Line)、プロディジィ(Prodig
y)、コンピュサーブ(Compuserve)、マイクロソフト
・ネットワーク(theMicrosoft Network)などのオンラ
イン・サービス・プロバイダ16を介してサーバ10の
大規模ネットワークと通信する。複数のクライアント1
2はそれぞれが、所望のアクセス・プロバイダ(14ま
たは16)を介してサーバ10のネットワークにアクセ
スするのに使用される周知のソフトウェア・ツールであ
る「ブラウザ」や「ナビゲータ」を走らせることができ
る。このコンピュータ・ネットワークでは、サーバ10
のネットワークが、ドキュメントおよびページの形態の
ファイルをサポートする「ウェブサイト」を運営する。
サーバ10までのネットワーク経路は、ネットワーク接
続を定義するための周知の文法を有するユニフォーム・
リソース・ロケータすなわちURLによって識別され
る。
【0009】前述のとおり、「ワールド・ワイド・ウェ
ブ」(WWW)は、ハイパーテキスト・トランスファ・
プロトコル(HTTP)を利用するインターネット通信
ネットワーク上のサーバの集合である。HTTPは、ハ
イパーテキスト・マークアップ・ランゲージ(HTM
L)として知られる標準的なページ記述言語を使用し
て、ファイルへのアクセスをユーザに提供するアプリケ
ーション・プロトコルである。アクセスされるファイル
は、テキスト、グラフィックス、画像、サウンド、ビデ
オなどを始めとする数多くのさまざまなフォーマットの
ものでよい。HTMLは、基本的なドキュメント・フォ
ーマッティングを提供し、開発者が、他のURLへの
「リンク」を指定することを可能とする。HTMLに準
拠したクライアント・ブラウザの使用は、必然的にUR
Lを介したリンク指定を伴う。この指定の後、クライア
ントは、そのリンクで識別されたサーバにリクエストを
送り、その応答として「ウェブ・ページ」を受け取る。
「ウェブ・ページ」は、HTMLに従ってフォーマット
されたドキュメントであることに留意されたい。
【0010】本発明は、ユーザがリンクの名称を発話す
るだけで、所望のウェブ・ページを受け取ることができ
る音声コマンド・インタフェースを提供する。本発明の
動作をより詳細に説明する前に、以下の説明では、本発
明が完全に理解されるよう多数の具体的な詳細が明示さ
れることを指摘しておく。しかし、そのような具体的な
詳細がなくとも本発明を実施できることは、当業者には
明白であろう。また、不必要な詳細のために本発明が不
明瞭とならないよう、周知の回路はブロック図の形で示
した。さらに、タイミング考慮事項などに関する詳細
は、このような詳細が、本発明の完全な理解を得るため
に必要でない限り、および関連技術の通常の熟練者の技
能の範囲である限りはほとんどの部分で省略した。
【0011】次に、図面について説明する。図示の要素
は、必ずしもスケールどおりに示されているわけではな
い。同じ要素または同様の要素は、いくつかの図を通じ
て同一の参照番号で示されている。
【0012】図2に、本発明が実施された代表的なクラ
イアント・コンピュータ12のブロック図を示す。この
システムは、メイ(Cathy May)他編の「The PowerPC A
rchitecture: A Specification for a New Family of R
ISC Processors」, 2d edition, 1994に従ったパワーP
C(PowerPC)マイクロプロセッサ(「PowerPC」はIB
M社の商標である)などの中央処理装置(CPU)21
0を有する。PowerPCマイクロプロセッサのより
具体的な実施態様は、IBM社の「PowerPC 604 RISC M
icroprocessor Users Manual」,1994に記載されてい
る。他の中央処理装置を、クライアント・コンピュータ
12内に実施してもよいことに留意されたい。本発明の
履歴バッファ(図示せず)は、CPU210に含まれて
いる。CPU210は、システム・バス212によって
他の各種構成要素に結合される。同様に、音声認識ユニ
ット252はシステム・バス212によって、データ処
理システム12の他の各種構成要素に結合される。リー
ド・オンリー・メモリ(「ROM」)216がシステム
・バス212に結合される。ROM216は、データ処
理システム12のある基本機能を制御する基本入出力シ
ステム(「BIOS」)を含む。ランダム・アクセス・
メモリ(「RAM」)214、入出力アダプタ218、
および通信アダプタ234もシステム・バス212に接
続される。入出力アダプタ218は、ディスク記憶装置
220と通信するスモール・コンピュータ・システム・
インタフェース(「SCSI」)アダプタでよい。テー
プ装置240を入出力アダプタ218に接続することも
できる。通信アダプタ234はバス212を、外部ネッ
トワークに相互接続し、このデータ処理システムと他の
システムとの通信を可能にする。入出力装置も、ユーザ
・インタフェース・アダプタ222およびディスプレイ
・アダプタ236を介してシステム・バス212に接続
される。キーボード224、トラックボール232、マ
ウス226、スピーカ228およびマイクロホン250
は全て、ユーザ・インタフェース・アダプタ222を介
してバス212に相互接続される。本発明の一実施形態
では、ユーザ・インタフェース・アダプタ222を部分
的に音声カードとして実施してもよいことに留意された
い。ディスプレイ・モニタ238は、ディスプレイ・ア
ダプタ236によってシステム・バス212に接続され
る。このようにしてユーザは、キーボード224、トラ
ックボール232、マウス226、またはマイクロホン
250を介してシステムに入力し、スピーカ228およ
びディスプレイ238を介してシステムから出力を受け
取ることができる。さらに、図2に示した各種構成要素
の機能を調整するため、AIX(「AIX」はIBM社
の商標である)などのオペレーティング・システムが使
用される。図2に示した構成要素の各種機能を調整する
のに利用できる他のオペレーティング・システムは、D
OS、ウィンドウズ3.x(Windows 3.x)、ウィンド
ウズ'95(Windows '95)、OS/2、および使用可能
な周知の他の一切のオペレーティング・システムであ
る。
【0013】クライアント・コンピュータ12が、イン
ターネットと呼ばれるコンピュータ・ネットワークと対
話するときには、インターネットにアクセスするための
各種ツールもRAM214内に実施される。このような
インターネット・アクセス・ツールには、HTTPに準
拠したウェブ・ブラウザが含まれる。このようなブラウ
ザ・ソフトウェアには、ネットスケープ(Netscape)、
ネットスケープ・ナビゲータ(Netscape Navigator)
2.0、モザイク(Mosaic)、IBMウェブエクスプロ
ーラ(IBM WebExplorer)、インターネット・エクスプ
ローラ(InternetExplorer)、およびその他の市販ブラ
ウザ・パッケージがある。本発明は、周知のまたは開発
中のこれらの一切のウェブ・ブラウザ内で動作するよう
に設計されている。RAM214は、シンプル・メール
・トランスファ・プロトコル(SMTP)すなわち電子
メール、ファイル・トランスファ・プロトコル(FT
P)、ネットワーク・ニュース・トランスファ・プロト
コル(NNTP)すなわち「ニュース・ネット」、およ
びリモート・ターミナル・アクセス(Telnet)を
含む他のインターネット・サービスをサポートすること
もできる。
【0014】本発明の好ましい実施態様には、本明細書
に記載した1つまたは複数の方法を実行するプログラム
されたコンピュータ・システムとしての実施態様、およ
びコンピュータ・プログラム・プロダクトとしての実施
態様が含まれる。コンピュータ・システムの実施態様に
よると、前記1つまたは複数の方法を実行する命令セッ
トは、概略前述のとおりに構成された1つまたは複数の
コンピュータ・システムのランダム・アクセス・メモリ
214に常駐する。コンピュータ・システムから要求が
あるまでは、この命令セットを、例えばディスク装置2
20(光ディスクやフロッピー・ディスクなどのリムー
バブル・メモリを含み得る)などの別のコンピュータ・
メモリにコンピュータ・プログラム・プロダクトとして
記憶しておいてもよい。さらに、このコンピュータ・プ
ログラム・プロダクトを別のコンピュータに記憶してお
き、必要なときに、ネットワークまたはインターネット
などの外部ネットワークによってユーザの作業端末に伝
送することもできる。プログラムを媒体に記憶させる
と、その媒体は物理的に変更され、コンピュータ可読情
報を担持するようになる。変更は、電気的、磁気的、化
学的または他の何らかの物理的方法でよい。命令、記
号、文字などで本発明を記述することは好都合である
が、それらは全て、適当な物理的要素と関連させなけれ
ばならないことに留意されたい。
【0015】本発明では、比較する、検査する、選択す
るなどの人間のオペレータを連想させる用語が使用され
る。しかし、本明細書に記載された本発明の一部を形成
する少なくともいくつかの動作については、人間のオペ
レータによる動作は望ましくない。記載の動作は大部分
が、電気信号を処理して別の電気信号を生成するマシン
動作である。
【0016】以下の動作説明の中では音声認識ユニット
252にたびたび言及する。音声認識ユニット252は
関連のデータ処理技術分野では周知なので、音声認識ユ
ニット252のより詳細な説明は本明細書に記載しな
い。音声認識ユニット252に関する情報については
は、米国特許第5465317号を参照されたい。
【0017】クライアント・コンピュータ12とも呼ぶ
本発明の動作を実行する複数のクライアント12のうち
の1つのクライアントの使用を、図3を参照して説明す
る。図3に示す技法の段階302では、現在のウェブ・
ページが、クライアント・コンピュータ12のグラフィ
カル・ユーザ・インタフェース上に表示される。現在の
ウェブ・ページへのアクセス、およびクライアント・コ
ンピュータ12のディスプレイ装置238上へのこのペ
ージの表示は、データ処理の技術分野では周知であり、
よってここでは詳細には記載しない。このウェブ・ペー
ジが、クライアント・コンピュータ12のディスプレイ
装置238上に表示された後、クライアント・コンピュ
ータ12は、ユーザ・インタフェース・アダプタ222
を使用可能とし、外部ユーザからの入力を検出できるよ
うにする。外部ユーザは、マウス226のボタンをクリ
ックするか、トラックボール232を正しい位置に置
き、使用可能状態にするか、またはキーボード224の
キーを押すかすることによって、このウェブ・ページを
スクロールダウンしたり、またはサーバ10の新しいウ
ェブ・ページにアクセスしたりすることができる。
【0018】外部ユーザが新しいウェブ・ページにアク
セスするときには、段階304で、CPU210は、音
声認識ユニット252に制御信号を供給し、そこに記憶
された語彙リストをクリアする。音声認識ユニット25
2の記憶された語彙リストは、マイクロホン250に入
力され、ユーザ・インタフェース・アダプタ222を介
して処理され、音声認識ユニット252に送られて音声
コマンドとして認識される外部ユーザによる全ての単語
および発話のリストを提供するものである。
【0019】続いて段階306で、CPU210は、ア
クセスされたウェブ・ページに対応するHTMLソース
・コードの構文解析を開始する。構文解析動作の実行で
は、CPU210はHTMLに関連したフォーマッティ
ングに依存する。このフォーマッティングについては後
に説明する。
【0020】HTMLは、記号「<>」によって表される
「タグ」を使用する。実際のタグはこれらの括弧記号の
間に置かれる。ほとんどのタグは、開始セクション(<
タグ>)および、スラッシュ記号によって表される終止
セクション(</タグ>)を有する。HTMLには、ドキ
ュメントを見る人が、同じドキュメントの別の場所にジ
ャンプしたり、別のドキュメントの先頭にジャンプした
り、別のドキュメントの特定の場所にジャンプしたり、
または新しいURLを介して別のサーバへのリモート・
リンクを生成し、そこへジャンプしたりすることができ
る多数のリンク・タグがある。先に述べたようなリンク
を指定するために、HTMLでは一般に、「<A HREF=/X
X.HTML>YY< /A>」の形のタグを使用する。ここで、XXは
URLを表し、YYは、アドレスの代わりにウェブ・ペー
ジに挿入されたテキストを表す。具体的にはリンクは、
タグに含められたHREF項によって指定される。この
指定に応答して、クライアント・コンピュータ12内の
ブラウザが、リンクを、異なる色または下線で表示す
る。これは、ユーザがリンクと関連した表示テキストを
指し、これをクリックするとリンクをダウンロードでき
ることを示す。この時点で、このリンクは「活動化」さ
れていると言い、クライアント・コンピュータ12内の
ブラウザは、リンクされたドキュメントまたはテキスト
をダウンロードし始める。
【0021】CPU210が、アクセスしたウェブ・ペ
ージに対応するHTMLを構文解析した後、段階308
で、CPU210は、アクセスしたウェブ・ページがリ
ンクを含んでいるか否かを判定する。含んでいない場合
には、プログラム・フローは段階302に戻る。しか
し、ウェブ・ページがリンクを含んでいる場合には、C
PU210が構文解析動作中にそれらのリンクを検出
し、段階310で、音声認識ユニット252を使用可能
状態にして、ディスプレイ装置238上に表示されてい
るそのリンクに対応するテキストを音声認識ユニットの
特殊語彙リストに記憶する。リンクに関連したテキスト
が、音声認識ユニット252が認識する単語のリストに
含まれているときには、段階310で、そのリンク・テ
キストは使用可能状態にされ、語彙リスト内に置かれ
る。その後、プログラム・フローは段階302に戻る。
【0022】ユーザが、新しいウェブ・ページに移動せ
ず、クライアント・コンピュータ12のディスプレイ装
置238に現在表示されているページをスクロールする
だけである場合には、段階314で、音声認識ユニット
252が、ページがスクロールされる前に表示されてい
た古いリンクに関連した言語をその語彙リストから削除
する。さらに、テキストを表示しているウィンドウの大
きさが変更されて、表示されるテキストやリンクが増減
するときにも、同様の機能が実行されることに留意され
たい。
【0023】続いて段階316で、CPU210が、ウ
ェブ・ページの新しくスクロールされた部分を構文解析
する。続いて段階318で、CPU210は、HTML
に関して先に述べたタグおよび参照を使用して、ウェブ
・ページのスクロールされた部分に新しいリンクが表示
されているか否かを判定する。表示されていない場合に
は、プログラム・フローは段階302に戻る。新しいリ
ンクが表示されている場合には、音声認識ユニット25
2が、そのリンクに関連したテキストを語彙リストに記
憶する。前述のとおり、語彙リストに記憶したテキスト
が、音声認識ユニット252が既に「知っている」単語
に対応するときには、音声認識ユニット252は、新し
いリンク・テキストを使用可能状態とし、このようなリ
ンク・テキストにアクセスする音声コマンドをユーザが
発話するときに、それが認識されるようにする。さら
に、本発明の他の実施形態では、音声認識ユニット25
2に記憶された古いリンクを、事前に選択した時間、保
持することができる。
【0024】次に段階324で、クライアント・コンピ
ュータ12は、外部ユーザが単語または音声を発するの
を検出する。その単語は、マイクロホン250からユー
ザ・インタフェース・アダプタ222に転送される。C
PU210の制御下で、その単語は、ユーザ・インタフ
ェース・アダプタ222から音声認識ユニット252に
送られる。段階326で、音声認識ユニット252は続
いて、その単語またはフレーズに対応するテキストを判
定する。音声認識ユニット252は、音声認識ユニット
252の語彙リストに記憶されたHREFすなわちリン
ク・テキストに対応するテキストと突き合わせることに
よってこの機能を実行する。この音声コマンドが語彙リ
ストにない場合には、音声認識ユニット252は、その
単語が自身の語彙の中に含まれないことを示し、プログ
ラム・フローは段階302に戻って、ユーザの次の行動
を待つ。音声コマンドが、音声認識ユニット252の語
彙リスト中の単語またはフレーズと一致する場合には、
その単語が、対応するウェブ・ページへのアクセスに使
用される。続いて段階328で、CPU210はこのウ
ェブ・ページ・アドレスを使用して、指定されたサーバ
10のウェブ・ページにアクセスする。
【0025】本発明の動作を、図1および図2のシステ
ム図および図3の流れ図を利用して説明してきたが、次
に、本発明の動作の例を示す。
【0026】ユーザが、インターネット上の「http://p
atent.womplex.ibm.com/ibm.html」で利用可能なIBM
の特許ホームページにアクセスすると仮定する。このよ
うなウェブ・ページにアクセスするために、クライアン
ト・コンピュータ12のRAM214から走らせている
ウェブ・ブラウザが、tcp/ip接続を使用して、H
TTPサービス(WINDOWSオペレーティング・シ
ステムの場合)または「デーモン(daemon)」(UNI
Xオペレーティング・システムの場合)を実行している
ウェブ・サーバ10にリクエストを送る。次いでHTT
Pサーバ(10)は、HTMLでフォーマットされたウ
ェブ・ページをブラウザに送ることによってこのリクエ
ストにサービスする。次いでブラウザは、ローカル資源
を使用してこのウェブ・ページを表示する。ウェブ・ペ
ージのリクエストは、インターナショナル・ビジネス・
マシーンズ社から市販されているOS/2オペレーティ
ング・システムを使用して音声コマンドによって実施し
てもよいし、または、(図2の)キーボード224やマ
ウス226などの従来の入力技術によって実施してもよ
いことに留意されたい。さらに、OS/2オペレーティ
ング・システムの使用は、単に例として示したに過ぎな
いことに留意されたい。サーバ・オペレーティング・シ
ステムは、HTTPプロトコルを実施するものであれば
どんなシステムでもよいことにも留意されたい。
【0027】図4に、図2のディスプレイ装置238上
に表示されたウェブ・ページを示す。ディスプレイ装置
238上には、クライアント・コンピュータ12のマイ
クロホン250に供給された音声入力を表示するため
に、音声マネージャ(Voice Manager)ウィンドウ40
0が提供されることに留意されたい。図4では、音声マ
ネージャ400は、ユーザがコマンド「Jump to IBM Pa
tent home page」を発話したことを表示している。した
がって、クライアント・コンピュータ12が、音声認識
ユニットを実施するか、またはこれにアクセスするOS
/2オペレーティング・システムまたはその他のオペレ
ーティング・システムの下で動作すると仮定すると、イ
ンターネット・アドレスが事前に定義され、クライアン
ト・コンピュータ12のメモリに記憶されている特定の
ウェブ・ページにジャンプするように音声コマンドを実
施することができる。図4にはいくつかの「リンク」が
図示されていることに留意されたい。これらのリンク
は、下線によって示されている。さらに、図4は、図3
の段階302および304に対応することに留意された
い。
【0028】次に、図4のウェブ・ページを生成するの
に使用したHTMLソース・コードを図5および図6に
示す。このHTMLソース・コードには、用語「image
s」、「FAQ」および「history and background of this
site」に対するリンクが存在することが示されている
(図6の中程)ことに留意されたい。前述のようにこれ
らのリンクは、先に識別した用語の前に置かれた用語H
REFによって指定される。したがって、クライアント
・コンピュータ12が、図4のウェブ・ページを生成す
るのに使用することができるHTMLソース・コードを
受け取るときには、CPU210は、一般にアンカー・
タグと呼ばれる「<A HREF=...>IBM</A>」の形のタグを
検出する。次にCPU210は、段階308ないし31
2を実行して、HREFタグに関連した言語を識別し、
その言語が、音声認識ユニット252が認識できる単語
に対応しているかどうかを判定する。
【0029】続いてユーザが、音声コマンド「link
s」を発話すると仮定する。「links」コマンド
は、ディスプレイ装置238に表示されたウィンドウの
トップ・バーのlinksメニューにアクセスする(図
7参照)。クライアント・コンピュータ12は音声コマ
ンドに応答しているので、音声マネージャ・ウィンドウ
600は、linksコマンドを受け取り、認識したこ
とを示している。さらに、linksコマンドは、図7
のウェブ・ページ中にリンクとして指定された用語だけ
を示すように更新されている。図示のテキストに関して
言うと、「images」、「FAQ」、「history and backgro
und of this site」および「NEW!」に対応するリンクが
識別されている。
【0030】次に、話し手が、コマンド「history and
background of this site」を発話し、そのテキストに
関連したウェブ・サイトにアクセスすると仮定する。こ
の場合、クライアント・コンピュータ12は、段階32
4で音声コマンドを検出する。続いて、CPU210お
よび音声認識ユニット252が、外部ユーザが供給し、
検出された単語またはフレーズが、リンクに関連した、
音声認識ユニット252の語彙リスト中のテキストと一
致するか否かを判定する。この用語は、linksメニ
ュー中に示されており、音声認識ユニット252が認識
できるので、音声認識ユニット252は、このリンクに
対応するインターネット・アドレスを供給する。この例
では、このインターネット・アドレスは「http://paten
t.womplex.ibm.com/info.html」である。このリクエス
トに応答して、コンピュータ・ネットワークのサーバ1
0は、このアドレスに対応するウェブ・ページを送信す
ることにより応答する。このウェブ・ページは、クライ
アント・コンピュータ12のブラウザに送られ、ディス
プレイ装置238上に表示される。図8に、その結果で
あるディスプレイ装置238上の表示を示す。音声認識
ユニット252がフレーズ「history and background o
f this site」を認識したことを、音声マネージャ・ウ
ィンドウが示していることに留意されたい。
【0031】外部ユーザが、図8の新しいウェブ・ペー
ジに関連したリンクを見たいときには、コマンド「li
nks」を発話するだけでよい。このコマンドに応答し
てlinksメニューが表示される。図7に表示した以
前のlinksメニューが、現在表示されているウェブ
・ページに関連したリンクのみを表示するように変更さ
れていることが図9のlinksメニューから分かる。
すなわち、リンク「missing or incomplete patent dat
a」および「what's new」が、以前に定義されたリンク
の代わりにlinksメニュー上に表示されている。こ
の新しいウェブ・ページにアクセスしたときには、この
ウェブ・ページに対応する語彙リストおよびlinks
メニューが適切な方法で確実に更新されるように、図3
の段階304ないし312が再び実行される。
【0032】第2の例として、IBMウェブエクスプロ
ーラ・ブラウザを使用して本発明を実施する。図4ない
し図9に示した例では、ネットスケープ・ブラウザが、
所望のウェブ・ページにアクセスするために利用されて
いたことに留意されたい。ウェブ・ブラウザによって実
行される大部分の動作は、ウェブ・ページを見ている外
部ユーザに対して同じ機能を実行しているように見える
が、外部ユーザにウェブ・ページを表示するのに各ブラ
ウザは異なる動作を実行している。
【0033】図10に、「Jump to USPTO home page」
コマンドを外部ユーザが実行することによってアクセス
できるウェブ・ページを示す。前述のとおり、このコマ
ンドは、ユーザが実施する音声インタフェースまたは他
の形態のグラフィカル・ユーザ・インタフェースを介し
て供給される。なお、USPTOホームページには、イ
ンターネット・アドレス「http://www.uspto.gov/web/m
enu/menu1.html」でアクセスすることができる。
【0034】 図11に、図10に表示したUSPTO
ホームページに対応するlinksメニューを示す。こ
れらのリンクは、USPTOホームページにジャンプす
るユーザの命令によってアクセスした新しいホームペー
ジに対応するものであることに留意されたい。続いてユ
ーザが、図10のウェブ・ページに定義されたリンクで
あり、図11のlinksメニューに表示されている
「office ofthe commissioner」を見るコマンドを発話
すると、インターネット・アドレス「http://www.uspt
o.gov/web/menu/comm.html」を有するウェブ・ページに
アクセスされる。このウェブ・ページを図12に示す。
次に図13に、外部ユーザの音声コマンドに応答して新
しくアクセスされたこのウェブ・ページに対応するli
nksメニューを示す。
【0035】本明細書に記載したそれぞれの例を通し
て、本発明は、ユーザが音声コマンドを与えて、ウェブ
・ページ上に指定されたリンクにアクセスする技法を実
現する。したがって例えば、ウェブ・ページのリンクに
関連したハイパーテキスト・ドキュメントはリモート・
サーバにあることが想定されているが、これは、本発明
を限定するものではなく、目標ドキュメントの記憶場所
とは無関係に音声コマンドを使用してリンクにアクセス
することができる。また、好ましい実施形態を、インタ
ーネット・ブラウザとの関係において説明してきたが、
ワールド・ワイド・ウェブにユーザが、インターネット
への直接接続によってアクセスしているか、またはオン
ライン・サービス・プロバイダを介して間接的にアクセ
スしているかに関わらず、本発明の技術は適用される。
したがって、本発明が実施されるコンピュータ・ネット
ワークは、クライアントが、「リモート」ドキュメン
ト、または、たとえ同じマシンまたはシステム上にある
場合でもそのドキュメントにリンクすることができる一
切のクライアント・サーバ・モデルを含むものと広く解
釈しなければならない。さらに、本発明のブラウザの実
施態様では、ブラウザは、ユーザのパーソナル・コンピ
ュータのランダム・アクセス・メモリに常駐するコード
・モジュール中の命令セットとして実施される。コンピ
ュータの要求があるまでは、この命令セットを、例え
ば、ハードディスク・ドライブ、または光ディスク(C
D‐ROMドライブで使用される)やフロッピー・ディ
スク(フロッピー・ディスク・ドライブで使用される)
のようなリムーバブル・メモリなどの別のコンピュータ
・メモリに記憶しておいてもよい。さらに、記載の各種
方法は、ソフトウェアによって選択的に活動化された、
すなわち再構成された汎用コンピュータで都合よく実施
できるが、このような方法は、必要な方法段階を実行す
るように構成されたハードウェア、ファームウェア、ま
たはより特化した装置でも実行できる。
【0036】さらに、本発明は、ネットスケープ、ネッ
トスケープ・ナビゲータ2.0、モザイク、インターネ
ット・エクスプローラなどのHTMLに準拠したブラウ
ザによって従来のHTMLおよびその拡張記述言語とと
もに実施されるように設計されている。このような既存
のまたは開発済みのプログラムは、前述の本発明の機能
を含むように修正される。
【0037】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0038】(1)第1のユーザ入力を受け取る第1の
入力手段と、第1の音声コマンドを受け取る第2の入力
手段と、前記第1の入力手段に結合され、前記第1のユ
ーザ入力に応答して第1の動作を実行し、前記第1のユ
ーザ入力に対応する第1のリンク値を識別する中央処理
装置と、前記第1のリンク値にアクセスし、前記第1の
リンク値を第1のメモリに記憶するために中央処理装置
に結合され、さらに前記第2の入力手段に結合されて、
前記第1の音声コマンドが前記第1のリンク値に対応し
ているかどうかを判定する音声認識ユニットとを含むデ
ータ処理システム。 (2)前記第1の音声コマンドが前記第1のリンク値に
対応すると前記音声認識ユニットが判定したときに、前
記中央処理装置が第2の動作を実行する、上記(1)に
記載のデータ処理システム。 (3)前記第1の動作が、前記第1のユーザ入力に対応
する第1のアプリケーションにアクセスする、上記
(2)に記載のデータ処理システム。 (4)前記第2の動作が、第2のアプリケーションにア
クセスする、上記(3)に記載のデータ処理システム。 (5)前記第1のユーザ入力が、第1のインターネット
・アドレスにある第1の情報ページに対応するソフトウ
ェアの第1の部分である、上記(1)に記載のデータ処
理システム。 (6)前記第1のリンクが、第2のインターネット・ア
ドレスを指示する、上記(5)に記載のデータ処理シス
テム。 (7)前記第1の音声コマンドが前記第1のリンクに対
応するときに、前記中央処理装置が、複数の制御信号を
供給して、第2のインターネット・アドレスにアクセス
する、上記(6)に記載のデータ処理システム。 (8)第3のユーザ入力を受け取る第3の入力手段をさ
らに含み、前記中央処理装置が、前記第1のインターネ
ット・アドレスにある第2の情報ページに対応するソフ
トウェアの第2の部分にアクセスする、上記(5)に記
載のデータ処理システム。 (9)前記中央処理装置が、前記第3のユーザ入力に対
応する第2のリンク値を識別する、上記(8)に記載の
データ処理システム。 (10)前記音声認識ユニットが、前記第2のリンク値
にアクセスし、前記第2のリンク値を第2のメモリに記
憶し、第2の音声コマンドが第2のリンク値に対応して
いるかどうかを判定する、上記(9)に記載のデータ処
理システム。 (11)前記第2のリンク値が前記第2のメモリに記憶
されたときに、前記第1のリンク値が前記第1のメモリ
から削除される、上記(10)に記載のデータ処理シス
テム。 (12)通信ネットワークにアクセスする方法であっ
て、第1のユーザ・インタフェースで第1のユーザ入力
を受け取る段階と、中央処理装置を使用可能状態にし、
前記第1のユーザ入力に応答して、第1のテキスト部分
を含む第1のアプリケーションにアクセスする段階と、
前記第1のテキスト部分を構文解析して、第2のアプリ
ケーションに対応する第1のリンクを識別する段階と、
第2のユーザ・インタフェースで第1の音声コマンドを
受け取る段階と、音声認識ユニットを使用可能状態にし
て、前記第1の音声コマンドを認識し、前記第1の音声
コマンドが前記第1のリンクに対応しているかどうかを
判定する段階とを含む方法。 (13)前記中央処理装置を使用可能状態にして、前記
第1の音声コマンドが前記第1のリンクに対応するとき
に第2のアプリケーションにアクセスする段階をさらに
含む、上記(12)に記載の方法。 (14)前記第1のユーザ入力が、第1のインターネッ
ト・アドレスにある第1の情報ページに対応するソフト
ウェアの第1の部分である、上記(13)に記載の方
法。 (15)前記中央処理装置が第2のアプリケーションに
アクセスしたときに、第2のインターネット・アドレス
にある第2の情報ページに対応するソフトウェアの第2
の部分を受け取る段階をさらに含む、上記(14)に記
載の方法。 (16)前記第1のリンクが、第2のインターネット・
アドレスに対応する、上記(15)に記載の方法。 (17)第3のユーザ・インタフェースで第3のユーザ
入力を受け取る段階と、前記中央処理装置を使用可能状
態にして、前記第1のインターネット・アドレスにある
第2の情報ページに対応するソフトウェアの第2の部分
にアクセスする段階とをさらに含む、上記(14)に記
載の方法。 (18)前記ソフトウェアの第2の部分から第2のリン
クを識別する段階をさらに含む、上記(17)に記載の
方法。 (19)前記音声認識ユニットを使用可能状態にして、
第2のリンクにアクセスする段階と、前記第2のリンク
を第2のメモリに記憶する段階と、前記音声認識ユニッ
トを使用可能状態にして、第2の音声コマンドが前記第
2のリンクに対応しているかどうかを判定する段階とを
さらに含む、上記(18)に記載の方法。 (20)前記第2のリンクが前記第2のメモリに記憶さ
れたときに、前記第1のリンクを前記第1のメモリから
削除する段階をさらに含む、上記(19)に記載の方
法。 (21)データ処理システムにアクセスする方法段階を
実行する、マシンが実行可能な命令プログラムを明白に
具現化したマシン可読のプログラム記憶装置であって、
前記方法段階が、第1のユーザ・インタフェースで第1
のユーザ入力を受け取る段階と、中央処理装置を使用可
能状態にし、前記第1のユーザ入力に応答して、第1の
テキスト部分を含む第1のアプリケーションにアクセス
する段階と、前記第1のテキスト部分を構文解析して、
第2のアプリケーションに対応する第1のリンクを識別
する段階と、第2のユーザ・インタフェースで第1の音
声コマンドを受け取る段階と、音声認識ユニットを使用
可能状態にして、前記第1の音声コマンドを認識し、前
記第1の音声コマンドが第1のリンクに対応しているか
どうかを判定する段階とを含むプログラム記憶装置。 (22)前記方法段階がさらに、前記中央処理装置を使
用可能状態にして、前記第1の音声コマンドが前記第1
のリンクに対応するときに第2のアプリケーションにア
クセスする段階を含む、上記(21)に記載のプログラ
ム記憶装置。 (23)前記第1のユーザ入力が、第1のインターネッ
ト・アドレスにある第1の情報ページに対応するソフト
ウェアの第1の部分である、上記(22)に記載のプロ
グラム記憶装置。 (24)前記方法段階がさらに、前記中央処理装置が第
2のアプリケーションにアクセスしたときに、第2のイ
ンターネット・アドレスにある第2の情報ページに対応
するソフトウェアの第2の部分を受け取る段階を含む、
上記(23)に記載のプログラム記憶装置。 (25)前記第1のリンクが、第2のインターネット・
アドレスに対応する、上記(24)に記載のプログラム
記憶装置。 (26)前記方法段階がさらに、第3のユーザ・インタ
フェースで第3のユーザ入力を受け取る段階と、前記中
央処理装置を使用可能状態にして、前記第1のインター
ネット・アドレスにある第2の情報ページに対応するソ
フトウェアの第2の部分にアクセスする段階とを含む、
上記(23)に記載のプログラム記憶装置。 (27)前記方法段階がさらに、前記ソフトウェアの第
2の部分から第2のリンクを識別する段階を含む、上記
(26)に記載のプログラム記憶装置。 (28)前記方法段階がさらに、前記音声認識ユニット
を使用可能状態にして、第2のリンクにアクセスする段
階と、前記第2のリンクを第2のメモリに記憶する段階
と、前記音声認識ユニットを使用可能状態にして、第2
の音声コマンドが前記第2のリンクに対応しているかど
うかを判定する段階とを含む、上記(27)に記載のプ
ログラム記憶装置。 (29)前記方法段階がさらに、前記第2のリンクが前
記第2のメモリに記憶されたときに、前記第1のリンク
を前記第1のメモリから削除する段階を含む、上記(2
8)に記載のプログラム記憶装置。
【図面の簡単な説明】
【図1】本発明の一実施形態に基づくコンピュータ・ネ
ットワークを示すブロック図である。
【図2】図1のクライアント・コンピュータを示すブロ
ック図である。
【図3】音声コマンド・インタフェースを使用してウェ
ブ・ページ上のリンクにアクセスするために本発明によ
って実現された技法の一実施形態を示す流れ図である。
【図4】複数のハイパーテキスト・リンクを示す代表的
なウェブ・ページを示す図である。
【図5】図4のウェブ・ページに対応するHTMLソー
ス・コードを示す図である。
【図6】図4のウェブ・ページに対応するHTMLソー
ス・コードを示す図である。
【図7】本発明の一実施形態に基づく音声コマンド・イ
ンタフェースを使用してアクセスしたlinksメニュ
ーを示す図である。
【図8】本発明の一実施形態に基づく音声コマンド・イ
ンタフェースを使用してアクセスしたウェブ・ページを
示す図である。
【図9】図8のウェブ・ページに対応するlinksメ
ニューを示す図である。
【図10】本発明の一実施形態に基づいてアクセスした
ウェブ・ページを示す図である。
【図11】図10のウェブ・ページに対応するlink
sメニューを示す図である。
【図12】本発明の一実施形態に基づく音声コマンドで
アクセスしたウェブ・ページを示す図である。
【図13】図12のウェブ・ページに対応するlink
sメニューを示す図である。
【符号の説明】
10 サーバ 12 クライアント 14 インターネット・アクセス・プロバイダ 16 オンライン・サービス・プロバイダ 210 中央処理装置(CPU) 212 システム・バス 214 ランダム・アクセス・メモリ(RAM) 216 リード・オンリー・メモリ(ROM) 218 入出力アダプタ 220 ディスク記憶装置 222 ユーザ・インタフェース・アダプタ 224 キーボード 226 マウス 228 スピーカ 232 トラックボール 234 通信アダプタ 236 ディスプレイ・アダプタ 238 ディスプレイ装置 240 ディスク駆動機構 252 音声認識ユニット
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェームズ・リン・テーラー アメリカ合衆国76530 テキサス州グラン ジャー シー・アール156 1975 (72)発明者 ウィリアム・ジョセフ・トレーシー・セカ ンド アメリカ合衆国78681 テキサス州ラウン ド・ロック ディープウッド・ドライブ 40

Claims (29)

    【特許請求の範囲】
  1. 【請求項1】第1のユーザ入力を受け取る第1の入力手
    段と、 第1の音声コマンドを受け取る第2の入力手段と、 前記第1の入力手段に結合され、前記第1のユーザ入力
    に応答して第1の動作を実行し、前記第1のユーザ入力
    に対応する第1のリンク値を識別する中央処理装置と、 前記第1のリンク値にアクセスし、前記第1のリンク値
    を第1のメモリに記憶するために中央処理装置に結合さ
    れ、さらに前記第2の入力手段に結合されて、前記第1
    の音声コマンドが前記第1のリンク値に対応しているか
    どうかを判定する音声認識ユニットとを含むデータ処理
    システム。
  2. 【請求項2】前記第1の音声コマンドが前記第1のリン
    ク値に対応すると前記音声認識ユニットが判定したとき
    に、前記中央処理装置が第2の動作を実行する、請求項
    1に記載のデータ処理システム。
  3. 【請求項3】前記第1の動作が、前記第1のユーザ入力
    に対応する第1のアプリケーションにアクセスする、請
    求項2に記載のデータ処理システム。
  4. 【請求項4】前記第2の動作が、第2のアプリケーショ
    ンにアクセスする、請求項3に記載のデータ処理システ
    ム。
  5. 【請求項5】前記第1のユーザ入力が、第1のインター
    ネット・アドレスにある第1の情報ページに対応するソ
    フトウェアの第1の部分である、請求項1に記載のデー
    タ処理システム。
  6. 【請求項6】前記第1のリンクが、第2のインターネッ
    ト・アドレスを指示する、請求項5に記載のデータ処理
    システム。
  7. 【請求項7】前記第1の音声コマンドが前記第1のリン
    クに対応するときに、前記中央処理装置が、複数の制御
    信号を供給して、第2のインターネット・アドレスにア
    クセスする、請求項6に記載のデータ処理システム。
  8. 【請求項8】第3のユーザ入力を受け取る第3の入力手
    段をさらに含み、前記中央処理装置が、前記第1のイン
    ターネット・アドレスにある第2の情報ページに対応す
    るソフトウェアの第2の部分にアクセスする、請求項5
    に記載のデータ処理システム。
  9. 【請求項9】前記中央処理装置が、前記第3のユーザ入
    力に対応する第2のリンク値を識別する、請求項8に記
    載のデータ処理システム。
  10. 【請求項10】前記音声認識ユニットが、前記第2のリ
    ンク値にアクセスし、前記第2のリンク値を第2のメモ
    リに記憶し、第2の音声コマンドが第2のリンク値に対
    応しているかどうかを判定する、請求項9に記載のデー
    タ処理システム。
  11. 【請求項11】前記第2のリンク値が前記第2のメモリ
    に記憶されたときに、前記第1のリンク値が前記第1の
    メモリから削除される、請求項10に記載のデータ処理
    システム。
  12. 【請求項12】通信ネットワークにアクセスする方法で
    あって、 第1のユーザ・インタフェースで第1のユーザ入力を受
    け取る段階と、 中央処理装置を使用可能状態にし、前記第1のユーザ入
    力に応答して、第1のテキスト部分を含む第1のアプリ
    ケーションにアクセスする段階と、 前記第1のテキスト部分を構文解析して、第2のアプリ
    ケーションに対応する第1のリンクを識別する段階と、 第2のユーザ・インタフェースで第1の音声コマンドを
    受け取る段階と、 音声認識ユニットを使用可能状態にして、前記第1の音
    声コマンドを認識し、前記第1の音声コマンドが前記第
    1のリンクに対応しているかどうかを判定する段階とを
    含む方法。
  13. 【請求項13】前記中央処理装置を使用可能状態にし
    て、前記第1の音声コマンドが前記第1のリンクに対応
    するときに第2のアプリケーションにアクセスする段階
    をさらに含む、請求項12に記載の方法。
  14. 【請求項14】前記第1のユーザ入力が、第1のインタ
    ーネット・アドレスにある第1の情報ページに対応する
    ソフトウェアの第1の部分である、請求項13に記載の
    方法。
  15. 【請求項15】前記中央処理装置が第2のアプリケーシ
    ョンにアクセスしたときに、第2のインターネット・ア
    ドレスにある第2の情報ページに対応するソフトウェア
    の第2の部分を受け取る段階をさらに含む、請求項14
    に記載の方法。
  16. 【請求項16】前記第1のリンクが、第2のインターネ
    ット・アドレスに対応する、請求項15に記載の方法。
  17. 【請求項17】第3のユーザ・インタフェースで第3の
    ユーザ入力を受け取る段階と、 前記中央処理装置を使用可能状態にして、前記第1のイ
    ンターネット・アドレスにある第2の情報ページに対応
    するソフトウェアの第2の部分にアクセスする段階とを
    さらに含む、請求項14に記載の方法。
  18. 【請求項18】前記ソフトウェアの第2の部分から第2
    のリンクを識別する段階をさらに含む、請求項17に記
    載の方法。
  19. 【請求項19】前記音声認識ユニットを使用可能状態に
    して、第2のリンクにアクセスする段階と、 前記第2のリンクを第2のメモリに記憶する段階と、 前記音声認識ユニットを使用可能状態にして、第2の音
    声コマンドが前記第2のリンクに対応しているかどうか
    を判定する段階とをさらに含む、請求項18に記載の方
    法。
  20. 【請求項20】前記第2のリンクが前記第2のメモリに
    記憶されたときに、前記第1のリンクを前記第1のメモ
    リから削除する段階をさらに含む、請求項19に記載の
    方法。
  21. 【請求項21】データ処理システムにアクセスする方法
    段階を実行する、マシンが実行可能な命令プログラムを
    明白に具現化したマシン可読のプログラム記憶装置であ
    って、前記方法段階が、 第1のユーザ・インタフェースで第1のユーザ入力を受
    け取る段階と、 中央処理装置を使用可能状態にし、前記第1のユーザ入
    力に応答して、第1のテキスト部分を含む第1のアプリ
    ケーションにアクセスする段階と、 前記第1のテキスト部分を構文解析して、第2のアプリ
    ケーションに対応する第1のリンクを識別する段階と、 第2のユーザ・インタフェースで第1の音声コマンドを
    受け取る段階と、 音声認識ユニットを使用可能状態にして、前記第1の音
    声コマンドを認識し、前記第1の音声コマンドが第1の
    リンクに対応しているかどうかを判定する段階とを含む
    プログラム記憶装置。
  22. 【請求項22】前記方法段階がさらに、前記中央処理装
    置を使用可能状態にして、前記第1の音声コマンドが前
    記第1のリンクに対応するときに第2のアプリケーショ
    ンにアクセスする段階を含む、請求項21に記載のプロ
    グラム記憶装置。
  23. 【請求項23】前記第1のユーザ入力が、第1のインタ
    ーネット・アドレスにある第1の情報ページに対応する
    ソフトウェアの第1の部分である、請求項22に記載の
    プログラム記憶装置。
  24. 【請求項24】前記方法段階がさらに、前記中央処理装
    置が第2のアプリケーションにアクセスしたときに、第
    2のインターネット・アドレスにある第2の情報ページ
    に対応するソフトウェアの第2の部分を受け取る段階を
    含む、請求項23に記載のプログラム記憶装置。
  25. 【請求項25】前記第1のリンクが、第2のインターネ
    ット・アドレスに対応する、請求項24に記載のプログ
    ラム記憶装置。
  26. 【請求項26】前記方法段階がさらに、 第3のユーザ・インタフェースで第3のユーザ入力を受
    け取る段階と、 前記中央処理装置を使用可能状態にして、前記第1のイ
    ンターネット・アドレスにある第2の情報ページに対応
    するソフトウェアの第2の部分にアクセスする段階とを
    含む、請求項23に記載のプログラム記憶装置。
  27. 【請求項27】前記方法段階がさらに、前記ソフトウェ
    アの第2の部分から第2のリンクを識別する段階を含
    む、請求項26に記載のプログラム記憶装置。
  28. 【請求項28】前記方法段階がさらに、 前記音声認識ユニットを使用可能状態にして、第2のリ
    ンクにアクセスする段階と、 前記第2のリンクを第2のメモリに記憶する段階と、 前記音声認識ユニットを使用可能状態にして、第2の音
    声コマンドが前記第2のリンクに対応しているかどうか
    を判定する段階とを含む、請求項27に記載のプログラ
    ム記憶装置。
  29. 【請求項29】前記方法段階がさらに、前記第2のリン
    クが前記第2のメモリに記憶されたときに、前記第1の
    リンクを前記第1のメモリから削除する段階を含む、請
    求項28に記載のプログラム記憶装置。
JP10243498A 1997-04-16 1998-04-14 音声コマンドを使用してネットワークをナビゲートするデータ処理システムおよび方法 Expired - Fee Related JP3378498B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/842,720 US6101472A (en) 1997-04-16 1997-04-16 Data processing system and method for navigating a network using a voice command
US08/842720 1997-04-16

Publications (2)

Publication Number Publication Date
JPH10320168A true JPH10320168A (ja) 1998-12-04
JP3378498B2 JP3378498B2 (ja) 2003-02-17

Family

ID=25288090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10243498A Expired - Fee Related JP3378498B2 (ja) 1997-04-16 1998-04-14 音声コマンドを使用してネットワークをナビゲートするデータ処理システムおよび方法

Country Status (2)

Country Link
US (1) US6101472A (ja)
JP (1) JP3378498B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000038043A1 (fr) * 1998-12-21 2000-06-29 Matsushita Electric Industrial Co., Ltd. Dispositif d'affichage d'hypertexte
JP2002169750A (ja) * 2000-11-30 2002-06-14 Nec Corp ブラウザ搭載装置
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
JP2002352104A (ja) * 2001-05-25 2002-12-06 Nec Fielding Ltd バーチャルショッピングシステム、バーチャルショッピング方法およびバーチャルショッピング用プログラム
US6952675B1 (en) 1999-09-10 2005-10-04 International Business Machines Corporation Methods and apparatus for voice information registration and recognized sentence specification in accordance with speech recognition
KR100519748B1 (ko) * 2000-08-11 2005-10-07 삼성전자주식회사 연속어 음성 명령을 통한 인터넷 네비게이션 시스템 및 그방법
JP2013137584A (ja) * 2011-12-27 2013-07-11 Toshiba Corp 電子機器、表示方法、およびプログラム
JP2015038732A (ja) * 2007-08-16 2015-02-26 ワベリンク コーポレーション 音声を利用できるテルネットインターフェイス

Families Citing this family (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6775264B1 (en) 1997-03-03 2004-08-10 Webley Systems, Inc. Computer, internet and telecommunications based network
US6678718B1 (en) * 1997-08-29 2004-01-13 Aspect Communications Corporation Method and apparatus for establishing connections
US6282512B1 (en) * 1998-02-05 2001-08-28 Texas Instruments Incorporated Enhancement of markup language pages to support spoken queries
US6751211B1 (en) * 1998-04-03 2004-06-15 Aspect Communications Corporation Method and apparatus for communicating information
US6859451B1 (en) * 1998-04-21 2005-02-22 Nortel Networks Limited Server for handling multimodal information
US6959449B1 (en) * 1998-06-08 2005-10-25 Sony Corporation System and method for simultaneously accessing video data and internet page data
US6308157B1 (en) * 1999-06-08 2001-10-23 International Business Machines Corp. Method and apparatus for providing an event-based “What-Can-I-Say?” window
US6901431B1 (en) * 1999-09-03 2005-05-31 Cisco Technology, Inc. Application server providing personalized voice enabled web application services using extensible markup language documents
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7050977B1 (en) * 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7516190B2 (en) * 2000-02-04 2009-04-07 Parus Holdings, Inc. Personal voice-based information retrieval system
US6721705B2 (en) 2000-02-04 2004-04-13 Webley Systems, Inc. Robust voice browser system and voice activated device controller
US8131555B1 (en) * 2000-03-21 2012-03-06 Aol Inc. System and method for funneling user responses in an internet voice portal system to determine a desired item or service
US6968380B1 (en) * 2000-05-30 2005-11-22 International Business Machines Corporation Method and system for increasing ease-of-use and bandwidth utilization in wireless devices
US6985933B1 (en) 2000-05-30 2006-01-10 International Business Machines Corporation Method and system for increasing ease-of-use and bandwidth utilization in wireless devices
FR2810125B1 (fr) * 2000-06-08 2004-04-30 Interactive Speech Technologie Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client
US7245291B2 (en) 2000-07-11 2007-07-17 Imran Sharif System and method for internet appliance data entry and navigation
US6980313B2 (en) * 2000-07-11 2005-12-27 Imran Sharif Fax-compatible internet appliance
US20030115167A1 (en) * 2000-07-11 2003-06-19 Imran Sharif Web browser implemented in an Internet appliance
US20020078445A1 (en) * 2000-07-11 2002-06-20 Imran Sharif Internet appliance for interactive audio/video display using a remote control unit for user input
US7240006B1 (en) * 2000-09-27 2007-07-03 International Business Machines Corporation Explicitly registering markup based on verbal commands and exploiting audio context
US7660754B1 (en) 2000-12-26 2010-02-09 At&T Delaware Intellectual Property Inc. Technician communications system with automated claims processing
US7286994B1 (en) 2000-12-26 2007-10-23 At&T Bls Intellectual Property, Inc. System for facilitating technician sales referrals
US6728681B2 (en) * 2001-01-05 2004-04-27 Charles L. Whitham Interactive multimedia book
US7228495B2 (en) 2001-02-27 2007-06-05 International Business Machines Corporation Method and system for providing an index to linked sites on a web page for individuals with visual disabilities
US7228493B2 (en) * 2001-03-09 2007-06-05 Lycos, Inc. Serving content to a client
US6941509B2 (en) 2001-04-27 2005-09-06 International Business Machines Corporation Editing HTML DOM elements in web browsers with non-visual capabilities
US20020161824A1 (en) * 2001-04-27 2002-10-31 International Business Machines Corporation Method for presentation of HTML image-map elements in non visual web browsers
US7610547B2 (en) * 2001-05-04 2009-10-27 Microsoft Corporation Markup language extensions for web enabled recognition
US20020178182A1 (en) * 2001-05-04 2002-11-28 Kuansan Wang Markup language extensions for web enabled recognition
US7506022B2 (en) * 2001-05-04 2009-03-17 Microsoft.Corporation Web enabled recognition architecture
US7409349B2 (en) * 2001-05-04 2008-08-05 Microsoft Corporation Servers for web enabled speech recognition
US7203188B1 (en) 2001-05-21 2007-04-10 Estara, Inc. Voice-controlled data/information display for internet telephony and integrated voice and data communications using telephones and computing devices
US7020841B2 (en) 2001-06-07 2006-03-28 International Business Machines Corporation System and method for generating and presenting multi-modal applications from intent-based markup scripts
US7606712B1 (en) 2001-06-28 2009-10-20 At&T Intellectual Property Ii, L.P. Speech recognition interface for voice actuation of legacy systems
US7401144B1 (en) 2001-06-28 2008-07-15 At&T Delaware Intellectual Property, Inc. Technician intranet access via systems interface to legacy systems
US7219137B1 (en) 2001-06-28 2007-05-15 Bellsouth Intellectual Property Corp Technician wireline and wireless intranet access via systems interface to legacy systems
US8831949B1 (en) 2001-06-28 2014-09-09 At&T Intellectual Property I, L.P. Voice recognition for performing authentication and completing transactions in a systems interface to legacy systems
US7609829B2 (en) * 2001-07-03 2009-10-27 Apptera, Inc. Multi-platform capable inference engine and universal grammar language adapter for intelligent voice application execution
US20030007609A1 (en) * 2001-07-03 2003-01-09 Yuen Michael S. Method and apparatus for development, deployment, and maintenance of a voice software application for distribution to one or more consumers
US7194513B2 (en) * 2001-07-08 2007-03-20 Imran Sharif System and method for using an internet appliance to send/receive digital content files as E-mail attachments
US8229753B2 (en) * 2001-10-21 2012-07-24 Microsoft Corporation Web server controls for web enabled recognition and/or audible prompting
US7711570B2 (en) 2001-10-21 2010-05-04 Microsoft Corporation Application abstraction with dialog purpose
US20030125953A1 (en) * 2001-12-28 2003-07-03 Dipanshu Sharma Information retrieval system including voice browser and data conversion server
US7149702B1 (en) 2001-12-31 2006-12-12 Bellsouth Intellectual Property Corp. System and method for document delays associated with a project
US20040054538A1 (en) * 2002-01-03 2004-03-18 Peter Kotsinadelis My voice voice agent for use with voice portals and related products
US20030145062A1 (en) * 2002-01-14 2003-07-31 Dipanshu Sharma Data conversion server for voice browsing system
US20060168095A1 (en) * 2002-01-22 2006-07-27 Dipanshu Sharma Multi-modal information delivery system
KR100420773B1 (ko) * 2002-04-10 2004-03-02 주식회사 온세통신 음성 인식을 이용한 실시간 통화 중 음성 정보 서비스제공 시스템 및 그 방법
US8611919B2 (en) * 2002-05-23 2013-12-17 Wounder Gmbh., Llc System, method, and computer program product for providing location based services and mobile e-commerce
US7216287B2 (en) * 2002-08-02 2007-05-08 International Business Machines Corporation Personal voice portal service
US7421390B2 (en) * 2002-09-13 2008-09-02 Sun Microsystems, Inc. Method and system for voice control of software applications
US20040128136A1 (en) * 2002-09-20 2004-07-01 Irani Pourang Polad Internet voice browser
AU2002347129A1 (en) * 2002-11-13 2004-06-03 Intel China Ltd. Multi-modal web interaction over wireless network
US6834265B2 (en) * 2002-12-13 2004-12-21 Motorola, Inc. Method and apparatus for selective speech recognition
US7197331B2 (en) * 2002-12-30 2007-03-27 Motorola, Inc. Method and apparatus for selective distributed speech recognition
US7313527B2 (en) * 2003-01-23 2007-12-25 Intel Corporation Registering an utterance and an associated destination anchor with a speech recognition engine
US7260535B2 (en) 2003-04-28 2007-08-21 Microsoft Corporation Web server controls for web enabled recognition and/or audible prompting for call controls
US20040230637A1 (en) * 2003-04-29 2004-11-18 Microsoft Corporation Application controls for speech enabled recognition
US7277697B2 (en) * 2003-05-23 2007-10-02 Adesh Desai Method and system for establishing a teleconference over a telephony network
WO2004109471A2 (en) * 2003-06-06 2004-12-16 The Trustees Of Columbia University In The City Of New York System and method for voice activating web pages
US8938595B2 (en) * 2003-08-05 2015-01-20 Sepaton, Inc. Emulated storage system
US7158779B2 (en) * 2003-11-11 2007-01-02 Microsoft Corporation Sequential multimodal input
US7363027B2 (en) * 2003-11-11 2008-04-22 Microsoft Corporation Sequential multimodal input
US20050163136A1 (en) * 2003-11-17 2005-07-28 Leo Chiu Multi-tenant self-service VXML portal
US7697673B2 (en) 2003-11-17 2010-04-13 Apptera Inc. System for advertisement selection, placement and delivery within a multiple-tenant voice interaction service system
US7434158B2 (en) 2003-12-10 2008-10-07 International Business Machines Corporation Presenting multimodal web page content on sequential multimode devices
US7515695B1 (en) 2003-12-15 2009-04-07 Avaya Inc. Client customizable interactive voice response system
US7552055B2 (en) 2004-01-10 2009-06-23 Microsoft Corporation Dialog component re-use in recognition systems
US8160883B2 (en) * 2004-01-10 2012-04-17 Microsoft Corporation Focus tracking in dialogs
US7864929B2 (en) * 2004-02-13 2011-01-04 Nuance Communications, Inc. Method and systems for accessing data from a network via telephone, using printed publication
US7650284B2 (en) * 2004-11-19 2010-01-19 Nuance Communications, Inc. Enabling voice click in a multimodal page
US20060241945A1 (en) * 2005-04-25 2006-10-26 Morales Anthony E Control of settings using a command rotor
EP1729284A1 (en) 2005-05-30 2006-12-06 International Business Machines Corporation Method and systems for a accessing data by spelling discrimination letters of link names
US7962842B2 (en) * 2005-05-30 2011-06-14 International Business Machines Corporation Method and systems for accessing data by spelling discrimination letters of link names
US8073700B2 (en) 2005-09-12 2011-12-06 Nuance Communications, Inc. Retrieval and presentation of network service results for mobile device using a multimodal browser
US20070286360A1 (en) * 2006-03-27 2007-12-13 Frank Chu System and Method for Providing Screen-Context Assisted Information Retrieval
US20070294927A1 (en) * 2006-06-26 2007-12-27 Saundra Janese Stevens Evacuation Status Indicator (ESI)
US7742922B2 (en) * 2006-11-09 2010-06-22 Goller Michael D Speech interface for search engines
US8843376B2 (en) 2007-03-13 2014-09-23 Nuance Communications, Inc. Speech-enabled web content searching using a multimodal browser
US8060371B1 (en) * 2007-05-09 2011-11-15 Nextel Communications Inc. System and method for voice interaction with non-voice enabled web pages
US8271876B2 (en) * 2009-01-26 2012-09-18 International Business Machines Corporation Trigger, generate, and display hover helps for multiple user interface elements
US8620939B2 (en) * 2010-01-25 2013-12-31 Sepaton, Inc. System and method for summarizing data
US8688651B2 (en) 2011-01-25 2014-04-01 Sepaton, Inc. Dynamic deduplication
US20120260284A1 (en) * 2011-04-07 2012-10-11 Sony Corporation User interface for audio video display device such as tv personalized for multiple viewers
US9183832B2 (en) * 2011-06-07 2015-11-10 Samsung Electronics Co., Ltd. Display apparatus and method for executing link and method for recognizing voice thereof
US9691381B2 (en) * 2012-02-21 2017-06-27 Mediatek Inc. Voice command recognition method and related electronic device and computer-readable medium
US9292252B2 (en) * 2012-08-02 2016-03-22 Nuance Communications, Inc. Methods and apparatus for voiced-enabling a web application
US9292253B2 (en) * 2012-08-02 2016-03-22 Nuance Communications, Inc. Methods and apparatus for voiced-enabling a web application
US9781262B2 (en) * 2012-08-02 2017-10-03 Nuance Communications, Inc. Methods and apparatus for voice-enabling a web application
US10157612B2 (en) 2012-08-02 2018-12-18 Nuance Communications, Inc. Methods and apparatus for voice-enabling a web application
US9400633B2 (en) 2012-08-02 2016-07-26 Nuance Communications, Inc. Methods and apparatus for voiced-enabling a web application
US9766832B2 (en) 2013-03-15 2017-09-19 Hitachi Data Systems Corporation Systems and methods of locating redundant data using patterns of matching fingerprints
US20140350928A1 (en) * 2013-05-21 2014-11-27 Microsoft Corporation Method For Finding Elements In A Webpage Suitable For Use In A Voice User Interface
US20140350941A1 (en) * 2013-05-21 2014-11-27 Microsoft Corporation Method For Finding Elements In A Webpage Suitable For Use In A Voice User Interface (Disambiguation)
US9256611B2 (en) 2013-06-06 2016-02-09 Sepaton, Inc. System and method for multi-scale navigation of data
US9678973B2 (en) 2013-10-15 2017-06-13 Hitachi Data Systems Corporation Multi-node hybrid deduplication
CN104123085B (zh) * 2014-01-14 2015-08-12 腾讯科技(深圳)有限公司 通过语音访问多媒体互动网站的方法和装置
CN105957530B (zh) * 2016-04-28 2020-01-03 海信集团有限公司 一种语音控制方法、装置和终端设备
KR102629385B1 (ko) * 2018-01-25 2024-01-25 삼성전자주식회사 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124293A (ja) * 1996-08-23 1998-05-15 Osaka Gas Co Ltd 音声指令可能なコンピュータとそれ用の媒体
JPH10154063A (ja) * 1996-11-22 1998-06-09 Nippon Telegr & Teleph Corp <Ntt> ハイパーテキスト中継方法及び装置
JPH10222342A (ja) * 1997-02-06 1998-08-21 Nippon Telegr & Teleph Corp <Ntt> ハイパーテキスト音声制御方法及び装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5363322A (en) * 1991-04-02 1994-11-08 Motorola, Inc. Data processor with an integer multiplication function on a fractional multiplier
JP2818362B2 (ja) * 1992-09-21 1998-10-30 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声認識装置のコンテキスト切換えシステムおよび方法
US5465317A (en) * 1993-05-18 1995-11-07 International Business Machines Corporation Speech recognition system with improved rejection of words and sounds not in the system vocabulary
EP0654734B1 (en) * 1993-11-24 2000-04-19 Canon Information Systems, Inc. System for speaking hypertext documents such as computerized help files
US5543789A (en) * 1994-06-24 1996-08-06 Shields Enterprises, Inc. Computerized navigation system
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
JPH08287288A (ja) * 1995-03-24 1996-11-01 Internatl Business Mach Corp <Ibm> 対話式三次元グラフィックスにおける複数側面アノテーション及びホットリンク
US5857172A (en) * 1995-07-31 1999-01-05 Microsoft Corporation Activation control of a speech recognizer through use of a pointing device
US5572643A (en) * 1995-10-19 1996-11-05 Judson; David H. Web browser with dynamic display of information objects during linking
US5737619A (en) * 1995-10-19 1998-04-07 Judson; David Hugh World wide web browsing with content delivery over an idle connection and interstitial content display
US5799063A (en) * 1996-08-15 1998-08-25 Talk Web Inc. Communication system and method of providing access to pre-recorded audio messages via the Internet
US5732216A (en) * 1996-10-02 1998-03-24 Internet Angles, Inc. Audio message exchange system
US5897618A (en) * 1997-03-10 1999-04-27 International Business Machines Corporation Data processing system and method for switching between programs having a same title using a voice command
US5893063A (en) * 1997-03-10 1999-04-06 International Business Machines Corporation Data processing system and method for dynamically accessing an application using a voice command
US5884266A (en) * 1997-04-02 1999-03-16 Motorola, Inc. Audio interface for document based information resource navigation and method therefor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124293A (ja) * 1996-08-23 1998-05-15 Osaka Gas Co Ltd 音声指令可能なコンピュータとそれ用の媒体
JPH10154063A (ja) * 1996-11-22 1998-06-09 Nippon Telegr & Teleph Corp <Ntt> ハイパーテキスト中継方法及び装置
JPH10222342A (ja) * 1997-02-06 1998-08-21 Nippon Telegr & Teleph Corp <Ntt> ハイパーテキスト音声制御方法及び装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000038043A1 (fr) * 1998-12-21 2000-06-29 Matsushita Electric Industrial Co., Ltd. Dispositif d'affichage d'hypertexte
JP2000187611A (ja) * 1998-12-21 2000-07-04 Matsushita Electric Ind Co Ltd ハイパーテキスト表示装置
US6952675B1 (en) 1999-09-10 2005-10-04 International Business Machines Corporation Methods and apparatus for voice information registration and recognized sentence specification in accordance with speech recognition
KR100519748B1 (ko) * 2000-08-11 2005-10-07 삼성전자주식회사 연속어 음성 명령을 통한 인터넷 네비게이션 시스템 및 그방법
JP2002169750A (ja) * 2000-11-30 2002-06-14 Nec Corp ブラウザ搭載装置
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
JP2002352104A (ja) * 2001-05-25 2002-12-06 Nec Fielding Ltd バーチャルショッピングシステム、バーチャルショッピング方法およびバーチャルショッピング用プログラム
JP2015038732A (ja) * 2007-08-16 2015-02-26 ワベリンク コーポレーション 音声を利用できるテルネットインターフェイス
JP2013137584A (ja) * 2011-12-27 2013-07-11 Toshiba Corp 電子機器、表示方法、およびプログラム

Also Published As

Publication number Publication date
US6101472A (en) 2000-08-08
JP3378498B2 (ja) 2003-02-17

Similar Documents

Publication Publication Date Title
JP3378498B2 (ja) 音声コマンドを使用してネットワークをナビゲートするデータ処理システムおよび方法
US7640163B2 (en) Method and system for voice activating web pages
JP3432076B2 (ja) 音声対話型ビデオスクリーン表示システム
US6810410B1 (en) Customizing a client application using an options page stored on a server computer
US7212971B2 (en) Control apparatus for enabling a user to communicate by speech with a processor-controlled apparatus
US6697838B1 (en) Method and system for annotating information resources in connection with browsing, in both connected and disconnected states
US7814171B2 (en) Method and system for modifying host application functionality based upon downloaded content
KR100329244B1 (ko) 원격 웹 페이지 리더
US7730419B2 (en) Communication between browser windows
US6915486B2 (en) Customizing a graphical user interface of a host application
US8069194B1 (en) Automated annotation of a resource on a computer network using a network address of the resource
US20060101147A1 (en) Multi-modal communication using a session specific proxy server
US20060047728A1 (en) Method and apparatus for updating a portal page
JPH10340252A (ja) 書式作成方法
EP1501268A1 (en) Combining use of a stepwise markup language and an object oriented development tool
US20060080612A1 (en) Dynamic portlet tabbing
KR20000075828A (ko) 명령어 목록을 이용한 음성 인식 디바이스
US7216287B2 (en) Personal voice portal service
US20030139932A1 (en) Control apparatus
US7409672B1 (en) Method and apparatus for communicating information between a browser and an application program
US20020152064A1 (en) Method, apparatus, and program for annotating documents to expand terms in a talking browser
US6922733B1 (en) Method for coordinating visual and speech web browsers
US20020111974A1 (en) Method and apparatus for early presentation of emphasized regions in a web page
US20020143817A1 (en) Presentation of salient features in a page to a visually impaired user
US20020129010A1 (en) System and method for processing user input from a variety of sources

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees