JPH11510977A - オーディオインターフェイスを用いた情報の取り出し方法および装置 - Google Patents

オーディオインターフェイスを用いた情報の取り出し方法および装置

Info

Publication number
JPH11510977A
JPH11510977A JP9538046A JP53804697A JPH11510977A JP H11510977 A JPH11510977 A JP H11510977A JP 9538046 A JP9538046 A JP 9538046A JP 53804697 A JP53804697 A JP 53804697A JP H11510977 A JPH11510977 A JP H11510977A
Authority
JP
Japan
Prior art keywords
audio
document
server
interface device
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP9538046A
Other languages
English (en)
Inventor
マイケル アブラハム ベネディクト
デビッド アラン ラッド
ジェームス クリストファー ラミング
ケネス ジー レアー
カーティス デュアン タッキー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH11510977A publication Critical patent/JPH11510977A/ja
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2207/00Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place
    • H04M2207/40Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place terminals with audio html browser
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)
  • Communication Control (AREA)
  • Information Transfer Between Computers (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

(57)【要約】 オーディオインターフェイス装置を用いてドキュメントサーバから情報を取り出すための方法および装置。ある有利な実施の形態では、通信ネットワークが、オーディオ処理ノードとオーディオインタープリタノードとを備えたオーディオブラウジングノードを含んでいる。オーディオインターフェイス装置とオーディオブラウジングノードとの間にはオーディオチャネルが確立される。オーディオブラウジングノードとドキュメントサーバとの間にはドキュメント供給プロトコルチャネルが確立される。ドキュメントサーバは、ドキュメント供給プロトコルチャネルを介してオーディオブラウジングノードにドキュメントを提供する。オーディオブラウジングノードは、ドキュメントをオーディオデータに翻訳し、さらにそのオーディオデータをオーディオチャネルを介してオーディオインターフェイスへ与える。オーディオインターフェイス装置は、オーディオチャネルを介してオーディオブラウジングノードへオーディオユーザ入力を与える。オーディオブラウジングノードは、そのオーディオユーザ入力を、ドキュメントサーバに与えられるのに適したユーザデータに翻訳し、さらにそのユーザデータをドキュメント供給プロトコルチャネルを介してドキュメントサーバに提供する。

Description

【発明の詳細な説明】 オーディオインターフェイスを用いた情報の取り出し方法および装置 発明の分野 本発明は情報の取り出し一般に関する。より詳細には、本発明は、オーディオ ユーザインターフェイスを用いたネットワークからの情報取り出しに関する。 発明の背景 通信ネットワーク上に存在する情報量は膨大であるとともに急速に増加してい る。このようなネットワークで最も一般的なものは、世界中のコンピュータがリ ンクされたネットワークであるインターネット(Internet)である。インターネ ットの普及度の高さの大部分は、インターネットのワールドワイドウェブ(WW W)部分に帰することができるであろう。WWWとは、サーバコンピュータとク ライアントコンピュータとの間の情報が通常ハイパーテキスト転送プロトコル( HTTP)を用いてやり取りされる、インターネットの一部分である。サーバは 情報を記憶しており、クライアントからの要求に応答してクライアントに情報を 供給(すなわち、送信)する。クライアントは、情報を要求し且つ表示するため の、しばしばブラウザといわれるコンピュータソフトウェアプログラムを実行す る。WWWブラウザの例としては、ネットスケープ社(Netscape Communication s lnc.)のネットスケープ・ナビゲータ(Netscape Navigator)、およびマイク ロソフト社(Microsoft Corp.)のインターネット・エクスプローラ(Internet Explorer)がある。 サーバおよびこれに記憶された情報は、URL(Uniform Resource Locators )によって識別される。URLは、バーナーズ-リー(Berners-Lee,T.)らの”U niform Resource Locators”(RFC1738,Network Working Group,1994)に詳細 に説明されている。それは参考文献として本明細書に組み入れられる。例えば、 http://www.hostname.com/document1.html(注1)というURLは、”document 1.html”というドキュメントがホストサーバ”www.hostname.com”にあることを 示 している。つまり、クライアントによるホストサーバへの情報の要求は、通常U RLを含んでいる。サーバからクライアントへ渡される情報は、通常ドキュメン トといわれる。かかるドキュメントは、HTML(Hypertext Markup Language )のようなドキュメント言語により記述されるのが一般的である。クライアント からの要求を受けると、サーバはHTMLドキュメントをクライアントに送信す る。HTMLドキュメントは、コンピュータのディスプレイ画面でユーザに情報 を表示するためにブラウザに用いられる情報を含んでいる。HTMLドキュメン トは、テキスト、論理構造コマンド、ハイパーテキストリンク、およびユーザ入 力コマンドを含んでいてよい。ユーザがディスプレイからハイパーテキストリン クを(例えばマウスをクリックすることにより)選択したときには、ブラウザは サーバに別のドキュメントを要求する。 現在のWWWブラウザは、テキストおよびグラフィカルなユーザインターフェ イスに基づいている。つまり、ドキュメントはコンピュータの画面上にイメージ として示される。かかるイメージは例えばテキスト、グラフィック、ハイパーテ キストリンク、およびユーザ入力用ダイアローグボックスを含むものである。ユ ーザのWWWとのすべての対話処理(インターアクション)は、グラフィカルユ ーザインターフェイスを通して行われる。オーディオデータはユーザのコンピュ ータで受信し且つ再生できるが(例えば、”.wav”または”.au”ファイル)、 オーディオデータを受信することはWWWのグラフィカルインターフェイスにと っては副次的なことに過ぎない。つまり、オーディオデータはユーザの要求の結 果として送信されてもよいが、ユーザがオーディオインターフェイスを用いてW WWと対話処理する手段は存在していない。 (注1) ここで例にあげたURLは説明のためだけに用いたものである。いか なる特定のURLを用いることも本発明の実例として以外に何ら意味を持つもの ではない。また、実際のURLを意味するものではない。 発明の要約 本発明は、オーディオインターフェイス装置(例えば、電話)を用いてドキュ メントサーバから情報を取り出すための方法および装置を提供する。また、ドキ ュメント供給プロトコルに従って動作するドキュメントサーバからドキュメント を取り出すインタープリタが提供される。このインタープリタは、ドキュメント を、オーディオユーザインターフェイスに与えられるオーディオデータに翻訳( interpret)する。また、インタープリタは、オーディオインターフェイス装置 からのオーディオユーザ入力を受信する。また、インタープリタは、そのオーデ ィオユーザ入力を、ドキュメント供給プロトコルに従ってドキュメントサーバに 送信されるのに適したユーザデータに翻訳するとともに、このユーザデータをド キュメントサーバに提供する。多くの実施の形態では、インタープリタは、オー ディオユーザインターフェイス内或いはドキュメントサーバ内に位置しているこ とがあり、またはオーディオユーザインターフェイスとドキュメントサーバとの 間の通信チャネル内に配置されていることがある。 ある実施の形態によると、本発明のオーディオブラウジング(browsing)機能 を実行するための通信ネットワークノードは、長距離電話ネットワークのような 通信ネットワーク内にノードとして含まれている。オーディオインターフェイス 装置とノードとの間に、オーディオチャネルが確立される。また、ノードとドキ ュメントサーバとの間には、ドキュメント供給プロトコルチャネルが確立される 。ノードは、ドキュメント供給プロトコルに従ってドキュメントサーバに供給さ れたドキュメントを受信し、さらにそのドキュメントをオーディオユーザインタ ーフェイスに適したオーディオデータに翻訳する。そして、ノードは、オーディ オチャネルを介してオーディオインターフェイス装置に、そのオーディオデータ を送信する。また、ノードは、オーディオインターフェイス装置からオーディオ ユーザ入力(例えば、DTMFトーン音または音声)を受信し、そのオーディオ ユーザ入力をドキュメントサーバに適したユーザデータに翻訳する。さらに、ノ ードは、ドキュメント供給プロトコルに従ってそのユーザデータをドキュメント サーバに送信する。 ある実施の形態では、ドキュメントサーバは、ハイパーテキスト転送プロトコ ルを介してクライアントと通信するワールドワイドウェブのドキュメントサーバ である。本発明の利点は、ユーザが、オーディオインターフェイス装置を介して ワールドワイドウェブのドキュメントサーバとのオーディオブラウジングセッシ ョンを行うことができることである。ワールドワイドウェブのドキュメントサー バは、このブラウジングセッションを通常のやり方で扱うことができ、その特定 のブラウジングセッションが通常のグラフィカルブラウザを実行するクライアン トにより開始させられたかまたはオーディオインターフェイス装置により開始さ せられたかを知っている必要がない。必要な翻訳機能は通信ネットワークノード で実行され、これらの機能は、オーディオ翻訳装置を用いるユーザおよびハイパ ーテキスト転送プロトコルに従って動作するワールドワイドウェブのドキュメン トサーバのいずれにも分からないように行われる。 本発明のこれらおよび他の利点は、以下の詳細な説明および添付図面を参照す ることにより当業者にとって明らかとなるであろう。 図面の簡単な説明 図1は、本発明を実行するのに適した通信システムを示す図である。 図2は、オーディオ処理ノードの構成部分のブロック図である。 図3は、オーディオインタープリタノードの構成部分のブロック図である。 図4は、ドキュメントサーバのブロック図である。 図5は、オーディオHTMLドキュメントの一例を示す図である。 図6は、HTMLドキュメントの一例を示す図である。 図7は、オーディオブラウジング機能がユーザインターフェイス装置で実行さ れる一実施の形態のブロック図である。 図8は、図7のユーザインターフェイス装置の構成部分のブロック図である。 図9は、オーディオブラウジング機能がオーディオブラウジングドキュメント サーバで実行される一実施の形態のブロック図である。 図10は、図9のオーディオブラウジングドキュメントサーバの構成部分のブ ロック図である。 図11は、オーディオ翻訳機能がオーディオインタープリタドキュメントサー バで実行される一実施の形態のブロック図である。 図12は、図11のオーディオインタープリタドキュメントサーバの構成部分 のブロック図である。 詳細な説明 図1は、本発明を実行するのに適した通信システム100を示す図である。例 えば電話110のようなオーディオインターフェイス装置が、ローカル交換キャ リア(LEC)120に接続されている。オーディオインターフェイス装置とし ては電話以外のものを用いることもできる。例えば、オーディオインターフェイ ス装置は、電話通信機能のあるマルチメディアコンピュータであってもよい。本 発明によると、電話110のユーザは、例えばドキュメントサーバ160のよう なドキュメントサーバから提供される情報に関連した電話番号に電話を掛ける。 図1に示した典型的な実施の形態においては、ドキュメントサーバ160は通信 ネットワーク162の一部である。有利な実施の形態では、通信ネットワーク1 62はインターネット(Internet)である。ドキュメントサーバ160のような ドキュメントサーバを介してアクセスできる情報に関連した電話番号は、それが オーディオブラウジング補助部(adjunct)150のような特別な通信ネットワ ークノードにルート指定されるように設定される。図1に示した実施の形態では 、オーディオブラウジング補助部150は、長距離電話ネットワークである通信 ネットワーク102の中にあるノードである。よって、その通話呼び出しはLE C120にルート指定され、LEC120がその通話呼び出しをさらに中継線1 25を介して長距離キャリアスイッチ130へルート指定する。長距離ネットワ ーク102は、通話呼び出しのルート指定を行うためにスイッチ130と同様の 他のスイッチを有することが一般的である。しかしながら、簡単のために図1に はスイッチが1つだけ描かれている。通信ネットワーク102内のスイッチ13 0は”インテリジェント”スイッチであり、様々な機能を実行するためにプログ ラムされることがある処理ユニット131を含んでいる(または処理ユニット1 31に接続されている)。このように通信ネットワークスイッチ内に処理ユニッ トを用いることおよびそれをプログラムすることは、この技術分野では周知であ る。スイッチ130で通話呼び出しを受信すると、その通話呼び出しはオーディ オブラウジング補助部150へルート指定される。これにより、電話110とオ ーデ ィオブラウジング補助部150との間にオーディオチャネルが確立される。通信 ネットワークを通しての通話のルート指定(ルーティング)はこの技術分野では 周知であり、ここではこれ以上説明しない。 ある実施の形態では、本発明によるオーディオブラウジングサービスは、通信 ネットワーク102のサービスプロバイダによって提供されるオーディオブラウ ジングサービスの加入者となったユーザだけに提供される。かかる実施の形態で は、スイッチ130に接続されたデータベース140が、加入者のリストを含ん でいる。スイッチ130は、通話呼び出しが加入者からサーバへされたかどうか を判定するためにデータベース140を参照する。これを実現するための1つの 方法は、データベース140内に呼び出し電話番号(ANI)のリストを記憶し ておくことである。周知の方法では、LEC120がスイッチ130に電話11 0のANIを提供する。そして、スイッチ130は、そのANIがデータベース 140に記憶されたオーディオブラウジングサービスの加入者リストに含まれて いるかどうかを判定するためにデータベース140を参照する。もしそのANI がリストにあれば、スイッチ130は、本発明に従い通話呼び出しをオーディオ ブラウジング補助部150にルート指定する。もしそのANIがオーディオブラ ウジングサービスの加入者でなければ、適切なメッセージが電話110に送られ る。 オーディオブラウジング補助部150は、ともに後で詳述する、オーディオ処 理ノード152とオーディオインタープリタノード154とを含んでいる。オー ディオブラウジング補助部150は、本発明に従ってオーディオブラウジング機 能を提供する。 電話110からの通話呼び出しを受信すると、オーディオブラウジング補助部 150は、リンク164を介して、呼び出した電話番号に関連したドキュメント サーバ160との通信チャネルを確立する。電話番号とドキュメントサーバとの 関連は、後で詳述する。WWWについての実施の形態では、リンク164はTC P/IPに対するソケット接続であり、その確立はこの技術分野では周知である 。TCP/IPのさらなる情報については、参考文献として組み入れられる、コ マー・ダグラス(Comer,Douglas)の”Internetworking with TCP/IP:Princip l es,Protocols,and Architecture”(Englewood Cliffs,NJ,Prentice Hall, 1988)を参照されたい。オーディオブラウジング補助部150およびドキュメン トサーバ160は、ドキュメント供給プロトコルを用いて互いに交信する。ここ で、ドキュメント供給プロトコルとは、クライアントとサーバとの間の情報の転 送についての通信プロトコルである。かかるプロトコルによると、クライアント はサーバに要求を送ることによりサーバに情報を要求し、サーバは要求された情 報を含むドキュメントをクライアントに送ることにより要求に応える。よって、 ドキュメント供給プロトコルチャネルは、オーディオブラウジング補助部150 とドキュメントサーバ160との間にリンク164を介して確立される。有利で あるWWWについての実施の形態では、ドキュメント供給プロトコルは、ハイパ ーテキスト転送プロトコル(HTTP)である。このプロトコルはWWW通信の 技術では周知であり、参考文献として組み入れられる、バーナーズ−リー(Bern ers-Lee,T)およびコノリー(Connolly,D)の”Hypertext Transfer Protocol(H TTP)Working Draft of the Internet Engineering Task Force”(1993)に詳述 されている。 従って、オーディオブラウジング補助部150は、HTTPプロトコルを用い てドキュメントサーバ160と通信する。よって、ドキュメントサーバ160に 関する限り、それは通常のグラフィカルブラウザを実行する通常のWWWクライ アントのいずれかと通信しているように振る舞う。つまり、ドキュメントサーバ 160は、リンク164から受け取った要求に応答してオーディオブラウジング 補助部150にドキュメントを供給する。ここでドキュメントとは情報の集合で ある。ドキュメントはサーバ160で予め決められた静的ドキュメントであって もよく、このときには、そのドキュメントへの全ての要求に対して同じ情報が与 えられる結果となる。或いは、ドキュメントは、要求に応答して供給される情報 が要求がされた時点で動的に生成されるような動的なものであってもよい。一般 には動的ドキュメントは、情報への要求に応答してサーバ160によって実行さ れるプログラムであるスクリプトによって生成される。例えば、URLはあるス クリプトと関連するものであってよい。サーバ160がURLを含む要求を受信 したとき、サーバ160はスクリプトを実行して動的ドキュメントを生成し、情 報を要求したクライアントにその動的に生成されたドキュメントを供給する。ド キュメントを動的に生成するためにスクリプトを用いることはこの技術分野では 周知である。 サーバ160によって供給されたドキュメントは、テキスト、論理構造コマン ド、ハイパーテキストリンク、およびユーザ入力コマンドを含んでいる。こうい ったドキュメントの1つの特徴は、ドキュメントに含まれる情報の物理構造(す なわち、通常のグラフィックブラウザを実行してクライアント側で表示したとき の情報の物理レイアウト)が定義されていないことである。その代わりとして、 ドキュメントは、物理レイアウトを定義するためにブラウザにおいて翻訳される 論理構造コマンドを含んでいる。例えば、このような論理構造コマンドは、強調 コマンドや新しいパラグラフコマンドなどを含んでいる。このようなコマンドの シンタックス構造は、参考文献として組み入れられるゴールドファーブ・チャー ルズ(Goldfarb,Charles)の”The SGML Handbook”(Clarendon Press,1990 )に記載されているSGML(Standard Generalized Markup Language)のよう な、より一般的な目的のドキュメント構造言語の規定に適合していてよい。本発 明のWWWについての実施の形態では、これらドキュメントは、ハイパーテキス トマークアップ言語(HTML)のドキュメントである。HTMLは、WWWサ ーバによって供給されるドキュメントを定義するために用いられるSGMLに基 づいた周知の言語である。HTMLについては、参考文献として組み入れられる 、バーナーズ−リー(Berners-Lee,T)およびコノリー(Connolly,D)の”Hyp ertext Markup Language(HTML)Working Draft of the Internet Engineering Task Force”(1993)に詳述されている。 HTMLドキュメントが通常のブラウザを実行するクライアントによって受信 されたときに、ブラウザはHTMLドキュメントをイメージに翻訳し且つそのイ メージをコンピュータディスプレイ画面に表示する。しかしながら、本発明の原 理によると、ドキュメントサーバ160からドキュメントを受信すると、オーデ ィオブラウジング補助部150はそのドキュメントをオーディオデータに変換す る。かかる変換の詳細は後で詳しく説明する。そして、オーディオデータは、ス イッチ130およびLEC120を介して電話110に送られる。つまり、この 方法によると、電話110のユーザは、オーディオインターフェイスを介してド キュメントサーバ160の情報にアクセスすることが可能である。 さらに、ユーザは、電話110からオーディオブラウジング補助部150にオ ーディオユーザ入力を送ることも可能である。オーディオユーザ入力は、例えば 音声信号またはDTMFトーン音であってよい。オーディオブラウジング補助部 150は、オーディオユーザ入力を、HTTPプロトコルに従ってリンク164 を介してドキュメントサーバ160に送信するのに適したユーザデータまたは命 令に変換する。ユーザデータまたは命令は、さらにドキュメント供給プロトコル チャネルを介してドキュメントサーバ160に送られる。これにより、ユーザと ドキュメントサーバとはオーディオユーザインターフェイスを介して互いに対話 処理することとなる。 このやり方では、ユーザはオーディオインターフェイスを介してWWWドキュ メントサーバとブラウジングセッションを行うことができる。ドキュメントサー バは、かかるブラウジングセッションを通常のやり方で扱うことができ、特定の ブラウジングセッションが通常のグラフィカルブラウザを実行するクライアント により開始させられたかまたは電話のようなオーディオインターフェイスにより 開始させられたかを知っている必要がない。ネットワーク102内のオーディオ ブラウジング補助部150は、ドキュメントサーバ160から供給されたドキュ メントを、電話110に送るのに適したオーディオデータに翻訳する。さらに、 オーディオブラウジング補助部150は、電話110で受け取ったオーディオユ ーザ入力を、ドキュメントサーバ160で受信されるのに適したユーザデータに 翻訳する。 次に、ブラウジングセッションに関する利点のある実施の形態について、より 詳細に説明する。ここで、電話110側にいるユーザが、ドキュメントサーバ1 60を介してアクセス可能な情報と関連付けられそれゆえオーディオブラウジン グ補助部150にルート指定されるように設定された番号(123)456−7 890(注2)にダイアルすると仮定する。通話呼び出しはLEC120にルー ト指定され、LEC120はその電話番号を長距離ネットワーク102、特にス イッチ130にルート指定されたものとして認識する。通話呼び出しを受信する と、スイッチ130は次にその通話呼び出しをリンク132を介してオーディオ ブラウジング補助部150にルート指定する。これにより、電話110とオーデ ィオブラウジング補助部150との間のオーディオチャネルが確立される。 オーディオ処理ノード152の詳細が図2に示されている。オーディオ処理ノ ード152は、電話ネットワークインターフェイスモジュール210と、DTM Fデコーダ/ジェネレータ212と、音声認識モジュール214と、テキスト− 音声モジュール216と、オーディオ再生/録音モジュール218とを備えてお り、図2に示すように、これらのそれぞれがオーディオバス220および制御/ データバス222に接続されている。さらに、オーディオ処理ノード152は、 中央処理装置224と、メモリ装置228と、パケットネットワークインターフ ェイス230とを備えており、これらのそれぞれは制御/データバス222に接 続されている。オーディオ処理ノード152の全体としての機能は、中央処理装 置224によって制御される。中央処理装置224は、メモリ装置228に記憶 されて実行されるコンピュータプログラム命令232の制御によって動作する。 メモリ装置228は機械的に読みだし可能な装置であればどのようなものでもよ い。例えば、メモリ装置228は、ランダムアクセスメモリ(RAM)、リード オンリーメモリ(ROM)、プログラム可能なリードオンリーメモリ(PROM )、消去可能PROM(EPROM)、電気的消去可能PROM(EEPROM )、磁気記憶媒体(すなわち、磁気ディスク)、または光学的記憶媒体(すなわ ち、CD−ROM)であってよい。さらに、オーディオ処理ノード152は、中 央処理装置224によるアクセスが可能で且つコンピュータプログラム命令23 2とデータ234とを共に記憶することができる機械的に読みだし可能な装置の 様々な組合せを含んでいてよい。 電話ネットワークインターフェイスモジュール210は、オーディオ処理ノー ド152と電話ネットワークスイッチ130との間の低レベルの対話処理を扱う 。ある実施の形態においては、モジュール210は、1または複数のアナログチ ップ/リングループスタート電話回線終端子からなる。モジュール210により 、中央処理装置224は制御データバス222を介してリンク132を制御する ことができる。制御機能としては、オンフック/オフフック、呼び出し検出、お よ び遠端オンフック検出を含む。別の実施の形態では、モジュール210は、T1 /DS1、E1、またはPR1のような1または複数のチャネル化ディジタルイ ンターフェイスを含んでいる。信号は帯域内または帯域外であってよい。DTM Fデコーダ/ジェネレータ212は、DTMFトーン信号のディジタルデータへ の変換、およびディジタルデータからのDTMFトーン音の生成を扱う。音声認 識モジュール214は、ユーザの電話110で発生してオーディオバス220か ら受け取った音声信号を認識する。このような音声信号は音声認識モジュール2 14によって処理され、ディジタルデータに変換される。テキスト−音声モジュ ール216は、ドキュメントサーバ160から受け取ったドキュメントのテキス トを、電話110側のユーザに送信されるオーディオ音声信号に変換する。オー ディオ再生/録音モジュール218はドキュメントサーバ160から受け取った オーディオデータを電話110側で再生するとともに、ユーザの声のようなオー ディオデータを録音するために用いられる。各モジュール210、212、21 4、216、218は、図2では別々の機能のモジュールとして示されているこ とを付記しておく。各モジュール212、214、216、218の機能は、周 知の信号処理技術を用いて、ハードウェア、ソフトウェアまたはハードウェアと ソフトウェアの組合せとして実現されてもよい。モジュール210の機能は、周 知の信号処理技術を用いて、ハードウェア、またはハードウェアとソフトウェア の組合せとして実現されてもよい。各モジュールの機能は、実例に関連して後で さらに詳述される。パケットネットワークインターフェイス230は、オーディ オ処理ノード152とオーディオインタープリタノード154との間の通信のた めに用いられる。 オーディオブラウジング補助部150は、オーディオ処理ノード152に接続 されたオーディオインタープリタノード154をも含んでいる。オーディオイン タープリタノード154は、図3にその詳細が示されている。オーディオインタ ープリタノード154は、中央処理装置302と、メモリ304と、制御/デー タバス310によって接続された2つのパケットネットワークインターフェイス 306、308とを含んでいる。オーディオインタープリタノード154の全体 としての機能は、中央処理装置302によって制御される。中央処理装置302 は、メモリ装置304に記憶されて実行されるコンピュータプログラム命令31 2の制御によって動作する。 メモリ装置304は機械的に読みだし可能な装置であればどのようなものでも よい。例えば、メモリ装置304は、ランダムアクセスメモリ(RAM)、リー ドオンリーメモリ(ROM)、プログラム可能なリードオンリーメモリ(PRO M)、消去可能PROM(EPROM)、電気的消去可能PROM(EEPRO M)、磁気記憶媒体(すなわち、磁気ディスク)、または光学的記憶媒体(すな わち、CD−ROM)であってよい。さらに、オーディオインタープリタノード 154は、中央処理装置302によるアクセスが可能で且つコンピュータプログ ラム命令312とデータ314とを共に記憶することができる機械的に読みだし 可能な装置の様々な組合せを含んでいてよい。 中央処理装置が実行するソフトウェア命令を用いて、オーディオ処理ノード1 52およびオーディオインタープリタノード154のような装置を制御すること は、この技術分野では周知であり、ここではさらに詳しい説明はしない。 実例に戻ると、電話110から電話番号(123)456−7890への通話 呼び出しはオーディオブラウジング補助部150、特にオーディオ処理ノード1 52へルート指定されている。中央処理装置224は、電話ネットワークインタ ーフェイスモジュール210により呼び出し中の回線を検出する。通話呼び出し を検出すると、中央処理装置は、ダイアルされた番号(DN)と関連したURL を決定するために参照を行う。ダイアルされた電話番号(DN)はこの技術分野 では周知のやり方でローカル交換キャリア120からスイッチ130へ与えられ 、さらにDNはスイッチ130からオーディオブラウジング補助部150に与え られる。メモリ228内には、DNに関連したURLのリストがデータ234と して記憶されている。本例ではDN(123)456−7890がURL http: //www.att.com/〜phone/greeting と関連付けられていると仮定する。 別の実施の形態では、様々なDNと関連付けられたURLのリストは、オーデ ィオブラウジング補助部150にローカルにあるのではなく、データベース14 0のようなネットワークデータベースに記憶されている。かかる実施の形態では 、オーディオ処理ノード152の中央処理装置224が、ネットワークスイッチ 1 30に対してデータベース140の参照を要求する信号を送る。スイッチはデー タベース140からURLを要求し、結果として得たURLをオーディオ処理ノ ード152に送り戻す。オーディオ処理ノード152とスイッチ130とデータ ベース140との間の通信は、この技術分野では周知である例えばSS7のよう な帯域外信号システムを経由してもよいことを付記しておく。このような構成の 利点は、複数のオーディオブラウジング補助部がネットワーク102内に存在し てもよく、そしてそれぞれが1つのデータベース140を共有してもよいことで ある。これにより、URLと関連するDNとを更新する必要があるデータベース 140は1つだけとなる。 DNに関連したURLを受け取った後、オーディオ処理ノード152の中央処 理装置224は、(URLを含む)メッセージをオーディオインタープリタノー ド154に送り、オーディオインタープリタノード154にオーディオ翻訳/ブ ラウジングセッションを始めるように命令する。かかるメッセージは、中央処理 装置224から制御/データバス222を経てパケットネットワークインターフ ェイス230へ送られる。さらにこのメッセージは、オーディオ処理ノード15 2のパケットネットワークインターフェイス230から接続153を介してオー ディオインタープリタノード154のパケットネットワークインターフェイス3 06へ送られる。ある有利な実施の形態では、オーディオ処理ノード152およ びオーディオインタープリタノード154は並置され、これにより一体としてオ ーディオブラウジング補助部150を形成する。別の実施の形態では、オーディ オ処理ノード152およびオーディオインタープリタノード154は地理的に分 離されてもよい。このような代替的ないくつかの実施の形態については後述する 。接続153は、この技術分野では周知のパケットデータネットワーク接続(例 えば、イーサネットに対するTCP/IP接続)であってよい。 実例に戻ると、オーディオインタープリタノード154は、パケットネットワ ークインターフェイス306を介して、新たなオーディオ翻訳/ブラウジングセ ッションを始めるようにというメッセージを受け取る。中央処理装置302は、 複数のユーザについての複数のオーディオ翻訳/ブラウジングセッションを同時 に制御することが可能である。プロセッサによるこのような複数処理の実行は周 知であり、各セッションを制御するソフトウェア処理の例示を一般に伴っている 。オーディオ翻訳/ブラウジングセッションの開始に当たり、オーディオインタ ープリタノード154は、URL http://www.att.com/〜phone/greeting につ いてのHTTP要求を接続164を介してドキュメントサーバ160へ送る。本 例では、ドキュメントサーバ160がホスト名 www.att.com と関連していると 仮定している。 ドキュメントサーバ160の詳細が図4に示されている。ドキュメントサーバ 160は、メモリ404に接続された中央処理装置402を含むコンピュータで ある。ドキュメントサーバ160の機能は、メモリ404に記憶されたコンピュ ータプログラム命令416を実行する中央処理装置402によって制御される。 動作に当たり、ドキュメントサーバ160は、接続164およびパケットネット ワークインターフェイス440を介してオーディオインタープリタノード154 からのドキュメントの要求を受け取る。中央処理装置402はその要求を翻訳し メモリ404から要求された情報を取り出す。かかる要求は、HTMLドキュメ ント408、オーディオHTMLドキュメント410、オーディオファイル41 2、またはグラフィックファイル414に対するものであってよい。HTMLド キュメント408は周知のものであり、通常のWWWグラフィカルブラウザに用 いられる通常のHTML命令を含んでいる。オーディオHTMLドキュメントは HTMLドキュメントに類似しているが、本発明に従ったオーディオインタープ リタノード154での翻訳のための特有の付加命令を有している。本発明のオー ディオブラウジング面について特有のかかる命令を、ここではオーディオHTM L命令という。オーディオHTMLドキュメントおよびオーディオHTML命令 についての詳細は後で詳しく説明する。オーディオファイル412はオーディオ 情報を含むフアイルである。グラフィックファイル414はグラフィカル(図表 )情報を含むフアイルである。この技術分野で周知な方法によると、URLは特 定のドキュメントサーバにある特定のドキュメントを同定する。メモリ404は 、動的に生成されるHTMLドキュメントおよびオーディオHTMLドキュメン トについてのスクリプト418をも含んでいてよい。本例に戻ると、URL htt p://www.att.com/〜phone/greeting についてのHTTP要求は、オーディオイ ン タープリタノード154から接続164を介してドキュメントサーバ160によ って受信される。 ドキュメントサーバはこのURLを翻訳し、中央処理装置402の制御のもと でメモリ404からオーディオHTMLページを取り出す。そして、中央処理装 置402は、このオーディオHTMLドキュメントを、パケットネットワークイ ンターフェイス440およびリンク164を介してオーディオインタープリタノ ード154に送る。 URL http://www.att.com/〜phone/greeting についての要求に応答して送 られ、さらにオーディオインタープリタノード154に受信されるオーディオH TMLドキュメント500が、図5に示されている。オーディオインタープリタ ノード154は以下のようにドキュメント500の翻訳を始める。ある実施の形 態では、ページのタイトルを含む、ドキュメント500のライン502〜506 の<HEAD>部分は音声には変換されず、オーディオインタープリタノード1 54に無視される。別の実施の形態では、<TITLE>部分は後述するテキス ト−音声を用いて翻訳されてもよい。 ドキュメント500の<BODY>部分のライン508にあるテキスト”He llo!”は、パケットネットワークインターフェイス306およびリンク15 3を介してオーディオインタープリタノード154からオーディオ処理ノード1 52へ送られる。テキスト”Hello!”について、オーディオインタープリ タノード154は、そのテキストはテキスト−音声モジュール216で処理され るべきものであるとの命令をオーディオ処理ノード152に送る。オーディオ処 理ノード152はパケットネットワークインターフェイス230を介して当該テ キストおよび命令を受け取り、そして当該テキストは制御/データバス222を 介してテキスト−音声モジュール216に与えられる。テキスト−音声モジュー ル216は、”Hello”(注3)を再生するオーディオ信号を生成し、オー ディオバス220を介してこの信号を電話ネットワークインターフェイスモジュ ール210へ送る。さらに、電話ネットワークインターフェイスモジュール21 0はこのオーディオ信号を電話110に送る。テキスト−音声変換は周知であっ て、テキスト−音声モジュール214には通常のテキスト−音声技術が用いられ てよいことを付記しておく。例えば、テキストが音声に変換される際、テキスト 内の記号”!”は大きな音量での再生と翻訳されてもよい。 ドキュメント500のライン510はフォーム命令であり、オーディオインタ ープリタノード154はこの命令についてはオーディオ処理ノード152に対し て何も送らない。オーディオインタープリタノード154はユーザからの将来の 応答を期待することを示すものとしてライン510を翻訳し、そしてこの応答は 、http://machine:8888/hastings-bin/getscript.sh.によって同定されるスク リプトへのアーギュメント(argument)として与えられる。ライン512はオー ディオHTML命令である。オーディオインタープリタノード154は、メモリ 404の記憶領域412内にある、www-spr.ih.att.com/〜hastings/annc/greet ing.mu8 で同定されるオーディオファイルについてのhttp要求をサーバ16 0へ送ることによりライン512を翻訳する。ドキュメントサーバ160はメモ リ404からオーディオファイルを取り出し、それをリンク164を介してオー ディオインタープリタノード154へ送る。オーディオファイルを受け取ると、 オーディオインタープリタノード154はそのファイルを、そのファイルがオー ディオ再生/録音モジュール218により再生されるべきものであることを示す 命令とともにオーディオ処理ノード152へ送る。これらファイルおよび命令を 受け取ると、オーディオ処理ノード152は、このオーディオファイルをオーデ ィオ再生/録音モジュール218へルート指定する。オーディオ再生/録音モジ ュール218は、オーディオバス220を介して電話ネットワークインターフェ イスモジュール210に送られるオーディオ信号を生成する。そして、電話ネッ トワークインターフェイスモジュール210はそのオーディオ信号を電話110 へ送る。この結果、電話110側にいるユーザは、電話110のスピーカで、オ ーディオファイル www-spr.ih.att.com/〜hastings/annc/greeting.mu8 の内容 を聞くことになる。 ライン514〜516はオーディオHTML命令である。オーディオインター プリタノード154はライン514をオーディオ処理ノード152に送らない。 ライン514は、ユーザからの応答が可変ネーム”collectvar”と関連したドキ ュメントサーバ160に送られることを示している。この命令は、ユーザが情報 を促されそして情報を与えるプロンプト−コレクト(collect)シーケンスの開 始を示すものである。この命令に続いて、プロンプト命令516および一組の選 択命令518〜522がある。オーディオインタープリタノード154はライン 512と同様なやり方でライン516を処理し、この結果、電話110側にいる ユーザは http://www-spr.ih.att.com/〜hastings/annc/choices.mu8 で同定さ れるファイルからの音を聞くことになる。この音はいくつかの基準に基づいて選 択をするようにユーザに尋ねるものであり、オーディオインタープリタノード1 54は電話110側のユーザからの応答を待つ。また、処理ライン516の結果 、中央処理装置302はオーディオ処理ノード152へ、電話ネットワークイン ターフェイスモジュール210がオーディオ入力を受け取る準備をするようにす るメッセージを送る。 そして、ユーザは電話110からのオーディオユーザ入力で応答する。オーデ ィオユーザ入力は、ユーザが電話110のキーパッド上のキーを押すことによっ て生成されるDTMFトーン形式であってよい。例えば、もしユーザが電話11 0のキーパッドの”2”を押すと、オーディオ処理ノード152は電話ネットワ ークインターフェイスモジュール210を介して”2”と関連したDTMFトー ン音を受け取る。かかるオーディオ信号は中央処理装置224によってDTMF トーン音として認識され、この信号をオーディオバス220を介してDTMFデ コーダ/ジェネレータ212に送るために命令が電話ネットワークインターフェ イスモジュール210に送られる。中央処理装置224は、DTMFトーン音を ディジタルデータに変換しさらにそのディジタルデータをパケットネットワーク インターフェイス230からオーディオインタープリタノード154へ送信する ように、DTMFデコーダ/ジェネレータ212に命令する。この信号が受信さ れると、オーディオインタープリタノード154は、ユーザの応答が”2”、つ まりオーディオHTMLドキュメント500のライン520に示された値”Ji m”の選択であることを認識する。つまり、オーディオインタープリタノード1 54は可変”collectvar”と関連した値”Jim”を、ドキュメント500のラ イン510で同定されるスクリプト http://machine:8888/hastings-bin/getscr ipt.sh.に送る。もしユーザの応答がリストされていないものを選択して入力す るものであれば、つまり本例で”1”から”3”以外の応答があれば、或いは所 定時間内にユーザが応答しなかったならば、オーディオインタープリタノード1 54は、「選択を受領できません。もう一度やり直してください」(イタリック 体)という音声信号を生成するようにテキスト−音声モジュール216に命令し 、そしてその信号が電話110側のユーザに送られる。 代替的には、オーディオユーザ入力は音声信号であってもよい。つまり、ユー ザが電話110のキーパッドの番号2を押す代わりに、ユーザは電話110のマ イクに「2」という語を話すのである。この音声信号は、電話ネットワークイン ターフェイスモジュール210を介してオーディオ処理ノード152に受信され る。そしてオーディオ信号は中央処理装置224によって音声信号であると認識 され、かかる信号をオーディオバス220を介して音声認識モジュール214に 送るために電話ネットワークインターフェイスモジュール210に命令が与えら れる。中央処理装置224は、音声信号をディジタルデータに変換しさらにこの ディジタルデータをオーディオインタープリタノード154に送信するためにパ ケットネットワークインターフェイス230へ与えるように、音声認識モジュー ル214に命令する。そしてオーディオインタープリタノード154は、ディジ タルデータを受け取ると、DTMFオーディオユーザ入力に関して説明したよう にこのデータを処理する。なお、音声認識モジュール214はこの技術分野では 周知の通常の音声認識技術にしたがって動作するものであることを付記しておく 。 HTMLドキュメントにはしばしばハイパーテキストリンクが存在する。これ が通常のグラフィカルブラウザを実行するコンピュータの画面に表示されるとき 、ハイパーテキストリンクはグラフィカルに示される(例えば、下線つきで)。 もしユーザが、例えばリンクをマウスでクリックすることにより、グラフィカル にリンクを選択した場合、ブラウザはリンクに示されたドキュメントについての 要求を生成し、その要求をドキュメントサーバに送る。ここで、図6に示された HTMLドキュメント600について考察する。ライン604、605は、ハイ パーテキストリンクの通常のHTML記述を詳細に示している。もしこのページ が通常のグラフィカルブラウザで処理されたならば、ディスプレイは以下のよう に見える。 This page gives you a choice of links to follow to other World W ide Web pages. Please click on one of the links below. (このページでは他のWWWのページへのリンクを選択できます。以下 のリンクのどれか1つをクリックして下さい) click here for information on cars (自動車の情報についてはここをクリック) click here for information on trucks (トラックの情報についてはここをクリック) そして、ユーザは、マウスのようなグラフィカルポインティングデバイスを用い てリンクの1つを選択する。もしユーザが click here for information on car s を選択すると、ブラウザはURL http://www.abc.com/cars.html で同定され るドキュメントについての要求を生成する。もしユーザが click here for info rmation on trucks を選択すると、ブラウザはURL http://www.abc.com/truc ks.html で同定されるドキュメントについての要求を生成する。 次に、本発明に従ったHTMLハイパーテキストリンクの処理について、図6 を参照して説明する。ここで、ドキュメントサーバ160が図6に示されたHT MLドキュメント600をオーディオインタープリタノード154に提供するこ とを仮定する。ライン602、603はテキスト−音声モジュール216によっ てオーディオ信号に変換され、上述のようにユーザの電話110に与えられる。 つまり、ユーザは、「このページでは他のWWWのページへのリンクを選択でき ます。以下のリンクのどれか1つをクリックして下さい」という音声を聞く。ラ イン604では、ライン604がハイパーテキストリンクであるとオーディオイ ンタープリタノード154が認識する。オーディオインタープリタノード154 はオーディオ処理ノード152に対して、電話110へのトーン音をDTMFデ コーダ/ジェネレータ212が生成するようにする命令を送る。或いは、このト ーン音は、オーディオインタープリタノード154が、オーディオ再生/録音モ ジュール218にトーン音を含むオーディオファイルを再生させるようにする命 令を、オーディオ処理ノード152に送ることによっても生成される。ハイパー テキストリンクの始まりをユーザに知らせるために、この特有のトーン音が用い られる。そして、オーディオインタープリタノード154は、テキストがテキス ト−音声モジュール216で処理されることを示す命令とともに、ハイパーテキ ストリンクのテキスト(click here for information on cars)をオーディオ処 理ノード152に与える。この結果、「自動車の情報についてはここをクリック 」という音声信号が電話110に与えられる。そして、オーディオインタープリ タノード154は、電話110へのトーン音をDTMFデコーダ/ジェネレータ 212が生成するようにする命令をオーディオ処理ノード152に送る。ハイパ ーテキストリンクの終了をユーザに知らせるために、この特有のトーン音が用い られる。ハイパーテキストリンクの始まりおよび終了をユーザに知らせるために 用いられるトーン音は同じトーン音でもよいし異なるトーン音でもよい。終了ト ーン音に引き続いて休止が置かれる。トーン音を用いる代わりに、ハイパーテキ ストリンクの始まりおよび終了が、「リンク開始[ハイパーテキスト]リンク終 了」のような音声信号で識別されてもよい。 もしユーザがリンクをたどることを希望する場合、ユーザは休止期間にユーザ オーディオ入力を供給する。例えば、ユーザがリンク”click here for informa tion on cars ”をたどることを望むものとする。ユーザは、リンクについて生成 された音声信号に引き続く休止期間内にオーディオ入力を入力する。オーディオ 入力は、例えば、電話110のキーパッド上のキーを押すことで生成されるDT MFトーン音であってよい。DTMFトーン音はオーディオ処理ノード152に 受信され、さらにDTMFデコーダ/ジェネレータ212によって処理される。 DTMFトーン音を表すデータは、制御/データバス222、パケットネットワ ークインターフェイス230、およびリンク153を介してオーディオインター プリタノード154に与えられる。オーディオインタープリタノード154は、 この信号を受け取ると、選択されたリンクに続く休止期間内に信号が受け取られ たことを認識し、そして、オーディオインタープリタノード154は、選択され たリンクに関連したURL http://www.abc.com/cars.html で同定されるWWW ドキュメントについての要求を生成する。或いは、ハイパーテキストリンクを選 択するためのオーディオユーザ入力は、音声信号であってもよい。 リンクの別のタイプとして、ハイパーテキストアンカーリンク(anchor link )がある。アンカーリンクは、1つのHTMLドキュメント内の特定の場所にユ ーザがジャンプできるようにするものである。通常のグラフィカルブラウザでは 、ユーザがアンカーリンクを選択したとき、ブラウザはリンクで指示されたドキ ュメントの一部を表示する。本発明のオーディオブラウジング技術によると、ユ ーザがアンカーリンクを選択したとき、オーディオインタープリタノード154 はリンクで指定された個所のドキュメントを翻訳し始める。例えば、ドキュメン ト600のライン620は、このドキュメントのライン625の部分へのハイパ ーテキストアンカーを含んでいる。このハイパーテキストリンクは、上述のよう に、新たなHTMLドキュメントを同定するハイパーテキストリンクと同様にユ ーザに識別される。ハイパーテキストアンカーリンクは、例えば、リンクがアン カーリンクであることを示す異なるオーディオトーン音または生成された音声信 号によって区別されるものであってよい。もしユーザがライン620でアンカー リンクを選択すると、オーディオインタープリタノード154はライン625の テキストにスキップし、そこのHTMLドキュメント600を翻訳し始める。 図1に関連して説明した有利な実施の形態は、オーディオ処理ノード152と オーディオインタープリタノード154とを含むオーディオブラウジング補助部 150が、長距離通信ネットワーク102内に位置する通信ネットワークノード 内に具体化されるようにしたものである。このようにすることで、本発明による オーディオブラウジング機能を、電話ネットワーク102サービス提供者が電話 ネットワーク加入者に提供することができるようになる。かかる構成では、ユー ザの構内設備またはドキュメントサーバに付加的なハードウェアが必要になるこ とがない。全てのオーディオブラウジング機能が電話ネットワーク102内の構 成要素によって提供される。しかしながら、このほかの構成とすることも可能で あり、かかる代替的な構成はここでの開示により当業者が容易に実施できるもの である。 かかる代替的構成の1つが図7に示されており、オーディオブラウジング補助 部の機能が図示のユーザインターフェイス装置700において実行される。この 実施の形態では、オーディオ処理ノード152の機能およびオーディオインター プリタノード154の機能は、ユーザインターフェイス装置700内に1つにま とめられている。ユーザインターフェイス装置700は、通信リンク702を介 してドキュメントサーバ160と通信する。リンク702は図1に関して説明し たリンク164と同様である。つまり、リンク702はTCP/IPに対するソ ケット接続であってよく、その確立はこの技術分野では周知である。ユーザイン ターフェイス装置700の詳細が図8に示されている。ユーザインターフェイス 装置700は、ユーザ入力を受け付けるためのキーパッド/キーボード802お よびマイク804と、オーディオ出力をユーザに提供するためのスピーカ806 とを備えている。また、ユーザインターフェイス装置700は、制御/データバ ス824に接続されたキーパッド/キーボードインターフェイスモジュール81 6をも備えている。さらに、ユーザインターフェイス装置700は、コーデック (codec)810と 音声認識モジュール818と、テキスト−音声モジュール 820と、オーディオ再生/録音モジュール822とを備えており、図8に示す ように、それぞれがオーディオバス808と制御/データバス824とに接続さ れている。コーデック810は、アナログ−ディジタルコンバータ812とディ ジタル−アナログコンバータ814とを含んでおり、これら両方は制御/データ バス824を介して中央処理装置826によって制御される。アナログ−ディジ タルコンバータ812は、マイク804からのアナログオーディオユーザ入力を ディジタルオーディオ信号に変換し、そのディジタルオーディオ信号をオーディ オバス808に与える。ディジタル−アナログコンバータ814は、オーディオ バス808からのディジタル信号を、スピーカ806から送出されるアナログオ ーディオ信号に変換する。キーパッド/キーボードインターフェイスモジュール 816は、キーパッド/キーボード802からの入力を受け取り、その入力を制 御/データバス824に与える。音声認識モジュール818、テキスト−音声モ ジュール820、およびオーディオ再生/録音モジュール822は、図2に関連 して説明したモジュール214、216および218とそれぞれ同じ機能を実行 し、これらと同様に構成されている。さらに、ユーザインターフェイス装置70 0は、リンク702を介してインターネットのようなパケットネットワークに接 続するためのパケットネットワークインターフェイス834を含んでいる。さら に、ユーザインターフェイス装置700は、それぞれ制御/データバス824に 接続された、中央処理装置826およびメモリ装置828を含んでいる。ユーザ インターフェイス装置700の全体としての機能は、中央処理装置826によっ て制御される。中央処理装置826は、メモリ装置828に記憶されて実行され るコンピュータプログラム命令830の制御のもとで動作する。メモリ装置82 8はデータ832をも含んでいる。 ユーザインターフェイス装置700は、図1の実施の形態と関連して説明した オーディオ処理ノード152およびオーディオインタープリタノード154の機 能を実行する。これらの機能は、コンピュータプログラム命令830を実行する 中央処理装置826によって実行される。つまり、コンピュータプログラム命令 830は、(1)オーディオ処理ノード152の機能を実行するコンピュータプ ログラム命令232、および(2)オーディオインタープリタノード154の機 能を実行するコンピュータプログラム命令312、と同じまたは類似のプログラ ム命令を含むものである。オーディオ処理ノード152およびオーディオインタ ープリタノード154の機能は前に詳しく説明したので、ここではこれ以上詳細 には述べない。中央処理装置826は、複数の処理を同時に実行することができ 、これにより、オーディオ処理ノード152およびオーディオインタープリタノ ード154の機能を実行する。このマルチ処理機能が図8に描かれており、そこ では中央処理装置826がオーディオ翻訳/ブラウジング処理836とオーディ オプロセス処理838とを行うものとして示されている。 動作において、ユーザインターフェイス装置700のユーザは、キーパッド/ キーボード802またはマイク804を用いてURLを要求する。もしキーパッ ド/キーボード802がURLの要求に用いられたならば、キーパッド/キーボ ードインターフェイスモジュール816が要求されたURLを制御/データバス 824を介して中央処理装置826に与える。もしマイク804がURLの要求 に用いられたならば、ユーザの声はマイク804で受信され、アナログ−ディジ タルコンバータ812でディジタル化され、オーディオバス808を介して音声 認識モジュール818に与えられる。そして、音声認識モジュール818は、要 求されたURLを制御/データバス824を介して中央処理装置826に与える 。 中央処理装置826は、URLを受信すると、オーディオ翻訳/ブラウジング 処理836で例示されたオーディオブラウジング/翻訳セッションを開始する。 オーディオ翻訳/ブラウジング処理836は、図1の実施の形態に関連して説明 したのと類似のやり方で、パケットネットワークインターフェイス834を介し てドキュメントサーバ160にHTTP要求を送る。ドキュメントサーバ160 からドキュメントを受け取ると、オーディオ翻訳/ブラウジング処理836は、 本発明のオーディオブラウジング技術に従ってドキュメントを翻訳する。このド キュメントの翻訳によって生じた音は、オーディオプロセス処理838の制御に よりスピーカ806からユーザに与えられる。同様に、ユーザインターフェイス 装置700のユーザは、マイク804を介してユーザインターフェイス装置にオ ーディオユーザ入力を与えることができる。 オーディオ翻訳/ブラウジング処理836およびオーディオプロセス処理83 8はともにユーザインターフェイス装置700内にあるから、2つの処理の間の 全ての通信は中央処理装置826を通して処理間通信によって行われ、処理83 6、838とユーザインターフェイス装置700の他の要素との間の全ての通信 は制御/データバス824を介して行われる。 図7および図8は、パケットネットワーク162内のドキュメントサーバ16 0と直接通信しているユーザインターフェイス装置700を示している。或いは 、ユーザインターフェイス装置700は標準的な電話接続を介してドキュメント サーバ160と通信するようにされていてもよい。かかる構成において、パケッ トネットワークインターフェイス834の代わりに、制御/データバス824を 介して中央処理装置826に制御される電話インターフェイス回路を用いてもよ い。ユーザインターフェイス装置700は、電話ネットワークを介してドキュメ ントサーバへ電話をする。ドキュメントサーバ160は、電話ネットワークイン ターフェイスモジュール210(図2)と類似のハードウェアを用いてユーザイ ンターフェイス装置700からの通話呼び出しを着信する。或いは、ドキュメン トサーバ160へのパケットネットワーク接続を提供する終端点(termination poin t)により、電話ネットワーク内で通話呼び出しが着信され得る。 図9に示す別の構成では、オーディオブラウジング補助部150の機能(オー ディオ処理ノード152およびオーディオインタープリタノード154の機能を 含んでいる)並びにドキュメントサーバ160の機能が、オーディオブラウジン グドキュメントサーバ900内で実行される。図9に描かれているように、通話 呼び出しは電話110から、LEC120、スイッチ130、別のLEC902 を経てオーディオブラウジングドキュメントサーバ900へルート指定される。 つまり、この実施の形態では、通常の電話110から電話ネットワークを介して オーディオブラウジングドキュメントサーバ900に到達することができる。さ らに、オーディオブラウジングドキュメントサーバ900は、リンク904を介 してインターネットにも接続されている。オーディオブラウジングドキュメント サーバ900の詳細が図10に示されている。オーディオブラウジングドキュメ ントサーバ900は、電話ネットワークインターフェイスモジュール1010と 、DTMFデコーダ/ジェネレータ1012と、音声認識モジュール1014と 、テキスト−音声モジュール1016と、オーディオ再生/録音モジュール10 18とを備えており、図10に示すように、これらのそれぞれはオーディオバス 1002および制御/データバス1004に接続されている。これらモジュール 1010、1012、1014、1016、および1018は、図2に関連して 説明したモジュール210、212、214、216、および218とそれぞれ 同じ機能を実行するものであり、これらと同様に構成されている。さらに、オー ディオブラウジングドキュメントサーバ900は、リンク904を介してインタ ーネットのようなパケットネットワークに接続するためのパケットネットワーク インターフェイス1044を含んでいる。パケットネットワークインターフェイ ス1044は、図2に関連して説明したパケットネットワークインターフェイス 230と同様なものである。また、オーディオブラウジングドキュメントサーバ 900は、中央処理装置1020とメモリ装置1030とを含んでおり、これら 両方は制御/データバス1004に接続されている。オーディオブラウジングド キュメントサーバ900の全体としての機能は、中央処理装置1020によって 制御される。中央処理装置1020は、メモリ装置1030に記憶されて実行さ れ るコンピュータプログラム命令1032の制御のもとで動作する。メモリ装置1 030は、データ1034、HTMLドキュメント1036、オーディオHTM Lドキュメント1038、オーディオファイル1040、およびグラフィックフ ァイル1042をも含んでいる。 オーディオブラウジングドキュメントサーバ900は、図1の実施の形態に関 連して説明した、オーディオ処理ノード152と、オーディオインタープリタノ ード154と、ドキュメントサーバ160との機能を実行する。これらの機能は 、コンピュータプログラム命令1032を実行する中央処理装置1020によっ て行われる。つまり、コンピュータプログラム命令1032は、(1)オーディ オ処理ノード152の機能を実行するコンピュータプログラム命令232、(2 )オーディオインタープリタノード154の機能を実行するコンピュータプログ ラム命令312、および(3)ドキュメントサーバ160の機能を実行するコン ピュータプログラム命令416、と同じまたは類似のプログラム命令を含むもの である。オーディオ処理ノード152、オーディオインタープリタノード154 、およびドキュメントサーバ160の機能は前に詳しく説明したので、ここでは これ以上詳細には述べない。中央処理装置1020は、複数の処理を同時に実行 することができ、これにより、オーディオ処理ノード152、オーディオインタ ープリタノード154およびドキュメントサーバ160の機能を実行する。この マルチ処理機能が図10に描かれており、そこでは中央処理装置1020がオー ディオ翻訳/ブラウジング処理1022とドキュメント供給処理1024とオー ディオプロセス処理1026とを行うものとして示されている。 動作において、電話110からオーディオブラウジングドキュメントサーバ9 00を介してアクセス可能な情報に関連した電話番号への通話呼び出しは、LE C120、スイッチ130、およびLEC902を介してオーディオブラウジン グドキュメントサーバ900にルート指定される。なお、複数の電話番号がオー ディオブラウジングドキュメントサーバ900を介してアクセス可能な種々の情 報に関連付けられていてよく、その各電話番号がオーディオブラウジングドキュ メントサーバ900にルート指定されることを付記しておく。呼び出しのあった 回線は、オーディオプロセス処理1026の制御のもとで電話ネットワークイン ターフェイスモジュール1010を介して検出される。通話呼び出しが検出され ると、中央処理装置1020は、ダイアルされた番号(DN)と関連したURL を決定するために参照を行う。DNは、この技術分野で周知の方法によりLEC 902からオーディオブラウジングドキュメントサーバ900に与えられる。D Nとその関連URLのリストはメモリ1030内にデータ1034として記憶さ れている。DNと関連したURLを受け取ると、中央処理装置1020は、オー ディオ翻訳/ブラウジング処理1022で例示されたオーディオブラウジング/ 翻訳セッションを開始する。オーディオ翻訳/ブラウジング処理1022は、中 央処理装置1020に共存するドキュメント供給処理1024にHTTP要求を 送る。ドキュメント供給処理1024は、図1に示した実施の形態のドキュメン トサーバ160と関連して説明したドキュメントサーバ機能を実行する。これら ドキュメントサーバ機能は、メモリ1030に記憶された、HTMLドキュメン ト1036、オーディオHTMLドキュメント1038、オーディオファイル1 040、およびグラフィックファイル1042によってサポートされる。これに より、中央処理装置1020は、URLと関連したドキュメントをメモリ103 0から取り出すこととなる。そして、オーディオ翻訳/ブラウジング処理102 2は、本発明のオーディオブラウジング技術に従ってドキュメントを翻訳する。 このドキュメントの翻訳で生じた音は、オーディオプロセス処理1026の制御 によりユーザに与えられる。同様に、電話110のユーザは、図1の実施の形態 と関連して説明したのと同様なやり方で、オーディオブラウジングドキュメント サーバ900にオーディオユーザ入力を与えることができる。 オーディオ翻訳/ブラウジング処理1022、ドキュメント供給処理1024 およびオーディオプロセス処理1026はともにオーディオブラウジングドキュ メントサーバ900内にあるから、処理1022、1024、1026間の全て の通信は中央処理装置1020を通して処理間通信によって行われ、処理102 2、1024、1026とオーディオブラウジングドキュメントサーバ900の 他の要素との間の全ての通信は制御/データバス1004を介して行われる。本 実施の形態の1つの利益は、HTMLドキュメントおよび他のデータが処理(例 えば、翻訳)のために潜在的に不確かな広域ネットワークを通過する必要がない という点で効率がよいことである。 図1に示した実施の形態では、オーディオ処理ノード152およびオーディオ インタープリタノード154は並置されていた。しかしながら、オーディオ処理 ノード152およびオーディオインタープリタノード154の機能は、図11に 示すように地理的に分離されてもよい。かかる実施の形態では、オーディオ処理 ノード152が通信ネットワーク102内に含まれており、オーディオインター プリタドキュメントサーバ1100がパケットネットワーク162内に含まれて いる。オーディオ処理ノード152の機能は、図1に関連して説明したのと同様 である。ドキュメントサーバ160のようなドキュメントサーバの機能とオーデ ィオインタープリタノード154の機能とを実行するオーディオインタープリタ ドキュメントサーバ1100の詳細が、図12に示されている。オーディオイン タープリタドキュメントサーバ1100は、リンク153および制御/データバ ス1204に接続されたパケットネットワークインターフェイス1202を含ん でいる。また、オーディオインタープリタドキュメントサーバ1100は、中央 処理装置1206とメモリ装置1212とを含んでおり、これら両方が制御/デ ータバス1204に接続されている。オーディオインタープリタドキュメントサ ーバ1100の全体としての機能は、中央処理装置1206によって制御される 。中央処理装置1206は、メモリ装置1212に記憶されて実行されるコンピ ュータプログラム命令1214の制御のもとで動作する。メモリ装置1212は 、データ1216、HTMLドキュメント1218、オーディオHTMLドキュ メント1220、オーディオファイル1222、およびグラフイックファイル1 224をも含んでいる。 オーディオインタープリタドキュメントサーバ1100は、図1の実施の形態 に関連して説明した、オーディオインタープリタノード154とドキュメントサ ーバ160との機能を実行する。これらの機能は、コンピュータプログラム命令 1214を実行する中央処理装置1206によって行われる。つまり、コンピュ ータプログラム命令1214は、(1)オーディオインタープリタノード154 の機能を実行するコンピュータプログラム命令312、および(2)ドキュメン トサーバ160の機能を実行するコンピュータプログラム命令416、と同じま たは類似のプログラム命令を含むものである。オーディオインタープリタノード 154およびドキュメントサーバ160の機能は前に詳しく説明したので、ここ ではこれ以上詳細には述べない。中央処理装置1206は、複数の処理を同時に 実行することができ、これにより、オーディオインタープリタノード154およ びドキュメントサーバ160の機能を実行する。このマルチ処理機能が図12に 描かれており、そこでは中央処理装置1206がオーディオ翻訳/ブラウジング 処理1208とドキュメント供給処理1210とを行うものとして示されている 。 動作において、オーディオ処理ノード152は、図1に関連して説明したのと 同様のやり方で、リンク153を介してオーディオインタープリタドキュメント サーバ1100と通信する。しかし、オーディオインタープリタノード154が リンク164を介してドキュメントサーバと通信する図1とは異なり、オーディ オ翻訳ブラウジング処理1208は処理間通信により中央処理装置1206を介 してドキュメント供給処理1210と通信する。 よって、以上説明したように、本発明のオーディオブラウジングは、オーディ オ処理機能、オーディオ翻訳/ブラウジング機能、およびドキュメント供給機能 が特定の構成に応じて一体または分離されるというように、様々な形態で実現す ることができる。当業者は、他の構成によっても本発明のオーディオブラウジン グ機能が提供されることを認めるであろう。 以上の記述から分かるように、本発明は、通常のグラフィックブラウザととも に用いられるようにされた標準的なHTMLドキュメントとともに、または本発 明の特徴であるオーディオブラウジングに用いられるように特に生成されたオー ディオHTMLドキュメントとともに用いられる。 標準的なHTMLドキュメントのオーディオ翻訳については、多くの標準的な テキスト−音声変換技術が用いられてよい。次のセクションでは、標準的なHT MLドキュメントをオーディオデータに変換するために用いられる技術について 説明する。ここで説明するHTMLドキュメントをオーディオデータに変換する 技術は説明のためのものに過ぎず、当業者はHTMLドキュメントをオーディオ 信号に変換する他の様々な技術を容易に実行することが可能である。 標準的なテキスト文書は、周知である通常のテキスト−音声変換技術を用いて 翻訳される。テキストはドキュメント内で出会ったときに翻訳され、このような 翻訳はユーザがオーディオ入力(例えば、プロンプトに答えるためまたはリンク をたどるため)を供給するまで、或いはドキュメント内でプロンプトに到達する まで続けられる。ある文章の終わりは、音に休止を付加することで翻訳され、パ ラグラフマーク<p>は長い休止を挿入することで翻訳される。テキスト様式は 、以下のように翻訳されてよい。 イメージ命令は、特定のイメージがドキュメント内に挿入されることを示すH TMLの仕様である。HTMLイメージ命令の一例は、以下のようなものである 。 <IMG SRC="http://machine.att.com/image.gif" ALT="[image of car]"> この命令は、URLで定義された機械からイメージファイル”image.gif”が 取り出され、それがクライアントのブラウザで表示されることを示している。あ る通常のグラフィックブラウザはイメージファイルをサポートしておらず、その ためHTMLイメージ命令はイメージの代わりに表示される代替テキストを含む ことがある。つまり、上述の例では、”image of car”というテキストがイメー ジファイルの代わりに含まれる。本発明のオーディオブラウジング技術によると 、イメージ命令が代替テキストを含むものであれば、そのテキストは処理されて 音声に変換され、その音声信号がユーザに提供される。つまり、この例では、” image of car”「自動車のイメージ」という音声信号が電話110側のユーザに 提供される。もし、代替テキストが提供されなければ、代替テキストのないイメ ージに遭遇したことを示す音声信号(例えば、「代替説明のない写真です」)が 生成される。 通常のHTMLは、ユーザ入力の入力(entering)をサポートする命令を含ん でいる。例えば、以下の命令、 <SELECT NAME="selectvar"> <OPTION> mary <OPTION SELECTED> joe <OPTION> </SELECT> は、ジョー(joe)がデフォールトのオプションとされているときに、マリー(m ary)とジョーという2つのオプションからのユーザが選択することを要求する ものである。クライアントが通常のグラフィカルブラウザを実行する際、これら のオプションは例えばプルダウンメニューとして表されてよい。本発明のオーデ ィオブラウジング技術によると、上記の命令は、以下のような音声信号に翻訳さ れる。 「以下のうちの1つを選んでください。メリー(休止)、現在選択されて いるジョー(休止)、オプションの終了。オプションをもう一度繰り返すには * r、次に行くには # を押してください」 もしあるオプションの後の休止期間にユーザがパウンドキー(pound key)を押 すと、そのオプションが選択される。どのアイテムが選択されても、ユーザが次 に進むことを選択したときは、可変な選択変数(selectvar)と関連したドキュ メントサーバに戻る。ユーザがDTMF信号で選択する代わりに、ユーザが音声 信号で選択を行なってもよい。 ユーザ入力を入力する別の通常のHTML命令は、チェックボックス命令であ る。例えば、以下のような一連の命令、 <INPUT TYPE="checkbox" NAME="varname"VALUE="red" CHECKED> <INPUT TYPE="checkbox" NAME="varname"VALUE="blue"> <INPUT TYPE="checkbox" NAME="varname"VALUE="green"> は、通常のグラフィックブラウザでは以下のように表示される。 赤(red) □ 青(blue) □ 緑(green) □ デフォールトでは赤のボックスがチェックされている。ユーザは、青または緑 のボックスをチェックすることでこのデフォールトを変更することが可能である 。本発明のオーディオブラウジング技術によると、上記一連の命令は、ユーザに 与えられる以下のような音声信号に翻訳される。 「以下の選択は休止期間に # を押せば変えられます。現在選択されてい る赤(休止)、青(休止)、緑(休止)。このリストをもう一度繰り返すには * r、次に行くには # を押してください」 休止期間に # を押してDTMF信号を生成すると、ユーザは休止期間の前にあ るアイテムを選択することができる。# キーをもう一度押すと、ユーザは一連の 入力動作から抜け出すことができる。ユーザがオプションのリストをもう一度繰 り返したいときには *r を押せばよい。DTMF信号入力の代わりに、ユーザが 音声信号入力を用いてチェックボックスオプションを選択するようにしてもよい 。 通常のHTMLドキュメントは、以下のような TEXTAREA 命令を用いてユーザ にテキスト入力を要求することができる。 <TEXTAREA COLS=60 ROWS=4 NAME="textvar">ここにテキストを挿入してく ださい </TEXTAREA> これにより、通常のグラフィックブラウザでは、「ここにテキストを挿入してく ださい」というテキストに続いて、テキスト入力のためにユーザに与えられた6 0行4列のテキストボックスが表示されることになる。本発明のオーディオブラ ウジング技術によると、上記命令は以下のように翻訳される。COL および ROWS というパラメータは無視され、 「ここにテキストを挿入してください」 という音声がユーザに与えられる。そして、ユーザはDTMFトーン音に続いて # 信号を入力することができる。これらDTMF信号は、変数”textvar”と関 連したドキュメントサーバに与えられる結果により処理される。或いは、ユーザ は電話110のマイクに応答を話すことでテキストを与えることができ、その音 声は音声認識モジュール214でデータに変換され、そのデータが変数”textva r”と関連したドキュメントサーバ160に与えられる。 以上の記述から分かるように、通常のHTMLドキュメントが本発明のオーデ ィオブラウジング技術によりブラウズされ得るように様々な技術を用いることが できる。 本発明によるオーディオブラウジングの利益をより十分に明らかにするために 、通常のHTML命令に加えて付加的なドキュメント命令が用いられてもよい。 オーディオHTML命令といわれるこれらの命令が、通常のHTMLドキュメン トに導入されてもよい。これらのオーディオHTML命令を以下で説明する。 音声源命令、 <VOICE SRC="//www.abc.com/audio.file"> によると、特定されたファイルがユーザに対して再生される結果となる。かかる 命令は、図5に例示したドキュメント500のライン512に詳細に記載されて いる。 ネームコレクト命令、 <COLLECT NAME="collectvar"> はプロンプトおよびコレクトシーケンスの開始を指定している。かかるコレクト ネーム命令の後には、プロンプト命令および1組の選択命令が続く。ユーザが選 択を行うと、オーディオユーザ入力で示されたように、ユーザの選択の結果は可 変コレクト変数(collectvar)と関連したドキュメントサーバに与えられる。コ レクトネーム命令は、関連するプロンプトおよびコレクトシーケンスとともに、 図5に例示したドキュメント500のライン514〜524に詳細に説明されて いる。 DTMF入力命令、 <INPUT TYPE="DTMF" MAXLENGTH="5" NAME=varname> は、DTMF信号形式のオーディオユーザ入力がユーザから予期されることを示 している。この命令はオーディオブラウジング補助部150を休止させユーザか らのDTMF入力を待機するようにする。ユーザは電話110のキーパッドにあ るキーを押すことによってDTMFシーケンスを入力し、# キーを押すことでシ ーケンスの終了を指示する。DTMF入力は、例示したHTMLドキュメント5 00について上述したように処理される。そして、デコードされたDTMF信号 は、可変ネーム(varname)と関連したドキュメントサーバに与えられる。MAXLE NGTH パラメータは、入力可能な最大長(DTMF入力)を示す。もしユーザが DTMFキー(この例では5)の最大数を超えて入力すると、システムは超過し た入力を無視する。 同様に、SPEECH 入力命令、 <INPUT TYPE="SPEECH" MAXLENGTH="5" NAME=varname> は、音声信号形式のオーディオユーザ入力がユーザから予期されることを示して いる。この命令はオーディオブラウジング補助部150を休止させユーザからの DTMF音声入力を待機するようにする。ユーザは電話110のマイクに向かっ て話して音声信号を入力する。音声入力は、例示したHTMLドキュメント50 0について上述したように処理される。そして、音声信号は、可変ネームと関連 したドキュメントサーバに与えられる。MAXLENGTH パラメータは、音声入力の最 大長が5秒であることを示す。 ここで説明したオーディオHTML命令は、本発明のオーディオブラウジング 技術の利益を利用するために実行されうるオーディオHTMLのタイプの例であ る。当業者は別のタイプのオーディオHTML命令を容易に実行することができ る。 上述のオーディオHTML命令に加えて、オーディオブラウジング補助部15 0は様々なナビゲーション命令をサポートしている。通常のグラフィックブラウ ザでは、ユーザはドキュメントによりナビゲーションするための通常の技術を用 いてもよい。このような通常の技術は、ドキュメントをスクロールするためのテ キストスライダと、カーソル動作と、ページアップ、ページダウン、ホーム、お よびエンドのような命令とを含んでいる。本発明のオーディオブラウジング技術 によると、以下のように、ユーザは、DTMFトーン形式または音声形式のいず れかのオーディオユーザ入力を用いてドキュメントをナビゲートしてもよい。 以上の詳細な説明は、全ての点について実例となる典型的なものであって限定 的なものと理解されるものではなく、ここで開示する発明の範囲は詳細な説明か らではなく、特許法に許される最大限の範囲に解釈される請求の範囲によって決 定されるものである。また、ここで示し説明した実施の形態は本発明の原則を例 示しただけのものであり、当業者は本発明の範囲および特徴から離れることなく 様々な設計変更を行なってもよいことが理解される。例えば、ここではパケット スイッチ通信チャネルのような通信チャネルについて説明したが、回路スイッチ 通信チャネルのような通信チャネルでの実行も可能である。 (注2) ここで電話番号は説明のためだけに用いたものである。いかなる特定 の電話番号を用いることも本発明の実例として以外に何ら意味を持つものではな い。また、実際の電話番号を意味するものではない。 (注3) ここでイタリック体はテキストが音声として再生されることを示すた めに用いられる。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04M 11/08 H04L 11/20 102Z (72)発明者 ラミング ジェームス クリストファー アメリカ合衆国 カリフォルニア州 メン ロパーク シャロン パーク ドライブ 350 アパートメント エヌ−103 (72)発明者 レアー ケネス ジー アメリカ合衆国 イリノイ州 バーウィン ウェスト 35 ストリート 7108 (72)発明者 タッキー カーティス デュアン アメリカ合衆国 イリノイ州 シカゴ ノ ース レタ 3546 【要約の続き】 したユーザデータに翻訳し、さらにそのユーザデータを ドキュメント供給プロトコルチャネルを介してドキュメ ントサーバに提供する。

Claims (1)

  1. 【特許請求の範囲】 1 サーバに記憶されている情報へのオーディオアクセスを提供するための方 法において、 オーディオインターフェイス装置と通信ネットワークノードとの間にオーディ オチャネルを確立するステップと、 前記通信ネットワークノードと前記サーバとの間にドキュメント供給プロトコ ルチャネルを確立するステップと、 前記サーバから前記ドキュメント供給プロトコルチャネルを介して、前記通信 ネットワークノードにおいてドキュメントを受信するステップと、 前記受信したドキュメントを、前記通信ネットワークノードにおいてオーディ オデータに翻訳するステップと、 前記オーディオデータを、前記通信ネットワークノードから前記オーディオチ ャネルを介して前記オーディオインターフェイス装置に送信するステップとを備 えていることを特徴とする方法。 2 前記オーディオインターフェイス装置が電話であり、前記オーディオチャ ネルを確立するステップが、 前記サーバに関連した電話番号への電話を受信するステップと、 前記電話を前記通信ネットワークノードへルート指定するステップとをさらに 備えていることを特徴とする請求項1の方法。 3 前記サーバがWWWドキュメントサーバであり、前記ドキュメント供給プ ロトコルがハイパーテキスト転送プロトコルであることを特徴とする請求項1の 方法。 4 前記ドキュメントがHTML命令を含んでいることを特徴とする請求項1 の方法。 5 前記ドキュメントがオーディオHTML命令をさらに含んでいることを特 徴とする請求項4の方法。 6 前記オーディオインターフェイス装置から前記オーディオチャネルを介し たオーディオユーザ入力を、前記通信ネットワークノードにおいて受信するステ ップと、 前記通信ネットワークノードにある前記オーディオユーザ入力を、前記ドキュ メント供給プロトコルを介して送信されるのに適したユーザデータに翻訳するす るステップと、 前記ユーザデータを前記ドキュメント供給プロトコルチャネルを介して前記サ ーバへ送信するステップとをさらに備えていることを特徴とする請求項1の方法 。 7 前記オーディオユーザ入力がDTMFトーン音であることを特徴とする請 求項6の方法。 8 前記オーディオユーザ入力が音声信号であることを特徴とする請求項6の 方法。 9 サーバに記憶されている情報へアクセスするためのシステムであって、 オーディオインターフェイス装置から前記サーバに関連した電話番号への通話 呼び出しを受信する通信ネットワークノードであって、この通信ネットワークノ ードと前記オーディオインターフェイス装置との間にオーディオチャネルが確立 されているような通信ネットワークノードと、 前記電話番号を前記サーバと関連付けるための、前記通信ネットワークノード によってアクセス可能なデータベースと、 前記通信ネットワークノードと前記サーバとの間にドキュメント供給プロトコ ルチャネルを確立するための、前記通信ネットワークノードに関連した手段と、 前記サーバから前記ドキュメント供給プロトコルチャネルを介して受信したド キュメントをオーディオデータに翻訳するための、前記通信ネットワークノード に関連したインタープリタと、 前記オーディオデータを前記オーディオチャネルを介して前記オーディオイン ターフェイス装置に送信するための、前記通信ネットワークノードに関連した手 段とを備えていることを特徴とするシステム。 10 前記オーディオインターフェイス装置が電話であることを特徴とする請 求項9のシステム。 11 前記インタープリタは、前記オーディオインターフェイス装置から前記 オーディオチャネルを介して受信したオーディオユーザインターフェイスを、前 記ドキュメント供給プロトコルを介しての送信に適したユーザデータに翻訳する ようにもされており、 前記システムが、前記ドキュメント供給プロトコルチャネルを介して前記サー バに前記ユーザデータを送信するための手段をさらに備えていることを特徴とす る請求項9のシステム。 12 前記オーディオユーザ入力がDTMFトーン音であることを特徴とする 請求項11のシステム。 13 前記オーディオユーザ入力が音声信号であることを特徴とする請求項1 1のシステム。 14 前記サーバがWWWドキュメントサーバであり、前記ドキュメント供給 プロトコルがハイパーテキスト転送プロトコルであることを特徴とする請求項9 のシステム。 15 前記ドキュメントがHTML命令を含んでいることを特徴とする請求項 9のシステム。 16 前記ドキュメントがオーディオHTML命令をさらに含んでいることを 特徴とする請求項15のシステム。 17 前記データベースが、電話番号とURLとを関連付けるデータを含んで いることを特徴とする請求項9のシステム。 18 ドキュメント供給プロトコルに従ってドキュメントを供給するサーバに 記憶された情報へのオーディオアクセスを提供する方法において、 オーディオインターフェイス装置と前記サーバとの間に通信チャネルを確立す るステップと、 前記サーバに供給されたドキュメントをオーディオデータに翻訳するステップ と、 前記オーディオデータを前記オーディオインターフェイス装置に提供するステ ップとを備えていることを特徴とする方法。 19 前記翻訳するステップが前記サーバで行われることを特徴とする請求項 18の方法。 20 前記ドキュメント供給プロトコルがハイパーテキスト転送プロトコルで あることを特徴とする請求項19の方法。 21 前記翻訳するステップが前記オーディオユーザインターフェイスで行わ れることを特徴とする請求項18の方法。 22 前記翻訳するステップが、前記サーバと前記オーディオユーザインター フェイスとの間に配置された、前記通信チャネル内の中間ノードで行われること を特徴とする請求項18の方法。 23 前記ドキュメント供給プロトコルがハイパーテキスト転送プロトコルで あることを特徴とする請求項18の方法。 24 前記オーディオインターフェイス装置から受信したオーディオユーザ入 力を、前記ドキュメント供給プロトコルと共存できる命令に翻訳するステップと 、 前記命令を前記サーバに提供するステップとを備えていることを特徴とする請 求項18の方法。 25 サーバとオーディオインターフェイス装置とが通信チャネルで接続され ており、ドキュメント供給プロトコルに従って動作する前記サーバと前記オーデ ィオインターフェイス装置との間で情報を翻訳するためのシステムにおいて、 前記ドキュメント供給プロトコルを介して前記サーバによって供給されるドキ ュメントを受信するための手段と、 前記受信したドキュメントをオーディオデータに翻訳するためのインタープリ タと、 前記オーディオデータを前記オーディオインターフェイス装置に提供するため の手段とを備えていることを特徴とするシステム。 26 前記オーディオインターフェイス装置が電話であり、前記システムが前 記通信チャネルを確立するための手段をさらに備えており、この通信チャネルを 確立するための手段が、 前記電話から前記サーバに関連した電話番号への電話を受信するための手段と 、 前記電話番号と前記サーバとを関連付けるためのデータベースとを備えている ことを特徴とする請求項25のシステム。 27 前記インタープリタが、前記オーディオインターフェイス装置と前記サ ーバとの間の前記通信チャネル内に置かれたノードに位置していることを特徴と する請求項25のシステム。 28 前記インタープリタが、前記ドキュメントサーバ内に位置していること を特徴とする請求項25のシステム。 29 前記インタープリタが、前記オーディオインターフェイス装置内に位置 していることを特徴とする請求項25のシステム。 30 前記インタープリタが、前記オーディオインターフェイス装置から受信 したオーディオユーザ入力を、前記ドキュメント供給プロトコルに従って送信さ れるのに適した命令に翻訳するようにもされており、 前記システムは前記命令を前記ドキュメントサーバに提供する手段をさらに備 えていることを特徴とする請求項25のシステム。 31 記憶されたドキュメントへのオーディオアクセスを提供するためのドキ ュメントサーバにおいて、 オーディオインターフェイス装置との通信を提供する通信リンクと接続するた めのインターフェイスと、 コンピュータプログラム命令および前記ドキュメントを記憶する機械読みだし 可能な記憶装置と、 前記コンピュータプログラム命令を実行するために、前記メモリおよび前記イ ンターフェイスに接続された中央処理装置とを備えており、 前記コンピュータプロググラム命令により、前記中央処理装置は、 ドキュメント要求の受信に応答し、ドキュメント供給プロトコルに従って前記 機械読みだし可能な記憶装置から前記要求されたドキュメントを取り出すステッ プと、 前記要求されたドキュメントをオーディオデータに翻訳するステップと、 前記オーディオデータを、前記インターフェイスを介して前記オーディオイン ターフェイス装置へ送信するステップとを実行するようにされていることを特徴 とするドキュメントサーバ。 32 前記ドキュメント供給プロトコルがハイパーテキスト転送プロトコルで あることを特徴とする請求項31のドキュメントサーバ。 33 前記通信リンクが電話ネットワーク接続であり、前記ドキュメントサー バが電話ネットワークインターフェイスをさらに備えていることを特徴とする請 求項31のドキュメントサーバ。 34 前記通信リンクがパケットネットワーク接続であり、前記ドキュメント サーバがパケットネットワークインターフェイスをさらに備えていることを特徴 とする請求項31のドキュメントサーバ。 35 前記コンピュータプログラム命令により前記中央処理装置が、さらに 前記オーディオインターフェイス装置から前記通信リンクを介して受信したオ ーディオユーザ入力に応答し、前記オーディオユーザ入力をユーザデータに翻訳 するステップと、 前記ユーザデータに応答し、ドキュメント供給プロトコルに従って前記機械読 みだし可能な記憶装置からドキュメントを取り出すステップとを実行するように されていることを特徴とする請求項31のドキュメントサーバ。
JP9538046A 1996-04-22 1997-03-18 オーディオインターフェイスを用いた情報の取り出し方法および装置 Ceased JPH11510977A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US63580196A 1996-04-22 1996-04-22
US08/635,801 1996-04-22
PCT/US1997/003690 WO1997040611A1 (en) 1996-04-22 1997-03-18 Method and apparatus for information retrieval using audio interface

Publications (1)

Publication Number Publication Date
JPH11510977A true JPH11510977A (ja) 1999-09-21

Family

ID=24549170

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9538046A Ceased JPH11510977A (ja) 1996-04-22 1997-03-18 オーディオインターフェイスを用いた情報の取り出し方法および装置

Country Status (7)

Country Link
EP (1) EP0834229A1 (ja)
JP (1) JPH11510977A (ja)
KR (1) KR19990028327A (ja)
CA (1) CA2224712A1 (ja)
IL (1) IL122647A (ja)
MX (1) MX9710150A (ja)
WO (1) WO1997040611A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001296991A (ja) * 2000-04-13 2001-10-26 Canon Inc データ処理装置、データ処理方法、記録媒体
JP2006508596A (ja) * 2002-11-29 2006-03-09 ストリームワイド ネットワークのオーディオデータを処理する方法およびその方法を実行する装置

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2317070A (en) * 1996-09-07 1998-03-11 Ibm Voice processing/internet system
WO1998035491A1 (en) * 1997-02-05 1998-08-13 British Telecommunications Public Limited Company Voice-data interface
WO1999046920A1 (en) * 1998-03-10 1999-09-16 Siemens Corporate Research, Inc. A system for browsing the world wide web with a traditional telephone
US20010012350A1 (en) * 1998-03-11 2001-08-09 James Ehlinger Method and apparatus for facilitating internet access from a telecommunications network
US6675054B1 (en) * 1998-04-20 2004-01-06 Sun Microsystems, Inc. Method and apparatus of supporting an audio protocol in a network environment
AU5126999A (en) * 1998-07-24 2000-02-14 Motorola, Inc. Telecommunication audio processing systems and methods therefor
CA2345661A1 (en) * 1998-10-02 2000-04-13 International Business Machines Corporation Conversational browser and conversational systems
WO2000025486A1 (en) * 1998-10-23 2000-05-04 Nokia Networks Oy Method and apparatus for distributing an audio or video information
AUPP713598A0 (en) * 1998-11-17 1998-12-10 Telstra R & D Management Pty Ltd A data access system and method
US7082397B2 (en) * 1998-12-01 2006-07-25 Nuance Communications, Inc. System for and method of creating and browsing a voice web
US6393107B1 (en) 1999-05-25 2002-05-21 Lucent Technologies Inc. Method and apparatus for creating and sending structured voicemail messages
US6459774B1 (en) 1999-05-25 2002-10-01 Lucent Technologies Inc. Structured voicemail messages
US6240391B1 (en) 1999-05-25 2001-05-29 Lucent Technologies Inc. Method and apparatus for assembling and presenting structured voicemail messages
FR2794924B1 (fr) * 1999-06-08 2004-04-02 Aplio Sa Procede et systeme pour acceder, via un reseau de communication informatique du type internet, a un serveur vocal multimedia
US7376710B1 (en) * 1999-10-29 2008-05-20 Nortel Networks Limited Methods and systems for providing access to stored audio data over a network
US7308462B1 (en) 1999-10-29 2007-12-11 Nortel Networks Limited Methods and systems for building and distributing audio packages
DE19959850A1 (de) * 1999-12-10 2001-06-13 Deutsche Telekom Ag Kommunikationssystem und Verfahren zum Bereitstellen eines Internet-Zugangs über ein Telefon
US6424945B1 (en) 1999-12-15 2002-07-23 Nokia Corporation Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection
EP1122636A3 (en) 2000-02-03 2007-11-14 Siemens Corporate Research, Inc. System and method for analysis, description and voice-driven interactive input to html forms
WO2001061894A2 (en) * 2000-02-18 2001-08-23 Penguinradio, Inc. Method and system for providing digital audio broadcasts and digital audio files via a computer network
SG98374A1 (en) * 2000-03-14 2003-09-19 Egis Comp Systems Pte Ltd A client and method for controlling communications thereof
US6823311B2 (en) * 2000-06-29 2004-11-23 Fujitsu Limited Data processing system for vocalizing web content
US6751593B2 (en) * 2000-06-30 2004-06-15 Fujitsu Limited Data processing system with block attribute-based vocalization mechanism
EP1178656A1 (en) * 2000-08-02 2002-02-06 Passcall Advanced Technologies Ltd System and method for computerless surfing of an information network
EP1233590A1 (en) * 2001-02-19 2002-08-21 Sun Microsystems, Inc. Content provider for a computer system
EP1246439A1 (en) * 2001-03-26 2002-10-02 Alcatel System and method for voice controlled internet browsing using a permanent D-channel connection
US7735101B2 (en) 2006-03-28 2010-06-08 Cisco Technology, Inc. System allowing users to embed comments at specific points in time into media presentation
IT1394765B1 (it) * 2009-07-08 2012-07-13 Onering S R L Dispositivo di raccolta e di gestione di documenti, e di controllo della fruizione di tali documenti, e metodo d'impiego di tale dispositivo

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001296991A (ja) * 2000-04-13 2001-10-26 Canon Inc データ処理装置、データ処理方法、記録媒体
JP2006508596A (ja) * 2002-11-29 2006-03-09 ストリームワイド ネットワークのオーディオデータを処理する方法およびその方法を実行する装置
JP4813798B2 (ja) * 2002-11-29 2011-11-09 ストリームワイド ネットワークのオーディオデータを処理する方法およびその方法を実行する装置

Also Published As

Publication number Publication date
EP0834229A1 (en) 1998-04-08
IL122647A (en) 2002-05-23
CA2224712A1 (en) 1997-10-30
KR19990028327A (ko) 1999-04-15
WO1997040611A1 (en) 1997-10-30
MX9710150A (es) 1998-07-31
IL122647A0 (en) 1998-08-16

Similar Documents

Publication Publication Date Title
JPH11510977A (ja) オーディオインターフェイスを用いた情報の取り出し方法および装置
KR100566014B1 (ko) 매개변수화된대화정의를사용하여네트워크를통한음성대화를위한방법및장치
US7555536B2 (en) Apparatus and methods for providing an audibly controlled user interface for audio-based communication devices
US7054818B2 (en) Multi-modal information retrieval system
WO2003063137A1 (en) Multi-modal information delivery system
US20030125953A1 (en) Information retrieval system including voice browser and data conversion server
US7502993B1 (en) Calling service using voice enabled web based application server
US8364490B2 (en) Voice browser with integrated TCAP and ISUP interfaces
Danielsen The promise of a voice-enabled Web
US20020112081A1 (en) Method and system for creating pervasive computing environments
US7054421B2 (en) Enabling legacy interactive voice response units to accept multiple forms of input
EP1131940A1 (en) A data access system and method
US8644465B2 (en) Method for processing audio data on a network and device therefor
CA2471133A1 (en) Method for exchanging information by means of voice over a packet-oriented network
US20020080805A1 (en) Method for establishing a telecommunications connection and service units and programme modules therefore
AU1535900A (en) A data access system and method
HK1088752B (en) Method for processing audio data on a network and device therefor
MXPA98002752A (es) Metodo y aparato para interaccion de voz en una red, utilizando definiciones de interaccion con parametros

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040316

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070710

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20071128

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080115