JPH10275162A - プロセッサに基づくホスト・システムを制御する無線音声起動制御装置 - Google Patents

プロセッサに基づくホスト・システムを制御する無線音声起動制御装置

Info

Publication number
JPH10275162A
JPH10275162A JP10031975A JP3197598A JPH10275162A JP H10275162 A JPH10275162 A JP H10275162A JP 10031975 A JP10031975 A JP 10031975A JP 3197598 A JP3197598 A JP 3197598A JP H10275162 A JPH10275162 A JP H10275162A
Authority
JP
Japan
Prior art keywords
control device
host system
grammar
voice
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10031975A
Other languages
English (en)
Inventor
Phillip R Thrift
アール.スリフト フィリップ
Charles T Hemphill
ティー.ヘムフィル チャールズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JPH10275162A publication Critical patent/JPH10275162A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72445User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting Internet browser applications
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Machine Translation (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ワールド・ワイド・ウェブに接続されたコン
ピュータのようなホスト・システムを制御する携帯無線
音声起動制御装置を提供する。 【解決手段】 携帯無線音声起動制御装置(10)はデ
ィスプレイ(10a)、前記オーディオ入力信号から導
き出したデータを前記ホスト・システムへ無線により送
信送信機(10g)と、前記ホスト・システムからイメ
ージ・データを無線により受信する受信機(10h)と
を有し、更にプロセッサ(10e)と、音声認識を実行
するメモリ(10f)とを有してもよい。無線音声起動
制御装置(20)は、ウェブ・ブラウジング用に音声認
識とこの音声認識の結果の解釈との両方を実行するプロ
セッサ(20e)及びメモリ(20f)を有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、概して音声認識装
置に関し、特にユーザが音声コマンドを有するワールド
・ワイド・ウェブ(World Wide Web)の
ようなハイパーメディア・ネットワークをブラウズ(検
索)できるようにさせた無線音声装置に関する。
【0002】
【従来の技術】インターネットは世界中に及ぶコンピュ
ータ・ネットワークであり、より正確にはネットワーク
のうちのワールド・ワイド・ネットワークである。これ
は情報の交換を行わせると共に、広範なサービスを提供
する。今日、インターネットはあらゆる種類の施設、ビ
ジネス、更に人々の家庭での個人にまで及ぶように成長
した。
【0003】ワールド・ワイド・ウェブ(“WWW”又
は“Web”)はインターネット上で利用可能なサービ
スのうちの一つである。これは、「ハイパーテキスト」
として知られている技術に基づいており、ドキュメント
がその他の部分に、又は他のドキュメントに対するリン
クを有する。ハイパーテキストは、イメージ及び音を含
め、コンピュータに記憶され得るどのような情報に対す
るリンクも包含するように拡張された。例えば、ウェブ
を用いてドキュメント内から要点のワード又は語句を選
択して世界の何処かに記憶されている定義、ソース又は
関連するドキュメントを得ることができる。
【0004】ウェブにおける基本的な単位は、「ペー
ジ」であり、他のページに対してリンクを有する(通常
は)テキスト+グラフのドキュメントである。ウェブを
「ナビゲートすること」は、主に、ページからページへ
と次々に移動することである。
【0005】ウェブの背後にある考えは、あらゆる種類
のソースからあらゆる種類のデータを収集して、高性能
なサーバ及び高性能なクライアント・プログラムがデー
タのフォーマットを取り扱えるようにすることにより、
両立性がないという問題をなくすことである。適正な翻
訳コードがサーバ及びクライアントに付加されれば、複
数のフォーマットをうまく処理するこのような機能は、
マルチメディア・フォーマットを含め、ウェブがあらゆ
る種類のデータを受け取ることができるようにする。ウ
ェブ・クライアントは、ウェブ・サーバ上に位置するウ
ェブ・リソースに接続するために用いられ、またこのリ
ソースを用いるためのものである。
【0006】
【発明が解決しようとする課題】ウェブをアクセスする
ために、またこれを使用するために用いられるクライア
ント・ソフトウェアの1形式は、「ウェブ・ブラウザ
(web browser)」ソフトウェアと呼ばれて
いる。このソフトウェアは、ユーザのコンピュータにイ
ンストールされてグラフィック・インタフェースをさせ
てもよく、そこではマウス又は他の指示装置による選択
を容易にするためにリンクがハイライトされるか、又は
マークされる。
【0007】
【課題を解決するための手段】本発明の1特徴は、ワー
ルド・ワイド・ウェブに接続されたコンピュータのよう
に、プロセッサに基づくホスト・システムを制御する無
線音声起動制御装置である。コンパクトな携帯装置がマ
イクロホン、無線オーディオ入力送信機、無線データ受
信機及びディスプレイを有する。このマイクロホンはユ
ーザからのボイス入力を受信して、オーディオ入力信号
として供給する。音声送信機はオーディオ入力信号から
導き出したデータをホスト・システムに無線により送信
する。ホスト・システムは、前記オーディオ入力信号に
対して作動した後、ある種の応答を受信機に無線により
送出されたイメージ・データ形式で送出する。ディスプ
レイはイメージ・データで表したイメージを発生して表
示する。
【0008】無線音声起動制御装置の変形は、音声出力
情報用のスピーカを含むことができる。無線音声起動制
御装置は、更に、フロント・エンド・ボイス認識処理を
実行するプロセッサと、メモリとを有することもでき
る。
【0009】本発明の効果は、ウェブ上の情報をよりア
クセスし易く、かつ有用にすることである。会話制御は
ウェブ・インタフェースに柔軟性を加えると共に機能性
を高めかつ情報に対するアクセスをより自然なものにす
る。
【0010】
【発明の実施の形態】ここで説明する本発明は、プロセ
ッサに基づくホスト・システムを制御する無線音声起動
制御装置に関するものである。即ち、この無線音声起動
制御装置は音声起動遠方制御装置である。この説明例に
おいて、ホスト・システムはワールド・ワイド・ウェブ
に接続されたコンピュータであり、この無線音声起動制
御装置は音声制御されたウェブ・ブラウジングに用いら
れる。しかし、同一の概念は、表示又は音声情報を提供
するプロセッサに基づくシステム、例えばテレビジョン
を制御する音声制御装置に適用可能である。
【0011】無線音声起動制御装置に関する種々の実施
例は、この装置に埋め込まれる「知能(intelli
gence)」により異なる。本発明の目的のために、
通常のウェブ・ブラウザ・ソフトウェアが使用できるよ
うにオーディオ入力を認識するため及びオーディオ入力
を解釈するために使用されるプログラミングは、組み込
まれるプログラムの範囲が設計及びコストの問題に対応
した形式によりモジュール化される。
【0012】図1は本発明による無線音声起動制御装置
(以下、制御装置という)10の一実施例を示す。前述
のように、この説明のために、ホスト・システム11は
コンピュータであり、ワールド・ワイド・ウェブとデー
タ通信をしている。
【0013】制御装置10はディスプレイ10a及びマ
イクロホン10bを有する。ディスプレイ10aはユー
ザから音声入力を受け取る。これは「ミュート(mut
e)」スイッチ10cを備えてもよく、従って制御装置
10はイメージを表示することができ、更に音声認識を
実行することなく、キー・パッド(図示なし)のような
代替的な入力装置を介して非オーディオ入力を受け取る
こともできる。マイクロホン10bはユーザの声を他の
音から区別する能力を強化するようにマイクロホン・ア
レーであってもよい。
【0014】図1の実施例において、制御装置10は音
声認識処理の全て又は一部を実行し、かつ会話データを
送信機10gを介してホスト・システム11に送出す
る。ホスト・システム11は種々の音声制御解釈処理を
実行し、更にウェブ・ブラウザも遂行する。しかし、制
御装置はその最も簡単な形式により、マイクロホン10
bからホスト・システム11へオーディオ・データを直
接送信し、ホスト・システム11が全ての処理を実行す
ることになる。
【0015】制御装置10が音声認識処理の全て又は一
部を実行する場合には、制御装置10がプロセッサ10
eを備えている。メモリ10fはプロセッサ10eが実
行する音声認識プログラミングを記憶している。スピー
チ認識に適したプロセッサ10eの例は、信号プロセッ
サ、例えばテキサス・インスツルメンツ社により製造さ
れたものである。マイクロホン10bがマイクロホン・
アレーである場合は、プロセッサ10eがユーザの声を
目標にする計算を実行してもよい。
【0016】制御装置は、いくつかの音声処理のみを実
行するのであれば、1又はそれより多くの「フロント・
エンド」処理、例えば線形予測符号(LPC)解析又は
会話終了点指示を実行してもよい。
【0017】制御装置10が全ての音声認識処理を実行
するのであれば、メモリ10fは(音声認識装置とし
て)これらの処理と共に、文法ファイルを記憶する。動
作において、音声認識装置はマイクロホン10bからの
オーディオ入力を受け取り、かつ適当な文法ファイルを
アクセスする。文法ファイル・ハンドラは、文法を会話
レディー形式に変換して発音文法を作成して、文法を音
声認識装置にロードさせる。
【0018】メモリ10fにおける文法ファイルは予め
定められて記憶されても、又はダイナミックに作成され
ても、又は両形式の文法ファイルの組合わせであっても
よい。ダイナミック文法ファイルの作成例を以下に図5
と関連させて説明する。文法は文脈なし文法のバックス
・ナウア形式(Backus−Naur formof
context−free grammer)により
書き込まれたものであってもよく、かつカスタマイズさ
れてもよい。図1の実施例であって、制御装置10をウ
ェブ・ブラウジングに用いる場合に、ホスト・システム
11は現在表示されているウェブ・ページ用のHTML
(hyper markup language)を制
御装置10に送出する。メモリ10fはダイナミックに
文法を発生する文法ファイル発生器を記憶している。ウ
ェブ・ブラウジングの他の実施例では、ホスト・システ
ム11が文法をダイナミックに発生して、文法ファイル
を制御装置10にダウンロードすることができる。
【0019】音声認識装置の出力は会話データである。
この会話データは音声制御解釈処理を実行するホスト・
システム11に送信される。音声制御されたウェブ・ブ
ラウジング用の種々の音声制御解釈処理は、「文法的な
メタデータを用いた音声起動ハイパーメディア・システ
ム(Voice Activated Hyperme
dia Systems Using Grammat
ical Metamedia)」と題してテキサス・
インスツルメント社に譲渡された米国特許出願第08/
419、229号に説明されており、ここでは引用によ
って関連される。この解釈の結果として、ホスト・シス
テム11はコマンドを実行することにより、又はハイパ
ーメディア(Web)リンクを設けることにより、制御
装置10に対する音声入力に応答してもよい。
【0020】ウェブ・ブラウジング以外の音声制御解釈
例は、テレビジョンに対するコマンドに関するものであ
り、そこではホスト・システム11がプロセッサに基づ
くテレビジョン・システムである。例えば、「今晩のテ
レビでは何が放送されますか」の音声コマンドは、テレ
ビジョン番組を表示する結果となる。ウェブ・ブラウジ
ング以外の他の音声制御解釈例は、コンピュータに基づ
く家事制御用のコマンドに関するものである。「スプリ
ンクラー予定を見せて下さい」の音声コマンドは、適当
な表示に帰結する。
【0021】ホスト・システム11が適当な操作を行っ
た後に、無線受信機10hはホスト・システム11から
データを受け取ってディスプレイ10a上に表示する、
又はスピーカ10bにより出力する。従って、ホスト・
システム11から受け取ったデータは、画像(テキス
ト、グラフィック、イメージ及びビデオを含む)又は音
声であってもよい。
【0022】図2は本発明の他の実施例、音声制御解釈
と共に音声認識を実行する無線音声起動制御装置(以
下、制御装置という。)20を示す。音声制御の解釈
は、ウェブのようなハイパーメディア・リソースをブラ
ウザするために固有のものである。ホスト・システム2
1はハイパーメディア・リソースに接続される。
【0023】制御装置20は制御装置10の構成要素と
同一のものを有する。しかし、そのプロセッサ20eは
メモリ20fに記憶された付加的なプログラミングを実
行する。特に、音声制御解釈処理は、会話可能コマンド
処理、会話可能ホットリスト処理、又は会話可能リンク
処理を備えるものであってもよい。これらの処理及びこ
れらに関連する文法ファイルは制御装置20上に存在す
る。
【0024】会話可能コマンド処理はディスプレイ20
a上にコマンド・インタフェースを表示し、かつ種々の
ウェブ・ブラウジング・コマンドを受け付ける。この会
話可能コマンド処理はユーザが話すかも知れないワード
及び語句(phrase)に関連した文法ファイルを有
する。
【0025】図3は音声制御解釈処理により得られたデ
ィスプレイ30の例を示す。会話可能コマンドは、ボタ
ン31により作動された「ヘルプ」コマンドである。応
答において、コマンド処理は音声制御のブラウジングを
どのように使用するのかを説明している「ヘルプ・ペー
ジ」を表示する。
【0026】他の会話可能コマンドは、「私の会話可能
コマンド・リストを見せて下さい」である。このコマン
ドを話すと、それぞれ会話可能コマンドを表す一組の文
法をリストにしたページが示される。例えば、ページダ
ウン・コマンド、バック・コマンド及びヘルプ・コマン
ドがある。コマンド処理がこれらコマンドのうちの一つ
の翻訳を受け取ると、適当な操作を実行する。
【0027】図3は更にウェブ・ブラウジングに特に有
用な音声認識装置の特徴を示す。ユーザは、ワード「X
YZの株価はどうなっているか」と言った例である。音
声認識装置が発声を認識すると、これは時間及びメモリ
使用に対するスコア値、種々の統計とを決定する。以下
で説明するように、株価に対する要求はホットリスト項
目であってもよく、情報を配置するウェブ位置を確認す
ることなく、単純にユーザに要求を発声可能にさせる。
【0028】他の会話可能なコマンドは、ボタン33に
より作動される「私の会話可能ホットリストを見せて下
さい」の例である。「ホットリスト」は、選択されたリ
ソース・ロケータ(URL)の記憶リスト、例えば頻繁
に使用されるものである。ホットリストはブックマーク
としても知られている。URLはウェブの周知の特徴で
あり、インターネット上の任意のリソースを命名するよ
うに短くかつ首尾一貫した方法を提供する。典型的なU
RLは以下の形式:http://www.ncsa.
uiic.edu/General/NCSAHom
e.htmlを有する。URLの種々の部分は、送信プ
ロトコル、コンピュータ・アドレス、及びそのアドレス
におけるディレクトリ・パスを識別する。URLは「リ
ンク」及び「アンカ」としても知られている。
【0029】会話可能ホットリスト処理は、ユーザに各
ホットリスト項目に対する文法を構築して文法をURL
に関連可能にさせる。文法を作成するために、ユーザは
BNF構文を用いた文法においてASCII文法ファイ
ル及び形式を編集することができる。例えば、天気予報
を検索する文法は、「今日の天気予報はどうなっている
か」及び「天気予報を教えて下さい」のような語句を定
義することができる。次いで、ユーザは適当なURLを
文法に関連させる。
【0030】ホットリスト文法ファイルは音声により変
更されてもよい。例えば、カレント・ページはホットリ
スト項目として付け加えられてもよい。語句が音声で入
力されると、「このページを私のホットリストに付け加
えて下さい」は、文法にページのタイトルを付け加える
と共に、その文法をカレントURLに関連させる。「私
の会話可能ホットリストを編集して下さい」の語句が音
声で入力されると、音声によって検索する付加的な語句
を付け加えることにより、ユーザに文法を編集できるよ
うにさせる。
【0031】会話可能ホットリスト処理は、音声認識装
置がホットリスト文法からホットリスト翻訳を認識した
ときに活性化されて、その翻訳をホットリスト処理に渡
す。ホットリストは関連するURLを参照する。これは
URLを(無線通信を介して)ホスト・コンピュータ上
に存在するブラウザにURLを渡し、従ってウェブ・ペ
ージを検索して制御装置10に送信し、ディスプレイ1
0a上に表示させることができる。
【0032】会話可能コマンド及び会話可能ホットリス
トのような文法ファイルは、常時活性化している。これ
は、ユーザにコマンド又はホットリストを任意の文脈に
リンク可能にする。会話可能リンク処理は制御装置20
のメモリ20eにも存在し得る。ウェブ・ページにおい
て選択された情報は、他のウェブ・ページに対するアク
セス用のリンクとなるものでもよい。これらのリンク
は、例えばアンダーラインされ、ハイライトされ、異な
る色付けにされ、画像の場合のように輪郭が付けられる
ことにより、指示されるか、又は他の方法により認識さ
れる。制御装置10のユーザは、リンクを選択するため
にマウス又は他の指示装置を用いる代わりに、ディスプ
レイ10a上に表示されているページからのリンクを話
すものでもよい。
【0033】図4はウェブ・ページ40の一部及びその
リンクを示す。例えば、第2のヘッドライン41は一つ
のリンクである。
【0034】会話可能リンク用の文法には完全な語句と
共に変形が含まれる。話者は、完全な語句を話すことに
加えて、「ニューヨーク期間におけるダイアナ」(文字
通りの変形として)「NYにおけるダイアナ」又は「ニ
ューヨークにおけるダイアナ」と言うこともできる。
【0035】会話可能リンクを作成すると、まず、その
ウェブ・ページからリンク/URLを得ることが必要で
ある。HTML(ハイパーテキスト・マークアップ言
語)フォーマットにおけるウェブ・ページは、任意の長
さを有するものでもよいので、認識者がサーチする候補
リンク/URL対の数は、ディスプレイ20aのカレン
ト・スクリーン上で見えるものに限定されてもよい。
「スクロール・ダウン」のようなコマンドは、候補リン
ク/URL対を更新する。スクリーン用のリンク/UR
L対が得られると、文法がカレント・スクリーン上の全
てのリンクに対して作成される。次に、リンクにおける
トークンが認識され、そのトークンに関する文法が作成
される。これらの文法は認識者の文法ファイルに付け加
えられる。正しいトークン化は、リンク・フォーマット
が広範に変わり得るので、簡単ではない。リンクには、
番号、頭字語、創作した言葉、及び新しい句読点使用が
含まれていてもよい。
【0036】会話可能リンクに関して簡単ではない他の
ものは、リンクの長さ、同一ページにおけるリンクのあ
いまいさ、及びビット・マップされたリンクを含むグラ
フィックである。長いリンクに対して、会話可能リンク
処理は、ユーザにNワード語の任意時点でリンクにおけ
るワードを話すのを停止可能にさせる。あいまいさに対
して、この処理は、第1のURLに対するデフォールト
であっても、又はユーザに対するURLの選択を提供し
てもよい。ビット・マップされたリンクに対して、処理
はリンク情報を探すために<ALT>タグを用いる。
【0037】会話可能リンクに関する文法はダイナミッ
クに作成されので、カレント表示用の文法のみが活性で
あり、新しいカレント表示を発生すると更新される。更
に、ダイナミックな文法の作成は必要とするメモリ10
fの量も減少させる。
【0039】図5は文法ファイルをダイナミックに作成
する適当な処理を示す。これは図1及び図2のダイナミ
ック文法発生器により実施される処理である。以上で説
明したように、ダイナミック文法ファイルはカレント・
ウェブ・ページから作成されるので、会話可能リンクを
認識することができる。以上で引用により関連させた米
国特許出願第08/419、226号は、更に、音声制
御されたホスト・システム11に印加されたこの方法、
即ち別個のリモート制御装置である制御装置10なしの
音声制御を説明している。
【0039】図4のディスプレイ40のようなディスプ
レイは、文法規約52に影響する。文法規約52は用語
集54及びユーザ・エージェント64に入力される。続
いて、用語集54はオンライン辞書56をフィードさ
せ、オンライン辞書56が発音モジュール58に入力す
る。発音モジュール58と共に、話者一人による連続的
な会話音声モジュール60は、ユーザ・エージェント6
4に入力する。加えて、会話モジュール66はユーザの
会話をユーザ・エージェント64に入力する。これに並
行して、ディスプレイ40からの入力を文脈モジュール
68が受け取って、ユーザ・エージェント64に入力す
る。
【0040】既存のRGDAG(Regular Gr
ammer Directed Acyclic Gr
aph:標準文法指向の非周期グラフ)は、新しい構文
及び用語にダイナミックに適応させてもよい。ディスプ
レイ40が変化する度に、ユーザ・エージェント64は
アンダーラインされた現在可視的な複数の語句(複数の
リンク)を含む文法を発生する。この文法から、ユーザ
・エージェント64は語句をトークン化して、例えば文
字の綴り及び削除または任意選択の句読を含むことがで
きる。ユーザ・エージェント64は、概要辞書とテキス
ト対音素マッピングとの組合わせを用いて、これらのト
ークンから音声発音文法(phonetic pron
unciation grammers)を作成する。
次いで、音声認識処理が作成した文法を付け加える。こ
れには、どのシンボルが出力する「ワード」を表すのか
を識別することを含め、音声認識装置用のいくつかの簡
単な簿記作業が含まれている。最後に、大域的な変化を
実施して新しくまたは変化した文法に関連させる。この
ために、文法はRGDAG関係により接続される。加え
て、各シンボルに対する最大深さが計算される。更に、
音声認識装置は出力により祖先シンボルを探してパーズ
(parse:品詞及び文法的な関係の)情報を必要と
する。その場合に、効果的なパーズ用の文法構造は同一
である。
【0041】他の実施例 特定の実施例を参照して本発明を説明したが、この説明
が限定的な意味で解釈されることを意図するものではな
い。開示した実施例の種々の変形と共に、他の実施例
は、当該技術分野に習熟する者に明らかである。従っ
て、特許請求の範囲は本発明の範囲内に包含される全て
の変形を含むことを意図している。
【0042】以上の項に関して更に以下の項を開示す
る。
【0043】(1)プロセスに基づくホスト・システム
を制御する無線音声起動制御装置において、ユーザから
の音声入力を受け取ることにより、オーディオ入力信号
を供給するように動作可能であるマイクロホンと、前記
オーディオ入力信号から導き出したデータを前記ホスト
・システムに無線により送信するように動作可能である
音声送信機と、前記ホスト・システムからイメージ・デ
ータを無線により受信するように動作可能であるデータ
受信機と、前記イメージ・データにより表されたイメー
ジを発生して表示するように動作可能であるディスプレ
イとを含む無線音声起動制御装置。
【0044】(2)前記マイクロホンは前記ディスプレ
イから独立してオン状態又はオフ状態に切り換え可能で
ある第1項記載の無線音声起動制御装置。
【0045】(3)前記マイクロホンは多重素子のマイ
クロホン・アレーである第1項記載の無線音声起動制御
装置。
【0046】(4)更に、音声認識処理を実行するよう
に動作可能なプロセッサと、前記音声認識処理及び文法
ファイルを記憶するメモリとを含む第1項記載の無線音
声起動制御装置。
【0047】(5)前記音声認識処理は線形予測符号解
析を含み、かつ前記送信機は前記解析の結果を送信する
ように動作可能である第4項記載の無線音声起動制御装
置。
【0048】(6)前記音声認識処理は会話終了点の解
析を含み、かつ前記送信機は前記解析の結果を送信する
ように動作可能である第4項記載の無線音声起動制御装
置。
【0049】(7)前記文法ファイルはダイナミックに
作成され、更に前記プロセッサは前記ダイナミック文法
発生処理を実行するように動作可能である第4項記載の
無線音声起動制御装置。
【0050】(8)ハイパーメディア・リソースとのデ
ータ通信においてホスト・システムを音声制御する無線
音声起動制御装置において、ユーザからの音声入力を受
け取ることにより、オーディオ入力信号を発生するよう
に動作可能であるマイクロホンと、前記オーディオ入力
信号から導き出したデータを前記ホスト・システムに無
線により送信するように動作可能である音声送信機と、
前記ホスト・システムからイメージ・データを無線によ
り受信するように動作可能であるデータ受信機と、前記
イメージ・データにより表されすると共に、前記ホスト
・システムにより前記ハイパーメディアから検索された
イメージを発生して表示ように動作可能であるディスプ
レイとを含む無線音声起動制御装置。
【0051】(9)更に、音声認識処理を実行するよう
に動作可能なプロセッサと、前記音声認識処理及び文法
ファイルを記憶するメモリとを含む第8項記載の無線音
声起動制御装置。
【0052】(10)前記音声認識処理は線形予測符号
解析を含み、かつ前記送信機は前記解析の結果を送信す
るように動作可能である第9項記載の無線音声起動制御
装置。
【0053】(11)前記音声認識処理は会話終了点の
解析を含み、かつ前記送信機は前記解析の結果を送信す
るように動作可能である第9項記載の無線音声起動制御
装置。
【0054】(12)前記文法ファイルはダイナミック
に作成され、更にプロセッサはダイナミックな文法発生
処理を実行するように動作可能である第9項記載の無線
音声起動制御装置。
【0055】(13)更に、音声制御処理を実行するよ
うに動作可能なプロセッサと、前記音声制御処理を記憶
するメモリとを含む第8項記載の無線音声起動制御装
置。
【0056】(14)前記音声制御処理は、前記ユーザ
が前記ホスト・システムの動作を音声により指令できる
ように、会話可能なコマンド処理を含む第13項記載の
無線音声起動制御装置。
【0057】(15)前記音声制御処理は、前記ユーザ
が前記ホスト・システムにより検索されるべき前記リソ
ースのうちの特定の一つを音声により要求できるよう
に、会話可能なホットリスト処理を含む第13項記載の
無線音声起動制御装置。
【0058】(16)前記音声制御処理は、前記ディス
プレイ上に表示されているカレント・ページ上のリンク
が前記ホスト・システムにより検索されるように、会話
可能なリンク処理を含む第13項記載の無線音声起動制
御装置。
【0059】(17)更に、音声認識処理を実行し、か
つダイナミック文法発生処理を実行するように動作可能
なプロセッサと、前記処理を記憶するメモリとを含む第
8項記載の無線音声起動制御装置。
【0060】(18)ワールド・ワイド・ウェブに接続
されたコンピュータのようなホスト・システム11を制
御する携帯無線音声起動制御装置10。前記携帯無線音
声起動制御装置10はディスプレイ10a、送信機10
g及び受信機10hを有する。前記携帯無線音声起動制
御装置10は、更に、音声認識を実行するためにプロセ
ッサ10e及びメモリ10fを有してもよい。装置20
は、音声認識とこの音声認識の結果の解釈との両方を実
行するプロセッサ20e及びメモリ20fを備えること
により、ウェブ・ブラウジング用に特に設計されてもよ
い。
【0062】関連する特許出願 この特許出願は、それぞれテキサス・インスツルメンツ
社に譲渡された以下の特許出願に関連する。「会話認識
における話者独立ダイナミック用語及び文法(Spea
ker−Independent Dynamic V
ocabularly and Grammer in
Speech Recognition)」と題する
米国特許出願第08/419、226号。「文法メタデ
ータを用いる音声作動ハイパーメディア・システム(V
oiceActivated Hypermedia
System Using Grammatical
Metadata)」と題する米国特許出願第08/4
19、229号。
【図面の簡単な説明】
【図1】本発明による無線音声起動制御装置の一実施例
を示す図。
【図2】ユーザからの音声入力を翻訳し、かつ解釈する
ように特に構成された無線音声起動制御装置の他の実施
例を示す図。
【図3】会話可能コマンド処理により提供される表示の
一例を示す図。
【図4】ウェブ・ページの一部及びその会話可能リンク
を示す図。
【図5】図1及び図2の音声認識装置が用いる文法をダ
イナミックに作成する処理を示す図。
【符号の説明】
10、20 無線音声起動制御装置 10a、20a ディスプレイ 10b、20b マイクロホン 10e、20e プロセッサ 10f、20f メモリ 10g 送信機 10h 無線受信機 11、21 ホスト・システム

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 プロセスに基づくホスト・システムを制
    御する無線音声起動制御装置において、 ユーザからの音声入力を受け取ることにより、オーディ
    オ入力信号を供給するように動作可能なマイクロホン
    と、 前記オーディオ入力信号から導き出したデータを前記ホ
    スト・システムに無線により送信するように動作可能な
    音声送信機と、 前記ホスト・システムからイメージ・データを無線によ
    り受信するように動作可能なデータ受信機と、 前記イメージ・データにより表されたイメージを発生し
    て表示するように動作可能なディスプレイとを備えた無
    線音声起動制御装置。
JP10031975A 1997-01-06 1998-01-06 プロセッサに基づくホスト・システムを制御する無線音声起動制御装置 Pending JPH10275162A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US943795 1992-09-11
US3468597P 1997-01-06 1997-01-06
US08/943,795 US6188985B1 (en) 1997-01-06 1997-10-03 Wireless voice-activated device for control of a processor-based host system
US034685 1997-10-03

Publications (1)

Publication Number Publication Date
JPH10275162A true JPH10275162A (ja) 1998-10-13

Family

ID=26711249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10031975A Pending JPH10275162A (ja) 1997-01-06 1998-01-06 プロセッサに基づくホスト・システムを制御する無線音声起動制御装置

Country Status (6)

Country Link
US (1) US6188985B1 (ja)
EP (1) EP0854417A3 (ja)
JP (1) JPH10275162A (ja)
KR (1) KR19980070352A (ja)
SG (1) SG72780A1 (ja)
TW (1) TW497044B (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999063444A1 (fr) * 1998-06-03 1999-12-09 Sony Corporation Procede et systeme de traitement de donnees
KR20010025230A (ko) * 2000-11-09 2001-04-06 차정만 음성도메인에 의한 인터넷접속 매개장치와 매개방법 및음성도메인의 데이터 베이스 생성방법
JP2002041277A (ja) * 2000-07-28 2002-02-08 Sharp Corp 情報処理装置およびWebブラウザ制御プログラムを記録した記録媒体
JP2002540477A (ja) * 1999-03-26 2002-11-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クライアント−サーバ音声認識
JP2002540479A (ja) * 1999-03-26 2002-11-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クライアントサーバ音声認識
JP2004505361A (ja) * 2000-07-21 2004-02-19 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 通信システム

Families Citing this family (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6965864B1 (en) * 1995-04-10 2005-11-15 Texas Instruments Incorporated Voice activated hypermedia systems using grammatical metadata
US7937260B1 (en) 1998-06-15 2011-05-03 At&T Intellectual Property Ii, L.P. Concise dynamic grammars using N-best selection
US6499013B1 (en) * 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
DE69814181T2 (de) 1998-09-22 2004-03-04 Nokia Corp. Verfahren und vorrichtung zur konfiguration eines spracherkennungssystems
DE69909806T2 (de) * 1998-09-30 2004-01-22 Lernout & Hauspie Speech Products N.V. Graphische Benutzerschnittstelle zur Navigation in Grammatiken eines Spracherkennungssystems
US7003463B1 (en) 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
US6587822B2 (en) * 1998-10-06 2003-07-01 Lucent Technologies Inc. Web-based platform for interactive voice response (IVR)
WO2000041066A1 (en) * 1999-01-07 2000-07-13 Inviso Transcription method using virtual image display
AU2388000A (en) * 1999-01-07 2000-07-24 Inviso Transcription device with virtual image display
US6606280B1 (en) * 1999-02-22 2003-08-12 Hewlett-Packard Development Company Voice-operated remote control
US6349283B1 (en) * 1999-03-05 2002-02-19 Glenn Sanders Remote control and processing of wireless digital receiver
US7283964B1 (en) 1999-05-21 2007-10-16 Winbond Electronics Corporation Method and apparatus for voice controlled devices with improved phrase storage, use, conversion, transfer, and recognition
US6584439B1 (en) 1999-05-21 2003-06-24 Winbond Electronics Corporation Method and apparatus for controlling voice controlled devices
US6543052B1 (en) * 1999-07-09 2003-04-01 Fujitsu Limited Internet shopping system utilizing set top box and voice recognition
DE19938535A1 (de) * 1999-08-13 2001-02-15 Christoph Bueltemann Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder Texte
DE19943875A1 (de) * 1999-09-14 2001-03-15 Thomson Brandt Gmbh System zur Sprachsteuerung mit einem Mikrofonarray
US7194752B1 (en) 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
US7174293B2 (en) * 1999-09-21 2007-02-06 Iceberg Industries Llc Audio identification system and method
US6526381B1 (en) * 1999-09-30 2003-02-25 Intel Corporation Remote control with speech recognition
US7330815B1 (en) * 1999-10-04 2008-02-12 Globalenglish Corporation Method and system for network-based speech recognition
US7219123B1 (en) * 1999-10-08 2007-05-15 At Road, Inc. Portable browser device with adaptive personalization capability
KR100812109B1 (ko) * 1999-10-19 2008-03-12 소니 일렉트로닉스 인코포레이티드 자연어 인터페이스 제어 시스템
EP2276020A1 (en) * 1999-11-09 2011-01-19 Nuance Communications Austria GmbH Speech recognition method for activating a hyperlink of an internet page
US9076448B2 (en) * 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US20030182113A1 (en) * 1999-11-22 2003-09-25 Xuedong Huang Distributed speech recognition for mobile communication devices
US6978475B1 (en) 1999-11-24 2005-12-20 Ecable, Llc Method and apparatus for internet TV
US6424945B1 (en) * 1999-12-15 2002-07-23 Nokia Corporation Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection
US6397186B1 (en) * 1999-12-22 2002-05-28 Ambush Interactive, Inc. Hands-free, voice-operated remote control transmitter
US8578439B1 (en) * 2000-01-28 2013-11-05 Koninklijke Philips N.V. Method and apparatus for presentation of intelligent, adaptive alarms, icons and other information
WO2001059759A1 (en) * 2000-02-10 2001-08-16 Randolphrand.Com Llp Recorder adapted to interface with internet browser
US20020055844A1 (en) * 2000-02-25 2002-05-09 L'esperance Lauren Speech user interface for portable personal devices
GB2362017A (en) * 2000-03-29 2001-11-07 John Pepin Network access
US6662163B1 (en) * 2000-03-30 2003-12-09 Voxware, Inc. System and method for programming portable devices from a remote computer system
US7096185B2 (en) 2000-03-31 2006-08-22 United Video Properties, Inc. User speech interfaces for interactive media guidance applications
FR2810125B1 (fr) * 2000-06-08 2004-04-30 Interactive Speech Technologie Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client
US8200485B1 (en) 2000-08-29 2012-06-12 A9.Com, Inc. Voice interface and methods for improving recognition accuracy of voice search queries
US6397388B1 (en) * 2000-09-29 2002-05-28 Digeo, Inc. Systems and devices for audio capture and communication during television broadcasts
US6529233B1 (en) 2000-09-29 2003-03-04 Digeo, Inc. Systems and methods for remote video and audio capture and communication
US6944880B1 (en) 2000-09-29 2005-09-13 Digeo, Inc. Methods for audio capture and communication during television broadcasts
US20020054206A1 (en) * 2000-11-06 2002-05-09 Allen Paul G. Systems and devices for audio and video capture and communication during television broadcasts
WO2002039425A1 (fr) * 2000-11-10 2002-05-16 Cai Co., Ltd. Systeme et procede de conversation en mode vocal faisant appel a un telephone portable, et centre en mode vocal
US6629077B1 (en) * 2000-11-22 2003-09-30 Universal Electronics Inc. Universal remote control adapted to receive voice input
DE60133529T2 (de) * 2000-11-23 2009-06-10 International Business Machines Corp. Sprachnavigation in Webanwendungen
US6973429B2 (en) * 2000-12-04 2005-12-06 A9.Com, Inc. Grammar generation for voice-based searches
JP4240807B2 (ja) * 2000-12-25 2009-03-18 日本電気株式会社 移動通信端末装置、音声認識方法、およびそのプログラムを記録した記録媒体
US20040244056A1 (en) * 2001-02-21 2004-12-02 Lorenz Kim E. System and method for providing direct, context-sensitive customer support in an interactive television system
US20050039214A1 (en) * 2001-02-21 2005-02-17 Lorenz Kim E. System and method for providing direct, context-sensitive customer support in an interactive television system
US6658414B2 (en) * 2001-03-06 2003-12-02 Topic Radio, Inc. Methods, systems, and computer program products for generating and providing access to end-user-definable voice portals
US20060265397A1 (en) * 2001-03-06 2006-11-23 Knowledge Vector, Inc. Methods, systems, and computer program products for extensible, profile-and context-based information correlation, routing and distribution
US20020138269A1 (en) * 2001-03-20 2002-09-26 Philley Charles F. Voice recognition maintenance inspection program
US7039590B2 (en) * 2001-03-30 2006-05-02 Sun Microsystems, Inc. General remote using spoken commands
US20020188447A1 (en) * 2001-04-10 2002-12-12 Coon Bradley S. Generation of grammars from dynamic data structures
US8108509B2 (en) * 2001-04-30 2012-01-31 Sony Computer Entertainment America Llc Altering network transmitted content data based upon user specified characteristics
US7506022B2 (en) * 2001-05-04 2009-03-17 Microsoft.Corporation Web enabled recognition architecture
US7409349B2 (en) 2001-05-04 2008-08-05 Microsoft Corporation Servers for web enabled speech recognition
US7610547B2 (en) * 2001-05-04 2009-10-27 Microsoft Corporation Markup language extensions for web enabled recognition
US7366712B2 (en) * 2001-05-31 2008-04-29 Intel Corporation Information retrieval center gateway
US7366673B2 (en) * 2001-06-15 2008-04-29 International Business Machines Corporation Selective enablement of speech recognition grammars
US20030046710A1 (en) * 2001-09-05 2003-03-06 Moore John F. Multi-media communication system for the disabled and others
US7711570B2 (en) 2001-10-21 2010-05-04 Microsoft Corporation Application abstraction with dialog purpose
US8229753B2 (en) * 2001-10-21 2012-07-24 Microsoft Corporation Web server controls for web enabled recognition and/or audible prompting
US20030078775A1 (en) * 2001-10-22 2003-04-24 Scott Plude System for wireless delivery of content and applications
US7013275B2 (en) * 2001-12-28 2006-03-14 Sri International Method and apparatus for providing a dynamic speech-driven control and remote service access system
US7203644B2 (en) * 2001-12-31 2007-04-10 Intel Corporation Automating tuning of speech recognition systems
US20030139929A1 (en) * 2002-01-24 2003-07-24 Liang He Data transmission system and method for DSR application over GPRS
US7062444B2 (en) * 2002-01-24 2006-06-13 Intel Corporation Architecture for DSR client and server development platform
US20030144846A1 (en) * 2002-01-31 2003-07-31 Denenberg Lawrence A. Method and system for modifying the behavior of an application based upon the application's grammar
US7712020B2 (en) * 2002-03-22 2010-05-04 Khan Emdadur R Transmitting secondary portions of a webpage as a voice response signal in response to a lack of response by a user
US7873900B2 (en) * 2002-03-22 2011-01-18 Inet Spch Property Hldg., Limited Liability Company Ordering internet voice content according to content density and semantic matching
US7016849B2 (en) * 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
US6910911B2 (en) 2002-06-27 2005-06-28 Vocollect, Inc. Break-away electrical connector
US7421389B2 (en) * 2002-11-13 2008-09-02 At&T Knowledge Ventures, L.P. System and method for remote speech recognition
WO2004053609A1 (en) * 2002-12-12 2004-06-24 Abb Research Ltd A control system controlling a plurality of real world objects, and a method for hanling messages from a mobile user connected to the control system
US9369775B2 (en) * 2003-01-31 2016-06-14 At&T Intellectual Property I, L.P. Methods and systems for delivering signals from cable networks to telecommunications networks
US7729913B1 (en) 2003-03-18 2010-06-01 A9.Com, Inc. Generation and selection of voice recognition grammars for conducting database searches
JP2004302300A (ja) * 2003-03-31 2004-10-28 Canon Inc 情報処理方法
DE60325901D1 (de) * 2003-04-07 2009-03-05 Nokia Corp Prachgesteuerter eingabe für eine elektronische vorrichtung mit einer benutzerschnittstelle
US7275032B2 (en) * 2003-04-25 2007-09-25 Bvoice Corporation Telephone call handling center where operators utilize synthesized voices generated or modified to exhibit or omit prescribed speech characteristics
US7260535B2 (en) * 2003-04-28 2007-08-21 Microsoft Corporation Web server controls for web enabled recognition and/or audible prompting for call controls
US20040230637A1 (en) * 2003-04-29 2004-11-18 Microsoft Corporation Application controls for speech enabled recognition
US20050027539A1 (en) * 2003-07-30 2005-02-03 Weber Dean C. Media center controller system and method
US8311835B2 (en) * 2003-08-29 2012-11-13 Microsoft Corporation Assisted multi-modal dialogue
US8160883B2 (en) * 2004-01-10 2012-04-17 Microsoft Corporation Focus tracking in dialogs
US7552055B2 (en) 2004-01-10 2009-06-23 Microsoft Corporation Dialog component re-use in recognition systems
US7739117B2 (en) * 2004-09-20 2010-06-15 International Business Machines Corporation Method and system for voice-enabled autofill
TWI287787B (en) * 2004-12-14 2007-10-01 Delta Electronics Inc A remote control device and method with speech control
US8873768B2 (en) * 2004-12-23 2014-10-28 Motorola Mobility Llc Method and apparatus for audio signal enhancement
CN101164102B (zh) * 2005-02-03 2012-06-20 语音信号科技公司 自动扩展移动通信设备的话音词汇的方法和装置
US20060227946A1 (en) * 2005-03-31 2006-10-12 Xerox Corporation Voice activated printer
US7548859B2 (en) * 2005-08-03 2009-06-16 Motorola, Inc. Method and system for assisting users in interacting with multi-modal dialog systems
US9152982B2 (en) 2005-08-19 2015-10-06 Nuance Communications, Inc. Method of compensating a provider for advertisements displayed on a mobile phone
US8073700B2 (en) 2005-09-12 2011-12-06 Nuance Communications, Inc. Retrieval and presentation of network service results for mobile device using a multimodal browser
US7672852B2 (en) * 2005-09-29 2010-03-02 Microsoft Corporation Localization of prompts
US7477909B2 (en) 2005-10-31 2009-01-13 Nuance Communications, Inc. System and method for conducting a search using a wireless mobile device
USD549694S1 (en) 2005-11-15 2007-08-28 Vocollect, Inc. Headset
USD552595S1 (en) 2005-11-16 2007-10-09 Vocollect, Inc. Control panel for a headset
US20070266162A1 (en) * 2005-12-07 2007-11-15 Microsoft Corporation Session initiation protocol redirection for process recycling
US20070136752A1 (en) * 2005-12-12 2007-06-14 John Sanders Personalized electronic programming guide
US8417185B2 (en) 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US20070156682A1 (en) * 2005-12-28 2007-07-05 Microsoft Corporation Personalized user specific files for object recognition
US7693267B2 (en) * 2005-12-30 2010-04-06 Microsoft Corporation Personalized user specific grammars
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
US7885419B2 (en) 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US20080086311A1 (en) * 2006-04-11 2008-04-10 Conwell William Y Speech Recognition, and Related Systems
US8843376B2 (en) 2007-03-13 2014-09-23 Nuance Communications, Inc. Speech-enabled web content searching using a multimodal browser
WO2009048984A1 (en) * 2007-10-08 2009-04-16 The Regents Of The University Of California Voice-controlled clinical information dashboard
USD626949S1 (en) 2008-02-20 2010-11-09 Vocollect Healthcare Systems, Inc. Body-worn mobile device
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
US9497322B2 (en) * 2008-10-16 2016-11-15 Troy Barnes Remote control of a web browser
US8386261B2 (en) 2008-11-14 2013-02-26 Vocollect Healthcare Systems, Inc. Training/coaching system for a voice-enabled work environment
US9390167B2 (en) 2010-07-29 2016-07-12 Soundhound, Inc. System and methods for continuous audio matching
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
TWI399935B (zh) * 2009-08-18 2013-06-21 Chia Yi Hsu Portable digital radio group navigation system
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
WO2011149558A2 (en) 2010-05-28 2011-12-01 Abelow Daniel H Reality alternate
US8659397B2 (en) 2010-07-22 2014-02-25 Vocollect, Inc. Method and system for correctly identifying specific RFID tags
US9047371B2 (en) 2010-07-29 2015-06-02 Soundhound, Inc. System and method for matching a query against a broadcast stream
USD643400S1 (en) 2010-08-19 2011-08-16 Vocollect Healthcare Systems, Inc. Body-worn mobile device
USD643013S1 (en) 2010-08-20 2011-08-09 Vocollect Healthcare Systems, Inc. Body-worn mobile device
JP5771002B2 (ja) * 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
US8898065B2 (en) 2011-01-07 2014-11-25 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers
US9035163B1 (en) 2011-05-10 2015-05-19 Soundbound, Inc. System and method for targeting content based on identified audio and multimedia
US8954334B2 (en) * 2011-10-15 2015-02-10 Zanavox Voice-activated pulser
US9244924B2 (en) * 2012-04-23 2016-01-26 Sri International Classification, search, and retrieval of complex video events
KR101309794B1 (ko) * 2012-06-27 2013-09-23 삼성전자주식회사 디스플레이 장치, 디스플레이 장치의 제어 방법 및 대화형 시스템
US10957310B1 (en) 2012-07-23 2021-03-23 Soundhound, Inc. Integrated programming framework for speech and text understanding with meaning parsing
CA2923003C (en) * 2012-09-06 2021-09-07 Rosetta Stone Ltd. A method and system for reading fluency training
KR101330671B1 (ko) 2012-09-28 2013-11-15 삼성전자주식회사 전자장치, 서버 및 그 제어방법
CN104769668B (zh) 2012-10-04 2018-10-30 纽昂斯通讯公司 改进的用于asr的混合控制器
KR20140060040A (ko) * 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
US9507849B2 (en) 2013-11-28 2016-11-29 Soundhound, Inc. Method for combining a query and a communication command in a natural language computer system
US9292488B2 (en) 2014-02-01 2016-03-22 Soundhound, Inc. Method for embedding voice mail in a spoken utterance using a natural language processing computer system
US11295730B1 (en) 2014-02-27 2022-04-05 Soundhound, Inc. Using phonetic variants in a local context to improve natural language understanding
US9564123B1 (en) 2014-05-12 2017-02-07 Soundhound, Inc. Method and system for building an integrated user profile
US10971157B2 (en) 2017-01-11 2021-04-06 Nuance Communications, Inc. Methods and apparatus for hybrid speech recognition processing
JP7057647B2 (ja) * 2017-11-17 2022-04-20 キヤノン株式会社 音声制御システム、制御方法及びプログラム
US11627012B2 (en) 2018-10-09 2023-04-11 NewTekSol, LLC Home automation management system
US11594218B2 (en) 2020-09-18 2023-02-28 Servicenow, Inc. Enabling speech interactions on web-based user interfaces

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07168851A (ja) * 1993-12-16 1995-07-04 Canon Inc 画像表示方法及び装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59100659A (ja) * 1982-11-30 1984-06-09 Sharp Corp ワイヤレスフオン
JPH03203794A (ja) * 1989-12-29 1991-09-05 Pioneer Electron Corp 音声リモートコントロール装置
US5247580A (en) * 1989-12-29 1993-09-21 Pioneer Electronic Corporation Voice-operated remote control system
KR940019171A (ko) * 1993-01-04 1994-08-19 최광주 음성인식 원격제어장치
US5890122A (en) * 1993-02-08 1999-03-30 Microsoft Corporation Voice-controlled computer simulateously displaying application menu and list of available commands
JPH06274194A (ja) * 1993-03-22 1994-09-30 Hitachi Ltd 携帯型音声入力モニタ・制御装置
JPH08186654A (ja) * 1994-12-22 1996-07-16 Internatl Business Mach Corp <Ibm> 携帯端末装置
US5774628A (en) * 1995-04-10 1998-06-30 Texas Instruments Incorporated Speaker-independent dynamic vocabulary and grammar in speech recognition
US5890123A (en) * 1995-06-05 1999-03-30 Lucent Technologies, Inc. System and method for voice controlled video screen display
US5636211A (en) * 1995-08-15 1997-06-03 Motorola, Inc. Universal multimedia access device
US6075575A (en) * 1995-10-02 2000-06-13 Starsight Telecast, Inc. Remote control device and method for using television schedule information
JPH09134319A (ja) * 1995-10-03 1997-05-20 Sony Electron Inc パーソナル通信ルーティングシステムのユーザインターフェース及びルール処理
US5802526A (en) * 1995-11-15 1998-09-01 Microsoft Corporation System and method for graphically displaying and navigating through an interactive voice response menu
US5737491A (en) * 1996-06-28 1998-04-07 Eastman Kodak Company Electronic imaging system capable of image capture, local wireless transmission and voice recognition

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07168851A (ja) * 1993-12-16 1995-07-04 Canon Inc 画像表示方法及び装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
中村 敏子: "携帯端末で"使える情報"を富士通が「WildBird」サービス開始", MOBILE MEDIA MAGAZINE, vol. 第17巻, CSND200000028002, 20 August 1996 (1996-08-20), JP, pages 34 - 37, ISSN: 0000792699 *
安藤 彰男: "音声認識を用いた放送番組リクエストシステム", 情報処理学会研究報告, vol. 第95巻 第90号, CSNG200000491004, 14 September 1995 (1995-09-14), JP, pages 25 - 30, ISSN: 0000792697 *
松崎 高典: "モバイルコンピューティング環境におけるソフトウェア製品の開発", 日立評論, vol. 第78巻 第9号, CSNH199800193002, 1 September 1996 (1996-09-01), JP, pages 11 - 16, ISSN: 0000792698 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999063444A1 (fr) * 1998-06-03 1999-12-09 Sony Corporation Procede et systeme de traitement de donnees
JP2002540477A (ja) * 1999-03-26 2002-11-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クライアント−サーバ音声認識
JP2002540479A (ja) * 1999-03-26 2002-11-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クライアントサーバ音声認識
JP2004505361A (ja) * 2000-07-21 2004-02-19 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 通信システム
JP2002041277A (ja) * 2000-07-28 2002-02-08 Sharp Corp 情報処理装置およびWebブラウザ制御プログラムを記録した記録媒体
KR20010025230A (ko) * 2000-11-09 2001-04-06 차정만 음성도메인에 의한 인터넷접속 매개장치와 매개방법 및음성도메인의 데이터 베이스 생성방법

Also Published As

Publication number Publication date
EP0854417A2 (en) 1998-07-22
SG72780A1 (en) 2000-05-23
TW497044B (en) 2002-08-01
US6188985B1 (en) 2001-02-13
EP0854417A3 (en) 2005-10-05
KR19980070352A (ko) 1998-10-26

Similar Documents

Publication Publication Date Title
US6188985B1 (en) Wireless voice-activated device for control of a processor-based host system
KR101359715B1 (ko) 모바일 음성 웹 제공 방법 및 장치
US6965864B1 (en) Voice activated hypermedia systems using grammatical metadata
US8380516B2 (en) Retrieval and presentation of network service results for mobile device using a multimodal browser
KR100661687B1 (ko) 대화형 음성 응답 애플리케이션 구현 장치 및 방법, 머신 판독가능 매체 및 대화형 음성 응답 시스템
CN101621547B (zh) 从用户处接收输入或地址项目的方法和设备
TWI353585B (en) Computer-implemented method,apparatus, and compute
EP1481328B1 (en) User interface and dynamic grammar in a multi-modal synchronization architecture
CA2436940C (en) A method and system for voice activating web pages
US20060235694A1 (en) Integrating conversational speech into Web browsers
US20040025115A1 (en) Method, terminal, browser application, and mark-up language for multimodal interaction between a user and a terminal
JP2004511867A (ja) 言語に無関係な音声ベースのサーチ・システム
US6732078B1 (en) Audio control method and audio controlled device
US20020072916A1 (en) Distributed speech recognition for internet access
Hemphill et al. Speech-aware multimedia
KR100519748B1 (ko) 연속어 음성 명령을 통한 인터넷 네비게이션 시스템 및 그방법
US20020077814A1 (en) Voice recognition system method and apparatus
JP2001075968A (ja) 情報検索方法及びそれを記録した記録媒体
JP2005181358A (ja) 音声認識合成システム
WO2002099786A1 (en) Method and device for multimodal interactive browsing
KR20050040983A (ko) 음성을 이용한 웹 브라우징 시스템 및 제어방법
Gupta et al. Dawn: Dynamic aural web navigation
EP1881685B1 (en) A method and system for voice activating web pages
KR20050035784A (ko) 에이치.티.엠.엘 컨텐츠 변환을 통한 음성지원 웹브라우저 및 음성지원 방법
KR20020058386A (ko) 검색하는 웹 문서의 구조와 요소 객체의 특징을 음색으로자동 표현하는 음성 브라우저

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060203

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060508

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060511

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061128