JPH10275162A - プロセッサに基づくホスト・システムを制御する無線音声起動制御装置 - Google Patents
プロセッサに基づくホスト・システムを制御する無線音声起動制御装置Info
- Publication number
- JPH10275162A JPH10275162A JP10031975A JP3197598A JPH10275162A JP H10275162 A JPH10275162 A JP H10275162A JP 10031975 A JP10031975 A JP 10031975A JP 3197598 A JP3197598 A JP 3197598A JP H10275162 A JPH10275162 A JP H10275162A
- Authority
- JP
- Japan
- Prior art keywords
- control device
- host system
- grammar
- voice
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72445—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting Internet browser applications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4938—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Machine Translation (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
ピュータのようなホスト・システムを制御する携帯無線
音声起動制御装置を提供する。 【解決手段】 携帯無線音声起動制御装置(10)はデ
ィスプレイ(10a)、前記オーディオ入力信号から導
き出したデータを前記ホスト・システムへ無線により送
信送信機(10g)と、前記ホスト・システムからイメ
ージ・データを無線により受信する受信機(10h)と
を有し、更にプロセッサ(10e)と、音声認識を実行
するメモリ(10f)とを有してもよい。無線音声起動
制御装置(20)は、ウェブ・ブラウジング用に音声認
識とこの音声認識の結果の解釈との両方を実行するプロ
セッサ(20e)及びメモリ(20f)を有する。
Description
置に関し、特にユーザが音声コマンドを有するワールド
・ワイド・ウェブ(World Wide Web)の
ようなハイパーメディア・ネットワークをブラウズ(検
索)できるようにさせた無線音声装置に関する。
ータ・ネットワークであり、より正確にはネットワーク
のうちのワールド・ワイド・ネットワークである。これ
は情報の交換を行わせると共に、広範なサービスを提供
する。今日、インターネットはあらゆる種類の施設、ビ
ジネス、更に人々の家庭での個人にまで及ぶように成長
した。
は“Web”)はインターネット上で利用可能なサービ
スのうちの一つである。これは、「ハイパーテキスト」
として知られている技術に基づいており、ドキュメント
がその他の部分に、又は他のドキュメントに対するリン
クを有する。ハイパーテキストは、イメージ及び音を含
め、コンピュータに記憶され得るどのような情報に対す
るリンクも包含するように拡張された。例えば、ウェブ
を用いてドキュメント内から要点のワード又は語句を選
択して世界の何処かに記憶されている定義、ソース又は
関連するドキュメントを得ることができる。
ジ」であり、他のページに対してリンクを有する(通常
は)テキスト+グラフのドキュメントである。ウェブを
「ナビゲートすること」は、主に、ページからページへ
と次々に移動することである。
のソースからあらゆる種類のデータを収集して、高性能
なサーバ及び高性能なクライアント・プログラムがデー
タのフォーマットを取り扱えるようにすることにより、
両立性がないという問題をなくすことである。適正な翻
訳コードがサーバ及びクライアントに付加されれば、複
数のフォーマットをうまく処理するこのような機能は、
マルチメディア・フォーマットを含め、ウェブがあらゆ
る種類のデータを受け取ることができるようにする。ウ
ェブ・クライアントは、ウェブ・サーバ上に位置するウ
ェブ・リソースに接続するために用いられ、またこのリ
ソースを用いるためのものである。
ために、またこれを使用するために用いられるクライア
ント・ソフトウェアの1形式は、「ウェブ・ブラウザ
(web browser)」ソフトウェアと呼ばれて
いる。このソフトウェアは、ユーザのコンピュータにイ
ンストールされてグラフィック・インタフェースをさせ
てもよく、そこではマウス又は他の指示装置による選択
を容易にするためにリンクがハイライトされるか、又は
マークされる。
ルド・ワイド・ウェブに接続されたコンピュータのよう
に、プロセッサに基づくホスト・システムを制御する無
線音声起動制御装置である。コンパクトな携帯装置がマ
イクロホン、無線オーディオ入力送信機、無線データ受
信機及びディスプレイを有する。このマイクロホンはユ
ーザからのボイス入力を受信して、オーディオ入力信号
として供給する。音声送信機はオーディオ入力信号から
導き出したデータをホスト・システムに無線により送信
する。ホスト・システムは、前記オーディオ入力信号に
対して作動した後、ある種の応答を受信機に無線により
送出されたイメージ・データ形式で送出する。ディスプ
レイはイメージ・データで表したイメージを発生して表
示する。
情報用のスピーカを含むことができる。無線音声起動制
御装置は、更に、フロント・エンド・ボイス認識処理を
実行するプロセッサと、メモリとを有することもでき
る。
クセスし易く、かつ有用にすることである。会話制御は
ウェブ・インタフェースに柔軟性を加えると共に機能性
を高めかつ情報に対するアクセスをより自然なものにす
る。
ッサに基づくホスト・システムを制御する無線音声起動
制御装置に関するものである。即ち、この無線音声起動
制御装置は音声起動遠方制御装置である。この説明例に
おいて、ホスト・システムはワールド・ワイド・ウェブ
に接続されたコンピュータであり、この無線音声起動制
御装置は音声制御されたウェブ・ブラウジングに用いら
れる。しかし、同一の概念は、表示又は音声情報を提供
するプロセッサに基づくシステム、例えばテレビジョン
を制御する音声制御装置に適用可能である。
例は、この装置に埋め込まれる「知能(intelli
gence)」により異なる。本発明の目的のために、
通常のウェブ・ブラウザ・ソフトウェアが使用できるよ
うにオーディオ入力を認識するため及びオーディオ入力
を解釈するために使用されるプログラミングは、組み込
まれるプログラムの範囲が設計及びコストの問題に対応
した形式によりモジュール化される。
(以下、制御装置という)10の一実施例を示す。前述
のように、この説明のために、ホスト・システム11は
コンピュータであり、ワールド・ワイド・ウェブとデー
タ通信をしている。
イクロホン10bを有する。ディスプレイ10aはユー
ザから音声入力を受け取る。これは「ミュート(mut
e)」スイッチ10cを備えてもよく、従って制御装置
10はイメージを表示することができ、更に音声認識を
実行することなく、キー・パッド(図示なし)のような
代替的な入力装置を介して非オーディオ入力を受け取る
こともできる。マイクロホン10bはユーザの声を他の
音から区別する能力を強化するようにマイクロホン・ア
レーであってもよい。
声認識処理の全て又は一部を実行し、かつ会話データを
送信機10gを介してホスト・システム11に送出す
る。ホスト・システム11は種々の音声制御解釈処理を
実行し、更にウェブ・ブラウザも遂行する。しかし、制
御装置はその最も簡単な形式により、マイクロホン10
bからホスト・システム11へオーディオ・データを直
接送信し、ホスト・システム11が全ての処理を実行す
ることになる。
部を実行する場合には、制御装置10がプロセッサ10
eを備えている。メモリ10fはプロセッサ10eが実
行する音声認識プログラミングを記憶している。スピー
チ認識に適したプロセッサ10eの例は、信号プロセッ
サ、例えばテキサス・インスツルメンツ社により製造さ
れたものである。マイクロホン10bがマイクロホン・
アレーである場合は、プロセッサ10eがユーザの声を
目標にする計算を実行してもよい。
行するのであれば、1又はそれより多くの「フロント・
エンド」処理、例えば線形予測符号(LPC)解析又は
会話終了点指示を実行してもよい。
するのであれば、メモリ10fは(音声認識装置とし
て)これらの処理と共に、文法ファイルを記憶する。動
作において、音声認識装置はマイクロホン10bからの
オーディオ入力を受け取り、かつ適当な文法ファイルを
アクセスする。文法ファイル・ハンドラは、文法を会話
レディー形式に変換して発音文法を作成して、文法を音
声認識装置にロードさせる。
定められて記憶されても、又はダイナミックに作成され
ても、又は両形式の文法ファイルの組合わせであっても
よい。ダイナミック文法ファイルの作成例を以下に図5
と関連させて説明する。文法は文脈なし文法のバックス
・ナウア形式(Backus−Naur formof
context−free grammer)により
書き込まれたものであってもよく、かつカスタマイズさ
れてもよい。図1の実施例であって、制御装置10をウ
ェブ・ブラウジングに用いる場合に、ホスト・システム
11は現在表示されているウェブ・ページ用のHTML
(hyper markup language)を制
御装置10に送出する。メモリ10fはダイナミックに
文法を発生する文法ファイル発生器を記憶している。ウ
ェブ・ブラウジングの他の実施例では、ホスト・システ
ム11が文法をダイナミックに発生して、文法ファイル
を制御装置10にダウンロードすることができる。
この会話データは音声制御解釈処理を実行するホスト・
システム11に送信される。音声制御されたウェブ・ブ
ラウジング用の種々の音声制御解釈処理は、「文法的な
メタデータを用いた音声起動ハイパーメディア・システ
ム(Voice Activated Hyperme
dia Systems Using Grammat
ical Metamedia)」と題してテキサス・
インスツルメント社に譲渡された米国特許出願第08/
419、229号に説明されており、ここでは引用によ
って関連される。この解釈の結果として、ホスト・シス
テム11はコマンドを実行することにより、又はハイパ
ーメディア(Web)リンクを設けることにより、制御
装置10に対する音声入力に応答してもよい。
例は、テレビジョンに対するコマンドに関するものであ
り、そこではホスト・システム11がプロセッサに基づ
くテレビジョン・システムである。例えば、「今晩のテ
レビでは何が放送されますか」の音声コマンドは、テレ
ビジョン番組を表示する結果となる。ウェブ・ブラウジ
ング以外の他の音声制御解釈例は、コンピュータに基づ
く家事制御用のコマンドに関するものである。「スプリ
ンクラー予定を見せて下さい」の音声コマンドは、適当
な表示に帰結する。
た後に、無線受信機10hはホスト・システム11から
データを受け取ってディスプレイ10a上に表示する、
又はスピーカ10bにより出力する。従って、ホスト・
システム11から受け取ったデータは、画像(テキス
ト、グラフィック、イメージ及びビデオを含む)又は音
声であってもよい。
と共に音声認識を実行する無線音声起動制御装置(以
下、制御装置という。)20を示す。音声制御の解釈
は、ウェブのようなハイパーメディア・リソースをブラ
ウザするために固有のものである。ホスト・システム2
1はハイパーメディア・リソースに接続される。
同一のものを有する。しかし、そのプロセッサ20eは
メモリ20fに記憶された付加的なプログラミングを実
行する。特に、音声制御解釈処理は、会話可能コマンド
処理、会話可能ホットリスト処理、又は会話可能リンク
処理を備えるものであってもよい。これらの処理及びこ
れらに関連する文法ファイルは制御装置20上に存在す
る。
a上にコマンド・インタフェースを表示し、かつ種々の
ウェブ・ブラウジング・コマンドを受け付ける。この会
話可能コマンド処理はユーザが話すかも知れないワード
及び語句(phrase)に関連した文法ファイルを有
する。
ィスプレイ30の例を示す。会話可能コマンドは、ボタ
ン31により作動された「ヘルプ」コマンドである。応
答において、コマンド処理は音声制御のブラウジングを
どのように使用するのかを説明している「ヘルプ・ペー
ジ」を表示する。
コマンド・リストを見せて下さい」である。このコマン
ドを話すと、それぞれ会話可能コマンドを表す一組の文
法をリストにしたページが示される。例えば、ページダ
ウン・コマンド、バック・コマンド及びヘルプ・コマン
ドがある。コマンド処理がこれらコマンドのうちの一つ
の翻訳を受け取ると、適当な操作を実行する。
用な音声認識装置の特徴を示す。ユーザは、ワード「X
YZの株価はどうなっているか」と言った例である。音
声認識装置が発声を認識すると、これは時間及びメモリ
使用に対するスコア値、種々の統計とを決定する。以下
で説明するように、株価に対する要求はホットリスト項
目であってもよく、情報を配置するウェブ位置を確認す
ることなく、単純にユーザに要求を発声可能にさせる。
より作動される「私の会話可能ホットリストを見せて下
さい」の例である。「ホットリスト」は、選択されたリ
ソース・ロケータ(URL)の記憶リスト、例えば頻繁
に使用されるものである。ホットリストはブックマーク
としても知られている。URLはウェブの周知の特徴で
あり、インターネット上の任意のリソースを命名するよ
うに短くかつ首尾一貫した方法を提供する。典型的なU
RLは以下の形式:http://www.ncsa.
uiic.edu/General/NCSAHom
e.htmlを有する。URLの種々の部分は、送信プ
ロトコル、コンピュータ・アドレス、及びそのアドレス
におけるディレクトリ・パスを識別する。URLは「リ
ンク」及び「アンカ」としても知られている。
ホットリスト項目に対する文法を構築して文法をURL
に関連可能にさせる。文法を作成するために、ユーザは
BNF構文を用いた文法においてASCII文法ファイ
ル及び形式を編集することができる。例えば、天気予報
を検索する文法は、「今日の天気予報はどうなっている
か」及び「天気予報を教えて下さい」のような語句を定
義することができる。次いで、ユーザは適当なURLを
文法に関連させる。
更されてもよい。例えば、カレント・ページはホットリ
スト項目として付け加えられてもよい。語句が音声で入
力されると、「このページを私のホットリストに付け加
えて下さい」は、文法にページのタイトルを付け加える
と共に、その文法をカレントURLに関連させる。「私
の会話可能ホットリストを編集して下さい」の語句が音
声で入力されると、音声によって検索する付加的な語句
を付け加えることにより、ユーザに文法を編集できるよ
うにさせる。
置がホットリスト文法からホットリスト翻訳を認識した
ときに活性化されて、その翻訳をホットリスト処理に渡
す。ホットリストは関連するURLを参照する。これは
URLを(無線通信を介して)ホスト・コンピュータ上
に存在するブラウザにURLを渡し、従ってウェブ・ペ
ージを検索して制御装置10に送信し、ディスプレイ1
0a上に表示させることができる。
トのような文法ファイルは、常時活性化している。これ
は、ユーザにコマンド又はホットリストを任意の文脈に
リンク可能にする。会話可能リンク処理は制御装置20
のメモリ20eにも存在し得る。ウェブ・ページにおい
て選択された情報は、他のウェブ・ページに対するアク
セス用のリンクとなるものでもよい。これらのリンク
は、例えばアンダーラインされ、ハイライトされ、異な
る色付けにされ、画像の場合のように輪郭が付けられる
ことにより、指示されるか、又は他の方法により認識さ
れる。制御装置10のユーザは、リンクを選択するため
にマウス又は他の指示装置を用いる代わりに、ディスプ
レイ10a上に表示されているページからのリンクを話
すものでもよい。
リンクを示す。例えば、第2のヘッドライン41は一つ
のリンクである。
共に変形が含まれる。話者は、完全な語句を話すことに
加えて、「ニューヨーク期間におけるダイアナ」(文字
通りの変形として)「NYにおけるダイアナ」又は「ニ
ューヨークにおけるダイアナ」と言うこともできる。
ウェブ・ページからリンク/URLを得ることが必要で
ある。HTML(ハイパーテキスト・マークアップ言
語)フォーマットにおけるウェブ・ページは、任意の長
さを有するものでもよいので、認識者がサーチする候補
リンク/URL対の数は、ディスプレイ20aのカレン
ト・スクリーン上で見えるものに限定されてもよい。
「スクロール・ダウン」のようなコマンドは、候補リン
ク/URL対を更新する。スクリーン用のリンク/UR
L対が得られると、文法がカレント・スクリーン上の全
てのリンクに対して作成される。次に、リンクにおける
トークンが認識され、そのトークンに関する文法が作成
される。これらの文法は認識者の文法ファイルに付け加
えられる。正しいトークン化は、リンク・フォーマット
が広範に変わり得るので、簡単ではない。リンクには、
番号、頭字語、創作した言葉、及び新しい句読点使用が
含まれていてもよい。
ものは、リンクの長さ、同一ページにおけるリンクのあ
いまいさ、及びビット・マップされたリンクを含むグラ
フィックである。長いリンクに対して、会話可能リンク
処理は、ユーザにNワード語の任意時点でリンクにおけ
るワードを話すのを停止可能にさせる。あいまいさに対
して、この処理は、第1のURLに対するデフォールト
であっても、又はユーザに対するURLの選択を提供し
てもよい。ビット・マップされたリンクに対して、処理
はリンク情報を探すために<ALT>タグを用いる。
クに作成されので、カレント表示用の文法のみが活性で
あり、新しいカレント表示を発生すると更新される。更
に、ダイナミックな文法の作成は必要とするメモリ10
fの量も減少させる。
する適当な処理を示す。これは図1及び図2のダイナミ
ック文法発生器により実施される処理である。以上で説
明したように、ダイナミック文法ファイルはカレント・
ウェブ・ページから作成されるので、会話可能リンクを
認識することができる。以上で引用により関連させた米
国特許出願第08/419、226号は、更に、音声制
御されたホスト・システム11に印加されたこの方法、
即ち別個のリモート制御装置である制御装置10なしの
音声制御を説明している。
レイは、文法規約52に影響する。文法規約52は用語
集54及びユーザ・エージェント64に入力される。続
いて、用語集54はオンライン辞書56をフィードさ
せ、オンライン辞書56が発音モジュール58に入力す
る。発音モジュール58と共に、話者一人による連続的
な会話音声モジュール60は、ユーザ・エージェント6
4に入力する。加えて、会話モジュール66はユーザの
会話をユーザ・エージェント64に入力する。これに並
行して、ディスプレイ40からの入力を文脈モジュール
68が受け取って、ユーザ・エージェント64に入力す
る。
ammer Directed Acyclic Gr
aph:標準文法指向の非周期グラフ)は、新しい構文
及び用語にダイナミックに適応させてもよい。ディスプ
レイ40が変化する度に、ユーザ・エージェント64は
アンダーラインされた現在可視的な複数の語句(複数の
リンク)を含む文法を発生する。この文法から、ユーザ
・エージェント64は語句をトークン化して、例えば文
字の綴り及び削除または任意選択の句読を含むことがで
きる。ユーザ・エージェント64は、概要辞書とテキス
ト対音素マッピングとの組合わせを用いて、これらのト
ークンから音声発音文法(phonetic pron
unciation grammers)を作成する。
次いで、音声認識処理が作成した文法を付け加える。こ
れには、どのシンボルが出力する「ワード」を表すのか
を識別することを含め、音声認識装置用のいくつかの簡
単な簿記作業が含まれている。最後に、大域的な変化を
実施して新しくまたは変化した文法に関連させる。この
ために、文法はRGDAG関係により接続される。加え
て、各シンボルに対する最大深さが計算される。更に、
音声認識装置は出力により祖先シンボルを探してパーズ
(parse:品詞及び文法的な関係の)情報を必要と
する。その場合に、効果的なパーズ用の文法構造は同一
である。
が限定的な意味で解釈されることを意図するものではな
い。開示した実施例の種々の変形と共に、他の実施例
は、当該技術分野に習熟する者に明らかである。従っ
て、特許請求の範囲は本発明の範囲内に包含される全て
の変形を含むことを意図している。
る。
を制御する無線音声起動制御装置において、ユーザから
の音声入力を受け取ることにより、オーディオ入力信号
を供給するように動作可能であるマイクロホンと、前記
オーディオ入力信号から導き出したデータを前記ホスト
・システムに無線により送信するように動作可能である
音声送信機と、前記ホスト・システムからイメージ・デ
ータを無線により受信するように動作可能であるデータ
受信機と、前記イメージ・データにより表されたイメー
ジを発生して表示するように動作可能であるディスプレ
イとを含む無線音声起動制御装置。
イから独立してオン状態又はオフ状態に切り換え可能で
ある第1項記載の無線音声起動制御装置。
クロホン・アレーである第1項記載の無線音声起動制御
装置。
に動作可能なプロセッサと、前記音声認識処理及び文法
ファイルを記憶するメモリとを含む第1項記載の無線音
声起動制御装置。
析を含み、かつ前記送信機は前記解析の結果を送信する
ように動作可能である第4項記載の無線音声起動制御装
置。
析を含み、かつ前記送信機は前記解析の結果を送信する
ように動作可能である第4項記載の無線音声起動制御装
置。
作成され、更に前記プロセッサは前記ダイナミック文法
発生処理を実行するように動作可能である第4項記載の
無線音声起動制御装置。
ータ通信においてホスト・システムを音声制御する無線
音声起動制御装置において、ユーザからの音声入力を受
け取ることにより、オーディオ入力信号を発生するよう
に動作可能であるマイクロホンと、前記オーディオ入力
信号から導き出したデータを前記ホスト・システムに無
線により送信するように動作可能である音声送信機と、
前記ホスト・システムからイメージ・データを無線によ
り受信するように動作可能であるデータ受信機と、前記
イメージ・データにより表されすると共に、前記ホスト
・システムにより前記ハイパーメディアから検索された
イメージを発生して表示ように動作可能であるディスプ
レイとを含む無線音声起動制御装置。
に動作可能なプロセッサと、前記音声認識処理及び文法
ファイルを記憶するメモリとを含む第8項記載の無線音
声起動制御装置。
解析を含み、かつ前記送信機は前記解析の結果を送信す
るように動作可能である第9項記載の無線音声起動制御
装置。
解析を含み、かつ前記送信機は前記解析の結果を送信す
るように動作可能である第9項記載の無線音声起動制御
装置。
に作成され、更にプロセッサはダイナミックな文法発生
処理を実行するように動作可能である第9項記載の無線
音声起動制御装置。
うに動作可能なプロセッサと、前記音声制御処理を記憶
するメモリとを含む第8項記載の無線音声起動制御装
置。
が前記ホスト・システムの動作を音声により指令できる
ように、会話可能なコマンド処理を含む第13項記載の
無線音声起動制御装置。
が前記ホスト・システムにより検索されるべき前記リソ
ースのうちの特定の一つを音声により要求できるよう
に、会話可能なホットリスト処理を含む第13項記載の
無線音声起動制御装置。
プレイ上に表示されているカレント・ページ上のリンク
が前記ホスト・システムにより検索されるように、会話
可能なリンク処理を含む第13項記載の無線音声起動制
御装置。
つダイナミック文法発生処理を実行するように動作可能
なプロセッサと、前記処理を記憶するメモリとを含む第
8項記載の無線音声起動制御装置。
されたコンピュータのようなホスト・システム11を制
御する携帯無線音声起動制御装置10。前記携帯無線音
声起動制御装置10はディスプレイ10a、送信機10
g及び受信機10hを有する。前記携帯無線音声起動制
御装置10は、更に、音声認識を実行するためにプロセ
ッサ10e及びメモリ10fを有してもよい。装置20
は、音声認識とこの音声認識の結果の解釈との両方を実
行するプロセッサ20e及びメモリ20fを備えること
により、ウェブ・ブラウジング用に特に設計されてもよ
い。
社に譲渡された以下の特許出願に関連する。「会話認識
における話者独立ダイナミック用語及び文法(Spea
ker−Independent Dynamic V
ocabularly and Grammer in
Speech Recognition)」と題する
米国特許出願第08/419、226号。「文法メタデ
ータを用いる音声作動ハイパーメディア・システム(V
oiceActivated Hypermedia
System Using Grammatical
Metadata)」と題する米国特許出願第08/4
19、229号。
を示す図。
ように特に構成された無線音声起動制御装置の他の実施
例を示す図。
一例を示す図。
を示す図。
イナミックに作成する処理を示す図。
Claims (1)
- 【請求項1】 プロセスに基づくホスト・システムを制
御する無線音声起動制御装置において、 ユーザからの音声入力を受け取ることにより、オーディ
オ入力信号を供給するように動作可能なマイクロホン
と、 前記オーディオ入力信号から導き出したデータを前記ホ
スト・システムに無線により送信するように動作可能な
音声送信機と、 前記ホスト・システムからイメージ・データを無線によ
り受信するように動作可能なデータ受信機と、 前記イメージ・データにより表されたイメージを発生し
て表示するように動作可能なディスプレイとを備えた無
線音声起動制御装置。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US943795 | 1992-09-11 | ||
| US3468597P | 1997-01-06 | 1997-01-06 | |
| US08/943,795 US6188985B1 (en) | 1997-01-06 | 1997-10-03 | Wireless voice-activated device for control of a processor-based host system |
| US034685 | 1997-10-03 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH10275162A true JPH10275162A (ja) | 1998-10-13 |
Family
ID=26711249
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10031975A Pending JPH10275162A (ja) | 1997-01-06 | 1998-01-06 | プロセッサに基づくホスト・システムを制御する無線音声起動制御装置 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US6188985B1 (ja) |
| EP (1) | EP0854417A3 (ja) |
| JP (1) | JPH10275162A (ja) |
| KR (1) | KR19980070352A (ja) |
| SG (1) | SG72780A1 (ja) |
| TW (1) | TW497044B (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1999063444A1 (fr) * | 1998-06-03 | 1999-12-09 | Sony Corporation | Procede et systeme de traitement de donnees |
| KR20010025230A (ko) * | 2000-11-09 | 2001-04-06 | 차정만 | 음성도메인에 의한 인터넷접속 매개장치와 매개방법 및음성도메인의 데이터 베이스 생성방법 |
| JP2002041277A (ja) * | 2000-07-28 | 2002-02-08 | Sharp Corp | 情報処理装置およびWebブラウザ制御プログラムを記録した記録媒体 |
| JP2002540477A (ja) * | 1999-03-26 | 2002-11-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | クライアント−サーバ音声認識 |
| JP2002540479A (ja) * | 1999-03-26 | 2002-11-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | クライアントサーバ音声認識 |
| JP2004505361A (ja) * | 2000-07-21 | 2004-02-19 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 通信システム |
Families Citing this family (138)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6965864B1 (en) * | 1995-04-10 | 2005-11-15 | Texas Instruments Incorporated | Voice activated hypermedia systems using grammatical metadata |
| US7937260B1 (en) | 1998-06-15 | 2011-05-03 | At&T Intellectual Property Ii, L.P. | Concise dynamic grammars using N-best selection |
| US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
| DE69814181T2 (de) | 1998-09-22 | 2004-03-04 | Nokia Corp. | Verfahren und vorrichtung zur konfiguration eines spracherkennungssystems |
| DE69909806T2 (de) * | 1998-09-30 | 2004-01-22 | Lernout & Hauspie Speech Products N.V. | Graphische Benutzerschnittstelle zur Navigation in Grammatiken eines Spracherkennungssystems |
| US7003463B1 (en) | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
| US6587822B2 (en) * | 1998-10-06 | 2003-07-01 | Lucent Technologies Inc. | Web-based platform for interactive voice response (IVR) |
| WO2000041066A1 (en) * | 1999-01-07 | 2000-07-13 | Inviso | Transcription method using virtual image display |
| AU2388000A (en) * | 1999-01-07 | 2000-07-24 | Inviso | Transcription device with virtual image display |
| US6606280B1 (en) * | 1999-02-22 | 2003-08-12 | Hewlett-Packard Development Company | Voice-operated remote control |
| US6349283B1 (en) * | 1999-03-05 | 2002-02-19 | Glenn Sanders | Remote control and processing of wireless digital receiver |
| US7283964B1 (en) | 1999-05-21 | 2007-10-16 | Winbond Electronics Corporation | Method and apparatus for voice controlled devices with improved phrase storage, use, conversion, transfer, and recognition |
| US6584439B1 (en) | 1999-05-21 | 2003-06-24 | Winbond Electronics Corporation | Method and apparatus for controlling voice controlled devices |
| US6543052B1 (en) * | 1999-07-09 | 2003-04-01 | Fujitsu Limited | Internet shopping system utilizing set top box and voice recognition |
| DE19938535A1 (de) * | 1999-08-13 | 2001-02-15 | Christoph Bueltemann | Vorrichtung zur Umwandlung von Sprachkommandos und/oder Sprachtexte in Tastatur- und/oder Mausbewegungen und/oder Texte |
| DE19943875A1 (de) * | 1999-09-14 | 2001-03-15 | Thomson Brandt Gmbh | System zur Sprachsteuerung mit einem Mikrofonarray |
| US7194752B1 (en) | 1999-10-19 | 2007-03-20 | Iceberg Industries, Llc | Method and apparatus for automatically recognizing input audio and/or video streams |
| US7174293B2 (en) * | 1999-09-21 | 2007-02-06 | Iceberg Industries Llc | Audio identification system and method |
| US6526381B1 (en) * | 1999-09-30 | 2003-02-25 | Intel Corporation | Remote control with speech recognition |
| US7330815B1 (en) * | 1999-10-04 | 2008-02-12 | Globalenglish Corporation | Method and system for network-based speech recognition |
| US7219123B1 (en) * | 1999-10-08 | 2007-05-15 | At Road, Inc. | Portable browser device with adaptive personalization capability |
| KR100812109B1 (ko) * | 1999-10-19 | 2008-03-12 | 소니 일렉트로닉스 인코포레이티드 | 자연어 인터페이스 제어 시스템 |
| EP2276020A1 (en) * | 1999-11-09 | 2011-01-19 | Nuance Communications Austria GmbH | Speech recognition method for activating a hyperlink of an internet page |
| US9076448B2 (en) * | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
| US20030182113A1 (en) * | 1999-11-22 | 2003-09-25 | Xuedong Huang | Distributed speech recognition for mobile communication devices |
| US6978475B1 (en) | 1999-11-24 | 2005-12-20 | Ecable, Llc | Method and apparatus for internet TV |
| US6424945B1 (en) * | 1999-12-15 | 2002-07-23 | Nokia Corporation | Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection |
| US6397186B1 (en) * | 1999-12-22 | 2002-05-28 | Ambush Interactive, Inc. | Hands-free, voice-operated remote control transmitter |
| US8578439B1 (en) * | 2000-01-28 | 2013-11-05 | Koninklijke Philips N.V. | Method and apparatus for presentation of intelligent, adaptive alarms, icons and other information |
| WO2001059759A1 (en) * | 2000-02-10 | 2001-08-16 | Randolphrand.Com Llp | Recorder adapted to interface with internet browser |
| US20020055844A1 (en) * | 2000-02-25 | 2002-05-09 | L'esperance Lauren | Speech user interface for portable personal devices |
| GB2362017A (en) * | 2000-03-29 | 2001-11-07 | John Pepin | Network access |
| US6662163B1 (en) * | 2000-03-30 | 2003-12-09 | Voxware, Inc. | System and method for programming portable devices from a remote computer system |
| US7096185B2 (en) | 2000-03-31 | 2006-08-22 | United Video Properties, Inc. | User speech interfaces for interactive media guidance applications |
| FR2810125B1 (fr) * | 2000-06-08 | 2004-04-30 | Interactive Speech Technologie | Systeme de commande vocale d'une page stockee sur un serveur et telechargeable en vue de sa visualisation sur un dispositif client |
| US8200485B1 (en) | 2000-08-29 | 2012-06-12 | A9.Com, Inc. | Voice interface and methods for improving recognition accuracy of voice search queries |
| US6397388B1 (en) * | 2000-09-29 | 2002-05-28 | Digeo, Inc. | Systems and devices for audio capture and communication during television broadcasts |
| US6529233B1 (en) | 2000-09-29 | 2003-03-04 | Digeo, Inc. | Systems and methods for remote video and audio capture and communication |
| US6944880B1 (en) | 2000-09-29 | 2005-09-13 | Digeo, Inc. | Methods for audio capture and communication during television broadcasts |
| US20020054206A1 (en) * | 2000-11-06 | 2002-05-09 | Allen Paul G. | Systems and devices for audio and video capture and communication during television broadcasts |
| WO2002039425A1 (fr) * | 2000-11-10 | 2002-05-16 | Cai Co., Ltd. | Systeme et procede de conversation en mode vocal faisant appel a un telephone portable, et centre en mode vocal |
| US6629077B1 (en) * | 2000-11-22 | 2003-09-30 | Universal Electronics Inc. | Universal remote control adapted to receive voice input |
| DE60133529T2 (de) * | 2000-11-23 | 2009-06-10 | International Business Machines Corp. | Sprachnavigation in Webanwendungen |
| US6973429B2 (en) * | 2000-12-04 | 2005-12-06 | A9.Com, Inc. | Grammar generation for voice-based searches |
| JP4240807B2 (ja) * | 2000-12-25 | 2009-03-18 | 日本電気株式会社 | 移動通信端末装置、音声認識方法、およびそのプログラムを記録した記録媒体 |
| US20040244056A1 (en) * | 2001-02-21 | 2004-12-02 | Lorenz Kim E. | System and method for providing direct, context-sensitive customer support in an interactive television system |
| US20050039214A1 (en) * | 2001-02-21 | 2005-02-17 | Lorenz Kim E. | System and method for providing direct, context-sensitive customer support in an interactive television system |
| US6658414B2 (en) * | 2001-03-06 | 2003-12-02 | Topic Radio, Inc. | Methods, systems, and computer program products for generating and providing access to end-user-definable voice portals |
| US20060265397A1 (en) * | 2001-03-06 | 2006-11-23 | Knowledge Vector, Inc. | Methods, systems, and computer program products for extensible, profile-and context-based information correlation, routing and distribution |
| US20020138269A1 (en) * | 2001-03-20 | 2002-09-26 | Philley Charles F. | Voice recognition maintenance inspection program |
| US7039590B2 (en) * | 2001-03-30 | 2006-05-02 | Sun Microsystems, Inc. | General remote using spoken commands |
| US20020188447A1 (en) * | 2001-04-10 | 2002-12-12 | Coon Bradley S. | Generation of grammars from dynamic data structures |
| US8108509B2 (en) * | 2001-04-30 | 2012-01-31 | Sony Computer Entertainment America Llc | Altering network transmitted content data based upon user specified characteristics |
| US7506022B2 (en) * | 2001-05-04 | 2009-03-17 | Microsoft.Corporation | Web enabled recognition architecture |
| US7409349B2 (en) | 2001-05-04 | 2008-08-05 | Microsoft Corporation | Servers for web enabled speech recognition |
| US7610547B2 (en) * | 2001-05-04 | 2009-10-27 | Microsoft Corporation | Markup language extensions for web enabled recognition |
| US7366712B2 (en) * | 2001-05-31 | 2008-04-29 | Intel Corporation | Information retrieval center gateway |
| US7366673B2 (en) * | 2001-06-15 | 2008-04-29 | International Business Machines Corporation | Selective enablement of speech recognition grammars |
| US20030046710A1 (en) * | 2001-09-05 | 2003-03-06 | Moore John F. | Multi-media communication system for the disabled and others |
| US7711570B2 (en) | 2001-10-21 | 2010-05-04 | Microsoft Corporation | Application abstraction with dialog purpose |
| US8229753B2 (en) * | 2001-10-21 | 2012-07-24 | Microsoft Corporation | Web server controls for web enabled recognition and/or audible prompting |
| US20030078775A1 (en) * | 2001-10-22 | 2003-04-24 | Scott Plude | System for wireless delivery of content and applications |
| US7013275B2 (en) * | 2001-12-28 | 2006-03-14 | Sri International | Method and apparatus for providing a dynamic speech-driven control and remote service access system |
| US7203644B2 (en) * | 2001-12-31 | 2007-04-10 | Intel Corporation | Automating tuning of speech recognition systems |
| US20030139929A1 (en) * | 2002-01-24 | 2003-07-24 | Liang He | Data transmission system and method for DSR application over GPRS |
| US7062444B2 (en) * | 2002-01-24 | 2006-06-13 | Intel Corporation | Architecture for DSR client and server development platform |
| US20030144846A1 (en) * | 2002-01-31 | 2003-07-31 | Denenberg Lawrence A. | Method and system for modifying the behavior of an application based upon the application's grammar |
| US7712020B2 (en) * | 2002-03-22 | 2010-05-04 | Khan Emdadur R | Transmitting secondary portions of a webpage as a voice response signal in response to a lack of response by a user |
| US7873900B2 (en) * | 2002-03-22 | 2011-01-18 | Inet Spch Property Hldg., Limited Liability Company | Ordering internet voice content according to content density and semantic matching |
| US7016849B2 (en) * | 2002-03-25 | 2006-03-21 | Sri International | Method and apparatus for providing speech-driven routing between spoken language applications |
| US6910911B2 (en) | 2002-06-27 | 2005-06-28 | Vocollect, Inc. | Break-away electrical connector |
| US7421389B2 (en) * | 2002-11-13 | 2008-09-02 | At&T Knowledge Ventures, L.P. | System and method for remote speech recognition |
| WO2004053609A1 (en) * | 2002-12-12 | 2004-06-24 | Abb Research Ltd | A control system controlling a plurality of real world objects, and a method for hanling messages from a mobile user connected to the control system |
| US9369775B2 (en) * | 2003-01-31 | 2016-06-14 | At&T Intellectual Property I, L.P. | Methods and systems for delivering signals from cable networks to telecommunications networks |
| US7729913B1 (en) | 2003-03-18 | 2010-06-01 | A9.Com, Inc. | Generation and selection of voice recognition grammars for conducting database searches |
| JP2004302300A (ja) * | 2003-03-31 | 2004-10-28 | Canon Inc | 情報処理方法 |
| DE60325901D1 (de) * | 2003-04-07 | 2009-03-05 | Nokia Corp | Prachgesteuerter eingabe für eine elektronische vorrichtung mit einer benutzerschnittstelle |
| US7275032B2 (en) * | 2003-04-25 | 2007-09-25 | Bvoice Corporation | Telephone call handling center where operators utilize synthesized voices generated or modified to exhibit or omit prescribed speech characteristics |
| US7260535B2 (en) * | 2003-04-28 | 2007-08-21 | Microsoft Corporation | Web server controls for web enabled recognition and/or audible prompting for call controls |
| US20040230637A1 (en) * | 2003-04-29 | 2004-11-18 | Microsoft Corporation | Application controls for speech enabled recognition |
| US20050027539A1 (en) * | 2003-07-30 | 2005-02-03 | Weber Dean C. | Media center controller system and method |
| US8311835B2 (en) * | 2003-08-29 | 2012-11-13 | Microsoft Corporation | Assisted multi-modal dialogue |
| US8160883B2 (en) * | 2004-01-10 | 2012-04-17 | Microsoft Corporation | Focus tracking in dialogs |
| US7552055B2 (en) | 2004-01-10 | 2009-06-23 | Microsoft Corporation | Dialog component re-use in recognition systems |
| US7739117B2 (en) * | 2004-09-20 | 2010-06-15 | International Business Machines Corporation | Method and system for voice-enabled autofill |
| TWI287787B (en) * | 2004-12-14 | 2007-10-01 | Delta Electronics Inc | A remote control device and method with speech control |
| US8873768B2 (en) * | 2004-12-23 | 2014-10-28 | Motorola Mobility Llc | Method and apparatus for audio signal enhancement |
| CN101164102B (zh) * | 2005-02-03 | 2012-06-20 | 语音信号科技公司 | 自动扩展移动通信设备的话音词汇的方法和装置 |
| US20060227946A1 (en) * | 2005-03-31 | 2006-10-12 | Xerox Corporation | Voice activated printer |
| US7548859B2 (en) * | 2005-08-03 | 2009-06-16 | Motorola, Inc. | Method and system for assisting users in interacting with multi-modal dialog systems |
| US9152982B2 (en) | 2005-08-19 | 2015-10-06 | Nuance Communications, Inc. | Method of compensating a provider for advertisements displayed on a mobile phone |
| US8073700B2 (en) | 2005-09-12 | 2011-12-06 | Nuance Communications, Inc. | Retrieval and presentation of network service results for mobile device using a multimodal browser |
| US7672852B2 (en) * | 2005-09-29 | 2010-03-02 | Microsoft Corporation | Localization of prompts |
| US7477909B2 (en) | 2005-10-31 | 2009-01-13 | Nuance Communications, Inc. | System and method for conducting a search using a wireless mobile device |
| USD549694S1 (en) | 2005-11-15 | 2007-08-28 | Vocollect, Inc. | Headset |
| USD552595S1 (en) | 2005-11-16 | 2007-10-09 | Vocollect, Inc. | Control panel for a headset |
| US20070266162A1 (en) * | 2005-12-07 | 2007-11-15 | Microsoft Corporation | Session initiation protocol redirection for process recycling |
| US20070136752A1 (en) * | 2005-12-12 | 2007-06-14 | John Sanders | Personalized electronic programming guide |
| US8417185B2 (en) | 2005-12-16 | 2013-04-09 | Vocollect, Inc. | Wireless headset and method for robust voice data communication |
| US20070156682A1 (en) * | 2005-12-28 | 2007-07-05 | Microsoft Corporation | Personalized user specific files for object recognition |
| US7693267B2 (en) * | 2005-12-30 | 2010-04-06 | Microsoft Corporation | Personalized user specific grammars |
| US7773767B2 (en) | 2006-02-06 | 2010-08-10 | Vocollect, Inc. | Headset terminal with rear stability strap |
| US7885419B2 (en) | 2006-02-06 | 2011-02-08 | Vocollect, Inc. | Headset terminal with speech functionality |
| US20080086311A1 (en) * | 2006-04-11 | 2008-04-10 | Conwell William Y | Speech Recognition, and Related Systems |
| US8843376B2 (en) | 2007-03-13 | 2014-09-23 | Nuance Communications, Inc. | Speech-enabled web content searching using a multimodal browser |
| WO2009048984A1 (en) * | 2007-10-08 | 2009-04-16 | The Regents Of The University Of California | Voice-controlled clinical information dashboard |
| USD626949S1 (en) | 2008-02-20 | 2010-11-09 | Vocollect Healthcare Systems, Inc. | Body-worn mobile device |
| USD605629S1 (en) | 2008-09-29 | 2009-12-08 | Vocollect, Inc. | Headset |
| US9497322B2 (en) * | 2008-10-16 | 2016-11-15 | Troy Barnes | Remote control of a web browser |
| US8386261B2 (en) | 2008-11-14 | 2013-02-26 | Vocollect Healthcare Systems, Inc. | Training/coaching system for a voice-enabled work environment |
| US9390167B2 (en) | 2010-07-29 | 2016-07-12 | Soundhound, Inc. | System and methods for continuous audio matching |
| US8160287B2 (en) | 2009-05-22 | 2012-04-17 | Vocollect, Inc. | Headset with adjustable headband |
| TWI399935B (zh) * | 2009-08-18 | 2013-06-21 | Chia Yi Hsu | Portable digital radio group navigation system |
| US8438659B2 (en) | 2009-11-05 | 2013-05-07 | Vocollect, Inc. | Portable computing device and headset interface |
| WO2011149558A2 (en) | 2010-05-28 | 2011-12-01 | Abelow Daniel H | Reality alternate |
| US8659397B2 (en) | 2010-07-22 | 2014-02-25 | Vocollect, Inc. | Method and system for correctly identifying specific RFID tags |
| US9047371B2 (en) | 2010-07-29 | 2015-06-02 | Soundhound, Inc. | System and method for matching a query against a broadcast stream |
| USD643400S1 (en) | 2010-08-19 | 2011-08-16 | Vocollect Healthcare Systems, Inc. | Body-worn mobile device |
| USD643013S1 (en) | 2010-08-20 | 2011-08-09 | Vocollect Healthcare Systems, Inc. | Body-worn mobile device |
| JP5771002B2 (ja) * | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
| US8898065B2 (en) | 2011-01-07 | 2014-11-25 | Nuance Communications, Inc. | Configurable speech recognition system using multiple recognizers |
| US9035163B1 (en) | 2011-05-10 | 2015-05-19 | Soundbound, Inc. | System and method for targeting content based on identified audio and multimedia |
| US8954334B2 (en) * | 2011-10-15 | 2015-02-10 | Zanavox | Voice-activated pulser |
| US9244924B2 (en) * | 2012-04-23 | 2016-01-26 | Sri International | Classification, search, and retrieval of complex video events |
| KR101309794B1 (ko) * | 2012-06-27 | 2013-09-23 | 삼성전자주식회사 | 디스플레이 장치, 디스플레이 장치의 제어 방법 및 대화형 시스템 |
| US10957310B1 (en) | 2012-07-23 | 2021-03-23 | Soundhound, Inc. | Integrated programming framework for speech and text understanding with meaning parsing |
| CA2923003C (en) * | 2012-09-06 | 2021-09-07 | Rosetta Stone Ltd. | A method and system for reading fluency training |
| KR101330671B1 (ko) | 2012-09-28 | 2013-11-15 | 삼성전자주식회사 | 전자장치, 서버 및 그 제어방법 |
| CN104769668B (zh) | 2012-10-04 | 2018-10-30 | 纽昂斯通讯公司 | 改进的用于asr的混合控制器 |
| KR20140060040A (ko) * | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
| US9507849B2 (en) | 2013-11-28 | 2016-11-29 | Soundhound, Inc. | Method for combining a query and a communication command in a natural language computer system |
| US9292488B2 (en) | 2014-02-01 | 2016-03-22 | Soundhound, Inc. | Method for embedding voice mail in a spoken utterance using a natural language processing computer system |
| US11295730B1 (en) | 2014-02-27 | 2022-04-05 | Soundhound, Inc. | Using phonetic variants in a local context to improve natural language understanding |
| US9564123B1 (en) | 2014-05-12 | 2017-02-07 | Soundhound, Inc. | Method and system for building an integrated user profile |
| US10971157B2 (en) | 2017-01-11 | 2021-04-06 | Nuance Communications, Inc. | Methods and apparatus for hybrid speech recognition processing |
| JP7057647B2 (ja) * | 2017-11-17 | 2022-04-20 | キヤノン株式会社 | 音声制御システム、制御方法及びプログラム |
| US11627012B2 (en) | 2018-10-09 | 2023-04-11 | NewTekSol, LLC | Home automation management system |
| US11594218B2 (en) | 2020-09-18 | 2023-02-28 | Servicenow, Inc. | Enabling speech interactions on web-based user interfaces |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07168851A (ja) * | 1993-12-16 | 1995-07-04 | Canon Inc | 画像表示方法及び装置 |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS59100659A (ja) * | 1982-11-30 | 1984-06-09 | Sharp Corp | ワイヤレスフオン |
| JPH03203794A (ja) * | 1989-12-29 | 1991-09-05 | Pioneer Electron Corp | 音声リモートコントロール装置 |
| US5247580A (en) * | 1989-12-29 | 1993-09-21 | Pioneer Electronic Corporation | Voice-operated remote control system |
| KR940019171A (ko) * | 1993-01-04 | 1994-08-19 | 최광주 | 음성인식 원격제어장치 |
| US5890122A (en) * | 1993-02-08 | 1999-03-30 | Microsoft Corporation | Voice-controlled computer simulateously displaying application menu and list of available commands |
| JPH06274194A (ja) * | 1993-03-22 | 1994-09-30 | Hitachi Ltd | 携帯型音声入力モニタ・制御装置 |
| JPH08186654A (ja) * | 1994-12-22 | 1996-07-16 | Internatl Business Mach Corp <Ibm> | 携帯端末装置 |
| US5774628A (en) * | 1995-04-10 | 1998-06-30 | Texas Instruments Incorporated | Speaker-independent dynamic vocabulary and grammar in speech recognition |
| US5890123A (en) * | 1995-06-05 | 1999-03-30 | Lucent Technologies, Inc. | System and method for voice controlled video screen display |
| US5636211A (en) * | 1995-08-15 | 1997-06-03 | Motorola, Inc. | Universal multimedia access device |
| US6075575A (en) * | 1995-10-02 | 2000-06-13 | Starsight Telecast, Inc. | Remote control device and method for using television schedule information |
| JPH09134319A (ja) * | 1995-10-03 | 1997-05-20 | Sony Electron Inc | パーソナル通信ルーティングシステムのユーザインターフェース及びルール処理 |
| US5802526A (en) * | 1995-11-15 | 1998-09-01 | Microsoft Corporation | System and method for graphically displaying and navigating through an interactive voice response menu |
| US5737491A (en) * | 1996-06-28 | 1998-04-07 | Eastman Kodak Company | Electronic imaging system capable of image capture, local wireless transmission and voice recognition |
-
1997
- 1997-10-03 US US08/943,795 patent/US6188985B1/en not_active Expired - Lifetime
-
1998
- 1998-01-05 SG SG1998000027A patent/SG72780A1/en unknown
- 1998-01-06 JP JP10031975A patent/JPH10275162A/ja active Pending
- 1998-01-06 KR KR1019980000108A patent/KR19980070352A/ko not_active Ceased
- 1998-01-06 EP EP98300092A patent/EP0854417A3/en not_active Withdrawn
- 1998-02-13 TW TW087100101A patent/TW497044B/zh not_active IP Right Cessation
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07168851A (ja) * | 1993-12-16 | 1995-07-04 | Canon Inc | 画像表示方法及び装置 |
Non-Patent Citations (3)
| Title |
|---|
| 中村 敏子: "携帯端末で"使える情報"を富士通が「WildBird」サービス開始", MOBILE MEDIA MAGAZINE, vol. 第17巻, CSND200000028002, 20 August 1996 (1996-08-20), JP, pages 34 - 37, ISSN: 0000792699 * |
| 安藤 彰男: "音声認識を用いた放送番組リクエストシステム", 情報処理学会研究報告, vol. 第95巻 第90号, CSNG200000491004, 14 September 1995 (1995-09-14), JP, pages 25 - 30, ISSN: 0000792697 * |
| 松崎 高典: "モバイルコンピューティング環境におけるソフトウェア製品の開発", 日立評論, vol. 第78巻 第9号, CSNH199800193002, 1 September 1996 (1996-09-01), JP, pages 11 - 16, ISSN: 0000792698 * |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1999063444A1 (fr) * | 1998-06-03 | 1999-12-09 | Sony Corporation | Procede et systeme de traitement de donnees |
| JP2002540477A (ja) * | 1999-03-26 | 2002-11-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | クライアント−サーバ音声認識 |
| JP2002540479A (ja) * | 1999-03-26 | 2002-11-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | クライアントサーバ音声認識 |
| JP2004505361A (ja) * | 2000-07-21 | 2004-02-19 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 通信システム |
| JP2002041277A (ja) * | 2000-07-28 | 2002-02-08 | Sharp Corp | 情報処理装置およびWebブラウザ制御プログラムを記録した記録媒体 |
| KR20010025230A (ko) * | 2000-11-09 | 2001-04-06 | 차정만 | 음성도메인에 의한 인터넷접속 매개장치와 매개방법 및음성도메인의 데이터 베이스 생성방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP0854417A2 (en) | 1998-07-22 |
| SG72780A1 (en) | 2000-05-23 |
| TW497044B (en) | 2002-08-01 |
| US6188985B1 (en) | 2001-02-13 |
| EP0854417A3 (en) | 2005-10-05 |
| KR19980070352A (ko) | 1998-10-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6188985B1 (en) | Wireless voice-activated device for control of a processor-based host system | |
| KR101359715B1 (ko) | 모바일 음성 웹 제공 방법 및 장치 | |
| US6965864B1 (en) | Voice activated hypermedia systems using grammatical metadata | |
| US8380516B2 (en) | Retrieval and presentation of network service results for mobile device using a multimodal browser | |
| KR100661687B1 (ko) | 대화형 음성 응답 애플리케이션 구현 장치 및 방법, 머신 판독가능 매체 및 대화형 음성 응답 시스템 | |
| CN101621547B (zh) | 从用户处接收输入或地址项目的方法和设备 | |
| TWI353585B (en) | Computer-implemented method,apparatus, and compute | |
| EP1481328B1 (en) | User interface and dynamic grammar in a multi-modal synchronization architecture | |
| CA2436940C (en) | A method and system for voice activating web pages | |
| US20060235694A1 (en) | Integrating conversational speech into Web browsers | |
| US20040025115A1 (en) | Method, terminal, browser application, and mark-up language for multimodal interaction between a user and a terminal | |
| JP2004511867A (ja) | 言語に無関係な音声ベースのサーチ・システム | |
| US6732078B1 (en) | Audio control method and audio controlled device | |
| US20020072916A1 (en) | Distributed speech recognition for internet access | |
| Hemphill et al. | Speech-aware multimedia | |
| KR100519748B1 (ko) | 연속어 음성 명령을 통한 인터넷 네비게이션 시스템 및 그방법 | |
| US20020077814A1 (en) | Voice recognition system method and apparatus | |
| JP2001075968A (ja) | 情報検索方法及びそれを記録した記録媒体 | |
| JP2005181358A (ja) | 音声認識合成システム | |
| WO2002099786A1 (en) | Method and device for multimodal interactive browsing | |
| KR20050040983A (ko) | 음성을 이용한 웹 브라우징 시스템 및 제어방법 | |
| Gupta et al. | Dawn: Dynamic aural web navigation | |
| EP1881685B1 (en) | A method and system for voice activating web pages | |
| KR20050035784A (ko) | 에이치.티.엠.엘 컨텐츠 변환을 통한 음성지원 웹브라우저 및 음성지원 방법 | |
| KR20020058386A (ko) | 검색하는 웹 문서의 구조와 요소 객체의 특징을 음색으로자동 표현하는 음성 브라우저 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040730 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051004 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051228 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060203 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060508 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20060511 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061128 |