JPH0823383A - 通信システム - Google Patents

通信システム

Info

Publication number
JPH0823383A
JPH0823383A JP7051195A JP5119595A JPH0823383A JP H0823383 A JPH0823383 A JP H0823383A JP 7051195 A JP7051195 A JP 7051195A JP 5119595 A JP5119595 A JP 5119595A JP H0823383 A JPH0823383 A JP H0823383A
Authority
JP
Japan
Prior art keywords
handset
input
signal
voice
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7051195A
Other languages
English (en)
Inventor
Iain Charles Moore
チャールズ ムーア イアイン
Christopher William H Ellis
ウィリアム ヘンダーソン エリス クリストファー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cable and Wireless PLC
Original Assignee
Cable and Wireless PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB9404620A external-priority patent/GB9404620D0/en
Priority claimed from GBGB9425836.5A external-priority patent/GB9425836D0/en
Application filed by Cable and Wireless PLC filed Critical Cable and Wireless PLC
Publication of JPH0823383A publication Critical patent/JPH0823383A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Exchange Systems With Centralized Control (AREA)
  • Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)

Abstract

(57)【要約】 【目的】 無線電話媒体(3)を介して電話網処理シス
テム(3,4)と通信する電話送受器(1)を有する通
信システムである。 【構成】 送受器(1)はユーザ入力を受信する入力装
置(10,8,11−13)と、音声伝送信号を生成す
るオンボードプロセッサ(7)と、それの伝送用アンテ
ナ(9)と、第1処理ステップを実行する第1プロセッ
サとを備え、又電話網処理システム(3,4)は音声伝
送信号用受信器と、第3者(29,30)に送信する手
段と、データ再生用リモートプロセッサ(35,36,
51)を備え、第2処理ステップを実行する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は通信システムに関する。
【0002】
【従来の技術】文書処理とスプレッドシートのような日
記とアドレス・ブックとコンピュータ・アプリケーショ
ンを含めた多種多様なアプリケーションを提供するPe
rsonal Digital Assistants
またはPDAsのようなシステムは周知のことである。
PDAsは優れた“縮小されたコンピュータ”である。
すなわち、それらは、小型のコンピュータを用いて手持
ち式の装置のデスクトップPCの機能を提供することを
意図している。最近、移動電話またはファクス機能ある
いはその両方を加えて、通信の特徴を通常のPDAに含
める試みも行われている。
【0003】
【発明が解決しようとする課題】しかし、通常のPDA
は全てのシステムとアプリケーション・ソフトウェア/
ハードウェア・オンボードを含んでいるので、装置の範
囲は、サイズと処理機能と電源装置の制約のために非常
に制限される。
【0004】
【課題を解決するための手段】本発明の第1の見解に従
って、我々は、無線電話媒体を介して電話網処理システ
ムと通信するように適応される少なくとも1つの移動式
で手持ち式の電話送受器を搭載する通信システムであっ
て、送受器は、入力をユーザから受信し且つ信号を其れ
に基づいて生成する手段と、第3者との電話の会話の一
部として音声伝送信号を生成するように音声入力を適応
する手段と、音声伝送信号を無線電話媒体を介して伝送
する手段を搭載し、電話網処理システムは音声伝送信号
を受信する手段と音声信号を第3者に送信する手段を搭
載し、送受器は、第1処理ステップを選択された入力信
号で実行し且つ遠方の第2処理ステップを実行するため
に必要な予め設定された情報を確保するデータを其れに
基づいて生成するように適応される第1処理手段と、伝
送信号を生成するために通常の無線電話プロトコルに従
ってデータを適応する手段と、伝送信号を無線電話媒体
を介して電話網処理システムに伝送する手段を更に搭載
し、システムは、データを再生するために電話網処理シ
ステムから伝送信号を受信して処理する手段と、送受器
から離れて位置し且つデータの第2処理ステップを実行
し且つ出力を其れに基づいて生成するように適応される
第2処理手段を更に搭載していることを特徴にする、前
述の通信システムを提供する。
【0005】本発明に従うシステムは、リモート・プロ
セッサ(一般的に固定されている)がサイズまたは電力
消費の要求に依って制限されないので、無限の処理能力
を移動式送受器に与える可能性がある手段を提供する。
本発明は、付随する無線電話網環境に使用する無線電話
装置(第3者との通常の電話の会話の一部として音声入
力に適応する手段の通常の“電話”の特徴を備えて)、
多種多様な代替応用事例に使用できる送受器とリモート
・プロセッサの間に配布される更なる処理機能の更なる
特徴も備えて一般的に含んでいる。これは、無線電話媒
体上に於ける効果的な人とコンピュータとの相互作用
を、エラーのない伝送を無線電話網上で許容可能なレベ
ルで入力信号を処理しながら、例えば圧縮しながら、遠
方の第2処理ステップを中心プロセッサまたは遠方で実
行するアプリケーションで実行するために要求される主
な情報も確保する、第1処理ステップを実行する送受器
の手段を与えることに依って可能にする。一般的に、電
話網処理システムはGSM(General Stan
dard Mobile)を活用する広域セルラー・ネ
ットワークを搭載している(9.6KBpsのデータ伝送に
付随する帯域幅を備えている)。代わりに、それはDC
S1800またはDECT(Digital Euro
pean Cordless Telephony)を
搭載できる。
【0006】電話網処理システムは、リアルタイムの通
信を送受器と第3者との間に(電話の会話のケースで)
且つ第1と第2の処理手段の間に(データ伝送のケース
で)与える一般的に回路切替システムである。これは、
データ伝送のためにだけ使用できる“パケット切替”ま
たは“メッセージ切替”通信環境と対照的である。一般
的に、伝送のために出てゆく音声入力を且つ音響出力の
ために入ってくる音声信号を処理する手段は、モデムを
搭載し、コードもデジタル伝送のケースで更に搭載して
いる。
【0007】第1と第2の処理ステップは音声認識プロ
セスで連続するステップになる。例えば、送受器の第1
処理ステップは音声認識プロセスの第1ステップにな
り、第2処理ステップは音声認識プロセスの残りのステ
ップを搭載し、テキスト/命令を出力として与える。一
般的に、音声認識プロセスの第1処理ステップは、無線
電話媒体の帯域幅の限界(GSMの場合で9.6KBbs)
に適合しながら、音声認識プロセスが遠方の中心サーバ
で完全に行われるために、入力音声の主な特長を維持す
る出力を生成する。
【0008】一般的に、音声認識プロセスの第1ステッ
プは(線形予測符号化のような)周知の演算に従う入力
音声信号をパラメータ係数に変換する初期特長分析を搭
載している。遠方の中心プロセッサで実行される第2処
理ステップは、受信されたパラメータ係数と、語彙と構
文と意味のモデルに対する更なる分析に依る周知のサブ
ワード・ユニット(音素、2次音素、または3単音のよ
うな)のライブラリを比較して、出力テキスト/命令を
生成するステップを搭載している。
【0009】中心プロセッサの出力は、テキストの形態
で表示のために送受器に戻され、且つテキストを入力と
して受け入れる更に遠方で処理されるアプリケーション
に命令として入力される。音声処理の方式は、重要な資
源が、処理能力とデータ保存に関して共に、最新の認識
エンジンに依って要求されることを認めている。語彙の
範囲と性能の両方で限定される、(PDAsのように)
小型化で妥協した対策を実施するよりむしろ、送受器
は、音声認識処理の初期の段階、すなわち、初期特長分
析を、送受器上でサポートし、且つ、移動式/コードレ
ス・ネットワークに依って提供される制約されたデータ
・チャンネル帯域幅を取り入れるために容量的に大幅に
限定された結果を、中心に位置する大型で強力なマルチ
ユーザ認識エンジンに与える。
【0010】代わりに、第1と第2の処理ステップはフ
ァクス伝送システムで別のプロセスになるか、または第
1と第2の分析ステップは音声認識システムと類似の手
書き認識システムになることもできる。手書き認識シス
テムの場合、テキストは、送受器にタッチ感知スクリー
ンを介して入力されて、中心プロセッサに標準ファクシ
ミリ・プロトコル(または、書き込まれたテキストの基
本的な特長が損なわれないように、適切な高品質の転送
方法を与える任意の他のプロトコル)を用いて送信され
る。中心プロセッサは、そこで、手書き認識手順をファ
クス・データで実行して、手書きの内容を解明して、そ
れを送受器に認識されたテキストとして戻す。
【0011】更なる代替方式に於いて、第1と第2の処
理ステップは、送受器がコンピュータのための遠方の入
力/出力装置として作動する“リモート・デスクトッ
プ”アプリケーションに用いられる。第1処理ステップ
は、ユーザの入力(例えばカーソル制御命令)を、遠方
のPCに設置されている(MS−WindowsTM、M
achintoshTM、または任意の他の目的指向グラ
フィック・インタフェースのような)特定のオペレーテ
ィング・システムに対応された、目的レベル・グラフィ
ック・コードに変換するステップを一般的に搭載してい
る。コードは、要求された無線プロトコルに従って変調
され、電話網処理システムを介して遠方のPCに伝送さ
れる。このケースでは、遠方のプロセッサは、目的レベ
ル・グラフィック・コードを解読して、命令を実行する
アプリケーションに入力する、PCに含まれている。
【0012】送受器に内蔵されているインテリジェンス
は、入力作用を目的ベースで識別して、目的操作のコー
ド化された表現だけ遠方で実行するアプリケーションに
伝送する。位置決め装置を用いて線を描く例をみると、
送受器は、入力される目的のタイプ、このケースでは線
と、コード化された形態でアプリケーションに伝送でき
る其の特性(開始と終了する座標や厚みや色など)を決
定している。遠方で実行するアプリケーションに付随す
る装置のドライバは、(送受器に局部的に保持されるも
のを反映する)標準目的ライブラリを参照しながら入力
を解読して、これをアプリケーションに認められる遅延
の無い状態で送る。スクリーンに図示される線の表現
は、送受器に依って局部的に描かれ、遠方のアプリケー
ションが変更を示す場合にだけ変えられる。ユーザに、
結果は瞬時に応答することになる。
【0013】この場合、送受器のユーザが使用できるア
プリケーションの機能性はオンボード・プロセッサの機
能に依って制限されない。“リモート・デスクトップ”
アプリケーションの場合、どこかで実行しているアプリ
ケーションと通信して遠方で制御することに依って、送
受器は其の遠方のプロセッサのパワーを移動するユーザ
に送る。更に、送受器の殆どのユーザは、彼らの従来の
デスクトップPCに常駐する、彼らの情報規定に対応さ
れた、アプリケーションの組を既に備えている。送受器
はアクセスを全てのこれらの資源に任意の位置から与え
るので、アプリケーション・ソフトウェアを送受器に更
に加える必要はなく、そのコストとサポートの可能性か
ら、或る範囲の情報資源に接続を設定するために必要な
複雑な構成を実施することもない。
【0014】“リモート・デスクトップ”概念の更なる
改善として、パーソナル・コンピュータに広く見受けら
れるアプリケーション・ソフトウェアを実行できるマル
チユーザ・コンピュータは、電話網の内部の遠方に位置
している。すなわち、マルチユーザ・コンピュータは、
アプリケーション実行機能を大きな集団の遠方のユーザ
に、彼らが其れを必要とする時に提供する。パーソナル
・コンピュータ・アプリケーションに精通しているが、
アクセスに適した構成のパーソナル・コンピュータを備
えていない、送受器のユーザは、これらのアプリケーシ
ョンをマルチユーザ・ノードの“仮想PC”環境内で実
行できる。このメカニズムは、パーソナル・コンピュー
タ・アプリケーションの利益を送受器のユーザに、パー
ソナル・コンピュータの購入に付随する巨額な支出を要
求せずに提供できる。
【0015】本発明の第2の見解に従って、我々は、無
線電話媒体を介して電話網処理システムと通信するよう
に適応される少なくとも1つの移動式で手持ち式の電話
送受器を具備する通信システムであって、送受器は、入
力をユーザから受信し且つ信号を其れに基づいて生成す
る手段と、第3者との電話の会話の一部として音声伝送
信号を生成するように音声入力を適応する手段と、音声
伝送信号を無線電話媒体を介して伝送する手段を搭載
し、電話網処理システムは、音声伝送信号を受信する手
段と、音声信号を第3者に送信する手段を搭載し、送受
器は入力/出力データを無線電話媒体と電話網処理シス
テムを介して送信し且つ受信するように適応され、そこ
では送受器は送受器から離れて位置し且つ電話網処理シ
ステムに取り付けられているコンピュータ上で実行する
アプリケーション・プログラムのための入力/出力装置
として作動することを特徴にする、前述の通信システム
を提供する。
【0016】前述のように、コンピュータはデスクトッ
プ・パーソナル・コンピュータ(PC)または平行する
マルチユーザ環境を与えるコンピュータになる。再び、
電話網処理システムは一般的に回路切替システムである
と言える。無線電話媒体の限られた帯域幅の機能は、入
力/出力を目的レベル・グラフィック説明プロトコルに
伝送のために変換することに依って一般的に解決され
る。
【0017】
【実施例】ネットワーク構造が、図1に図示されてい
て、4つの主な機能入力、すなわち、送受器1と、ワイ
ヤレス3と固定ネットワーク伝送媒体4を具備する搬送
施設2(送信とベアラ・チャンネル)と、中心処理形式
設定制御プラットホーム5と、サービス・プラットホー
ム6を備えている。部品6は、保存/送信ファクス・サ
ーバと対話式バンキング・サービスまたは電子メール・
アクセス機能を搭載できる、分類されたサービス・プラ
ットホームを表す総称的なものである。
【0018】送受器1の1つのプロセッサ7は、全体的
な制御機能と、オンボード・アプリケーションに付随す
るデータ処理と取扱機能と、DSP機能を行う。プロセ
ッサは柔軟性に富んだ機能を提供する一般的にRISC
ベース・プロセッサである、すなわち、チップ・パワー
は、無線、計算応用事例、DSP、または全てのこれら
の間の分割に使用できる。送受器は、ノイズ消去機能を
備えた16KHz マイクロフォン8とアンテナ9もサポー
トする。以降、プロセッサ7は、それと、これから説明
される他のプロセッサと区別するためにDSP7と呼ば
れる。
【0019】送受器は、ユーザとの対話のために図2に
図示される入力と出力装置も備えている。送受器は、フ
ァクスと電子メールとメニュー・オプションと他の視覚
的な出力を表示するLCD表示スクリーン10を備えて
いる。図2に見られるように、スクリーン10の部分は
ユーザに与えられる送受器1のエリアの大部分を占めて
いる。送受器は、入力ボタン11と12とカーソル・コ
ントロール13を、最適な耳と口の間の離間距離とする
ために位置設定された電話マイクロフォン8と拡声器1
4と共に備えている。送受器の代表的な形状は、長さ1
5が170mm、幅16が70mm、深さ(図示されていな
い)が23mmである。これは、送受器が手で容易に保持
されることを可能にする。送受器は、ケースと一体化さ
れていて、動作のために延長することを要求しない、ア
ンテナ(図示されていない)も備えている。
【0020】送受器1はGSM900またはDCS18
00のような任意の通常の無線通信環境3と通信でき
る。代わりに、コードレス・システムの場合、移動式送
受器がコードレス(例えばDECT)ベース・ステーシ
ョンと通信できる。送受器1と中心プラットホーム5の
間の日常的なコールと別に、搬送施設2は、送受器1と
第3者29または30の間の電話の会話を、無線網3の
他のベース・ステーションを介してまたはPSTN4を
介して各々設定することもできる。
【0021】中心プラットホーム5は一般的に提示管理
装置26を具備している。提示管理装置26は、中心プ
ラットホーム5と送受器1の間のインタフェースの管理
と制御と、装置からの入力の承認を行う。提示管理装置
26は、任意のサービス・プラットホームからの出力の
形式を定めて、送受器のインタフェース内部で発生する
事象を解明する。中心プラットホーム5は、電子メール
と、送受器1に出入するファクス・データの処理を含め
た、多種多様な機能も実行する。
【0022】マルチ・ユーザ・データベース32は各々
送受器ユーザに関連するデータを保存するために用いら
れる。部品番号28は、中心プラットホーム5の一部を
形成する総称的な“サービス代用”機能を表している。
これは“予想された”インタフェースをサービス・プラ
ットホーム6に与える、例えば、それはVT100ター
ミナルに相当する。出力は提示管理装置26に送られ
て、送受器に相応して形式設定されるが、サービスに対
する要請として提示管理装置26に依って解明された事
象は適切に変換されて関連するプラットホーム6に発行
される。
【0023】音声処理ホスト35は、配置されている音
声認識環境に相応するように構成されていて、且つ、音
声合成機能を搭載して、指令や命令のような音響出力を
送受器ユーザに送る。手書き認識ホスト36は送受器の
手書き画像データをテキスト(後に説明)に変換する。
【0024】ここで代表的な音声認識応用事例について
3と4を参照しながら説明される。図3は、音声認識の
プロセスに関連する機器を示している。音声認識プロセ
スの第1ステップは送受器のDSP7で実行され、残り
のステップは音声処理ホスト35で実行される。ホスト
35は、テキスト出力を、キーボードの出力と類似の方
式で適正な形式で送ることができる。ホスト35は、送
受器に依って生成された音声ユニット(例えば音素や2
次音素など)を認識して其れをテキスト表示に変換する
ことに依って、送受器1から送られた音声入力に対応す
る。
【0025】移動式送受器1はホスト35から離れてい
て、これは、いま使用可能な電話網を用いて完全に応答
する高品質音声認識システムの方式に対して実質的な障
壁を、今まで形成していたことは、十分に認められるこ
とである。要求された完全に応答し且つ高品質の認識プ
ロセスとしてホスト35を支援するために、ホスト35
に与えられる情報は、CDまたはDATオーディオ・シ
ステムで達成される情報と類似の高信頼性の情報になら
なければならないことも十分に認められることである。
これは22KHz の単位の帯域幅を要求し、ホスト35が
このような帯域幅で与えられた情報を処理できても、送
受器1と音声認識機器35の間で形成される通信連結機
構は、このような帯域幅を与えることができない。
【0026】発明は、マイクロフォン8に依って入手さ
れた音声情報に関する独自の分析と圧縮プロセスを実施
して、この問題を解決する。分析され圧縮されたデータ
は、今のネットワークに依って広く与えられる単位の帯
域幅、例えば9.6Kbpsを要求するにすぎない。分析さ
れ圧縮されたデータは、ホスト35に依って受信される
と、適切な幅の帯域幅、例えば22KHz の単位を有する
再構成された音声データの発生源として使用されるの
で、これは、要求された高品質の認識手順がホスト35
で実行されることを可能にする。
【0027】図4は、図3の機器の構成要素に依って実
行される種々のステップを示す流れ図である。音声認識
プロセスに送られ、次に遠方のシステムの制御情報とし
て採用される音声情報は、適切な変換器を備えたマイク
ロフォン8に依って入手されて(図8)DSP7に送ら
れる。DSP7は、音声情報を入手して22KHz の単位
の帯域幅を備えた高信頼性レベルでデジタル化する(ス
テップ62)。次に、デジタル化された音声信号の初期
特長分析(ステップ63)がDSP7で実行される。こ
の段階で採用される代表的な演算は線形予測符号化また
はフィルタ・バンク分析である。演算は入力周波数の十
分な範囲を確保するように選択される(約16KHz ま
で)。これは、主な特長が伝送後に確保されることを可
能にし、ホスト35に於ける詳細な(例えば口述品質)
音声認識を可能にする。初期特長分析の出力はパラメー
タ係数64のストリームを搭載している。これらの係数
は、伝送媒体の帯域幅に適合することが要求される場合
にDSPに依って(例えば図4に図示されていないステ
ップの一時的な分解補間に依って)更に符号化され、且
つ要求されたプロトコル(例えばGSM,DECTまた
はDCS1800)に従う無線伝送信号を与える通常の
方式で65で変調される。伝送信号は信号を66で伝送
するアンテナ9に送られる。
【0028】送信された信号67は、無線電話処理網3
のベース・ステーション20に依って通常の方式で復調
され、デジタル・データとして(点線53に依って一般
的に指示される数多くのユニットを介して)ホスト35
に最終的に送られる。どのプロトコルが用いられている
かに基づいて、伝送されたデータは、主要通信網に配送
される前に構内交換機(PBX)または移動切替センタ
ー(MSC)で受信される。初期特長分析パラメータ係
数は前述の復調ステップで再生される場合もある。代わ
りに、復調は、初期特長分析係数を再生するためにホス
ト35に依って要求される場合もある(例えば係数は一
時的な分解補間に依って符号化される)。
【0029】係数は、係数が表す内容に基づいて、音
素、2次音素、2単音、3単音、または他の2次ワード
・ユニットのライブラリ41を調べるために用いられ
る。これは図4の69に図示されている。選択されたサ
ブワード・ユニットは、数多くの状態で用いられるテキ
スト71を出力する、70でプロセッサ42に依って分
析される。例えば、テキスト出力43は表示のために送
受器に再び伝送される。そのうえ、テキスト出力は、テ
キスト入力を認識する別の実行アプリケーションの入力
を与えるために用いられる。
【0030】代表的な音声認識手順が前述のように略述
されたが、一般的に任意の通常の音声認識プロセスが用
いられ、そのプロセスの一部は送受器1で、残りは中心
サーバ34で実行される。作業の分割は情報の損失を最
小限に且つDSP7の活用を最大限にするように決定さ
れる。或る特定の実施例に於いて、初期特長分析63の
ステップはDSP7でデジタル化された情報の音声要素
(例えば音素や2次音素など)を表すデータの生成に関
連する。次に示す説明は、音声要素が2次音素または3
単音であるが、音素の使用を説明するものとする。
【0031】符号化後の音素を表すデータは選択された
プロトコル(例えばDECT,GSM900、またはD
CS1800など)に依って伝送されるように構成され
ている。DSP7は、約2MバイトのROMに保存でき
る数多くの音素のライブラリを搭載している。選択され
たプロトコルを介して伝送のためにDSP7から導かれ
た符号化データ信号は、マイクロフォン8を用いて入手
された完全な音声情報を特に正確に表している。そこで
DSP7を用いて達成された音声情報の圧縮は、符号化
データの転送が音声データをマイクロフォン8を用いて
入手するために元々要求されていたよりも遙かに狭い帯
域幅を要求するので特に重要である。特に、符号化デー
タの帯域幅は、選択されたプロトコルを介して且つ一般
的にNetwork PSTNを介して伝送のために使
用できる帯域幅に属している。
【0032】音素を表す符号化データは、任意の不具合
な劣化で乱れることなく、ネットワークを経由して伝送
されて、ゲートウェイ34から音声処理ホスト35に送
られる。このホスト35は、全ての可能性のある音素に
関連するデータのライブラリを含んでいて、DSP7の
ライブラリを反映する。従って、送受器1からネットワ
ークを経由して伝送された符号化データの受信時に、ホ
スト35は、そのライブラリの内容を参照しながら音声
情報を再構成するように構成されている。再構成プロセ
スは、そこで、22KHz の帯域幅を有する比較的高信頼
性の音声情報に対して実行できる。
【0033】発明は、ユーザ識別と機密性に関するスマ
ートカード・レベルは送受器1の内部に元々固有のもの
であり、ホスト35で最終的に実行される音声認識プロ
セスは話者に相応して構成されるので特に優れている。
このようにして、中心プラットホーム5と付随するホス
ト35は、小型で比較的廉価な送受器1から電話網を介
して必要な入力情報が与えられる強力な“認識エンジ
ン”を形成する。従って、実際の認識手順は、このよう
な送受器から且つ特殊な試験条件に対応する適切な環境
に於いて遠方から実施できる。また、ネットワークは音
声情報を単純に符号化データとして見るので、十分なエ
ラー補正と暗号化が必要におうじて実施できる。これは
応答時間を通常の音声に対する一般的な許容限界を超過
させることになるが、このような変形は、5秒までの平
均遅延時間は一般的に許容可能と見なされる音声認識に
とって大きな問題にならない。任意のケースに於いて、
語句は情報検索の入力命令として使用できるので、より
長い遅延時間、10秒までも、妥当と見なされる。特
に、送受器の所有者には、送受器またはラップトップP
Cでは使用できないと思われる、且つ専用デスクトップ
・マシンでは特に購入不可能な高価な価格になると思わ
れる、音声認識機能に対するアクセスも提供される。
【0034】更に、本発明の構造から、送受器1のユー
ザは、中心プラットホーム5とホスト35に関連する技
術の成果として与えられる全ての改善点から利益を直接
得ることができる。図1に図示されているように、中心
プラットホーム5は、銀行や流通業者のサービス・オペ
レーションまたはネットワーク上で行われる他の専用サ
ービスのように、言葉、文字、または数字コマンドを要
求すると考えられる他のアプリケーション6、例えばM
ercury Communications Lim
itedに依って提供される。いわゆるWingアプリ
ケーションに対してネットワークに現れるデータのアク
セスを提供できる。分析と符号化装置としてDSP7の
使用に固有の機密性とユーザ識別のレベルは、このよう
なサービス・オペレーションに特に効果的なことを証明
する。
【0035】送受器10とこのような高品質のPSTN
を用いて、このような高品質の音声認識を与えること
は、特に優れたマルチ・メディア・データ処理システム
を提供することになる。例えば、音声応答と音声認識と
話者識別とテキスト/画像表示とタッチ感知スクリーン
などの組み合わせは、特にユーザが使いやすい応答方式
で多種多様な応用事例を与えるシステムを提供する。
【0036】ここで本発明の“リモート・デスクトッ
プ”アプリケーションについて図5を参照しながら説明
される。消去される入力/出力をサポートする従来のプ
ロトコルは、例えば、位置決め装置を用いて線を完全に
描くために、かなりの量のネットワーク・トラフィック
の伝送を要求する。遠方で実行するアプリケーション
は、マウスの各々僅かの動きを反映する入力情報が送ら
れ、且つスクリーンに表示される線の各々対応する延長
に相応する出力命令に応答する。実際に、この好都合な
構造を移動ネットワーク上で実現しようとする任意の試
みは、かなりの許容されない遅延時間を入力行為と最終
的な出力の間に導くと思われる。発明に従う“リモート
・デスクトップ”の特長は、送受器1が、50で一般的
に示されるように、リモート・デスクトップ・パーソナ
ル・コンピュータ(PC)のための入力/出力装置とし
て作動することを可能にする。
【0037】送受器1は、特定の無線電話網に付随する
ローカル・ベース・ステーション20を介してPCとの
コールを設定する。コールは電話網処理システム(点線
で一般的に図示される)を介してPCに送られる。スク
リーン情報を表示するだけでなく、送受器は、入力をユ
ーザから受信するので、PC50の“遠隔制御”として
作動する。これは、(PC50の)アプリケーションと
送受器1を連結するネットワーク内部のロー・ビット・
レート活用のために最適化された目的レベル・グラフィ
ック説明プロトコルの使用に依って限定された帯域幅通
信媒体上で達成される。
【0038】PCはWindowsオペレーティング・
システム53に依ってサポートされるアプリケーション
・プログラム52を実行するプロセッサ51を搭載して
いる。Windowsオペレーティング・システム53
は、アプリケーション・プログラム52に対する入力の
ために目的レベル説明プロトコルに一般的に変換される
キーボード54とキーボード・ドライバ55から入力を
受信する。同様に、アプリケーション・プログラム52
の出力は、スクリーン57をドライブするスクリーン・
ドライバ56に対するファンクション・コールとして適
切なウインドウズ・ライブラリと出力を参照しながらウ
インドウズ目的レベル・ファンクション・コールに変換
される。キーボード・ドライバ55とスクリーン・ドラ
イバ56は、電話網に対するネットワーク・アダプタ7
1コネクションに接続されるシリアル・ポート58を介
して入力と出力の各々情報に構成される。例えば、アダ
プタ71はISDNターミナル・アダプタになる。
【0039】キーボード・ドライバ55とスクリーン・
ドライバ56は(図5に図示されるように)シリアル・
ポート58に出入する入力/出力ファンクション・コー
ルを分岐するためにPC製造会社に依って構成される。
代わりに、通常のPCは、遠方の送受器とのインタフェ
ースを可能にするために、カードがPCに挿入されるよ
うに適応できる。更なる代替実施例に於いて、PC51
は、インタフェースを其こに取り付けられている数多く
のPCと外部電話網の間に与えるソフトウェアを備えた
集合サーバに接続される場合もある。
【0040】ここで送受器1を見ると、DSP7は、入
力をカーソル・コントロール13である70で一般的に
示される入力手段から、または入力をタッチ感知スクリ
ーン10から受信する。DSP7に内蔵されているイン
テリジェンスは、入力作用を目的ベースで識別して、目
的操作の符号化表示(適切なWindowsTM形式で)
だけ遠方で実行するアプリケーションに伝送する。略述
された線を描く例を考慮して、DSP7は入力される目
的のタイプをWindowsTM目的ライブラリを参照し
ながら決定すると思われる。このケースでは、DSP7
は、目的が線であることを決定し、且つ符号化された形
態でアプリケーションに伝送できる其の特性(開始と終
了する座標と厚みと色など)も決定する。遠方で実行す
るアプリケーションに付随するキーボードとスクリーン
・ドライバ55と56は、入力を(送受器で局部的に保
持されるものを反映する)標準目的ライブラリを参照し
ながら解読して、これをアプリケーションに認識可能な
遅延なしに送る。スクリーン上に図示される線の表現
は、DSP7に依って局部的に生成され、且つ遠方のア
プリケーション52が変更を示す場合にだけ変えられ
る。ユーザにとって結果は瞬間的なものである。
【0041】遠方のアプリケーション52が変更を示す
と、スクリーン・ドライバ56は、アダプタ71を介し
て送受器1と、電話網ベース・ステーション・コントロ
ーラ20に、伝送される適切なファンクション・コール
を出力する。DSP7は、信号を受信して、それを保存
されている標準目的ライブラリを参照しながら処理す
る。そこで、適切な出力がスクリーン10上に表示され
る。
【0042】図5に図示される通常のPCにアクセスす
る代わりに、送受器は、アプリケーション実行機能を大
きな集団のユーザに平行して且つ彼らが其れを必要とす
る時に与える“マルチユーザ”にアクセスできる。保存
送信ファクス・サービスのための入力/出力と制御装置
としての送受器の使用について、ここで説明される。
【0043】保存送信ファクス・サービスはファクシミ
リ・メッセージのメールボックスとして作動する。中心
に接続されているノードは、入力ファクス・メッセージ
が例えばコール送信を介して或いは(Mercury’
s Wingsプラットホームのような)インテリジェ
ント周辺装置の一部として送られるライン・ターミネー
ション・インタフェースを提供する。
【0044】これらの入力ファクスは、定められたファ
クス・インタフェースを通って、ディスクにデジタル形
態で保存される。ファクスを受信すると、通知プロセス
が始動して、例えば、ユーザに新しいメッセージの存在
がページ・メッセージを介して知らされる。保存されて
いるメッセージに対するアクセスは電話送受器DTMF
インタフェースを介して今まで行われていて、それを介
して該当する宛先のファクス番号がユーザに依って入力
される。ファクス番号を指定すると、メールボックス
は、保存されているデジタル・データを定められたファ
クス・インタフェースで変換し、且つアナログ形態で伝
送することに依って“アンロード”される。
【0045】送受器の大型でタッチ感知スクリーンは、
それが手書き或いはスケッチされたファクスの入力のた
めのターミナルとして作動することを可能にするが、そ
の画面移動表示機能は外部で発行されたファクスが読ま
れることを可能にする。更に、配付された音声認識環境
に関係する機能は、語られたテキストまたはコマンド入
力をサポートする。
【0046】送受器と保存送信ファクス・サービスの組
み合わせは、移動式ファクスの要望に対して有望な方式
を提供する。ゲートウェイは、大量のファクスをユーザ
の代わりに受信して、ユーザに送受器のグラフィック・
ユーザ・インタフェースを介して知らせる。これは、送
信者の詳細な内容(ファクス・ヘッダーから抽出され
た)をメッセージ・サイズと共に含むことができる。ユ
ーザは、メッセージを送受器のスクリーン上で確認し
て、各々ページを下方に画面移動するか、またはメッセ
ージが大きいか或いはハード・コピーが要求される場合
にファクスが近くのファクス・マシンに送信されるコマ
ンドを発行することを選択する。
【0047】タッチ感知スクリーンを使用すると、ユー
ザは、例えば、入力ファクスに注釈を付けて、恐らく其
れを許可証として署名し、それを送信者に返すか或いは
別の関係者に送信する。話中の番号に再試行し且つ複数
の宛先に送信することは、保存送信環境内部でサポート
される特徴なので、メッセージを処理して回答するため
に要求される時間を短縮することになる。
【0048】殆どの事例に於いて、送受器とサービス・
ホスト間のファクシミリ情報の転送は標準ファクス・プ
ロトコルを使用する。グループIII ファクスは、GSM
相2スタンダードに含まれていて、数多くの他のセルラ
ーとコードレス環境内でもサポートされる。しかし、ス
クリーン・サイズの“ファクス・ノート”のような小さ
なメッセージが標準搬送メカニズム上で所有権のあるプ
ロトコルを介して伝送される場合もある。1例として、
Apple 社とMotorola社はAsia周辺の両方向ページングの
其れらの作業の元々一部として約500バイトのApp
le Newton Message Padスクリー
ンから“生のインク”(手書きのテキストとスケッチ)
を表現できる圧縮スタンダードを開発した。
【0049】GSMとDCS1800の内部の帯域外メ
ッセージ送信のSMS施設(及びDECT内部のCOM
S施設)がメッセージあたり約160バイトの処理量を
提供すると想定すると、ファクス・ノートは4つのこの
ようなメッセージに送られることができる。この方法を
用いてファクス表現を送受器からサービス・ホストに移
動すると、切替式のベアラ・チャンネルの経費を解消
し、また、コールを同時に継続する状態で行うことも可
能にすると考えられる。
【0050】ここで、配付される手書きの認識環境を実
施する方法について説明される。通常のPersona
l Digital Assistantsは、手書き
認識に依るテキスト入力を可能にするように試みた。こ
のプロセスは、タッチ感知スクリーンに入力された手書
きテキストを解釈する局部的な資源の活用に関連する。
残念なことに、これは特に際だった成果を示していな
い。
【0051】更に強力な遠方処理資源を更に総合的な参
照データと共に使用すると、手書き認識プロセスの性能
を大幅に改善する。従って、送受器が中心に位置するホ
ストに依る処理のためにデータを集めて提示する、発明
に従う配付システムは、大きな利益を提供する。前述の
音声処理システムと類似の形態で、入力データは、処理
精度に関与する任意の特長を損ねずに中心資源に伝送さ
れる必要がある。手書きは動的な特長と静的なグラフィ
ックの特長に基づいて認識できる。動的な特長は、DS
P7に依って送受器で分析されて、遠方の手書き認識プ
ロセッサ36にグラフィックの特長と共に伝送される。
【0052】好都合に、グラフィックの特長は、手書き
認識プロセスが遠方のプロセッサで完全に行われるため
に、入力された手書き信号の予め設定された特長を維持
するプロトコルを介して伝送される。標準ファクシミリ
・プロトコルは、送受器(または標準ファクシミリ基準
に適合する任意の他の部品)がファクスを介して認識の
ために手書きの内容を配布し且つ認識された出力を標準
できるように、グラフィックの特長に適した高品質の転
送方法を提供する。
【図面の簡単な説明】
【図1】関連するネットワーク構造を備えた送受器の概
略構成図を示す。
【図2】代表的なユーザ入出力装置を備えた送受器の外
部回路の構成図を示す。
【図3】代表的な音声認識プロセス用の機器の概略構成
図を示す。
【図4】関連する音声認識のステップを示す流れ図であ
る。
【図5】本発明に係る遠隔式デスクトップ型装置の実施
例の概略構成図である。
【符号の説明】
1…送受器 2…転送インフラストラクチヤ 3…無線回路網(伝送媒体) 4…固定〔一般加入電話網〕回路網(伝送媒体) 5…中央処理用制御プラットホーム 6…分類サービス・プラットホームの総称体 7…単一処理手段 8…電話マイクロフォン 9…アンテナ 10…液晶表示(接触感知)スクリーン 11,12…入力ボタン 13…カーソル・コントロール 14…拡声器 20…電話回路網(ローカルベース局) 26…提示用管理装置 28…中央プラットホームの一部 29,30…第3者 32…多重ユーザ用データベース 34…ゲートウェイ 35…音声認識ホスト 36…手書き認識用ホスト 41…ライブラリ 42…プロセッサ 43…テキストの出力 50…遠隔式デスクトップ・パソコン 52…アプリケーション・プログラム 53…ウィンドウ操作 54…キーボード 55…キーボード・ドライバ 56…スクリーン・ドライバ 57…スクリーン 58…直列ポート 67…送信信号 71…テキスト
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04Q 11/04 (72)発明者 クリストファー ウィリアム ヘンダーソ ン エリス イギリス国,レーミントン スパ シーブ イ32 5エヌダブリュ,ストラザーン ロ ード 56

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 無線電話用媒体(3)を介して電話網処
    理システム(3,4)と通信するように適応される少な
    くとも1つの移動式で手持ち式の電話送受器(1)を具
    備する通信システムであって、 送受器は、入力をユーザから受信し且つ信号を其れに依
    存して生成する手段(10,8,11−13)と、第3
    者との電話の会話の一部として音声伝送信号を生成する
    ように音声入力を適応させる手段(7) と、音声伝送信
    号を無線電話媒体(3)を介して伝送する手段(9)と
    を搭載していて、 電話網処理システム(3,4)は、音声伝送信号を受信
    する手段と、音声信号を第3者(29,30)に送信す
    る手段を具備しており、 送受器は、第1処理ステップを選択された入力信号で実
    行し且つ遠方の第2処理ステップを実行するために必要
    な予め設定された情報を確保するデータを其れに基づい
    て生成するように適応される第1処理手段(7)と、伝
    送信号を生成するために通常の無線電話プロトコルに従
    ってデータを適応する手段と、伝送信号を無線電話媒体
    を介して電話網処理システムに伝送する手段(9)を更
    に搭載していて、 システムは、データを再生するために電話網処理システ
    ムから伝送信号を受信して処理する手段と、送受器から
    離れて位置し且つデータの第2処理ステップを実行し且
    つ出力(43)を其れに基づいて生成するように適応さ
    れる第2処理手段(35,36,51)を更に搭載して
    いることを特徴とする、前記の通信システム。
  2. 【請求項2】 第1と第2の処理手段は第1(63)と
    第2(69,70)のステップを音声認識プロセスで実
    行するように用いられる、特許請求の範囲第1項に記載
    のシステム。
  3. 【請求項3】 選択された入力信号は音声信号を具備
    し、且つ、該第1の処理手段が、入力音声信号の予め設
    定された特長を維持する出力(64)を与えて、該第2
    の処理手段(35)に音声認識プロセスの残りのステッ
    プを実行させることができる、特許請求の範囲第2項に
    記載のシステム。
  4. 【請求項4】 第2の処理手段(35)は、入力音声信
    号のテキストの内容を表すテキスト信号を搭載する出力
    (43)を与えて、テキスト信号を送受器にテキストと
    して出力するために戻す、特許請求の範囲第3項に記載
    のシステム。
  5. 【請求項5】 第1の処理ステップは初期特長分析を搭
    載する、特許請求の範囲第3項または第4項に記載のシ
    ステム。
  6. 【請求項6】 第1と第2の処理手段は第1と第2のス
    テップを手書き認識プロセスで実行するように適応され
    る、先行する特許請求の範囲の何れかに記載のシステ
    ム。
  7. 【請求項7】 選択された入力信号は送受器上で接触感
    知型スクリーン(10)を介して入力された手書き信号
    を搭載し、且つ、第1の処理手段は、入力された手書き
    信号の予め設定されたグラフィックの特長を維持する出
    力を与えて、第2の処理手段(36)に手書き認識プロ
    セスの残りのステップを実行させることができる、特許
    請求の範囲第6項に記載のシステム。
  8. 【請求項8】 伝送信号は通常のファクシミリ・プロト
    コルに従って変調される、特許請求の範囲第7項に記載
    のシステム。
  9. 【請求項9】 第2の処理手段は、入力手書き信号のテ
    キストの内容を表すテキスト信号を搭載する出力を与え
    て、テキスト信号を送受器にテキストとして出力するた
    めに戻す、特許請求の範囲第7項または第8項に記載の
    システム。
  10. 【請求項10】 テキストは更に遠方で処理されるアプ
    リケーションに対する命令として入力される、特許請求
    の範囲第4項または第9項に記載のシステム。
  11. 【請求項11】 送受器は遠方の入力装置としてコンピ
    ュータ(50)に対して作動する、先行する特許請求の
    範囲の何れかに記載のシステム。
  12. 【請求項12】 第1の処理ステップは選択された入力
    信号をコンピュータ(50)に適した目的レベル・グラ
    フィック・コードに変換するステップを搭載している、
    特許請求の範囲第11項に記載のシステム。
  13. 【請求項13】 コンピュータはマルチユーザ・コンピ
    ュータを搭載している、特許請求の範囲第12項に記載
    のシステム。
  14. 【請求項14】 第2の処理手段(3)は目的レベル・
    グラフィック・コードをコンピュータで実行するアプリ
    ケーション・プログラム(52)の入力に変換するよう
    に適応される、特許請求の範囲第12項または第13項
    に記載のシステム。
  15. 【請求項15】 無線電話媒体(3)を介して電話網処
    理システム(3,4)と通信するように適応される少な
    くとも1つの移動式で手持ち式の電話送受器(1)を具
    備する通信システムであって、 送受器は、入力をユーザから受信し且つ信号を其れに基
    づいて生成する手段(10,8,11−13)と、第3
    者との電話の会話の一部として音声伝送信号を生成する
    ように音声入力を適応する手段(7) と、音声伝送信号
    を無線電話媒体(3)を介して伝送する手段(9)を搭
    載していて、 電話網処理システム(3,4)は、音声伝送信号を受信
    する手段と、音声信号を第3者(29,30)に送信す
    る手段を搭載していて、 送受器は入力/出力データを無線電話媒体と電話網処理
    システムを介して送信し且つ受信するように適応されて
    いて、そこでは送受器は送受器から離れて位置し且つ電
    話網処理システムに取り付けられているコンピュータ上
    で実行するアプリケーション・プログラムのための入力
    /出力装置として作動することを特徴とする、前記の通
    信システム。
  16. 【請求項16】 遠方で実行するアプリケーションの出
    力は伝送されて送受器に表示される、特許請求の範囲第
    15項に記載のシステム。
  17. 【請求項17】 ユーザから選択された入力信号は遠方
    で実行するアプリケーションの入力のためにコンピュー
    タに出力信号として伝送される、特許請求の範囲第15
    項または第16項に記載のシステム。
  18. 【請求項18】 入力または出力あるいはその両方の信
    号は目的レベル・グラフィック説明プロトコルである、
    特許請求の範囲第16項または第17項に記載のシステ
    ム。
  19. 【請求項19】 コンピュータは複数のアプリケーショ
    ン・プログラムを実行し、各々アプリケーション・プロ
    グラムは異なる遠方の送受器に依ってアクセスされる、
    特許請求の範囲第15項から第18項の何れか一項に記
    載のシステム。
  20. 【請求項20】 電話網処理システムは回路切替システ
    ムを搭載している、先行する特許請求の範囲の何れかに
    記載のシステム。
  21. 【請求項21】 前記の第1処理ステップは、音声入力
    から得た音声信号を分析し、前記の音声入力の音声要素
    を識別するように前記の音声信号を分析し、前記の音声
    入力の前記の音声要素を表すデータを生成するステップ
    を搭載していて、且つ前記の第2処理ステップは前記の
    伝送されたデータに依って表された音声要素に基づいて
    音声認識手順を実施するステップを搭載している、特許
    請求の範囲第1項から第14項の何れか一項に記載の方
    法。
  22. 【請求項22】 前記の音声要素は音素を搭載してい
    る、特許請求の範囲第21項に記載の方法。
  23. 【請求項23】 前記の音声信号の前記の分析は2次音
    素レベルで実施される、特許請求の範囲第21項に記載
    の方法。
JP7051195A 1994-03-10 1995-03-10 通信システム Pending JPH0823383A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB9404620A GB9404620D0 (en) 1994-03-10 1994-03-10 Method and apparatus for telephonic speech recognition
GB9404620:8 1994-12-21
GB9425836:5 1994-12-21
GBGB9425836.5A GB9425836D0 (en) 1994-12-21 1994-12-21 Communication system

Publications (1)

Publication Number Publication Date
JPH0823383A true JPH0823383A (ja) 1996-01-23

Family

ID=26304464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7051195A Pending JPH0823383A (ja) 1994-03-10 1995-03-10 通信システム

Country Status (4)

Country Link
US (2) US6125284A (ja)
EP (3) EP0671721A3 (ja)
JP (1) JPH0823383A (ja)
AU (1) AU684872B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013535915A (ja) * 2010-07-26 2013-09-12 クゥアルコム・インコーポレイテッド 多重マイク位置選択性処理用のシステム、方法、装置、およびコンピュータ可読媒体

Families Citing this family (231)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU684872B2 (en) * 1994-03-10 1998-01-08 Cable And Wireless Plc Communication system
US5892764A (en) * 1996-09-16 1999-04-06 Sphere Communications Inc. ATM LAN telephone system
GB2325110B (en) * 1997-05-06 2002-10-16 Ibm Voice processing system
US6993321B1 (en) * 1997-06-19 2006-01-31 Nilsson Byard G Wireless telephone system with mobile instruments for outgoing calls
JP3055514B2 (ja) * 1997-12-05 2000-06-26 日本電気株式会社 電話回線用音声認識装置
US6003004A (en) 1998-01-08 1999-12-14 Advanced Recognition Technologies, Inc. Speech recognition method and system using compressed speech data
KR100259918B1 (ko) * 1998-03-05 2000-06-15 윤종용 핸즈프리키트의 쇼트메시지 음성합성 장치 및 방법
JP3125746B2 (ja) * 1998-05-27 2001-01-22 日本電気株式会社 人物像対話装置及び人物像対話プログラムを記録した記録媒体
US6397079B1 (en) * 1998-09-16 2002-05-28 Intel Corporation Augmenting the capabilities of transceivers
US7003463B1 (en) 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
GB2342828A (en) * 1998-10-13 2000-04-19 Nokia Mobile Phones Ltd Speech parameter compression; distributed speech recognition
US6539437B1 (en) * 1998-11-30 2003-03-25 Intel Corporation Remote control inputs to java applications
US20060015638A1 (en) * 1998-12-28 2006-01-19 Holzhauser Lisa D Method and apparatus for initiating telephone call from a mobile device
US6744860B1 (en) * 1998-12-31 2004-06-01 Bell Atlantic Network Services Methods and apparatus for initiating a voice-dialing operation
US6292781B1 (en) * 1999-05-28 2001-09-18 Motorola Method and apparatus for facilitating distributed speech processing in a communication system
DE19933318C1 (de) * 1999-07-16 2001-02-01 Bayerische Motoren Werke Ag Verfahren zur drahtlosen Übertragung von Nachrichten zwischen einem fahrzeuginternen Kommunikationssystem und einem fahrzeugexternen Zentralrechner
US7115076B2 (en) * 1999-09-07 2006-10-03 Brunswick Corporation Treadmill control system
JP3969908B2 (ja) * 1999-09-14 2007-09-05 キヤノン株式会社 音声入力端末器、音声認識装置、音声通信システム及び音声通信方法
US6963759B1 (en) * 1999-10-05 2005-11-08 Fastmobile, Inc. Speech recognition technique based on local interrupt detection
FI112427B (fi) * 1999-11-05 2003-11-28 Nokia Corp Menetelmä langattoman päätelaitteen ominaisuuksien määrittämiseksi multimediasanoman välityspalvelussa, multimediasanoman välityspalvelu ja multimediapäätelaite
US7050977B1 (en) 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US6675027B1 (en) * 1999-11-22 2004-01-06 Microsoft Corp Personal mobile computing device having antenna microphone for improved speech recognition
US20030182113A1 (en) * 1999-11-22 2003-09-25 Xuedong Huang Distributed speech recognition for mobile communication devices
DE10003529A1 (de) * 2000-01-27 2001-08-16 Siemens Ag Verfahren und Vorrichtung zum Erstellen einer Textdatei mittels Spracherkennung
US20050083890A1 (en) * 2000-02-03 2005-04-21 Eli Plotnik Communication system utilizing host signal processing
US6941382B1 (en) * 2000-02-07 2005-09-06 Raja Tuli Portable high speed internet or desktop device
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
CN1315721A (zh) * 2000-03-23 2001-10-03 韦尔博泰克有限公司 客户服务器语音信息传送系统与方法
FR2809918A1 (fr) * 2000-05-30 2001-12-07 Koninkl Philips Electronics Nv Telecommande pour telephone mobile et telephone mobile pouvant etre commande par une telecommande
ATE358316T1 (de) * 2000-06-08 2007-04-15 Nokia Corp Verfahren und system für adaptive verteilte spracherkennung
EP1168156A3 (en) * 2000-06-30 2005-09-28 Robert Bosch Gmbh Wearable unit for remote speech control
FI112307B (fi) * 2000-08-02 2003-11-14 Nokia Corp Viestintäpalvelu
US6772123B2 (en) * 2000-11-30 2004-08-03 3Com Corporation Method and system for performing speech recognition for an internet appliance using a remotely located speech recognition application
EP1215659A1 (en) * 2000-12-14 2002-06-19 Nokia Corporation Locally distibuted speech recognition system and method of its operation
GB2373136A (en) * 2001-03-07 2002-09-11 Int Computers Ltd Distributed computing using wireless mobile devices
US7406421B2 (en) 2001-10-26 2008-07-29 Intellisist Inc. Systems and methods for reviewing informational content in a vehicle
US6885735B2 (en) * 2001-03-29 2005-04-26 Intellisist, Llc System and method for transmitting voice input from a remote location over a wireless data channel
US8175886B2 (en) 2001-03-29 2012-05-08 Intellisist, Inc. Determination of signal-processing approach based on signal destination characteristics
US20020143611A1 (en) * 2001-03-29 2002-10-03 Gilad Odinak Vehicle parking validation system and method
US6487494B2 (en) * 2001-03-29 2002-11-26 Wingcast, Llc System and method for reducing the amount of repetitive data sent by a server to a client for vehicle navigation
USRE46109E1 (en) * 2001-03-29 2016-08-16 Lg Electronics Inc. Vehicle navigation system and method
US7587669B2 (en) * 2001-04-09 2009-09-08 Aol Llc Server-based browser system
US7941313B2 (en) * 2001-05-17 2011-05-10 Qualcomm Incorporated System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
US20020173333A1 (en) * 2001-05-18 2002-11-21 Buchholz Dale R. Method and apparatus for processing barge-in requests
US20020181442A1 (en) * 2001-05-29 2002-12-05 Purshotam Rajani Multimode personal communication system and method
US7203643B2 (en) * 2001-06-14 2007-04-10 Qualcomm Incorporated Method and apparatus for transmitting speech activity in distributed voice recognition systems
US7366673B2 (en) * 2001-06-15 2008-04-29 International Business Machines Corporation Selective enablement of speech recognition grammars
CN1223984C (zh) * 2001-06-19 2005-10-19 英特尔公司 基于客户机-服务器的分布式语音识别系统
US20030023431A1 (en) * 2001-07-26 2003-01-30 Marc Neuberger Method and system for augmenting grammars in distributed voice browsing
CN1190721C (zh) * 2001-08-08 2005-02-23 国际商业机器公司 协同手写输入的系统和方法
US20030033144A1 (en) * 2001-08-08 2003-02-13 Apple Computer, Inc. Integrated sound input system
WO2003024069A1 (en) * 2001-09-13 2003-03-20 Xcitel Ltd. Method and system for handling multi-part messages sent to e-mail clients form cellular phones
US7107081B1 (en) 2001-10-18 2006-09-12 Iwao Fujisaki Communication device
US7466992B1 (en) 2001-10-18 2008-12-16 Iwao Fujisaki Communication device
US7127271B1 (en) 2001-10-18 2006-10-24 Iwao Fujisaki Communication device
US7133829B2 (en) * 2001-10-31 2006-11-07 Dictaphone Corporation Dynamic insertion of a speech recognition engine within a distributed speech recognition system
US7146321B2 (en) * 2001-10-31 2006-12-05 Dictaphone Corporation Distributed speech recognition system
US6785654B2 (en) 2001-11-30 2004-08-31 Dictaphone Corporation Distributed speech recognition system with speech recognition engines offering multiple functionalities
US20030128856A1 (en) * 2002-01-08 2003-07-10 Boor Steven E. Digitally programmable gain amplifier
US8249880B2 (en) * 2002-02-14 2012-08-21 Intellisist, Inc. Real-time display of system instructions
US7392068B2 (en) * 2002-03-01 2008-06-24 Mobilewise Alternative wirefree mobile device power supply method and system with free positioning
US7292975B2 (en) * 2002-05-01 2007-11-06 Nuance Communications, Inc. Systems and methods for evaluating speaker suitability for automatic speech recognition aided transcription
US7236931B2 (en) 2002-05-01 2007-06-26 Usb Ag, Stamford Branch Systems and methods for automatic acoustic speaker adaptation in computer-assisted transcription systems
WO2003098946A1 (en) 2002-05-16 2003-11-27 Intellisist, Llc System and method for dynamically configuring wireless network geographic coverage or service levels
US7656846B2 (en) * 2002-11-18 2010-02-02 Ge Fanuc Automation North America, Inc. PLC based wireless communications
US6961696B2 (en) * 2003-02-07 2005-11-01 Motorola, Inc. Class quantization for distributed speech recognition
US8229512B1 (en) 2003-02-08 2012-07-24 Iwao Fujisaki Communication device
US8241128B1 (en) 2003-04-03 2012-08-14 Iwao Fujisaki Communication device
US20050033571A1 (en) * 2003-08-07 2005-02-10 Microsoft Corporation Head mounted multi-sensory audio input system
US7383181B2 (en) 2003-07-29 2008-06-03 Microsoft Corporation Multi-sensory speech detection system
EP1665086A4 (en) * 2003-08-15 2009-09-02 Silverbrook Res Pty Ltd IMPROVING ACCURACY IN DIGITAL COLOR SEARCH
AU2004265700B2 (en) * 2003-08-15 2008-10-02 Silverbrook Research Pty Ltd Natural language recognition using distributed processing
US8090402B1 (en) 2003-09-26 2012-01-03 Iwao Fujisaki Communication device
US7917167B1 (en) 2003-11-22 2011-03-29 Iwao Fujisaki Communication device
US7447630B2 (en) * 2003-11-26 2008-11-04 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7499686B2 (en) * 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US8041348B1 (en) 2004-03-23 2011-10-18 Iwao Fujisaki Communication device
US10032452B1 (en) 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
US7574008B2 (en) * 2004-09-17 2009-08-11 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7283850B2 (en) * 2004-10-12 2007-10-16 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US8208954B1 (en) 2005-04-08 2012-06-26 Iwao Fujisaki Communication device
US7346504B2 (en) * 2005-06-20 2008-03-18 Microsoft Corporation Multi-sensory speech enhancement using a clean speech prior
US7680656B2 (en) * 2005-06-28 2010-03-16 Microsoft Corporation Multi-sensory speech enhancement using a speech-state model
US7406303B2 (en) 2005-07-05 2008-07-29 Microsoft Corporation Multi-sensory speech enhancement using synthesized sensor signal
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8032372B1 (en) 2005-09-13 2011-10-04 Escription, Inc. Dictation selection
US7930178B2 (en) * 2005-12-23 2011-04-19 Microsoft Corporation Speech modeling and enhancement based on magnitude-normalized spectra
US20080008142A1 (en) * 2006-07-07 2008-01-10 Luis Aldaz Voice communication device for providing voice over wireless local area network (VoWLAN) communication using a single microprocessor
US20080008161A1 (en) * 2006-07-07 2008-01-10 Luis Aldaz Voice communication device for providing cellular and voice over wireless local area network (VoWLAN) communication using a single microprocessor
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8243638B2 (en) 2007-01-08 2012-08-14 Hellosoft, Inc. Passive listening in wireless communication
US8238278B2 (en) 2007-01-08 2012-08-07 Hellosoft, Inc. Hardware-based beacon processing
US9760146B2 (en) 2007-01-08 2017-09-12 Imagination Technologies Limited Conditional activation and deactivation of a microprocessor
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20080259551A1 (en) * 2007-04-20 2008-10-23 Gotive A.S. Modular computing device
US7890089B1 (en) 2007-05-03 2011-02-15 Iwao Fujisaki Communication device
US8559983B1 (en) 2007-05-03 2013-10-15 Iwao Fujisaki Communication device
US8223799B2 (en) * 2007-06-11 2012-07-17 Broadcom Corporation Method and system for a digital diary system
US8019606B2 (en) * 2007-06-29 2011-09-13 Microsoft Corporation Identification and selection of a software application via speech
US8676273B1 (en) 2007-08-24 2014-03-18 Iwao Fujisaki Communication device
US8639214B1 (en) 2007-10-26 2014-01-28 Iwao Fujisaki Communication device
US8472935B1 (en) 2007-10-29 2013-06-25 Iwao Fujisaki Communication device
US8744720B1 (en) 2007-12-27 2014-06-03 Iwao Fujisaki Inter-vehicle middle point maintaining implementer
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8543157B1 (en) 2008-05-09 2013-09-24 Iwao Fujisaki Communication device which notifies its pin-point location or geographic area in accordance with user selection
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8594740B2 (en) 2008-06-11 2013-11-26 Pantech Co., Ltd. Mobile communication terminal and data input method
US8340726B1 (en) 2008-06-30 2012-12-25 Iwao Fujisaki Communication device
US8452307B1 (en) 2008-07-02 2013-05-28 Iwao Fujisaki Communication device
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9865263B2 (en) * 2009-12-01 2018-01-09 Nuance Communications, Inc. Real-time voice recognition on a handheld device
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US8977584B2 (en) 2010-01-25 2015-03-10 Newvaluexchange Global Ai Llp Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9953653B2 (en) 2011-01-07 2018-04-24 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10776830B2 (en) 2012-05-23 2020-09-15 Google Llc Methods and systems for identifying new computers and providing matching services
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN104769668B (zh) 2012-10-04 2018-10-30 纽昂斯通讯公司 改进的用于asr的混合控制器
US10650066B2 (en) 2013-01-31 2020-05-12 Google Llc Enhancing sitelinks with creative content
US10735552B2 (en) 2013-01-31 2020-08-04 Google Llc Secondary transmissions of packetized data
EP2954514B1 (en) 2013-02-07 2021-03-31 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
HK1220268A1 (zh) 2013-06-09 2017-04-28 苹果公司 用於實現跨數字助理的兩個或更多個實例的會話持續性的設備、方法、和圖形用戶界面
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
JP2016521948A (ja) 2013-06-13 2016-07-25 アップル インコーポレイテッド 音声コマンドによって開始される緊急電話のためのシステム及び方法
KR101749009B1 (ko) 2013-08-06 2017-06-19 애플 인크. 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
DE202015006142U1 (de) 2014-09-02 2015-12-09 Apple Inc. Elektronische Touch-Kommunikation
WO2016036427A1 (en) 2014-09-02 2016-03-10 Apple Inc. Electronic device with rotatable input mechanism
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10708313B2 (en) 2016-12-30 2020-07-07 Google Llc Multimodal transmission of packetized data
US10593329B2 (en) 2016-12-30 2020-03-17 Google Llc Multimodal transmission of packetized data
US10971157B2 (en) 2017-01-11 2021-04-06 Nuance Communications, Inc. Methods and apparatus for hybrid speech recognition processing
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB196282A (en) * 1922-04-15 1924-01-10 Albert Weitz Improvements in beam calipers and similar measuring apparatus
US4394538A (en) * 1981-03-04 1983-07-19 Threshold Technology, Inc. Speech recognition system and method
EP0071716B1 (en) * 1981-08-03 1987-08-26 Texas Instruments Incorporated Allophone vocoder
JPS59100659A (ja) * 1982-11-30 1984-06-09 Sharp Corp ワイヤレスフオン
JPS60198957A (ja) * 1984-03-21 1985-10-08 Kosaburo Sato 電気通信線利用の超小型コンピユ−タ−遠隔制御装置
DE3519915A1 (de) * 1985-06-04 1986-12-04 Telefonbau Und Normalzeit Gmbh, 6000 Frankfurt Verfahren zur spracherkennung an endgeraeten von fernmelde-, insbesondere fernsprechanlagen
US4775928A (en) * 1985-10-30 1988-10-04 Westinghouse Electric Corp. Hand-held wireless computer controller system
GB2183880A (en) * 1985-12-05 1987-06-10 Int Standard Electric Corp Speech translator for the deaf
US5218188A (en) * 1989-10-24 1993-06-08 Norand Corporation Compact hand-held RF data terminal
JPS63133793A (ja) * 1986-11-25 1988-06-06 Nec Corp 構内電話交換方式
US5136285A (en) * 1988-05-20 1992-08-04 Man Design Co., Ltd. Portable data transmitting/receiving apparatus
JP2589807B2 (ja) * 1988-05-20 1997-03-12 日東工器株式会社 携帯型データ送受信装置
JPH0251944A (ja) * 1988-08-15 1990-02-21 Nec Corp 自動ダイヤル電話機
US5065360A (en) * 1989-01-10 1991-11-12 Kelly Douglas J Portable data storage and editing device
US5150357A (en) * 1989-06-12 1992-09-22 Emil Hopner Integrated communications system
JPH0381817A (ja) * 1989-08-25 1991-04-08 Hitachi Ltd 手書入力情報処理装置およびこの手書入力情報処理装置を用いた手書入力情報システム
JPH03132797A (ja) * 1989-10-19 1991-06-06 Matsushita Electric Ind Co Ltd 音声認識装置
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
GB2240203A (en) * 1990-01-18 1991-07-24 Apple Computer Automated speech recognition system
FI85776C (fi) * 1990-08-20 1992-05-25 Nokia Oy Ab Transportabel personlig arbetsstation.
GB9021489D0 (en) * 1990-10-03 1990-11-14 Ensigma Ltd Methods and apparatus for verifying the originator of a sequence of operations
FR2669131A1 (fr) * 1990-10-24 1992-05-15 Widmer Michel Dispositif ordinateur de telecommunication portatif.
GB2264209B (en) * 1992-02-06 1995-11-08 Technophone Ltd Cordless telephone arrangement
DE69328702T2 (de) * 1992-03-30 2000-10-26 Canon K.K., Tokio/Tokyo Gerät und Verfahren zur Bildverarbeitung
US5260989A (en) * 1992-05-21 1993-11-09 International Business Machines Corporation Method and system for enhanced data transmission in a cellular telephone system
DE4216509A1 (de) * 1992-05-19 1993-12-02 Deutsche Bundespost Telekom Einrichtung zur mobilen Kommunikation (hauptsächlich Datenfernübertragung) mit Hilfe der Technologie der sogenannten Schnurlosen Telefone
JPH066436A (ja) * 1992-06-23 1994-01-14 Hasegawa Electric Co Ltd 手書文字入力型電話機
JP2850674B2 (ja) * 1992-11-09 1999-01-27 レーム プロパティズ ビーブイ ペン操作可能な携帯型コミュニケータ
JP3179217B2 (ja) * 1992-11-16 2001-06-25 株式会社日立製作所 携帯用情報通信装置
JPH06251199A (ja) * 1993-02-26 1994-09-09 N T T Data Tsushin Kk 文字認識前処理装置
US5327486A (en) * 1993-03-22 1994-07-05 Bell Communications Research, Inc. Method and system for managing telecommunications such as telephone calls
US5422656A (en) * 1993-11-01 1995-06-06 International Business Machines Corp. Personal communicator having improved contrast control for a liquid crystal, touch sensitive display
US5546538A (en) * 1993-12-14 1996-08-13 Intel Corporation System for processing handwriting written by user of portable computer by server or processing by the computer when the computer no longer communicate with server
AU684872B2 (en) * 1994-03-10 1998-01-08 Cable And Wireless Plc Communication system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013535915A (ja) * 2010-07-26 2013-09-12 クゥアルコム・インコーポレイテッド 多重マイク位置選択性処理用のシステム、方法、装置、およびコンピュータ可読媒体
US9025782B2 (en) 2010-07-26 2015-05-05 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing

Also Published As

Publication number Publication date
US6125284A (en) 2000-09-26
EP0671721A3 (en) 1996-02-21
EP0671721A2 (en) 1995-09-13
EP1032189A3 (en) 2000-10-25
AU684872B2 (en) 1998-01-08
EP1032189A2 (en) 2000-08-30
EP1031963A3 (en) 2000-10-18
EP1031963A2 (en) 2000-08-30
AU1220295A (en) 1995-09-21
US6216013B1 (en) 2001-04-10

Similar Documents

Publication Publication Date Title
JPH0823383A (ja) 通信システム
JP3402100B2 (ja) 音声制御ホスト装置
US20130231160A1 (en) Multifunction Portable Electronic Device and Mobile Phone with Touch Screen, Internet Connectivity, and Intelligent Voice Recognition Assistant
CN101794577B (zh) 声音识别服务器、电话机、声音识别系统以及声音识别方法
US20020138274A1 (en) Server based adaption of acoustic models for client-based speech systems
US20020143551A1 (en) Unified client-server distributed architectures for spoken dialogue systems
JPH11215248A (ja) 通信システムおよびこれに用いられる無線通信端末装置
JPH08293830A (ja) 携帯電話機および表示アダプタ
KR20010051903A (ko) 음성인식에 기초한 무선장치용 사용자 인터페이스
CN1232338A (zh) 辅助移动电话机的免提机中简短消息的语音合成装置
WO1998047252A2 (en) Personal audio message processor and method
JP3138370B2 (ja) 情報処理装置
WO2007067880A2 (en) System and method for assisted speech recognition
US7593387B2 (en) Voice communication with simulated speech data
US6397079B1 (en) Augmenting the capabilities of transceivers
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
JP3276404B2 (ja) 端末データ入出力方法及び装置
TW399386B (en) Communication system
US20060029197A1 (en) One-touch user voiced message
JPH10190865A (ja) 移動端末音声認識/フォーマット文章作成システム
KR20050048035A (ko) 이모사운드 서비스 제공 방법 및 시스템
JP2002164993A (ja) 電話端末操作方法及び電話端末
JPH10276462A (ja) メッセージ伝送システム及びメッセージ伝送方法
JP2003281145A (ja) 情報検索表示システムおよび携帯端末装置
HK1015047B (en) Apparatus for generating text data on the basis of speech data input from terminal

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041005

A61 First payment of annual fees (during grant procedure)

Effective date: 20041022

Free format text: JAPANESE INTERMEDIATE CODE: A61

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071029

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees