JPH02502149A - 音声命令によって通話を終了させる方法 - Google Patents
音声命令によって通話を終了させる方法Info
- Publication number
- JPH02502149A JPH02502149A JP63507506A JP50750688A JPH02502149A JP H02502149 A JPH02502149 A JP H02502149A JP 63507506 A JP63507506 A JP 63507506A JP 50750688 A JP50750688 A JP 50750688A JP H02502149 A JPH02502149 A JP H02502149A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- predetermined
- user
- voice communication
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 claims description 89
- 230000004044 response Effects 0.000 claims description 52
- 238000001514 detection method Methods 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 32
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 230000000903 blocking effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 7
- 230000007257 malfunction Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000238366 Cephalopoda Species 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 208000032368 Device malfunction Diseases 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
- H04B1/44—Transmit/receive switching
- H04B1/46—Transmit/receive switching by voice-frequency signals; by pilot signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Selective Calling Equipment (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
音声命令によって通話を終了させる方法技術分野
本発明は、一般的に、音声認識制御システムに関する。
ざらに詳しくは、本発明は、特に移動無線電話機を利用する場合に生じるような
雑音の多い環境で使用するのに適したハンドフリー音声命令制御システムに関す
る。
背景技術
一般的に、無線電話システムおよび地上線電話システムのいずれの場合にも、ユ
ーザはハンドセットによって通信を行ない、このハンドセットはユーザの耳の近
くに位置する一端にスピーカを有し、他端にはユーザの口の近くに位置するマイ
クを有する。動作中、ユーザの一方の手はハンドセットを適切な方向に保持する
ためにふさがれるので、自動車を運転する等の動作は、ユーザの空いた方の手の
みによって行わなければはならない。ユーザにより大きな自由度を与えるため、
地上線電話システムにおいては、通常スピーカ電話機が利用される。近年、自動
車に使用する移動スピーカ電話機が開発された。例えば、いずれも本発明と同一
の出願人に付与されたイーストモンドによる米国特許第4,378,603号お
よび、ビルムアによる米国特許第4,400,584号にハンドフリー操作の移
動電話機が述べられている。
ハンドフリー制御システムとは、人間の声に応答し、自動車用の用途に特に望ま
しいものである。はとんどの移動無線電話機の送受信機としての機能(例えば、
オン/オフ、送信/受信、音量、スケルチ等)、または移動無線電話機としての
機能(例えば、押し釦ダイヤル、音声認識装置の学習、通話返答)は、如何なる
手動操作を必要とすることなく、音声命令によって容易に実現可能である。した
がって、移動スピーカ電話機に音声認識を使用すると、自動車の運転者がハンド
ルから手を離したり、道路から目をはなしたりする必要がなく、手を全く使用す
る必要のない通話を行える潜在的可能性がある。この特徴によって、手を使用し
ないで行える能力を拡大するばかりでなく、自動車で移動無線電話機を使用する
場合の安全性と便利性も与えられる。
残念ながら、移動無線電話機に完全なハンドフリー制御を適用すると、幾つかの
重要な障害が生じる。移動環境に音声認識を使用する場合、自動車に固有の高い
レベルの周辺の雑音が音声制御の信頼性に無視できない問題を生じる。
さらに一般に移動スピーカ電話機のマイクロフォンは、一般的に頭上にある自動
車のサン・バイザに取付けられる等ユーザの口から離れている。したがって、こ
れに必要な高いマイク感度によって、音声認!i!装置に入力される周囲のバッ
クグランドノイズ量が大幅に増大し、これはこのV、Hの認識に対する信頼度を
低下させる。
しかし、ざらに重要なことは、音声認識の誤動作の問題である。もし、音声命令
制御装置が「通話に対する返答」命令を誤って識別した場合、通話装置が必要で
ないときに「オフ・フック(受話器を外した)」状態となり、これは一般に一寸
した不便に過ぎない。しかし、もし制御装置が「通話終了」命令を誤って検出し
た場合、この制御装置は装置を「オン・フック(受話器を置いた)」状態にし、
この通話は予期せず終了してしまい、このことは少なくとも、ユーザにかなりの
欲求不満を与える。したがって、通話終了命令に対する音声認識の誤動作は、他
の命令語よりもざらに重大な結果を生じる。
このような理由によって、ハンドフリー電話機で通話を終了させる従来技術は、
厳しい制限を受けていた。大半のシステムは、通話はなお手動で返答し終了しな
ければならないため、完全にハンドフリーではない。例えば、セルラー移動無線
電話機は音声命令ダイヤルの特徴を提供できても、この電話機の場合、ユーザは
、音声命令システムを動作させるため、しばしば受話器を取上げる必要がある。
他の移動電話システムの場合、ユーザはハンドルに取付けた「通話終了」釦を動
作させる必要がある。ざらに、他の音声制御電話機システムは、単一の独立した
8葉の識別テンプレート(recognition template)に対応
する音声命令を認識することによって、通話を終了させる。雑音レベルが高い環
境では、実際上音声量i装置が誤動作し、通話を不用意に終了させる可能性があ
る。ざらに、ユーザが通話中不用意に音声命令語を発した場合、通話が終了する
可能性がある。この誤動作の可能性は、音声認識装置がユーザの音声の多様な特
性に強力に対応できる望ましい特徴を持つことによって、ざらに増大する。
したがって、ハンドフリー通話装置において、音声命令によって通話を終了させ
るだめの信頼できる方法を提供する必要がめる。
発明の概要
したがって、本発明の一般的な目的は、音声命令によって電話の通話を終了させ
る改良した方法と装置を提供することである。
ざらに本発明の特定の目的は、誤って通話を中断することが殆ど無く、完全にハ
ンドフリー操作の可能な改良したユーザと相互に作用可能な音声命令制御システ
ムを提供することである。
本発明によって、音声通話装置が提供され、この装置は、ユーザの話した命令語
に応答して音声命令制御システムによって与えられた命令信号によって制御され
る。この音声命令制御システムは音声認識ユニットを有し、これはユーザが発し
た第1の発声を予め設定した第1命令語に対応するものとして認識し、この認識
に応答して第1検出信号を導出し、ユーザが発した第2の発声を予め設定した第
2命令語に応答するものとして認識し、これに応答して第2検出信号を導出する
。この制御システムはさらに、デバイス゛制御装置を有し、この装置は所定の識
別時間間隔内に第1検出信号に続いて第2検出信号の発生する場合にのみ、これ
に応答して命令信号を発生し、この結果、もし予め設定した最大中断時間間隔を
超過した場合、第2命令語を認識しても、命令信号は発生されない。
好適な実施例の場合、ハンドフリーなユーザと相互に作用可能な音声命令制御シ
ステムは、移動スピーカ電話機を用いた自動車無線電話機に使用される。この制
御システムは、オフ・フック・モードから無線電話機を切替える機構を有し、こ
の場合、オン・フック・モードで通話経路が形成され、オン・フック信号に応答
して通話経路が遮断される。この制御システムは、またユーザが発した第1の発
声を第1の予め設定した終了命令語に応答するものとして認識し、この認識に応
答して第1検出信号を導出する機構。
ユーザが発した第1の発声の終了とユーザが発した第2の発声の開始との間の時
間間隔を測定し、この時間間隔が所定の中断時間間隔内の場合のみ、時間信号を
発生するタイマ、ユーザが発した第2の発声を第2の予め設定した終了命令語に
応答するものとして認識し、この認識に応答して第2検出信号を導出する機構、
タイマ信号と連続して発生する第1および第2検出信号にのみ応答して遮断信号
を発生する判定機構、遮断信号に応答、しユーザに指示を行う音声合成器、続い
てユーザが発した発声を予め設定したエラー命令語に対応するものとして認識し
、この認識に応答してエラー信号を導出する機構、およびもし遮断信号の発生の
後、エラー信号が所定の再接続期間内に発生しない場合にのみ、遮断信号に応答
してオン・フック信号を発生する訂正機構を有し、その結果、所定の再接続時間
間隔内にエラー命令語を認識することによって、終了命令語の認識が通話経路を
終了させるのを防止する。
図面の簡単な説明
第1図は、本発明によるハンドフリー・スピーカ電話機を用いる通話装置用の音
声命令制御システムのブロック図である。
第2A図および第2B図は、本発明の好適な実施例である制御システムにより実
行される動作の特定の詳細なシーケンスを示すフローチャートである。
発明を実施するための最良の形態
新規であると信じられる本発明の特徴は、特に添付の請求の範囲に詳しく述べら
れる。しかし、本発明自体は、この他の目的および利点と共に、添付図面と組合
わせて以下の詳細な説明を参照することにより、最もよく理解される。
音声認識は、雑音の多い環境において誤動作しやすい。
したがって、本発明はたとえ適切な命令シーケンスが認識された場合でも、通話
を継続する能力を提供するため、ユーザとの情報の相互作用と共に、時間の定ま
った語間の中断間隔を有する所定の2語の命令シーケンスを使用して通話終了手
順を開始する。連続する2つの発声の認識を必要とする音声認識文法構造を使用
することにより、連続して音声認識装置を使用した場合でも、通話中に発生する
誤認識の可能性を受容可能なレベルまで大巾に減少することができる。もし選択
した特定の命令語が複数の音節を有する場合、このシステムの信頼性はざらに強
化される。さらに、本発明は、もし音声合成装置が誤動作した場合、またはユー
ザが正しい命令を話そうとしなかった場合でも、ユーザに通話を継続する手段を
提供する。その結果、本発明は、周囲の雑音が高い条件においても、ユーザが高
い信頼性で音声命令によって電話の通話を遮断することを可能にする。
一般的に、この制御システムは、特定の音声命令に対応するユーザの発声の認識
を行うために待機している。好適な実施例の場合、通話の終了命令を表すために
2つの単語TERMINATE (終了) トC0NVER3ATION (
会話)を選択シタ。
TERMINATEとC0NVER3ATIONトイう語は、い−fれもm−コ
ノ語順にm−、両車語間にできるだで短いポーズをおいて認識さレネLfならな
い。コレら(7)TERMINATE トC0NVER3ATIONという単語
が認識されると、この制御システムは、TER)II−NATEという単語を合
成し、通話が終了しつつあることを指示する。この時点において、制御装置は受
信した音声を出力せず、所定の再接続時間間隔、例えば5秒間、待機した後通話
を終了させる。もし、ユーザが5秒間の待機時間中にC^LL(通話)という言
葉を発声した場合、制御装置は「ブザー音」を合成して通話が終了しないことを
示し、受信した音声を出力する。そこで制m装置は通話を終了させない。通話終
了手順の間にユーザとの間の相互作用のフィードバックを行うこの方法によれば
、もし音声認識装置が誤動作した場合、またはユーザがうつかり適切な命令語の
シーケンスを発声した場合でも、ユーザは通話を再接続することが可能になる。
ここで添付図面を参照して、第1図は本発明のユーザとの間の相互作用制御シス
テム100の一般的なブロック図を示す。このシステムは、基本的に音声通信装
置140に接続されたデバイス制i[l装置120によって構成される。
このシステムは、特に電話機ハンドセットよりむしろスピーカ電話機と共に使用
され、それにより、ユーザの手は自由となり他の操作を行うことができる。スピ
ーカ電話機150は、このハンドフリーの特徴を与えるため、音声経路の方向を
制御する。音声認識装置110は、ユーザからの口頭による命令を命令信号に変
換するため、スピーカ電話機とデバイス制WJ装置に結合される。このデバイス
制御装置は、音声認識装置とタイマ124から来る情報を監視する。制御装置は
、タイマをリセットする能力、通信装置をオン・フック状態にする能力、テンプ
レートを選択し音声認識装置110を動作させる能力、およびユーザにフィード
バックするために音声合成装置130に情報を提供する能力を有する。
音声通信装置140は、例えば、双方向無線システム、電話システム、インクコ
ム・システム等のようないずれかの無線または地上線音声通信システムの部分を
有してもよい。本実施例では、音声通信装置140は、セルラー移動無線電話機
のような無線電話送受信機である。このような無線電話機の詳細な説明は、rD
YNA T、A、C,■セルラー移動電話機」とう名称のモトローラ社取扱い
説明書68P81066E40号に記載されている。しかし、ハンドフリーなユ
ーザとの間に相互作用動作を保証する音声通信装置ならいずれを使用してもよい
。例えば、ハンドフリー制御を必要とするいずれの地上線電話機または単方向無
線送受信機もまた、本発明を利用することが可能である。
音声通信装置140は、送信経路144と受信経路142を利用して送信/受信
音声を通信チャンネルにインターフェースする。自動車無線電話機の好適な実施
例では、これらの経路は、全二重無線電話動作(duplex radiote
le−phon operation )のため1対の無線周波数(RF)チャ
ンネルに対してインターフェースを行うことが可能であり、または単方向動作の
ために単一のRFチャンネルに対してインターフェースを行うことも可能である
。
音声認識装置110は、入力音声信号158に基づいて音声認識を実行する。識
別中、音声比!i!装置110は以前に記憶していた言語テンプレートを入力音
声情報と比較する。本実施例の識別アルゴリズムは、はぼテンプレートとの整合
を決定するため、はぼ連続的な音声認識、動的時間ワービング(worping
) 、エネルギの正規化、およびチェビシェフ間隔測定を含む。IEEE音V#
言語および信号処理区tub m員ell(IEEE Internation
al Conference onAcoustic 5peech and
5ianal Processing) (1982年3月3日−5日)第2巻
、899−902頁に記載されたJ。
S、プライドル、M、D、ブラウンおよびR,M、チャンバーレインによる「結
合語の認識アルゴリズム」 (^nA1gorithm for Connec
ted Word Recognition)のような従来技術の認識アルゴリ
ズムもまた使用可能である。
本実施例では、8ビツトのマイクロコンピュータが音声認識装置110の機能を
実行する。ざらに、第1図の他の幾つかの制御システム・ブロックは、C0DE
C/FILTERとDSP(デジタル信号処理装置)の支援によって同じマイク
ロコンピュータによって部分的に実行される。
ブロック110の機能を実行するために使用可能な音声比I装置は、J、ペック
ハム、J、グリーン、J、キャニング、およびP、ステイーブンスによる「実時
間ハードウェア連続音声認識システムJ (A Real−Time Hard
ware Con−International Conference on
Acoustics、 5peech、 andSignal Proces
sing) (1982年3月3日−5日)、第2巻、863−866頁および
ここに含まれる参考文献に述べられている。しかし、本発明は、いかなる特定の
ハードウェアまたはいかなるタイプの音声認識にも限定されるものではない。特
に、本発明は、特定話者または非特定話者の音声認識、分離または連続的音声認
識、およびソフトウェアを基本とした、またはハードウェアを基本とした実行を
使用を意図するものである。
デバイス制御装置120は一般にマイクロプロセッサであって、これは音声通信
装置140、音声量IE装置110、および音声合成装置130の間のインター
フェースを行う。
デバイス制御装置120は、音声認識装置110によって与えられたデバイス制
御データ112を制御信号に変換し、これらの信号は特定の音声通信装置によっ
て認識することができる。これらの制御信号は、ユーザによって命令された特定
の動作機能を実行するために装置に命令を与える。
例えば、もしユーザが発した発声が予め設定した通話返答命令または通話終了命
令に対応する場合、デバイス制m+装置120は、制御バス148を介し適切な
フックスイッチ(hookswitch)制御信号を発生する。制御装置120
は、また制御ヘッドのロック解除、電話番号または他の動作機能の番号のダイア
ル等のような音声通信装置140の伯の機能である音声命令制御を実行する。
装置制御装置120は、また音声通信装置140の動作状態を表す装置状態デー
タ122を発生する。このデータは、音声合成装置130に供給され、スピーカ
176から出力されると、ユーザが認識できる音声に変換される。例えば、ユー
ザの発した発声が予め設定された音声命令に対応する場合、音声合成装置130
はその認識に応答してユーザに対する指示を合成する。状態情報はまた、音声に
よるダイアル・システム中に格納した名前および電話番号([事務所、555−
1234J等)、音声認識状態情報(「用意」、「終了しますか?」等)、また
は無線電話状態情報(「通話が終了しました」、「システムが混んでいます」等
)を有してもよい。
本実施例では、言語合成装置130として19チヤンネルのボコーダ(Voco
der)が使用される。このようなボコーダの例は、J、N、ホルムスによるr
JSRLJチャンネル・ボコーダJ (The JSRU Channel V
ocoder)と題する1980年2月付けIEE発行第127巻、パートド1
第1号、53ないし60頁に見ることが可能である。しかし、当業者に明らかな
ように、他のいかなる音声合成装置でも利用可能である。ざらに、本発明は、ユ
ーザに指示を与えるいがなる手段も音声合成ブロック130の基本的な返答機能
を実行することを意図している。例えば、禍覚的指示(例えば、LED、LCD
、CRT等)または聴覚的表示(例えば、トーン発生器または他の聴覚信号)で
代替することが可能である。
タイマ・ブロック124は、ユーザが発した第1の発声の終了とユーザが発した
第2の発声の開始との間の時間間隔の測定と、予め設定したTER)IINAT
E命令が認識されてからの再接続時間間隔の測定を行う。これらの時間間隔は、
データ・バス126を介して制御装置120によって初期化、読取り、およびリ
セットされることが可能である。これらタイマの動作は、第2図の詳細な説明を
参照すること。
スピーカ電話機150は、ハンドフリー制御システムの送信/受信音声切替え機
能と受信音声/返答音声の多重化機能を行う。ユーザが発した入力音声はマイク
152へ入力され、このマイクは、一般にユーザの口から離れた場所(例えば、
自動車のサン・バイザ上)に取付けられる。マイク152は、電気的な入力音声
信号を発生し、この信号はプリアンプ153によって増幅され、入力音声信号1
54はスピーカ電話機150に供給される。スピーカ電話機150は、入力信号
線158を介して154における入力音声信号を音声認識装置110に加える。
単方向システムでは、移動無線のユーザが話している場合、信号検出器160は
検出出力162を介して正の制御信号を与え、送信音声スイッチ156を閉じ、
検出出力164を介して負の制御信号を与え、受信音声スイッチ166を開く。
反対に、地上線の加入者が話している場合、信号検出器160は複数の反転した
信号を発生して受信音声スイッチ166を閉じ、一方送信音声スイッチ156を
開く。受信音声スイッチ166が閉じられている場合、音声通信装置140から
の受信機音声146は、受信音声スイッチ166を経由し、切替えられた受信音
声出力168を介してマルチプレクサ170に送られる。マルチプレクサ170
は、デバイス制御装置120からの多重制御信号128に応答して、音声合成装
置130からの音声返答オーディオ132と切替えられた受信オーディオ168
との間のオーディオ経路を制御する。デバイス制御装置が音声合成装置に情報を
送る場合はいつも、多重信号128はマルチプレクサ170に音声返答オーディ
オをスピーカに加えるように指示する。車両用スピーカ電話機のオーディオ17
2は、通常スピーカ176に供給される前にオーディオ増幅器174によって増
幅される。
ここで説明する車両用スピーカ電話機の実施例は、多数ある可能な構成の1つに
すぎない。例えば、音声認識装置110は、地上線加入者が話していると否とに
拘らず、移動ユーザの命令に常に応答できることが望ましい。このような場合、
入力音声信号154は、音声認識装置110に直接接続される。ざらに、幾つか
の通信システムの場合、オーディオ・スイッチ156および166を、信号検出
器からの制御信号に応答して等価だが反対の減衰を行う可変ゲイン装置に置き換
えると有利である場合がある。信号検出器160は、また地上線加入者または移
動ユーザが話しているか否かを表す信号をデバイス制御装置120に供給して、
音声比i1装置110が地上線加入者からの音声を誤って認識するのを防止する
のに使用することができる。
さて理解できるように、デバイス制御!l装置120はユーザとの間の相互通信
ハンドフリー音声命令制御システム100の心臓部である。技術上周知のもので
本発明に使用するのに適したデバイス制御1装置の例は、マイクロプロセッサで
ある。デバイス制m装置120の詳細な動作が、制御システム100用のソフト
ウェア・フローチャートによって説明される。
第2A図と第2B図は、通話終了命令シーケンスの期間中に制御システム100
によって実行されるステップのシーケンスを説明する。ステップ202から始ま
り、制m装置は、先ずステップ204で通信装置140の状態をチェックする。
もし通話が進行中でなければ、制御はステップ204に戻り、その結果、通話終
了命令シーケンスは実行されない。もし通話が進行中であれば、制御はシーケン
ス200に進み、このシーケンスは、2つの単語TER)fINATECONV
ER3ATIONの音声認識プロセスを示す。
適当な単H識テンプレートが先ずステップ206で選択される。次に、ステップ
208で、音声認識装置110は、ユーザの発した発声を認識するためにイネー
ブルにされる。ステップ210で、制tI装置は、ステップ252で通話の遮断
がユーザに対して直ちに指示されるように、電話の通話がまだ進行中であるかど
うかをチェックする。この指示は「通話が切れています」のような単品の合成で
もよいし、または他の可聴的または視覚的指示でよい。
もしまだ通話が行われている場合、ステップ212で制御装置は音声合成装置が
何らかの単語を認識したかどうかをテストする。もしまだ何らの単語も認識され
ていないなら、制御はステップ210に戻り、再び通話がまだ行われているかど
うかチェックする。しかし、もし単語がKX識されていると、ステップ214で
認識された単語の異なったパラメータに対して変数Wl、D1.およびT1を割
り当てる。ざらに詳しくは、変数W1は認識された単語に割り当てられる。間隔
距離、すなわち認識された単語と特定の単語のテンプレートとの整合性の量的な
測定変数は、変数D1として示される。変数T1は、単語1に対応する第1の発
声の終了と一致する時点に割り当てられ、これは終了時間として定義される。
ステップ216では、単語1に対する間隔距離D1は音声認識しきい値と比較さ
れ、これが所定の近似する程度に一致するか否かを決定する。すべての音声認識
アルゴリズムは、ある量的な認識しきい値を本来的に有し、これは発声がテンプ
レートと一致することが決定される前に合致しなければならない。希望すれば、
この音声認識しきい値は、誤動作を最小にする重要性のため、通話終了命令に対
しより高度な近似に対応するよう調整することが可能である。
もしDlが間隔距離しきい値以上であれば、制御はステップ210へ戻る。もし
Dlが間隔距離しきい値未満であれば、ステップ218で、認識した単語が予め
設定した通話終了命令に対応する正しい単Ha識テンプレートに対応するか否か
をチェックする。好適な実施例では、ステップ218は単にWlがTER)II
NATEという単語であるか否かをチェックする。もし丁ERHINATEとい
う単轟吾が認識されなかったなら、制御はシーケンス200の開始点に戻る。
もし認識された最初の単語がTER)IINATEであったなら、ステップ22
0でこの通話がまだ進行中であるか否か再びチェックされる。再び、通話が進行
中でない場合、ブロック252で「通話は切れています」という指示が出力され
、制御は開始ステップに戻る。もし通話がまだ進行中であれば、ステップ222
でTERMINATEという単語の終了からどれ位の時間が経過したかをチェッ
クする。もしこの時間が最大待機時間を超えたなら、制御はシーケンス200に
戻る。ステップ222は、制m装置が次の発声が認識されるまで無制限に待機し
ないことを保証する。もしこの待機時間を超えていなければ、ステップ224で
、第2の単語が認識されたか否かをチェックする。もし認識されないならば、ス
テップ220に戻る。もし第2の単語が認識されたならば、ステップ226で変
数W2.D2.およびT2が以下のように割当てられる。W2は認識された単語
に割当てられ、D2は認識された第2の単語の間隔距離に割当てられ、T2はユ
ーザが発した第2の発声の開始時点に割当てられる。ステップ228で再び、正
しいテンプレートの一致が実現したか否かを知るため、音声認識しきい値に対す
る間隔距離D2のチェックを行う。もし一致しない場合、制御はステップ220
に戻る。もしD2が必要な一致しきい値未満であれば、通話終了命令の正しい第
2の単語が認識されたか否か知るため、ステップ230で第2の単語の変数W2
がテストされる。好適な実施例では、第2の単語トL/ T C0NVER3A
TIONヲ使用する。もしW2がC0NVER3ATIONでなければ、制御は
再びシーケンス200に向けられる。
次に、ステップ232で、ユーザの発した第1の発声の終了からユーザの発した
第2の発声の開始迄の時間間隔、すなわち、Tl−72が予め設定した最大中断
時間間隔と比較される。これによって、2つの単語TERMINATEとC0N
−VER3ATIONが、これらの単語の間の特定の中断間隔未満の間隔で発生
したことが保証される。所定の中断時間間隔の選択は、適正なものであればいず
れの値でもいが、1秒未満が好ましい。好適な実施例の場合、使用する最大中断
時間間隔は300ミリ秒である。もしTl−T2が中断時間間隔以上であれば、
制御は再びシーケンス200に戻る。
シカし、もしTERMINATE C0NVER8ATIONが、コレラ単n
E (7)所定の中断時間間隔未満で正しい順序で認識されたなら、制御はステ
ップ234に進み、ここで制wJ装置はユーザにTERMINATE C0NV
ER3ATIONが認識サレタコトヲ指示する。再び、この指示は音声合成、視
覚手段、または聴覚手段によって実行されることができる。
ステップ236で、再接続タイマがスタートする。再接続タイマハ、TERMI
NATE C0NVER3ATIONヲH識シテカらの時間間隔を測定する。こ
の時、エラー命令の認識による妨害を防止するため、受信したオーディオ音を消
すことが望ましい。ステップ238で、再接続タイマが所定の最大再接続時間を
超えたかどうか、または通話が切れたかどうかを知るため、このタイマをチェッ
クする。好適な実施例では、このような最大再接続時間は2秒ないし10秒の範
囲であり、5秒が好ましい。もし再接続タイマがまだ終了せず、通話も依然継続
している場合、制御はステップ240に進み、ここで音声認識装置は、予め設定
したエラー命令に対応してユーザの発した発声を認識するため、プログラムされ
る。本実施例では、エラー命令としてCALLという単語が使用される。もし再
接続タイマが終了する前にエラー命令が認識されると、ステップ244で制御l
装置は通話が再接続されることを指示する。例えば、制m装置は通話が再び継続
されることを指示するため、ブザー音を合成することができ、通話を継続させる
ため、受信したオーディオ音を消去しない。次に、制御は、TERMINATE
C0NVER3ATIONト(、Nう単語を探すためシーケンス200に戻る
。もしエラー命令が再接続タイマが終了する前に認識されないと、デバイス制御
装置はユーザが制御装置に電話の通話を切ることを希望していると判断する。し
たがって、ステップ246で、この制御装置は通話装置をオン・フック状態に切
替える。
ステップ248で、音声認識装置はディセーブルされ、通話終了プロセスはステ
ップ250で終了する。
要約すれば、制御装置の実行する特定のステップのシーケンスによって、本発明
は、通話を終了させる信頼性のある方法を提供することが理解される。本発明で
は、通話終了命令認識シーケンスを認識した場合、幾つかの制約を加える必要が
ある。上述したように、通話終了手順に加える11J 約LIE、次(7)通す
’156 (例トLテTERHINATE トC0NVER−3ATIONとい
う単語を使用する場合)。(1)予め設定した通話終了命令は独立した2つの言
語の発声でなければならない(例えば、TERHINATE トC0NVER3
ATION) : (2) 発声は正しい順序でなければならない(例えば、T
ERMINATEが最初で、次ニC0NVER3ATIONがくる): (3)
最初ノ発声の終了と次の発声の開始との間に最大中断時間があること(例えば、
300ミリ秒):および(4)これが予め設定した音声認識一致基準を満足する
ことである。さらに、確認時間間隔が設けられ、その結果、ユーザは、エラー命
令を使用して通話を再接続することも可能である。
したがって、本発明によれば、高いバックグラウンド雑音レベルの環境で使用す
る場合でも、ハンドフリー制御システムに対して高い信頼性が提供される。例え
ば本発明は、ユーザが音声命令によって通話に返答し、通話を終了させようと希
望するいかなる条件で使用することが可能である。
一般的に、本発明は、地上線電話機または移動電話機いずれの場合にも、ハンド
フリーの機能を提供するスピーカ電話機と組合わせて使用される。しかし、本発
明はまた、ハンドセット電話機またはヘッドセット型の電話機にも十分適合する
。
ここで本発明の特定の実例を図示し説明したが、当業者は、ざらに変形と改良を
行うことができる。特に、TERHI−NATE、 C0NVER3ATION
、 aJl:ヒCALL(7)命令語は、上述の基準に合致する英語の単語を表
すものとして好適な実施例で選択されたものであるに過ぎないことを理解しなけ
ればはならない。しかし、特に異なった言語で使用する場合、もし希望すれば、
他の命令語を選択することも可能である。ここに開示し、特許を請求している基
本的な根底にある原理を保持するこのような変形は、全て本発明の範囲内のもの
である。
ト
手続補正書
平成2年4月6日
特許庁長官 吉 1)文 毅 殿
1、事件の表示
PCT/US88102885
2、発明の名称
音声通信装置および音声命令によって通話を終了させる方法
3、補正をする者
事件との関係 特許出願人
名 称 モトローラ・インコーホレーテッド6、補正の対象 請求の
範囲および明細書の発明の名称の欄
7、補正の内容
(1)請求の範囲は別紙のとおり。
(2)発明の名称を「音声通信装置および音声命令によって通話を終了させる方
法」に訂正する。
請求の範囲
一ザの発する命令語に応答して前記制御システムによって与えられる命令信号に
よって制御される音声通信装置において、前記制御システムは:前記音声通信経
路が確立されている期間少なくとも続いて起こる第1および第2のユーザの す
る発声を認識する音声認識手段から構成され、前記音声認識手段は:
前記音声通信経路が確立されている期間、ユーザの発した煎E第1の発声を、所
定の第1命令語に対応するものとして認識し、この認識に応答して第1検出信号
を導出する第1手段:
ユーザの発した酸第2の発声を、所定の第2の命令語に対応するものとして認識
し、7の第2命令語が認識される場合第2検出信号を導出し、前記所 の 2命
令語が認識されない場合前記所定の第1命令語の前記認識を取り消す第2手段:
および
前記第1検出信号の後で、所定の認識時間間隔内に発生する前記第2検出信号に
のみ応答して前記命令信号を発生する決定手段:
によって構成されることを特徴とする音声通信装置。
2、ユーザの発した第3の発声を、所定の第3命令語に対応するものとして認識
し、この認識に応答して第3検出信号を導出する第3手段:および
前記第3検出信号が、前記第2検出信号の後で、所定の照合時間間隔内に発生し
た場合、肛星迭亙手段が前記命令語を与えるのを阻止する訂正手段;によって構
成されることを特徴とする請求項1記載の音声通信装置。
3、前記所定の認識時間間隔が5秒未満であることを特徴とする請求項1記載の
音声通信装置。
4、前記所定の照合時間間隔が10秒未満であることを特徴とする請求項2記載
の音声通信装置。
5、ハンドフリーでユーザと相互に作用可能な音声命令制御システムを有する音
声通信装置であって、前記通信装置を通信経路の形成されるオフ・フック状態か
ら、通信経路を遮断するオン・フック信号に応答して、前記オン・フック状態に
切替える手段を含む通信装置において、前記制御システムは:
前記オフ・フック状態において、ユーザの発した第1の発声を、所定の第1終了
命令語に対応するものとして認識し、この認識に応答して第1検出信号を導出す
る第1手段;
前記ユーザの発した第1の発声の終了とユーザの発する続いて起こる第2の発声
の開始との間の中断時間間隔を測定し、測定した前記中断時間が所定の最大中断
時間間隔未満である場合にのみ、タイマ信号を与えるタイマ手段:
前記ユーザの発した第2の発声を、所定の第2終了命令語に対応するものとして
認識し、前記所の第2終了命令語が認識される場合第2検出信号を導出し、前記
所定の第2終了命令語が認識されない場合前記第1検出信号を取り消す第2手段
:および
前記タイマ信号および順次発生する前記第1および第2検出信号にのみ応答して
切断信号を導出する決定手段:
によって構成され、その結果
測定した前記中断時間間隔が所定の前記最大中断時間を超える場合のみ、前記第
2終了命令語の認識によって、前記通信経路を終了させないことを特徴とする音
声通信装置。
6、前記切断信号に応答してユーザに指示を与える手段:
ユーザの発した発声を、所定のエラー命令語に対応するものとして認識し、この
認識に応答してエラー信号を導出する第3手段:および前記エラー信号が、前記
切断信号の発生後で、所定の再接続時間間隔内に発生しない場合にのみ、前記切
断信号に応答して前記オン・フック信号を導出する訂正手段;
によって構成され、その結果
前記エラー命令語を前記所定の再接続時間内で認識することによって、前記終了
命令語の認識が前記通信経路の終了を防止させることを特徴とする請求項5記載
の音声通信装置。
7、前記音声通信装置が移動無線電話機であることを特徴とする請求項5記載の
音声通信装置。
8、前記音声通信装置がスピーカ電話機を含むことを特徴とする請求項5記載の
音声通信装置。
9、前記第1.第2.および第3認識手段が、結合された単語による音声認識を
実行することを特徴とする請求項5記載の音声通信装置。
10、前記所定の第1および第2終了命令語が、各々少なくとも2音節を有する
ことを特徴とする請求項5記載の音声通信装置。
11、前記所定の最大中断時間間隔が1秒未満であることを特徴とする請求項5
記載の音声通信装置。
12、前記指示出力手段が、音声合成装置であることを特徴とする請求項6記載
の音声通信装置。
13、前記所定の再接続時間が10秒未満であることを特徴とする請求項6記載
の音声通信装置。
14、音声認識および前記音声通信装置と他の置との間に確立された音声通信経
路を制御する装置の動作を制御する能力を有する音声通信装置を制御する方法に
おいて、前記方法は:前記音声通信経路を確立する段階;
ユーザが発した第1の発声を、所定の第1命令語に対応するものとして認識し、
この認識に応答して第1検出信号を導出する段階:
前記ユーザの発した第1の発声の終了とユーザの発する続いて起こる第2の発声
の開始との間の中断時間間隔を測定し、測定した前記中断時間間隔が所定の最大
中断時間間隔未満である場合のみ、タイマ信号を導出する段階;
ユーザの発する続いて起こる前記第2の発声を、所定の第2命令語に対応するも
のとして認識し、前記所定の第2命令語が認識される場合第2検出信号を導出し
、前記所定の第2命令語が検出されない場合ユーザの する第1の発声を認識す
る前に艮■Δヌタ段階:および
前記タイマ信号および順次に発生する前記第1および第2検出信号にのみ応答し
て第1装置制御信丹を導出する段階;
によって構成されることを特徴とする通信装置制御方法。
15、前記第1装置制御信号に応答してユーザに指示を与える段階;
ユーザの発した第3発声を、所定の第3の命令語に対応するものとして認識し、
この認識に対応してエラー信号を導出する段階:および前記第1装置制御信号の
発生後で所定の再接続時間内に前記エラー信号が発生しない場合にのみ、前記第
1装置制御信号に応答して第2装置制御信号を導出する段階;
をざらに含んで構成されることを特徴とする請求項14記載の方法。
16、前記音声通信装置が移動無線電話機であることを特徴とする請求項14記
載の方法。
17、前記音声通信装置がスピーカ電話機を含むことを特徴とする請求項14記
載の方法。
18、全ての認識段階が、結合された単語による音声認識を使用して実行される
ことを特徴とする請求項14記載の方法。
19、前記所定の第1および第2命令語が、各々少なくとも2音節を有すること
を特徴とする請求項14記載の方法。
20、前記所定の最大中断時間間隔が1秒未満であることを特徴とする請求項1
4記載の方法。
21、前期指示を与える段階が音声合成を使用して実行されることを特徴とする
請求項15記載の方法。
22、前記所定の再接続時間が10秒未満でおることを特徴とする請求項15記
載の方法。
国際調査報告
Claims (22)
- 1.音声命令制御システムを有し、ユーザの発する命令語に応答して前記制御シ ステムによって与えられる命令信号によって制御される音声通信装置にむいて、 前記制御システムは: ユーザの発した第1の発声を、所定の第1命令語に対応するものとして認識し、 この認識に応答して第1検出信号を導出する第1手段; ユーザの発した第2の発声を、所定の第2命令語に対応するものとして認識し、 この認識に応答して第2検出信号を導出する第2手段;および 前記第1検出信号の後で、所定の認識時間間隔内に発生する前記第2検出信号に のみ応答して前記命令信号を発生する決定手段; によって構成されることを特徴とする音声通信装置。
- 2.ユーザの発した第3の発声を、所定の第3命令語に対応するものとして認識 し、この認識に応答して第3検出信号を導出する第3手段;および 前記第3検出信号が、前記第2検出信号の後で、所定の照合時間間隔内に発生し た場合、前記命令語を阻止する訂正手段; によって構成されることを特徴とする請求項1記載の音声通信装置。
- 3.前記所定の認識時間間隔が5秒未満であることを特徴とする請求項1記載の 音声通信装置。
- 4.前記所定の照合時間間隔が10秒未満であることを特徴とする請求項2記載 の音声通信装置。
- 5.ハンドフリーでユーザと相互に作用可能な音声命令制御システムを有する音 声通信装置であって、前期通信装置を通信経路の形成されるオフ・フック状態か ら、通信経路を遮断する、フック信号に応答して、前記オン・フック状態に切替 える手段を含む通信装置において、前記制御システムは: ユーザの発した第1の発声を、所定の第1終了命令語に対応するものとして認識 し、この認識に応答して第1検出信号を導出する第1手段; 前記ユーザの発した第1の発声の終了とユーザの発する第2の発声の開始との間 の中断時間間隔を測定し、測定した前記中断時間が所定の最大中断時間間隔未満 である場合にのみ、タイマ信号を与えるタイマ手段;前記ユーザの発した第2の 発声を、所定の第2終了命令語に対応するものとして認識し、この認識に応答し て第2検出信号を導出する第2手段;および 前記タイマ信号および順次発生する前記第1および第2検出信号にのみ応答して 切断信号を導出する決定手段;によって構成され、その結果 測定した前記中断時間間隔が所定の前記最大中断時間を超える場合のみ、前記第 2終了命令語の認識によって、前記通信経路を終了させないことを特徴とする音 声通信装置。
- 6.前記切断信号に応答してユーザに指示を与える手段;ユーザの発した発声を 、所定のエラー命令語に対応するものとして認識し、この認識に応答してエラー 信号を導出する第3手段;および 前記エラー信号が、前記切断信号の発生後で、所定の再接続時間間隔内に発生し ない場合にのみ、前記切断信号に応答して前記オン・フック信号を導出する訂正 手段;によって構成され、その結果 前記エラー命令語を前記所定の再接続時間内で認識することによって、前記終了 命令語の認識が前記通信経路の終了を防止させることを特徴とする請求項5記載 の音声通信装置。
- 7.前記音声通信装置が移動無線電話機であることを特徴とする請求項5記載の 音声通信装置。
- 8.前記音声通信装置がスピーカ電話機を含むことを特徴とする請求項5記載の 音声通信装置。
- 9.前記第1,第2,および第3認識手段が、連続する単語による音声認識を実 行することを特徴とする請求項5記載の音声通信装置。
- 10.前記所定の第1および第2終了命令語が、各々少なくとも2音節を有する ことを特徴とする請求項5記載の音声通信装置。
- 11.前記所定の最大中断時間間隔が1秒未満であることを特徴とする請求項5 記載の音声通信装置。
- 12.前記指示出力手段が、音声合成装置であることを特徴とする請求項6記載 の音声通信装置。
- 13.前記所定の再接続時間が10秒未満であることを特徴とする請求項6記載 の音声通信装置。
- 14.音声認識および装置の動作を制御する能力を有する音声通信装置を制御す る方法において、前記方法は;ユーザが発した第1の発声を、所定の第1命令語 に対応するものとして認識し、この認識に応答して第1検出信号を導出する段階 ; 前記ユーザの発した第1の発声の終了とユーザの発する第2の発声の開始との間 の中断時間間隔を測定し、測定した前記中断時間間隔が所定の最大中断時間間隔 未満である場合のみ、タイマ信号を導出する段階;前記ユーザの発した第2の発 声を、所定の第2命令語に対応するものとして認識し、この認識に応答して第2 検出信号を導出する段階;および 前記タイマ信号および順次に発生する前記第1および第2検出信号にのみ応答し て第1装置制御信号を導出する段階; によって構成されることを特徴とする通信装置制御方法。
- 15.前記第1装置制御信号に応答してユーザに指示を与える段階; ユーザの発した第3発声を、所定の第3の命令語に対応するものとして認識し、 この認識に対応してエラー信号を導出する段階;および 前記第1装置制御信号の発生後で所定の再接続時間内に前記エラー信号が発生し ない場合にのみ、前記第1装置制御信号に応答して第2装置制御信号を導出する 段階;をさらに含んで構成されることを特徴とする請求項14記載の方法。
- 16.前記音声通信装置が移動無線電話機であることを特徴とする請求項14記 載の方法。
- 17.前記音声通信装置がスピーカ電話機を含むことを特徴とする請求項14記 載の方法。
- 18.全ての認識段階が、連続する単語による音声認識を使用して実行されるこ とを特徴とする請求項14記載の方法。
- 19.前記所定の第1および第2命令語が、各々少なくとも2音節を有すること を特徴とする請求項14記載の方法。
- 20.前記所定の最大中断時間間隔が1秒未満であることを特徴とする請求項1 4記載の方法。
- 21.前期指示を与える段階が音声合成を使用して実行されることを特徴とする 請求項15記載の方法。
- 22.前記所定の再接続時間が10秒未満であることを特徴とする請求項15記 載の方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US10515187A | 1987-10-02 | 1987-10-02 | |
| US105,151 | 1987-10-02 | ||
| US105151 | 1987-10-02 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH02502149A true JPH02502149A (ja) | 1990-07-12 |
| JP2673716B2 JP2673716B2 (ja) | 1997-11-05 |
Family
ID=22304314
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63507506A Expired - Fee Related JP2673716B2 (ja) | 1987-10-02 | 1988-08-24 | 音声通信システム及び音声通信装置を制御する方法 |
Country Status (11)
| Country | Link |
|---|---|
| EP (1) | EP0393059B1 (ja) |
| JP (1) | JP2673716B2 (ja) |
| KR (1) | KR960004692B1 (ja) |
| AR (1) | AR244482A1 (ja) |
| AT (1) | ATE119724T1 (ja) |
| AU (1) | AU609527B2 (ja) |
| BR (1) | BR8807726A (ja) |
| CA (1) | CA1290871C (ja) |
| DE (1) | DE3853294T2 (ja) |
| IL (1) | IL87377A (ja) |
| WO (1) | WO1989003139A1 (ja) |
Cited By (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016004270A (ja) * | 2014-05-30 | 2016-01-12 | アップル インコーポレイテッド | 手動始点/終点指定及びトリガフレーズの必要性の低減 |
| US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
| US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
| US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
| US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
| US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
| US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
| US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
| US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
| JP2019057876A (ja) * | 2017-09-22 | 2019-04-11 | 沖電気工業株式会社 | 端末、プログラム、通信方法及び通信システム |
| US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
| US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
| US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
| US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
| US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
| US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
| US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
| US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
| US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100266203B1 (ko) * | 1997-08-01 | 2000-09-15 | 구자홍 | 음성 및 펜입력을 갖는 소형 정보 단말기 |
| KR20010094229A (ko) * | 2000-04-04 | 2001-10-31 | 이수성 | 전화기의 음성인식 조작 방법 및 시스템 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58130635A (ja) * | 1982-01-07 | 1983-08-04 | ゼネラル・エレクトリツク・カンパニイ | 音声制御の移動式状態装置及びその作動方法 |
| JPS59176793A (ja) * | 1983-03-25 | 1984-10-06 | シャープ株式会社 | 単語音声認識装置 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4348550A (en) * | 1980-06-09 | 1982-09-07 | Bell Telephone Laboratories, Incorporated | Spoken word controlled automatic dialer |
| US4525793A (en) * | 1982-01-07 | 1985-06-25 | General Electric Company | Voice-responsive mobile status unit |
| US4426733A (en) * | 1982-01-28 | 1984-01-17 | General Electric Company | Voice-controlled operator-interacting radio transceiver |
-
1988
- 1988-08-08 IL IL87377A patent/IL87377A/xx not_active IP Right Cessation
- 1988-08-10 CA CA000574301A patent/CA1290871C/en not_active Expired - Lifetime
- 1988-08-24 AU AU23826/88A patent/AU609527B2/en not_active Ceased
- 1988-08-24 BR BR888807726A patent/BR8807726A/pt not_active IP Right Cessation
- 1988-08-24 AT AT88908527T patent/ATE119724T1/de not_active IP Right Cessation
- 1988-08-24 DE DE3853294T patent/DE3853294T2/de not_active Expired - Fee Related
- 1988-08-24 WO PCT/US1988/002885 patent/WO1989003139A1/en not_active Ceased
- 1988-08-24 EP EP88908527A patent/EP0393059B1/en not_active Expired - Lifetime
- 1988-08-24 KR KR1019890700967A patent/KR960004692B1/ko not_active Expired - Fee Related
- 1988-08-24 JP JP63507506A patent/JP2673716B2/ja not_active Expired - Fee Related
- 1988-09-14 AR AR88311929A patent/AR244482A1/es active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58130635A (ja) * | 1982-01-07 | 1983-08-04 | ゼネラル・エレクトリツク・カンパニイ | 音声制御の移動式状態装置及びその作動方法 |
| JPS59176793A (ja) * | 1983-03-25 | 1984-10-06 | シャープ株式会社 | 単語音声認識装置 |
Cited By (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
| US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
| US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
| US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
| US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
| US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
| US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
| US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
| US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
| US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
| US12118999B2 (en) | 2014-05-30 | 2024-10-15 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| JP2016004270A (ja) * | 2014-05-30 | 2016-01-12 | アップル インコーポレイテッド | 手動始点/終点指定及びトリガフレーズの必要性の低減 |
| US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
| US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
| US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
| US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
| US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
| US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
| US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
| US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
| US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
| JP2019057876A (ja) * | 2017-09-22 | 2019-04-11 | 沖電気工業株式会社 | 端末、プログラム、通信方法及び通信システム |
Also Published As
| Publication number | Publication date |
|---|---|
| IL87377A0 (en) | 1989-01-31 |
| AU609527B2 (en) | 1991-05-02 |
| IL87377A (en) | 1992-01-15 |
| EP0393059B1 (en) | 1995-03-08 |
| BR8807726A (pt) | 1990-08-07 |
| JP2673716B2 (ja) | 1997-11-05 |
| KR890702345A (ko) | 1989-12-23 |
| KR960004692B1 (ko) | 1996-04-11 |
| DE3853294T2 (de) | 1995-10-12 |
| WO1989003139A1 (en) | 1989-04-06 |
| ATE119724T1 (de) | 1995-03-15 |
| AU2382688A (en) | 1989-04-18 |
| EP0393059A1 (en) | 1990-10-24 |
| DE3853294D1 (de) | 1995-04-13 |
| EP0393059A4 (en) | 1990-12-12 |
| AR244482A1 (es) | 1993-10-29 |
| CA1290871C (en) | 1991-10-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4945570A (en) | Method for terminating a telephone call by voice command | |
| JPH02502149A (ja) | 音声命令によって通話を終了させる方法 | |
| KR0129856B1 (ko) | 음성명령에 의한 디지트 시퀀스르 입력하기 위한 방법 | |
| JP2654942B2 (ja) | 音声通信装置及びその動作方法 | |
| US6493670B1 (en) | Method and apparatus for transmitting DTMF signals employing local speech recognition | |
| JPS63238752A (ja) | 音声認識電話機 | |
| JP2001308970A (ja) | 携帯電話の音声認識操作方法及びシステム | |
| US6256611B1 (en) | Controlling a telecommunication service and a terminal | |
| US5842139A (en) | Telephone communication terminal and communication method | |
| US20070047708A1 (en) | Voice call reply using voice recognition and text to speech | |
| JPH04108246A (ja) | ハンズフリー電話装置 | |
| US6625474B1 (en) | Method and apparatus for audio signal based answer call message generation | |
| US11056106B2 (en) | Voice interaction system and information processing apparatus | |
| JPH11331328A (ja) | ハンズフリー電話装置 | |
| KR19990024488A (ko) | 차량 전화기의 핸즈 프리 장치 | |
| JP4299768B2 (ja) | 音声認識装置、方法及び音声認識方法を用いた携帯型情報端末装置 | |
| JP3384282B2 (ja) | 電話装置 | |
| JPH01135132A (ja) | ハンズフリー電話機 | |
| JPH04192852A (ja) | ダイヤル番号発信方法 | |
| JP2974427B2 (ja) | 音声通信システムとその音声通信装置 | |
| GB2209906A (en) | Telephone instrument | |
| JPH03204699A (ja) | 音声制御装置及び音声入力装置 | |
| JPH04286443A (ja) | 電話機の保留制御装置 | |
| JPS63236451A (ja) | 音声ダイアル制御装置 | |
| JPS63232727A (ja) | 電話装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |