JPH09244686A5 - - Google Patents

Info

Publication number
JPH09244686A5
JPH09244686A5 JP1997026970A JP2697097A JPH09244686A5 JP H09244686 A5 JPH09244686 A5 JP H09244686A5 JP 1997026970 A JP1997026970 A JP 1997026970A JP 2697097 A JP2697097 A JP 2697097A JP H09244686 A5 JPH09244686 A5 JP H09244686A5
Authority
JP
Japan
Prior art keywords
standard
pattern
input
current
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1997026970A
Other languages
English (en)
Other versions
JPH09244686A (ja
Filing date
Publication date
Priority claimed from GBGB9602699.2A external-priority patent/GB9602699D0/en
Application filed filed Critical
Publication of JPH09244686A publication Critical patent/JPH09244686A/ja
Publication of JPH09244686A5 publication Critical patent/JPH09244686A5/ja
Pending legal-status Critical Current

Links

Claims (60)

  1. 入力信号を表す入力パターンシーケンスと複数の格納された標準パターンシーケンスとの間のダイナミックプログラミングマッチング処理を実行する方法であって、該標準パターンシーケンスは標準信号を表し、該方法は少なくとも標準信号の幾つかに関連して各入力パターンを順次処理するものであり、
    (1)処理中の現入力パターンに対するダイナミックプログラミングパスの終点における標準信号の標準パターンをアクティブパターンとして定義し、各パスは標準パターンシーケンスと、該現入力パターンまでの入力パターンシーケンスとの間のマッチング候補を表し、そして該現入力パターンに関するアクティブパターンを現アクティブリストに登録し、
    (2)各アクティブパターンに対して、当該アクティブパターンに対応して設けられた格納部に、前記現入力パターンに対する当該アクティブパターンで終わるダイナミックプログラミングパスのスコアを表す累積値を格納し、
    (3)現標準信号の各アクティブパターンを逆方向順に処理することによって、ダイナミックプログラミングパスに課された制限に基づいて、前記累積値を更新するとともに前記ダイナミックプログラミングパスを伝搬させるために、
    (A)前記現入力パターンを用いて、処理中の現アクティブパターンに関連する格納部に格納された累積値を更新し、
    (B)前記現アクティブパターンに関連するダイナミックプログラミングパスを伝搬させ、もしそれがリストに無ければ、次の入力パターンのためのダイナミックプログラミングパスの終点となる標準信号の各標準パターンを新規アクティブリストに登録し、
    現在の標準信号の各ダイナミックプログラミングパスの伝搬が現標準信号関連するポインタを用いて制御され、該ポインタは、前回のアクティブパターンの完了の後に、前記新規アクティブリストにリストされた現標準信号のパターンのシーケンスにおける最も手前の標準パターンを特定し、これによって、現標準信号の内のどの標準パターンが先行するアクティブパターンを処理した結果として新規アクティブリストに登録されたかを検索する必要なしに各ダイナミックプログラミングパスの伝搬が達成される
    ことを特徴とする情報処理方法。
  2. 前記工程(3)の(B)において、
    (i)ダイナミックプログラミングパスの伝搬に課せられた前記制限に基づいて、現標準信号のどの標準パターンが、前記次の入力パターンについて前記現アクティブパターンで終わるダイナミックプログラミングパスの終点に存在する可能性のあるかを判断し、
    (ii)工程(i)で決定された各標準パターンを処理することにより、ダイナミックプログラミングパスを伝搬させ、新規アクティブリストを更新し、工程(i)で決定された標準パターンに関連する格納部に適切な累積値を複写する
    ことを特徴とする請求項1に記載の情報処理方法。
  3. 前記工程(i)において決定される標準パターンについて、現アクティブパターンが該標準パターンの一つであればこれを除き、残された標準パターンの各々が
    (a)処理中の現標準パターンが前記ポインタによって特定されるどの標準パターンをも越えていまうかどうか判断し、
    (b)シーケンス上において、現標準パターンが特定された標準パターンと同じ位置かもしくはそれを越える場合であって、前記現アクティブパターンに関連する格納部に格納された累積値が現標準パターンに関連する格納部に既に格納されている累積値よりも良い場合、該現アクティブパターンに関連する格納部に格納された累積値を該現標準パターンに関連する格納部にコピーし、
    (c)シーケンス上において現標準パターンが特定された標準パターンよりも前であるか、前記新規アクティブリスト内に現標準信号の標準パターンが無い場合、前記現アクティブパターンに関連する格納部に格納された累積値を前記現標準パターンに関連する格納部にコピーし、前記新規アクティブリストに該現標準パターンを登録する
    ことを特徴とする請求項2に記載の情報処理方法。
  4. 前記工程(i)において決定された標準パターンの一つが現アクティブパターンである場合、前記工程(ii)における現アクティブパターンの処理は、該現アクティブパターンがダイナミックプログラミングプロセスに課せられたいかなる制限にも違反しない場合に、該現アクティブパターンを前記新規アクティブリストに登録する
    ことを特徴とする請求項または3に記載の情報処理方法。
  5. 現アクティブパターンの処理によって前記新規アクティブリストを更新した後に、現標準信号に関連する前記ポインタが、新規アクティブリスト上の、現標準信号のパターンのシーケンスにおける最も早い標準パターンを指示するように設定される
    ことを特徴とする請求項1乃至4のいずれかに記載の情報処理方法。
  6. 現入力パターンの処理は次の入力パターンが受信される前に実行されることを特徴とする請求項1乃至5のいずれかに記載の情報処理方法。
  7. 最初の入力パターンが処理される前に入力信号全体が受信されることを特徴とする請求項1乃至5のいずれかに記載の情報処理方法。
  8. 各標準信号がそれに関連付けられた現アクティブリストと新規アクティブリストを有することを特徴とする請求項1乃至7のいずれかに記載の情報処理方法。
  9. 標準パターンが前記新規アクティブリストに追加される場合に、それが当該リストの最後に置かれることを特徴とする請求項1乃至8のいずれかに記載の情報処理方法。
  10. 前記工程(ii)において処理された標準パターンが、シーケンスの方向と逆方向に処理されることを特徴とする請求項2乃至9のいずれかに記載の情報処理方法。
  11. 現アクティブパターンに関連する累積値がしきい値よりも良好である場合、該現アクティブパターンに対して前記工程(3)のみを実行することを特徴とする請求項1乃至10のいずれかに記載の情報処理方法。
  12. 前記しきい値は、各入力パターンについて処理されるアクティブパターンの数を与えられた最大数よりも小さく保つように変更されることを特徴とする請求項11に記載の情報処理方法。
  13. 次の入力パターンの処理を行う間に用いられる前記しきい値が、現入力パターンの処理中に、新規アクティブリスト中の、もしくは次の入力パターンのためのリスト中の標準パターンの数の合計に基づいて決定されることを特等とする請求項12に記載の情報処理方法。
  14. 前記ダイナミックプログラミングの制限の一つが、同じダイナミックプログラミングパス上において、標準パターンがマッチし得る連続的な入力パターンの数に関する制限であることを特徴とする請求項1乃至13のいずれかに記載の情報処理方法。
  15. 前記ダイナミックプログラミングの制限の一つが、標準パターンが入力パターンとマッチする場合に、同一のダイナミックプログラミングパス上において、シーケンス上当該標準パターンを越える位置にある標準パターンのうちの、次の入力パターンにマッチングさせることが可能な標準パターンの数を制限することを特徴とする請求項1乃至14のいずれかに記載の情報処理方法。
  16. 前記ダイナミックプログラミングの制限の一つが、標準パターンが入力パターンとマッチする場合に、同一のダイナミックプログラミングパス上において、シーケンス上、その標準パターンよりも手前にある標準パターンは次に入力されたパターンとマッチングさせることができないことであることを特徴とする請求項1乃至15のいずれかに記載の情報処理方法。
  17. 前記標準パターンはテンプレートで表され、前記累積値は距離の尺度であることを特徴とする請求項1乃至16のいずれかに記載の情報処理方法。
  18. 前記標準パターンは統計的モデルを表し、前記累積値は確率的尺度であることを特徴とする請求項1乃至16のいずれかに記載の情報処理方法
  19. 一つの標準信号内を伝わるダイナミックプログラミングパスが続いて他の標準信号に伝わることを可能とすることにより、前記入力信号を前記標準信号のシーケンスとマッチング可能とすることを特徴とする請求項1乃至18のいずれかに記載の情報処理方法。
  20. 標準パターンから現入力パターンへ出る全てのダイナミックプログラミングパスのうち、最良の累積値を有するダイナミックプログラミングパスのみが先へ進みうることを特徴とする請求項19に記載の情報処理方法。
  21. 入力信号がマッチングされ得る前記標準信号のシーケンスは、特定された規則によって制限されることを特徴とする請求項19または20に記載の情報処理方法。
  22. 現入力パターンが標準信号に関して処理された後、新規アクティブリストを更新するために、及びそれら標準信号の開始点における標準パターンであって対応する標準信号に入っているダイナミックプログラミングパスの終点に対応する可能性のある標準パターンに関する累積値を更新するために、当該標準信号に入りうる全てのダイナミックプログラミングパスの最良の累積値を用いて、前記制限に基づいてそれら標準信号を処理することを特徴とする請求項19乃至21のいずれかに記載の情報処理方法。
  23. 前記入力信号は音声信号を表し、各入力パターンは対応する時間フレーム間の音声信号の音響的特徴を表す複数のパラメータを備えることを特徴とする請求項1乃至22のいずれかに記載の情報処理方法。
  24. 前記入力音声信号は標準音声信号のシーケンスにマッチングされ、該シーケンスは言語モデルによって規定されることを特徴とする請求項23に記載の情報処理方法。
  25. 前記現入力パターンの処理において、標準信号を出るダイナミックプログラミングパスの終点が以降に入力されるパターンのためのバックグラウンドノイズを表すパターンとマッチングされることを特徴とする請求項24に記載の情報処理方法。
  26. 入力音声信号を複数の標準音声信号と比較することによって認識する音声認識方法であって、
    前記入力音声信号を表す入力パターンシーケンスを抽出する抽出工程と、
    標準パターンシーケンスを格納する格納工程と、該標準パターンシーケンスの各々は対応する標準音声信号を表し、
    請求項23乃至25のいずれかに記載の方法を用いて、前記入力パターンシーケンスと前記標準音声信号とのマッチングを行うマッチング工程と、
    前記マッチング工程で決定された累積値より認識結果を提供する工程と
    を備えることを特徴とする音声認識方法。
  27. 前記認識結果は、前記シーケンスにおける最終の入力パターンにて終わるダイナミックプログラミングパスのうちの、最良の累積値を有するパスを決定することによって提供されることを特徴とする請求項26に記載の音声認識方法。
  28. パターンマッチングシステムで用いられる既存の標準モデルを更新する方法であって、該標準モデルの各々は標準パターンシーケンスを有し、
    (a)内容が既知である複数の入力信号を入力し、
    (b)入力パターンを表すシーケンスを生成するために入力信号の各々を処理し、
    (c)各入力信号に対して、前記入力パターンを表すシーケンスと、当該入力信号中に存在することがわかっている信号の既存の標準モデルの標準パターンシーケンスに関連付けを行い、
    (d)1つまたはそれ以上の入力信号の複数の入力パターンに関連付けられた各標準パターンについて、
    (i)関連付けれた入力信号の入力パターンを結合する工程と、
    (ii)当該標準パターンを前記工程(i)において結合された入力パターンで置き換える工程と
    を備えることを特徴とする情報処理方法。
  29. 前記関連付けられた入力パターンは、それらを平均化することにより結合されることを特徴とする請求項28に記載の情報処理方法。
  30. 前記標準モデルは音声を表し、前記入力信号は、その音声内容が既知の音声信号であることを特徴とする請求項28または29に記載の情報処理方法。
  31. 各標準モデルが1つまたはそれ以上のワードを表すことを特徴とする請求項30に記載の情報処理方法。
  32. 少なくとも一つの入力信号との関連付けが行なわれた標準モデルの各標準パターンにおいて、前記入力信号の入力パターンのいずれにも関連付けられない標準パターンを、当該標準モデル内の既に置き換えられた標準パターンのうちの隣接する標準パターンを用いて補間もしくは外挿を行って得られたパターンで置き換えることを特徴とする請求項28乃至31のいずれかに記載の情報処理方法。
  33. 前記標準パターンは、最も近くの隣接する標準パターンを用いて得られた補間値もしくは外挿値で置き換えられることを特徴とする請求項32に記載の情報処理方法。
  34. 請求項1乃至33のいずれかに記載の方法を実行するためのソフトウエアプログラムを格納するデータ保持媒体。
  35. 請求項1乃至33のいずれかに従う方法を実行することを特徴とする情報処理装置。
  36. 電話システムを制御する制御システムであって、
    前記電話システムを制御するための音声コマンドの入力を可能とするとともに、入力された音声コマンドと予め格納された標準モデルとの比較に基づいて認識結果を出力する音声認識ユーザインターフェースと、
    前記インターフェースから出力された前記認識結果に応じて、入力音声コマンドに従って前記電話システムを制御する制御手段とを備え、
    前記音声認識ユーザインターフェース連続的な音声コマンドを認識可能に適応させられ、該音声コマンドは所望の電話サービス及び他ユーザの識別を特定する複数のワードを有し、その認識は、格納された言語モデルによって許可されるワードモデルのシーケンスと入力された音声コマンドを比較することによって行なわれ、前記制御手段が入力された音声コマンドに対応する機能を実行する実行手段を備える
    ことを特徴とする制御システム。
  37. システムによって提供される電話サービスを制御するための音声コマンドの入力を可能とするとともに、入力された音声コマンドと予め格納された標準モデルとの比較に基づいて認識結果を出力する音声認識ユーザインターフェースと、
    前記インターフェースからの認識結果出力に基づいて、音声コマンドに対応する機能を実行する実行手段とを備え、
    前記システムの各ユーザは電話番号及び関連付けられた識別情報によって識別され、前記実行手段は、ユーザが前記音声認識ユーザインターフェースを介して別のユーザの識別情報のみを入力した場合に、現在のシステム状態情報を用いてどの電話サービスを欲しているかを予測する
    ことを特徴とする制御システム。
  38. 前記実行手段は、当該システムの現在の状態を表す情報に依存して当該システムのユーザと通話するよう適応され、該実行手段が、
    i)現在のシステム状態情報を保持し、
    ii)音声コマンドに対応する機能が現在のシステム状態情報と対立しないことをチェックし、
    iii)対立が無ければ、実行に先立って前記音声コマンドの確認をユーザに要求し、
    前記実行手段がユーザの確認を待つ間に生成される新たなシステム状態情報をバッファリングするためのバッファが提供される
    ことを特徴とする請求項36または37に記載の制御システム。
  39. 前記状態情報は、各ユーザについて、該ユーザは現在誰と通話しているか、該ユーザが誰にダイヤルしているか、誰が保留されているか、誰が該ユーザに電話しようとしているか、当該ユーザはメッセージを再生しているか否か、誰が該ユーザを保留しているか、誰が該ユーザを電話会議に招いたか、の少なくとも1つを備えることを特徴とする請求項37または38に記載の制御システム。
  40. 前記電話サービスは、発呼の設定、呼の転送、呼の保留、呼の戻し、会議の設定、メッセージの選択と再生の少なくとも1つを備えることを特徴とする請求項36乃至39のいずれかに記載の制御システム。
  41. 前記制御手段は、出荷時に予め格納された辞書を用いて、認識結果を補間する補間手段を更に備えることを特徴とする請求項36乃至40のいずれかに記載の制御システム。
  42. 前記システムにおける各ユーザは関連する格納手段を有し、格納手段は、他のユーザの電話番号及び関連付けられた識別情報を格納し、これによって、各ユーザは、前記音声認識ユーザインターフェースに対応する識別情報を音声入力することで、該システムの別のユーザを指示できることを特徴とする請求項36乃至41のいずれかに記載の制御システム。
  43. 前記実行手段は、ユーザが前記音声認識ユーザインターフェースを介して別のユーザの識別情報のみを入力した場合に、現在のシステム状態情報を用いてどの電話サービスを欲しているかを予測する
    ことを特徴とする請求項36に記載の制御システム。
  44. 前記音声認識ユーザインターフェースは新しい音声コマンドを認識するべく学習が可能であることを特徴とする請求項36乃至43のいずれかに記載の制御システム。
  45. 各ユーザが個別に、関連する標準モデルのセットを有することを特徴とする請求項36乃至44のいずれかに記載の制御システム。
  46. ローカル交換機に提供されることを特徴とする請求項36乃至45のいずれかに記載の制御システム。
  47. 電話システムを制御する請求項36乃至46のいずれかに記載の制御システムと、該電話システムのユーザによって使用される複数の通信装置とを備え、複数の通信装置がローカル交換機を介して接続されることを特徴とする電話システム。
  48. 前記実行手段は、各ユーザがそれぞれの通信装置を介した通話と、該システムの現在の状態を表す情報に適応することを特徴とする請求項47に記載の電話システム。
  49. 前記通信装置の少なくとも1つは表示器を有し、該表示器は、入力された音声コマンドに対応する機能を表すメッセージを所定時間の間表示するべく適用されることを特徴とする請求項47または48に記載の電話システム。
  50. 前記ローカル交換機は、該ローカル交換機に接続されたユーザが公衆交換機に接続されたりモードユーザと通信可能とするように、該公衆交換機に接続されることを特徴とする請求項47乃至49のいずれかに記載の電話システム。
  51. 前記システムのユーザが着信に応答できなかった場合に、該ユーザに対して発呼者によって残されたメッセージを格納するメールボックス機能を更に備えることを特徴とする請求項47乃至50のいずれかに記載の電話システム。
  52. 前記メールボックス機能に格納された各メッセージに、そのメッセージを残した発呼者の電話番号が関連付けらていることを特徴とする請求項51に記載の電話システム。
  53. 前記音声認識ユーザインターフェースを介して、ユーザは前記メールボックス機能に対して特定の発呼者からのメッセージを再生するよう要求できることを特徴とする請求項52に記載の電話システム。
  54. 選択された複数のメッセージの一つを再生した後に、ユーザは他の電話サービスをアクセスできると共に、それら他の電話サービスへのアクセスの後に、再び前記選択された複数のメッセージの残りを再生可能であることを特徴とする請求項53に記載の電話システム。
  55. 前記音声認識ユーザインターフェース及び前記実行手段が、複数のユーザによって時分割で使用されることを特徴とする請求項47乃至54のいずれかに記載の電話システム。
  56. 複数の異なるユーザによる同時的な使用のために、複数の音声認識ユーザインターフェース及び複数の実行手段が提供されることを特徴とする請求項47乃至55のいずれかに記載の電話システム。
  57. 前記システムが通信装置に提供されることを特徴とする請求項36乃至44のいずれかに記載の制御システム。
  58. 電話システムを制御するための方法であって、
    請求項36乃至57のいずれかに記載のシステムを提供し、
    前記音声認識インターフェースを介して前記システムに音声コマンドを入力し、
    前記音声認識インターフェースにより、前記入力された音声コマンドと予め格納された標準モデルとの比較に基づいて認識結果を出力し、
    前記認識結果に基づいて前記電話システムを制御する
    ことを特徴とする制御方法。
  59. 請求項58に従った方法を実行するためのソフトウエアプログラムを格納するデータ保持媒体。
  60. 電話システムで用いるメールボックス装置であって、
    メールボックス機能を制御するためのユーザによる音声コマンドの入力を可能とすると共に、入力音声コマンドと予め格納された標準モデルとの比較に基づいて認識結果を出力する音声認識ユーザインターフェースと、
    前記インターフェースよりの認識結果出力に応じて、前記入力された音声コマンドに従って前記メールボックス機能を制御する制御手段と、
    ユーザがコールに応答できない場合に、発呼者によって残されたメッセージを格納する格納手段とを備え、
    前期メールボックスに格納された各メッセージは、当該メッセージを残した発呼者の電話番号が関連付けられ、これによって、ユーザは、音声認識ユーザインターフェースを介して、前記メールボックス機能に特定の発呼者からのメッセージを再生させ得る
    ことを特徴とするメールボックス装置。
JP9026970A 1996-02-09 1997-02-10 情報処理方法及び装置 Pending JPH09244686A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GBGB9602699.2A GB9602699D0 (en) 1996-02-09 1996-02-09 Pattern matching method and apparatus
GB96144290 1996-07-09
GBGB9614429.0A GB9614429D0 (en) 1996-02-09 1996-07-09 Telephony system
GB96026992 1996-07-09

Publications (2)

Publication Number Publication Date
JPH09244686A JPH09244686A (ja) 1997-09-19
JPH09244686A5 true JPH09244686A5 (ja) 2005-01-06

Family

ID=26308650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9026970A Pending JPH09244686A (ja) 1996-02-09 1997-02-10 情報処理方法及び装置

Country Status (4)

Country Link
US (2) US5960395A (ja)
EP (1) EP0789349B1 (ja)
JP (1) JPH09244686A (ja)
DE (2) DE69714880T2 (ja)

Families Citing this family (127)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
US6807256B1 (en) 1997-11-04 2004-10-19 Bellsouth Intellectual Property Corporation Call screening method and apparatus
US6871064B1 (en) 1997-11-04 2005-03-22 Bellsouth Intellectual Property Corporation Outgoing call handling system and method
US7280821B2 (en) * 1998-10-27 2007-10-09 At&T Bls Intellectual Property, Inc. Outgoing call handling system and method
US6151574A (en) * 1997-12-05 2000-11-21 Lucent Technologies Inc. Technique for adaptation of hidden markov models for speech recognition
GB9802838D0 (en) * 1998-02-10 1998-04-08 Canon Kk Pattern matching method and apparatus
GB9802836D0 (en) * 1998-02-10 1998-04-08 Canon Kk Pattern matching method and apparatus
JPH11296192A (ja) * 1998-04-10 1999-10-29 Pioneer Electron Corp 音声認識における音声特徴量の補正方法、音声認識方法、音声認識装置及び音声認識プログラムを記録した記録媒体
GB9822931D0 (en) 1998-10-20 1998-12-16 Canon Kk Speech processing apparatus and method
GB9822930D0 (en) * 1998-10-20 1998-12-16 Canon Kk Speech processing apparatus and method
KR100828884B1 (ko) 1999-03-05 2008-05-09 캐논 가부시끼가이샤 데이터베이스 주석 및 검색
EP1045374B1 (en) * 1999-04-13 2010-08-11 Sony Deutschland GmbH Merging of speech interfaces for concurrent use of devices and applications
GB2349259B (en) 1999-04-23 2003-11-12 Canon Kk Speech processing apparatus and method
GB9911971D0 (en) 1999-05-21 1999-07-21 Canon Kk A system, a server for a system and a machine for use in a system
US6278987B1 (en) * 1999-07-30 2001-08-21 Unisys Corporation Data processing method for a semiotic decision making system used for responding to natural language queries and other purposes
US6394263B1 (en) * 1999-07-30 2002-05-28 Unisys Corporation Autognomic decision making system and method
EP1076297A1 (en) * 1999-08-09 2001-02-14 Deutsche Thomson-Brandt Gmbh Method for fast Fourier transformation of audio signals
JP4200607B2 (ja) * 1999-09-03 2008-12-24 ソニー株式会社 情報処理装置および方法、並びにプログラム格納媒体
US7212968B1 (en) 1999-10-28 2007-05-01 Canon Kabushiki Kaisha Pattern matching method and apparatus
US6882970B1 (en) 1999-10-28 2005-04-19 Canon Kabushiki Kaisha Language recognition using sequence frequency
US7310600B1 (en) 1999-10-28 2007-12-18 Canon Kabushiki Kaisha Language recognition using a similarity measure
GB2355833B (en) 1999-10-29 2003-10-29 Canon Kk Natural language input method and apparatus
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7050977B1 (en) 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
GB9930731D0 (en) * 1999-12-22 2000-02-16 Ibm Voice processing apparatus
GB0003903D0 (en) 2000-02-18 2000-04-05 Canon Kk Improved speech recognition accuracy in a multimodal input system
GB0011798D0 (en) 2000-05-16 2000-07-05 Canon Kk Database annotation and retrieval
GB0015233D0 (en) 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
GB2364814A (en) 2000-07-12 2002-02-06 Canon Kk Speech recognition
GB2365188B (en) * 2000-07-20 2004-10-20 Canon Kk Method for entering characters
GB2365145A (en) * 2000-07-26 2002-02-13 Canon Kk Voice control of a machine
GB2365189A (en) * 2000-07-26 2002-02-13 Canon Kk Voice-controlled machine
GB0023930D0 (en) 2000-09-29 2000-11-15 Canon Kk Database annotation and retrieval
US6871178B2 (en) * 2000-10-19 2005-03-22 Qwest Communications International, Inc. System and method for converting text-to-voice
US6990449B2 (en) * 2000-10-19 2006-01-24 Qwest Communications International Inc. Method of training a digital voice library to associate syllable speech items with literal text syllables
US6862568B2 (en) * 2000-10-19 2005-03-01 Qwest Communications International, Inc. System and method for converting text-to-voice
US6990450B2 (en) * 2000-10-19 2006-01-24 Qwest Communications International Inc. System and method for converting text-to-voice
US7451087B2 (en) * 2000-10-19 2008-11-11 Qwest Communications International Inc. System and method for converting text-to-voice
US7085716B1 (en) 2000-10-26 2006-08-01 Nuance Communications, Inc. Speech recognition using word-in-phrase command
GB0027178D0 (en) 2000-11-07 2000-12-27 Canon Kk Speech processing system
GB0028277D0 (en) 2000-11-20 2001-01-03 Canon Kk Speech processing system
US6944272B1 (en) * 2001-01-16 2005-09-13 Interactive Intelligence, Inc. Method and system for administering multiple messages over a public switched telephone network
US6876968B2 (en) * 2001-03-08 2005-04-05 Matsushita Electric Industrial Co., Ltd. Run time synthesizer adaptation to improve intelligibility of synthesized speech
US20040120472A1 (en) * 2001-04-19 2004-06-24 Popay Paul I Voice response system
US20030055640A1 (en) * 2001-05-01 2003-03-20 Ramot University Authority For Applied Research & Industrial Development Ltd. System and method for parameter estimation for pattern recognition
US20030033143A1 (en) * 2001-08-13 2003-02-13 Hagai Aronowitz Decreasing noise sensitivity in speech processing under adverse conditions
US6999928B2 (en) * 2001-08-21 2006-02-14 International Business Machines Corporation Method and apparatus for speaker identification using cepstral covariance matrices and distance metrics
US6950796B2 (en) * 2001-11-05 2005-09-27 Motorola, Inc. Speech recognition by dynamical noise model adaptation
US7324942B1 (en) 2002-01-29 2008-01-29 Microstrategy, Incorporated System and method for interactive voice services using markup language with N-best filter element
GB2391679B (en) * 2002-02-04 2004-03-24 Zentian Ltd Speech recognition circuit using parallel processors
GB2385697B (en) * 2002-02-14 2005-06-15 Canon Kk Speech processing apparatus and method
EP1339045A1 (en) * 2002-02-25 2003-08-27 Sony International (Europe) GmbH Method for pre-processing speech
JP2003255993A (ja) * 2002-03-04 2003-09-10 Ntt Docomo Inc 音声認識システム、音声認識方法、音声認識プログラム、音声合成システム、音声合成方法、音声合成プログラム
US7340392B2 (en) * 2002-06-06 2008-03-04 International Business Machines Corporation Multiple sound fragments processing and load balancing
US7788097B2 (en) * 2002-06-06 2010-08-31 Nuance Communications, Inc. Multiple sound fragments processing and load balancing
EP1540646A4 (en) * 2002-07-31 2005-08-10 Arie Ariav VOICE CONTROL SYSTEM AND ASSOCIATED METHOD
JP4072718B2 (ja) * 2002-11-21 2008-04-09 ソニー株式会社 音声処理装置および方法、記録媒体並びにプログラム
US7516070B2 (en) * 2003-02-19 2009-04-07 Custom Speech Usa, Inc. Method for simultaneously creating audio-aligned final and verbatim text with the assistance of a speech recognition program as may be useful in form completion using a verbal entry method
US20050049873A1 (en) * 2003-08-28 2005-03-03 Itamar Bartur Dynamic ranges for viterbi calculations
US7389236B2 (en) * 2003-09-29 2008-06-17 Sap Aktiengesellschaft Navigation and data entry for open interaction elements
KR20050059766A (ko) * 2003-12-15 2005-06-21 엘지전자 주식회사 동적 시간 워핑을 이용한 음성 인식 방법
US7480615B2 (en) * 2004-01-20 2009-01-20 Microsoft Corporation Method of speech recognition using multimodal variational inference with switching state space models
JP4424057B2 (ja) * 2004-05-10 2010-03-03 富士ゼロックス株式会社 学習装置およびプログラム
KR100617711B1 (ko) * 2004-06-25 2006-08-28 삼성전자주식회사 휴대단말기에서 음성인식구동 방법
DE102004048348B4 (de) * 2004-10-01 2006-07-13 Daimlerchrysler Ag Verfahren zur Adaption und/oder Erzeugung statistischer Sprachmodelle
JP2006125976A (ja) * 2004-10-28 2006-05-18 Nsk Ltd 機械設備の異常診断システム
US7359895B2 (en) * 2004-11-18 2008-04-15 Industrial Technology Research Institute Spiral string matching method
US7865362B2 (en) * 2005-02-04 2011-01-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US8200495B2 (en) 2005-02-04 2012-06-12 Vocollect, Inc. Methods and systems for considering information about an expected response when performing speech recognition
US7827032B2 (en) 2005-02-04 2010-11-02 Vocollect, Inc. Methods and systems for adapting a model for a speech recognition system
US7895039B2 (en) * 2005-02-04 2011-02-22 Vocollect, Inc. Methods and systems for optimizing model adaptation for a speech recognition system
US7949533B2 (en) 2005-02-04 2011-05-24 Vococollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US8694317B2 (en) * 2005-02-05 2014-04-08 Aurix Limited Methods and apparatus relating to searching of spoken audio data
US20070016420A1 (en) * 2005-07-07 2007-01-18 International Business Machines Corporation Dictionary lookup for mobile devices using spelling recognition
JP2007047575A (ja) * 2005-08-11 2007-02-22 Canon Inc パターンマッチング方法およびその装置、および音声情報検索システム
US20070214153A1 (en) * 2006-03-10 2007-09-13 Mazzagatti Jane C Method for processing an input particle stream for creating upper levels of KStore
US20070220069A1 (en) * 2006-03-20 2007-09-20 Mazzagatti Jane C Method for processing an input particle stream for creating lower levels of a KStore
US8238351B2 (en) * 2006-04-04 2012-08-07 Unisys Corporation Method for determining a most probable K location
US8510109B2 (en) 2007-08-22 2013-08-13 Canyon Ip Holdings Llc Continuous speech transcription performance indication
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
US7822605B2 (en) * 2006-10-19 2010-10-26 Nice Systems Ltd. Method and apparatus for large population speaker identification in telephone interactions
CN100552664C (zh) * 2006-10-20 2009-10-21 东芝泰格有限公司 模式匹配装置以及方法
US20080201158A1 (en) 2007-02-15 2008-08-21 Johnson Mark D System and method for visitation management in a controlled-access environment
US8542802B2 (en) 2007-02-15 2013-09-24 Global Tel*Link Corporation System and method for three-way call detection
US8457959B2 (en) * 2007-03-01 2013-06-04 Edward C. Kaiser Systems and methods for implicitly interpreting semantically redundant communication modes
US9973450B2 (en) 2007-09-17 2018-05-15 Amazon Technologies, Inc. Methods and systems for dynamically updating web service profile information by parsing transcribed message strings
JP2009129237A (ja) * 2007-11-26 2009-06-11 Toshiba Corp 画像処理装置及びその方法
US20090171936A1 (en) * 2007-12-28 2009-07-02 Sybase, Inc. System, Method, and Computer Program Product for Accelerating Like Conditions
US20090210233A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Cognitive offloading: interface for storing and composing searches on and navigating unconstrained input patterns
US8676577B2 (en) * 2008-03-31 2014-03-18 Canyon IP Holdings, LLC Use of metadata to post process speech recognition output
US8140330B2 (en) * 2008-06-13 2012-03-20 Robert Bosch Gmbh System and method for detecting repeated patterns in dialog systems
US20100088097A1 (en) * 2008-10-03 2010-04-08 Nokia Corporation User friendly speaker adaptation for speech recognition
US8630726B2 (en) 2009-02-12 2014-01-14 Value-Added Communications, Inc. System and method for detecting three-way call circumvention attempts
US9225838B2 (en) 2009-02-12 2015-12-29 Value-Added Communications, Inc. System and method for detecting three-way call circumvention attempts
EP2326091B1 (en) * 2009-11-13 2015-08-12 NTT DoCoMo, Inc. Method and apparatus for synchronizing video data
US20110138207A1 (en) * 2009-12-08 2011-06-09 Su Chen-Wei Power control and operation method for notebook computer
US20110184736A1 (en) * 2010-01-26 2011-07-28 Benjamin Slotznick Automated method of recognizing inputted information items and selecting information items
US8264909B2 (en) * 2010-02-02 2012-09-11 The United States Of America As Represented By The Secretary Of The Navy System and method for depth determination of an impulse acoustic source by cepstral analysis
US8886541B2 (en) * 2010-02-04 2014-11-11 Sony Corporation Remote controller with position actuatated voice transmission
US20150279354A1 (en) * 2010-05-19 2015-10-01 Google Inc. Personalization and Latency Reduction for Voice-Activated Commands
TWI429288B (zh) * 2010-05-31 2014-03-01 Ibm 網路會議伺服器與進行網路會議的方法
US8375042B1 (en) 2010-11-09 2013-02-12 Google Inc. Index-side synonym generation
US11423029B1 (en) 2010-11-09 2022-08-23 Google Llc Index-side stem-based variant generation
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US9037591B1 (en) 2012-04-30 2015-05-19 Google Inc. Storing term substitution information in an index
US8781821B2 (en) * 2012-04-30 2014-07-15 Zanavox Voiced interval command interpretation
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
US9390708B1 (en) * 2013-05-28 2016-07-12 Amazon Technologies, Inc. Low latency and memory efficient keywork spotting
US9953632B2 (en) 2014-04-17 2018-04-24 Qualcomm Incorporated Keyword model generation for detecting user-defined keyword
US10417554B2 (en) * 2014-05-22 2019-09-17 Lee J. Scheffler Methods and systems for neural and cognitive processing
WO2016114428A1 (ko) 2015-01-16 2016-07-21 삼성전자 주식회사 문법 모델을 이용하여 음성인식을 수행하는 방법 및 디바이스
KR20160098910A (ko) * 2015-02-11 2016-08-19 한국전자통신연구원 음성 인식 데이터 베이스 확장 방법 및 장치
US10089989B2 (en) * 2015-12-07 2018-10-02 Semiconductor Components Industries, Llc Method and apparatus for a low power voice trigger device
US10453460B1 (en) * 2016-02-02 2019-10-22 Amazon Technologies, Inc. Post-speech recognition request surplus detection and prevention
US10572961B2 (en) 2016-03-15 2020-02-25 Global Tel*Link Corporation Detection and prevention of inmate to inmate message relay
US9609121B1 (en) 2016-04-07 2017-03-28 Global Tel*Link Corporation System and method for third party monitoring of voice and video calls
US10714121B2 (en) 2016-07-27 2020-07-14 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments
US10027797B1 (en) 2017-05-10 2018-07-17 Global Tel*Link Corporation Alarm control for inmate call monitoring
US10225396B2 (en) 2017-05-18 2019-03-05 Global Tel*Link Corporation Third party monitoring of a activity within a monitoring platform
US10860786B2 (en) 2017-06-01 2020-12-08 Global Tel*Link Corporation System and method for analyzing and investigating communication data from a controlled environment
US11005620B2 (en) * 2017-06-16 2021-05-11 Qualcomm Incorporated Uplink reference signal sequence design in 5G new radio
US9930088B1 (en) 2017-06-22 2018-03-27 Global Tel*Link Corporation Utilizing VoIP codec negotiation during a controlled environment call
US20190115028A1 (en) * 2017-08-02 2019-04-18 Veritone, Inc. Methods and systems for optimizing engine selection
CN111883124B (zh) * 2020-07-24 2022-11-11 贵州电网有限责任公司 一种继电保护设备的语音识别系统
US11694694B2 (en) * 2020-07-30 2023-07-04 University Of Florida Research Foundation, Incorporated Detecting deep-fake audio through vocal tract reconstruction

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US33597A (en) * 1861-10-29 Improvement in the manufacture of springs from rubber and steel
US4349700A (en) * 1980-04-08 1982-09-14 Bell Telephone Laboratories, Incorporated Continuous speech recognition system
US4592086A (en) * 1981-12-09 1986-05-27 Nippon Electric Co., Ltd. Continuous speech recognition system
US4468204A (en) * 1982-02-25 1984-08-28 Scott Instruments Corporation Process of human-machine interactive educational instruction using voice response verification
JPS5923956A (ja) 1982-07-30 1984-02-07 Toshiba Corp 電話自動応対装置
CH644482A5 (de) * 1982-08-09 1984-07-31 Siemens Ag Verfahren zur uebermittlung von besonderen auftraegen in fernsprechvermittlungsanlagen, insbesondere in fernsprechnebenstellenanlagen.
US4757525A (en) * 1982-09-29 1988-07-12 Vmx, Inc. Electronic audio communications system with voice command features
USRE33597E (en) 1982-10-15 1991-05-28 Hidden Markov model speech recognition arrangement
JPS59172700A (ja) * 1983-03-22 1984-09-29 中川 聖一 パタ−ン比較装置
US4618984A (en) * 1983-06-08 1986-10-21 International Business Machines Corporation Adaptive automatic discrete utterance recognition
JPS6022283A (ja) * 1983-07-19 1985-02-04 Nec Corp パタ−ンマツチング装置
US4726065A (en) 1984-01-26 1988-02-16 Horst Froessl Image manipulation by speech signals
US5218668A (en) * 1984-09-28 1993-06-08 Itt Corporation Keyword recognition system and method using template concantenation model
US4783809A (en) * 1984-11-07 1988-11-08 American Telephone And Telegraph Company, At&T Bell Laboratories Automatic speech recognizer for real time operation
US4783804A (en) * 1985-03-21 1988-11-08 American Telephone And Telegraph Company, At&T Bell Laboratories Hidden Markov model speech recognition arrangement
EP0235127B2 (en) 1985-09-03 1993-05-05 Motorola, Inc. Hands-free control system for a radiotelephone
US4751737A (en) * 1985-11-06 1988-06-14 Motorola Inc. Template generation method in a speech recognition system
US4783803A (en) * 1985-11-12 1988-11-08 Dragon Systems, Inc. Speech recognition apparatus and method
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
GB8621994D0 (en) 1986-09-12 1986-10-22 Crosfield Electronics Ltd Image processing
US4729065A (en) * 1987-04-24 1988-03-01 Arriflex Corporation Photography light
US5068645A (en) 1987-10-14 1991-11-26 Wang Laboratories, Inc. Computer input device using an orientation sensor
US4928302A (en) 1987-11-06 1990-05-22 Ricoh Company, Ltd. Voice actuated dialing apparatus
GB2218878A (en) 1988-02-12 1989-11-22 Mars Inc Telephone
JP2733955B2 (ja) * 1988-05-18 1998-03-30 日本電気株式会社 適応型音声認識装置
AT390685B (de) * 1988-10-25 1990-06-11 Philips Nv System zur textverarbeitung
US5027406A (en) * 1988-12-06 1991-06-25 Dragon Systems, Inc. Method for interactive speech recognition and training
US5151998A (en) 1988-12-30 1992-09-29 Macromedia, Inc. sound editing system using control line for altering specified characteristic of adjacent segment of the stored waveform
US5127055A (en) * 1988-12-30 1992-06-30 Kurzweil Applied Intelligence, Inc. Speech recognition apparatus & method having dynamic reference pattern adaptation
JPH04504178A (ja) 1989-01-05 1992-07-23 オリジン・テクノロジー・インク 音声処理装置とそのための方法
JPH0315899A (ja) 1989-06-14 1991-01-24 Hitachi Ltd 情報処理システム
DE3930889A1 (de) * 1989-09-15 1991-03-28 Philips Patentverwaltung Verfahren zur erkennung von n unterschiedlichen wortketten in einem sprachsignal
JPH05284203A (ja) * 1990-04-05 1993-10-29 Texas Instr Inc <Ti> 電気通信に準拠した通話のためのユーザー・インタフェースの方法とシステム
US5187735A (en) * 1990-05-01 1993-02-16 Tele Guia Talking Yellow Pages, Inc. Integrated voice-mail based voice and information processing system
CA2081910C (en) 1990-05-01 2000-04-25 Donald E. Drumm Hands-free hardware keyboard
JP2852298B2 (ja) * 1990-07-31 1999-01-27 日本電気株式会社 標準パターン適応化方式
US5165095A (en) 1990-09-28 1992-11-17 Texas Instruments Incorporated Voice telephone dialing
WO1993001664A1 (en) 1991-07-08 1993-01-21 Motorola, Inc. Remote voice control system
CA2077324C (en) 1991-10-07 1997-06-24 Michael R. Campanelli Image editing system and method having improved automatic object selection
US5416890A (en) 1991-12-11 1995-05-16 Xerox Corporation Graphical user interface for controlling color gamut clipping
CA2058644C (en) * 1991-12-31 1996-06-18 Peter A. Tinsley Voice activated telephone set
EP0559349B1 (en) * 1992-03-02 1999-01-07 AT&T Corp. Training method and apparatus for speech recognition
US5390236A (en) * 1992-03-31 1995-02-14 Klausner Patent Technologies Telephone answering device linking displayed data with recorded audio message
FI97919C (fi) 1992-06-05 1997-03-10 Nokia Mobile Phones Ltd Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten
JPH06131437A (ja) 1992-10-20 1994-05-13 Hitachi Ltd 複合形態による操作指示方法
US5483579A (en) 1993-02-25 1996-01-09 Digital Acoustics, Inc. Voice recognition dialing system
US5452340A (en) 1993-04-01 1995-09-19 Us West Advanced Technologies, Inc. Method of voice activated telephone dialing
CA2115210C (en) 1993-04-21 1997-09-23 Joseph C. Andreshak Interactive computer system recognizing spoken commands
US5594784A (en) 1993-04-27 1997-01-14 Southwestern Bell Technology Resources, Inc. Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
AU7802194A (en) * 1993-09-30 1995-04-18 Apple Computer, Inc. Continuous reference adaptation in a pattern recognition system
CA2143980A1 (en) 1994-04-06 1995-10-07 Raziel Haimi-Cohen User display in speech recognition system
US5793891A (en) * 1994-07-07 1998-08-11 Nippon Telegraph And Telephone Corporation Adaptive training method for pattern recognition
US5832428A (en) 1995-10-04 1998-11-03 Apple Computer, Inc. Search engine for phrase recognition based on prefix/body/suffix architecture
GB9602701D0 (en) 1996-02-09 1996-04-10 Canon Kk Image manipulation
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming

Similar Documents

Publication Publication Date Title
JPH09244686A5 (ja)
EP0585004B1 (en) Voice directed communications system employing shared subscriber identifiers
US10110741B1 (en) Determining and denying call completion based on detection of robocall or telemarketing call
US5325421A (en) Voice directed communications system platform
CN110351440B (zh) 业务流程构建方法及设备
US9380161B2 (en) Computer-implemented system and method for user-controlled processing of audio signals
US5832063A (en) Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases
JPH0685893A (ja) 音声テレフォン・ダイヤリング
JP5042194B2 (ja) 話者テンプレートを更新する装置及び方法
CN109005303A (zh) 交互语音应答方法及装置
JPH10210154A (ja) ボイスメッセージの明瞭度を向上する方法
US6246987B1 (en) System for permitting access to a common resource in response to speaker identification and verification
US20030086541A1 (en) Call classifier using automatic speech recognition to separately process speech and tones
US8600021B2 (en) Method and apparatus for connecting a caller previously diverted to voicemail
US20140369479A1 (en) System and Method for Live Voice and Voicemail Detection
JPH06149760A (ja) ディジタル信号処理方法及び装置
CN108682421A (zh) 一种语音识别方法、终端设备及计算机可读存储介质
CN106713672A (zh) 来电提醒方法及装置
JP7758402B1 (ja) 架電プログラム、架電システム、および架電方法
US20030088403A1 (en) Call classification by automatic recognition of speech
CN113890949A (zh) 面向意图识别的智能语音外呼方法及装置
US6658386B2 (en) Dynamically adjusting speech menu presentation style
JPH08163252A (ja) Pbx−コンピュータ連動システム
CN118865967B (zh) 语音交互方法、装置及电子设备
US20030081756A1 (en) Multi-detector call classifier