JPH11327583A

JPH11327583A - ネットワ―ク話し言葉語彙システム

Info

Publication number: JPH11327583A
Application number: JP11079072A
Authority: JP
Inventors: Keith Loring; キース・ローリング; Paritosh D Patel; パリトシュ・ディ・パテル
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1998-03-27
Filing date: 1999-03-24
Publication date: 1999-11-26
Anticipated expiration: 2019-03-24
Also published as: DE69917112T2; EP0945851B1; JP3519015B2; KR19990077872A; US6195641B1; DE69917112D1; EP0945851A2; EP0945851A3; TW405109B; KR100324079B1

Abstract

(57)【要約】【課題】音声アプリケーションのためのネットワーク
話し言葉語彙システムを提供すること。【解決手段】音声アプリケーションのためのネットワ
ーク話し言葉語彙システムは、ネットワークを介して互
いに通信するネットワーク・サーバ及び複数のネットワ
ーク・クライアントと、認識可能な単語のためのサーバ
内の中央語彙リストと、各クライアント内の音声認識エ
ンジン及びローカル語彙リスト・キャッシュとを含む。
キャッシュは、サーバ内の中央語彙リストから伝達さ
れ、以前に認識された単語と、音声アプリケーションに
より認識された新たな単語とを有する。新たな単語の各
々はサーバに伝達されて、中央語彙リストに追加され、
中央語彙リストに追加された新たな単語の各々が、少な
くとも１つの他のクライアントに伝達されて、キャッシ
ュに追加される。新たな単語は自動的にサーバに、及び
サーバから伝達される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は一般に、音声アプリ
ケーションの分野に関して、特に、新たな単語発音を、
ネットワーク上の音声アプリケーション・クライアント
に自動的に記憶、追跡、及び配布する方法及び装置に関
する。

【０００２】

【従来の技術】コンピュータにおける話し言葉の使用
は、通常、音声認識及び音声合成に関連付けられ、単語
の綴りだけでなく、単語に関連付けられる他のデータ、
例えば音素や代替発音、或いは名詞、動詞、形容詞など
の他の単語及び音声部分との関連性を記憶及び検索する
ステップを含む。

【０００３】初期のコンピュータ・システムは、もっぱ
ら書き言葉を扱うために開発された。書き言葉は多くの
物事にとって有用であり、話し言葉よりも、コンピュー
タ・システムにおいて解釈、表現、及び再生することが
遥かに容易である。今日、コンピュータ・システムは２
つの技術形式、すなわち音声認識及び音声合成により、
話し言葉を処理している。音声合成は、テキスト−音声
（ＴＴＳ）変換とも呼ばれる。

【０００４】話し言葉をサポートするために、コンピュ
ータにより実行される作業の定義は、話し言葉を書き言
葉と比較することにより支援される。これらの２つの伝
達形式に共通しているのは単語であるが、その形態は異
なっている。例えば、単語は話される音声または書かれ
た文字として異なって表現される。書き言葉はまた、句
読点や、強調のための太字などのフォントという固有の
特徴を有し、一方、話し言葉は、例えば音量、ピッチ、
韻律（スピード）、及び抑揚という固有の特徴を有す
る。

【０００５】コンピュータが話し言葉のサポートに取り
組むとき、通常話される話し言葉が、音声認識によりテ
キスト形式に変換され、音声合成により発音形式に逆変
換される。このことは、可聴表現に比較して、書き言葉
表現を記憶または伝送する際の、システム資源に対する
要求の多大な低減を利用する。書き言葉と話し言葉との
差が、音声アプリケーションにおける多くの問題を生成
する。

【０００６】

【発明が解決しようとする課題】エンドユーザは、認識
可能な語彙単語のスタータ・セットに含まれない単語の
発音を追加する必要性により、多大な不便を被る。設計
上、エンドユーザは、不正に認識された単語の特殊ケー
スとして、この問題に遭遇する。認識は、ユーザにより
話された単語に関する、認識エンジンによる最善の推測
と見なされる。ユーザが認識エンジンに知れていない単
語を話すとき、認識エンジンは単に誤って推測する。こ
の時、ユーザは単語の訂正を開始し、適切な代替語の候
補リストから、新たな単語を選択しなければならない。
話された単語が、代替選択肢としてリストされていない
場合、ユーザは通常、その単語をタイプ入力し、多分そ
れを再度発音するように要求される。この不便さはユー
ザに正当な訂正プロシージャを無視させ、単に訂正され
たテキストをタイプ入力するように仕向ける。残念なが
ら、このプロシージャは差し当たり迅速であるが、音声
認識システムが正当なプロシージャにより、訂正に関し
て学習することが重要である。なぜなら、この情報が単
語を追加及び訂正するための、従って将来の認識性能を
向上するための、唯一の方法であるからである。

【０００７】音声アプリケーションにおいて提供される
音声認識エンジンは、十分に正確ではなく、時に、誤認
識や誤認識を訂正するために必要とされる時間により、
スループットが悪くなる。

【０００８】誤認識された単語の訂正は、１分当たりの
単語数を含む音声認識の有効性及び有用性の測定におい
て、主要な要素である。語彙外の単語から生じる訂正の
数を制限するために、大きな語彙が提供される。

【０００９】独立型のシステムでは、ユーザが動き回っ
たり、システム間を切り替わるとき（例えばホーム・コ
ンピュータとオフィス・コンピュータ間、及び携帯コン
ピュータとデスクトップ・コンピュータ間）、或いはコ
ンピュータまたは音声認識アプリケーションを更新する
とき、ユーザにより追加された単語がバックアップさ
れ、システム間で移動される必要がある。この作業は時
間を消費し、冗長で、不明確であるため、その後は一般
に実行されないのが普通である。

【００１０】通常、音声認識または合成ソフトウェアと
共に、発音を含む単語のスタータ・セットがコンピュー
タ上に導入される。発音は、単語が発音されるまたは聞
こえる様子に関する指示を表す基本形式として記憶され
る。所与のアプリケーションのための理想的なスタータ
・セットを生成するために、多くの要素が考慮されなけ
ればならない。スタータ・セット内の単語の数は、通
常、要求される記憶空間、単語の使用頻度、共通使用
度、及びスタータ・セット内の他の全ての単語に対する
認識精度など、考慮すべき要件を均衡させることにより
決定される。音声認識システムの開発者は、通常、認識
のために要求される単語−発音データの大きな語彙を導
入する。こうした語彙を生成することは、かなり冗長で
時間の掛かる作業である。

【００１１】

【課題を解決するための手段】本発明の構成に従い開発
及び管理されるネットワーク汎用話し言葉語彙は、従来
技術で述べられた全ての問題を克服する。本発明の構成
は、話し言葉語彙データの記憶、追跡、共用、及び配布
を自動化及び最適化する。全ての既知の単語に関する単
語情報が、ネットワークに接続されたサーバから配布さ
れる。任意のクライアント・ユーザにより追加された新
たな単語が、全てのユーザにとって使用可能にされ、続
くユーザが各々、同一の新たな単語に関するデータを提
供する必要性を排除する。

【００１２】各ユーザにより要求される手操作による発
音の追加が、より一層低減し、それによりユーザは、音
声アプリケーションに新たな単語を教えるように、誤認
識を訂正するプロシージャに従うことが多くなり、従っ
て、全てのユーザにとって将来の認識性能が改善され
る。

【００１３】本発明の構成に従う音声認識及び音声合成
システムまたはアプリケーションは、２人以上のユーザ
が同じ新たな単語を追加する必要性を排除する。新たな
単語の１番目のユーザだけが、その新たな単語を追加す
る必要がある。本システムは、代替単語の認識または決
定もできるが、汎用語彙サーバに新たな単語を問い合わ
せることができ、データの提供のためにユーザを煩わす
ことはない。

【００１４】話された単語と既知の正確に認識された単
語との間の、高いヒット率による、音声認識の正確さ及
びスループットの向上が高度に最適化され、キャッシュ
される汎用語彙の利点である。

【００１５】大きな語彙を各システム上に導入及び保持
する要求が、有利に低減される。ユーザにとって、単語
がサーバ上に記憶されていることは透過的であり、シス
テムが使用されるとき、キャッシングがヒット率を高
め、クライアント上に記憶される単語の数を低減し、同
時に一般にスピードアップを達成する。

【００１６】ユーザにより追加された単語を保持する必
要性、及び更新された語彙リストを個々にバックアップ
し、移動する必要性が、データ・バックアップの集中化
により、都合良く排除される。

【００１７】事前に最も適切なスタータ・セットを慎重
に選択する負担が、有利に排除される。なぜなら、特殊
化された単語が、ユーザのネットワークにより、効率的
に且つ負担分散方式により追加されるからである。反対
に、全てのユーザのための語彙が、ユーザ対話を要求す
ること無く、必要に際して自動的に更新される。

【００１８】本発明の構成に従う、音声アプリケーショ
ンのためのネットワーク話し言葉語彙システムは、ネッ
トワークを介して互いに通信するネットワーク・サーバ
及び複数のネットワーク・クライアントと、認識可能な
単語のためのサーバ内の中央語彙リストと、各クライア
ント内の音声認識エンジン及びローカル語彙リスト・キ
ャッシュとを含み、前記キャッシュが、サーバ内の中央
語彙リストから伝達され、以前に認識された単語と、音
声アプリケーションにより認識された新たな単語とを有
する。そして、新たな単語の各々がサーバに伝達され
て、中央語彙リストに追加され、中央語彙リストに追加
された新たな単語の各々が、少なくとも１つの他のクラ
イアントに伝達されて、キャッシュに追加される。

【００１９】新たな単語はクライアントからサーバに自
動的に伝達され、またサーバから１つ以上のクライアン
トに自動的に伝達される。

【００２０】サーバは更に、ユーザ・プロファイル・テ
ーブルを含み、これは各ユーザに対応して、音声認識の
ために使用される中央語彙リストのそれぞれのサブセッ
トを示すデータ、及びワークグループ内の会員を示すデ
ータを有する。このデータが使用可能なとき、あるワー
クグループ内の任意のユーザから、サーバに伝達された
新たな単語の各々が、自動的にそのワークグループ内の
他の全てのユーザに伝達される。更に、ワークグループ
内の各ユーザは、音声認識のために使用される中央語彙
リストの同一のサブセットを受信できる。

【００２１】各クライアントは更に、サーバに伝達され
る新たな単語を識別し、キャッシュに追加するための、
単語発音追加ツールを含み得る。単語発音追加ツール
は、新たな単語がクライアント内の音声認識エンジンに
より認識されるとき、及び新たな単語がサーバから伝達
されるとき、それらを追加できる。

【００２２】中央語彙リストは、各単語に対する複数の
データ・レコードを含み得、それらには、綴り、音素、
使用領域、原クライアント、及び単語を要求するワーク
グループが含まれる。

【００２３】本発明の別の構成に従う、音声アプリケー
ションのためのネットワーク話し言葉語彙システムは、
認識可能な単語のための永久中央語彙リスト及びユーザ
・プロファイル・データベースを有するネットワーク・
サーバと、各々が音声認識エンジン及びローカル語彙リ
スト・キャッシュを有する、複数のネットワーク・クラ
イアントと、サーバ及びクライアントが通信し合うネッ
トワークとを含む。キャッシュは、サーバ内の中央語彙
リストから伝達され、以前に認識された単語と、セッシ
ョンの間に音声アプリケーションにより認識された新た
な単語とのサブセットを記憶する。新たな単語の各々は
サーバに伝達され、中央語彙リストに追加される。中央
語彙リストに追加された新たな単語の各々は、ユーザ・
プロファイル・データベース内のデータに従い、他のク
ライアントに伝達される。

【００２４】新たな単語は自動的にサーバに、及びサー
バから伝達される。

【００２５】ユーザ・プロファイル・データベースは、
各ユーザに対応して、音声認識のために使用される中央
語彙リストのそれぞれのサブセットを示すデータ、及び
ワークグループ内の会員を示すデータを有する。このデ
ータが使用可能なとき、あるワークグループ内の任意の
ユーザから、サーバに伝達された新たな単語の各々が、
自動的にそのワークグループ内の他の全てのユーザに伝
達される。更に、ワークグループ内の各ユーザが、音声
認識のために使用される中央語彙リストの同一のサブセ
ットを受信できる。

【００２６】各クライアントは更に、サーバに伝達され
る新たな単語を識別し、また単語をキャッシュに追加す
るための、単語発音追加ツールを含み得る。単語発音追
加ツールは、新たな単語がクライアント内の音声認識エ
ンジンにより認識されるとき、及び新たな単語がサーバ
から伝達されるとき、それらを追加できる。

【００２７】中央語彙リストは、各単語に対する複数の
データ・レコードを含み得、これらのデータ・レコード
には、綴り、音素、使用領域、原クライアント、及び単
語を要求するワークグループが含まれる。

【００２８】

【発明の実施の形態】図１に、音声認識及び音声合成な
どの、話し言葉技術のための語彙サポートの全ての側面
をカバーする包括システム１０が示される。このシステ
ムは単語発音または語彙サーバ１２を含み、これはネッ
トワーク２０を介して、複数の語彙クライアント１４、
１６、１８に接続される。ネットワーク２０は、ローカ
ル・エリア・ネットワーク（ＬＡＮ）または広域ネット
ワーク（ＷＡＮ）である。本発明の構成によれば、単語
発音または語彙サーバ１２は、全ての既知の単語及び関
連する話し言葉属性のための汎用貯蔵部である。新たな
単語が必要に際して、ネットワーク・クライアントから
獲得され、またネットワーク・クライアントに配布され
る。

【００２９】単語発音サーバ１２は、汎用語彙サーバ・
プログラム２２、汎用語彙リストまたはデータベース２
４、及びユーザ・プロファイル・テーブル２６を含む。
単語発音サーバ１２は、ネットワークに接続されたコン
ピュータ・システムであり、汎用語彙データベース及び
汎用語彙サーバ・ソフトウェア・プログラム２２をホス
トとして維持する。プログラム２２は、音声認識プログ
ラムまたは音声合成プログラムを実行中のクライアント
・コンピュータ・システムからの要求に応答する。

【００３０】汎用語彙リスト２４はシステムに知れた全
ての単語を含み、それらには綴りや発音方法を示すデー
タが含まれる。用語"汎用"は、ネットワーク全体を通じ
ることを意味する。この意味において、汎用語彙リスト
は、中央語彙リストまたはマスタ語彙リストと見なされ
る。各単語エントリに対するデータ・レコードには、次
の情報すなわち、綴り、音素すなわち発音データ、使用
領域のリスト、その単語を追加した原クライアント、及
びその単語を使用しそうなユーザのワークグループが含
まれる。

【００３１】ユーザ・プロファイル・テーブル２６は、
汎用語彙クライアント・プログラムをサポートするため
に要求される情報を含む、データベースである。特定の
ユーザが使用する単語グループ、及びユーザが属するユ
ーザ・グループに関するデータが、サーバ上に保持さ
れ、各クライアントがセッションを音声認識またはＴＴ
Ｓソフトウェアから開始するとき、彼らに伝送される。

【００３２】用語"クライアント"は、単語発音サーバ１
２によりサービスされるワーク・ステーションの意味に
おいて使用される。ユーザはクライアントにおける作業
者である。ユーザ・プロファイル・テーブルまたはデー
タベース２６は、名前またはログイン識別により識別さ
れるユーザに合わせて準備され、従ってどのユーザに対
しても、使用される特定のワーク・ステーションまたは
クライアントに関係無しに、語彙単語の適切なサブセッ
トを提供することができる。特定のクライアントまたは
ワーク・ステーションのユーザが、ユーザ・プロファイ
ル・テーブル内に存在しない場合、ユーザ・プロファイ
ル・テーブルは、そのクライアントまたはワーク・ステ
ーション識別に合わせることもできる。或いは、未確認
ユーザに対するデフォルトのサブセットを定義してもよ
い。更に別の現在好適な代替例として、未確認ユーザは
ユーザ・プロファイル・テーブル内で識別されるため
の、十分な情報を提供するように指示され、その後、適
切なサブセット語彙リスト及び適切な新たな単語を提供
される。

【００３３】適切な語彙リストは更に、モデム、衛星通
信、またはインターネットにより、リモート・ワーク・
ステーションに転送され得るが、即時の自動更新は、リ
モート・リンクが維持された場合に限り、使用可能であ
る。この点で、ネットワーク２０は更にリモート・リン
クも表す。

【００３４】クライアント１４、１６及び１８の各々
は、汎用語彙クライアント・プログラム３０、音声認識
エンジン３２、単語発音追加ツール３４、及び汎用語彙
リスト２４の個別化されたサブセットを記憶するローカ
ル語彙リスト・キャッシュ３６を含む。説明の都合上、
クライアント１４及び１６は、ユーザ・プロファイルＡ
に関連付けられるワークグループのメンバである。クラ
イアント１８は、ユーザ・プロファイルＢに関連付けら
れるワークグループのメンバである。

【００３５】単語発音追加ツール３４は、各クライアン
トに新たに追加された単語を、ネットワーク２０を介し
て、単語発音サーバ１２に伝送し、そこで新たな単語が
汎用語彙リスト２４に追加される。単語発音追加ツール
３４はまた、単語発音サーバ１２からネットワーク２０
を介して、新たな単語を受信し、それをローカル語彙リ
スト・キャッシュ３６に向ける。

【００３６】汎用語彙クライアント・プログラム３０
は、汎用語彙リスト２４からキャッシュされたローカル
・サブセット３６を維持するクライアント・システム上
で実行されるアプリケーションである。単語はユーザか
ら、及び汎用語彙リストからキャッシュ３６に追加さ
れ、一方、キャッシュに保持しておく価値のなくなった
単語は消去される。ローカル語彙リスト・キャッシュ３
６は、従来の独立型のスタータ・セット語彙に代わるも
ので、動的に最適化される。

【００３７】ローカル語彙リスト・キャッシュ３６を保
守するプログラムは、ネットワーク・トラフィック、使
用可能なローカル記憶装置、使用頻度、システム・プロ
セッサ・スピード、現エンドユーザ・タスク、及びエン
ドユーザ設定を考慮して、キャッシュのパラメータを決
定することができるアルゴリズムを使用する。キャッシ
ュは最適なローカル語彙と見なされる。キャッシュが最
適である理由は、ユーザが話したことがわかっている単
語を含むことにより、認識を向上させ、同時に、ユーザ
が話していないことがわかっている単語を含まないこと
で、突き合わせのためにキャッシュを探索するのに必要
な処理時間が低減されるからである。

【００３８】クライアント・アプリケーションは、新た
に追加された単語に関するデータを、汎用語彙サーバ・
プログラムに送信する。デフォルトでは、全ての単語は
公用として、すなわち共用されるように追加されるが、
ユーザは特定の理由から、追加された単語が私用として
保持されるように選択することもできる。

【００３９】単純な例が図１に示される。ここでは、ク
ライアント１４が新たな単語を追加している。追加され
た新たな単語は、単語発音追加ツール３４からネットワ
ーク２０を介して、単語発音サーバ１２に伝送され、そ
この汎用語彙リスト２４に追加される。この様子が破線
矢印１により示されている。クライアント１６が口述を
行っているか、またはその後いつか口述を開始する場
合、汎用語彙サーバ・プログラム２２が、破線矢印２に
より示されるように、クライアント１６に対するユーザ
・プロファイルを、ユーザ・プロファイル・テーブル２
６から読み出す。ユーザ・プロファイルは、クライアン
ト１６がクライアント１４と同一のワークグループ（同
一のプロファイルＡを用いて表される）に属することを
示す。クライアント１６が既に口述を行っている場合、
新たな単語がクライアント１６に転送され、ローカル語
彙リスト・キャッシュ３６に追加される。クライアント
１６が口述を開始する場合、個別化された語彙リストが
クライアント１６に転送され、ローカル語彙リスト・キ
ャッシュ３６に記憶される。ユーザ１６はユーザ１４と
同じプロファイルＡを使用するので、転送されてきたリ
ストには、クライアント１４により以前に追加された新
たな単語が含まれている。両方の例が、破線矢印３によ
り示される。

【００４０】本発明の構成によれば、包括的なデータベ
ースが、ユーザにより動的且つ増分式に強化され、時間
の経過に伴い自動的に最適化されるので、全体的なシス
テム性能が向上され、またネットワーク帯域幅、ファイ
ル及びキャッシング技術を使用したデータ記憶装置など
のコンピュータ・システム資源が平衡化される。

【００４１】まとめとして、本発明の構成に関して以下
の事項を開示する。

【００４２】（１）音声アプリケーションのためのネッ
トワーク話し言葉語彙システムであって、ネットワーク
を介して互いに通信するネットワーク・サーバ及び複数
のネットワーク・クライアントと、認識可能な単語のた
めの前記サーバ内の中央語彙リストと、前記クライアン
トの各々内の音声認識エンジン及びローカル語彙リスト
・キャッシュとを含み、前記キャッシュが、前記サーバ
内の前記中央語彙リストから伝達され、以前に認識され
た単語と、前記音声アプリケーションにより認識された
新たな単語とを有し、前記新たな単語の各々が前記サー
バに伝達され、前記中央語彙リストに追加され、前記中
央語彙リストに追加された前記新たな単語の各々が、少
なくとも１つの他の前記クライアントに伝達されて、前
記キャッシュに追加される、システム。（２）前記新たな単語が自動的に前記サーバに伝達され
る、前記（１）記載のシステム。（３）前記新たな単語が自動的に前記サーバに、及び前
記サーバから伝達される、前記（１）記載のシステム。（４）前記サーバが、各ユーザに対応して、音声認識の
ために使用される前記中央語彙リストのそれぞれのサブ
セットを示すデータを有する、ユーザ・プロファイル・
テーブルを含む、前記（１）記載のシステム。（５）前記サーバが、各ユーザに対応して、ワークグル
ープ内の会員を示すデータを有する、ユーザ・プロファ
イル・テーブルを含む、前記（１）記載のシステム。（６）あるワークグループ内の任意のユーザから、前記
サーバに伝達された新たな単語の各々が、自動的に当該
ワークグループ内の他の全てのユーザに伝達される、前
記（５）記載のシステム。（７）前記ユーザ・プロファイル・テーブルが、各ユー
ザに対応して、ワークグループ内の会員を示すデータを
有し、前記ワークグループ内の各ユーザが、音声認識の
ために使用される前記中央語彙リストの同一のサブセッ
トを受信する、前記（４）記載のシステム。（８）前記クライアントの各々が、前記サーバに伝達さ
れる前記新たな単語を識別し、前記新たな単語を前記キ
ャッシュに追加するための単語発音追加ツールを含む、
前記（１）記載のシステム。（９）前記単語発音追加ツールが、前記新たな単語が前
記クライアント内の前記音声認識エンジンにより認識さ
れるとき、及び前記サーバから伝達されるとき、前記新
たな単語を追加できる、前記（８）記載のシステム。（１０）前記中央語彙リストが、各単語に対する複数の
データ・レコードを含み、前記データ・レコードが、綴
り、音素、使用領域、原クライアント、及び当該単語を
要求するワークグループを含む、前記（１）記載のシス
テム。（１１）音声アプリケーションのためのネットワーク話
し言葉語彙システムであって、認識可能な単語のための
永久中央語彙リスト及びユーザ・プロファイル・データ
ベースを有するネットワーク・サーバと、各々が音声認
識エンジン及びローカル語彙リスト・キャッシュを有す
る、複数のネットワーク・クライアントと、前記サーバ
及び前記クライアントが通信し合うネットワークと、前
記サーバ内の前記中央語彙リストから伝達され、以前に
認識された単語と、セッションの間に前記音声アプリケ
ーションにより認識された新たな単語とのサブセットを
記憶したキャッシュとを含み、前記新たな単語の各々が
前記サーバに伝達され、前記中央語彙リストに追加さ
れ、前記中央語彙リストに追加された前記新たな単語の
各々が、前記ユーザ・プロファイル・データベース内の
データに従い、他のクライアントに伝達される、システ
ム。（１２）前記新たな単語が自動的に前記サーバに、及び
前記サーバから伝達される、前記（１１）記載のシステ
ム。（１３）前記ユーザ・プロファイル・データベースが、
各ユーザに対応して、音声認識のために使用される前記
中央語彙リストのそれぞれのサブセットを示すデータを
有する、前記（１１）記載のシステム。（１４）前記ユーザ・プロファイル・データベースが、
各ユーザに対応して、ワークグループ内の会員を示すデ
ータを有する、前記（１１）記載のシステム。（１５）あるワークグループ内の任意のユーザから、前
記サーバに伝達された新たな単語の各々が、自動的に当
該ワークグループ内の他の全てのユーザに伝達される、
前記（１４）記載のシステム。（１６）前記ユーザ・プロファイル・データベースが、
各ユーザに対応して、ワークグループ内の会員を示すデ
ータを有し、前記ワークグループ内の各ユーザが、音声
認識のために使用される前記中央語彙リストの同一のサ
ブセットを受信する、前記（１１）記載のシステム。（１７）前記クライアントの各々が、前記サーバに伝達
される前記新たな単語を識別し、前記新たな単語を前記
キャッシュに追加するための単語発音追加ツールを含
む、前記（１１）記載のシステム。（１８）前記単語発音追加ツールが、前記新たな単語が
前記クライアント内の前記音声認識エンジンにより認識
されるとき、及び前記サーバから伝達されるとき、前記
新たな単語を追加できる、前記（１７）記載のシステ
ム。（１９）前記中央語彙リストが、各単語に対する複数の
データ・レコードを含み、前記データ・レコードが、綴
り、音素、使用領域、原クライアント、及び当該単語を
要求するワークグループを含む、前記（１１）記載のシ
ステム。

【図面の簡単な説明】

【図１】本発明の構成に従うネットワーク汎用話し言葉
語彙システムのブロック図である。

【符号の説明】

１０包括システム１２サーバ１４、１６、１８クライアント２０ネットワーク２２汎用語彙サーバ・プログラム２４汎用語彙リスト２６ユーザ・プロファイル・テーブル３０汎用語彙クライアント・プログラム３２音声認識エンジン３４単語発音追加ツール３６ローカル語彙リスト・キャッシュ

───────────────────────────────────────────────────── フロントページの続き (72)発明者パリトシュ・ディ・パテルアメリカ合衆国33442、フロリダ州ディアフィールド・ビーチ、パラディアン・サークル 3503

Claims

【特許請求の範囲】

【請求項１】音声アプリケーションのためのネットワー
ク話し言葉語彙システムであって、ネットワークを介して互いに通信するネットワーク・サ
ーバ及び複数のネットワーク・クライアントと、認識可能な単語のための前記サーバ内の中央語彙リスト
と、前記クライアントの各々内の音声認識エンジン及びロー
カル語彙リスト・キャッシュとを含み、前記キャッシュ
が、前記サーバ内の前記中央語彙リストから伝達され、
以前に認識された単語と、前記音声アプリケーションに
より認識された新たな単語とを有し、前記新たな単語の
各々が前記サーバに伝達され、前記中央語彙リストに追
加され、前記中央語彙リストに追加された前記新たな単
語の各々が、少なくとも１つの他の前記クライアントに
伝達されて、前記キャッシュに追加される、システム。
【請求項２】前記新たな単語が自動的に前記サーバに伝
達される、請求項１記載のシステム。
【請求項３】前記新たな単語が自動的に前記サーバに、
及び前記サーバから伝達される、請求項１記載のシステ
ム。
【請求項４】前記サーバが、各ユーザに対応して、音声
認識のために使用される前記中央語彙リストのそれぞれ
のサブセットを示すデータを有する、ユーザ・プロファ
イル・テーブルを含む、請求項１記載のシステム。
【請求項５】前記サーバが、各ユーザに対応して、ワー
クグループ内の会員を示すデータを有する、ユーザ・プ
ロファイル・テーブルを含む、請求項１記載のシステ
ム。
【請求項６】あるワークグループ内の任意のユーザか
ら、前記サーバに伝達された新たな単語の各々が、自動
的に当該ワークグループ内の他の全てのユーザに伝達さ
れる、請求項５記載のシステム。
【請求項７】前記ユーザ・プロファイル・テーブルが、
各ユーザに対応して、ワークグループ内の会員を示すデ
ータを有し、前記ワークグループ内の各ユーザが、音声
認識のために使用される前記中央語彙リストの同一のサ
ブセットを受信する、請求項４記載のシステム。
【請求項８】前記クライアントの各々が、前記サーバに
伝達される前記新たな単語を識別し、前記新たな単語を
前記キャッシュに追加するための単語発音追加ツールを
含む、請求項１記載のシステム。
【請求項９】前記単語発音追加ツールが、前記新たな単
語が前記クライアント内の前記音声認識エンジンにより
認識されるとき、及び前記サーバから伝達されるとき、
前記新たな単語を追加できる、請求項８記載のシステ
ム。
【請求項１０】前記中央語彙リストが、各単語に対する
複数のデータ・レコードを含み、前記データ・レコード
が、綴り、音素、使用領域、原クライアント、及び当該
単語を要求するワークグループを含む、請求項１記載の
システム。
【請求項１１】音声アプリケーションのためのネットワ
ーク話し言葉語彙システムであって、認識可能な単語のための永久中央語彙リスト及びユーザ
・プロファイル・データベースを有するネットワーク・
サーバと、各々が音声認識エンジン及びローカル語彙リスト・キャ
ッシュを有する、複数のネットワーク・クライアント
と、前記サーバ及び前記クライアントが通信し合うネットワ
ークと、前記サーバ内の前記中央語彙リストから伝達され、以前
に認識された単語と、セッションの間に前記音声アプリ
ケーションにより認識された新たな単語とのサブセット
を記憶したキャッシュとを含み、前記新たな単語の各々
が前記サーバに伝達され、前記中央語彙リストに追加さ
れ、前記中央語彙リストに追加された前記新たな単語の
各々が、前記ユーザ・プロファイル・データベース内の
データに従い、他のクライアントに伝達される、システ
ム。
【請求項１２】前記新たな単語が自動的に前記サーバ
に、及び前記サーバから伝達される、請求項１１記載の
システム。
【請求項１３】前記ユーザ・プロファイル・データベー
スが、各ユーザに対応して、音声認識のために使用され
る前記中央語彙リストのそれぞれのサブセットを示すデ
ータを有する、請求項１１記載のシステム。
【請求項１４】前記ユーザ・プロファイル・データベー
スが、各ユーザに対応して、ワークグループ内の会員を
示すデータを有する、請求項１１記載のシステム。
【請求項１５】あるワークグループ内の任意のユーザか
ら、前記サーバに伝達された新たな単語の各々が、自動
的に当該ワークグループ内の他の全てのユーザに伝達さ
れる、請求項１４記載のシステム。
【請求項１６】前記ユーザ・プロファイル・データベー
スが、各ユーザに対応して、ワークグループ内の会員を
示すデータを有し、前記ワークグループ内の各ユーザ
が、音声認識のために使用される前記中央語彙リストの
同一のサブセットを受信する、請求項１１記載のシステ
ム。
【請求項１７】前記クライアントの各々が、前記サーバ
に伝達される前記新たな単語を識別し、前記新たな単語
を前記キャッシュに追加するための単語発音追加ツール
を含む、請求項１１記載のシステム。
【請求項１８】前記単語発音追加ツールが、前記新たな
単語が前記クライアント内の前記音声認識エンジンによ
り認識されるとき、及び前記サーバから伝達されると
き、前記新たな単語を追加できる、請求項１７記載のシ
ステム。
【請求項１９】前記中央語彙リストが、各単語に対する
複数のデータ・レコードを含み、前記データ・レコード
が、綴り、音素、使用領域、原クライアント、及び当該
単語を要求するワークグループを含む、請求項１１記載
のシステム。