JP2000504510A - データベースアクセス - Google Patents
データベースアクセスInfo
- Publication number
- JP2000504510A JP2000504510A JP9527399A JP52739997A JP2000504510A JP 2000504510 A JP2000504510 A JP 2000504510A JP 9527399 A JP9527399 A JP 9527399A JP 52739997 A JP52739997 A JP 52739997A JP 2000504510 A JP2000504510 A JP 2000504510A
- Authority
- JP
- Japan
- Prior art keywords
- display
- vocabulary
- combination
- database
- announcement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
(57)【要約】
データベースシステムをアクセスする方法および装置において、前記データべースシステムは、エントリに属する情報のアイテムの機械表示を含む複数のフィールドをそれぞれ含むエントリを含んでおり、前記表示は第1のボキャブラリを形成しているデータベースと、このような表示の第2のボキャブラリに入る機械表示に応答して機械表示を表す信号を発生する出力手段と、信号を受信してこのような表示の第3のボキャブラリに入る機械表示を発生するように動作可能な入力手段とを具備している。データベースシステムをアクセスする方法は、(i)第1のボキャブラリと第3のボキャブラリの定められた関係にしたがって、入力手段により生成される各表示に対して、第1のボキャブラリにしたがった1以上の表示を発生し、(ii)生成された表示を含んでいるデータベースエントリを識別し、(iii )識別されたエントリの選択されたフィールドまたはフィールドの組合わせに含まれている各表示または表示の組合わせを試験してこれらの表示または組合わせのうちの弁別可能なものを識別し、規定された関係にしたがって第2のボキャブラリの表示へ変換されるときの弁別可能な表示または組合わせは、同様に変換されるときの弁別可能な表示または組合わせと互いに異なっており、(iv)弁別可能な表示または組合わせのうちの1つに対応する少なくとも1つの単語または単語の組合わせを含んでいる出力を発生する出力手段を制御するステップを有する。
Description
【発明の詳細な説明】
データベースアクセス
本発明はデータベースのアクセス、特に言語スピーチ認識入力および合成され
た言語出力の使用に関するが、それに限定されない。
国際特許公開第WO94/14270号明細書は、機械化されたディレクトリ問合わせ(
電話番号案内)システムを開示しており、ここでは発呼者が最初に必要な都市名
を述べようとする。話された単語が認識され、最高の確信レベルを有する単語が
使用者が話した単語として選択される。その後、発呼者は探し求めているパーテ
ィ(当業者)の名称を述べようとする。満足すべき確信レベルが得られたとき、
データベースがアクセスされ、番号が発呼者に接続される。確信レベルが好まし
い確信レベルに合致しなかったならば、発呼者はその位置または名称のスペル(
綴り)を全てまたは一部綴る。話した入力とデータベース間に1または複数の一
致が発見されたならば、使用者は確認された一致が見つかるまでそれぞれの一致
を1つ1つ確認するように求められる。このような一致が突き止められなかった
ならば、自動処理が終了される。
欧州特許出願公開第433964号明細書はテキスト入力を使用するシステムに関す
る。第1に、姓を表す入力単語がエントリと整合される。“類似する”が入力と
全く同一ではない整合が発見されたならば、入力の頭文字とデータベースエント
リが比較される。これらが一致したならば、データエントリの記録が行われる。
システムはその後必要なタイトルと必要な個人名を比較する。最も確率の高いエ
ントリが使用者へ与えられる。
米国特許第5204894 号明細書はパーソナル電子ディレクトリに関し、ここでは
エントリの名称が使用者の音声中に記憶され、関連する番号は多音(DTMF)
電話キーパッドまたは話された入力を使用して入力される。使用者がディレクト
リをアクセスする必要があるとき、使用者は必要な名前を言及し、ディレクトリ
システムは入力の第1の単語と記憶された単語を比較し、使用者が1つの単語を
確認するまで連続して全ての可能性を使用者へ与える。
前述した全ての従来技術のシステムでは、システムは使用者がデータエントリ
を必要なものとして確定するまで使用者にデータベース内の識別されたエントリ
を連続的な方法で与える。
本発明の1特徴にしたがって、データベースアクセス装置が提供され、この装
置は、
(a)エントリに属する情報のアイテムの機械表示を含む複数のフィールドをそ
れぞれ具備するエントリを含んでおり、前記表示は第1のボキャブラリを形成し
ているデータベースと、
(b)このような表示の第2のボキャブラリ内に入る機械表示に応答して話され
たアナウンスを表したオーディオ信号を発生するアナウンス手段と、
(c)信号を受信し、このような表示の第3のボキャブラリに入る機械表示を発
生するように動作可能な入力手段と、
(d)第1のボキャブラリと第2のボキャブラリとの間の関係と、第1のボキャ
ブラリと第3のボキャブラリとの間の関係を規定する変換手段と、
(e)制御手段とを具備しており、この制御手段は、
(i)規定された関係にしたがって、入力手段により発生される各表示に対して
第1のボキャブラリにしたがって1または複数の表示を発生し、
(ii)発生された表示を含んでいるデータベースエントリを識別し、
(iii )識別されたエントリの選択されたフィールドまたはフィールドの組合わ
せに含まれている各表示または表示の組合わせを検査してこれらの表示または組
合わせのうち弁別可能なものを識別し、限定された関係にしたがって第2のボキ
ャブラリの表示へ変換されるときの弁別可能な表示または組合わせは、同様に変
換されるときの弁別可能な表示または組合わせと互いに異なっており、
(iv)アナウンスを生成するアナウンス手段を制御するように動作可能であり、
アナウンスは弁別可能な表示または組合わせのうちの1つに対応する1または複
数の単語または単語の組合わせを含んでいる。
アナウンスにより出力される含まれている単語は任意の適切な形態であっても
よく、例えば含まれた単語は単語全体、綴られた単語またはアルファ数字を表し
てもよい。
別の特徴では、本発明はスピーチ認識方法を提供し、それは、
(a)応答を必要とする少なくとも1つのアナウンスを生成し、
(b)応答を認識し、
(c)認識された応答に整合するフィールドを含んだデータベースエントリを識
別し、
(d)このようなエントリの数が予め定められた限界を越えた場合、正または負
の応答に対する識別されたエントリの選択フィールドに対応する少なくとも1つ
の単語を含んだアナウンスを生成し、
(e)正の応答を受信したとき、認識された応答に整合するフィールドを含み、
その選択されたフィールドが前記単語に整合するデータベースエントリを識別し
、
(f)ステップ(d)と(e)を1回以上反復するステップを有する。
本発明の幾つかの実施形態を添付図面を参照して例示により説明する。
図1は音声、話された、データベース表示間の変換の1例を示したエンティテ
ィ関連図である。
図2は本発明にしたがった装置のブロック図である。
図3は図1の装置の動作を示したフローチャートである。
図3aは図1の装置の別の動作を示したフローチャートである。
図4は弁別可能なタップルを識別するプロセスを示したフローチャートである
。
図5は音声、話された言葉、綴り、データベース表示間の変換の1例を示した
エンティティ関係図である。
音声対話装置を以下説明し、これは使用者に対して質問を行い、使用者の応答
を認識し、それによってデータベースの内容をアクセスする。自動式電話ディレ
クトリ問合わせシステムで使用されるような名前、住所、電話番号のデータベー
スを1例として用いる。しかしながら、最初に、装置の動作を理解するのに重要
な幾つかの基本的な概念を説明する。
データベースは複数のエントリを含んでいるものと想定され、各エントリは例
えばエントリが照合する人物の姓名、位置、電話番号等の、エントリについての
情報のアイテムをそれぞれ含んでいる複数のフィールドを有する。1つのエント
リからの1フィールドセットをここではタップルと呼び、即ちN個のフィールド
の組合わせである(N=1、2または3であるとき、用語シングル、デュプル、
トリプルがそれぞれ使用される)。従って完全なエントリは1つのエントリから
抽出されたそれより小さいフィールドセットのようなタップルであり、したがっ
て例示のデータベースから取られた1セットの名/姓の対は1セットの抽出デュ
プルを形成している。
データベースフィールドに記憶された情報アイテムは任意の便利な表示であっ
てもよく、一般的にこの説明は通常テキスト表示の使用を想定し、例えば姓がジ
ョンソン(Jonson)の場合、名前の文字に対応する文字コードを使用するが、例
えば地理的位置等の幾つかのフィールドの形式化された表示では、サウスエンド
と呼ばれる地名が英国ではサウスエンド1、サウスエンド2、サウスエンド3の
ように3つ存在するように異なった表示で同一名称の幾つかの異なった位置を識
別する。
装置と使用者間の対話で使用されるフィールド内容を表すための単語はデータ
ベース表示とは概念上異なっており、各フィールドについて話されたボキャブラ
リー(語彙)を表す。データベース表示がテキストであるならば、これら表示と
話されたボキャブラリの間にオーバーラップが存在するが、そうであっても情報
のアイテムを説明するために使用者がデータベースフィールドに実際に含まれて
いる単語とは異なった単語を使用することを考慮することが望ましく、即ち幾つ
かの単語は同義語と見なされる。
最後に、複数の発音が1つの単語(同音異義語:ホモニム)に関連してもよく
、また反対に複数の単語が同一の発音を有する(同音字:ホモフォン)ことでも
よいことに留意する必要がある。
これらの概念は“エンティティ関連図”である図1に示されており、ここでは
、左から右、右から左に移行するときに表示を変換する必要性が見られる。ボッ
クスAは1つのデータエントリのセットを表し、ボックスBはエントリとの1:
多数(one:many)の関係を有する1セット(組)の特定の姓を表しており、即ち
1つの姓が多数のエントリで見られるが1つのエントリは1つの姓のみを含んで
いる。ボックスC、D、Eは名前、町、電話番号の表示のセットに対応し、ここ
では同様のことが言える。ボックスFは名前に対応する話されたボキャブラリ、
即ちこのフィールドの説明に使用することが装置により許容された全ての単語の
セ
ットを表している。これはデータベースボキャブラリとは異なっていてもよく(
または同じであっても、多くはそれと1:1の対応をもたない)、それによって
例えばアンディ(Andy)、ジム(Jim)等の(姓に対する)名の略称がアンドリ
ュー(Andrew)、ジェイムズ(James)等の正式名と同一の意味を有すると考え
られるような同義語等の別名(アリアス)を考慮する。話されたボキャブラリ単
語の好ましい形態と、使用の“可能性を有する”別の形態とに対応してボックス
CとFの間に2つの接続路が示されている。
同様に、ボックスGは町の名称に対応する話されたボキャブラリを表している
。ここで大きな町はその中に小さい場所または地区を含むことが多いので別名の
可能性が生じる。例えば、イプスウィッチ(Ipswich)はイングランドのサフォ
ーク(Suffolk)州の町である。その近くにケスグレーブ(Kesgrave)と呼ばれ
る小さい地区が存在する。ケスグレーブに在住の人はイプスウィッチまたはケス
グレーブとしてデータベースに記憶されている住所をもつ。同様に、このような
人の電話番号を探す問合わせ人はその場所のいずれかの呼び方をすることもある
。したがってイプスウィッチまたはケスグレーブはデータベースの検索の目的で
は同義とみなされる。しかしながら、この地理的な別名は複雑であることに留意
し、即ちイプスウィッチはフォックスホール(Foxhall )のような別の局地的な
村落と同義であるとみなされるが、ケスグレーブとフォックスホールは異なった
位置であるので同義ではない。
ボックスHは完全にするため姓についての話されたボキャブラリを表している
が、このフィールドでは同義語の範囲は恐らく小さい。
ボックスJは同音字および同音異義語(homophone and homonym )を考慮する
ため姓についての発音ボキャブラリを表している。例えば、Smith という姓は通
常、英単語“pith”のように短い“i”で発音するが、一方Smytheという姓は“
lithe”のように長音で“i”を発音する。他方、Smyth はどちらかの方法で発
音される。地域的にアクセントが異なっている例ではその他の例の種々の発音例
が生じる。以下説明する理由で、“主要”および“可能性を有する”のリンクが
示されている。
ボックスKとLはそれぞれ名前と地理的名称についての発音ボキャブラリを表
している。
図2は対話を行う装置のブロック図である。一方オーディオ信号入力1はスピ
ーチ認識装置2に接続されており、オーディオ信号出力3はスピーチシンセサイ
ザ(言語合成器)4に接続されている。記憶プログラム制御されたプロセッサ5
の形態の制御装置は認識装置とシンセサイザの動作を制御し、またプログラムメ
モリ6、動作メモリ(RAM)7、データベース8、話されたボキャブラリ変換
表9、発音表10へのアクセスを行う。オーディオ入力および出力は電話線等を経
て使用者との2方向の通信をするために接続されている。
データベース8は前述したようにテキスト形態で電話ディレクトリエントリを
含むものと仮定される。話されたボキャブラリ変換表9はディレクトリ表示と話
されたボキャブラリ表示から構成されている単語対を含んでいる記憶装置であり
、例えばIpswich がその例である。
データベース 話された言葉
表示 表示
IPSWICH IPSWICH
IPSWICH KESGRAVE
IPSWICH FOXHALL
KESGRAVE KESGRAVE
KESGRAVE IPSWICH
FOXHALL FOXHALL
FOXHALL IPSWICH
(所望ならば、話されたボキャブラリ単語と1:1の対応を有し、同じである
データベース表示として使用される任意の単語は変換が必要ないのでこの表から
省略されてもよい)。変換表9は各タイプのフィールドに対する別々の区域を有
し、所定のボキャブラリ単語に対応するデータベース表示を決定するためにプロ
セッサ5によりアクセスされ、その逆も行われる。所望ならば(またはデータベ
ース表示がテキスト形態ではないならば)全てのアイテムが変換されてもよい。
発音表10は検索表(および所望ならば、検索表中のエントリ数を減少するため
の1セットのルール)を含んでいる記憶装置であり、それによってプロセッサ5
は(合成目的または同音異義語の識別目的で)それをアクセスし、それによって
所定の話されたボキャブラリ単語に対して1または複数のその発音方法の音声表
示を獲得し、反対に(認識のために)その発音に対応する1または複数の話され
たボキャブラリ単語を獲得することもできる。各タイプのフィールドに対して別
々の区域が所望されるようにしてもよい。
装置の動作が図3のフローチャートで示されており、これはメモリ6に記憶さ
れたプログラムとして実行される。第1のステップはシンセサイザを使用して使
用者に対する質問の生成と使用者の返答の認識を含んでいる。従って、ステップ
100、104、108では、プロセッサ5はシンセサイザ4へ指令を送信し、電話番号
を探す人物の姓名と町名をそれぞれ使用者に言わせるようにリクエストするアナ
ウンスを行う。ステップ102、106、110では、プロセッサは認識装置2へ指令を
送信し、これらのフィールドに対応する音声ボキャブラリを参照して使用者の回
答を認識するように命令する。認識装置は各認識ステップで使用されるボキャブ
ラリを決定するために変換表9、10をアクセスするか、その固有のボキャブラリ
を内部で記憶または生成し、後者の場合、使用されたボキャブラリは表9、10(
および適切であるならばデータベース)により決定されるボキャブラリに対応し
なければならず、それ故、音声ボキャブラリに含まれる単語のみを出力すること
ができる。認識装置は、各認識ステップで、出力として、使用者が実際に話され
た単語に対して予め定められた類似性基準を満たすだけの数の音声表示を生成す
るように配置されている。(認識装置は勿論話されたボキャブラリ表示への変換
を行い、多数の認識装置はそれを行うことができる。)認識装置は使用者が実際
に話した単語が表10中の音声表示のどれともほとんど類似していないことを示し
、これをプロセッサ5へ示すことが可能である。好ましくは認識装置は実際に話
された単語に対応する相対的な確率または可能性を示している各表示の“スコア
”または確信尺度も生成する。予備ステップ 100−110 は他にも記載されている
ので(例えば国際特許出願第PCT/GB/02524号明細書を参照)これ以上説明しない
。
以下のテキストでは、データベースエントリに対して複数のスコアされたタッ
プル(scoredtuple)についての整合を含んだステップを説明する。これらの整
合がとれるエントリから、特定の(または弁別可能な)スコアされたタップルの
セットが得られ、これはその整合のために使用されたタップルとは異なったセッ
ト(恐らくオーバーラップしている)に対応する。
ステップ110 に続いて、プロセッサ5は各3つのフィールドに対して、認識さ
れていると考える1または複数の音声表示を利用できるようにしている。ここで
必要なことは話されたボキャブラリ表示への変換、即ち図1の左側に示されてい
る変換である。したがってステップ112 では、プロセッサは各単語に対して1ま
たは複数の対応する話されたボキャブラリ表示を決定するために表10をアクセス
し、それによって各フィールドにつき1つの、3つの話されたボキャブラリ表示
のセットを有する。
各話されたボキャブラリ表示に対するスコアは変換が行われた(もとの)音声
表示に対するスコアである。2つの音声表示が同一のボキャブラリ表示に変換さ
れるならば、2スコア以上の確信が得られる。これは前述の一般化された整合プ
ロセスの特別例であり、ここでは整合がとれるシングル(単一のもの)のセット
は発音であり、得られたシングルのセットは話されたボキャブラリアイテムであ
る。
ステップ114 では、プロセッサ5は、各話された表示に対して1または複数の
対応するデータベース表示を決定するために表9を使用してデータベース表示へ
の変換、即ち図1の中心に示されている変換を行い、それによって3つのデータ
ベース表示のセットをもっている。スコアは初期の変換のために送られる。デー
タベース表示はトリプルの数(実際の数は3つのセットのそれぞれの表示数の積
)を表している。トリプルのスコアは一般に、構成される個々の表示のスコアの
積である。ステップ116 で、プロセッサはこれらのトリプルのリストを作成し、
これをデータベースヘ送り、データベースはこれらのトリプルに対応するデータ
べースエントリ数のカウントKを戻す。この数がゼロであるならば(ステップ11
8 )、ステップ120 でプロセッサはエントリが発見されなかったことをアナウン
スするようにシンセサイザヘ指令を送り、プログラムを終了する(ステップ122
)。
その代わりに使用者がマニュアルオペレータへ転送するような他の動作が行われ
てもよい。
エントリが存在するならば、ステップ124 で、ステップ116 で整合した全ての
エントリタップルが次いでデータベースから検索され、3以下の弁別可能なエン
トリが存在するか否かを判断して決定する。タップルは可能性の順序で、最初に
最も可能性の高いものの順で検索される。1または複数のタップルが同一スコア
を共有することが可能である。この場合、任意のランキングがこれらの間で選択
されるか、ランキングを判断するために事前の知識が使用されてもよい。タップ
ルが検索されると、これらが3以下の弁別可能なエントリを表すか否かについて
の査定が行われる。“弁別可能”の意味とその判断決定方法についてここで説明
する。カウント4に到達すると、試験が終了する。(ステップ126 において)弁
別可能なエントリの数が3以下であるならば、ステップ128 でプロセッサはこれ
らのエントリをデータベースから検索し、これらをシンセサイザ4へ転送し、シ
ンセサイザ4はデータベース表示から一次的な音声表示へ変換するために表9、
10を使用して確信性が最も高いものを最初にした確信度の順序で使用者へ読出す
。
弁別可能なエントリが4以上存在するならば、プロセスは対話確定相に入り、
ここで3以下の弁別可能なタップルを含んでいる抽出されたタップルのリストを
識別し、続いて確定のため使用者へタップルを提供する。この例では、タップル
は名前(名十姓)に対応するデュプルと、町に対応するシングルである。この例
の場合でも原理上、これらのタップルの構成単語が使用者が既に尋ねているフィ
ールドに対応する必要はないことに留意すべきである。
ステップ130 では、名前のデュプルが既に確定するために与えられているか否
かに関する検査が行われ、第1のパスでは回答は常に“ノー”であり、ステップ
132 では抽出された名前のデュプルのリストがトリプルのリストから準備される
。リストからの名前デュプルは、3以下の弁別可能なデュプルが存在するか否か
を判断して決定するためにステップ124 におけるトリプルの試験方法と類似した
方法で試験される。(所望ならば、リスト中の同一でないデータベース表示デュ
プルの数がカウントされ、例えば30のような予め定められた限界を越えるなら
ば、詳細な試験プロセスは(ステップ144 へ)スキップされてもよい。)3以下
の弁別可能なデュプルが存在するならば(ステップ134 )スコアされた各デュプ
ルは単一の主要な音声表示へ変換され、ステップ136 で確信度の順序でシンセサ
イザ
へ供給され、それによってシンセサイザは質問(例えば)“名前はJohn Smithで
すか?イエスまたはノーで答えてください”と話しかけ“イエス”または“ノー
”を試験するように認識装置に一度に1つづつプロセッサヘ返答を転送する(13
8 )。使用者が“イエス”と返答したならば、ステップ140 へ進む。
(a)姓名フィールドは“確定”とマークされ、したがって確定のために姓名
フィールドをさらに与えることはステップ130 のテストによりバイパスされる。
(b)確定されたデュプル(以下参照)に関する以外のトリプルのリストの全
てのメンバー(構成要素)が消去される。
プロセッサはステップ124 から再開される。
使用者が“ノー”と返答したならば、トリプルのリストの対応するメンバは消
去される。消去されるものは、システム設計者により選択されるように音声表示
とデータベース表示間の限定された関係に基づいている。例えば使用者が氏名は
“John Smithですか?”と聞かれ、使用者が“ノー”と答えたならば、Smytheが
常に SmithまたはSmyth と異なって発音されることがシステム設計者により決定
されている場合、JohnおよびSmith/Smyth/Smytheを含むトリプルのリストの全て
のメンバが消去されるか、またはJohnおよびSmith/Smyth を含むメンバのみが消
去される。
同様に、使用者が“氏名はDave Smithですか?”と尋ねられ、使用者が“ノー
”と返答したならば、Dave Smithを含むメンバーは消去されてもよく、使用者は
“氏名はDavid Smithですか?”と尋ねられる。
(ステップ142 )使用者が全ての与えられたタップルに対してノーと答えたな
らば、これは失敗と考慮され、プロセスはステップ120 、122 を経てこれを終了
する。
ステップ134 のテストで弁別可能な氏名のデュプルの数が確定するには多過ぎ
るならば、または第2または後続のパスにおけるステップ130 で氏名の確定が既
に行われ、(ステップ144 )で町の名称が確定のために与えられていないならば
、町の名称の確定プロセスが開始され、既に説明したステップ132 乃至142 に全
ての観点で類似しているステップ146 乃至150 を含んでいる。
これらのプロセッサがテスト126 で弁別可能なエントリ数を減少できないなら
ば、プロセッサは与えられた返答に対して多過ぎるエントリが見つかったという
アナウンス156 によって最終的に終了する。その代わりに、さらに別のフィール
ドにおける情報を獲得するために(ステップ100 で行われたように)1または複
数の質問をする処理が後続する。
明瞭にするために、図3で示されステップ116 から進行する処理をデュプルと
シングルの確定に関して説明する。より一般的なアルゴリズムは以下のように進
行する。
開始:依然としてアクティブなデータベースエントリが存在しないならば:
“何もなし”メッセージを与える
アルゴリズムを終了する
ジャンプ:3以下の弁別可能なデータベースエントリが存在するならば:
それらを提供する
アルゴリズムを終了する
4以上の弁別可能なデータベースエントリが存在するならば:
連続し優先順位を有するフィールドまたはまだ確定されていない
フィールドの組合わせに対してこれらがなくなるまで以下のこと
が行われる:
これに関して3以下の弁別可能なタップルを有するタップル
リストが存在するならば:
このリストを確定する
確定がポジティブの場合、これを確定しJUMPへ進む
ネガティブな確定が“誤ったエントリ”というメッセー
ジを与えたならば:
“以下のことを行う”へ戻る
優先順位を有するリストでは、尋ねられた次のボキャブラリを得る。
尋ねられていないおよび確定されていないボキャブラリが残っているなら
ば:
それを尋ねる
アルゴリズムのスタートヘ移行する
尋ねられていないまたは確定されていないボキャブラリが残っていない
ならば:
“多過ぎる”というメッセージを与える
アルゴリズムを終了する
問合わせプロセス全体の別のプロセスが図3aに示されている。このプロセス
は以下のように行われる。
開始
依然としてアクティブなデータベースエントリが存在しないならば(300
)
“何もない”メッセージを与える(301 )
アルゴリズムを終了する
3以下の弁別可能なデータベースエントリが存在するならば(302 ):
それらを提供する(303 )
アルゴリズムを終了する
4以上の弁別可能なデータベースエントリが存在するならば(302 )
まだ確定されていないフィールドまたはフィールドの組合わせについての
各優先順位を付けられたリストのそれぞれを考慮する(304 )
3以下の弁別可能なタップルを有するタップルリストが存在する
ならば:
このリストを確定する(308 )
肯定的な確定の場合ならば(309 ):
スタートヘ移行する
否定的な確定ならば:
誤エントリメッセージを与える(310 )
アルゴリズムを終了する。
3以下の弁別可能なタップルを有するタップルリストが存在しな
いならば:
次のフィールドまたはフィールドの組合わせを考慮する
3以下の弁別可能なタップルを有するリストが存在しないならば
:
優先順位を付けられたリストでは、尋ねられていないおよび
確定されていない残りのボキャブラリが存在するならば
(305 )、
それを尋ねる(307 )
“スタート”へ移行する
尋ねられていないおよび確定されていない残りのボキャブラ
リが存在しないならば:
“多過ぎる”というメッセージを与える(306 )
アルゴリズムを終了する
前述の手順では、存在する弁別可能なタップルの数を判断して決定するために
データベース表示中のタップルのリストを試験することが必要とされる。(前述
のステップ124 のように)問題となるタップルはデータベースエントリ全体であ
ってもよく、これは(ステップ132 のように)2(以上)のフィールドからの表
示を含んでいる抽出されたタップルであるか、または(ステップ146 のように)
抽出されたシングルであってもよい。
2つの表示は以下(a)、(b)、(c)であるならば弁別できないと考えら
れる。
(a)それらは同一であるかまたは、
(b)それらは同一の話されたボキャブラリ単語(例えばこれらは同義語である
か地理的に混雑している)へ変換し、または、
(c)それらは同音異義語である話されたボキャブラリ単語に変換し(即ち、こ
れらの単語は同一の音声表示へ変換する)。
(前に定義したように)1つのタップルのフィールドが対応する他のタップル
のフィールドと弁別できないならば、2つのタップルは弁別できないものと考え
られる。
同様に、2つの表示は以下(a)、(b)、(c)であるならば弁別できると
考えられる。
(a)それらは同一ではない
(b)それらは同一の話されたボキャブラリ単語(例えばそれらは同義語ではな
く地理的に混同を生じていない)へ変換しない
(c)それらは同音異義語である話されたボキャブラリ単語に変換せず(即ち、
これらの単語は同一の音声表示へ変換しない)。
データベース表示のタップルのリストを有し、リストの第1のタップルがD(
1)、リストのn番目の位置を現在占有するタップルがD(n)であり、n=1
,・・・,Nであり、リスト中にN個のタップルが存在することを想定する。各タ
ップルはMフィールドからなり、dとして示され、タップルD(n)のm番目の
フィールドはd(n,m)、即ちD(n)={d(n,m)}、m=1,・・・,
Mである。好ましくはリストはスコアにより順序を定められ、即ち最高の確信度
を有するタップルはD(1)であり、次に高い確信度を有するタップルはD(2
)である。
以下説明するプロセスは図4のフローチャートに示されており、リストから第
1のタップルを取り、それをリストにおけるその下部のタップルと比較し、2つ
が弁別可能であるか否かを確めることを含んでいる。これらが弁別可能ではない
ならば、下部の位置を占有するタップルはリストから消去される。全てのタップ
ルが試験されるまでこれが繰返される。同じステップがリストの第2の位置を現
在占有しているタップルに対して行われ、以下同様に行われて最終的にリストに
残る個々のタップルが他のものと弁別可能である。所望ならば、弁別可能なタッ
プル数が後続するステップにより処理されることができるタップル数を越したこ
とを確定すると直ぐにプロセスは終了される(即ち例3)。
図4では、iはリストの1つのタップルを指しており、jはリストの下部の1
つのタップルを指している。lはリスト中のタップル数である。ステップ200 で
は、iは1に初期設定され、lはNに設定され、ステップ202 では、D(i)が
データベースから読取られる。ステップ204 はjを後続するタップルの点へ設定
し、ステップ206 でD(j)が読取られる。フィールドポインタmはその後ステ
ップ208 で1に初期化され、この後に後続のループで2つのタップルの各フィー
ルドが順に採用される。タップルD(i)のフィールドmは表9によって1また
は複数の話されたボキャブラリ単語s1(a)へ変換され、ここでa=1,・・・
Aであり、Aは実際上は、発見された同義語の数である。話されたボキャブラリ
単
語a1は表10によりB音声表示p1(b)(b=1,・・・B)の総数へ変換さ
れる。Bはこのような表示の数、即ち同音異義語の数により乗算されたAである
。類似のステップ214 、216 は1または複数の音声表示p2(d)(d=1,…
D)を生成する対応するフィールドD(j)の2段変換を行う。
ステップ218 では、各音声表示p1(b)は各表示p2(d)と比較される(
即ちBDの全体比較)。これらの比較に同一性が発見されなかったならば、2つ
のタップルは弁別可能であると考えられる。(ステップ226 において)jがリス
トの最後のタップルに到達していないならば、これはステップ206 の反復におい
てさらにタップルを読取る前にインクレメントされ(ステップ228)、そうでな
ければタップルポインタiはリストの語尾から2番目のメンバに到達するか否か
に関してステップ230 でテストされ、(到達していないならば)ステップ202 に
戻る前にインクレメント(232)され、(到達しているならば)プロセスは終了
する。この点で、リストは相互に識別可能なタップルのみを含んでおり、lは数
であり、結果kはステップ234 でプロセスのこの部分から出る前にステップ233
でlに設定される。
一方、218 における比較が1つのタップルの1つのフィールドで生成された音
声表示のうちの1つと、他のタップルの同じフィールドで生成された音声表示の
うちの1つとの間の識別を示しているならば、mをインクレメント(ステップ23
6 )し、さらに別のフィールドに対してステップ210 から218 を繰り返すことが
必要である。2つのタップルの全てのフィールドが比較され、全てが弁別可能で
はないならば、これはステップ238 で認識され、タップルは識別可能ではないと
考えられる。この場合、低いタップルD(j)がリストから外され、lがデクレ
メントされ、それによってリストに残るタップル数を表し続ける(ステップ240
、242 )。jはステップ244 で、これが(短くされた)リストの端を越えて指し
ているか否かを決定するテストをされ、さらにタップルが試験されない場合には
、ステップ206 から継続される。そうでなければプロセスは既に説明したように
ステップ230 へ進行する。
ステップ232 がiをタップルへの点へインクレメントする毎に、ステップ240
によりリストから除去されることにならない少なくともiタップルが存在するこ
とが知られている。したがってこの点では、iはこれが3に到達するか否かを見
るためにテストされることができ(ステップ246 )、到達しているならば、プロ
セスは中断され、kは4に設定され、出口234 へ進む。
図4のアルゴリズムと図3または3aのステップの関係を明瞭にするため、以
下のことを注目すべきある。
(a)アルゴリズムはステップ124 の実行を表し、図4の結果におけるリストは
エントリがステップ128 で与えられるエントリを(データベースから)アクセス
するために使用される。
(b)アルゴリズムはステップ132 の実行を表し、図4の結果におけるリストは
ステップ136 で使用者へ与えられるための(データベース表示の)氏名デュプル
のリストを表している。
(c)アルゴリズムはステップ146 の実行を表し、図4の結果におけるリストは
ステップ150 で使用者へ与えられるための町のリストを表している。
(d)アルゴリズムはステップ302 の実行を表している。
図3のステップ140 と154 で行われる除去を説明しなければならない。ステッ
プ140 を例に挙げると、従うべき原理は、使用者が、弁別可能ではないと考えら
れるタップルの対(またはグループ)の1つであるタップル(この場合ではデュ
プル)を確定する場合、これは他の対またはグループの他のタップルの確定を構
成するものと考えられる。例えば、氏名デュプルのリストが、以下の氏名を含み
、
Dave Smith
David Smyth
これらがステップ132 により弁別可能ではないと考えられるならば、(例えば最
初の“Dave Smith”の場合)1つのエントリのみがステップ136 で確
定されるために使用者へ与えられる。与えられるタップルは、システム設計者に
よる選択にしたがって決定される。しかしながら、使用者が“イエス”と返答し
たならば、ステップ140 で、“Dave Smith”を含む全てのタップルな らびに
“David Smyth”を含む全てのタップルが保持される。
これはステップ132 で行われる変換結果を使用して行われるが、以下のように
進行することが好ましい。音声表示における確定されたデュプルの各フィールド
p(即ちステップ136 で生成されたデュプル)は表9、10を使用して1または
複数のデータベース表示へ変換される。これらの表示の組合わせにより表される
全てのデュプルが確定され、即ちこれらのデュプルのうちの1つを含んでいるト
リプルのリストが保持され、他のトリプルは消去される。
図1のエンティティ関係図と、図3、4で説明されているプロセスとの関係を
明瞭にする価値がある。これらのプロセスでは、データベース表示から話された
ボキャブラリ表示へ、さらに音声表示への(即ち図1の右から左へ)変換が行わ
れ、またその反対方向、即ち音声表示から、話されたボキャブラリ表示へ、さら
にデータベース表示への(即ち図1の左から右)変換が行われる。図面の代わり
の通路(例えば話される可能性/主として話される)の存在は変換ルートの選択
を示している。合成するために、“主として話される”ルートが通常使用され、
他の目的では、変換に同義語または同音異義語を含むか除外するかの要求にした
がって変化が可能である。異なったルートを以下表にし、名前に対するルートセ
ットの1例を含んでいる。他のマッピングが使用されてもよい。 したがって、入力が受信され、入力信号を表す機械表示が発生されたとき、シ
ングル入力に対する機械表示は全ての可能なデータ表示へ変換される。これを実
現するために、入力は“可能性のある発音”ルートによって話された認識ボキャ
ブラリヘマップされる。したがって、入力の全ての可能な話された表示が識別さ
れる。これらの話されたボキャブラリ表示はその後、話された表示が表している
全ての可能なデータベース表示(例えば“話される可能性のある”)へマップさ
れる。例えば、名前“Dave”が入力され、音声表示D AI VとM AI Vがスピー
チ認識装置2により発生される。これらの音声表示は例えば“Dave”と“M
ave”のように話されたボキャブラリ表示へ変換される。これらの各話された
ボキャブラリ表示はその後、記憶装置9によって全ての可能なデータベース表示
(“話される可能性のある”)例えばDave、David、Mave、Mav
isへ変換される。プロセッサ5は名前フィールド中のこれらのエントリを含む
全てのエントリに対してデータベース8を検索する。
プロセッサ5は発見された全てのエントリに対して、選択されたフィールドに
含まれるそれぞれの表示を試験し、これらの組合わせから弁別可能なものを識別
する。弁別可能なエントリは確定するために使用者へ与えられる。これを行うた
めに、プロセッサ5は話されたボキャブラリ記憶装置10を参照して、限定された
関係にしたがって、識別されたデータベース表示を“可能性のある話された”ル
ートにより話されたボキャブラリヘ変換する。したがって、Daveの全てのエ
ントリは“Dave”または“David”へ変換され、Davidに対する全
てのエントリは“Dave”または“David”へ変換され、Maveに対す
る全てのエントリは“Mave”または“Mavis”へ変換され、Mavis
の全てのエントリは“Mave”または“Mavis”へ変換される。プロセッ
サ5はその後、記憶装置10を参照して話されたボキャブラリ表示を音声表示(“
可能性のある発音”)へ変換する。したがって“Dave”、“David”、
“Mave”、“Mavis”が発音される態様を表す音声表示はD AI V、DA
I V I D、D AA V I D、M AI V、M AI VI Sとして決定される。これ
らの音声表示は弁別可能なものを識別するために試験される。例えばDaveと
Davidはそれらが少なくとも1つの共通の発音を共有しているので弁別可能
ではない。しかしながら、MaveとDaveはこれらが共通の音声表示を共有
していないので弁別可能である。2つのデータベース表示が弁別可能でないこと
が認められたならば、一方の表示が維持され、他方は消去され、例えばDavi
dはDaveに勝るものとして選択され、MavisはMaveに勝るものとし
て選択される。この選択はシステム設計者により判断されて決定され、メモリ6
に記憶される。“David”および“Mavis”の最も確率の高い音声表示
が“話される可能性/主として話される”関係を用いてプロセッサ5によりシン
セサイザ4へ、さらに使用者へ与えられる。
実際、記憶装置9、10は各マッピングに対する別々の“表”を含んでもよいこ
とに留意すべきである。
図1はアナウンス手段、例えばスピーチシンセサイザのボキャブラリが入力手
段、例えばスピーチ認識装置のボキャブラリと同一である状態を示している。し
かしながら、これは必ずしも常に同一ではない。例えば、スペリングは話してい
る形態に対する代わりの入力または確定媒体として使用されてもよいことに留意
すべきである。スペリングに必要な技術は話された形態に直接類似している。図
5は図1に対応し、(ボックスMで示されている)町名のスペリングを有する(
簡単にするためにこれらのマッピングは図5で示されていないがスペリングはま
た姓名に対して与えられる。)“可能性のあるスペル”、“主としたスペル”が
話された認識に加えて設けられる。
スペリングが、図1を参照して前述した全てのルートを認識または確定する期
間に使用されるならば、“スペル”は“発音”に置換され、アルゴリズムは全て
依然として適用される。
提供および確定に関する考察が依然として行われるので、話されたまたはスぺ
ルの入力または出力は基本的ではないことを注意しなければならない。例えばキ
ーパッド入力が使用されるが、これは1または複数の文字を電話キーパッドの各
ボタンヘ割当てるために曖昧さの問題が生じる。この場合、キーパッド入力コー
ドのさらに別のボキャブラリが必要とされ、“可能性のあるキー”の変換は前述
した発音およびスペリング変換と類似している。
入力ボキャブラリとデータベースの機械表示は同一の技術にしたがって発生さ
れ、例えばデータベースエントリはテキスト形態で記憶され、入力もテキスト形
態で記憶され、データベースと出力の機械表示は話された出力等の異なった技術
にしたがって発生される。
使用者により話された実際の単語の同義語を含んでいるアナウンスが使用者に
与えられると混乱が生じる。例えば使用者が“Dave Smith”について
尋ねると、システムは“David Smithと言いましたか?”という出力
を発生する。この混乱を避けるため、識別された弁別可能なデータベースエント
リに対応する単語が入力手段により認識される単語に対応することを確認するチ
ェックが行われる。
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 オルセン、ポール・アンドリュー
イギリス国、アイピー4・2アールエヌ、
サフォーク、イプスウィッチ、アレキサン
ドラ・ロード 65
(72)発明者 ブリッジマン、シーマス・オーデェイン
アイルランド国、4 ダブリン、マリオ
ン・ロード(番地なし)、マリオン・ハウ
ス、テレコム・アイルランド・ソフトウェ
アー内
(72)発明者 ウィットテーカー、スティーブン・ジョン
イギリス国、アイピー4・4エルピー、サ
フォーク、イプスウィッチ、ブリストル・
ロード 53
【要約の続き】
ラリの表示へ変換されるときの弁別可能な表示または組
合わせは、同様に変換されるときの弁別可能な表示また
は組合わせと互いに異なっており、(iv)弁別可能な表
示または組合わせのうちの1つに対応する少なくとも1
つの単語または単語の組合わせを含んでいる出力を発生
する出力手段を制御するステップを有する。
Claims (1)
- 【特許請求の範囲】 1.データベースアクセス装置において、 (a)エントリに属する情報のアイテムの機械表示を含む複数のフィールドをそ れぞれ具備するエントリを含んでおり、前記表示は第1のボキャブラリを形成し ているデータベースと、 (b)このような表示の第2のボキャブラリ内に入る機械表示に応答して話され たアナウンスを表したオーディオ信号を発生するアナウンス手段と、 (c)信号を受信し、このような表示の第3のボキャブラリ内に入る機械表示を 発生するように動作可能な入力手段と、 (d)第1のボキャブラリと第2のボキャブラリとの間、および第1のボキャブ ラリと第3のボキャブラリとの間の関係を規定する変換手段と、 (e)制御手段とを具備しており、この制御手段は、 (i)規定された関係にしたがって、入力手段により発生される表示に対して第 1のボキャブラリにしたがって1以上の表示を発生し、 (ii)発生された表示を含んでいるデータベースエントリを識別し、 (iii )識別されたエントリの選択されたフィールドまたはフィールドの組合わ せに含まれている各表示または表示の組合わせを検査し、これらの表示または組 合わせのうち弁別可能なものを識別し、規定された関係にしたがって第2のボキ ャブラリの表示へ変換されるときの弁別可能な表示または組合わせは、同様に変 換されるときの弁別可能な表示または組合わせと互いに異なっており、 (iv)アナウンスを生成するアナウンス手段を制御するように動作可能であり、 アナウンスは弁別可能な表示または組合わせの1つに対応する少なくとも1つの 単語または単語の組合わせを含んでいるデータベースアクセス装置。 2.制御手段は、アナウンス手段を制御するように動作可能であり、それによっ て弁別可能な表示または組合わせの1つに対応する少なくとも1つの単語または 単語の組合わせをそれぞれ含んでいる連続的アナウンスを生成し、逐次的な確信 順序でアナウンスを出力するためアナウンス手段を制御するように動作可能であ り、第1のアナウンスは最も弁別可能な表示または組合わせに対応する少なくと も1つの単語または単語の組合わせを含んでいる請求項1記載の装置。 3.制御手段は、前記ステップ(iv)において、各弁別可能な表示または組合わ せに対して、弁別可能な表示または組合わせから変換手段を使用して、第2のボ キャブラリの1つの表示または組合わせを生成し、これをアナウンス手段へ送信 するように動作可能である請求項1または2記載の装置。 4.制御手段は、ステップ(iv)において、各弁別可能な表示または組合わせに 対して、アナウンス手段へ第2のボキャブラリの1つの表示または組合わせを送 信し、第2のボキャブラリは変換手段により規定される関係にしたがって、ステ ップ(iii )ですでに生成されている弁別可能な表示または組合わせに対応して いる請求項1または2記載の装置。 5.制御手段は、ステップ(iv)において、含まれている単語または組合わせの 確定をリクエストするアナウンスを発生するように動作可能であり、さらに動作 において、 (v)確定応答を受信したとき、含まれている単語に対応する第2のボキャブラ リ中の表示または組合わせから、1以上の表示または組合わせを第1のボキャブ ラリにしたがって生成し、選択されたフィールドでこのような表示または組合わ せを含んでいるデータベースエントリを識別するように配置されている請求項1 乃至4のいずれか1項記載の装置。 6.入力手段はオーディオ信号を受信するように動作可能なスピーチ認識装置で ある請求項1乃至5のいずれか1項記載の装置。 7.第2および第3のボキャブラリは同一である請求項6記載の装置。 8.第1および第3のボキャブラリは同一である請求項1乃至7のいずれか1項 記載の装置。 9.少なくとも1つの選択されたフィールドは、生成された表示がステップ(ii )で発見されたフィールドであり、ステップ(iv)に含まれる単語が入力手段に より生成される表示に対応している単語である請求項1乃至8のいずれか1項記 載の装置。 10.さらに中間ボキャブラリを具備し、変換手段は第1のボキャブラリと中間 ボキャブラリとの関係と、第2のボキャブラリと中間ボキャブラリとの関係と、 第3のボキャブラリと中間ボキャブラリとの関係を定めている請求項1乃至9の いずれか1項記載の装置。 11.エントリに属する情報のアイテムの機械表示を含む複数のフィールドをそ れぞれ具備したエントリを含んでおり、前記表示は第1のボキャブラリを形成す るデータベースと、このような表示の第2のボキャブラリに入る機械表示に応答 し、話されたアナウンスを表すオーディオ信号を発生するアナウンス手段と、信 号を受信してこのような表示の第3のボキャブラリに入る機械表示を発生するよ うに動作可能な入力手段とを具備しているデータベースシステムのアクセス方法 において、 (i)第1のボキャブラリと第3のボキャブラリの間の規定された関係にしたが って、入力手段により生成される各表示に対して、第1のボキャブラリにしたが って1以上の表示を発生し、 (ii)生成された表示を含んでいるデータベースエントリを識別し、 (iii)識別されたエントリの選択されたフィールドまたはフィールドの組合わ せに含まれている各表示または表示の組合わせを検査してこれらの表示または組 合わせのうちの弁別可能なものを識別し、定められた関係にしたがって第2のボ キャブラリの表示へ変換されるときの弁別可能な表示または組合わせは、同様に 変換されるときの他の弁別可能な表示または組合わせと互いに異なっており、 (iv)アナウンスを生成するアナウンス手段の制御は弁別可能な表示または組合 わせのうちの1つに対応する少なくとも1つの単語または単語の組合わせを含ん でいるステップを有するデータベースシステムのアクセス方法。 12.ステップ(iv)において、逐次的な確信度順序で1以上のアナウンスを出 力する出力手段を制御し、第1のアナウンスは最もそれらしい高い弁別可能な表 示に対応する少なくとも1つの単語または単語の組合わせを含んでいる請求項1 1記載の方法。 13.(a)応答を必要とする少なくとも1つのアナウンスを生成し、 (b)応答を認識し、 (c)認識された応答に整合するフィールドを含んだデータベースエントリを識 別し、 (d)このようなエントリの数が予め定められた限界を越えた場合、ポジチブま たはネガチブな応答に対する識別されたエントリの選択されたフィールドに対応 する少なくとも1つの単語を含んだ出力を発生し、 (e)ポジチブな応答を受信したとき、認識された応答に整合するフィールドを 含みその選択されたフィールドが前記単語に一致するデータベースエントリを識 別し、 (f)ステップ(d)と(e)を少なくとも1度反復するステップをさらに有す る請求項11または12記載の方法。 14.(a)応答を必要とする少なくとも1つのアナウンスを生成し、 (b)応答を認識し、 (c)認識された応答に整合するフィールドを含んだデータベースエントリを識 別し、 (d)このようなエントリの数が予め定められた限界以下である場合、整合する エントリの1以上のフィールドをそれぞれ含んだ1以上のエントリを与える出力 を発生し、終了し、 (e)このようなエントリの数が予め定められた限界を越えた場合、特定のフィ ールドまたはフィールドの選択に対して、同一のエントリの特定のフィールドま たはフィールドの組合わせに含まれている弁別可能な表示または表示の選択を試 験し、 (f)このような弁別可能な表示または表示の組合わせの数が予め定められた限 界を越えた場合、ステップ(e)を反復し、予め定められた順序にしたがって別 のフィールドまたはフィールドの選択を選択し、これは考慮されるフィールドが なくなるまで考慮されず、 (g)すでにリクエストされていないまたは確定されていない応答を必要とする 少なくとも1つの出力を発生し、 (h)応答を認識し、 (i)少なくとも1度ステップ(c)を反復し、 (j)このような弁別可能な表示または表示の組合わせの数が予め定められた限 界以下である場合、ポジチブまたはネガチブな応答に対する識別されたエントリ の選択されたフィールドに対応する少なくとも1つの単語を含んだアナウンスを 発生し、 (k)ポジチブな応答を受信したとき、認識された応答に整合するフィールドを 含みその選択されたフィールドが前記単語または単語の組合わせに整合するデー タベースエントリを識別し、 (1)ステップ(d)および(e)を少なくとも1度反復し、 (m)全てのこのような単語または複数の単語のネガチブな応答を受信したとき 、データベースアクセス方法を終了するステップを有する請求項11または12 記載の方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GB9601925.2 | 1996-01-31 | ||
| GBGB9601925.2A GB9601925D0 (en) | 1996-01-31 | 1996-01-31 | Database access |
| PCT/GB1997/000233 WO1997028634A1 (en) | 1996-01-31 | 1997-01-27 | Database access |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000504510A true JP2000504510A (ja) | 2000-04-11 |
Family
ID=10787862
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9527399A Pending JP2000504510A (ja) | 1996-01-31 | 1997-01-27 | データベースアクセス |
Country Status (12)
| Country | Link |
|---|---|
| US (1) | US5778344A (ja) |
| EP (1) | EP0878085B1 (ja) |
| JP (1) | JP2000504510A (ja) |
| KR (1) | KR19990082252A (ja) |
| CN (1) | CN1121777C (ja) |
| CA (1) | CA2244116C (ja) |
| DE (1) | DE69729277T2 (ja) |
| GB (1) | GB9601925D0 (ja) |
| MX (1) | MX9806168A (ja) |
| NO (1) | NO983501L (ja) |
| NZ (1) | NZ326441A (ja) |
| WO (1) | WO1997028634A1 (ja) |
Families Citing this family (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6301560B1 (en) * | 1998-01-05 | 2001-10-09 | Microsoft Corporation | Discrete speech recognition system with ballooning active grammar |
| EP1099214B1 (en) * | 1998-07-21 | 2004-09-29 | BRITISH TELECOMMUNICATIONS public limited company | Speech recognition |
| US6269335B1 (en) * | 1998-08-14 | 2001-07-31 | International Business Machines Corporation | Apparatus and methods for identifying homophones among words in a speech recognition system |
| US6192337B1 (en) | 1998-08-14 | 2001-02-20 | International Business Machines Corporation | Apparatus and methods for rejecting confusible words during training associated with a speech recognition system |
| US6185530B1 (en) | 1998-08-14 | 2001-02-06 | International Business Machines Corporation | Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system |
| WO2000036591A1 (en) * | 1998-12-17 | 2000-06-22 | Koninklijke Philips Electronics N.V. | Speech operated automatic inquiry system |
| GB2347307B (en) * | 1999-02-26 | 2003-08-13 | Mitel Inc | Dial by name feature for messaging system |
| US6587818B2 (en) * | 1999-10-28 | 2003-07-01 | International Business Machines Corporation | System and method for resolving decoding ambiguity via dialog |
| GB2362746A (en) * | 2000-05-23 | 2001-11-28 | Vocalis Ltd | Data recognition and retrieval |
| US7013276B2 (en) * | 2001-10-05 | 2006-03-14 | Comverse, Inc. | Method of assessing degree of acoustic confusability, and system therefor |
| US7177814B2 (en) * | 2002-02-07 | 2007-02-13 | Sap Aktiengesellschaft | Dynamic grammar for voice-enabled applications |
| WO2004036887A1 (en) | 2002-10-16 | 2004-04-29 | Koninklijke Philips Electronics N.V. | Directory assistant method and apparatus |
| US7426468B2 (en) * | 2003-03-01 | 2008-09-16 | Coifman Robert E | Method and apparatus for improving the transcription accuracy of speech recognition software |
| US7603291B2 (en) | 2003-03-14 | 2009-10-13 | Sap Aktiengesellschaft | Multi-modal sales applications |
| JP3890326B2 (ja) * | 2003-11-07 | 2007-03-07 | キヤノン株式会社 | 情報処理装置、情報処理方法ならびに記録媒体、プログラム |
| US20060167920A1 (en) * | 2005-01-25 | 2006-07-27 | Listdex Corporation | System and Method for Managing Large-Scale Databases |
| CA2693944C (en) | 2007-07-20 | 2015-11-17 | Ralf Dujardin | Polymer composite material with biocide functionality |
| US8383549B2 (en) | 2007-07-20 | 2013-02-26 | Bayer Cropscience Lp | Methods of increasing crop yield and controlling the growth of weeds using a polymer composite film |
| DE102014114845A1 (de) * | 2014-10-14 | 2016-04-14 | Deutsche Telekom Ag | Verfahren zur Interpretation von automatischer Spracherkennung |
| EP3504709B1 (en) | 2016-10-20 | 2020-01-22 | Google LLC | Determining phonetic relationships |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4831654A (en) * | 1985-09-09 | 1989-05-16 | Wang Laboratories, Inc. | Apparatus for making and editing dictionary entries in a text to speech conversion system |
| GB8610809D0 (en) * | 1986-05-02 | 1986-06-11 | Smiths Industries Plc | Speech recognition apparatus |
| US5027406A (en) * | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
| AU631276B2 (en) * | 1989-12-22 | 1992-11-19 | Bull Hn Information Systems Inc. | Name resolution in a directory database |
| US5251129A (en) * | 1990-08-21 | 1993-10-05 | General Electric Company | Method for automated morphological analysis of word structure |
| US5204894A (en) * | 1990-11-09 | 1993-04-20 | Bell Atlantic Network Services, Inc. | Personal electronic directory |
| US5454062A (en) * | 1991-03-27 | 1995-09-26 | Audio Navigation Systems, Inc. | Method for recognizing spoken words |
| CA2088080C (en) * | 1992-04-02 | 1997-10-07 | Enrico Luigi Bocchieri | Automatic speech recognizer |
| AU5803394A (en) * | 1992-12-17 | 1994-07-04 | Bell Atlantic Network Services, Inc. | Mechanized directory assistance |
| US5623578A (en) * | 1993-10-28 | 1997-04-22 | Lucent Technologies Inc. | Speech recognition system allows new vocabulary words to be added without requiring spoken samples of the words |
-
1996
- 1996-01-31 GB GBGB9601925.2A patent/GB9601925D0/en active Pending
- 1996-06-05 US US08/659,526 patent/US5778344A/en not_active Expired - Lifetime
-
1997
- 1997-01-27 NZ NZ326441A patent/NZ326441A/en unknown
- 1997-01-27 JP JP9527399A patent/JP2000504510A/ja active Pending
- 1997-01-27 WO PCT/GB1997/000233 patent/WO1997028634A1/en not_active Ceased
- 1997-01-27 EP EP97901199A patent/EP0878085B1/en not_active Expired - Lifetime
- 1997-01-27 DE DE69729277T patent/DE69729277T2/de not_active Expired - Lifetime
- 1997-01-27 KR KR1019980705981A patent/KR19990082252A/ko not_active Ceased
- 1997-01-27 CN CN97191984A patent/CN1121777C/zh not_active Expired - Lifetime
- 1997-01-27 CA CA002244116A patent/CA2244116C/en not_active Expired - Fee Related
-
1998
- 1998-07-30 NO NO983501A patent/NO983501L/no not_active Application Discontinuation
- 1998-07-31 MX MX9806168A patent/MX9806168A/es unknown
Also Published As
| Publication number | Publication date |
|---|---|
| CA2244116C (en) | 2001-11-27 |
| US5778344A (en) | 1998-07-07 |
| CN1121777C (zh) | 2003-09-17 |
| EP0878085B1 (en) | 2004-05-26 |
| GB9601925D0 (en) | 1996-04-03 |
| NO983501D0 (no) | 1998-07-30 |
| EP0878085A1 (en) | 1998-11-18 |
| MX9806168A (es) | 1998-10-31 |
| AU3606897A (en) | 1997-08-22 |
| KR19990082252A (ko) | 1999-11-25 |
| CN1210643A (zh) | 1999-03-10 |
| AU707248B2 (en) | 1999-07-08 |
| DE69729277T2 (de) | 2005-06-02 |
| NO983501L (no) | 1998-09-30 |
| CA2244116A1 (en) | 1997-08-07 |
| DE69729277D1 (de) | 2004-07-01 |
| WO1997028634A1 (en) | 1997-08-07 |
| NZ326441A (en) | 1999-09-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2000504510A (ja) | データベースアクセス | |
| US6230132B1 (en) | Process and apparatus for real-time verbal input of a target address of a target address system | |
| KR100556050B1 (ko) | 적어도위치및/또는거리이름들을위한입력시스템 | |
| JP4353212B2 (ja) | 単語列認識装置 | |
| KR100383352B1 (ko) | 음성작동서비스 | |
| US20020143548A1 (en) | Automated database assistance via telephone | |
| US8996385B2 (en) | Conversation system and conversation software | |
| JP3278222B2 (ja) | 情報処理方法及び装置 | |
| US7020612B2 (en) | Facility retrieval apparatus and method | |
| US20020032568A1 (en) | Voice recognition unit and method thereof | |
| JP2002123290A (ja) | 音声認識装置ならびに音声認識方法 | |
| JP4137399B2 (ja) | 音声検索装置 | |
| US6629069B1 (en) | Speech recognizer using database linking | |
| JP2019144348A (ja) | 情報処理システム及びコンピュータプログラム | |
| JPH11249689A (ja) | 音声認識装置および地図表示装置 | |
| US20040015354A1 (en) | Voice recognition system allowing different number-reading manners | |
| JP3576511B2 (ja) | 音声対話装置 | |
| AU707248C (en) | Database access | |
| US11250845B2 (en) | Vehicle virtual assistant systems and methods for processing a request for an item from a user | |
| WO2002086863A1 (en) | Speech recognition | |
| EP0844574A2 (en) | A method of data search by vocal recognition of alphabetic type requests | |
| JP2006301968A (ja) | 会話支援装置 | |
| JPH1063294A (ja) | 音声認識装置および音声認識方法 | |
| JP2025162928A (ja) | 音声応答システム、及びそれを利用した応答方法 | |
| JPH10124085A (ja) | 音声認識装置及び認識方法 |