JPS63500126A

JPS63500126A - 話者照合装置

Info

Publication number: JPS63500126A
Application number: JP61503732A
Authority: JP
Inventors: アバット，ヒューゼイン; デンカー，トーマス・エイ; エルマン，ジェフリー・エル; タオ，バートラム・ピー・エム
Original assignee: エッコ・インダストリ−ズ・インコ−ポレ−テッド
Priority date: 1985-07-01
Filing date: 1986-07-01
Publication date: 1988-01-14
Also published as: EP0233285A1; EP0233285A4; WO1987000332A1; AU6128586A

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】話者照合装置発明の背景この出願は１９８５年６月１日出願の米国特許継続出願第７５１．０３１号であシ、この出願と同一の本出願人に譲渡されたものである。

この発明は話者検証装置に関し、特に音声入力に基づいて個人を識別する方法及び装置に関する。

個人の識別をすることを必要とする場合が多数ある。このような場合には、保安環境に対する物理的なアクセスの制御、データ入力またはデータ転送の検定、自動テラー・マシンに対するアク毛ス制御、及びクレジット・カードの識別確定が含まれる。音声による識別は、よシ便利で１、遠方に、例えば電話により伝送することができ、しかも信頼性があるので、これらの場合の何れにおいても代替装置として優れている。

自動化された従来の話者検証装置は、その信頼性に限界からシ、多くの問題を拘えているので、通常その適用が高い信頼性を必要としない分野に限定されていた。

このような形式の装置は、連続したピンチ期間からピーク及び谷を選択して用い、未知の話者の音声入力に関する特徴座標を得ている。これらの座標は前に記憶した基準座標と選択的に比較される。比較の結果、未知の話者についての同一性を判断する。このような装置の大きな欠点は、記憶した発声を比較する際に、受信した発声の総合的な強度レベルの変化により問題が発生することがらるという点にある。

この技術分野における他の問題は、個人が試験センテンスを発声する特徴方法を、前に記憶した同一のセンテンスの発声と比較することである。この装置は試験発声と記憶した基準発声とのスにクトル及び基本周波数の一致に基づいている。

その結果、この装置は話者の音声ピッチにおける変化によシ誤シが発生し易い。

また、話者の検証に利用されていた他の形式の構造は、各発声をろ波して、個人を高度に表わすパラメータを得ているが、発声の定数から独立している。これは、話者の声道の固有な特性に基づく線形予測分析によシ達成される。話者の声道の特性を識別する信号を、話者の識別を表わし、かつ話者の物理的な特徴を表わす一組の信号に変換するために、−組の基準計数信号が採用されている。

その装置において前記の線形予測・ξラメータを用いて未知の話者の仮想識別を発生した後、識別した話者の物理的な特徴を表わす信号と比較することにより、未知の話者の同一性を確認する。文献は、その装置において試験発声と基準発声との間の歪みを比較することができる機構については説明していない。

その結果、発声分析の予備ステップに対して、話者検証の段階を実際に実行するための明確な方法は示されていない。

いくらか異なる解決方法を採用した他の装置は、ユーザが発声した標準的なフレーズに対応する波形の瞬時的な不変量を用いた話者検証装置を備えている。即ち、同一のユーザによる同一フレーズの独立発声数を用いて、発声ベクトルにそれぞれに対応する一組の瞬時的な不変量を編集する。次に、平均的な発声はクトルを計算する。平均的な発声ベクトルと後に得た発声ベクトルとを比較して、話者の検証を得る。異なる年令および性の個人グループの瞬時的な不変量も記憶し、またユーザーに対して同じような年令及び同性にあるグループ内の複数個人の不変量グループも、記憶したユーザーの発声ベクトルと比較して重み付はベクトルを得る。ユーザーの重み付はベクトル及び計算した発声ベクトルをカードに記憶し、濁値を計算する際及びユーザーの発声を後に評価する際に用いる。この装置は、試験発声と参照番号発声との間の歪みを比較することができる機構については何も述べていない。更に、平均発声ベクトルに対して新しい発声を比較することに基づいての許可の信頼性には疑問がちる。これは、ユーザーの発声が種々なその特徴に大きな変動が見られるときに、特に疑問がある。例えば、話者が与えられた時間に単語を違えて話すときは、単純平均値はこのように変動する音声の確認に柔軟性がない。

更に、関連する他の装置では、分類する試験単語と他の標本値との間の「距離；Ｎ値」及び「平均値」を計算し、「重み付は係数」を用いて特定の変数の重要性を測定する。これらの部分が基準標本値の部分の最小距離内に入るときに、また藏値外の試験単語の複数部分の比較により音声の検証ができることを除き、与えられたユーザーについて固定的な絢値を必要とする。

試験標本値の近傍に基準標本値がないときは、試験標本値が基ン１準、ダ、値外にあるときに許可を得る手段がない。例えば単語を無意識に正しく発音しなかったときは、ユーザーを検証することができない。

この技術における更に他の装置では、与えられた基準単語の基準化したテンプレートに複数の話者の音響的な特徴の平均値を記憶するものでるる。識別された話者の発声に応答して、基準単語の特徴テンプレートによシ識別した話者の特徴の対応性を表わす一組の信号を発生する。未知の話者の発声を、未知の話者の発声特性、及び確認をした複数の単語について記憶したテンプレートと比較することによシ分析する。更に、この装置は受信した音声の１標本値とその特定のユーザーの１ｎ値とを比較するという問題もある。その結果、単語を発音する１回の試行が装置に記憶している基準情報から大幅に異なっているときは、ユーザーは（勾値の設定に従って検証を証明することができない。

多くの従来装置が有する他の問題は、音声の開始及び終了を検出する信頼性のるる制御可能な手段がないことである。これは、更に従来装置の信頼性を低下させたり、音声の終了点の識別を目的とする精巧な構成により装置のコストを大幅に増加させるものでちる。多くの従来装置では、このような検出をすることなく、基準音声と検出が困難な終了点を有する受信音声とを信頼性のある比較をすることは、非常に困難である。

以上で述べた技術のような話者検証の技術における種々の問題に鑑み、話者検証について装置の信頼性を高めることは、大きな技術上の進歩となる。更に、パラメータを用いて与えられたユーザーの複数の試行及びユーザー自身の単語テンプレートによる話者の比較に基づき、合否を評価する場合、かつ与えられたユーザーの情報がユーザー検証のために選択した囚値しくルに基づき氏名詐称証者を許可する可能性を有する場合に、声道に固有な特性を反映する話者従属特性に基づく強度変動からこのような装置がほぼ独立しているならば、これも重要な改善となる。更に、これは、装置が合否前にユーザーから抽出する複数の標本値を得ることができ、従って単語の発音における疑似的な又は偶発的な誤シがユーザーの識別の妨げとならないならば、改善となる。更に、実行した多数の試験により検証基準を定め、かつ検証ａｔ値の厳密性を変化させるｋに監視員による調整又は変更が容易であれば、これも改善となる。

識別の検証を実行する方法および装置を提供するものである。

特に、この発明は、ユーザー自身及び包括的な発声データの比較により、処理されるユーザーからの単語の標本値を有するデータ・ベースを最初に導出し、与えられた単語に基づく検証に関連して氏名詐称証者を誤って許可する確率手段を導出する装置を提供するものである。生成された前記データ・ベースによシ、装置は処理をし、複数の試行に基づき、かつ前記データ・ベースの情報に鑑み、話者の識別を検証する。

話者は、検証目的用に装置を使用する前に登録されなければならない。装置は、ユーザーを登録するために、充分な数の単語のトークン（トークンとは箪語の一回の発声であシ、本明細書中「証拠」、「合言葉」として記載される。）を得て、データ・ベースに記憶するまで、一連の基準単語のトークンのためにユーザーを繰シ返して促す。トークンを特徴分析に掛ること−によシ、話者の声道のある係数情報が得られる。トークンは終了点検出器にも掛けられる。装置は、トークン間の比較によシ、かつ対応する通常の人間集団のトークンにより、氏名詐称証者を誤って許可する確率、又は真の話者を拒否する確率の手段を得る。

登録したユーザーは、自己の音声を検証（確認）したいときは、自分が要求している識別を入力し、次に装置がユーザーに発声を促す。ユーザーの発声はディジタル的に符号化されて分析される。開始点と終了点とが検出され、発声の特徴に対応する係数が導出される。選択した単語についてユーザーが前に記録したトークンから導出し、選択した係数を、新しく受信した発声の係数と比較して、新しい発声と各基準トークンとの間の距離の測定値を導出する。この処理全ユーザーの付加的な発声について反復する。登録中に導出した確率情報に対する１以上の距離測定値を分析することによシ、装置は誤判定する確率を決定する。これらの確率に基づいて、ユーザーを受付けるか、拒否するかの判断を以下の複数の段階で行なう。段階毎に累積する確率を用いることＫより、異なる単語に対する幾つかの音声試行と関連して音声をダイナミックに評価する手段が得られるので、検証判断は種々の単語のそれぞれについてのユーザーの実行に基づいておシ、氏名詐称証者を誤って許可する可能性を低減させている。

この発明の一つの概要的な特徴は、初期の段階で次の段階に進むべきか否かの判断を行なう段階で、検証判断（すなわち、確認）を行なうことであシ、次の段階では検証判断を最初の段階で行なった分析と、次の段階で行なった分析とに基づいていることである。

他の概要的な特徴は、記憶した音声情報から導出した確率データから得る少なくとも一つの確率値について検証判断をバイアスすることである。

他の概要的な特徴は、話者が既知の人物であると検証されたときにのみ、話者の発声についての試験情報に基づき記憶情報を更新することにある。

他の概要的な特徴は、話者が既知の人物であると検証されたときに、装置（例えば、ドアのロックのソレノイトリをトリガする非磁気的なパワー・スイッチである。

他の概要的な特徴は、符号化されたトーン信号を検出し、デコート９すること、かつ同一のディジタル・プロセッサを用いて音声検証を実行することにある。

他の概要的な特徴は、分析を同時的に処理することができるように、異なるステーショ／から受信した異なる発声の分析を時分割ですることにある。

他の概要的な特徴は、発声を受信する複数のステーションと、それぞれのステーションにサービスを行なう複数のプロセッサと、リアル・タイムでそれぞれのステーションにサービスを行なうリアル・タイム処理装置を有するホスト・コンピュータとを組合せることにろる。

他の概要的な特徴は、以下で説明する好ましい実施例、及び請求の範囲から明らかとなる。

第１図はこの発明に用いられる音声検証の方法の一般的な概要ブロック図である。

第２図はこの発明の話者検証装置で用いられる装置の好ましい一実施例の詳細なブロック図である。

第３図及び第４図はこの発明の話者検証装置の動作を説明するフローチャートである。

第５図はこの発明の音声検出装置の状態図である。

第６図から第８図はこの発明の話者検証装置の動作を説明するフローチャートである。

第９図は与えられた単語のトークンの比較を表わす全体的な歪みを得る方法のグラフ表示である。

第１０図およυ第１１図はこの発明の話者検証装置の動作を示すフローチャートでるる。

第１２図はこの発明の動作で導出した歪みを編成するアレー゛Ｄ″の表である。

第１３図はこの発明の動作において生成された単語側の５ＴＡＴフアイルの表である。

第１４図から第１６図はこの発明の話者検証装置の動作を示すフローチャートである。

第１７図はリアル・タイム処理装置を有するホスト・コンピュータがサービスをする多重アクセス・モジュール装置のブロック図である。

第１８図はアクセス・モジュールのブロック図である。

第４９図はアクセス・モジュール部分のブロック図である。

第２０図はアクセス・モジュールにおけるリレ一式回路の回路図である。

第２１図はリアル・タイム処理装置のメモリ配置テーブルのブロック図である。

第２２図、第２３図はリアル・タイム処理装置で用いられる種々のテーブルである。

第２４図は検証処理のフローチャートである。

第２５図、第２６図は他の検証処理のフローチャートである。

第２７図は他の検証処理で用いられるガウス関数を示す。

第１図を参照してこの発明を機能的に説明することができる。

この装置の動作は、装置を作動させるスイッチもしくは他の機械的な作動装置の動作のような外部条件にょシ、ユーザーの存在を検出するフォトセンサのような電子検出装置により、ユーザーの音声を検出する音声もしくは音響の付勢により、またはこれ以外に「タッチ・トーン」信号を付勢させるような雑音を作成するによりブロック２０から開始される。

付勢された装置は、ユーザーによシ、又は前の時点でオイレータによるシステム処理のために予め選択されたものにょシ、要求されている処理を実行するように機能する。この観点において、装置はブロック２ｏから判断ブロック２２に進み、受取った命令に基づいて全体を２４で示す「登録」モードに入るか否かを判断する。

登録モート９は特定のユーザーに関連する情報ｆｃ邑該ユーザーから獲得し、後の時点でユーザーの識別を検証する際に用いる−ために処理し、かつ記憶する処理を行なう。この情報には、データ・ベースを形成するように処理され、ユーザーが選択した基準単語を発声したもの（即ちトークン）が含まれており、このデータ・ベースを次のユーザー検証において比較用に用いる。

従って、個人が検証用に装置を使用可能となる前に、彼または彼女は処理の登録モードにおける登録処理を経る必要がある。

装置が登録モードに進むように命令されたときは、装置は判断ブロック２２からブロック２６に進み、オにレータは装置にユーザー名前、ユーザーが通過してもよいアクセス点、及びユーザー検証において偽許可及び偽拒絶誤シに対する最大許容レベルを含む情報をキー・インする。アクセス点及び最大許容レベルが指定されなかったときは、デフオールド値を用いる。

装置はブロック２６からブロック２８に進み、ユーザーを促してユーザーが記録すべき基準単語のリストのうちの一つを発声させる。このような発声によって、パターンがユーザーの識別を表わしている音響的なメツセージを得る、即ち通信をする。

装置は、ユーザーを促した後、ブロック３ｏに進み、受信信号を標本化すなわち、正規化する。装置は発声を検出すると、ブロック３２に進み、検出した発声をディジタル形式に変換する。

装置は、ブロック２２からブロック３４に進み、受信信号を周期的に標本化し、各期間は標本値を形成する。この標本値には特定の期間中に検出した音声を表わす信号が含まれている。

標本値は、指定された標本数がフレームを形成するまで記憶され、次いでこのフレームを処理することにより、フレームを表わす自己相関関数、正規化自己相関関数、及び線形予測係数を得る。各トークンから抽出した一組の係数（「テンプレート」と言う）は、以下で説明する検証処理で用いられる。この線形予測係数は話者の声道特性を表わすものである。

装置は、ブロック３４からブロック３６に進み、ブロック３４で抽出した特徴を用い、発声の開始点及び終了点を検出する。

受信信号のエネルギ及びスＲクトル・レベルに基づいてこの終了点を検出するために、状態機械が用いられる。抽出された特徴及び終了点を一時記憶メモリ３８に記憶した後、ブロック３６から判断ブロック４０に進む。

それぞれ選択した各単語について指定トークン数を未だ得ているときは、ブロック４０はブロック２８に戻り、他の発声をするようにユーザーを促し、以上説明した処理を続ける。ブロック４０において、必要なトークンを得たと判断したときは、装置はブロック４２に進み、命令を受取ってデータ・ベースを形成する時点まで、ループして待機する。

装置は、データ・ベースを形成するように命令されると、ブロック４２からブロック４４に進み、全体的な歪み値が形成され、ブロック３８から抽出した特徴をアクセスし、与えられた基準単語のそれぞれのテンプレートと自己のものとの間で比較すると共に、これらの特徴を一般的な話者グループの対応するトークンに対しても比較する。これらの比較の結果、−組の全体的な歪みが得られ、各歪みは対応する２つのテンプレート間。

の距離値を表わすものである。

装置は、ブロック４４からブロック４４に進み、対応する同一ノ話者のテンプレートについての話者間比較、及びユーザーのテアプレートと全体的なテンプレートとの話者間比較について全体的な歪みを処理し、選択した１ん値レイルに従って氏名詐称証者の偽許可の確率を示すアレーに整理する。テンプレート及び対応する因値を基準テンプレート・ブロック４７に記憶し、ブロック４７に記憶されたテンプレート及び成値に関連するユーザーの識別をブロック４８に記憶する。

装置は、全てのテンプレートを形成し、１開値を計算した後、ブロック４６からブロック４９に進み、以下、登録モードの処°理を終了する。

装置が判断ブロック２２において登録モードに入るように命令されていないときは、装置はブロック５０に進み、全体的を５３で示す検証モードに装置は入るか否かを判断する。アクセス点にユーザーが存在するときは、この検証処理が開始される。

装置は、検証モードに入るように命令されたときは、ブロック５２に進み、ユーザーによる付勢を待機する。ユーザーは、限定的ではないが、キー−・パッドに個人的な識別番号を入力すること、読取装置にプラスチック・カードを挿入すること、又はマイクロフォンにその者の名前を言うことを含む幾つかの方法で装置を付勢することができる。装置は、ブロック５２においてこのユーザーのデータを受信すると、ブロック５４に進み、メッセー：）全送出してユーザーが登録モードで前に記憶した基準単語のうちの一つである発声の入力を要求する。

装置は、ブロック５４から音声を表わす電子信号の受信を検出するブロック５６に進む。装置は、音声を検出すると、ブロック５８に進み、電子信号全ディジタル的に符号化して、予め選択した期間で検出された受信音声を表わす８ビツトのワードに形成し、これを以下、「フレーム」と呼ぶ。

次に、装置はブロック６０に進み、各フレームラ処理し、その線形予測係数パラメータ（以下、ＬＰＣパラメータと呼ぶ）を得る。ＬＰＣパラメータの導出には、先ずフレーム内において近傍の音声標本値間の統計的な依存の程度を計る自己相関係数の計算が含まれる。典型的なものとして、各フレームには１００カら３００の音声標本値が含まれ、自己相関係数は種々のこれらの標本値間の関係を表わしている。

自己相関係数は「レビンソンのアルゴリズム」と呼ばれる周知のアルゴリズムを用いることにより処理され、フレームを表わす係数グループを導出する。これらの自己相関係数は線形予測係数を含み、話者の声道の形状を表わしている。これらの自己相関係数は処理によシ、この変換係数によって音声のフレームを表わす線形予測係数グループを表わす一つの変換係数に変換される。この情報は以後で使用するために記憶される。

以上で説明した変換係数の導出処理は、発声が終了するまで、発声のセグメントについて続けられる。従ってブロック６２において、装置は発声の終了点を検出して、当該発声に対応する変換係数グループを含むテンプレートを形成する。従って、このテンプレートによって発声を表わすものとなる。

装置は、このブロック６２か′らブロック６４に進み、発声のテンプレートはダイナミック・プログラム分析によシ、特定の発声に対応する基準テンプレートに比較される。比較用の基準テンプレートは基準テンプレート・メモリ６６から抽出され、基準テンプレート・メモリ６６は、一般的な話者グループを表わす対応の単語テンプレートと共に、登録処理中に個々のユーザーが生成したこれらのテンプレートを記憶している。ブロック６６において参照される特定のテンプレートは、識別メモリ６８からの信号によシ識別される。この信号は、ブロック６６においてブロック５２で入力したユーザーの識別に基づき、かつブロック５４において識別され、促されて特定の単語によシ、特定の基準テンプレートを選択するものである。

ブロック６４において生成された距離比較、即ち「歪み」は、それぞれその発声の差である一組の値であり、その特定のユーザーの基準テンプレートのうちの一つに対する比較によシ試験される。次いで、これらの差の値を処理して現在発声と基準発声との間の相対的な対応性を示す「スコア」を得る。

次に、装置は判断ブロック７０に進み、ブロック７２から適当な底値を参照して許可するか、拒絶するか、未だ決定していないかを判断する。ブロック７２の自信はオにレータにより設定することができるが、オペレータによりセットされなかったときは、デフオールド値すなわち、ｄｅｆａｕｌｔ　ｖａｌｕｅｓにセットされる。これらのＨ５，値はエネーブル・モードにおける比較結果に基づく一組の「スコア」を有し、氏名詐称証者が受信した選択試験発声を誤って受付ける確率を表わしている。

ブロック７０では、ブロック６４のスコアをブロック７２のり値と比較する。スコアが１句値以下であったとき、及びユーザーが少なくとも２つの試験単語を発声したときは、その者は許可され、装置はブロック７４に進み、以後検証モードすなわち、確認モードの処理を終結する信号を発生する。スコアが囚値以下であっても、ユーザーが少なくとも２つの標本値を得ることができなかったときは、装置はブロック５４に戻シ、ここでユーザーを促して登録処理で得た他の基準単語に対応する発声を得る。

ブロック７０において、ユーザーがブロック７２における面位以上のスコアを得たときは、失敗とする。２回未満の失敗のときは、装置はブロック５４に進み、ユーザーの他の基準単語すなわち基準ワードについてユーザーを促す。ユーザーが２回とも失敗したときは、装置はブロック７０からブロック７４に進み、そのユーザーを氏名詐称証者として拒否する。装置は、ブロック７４かうその個人の不照合に基づいて以後の処理を禁止する信号を発生する。

検証を得ること、または拒否することに対する以上の試行または失敗の数の以上の例は、例示目的のみのもので１、これらのパラメータをオはレータの所望によシ変更してもよい。この実施例においては、それぞれ新しい試験単語によシ、許可及び拒否の成値が固定されたままである。しかし、選択により、更に多くの発声試行を行なう時間に変更するためのブロック６４の合成スコアにおける変化に比例させて、１気値を変更することは可能性で多る。

第１７図を参照すると、装置１１０においてＩＢＭ、ｅ−ソナル・コンビーータ１１２　（ＸＴまたはこれと同等のもの）にリアル・タイム処理装置１１４が備えられておシ、バス１１６を介して４４の検証ボード（ＳＶＢ）１１８に接続され、リアル・タイムのサービスを行なっている。各ＳＶＢは多重処理形式により２つのステーション１０２にサービスを行なうことができる。ステーションのうちの一つであるステーション１０３は登録処理に割ｐ付げられ、登録ステーションと呼ばれる。

この発明の装置はインタラブド・プロトコル後に同期的な方法、または直接メモリ・アクセス（ＤＭＡ）方法によυホスト・コンビーータのバスを介して動作するように設計されている。

実質的にどのような基準によってもホスト・インターフェースをプログラムすることができるが、ここに關示した実施例はホストとしてＩＢＭ、ＰＣ／ＴＸを使用することを仮定している。。

従って、ホストは、商業的な市場で現存する周知のより／Ｍパーソナル、コンビーータのうちの多くのものから選択可能なものでおって、僅かな修正を必要とするだけで実質的に如何なるコンピュータ・バスのインタフェースも行なう。こけホストは、ユーザーのために以上で述べた基準テンプレートを収集して記憶すること、基準テンプレートについての統計的な情報全計算し、更新し、記憶すること、及び幾つかの検証作業を実行することができる。第１７図に示した装置の物理的な構成は、バス１１６及びＳＶＢ　１１８をホスト・コンピュータの内部に収容するとともに、ステーション１０２をホストの外部に設けるようにしたものである。

第１８図を参照すると、各ステーション５９０は１６キーのタッチ・トーン・バッド５９２と、マイクロフォン５９４と、表示ランフ５９６とを備えている。ステーション５９０はマルチプレクサ６０２及び双方向３線式信号線５９８を介して５ＢＶ６００に接続されている。

第１９図を参照すると、決して同時ではないが、登録及び検証中の種々の時点で、ユーザーは、（例えば、検証中に自己を識別するために）タッチ・トーン・キーを押し、（例えば、基準単語を話すために）マイクロフォンに向って話す。タッチ・トーン・キーを押すと、ＤＴＦＭ）−ン発生器６０４は基準ＤＴＦＭ信号ベアのうちの一つを発生し、これを信号合成器６０６を介して線５９８に転送してＳＶＢ　１１８に送出する。マイクロフォンは話すことによシ音声信号を発生し、これを信号合成器６０６を介して線５９８に転送する。

ＳＢＶにおいて、５Ｄ１０６　（以下で説明する）は音声信号を受取シ、アナログ・ディジタル変換器（Ａ／Ｃ）６０８を介して転送する。ディジタル化した標本値は５Ｄ１０６からＳＰ　１２２（以下で説明する）に転送され、ここでフレームに編成され、各フレームについて線形予測係数を導出する。付勢を表わす信号が（第５図の状態機械によシ）検出されると、ＣＰ　１１０　（以下で説明する）は次の受信フレームを分析して音声即ちトーン信号を受信したか否かを判断する。トーン信号を検出すると、通常のフーリエ分析を実行してどのキーを押したのかを判断する。しかし、音声信号を受信すると、以下に説明するようにこ− １れらの音声信号を処理する。従って、ＤＴＦＭ信号の復号処理には音声信号の処理に必要とする同一のハードウェア及びソフトウェアが用いられる。

第２０図を参照すると、ステーション５９０内において（例えば、ドア・ロック・ソレノイドを作動させるための）、固体回路リレー６１０が電源６１２（電源装置）に接続されている。電源６１２は１２ボルト又は２４ボルトのＡＣ又はＤＣ（パルス化したＤＣ）を供給することができ、スイッチによシ選択可能になっている。リレー６１０は（点線内に）ディオニックス（Ｄｉｏ−ｎｉｃｓ）　ＤＩＧ　−１２−０８−４５オプト・カップラー６１６の光源に電力を供給する「オープン」　−コレクタの非反転バッファ６１４を備えている（オプト・カップラー内に備えられている光源は近赤外線スペクトルによシ光を発光するガリウム・アルミニウム砒素型の発光ダイオ−）（ＬＥＤ）で°らる。）ドア開放信号６１８は、特殊な波形のものであシ、線５９８を介して送出され、カウンタ６２０をリセットする。カウンタ６２０は内蔵ｒア受坐発振器６２２のクロック信号によシ駆動されている。第２のカウンタ６２４は、種々のドア受坐の「オン」時間（２秒〜５０秒）についてスイッチにより選択可能（スイッチ６２５）である。

カウンタ６２４の出力はゲート６２８に接続されており、ゲート６２８はジャンパ６３０によシ選択する「通常オフ」または「通常オン」のドア受坐電力を供給する。ゲート６２８の出力は直接、固体回路リレー６１０の状態を制御する。

光学的に結合された（電気的に絶縁した）リレーの理由には２つめる。その第１ ″はリレー６１０の電力ＭＯ３ＦＥＴ、即ちそれらの入力駆動がシステム接地を参照することを防止することであり、その第２は装置のロジックを雑音及びその高い電圧（１５００ボルト）のトランジェントから絶縁することである。

オプト・カップラー６１６の出力は、非常に低抵抗のビレイン・ソース（Ｒオンとして知られている最大０．０８５オーム）によシ特徴付けられる２つの電力ＭＯ３ＦＥＴ６３２，６３４　（モトローラＭＴＰ２５Ｎｏ６ｔたはインターナショナル・レフティファイア社ＩＲＦ−５４１）’を駆動する。全ての電力ＭＯ３ＦＥＴは動作電圧の通常極性から逆方向に接続された複合ダイオード、ドレイン・ソースを有する。このダイオ−ｒはＡＣまたはＤＣ動作が可能なリレー６１０の動作において重要な働きをしている。一方の極性では、電流が左側の電力ＭＯＳＦＥＴのバルク及び右側の電力ＭＯ３ＦＥＴのダイオードを介して流れる。極性が反転すると、電流の流れも反転する。非機械的な接点と異なり、電力ＭＯ８ＦＥＴの接触抵抗は容易に経年変化をしないので、電力ＭＯ８ＦＥＴはかなり信頼性がある。またこれらの電力ＭＯ３ＦＥＴは湿度によシ影響されず、デバイス「オン」に切換えるために非常な低電流（＜１ｏＯＸ１０　アンヘア）を必要とするだけである（従って、ターン・オンに非常に低電力の電圧源を用いることができる）。素子６３４はゼネラル・エレクトリックから購入可能なＶ４７ＺＡ７であシ、トランジェント制限及び保護に用いられる。

第２図に示すシステムはリアルタイムで同時に別々のステーションに居る２人のユーザーをノ・ンドリングするために２個の検証チャンネルを多重タスクすることができる。更に、前記システムは１６個の別のユーザーステーション１０２まで支援するように構成されている。ＳＤ　１０６は、データシステムを構成するためのその他の周知の従来の論理エレメントに加えて制御のためのＭＭＩからのＰＡＬ２０ＲＡ１０ＣＮＳプログラム可能論理アレイを含むエレメントから構成される装置ＳＤ　１０６はステーション１０２かもアナログ信号全受取り、その信号を多重化して１６からなる組のチャンネルから２個のチャンネルを選択する。次いで２個のチャンネルがその入力側と出力側の双方においてＰＣＭＰ遇され、］２５から１５０ミリ秒毎にサンプリングされる。ＳＤ　１０６は、前記ザンプル全稈るよう相互に接続されているそれ自体のクロック１０８により励振される。５Ｄ１０６は制御プロセッササブシステム（ｃｐ）１１０に電気的に接続され、クロック１０８によシセノトされるサンプル変換時間毎にＣｐｌｌｏに着ｌ込む。この間、Ｃｐｌｌｏは５Ｄ１０６から双方のチャンネルに対して一連の読取シおよび書込み演算を行なうことができる。その他のときにはｃｐＨ。

は読取シ、あるいは書込みのための５Ｄ１０６に対する有効アクセス全稈ることができない。

Ｃｐｌｌｏは１０ＭＨｚのＭ０６８０００　マイクロプロセッサ１１２゜メモリ１１４および入力／出力およびメモリアクセスのための各種の制御信号を発生させるための論理１１６とを含む。Ｃｐｌｌｏは、上位コンビーータとの通信および調整を含み、当該システムにおけるその他の全ての機能との通信および調整を行う。Ｃｐｌｌｏは信号処理タスクを行うことができるものの、主としてデータ管理手段として機能する。このように、０１１）１１０は当該システムの各部分を直接制御したシ、アクセスすることができ、また上位インターフェースユニット（ＨＩＵ）１１８を介して記号化したデータの形態で上位コンビーータと通信もできる。

０ｐ１１０はまた中央データバッファ（ＣＤＢ）１２０とも電気的に接続されている。該バッファは高速の４ＫＸ１６の乱アクセスメモリデータバッファであって、これを介して、プロセッサ間の大多数のデータやメッセー：）全迅速、かつ効率よく通すことができる。バッファはｌＮＭＯＳによシ製造されている、例えば４個の１ＭＳ１４２１Ｓ−５０ＲＡｍ装置（４Ｘ４０９６）によ多構成しうる。演算の検証モードの場合、ｃｐ１２０はプロセッサ間の唯一のデータ源である。この種の唯一の別のデータ通路はｃｐ　１１０　トＨＩＵ　１１８　トノ間（７）ｄｆ−トチ６ル。ＣＤＢ１２０は、Ｃｐｌｌｏ用、ＨＩＵ１１８用および信号処理サブシステム（Ｓｐ）１２２用のデータボートを含む。またＣＤＢ１２０はｃｐｌｌｏとのメモリをマツプした入力／出力通信のためのアト９レスポートも含む。直接メモリアクセスするために、ＣＤＢに対して高速に順に自動増分アクセスできる１２ビツトのカウンタ１２４がある。４ＫＸ１６のメモリは５ｐ１２２とＨＩＵ１１８とによシアクセスされるが、後者の場合は単にバイトの幅でアクセスされる。ＨＩＵ１１８は１２６で示すラインにおいて信号を提供するが、該ラインにＣＤＢ１２０が適正モート９で位置されると２バイト毎に自動増分できる。しかしながら効率を最大とするためＣｐｌｌｏに対してはワードあるいはバイトの幅の何れかでアクセスが行われる。

ｃｐｌｌｏの景重要機能の１つはＣＤＢ１２０の割付けを管理することである。

この点についそ、かつ効率を最大とするためにＣＤＢ　１２０はメモリをマツプさせてＣｐｌｌｏとインタフェースするよう構成されていた。しかしながら５ｐ１２２とＨＩＵ１１８とは、ＣＤＢ＝ｉ入力／出力装置と見做し、かつ直接的にメモリにアクセスすることによう達成されうるものと見做している。

殆んどのプロセッサ間の通信はＣＤＢ１２０’ｅ用いる必要があるので、検証モート９に坩るシステムの時間の多くが当該システムのこのエレメントにおいて使われる。それにも拘わらず、ノ・−ドワイヤによる優先システムは何らないので何れのプロセッサもＣＤＢ　１２０に対していつでもアクセスできる。

ＣＤＢ１２０に対するアクセスは、ＣＤＢ１２０のリクエストがＣＩ）１１０によってまず許可される程度までＣｐｌｌｏによって厳密に制御される。プロトコルはリクエストしているプロセンサによりＣｐｌｌｏへの割込みを開始する。次いでｃｐはＣＤＢ１２０１２０が使用されていなければ、割込みが要求元へ戻され、その場合要求元はＣｐがＣＤＢバスの所有を指示したことを推察できる。

Ｃｐｌｌｏによっては特定の４−トが何ら使用可能とされず、その代りにＣＤＢ１２０のプロセッサがそれ自体の制御信号を用いてこの作業を実行する。このスキームはハードウェアを保存しているにも拘わらず、何れのプロセッサも前述のようにいつでもＣＤＢにアクセスし得ることを意味している。このため、ｃｐ　１００はＣＤＢ１２０に対してリクエストの待ち行列を制御する必要がある。

５ｐ１２２はその他のプロセッサの何れとも直接的な通信ｙｌ　−トを有していないため、この目的に対してＣＤＢ１２０を使用する必要がある。また、ＨＩＵ１１８は、それとＣｐｌｌｏとの間にボートがるるもののＣＤＢ　１２０に介してメツセージおよび／またはデータを保存および検索することができる。この通信システムを提供するために、各プロセッサは予め指定したメモリのウィンドウを有する必要が、１、そのウィンドウの１つは他のプロセッサに知られている。

従って、ＣＤ８１２０ｔ−何らか所有することによシメモリの適当なウィンドウに単にアクセスすることにより何れかのプロセッサから何れかのプロセッサへデータを通すことができる。

また、ｃｐｌｌｏは、１６／３２ビツトのＴＭＳ３２０１０信号処理プロセッサである５ｐ１２２にも接続されている。また、５ｐ１２２は、例えばＭＭ工６３８１のような７５４　ｎｓ速度の８　Ｘ　１０２４ビツトの２個のｐＲｏｍｓのようなエレメントによシ提供されるＳｐマイクロコード用のメモリ記憶装置を含む。とのサブシステムは入力／出力復号化、Ｃｐｌｌｏとの通信およびＣＤＢ１２０へのデータ経路のためのランダム論理を含む。８ｐ１２２は１秒当シ５００万回の演算速度で算術計算を行うので、ヘビイナンバーのハンドリングタスクの全てに対して使用される。ｃｐｌｌｏはライン１２８上で特殊信号を送ることによｆｉｓｐ１２２でタスクを開始し、該信号は５ｐ１２２が、Ｃｐによ、９ＣＤＢに書込まれた命令により指定される個所まで分岐させる。

５ｐ１２２は検証モードにおいて、未記号化のベクトル位置を含む命令の予め記憶したライブラリヲ有し、それをａｐｌｉｏが呼出して各種のタスクを行う。従ってＳｐＨ２は、そのタスクがＣｐｌｌｏによシ開始される従属システムである。また、選定されたタスクの持続時間全体に対してＣｐｌｌｏがＣＤＢ１２０ｔｓｐ１２２に割当てることが可能で、その場合ＣＤＢ１２０はＳｐ１２２用の専用の記憶媒体となる。

ＨＩＵ　１１８は上位プロセッサ（図示せず）とＣｐＩＩＯとの間ならびにＣＤＢ１２０との間のインタフェースとして機能する。

全ての信号のインタフェースはＨＩｔＪ１１８により緩衝され、ＨＩＵ１１８は互換性の要求に対応するよう上位プロセッサからの調時および制御信号を調整する。例えば、第２図に示す調時システムと上位プロセッサの調時システムとの間の非互換性は、ＨＩＩＪ１１８の内部に来るプログラム可能アレイ調理装置（ＰＡＬ）（図示せず）が埋合せる。

上位プロセッサからの何れのデータ転送もＣｐＩＩＯに対する割込みの形でまずリクエストされる必要がある。割込みベクトルはｃｐ上位プロセッサのデータポートか、あるいは前述のようにＣＤＢのメツセージウィンドつからの何れから読取ることができる。しかしながら、システムによるアクセスの前に上位プロセッサはシステムのアビレスを知っておく必要がある。ば−スアドレスが、単にアドレスコンパレータでらるＨＩＵ１１８の入力選択装置に設置されている。各システムのベースアドレスはスイッチを介してユーザがプログラム可能であって、処理能力を高めるために使用するマルチシステムを上位プロセッサに提供する。このように、単により多くの河路盤を上位プロセッサのバスに設置することによシ検証モードで使用するよう６４個までのステージ目ン１０２を提供することができる。

５ｐ１２２とＨＩＵ１１８とは遍在リセットおよび多相クロックゼネレータ（ＲＣＧ）１３０とに接続されておシ、該ゼネレータは全体システムに対して全てのりセクトおよびクロック信号を提供する。第２図においてブロック線図で示す各種のエレメントは当該技術分野の専門家に周知の多数の方法の何れかによりそれぞれ構成しうろことが認められる。

方法当該システムがその目的を達成するための方法を第３図から第１６図までを参照して詳細に説明する。特に、第３図は第１図の２４で全体的に示す登録モードを示す。

第３図全参照すれば、システムが一部ブロック１５０の登録モードまで進むと、システムはブロック１５２においてユーザの名前；ユーザが通過しうるアクセスポイントおよびユーザが間違って受入れたシ、かつ拒否するのに対して最大許容しうるベルを得るよう演算を開始する。何ら値が特定されなければ、必要に応じて省略時の値が提供される。ステップ１５２において、システムはまた、ユーザが記録すべき基準ワードのリストを検索し、参考のためにそれら全記憶する。説明のために、１０個の基準ワードの使用について本明細書で説明する。しかしながら、当該システムの機能や構造を変えることなく希望する何れの数の基準ワードも選択しうろことが認められる。多数の種々の基準ワードヲ用いることによシ、特定のユーザの誤って受入れる可能性の最も少ないワードを識別することが可能である。

使用される基準ワードの数が増えるにつれて、誤る可能性の最も少ないワードヲ入手する能力が向上する。このように、登録モードは当該システムの演算における後の検証演算部分において用いうる一組のデータを特定のユーザから発生させるべく機能する。

ブロック１５２から、システムはブロック１５４へ進み、そこで情報に一時的な識別番号が割当てられて、システムはステップ１５６へ進む。

ブロック１５６は、すでに集められている１０個の基準ワードのトークンの数に関する決定ブロックである。選定した数の１０個のワードの各々のトークン（あるいは発声）がなされなかったとすれば、上位プロセッサはステップ１５８へ進み、督促命令を発生させてユーザから新しいワー）＃ヲリクエストする。説明のために、各基準ワードに対して４個のトークンを使用することについて本明細書で記載している。当然、本発明の方法や装置を正しく作動させるために、概ね何れの数のトークンを用いてもよいことが認められる。

督促命令に応答して、第２図のＣｐ　１１０は５Ｄ１０６を介して、入力／出力ライン１０４を通してステーション１０２と連通ずる信号を発生させることによりスピーカ、あるいはその他の可聴あるいは可視通信手段によシューザはそのためのトークンを記憶させるべき、１０個の基準ワードの中の１個全発声するよう促される。ステージｙｙ１０２におけるマイクロフォンがユーザからの基準ワードの発声を受取シ、それをライン１０４と５Ｄ１０６とを介してステーション１０２からｃｐｌｌｏへ連通させ、ｃｐｌｌｏにおいて後述のようにさらに処理される。

まで進み、そこでシステムが、「登録」ルーチンを呼出すことにより送入されてくるスピーチに対して自動相関係数（ｒ係数）を発生させるよう指示する。登録ルーチンについては第４図全参照して更に詳しく以下説明する。システムはｒ係数を発生するにつれて、これらの係数を検査してシステムに送入されるスピーチがあるか否か検出する。督促信号に続く予めセットした時間内にスピーチが何ら介在していないとすれば、上位プロセッサは不具合のあったことを検出してブロック１６２へ進む。督促信号に続いてシステムがスピーチを検出しなかった回数が所定の限界回数を上廻ると、プロセッサはブロック１６４まテ進み、ユーザを登録するためのそれ以上の試みは中止する。他方、不具合の回数が限界値金上廻らなげれば、プロセッサはブロック１５８へ戻シ、再びユーザに発声を入力するよう促す。

ブロック１６０においてスピーチが検出されるとすれば、上位プロセッサはブロック１６６まで進み、ｒ係数を変形された直線の予測係数（ａａ係数）へ変換し始める。前記予測係数は検出された発声とユーザの発声気管の形状とを相関させる０この変換は第４図に関して説明する登録ルーチンの一部として実行される。

ａａ係数が発生した後上位プロセッサはブロック１６８まで進み、自動相関係数と変形された直線予測係数とを将来の使用に備えてアレイに記憶させる。次いでプロセッサはブロック１７０まで進み、かつワードとトークンとのカウンタを増分させて、また４個のトークンがユーザから受取られていないとすれば現在のワードの次のトークンを、４個のトークンが受取られずみであれば次のワードを識別する。前述のように、トークンの数はプログラム可能でアわ、かつ使用前に操作者が選択する。プシステムがそのリストにあるワードの各々に対して４個のドブロック１６９マで進み、使用可能モードから記憶された情報を処理して検証モードでのシステムの後での演算に必要なデータを発生させる必要のあることを示すフラッグをセットする。このフラッグをセットすると、システムはブロック１７１へ進み、そこで演算の登録モードから出て、第１図の開始ブロックへ戻り別の指令を待つ。１０個のワードの各々の４個のトークンが受取られなかったとすれば、システムはブロック１５６からブロック１５８へと進み、前述のように演算する。

第４図を参照すれば、第３図のブロック１６０において上位プロセッサにより行われる登録ルーチンを説明することができる。

第４図の登録モー）”１６０へ入ると、システムはブロック１７２へ進み、そこでシステムは第２図のｃｐｉｉｏのＭｏ　６８０００マイクロプロセツサが、毎秒約８０００個のサンプルの採集速度においてＳＤ　１０６から受取られたアナログ発声信号を計数化する。

サンプルフレームが形成され、ｃｐ　１１０のメモリ１１４に割当てられたバッファに記憶される。Ｃ０ＤＥＣの割込みハンドうに制御が移ればいつでもサンプルの各々が８ビット幅のｍ　−ｌａｗ記号化ワードとしてＳＤ　１０６の符号器／復号器（ＣＯＤＥＣ）チップから読出される。

ｃｐメモリ１１４のバッファが一部１フレーム分のサンプルで充満されると、システムはブロック１７４まで進み、バッファからサンプル１ｃＤＢ１２０ヘコピイする。サンプルを構成する８ビツトコードのワードの各々は分解されて１６ビノトのサンプルをつくる。この分解は、速度に対してテーブル駆動方法を用いたフライによシ行われる。ｍｍ−１ａコンパンジヨン使用は当該技術分野において周知である。この主題に関する包括的な説明はテキサスインストルメンツ社（Ｔｅｘａｓ　Ｉｎｓｔｒｕｍｅｎｔｓ　）　（１９８４）扁５ＩＩＩＲＡＯＯＩによる［デジタル信号処理応用報告：　ＴＭＳ　３２０１０用（Ｄ　コンＡ７デイング、ｎ、−ｆ７Ｊ　（”　Ｄｉｇｉｔａｌ、　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓ −１ｎｇＡｐｐ１ｊ、ｃａｔｉｏｎ　Ｒｅｐｏｒｔ　：　Ｃｏｍｐａｎｄｉｎｇ　Ｒｏｕｔｉｎｅｓ　ｆｏｒ　ｔｈｅＴｍＳ　３２０１０”）に提供されている。この文書は参考のため本明細書に含めである。

ブロック１７４からシステムはブロック１７６まで進み、現在のフレームプラス前のフレームの後半分を含むフレームを形成し、オーバラップ分析ができるようにしてプレエンファシスを達成する。以下のようにフォーマットの入力サンプルに適用される一次有限インパルスレスポンスフィルタを用いることにょシサンプルはプレエンファシスサレル。

ｙ（ｎ）＝ｘ（ｎ）−−９４Ｘ（ｎ−１）　（１）ｎはサンプルのインデックス番号に等しく、Ｘはプレエンファシス前のサンプルに等しく、ｙはプレエンファシスの後のサンプルに等しい。プレエンファシスは高周波数を強調したシ且っスピーカとマイクロフォンとの間の開放空間に対するスピーカすなわち話し手の唇からの音声変移によう発生する低周波数の強調を消去したりするために拘われる。

一旦プレニンシアシスが行われると、正常化されていない自動相関が以下のように計算される。

Ｒ（１）＝　Σ　（ｓ（ｊ）Ｘｓ（ｊ＋１））　（２）ｊ　−。

１＝０．・・・・・・Ｐ；ｓはサンプルのプレエンファシス値でＩｌｌ、Ｌは分析フレームサイズであシ、ｐは自動相関順序である。

式（２）からの正常化されていない自動相関は以下の関係式にょシ正常化された相関へ変換される。

ｒ（１）＝Ｒ（土）／Ｒ（０）　（３）１＝１．・・・・・・ｐ。

Ｒ（ｏ）相関は「エネルギー」と称せられ、後述するように発声の始まりと終シとを検出するためにシステムが用いる量である。

エネルギＲ（０）の項と共に等式（３）からの正常化した自動相関（ｒ係数）は５ｐ１２２が計算を終了すれば直ちにｃｐ　１１０に戻される。

ブロック１７６からシステムはブロック１７８へ進み、そこで直線予測係数（Ｌｐ）を展開させる。詳しくは、ＣＩ）　１１０　ＨＣＤＢ１２０からｒ係数のコピイを検索してａｐ１２２ｅ開始させＬｐ係数を展開する。この達成のために採用した再帰的方法はレビンンンのアルゴリズム（Ｌｅｖｉｎｓｏｎ　’　ｓ　Ａｌｇｏｒｉｔｈｍ）として当該技術分野において周知である。このアルゴリズムについてはニューヨークのスプリングフェアラーグ社（１９７６年版）のジェイ、ディ、マーケルおよびエイ、エッチ、グレイの［スピーチの直線的予測Ｊ　（Ｊ、　Ｄ、　ｍａｒｋｅｔ　ａｎｄ　Ａ、　Ｈ，Ｇｒａｙ、”　Ｌｉｎｅａｒ　Ｐｒｅ−ｄｉｃＭｏ、ｎ　ｏｆ　５ｐｅｅｃｈ″、　Ｓｐｒｉｎｇｅｒ　−Ｖｅｒｌａｇ、　Ｎｅｗ　Ｙｏｒｋ、　（１９７６）　）に詳しく述べられている。

このテキストを参考のため本明細書に含めである。

レビンソンのアルゴリズムは以下の関係に基づく再帰的方法によシー組のフィルタ係数を提供する。

１＝Ｏ１・・・・・・ｎ、ａ　。（１）　＝＝　１はＯでない全ての１に対するもの、ａ−、（０）＝ＱはＯでない全ての１に対するもの；およびｅＯ＝１である・ｐ次元のＬｐｃ分析においては算式（４）　−（６）に記載のレビンンンのアルゴリズムは、Ｌｐ係数から構成される１組のフィルタ係数ａ（ｉ）、ｉ＝ｏ、・・・・・・ｐｆ提供する。このｐ次元分析において、ｎの値は１からｐまでの範囲でる）、ａ（１）はｎの各値に対して１＝０．・・・・・・ｐの各値に対して計算される。

ブロック１７８からシステムはブロック１８０まで進み、ｃｐ係数をａａ係数に変形する。この変形を達成する方法は以下の通ａａ（ｊ）　＝　２　Ｘ　Σ　ａｒｉ）　ｘ　ａ　（ｉ＋ｊ）、：のｉ形ｕ検証モードにおいて発声比較演算速度を速めるために行われる。

ａａ係数は、いわゆる残留エネルギ（ａｎ）の２進ロガリズムと共に、ｓｐ　１２２が変形を完了した際ＣＤＢ　１２０に残される。

一旦フレームが分析され、その正常化された自動相関、エネ／ｌ／キＲＩ：Ｏ）、　ａａ係数および残留エネルギｅｎのロゴリズムカ抽出されると、システムは決定ブロック１８２まで進む。プロ、り１８２において、Ｃｐｌｌｏは抽出されたデータをステートマシンへ送入し、フレームが記録された間ユーザがステーション１０２のマイクロフォンに向かって話していたか否か検出する。このステートマシンについては第５図を参照して以下詳細に説明する。

スピーチ検出器がスピーチが何ら行われていないと判定すると、システムはブロック１８４へ進み、スピーチ検出器のステートマシンが出口状態にあるか否か検出する。出口状態であるとすれば、スピーチが完了している全示し、システムはブロック１８６まで進み、第４図に示すアルゴリズムの演算を停止し、次いで第３図のブロック１６０へ戻る。システムがブロック１８４にある間にステートマシンが出口状態にないとすれば、システムはブロック１７２へ戻シ、前述のように処理するため次のスピーチサンプルを獲得する。

スピーチ検出器がシステムが決定ブロック１８２にある間現在のところスピーチが行われていることを示せば、システムはブロック１８８まで進み、システムが登録モードにあるが否か検出する。システムが登録モードにあるとすれば、システムはズ０ツク１９０まで進み、第２図のメモリ１１４にａａ係数を記憶する。

システムが登録モードにないとすれば、ブロック１８８がらプロ、り１９２まで進み、正常化すなわち正規化された自動相関係数と、レビンンンのアルゴリズムからの残留エネルギとをメモリ１１４に記憶する。ブロックｒ９０または１９２の何れかからシステムはブロック１７２に戻シ、前述のように連続的に機ユーザからの有効スピーチの最後のフレームが見出されると直ちに、これまで抽出されてきたパラメータセットの全てがメモリ１１４からＣＤＢ　１２０ヘコピイされる。次いで上位プロセッサがＣｐｌｌｏによシ割込まれ、完全な発声に対する・ ξラメータがＣＤＢ　１２０へ送られつつあることを示す。次いで上位プロセッサはＣＤＢ　１２０からのパラメータを読取シ、最終的にその結果をその大容量記憶装置に記憶させる。

第５図全参照して、スピーチの始まシと終シ点とを検出するために使用されるステート線図を説明できる。新しいフレームに対する自動相関ならびにエネルギが入力信号から送られると常に、第５図に示す状態を有する有限ステートマシンが使用されて前記のパラメニタからスピーチが有効か、あるいはスピーチのある状態と無い状態の変移状態のどの状態にシステムが入っているか検出する。

ステート線図は、初期および最終の状態であるサイレンスステート２００ｔ−含む。この状態においては、マシンは発声の始まりを検出するよう待機し、発声の終りが検出された後復帰する。

発声の開始が検出されると、ステートマシンはサイレンスステート２００からアテンションステート２０２まで進む。詳しくは、マシンは検出された信号のエネルギがある上限レイル以上となるか、あるいはある下限レベルを下廻るかすればアテンションステートへ進み、正常化されたすなわち、正規化された自動相関機能（ｒ）は、マシンがノイズを測定した自動相関機能＜ｒ）の値からの予め選定した限界距離ｒ１以上であるユークリッド距離を有する。このノイズの自動相関機能はサイレンスステート２００においてマシンにに　再帰的に更新される。

検出されたエネルギがシステムをサイレンスステート１離すないようにするに十分高い場合、かつマシンがアテンションステート２０２で３回サイクル分を費した場合マシンはサイレンスステート２０２からスピーチステート２０４まで進む。

一旦スピーチステート２０４にあると、スピーチは検出されたエネルギが「スピーチの終り」の限界以下に低下し、発生の終りが検出されたことを示すまでそこに留っている。その時点でマシンは出口ステート２０６へ進む。出口ステート２０６カラ、もし検出されたエネルギが５回のサイクルの後下限を１廻るに十分な程高くないとすればサイレンスステートへ進む。もし十分高い値のエネルギア：検出されるとすればマシンは出口ステート２０６から再開ステート２０８まで進み、該再開ステートは、エネルギが出口ステート２０６へ戻るに十分高くなく、且つマシンが再開ステー）２８２．３サイクル分費したとき、アテンションステートと同様にマシンをスピーチステート２０４へ戻すよう機能する。

またスピーチ検出オートマトンは本発明による減衰システムを制御することが注目される。このようにステートがサイレンスステートとなればいつでも、減衰器レジスタが変更されてノイズ音する一定しくルに保持する。一旦ステートマシンがサイレンスステート１離れると、減衰は一定に保持される。現在好適な一実施例においては、スピーチ検出マシンはソフトウェアを含む。もつともハードウェアの実施例は当該技術分野の専門家によシ、マシンについての前述の説明に基づき容易に提供しうる。

登録演算を完了すると、システムは操作者あるいは例えば調時装置のようなその他の手段によシ作動されて、検出モードに゛　おいて送入されるスピーチ信号を比較するために使用されるデータ（−スを形成するために登録モードにおいて発生する情報を利用する。特に、第６図は適当なデータベースを構成しうるようにするシステムの性能を発揮させる方法を示す。

データベースの形成を要求する信号を受取ると、システムは第６図のブロック２２０からブロック２２２まで進み、第３図の１６９においてセットしたフラッグが依然としてセットされているか否か検出する。フラッグがセットされていないとすれば、処理すべきデータが何らなく、システムはブロック２２４−１で進み、データベースをつくるための過程の演算を終了し、第１図のステート２０を開始させるよう復帰する。

処理スべきデータがあるとすれば、システムはブロック２２２からブロック２２６マで進み、そこでＣＤＢ　１２０に記憶された次のワードを獲得する。ブロック２２６において、システムはまたデータベースの準備を完了したか否か検出する。まだ完了していなければ、システムはブロック２２６からブロック２２８まで進む。

ブロック２２８において、システムは「スピーカ間内部・話し手」の比較を行い、登録モードにおいて展開された統計が相互に比較されて「グローバルディストーション（大域的ひずみ）すなわち全体的な否」を展開し、ワードがワード間で相違する程度を指示する。前記のスピーカ間（内部・話し手）の比較は（内部・話し手）の比較に対するグローノ；ルディストージョンは所定のトークンのｒ（１）ｅ、同じスピーカによシつくられた同じワードの全ての他のトークンのａ　ａ　／ｉ）と比較することによりつくシ出される。このように、ｔの異なったトークンがあるとすれば、Ｔｗ＝（ｔ−ｔ）−ｔのスピーカ間（内部・話し手）の比較が行われる。上位ゾロセッサは、前述の過程を実行し、かつ第７図から第９図に関して後述するスピーカ間（内部・話し手）のルーチングを用いることにより前記のスピーカ間の比較からグローバルディストーションＧｉ獲得する。

一旦スビーカ間のグローバルディストーションがブロック２２８において展開されると、それらは将来の使用に備えて記憶され、システムはブロック２３０へ進む。

ブロック２３０において、スピーカのワードに対するスピーカ間（すなわち、相互・話し手）比較はそのワードのスピーカのＮトークンの各々に対してグローバルディストーション（Ｃ，）　’ｅ得ることにより計算される。該グローバルディスト−：）！ｌ　７　（Ｇ）は包括的なデータベースにおいて全てのスピーカによシ発生する同じワードのその他の全てのトークンのａａ　（ｉｌ値とそノド −クンのｒ（１）値とを比較することから発生する。前記の包括的データベースは検証システムによシ使用される１０個の基準ワードの翻訳における広範囲の変化を網羅する。何故なら、それぞれ明確に異った発声気管特性を有する個人からなる群によるトークンの発生を表示するからである。ｎ人のスピーカがあるとすれば、Ｔｂ＝ｎ、ｔ２のスピーカ間（相互・話し手）の比較が行われる。ブロック２３０においてスピーカ間比較を達成するための方法についての詳細な説明は第１０図に関して後述する。

ブロック２３０においてスピーカ間（相互・話し手）のディストー：）ヨンを獲得した後、システムはブロック２３２まで進み、そこでスピーカ間（内部・話し手）からのディストーションとスピーカ間（相互・話し手）の比較とが合わされて数が下がる方向に記憶され、アレイＤに記憶される。このアレイにおけるディストーションの全体数はｄ＝Ｔｗ＋ＴＢである。このアレイにおけるディストーションはスピーカ間（相互・話し手）あるいはスピーカ間（内部・話し手）のディストーションとうはルが付げ続けられる。ブロック２３２でつくられるアレイＤの例を第１２図に示す。

ブロック２３２からシステムはブロック２３４マで進み、そこで統計ファイル５ＴＡＴがつくられる。第１２図に示す順序のディストーションを用いることによりシステムは、受入れ／拒否の決定のための限界値が特定のスピーカ間のディストーションのディストーションに対応するディストーション値に基づいているとすれば、それぞれのスピーカディストーションに対して、システムが間違って実際のスピーカを拒否したり、間違って偽のスピーカを受入れたりし易いことを指示するファイルをつくる。第１２図のアレイＤにおけるインフォーメーションに基づいた５ＴＡＴフアイルの一例を第・１３図に示す。第１３図の５ＴＡＴフアイルを展開するためにブロック２３４において用いられる過程を第１１図に関して以下説明する。

ブロック２３４から、第６図に示すシステムはブロック２２６へ戻り被登録人の次のワードを獲得する。全てのワードが前述のように処理されたとすれば、システムはブロック２３６マで進み、０ＲＤＥＲフアイルを構成し、このファイルは現在のスピーカを包括的なデータベースにその人のデータが記憶されているその他のスピーカから判別しうる基準ワードの各々の相対的能力を示す。高度の区別能力全盲するワードとは間違って拒否する誤差比率の何れかの所定レベルにおいて間違って受入れる誤差比率の低いワードのことである。システムはワード対ワードの５ＴＡＴフアイルにおいて間違って受入れる場合の最大値に基いたワードヲ仕分けすることにより現在のユーザに対してワードの相対的な判別能力を検出する。このように、例えば、第１３図に示す５ＴＡＴフアイルにより表示されるワードを仕分けるために使用ｆる値１ｄＥＲＲＯＲＦＡＬＳＥ　ＡＣＣＥＰＴのＪＩ、出りの下での最初の入口であって、これは２／６の値でらる。基準ワード３に対するワード毎の５ＴＡＴ７アイルの各々からの前記の表示値は数が小さくなる順に並べられ、五−ザ毎に識別されるファイル［０ＲＤＥＲＪに保存される。

ブロック２３６にある間、システムはその識別子記憶ファイルにおける特定ユーザに対する登録時に得た情報（名前、アクセス点、誤差レイル）を入力する。前記ファイルは当該ユーザの識別子に対応するデータベース情報にリンクされている。

第７図から第９図までを参照することによシ、スピーカ間（内部・話し手）の比較を行うために第６図に示すブロック２２８で用いられる過程を説明することができる。第７図を参照すれば、第６図に示すブロック２２８へ入る際システムはブロック２４０まで進行し、そこで現在検討されておシ、かつ被登録人が発声したワードの次のトークンを装填する。一旦次のトークンが装填すれると、システムはブロック２４２まで進み、そこで「ＣｏｍｐＡＲＥＪの過程が呼出される。

ＣｏｍｐＡＲＥ過程は被登録人が発生したワードの他のトークジと、当該トークンを比較することによシ検討されている特定のトークンに対するグローバルディストーションを提供する。

比較を完了し、かつグローバルディストーションを獲得すると、システムはブロック２４４まで進み、かつ後で使用するためにディストー：）：ｌ　７　ｆ記憶する。ブロック２４４からシステムはブロック２４０まで戻り、Ｎトークンの次のトークンを獲得し、前述のようにこのトークンの処理を行う。所定のワードに対してそれ以上トークンが入手できないとすればシステムは第６図のブロック２３０に対応するブロック２３０マで進み、スピーカ間の比較を開始する。

さて第８図と第９図とを参照すれば、第７図のブロック２４２において使用されるＣｏｍｐＡＲＥ過程を説明する。第７図のｃｏｍｐＡＲＥブロック２４２へ入るとシステムは第８図のブロック２４２まで進み、基準トークンとテストトークンとの間の比較を開始する。イントラスピーカ比較の場合基準トークンは被登録人の前の発声の中の１個である。テストトークンとは第６図のブロック２２８に示すように、データベースをつくる上で現在処理されているトークンである。

ａａａ数セットの基準パターンをテストテンプレートのｒ　ｆｉ）およびｅ値に対して比較することによシ比較が行われる。

テストの状況については第９図にグラフ表示しておシ、基準軸２８０上で零からｊまで各フレームに対してａａ値全全指定ることにより基準テンプレートが規定されることが判る。同様にテストテンプレートの零から１までの各フレームに対するｒとｅの値は１軸２８２に沿って位置する。基準テンプレートの長さはｊＩｌｄｌ上で原点２８４からＭまで延びるものとして示されている。

同様（、テストテンプレートの長さはｉ軸のＮとして示す位置まで原点２８４から延びるものとして示されている。

テストの結果は、原点２８４と、２８８で示すＭとＮ位置の軸に対して垂直の線の交差点との間の可能な全ての軌道を横移動することによシ経験される最小量のディストーションを示すグローバルディスト−９ａン値Ｇで示す。

前記ノブローバルブイスト−ジョンＧは、第８図のフロー線図で示され、かつ以下説明する２段階の方法によシ得られる。

第８図に示すブロック２４２からシステムは決定ブロック２４６まで進み、そこで基準テンプレートのフレームＭの数はテストテンプレートのフレームＮの数と比較される。フレームの前記数の差が所定の限界値をはみ出しているとすれば、システムはブロック２４８マで進み、発声の長さは比較するには互換性のないことを示す出力信号ｒ９９９Ｊを提供する。図示実施例に対しては、限界値は発声の長さが限界値内に入っているとすれば、システムはブロック２５０まで進み、１＝０の初期値をセットする。ブロック２５０カラシステムはブロック２５２まで進み、ｊ＝ｏの初期値をセットする。ブロック２５２からシステムは次にブロック２５４まで進み、システムの所定点１．ｊにおける局部ディストーションを計算して比較過程の第１段階を完了する。１とｊの初期値はＯであるので、過程は原点２８４から始まり、そこから点２８８までの最小軌道を検出する必要がある。

ブロック２５４において、第２図の５Ｐ１２２はｌＬ＆係数のＮベクトルと正規化された自己相関ｒとを比較する。局部歪結果でらるＮはＣＤＢ１２０内に１６ビツトの値としてストアされる。

これらの局部歪を得るための関係はＨ＝。

として示される。

次に、マドリスク内の各１．ｊ点のためにそのロケーションで）基準とテストテンプレート間で距離測定を表示する歪値が発生される。

ブロック２５４内に演算された局部歪（ｉ、ｊ）が含まれておシ、システムは次にブロック２５６に移り、第９図のグラフ上の座標１及びｊによって示される特定位置用の全体的な距離値（１゜ｊ）を発生する。この最小距離バスを決定するために、プロセッサは与えられた位置に対する異なるバスの値をめ、そして最小歪値を有する・ξスを選択する。次に、第９図のグラフ上の点２９０用の最小の全体的な歪を決定するために、２９２．２９４及び２９６で示される３つのパスの間からの最小歪が受入れられる。この最小・ぞスは次の関係によって数学的に決定できる。

ｄは前もって発生された局部歪、前もって決定されていない指数すなわち負の数になるものは零の値に割当てられる。例えば、点１＝１．５＝１でのｇｉ、　ｊの値は点１−２．　ｊ−１，及び１−１．ｊ−２でのｇのための値を要求する。

これらのｇの値は軸の負側にないので、彼等はシステム内に存在せず、従って彼等は零の値に割当てられる。

最小パスの値を定義する最後の全体的な歪は第９図の点２８８に発見される。この点のために、システム内のブロック２５６戻る。この最後のＧ値は以下のように決定される。

実際の動作において、上述の演算を継続するために全ての情報が必要であるので、ａｐＨｏは全体的な歪の３つの列及び局部歪の２つの列だけを維持する。これは重要な記憶スペースを節約する。更に、上述のグイナミイクプログラミングアルゴリズムにおける平行四辺形境界のために、点の略々３０％がイクスプリトサーチから省略される。これ°らの点は原点２８４に及び第９図のラインの終点２８６に接続されている角を有する平行四辺形の外側である。これらの点は、はぼｊ軸上のＮ値、ｊ軸上のＭ値でおるグラフのこれらの境界の近くに特に集中している。

第９図のグラフ上の現在の点１．ｊのための全体的な歪が得られた後に１システムはブロック２６０に移シ、かつｊ指数が１だけ増加される。そして、システムは決定ブロック２６２ニ移りかつ基準証拠（ｒｅｆｅｒｅｎｃｅ　ｔｏｋｅｒ）内のａａ係数の数と新しいｊ指数が等しいかどうか決定する。もし、ｊ指数がａａ係数の数と等しくなければ、システムはブロック２５４へ戻シ、第９図のグラフ内の新しい位置用の歪を上述の如く演算する。

もし、ｊ指数が基準証拠のａａ係数と等しければ、システムはブロック２６２からブロック２６４へ移シ、かつ１指数を１だけ増加する。ブロック２６４からシステムが決定ブロック２６６に移シ、テスト証拠（ｔｅｓｔ　ｔｏｋｅｎ）のｒ係数の数と１指数が等しいはブロック２５２へ戻シ、ｊ指数を零に等しくセットし、第９図のグラフ内Ω新しい位置で歪の引出しを継続する。もし、新しい指数１がテスト証拠（ｔｅｓｔ　ｔｏｋｅｎ）のためにセットするｒ係数に等しげれば、次にシステムは第９図のグラフ内の最後の点２８８にある。システムは上記方程式ａ３で示された如きに定義された点２８８での最後の正規化された全体的な歪値のブロック２６８へ移る。この正規化された値はテスト証拠と基準証拠の比較に対応する全体的な歪になる。

第６図のブロック２２８内の内部・話し手比較を完了し、かつ上述の処理を利用した後に、システムは相互・話し手比較が実行される第６図のブロック２３０へ移る。第１０図を参照して、相互・話し手比較の成就がもっと詳細に述べられる。特に、ブロック２３０に達しているとき、システムは特定のワードが処理されている間に使用者の次の証拠へ進めるブロック３００へ移る。一度この証拠が認識されると、次の一般的な証拠へ進めるブロック３０２へ移り、かつ現在のワードが検査されている間に特定の一般的な話し手の次の証拠へ進め葱ズロソク３０４へ移る。

システムは、ブロック３０４内に示されている如く、特定の一般的な話し手からの証拠を伴うユーザからのワードの現在の証拠の比較を導くブロック３０６へ移る。この比較の成就のための手順は第８図及び第９図に関して上述されたものと同じでｉ、比較された証拠用のスコア値を表わす全体的な歪音発生する各比較を伴う。比較の完成後（て、全体的な歪は更に使用されるためにストアされる。

一般的な話し手の次の証拠を得る。もし、考察下のワード・に関連している話し手用の証拠がそれ以上なげれば、システムはブロック３０４からブロック３０２へ移シ、次の一般的な話し手に進み・次に上述の如く一般的な話し手用の証拠の数値をめる。

もし、一般的な話し手からの現在のワードの証拠がそれ以上なければ、システムはブロック３０２からブロック３００へ移シ、そして特定なワードのユーザの次の証拠へ進む。もし、そのワードのユーザの証拠の全ての比較が完了すれば、システムは第１０図のブロック３０８にストアされた歪が組合され上述の如くストアされる第６図のフローチャート内のブロック２３２ヘブロノク３００から移る。

第１１図を参照して、第６図のブロック２３４によって実行される如（ＳＴＡＴファイルの作図の成就用の手順を述べることは可能であり、システムは前もって考察されていない上位桁を有する内部・話し手用の次の全体的な歪値が第１２図のアレイＤから得られる第１１図のブロック３１０ヘジヤンプすることによｐＳＴＡＴファイルの作図を開始した。第１２図を参照して例えばブロック３１０の活性化は内部・話し手比較番号６に対応する歪値８７を得る。この情報はストアされ、システムはＥＲＲＯＲＦＡＬＳＥ　ＡＣＣＥＰＴ　（ＥＲＲＯＲＦＡ）値が引出されるブロック３１２に移る。

第１３図のｐｅｒ　”　ｗｏｒｄ　５ＴＡＴフアイルの情報全稈るために、第１２図のアレイＤに記憶された各々の内部・話し手歪は数１＝０．・・・・・・Ｔｗを割シ当てられている。アレイＤの各々のＴｗ内部・話し手歪については、その歪よシ数的に小さいアレイ内の内部・話し手歪の数は演算されかつアレイＪに記憶される。

これらのアレイ内に１＝Ｏ２・・・・・・ＴＷのエレメントがある。数ＴＷで割シ当てられたアレイＤ内の内部・話し手歪については、数的（（その歪に等しいか又は以下である歪の総数は（相互および内部・話し手）演算され且つアレイＫに記憶される。上記発生された情報に基づいて、第１３図のｐｅｒ−ｗｏｒｄ　５ＴＡＴフアイルのＥＲＯＲＦＡ欄は以下の関係を用いて第１１図のブロック３２１の要求によって発生される。

ｐｅｒ　−ｗｏｒｄ　５ＴＡＴフアイルのＥＲＲＯＲＦＡの第１のエレメントは上記式１４全第１２図のＤアレイにおいて上から下に移動するとき出会う第１の内部・話し手歪値に適用することによシ確定する。この場合においては、第１の出会った歪値は歪値値については、数的に配列番号６より小さい２相互・話し手歪が存在するので、上述の関係はＪ　＝　（１）　＝　２　＝ｉ発生する。出会った第１の歪（配列番号６）より小さいか等しい６歪が存在するのでＫは６である。一方、４０の値の内部・話し手歪については、その点以下の相互・話し手歪が存在しないこと一注意すべきである。従って、ＥＲＲＯＲＦＡの分子はＯであり、一方、第１の出会った内部・話し手歪に含まれている６歪が存在するので分母は６のままである。ブロック３１２のＥＲＲＯＲＦＡ欄の開発が完了したときは、システムは第１３図のｐｅｒ−ｗｏｒｄＳＴＡＴファイルのＥＲＲＯＲＦＡＬＳＥ　Ｒｚ、Ｆ、ｃｒ　（ＥＲＲＯＲＦＲ）を開発するブロック３１４へ移動する。上述の関係全利用してＥＲＲＯＲ工欄は以下の関係を発生する。

第１２図のアレイＤを参照して、ＥＲＲＯＲＦＲの式１５は、第１３図において出会い従って番号ニー１が割シ当てられる第１の内部・話し手歪を検査することによシ第１３図の値を定義する。一般的な場合において、システム内にＮ内部・話し手歪が存在し、上記式は８７の歪でＥＲＲＯＲＦＲの値をｌ−１／ｎ＝０　／　ｎ　＝　Ｏと指示する。システムはブロック３１４から次にブロック３１６へ移動し、ブロック３１２および３１４で開発された情報を説明のために第１３図に描かれたｐｅｒ−ｗｏｒｄ　５ＴＡＴフアイルに記憶する◇ｐｅｒ−ｗｏｒｄ　５ＴＡＴフアイルの完成に伴って、システムはブロック３１６からブロック３１０へ移動する。このブロック３１０は、上述された方法で・Ｄ′アレイから次の内部・話し手歪を得て、そのワードのためのｐｅｒ−ｗｏｒｄ　５ＴＡＴフアイルヲ形成する。アレイＤにそれ以上内部・話し手歪がなければ、システムは第６図のブロック２２６へ移動し、上述の如く機能する。登録手順が完了したら、ユーザは安全なエリヤへのアクセスを得る試みにおいて本発明の確認モードを起動し、また本発明の確認システムが応用するアクセス、同人確認等の目的で利用される。再び第１図を参照して、システムが登録状態になければ、ブロック５０へ移動し、確認モードの有無を決定する。確認モードと決定されれば、第１４図のブロック５０へ移動し、確認成就の手順を活性化する。システムは第１４図のブロック５０からブロック４００へ移動し、ステーショア１０２の１つでの現在のアクセスの要求の有無？決定する。

ブロック４００において、ホスト・プロセッサは動作のための全てのアクセス点を継続的にスキャンする。動作が表示されなければ、ライン４０２を通してシステムループはブロック４００へ戻り、そしてここで要求が行われるような時間まで機能する。

ユーザは個人確認番号即ちキー・ぞア）’（ＫＥＹ　ＰＡＤ）の入力、プラスチックカードの挿入、マイクロフォンへの名前の入力のような種々の方法で確認要求を与える。要求を検出したときは、システムはブロック４０４へ移動し、ユーザに確認のための要求を発生する。この要求は０Ｐ１００からＳＤ　１０６　を介してステーション１０２へ転送される。ユーザ確認について急いでいれば、システムはブロック４０６に移動し、５Ｄ１０６を介してステーション１０２からの入力信号を監視し、同一性証明情報に存在する表示に対応する信号のエネルギレベルを検出する。この形式の入力信号が予め設定された時間期間の後に検出されなければ、システムはブロック４０４への戻ｐ１ユーザからの同一性証明を要求する。同一性証明を含む信号を検出したときは、システムはブロック４０８へ移動する。ブロック４０８において、システムは、同一性証明が手続きされたユーザに対応するがどうか及び同一性証明が特定のアクセス点からのアクセスであると認めるかどうかを決定するために、ユーザ用に予め記憶された同一性証明情報と比較する。同一性証明が表示された基準に合わないときには、システムはブロック４１０へ移動し、ユーザを拒絶する信号を発生する。同一・性証明は特定のアクセス点として容認可能とされれば、システムはブロック４１２に移動し、予め入力され且つ記憶された特定のユーザ用のデータに基づいたしきい値全設定する。しきい値が指定されていなげれば、システムはデホルト（ｄｅｆａｌｔ）値を利用する。

設定されているしきい値は、要求を拒絶する前に許される検査（各ワード毎に検査が継続される）の最大回数、要求を容認可能なものとして許す前に要求されている検査の最低回数、容認のために要求されるホルト・アクセプト・エラー・レイト（ｆａｌｓｅ　ａｃｃｅｐｔ　ｅｒｒｏｒ　ｒａｔｅ）　（ＥＲＲＯＲＦＡ）のしくル、容認のために要求されるホルト・リジェクト・エラー・レイト（ｆａｌｓｅ　ｒｅｊｅｃｔｉｏｎ　ｅｒｒｏｒ　ｒａｔｅ　）　（ＥＲＲＯＲＦＡ　）及び容認されている検査失敗の最大回数を含んでいる。しきい値が設定されたときは、システムはブロック４１２からブロック４１４へ移動し、この特定のユーザのための０ＲＤＥＲフアイルをアクセスする。システムは登録手続きモードにおいて創作された０ＲＤＥＲフアイルからの次のワードを得る。新しいワードを有するシステムはブロック４１４からブロック４１８に移動し、ユーザがステーション１０２のマイクロフォンに選択されたワードを話すように要求する。

ユーザによって発声された現在の合言葉を受信したときは、システムはブロック４２０へ移動し、正規化された自己相関係数ｒを得る。これらのｒ係数はテスト手順にょ）得られるｅ’テスト手順は、確認プロセスを促進するために現在のスピーチにおけるｒ係数を発生するように他のパラメータと同様に機能する。この手順は第４図のとともに前述されている。

ｒ係数を受信したときは、システムはブロック４２２へ移動し、現在の合言葉（トークン：　ｔｏｋｅｎ）とユーザの対応している４つのテンプレートとを比較し、そしてこれらの比較から得られた全体的な歪を利用し、ｐｅｒ　−ｗｏｒｄ　５ＴＡＴフアイルからＥＲＲＯＲＦＡ用の現在値を得る。このＥＲＲＯＲＦＡｔ得るための手順は第１５図に詳しく描かれておシ、更に後述される。５ＴＡＴフアイルからのＥＲＲＯＲＦＡの訂正の動作の間に、現在の歪よシ大きな歪が５ＴＡＴフアイルの中に記憶されていないことがわかれば、検査は失敗したとみなされる。システムはブロック４２８へ移動し、容認または拒絶がされなければならないことに関するどの動作をするかを決定するために更にテストが行われる。

ブロック４２８内で実行されているテスト手順は第１６図を参照して後述される。ブロック４２８のテスト手順の決定ノ基づいて、システムは何も決定せず、そして次のワードが０ＲＤＥＲフアイルから得られ動作が上述のように継続されるブロック４１４へ戻るか、またはブロック４３２へ戻シ要求者を容認する。ブロック４３０および４３２から第２図のステーション１０２へ転送される信号が発生され容認者の決定を助ける。勿論、これらの信号は外部装置へ確認された場所へのドアを開くこと、選択された装置の動作を開始させる等のことを成就するために転送される。

ブロック４２２でＥＲＲＯＲＦＡが訂正されれば、システムはブロック４２６へ移動し、累積された誤差値が調整される。ブロック４２６を通る初めのノξス上で累積誤差はブロック４２２から与えられたＥＲＲＯＲＦＡと対応する。ブロック４２６を通る次のパス上で累積誤差は前の累積誤差値とブロック４２２から受信した現在のＥＲＲＯＲ，Ａ値との組合わせを含む。一実施例において、この組合わせは前の累積誤差とブロック４２２から受信された現在のＥＲＲＯＲ，Ａ値の積を含む。そして、累積誤差は新しい要求が評価される毎に氏名詐称者の容認失敗の確率に基づいて調整される。システムはブロック４２６からブロック４２８へ移動し、後述される手順に従って要求者の容認または拒絶に関連した決定が行われる。

第１５図を参照して、ブロック４２２のＥＲＲＯＲＦＡｉ得るための手順を述べる。ブロック４２２に入ったとき、システ゛ムは第１５図のブロック４４０に直ちに移動し、登録モードで発生された次の４つａａミツアイルテストされたワードに対応する）？得るｏａａ値を得たとき、システムはブロック４４２へ移動し、第１４図のブロック４４２で得た新しいｒ係数とブロック４４０から得たａａ係数とを比較する。この比較は第８図および第９図を参照して前に説明された手順によって成就され、新しい証拠（ｊｏｋｅｎ　）のｒ値とブロック４４０で得られた証拠のａａ値との差を表示する全体的な歪を発生する。

システムはブロック４４４へ移動し、ブロック４４２で得られた全体的な歪値を読み出す。この歪値は記憶され、システムはブロック４４６へ移動し、このユーザに対応している記憶された証拠Ｎの何れもが現在の発声の値とまだ比較されていないがを決定する。比較されていない証拠があれば、システムはブロック４４０に戻シ、上述の如く機能する。比較されるべき証拠がこれ以上の残っていなげれば、システムはブロック４４８へ移動し、このブロック４４８は新しいｒ値とユーザの記憶されタテンプレー）Ｈの比較によって発生された全体的な歪を合成歪全発生するために処理する。この合成歪は幾つかの別の値を含んでいる。例えば、一実施例において、証拠歪値は合成歪を含むように一緒に平均される。他の実施例においては、歪の最小の値が選択され、更に他の実施例においては、最小の二つの歪が平均される。合成歪の構成が選択される基礎は発明が利用される応用の形式から独立しておシ且つオペレータの希望からも独立している。現在の発声を表示する合成歪値が決定されれば、システムはブロック４５０へ移動し、登録モードで作成されたｐｅｒ−ｗｏｒｄ　５ＴＡＴフアイルが参照される。

ブ０７り４５０において、合成歪はｐｅｒ−ｗｏｒｄ　５ＴＡＴフアイルの歪と比較され、合成歪と最も近いがそれより大きい歪が同一のものとみなされる。

同一のものとみなされた歪に関連したＥ　ＲＲＯＲＦＡが抽出され、出す１４図のブロック４２２へ供給されるＥＲＲＯＲＦＡとして利用される。

合成歪がｐｅｒ−ｗｏｒｄ　５ＴＡＴフアイルのどの歪よシも太きいときには、ＥＲＲＯＲＦＡが抽出されず、代りに１に等しいＥＲＲＯＲ，Ａが検査が失敗したことを表示するブロック４２２へ供給される。システムが第１４図のブロック４２２からブロック４２４へ進み、そしてブロック４２８へ進む場合は、累積誤差４２６は失敗した検査に応答して調整されないことは注見される。不注意な雑音、ユーザのしゃつくり、またはユーザを現在の入力中の彼の発声から邪魔するどのような種類の問題の彼の別の発声を容認される見込みに不利に影響しない。

それにも拘わらず、このような普通でない発声は繰り返されるなら、検出された間違った発声や音はシステムで認識され容認または拒絶に影響する・テストブロックを含む第１４図のブロック４２８の動作が第１６図に関連して述べられる。

特に、ブロック４２８に入ったときは、システムはブロック４６０へ移動し、ブロック４２４がらの７エイルカウンタがユーザが検査の予め設定された回数を越値は２である。熱論、この値はオペレータの裁量で設定されても良い。失敗した検査が最大を越えていれば、システムはブロック４３０へ移動し、上述の如く要求者を拒絶する。失敗した検査が最大を越えていなければ、システムはブロック４６２へ移動し、検査の最大回数が越えられたかを決定する。この条件は、要求者の累積誤差がしきい値よシ大きいがブロック４６０の検査が失敗されていないときに生じる。検査の最大回数のための緩やかなしきい値５である。再びもし彼が希望するなら、オペーレタは別の値を選択できる。最大検査が限度を越えていれば、システムはブロック４３０へ移動し、上述の方法で要求者を拒絶する。最大検査が限度を越えていなげれば、システムはブロック４６４へ移動し、第１４図のブロック４２６からの累積誤差がしきい値より大きいか決定される。もし、そうなら、システムは第１４図のブロック４１４へ移動し、０ＲＤＥＲフアイルからの次のワートヲ得て、上述のように処理する。累積誤差がしきい値よシ小さければ、システムはブロック４６６へ移動し、要求者が少なくとも２回を越えているか全決定する。このことは少なくとも２回の検査がこの要求者のために行われた且つ第２の検査の終りで累積誤差が容認のためのしきい値以下であることを意味する。

上述の実施例で、累積誤差はブロック４２６の各検査によって調整される。他の実施例において、しきい値は累積誤差と一緒に調整される。この調整は、累積誤差のために行われたと同じ方法で、しきい値に現在のＥＲＲＯＲＦＡ値を乗算するような累積誤差での変化の割合として行われ乞。結果として、分数によって乗算される如く小さくなる累積誤差の傾向はしきい値レベルの低下を伴い、容認される氏名詐称者の見込みは検査の増加によって増加されなくなる。２回以下の検査が行われたことが検出されると、システムはブロック４６６からブロック４１４に移動し、０ＲＤＥＲフアイルから次のワード全稈て、上述のように処理する。少なくても２回の検査が行われていれば、システムはブロック４６８へ移動し、要求者に彼が容認されたことを連絡するために又は容認信号によって動作される装置全始動させるためにステーション１０２金介して転送される信号を発生して要求者を容認する。

よりＭのパーソナルコンピュータ１１２のリアルタイム動作システム１１４全成就するのに、以下のステップが要求される。

第２１図全参照して、パーンナルコンピュータのメモリーがスタック（ｓｔａｃｋｓ）　１２４として使用されるべくブロック内に組込まれている。これらのスタック同時と進行される各１２のプロセス（ｐｒｏｃｅｓｓｅｓ）めに全ての修飾可能データを保持する。実行されるべき各プロセスのイメージ（ｉｍａｇｅ）はそのスタックに記憶されている。プロセスＯはイメージ初期設定を必要とせず、全ての他の初期設定およびセットアツプを実行する特殊なものと指摘される。

その後は、プロセスＯは時間を連続的に読出し、シャード・セマフォード・メモリー（ｓｈａｒｅｄ　ｓｅｍａｐｈｏｒｅｄ　ｍｅｍｏｒｙ）のロケーション内の他の全てのプロセスを有用にする“タイム（ｔ１ｍθ）″を作成する。イメージが初期設定された後はルーチンが動作の開始２許された１クロツク・割込み・サービス・ルーチン”即ち゛クロックＩＳＲ”と呼ばれる。クロックＩＳＲはプロセスのスタックの現在のプロセスのイメージを押し進める。他のプロセスの状態に基づいて、決定はパーソナル・コンピュータのデジタル・プロセッサの使用に値いする０スケジエーラ（５ｃｈｅ４ｕｌｅｒ　）″によって行われる。選択されたプロセッサのスタックのアドレスはプロセスティプル１２６から回収され、そのイメージはスタックを急に出ていく。そのプロセスの動作は割込みから復温したときに直ちに開始される。初期イメージの危険部分は正しい割込み復帰アドレスとフラグの立証である。

スタックおよびイメージ変化の手順は“文脈スイッチ（ｃｏｎｔθＸＢｗｉｔｃｈ）”と呼ばれる。第２の機構も文脈スイッチを実行する。おるイベント’を待つプロセスは、割込みが行われそしてスタック決定および他のプロセスのイメージポツプポツピング（ｐｏｐｐｉｎｇ）が継続されていれば、イメージを造る文脈スイッチ機構に対して制御を与える。プロセスはプログラムのスペースを共用する。“純”即ち”再入可能”コードが絶対に必要とされる。各々共用される資料、装置、資源は専用のセマフォー（θθｍａｐｈｏｒｅ　）によって保護されなければならない。セマフォーはセクトされ、ｉう最小非削込み動作によって試験されるフラグである。問題になるのは２つのプロセスは試験即ち同一ロケーション、装置、資源の修飾を試み、かつその動作中に非干渉を除く可能性である。

セマフォービは、割込み中止しフラグを読出すプロセスを有すことによシ確実性を保証する。フラグが無げれば、フラグがセットされ、割込みが再び開始される。

フラグが有効なら、文脈スイッチ（即ち、文脈切替え）が行われる。プロセッサがこの文脈に再び戻るときには、フラグが再び試験される。割込みはこの文脈中はセマフォーが無くなるまでオフのままである。各々の装置（例えば、クロック、スクリーン、キーボード、ディスク、ｒθ２３２バス、および５ＶＢ）は１コマン）”　（ｃｏｍｍａｎｄ　）”機能および”割込み・サービス・ルーチン（ｉｎｔｓｒｒｕｐｕ　５ｅｒｖｉｃｅ　ｒｏｕｔｉｎｅ）″機能と関連している。ＳＶＢは、４つまでのボードを共用するＤＭＡ機能を使用する権利をボードがあるか決定するために割込み・サービス・ルーチンの０ラウンド９・ロビン（ｒｏｕｎｄ　ｒｏｂｉｎ）”様式で試験される。装置が使用されるとき、プロセスは装置セマフォーをセットし、割込みを停止し、装置をコマンドシ、装置ビジィフラグをセットし、文脈切替えが禁止される。スケジューラはそのプロセスに復帰することができる。プロセスは装置セマフォーを解除し、割込みぬ戻す。プロセスのプロセッサ使用に関するスケジューラの決定は、優先度、ディバイス・ビーシイ・フラグ、プロセス状態に基づいている。２つのレベルの優先度がある。

高優先度は残存されなければならないシステムのユーザに対する連続する正しい音のスピーチ出方に対してのみ与えられる。全ての他のプロセスは低優先度全盲する。高優先度プロセスは低優先度プロセス状態える絶対先例を有する。スヶジー−ラは同時ド切替えられた物に従うプロセスを示している”ラントハロビン（ｒｏｕｎｄ　ｒｏｂｉｎ）″様式のプロセスティプルを試験する。このランド・ロビン試験の間、装置尾　および無駄なプロセスがスキップされるのを待つ。第１の実行可能低優先度プロセスが記憶されている。高優先度プロセスが待機中なら、最初に発見された物が栗初に実行される。何も発見されなげれば、記憶された低優先度タスクが実行される。プロセス０はブロック化即ち゛無効”されることは不可能であり、従ってスケジュラ−は常にプロセスを実行するために有している。プロセスは”キイルド（ｋｌｌｌｅｄ）Ｉｌまたはト顎ム）”　（ｄｏｏｍｅｄ　）″される。キイルト毛れたプロセスは直ちに終了され、文脈記切替えが出され、続いてランド・ロビン試験にスキップされる。

ドウムドされたプロセスはプロセスが終了するまで継続する。

これは“プロセストリイブ（ｐｒｏｃｅｓｓ　ａθ１ｖｅｒ　）″を指摘したプロセスの初期イメージを有することにょシ成就される。プロセストリイブはプロセスティプルに明記された機能を機能を実行する無限ループである。この無限ループはプロセスドラムフラグ（ｐｒｏｃｅｓθａｏｏｍ　ｎａｇ）セットを検出したときに自身で終了し、文脈切シ替えを出す。プロセスは”イクス（ｅｘｅｃ ’ｅｄ）”される。イクスプロセスに対して、まず確実に無駄にされなけ゛ればならない。キルコマンドはプロセス及び機能ポインターがそのプロセスを入力するためのプロセスティプルにコピーされ、そのプロセスティプル入力のリマインダ（ｒｅｍａｉｎｄｅｒ　）が入力データにまるまでキイルドとしてのこるプロセス状態を除いて初期化されるために、発生される。プロセス状態は”ライブ（ｌｉｖｅ）”になる。動作システムはファイルシステムの同等物内に固定デスクを保存しなければならない。デスクは７つのブロックに組織サレル。スナワチ、ＢＯＯＴ、０ＰＥＲＡＴＩＯＮＧ　ＳＹＳＴＥＭ。

５ＴＵＣＴＵＲＥＳ、ＨＥＡＤＥＲＳ、ＩＭＰＯ３ＴＯＲＳ、ＥＮＲＯＬＬＥＥＳ。

ＡＵＤＩＴ　ＴＲＡＬＬである。ＢＯＯＴは動作システム及び構成を定義するためのデスク連結を含む動作システム全完成させるに必要なプログラムを含む。例えば、確認の管理における全てのデスク及び資料である。５ＴＲＵＣＴＵＲＥＳは全ての７つのブロックが配置されたマツプである。これらのブロックは主要なブロックは時々分離された小さなブロックに分割される。例えば２つのＨＥＡＤＥＲば１つのコピーへのダメージが有用なデータを永久に破壊しないように遠く離されたデスクセクタに記憶される。これは、２枚のコピーを有する５ＴＲＵＣＴＵＲＥＳＨＡも同様である。これらの５ＴＲＵＣＴＵＲＥＳＨＡのロケーションはＢＯＯＴ内に記憶される。ＨＥＡＤＥＲＳは全ての会員に個人データ及びＥＮＲＯＬＬＥＥＳブロックとＩＭＰＯ８ＴＯＲＳブロックのリンケイジを含む。

ＩＭＰＯ８ＴＯＲＳプロ、りは証拠のアレイである。各ＩＭＰＯ３ＴＯＲ８は各々５ワードの５つの証拠を有する。ＥＮＲＯＬＬＥＥＳブロックは証拠のアレイである。各々の会員のために各々５ワードの５つの証拠がある。

確認手顆は動作システムによシ与えられる根本的機能を使用する別のモジュールに記憶されている。確認は３つの主要なサブモジュール、ＶＥＲＩＦＹ、ＥＮＲＯＬＬ、ＭＡＮＡＧＥに分割されている。ＥＮＲＯＬＬはＭａｎａｇｅｒ　Ａｃｃｅｓｓ　Ｐｎｉｎｔ″動作からのみ理解できる。内部的に、５０の証拠をワード毎に５７−ト０×５証拠で成る２５の証拠と共に保持する大きな証拠バッファがある。２つにバッファはＲＡＭ内で内部・話し手及び相互・話し手の統計値を発生する動作をし続けるために必要とされている。ディスクのシフトオフ及びオンの間この動作はシステムを低速にする。（記：これらのバッファは、またＢＡＣＫＵＰのようなＥＮＲＯＬＬと同時に実行しない他にモジュールによって使用される。ＢＡＣＫＵＰは、また、２５証拠のブロックをそれぞれシフトオンし、且つデスケラト及びディスクをシフトオフする）プロンプ）　（ｐｒｏｍｐｔθ ）はＲＡＭ内で同様な速度原理によシ保持される。スピーチプロンプチング（５ｐｅｅｃｈ　ｐｒｏｍｐｔｉｎｇ　）（音声出力）の間、スケジューラによるプロセッサの割シ振シは粗悪な品質の音になる出力スピーチ細分部分を作る。従って、スピーチ出力は高優先度が与えられる。プロンプトが出力された時、プロセスは割り振シ処理者用のコマンドをセットし、ボード割り込み処理者への送信及び動作を待つとき自身にマークする。割シ込み処理者は停止された割り込みを有するので、セマフォー及びディバイスビイシイフラグが不必要となるようにＤＭＡ用の争いが存在してはならない。割シ込み処理者はプロセスの要求が終了ししだいにプロセスのため動作待機フラグを消す。動作を待つ間にプロセス文脈切シ替えが出力され、動作フラグ消去を待つまで再び実行されない。ディスクから証拠を検索する間、プロセスはディスクをセマフォーし、コマンド及びＤＭＡｅセットし、ディスクをビイシイとマークし、ディスクがビイシイの実行するだめの他のプロセス時間を与えることを切シ替え文脈切シ替えに要求する。ディスクが処理された時、空きの如くマークされたディスクの割込みヲ災行し、セマフォーを切る。ラウントロピンループがこのプロセスに再び達した時、スケ−ジー−ラこのプロセスの実行を継続する。ＥＮＲＯＬＬは”ドクム（ｄｏｏｍ　）″プロセス１であるところのＭＡＮＡＧＥＲから開始する。プロセス１は確認プロセスでおるので、システムは時間切れ及びそれ自身を消滅させるために確認を待つ。

起こりえる正当な確認を割込ませることは不適切である。プロセス１が自身を消滅させた後、ＭＡＮＡＧＥＲはプロセス１上に立ったＫＩＬＬ７ラグを見るかつプロセス１上のＥＸＥＣｏｆ　ＥＮＲＯＬＬを実行する。ＥＮＲＯＬＬは重要な統計を得ることにより開始され、各証拠が訂正された時にそれは自身の番号とそれのワード番号に従って順次にＲぷスコアに記憶される。証拠が長さにおける大きな分散によって試験される。このような分散が発見されなげれば、際立った長さを有する証拠金置換える試みがなされる。多くの証拠がワード内で“際立つ（ θｔａｎａｏｕｔ　）″であれば、そのワード９のための証拠の新しい設定が指示される。

これが失敗すれば、ＥＮＲＯＬＬは失敗する。ＥＮＲＯＬＬが失敗すれば、証拠はにバッファに記憶されているに証拠に変換される。ボードは同一のワードの他の証拠と比較したような各証拠のスコア（５ｃｏｒＩ５）　ｋ発生するために指示される。このスコアはＨＥＡＤＳＥＲ内に記憶された内部・話し手の統計を決定するのに使用される。任命された氏名詐称者はｒ証拠バッファ内へ読出され、内部・話し手続計が同様な方法で発生される。任命されない氏名詐称者のために統計の誤りセットが発生される。

これらの統計は発生された内部・話し手続計と組み合わされる。

これらの統計はＨＥＡＤＳＥＨに記憶される。Ｋ証拠バッファはユーザディスク見出しく　ｕｄｊ、　）に割り当てられ、書出される。

ｒ証拠バッファ内への読戻しが行われ、ディスク上に悪いセクターかどうかを決定するためにバイト対バイトの比較が行われる。もしそうなら、正常な書込み／続出しシーケンスが実行されるか又はディスクが満配はなるまで他のｕｄｉが発生される。

そして、ＲＡＭ内のＨＥＡＤＳＥＲが不正の如くマークされ、直ちに書出しが行われる。このことは証拠を変更し、統計がＨＥＡＤＳＥＨに不正の如くマークし１５分フラッシュが生じるまで書出しされない確認と対照をなす。ＶＶＥＲＩＦＹはプロセスエないし８の普通の機能である。第２２図で述べられるＶＥＲＩＦＹプロセスのフローチャトは上述の確認動作のシステム１１４を動作することによりとられたステップを描いている。

添付されたＡｐｐｅｎｘｄｉｘ　Ａは確認、構成および登録のデータベースのサブプログラムの目的コードのコピーである。目的コードは、８進数形式、プログラミング言語Ｃおよび１ＢＭ　ＰＣ／ＸＴ用のマスコンポバージョンアセンブリ言語で記載しである。また、Ａｐｐｅｎｘｄｉｘ　ＢはＴＭＳ　３２０１０で記載されたｓｐ目的コードのコピーでおる。Ａｐｐｅｎｘｄｉｘ　ＣはＭｏｔｏｒｏ’ｌａ　Ｓ　−ｒｅｃＯｒｄフォーマットのコピーである。ＣＰ目的コードはプログラミング言語ＣおよびＭ　６８０００アセンブリ言語のＭＡＳＳＣＯＭＰバー：）ヨンアセンブリで記載されている。勿論、これらの付属物のコードが技術的に公知の多くの言語で実質的に”プログラム”されることは認められる。従って付属物に開示された実施例は本発明の１つの参照例として与えられたものでアシ、本発明の範囲を如何なる方法でも限定するものではない。上述された装置および方法は以下の信頼でき且つ能率的なスピーチ確認システムを提供することにより従来技術を越える優れた改良を含んでいる。本発明は（１）スピーチの始めと終りを能率的に且つ正確に検出する手段を含んでいて、（２）音声コードの特徴に関し、時間又は強度制限に基づく制限なしに基準及びテスト発声間の比較を供給する確認用の・ξラメータを提供し、（３）氏名詐称者を間違って容認し又は正しい話し手を拒絶する確率の表示全発生し、内部及び相互・話し手の両方に基づく別の発声の複数の比較の結果の関数である容認のための結果を利用する確認モー１を提供し、（４）話し手を容認又は拒絶するかを決定する間おおよその一定基準を維持すること金許すところの話し手の容認又は拒絶のための任意の可変しきい値を供給する。

本発明はその範囲全能れることなく又は本質的特徴全能れることなく他の形に具体化できる。

例えば、第２５図を参照して、登録動作の完成の後、第１の基準ワードの発声の登録のだめの内部・話し手の全体的な歪値を演算（５００）するために続行される。一度そのワードのための全体的な歪値が演算されると、最大の値が捨てられ、平均及び全体的な歪値の残りのための分散が演算され、後の確認動作用に記憶される（５０２）。

同様に、相互・話し手の全体的な歪値を演算するための相互・話し手比較が実行され（５０４）、最大の歪値が捨てられ、全体的な歪値の残シのために、相互・話し手の平均及び分散が演算され及び記憶される（５０６）。

各々の別の基準ワード及び彼らの対応する発声のグループのために、内部・話し手及び相互・話し手の平均及び分散が上述のように演算され且つ記憶される。

第２６図を参照して、確認動作の間、システムが要求されたユーザの同一性を確認し得た後に、システムはメモリから内部・話し手及び相互・話し手の平均及び分散値、基準ワード、各基準ワードに関連した発声のに係数及び要求されたユーザの同一性に対応する２つのしきい値Ｕ及びｖ−１訂正する（５２２）。

基準ワードから、システムは任意に１のワー）”ｉ選択し、ユーザに選択されたワードをマイクロフォンに話すように促す（５２４）。受信された発声は正規化された自己相関係数ｒを得るために直ちに処理される（５２６）。ｒ係数は、全体的な歪の新しい組を演算するためにそのワード（登録されたユーザによって前（（話されている）の記憶されている各々の発声のに係数と比較される（５２８）。全体的な歪の組から、１個の組合わされたスコア（即ち、全体的な歪の平均）が演算される。組合わされたスコア及び内部・話し手及び相互・話し手の平均及び分散値を使用することによって、２つの値Ｐ及びＱが演算され、彼らは登録されたユーザがいま演算されたスコアよシ悪い組合わされたスコアを生じる発声を生じる確率と、いま演算されたスコアよシ良い組合わされたスコアを生じる発声を生じる確率とをそれぞれ表示する。第２７図を参照して、Ｐは同一性を肯定するために、組合わされたスコア５４６からの２つの内部・話シ手値（即ち、平均５２４と分散５４４）によって特定されたガウス形密度関数５４０の積分によって演算される（即ち、Ｐは破線された領域５４８に等しい）。

同様に、Ｑは同一性を否定するために、組合わされたスコア５４６からの２つの相互・話し手（即ち、平均５２２と分散５５４）によって特定されたガウス形密度関数の積分によって演算される（即ち、Ｑは破線された領域５５６に等しい）。

再び第２６図を参照して、Ｐおよび現在の基準ワードの現在の発声に対応する確率値である間は、ＰおよびＱはｐおよびｑの新しい値が演算される毎に更新された累積確率値であり、即ちユーザから新しい発声が受信される毎にＰおよびＱ（１に初期化される）は個々の確率新しい値ＰおよびＱ’ｔそれぞれ積算することにより更新される。結果的に、ユーザの最初の発声の後、ＰおよびＱはｐおよびｑにそれぞれ等しくなる（５６０）。確認決定（５６２）　’ｉするために、ＰおよびＱはそれぞれ登録されたユーザのために２つのしきい値Ｕおよび■と比較される。ＰがＵよシ小さいがＵがＶ　（５６４）以上に保たれれば、ユーザは拒絶され、逆に、ＱがＶよシ小さいがＰがＵ　（５６６）以上に保たれれば、ユーザは容認される。しかし、ＰがＵ以上に保たれかつＱがＶ　（５６８）以上に保たれれば、ユーザを容認または拒絶するための決定は行われず、代シに基準ワードの他の１つが選択され、ユーザは他の発声を促される。ｐ、　ｑ、　ｐの新しい値がこの発声のために演算され、更新された値Ｐおよびｑがもう一度ＵとＶと比較される。ユーザを容認するが拒絶するために確認決定を行われるまでシステムはユーザに発声を促し続ける。

確認決定の感度および安全レベルは直接に２つのしきい値ＵおよびＶに関連する。ＵおよびＶが比較的に小さな値に設定されていれば、確認動作は発声および分析の長いシーケンスを要求する傾向になる。低いしきい値しばルの、区恵は増加された安全性であり、即ち氏名詐称者が容認されないで正しいユーザが拒絶されない大きい確実性であり、勿論増加された確実性は長い確認動作と反対に重要である。

■の値に関連したＵの値が低くなればシステムは大きな組合わされた全体的な歪値を示す不規則な発声音よシ寛大にし、一方Ｕの値に関連したＶの値が低くなれば正しいユーザと容認されるべき氏名詐称者の両方がより困難になる。

確認動作の始めで、ユーザが正確な同一性（５７０）を供給すれば、彼は直ちに拒絶されない、代りに、彼は不足している基準ワードのグループの幾つかを発することを促される。しかし、発声の結果が捨てられ、ユーザは最後の発声を話した後で直ちに拒絶される。この手順は彼が正確な同一性を発生しているかどうか全ユーザから聞き知ることを防ぐ。

ユーザが登録されたユーザとして容認されれば、確認動作中に彼または彼女が話した発声は記憶された基準発声と内部・話し手及び相互・話し手の平均及び分散値とを更新するのに使用される。これは人間の声に常に生じる変化を受入れるのに行われる。更新することは非常に新しい発声に非常に古い発声よシも重要性を自動的に与える。

記載された実施例は説明された例のみ限定されず全ての範囲が考察されるべきであシ、従って本発明の範囲は実施例よシもむしろ請求の範囲によって示されている。請求の範囲の同一の意味および領域内の変更は本発明の範囲内に包括されるべきである。

浄書（内容に変更ないＦＩＧ、３ＦＩＧ、４ＦＩＧ、５ＦＩＧ、　７ＦＩＧ、　６ＦＩＧ、８ＦＩＧ、７０ＦＩＧ、７７７Ｙ　”Ｄ“ ＦＩＧ、　７２ＦＩＧ、　７３竹表昭６３−５００１２６　（２６）ＦＩＧ、１６ −−」ＦＩＧ、７７ＦＩＧ、　７９ＪＦＩＧ、２１ｂＫＥＹＢＯＡＲＤ　ＴＡＢＬＥ（−πン”うζηし）　」２？唸１！ぺ≧シ：巨 −（π〜吐ゴ≦ム〕ＦＩＧ、　２２０立訂Ｅ厘　歴ｒ５ヨヒＬ）ＥＡｒｙ：ＲｔｘｒＥＮｓｐｏＮｔｔｓ４１＠）　ＲＥＣＯＲＤ（１−）−Ｖ＞ｔ　（−４＝−４）　ＲＥ！；ＪＤＥＮＴ　ＥＮＴ　ｌ　ラ”＞）−Ｉ〉ドＪ）ＦＩＧ、　２３ｂＦＩＧ、２４（）ＦＩＧ、　２４ｂＦＩＧ、２５Ｆ／Ｇ、２６手続補正書（方力１．事件の表示ＰＣＴ／ＵＳ８６１０１４０２２、発明の名称話者照合装置３、補正をする者事件との関係　出　願人住所名　称　ニック・インダストリーズ・インコーホレーテッド４、代理人住　所　東京都千代田区大手町二丁目２番１号新大手町ビル　２０６号室電話２７０−６６４１〜６６４６７、補正の内容別紙の通り（尚、（３）及び（４）の書面の内容には変更なし）国際調査報告

Claims

【特許請求の範囲】

１．話し手が知られている人間かどうか前記知られている人間のスピーチについての基準情報を含む記憶された情報に基づいて確かめる方法において、前記確認の第１段階で、前記話し手の発声を前記記憶された情報に関連して分析し、前記分析に基づいて次の段階を続けるかを判断し、もし続け無いときには前記話し手を受入れるか或いは拒絶するかを決定し、もし続けると決定した場合には、前記次の段階で前記記憶された情報に関連した前記話し手の少なくとも付加的な発声についてのテスト情報を分析し、第１の段階で行われた分析と段階２の段階で行われた分析の両方に基づいて確認決定を行う、ことを特徴にする方法。
２．前記分析は前記比較の結果を暗示する差データを得るために前記テスト情報と前記基準情報とを比較することと、前記決定が前記差データから得られる確率値および少なくとも１のしきい値とに基づくことを含むことを特徴とする請求の範囲第１項に記載の方法。
３．前記記憶された情報は、ある与えられた前記差データのための確率値を暗示する確率値を含むことを特徴とする請求の範囲第１項に記載の方法。
４．複数の前記次の段階を含み、各々の前記次の段階は前記記憶された情報に関連した少なくとも別の前記話し手の付加的な発声についてのテスト情報の分析を含み、前記確認決定は前記第１の段階および前記第２の段階における前記分析に基づいて行われることを特徴とする請求の範囲第１項に記載の方法。
５．１つは氏名詐称者を間違って容認する見込みを表し、他は前記知られている人間を間違って拒絶する見込みを表示する２つの前記確率値を有し、２つの前記しきい値を有することを特徴とする請求の範囲第２項に記載の方法。
６．前記しきい値は調整可能であることを特徴とする請求の範囲第５項に記載の方法。
７．前記次の段階における前記確率値は前記第１の段階の確率値に部分的に基づいていることを特徴とする請求の範囲第５項に記載の方法。
８．前記確認決定は前記話し手が前記知られている人間であるかを決定することを含むことを特徴とする請求の範囲第１項に記載の方法。
９．もし前記確認決定が前記話し手が前記知られている人間てあると決定したときは前記テスト情報に基づいて前記記憶された情報が更新されることを更に含むことを特徴とする請求の範囲第１項に記載の方法。
１０．前記発声および前記付加的発声は前記基準情報の基礎を形成する１組のワードからランダムに引出された２つのワードを含むことを特徴とする請求の範囲第１項に記載の方法。
１１．話し手が知られている人間かどうかを前記知られている人間のスピーチについての線予知係数に基づく基準値を含む記憶された情報に基づいて確かめる方法において、与えられたテスト情報分析の結果によって前記話し手が前記知られている人間かどうかの確率を暗示する確率値を前記記憶された情報から得ることと、確認の間、前記記憶され情報に関連して前記話し手の発声についての情報を分析し、前記発声に対する前記テスト情報分析の結果を前記話し手の前記発声用の少なくとも１つの確率値を得るために前記確率データに供給し、少なくとも前記確率値に基づいて確認決定を行うことを特徴とする方法。
１２．前記確率データが確率分布関数から得られる数を含むことと、各前記確率値が前記確率分布関数の１つの部分を積分することにより得られることを含むことを特徴とする請求の範囲第１１項に記載の方法。
１３．前記値は平均および分散を含むことを特徴とする請求の範囲第１２項に記載の方法。
１４．１つの前記確率値が氏名詐称者が前記知られている人間であることを間違って決定する見込みを表示し、他の前記確率値が前記話し手が前記知られている人間であることを間違って決定する見込みを表示する２つの前記確率値と、２つの前記確率分布関数を有することを特徴とする請求の範囲第１２項に記載の方法。
１５．前記テスト情報が前記話し手の前記発声の正規化された自己相関係数に基づくテスト値を含み、前記分析が前記基準値と前記テスト値との間の差を表示する全体的な歪を得るために前記テスト値と前記基準値との比較することを含むことを特徴とする請求の範囲第１１項に記載の方法。
１６．前記確率データは前記知られている人間による複数の発声証拠および他の人間による複数の発声証拠から得られ、前記確率データは以下のものを含む、前記知られている人間による２つの前記発声証拠の可能な組合わせのための線予知係数間の差をそれぞれ表示する全体的な歪値の平均値と等しい内部・話し手平均値と、前記内部・話し手の全体的な歪値の分散値と等しい内部・話し手分散値と、前記知られている人間による前記発声と前記他の人間による前記発声との各々の組合わせ可能性のための線予知係数間の差を各々表示する全体的な歪値の平均値と等しい相互・話し手平均値と、前記相互・話し手の全体的な歪値の分散値と等しい内部・話し手の分散値と、および第１の前記確率値は前記内部・話し手平均値および分散値によって識別されたガウス形密度関の前記テスト値と基準値の差を表示する前記全体的な歪値から正の無限大への積分に等しいことと、相互・話し手平均値と分散値人間によって識別されたガウス形密度関数の負の無限大から前記テスト値と基準値の差を表示する前記全体的な歪値への積分に等しい第２の前記確率値とを含む請求の範囲第１５項に記載の方法。
１７．前記記憶された情報は第１および第２のしきい値を含み、前記方法は更に前記第１および第２の確率値と前記第１および第２のしきい値間の比較にそれぞれ基づく確認決定を行うことを含むことを特徴とする請求の範囲第１６項に記載の方法。
１８．請求の範囲第１７項のステップは複数回繰り返され、第１の累積する確率値は総ての前の第１の確率値の積と等しく、第２の累積する確率値は総ての前の第２確率値の積に等しく、前記確認決定は前記第１および第２の累積する確率値と前記２つのしきい値とのそれぞれの比較に基づいていることと、前記確認決定が、もし第１の累積する確率値が前記第１のしきい値より小さく且つ前記第２の確率値が前記第２のしきい値より大きい時には話し手が前記知られている人間でないとして拒絶され、もし前記第１の確率値が前記第１のしきい値より大きく且つ前記第２の累積する確率値が前記第２のしきい値より小さい時には前記話し手が前記知られている人間であると確認するように決定されることを含む、ことを特徴とする請求の範囲第１７項に記載の方法。
１９．前記しきい値が所望の保証度に従って調節されることを特徴とする請求の範囲第１６項に記載の方法。
２０．話し手が知られている人間かどうか前記知られている人間のスピーチについての基準情報を含む記憶された情報に基づいて確かめる方法において、前記記憶された情報に関連した前記話し手の発声についてのテスト情報の分析に基づいて前記話し手が前記知られている人間かどうかを確認することと、もし前記話し手が前記知られている人間と確認されたときには、前記記憶された情報を前記テスト情報に基づいて更新することとを含む、ことを特徴とする方法。
２１．装置が動力を受取ることを認められている知られている人間として話し手が確認されることに基づいて動力を必要としている装置に動力を供給する装置において、前記知られている人間のスピーチについての記憶された情報に関連した前記人間の現在の発声の分析に基づいて前記人間が前記知られている人間であると確認し、このときには論理確認信号を出力する装置と、前記論理信号に応答して前記装置に動力を送る非機械的、非磁気的スイッチとを含む、ことを特徴とする装置。
２２．前記パーワースインチはパーワーＭＯＳＦＥＴ装置を含むことを特徴とする請求の範囲第２１項に記載の装置。
２３．前記装置は前記話し手がドアを通れるようにドアロックを解除するためのソレノイドを含むことを特徴とする請求の範囲第２１項に記載の方法。
２４．話し手が知られている人間かどうか前記知られている人間のスピーチについての基準情報を含む記憶された情報に基づいて確かめる装置において、前記確認に関連したキー化された情報を受信しかつコード化されたトーン信号を発生するキー動作されるトーン発生器と、前記話し手の発声に応答してアナログ電気信号を発生するマイクロフォンと、前記トーン信号と前記アナログ信号の両方を搬送するチャネルと、前記チャネルから受信された信号をディジタル信号に変換するアナログ・ディジタル変換器と、前記記憶された情報に関連した前記発声に対応した前記ディジタル信号を前記確認の部分として分析する記憶されたプログラムによって制御されるディジタルプロセッサであって前記プロセッサは前記キー化された情報を得るために前記トーン信号に対応したディジタル信号を検出し解読するようにプログラムされており、そして前記装置は前記キー化されている情報に基づいた確認を導くために採用されていることを特徴とする装置。
２５．複数の話し手が知られている人々かどうかを前記知られている人々のスピーチについての情報を含む記憶された情報に基づいて確かめる装置において、前記複数の話し手からの発声を受信する複数のステーションと、前記確認の一部として前記記憶された情報に関連した各前記発車を分析することをプロセッサに可能するように配列された記憶されたプログラムによって制御されるディジタルプロセッサとを含み、前記記憶されたプログラムは前記ディジタルプロセッサに前記異なる発声が同時に処理されるように異なる前記発声の分析のステップをタイム・インタリーブするように配列されていることを特徴とする装置。
２６．複数の話し手が知られている人々かどうかを前記知られている人々のスピーチについての情報に基づいて確かめる装置において、前記複数の話し手からの発声を受信しかつ前記話し手の情報を発生する複数のステーションと、前記ステーションのそれぞれのユーザに対応する複数のプロセッサと、前記プロセッサを管理するホストコンピュータであって、複数のプロセッサがリアルタイムで前記それぞれのステーションに対応できるように複数の前記プロセッサの制御をタイム・インタリーブするリアルタイム動作システムにより前記ホストコンピュータが制御されることを特徴とする装置。
２７．音響信号源の同一性を確認する方法において、前記音響信号源からの音響信号を受信することと、前記音響信号源からの第１のパラメータを得ることとそして前記第１のパラメータは前記音響信号源の物理的特性に対応していることと、前記音響信号源から前に受信した音響信号から得た第２のパラメータと前記第１のパラメータを比較し、これにより前記第１および第２のパラメータの比較を表示する第１の歪値を発生することと、前記第１の歪値と他のグループを伴う前記第２のパラメータの複数のグループの各々の比較を表示する複数の第２の歪値とを比較し、前記第２の歪値は他の音響信号源からの音響信号の誤り確認に関して対応している確率値を各々同一のものとみなすことと、前記第１の歪値と第２の歪値との比較に基づいて第１の誤差値を発生し、前記第２の歪値の一つによって同一のものとみなされた確率に対応させることと、前記音響信号源からの第２の音響信号のために上述のステップを繰り返すことと、前記ステップの端繰り返しの間の前記第１の誤差値における変化を反映している第２の誤差値を発生することと、前記第２の誤差値としきい値とを比較することと、もし第２の誤差値としきい値との関係が予め選択された容認基準に従っていれば容認信号を発生することを特徴とする方法。
２８．前記第２のパラメータがパラメータのグループを含む、各パラメータのグループは前記第１のパラメータに対応した音響信号に類似する特性を有する音響信号に対応した請求の範囲第２７項に記載された如き音響信号源の同一性を確認する方法。
２９．第１のパラメータと第２のパラメータとを比較するステップが、第１のパラメータと前記第２のパラメータのグループの各々を分離的に比較し、これにより各々比較のための歪値を発生するステップと、合成値を発生するために各々の比較からの歪値を発生するステップとを含む請求の範囲２８項に記載された如き音響信号源の同一性を確認する方法。
３０．第１の誤差値を発生するステップが、第１および第２の歪値に応答して第１の歪値より次に大きい第２の歪値を選択するステップと、第１の誤差値として選択された第２の歪値に関連した確率値を選定するステップとを含む請求の範囲２７項に記載された如き音響信号源の同一性を確認する方法。
３１．もし第２の歪値が第１の歪値より大きくなけれ選定するステップが、第２の歪値によって表示された音響信号を発生する音響信号源以外の音響信号源からの音響信号を表示する第１の歪値を示す第１の誤差値に値を選定することを含む請求の範囲３０項に記載された如き音響信号源の同一性を確認する方法。
３２．第２の誤差値が前記方法の以前のステップの各繰り返し内において発生された第１の誤差値に応答して変化された合成値を含み、これにより選択された音響信号源を確認するために前記方法の実施において発生された誤差値の影響を表示する表示値を供給する請求の範囲３０項に記載された如き音響信号源の同一性を確認する方法。
３３．第１および第２のパラメータが自己相関係数ａａ係数を含み、本方法において利用される歪を得るためにパラメータのグループの一つが正規化された自己相関係数がパラメータの他のグループのａａ係数と比較される請求の範囲２７項に記載された如き音響信号源の同一性を確認する方法。
３４．音響信号の受信ステップ前に前記音響信号源から前に受信された別の音響信号を表示している値の表から音響信号を選択するステップと、前記音響信号源と通信しかつ前記音響信号源から与えられるべき選択された音響的な信号を同一のものとみなす敏速な信号を発生するステップとを含む請求の範囲２７項に記載された如き音響信号源の同一性を確認する方法。
３５．音響信号源の同一性を確認する方法において、前記音響信号源からの複数の音響信号を受信することと、前記音響信号の各々を表示するパラメータを発生させることと、前記信号が同一の音響的なメッセージパターンを与えようとする前記音響信号のグループのために、グループ内の音響信号を表示するパラメータ間の差を表示する第１の値を発生させることと、前記グループからのパラメータと音響的メッセージパターンと類似した他の音響信号源からの信号を表示するパラメータとを比較することと、前記比較ステップに応答して、他の音響信号源からの信号を表示する前記パラメータとグループ内の音響信号を表示する前記パラメータとの間の差を表示する第２の値を発生することと、前記第１の値のために前記音響信号源からの音響信号を表示するパラメータに類似する値を有するパラメータによって表示された他の音響信号源からの音響信号の誤った確認の確率を表示している確率値を発生することと、確認されるべき新しい音響信号を受信することと、前記新しい信号を表示する新しいパラメータを発生することと、前記新しいパラメータと前記新しい音響信号として同じ音響的メッセージを各々が与えようとする音響信号のグループのパラメータとを比較することと、前記新しいパラメータ比較ステップに応答して、前記音響信号のグループのパラメータと新しいパラメータ間の差を表示する新しい値を発生することと、前記新しい差値と前記第１の値を比較し、前記新しい差値に接近した前記第１の値の１つを選択することと、前記選択された第１の値に関連した確率値に対応した第１の誤差値を発生することと、確認されるべき新しい他の音響信号を受信することと、前記他の新しい音響信号のために新しい音響信号の受信ステップ以下の上述のステップを繰り返すことと、前記繰り返しステップから生じる第１の合成誤差値を反映する第２の誤差値を発生することと、第２の誤差値としきい値とを比較することと、もし第２の誤差値としきい値間の関係が予め選択された容認基準に従っているときには、容認信号を発生することを含む方法。
３６．請求の範囲３５項に記載された如き音響信号源の同一性を確認する方法において、複数の音響信号の受信ステップより前に、前記音響信号源を同一のものとみなす記憶された情報を含む方法。
３７．請求の範囲３５項に記載された如き音響信号源の同一性を確認する方法において、前記複数の音響信号が複数の音響信号のグループを含み、各前記グループは同一の音響的メッセージを表示している複数の信号を含んでいる方法。
３８．第１の値を得るステップがグループ内の音響信号のパラメータとグループ内の他の音響信号のパラメータとを比較するステップを含む請求の範囲３５項に記載された如き音響信号源の同一性を確認する方法。
３９．複数の音響信号を受信するステップが、前記音響信号をモニターするステップと、前記信号によって表示された音響的なメッセージの開始および終りを検出するステップとを含み、これにより各々が音響的メッセージを表示する複数の音響信号を形成する請求の範囲３５項に記載された如き音響信号源の同一性を確認する方法。
４０．音響信号源の同一性を確認する装置において、前記音響信号源からの音響信号を受信する手段と、前記音響信号源からの第１のパラメータを得る手段と、そして前記第１のパラメータは前記音響信号源の物理的特性に対応していることと、前記音響信号源から前に受信した音響信号から得た第２のパラメータと前記第１のパラメータを比較する手段と、これにより前記第１および第２のパラメータの比較を表示する第１の歪値を発生することと、前記第１の歪値と第２の歪値との比較に基づいて第１の誤差値を発生し、前記第２の歪値の一つによって同一のものとみなされた確率に対応させる手段と、前記音響信号源からの第２の音響信号を受信することから生じる第１の誤差値における変化を反映している第２の誤差値を発生する手段と、前記第２の誤差値としきい値とを比較する手段と、もし第２の誤差値としきい値との関係が予め選択された容認基準に従っていれば容認信号を発生する手段とを備えたことを特徴とする装置。
４１．音響信号源の同一性を確認する方法において、第１の音響信号を受信することと、前記第１の音響信号を表示するテスト値を発生することと、第２の音響信号を受信することと、前記テスト値が第１および第２の音響信号を表示するように調節することと、前記調節されたテスト値をしきい値と比較することと、調節されたテスト値としきい値との関係が予め選択され容認基準に従っていれば容認信号を発生することとを含むことを特徴とする方法。
４２．もし調節されたテスト値としきい値との関係が予め選択された容認基準に従っていないときには、第２の信号を受信するステップから開始する上記のステップを繰り返すステップを更に含む請求の範囲４１項に記載された如き音響信号源の同一性を確認する方法。
４３．繰り返しステップの前に、もし調節されたテスト値としきい値との関係が予め選択された容認基準に従っていなくて、かつ繰り返しステップが予め選択された回数を実行しているときには動作を終了ステップを含む請求の範囲４２項に記載された如き音響信号源の同一性を確認する方法。
４４．動作を終了する前に、もし調節されたテスト値としきい値との関係が予め選択された容認基準に従っていなくて、かつ繰り返しステップが予め選択された回数を実行しているときには否容認信号が発生される請求の範囲４３項に記載された如き音響信号源の同一性を確認する方法。
４５．前記テスト値を調節するステップが、前記第２の音響信号を表示するテスト値を発生することと、第１の音響信号を表示するテスト値と第２の音響信号を表示するテスト値とを乗算することと、これにより第１および第２の音響信号の前記組合わせを含む値を発生することを含む請求の範囲４１項に記載された如き音響信号源の同一性を確認する方法。
４６．前記第１の音響信号が前記音響信号源からの第１の通信を表示し、前記第２の音響信号が前記音響信号源からの第２の通信を表示し、前記第２の通信は前記第１の通信と異なる請求の範囲４１項に記載された如き音響信号源の同一性を確認する方法。
４７．音響信号源の同一性を確認する方法において、各々の第１のテンプレートが選択された音響信号源からの選択された通信の別々の音響的通信の表示を含む複数の第１のテンプレートを供給することと、各々の第２のテンプレートが別の音響信号源からの選択された通信の音響的通信の表示を含む複数の第２のテンプレートを供給することと、複数の第１のテンプレートのあるものと前記第１のテンプレートの他のものとを個々に比較して、前記個々のあるもの用の第１の歪値を定義し、前記第１の歪値は選択された音響信号源からの同じメッセージの別の音律的通信における差を表示することと、複数の第１のテンプレートのあるものと複数の第２のテンプレートのあるものとを比較し、他の音響信号源と比較されたものとして選択された音響信号源による選択された音響的通信における差を表示する第２の歪値を定義することと、第１の歪値と第２の歪値を比較し、前記第１の歪値のための確率値を発生し、前記確率値は他の音響信号源からの選択された通信の音響的伝送が選択された第１の歪値に対する予め決められた関係を有する歪値を有するという見込みの表示を与えることと、前記確率値に基づいた音響信号源の容認のためのしきい値を選択することと、音響信号源からの選択された通信の音響的伝送の表示を含む第３のテンプレート受信することと、第３の歪値を定義するために第３のテンプレートと第１のテンプレートとを比較することと、しきい値と第３の歪値との関係が予め選択された容認基準に従っているときには、第３のテンプレートによって表示された音響信号源を容認することとを含むことを特徴とする方法。
４８．前記音響信号源を容認するステップの前に、第１の選択された通信と異なる第２の選択された通信のために前記方法のステップを繰り返すステップと、第３のテンプレートと第１のテンプレートとを比較するステップによって発生された第３の歪の組合わせを含む誤差値を発生するステップと、前記誤差値としきい値とを比較するステップと、もし前記誤差値としきい値との関係が予め選択された容認基準に従っていれば第３のテンプレートによって表示された音響信号源を容認するステップとを含む請求の範囲４７項に記載された如き音響信号源の同一性を確認する方法。
４９．もし誤差値としきい値との関係が予め選択された容認基準に従っていないときには、請求の範囲２８項のステップを繰り返すステップを更に含む請求の範囲４８項に記載された如き音響信号源の同一性を確認する方法。
５０．請求の範囲４８項のステップを繰り返すステップの前に、もし誤差値としきい値との関係が予め選択された容認基準に従っていなくて、かつ請求の範囲４８項のステップが予め選択された回数実行されていれば前記方法の動作を終了するステップを含む請求の範囲４９項に記載された如き音響信号源の同一性を確認する方法。
５１．誤差値が第３のテンプレートと第１のテンプレートとを比較するステップによつて発生された第３の歪を発生を含む請求の範囲４８項に記載された如き音響信号源の同一性を確認する方法。
５２．音響信号源を同一のものとみなすとき容認しきい値を定義する方法において、各々の第１のテンプレートが選択された音響信号源からの選択された通信の別々の音響的通信の表示を含む複数の第１のテンプレートを供給することと、各々の第２のテンプレートが別の音響信号源からの選択された通信の音響的通信の表示を含む複数の第２のテンプレートを供給することと、複数の第１のテンプレートのあるものと前記第１のテンプレートの他のものとを個々に比較して、前記個々のあるもの用の第１の歪値を定義し、前記第１の歪値は選択された音響信号源からの同じメッセージの別の音響的通信にむける差を表示することと、複数の第１のテンプレートのあるものと複数の第２のテンプレートのあるものとを比較し、他の音響信号源と比較されたものとして選択された音響信号源による選択された音響的通信における差を表示する第２の歪値を定義することと、第１の歪値と第２の歪値を比較し、前記第１の歪値のための確率値を発生し、前記確率値は他の音響信号源からの選択された通信の音響的伝送が選択された第１の歪値に対する予め決められた関係を有する歪値を有するという見込みの表示を与えることと、前記確率値に基づいた音響信号源の容認のためのしきい値を選択することとを含むことを特徴とする方法。
５３．音響信号源の同一性を確認する装置において、第１の音響信号を受信する手段と、前記第１の音響信号を表示するテスト値を発生する手段と、第２の音響信号を受信する手段と、前記第２の音響信号を第１および第２の音４信号組合わせを与えるために調節する手段と、調節されテスト値としきい値との関係が予め選択された容認基準に従っているときには容認信号を発生する手段とを備えたことを特徴とする装置。
５４．音響信号の始めと終りを検出する方法において、選択された開始しきい値レベル以上の音響エネルギーを検出するステップと、開始エネルギーしきい値以上の音響エネルギー検出された後で且つ前記音響エネルギーが選択された第１のしきい値時間期間を越える時間期間の間選択された第１のアテンションしきい値レベル以上である時に音響信号の始めと同一のものとみなすステップと、前記音響エネルギーが選択された終了信号しきい値レベル以下に落ちる時を検出するステップと、前記音響エネルギーが選択された終了信号しきい値レベル以下に落ちる時が検出された後でかつ前記音響エネルギーが選択された第２のしきい値時間期間を越える時間期間の間選択された第２のアテンションしきい値レベル以上てある時に音響信号の終りと同一のものとみなすステップとを含むことを特徴とする方法。
５５．音響エネルギーを検出するステップに続き、かつ前記音響エネルギーが選択された開始スピーチしきい値レベル以上でないときに、該方法はノイズを含む信号のために測定されている自己相関関数の値から予め選択された距離以上のユークリッド距離を正規化された自己相関関数が有する状態における他の開始信号しきい値レベル以上の音響エネルギーを検出するステップを含む請求の範囲５４項に記載された如き音響信号源の始めと終りを検出する方法。