JPS63500126A - 話者照合装置 - Google Patents

話者照合装置

Info

Publication number
JPS63500126A
JPS63500126A JP61503732A JP50373286A JPS63500126A JP S63500126 A JPS63500126 A JP S63500126A JP 61503732 A JP61503732 A JP 61503732A JP 50373286 A JP50373286 A JP 50373286A JP S63500126 A JPS63500126 A JP S63500126A
Authority
JP
Japan
Prior art keywords
value
acoustic signal
acoustic
signal source
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61503732A
Other languages
English (en)
Inventor
アバット,ヒューゼイン
デンカー,トーマス・エイ
エルマン,ジェフリー・エル
タオ,バートラム・ピー・エム
Original Assignee
エッコ・インダストリ−ズ・インコ−ポレ−テッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エッコ・インダストリ−ズ・インコ−ポレ−テッド filed Critical エッコ・インダストリ−ズ・インコ−ポレ−テッド
Publication of JPS63500126A publication Critical patent/JPS63500126A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 話者照合装置 発明の背景 この出願は1985年6月1日出願の米国特許継続出願第751.031号であ シ、この出願と同一の本出願人に譲渡されたものである。
この発明は話者検証装置に関し、特に音声入力に基づいて個人を識別する方法及 び装置に関する。
個人の識別をすることを必要とする場合が多数ある。このような場合には、保安 環境に対する物理的なアクセスの制御、データ入力またはデータ転送の検定、自 動テラー・マシンに対するアク毛ス制御、及びクレジット・カードの識別確定が 含まれる。音声による識別は、よシ便利で1、遠方に、例えば電話により伝送す ることができ、しかも信頼性があるので、これらの場合の何れにおいても代替装 置として優れている。
自動化された従来の話者検証装置は、その信頼性に限界からシ、多くの問題を拘 えているので、通常その適用が高い信頼性を必要としない分野に限定されていた 。
このような形式の装置は、連続したピンチ期間からピーク及び谷を選択して用い 、未知の話者の音声入力に関する特徴座標を得ている。これらの座標は前に記憶 した基準座標と選択的に比較される。比較の結果、未知の話者についての同一性 を判断する。このような装置の大きな欠点は、記憶した発声を比較する際に、受 信した発声の総合的な強度レベルの変化により問題が発生することがらるという 点にある。
この技術分野における他の問題は、個人が試験センテンスを発声する特徴方法を 、前に記憶した同一のセンテンスの発声と比較することである。この装置は試験 発声と記憶した基準発声とのスにクトル及び基本周波数の一致に基づいている。
その結果、この装置は話者の音声ピッチにおける変化によシ誤シが発生し易い。
また、話者の検証に利用されていた他の形式の構造は、各発声をろ波して、個人 を高度に表わすパラメータを得ているが、発声の定数から独立している。これは 、話者の声道の固有な特性に基づく線形予測分析によシ達成される。話者の声道 の特性を識別する信号を、話者の識別を表わし、かつ話者の物理的な特徴を表わ す一組の信号に変換するために、−組の基準計数信号が採用されている。
その装置において前記の線形予測・ξラメータを用いて未知の話者の仮想識別を 発生した後、識別した話者の物理的な特徴を表わす信号と比較することにより、 未知の話者の同一性を確認する。文献は、その装置において試験発声と基準発声 との間の歪みを比較することができる機構については説明していない。
その結果、発声分析の予備ステップに対して、話者検証の段階を実際に実行する ための明確な方法は示されていない。
いくらか異なる解決方法を採用した他の装置は、ユーザが発声した標準的なフレ ーズに対応する波形の瞬時的な不変量を用いた話者検証装置を備えている。即ち 、同一のユーザによる同一フレーズの独立発声数を用いて、発声ベクトルにそれ ぞれに対応する一組の瞬時的な不変量を編集する。次に、平均的な発声はクトル を計算する。平均的な発声ベクトルと後に得た発声ベクトルとを比較して、話者 の検証を得る。異なる年令および性の個人グループの瞬時的な不変量も記憶し、 またユーザーに対して同じような年令及び同性にあるグループ内の複数個人の不 変量グループも、記憶したユーザーの発声ベクトルと比較して重み付はベクトル を得る。ユーザーの重み付はベクトル及び計算した発声ベクトルをカードに記憶 し、濁値を計算する際及びユーザーの発声を後に評価する際に用いる。この装置 は、試験発声と参照番号発声との間の歪みを比較することができる機構について は何も述べていない。更に、平均発声ベクトルに対して新しい発声を比較するこ とに基づいての許可の信頼性には疑問がちる。これは、ユーザーの発声が種々な その特徴に大きな変動が見られるときに、特に疑問がある。例えば、話者が与え られた時間に単語を違えて話すときは、単純平均値はこのように変動する音声の 確認に柔軟性がない。
更に、関連する他の装置では、分類する試験単語と他の標本値との間の「距離; N値」及び「平均値」を計算し、「重み付は係数」を用いて特定の変数の重要性 を測定する。これらの部分が基準標本値の部分の最小距離内に入るときに、また 藏値外の試験単語の複数部分の比較により音声の検証ができることを除き、与え られたユーザーについて固定的な絢値を必要とする。
試験標本値の近傍に基準標本値がないときは、試験標本値が基ン1 準、ダ、値外にあるときに許可を得る手段がない。例えば単語を無意識に正しく 発音しなかったときは、ユーザーを検証することができない。
この技術における更に他の装置では、与えられた基準単語の基準化したテンプレ ートに複数の話者の音響的な特徴の平均値を記憶するものでるる。識別された話 者の発声に応答して、基準単語の特徴テンプレートによシ識別した話者の特徴の 対応性を表わす一組の信号を発生する。未知の話者の発声を、未知の話者の発声 特性、及び確認をした複数の単語について記憶したテンプレートと比較すること によシ分析する。更に、この装置は受信した音声の1標本値とその特定のユーザ ーの1n値とを比較するという問題もある。その結果、単語を発音する1回の試 行が装置に記憶している基準情報から大幅に異なっているときは、ユーザーは( 勾値の設定に従って検証を証明することができない。
多くの従来装置が有する他の問題は、音声の開始及び終了を検出する信頼性のる る制御可能な手段がないことである。これは、更に従来装置の信頼性を低下させ たり、音声の終了点の識別を目的とする精巧な構成により装置のコストを大幅に 増加させるものでちる。多くの従来装置では、このような検出をすることなく、 基準音声と検出が困難な終了点を有する受信音声とを信頼性のある比較をするこ とは、非常に困難である。
以上で述べた技術のような話者検証の技術における種々の問題に鑑み、話者検証 について装置の信頼性を高めることは、大きな技術上の進歩となる。更に、パラ メータを用いて与えられたユーザーの複数の試行及びユーザー自身の単語テンプ レートによる話者の比較に基づき、合否を評価する場合、かつ与えられたユーザ ーの情報がユーザー検証のために選択した囚値しくルに基づき氏名詐称証者を許 可する可能性を有する場合に、声道に固有な特性を反映する話者従属特性に基づ く強度変動からこのような装置がほぼ独立しているならば、これも重要な改善と なる。更に、これは、装置が合否前にユーザーから抽出する複数の標本値を得る ことができ、従って単語の発音における疑似的な又は偶発的な誤シがユーザーの 識別の妨げとならないならば、改善となる。更に、実行した多数の試験により検 証基準を定め、かつ検証at値の厳密性を変化させるkに監視員による調整又は 変更が容易であれば、これも改善となる。
識別の検証を実行する方法および装置を提供するものである。
特に、この発明は、ユーザー自身及び包括的な発声データの比較により、処理さ れるユーザーからの単語の標本値を有するデータ・ベースを最初に導出し、与え られた単語に基づく検証に関連して氏名詐称証者を誤って許可する確率手段を導 出する装置を提供するものである。生成された前記データ・ベースによシ、装置 は処理をし、複数の試行に基づき、かつ前記データ・ベースの情報に鑑み、話者 の識別を検証する。
話者は、検証目的用に装置を使用する前に登録されなければならない。装置は、 ユーザーを登録するために、充分な数の単語のトークン(トークンとは箪語の一 回の発声であシ、本明細書中「証拠」、「合言葉」として記載される。)を得て 、データ・ベースに記憶するまで、一連の基準単語のトークンのためにユーザー を繰シ返して促す。トークンを特徴分析に掛ること−によシ、話者の声道のある 係数情報が得られる。トークンは終了点検出器にも掛けられる。装置は、トーク ン間の比較によシ、かつ対応する通常の人間集団のトークンにより、氏名詐称証 者を誤って許可する確率、又は真の話者を拒否する確率の手段を得る。
登録したユーザーは、自己の音声を検証(確認)したいときは、自分が要求して いる識別を入力し、次に装置がユーザーに発声を促す。ユーザーの発声はディジ タル的に符号化されて分析される。開始点と終了点とが検出され、発声の特徴に 対応する係数が導出される。選択した単語についてユーザーが前に記録したトー クンから導出し、選択した係数を、新しく受信した発声の係数と比較して、新し い発声と各基準トークンとの間の距離の測定値を導出する。この処理全ユーザー の付加的な発声について反復する。登録中に導出した確率情報に対する1以上の 距離測定値を分析することによシ、装置は誤判定する確率を決定する。これらの 確率に基づいて、ユーザーを受付けるか、拒否するかの判断を以下の複数の段階 で行なう。段階毎に累積する確率を用いることKより、異なる単語に対する幾つ かの音声試行と関連して音声をダイナミックに評価する手段が得られるので、検 証判断は種々の単語のそれぞれについてのユーザーの実行に基づいておシ、氏名 詐称証者を誤って許可する可能性を低減させている。
この発明の一つの概要的な特徴は、初期の段階で次の段階に進むべきか否かの判 断を行なう段階で、検証判断(すなわち、確認)を行なうことであシ、次の段階 では検証判断を最初の段階で行なった分析と、次の段階で行なった分析とに基づ いていることである。
他の概要的な特徴は、記憶した音声情報から導出した確率データから得る少なく とも一つの確率値について検証判断をバイアスすることである。
他の概要的な特徴は、話者が既知の人物であると検証されたときにのみ、話者の 発声についての試験情報に基づき記憶情報を更新することにある。
他の概要的な特徴は、話者が既知の人物であると検証されたときに、装置(例え ば、ドアのロックのソレノイトリをトリガする非磁気的なパワー・スイッチであ る。
他の概要的な特徴は、符号化されたトーン信号を検出し、デコート9すること、 かつ同一のディジタル・プロセッサを用いて音声検証を実行することにある。
他の概要的な特徴は、分析を同時的に処理することができるように、異なるステ ーショ/から受信した異なる発声の分析を時分割ですることにある。
他の概要的な特徴は、発声を受信する複数のステーションと、それぞれのステー ションにサービスを行なう複数のプロセッサと、リアル・タイムでそれぞれのス テーションにサービスを行なうリアル・タイム処理装置を有するホスト・コンピ ュータとを組合せることにろる。
他の概要的な特徴は、以下で説明する好ましい実施例、及び請求の範囲から明ら かとなる。
第1図はこの発明に用いられる音声検証の方法の一般的な概要ブロック図である 。
第2図はこの発明の話者検証装置で用いられる装置の好ましい一実施例の詳細な ブロック図である。
第3図及び第4図はこの発明の話者検証装置の動作を説明するフローチャートで ある。
第5図はこの発明の音声検出装置の状態図である。
第6図から第8図はこの発明の話者検証装置の動作を説明するフローチャートで ある。
第9図は与えられた単語のトークンの比較を表わす全体的な歪みを得る方法のグ ラフ表示である。
第10図およυ第11図はこの発明の話者検証装置の動作を示すフローチャート でるる。
第12図はこの発明の動作で導出した歪みを編成するアレー゛D″の表である。
第13図はこの発明の動作において生成された単語側の5TATフアイルの表で ある。
第14図から第16図はこの発明の話者検証装置の動作を示すフローチャートで ある。
第17図はリアル・タイム処理装置を有するホスト・コンピュータがサービスを する多重アクセス・モジュール装置のブロック図である。
第18図はアクセス・モジュールのブロック図である。
第49図はアクセス・モジュール部分のブロック図である。
第20図はアクセス・モジュールにおけるリレ一式回路の回路図である。
第21図はリアル・タイム処理装置のメモリ配置テーブルのブロック図である。
第22図、第23図はリアル・タイム処理装置で用いられる種々のテーブルであ る。
第24図は検証処理のフローチャートである。
第25図、第26図は他の検証処理のフローチャートである。
第27図は他の検証処理で用いられるガウス関数を示す。
第1図を参照してこの発明を機能的に説明することができる。
この装置の動作は、装置を作動させるスイッチもしくは他の機械的な作動装置の 動作のような外部条件にょシ、ユーザーの存在を検出するフォトセンサのような 電子検出装置により、ユーザーの音声を検出する音声もしくは音響の付勢により 、またはこれ以外に「タッチ・トーン」信号を付勢させるような雑音を作成する によりブロック20から開始される。
付勢された装置は、ユーザーによシ、又は前の時点でオイレータによるシステム 処理のために予め選択されたものにょシ、要求されている処理を実行するように 機能する。この観点において、装置はブロック2oから判断ブロック22に進み 、受取った命令に基づいて全体を24で示す「登録」モードに入るか否かを判断 する。
登録モート9は特定のユーザーに関連する情報fc邑該ユーザーから獲得し、後 の時点でユーザーの識別を検証する際に用いる−ために処理し、かつ記憶する処 理を行なう。この情報には、データ・ベースを形成するように処理され、ユーザ ーが選択した基準単語を発声したもの(即ちトークン)が含まれており、このデ ータ・ベースを次のユーザー検証において比較用に用いる。
従って、個人が検証用に装置を使用可能となる前に、彼または彼女は処理の登録 モードにおける登録処理を経る必要がある。
装置が登録モードに進むように命令されたときは、装置は判断ブロック22から ブロック26に進み、オにレータは装置にユーザー名前、ユーザーが通過しても よいアクセス点、及びユーザー検証において偽許可及び偽拒絶誤シに対する最大 許容レベルを含む情報をキー・インする。アクセス点及び最大許容レベルが指定 されなかったときは、デフオールド値を用いる。
装置はブロック26からブロック28に進み、ユーザーを促してユーザーが記録 すべき基準単語のリストのうちの一つを発声させる。このような発声によって、 パターンがユーザーの識別を表わしている音響的なメツセージを得る、即ち通信 をする。
装置は、ユーザーを促した後、ブロック3oに進み、受信信号を標本化すなわち 、正規化する。装置は発声を検出すると、ブロック32に進み、検出した発声を ディジタル形式に変換する。
装置は、ブロック22からブロック34に進み、受信信号を周期的に標本化し、 各期間は標本値を形成する。この標本値には特定の期間中に検出した音声を表わ す信号が含まれている。
標本値は、指定された標本数がフレームを形成するまで記憶され、次いでこのフ レームを処理することにより、フレームを表わす自己相関関数、正規化自己相関 関数、及び線形予測係数を得る。各トークンから抽出した一組の係数(「テンプ レート」と言う)は、以下で説明する検証処理で用いられる。この線形予測係数 は話者の声道特性を表わすものである。
装置は、ブロック34からブロック36に進み、ブロック34で抽出した特徴を 用い、発声の開始点及び終了点を検出する。
受信信号のエネルギ及びスRクトル・レベルに基づいてこの終了点を検出するた めに、状態機械が用いられる。抽出された特徴及び終了点を一時記憶メモリ38 に記憶した後、ブロック36から判断ブロック40に進む。
それぞれ選択した各単語について指定トークン数を未だ得ているときは、ブロッ ク40はブロック28に戻り、他の発声をするようにユーザーを促し、以上説明 した処理を続ける。ブロック40において、必要なトークンを得たと判断したと きは、装置はブロック42に進み、命令を受取ってデータ・ベースを形成する時 点まで、ループして待機する。
装置は、データ・ベースを形成するように命令されると、ブロック42からブロ ック44に進み、全体的な歪み値が形成され、ブロック38から抽出した特徴を アクセスし、与えられた基準単語のそれぞれのテンプレートと自己のものとの間 で比較すると共に、これらの特徴を一般的な話者グループの対応するトークンに 対しても比較する。これらの比較の結果、−組の全体的な歪みが得られ、各歪み は対応する2つのテンプレート間。
の距離値を表わすものである。
装置は、ブロック44からブロック44に進み、対応する同一ノ話者のテンプレ ートについての話者間比較、及びユーザーのテアプレートと全体的なテンプレー トとの話者間比較について全体的な歪みを処理し、選択した1ん値レイルに従っ て氏名詐称証者の偽許可の確率を示すアレーに整理する。テンプレート及び対応 する因値を基準テンプレート・ブロック47に記憶し、ブロック47に記憶され たテンプレート及び成値に関連するユーザーの識別をブロック48に記憶する。
装置は、全てのテンプレートを形成し、1開値を計算した後、ブロック46から ブロック49に進み、以下、登録モードの処°理を終了する。
装置が判断ブロック22において登録モードに入るように命令されていないとき は、装置はブロック50に進み、全体的を53で示す検証モードに装置は入るか 否かを判断する。アクセス点にユーザーが存在するときは、この検証処理が開始 される。
装置は、検証モードに入るように命令されたときは、ブロック52に進み、ユー ザーによる付勢を待機する。ユーザーは、限定的ではないが、キー−・パッドに 個人的な識別番号を入力すること、読取装置にプラスチック・カードを挿入する こと、又はマイクロフォンにその者の名前を言うことを含む幾つかの方法で装置 を付勢することができる。装置は、ブロック52においてこのユーザーのデータ を受信すると、ブロック54に進み、メッセー:)全送出してユーザーが登録モ ードで前に記憶した基準単語のうちの一つである発声の入力を要求する。
装置は、ブロック54から音声を表わす電子信号の受信を検出するブロック56 に進む。装置は、音声を検出すると、ブロック58に進み、電子信号全ディジタ ル的に符号化して、予め選択した期間で検出された受信音声を表わす8ビツトの ワードに形成し、これを以下、「フレーム」と呼ぶ。
次に、装置はブロック60に進み、各フレームラ処理し、その線形予測係数パラ メータ(以下、LPCパラメータと呼ぶ)を得る。LPCパラメータの導出には 、先ずフレーム内において近傍の音声標本値間の統計的な依存の程度を計る自己 相関係数の計算が含まれる。典型的なものとして、各フレームには100カら3 00の音声標本値が含まれ、自己相関係数は種々のこれらの標本値間の関係を表 わしている。
自己相関係数は「レビンソンのアルゴリズム」と呼ばれる周知のアルゴリズムを 用いることにより処理され、フレームを表わす係数グループを導出する。これら の自己相関係数は線形予測係数を含み、話者の声道の形状を表わしている。これ らの自己相関係数は処理によシ、この変換係数によって音声のフレームを表わす 線形予測係数グループを表わす一つの変換係数に変換される。この情報は以後で 使用するために記憶される。
以上で説明した変換係数の導出処理は、発声が終了するまで、発声のセグメント について続けられる。従ってブロック62において、装置は発声の終了点を検出 して、当該発声に対応する変換係数グループを含むテンプレートを形成する。従 って、このテンプレートによって発声を表わすものとなる。
装置は、このブロック62か′らブロック64に進み、発声のテンプレートはダ イナミック・プログラム分析によシ、特定の発声に対応する基準テンプレートに 比較される。比較用の基準テンプレートは基準テンプレート・メモリ66から抽 出され、基準テンプレート・メモリ66は、一般的な話者グループを表わす対応 の単語テンプレートと共に、登録処理中に個々のユーザーが生成したこれらのテ ンプレートを記憶している。ブロック66において参照される特定のテンプレー トは、識別メモリ68からの信号によシ識別される。この信号は、ブロック66 においてブロック52で入力したユーザーの識別に基づき、かつブロック54に おいて識別され、促されて特定の単語によシ、特定の基準テンプレートを選択す るものである。
ブロック64において生成された距離比較、即ち「歪み」は、それぞれその発声 の差である一組の値であり、その特定のユーザーの基準テンプレートのうちの一 つに対する比較によシ試験される。次いで、これらの差の値を処理して現在発声 と基準発声との間の相対的な対応性を示す「スコア」を得る。
次に、装置は判断ブロック70に進み、ブロック72から適当な底値を参照して 許可するか、拒絶するか、未だ決定していないかを判断する。ブロック72の自 信はオにレータにより設定することができるが、オペレータによりセットされな かったときは、デフオールド値すなわち、default valuesにセッ トされる。これらのH5,値はエネーブル・モードにおける比較結果に基づく一 組の「スコア」を有し、氏名詐称証者が受信した選択試験発声を誤って受付ける 確率を表わしている。
ブロック70では、ブロック64のスコアをブロック72のり値と比較する。ス コアが1句値以下であったとき、及びユーザーが少なくとも2つの試験単語を発 声したときは、その者は許可され、装置はブロック74に進み、以後検証モード すなわち、確認モードの処理を終結する信号を発生する。スコアが囚値以下であ っても、ユーザーが少なくとも2つの標本値を得ることができなかったときは、 装置はブロック54に戻シ、ここでユーザーを促して登録処理で得た他の基準単 語に対応する発声を得る。
ブロック70において、ユーザーがブロック72における面位以上のスコアを得 たときは、失敗とする。2回未満の失敗のときは、装置はブロック54に進み、 ユーザーの他の基準単語すなわち基準ワードについてユーザーを促す。ユーザー が2回とも失敗したときは、装置はブロック70からブロック74に進み、その ユーザーを氏名詐称証者として拒否する。装置は、ブロック74かうその個人の 不照合に基づいて以後の処理を禁止する信号を発生する。
検証を得ること、または拒否することに対する以上の試行または失敗の数の以上 の例は、例示目的のみのもので1、これらのパラメータをオはレータの所望によ シ変更してもよい。この実施例においては、それぞれ新しい試験単語によシ、許 可及び拒否の成値が固定されたままである。しかし、選択により、更に多くの発 声試行を行なう時間に変更するためのブロック64の合成スコアにおける変化に 比例させて、1気値を変更することは可能性で多る。
第17図を参照すると、装置110においてIBM、e−ソナル・コンビーータ 112 (XTまたはこれと同等のもの)にリアル・タイム処理装置114が備 えられておシ、バス116を介して44の検証ボード(SVB)118に接続さ れ、リアル・タイムのサービスを行なっている。各SVBは多重処理形式により 2つのステーション102にサービスを行なうことができる。ステーションのう ちの一つであるステーション103は登録処理に割p付げられ、登録ステーショ ンと呼ばれる。
この発明の装置はインタラブド・プロトコル後に同期的な方法、または直接メモ リ・アクセス(DMA)方法によυホスト・コンビーータのバスを介して動作す るように設計されている。
実質的にどのような基準によってもホスト・インターフェースをプログラムする ことができるが、ここに關示した実施例はホストとしてIBM、PC/TXを使 用することを仮定している。。
従って、ホストは、商業的な市場で現存する周知のより/Mパーソナル、コンビ ーータのうちの多くのものから選択可能なものでおって、僅かな修正を必要とす るだけで実質的に如何なるコンピュータ・バスのインタフェースも行なう。こけ ホストは、ユーザーのために以上で述べた基準テンプレートを収集して記憶する こと、基準テンプレートについての統計的な情報全計算し、更新し、記憶するこ と、及び幾つかの検証作業を実行することができる。第17図に示した装置の物 理的な構成は、バス116及びSVB 118をホスト・コンピュータの内部に 収容するとともに、ステーション102をホストの外部に設けるようにしたもの である。
第18図を参照すると、各ステーション590は16キーのタッチ・トーン・バ ッド592と、マイクロフォン594と、表示ランフ596とを備えている。ス テーション590はマルチプレクサ602及び双方向3線式信号線598を介し て5BV600に接続されている。
第19図を参照すると、決して同時ではないが、登録及び検証中の種々の時点で 、ユーザーは、(例えば、検証中に自己を識別するために)タッチ・トーン・キ ーを押し、(例えば、基準単語を話すために)マイクロフォンに向って話す。タ ッチ・トーン・キーを押すと、DTFM)−ン発生器604は基準DTFM信号 ベアのうちの一つを発生し、これを信号合成器606を介して線598に転送し てSVB 118に送出する。マイクロフォンは話すことによシ音声信号を発生 し、これを信号合成器606を介して線598に転送する。
SBVにおいて、5D106 (以下で説明する)は音声信号を受取シ、アナロ グ・ディジタル変換器(A/C)608を介して転送する。ディジタル化した標 本値は5D106からSP 122(以下で説明する)に転送され、ここでフレ ームに編成され、各フレームについて線形予測係数を導出する。付勢を表わす信 号が(第5図の状態機械によシ)検出されると、CP 110 (以下で説明す る)は次の受信フレームを分析して音声即ちトーン信号を受信したか否かを判断 する。トーン信号を検出すると、通常のフーリエ分析を実行してどのキーを押し たのかを判断する。しかし、音声信号を受信すると、以下に説明するようにこ− 1れらの音声信号を処理する。従って、DTFM信号の復号処理には音声信号の 処理に必要とする同一のハードウェア及びソフトウェアが用いられる。
第20図を参照すると、ステーション590内において(例えば、ドア・ロック ・ソレノイドを作動させるための)、固体回路リレー610が電源612(電源 装置)に接続されている。電源612は12ボルト又は24ボルトのAC又はD C(パルス化したDC)を供給することができ、スイッチによシ選択可能になっ ている。リレー610は(点線内に)ディオニックス(Dio−nics) D IG −12−08−45オプト・カップラー616の光源に電力を供給する「 オープン」 −コレクタの非反転バッファ614を備えている(オプト・カップ ラー内に備えられている光源は近赤外線スペクトルによシ光を発光するガリウム ・アルミニウム砒素型の発光ダイオ−)(LED)で°らる。)ドア開放信号6 18は、特殊な波形のものであシ、線598を介して送出され、カウンタ620 をリセットする。カウンタ620は内蔵rア受坐発振器622のクロック信号に よシ駆動されている。第2のカウンタ624は、種々のドア受坐の「オン」時間 (2秒〜50秒)についてスイッチにより選択可能(スイッチ625)である。
カウンタ624の出力はゲート628に接続されており、ゲート628はジャン パ630によシ選択する「通常オフ」または「通常オン」のドア受坐電力を供給 する。ゲート628の出力は直接、固体回路リレー610の状態を制御する。
光学的に結合された(電気的に絶縁した)リレーの理由には2つめる。その第1 ″はリレー610の電力MO3FET、即ちそれらの入力駆動がシステム接地を 参照することを防止することであり、その第2は装置のロジックを雑音及びその 高い電圧(1500ボルト)のトランジェントから絶縁することである。
オプト・カップラー616の出力は、非常に低抵抗のビレイン・ソース(Rオン として知られている最大0.085オーム)によシ特徴付けられる2つの電力M O3FET632,634 (モトローラMTP25No6tたはインターナシ ョナル・レフティファイア社IRF−541)’を駆動する。全ての電力MO3 FETは動作電圧の通常極性から逆方向に接続された複合ダイオード、ドレイン ・ソースを有する。このダイオ−rはACまたはDC動作が可能なリレー610 の動作において重要な働きをしている。一方の極性では、電流が左側の電力MO SFETのバルク及び右側の電力MO3FETのダイオードを介して流れる。極 性が反転すると、電流の流れも反転する。非機械的な接点と異なり、電力MO8 FETの接触抵抗は容易に経年変化をしないので、電力MO8FETはかなり信 頼性がある。またこれらの電力MO3FETは湿度によシ影響されず、デバイス 「オン」に切換えるために非常な低電流(<1oOX10 アンヘア)を必要と するだけである(従って、ターン・オンに非常に低電力の電圧源を用いることが できる)。素子634はゼネラル・エレクトリックから購入可能なV47ZA7 であシ、トランジェント制限及び保護に用いられる。
第2図に示すシステムはリアルタイムで同時に別々のステーションに居る2人の ユーザーをノ・ンドリングするために2個の検証チャンネルを多重タスクするこ とができる。更に、前記システムは16個の別のユーザーステーション102ま で支援するように構成されている。SD 106は、データシステムを構成する ためのその他の周知の従来の論理エレメントに加えて制御のためのMMIからの PAL20RA10CNSプログラム可能論理アレイを含むエレメントから構成 される装置SD 106はステーション102かもアナログ信号全受取り、その 信号を多重化して16からなる組のチャンネルから2個のチャンネルを選択する 。次いで2個のチャンネルがその入力側と出力側の双方においてPCMP遇され 、]25から150ミリ秒毎にサンプリングされる。SD 106は、前記ザン プル全稈るよう相互に接続されているそれ自体のクロック108により励振され る。5D106は制御プロセッササブシステム(cp)110に電気的に接続さ れ、クロック108によシセノトされるサンプル変換時間毎にCplloに着l 込む。この間、Cplloは5D106から双方のチャンネルに対して一連の読 取シおよび書込み演算を行なうことができる。その他のときにはcpH。
は読取シ、あるいは書込みのための5D106に対する有効アクセス全稈ること ができない。
Cplloは10MHzのM068000 マイクロプロセッサ112゜メモリ 114および入力/出力およびメモリアクセスのための各種の制御信号を発生さ せるための論理116とを含む。Cplloは、上位コンビーータとの通信およ び調整を含み、当該システムにおけるその他の全ての機能との通信および調整を 行う。Cplloは信号処理タスクを行うことができるものの、主としてデータ 管理手段として機能する。このように、011)110は当該システムの各部分 を直接制御したシ、アクセスすることができ、また上位インターフェースユニッ ト(HIU)118を介して記号化したデータの形態で上位コンビーータと通信 もできる。
0p110はまた中央データバッファ(CDB)120とも電気的に接続されて いる。該バッファは高速の4KX16の乱アクセスメモリデータバッファであっ て、これを介して、プロセッサ間の大多数のデータやメッセー:)全迅速、かつ 効率よく通すことができる。バッファはlNMOSによシ製造されている、例え ば4個の1MS1421S−50RAm装置(4X4096)によ多構成しうる 。演算の検証モードの場合、cp120はプロセッサ間の唯一のデータ源である 。この種の唯一の別のデータ通路はcp 110 トHIU 118 トノ間( 7)df−トチ6ル。CDB120は、Cpllo用、HIU118用および信 号処理サブシステム(Sp)122用のデータボートを含む。またCDB120 はcplloとのメモリをマツプした入力/出力通信のためのアト9レスポート も含む。直接メモリアクセスするために、CDBに対して高速に順に自動増分ア クセスできる12ビツトのカウンタ124がある。4KX16のメモリは5p1 22とHIU118とによシアクセスされるが、後者の場合は単にバイトの幅で アクセスされる。HIU118は126で示すラインにおいて信号を提供するが 、該ラインにCDB120が適正モート9で位置されると2バイト毎に自動増分 できる。しかしながら効率を最大とするためCplloに対してはワードあるい はバイトの幅の何れかでアクセスが行われる。
cplloの景重要機能の1つはCDB120の割付けを管理することである。
この点についそ、かつ効率を最大とするためにCDB 120はメモリをマツプ させてCplloとインタフェースするよう構成されていた。しかしながら5p 122とHIU118とは、CDB=i入力/出力装置と見做し、かつ直接的に メモリにアクセスすることによう達成されうるものと見做している。
殆んどのプロセッサ間の通信はCDB120’e用いる必要があるので、検証モ ート9に坩るシステムの時間の多くが当該システムのこのエレメントにおいて使 われる。それにも拘わらず、ノ・−ドワイヤによる優先システムは何らないので 何れのプロセッサもCDB 120に対していつでもアクセスできる。
CDB120に対するアクセスは、CDB120のリクエストがCI)110に よってまず許可される程度までCplloによって厳密に制御される。プロトコ ルはリクエストしているプロセンサによりCplloへの割込みを開始する。次 いでcpはCDB120120が使用されていなければ、割込みが要求元へ戻さ れ、その場合要求元はCpがCDBバスの所有を指示したことを推察できる。
Cplloによっては特定の4−トが何ら使用可能とされず、その代りにCDB 120のプロセッサがそれ自体の制御信号を用いてこの作業を実行する。このス キームはハードウェアを保存しているにも拘わらず、何れのプロセッサも前述の ようにいつでもCDBにアクセスし得ることを意味している。このため、cp  100はCDB120に対してリクエストの待ち行列を制御する必要がある。
5p122はその他のプロセッサの何れとも直接的な通信yl −トを有してい ないため、この目的に対してCDB120を使用する必要がある。また、HIU 118は、それとCplloとの間にボートがるるもののCDB 120に介し てメツセージおよび/またはデータを保存および検索することができる。この通 信システムを提供するために、各プロセッサは予め指定したメモリのウィンドウ を有する必要が、1、そのウィンドウの1つは他のプロセッサに知られている。
従って、CD8120t−何らか所有することによシメモリの適当なウィンドウ に単にアクセスすることにより何れかのプロセッサから何れかのプロセッサへデ ータを通すことができる。
また、cplloは、16/32ビツトのTMS32010信号処理プロセッサ である5p122にも接続されている。また、5p122は、例えばMM工63 81のような754 ns速度の8 X 1024ビツトの2個のpRomsの ようなエレメントによシ提供されるSpマイクロコード用のメモリ記憶装置を含 む。とのサブシステムは入力/出力復号化、Cplloとの通信およびCDB1 20へのデータ経路のためのランダム論理を含む。8p122は1秒当シ500 万回の演算速度で算術計算を行うので、ヘビイナンバーのハンドリングタスクの 全てに対して使用される。cplloはライン128上で特殊信号を送ることに よfisp122でタスクを開始し、該信号は5p122が、Cpによ、9CD Bに書込まれた命令により指定される個所まで分岐させる。
5p122は検証モードにおいて、未記号化のベクトル位置を含む命令の予め記 憶したライブラリヲ有し、それをaplioが呼出して各種のタスクを行う。従 ってSpH2は、そのタスクがCplloによシ開始される従属システムである 。また、選定されたタスクの持続時間全体に対してCplloがCDB120t sp122に割当てることが可能で、その場合CDB120はSp122用の専 用の記憶媒体となる。
HIU 118は上位プロセッサ(図示せず)とCpIIOとの間ならびにCD B120との間のインタフェースとして機能する。
全ての信号のインタフェースはHItJ118により緩衝され、HIU118は 互換性の要求に対応するよう上位プロセッサからの調時および制御信号を調整す る。例えば、第2図に示す調時システムと上位プロセッサの調時システムとの間 の非互換性は、HIIJ118の内部に来るプログラム可能アレイ調理装置(P AL)(図示せず)が埋合せる。
上位プロセッサからの何れのデータ転送もCpIIOに対する割込みの形でまず リクエストされる必要がある。割込みベクトルはcp上位プロセッサのデータポ ートか、あるいは前述のようにCDBのメツセージウィンドつからの何れから読 取ることができる。しかしながら、システムによるアクセスの前に上位プロセッ サはシステムのアビレスを知っておく必要がある。ば−スアドレスが、単にアド レスコンパレータでらるHIU118の入力選択装置に設置されている。各シス テムのベースアドレスはスイッチを介してユーザがプログラム可能であって、処 理能力を高めるために使用するマルチシステムを上位プロセッサに提供する。こ のように、単により多くの河路盤を上位プロセッサのバスに設置することによシ 検証モードで使用するよう64個までのステージ目ン102を提供することがで きる。
5p122とHIU118とは遍在リセットおよび多相クロックゼネレータ(R CG)130とに接続されておシ、該ゼネレータは全体システムに対して全ての りセクトおよびクロック信号を提供する。第2図においてブロック線図で示す各 種のエレメントは当該技術分野の専門家に周知の多数の方法の何れかによりそれ ぞれ構成しうろことが認められる。
方法 当該システムがその目的を達成するための方法を第3図から第16図までを参照 して詳細に説明する。特に、第3図は第1図の24で全体的に示す登録モードを 示す。
第3図全参照すれば、システムが一部ブロック150の登録モードまで進むと、 システムはブロック152においてユーザの名前;ユーザが通過しうるアクセス ポイントおよびユーザが間違って受入れたシ、かつ拒否するのに対して最大許容 しうるベルを得るよう演算を開始する。何ら値が特定されなければ、必要に応じ て省略時の値が提供される。ステップ152において、システムはまた、ユーザ が記録すべき基準ワードのリストを検索し、参考のためにそれら全記憶する。説 明のために、10個の基準ワードの使用について本明細書で説明する。しかしな がら、当該システムの機能や構造を変えることなく希望する何れの数の基準ワー ドも選択しうろことが認められる。多数の種々の基準ワードヲ用いることによシ 、特定のユーザの誤って受入れる可能性の最も少ないワードを識別することが可 能である。
使用される基準ワードの数が増えるにつれて、誤る可能性の最も少ないワードヲ 入手する能力が向上する。このように、登録モードは当該システムの演算におけ る後の検証演算部分において用いうる一組のデータを特定のユーザから発生させ るべく機能する。
ブロック152から、システムはブロック154へ進み、そこで情報に一時的な 識別番号が割当てられて、システムはステップ156へ進む。
ブロック156は、すでに集められている10個の基準ワードのトークンの数に 関する決定ブロックである。選定した数の10個のワードの各々のトークン(あ るいは発声)がなされなかったとすれば、上位プロセッサはステップ158へ進 み、督促命令を発生させてユーザから新しいワー)#ヲリクエストする。説明の ために、各基準ワードに対して4個のトークンを使用することについて本明細書 で記載している。当然、本発明の方法や装置を正しく作動させるために、概ね何 れの数のトークンを用いてもよいことが認められる。
督促命令に応答して、第2図のCp 110は5D106を介して、入力/出力 ライン104を通してステーション102と連通ずる信号を発生させることによ りスピーカ、あるいはその他の可聴あるいは可視通信手段によシューザはそのた めのトークンを記憶させるべき、10個の基準ワードの中の1個全発声するよう 促される。ステージyy102におけるマイクロフォンがユーザからの基準ワー ドの発声を受取シ、それをライン104と5D106とを介してステーション1 02からcplloへ連通させ、cplloにおいて後述のようにさらに処理さ れる。
まで進み、そこでシステムが、「登録」ルーチンを呼出すことにより送入されて くるスピーチに対して自動相関係数(r係数)を発生させるよう指示する。登録 ルーチンについては第4図全参照して更に詳しく以下説明する。システムはr係 数を発生するにつれて、これらの係数を検査してシステムに送入されるスピーチ があるか否か検出する。督促信号に続く予めセットした時間内にスピーチが何ら 介在していないとすれば、上位プロセッサは不具合のあったことを検出してブロ ック162へ進む。督促信号に続いてシステムがスピーチを検出しなかった回数 が所定の限界回数を上廻ると、プロセッサはブロック164まテ進み、ユーザを 登録するためのそれ以上の試みは中止する。他方、不具合の回数が限界値金上廻 らなげれば、プロセッサはブロック158へ戻シ、再びユーザに発声を入力する よう促す。
ブロック160においてスピーチが検出されるとすれば、上位プロセッサはブロ ック166まで進み、r係数を変形された直線の予測係数(aa係数)へ変換し 始める。前記予測係数は検出された発声とユーザの発声気管の形状とを相関させ る0この変換は第4図に関して説明する登録ルーチンの一部として実行される。
aa係数が発生した後上位プロセッサはブロック168まで進み、自動相関係数 と変形された直線予測係数とを将来の使用に備えてアレイに記憶させる。次いで プロセッサはブロック170まで進み、かつワードとトークンとのカウンタを増 分させて、また4個のトークンがユーザから受取られていないとすれば現在のワ ードの次のトークンを、4個のトークンが受取られずみであれば次のワードを識 別する。前述のように、トークンの数はプログラム可能でアわ、かつ使用前に操 作者が選択する。プシステムがそのリストにあるワードの各々に対して4個のド ブロック169マで進み、使用可能モードから記憶された情報を処理して検証モ ードでのシステムの後での演算に必要なデータを発生させる必要のあることを示 すフラッグをセットする。このフラッグをセットすると、システムはブロック1 71へ進み、そこで演算の登録モードから出て、第1図の開始ブロックへ戻り別 の指令を待つ。10個のワードの各々の4個のトークンが受取られなかったとす れば、システムはブロック156からブロック158へと進み、前述のように演 算する。
第4図を参照すれば、第3図のブロック160において上位プロセッサにより行 われる登録ルーチンを説明することができる。
第4図の登録モー)”160へ入ると、システムはブロック172へ進み、そこ でシステムは第2図のcpiioのMo 68000マイクロプロセツサが、毎 秒約8000個のサンプルの採集速度においてSD 106から受取られたアナ ログ発声信号を計数化する。
サンプルフレームが形成され、cp 110のメモリ114に割当てられたバッ ファに記憶される。C0DECの割込みハンドうに制御が移ればいつでもサンプ ルの各々が8ビット幅のm −law記号化ワードとしてSD 106の符号器 /復号器(CODEC)チップから読出される。
cpメモリ114のバッファが一部1フレーム分のサンプルで充満されると、シ ステムはブロック174まで進み、バッファからサンプル1cDB120ヘコピ イする。サンプルを構成する8ビツトコードのワードの各々は分解されて16ビ ノトのサンプルをつくる。この分解は、速度に対してテーブル駆動方法を用いた フライによシ行われる。mm−1aコンパンジヨン使用は当該技術分野において 周知である。この主題に関する包括的な説明はテキサスインストルメンツ社(T exas Instruments ) (1984)扁5IIIRAOOIに よる[デジタル信号処理応用報告: TMS 32010用(D コンA7デイ ング、n、−f7J (” Digital、 Signal Process −1ngApp1j、cation Report : Companding  Routines for theTmS 32010”)に提供されている 。この文書は参考のため本明細書に含めである。
ブロック174からシステムはブロック176まで進み、現在のフレームプラス 前のフレームの後半分を含むフレームを形成し、オーバラップ分析ができるよう にしてプレエンファシスを達成する。以下のようにフォーマットの入力サンプル に適用される一次有限インパルスレスポンスフィルタを用いることにょシサンプ ルはプレエンファシスサレル。
y(n)=x(n)−−94X(n−1) (1)nはサンプルのインデックス 番号に等しく、Xはプレエンファシス前のサンプルに等しく、yはプレエンファ シスの後のサンプルに等しい。プレエンファシスは高周波数を強調したシ且っス ピーカとマイクロフォンとの間の開放空間に対するスピーカすなわち話し手の唇 からの音声変移によう発生する低周波数の強調を消去したりするために拘われる 。
一旦プレニンシアシスが行われると、正常化されていない自動相関が以下のよう に計算される。
R(1)= Σ (s(j)Xs(j+1)) (2)j −。
1=0.・・・・・・P; sはサンプルのプレエンファシス値でIll、Lは分析フレームサイズであシ、 pは自動相関順序である。
式(2)からの正常化されていない自動相関は以下の関係式にょシ正常化された 相関へ変換される。
r(1)=R(土)/R(0) (3)1=1.・・・・・・p。
R(o)相関は「エネルギー」と称せられ、後述するように発声の始まりと終シ とを検出するためにシステムが用いる量である。
エネルギR(0)の項と共に等式(3)からの正常化した自動相関(r係数)は 5p122が計算を終了すれば直ちにcp 110に戻される。
ブロック176からシステムはブロック178へ進み、そこで直線予測係数(L p)を展開させる。詳しくは、CI) 110 HCDB120からr係数のコ ピイを検索してap122e開始させLp係数を展開する。この達成のために採 用した再帰的方法はレビンンンのアルゴリズム(Levinson ’ s A lgorithm)として当該技術分野において周知である。このアルゴリズム についてはニューヨークのスプリングフェアラーグ社(1976年版)のジェイ 、ディ、マーケルおよびエイ、エッチ、グレイの[スピーチの直線的予測J ( J、 D、 market and A、 H,Gray、” Linear  Pre−dicMo、n of 5peech″、 Springer −Ve rlag、 New York、 (1976) )に詳しく述べられている。
このテキストを参考のため本明細書に含めである。
レビンソンのアルゴリズムは以下の関係に基づく再帰的方法によシー組のフィル タ係数を提供する。
1=O1・・・・・・n、a 。(1) == 1はOでない全ての1に対する もの、a−、(0)=QはOでない全ての1に対するもの;およびeO=1であ る・ p次元のLpc分析においては算式(4) −(6)に記載のレビンンンのアル ゴリズムは、Lp係数から構成される1組のフィルタ係数a(i)、i=o、・ ・・・・・pf提供する。このp次元分析において、nの値は1からpまでの範 囲でる)、a(1)はnの各値に対して1=0.・・・・・・pの各値に対して 計算される。
ブロック178からシステムはブロック180まで進み、cp係数をaa係数に 変形する。この変形を達成する方法は以下の通aa(j) = 2 X Σ a ri) x a (i+j)、:のi形u検証モードにおいて発声比較演算速度 を速めるために行われる。
aa係数は、いわゆる残留エネルギ(an)の2進ロガリズムと共に、sp 1 22が変形を完了した際CDB 120に残される。
一旦フレームが分析され、その正常化された自動相関、エネ/l/キRI:O) 、 aa係数および残留エネルギenのロゴリズムカ抽出されると、システムは 決定ブロック182まで進む。プロ、り182において、Cplloは抽出され たデータをステートマシンへ送入し、フレームが記録された間ユーザがステーシ ョン102のマイクロフォンに向かって話していたか否か検出する。このステー トマシンについては第5図を参照して以下詳細に説明する。
スピーチ検出器がスピーチが何ら行われていないと判定すると、システムはブロ ック184へ進み、スピーチ検出器のステートマシンが出口状態にあるか否か検 出する。出口状態であるとすれば、スピーチが完了している全示し、システムは ブロック186まで進み、第4図に示すアルゴリズムの演算を停止し、次いで第 3図のブロック160へ戻る。システムがブロック184にある間にステートマ シンが出口状態にないとすれば、システムはブロック172へ戻シ、前述のよう に処理するため次のスピーチサンプルを獲得する。
スピーチ検出器がシステムが決定ブロック182にある間現在のところスピーチ が行われていることを示せば、システムはブロック188まで進み、システムが 登録モードにあるが否か検出する。システムが登録モードにあるとすれば、シス テムはズ0ツク190まで進み、第2図のメモリ114にaa係数を記憶する。
システムが登録モードにないとすれば、ブロック188がらプロ、り192まで 進み、正常化すなわち正規化された自動相関係数と、レビンンンのアルゴリズム からの残留エネルギとをメモリ114に記憶する。ブロックr90または192 の何れかからシステムはブロック172に戻シ、前述のように連続的に機ユーザ からの有効スピーチの最後のフレームが見出されると直ちに、これまで抽出され てきたパラメータセットの全てがメモリ114からCDB 120ヘコピイされ る。次いで上位プロセッサがCplloによシ割込まれ、完全な発声に対する・ ξラメータがCDB 120へ送られつつあることを示す。次いで上位プロセッ サはCDB 120からのパラメータを読取シ、最終的にその結果をその大容量 記憶装置に記憶させる。
第5図全参照して、スピーチの始まシと終シ点とを検出するために使用されるス テート線図を説明できる。新しいフレームに対する自動相関ならびにエネルギが 入力信号から送られると常に、第5図に示す状態を有する有限ステートマシンが 使用されて前記のパラメニタからスピーチが有効か、あるいはスピーチのある状 態と無い状態の変移状態のどの状態にシステムが入っているか検出する。
ステート線図は、初期および最終の状態であるサイレンスステート200t−含 む。この状態においては、マシンは発声の始まりを検出するよう待機し、発声の 終りが検出された後復帰する。
発声の開始が検出されると、ステートマシンはサイレンスステート200からア テンションステート202まで進む。詳しくは、マシンは検出された信号のエネ ルギがある上限レイル以上となるか、あるいはある下限レベルを下廻るかすれば アテンションステートへ進み、正常化されたすなわち、正規化された自動相関機 能(r)は、マシンがノイズを測定した自動相関機能<r)の値からの予め選定 した限界距離r1以上であるユークリッド距離を有する。このノイズの自動相関 機能はサイレンスステート200においてマシンにに 再帰的に更新される。
検出されたエネルギがシステムをサイレンスステート1離すないようにするに十 分高い場合、かつマシンがアテンションステート202で3回サイクル分を費し た場合マシンはサイレンスステート202からスピーチステート204まで進む 。
一旦スピーチステート204にあると、スピーチは検出されたエネルギが「スピ ーチの終り」の限界以下に低下し、発生の終りが検出されたことを示すまでそこ に留っている。その時点でマシンは出口ステート206へ進む。出口ステート2 06カラ、もし検出されたエネルギが5回のサイクルの後下限を1廻るに十分な 程高くないとすればサイレンスステートへ進む。もし十分高い値のエネルギア: 検出されるとすればマシンは出口ステート206から再開ステート208まで進 み、該再開ステートは、エネルギが出口ステート206へ戻るに十分高くなく、 且つマシンが再開ステー)282.3サイクル分費したとき、アテンションステ ートと同様にマシンをスピーチステート204へ戻すよう機能する。
またスピーチ検出オートマトンは本発明による減衰システムを制御することが注 目される。このようにステートがサイレンスステートとなればいつでも、減衰器 レジスタが変更されてノイズ音する一定しくルに保持する。一旦ステートマシン がサイレンスステート1離れると、減衰は一定に保持される。現在好適な一実施 例においては、スピーチ検出マシンはソフトウェアを含む。もつともハードウェ アの実施例は当該技術分野の専門家によシ、マシンについての前述の説明に基づ き容易に提供しうる。
登録演算を完了すると、システムは操作者あるいは例えば調時装置のようなその 他の手段によシ作動されて、検出モードに゛ おいて送入されるスピーチ信号を 比較するために使用されるデータ(−スを形成するために登録モードにおいて発 生する情報を利用する。特に、第6図は適当なデータベースを構成しうるように するシステムの性能を発揮させる方法を示す。
データベースの形成を要求する信号を受取ると、システムは第6図のブロック2 20からブロック222まで進み、第3図の169においてセットしたフラッグ が依然としてセットされているか否か検出する。フラッグがセットされていない とすれば、処理すべきデータが何らなく、システムはブロック224−1で進み 、データベースをつくるための過程の演算を終了し、第1図のステート20を開 始させるよう復帰する。
処理スべきデータがあるとすれば、システムはブロック222からブロック22 6マで進み、そこでCDB 120に記憶された次のワードを獲得する。ブロッ ク226において、システムはまたデータベースの準備を完了したか否か検出す る。まだ完了していなければ、システムはブロック226からブロック228ま で進む。
ブロック228において、システムは「スピーカ間内部・話し手」の比較を行い 、登録モードにおいて展開された統計が相互に比較されて「グローバルディスト ーション(大域的ひずみ)すなわち全体的な否」を展開し、ワードがワード間で 相違する程度を指示する。前記のスピーカ間(内部・話し手)の比較は(内部・ 話し手)の比較に対するグローノ;ルディストージョンは所定のトークンのr( 1)e、同じスピーカによシつくられた同じワードの全ての他のトークンのa  a /i)と比較することによりつくシ出される。このように、tの異なったト ークンがあるとすれば、Tw=(t−t)−tのスピーカ間(内部・話し手)の 比較が行われる。上位ゾロセッサは、前述の過程を実行し、かつ第7図から第9 図に関して後述するスピーカ間(内部・話し手)のルーチングを用いることによ り前記のスピーカ間の比較からグローバルディストーションGi獲得する。
一旦スビーカ間のグローバルディストーションがブロック228において展開さ れると、それらは将来の使用に備えて記憶され、システムはブロック230へ進 む。
ブロック230において、スピーカのワードに対するスピーカ間(すなわち、相 互・話し手)比較はそのワードのスピーカのNトークンの各々に対してグローバ ルディストーション(C,) ’e得ることにより計算される。該グローバルデ ィスト−:)!l 7 (G)は包括的なデータベースにおいて全てのスピーカ によシ発生する同じワードのその他の全てのトークンのaa (il値とそノド −クンのr(1)値とを比較することから発生する。前記の包括的データベース は検証システムによシ使用される10個の基準ワードの翻訳における広範囲の変 化を網羅する。何故なら、それぞれ明確に異った発声気管特性を有する個人から なる群によるトークンの発生を表示するからである。n人のスピーカがあるとす れば、Tb=n、t2のスピーカ間(相互・話し手)の比較が行われる。ブロッ ク230においてスピーカ間比較を達成するための方法についての詳細な説明は 第10図に関して後述する。
ブロック230においてスピーカ間(相互・話し手)のディストー:)ヨンを獲 得した後、システムはブロック232まで進み、そこでスピーカ間(内部・話し 手)からのディストーションとスピーカ間(相互・話し手)の比較とが合わされ て数が下がる方向に記憶され、アレイDに記憶される。このアレイにおけるディ ストーションの全体数はd=Tw+TBである。このアレイにおけるディストー ションはスピーカ間(相互・話し手)あるいはスピーカ間(内部・話し手)のデ ィストーションとうはルが付げ続けられる。ブロック232でつくられるアレイ Dの例を第12図に示す。
ブロック232からシステムはブロック234マで進み、そこで統計ファイル5 TATがつくられる。第12図に示す順序のディストーションを用いることによ りシステムは、受入れ/拒否の決定のための限界値が特定のスピーカ間のディス トーションのディストーションに対応するディストーション値に基づいていると すれば、それぞれのスピーカディストーションに対して、システムが間違って実 際のスピーカを拒否したり、間違って偽のスピーカを受入れたりし易いことを指 示するファイルをつくる。第12図のアレイDにおけるインフォーメーションに 基づいた5TATフアイルの一例を第・13図に示す。第13図の5TATフア イルを展開するためにブロック234において用いられる過程を第11図に関し て以下説明する。
ブロック234から、第6図に示すシステムはブロック226へ戻り被登録人の 次のワードを獲得する。全てのワードが前述のように処理されたとすれば、シス テムはブロック236マで進み、0RDERフアイルを構成し、このファイルは 現在のスピーカを包括的なデータベースにその人のデータが記憶されているその 他のスピーカから判別しうる基準ワードの各々の相対的能力を示す。高度の区別 能力全盲するワードとは間違って拒否する誤差比率の何れかの所定レベルにおい て間違って受入れる誤差比率の低いワードのことである。システムはワード対ワ ードの5TATフアイルにおいて間違って受入れる場合の最大値に基いたワード ヲ仕分けすることにより現在のユーザに対してワードの相対的な判別能力を検出 する。このように、例えば、第13図に示す5TATフアイルにより表示される ワードを仕分けるために使用fる値1dERRORFALSE ACCEPTの JI、出りの下での最初の入口であって、これは2/6の値でらる。基準ワード 3に対するワード毎の5TAT7アイルの各々からの前記の表示値は数が小さく なる順に並べられ、五−ザ毎に識別されるファイル[0RDERJに保存される 。
ブロック236にある間、システムはその識別子記憶ファイルにおける特定ユー ザに対する登録時に得た情報(名前、アクセス点、誤差レイル)を入力する。前 記ファイルは当該ユーザの識別子に対応するデータベース情報にリンクされてい る。
第7図から第9図までを参照することによシ、スピーカ間(内部・話し手)の比 較を行うために第6図に示すブロック228で用いられる過程を説明することが できる。第7図を参照すれば、第6図に示すブロック228へ入る際システムは ブロック240まで進行し、そこで現在検討されておシ、かつ被登録人が発声し たワードの次のトークンを装填する。一旦次のトークンが装填すれると、システ ムはブロック242まで進み、そこで「CompAREJの過程が呼出される。
CompARE過程は被登録人が発生したワードの他のトークジと、当該トーク ンを比較することによシ検討されている特定のトークンに対するグローバルディ ストーションを提供する。
比較を完了し、かつグローバルディストーションを獲得すると、システムはブロ ック244まで進み、かつ後で使用するためにディストー:):l 7 f記憶 する。ブロック244からシステムはブロック240まで戻り、Nトークンの次 のトークンを獲得し、前述のようにこのトークンの処理を行う。所定のワードに 対してそれ以上トークンが入手できないとすればシステムは第6図のブロック2 30に対応するブロック230マで進み、スピーカ間の比較を開始する。
さて第8図と第9図とを参照すれば、第7図のブロック242において使用され るCompARE過程を説明する。第7図のcompAREブロック242へ入 るとシステムは第8図のブロック242まで進み、基準トークンとテストトーク ンとの間の比較を開始する。イントラスピーカ比較の場合基準トークンは被登録 人の前の発声の中の1個である。テストトークンとは第6図のブロック228に 示すように、データベースをつくる上で現在処理されているトークンである。
aaa数セットの基準パターンをテストテンプレートのr fi)およびe値に 対して比較することによシ比較が行われる。
テストの状況については第9図にグラフ表示しておシ、基準軸280上で零から jまで各フレームに対してaa値全全指定ることにより基準テンプレートが規定 されることが判る。同様にテストテンプレートの零から1までの各フレームに対 するrとeの値は1軸282に沿って位置する。基準テンプレートの長さはjI ldl上で原点284からMまで延びるものとして示されている。
同様(、テストテンプレートの長さはi軸のNとして示す位置まで原点284か ら延びるものとして示されている。
テストの結果は、原点284と、288で示すMとN位置の軸に対して垂直の線 の交差点との間の可能な全ての軌道を横移動することによシ経験される最小量の ディストーションを示すグローバルディスト−9aン値Gで示す。
前記ノブローバルブイスト−ジョンGは、第8図のフロー線図で示され、かつ以 下説明する2段階の方法によシ得られる。
第8図に示すブロック242からシステムは決定ブロック246まで進み、そこ で基準テンプレートのフレームMの数はテストテンプレートのフレームNの数と 比較される。フレームの前記数の差が所定の限界値をはみ出しているとすれば、 システムはブロック248マで進み、発声の長さは比較するには互換性のないこ とを示す出力信号r999Jを提供する。図示実施例に対しては、限界値は 発声の長さが限界値内に入っているとすれば、システムはブロック250まで進 み、1=0の初期値をセットする。ブロック250カラシステムはブロック25 2まで進み、j=oの初期値をセットする。ブロック252からシステムは次に ブロック254まで進み、システムの所定点1.jにおける局部ディストーショ ンを計算して比較過程の第1段階を完了する。1とjの初期値はOであるので、 過程は原点284から始まり、そこから点288までの最小軌道を検出する必要 がある。
ブロック254において、第2図の5P122はlL&係数のNベクトルと正規 化された自己相関rとを比較する。局部歪結果でらるNはCDB120内に16 ビツトの値としてストアされる。
これらの局部歪を得るための関係は H=。
として示される。
次に、マドリスク内の各1.j点のためにそのロケーションで)基準とテストテ ンプレート間で距離測定を表示する歪値が発生される。
ブロック254内に演算された局部歪(i、j)が含まれておシ、システムは次 にブロック256に移り、第9図のグラフ上の座標1及びjによって示される特 定位置用の全体的な距離値(1゜j)を発生する。この最小距離バスを決定する ために、プロセッサは与えられた位置に対する異なるバスの値をめ、そして最小 歪値を有する・ξスを選択する。次に、第9図のグラフ上の点290用の最小の 全体的な歪を決定するために、292.294及び296で示される3つのパス の間からの最小歪が受入れられる。この最小・ぞスは次の関係によって数学的に 決定できる。
dは前もって発生された局部歪、前もって決定されていない指数すなわち負の数 になるものは零の値に割当てられる。例えば、点1=1.5=1でのgi、 j の値は点1−2. j−1,及び1−1.j−2でのgのための値を要求する。
これらのgの値は軸の負側にないので、彼等はシステム内に存在せず、従って彼 等は零の値に割当てられる。
最小パスの値を定義する最後の全体的な歪は第9図の点288に発見される。こ の点のために、システム内のブロック256戻る。この最後のG値は以下のよう に決定される。
実際の動作において、上述の演算を継続するために全ての情報が必要であるので 、apHoは全体的な歪の3つの列及び局部歪の2つの列だけを維持する。これ は重要な記憶スペースを節約する。更に、上述のグイナミイクプログラミングア ルゴリズムにおける平行四辺形境界のために、点の略々30%がイクスプリトサ ーチから省略される。これ°らの点は原点284に及び第9図のラインの終点2 86に接続されている角を有する平行四辺形の外側である。これらの点は、はぼ j軸上のN値、j軸上のM値でおるグラフのこれらの境界の近くに特に集中して いる。
第9図のグラフ上の現在の点1.jのための全体的な歪が得られた後に1システ ムはブロック260に移シ、かつj指数が1だけ増加される。そして、システム は決定ブロック262ニ移りかつ基準証拠(reference toker) 内のaa係数の数と新しいj指数が等しいかどうか決定する。もし、j指数がa a係数の数と等しくなければ、システムはブロック254へ戻シ、第9図のグラ フ内の新しい位置用の歪を上述の如く演算する。
もし、j指数が基準証拠のaa係数と等しければ、システムはブロック262か らブロック264へ移シ、かつ1指数を1だけ増加する。ブロック264からシ ステムが決定ブロック266に移シ、テスト証拠(test token)のr 係数の数と1指数が等しいはブロック252へ戻シ、j指数を零に等しくセット し、第9図のグラフ内Ω新しい位置で歪の引出しを継続する。もし、新しい指数 1がテスト証拠(test token)のためにセットするr係数に等しげれ ば、次にシステムは第9図のグラフ内の最後の点288にある。システムは上記 方程式a3で示された如きに定義された点288での最後の正規化された全体的 な歪値のブロック268へ移る。この正規化された値はテスト証拠と基準証拠の 比較に対応する全体的な歪になる。
第6図のブロック228内の内部・話し手比較を完了し、かつ上述の処理を利用 した後に、システムは相互・話し手比較が実行される第6図のブロック230へ 移る。第10図を参照して、相互・話し手比較の成就がもっと詳細に述べられる 。特に、ブロック230に達しているとき、システムは特定のワードが処理され ている間に使用者の次の証拠へ進めるブロック300へ移る。一度この証拠が認 識されると、次の一般的な証拠へ進めるブロック302へ移り、かつ現在のワー ドが検査されている間に特定の一般的な話し手の次の証拠へ進め葱ズロソク30 4へ移る。
システムは、ブロック304内に示されている如く、特定の一般的な話し手から の証拠を伴うユーザからのワードの現在の証拠の比較を導くブロック306へ移 る。この比較の成就のための手順は第8図及び第9図に関して上述されたものと 同じでi、比較された証拠用のスコア値を表わす全体的な歪音発生する各比較を 伴う。比較の完成後(て、全体的な歪は更に使用されるためにストアされる。
一般的な話し手の次の証拠を得る。もし、考察下のワード・に関連している話し 手用の証拠がそれ以上なげれば、システムはブロック304からブロック302 へ移シ、次の一般的な話し手に進み・次に上述の如く一般的な話し手用の証拠の 数値をめる。
もし、一般的な話し手からの現在のワードの証拠がそれ以上なければ、システム はブロック302からブロック300へ移シ、そして特定なワードのユーザの次 の証拠へ進む。もし、そのワードのユーザの証拠の全ての比較が完了すれば、シ ステムは第10図のブロック308にストアされた歪が組合され上述の如くスト アされる第6図のフローチャート内のブロック232ヘブロノク300から移る 。
第11図を参照して、第6図のブロック234によって実行される如(STAT ファイルの作図の成就用の手順を述べることは可能であり、システムは前もって 考察されていない上位桁を有する内部・話し手用の次の全体的な歪値が第12図 のアレイDから得られる第11図のブロック310ヘジヤンプすることによpS TATファイルの作図を開始した。第12図を参照して例えばブロック310の 活性化は内部・話し手比較番号6に対応する歪値87を得る。この情報はストア され、システムはERRORFALSE ACCEPT (ERRORFA)値 が引出されるブロック312に移る。
第13図のper ” word 5TATフアイルの情報全稈るために、第1 2図のアレイDに記憶された各々の内部・話し手歪は数1=0.・・・・・・T wを割シ当てられている。アレイDの各々のTw内部・話し手歪については、そ の歪よシ数的に小さいアレイ内の内部・話し手歪の数は演算されかつアレイJに 記憶される。
これらのアレイ内に1=O2・・・・・・TWのエレメントがある。数TWで割 シ当てられたアレイD内の内部・話し手歪については、数的((その歪に等しい か又は以下である歪の総数は(相互および内部・話し手)演算され且つアレイK に記憶される。上記発生された情報に基づいて、第13図のper−word  5TATフアイルのERORFA欄は以下の関係を用いて第11図のブロック3 21の要求によって発生される。
per −word 5TATフアイルのERRORFAの第1のエレメントは 上記式14全第12図のDアレイにおいて上から下に移動するとき出会う第1の 内部・話し手歪値に適用することによシ確定する。この場合においては、第1の 出会った歪値は歪値値については、数的に配列番号6より小さい2相互・話し手 歪が存在するので、上述の関係はJ = (1) = 2 =i発生する。出会 った第1の歪(配列番号6)より小さいか等しい6歪が存在するのでKは6であ る。一方、40の値の内部・話し手歪については、その点以下の相互・話し手歪 が存在しないこと一注意すべきである。従って、ERRORFAの分子はOであ り、一方、第1の出会った内部・話し手歪に含まれている6歪が存在するので分 母は6のままである。ブロック312のERRORFA欄の開発が完了したとき は、システムは第13図のper−wordSTATファイルのERRORFA LSE Rz、F、cr (ERRORFR)を開発するブロック314へ移動 する。上述の関係全利用してERROR工欄は以下の関係を発生する。
第12図のアレイDを参照して、ERRORFRの式15は、第13図において 出会い従って番号ニー1が割シ当てられる第1の内部・話し手歪を検査すること によシ第13図の値を定義する。一般的な場合において、システム内にN内部・ 話し手歪が存在し、上記式は87の歪でERRORFRの値をl−1/n=0  / n = Oと指示する。システムはブロック314から次にブロック316 へ移動し、ブロック312および314で開発された情報を説明のために第13 図に描かれたper−word 5TATフアイルに記憶する◇per−wor d 5TATフアイルの完成に伴って、システムはブロック316からブロック 310へ移動する。このブロック310は、上述された方法で・D′アレイから 次の内部・話し手歪を得て、そのワードのためのper−word 5TATフ アイルヲ形成する。アレイDにそれ以上内部・話し手歪がなければ、システムは 第6図のブロック226へ移動し、上述の如く機能する。登録手順が完了したら 、ユーザは安全なエリヤへのアクセスを得る試みにおいて本発明の確認モードを 起動し、また本発明の確認システムが応用するアクセス、同人確認等の目的で利 用される。再び第1図を参照して、システムが登録状態になければ、ブロック5 0へ移動し、確認モードの有無を決定する。確認モードと決定されれば、第14 図のブロック50へ移動し、確認成就の手順を活性化する。システムは第14図 のブロック50からブロック400へ移動し、ステーショア102の1つでの現 在のアクセスの要求の有無?決定する。
ブロック400において、ホスト・プロセッサは動作のための全てのアクセス点 を継続的にスキャンする。動作が表示されなければ、ライン402を通してシス テムループはブロック400へ戻り、そしてここで要求が行われるような時間ま で機能する。
ユーザは個人確認番号即ちキー・ぞア)’(KEY PAD)の入力、プラスチ ックカードの挿入、マイクロフォンへの名前の入力のような種々の方法で確認要 求を与える。要求を検出したときは、システムはブロック404へ移動し、ユー ザに確認のための要求を発生する。この要求は0P100からSD 106 を 介してステーション102へ転送される。ユーザ確認について急いでいれば、シ ステムはブロック406に移動し、5D106を介してステーション102から の入力信号を監視し、同一性証明情報に存在する表示に対応する信号のエネルギ レベルを検出する。この形式の入力信号が予め設定された時間期間の後に検出さ れなければ、システムはブロック404への戻p1ユーザからの同一性証明を要 求する。同一性証明を含む信号を検出したときは、システムはブロック408へ 移動する。ブロック408において、システムは、同一性証明が手続きされたユ ーザに対応するがどうか及び同一性証明が特定のアクセス点からのアクセスであ ると認めるかどうかを決定するために、ユーザ用に予め記憶された同一性証明情 報と比較する。同一性証明が表示された基準に合わないときには、システムはブ ロック410へ移動し、ユーザを拒絶する信号を発生する。同一・性証明は特定 のアクセス点として容認可能とされれば、システムはブロック412に移動し、 予め入力され且つ記憶された特定のユーザ用のデータに基づいたしきい値全設定 する。しきい値が指定されていなげれば、システムはデホルト(defalt) 値を利用する。
設定されているしきい値は、要求を拒絶する前に許される検査(各ワード毎に検 査が継続される)の最大回数、要求を容認可能なものとして許す前に要求されて いる検査の最低回数、容認のために要求されるホルト・アクセプト・エラー・レ イト(false accept error rate) (ERRORFA )のしくル、容認のために要求されるホルト・リジェクト・エラー・レイト(f alse rejection error rate ) (ERRORFA  )及び容認されている検査失敗の最大回数を含んでいる。しきい値が設定され たときは、システムはブロック412からブロック414へ移動し、この特定の ユーザのための0RDERフアイルをアクセスする。システムは登録手続きモー ドにおいて創作された0RDERフアイルからの次のワードを得る。新しいワー ドを有するシステムはブロック414からブロック418に移動し、ユーザがス テーション102のマイクロフォンに選択されたワードを話すように要求する。
ユーザによって発声された現在の合言葉を受信したときは、システムはブロック 420へ移動し、正規化された自己相関係数rを得る。これらのr係数はテスト 手順にょ)得られるe’テスト手順は、確認プロセスを促進するために現在のス ピーチにおけるr係数を発生するように他のパラメータと同様に機能する。この 手順は第4図のとともに前述されている。
r係数を受信したときは、システムはブロック422へ移動し、現在の合言葉( トークン: token)とユーザの対応している4つのテンプレートとを比較 し、そしてこれらの比較から得られた全体的な歪を利用し、per −word  5TATフアイルからERRORFA用の現在値を得る。このERRORFA t得るための手順は第15図に詳しく描かれておシ、更に後述される。5TAT フアイルからのERRORFAの訂正の動作の間に、現在の歪よシ大きな歪が5 TATフアイルの中に記憶されていないことがわかれば、検査は失敗したとみな される。システムはブロック428へ移動し、容認または拒絶がされなければな らないことに関するどの動作をするかを決定するために更にテストが行われる。
ブロック428内で実行されているテスト手順は第16図を参照して後述される 。ブロック428のテスト手順の決定ノ基づいて、システムは何も決定せず、そ して次のワードが0RDERフアイルから得られ動作が上述のように継続される ブロック414へ戻るか、またはブロック432へ戻シ要求者を容認する。ブロ ック430および432から第2図のステーション102へ転送される信号が発 生され容認者の決定を助ける。勿論、これらの信号は外部装置へ確認された場所 へのドアを開くこと、選択された装置の動作を開始させる等のことを成就するた めに転送される。
ブロック422でERRORFAが訂正されれば、システムはブロック426へ 移動し、累積された誤差値が調整される。ブロック426を通る初めのノξス上 で累積誤差はブロック422から与えられたERRORFAと対応する。ブロッ ク426を通る次のパス上で累積誤差は前の累積誤差値とブロック422から受 信した現在のERROR,A値との組合わせを含む。一実施例において、この組 合わせは前の累積誤差とブロック422から受信された現在のERROR,A値 の積を含む。そして、累積誤差は新しい要求が評価される毎に氏名詐称者の容認 失敗の確率に基づいて調整される。システムはブロック426からブロック42 8へ移動し、後述される手順に従って要求者の容認または拒絶に関連した決定が 行われる。
第15図を参照して、ブロック422のERRORFAi得るための手順を述べ る。ブロック422に入ったとき、システ゛ムは第15図のブロック440に直 ちに移動し、登録モードで発生された次の4つaaミツアイルテストされたワー ドに対応する)?得るoaa値を得たとき、システムはブロック442へ移動し 、第14図のブロック442で得た新しいr係数とブロック440から得たaa 係数とを比較する。この比較は第8図および第9図を参照して前に説明された手 順によって成就され、新しい証拠(joken )のr値とブロック440で得 られた証拠のaa値との差を表示する全体的な歪を発生する。
システムはブロック444へ移動し、ブロック442で得られた全体的な歪値を 読み出す。この歪値は記憶され、システムはブロック446へ移動し、このユー ザに対応している記憶された証拠Nの何れもが現在の発声の値とまだ比較されて いないがを決定する。比較されていない証拠があれば、システムはブロック44 0に戻シ、上述の如く機能する。比較されるべき証拠がこれ以上の残っていなげ れば、システムはブロック448へ移動し、このブロック448は新しいr値と ユーザの記憶されタテンプレー)Hの比較によって発生された全体的な歪を合成 歪全発生するために処理する。この合成歪は幾つかの別の値を含んでいる。例え ば、一実施例において、証拠歪値は合成歪を含むように一緒に平均される。他の 実施例においては、歪の最小の値が選択され、更に他の実施例においては、最小 の二つの歪が平均される。合成歪の構成が選択される基礎は発明が利用される応 用の形式から独立しておシ且つオペレータの希望からも独立している。現在の発 声を表示する合成歪値が決定されれば、システムはブロック450へ移動し、登 録モードで作成されたper−word 5TATフアイルが参照される。
ブ07り450において、合成歪はper−word 5TATフアイルの歪と 比較され、合成歪と最も近いがそれより大きい歪が同一のものとみなされる。
同一のものとみなされた歪に関連したE RRORFAが抽出され、出す14図 のブロック422へ供給されるERRORFAとして利用される。
合成歪がper−word 5TATフアイルのどの歪よシも太きいときには、 ERRORFAが抽出されず、代りに1に等しいERROR,Aが検査が失敗し たことを表示するブロック422へ供給される。システムが第14図のブロック 422からブロック424へ進み、そしてブロック428へ進む場合は、累積誤 差426は失敗した検査に応答して調整されないことは注見される。不注意な雑 音、ユーザのしゃつくり、またはユーザを現在の入力中の彼の発声から邪魔する どのような種類の問題の彼の別の発声を容認される見込みに不利に影響しない。
それにも拘わらず、このような普通でない発声は繰り返されるなら、検出された 間違った発声や音はシステムで認識され容認または拒絶に影響する・テストブロ ックを含む第14図のブロック428の動作が第16図に関連して述べられる。
特に、ブロック428に入ったときは、システムはブロック460へ移動し、ブ ロック424がらの7エイルカウンタがユーザが検査の予め設定された回数を越 値は2である。熱論、この値はオペレータの裁量で設定されても良い。失敗した 検査が最大を越えていれば、システムはブロック430へ移動し、上述の如く要 求者を拒絶する。失敗した検査が最大を越えていなければ、システムはブロック 462へ移動し、検査の最大回数が越えられたかを決定する。この条件は、要求 者の累積誤差がしきい値よシ大きいがブロック460の検査が失敗されていない ときに生じる。検査の最大回数のための緩やかなしきい値5である。再びもし彼 が希望するなら、オペーレタは別の値を選択できる。最大検査が限度を越えてい れば、システムはブロック430へ移動し、上述の方法で要求者を拒絶する。最 大検査が限度を越えていなげれば、システムはブロック464へ移動し、第14 図のブロック426からの累積誤差がしきい値より大きいか決定される。もし、 そうなら、システムは第14図のブロック414へ移動し、0RDERフアイル からの次のワートヲ得て、上述のように処理する。累積誤差がしきい値よシ小さ ければ、システムはブロック466へ移動し、要求者が少なくとも2回を越えて いるか全決定する。このことは少なくとも2回の検査がこの要求者のために行わ れた且つ第2の検査の終りで累積誤差が容認のためのしきい値以下であることを 意味する。
上述の実施例で、累積誤差はブロック426の各検査によって調整される。他の 実施例において、しきい値は累積誤差と一緒に調整される。この調整は、累積誤 差のために行われたと同じ方法で、しきい値に現在のERRORFA値を乗算す るような累積誤差での変化の割合として行われ乞。結果として、分数によって乗 算される如く小さくなる累積誤差の傾向はしきい値レベルの低下を伴い、容認さ れる氏名詐称者の見込みは検査の増加によって増加されなくなる。2回以下の検 査が行われたことが検出されると、システムはブロック466からブロック41 4に移動し、0RDERフアイルから次のワード全稈て、上述のように処理する 。少なくても2回の検査が行われていれば、システムはブロック468へ移動し 、要求者に彼が容認されたことを連絡するために又は容認信号によって動作され る装置全始動させるためにステーション102金介して転送される信号を発生し て要求者を容認する。
よりMのパーソナルコンピュータ112のリアルタイム動作システム114全成 就するのに、以下のステップが要求される。
第21図全参照して、パーンナルコンピュータのメモリーがスタック(stac ks) 124として使用されるべくブロック内に組込まれている。これらのス タック同時と進行される各12のプロセス(processes)めに全ての修 飾可能データを保持する。実行されるべき各プロセスのイメージ(image) はそのスタックに記憶されている。プロセスOはイメージ初期設定を必要とせず 、全ての他の初期設定およびセットアツプを実行する特殊なものと指摘される。
その後は、プロセスOは時間を連続的に読出し、シャード・セマフォード・メモ リー(shared semaphored memory)のロケーション内 の他の全てのプロセスを有用にする“タイム(t1mθ)″を作成する。イメー ジが初期設定された後はルーチンが動作の開始2許された1クロツク・割込み・ サービス・ルーチン”即ち゛クロックISR”と呼ばれる。クロックISRはプ ロセスのスタックの現在のプロセスのイメージを押し進める。他のプロセスの状 態に基づいて、決定はパーソナル・コンピュータのデジタル・プロセッサの使用 に値いする0スケジエーラ(5che4uler )″によって行われる。選択 されたプロセッサのスタックのアドレスはプロセスティプル126から回収され 、そのイメージはスタックを急に出ていく。そのプロセスの動作は割込みから復 温したときに直ちに開始される。初期イメージの危険部分は正しい割込み復帰ア ドレスとフラグの立証である。
スタックおよびイメージ変化の手順は“文脈スイッチ(contθXBwitc h)”と呼ばれる。第2の機構も文脈スイッチを実行する。おるイベント’を待 つプロセスは、割込みが行われそしてスタック決定および他のプロセスのイメー ジポツプポツピング(popping)が継続されていれば、イメージを造る文 脈スイッチ機構に対して制御を与える。プロセスはプログラムのスペースを共用 する。“純”即ち”再入可能”コードが絶対に必要とされる。各々共用される資 料、装置、資源は専用のセマフォー(θθmaphore )によって保護され なければならない。セマフォーはセクトされ、iう最小非削込み動作によって試 験されるフラグである。問題になるのは2つのプロセスは試験即ち同一ロケーシ ョン、装置、資源の修飾を試み、かつその動作中に非干渉を除く可能性である。
セマフォービは、割込み中止しフラグを読出すプロセスを有すことによシ確実性 を保証する。フラグが無げれば、フラグがセットされ、割込みが再び開始される 。
フラグが有効なら、文脈スイッチ(即ち、文脈切替え)が行われる。プロセッサ がこの文脈に再び戻るときには、フラグが再び試験される。割込みはこの文脈中 はセマフォーが無くなるまでオフのままである。各々の装置(例えば、クロック 、スクリーン、キーボード、ディスク、rθ232バス、および5VB)は1コ マン)” (command )”機能および”割込み・サービス・ルーチン( intsrrupu 5ervice routine)″機能と関連している 。SVBは、4つまでのボードを共用するDMA機能を使用する権利をボードが あるか決定するために割込み・サービス・ルーチンの0ラウンド9・ロビン(r ound robin)”様式で試験される。装置が使用されるとき、プロセス は装置セマフォーをセットし、割込みを停止し、装置をコマンドシ、装置ビジィ フラグをセットし、文脈切替えが禁止される。スケジューラはそのプロセスに復 帰することができる。プロセスは装置セマフォーを解除し、割込みぬ戻す。プロ セスのプロセッサ使用に関するスケジューラの決定は、優先度、ディバイス・ビ ーシイ・フラグ、プロセス状態に基づいている。2つのレベルの優先度がある。
高優先度は残存されなければならないシステムのユーザに対する連続する正しい 音のスピーチ出方に対してのみ与えられる。全ての他のプロセスは低優先度全盲 する。高優先度プロセスは低優先度プロセス状態える絶対先例を有する。スヶジ ー−ラは同時ド切替えられた物に従うプロセスを示している”ラントハロビン( round robin)″様式のプロセスティプルを試験する。このランド・ ロビン試験の間、装置尾 および無駄なプロセスがスキップされるのを待つ。第 1の実行可能低優先度プロセスが記憶されている。高優先度プロセスが待機中な ら、最初に発見された物が栗初に実行される。何も発見されなげれば、記憶され た低優先度タスクが実行される。プロセス0はブロック化即ち゛無効”されるこ とは不可能であり、従ってスケジュラ−は常にプロセスを実行するために有して いる。プロセスは”キイルド(kllled)Ilまたはト顎ム)” (doo med )″される。キイルト毛れたプロセスは直ちに終了され、文脈記切替え が出され、続いてランド・ロビン試験にスキップされる。
ドウムドされたプロセスはプロセスが終了するまで継続する。
これは“プロセストリイブ(process aθ1ver )″を指摘したプ ロセスの初期イメージを有することにょシ成就される。プロセストリイブはプロ セスティプルに明記された機能を機能を実行する無限ループである。この無限ル ープはプロセスドラムフラグ(procesθaoom nag)セットを検出 したときに自身で終了し、文脈切シ替えを出す。プロセスは”イクス(exec ’ed)”される。イクスプロセスに対して、まず確実に無駄にされなけ゛れば ならない。キルコマンドはプロセス及び機能ポインターがそのプロセスを入力す るためのプロセスティプルにコピーされ、そのプロセスティプル入力のリマイン ダ(remainder )が入力データにまるまでキイルドとしてのこるプロ セス状態を除いて初期化されるために、発生される。プロセス状態は”ライブ( live)”になる。動作システムはファイルシステムの同等物内に固定デスク を保存しなければならない。デスクは7つのブロックに組織サレル。スナワチ、 BOOT、0PERATIONG SYSTEM。
5TUCTURES、HEADERS、IMPO3TORS、ENROLLEE S。
AUDIT TRALLである。BOOTは動作システム及び構成を定義するた めのデスク連結を含む動作システム全完成させるに必要なプログラムを含む。例 えば、確認の管理における全てのデスク及び資料である。5TRUCTURES は全ての7つのブロックが配置されたマツプである。これらのブロックは主要な ブロックは時々分離された小さなブロックに分割される。例えば2つのHEAD ERば1つのコピーへのダメージが有用なデータを永久に破壊しないように遠く 離されたデスクセクタに記憶される。これは、2枚のコピーを有する5TRUC TURESHAも同様である。これらの5TRUCTURESHAのロケーショ ンはBOOT内に記憶される。HEADERSは全ての会員に個人データ及びE NROLLEESブロックとIMPO8TORSブロックのリンケイジを含む。
IMPO8TORSプロ、りは証拠のアレイである。各IMPO3TOR8は各 々5ワードの5つの証拠を有する。ENROLLEESブロックは証拠のアレイ である。各々の会員のために各々5ワードの5つの証拠がある。
確認手顆は動作システムによシ与えられる根本的機能を使用する別のモジュール に記憶されている。確認は3つの主要なサブモジュール、VERIFY、ENR OLL、MANAGEに分割されている。ENROLLはManager Ac cess Pnint″動作からのみ理解できる。内部的に、50の証拠をワー ド毎に57−ト0×5証拠で成る25の証拠と共に保持する大きな証拠バッファ がある。2つにバッファはRAM内で内部・話し手及び相互・話し手の統計値を 発生する動作をし続けるために必要とされている。ディスクのシフトオフ及びオ ンの間この動作はシステムを低速にする。(記:これらのバッファは、またBA CKUPのようなENROLLと同時に実行しない他にモジュールによって使用 される。BACKUPは、また、25証拠のブロックをそれぞれシフトオンし、 且つデスケラト及びディスクをシフトオフする)プロンプ) (promptθ )はRAM内で同様な速度原理によシ保持される。スピーチプロンプチング(5 peech prompting )(音声出力)の間、スケジューラによるプ ロセッサの割シ振シは粗悪な品質の音になる出力スピーチ細分部分を作る。従っ て、スピーチ出力は高優先度が与えられる。プロンプトが出力された時、プロセ スは割り振シ処理者用のコマンドをセットし、ボード割り込み処理者への送信及 び動作を待つとき自身にマークする。割シ込み処理者は停止された割り込みを有 するので、セマフォー及びディバイスビイシイフラグが不必要となるようにDM A用の争いが存在してはならない。割シ込み処理者はプロセスの要求が終了しし だいにプロセスのため動作待機フラグを消す。動作を待つ間にプロセス文脈切シ 替えが出力され、動作フラグ消去を待つまで再び実行されない。ディスクから証 拠を検索する間、プロセスはディスクをセマフォーし、コマンド及びDMAeセ ットし、ディスクをビイシイとマークし、ディスクがビイシイの実行するだめの 他のプロセス時間を与えることを切シ替え文脈切シ替えに要求する。ディスクが 処理された時、空きの如くマークされたディスクの割込みヲ災行し、セマフォー を切る。ラウントロピンループがこのプロセスに再び達した時、スケ−ジー−ラ このプロセスの実行を継続する。ENROLLは”ドクム(doom )″プロ セス1であるところのMANAGERから開始する。プロセス1は確認プロセス でおるので、システムは時間切れ及びそれ自身を消滅させるために確認を待つ。
起こりえる正当な確認を割込ませることは不適切である。プロセス1が自身を消 滅させた後、MANAGERはプロセス1上に立ったKILL7ラグを見るかつ プロセス1上のEXECof ENROLLを実行する。ENROLLは重要な 統計を得ることにより開始され、各証拠が訂正された時にそれは自身の番号とそ れのワード番号に従って順次にRぷスコアに記憶される。証拠が長さにおける大 きな分散によって試験される。このような分散が発見されなげれば、際立った長 さを有する証拠金置換える試みがなされる。多くの証拠がワード内で“際立つ( θtanaout )″であれば、そのワード9のための証拠の新しい設定が指 示される。
これが失敗すれば、ENROLLは失敗する。ENROLLが失敗すれば、証拠 はにバッファに記憶されているに証拠に変換される。ボードは同一のワードの他 の証拠と比較したような各証拠のスコア(5corI5) k発生するために指 示される。このスコアはHEADSER内に記憶された内部・話し手の統計を決 定するのに使用される。任命された氏名詐称者はr証拠バッファ内へ読出され、 内部・話し手続計が同様な方法で発生される。任命されない氏名詐称者のために 統計の誤りセットが発生される。
これらの統計は発生された内部・話し手続計と組み合わされる。
これらの統計はHEADSEHに記憶される。K証拠バッファはユーザディスク 見出しく udj、 )に割り当てられ、書出される。
r証拠バッファ内への読戻しが行われ、ディスク上に悪いセクターかどうかを決 定するためにバイト対バイトの比較が行われる。もしそうなら、正常な書込み/ 続出しシーケンスが実行されるか又はディスクが満配はなるまで他のudiが発 生される。
そして、RAM内のHEADSERが不正の如くマークされ、直ちに書出しが行 われる。このことは証拠を変更し、統計がHEADSEHに不正の如くマークし 15分フラッシュが生じるまで書出しされない確認と対照をなす。VVERIF Yはプロセスエないし8の普通の機能である。第22図で述べられるVERIF Yプロセスのフローチャトは上述の確認動作のシステム114を動作することに よりとられたステップを描いている。
添付されたAppenxdix Aは確認、構成および登録のデータベースのサ ブプログラムの目的コードのコピーである。目的コードは、8進数形式、プログ ラミング言語Cおよび1BM PC/XT用のマスコンポバージョンアセンブリ 言語で記載しである。また、Appenxdix BはTMS 32010で記 載されたsp目的コードのコピーでおる。Appenxdix CはMotor o’la S −recOrdフォーマットのコピーである。CP目的コードは プログラミング言語CおよびM 68000アセンブリ言語のMASSCOMP バー:)ヨンアセンブリで記載されている。勿論、これらの付属物のコードが技 術的に公知の多くの言語で実質的に”プログラム”されることは認められる。従 って付属物に開示された実施例は本発明の1つの参照例として与えられたもので アシ、本発明の範囲を如何なる方法でも限定するものではない。上述された装置 および方法は以下の信頼でき且つ能率的なスピーチ確認システムを提供すること により従来技術を越える優れた改良を含んでいる。本発明は(1)スピーチの始 めと終りを能率的に且つ正確に検出する手段を含んでいて、(2)音声コードの 特徴に関し、時間又は強度制限に基づく制限なしに基準及びテスト発声間の比較 を供給する確認用の・ξラメータを提供し、(3)氏名詐称者を間違って容認し 又は正しい話し手を拒絶する確率の表示全発生し、内部及び相互・話し手の両方 に基づく別の発声の複数の比較の結果の関数である容認のための結果を利用する 確認モー1を提供し、(4)話し手を容認又は拒絶するかを決定する間おおよそ の一定基準を維持すること金許すところの話し手の容認又は拒絶のための任意の 可変しきい値を供給する。
本発明はその範囲全能れることなく又は本質的特徴全能れることなく他の形に具 体化できる。
例えば、第25図を参照して、登録動作の完成の後、第1の基準ワードの発声の 登録のだめの内部・話し手の全体的な歪値を演算(500)するために続行され る。一度そのワードのための全体的な歪値が演算されると、最大の値が捨てられ 、平均及び全体的な歪値の残りのための分散が演算され、後の確認動作用に記憶 される(502)。
同様に、相互・話し手の全体的な歪値を演算するための相互・話し手比較が実行 され(504)、最大の歪値が捨てられ、全体的な歪値の残シのために、相互・ 話し手の平均及び分散が演算され及び記憶される(506)。
各々の別の基準ワード及び彼らの対応する発声のグループのために、内部・話し 手及び相互・話し手の平均及び分散が上述のように演算され且つ記憶される。
第26図を参照して、確認動作の間、システムが要求されたユーザの同一性を確 認し得た後に、システムはメモリから内部・話し手及び相互・話し手の平均及び 分散値、基準ワード、各基準ワードに関連した発声のに係数及び要求されたユー ザの同一性に対応する2つのしきい値U及びv−1訂正する(522)。
基準ワードから、システムは任意に1のワー)”i選択し、ユーザに選択された ワードをマイクロフォンに話すように促す(524)。受信された発声は正規化 された自己相関係数rを得るために直ちに処理される(526)。r係数は、全 体的な歪の新しい組を演算するためにそのワード(登録されたユーザによって前 ((話されている)の記憶されている各々の発声のに係数と比較される(528 )。全体的な歪の組から、1個の組合わされたスコア(即ち、全体的な歪の平均 )が演算される。組合わされたスコア及び内部・話し手及び相互・話し手の平均 及び分散値を使用することによって、2つの値P及びQが演算され、彼らは登録 されたユーザがいま演算されたスコアよシ悪い組合わされたスコアを生じる発声 を生じる確率と、いま演算されたスコアよシ良い組合わされたスコアを生じる発 声を生じる確率とをそれぞれ表示する。第27図を参照して、Pは同一性を肯定 するために、組合わされたスコア546からの2つの内部・話シ手値(即ち、平 均524と分散544)によって特定されたガウス形密度関数540の積分によ って演算される(即ち、Pは破線された領域548に等しい)。
同様に、Qは同一性を否定するために、組合わされたスコア546からの2つの 相互・話し手(即ち、平均522と分散554)によって特定されたガウス形密 度関数の積分によって演算される(即ち、Qは破線された領域556に等しい) 。
再び第26図を参照して、Pおよび現在の基準ワードの現在の発声に対応する確 率値である間は、PおよびQはpおよびqの新しい値が演算される毎に更新され た累積確率値であり、即ちユーザから新しい発声が受信される毎にPおよびQ( 1に初期化される)は個々の確率新しい値PおよびQ’tそれぞれ積算すること により更新される。結果的に、ユーザの最初の発声の後、PおよびQはpおよび qにそれぞれ等しくなる(560)。確認決定(562) ’iするために、P およびQはそれぞれ登録されたユーザのために2つのしきい値Uおよび■と比較 される。PがUよシ小さいがUがV (564)以上に保たれれば、ユーザは拒 絶され、逆に、QがVよシ小さいがPがU (566)以上に保たれれば、ユー ザは容認される。しかし、PがU以上に保たれかつQがV (568)以上に保 たれれば、ユーザを容認または拒絶するための決定は行われず、代シに基準ワー ドの他の1つが選択され、ユーザは他の発声を促される。p、 q、 pの新し い値がこの発声のために演算され、更新された値Pおよびqがもう一度UとVと 比較される。ユーザを容認するが拒絶するために確認決定を行われるまでシステ ムはユーザに発声を促し続ける。
確認決定の感度および安全レベルは直接に2つのしきい値UおよびVに関連する 。UおよびVが比較的に小さな値に設定されていれば、確認動作は発声および分 析の長いシーケンスを要求する傾向になる。低いしきい値しばルの、区恵は増加 された安全性であり、即ち氏名詐称者が容認されないで正しいユーザが拒絶され ない大きい確実性であり、勿論増加された確実性は長い確認動作と反対に重要で ある。
■の値に関連したUの値が低くなればシステムは大きな組合わされた全体的な歪 値を示す不規則な発声音よシ寛大にし、一方Uの値に関連したVの値が低くなれ ば正しいユーザと容認されるべき氏名詐称者の両方がより困難になる。
確認動作の始めで、ユーザが正確な同一性(570)を供給すれば、彼は直ちに 拒絶されない、代りに、彼は不足している基準ワードのグループの幾つかを発す ることを促される。しかし、発声の結果が捨てられ、ユーザは最後の発声を話し た後で直ちに拒絶される。この手順は彼が正確な同一性を発生しているかどうか 全ユーザから聞き知ることを防ぐ。
ユーザが登録されたユーザとして容認されれば、確認動作中に彼または彼女が話 した発声は記憶された基準発声と内部・話し手及び相互・話し手の平均及び分散 値とを更新するのに使用される。これは人間の声に常に生じる変化を受入れるの に行われる。更新することは非常に新しい発声に非常に古い発声よシも重要性を 自動的に与える。
記載された実施例は説明された例のみ限定されず全ての範囲が考察されるべきで あシ、従って本発明の範囲は実施例よシもむしろ請求の範囲によって示されてい る。請求の範囲の同一の意味および領域内の変更は本発明の範囲内に包括される べきである。
浄書(内容に変更ない FIG、3 FIG、4 FIG、5 FIG、 7 FIG、 6 FIG、8 FIG、70 FIG、77 7Y ”D“ FIG、 72 FIG、 73 竹表昭63−500126 (26) FIG、16 −−」 FIG、77 FIG、 79 J FIG、21b KEYBOARD TABLE(−πン”うζηし) 」2?唸1!ぺ≧シ:巨 −(π〜吐ゴ≦ム〕FIG、 220 立訂E厘 歴r5ヨヒL )EAry:RtxrENspoNtts41@) RECORD(1−)−V >t (−4=−4) RE!;JDENT ENT l ラ”>)−I〉ドJ )FIG、 23b FIG、24() FIG、 24b FIG、25 F/G、26 手続補正書(方力 1.事件の表示 PCT/US86101402 2、発明の名称 話者照合装置 3、補正をする者 事件との関係 出 願人 住所 名 称 ニック・インダストリーズ・インコーホレーテッド4、代理人 住 所 東京都千代田区大手町二丁目2番1号新大手町ビル 206号室 電話270−6641〜6646 7、補正の内容 別紙の通り(尚、(3)及び(4)の書面の内容には変更なし)国際調査報告

Claims (55)

    【特許請求の範囲】
  1. 1.話し手が知られている人間かどうか前記知られている人間のスピーチについ ての基準情報を含む記憶された情報に基づいて確かめる方法において、前記確認 の第1段階で、前記話し手の発声を前記記憶された情報に関連して分析し、前記 分析に基づいて次の段階を続けるかを判断し、もし続け無いときには前記話し手 を受入れるか或いは拒絶するかを決定し、 もし続けると決定した場合には、前記次の段階で前記記憶された情報に関連した 前記話し手の少なくとも付加的な発声についてのテスト情報を分析し、 第1の段階で行われた分析と段階2の段階で行われた分析の両方に基づいて確認 決定を行う、 ことを特徴にする方法。
  2. 2.前記分析は前記比較の結果を暗示する差データを得るために前記テスト情報 と前記基準情報とを比較することと、前記決定が前記差データから得られる確率 値および少なくとも1のしきい値とに基づくことを含むことを特徴とする請求の 範囲第1項に記載の方法。
  3. 3.前記記憶された情報は、ある与えられた前記差データのための確率値を暗示 する確率値を含むことを特徴とする請求の範囲第1項に記載の方法。
  4. 4.複数の前記次の段階を含み、各々の前記次の段階は前記記憶された情報に関 連した少なくとも別の前記話し手の付加的な発声についてのテスト情報の分析を 含み、前記確認決定は前記第1の段階および前記第2の段階における前記分析に 基づいて行われることを特徴とする請求の範囲第1項に記載の方法。
  5. 5.1つは氏名詐称者を間違って容認する見込みを表し、他は前記知られている 人間を間違って拒絶する見込みを表示する2つの前記確率値を有し、2つの前記 しきい値を有することを特徴とする請求の範囲第2項に記載の方法。
  6. 6.前記しきい値は調整可能であることを特徴とする請求の範囲第5項に記載の 方法。
  7. 7.前記次の段階における前記確率値は前記第1の段階の確率値に部分的に基づ いていることを特徴とする請求の範囲第5項に記載の方法。
  8. 8.前記確認決定は前記話し手が前記知られている人間であるかを決定すること を含むことを特徴とする請求の範囲第1項に記載の方法。
  9. 9.もし前記確認決定が前記話し手が前記知られている人間てあると決定したと きは前記テスト情報に基づいて前記記憶された情報が更新されることを更に含む ことを特徴とする請求の範囲第1項に記載の方法。
  10. 10.前記発声および前記付加的発声は前記基準情報の基礎を形成する1組のワ ードからランダムに引出された2つのワードを含むことを特徴とする請求の範囲 第1項に記載の方法。
  11. 11.話し手が知られている人間かどうかを前記知られている人間のスピーチに ついての線予知係数に基づく基準値を含む記憶された情報に基づいて確かめる方 法において、与えられたテスト情報分析の結果によって前記話し手が前記知られ ている人間かどうかの確率を暗示する確率値を前記記憶された情報から得ること と、 確認の間、前記記憶され情報に関連して前記話し手の発声についての情報を分析 し、前記発声に対する前記テスト情報分析の結果を前記話し手の前記発声用の少 なくとも1つの確率値を得るために前記確率データに供給し、 少なくとも前記確率値に基づいて確認決定を行うことを特徴とする方法。
  12. 12.前記確率データが確率分布関数から得られる数を含むことと、 各前記確率値が前記確率分布関数の1つの部分を積分することにより得られるこ とを含むことを特徴とする請求の範囲第11項に記載の方法。
  13. 13.前記値は平均および分散を含むことを特徴とする請求の範囲第12項に記 載の方法。
  14. 14.1つの前記確率値が氏名詐称者が前記知られている人間であることを間違 って決定する見込みを表示し、他の前記確率値が前記話し手が前記知られている 人間であることを間違って決定する見込みを表示する2つの前記確率値と、2つ の前記確率分布関数を有することを特徴とする請求の範囲第12項に記載の方法 。
  15. 15.前記テスト情報が前記話し手の前記発声の正規化された自己相関係数に基 づくテスト値を含み、前記分析が前記基準値と前記テスト値との間の差を表示す る全体的な歪を得るために前記テスト値と前記基準値との比較することを含むこ とを特徴とする請求の範囲第11項に記載の方法。
  16. 16.前記確率データは前記知られている人間による複数の発声証拠および他の 人間による複数の発声証拠から得られ、前記確率データは以下のものを含む、 前記知られている人間による2つの前記発声証拠の可能な組合わせのための線予 知係数間の差をそれぞれ表示する全体的な歪値の平均値と等しい内部・話し手平 均値と、前記内部・話し手の全体的な歪値の分散値と等しい内部・話し手分散値 と、 前記知られている人間による前記発声と前記他の人間による前記発声との各々の 組合わせ可能性のための線予知係数間の差を各々表示する全体的な歪値の平均値 と等しい相互・話し手平均値と、 前記相互・話し手の全体的な歪値の分散値と等しい内部・話し手の分散値と、お よび第1の前記確率値は前記内部・話し手平均値および分散値によって識別され たガウス形密度関の前記テスト値と基準値の差を表示する前記全体的な歪値から 正の無限大への積分に等しいことと、 相互・話し手平均値と分散値人間によって識別されたガウス形密度関数の負の無 限大から前記テスト値と基準値の差を表示する前記全体的な歪値への積分に等し い第2の前記確率値とを含む請求の範囲第15項に記載の方法。
  17. 17.前記記憶された情報は第1および第2のしきい値を含み、前記方法は更に 前記第1および第2の確率値と前記第1および第2のしきい値間の比較にそれぞ れ基づく確認決定を行うことを含むことを特徴とする請求の範囲第16項に記載 の方法。
  18. 18.請求の範囲第17項のステップは複数回繰り返され、第1の累積する確率 値は総ての前の第1の確率値の積と等しく、第2の累積する確率値は総ての前の 第2確率値の積に等しく、前記確認決定は前記第1および第2の累積する確率値 と前記2つのしきい値とのそれぞれの比較に基づいていることと、前記確認決定 が、もし第1の累積する確率値が前記第1のしきい値より小さく且つ前記第2の 確率値が前記第2のしきい値より大きい時には話し手が前記知られている人間で ないとして拒絶され、もし前記第1の確率値が前記第1のしきい値より大きく且 つ前記第2の累積する確率値が前記第2のしきい値より小さい時には前記話し手 が前記知られている人間であると確認するように決定されることを含む、ことを 特徴とする請求の範囲第17項に記載の方法。
  19. 19.前記しきい値が所望の保証度に従って調節されることを特徴とする請求の 範囲第16項に記載の方法。
  20. 20.話し手が知られている人間かどうか前記知られている人間のスピーチにつ いての基準情報を含む記憶された情報に基づいて確かめる方法において、 前記記憶された情報に関連した前記話し手の発声についてのテスト情報の分析に 基づいて前記話し手が前記知られている人間かどうかを確認することと、 もし前記話し手が前記知られている人間と確認されたときには、前記記憶された 情報を前記テスト情報に基づいて更新することとを含む、ことを特徴とする方法 。
  21. 21.装置が動力を受取ることを認められている知られている人間として話し手 が確認されることに基づいて動力を必要としている装置に動力を供給する装置に おいて、前記知られている人間のスピーチについての記憶された情報に関連した 前記人間の現在の発声の分析に基づいて前記人間が前記知られている人間である と確認し、このときには論理確認信号を出力する装置と、 前記論理信号に応答して前記装置に動力を送る非機械的、非磁気的スイッチとを 含む、ことを特徴とする装置。
  22. 22.前記パーワースインチはパーワーMOSFET装置を含むことを特徴とす る請求の範囲第21項に記載の装置。
  23. 23.前記装置は前記話し手がドアを通れるようにドアロックを解除するための ソレノイドを含むことを特徴とする請求の範囲第21項に記載の方法。
  24. 24.話し手が知られている人間かどうか前記知られている人間のスピーチにつ いての基準情報を含む記憶された情報に基づいて確かめる装置において、 前記確認に関連したキー化された情報を受信しかつコード化されたトーン信号を 発生するキー動作されるトーン発生器と、前記話し手の発声に応答してアナログ 電気信号を発生するマイクロフォンと、 前記トーン信号と前記アナログ信号の両方を搬送するチャネルと、 前記チャネルから受信された信号をディジタル信号に変換するアナログ・ディジ タル変換器と、 前記記憶された情報に関連した前記発声に対応した前記ディジタル信号を前記確 認の部分として分析する記憶されたプログラムによって制御されるディジタルプ ロセッサであって前記プロセッサは前記キー化された情報を得るために前記トー ン信号に対応したディジタル信号を検出し解読するようにプログラムされており 、そして前記装置は前記キー化されている情報に基づいた確認を導くために採用 されていることを特徴とする装置。
  25. 25.複数の話し手が知られている人々かどうかを前記知られている人々のスピ ーチについての情報を含む記憶された情報に基づいて確かめる装置において、 前記複数の話し手からの発声を受信する複数のステーションと、 前記確認の一部として前記記憶された情報に関連した各前記発車を分析すること をプロセッサに可能するように配列された記憶されたプログラムによって制御さ れるディジタルプロセッサとを含み、 前記記憶されたプログラムは前記ディジタルプロセッサに前記異なる発声が同時 に処理されるように異なる前記発声の分析のステップをタイム・インタリーブす るように配列されていることを特徴とする装置。
  26. 26.複数の話し手が知られている人々かどうかを前記知られている人々のスピ ーチについての情報に基づいて確かめる装置において、 前記複数の話し手からの発声を受信しかつ前記話し手の情報を発生する複数のス テーションと、 前記ステーションのそれぞれのユーザに対応する複数のプロセッサと、 前記プロセッサを管理するホストコンピュータであって、複数のプロセッサがリ アルタイムで前記それぞれのステーションに対応できるように複数の前記プロセ ッサの制御をタイム・インタリーブするリアルタイム動作システムにより前記ホ ストコンピュータが制御されることを特徴とする装置。
  27. 27.音響信号源の同一性を確認する方法において、前記音響信号源からの音響 信号を受信することと、前記音響信号源からの第1のパラメータを得ることとそ して前記第1のパラメータは前記音響信号源の物理的特性に対応していることと 、 前記音響信号源から前に受信した音響信号から得た第2のパラメータと前記第1 のパラメータを比較し、これにより前記第1および第2のパラメータの比較を表 示する第1の歪値を発生することと、 前記第1の歪値と他のグループを伴う前記第2のパラメータの複数のグループの 各々の比較を表示する複数の第2の歪値とを比較し、前記第2の歪値は他の音響 信号源からの音響信号の誤り確認に関して対応している確率値を各々同一のもの とみなすことと、 前記第1の歪値と第2の歪値との比較に基づいて第1の誤差値を発生し、前記第 2の歪値の一つによって同一のものとみなされた確率に対応させることと、 前記音響信号源からの第2の音響信号のために上述のステップを繰り返すことと 、 前記ステップの端繰り返しの間の前記第1の誤差値における変化を反映している 第2の誤差値を発生することと、前記第2の誤差値としきい値とを比較すること と、もし第2の誤差値としきい値との関係が予め選択された容認基準に従ってい れば容認信号を発生することを特徴とする方法。
  28. 28.前記第2のパラメータがパラメータのグループを含む、各パラメータのグ ループは前記第1のパラメータに対応した音響信号に類似する特性を有する音響 信号に対応した請求の範囲第27項に記載された如き音響信号源の同一性を確認 する方法。
  29. 29.第1のパラメータと第2のパラメータとを比較するステップが、第1のパ ラメータと前記第2のパラメータのグループの各々を分離的に比較し、これによ り各々比較のための歪値を発生するステップと、 合成値を発生するために各々の比較からの歪値を発生するステップとを含む請求 の範囲28項に記載された如き音響信号源の同一性を確認する方法。
  30. 30.第1の誤差値を発生するステップが、第1および第2の歪値に応答して第 1の歪値より次に大きい第2の歪値を選択するステップと、 第1の誤差値として選択された第2の歪値に関連した確率値を選定するステップ とを含む請求の範囲27項に記載された如き音響信号源の同一性を確認する方法 。
  31. 31.もし第2の歪値が第1の歪値より大きくなけれ選定するステップが、第2 の歪値によって表示された音響信号を発生する音響信号源以外の音響信号源から の音響信号を表示する第1の歪値を示す第1の誤差値に値を選定することを含む 請求の範囲30項に記載された如き音響信号源の同一性を確認する方法。
  32. 32.第2の誤差値が前記方法の以前のステップの各繰り返し内において発生さ れた第1の誤差値に応答して変化された合成値を含み、これにより選択された音 響信号源を確認するために前記方法の実施において発生された誤差値の影響を表 示する表示値を供給する請求の範囲30項に記載された如き音響信号源の同一性 を確認する方法。
  33. 33.第1および第2のパラメータが自己相関係数aa係数を含み、本方法にお いて利用される歪を得るためにパラメータのグループの一つが正規化された自己 相関係数がパラメータの他のグループのaa係数と比較される請求の範囲27項 に記載された如き音響信号源の同一性を確認する方法。
  34. 34.音響信号の受信ステップ前に前記音響信号源から前に受信された別の音響 信号を表示している値の表から音響信号を選択するステップと、 前記音響信号源と通信しかつ前記音響信号源から与えられるべき選択された音響 的な信号を同一のものとみなす敏速な信号を発生するステップとを含む請求の範 囲27項に記載された如き音響信号源の同一性を確認する方法。
  35. 35.音響信号源の同一性を確認する方法において、前記音響信号源からの複数 の音響信号を受信することと、前記音響信号の各々を表示するパラメータを発生 させることと、 前記信号が同一の音響的なメッセージパターンを与えようとする前記音響信号の グループのために、グループ内の音響信号を表示するパラメータ間の差を表示す る第1の値を発生させることと、前記グループからのパラメータと音響的メッセ ージパターンと類似した他の音響信号源からの信号を表示するパラメータとを比 較することと、 前記比較ステップに応答して、他の音響信号源からの信号を表示する前記パラメ ータとグループ内の音響信号を表示する前記パラメータとの間の差を表示する第 2の値を発生することと、前記第1の値のために前記音響信号源からの音響信号 を表示するパラメータに類似する値を有するパラメータによって表示された他の 音響信号源からの音響信号の誤った確認の確率を表示している確率値を発生する ことと、 確認されるべき新しい音響信号を受信することと、前記新しい信号を表示する新 しいパラメータを発生することと、 前記新しいパラメータと前記新しい音響信号として同じ音響的メッセージを各々 が与えようとする音響信号のグループのパラメータとを比較することと、 前記新しいパラメータ比較ステップに応答して、前記音響信号のグループのパラ メータと新しいパラメータ間の差を表示する新しい値を発生することと、 前記新しい差値と前記第1の値を比較し、前記新しい差値に接近した前記第1の 値の1つを選択することと、前記選択された第1の値に関連した確率値に対応し た第1の誤差値を発生することと、 確認されるべき新しい他の音響信号を受信することと、前記他の新しい音響信号 のために新しい音響信号の受信ステップ以下の上述のステップを繰り返すことと 、前記繰り返しステップから生じる第1の合成誤差値を反映する第2の誤差値を 発生することと、 第2の誤差値としきい値とを比較することと、もし第2の誤差値としきい値間の 関係が予め選択された容認基準に従っているときには、容認信号を発生すること を含む方法。
  36. 36.請求の範囲35項に記載された如き音響信号源の同一性を確認する方法に おいて、 複数の音響信号の受信ステップより前に、前記音響信号源を同一のものとみなす 記憶された情報を含む方法。
  37. 37.請求の範囲35項に記載された如き音響信号源の同一性を確認する方法に おいて、 前記複数の音響信号が複数の音響信号のグループを含み、各前記グループは同一 の音響的メッセージを表示している複数の信号を含んでいる方法。
  38. 38.第1の値を得るステップがグループ内の音響信号のパラメータとグループ 内の他の音響信号のパラメータとを比較するステップを含む請求の範囲35項に 記載された如き音響信号源の同一性を確認する方法。
  39. 39.複数の音響信号を受信するステップが、前記音響信号をモニターするステ ップと、前記信号によって表示された音響的なメッセージの開始および終りを検 出するステップとを含み、これにより各々が音響的メッセージを表示する複数の 音響信号を形成する請求の範囲35項に記載された如き音響信号源の同一性を確 認する方法。
  40. 40.音響信号源の同一性を確認する装置において、前記音響信号源からの音響 信号を受信する手段と、前記音響信号源からの第1のパラメータを得る手段と、 そして前記第1のパラメータは前記音響信号源の物理的特性に対応していること と、 前記音響信号源から前に受信した音響信号から得た第2のパラメータと前記第1 のパラメータを比較する手段と、これにより前記第1および第2のパラメータの 比較を表示する第1の歪値を発生することと、 前記第1の歪値と第2の歪値との比較に基づいて第1の誤差値を発生し、前記第 2の歪値の一つによって同一のものとみなされた確率に対応させる手段と、 前記音響信号源からの第2の音響信号を受信することから生じる第1の誤差値に おける変化を反映している第2の誤差値を発生する手段と、 前記第2の誤差値としきい値とを比較する手段と、もし第2の誤差値としきい値 との関係が予め選択された容認基準に従っていれば容認信号を発生する手段とを 備えたことを特徴とする装置。
  41. 41.音響信号源の同一性を確認する方法において、第1の音響信号を受信する ことと、 前記第1の音響信号を表示するテスト値を発生することと、第2の音響信号を受 信することと、 前記テスト値が第1および第2の音響信号を表示するように調節することと、 前記調節されたテスト値をしきい値と比較することと、調節されたテスト値とし きい値との関係が予め選択され容認基準に従っていれば容認信号を発生すること とを含むことを特徴とする方法。
  42. 42.もし調節されたテスト値としきい値との関係が予め選択された容認基準に 従っていないときには、第2の信号を受信するステップから開始する上記のステ ップを繰り返すステップを更に含む請求の範囲41項に記載された如き音響信号 源の同一性を確認する方法。
  43. 43.繰り返しステップの前に、もし調節されたテスト値としきい値との関係が 予め選択された容認基準に従っていなくて、かつ繰り返しステップが予め選択さ れた回数を実行しているときには動作を終了ステップを含む請求の範囲42項に 記載された如き音響信号源の同一性を確認する方法。
  44. 44.動作を終了する前に、もし調節されたテスト値としきい値との関係が予め 選択された容認基準に従っていなくて、かつ繰り返しステップが予め選択された 回数を実行しているときには否容認信号が発生される請求の範囲43項に記載さ れた如き音響信号源の同一性を確認する方法。
  45. 45.前記テスト値を調節するステップが、前記第2の音響信号を表示するテス ト値を発生することと、第1の音響信号を表示するテスト値と第2の音響信号を 表示するテスト値とを乗算することと、 これにより第1および第2の音響信号の前記組合わせを含む値を発生することを 含む請求の範囲41項に記載された如き音響信号源の同一性を確認する方法。
  46. 46.前記第1の音響信号が前記音響信号源からの第1の通信を表示し、前記第 2の音響信号が前記音響信号源からの第2の通信を表示し、前記第2の通信は前 記第1の通信と異なる請求の範囲41項に記載された如き音響信号源の同一性を 確認する方法。
  47. 47.音響信号源の同一性を確認する方法において、各々の第1のテンプレート が選択された音響信号源からの選択された通信の別々の音響的通信の表示を含む 複数の第1のテンプレートを供給することと、 各々の第2のテンプレートが別の音響信号源からの選択された通信の音響的通信 の表示を含む複数の第2のテンプレートを供給することと、 複数の第1のテンプレートのあるものと前記第1のテンプレートの他のものとを 個々に比較して、前記個々のあるもの用の第1の歪値を定義し、前記第1の歪値 は選択された音響信号源からの同じメッセージの別の音律的通信における差を表 示することと、 複数の第1のテンプレートのあるものと複数の第2のテンプレートのあるものと を比較し、他の音響信号源と比較されたものとして選択された音響信号源による 選択された音響的通信における差を表示する第2の歪値を定義することと、第1 の歪値と第2の歪値を比較し、前記第1の歪値のための確率値を発生し、前記確 率値は他の音響信号源からの選択された通信の音響的伝送が選択された第1の歪 値に対する予め決められた関係を有する歪値を有するという見込みの表示を与え ることと、 前記確率値に基づいた音響信号源の容認のためのしきい値を選択することと、 音響信号源からの選択された通信の音響的伝送の表示を含む第3のテンプレート 受信することと、 第3の歪値を定義するために第3のテンプレートと第1のテンプレートとを比較 することと、 しきい値と第3の歪値との関係が予め選択された容認基準に従っているときには 、第3のテンプレートによって表示された音響信号源を容認することとを含むこ とを特徴とする方法。
  48. 48.前記音響信号源を容認するステップの前に、第1の選択された通信と異な る第2の選択された通信のために前記方法のステップを繰り返すステップと、 第3のテンプレートと第1のテンプレートとを比較するステップによって発生さ れた第3の歪の組合わせを含む誤差値を発生するステップと、 前記誤差値としきい値とを比較するステップと、もし前記誤差値としきい値との 関係が予め選択された容認基準に従っていれば第3のテンプレートによって表示 された音響信号源を容認するステップとを含む請求の範囲47項に記載された如 き音響信号源の同一性を確認する方法。
  49. 49.もし誤差値としきい値との関係が予め選択された容認基準に従っていない ときには、請求の範囲28項のステップを繰り返すステップを更に含む請求の範 囲48項に記載された如き音響信号源の同一性を確認する方法。
  50. 50.請求の範囲48項のステップを繰り返すステップの前に、もし誤差値とし きい値との関係が予め選択された容認基準に従っていなくて、かつ請求の範囲4 8項のステップが予め選択された回数実行されていれば前記方法の動作を終了す るステップを含む請求の範囲49項に記載された如き音響信号源の同一性を確認 する方法。
  51. 51.誤差値が第3のテンプレートと第1のテンプレートとを比較するステップ によつて発生された第3の歪を発生を含む請求の範囲48項に記載された如き音 響信号源の同一性を確認する方法。
  52. 52.音響信号源を同一のものとみなすとき容認しきい値を定義する方法におい て、 各々の第1のテンプレートが選択された音響信号源からの選択された通信の別々 の音響的通信の表示を含む複数の第1のテンプレートを供給することと、 各々の第2のテンプレートが別の音響信号源からの選択された通信の音響的通信 の表示を含む複数の第2のテンプレートを供給することと、 複数の第1のテンプレートのあるものと前記第1のテンプレートの他のものとを 個々に比較して、前記個々のあるもの用の第1の歪値を定義し、前記第1の歪値 は選択された音響信号源からの同じメッセージの別の音響的通信にむける差を表 示することと、 複数の第1のテンプレートのあるものと複数の第2のテンプレートのあるものと を比較し、他の音響信号源と比較されたものとして選択された音響信号源による 選択された音響的通信における差を表示する第2の歪値を定義することと、第1 の歪値と第2の歪値を比較し、前記第1の歪値のための確率値を発生し、前記確 率値は他の音響信号源からの選択された通信の音響的伝送が選択された第1の歪 値に対する予め決められた関係を有する歪値を有するという見込みの表示を与え ることと、 前記確率値に基づいた音響信号源の容認のためのしきい値を選択することとを含 むことを特徴とする方法。
  53. 53.音響信号源の同一性を確認する装置において、第1の音響信号を受信する 手段と、 前記第1の音響信号を表示するテスト値を発生する手段と、第2の音響信号を受 信する手段と、 前記第2の音響信号を第1および第2の音4信号組合わせを与えるために調節す る手段と、調節されテスト値としきい値との関係が予め選択された容認基準に従 っているときには容認信号を発生する手段とを備えたことを特徴とする装置。
  54. 54.音響信号の始めと終りを検出する方法において、選択された開始しきい値 レベル以上の音響エネルギーを検出するステップと、 開始エネルギーしきい値以上の音響エネルギー検出された後で且つ前記音響エネ ルギーが選択された第1のしきい値時間期間を越える時間期間の間選択された第 1のアテンションしきい値レベル以上である時に音響信号の始めと同一のものと みなすステップと、 前記音響エネルギーが選択された終了信号しきい値レベル以下に落ちる時を検出 するステップと、 前記音響エネルギーが選択された終了信号しきい値レベル以下に落ちる時が検出 された後でかつ前記音響エネルギーが選択された第2のしきい値時間期間を越え る時間期間の間選択された第2のアテンションしきい値レベル以上てある時に音 響信号の終りと同一のものとみなすステップとを含むことを特徴とする方法。
  55. 55.音響エネルギーを検出するステップに続き、かつ前記音響エネルギーが選 択された開始スピーチしきい値レベル以上でないときに、該方法はノイズを含む 信号のために測定されている自己相関関数の値から予め選択された距離以上のユ ークリッド距離を正規化された自己相関関数が有する状態における他の開始信号 しきい値レベル以上の音響エネルギーを検出するステップを含む請求の範囲54 項に記載された如き音響信号源の始めと終りを検出する方法。
JP61503732A 1985-07-01 1986-07-01 話者照合装置 Pending JPS63500126A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US75103185A 1985-07-01 1985-07-01
US751031 1985-07-01

Publications (1)

Publication Number Publication Date
JPS63500126A true JPS63500126A (ja) 1988-01-14

Family

ID=25020188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61503732A Pending JPS63500126A (ja) 1985-07-01 1986-07-01 話者照合装置

Country Status (4)

Country Link
EP (1) EP0233285A4 (ja)
JP (1) JPS63500126A (ja)
AU (1) AU6128586A (ja)
WO (1) WO1987000332A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010276697A (ja) * 2009-05-26 2010-12-09 Waseda Univ 音声処理装置およびプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990008379A1 (en) * 1989-01-17 1990-07-26 The University Court Of The University Of Edinburgh Speaker recognition
US5054083A (en) * 1989-05-09 1991-10-01 Texas Instruments Incorporated Voice verification circuit for validating the identity of an unknown person
GB2237135A (en) * 1989-10-16 1991-04-24 Logica Uk Ltd Speaker recognition
GB0427205D0 (en) 2004-12-11 2005-01-12 Ncr Int Inc Biometric system
US9251792B2 (en) 2012-06-15 2016-02-02 Sri International Multi-sample conversational voice verification
CN116052688B (zh) * 2021-10-28 2025-07-25 厦门快商通科技股份有限公司 一种语音鉴别方法、终端设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3673331A (en) * 1970-01-19 1972-06-27 Texas Instruments Inc Identity verification by voice signals in the frequency domain
DE2511233C2 (de) * 1975-03-14 1977-03-10 Dornier Gmbh Verfahren zur Verhinderung ungewollter Land- oder Wasserberührung von in niedriger Höhe fliegenden Fluggeräten
US4032711A (en) * 1975-12-31 1977-06-28 Bell Telephone Laboratories, Incorporated Speaker recognition arrangement
GB1569450A (en) * 1976-05-27 1980-06-18 Nippon Electric Co Speech recognition system
DE2844156A1 (de) * 1978-10-10 1980-04-24 Philips Patentverwaltung Verfahren zum verifizieren eines sprechers
JPS6057261B2 (ja) * 1980-03-18 1985-12-13 日本電気株式会社 多回線音声入出力装置
JPS5870292A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 車両用音声認識装置
JPS5876893A (ja) * 1981-10-30 1983-05-10 日本電気株式会社 音声認識装置
JPS59178587A (ja) * 1983-03-30 1984-10-09 Nec Corp 話者確認システム
IT1160148B (it) * 1983-12-19 1987-03-04 Cselt Centro Studi Lab Telecom Dispositivo per la verifica del parlatore

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010276697A (ja) * 2009-05-26 2010-12-09 Waseda Univ 音声処理装置およびプログラム

Also Published As

Publication number Publication date
EP0233285A1 (en) 1987-08-26
EP0233285A4 (en) 1987-12-01
WO1987000332A1 (en) 1987-01-15
AU6128586A (en) 1987-01-30

Similar Documents

Publication Publication Date Title
US6161090A (en) Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US9183367B2 (en) Voice based biometric authentication method and apparatus
US10476872B2 (en) Joint speaker authentication and key phrase identification
US5548647A (en) Fixed text speaker verification method and apparatus
AU2013203139B2 (en) Voice authentication and speech recognition system and method
US6272463B1 (en) Multi-resolution system and method for speaker verification
EP0983587B1 (en) Speaker verification method using multiple class groups
Li et al. Automatic verbal information verification for user authentication
US5937381A (en) System for voice verification of telephone transactions
US8433569B2 (en) Method of accessing a dial-up service
JP2007133414A (ja) 音声の識別能力推定方法及び装置、ならびに話者認証の登録及び評価方法及び装置
JPH11327585A (ja) 自由音声評点法を用いた動的音声認識の方法および装置
Campbell Jr Speaker recognition
CN1213398C (zh) 使用行为模型来进行无干扰的说话者验证的方法和系统
Li et al. Recent advancements in automatic speaker authentication
Ma et al. English-Chinese bilingual text-independent speaker verification
JPS63500126A (ja) 話者照合装置
Singh et al. Voice disguise by mimicry: deriving statistical articulometric evidence to evaluate claimed impersonation
Furui Speech and speaker recognition evaluation
US9978373B2 (en) Method of accessing a dial-up service
GB2637501A (en) An authentication system and method
CN118474256A (zh) 基于声纹识别的身份认证方法、系统、设备、介质和产品
CN117351945A (zh) 身份鉴权方法、装置及介质
McInnes et al. User response to prompt wording styles in an automated banking service with a Wizard of Oz simulation of word-spotting
Chao Verbal Information Verification for High-performance Speaker Authentication