JPS6131477B2

JPS6131477B2 -

Info

Publication number: JPS6131477B2
Application number: JP53087849A
Authority: JP
Inventors: Hiroaki Sekoe
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1978-07-18
Filing date: 1978-07-18
Publication date: 1986-07-21
Also published as: GB2031206A; US4286115A; GB2031206B; JPS5529803A

Description

【発明の詳細な説明】

本発明は１個以上の単語を連続して発声した連
続音声を自動的に認識する連続音声認識装置の改
良に関する。音声認識装置は計算機等へのデータや制御命令
等の入力手段として多くの優れた特徴をもつてい
る。しかし、現在までに開発されている音声認識
装置では、連続音声を認識することができず、単
語を１個ずつ区切つて発声して入力しないと正確
に動作しないという欠点を持つている。この結果
として多桁の数字データーを入力する場合には、
１桁ずつ区切らなければならず、このため、従来
の音声認識装置はデータの入力速度が低く、使用
者にとつて不便なものである。音声認識の手法としては従来から種々の方法が
試みられてる。それらの中で最も簡単でしかも有
効な方法としてパタンマツチング法と呼ばれるも
のがある。この方法は認識すべき語彙の各単語に
標準的なパタン（以下標準パタンと称する）を用
意しておき、入力された未知の音声パタン（以下
入力パタンと称する）との間で比較操作（すなわ
ちパタンマツチング）を行なつて、一致の度合を
表わす量（以下類似度と称する）を算出し、最も
類似した、すなわち、類似度が最大になる標準パ
タンと同じ単語に属すると判定する方法である。「特願昭50−132003号」には上記パタンマツチ
ング法を基礎として動作する連続音声認識装置の
動作原理が記載されている。この原理は大略次の
ようである。すなわち、何個かの標準パタンをあ
らゆる順列で接続することによつて得られるパタ
ンを連続音声の標準パタンと考えて入力パタン全
体とのマツチングを行なう。この結果得られる類
似度が最大となるような標準パタンの個数と標準
パタンの順列組合せを定めることによつて認識を
行なう。実際には上記最大化を単語単位としての
最大化処理と全体としての最大化処理との２段階
に分割し、それぞれの最大化を動的計画法を利用
して実行することによつて処理量を低減して実用
的な処理速度を達成している。以上述べた「特願
昭50−132003号」記載の方法が従来では最も有効
な連続音声認識法であると考えられる。実際の音声認識装置では常に多少の誤認識が発
生する傾向がある。これは標準パタンを入力する
ための発声と、実際のデータを入力するための発
声とが異なるために生じるもので、発声者が注意
して発声してもある程度の確率で誤認識が生じる
のは避けられない。したがつて、運用面でさしつ
かえない範囲での制約を設け誤認識を低減する努
力が必要となる。今、実際の適用業務例として商
店における売上データ入力を考えて見る。この場
合、入力データフオーマツトとして(1)商品名、(2)
売上個数の順序を考える。商品名は“キヤラメ
ル”“チヨレート”“アメ”、等のように直接品名
を入力し、売上個数は必らず３桁の数字で入力す
るものとする（例“003”、“019”、“100”）。この
ような場合には、フオーマツト情報を利用しない
と、入力される最初の単語（商品名）を数字とし
て判定してしまうとか、逆に数字の部分を商品名
と誤るといつた誤認識が発生する可能性がある。
もし、認識処理の過程でフオーマツト情報を利用
し、第１単語は必らず商品名と判定し次の３単語
は数字であるとの条件のもとに判定することがで
きれば上例のような誤認識は防止できる。別の例
として生年月日データの入力を考える。例えば
280925（ニイハチゼロキユウニーゴー）の形式で
昭和28年９月25日と言う生年月日を入力するもの
とする。この場合、昭和は現時点で53年までであ
るから第１桁は０〜５、第２桁は０〜９の数字が
発生し得る。また、月は01〜12であるから第３桁
は０か１、第４桁は０〜９となる。最後の２桁は
表わすから第５桁は０〜３、第４桁は０〜９の範
囲となる。したがつて、第１桁は０〜５、第３桁
０〜１、第５桁は０〜３と制限すると、68年と
か、29月あるいは47日というような異常なデータ
への誤認識は防止できる。本発明の目的は前記「特願昭50−132003号明細
書」記載の連続音声認識装置にフオーマツトに基
づいて判定を行なう機能を付加し実用業務に当つ
てより誤認識の少ない連続音声認識装置を提供す
ることにある。本発明による装置の構成を述べるに先だつて音
声パタン認識に関連する基礎的事項を説明してお
く。音声パタンはスペクトラム分析法等による分
析と分析結果の時間標本化とによつて特徴ベクト
ルａ_iの時系列として表現できる。Ａ＝a₁、a₂、………、ａ_i、………、ａ_I (1) いま、単語をその分類を表わす番号ｎによつて
指定するものとしてｎ＝１、２、………、Ｎとい
うＮ種類の単語セツトを語彙として考える。単語
ｎの標準パタンをＢⁿで示すことにする。Ｂⁿ＝ｂ^ｎ _１、ｂ^ｎ _２、………、ｂ^ｎ _ｊ、………ｂ^ｎ _Ｊ
ｎ(2) 上記の如き入力パタンＡと標準パタンＢ（標準
パタンを一般的に代表するもの）との間の類似性
の尺度として類似度なる量を定義し、Ｓ（Ａ、
Ｂ）と示す。また、上に述べたフオーマツト指定
をＦ＝f₁、f₂、………、ｆ_x、………、ｆ_k (3) によつて示す。ここにｆは第ｘ単語として指定さ
れる単語群を与えるもので例えば次の形式で与え
られる。 fx＝｛ｎ^１ _ｘ、ｎ^２ _ｘ、ｎ^３ _ｘ｝ (4) これは第ｘ桁として単語ｎ^１ _ｘ、ｎ^２ _ｘｎ、^３ _ｘのい
ずれ
かのみが許されることを意味する。本発明の連続音声認識装置は入力音声を特徹ベ
クトルａ_iの時系列として表現される入力パタン
Ａ＝a₁、a₂、………、ａ_i、………、ａ_Iに変換す
るための入力部と、単語ｎの標準パタンＢ＝ｂ
^ｎ _１、ｂ^ｎ _２、………ｂ^ｎ _ｊ、………、ｂ^ｎ _Ｊｎを各単
語に対
して記憶するための標準パタン記憶部と、前記入
力パタンＡとして連続発声入力が許容される単語
数ｋと、連続発声中の第ｘ単語として許容される
単語群ｆ_xの時系列Ｆ＝f₁、f₂、………ｆ_x、……
…ｆ_kとしてフオーマツトを指定するためのフオ
ーマツト指定部と、前記入力パタンＡの時間点ｉ
＝ｌを始端とし時間点ｉ＝ｍを終端とする部分時
系例ａ_l+1、ａ_l+2………、ａ_nとして定義される部
分パタンＡ（ｌ、ｍ）と前記標準パタン標準パタ
ンＢⁿとの類似度Ｓ（ｌ、ｍ、ｎ）をすべての単
語類ｎに関して算出するための類似度計算部と、
前記入力パタンＡを前記フオーマツト指定部によ
り指定される単語数たるｋ個の部分パタンＡ
（ｌ、ｍ）の群Ａ（０、ｌ(1)）、Ａ（ｌ(1)、ｌ
(2)）、………、Ａ（ｌ（ｋ−１）、Ｉ）に分解しそ
れぞれの部分パタンに前記フオーマツト指定部に
よつてそれぞれ許容される条件、すなわちｎ
（ｘ）∈ｆ_xの条件のもとに単語ｎ(1)、ｎ(2)、……
…ｎ(k)を割り当て前記類似度の群Ｓ（０、ｌ(1)
ｎ(1)）、Ｓ（ｌ(1)、ｌ(2)、ｎ(1)）、………Ｓ（ｌ
（ｋ−１）、Ｉ、ｎ(k)）の総和が区分点群ｌ(1)、ｌ
(2)、………、ｌ（ｋ−１）及び単語群ｎ(1)、ｎ
(2)、………、ｎ(k)の定め方に関して最大になるよ
うに前記区分点群と、単語群とを決定する機能を
有する全体マツチング部とから構成されている。このような構成によると、フオーマツト指定に
違反した結果に誤認識される可能性は排除され、
従来装置に比べてより高い認識性能を備えた連続
音声認識装置が実現できる。次に図面を参照して本発明を詳細に説明する。第１図は本発明の装置が実行する認識原理を既
念的に示すための図である。説明を容易にするた
めに、先に述べた生年月日データ入力業務を例に
とつて説明する。信号線SPを経由して入力され
る音声波形は入力部１０によつて分析処理され、
(1)式のような入力パタンＡに変換され入力パタン
バツフア１１に送られ一時保持される。標準パタ
ン記憶１３には(2)式の形式で数字“０”〜“９”
の標準パタン群B⁰、B¹、………Ｂⁿ、………B¹⁰が
記憶されている。また、フオーマツト指定部には
入力されるデータの桁数としてｋ＝６が、また各
桁に許される数字がＦ＝f₁、f₂、f₃、f₄、f₅、f₆ (5) の形式で与えられる。年月日データと言う制約か
ら f₁＝｛０、１、２、３、４、５｝ f₃＝｛０、１｝ f₅＝｛０、１、２、３｝ f₂＝f₄＝f₆ ＝｛０、１、２、３、４、５、６、７、８、
９｝と定義され記憶されている。接続部１４は前記標
準パタン記憶１３より複数個の標準パタンＢⁿ
(1)、Ｂⁿ(2)、………Ｂⁿ(6)を読み出し接続すること
によつて連続音声標準パタン＝Ｂⁿ(1)Ｂⁿ(2)………Ｂ^n(x)………Ｂⁿ(6) (6) を生成して標準パタンバツフア１５に送る。ここ
になる記号はパタンの接続を表わす演算子であ
る。例えば、ＢⁿＢ^mはＢⁿＢ^m＝ｂ^ｎ _１、ｂ^ｎ _２、………ｂ^ｍ _Ｊｏ、ｂ^ｍ _１、ｂ^ｍ _２、………ｂ^ｍ _Ｊｎ (7) であることを意味する。なお、(6)式におけるｎ(6)
の６はフオーマツト指定部１２により指定される
単語数ｋである。また、各桁の単語ｎ（ｘ）は(5)
式のフオマツト指定に従うものとする。すなわ
ち、ｎ（ｘ）∈ｆ_x (8) なる制約が課せられる。この制約のもとに許され
るすべてのｎ（ｘ）の順列組合せに関して(6)式の
連続音声標準パタンが接続部１４によつて生成
され標準パタンバツフア１５に送られる。マツチ
ング部１６では前記入力パタンバツフア１１に保
持される入力パタンＡと前記標準パタンバツフア
１５に保持される前記連続音声標準パタンとの
パタンマツチングが行なわれ、類似度Ｓが出力さ
れる。この処理は接続部１４によつて生成される
すべての連続音声標準パタンに対して行なわ
れ、それぞれの場合の類似度Ｓが算出され順次出
力される。判定部１７では前記マツチング部１６
によつて算出される類似度Ｓを比較してその最大
値を決定するとともに、その最大値を与える連続
単語標準パタンを決定する。このに対応する
単語ｎ(1)、ｎ(2)、………ｎ(6)を定めることによつ
て入力パタンＡは単語群ｎ＾(1)、ｎ＾(2)、………、ｎ
＾
(6)であると判定する。かくの如き原理によると、
接続部１４ではフオーマツト指定の範囲内での連
続単語標準パタンののみが生成されるのでフオ
ーマツト指定外の認識結果が出力される恐れはな
い。上記の原理を数式的に表現すると次のようにな
る。すなわち最大問題Ｔ＝max〔Ｓ（Ａ、Ｂⁿ(1)Ｂⁿ(2)………Ｂ^n(x)………Ｂⁿ(6)）〕ｎ（ｘ）∈ｆ_x (12) を計算し、最適パラメタｎ（ｘ）＝ｎ＾（ｘ）、ｘ＝
１、２、………６を求める。認識結果はｎ＾(1)、ｎ＾
(2)、………、ｎ＾(6)で与えられる。しかし、上記原
理を単語ｎ（ｘ）の組合せに関する総当りで処理
すると膨大な計算量が必要となる。それはｎ(1)、
ｎ(2)、………、ｎ(6)の組合せが多くなるからであ
つて、この例では６×10×３×10×４×10＝
72000の組合せとなる。したがつて、これだけの
回数のパタンマツチングがマツチング部１６によ
つてなされる必要がある。本発明では前記「特願昭50−132003号」明細書
記載の装置で行なわれているのと同様に、(12)式の
最大化を分解して計算することによつて実用的な
処理速度を可能とする。すなわち入力パタンＡの
時間軸上に（ｋ−１）すなわち５個の区分点ｌ
(1)、ｌ(2)、………、ｌ（ｘ）、………、ｌ(5)を仮
定して入力パタンＡをｋすなわち６個の部分パタ
ンに分解して考える。Ａ＝Ａ（ｌ（０）、ｌ(1)）Ａ（ｌ(1)、ｌ(2)）………Ａ（ｌ（ｘ−１）、ｌ（ｘ））………Ａ（ｌ(5)、ｌ
(6)）（13）ここにｌ（０）＝０、ｌ(6)＝Ｉ（(1)式参照）と
仮定している。部分パタンは一般に次のように定
義される。Ａ（ｌ、ｍ）＝ａ_I+1、ａ_I+1、………、am（14）今、２個の音声パタンＡ＝a₁、a₂、………ａ_i、
………ａ_IとＢ＝b₁、b₂、………、ｂ_j、………ｂ
_Jとの間の類似度を前記引用文献と同様にと定義する。ここに、ｒ（ｉ、ｊ）はベクトルａ
_iとｂ_jとの間の類似の度合を示す量であり、例え
ば、相関値である。関数ｊ＝ｊ（ｉ）は単調増加
な関数であつて始端に関してｊ(1)＝１終端に関してｊ（Ｉ）＝Ｊなる条件を満足するものとする。このような定義
による類似度Ｓ（Ａ、Ｂ）はパタンの接続部分に
関して次の性質を有する。Ｓ（Ａ、Ｂ^mＢⁿ）＝max〔Ｓ（Ａ（０、ｌ）、Ｂ^m）Ｓ（Ａ（ｌ、Ｉ）、Ｂⁿ）〕 (12)式に（13）式を代入してさらに（16）式の関
係を繰返し適用し整理すると、ここにＳ（ｌ、ｍ、ｎ）なる記法は部分パタン
Ａ（ｌ、ｍ）と標準パタンＢⁿとの間の類似度Ｓ
（Ａ（ｌ、ｍ）、Ｂⁿ）を簡単化して記したもので
ある。（17）式の最大問題は次のように３段階に
分解して計算できる。〈第１段〉類似度Ｓ（ｌ、ｍ、ｎ）＝Ｓ（Ａ（ｌ、ｍ）、Ｂ
ⁿ）（18）をすべての部分区間Ａ（ｌ、ｍ）と標準パタンＢ
ⁿとの組合せに関して算出する。〈第２段〉部分類似度及び部分判定結果をすべてのｌ、ｍ、ｘの組合せに対して計算す
る。ここにargmax〔〕なる記号はｎ∈ｆ_xなる
条件のことで〔〕内の値を最大にするパラメタ
ｎを求めることを意味する。〈第３段〉なる最大問題を計算し最適なパラメタｌ（ｘ）＝
ｌ＾（ｘ）、ｘ＝１、２、………、６を求める。特
願昭50−132003号明細書に記載されるごとく、
（21）式の最大問題は次の漸化式計算によつて解
かれる。初期条件Ｔ（ｏ、ｏ）＝ｏ漸化式仮区分点（22）式と（23）式の計算は１≦ｘ≦６、１≦
ｍ≦１の範囲でｘとｍに関しては増加方向に計算
する。以上の処理が終了すると（23）式のＬ（ｍ、
ｘ）から区分点ｌ＾（ｘ）が次の如く決定される。 (a) 初期条件ｘ＝６、ｌ＾(6)＝Ｉ（24−ａ） (b) 漸化式（ｘ＝５、４、３、２、１）ｌ（ｘ）＝Ｌ（ｌ＾（ｘ＋１）、ｘ＋１）
（24−ｂ）かくして得られる区分点ｌ（ｘ）をもとにして
（20）式を部分伴定結果Ｎ＾（ｌ、ｍ、ｘ）を参照
することにより (c) ｎ（ｘ）＝Ｎ＾（ｌ（ｘ−１）、ｌ（ｘ）、ｘ）
、ｘ＝１、２、………、６（24−ｃ）なる認識結果が得られる。本発明による装置は以
上の動作原理を効率よく実行するものである。第２図は本発明の一実施例を示す図である。信
号線SPより入力される音声波形信号はスペクト
ラムアナライザで構成される入力部１０によつて
周波数分析され時間標本化、デイジタル化の処理
を受けて(1)式の如き入力パタンＡに変換され入力
パタンバツフア１１に入力される。なお、スペク
トラムアナライザは一例として「特願昭52−
23610号」に記載されたデイジタル周波数分析装
置によつて構成することができる。また、この入
力部１０には入力音声のエネルギーレベルを検定
することによつて音声の始端と終端を決定する機
能を有する。これにより音声の始端時点でパルス
Ｐ_sを、終端時点でパルスＰ_eをそれぞれ発生す
る。他の各部は前記パルスＰ_sが発生された時点
以後動作を開始する。制御部３１は前記始端時点
パルスＰ_sが与えられて以後内蔵するカウンタに
よつて時刻信号m₁を１より始めて計数し続け
る。なお、この計数は入力部１０より特徴ベクト
ルａ_iが１個入力される毎に行なわれる。パルス
信号Ｐ_s、Ｐ_e及びカウンタ信号m₁の変化の様子を
第３図のタイムチヤートに示す。類似度計算部は入力パタンバツフア１１と第１
マツチング部２１とから構成されている。以下に
入力パタンバツフア１１に特徴ベクトルａ_n（ｍ
はカウンタ信号m₁によつて指定される）が１個
入力される毎に各部によつて実行される動作を説
明する。第１マツチング部２１では標準パタン記
憶部１３に記憶される標準パタンＢⁿと、入力パ
タンバツフア１１に記憶される現時点までに入力
された音声パタンa₁、a₂、………、ａ_i、………ａ
_nとを基にして（18）式の類似度Ｓ（ｌ、ｍ、
ｎ）を計算する。具体的には次の動的計画計算に
よつて行なわれるが、これは前記「特願昭50−
132003号」記載の装置と同一である。すなわち、初期条件ｇ（ｉ、Ｊⁿ）＝ｒ（ｍ、Ｊⁿ）、ｉ＝ｍ＝ｏ、
ｉ＝ｍ（25）漸化式

【表】制約条件（整合窓）と呼ぶ）ｊ＋ｍ−Ｊⁿ−ｒ≦ｉ≦ｊ＋ｍ−Ｊⁿ＋ｒ（27）なる漸化式計算をｊ＝Ｊⁿ、Ｊⁿ−１、Ｊⁿ−２、
………、１の順序で行なうことによつて、次の類
似度Ｓ（ｌ、ｍ、ｎ）＝ｇ（ｌ＋１、１）（28）をｍ−Ｊⁿ−ｒ≦１≦ｍ−Ｊⁿ＋ｒ（29）なる範囲で算出し、信号Ｓとして出力する。この
マツチング部２１の構成は「特願昭51−18346
号」明細書第３図に記載された回路によつて構成
される（28）式の類似度は各標準パタンＢⁿに対
して（29）式の範囲で算出される。（27）式の整
合窓の広さｒは、実際の発声において生じる発声
速度変化あるいはそれによつて引き起される標準
パタンと入力パタンとの間に時間軸のずれを包含
できるように十分大きく設定される。それゆえ、
類似度（28）式は（29）式の範囲内のみで考えれ
ば十分である。それ以外では類似度Ｓ（ｌ、ｍ、
ｎ）＝−∞（負の無限大）として処理する。フオーマツト指定部２２にはフオーマツト指定
(5)が記憶されており、カウンタ信号m₁のサイク
ル内にf₁、f₂、f₃、f₄、f₅が次々にフオーマツト信
号ｆ_xとして出力される。全体マツチングは最大
値選択回路２３、バツフア２４、バツフア２５、
第２マツチング部２６、レジスタ２７、バツフア
２８、バツフア２９、及び判定部３０から構成さ
れている。最大値検出部２３では前記第１マツチ
ング部２１より信号Ｓとして入力されるＳ（ｌ、
ｍ、ｎ）とフオーマツト指定部２２より入力され
るフオーマツト信号ｆ_xとに基づいて部分類似度
Ｓ＾（ｌ、ｍ、ｘ）（19）式と部分判定結果Ｎ＾
（ｌ、ｍ、ｘ）（20）式とが計算されそれぞれ信号
S₁と信号l₁として出力される。この処理は、例え
ばf₅＝｛０、１、２、３｝の場合次のように行な
われる。(a)類似度群Ｓ（ｌ、ｍ、０）、Ｓ（ｌ、
ｍ、１）、Ｓ（ｌ、ｍ、２）、Ｓ（ｌ、ｍ、３）の
最大値を決定して信号S₁として出力する。(b)前記
最大値を与える単語番号ｎを定めて信号n₁として
出力する。かくして、計算される部分類似度Ｓ＾
（ｌ、ｍ、ｘ）と部分判定結果Ｎ＾（ｌ、ｍ、ｘ）
はそれぞれバツフア２４及びバツフア２５の
（ｌ、ｘ）番地（ｌは信号線l₁によりｘは信号線
x₁によつて指定される）に記憶される。なお、カ
ウンタ信号m₁の各サイクル毎に対して上記バツ
フア２４と２５内の内容は、ただちに処理され、
次のサイクルでは更新されるので、カウンタ信号
m₁にるアドレス指定は不要である。部分類似度
Ｓ＾（ｌ、ｍ、ｘ）と部分判定結果Ｎ＾（ｌ、ｍ、
ｘ）は必要なすべての（ｌ、ｘ）の組合せに対し
て計算される。当然ｌ＜ｍ、０≦ｘ≦９（10数字
の場合）である。カウンタ信号m₁の各サイクルの前半で以上の
処理が終了すると、（22）、（23）式の計算が開始
される。レジスタ２７は（30）式のＴ（ｍ、ｘ）
を記憶するためのメモリーである。第２マツチン
グ部２６からはアドレス信号l₂とx₂が発生され
る。これによつ（30）式のｌ及びｘが指定され、
前記バツフア２４より部分類似度Ｓ＾（ｌ、ｍ、
ｘ）が、バツフア２５からは部分判定結果Ｎ＾
（ｌ、ｍ、ｘ）が、レジスタ２７より漸化式値Ｔ
（ｌ、ｘ−１）が出力される。なお、アドレス信
号l₂は０≦ｌ≦ｍの範囲でアドレス信号x₂は１≦
ｘ≦６の範囲でそれぞれ変化される。これらをも
とに（22）、（23）式の計算を行なう回路は一例と
して「特願昭51−13846号明細書第５図」に示さ
れた如く構成できる。なお、本実施例では以上の
処理と並行して仮判定結果Ｎ（ｍ、ｘ）＝Ｎ＾（ｌ＾、ｍ、ｘ）、
（29）なる計算が行なわれる。ただし、ｌ＾＝Ｌ（ｍ、ｘ）（（23）式参照）。かくして得られる漸化式値Ｔ（ｍ、ｘ）、仮区
分点Ｌ（ｍ、ｘ）、仮判定結果Ｎ（ｍ、ｘ）はそ
れぞれレジスタ２７、バツフア２８、バツフア２
６に、カウンタ信号m₁及びアドレス信号x₂によ
り番地指定されて書込まれる。以上述べた第１マツチング部と第２マツチング
部の動作は入力パタンバツフア１１に新たなベク
トルａ_nが入力される毎に繰り返され、これに同
期してカウンタ信号m₁（＝ｍ）は１ずつ増加さ
れる。音声信号の入力が終了すると第３図のタイ
ムチヤートに示すように終端検出を意味するパル
スＰ_eが入力部１０により発生される。この時点
以後判定部３０は（24−ａ）、（24−ｂ）、（24−
ｃ）式に示される判定動作を実行する。最初、
（24−ａ）式の初期条件を設定する。すなわち、
ｘをカウントするための信号x₄にフオーマツト指
定部２２から信号線Ｋにより与えられる単語数ｋ
＝６がセツトされる。同時に、その時点で信号
m₁によつて指定されている入力パタン長Ｉを信
号m₄とする。以下は（24−ｂ）式を実行するこ
とによつて区分点ｌ＾（ｘ）をバツフア２８より信
号線l₄を経由して読み出す。なお、（24−ｂ）式
における引数ｌ＾（ｘ＋１）は信号m₄によつて指
定される。認識結果は仮判定結果Ｎ（ｍ、ｘ）の
バツフア２９からｎ＾（ｘ）＝Ｎ（ln^（ｘ）、ｘ）（30）の形で信号m₄として読み出される。（30）式にお
ける引数ｌ＾（ｘ＋１）は信号m₄により、ｘは信
号x₄により指定される。かくして最初の認識結果
ｎ＾(6)が得られ信号n₀として出力される。次にm₄
＝ｌ＾（ｘ）としかつカウンタ信号x₄を１だけ減じ
た後以上の動作を繰返すことによつて次の認識結
果ｎ＾(5)が得られる。同様の繰返しによつて認識結
果ｎ＾(4)、ｎ＾(3)、ｎ＾(2)、ｎ＾(1)が順次（逆順に
）得ら
れ、信号線n₀より出力される。かくの如き動作を
実行するための、判定部３０は一例として「特願
昭51−13846号明細書第７図」に記載された如き
回路によつて構成できる。以上本発明の原理を実施例にもとづいて説明し
たが、これらの記載は本発明の範囲を限定するを
のではない。特に、フオーマツト指定部によるフ
オーマツト指定の方法は種々考えられる。例え
ば、フオーマツトは固定されたものではなく外部
からの制御によつて変化する形態であつてもよ
い。また、本明細書では類似度を基にして認識す
る動作を説明したが、距離のように大小関係が逆
の尺度によつても同様な処理が可能である。この
場合には上記実例中における最大化処理をすべて
最小化処理に置換するとよい。

【図面の簡単な説明】

第１図は本発明の原理を説明するための図、第
２図は本発明の一実施例を示す図および第３図は
前第２図の動作を説明するためのタイムチヤート
である。第１図および第２図において、１０は入力部、
１１は入力パタンバツフア、１２はフオーマツト
指定部、１３は標準パタン記憶、１４は接続部、
１５は標準パタンバツフア、１６はマツチング
部、１７は判定部、２１は第１マツチング部、２
２はフオーマツト指定部、２３は最大値検出部、
２４と２５はバツフア、２６は第２マツチング
部、２７はレジスタ、２８と２９はバツフア、３
０は判定部である。

Claims

【特許請求の範囲】

１入力音声を分析して特徴ベクトルａ_iの時系
列たる入力パタンＡ＝a₁、a₂、………、ａ_i……
…、ａ_Iに変換するための入力部と、単語ｎの標
準パタンＢⁿ＝ｂ^ｎ _１、ｂ^ｎ _２、………ｂ^ｎ _ｊ、………
、ｂ
^ｎ _Ｊｎを各単語に対して記憶するための標準パタン
記憶部と、前記入力パタンＡとして連続発声入力
が許容される単語数ｋと、連続発声中の第ｘ単語
として許容される単語群ｆ_xの時系列Ｆ＝f₁、f₂、
………ｆ_x………ｆ_kとして単語生起順序たるフオ
ーマツトとを指定するためのフオーマツト指定部
と、前記入力パタンＡの時間点ｉ＝ｌを始端とし
時間点ｉ＝ｍを終端とする部分パタンＡ（ｌ、
ｍ）と前記標準パタンＢⁿとの間の類似度Ｓ
（ｌ、ｍ、ｎ）をすべての単語類ｎに関して算出
するための類似度計算部と、前記入力パタンＡを
前記フオーマツト指定部により指定される単語数
であるｋ個の部分パタンＡ（ｌ、ｍ）の群Ａ
（０、ｌ(1)）、Ａ（ｌ(1)、ｌ(2)）、………、Ａ（ｌ
（ｋ−１）、Ｉ）に分解しそれぞれの部分パタンに
対して前記フオーマツト指定部によつて許容され
る条件、すなわちｎ（ｘ）∈ｆ_xの条件のもとに
単語ｎ(1)、ｎ(2)、………、ｎ(k)を割り当て前記類
似度の群Ｓ（０、ｌ(1)、ｎ(1)）、Ｓ（ｌ(1)、ｌ
(2)、ｎ(2)）、………、Ｓ（ｌ（ｋ−１）、Ｉ、ｎ
(k)）の総和が区分点群ｌ(1)、ｌ(2)、………、ｌ
（ｋ−１）、及び単語群ｎ(1)、ｎ(2)、………、ｎ(k)
の定め方に関して最大となるようにし最適なパラ
メタｎ＾(1)、ｎ＾(2)、………、ｎ＾(k)を認識結果と
して
出力する処理を実行する全体マツチング部とから
構成されたことを特徴とする連続音声認識装置。