JPH0293694A

JPH0293694A - パターン作成装置

Info

Publication number: JPH0293694A
Application number: JP63248207A
Authority: JP
Inventors: Fumio Maehara; 文雄前原
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1988-09-30
Filing date: 1988-09-30
Publication date: 1990-04-04

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は、不特定多数の利用者を対象とした文字や音声
の認識装置に用いる標準パターン作成装置に関する。

従来の技術従来、認識装置、例えば音声認識装置（樺沢他；バネ特
定話者単語認識ボード“日本音響学会講演論文集１）Ｌ
１４５−１４Ｇ昭和５９年３月）や文字・図形の認識装
置などでは、入力データを分析することによって得られ
るｎ次元の特徴ベクトル系列ａに対して、予め装置内に
登録しであるｐ個の標ｆｆ４パターンベクトル系列すの
中から、これと距離の最も近いもの、もしくは類似性の
大きいものをもって認識結果としているものが大部分で
ある。

ところで、辞書として、あらかじめ装置内に登録しであ
る標準パターンベクトル列としては、特定の利用者を対
象として使用者が認識装置の使用に先だって、該当パタ
ーンを発声しておき、これを用いるもののほか、複数の
利用者から集められた多数のデータをもとに、これらの
データから得られた多数のデータをグループ化して、グ
ループを代表する特徴パターンを標準パターンとするい
わゆる、不特定話者音声認識装置がある。

音声認識装置に用いる標準パターン作成のためエル　ア
ール　ラヒ゛ナー　　　　　　　　　　　スの従来例と
しては、　ｒＬ、Ｒ，Ｒａｂｌｎｅｒ、ｅｔ、ａｌ　：
　”　Ｓｐビーカー　インチ゛へ°ンテ′ント　レコン
゛ニション　　　オフ゛　アイソレイテト゛　　ワｅａ
ｋｅｒ　　Ｉｎｄｅｐｅｎｄｅｎｔ　　ｒｅｃｏｇｎｉ
ｔｉｏｎ　　ｏｆ　　ｌ５ｏｌａｔｅｄ　　ｖ。

晶慣。六１？、畳磐パ孫山、。Ｊ１韮’Ａ−ＴＬ丑。

Ｘｇｇ’５”；ｔ、檻ｅ’Ａｈ　ｒ７粛１　？ｒｇ’ｃ
”：；’？ａｓ、、　ＡＳＳＰ−２７＋　ｐｐ、３３Ｇ
　−３４９（＋９７９）Ｊに示されるものが代表的であ
る。

第２図は、不特定話者を対象とする認識装置における従
来例１の標準パターン作成方式のブロック図を示すもの
であり、１２は特徴抽出手段で１カテゴリー毎に入力さ
れるＮ個の入カバターンについて各入カバターン毎にそ
の特徴量を抽出して入カバターンを表わす特徴パターン
すなわち前述の特徴ベクトル系列ａを生成する。１３は
記憶手段で、特徴抽出手段１２で生成された特徴パター
ンを記憶する。１４は計算手段で前記特徴パターン間の
距離を計算し結果を保持する。１５はグループ化手段で
、前記計算結果に基すいて、特徴パターンと他の特徴パ
ターンとの距離が小さい上位■（個を一つの特徴パター
ン群とし、各特徴パターン毎に選ばれたＮ個の特徴パタ
ーン群間で共通する特徴パターンの数が所定数Ｋｓ（く
Ｉ（）以上の特徴パターン群をグループ化する。Ｉ６は
判断手段で、グループ化手段１５でグループ化されたグ
ループの数が所定数Ｍであるかどうかを判断してＭ個で
無いときはグループ化手段１５再駆動さぜる。１７は平
均手段で前記グループ内のそれぞれの特徴パターンを平
均する。

以上の様に構成された従来の標弘パターン作成装置に付
いて、以下その動作について説明する。

入カバターンは特徴抽出手段１２で特徴抽出されて、入
カバターンを表す特徴パターンＡ１が生成される。一つ
のカテゴリーにたいするＮ個の入カバターンについて入
カバターン毎に生成された前記特徴パターンＡ１（１：
Ｏ，φ・・、Ｎ−１）は記憶手段１３にそれぞれ記憶さ
れる。記憶手段１３では、記憶されているＮ個の特徴パ
ターン群Ａｌ（＋＝ｏ、・・・、Ｎ−１）に対し、計算
手段１４でそれぞれの特徴パターン間の距離計算を行い
、それぞれの計算結果Ｄ１１：１Ａ１−Ａｊ’　（１＋
Ｊ＝０＋　　拳・・。Ｌｌ）を保持する。

グループ化手段１５では前記計算結果に基すいて、一つ
の特徴パターンＡ１について他の特徴パターンとの距離
の近いもの上位に個の特徴パターンに個ＡＩ＋ＡＸＩ・・−１Ａ、で構成される特徴パターン群
に個ａＩ”（ＡＩ　＋Ａｘ　＋自　番　争、　Ａ、）（１＝
ｏ・　・　・、Ｌｌ）を選び、前記特徴パターン群間で
共通する特徴パターンが所定個数Ｋｓ（＜Ｋ）以上存在
する場合に該当する特徴パターンとうしａｓ　＋　ａ　
Ｌ　［Ｋｓ〈Ｋｕｍ　（ａｓ　　ａ）　）：ｅ＋ｒ：ｏ
１拳・Ｌｌ、ｅ≠ｆ　：　Ｋｕｉ（Ｘ）は集合Ｘの要素
の数）をグループ化する。判断手段１６では、グループ
化手段Ｉ５でグループ化されたグループの数が所定数Ｍ
であるかどうかを判断し、所定数Ｍで無いときには、前
記特徴パターン群を構成する特徴パターン数Ｋを１つ増
やしてに＋１としてグループ化手段１６を再駆動させる
が、前記グループの数が所定数Ｍであれば、平均手段１
７を駆動させる。平均手段１７ではグループ化手段！５
でグループされて記憶手段！３で記憶されている特徴パ
ターンのグループＢ　ｇ＋・・、Ｂ　Ｍ−１について、
それぞれのグループ内のに個の特徴パターンを平均して
各グループを代表する標準パターンＳ９＋・・・＋５Ｎ
−１をそれぞれのカテゴリーに対して前記所定のグルー
プ数Ｍだけ発生する。

以上のように、−群のデータを特徴の似た複数のグルー
プに分割する手法をクラスタリングと呼ぶ。

発明が解決しようとする課題しかしながら、この様な従来例の構成では、前記グルー
プ化された特徴パターンを平均するので、一つのカテゴ
リーに属する標準パターン間の距離よりも、他のカテゴ
リーに属する標章パターンとの距離の方が近くなる場合
が生じ結果的に、作成された標準パターンはカテゴリー
の特徴を失ってしまう。

従って、この様な装置により作成した標準パターンは、
認識率の劣下の大きな原因の一つとなるという問題を有
する。

本発明はかかる点に鑑み、グループ間距離を、大きくし
た標準パターンを得ることができるパターン作成装置を
提供することを目的としている。

課題を解決するための手段本発明は、複数の認識対象の各認識対象ごとに異なる発
生条件で得た複数カテゴリーのサンプルの特徴パターン
を抽出する特徴パターン抽出手段と、各カテゴリー毎の
データの分散を計算する、分散計算手段と、その結果分
散の大きいカテゴリーから順にすべてのカテゴリーにた
いして以下の手段を用い、クラスタリングをおこなう、
すなわち、前記特徴パターンの相互間の距離を計算する
計算手段と、異なる認識対象の特徴パターン間の距離が
所定値よりも小さいとき当該パターンのサンプルを標準
パターン作成のためのサンプルから除外するサンプル選
択手段と、各認識対象毎に、当該認識対象の前記除外サ
ンプル以外のサンプルをもとに、当該サンプルより生成
された特徴パターン間の距離の各グループ毎の最大値が
最小となるように前記当該サンプルをグループ化し、グ
ループの中心となるサンプルを標準パターンとする標章
パターン決定手段とを備えた標章パターン作成装置であ
る。

作用本発明は以上のように構成することにより、複数の認識
対象の各認識対象毎に異なる発生条件で得た複数カテゴ
リーのデータに対し、分散の大きいデータを含むクラス
ターから用頁にクラスター間にまたがるオーバーラツプ
を排除しつつクラスタリングを行うことにより、サンプ
ルデータのオーバーラツプに影響されず最適の標準パタ
ーンを作成するものである。

実施例以下、本発明の一実施例について図面とともに説明する
。第１図は本発明の第一の実施例における音声認識装置
のブロック図である。

同図において、１は入力信号をｎ次元のパラメータベク
トル系列ａに逐次変換する特徴抽出部で、フィルタバン
ク、フーリエ変換器など公知の技術で実現される。２は
スイッチで、標準パターン作成時にはＡ側に、パターン
比較時にはＢ側に切り替わる、３は標章パターン作成部
で認識動作に供する標準パターンｂ１・・・ｂ、を作成
。４はパタを記憶する。５は前記パラメータベクトル系
列ａと標章パターン記憶部４に記憶されている標準パタ
ーンとの距離を計算する距離計算部である。６は距離計
算部５により得られたＰ個の距離の内、最小なる標章パ
ターンを認識結果として出力信号線７に出力する判定部
である。

つぎに標準パターン作成手段３の内部７１７．￥成につ
いて説明する。第３図において、１９は記憶手段Ｉで、
特徴抽出部１で生成された特徴パターンを、記憶する。

２０は計算手段で、前記特徴パターン間の距離を計算し
結果を保持する。

２Ｉはグループ化手段Ｉで、前記計算結果に基ずいて、
特徴パターンと他の特徴パターンとの距離が小さい上位
に個を一つの特徴パターン群とし、各１、Ｙ徴パターン
毎に選ばれたＮ個の特徴パターン群間で共通する特徴パ
ターンの数が、所定￥ｌＫＳ（〈Ｋ）以上の特徴パター
ン群を、グループ化する。

２２は判断手段で、グループ化手段Ｉ２１でグループ化
されたグループの数が所定数Ｍ以上であるかどうかを判
断してＭ個でない時は前記プループ化手段を再駆動させ
る。２３は選択手段■で、Ｍ個のグループ内の、それぞ
れの特徴パターン間で当該特徴パターンと他の特徴パタ
ーンとの距離の最大値が最も小さくなる特徴パターンを
選択して、標準パターンとして、出力する。

第４図、第５図に示す、クラスタリング手段ＩＩ、Ｉｌ
ｌについてもクラスタリング手段Ｉと同一の構成である
。

次に上記のように１１１￥成された装置の動作について
、第１図、第３図、第４図、第５図を用いて、標ｒ３μ
パターン作成時、パターン比較時に分けて各々説明する
。まず標喀パターン作成時にはスイフチ２をＡ側にし標
桑パターン作成に供するデータを順次入力する。

入力データは特徴抽出部１で特徴抽出されて、入力デー
タをあられす特徴パターンＡＩ（ｌ＝Ｏ２・・、Ｎ−１
）は記憶手段■、１７にそれぞれ記憶される。記憶手段
Ｉ２５で記憶されているＮ個の特徴パターン７ｔＴＡ１
（１＝ｏ、・・、Ｎ−１）に対し、計算手段１２０で、
それぞれの特徴パターン間の距離計算を行い、それぞれ
の計算結果り、、＝ｌ　Ａ、−Ａ、　ｌを保持する。グ
ループ化手段Ｉ２１では前記計算結果に基すいて、一つ
の特徴パターンＡ１について他の特徴パターンとの距離
の近いもの上位に個の特徴パターンに個に個前記特徴パターン群間で共通する特徴パターンが所定個
数に、　（（Ｋ）以上存在する場合に該当する特徴パタ
ーン同志あａｅ　＋ａｌ　＋［Ｋｓ〈Ｎｕ、１（ａｓ凸
ａ、）：　ｅ、　　ｆ：ｏ。

・・、Ｎ−＋＋ｅ＝ｒ；Ｎｕｎ　（ｘ）は集合Ｘの要素
の数）をグループ化する。

判断手段Ｉ２２てはグループ化手段Ｉ２１でグループ化
されたグループの数が所定数Ｍであるかどうかを判断し
、所定数Ｍでない時には、前記特徴ノ々ターン群を構成
する特徴パターン数Ｋを一つ増してＩ＜＋１として、グ
ループ化手段Ｉ２１を再駆動させるが、前記グループの
数が所定数Ｍであれば、選択手段■、２３を駆動させる
。選択手段Ｉ２３では、グループ化手段Ｉ２１でグルー
プ化された特徴、＋ターン群について特徴パターン間で
当該特徴／Ｎ６ターンＡＩＱ（Ｂｌ：ｌ：Ｏ，・・・、
Ｍ−１１ｃＩ＝ｏＩ　　・命・、　　Ｋ−１）と他の特
徴パターンＡＩ、（１３＋　：ｌ＝ｒ：Ｏ，＊　ｅ　翳
に−１）との距離の最大値Ｄ　ｑｍａｘ　（ｑ＝ｏ　、
俸・・、　　Ｋ−１）が最も小さくなる特徴パターンを
もとに他グループに混入しているものを省いた残りのパ
ターンＡ　１’　（＋　’０　＋φΦ―、Ｎ’−１）は
記憶手段ＩＩ、２５にそれぞれ記憶される。記憶手段＋
１２５で記憶されているＮ′個の特徴パターン群Ａｌ・
（ｉ’＝：Ｏ，・・・、　　Ｎ−１）に対し、計算手段
１１２６でそれぞれの特徴パターン間の距ｇｊｆＵ計算
を行い、それぞれの特徴パターン間の距シ１１１計算を
行い、それぞれの特徴パターン間の距離計算を行い、そ
れぞれの計算結果Ｄ１□：ｌＡ、＝−Ａ、＝　Ｂビｊ　
１＝０・・　Ｎ’−１）を保持する。グループ化手段＋
１２７ては［］ＩＩ記計算結果に基すいて、一つの特徴
パターンＡ’ｌについて他の特徴パターンとの距ノ）１
Ｆの近いもの」１位に′個の特徴パターンに′個ｒ−ゝ〈−一− Ａ’ｌ’ｌＡ’Ｘ・、・・、　、ＡＩ、・で構成される
特徴パターン群　Ｚ＝（ＡＩ、　、　、Ａ１．、　、　
、　、　、ＡＩ、　、　Ｌ（１１：Ｑ、　＠　、　、Ｎ
＋１）を選び、前記特徴パターン群間で共通する特徴パ
ターンが所定個数Ｉく”、（くに’）以上存在する場合
に該当する特徴パターン聞忘ａ＋。、ａ’ｊ　ｆＫ’ｓ
＜Ｎ’ｕ’ｉ（ａ’ａρａ′、）　：ｅ’、ｆ’：Ｏ，
、ｓ、　　Ｎ’−１，ｅ’≠ｆ’；Ｎ’、・、−（×＋
）は集合Ｘ′の要素の数）をグループ化する。判断手段
１１，２８ではグループ化手段１１．２７でグループ化
されたグループの数が所定数ト１′であるかとうかを判
断し、所定数５１゛でない時には、前記特徴パターン１
１１′を構成する特徴パターン数Ｋ”を１つ増やしてに
’＋１として、グループ化手段＋１２７を再駆動させる
が、前記グループの数が所定数Ｍ′であれば、選択手段
Ｉ＋、２９を駆動させる。選択手段１１．２９では、グ
ループ化手段Ｉｔ、２７でグループ化された特徴パター
ン群について、特徴パターン間で当該特徴パターンＡ’
＋−（Ｂ’＋・：ビニ０．・・・、Ｍ′−１、ｑ　ｌａ
６　、・・１　、に’−１）と他の特徴パターンＡ　’
ｌ＋、ｌ　（Ｂ　’ヒ：ｌ’：ｒ゛：０．・・・、に’
−１）との距離の最大値Ｄ　’ｑｎｍｘ　（ｑ’＝０、
・・−、に’−１）が最も小さくなる特徴パターンＡ。

（ｍ＝０　、・・・、トｌ）を選択して標準パターンと
して出力し標準パターン記憶部４に記憶する。

次にパターン比較の場合について説明する。パターン比
較に際しては、スイッチ２をＢ側に接続し、特徴抽出部
１は、入力音声に対応する入力パラメータベクトル列（
ａｌ　＋ａ２　＋・・”＋ａ＋）を距離計算部５へ送出
する。距離計算部５では特徴抽出部１、パターン記憶部
４から送出された各信号に対し、ｄ＝Ｉａ−ｂｌで示さ
れる市街距離、あるいはユークリッド距離等を用いて距
離計算を行う。

この動作を標準パターンベクトルの第１グループ１＝ｉ
−ｐなるｌと第２グループの同じ＜１＝１−Ｐにたいし
て行い、各々の距離を判定部６に出力する。判定部６は
、これらＰ個の距離のうち最小のものを判定し、最小距
離を与える標準パターンベクトルを判定結果として出力
信号線７に出力する。

本発明を先の従来例との比較によってさらに説明する。

本発明を、方言・声の大小長短・年齢性別をふ（むデー
タを対象とする、音声認識にに適用した場合の標準パタ
ーン作成の動作を第６図のフローチャートに示す。

第６図に示す様に、まず、方言カテゴリー　声の大小長
短のカテゴリー　年齢令性別カテゴリー認識対象単語カ
テゴリーにたいして、第１図８なる分散計算手段により
分散を計算する、実験の結果によると、分散の大きさは
年齢性別カテゴリー声の大小長短カテゴリー　単語カテ
ゴリー　方言カテゴリーの順にで有ることが確かめられ
ている。

そこで単語間並びに地域差カテゴリー　声の大小・長短
カテゴリーの３種類のカテゴリーについて、その相互に
オーバーラツプするサンプルデータを排除しつつ３回の
クラスタリングを行なうものである。

第２図に示す公知例である、従来のＲａｂｌｎｅｒらの
方法では、オーバーラツプ部分に対して最適な個数の標
梨パターンを配置してこれをカバーしているが、オーバ
ーラツプ部分のデータの影響で、他カテゴリーの単語の
認識に悪影響を与えるパターンか生じる場合が考えられ
る。又クラスタリングに際して収束性が悪く処理時間が
長いという欠点を有する。

認識実験による比較では第２図の公知例の方法と比較し
て４．１％の認識率向上が認められた。

本法を用いて認識率の改善が得られた理由について、第
７図を用いて、さらに詳しく考察する。

すなわち、従来のクラスタリング手法では比較的均質の
サンプルデータからなる母集団に対しては有効であった
（例えば同一性別、同年齢の標準発声集団など）。しか
し、違った年齢（特に子供の場合など）、男女差、地域
差などの話者属性によって母集団に多様なバラツキや偏
りが見られる場合には従来のクラスタリング手法が十分
効果を発揮しない場合がある。

例えば同一単語を同一の人が発声する場合でも静かな環
境で発声する場合と、騒音下で発声する場合では発声の
大きさか異なる、また男女別の発声においても、子供の
男子の声は成人の女性の声に近いなどの傾向がありこれ
らを同一のカテゴリーとみなしてクラスタリングすると
単語カテゴリーが接近してしまい、最終的にＫ　Ｎ　Ｎ
判定の法則が適用できない場合が生じ、これが誤ａ８　
Ｑ２の一因となっていた。

本方式ではデータの分散の結果をもとに最もコンヒユー
ジョンの大きかったカテゴリーを分割し３つのサブカテ
ゴリーをつくり３回のクラスタリングによって相互のカ
テゴリーでオーバーラツプするサンプルを除去しつつク
ラスタリングをおこなうことによってコンヒユージョン
の少ない標準パターンを作ることを可能とした。

この間の様子を第７図によって図式的に説明する。すな
わち、第７図においてＳ９を「京都」と発声された入カ
バターンベクトルとする。この時予め作成された標準パ
ターンのうち例えば、幼年男子の「東京」という発声の
母集団と、成人女子の「京都」というパターンの、もと
のサンプル母集団に大きなオーバーラツプが有る場合、
これを従来の、　Ｈｕｍａｎ　Ｆａｃｔｏｒに起因する
データのオーバーラツプを考慮しない方式でクラスタリ
ングすると、第７図４３に示すように、データの分布状
況によっては、クラスタリング後のＴＯＫＹＯのサンプ
ルの中心点の１つがＳ、に近すいてしまい、その結果本
来のクラスターであるＫＹＯＴＯのクラスターの中心点
の一つよりも距離が近すくということが起こり易い。と
ころが本ＭＳＣ方式のように、同−単語内においてもＨ
ｕｍａｎ　Ｆａｃｔｏｒなどの別クラスター要素のオー
バーラツプサンプルを予め取り省いておくと、クラスタ
ーの中心点が極端に別クラスターに接近するＩｒがなく
なる、この場合のクラスターの選び方としてばらつきの
最も大きいクラスターを選ぶことにより、最適なデータ
の空間分割が可能となる、この結果、第７図４２に示す
ように、クラスターの中心点が極端に別クラスターに接
近する事がなくなり本データベースのように多様なｌｌ
ｕｍａｎ　Ｆａｃｔｏｒをふくむデータのクラスタリン
グにさいして最もコンフユージヨンの少ないクラスター
中心点を求める事ができ、認識率の向上を図ることがで
きるものと、考えられる。

次に、本発明の第二の実施例について図面とともに説明
する。第８図は本発明の一実施例における文字再認識装
置のブロック図である。

同図において、４４は入力信号を読み取る読み取り装置
、４５は入力された文字列パターンから各文字を切り出
す切り出し装置であり、第９図に示す様に動作する。す
なわち、読み取り装置４４から入力された文字列にたい
して、文字の存在部分に１、そうでない部分にＯを割当
、ひとかたまりの１部分を一文字とみなす。イ６は切り
出された各文字をｎ次元のパラメータベクトル系列ａに
逐次変換する特徴抽出部で、第１０図４９に示すように
入力された文字に対してその、切り出された区形内のド
ツトか１である点から上下左右８方向に対する、隣あう
ドツトの存在似たいして、第１０図５７なる方向別の数
字を割当、これを特徴パラメータとする、など公知の技
術で実現される。５３はパターン記憶部で、第１図３に
しめず構成により同様にして作成された標準パターン系
列ｂ１・・・・ｂｐを記ｒ・芝する。５４は前記パラメ
ータベクトル系列ａと標準パターン記憶部５３に記憶さ
れている標準パターンとの距シ１１Ｆを計算する距βｊ
ｔＩ　、ｉ１算部である。５５は距汀Ｅ計算部５により
得られたＰ個の距離の内、最小なる標準パターンを認識
結果として出力信号線５Ｇに出力する判定部である。

文字認識に際しては、特徴徴抽出部４６は、入力文字列
に対応する入力パラメータベクトル列（ａｔ、ａ２．・
・Φ、ａ１）を距耶計算部５４へ送出する。距ｉｔら送
出された各信号に対し、ｄ＝Ｉａ−ｂｌで示される市街
距離、ユークリッド距離等を用いて距離計算を行う。こ
の動作を標準パターンベクトルの第一グループ１＝１−
Ｐなる１と第ニゲループの同じ＜１＝１−Ｐにたいして
行い、各々の距血［を判定部５５に出力する。

判定部５５は、これらＰ個の距離のうち最小のものを判
定し、最小距離を与える標準パターンベクトルを判定結
果として出力信号線５Ｇに出力する。

標１／＜パターン作成に際しては、スイッチ２をＡ側さ
し、第８図４８なる標準パターン作成部において、第一
の実施例に示す、第１図３なる標賭パターン作成１・π
くと同一の動作により標げＩヘパターンを作成する。

なお、本実施例は、これを、コンピュータに置き換え、
プログラム的にこれを行うことも可能である。又、本実
施例では標桑パターン作成と認識動作を同一の認識装置
上に構成したが、これを２つの装置とし、標準パターン
作成のみを行う装置き、認識動作を行う装置に分割する
ことも可能である。また記憶手段Ｉと計算手段Ｉとグル
ープ化手段ｌと判断手段Ｉと選択手段Ｉならびに記憶手
段ＩＩ。

ＩＩ＋と判断手段ＩＩ、ＩＩ＋と選択手段ＩＩ、ＩＩ＋
は共用化し、−組の手段を時分割的に使用することも可
能である。

発明の効果本発明の標べξパターン作成装置は、複数の認識対象の
各認識対象毎に異なる条件で得た複数のすンプルのうち
から、異なる認識対象の特徴パターン間の距離が所定値
よりも小さいものを除いて、標準パターンを作成するよ
うににたので、グループ間ｎ距離の大きい標準パターン
を得ることができ、この標準パターンを認識装置に用い
ることにより、高い認識率を得ることができる。そして
、それによって有効な音声認識装置や文字認識装置を実
現できる。

【図面の簡単な説明】

第１図は本発明の一実施例における音声認識装置のブロ
ック図、第２図は公知技術の説明図、第３図、第４図、
第５図はそれぞれ本発明の一実施例の標準パターン作成
部の動作説明図、第６図は同標準パターン作成部の動作
説明用フローチャート、第７図は本発明の実施例におけ
る改善効果の説明図、第８図は本発明の一実施例の文学
界装置における文字切り出しを説明する図、第９図およ
び第１０図は同文学界装置におけるパラメータ抽出の原
理説明図である。１・・特徴抽出部、３・・標準パターン作成部、８・記
１．へ手段、９・・計算手段、１０・・グループ化手段、１１・・判断手段、１２・・選択手段。

Claims

【特許請求の範囲】

（１）複数の認識対象の各認識対象ごとに異なる条件で
得た複数カテゴリーに属する複数のサンプルの特徴パタ
ーンを抽出する特徴パターン抽出手段と、前記複数カテ
ゴリーのおのおのに属するデータの分散を計算する分散
計算手段と、前記分散計算手段により計算された分散の
大きいカテゴリーから順に、分散特徴パターンの相互間
の距離を計算する計算手段と、異なる認識対象の特徴パ
ターン間の距離が所定値よりも小さいとき当該特徴パタ
ーンのサンプルを標準パターン作成のためのサンプルか
ら除外するサンプル選択手段と、各認識対象毎に、前記
認識対象の前記除外サンプルより生成された特徴パター
ン間の距離の各グループ毎の最大値が最小となるように
前記サンプルを標準パターンとする標準パターン決定手
段とを備えた標準パターン作成装置。
（２）請求項１に記載の標準パターン作成装置で作成し
た標準パターンを記憶する記憶手段と、入力音声を分析
する分析手段と、前記分析手段の出力並びに前記記憶手
段の内容を比較する比較手段と、前記比較手段による比
較の結果最も類似する標準パターンを判定し認識結果を
出力する判定手段を備えた音声認識装置。
（３）入力された文字列パターンから個々の文字を切り
出す文字切出手段と、切り出された文字パターンをパラ
メータ分析する分析手段と、このパラメータから標準パ
ターンを作成する請求項１記載の標準パターン作成装置
と、前記標準パターン作成装置の出力を記憶する記憶手
段と、前記パラメータ分析手段の出力と前記記憶手段の
標準パターンを比較する比較手段と、前記比較手段によ
る比較の結果最も類似する標準パターンを判定し認識結
果とする判定手段を備えた文字認識装置。