JPS62120590A

JPS62120590A - パタ−ン認識用辞書の作成方式

Info

Publication number: JPS62120590A
Application number: JP60259891A
Authority: JP
Inventors: Saiji Kageyama; 斎司蔭山
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1985-11-21
Filing date: 1985-11-21
Publication date: 1987-06-01
Anticipated expiration: 2009-08-03
Also published as: JPH0658695B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の利用分野〕本発明は、文字認識、音声認識などに用いられる辞書の
作成方式に関する。

〔発明の背景〕

従来、たとえば、電子通信学会技術研究報告、ＰＲＬ８
０−１６の内１ＩＩｉｌｉ！一部等による論文「手書き
漢字データの統計的分析」や電子通信学会技術研究報告
、ＰＲＬ８０−２５の赤松　茂等による論文「構造集積
特徴による手書き漢字の類別実験」などに説明されてい
るように、文字パターンなどの認識を行なう場合には、
入力パターンと、各カテゴリ　（文字の場合には、たと
えば、「あ」。

「い」、「う」、「え」、「お」などの字種）を代表す
る標準パターンとの間で比較を行ない、この人カバター
ンに対する１個の答カテゴリあるいは２個以上の候補カ
テゴリを見つけ出すようにしている。

これをさらに具体的に説明する。いま、入力パターンを
Ｕとし、また、カテゴリがｋ（但し、ｋ≧１）個あって
、夫々のカテゴリをＣＩ　、Ｃｔ　。

・・・・・・、Ｃ５とし、夫々のカテゴリＣ３〜Ｃｋの
標準パターンをｒ（ＣＩ）、　ｒ（Ｃｔ）、・・・・・
・、ｔ＜ｃｍ）とすると、次の処理を行なって１個の答
カテゴリを決定あるいは複数個の候補カテゴリを選択す
る。

（１）　　人カバターンＵと各カテゴリ０１〜ｃ１１の
標準パターンｆ（ＣＩ）〜ｆ（ＣＩｌ）との間の距離ｄ
（ｕ。

ｆ（ＣＩ））、ｄ（ｕ、　ｆ（Ｃｔ））、”””、　ｄ
（ｕ、　ｆ（Ｃｍ））を求める。

（２）各カテゴリＣＩ−Ｃｗ毎に標準パターンｆ（Ｃ１
）〜ｆ（Ｃ，）からの距離範囲、すなわち閾値θ（ｆ（
ＣＩ））　、θ（ｆ（ＣＩ））　、　・・・・−・、　
　θ（ｒ（ｃｍ））が定められており、全てのカテゴリ
ｃ１〜Ｃ５の中から、ｄ　（ｕ、　ｆ（ＣＩ））≦θ（ｆ（Ｃｔ））となる全
てのカテゴリＣ！を得る。

（３）カテゴリＣ！が１個であるならば、それを入力パ
ターンＵの答カテゴリとし、２個以上ならば、それらを
入力パターンＵの答の候補カテゴリとする。

これを第６図によって説明する。全カテゴリをＣｔ　、
Ｃｔ　、Ｃｓとし、夫々の標準パターンを「（ＣＩ）、
ｆ（Ｃｔ）、ｆ（Ｃｓ）、夫々の閾値をθ（ｆ（ＣＩ）
）　。

θ（ｆ（Ｃ２））、　　θ（ｆ（Ｃｓ））とすると、図
示するように、各カテゴリＣ＋　、Ｃｔ　、Ｃｓは夫々
その標準パターンを中心として半径が閾値の円内の範囲
として表わされる。そこで、入力パターンＵと各カテゴ
リＣ＋　、Ｃｍ　、Ｃｓの標準パターｙｒ（ＣＩ）。

ｒ（ｃｔ）、　ｒ（Ｃｓ）との距ａｔｃｔ　（ｕ、　ｆ
（ＣＩ））　、　　ｄ　（ｕ。

ｆ（Ｃｔ））、　　ｄ（ｕ、　ｆ（Ｃｓ））を求め、次
いで各カテゴリＣ＋、ｃｌ、Ｃｓ　（Ｄ閾値θ（ｆ（Ｃ
Ｉ））　、　　θ〔ｆ（ＣＩ））、　　θ（ｆ（Ｃコ）
）とを比較したところ、ｄ（ｕ、ｆ（ＣＩ）＞θ（ｆ（
ＣＩ））ｄ（ｕ、ｆ（Ｃｘ）＞θ（ｒ（ｃｔ））ｄ（ｕ
、ｆ（Ｃｓ）〈θ（ｒ（ｃｓ））であったとすると、第
６図＋ａ）に示すように、入力パターンＵはカテゴリＣ
１の範囲内に含まれることになり、したがって、この場
合には、カテゴリＣ１は入力パターンＵの答カテゴリと
なる。これに対して、第６図（ｂｌに示すように、カテ
ゴリｃ！。

Ｃ８が一部重なり、この重なり部分に入力パターンＵが
存在していると、これらカテゴリＣｔ、Ｃｓが候補カテ
ゴリとして選択される。

かかる手順によって入力パターンの答カテゴリあるいは
候補カテゴリが得られるが、この場合、上記のように、
各カテゴリＣｒは、標準パターンｊ（Ｃｔ）　と閾値θ
　（ｆ（Ｃｔ）　）との組で表わされ、この組でもって
全カテゴリを集めたものが、パターン認識用辞書あるい
は略して辞書である。　　。

そこで、この辞書を作成するためには、各カテゴリＣｔ
毎に標準パターンｆ（Ｃｔ　）と閾値θ　〔ｒ（ＣＩ）
）とを作成する必要がある。標準パターンｆ（Ｃｉ）は
同一カテゴリＣＩに属するパターンを用いて作成する。

たとえば、文字「あ」のカテゴリの場合、複数の人に文
字「あ」を書いてもらい、あるいは、同一人に複数回文
字「あ」を書いてもらい、これらから標準パターンｆ（
あ）を作成する。

この標準パターンｆ（Ｃｉ　）を作成するために用いら
れる上記パターンは学習サンプルと呼ばれる。

カテゴリＣムの閾値θ（ｆ（Ｃｉ）〕を求める方法とし
ては、次の２通りがある。

（１）′標準パターンｆ（Ｃｉ）の作成に用いた学習サ
ンプルに基づいて閾値θ（ｆ（Ｃｔ　）　）を作成す（
２）′閾値θ（ｆ（Ｃｉ　）　）を学習サンプルによら
ない固定値とする。

これらの方法のうち（１）の方法は（２）の方法よりも
、Ｌｉ！ｍ精度および！！識速度の点で勝っていること
が知られている。しかし、上記ｉｌｌの方法でも、学習
サンプル数が少ない場合には、閾値θ（ｆ（Ｃｉ））の
推定精度が低くなり、充分な！！認識精度得られないと
いう欠点があった。以下、この点を具体的に説明する。

いま、あるカテゴリＣ４における学習サンプルをｕｌ＋
　・・・・・・＋ｕａ（但し、ｎ＝１）としたとき、辞
書作成方法の１つとして、次のように標準パターンｆ（
Ｃｉ）、と閾値θ（ｆ（Ｃｉ）、ｌ）とを求めることが
できる。なお、ここで、サフィックスｒｎＪは、上記の
ように用いた学習サンプルの数を表わしている。

式（１−２）は、式（１−１）で得られた標準パターン
ｆ（Ｃｉ）−からの学習サンプルｕ１までの距離がｄ（
ｆ（Ｃｉ）−、ｕｔ）であり、これら距離のうちの最大
のものがこのカテゴリＣ９の閾値θ（ｆ（Ｃｉ）−）で
あることを表わしている。

このように、標準パターンから学習サンプルまでの距離
のうちの最大のものを閾値としている。

そこで、第７図に示すように、いま、カテゴリＣ２に対
し、学習サンプルをｕｌ　＋　　ｕＩ　＋　・・・・・
・。

Ｕ、とし、これらから式（１−１）で得られる標準パタ
ーンをｆ（Ｃｉ　）ｔとすると、これがらの各学習サン
プルまでの距離が学習サンプルｕ４に対して最大である
場合、このカテゴリ範囲の範囲は標準パターンｆ（Ｃｉ
）、を中心とし、これより学習サンプルｕｓまでの距１
１ｄ（１１４、ｆｃｃｒ　）ｙ）を閾値θ（ｆ（Ｃｉ）
ｙ）とし、これを半径とする円内となり、この範囲内に
全ての学習サンプルｕｌ””ｕｌが含まれる。このため
に、用いられた学習サンプルｕ１〜Ｕ？を入力パターン
とし、上記処理手順ｆｉｌ〜（３）に従ってパターン認
識を行なった場合、入力パターンＵ、〜Ｕ、の全てに対
し、この入力パターンを学習サンプルとするカテゴリＣ
４が正しく答カテゴリあるいは候補カテゴリの１つとし
て選択されるという利点がある。このことは、たとえば
、文字認識の場合、辞書作成のために学習サンプルを提
供した人が書いた入力文字パターンの認識は、正しく行
なわれることを意味する。

学習サンプルが多くなる程、同一カテゴリでもいろいろ
なパターンが含まれるので、このカテゴリの閾値は大き
くなる。このために、学習サンプルとはならなかった入
力パターンに対しても、高い精度で答カテゴリや候補カ
テゴリを得ることができる。

これに対して、学習サンプルが少なくなる程、一般には
、カテゴリの閾値は小さくなる。第７図では、同一カテ
ゴリＣ１において、７個の学習サンプルｕ１〜Ｕ、にお
けるカテゴリ範囲Ｓ、と比較して、ｕ　Ｉ　＋　　ｕ　
Ｒの２個を学習サンプルとするカテゴリ範囲Ｓｌ′も示
している。同図から明らかなように、カテゴリ範囲ｓ％
はカテゴリ範囲Ｓ＋よりも狭くなり、同一カテゴリＣｔ
に属する入力パターンＵ、〜Ｕ、に対し、このカテゴリ
Ｃ５はもはや答カテゴリあるいは候補カテゴリとして選
択されなくなる。特に、学習サンプルの数が１の場合（
ｎ＝１）、このカテゴリの閾値θ（ｆ（Ｃｔ））は零と
なってしまう。

このように、従来の方法によって作成された辞書では、
学習サンプル数に応じてカテゴリの閾値の推定精度が異
なり、学習サンプル数が少ないと、閾値の推定精度が低
くなって充分な認識精度が得られないという問題があっ
た。

〔発明の目的〕

本発明の目的は、上記従来技術の問題点を解消し、学習
サンプル数にかかわらず、高い認識精度を得ることがで
きるようにしたパターン認識用辞書の作成方式を提供す
るにある。

〔発明の概要〕

この目的を達成するために、本発明は、学習サンプルか
ら得られたカテゴリの閾値を該学習サンプルの数に応じ
て補正し、辞書のカテゴリ範囲設定のために用いられる
学習サンプルの数にかかわらず、常に、数多くの学習サ
ンプルが用いられた場合と同程度のカテゴリ範囲を設定
可能とした点に特徴がある。

〔発明の実施例〕

以下、本発明の実施例を図面によって説明する。

第１図は本発明によるパターン認識用辞書の作成方式の
一実施例を示すブロック図であって、１はパターン観測
部、２は特徴抽出部、３は学習サンプルメモリ部、４は
辞書計算部、５は辞書メモリ部、６は辞書補正部、７は
辞書メモリ部、８は制御部である。

同図において、パターン観測部１は文字パターンや音声
パターンなどの入力パターンＡを電気信号Ｂに変換する
ものであって、スキャナ、マイクロホンなどからなって
いる。この電気信号Ｂは特徴抽出部２に供給され、前処
理、正規化、特徴抽出などが行なわれて、入力パターン
Ａに対する特徴パターンＣが得られる。いま、カテゴリ
Ｃ，に対してｎ個の入力パターンＡが順次パターン観測
部１で読み取られたとすると、特徴抽出部２からはこれ
ら入力パターン毎に特徴パターンＣが得られ、学習サン
プルｕＩ　＊　　ｕｌ　＋　・・・・・・＋　　ｕｌｌ
　として学習サンプルメモリ部３に格納される。

１つのカテゴリＣ１に対する学習サンプルＵ。

〜ｕ７全てが学コサンプルメモリ部３に格納されると、
次に、これらが読み出され、辞書計算部４において、こ
れら学習サンプルｕ１〜ｕ９から、たとえば、先の式（
１−１）　、　（１−２）からこのカテゴ’ＪＣ！に対
する標準パターンｆ（ＣＩ）ｓ、閾値θ（ｆ（Ｃｉ）−
３が算出され、辞書メモリ部５に格納される。

以上の処理により、カテゴリＣ！の範囲が得られるが、
次に、辞書メモリ部５から標準パターンと閾値とが読み
出され、辞書補正部６で、後述するように、カテゴリＣ
ｔの範囲が用いられた前記学習サンプルＵ、〜ｕ、ｌの
敗に応じて補正され、辞書メモリ部１７に格納される。

以上の処理は各カテゴリ毎に行なわれ、辞書メモリ部７
に所望の辞書が得られる。

次に、この実施例の特徴をなす辞書補正部６について説
明する。

辞書メモリ部５に格納される辞書は、全カテゴリについ
ての標準パターン、閾値および学習サンプル数である。

辞書補正部６はかかる辞書を各カテゴリ毎に学習サンプ
ル数に応じて補正するものであるが、補正対象としては
、標準パターンと閾値とである。しかし、ここでは、説
明を簡単にするために、閾値のみを補正するものとして
説明する。そこで、辞書メモリ部５から辞書補正部６に
カテゴリ毎に標準パターン、閾値および学習サンプル数
が供給され、閾値は学習サンプル数に応じて補正されて
辞書メモリ部７に格納される。この場合、学習サンプル
数は不要となるので、辞書メモリ部７に供給されない。

閾値は次に示すような方法によって簡単かつ有効に補正
することができる。ここでは、２つの補正方法について
説明する。

ｔａ＋　　補正方法ｌいま、あるカテゴリＣに対してｎ個の学習サンプルｕｌ
＋　・・・・・・、ｕつが与えられたとき、上記式（１
−１）　、　（１−２）によって得られたこのカテゴリ
Ｃの閾値をθとし、これを辞書補正部６で補正して得ら
れる閾値をθ′とすると、この閾値θ′は、学習サンプ
ル数ｎに応じて閾値θを補正したものとするものである
。この補正によると、閾値θ′は、学習サンプル数ｎが
小さいときには、閾値θよりも大きく、学習サンプル数
ｎが増加するとともに、広義の単１１減少して閾値θに
近づくものである。

これは、閾値θ′は次の式を満足するように設定するこ
とである。

但し、ｈ（Ｉｌｌは、第２図に示すように、次の条件を
満足する関数である。

（ｉ）すべての正整数ｎに対し、ｈ　（ｎｌ≧１（ｉｆ
）Ｏ＜ｚ＜ｍを満足する全ての整数１１ｍについて、ｈ（１）≧ｈ− （ｉｉｉ）ｎが充分大きい正整数のとき、ｈ　（ｎ）夕
１この間数ｈ（ｎｌは、カテゴリ毎に異なるものであろう
が、学習サンプル数ｎが小さいときに、閾値θを大きく
補正することからみると、各カテゴリに共通としても左
程問題はない、関数ｈ　（ｎｌの求め方としては種々考
えられるが、その−例としては、いくつかのカテゴリに
ついて学習サンプル数毎の閾値の変化傾向および安定し
た閾値を得、これらの結果から、全ての学習サンプル数
での閾値がこの安定した閾値となるような補正係数を各
カテゴリ毎に求め、これらのうちの学習サンプル数毎の
最適なもの（たとえば、学習サンプル数毎に、平均した
もの、学習サンプル数毎の最大のものなど）を選択して
関数ｈ　（ｎ）とすることができる。

世）　補正方法２これは、 θ′謬ａ・θ＋ｂとするものである、ここで、ａ、ｂは学習サンプル数ｎ
の関数であり、−例として、ａは第３図＋ａ）のような
傾向をもたせ、ｂは同図（ｂｌのような傾向をもたせる
。これらａ、ｂも先の（ａ）補正方法１における関数ｈ
　（ｎｌと同様の方法で得ることができる。

関数ａ、ｂを、第３図に示すように、連続的に変化させ
ることがメモリの容量の点から問題となる場合には、第
４図（ａ）、　（ｂｌに示すように、学習サンプル数ｎ
を複数ずつ区分、関数ａ、ｂを区分毎に階段的に減少さ
せるようにしてもよい、このことは、＋ａｌ補正方法１
の関数ｈ　Ｔｎｌについても同様である。

以上のような補正を行なうことにより、学習サンプル数
が少なくても、 ■　入力パターンＵは正解カテゴリの標準パターンから
距離θ′以内に存在する確率、つまり、正解カテゴリが
候補カテゴリに含まれる確率が高くなり、 ■　入力パターンＵの候補カテゴリに、正解カテゴリ以
外の異カテゴリが入る確率が低くなる。

そして、学習サンプル数ｎが増加するにつれて、上記■
での確率が増々高（なり、上記■での確率は増々低くな
る。

このようにして、従来技術の欠点が解消できる。

なお、上記実施例では、全カテゴリの辞書を一旦辞書メ
モリ部５に格納した後、辞書補正部６での辞書の補正を
行なう場合には、辞書メモリ５と７を同一とすることが
できる。また、各カテゴリ毎にパターン観測部１から辞
書補正部６までの一連の処理を行なうようにしてもよい
。

制御部８は以上の動作を制御するものであって、煩雑さ
を避けるために、＠御線を省略している。

また、特徴抽出部２での特徴抽出法としては、次のよう
な特徴をとらえるようにしたものが従来から知られてお
り、参考となる文献名も同時に示す。

（イ）第８図（ａｌに示す周辺分布特徴。

中日、中野外、“Ｒｅｃｏｇｎｉｔｉｏｎ　　ｏｆ　　
ＣｈｉｎｅｓｅＣｈａｒａｃｔｏｒｓ　、　Ｐｒｏｃ＋
ｏｆ　ｔｈｅ　　Ｃｏｎｆｅｒｅｎｃｅ　　ｏｎｍａｃ
ｈｉｎｅ　ｐｅｒｃｅｐｔｉｏｎ　ｏｆ　ｐａｔｔｅｒ
ｎｓ　ａｎｄ　ｐｉｃｔｕｒｅｓｈｅｌｄ　ａｔ　ｔｈ
ｅ　ＮＰＬ　”　　Ｔｅｄｄｌｎｇｔｏｎ　、　１９７
２．４（ロ）同図山）に示すストローク密度関数特徴。

信学論　Ｖｏｌ、　６３−Ｄ、　Ｎｏ、１２　１９８０
．１２　　ｐｐ、１０９６−１１０１　　萩田他による
「３つの概形特徴を用いた手書き漢字の分類」（ハ）同図（Ｃ１，（ｄｌに示すペリフェラル特徴、上
記（ロ）で示した文献。

（ニ）第９図に示す方向性パターン特徴。

信学論　Ｖｏｌ、　６２−Ｄ、　Ｎｏ、３１９７９．３
　　ｐｐ、２１７−２２４安田他「文字認識のための相
関法の一改良」（ホ）その他第５図は本発明によるパターン認識用辞書の作成方式の
他の実施例を示すブロック図であって、９は整合部、１
０は判定部、１１は修正部であり、第１図に対応する部
分には同一符号をつけて重複する説明は省略する。

第１図に示した実施例では、学習サンプルはそのカテゴ
リがわかっていた。これに対して、第５図に示すこの実
施例では、カテゴリが不明の入力パターンをも、そのカ
テゴリを判定し、既に形成されている辞書の対応するカ
テゴリの学習サンブルとし、辞書を補正できるようにし
たものである。

したがって、この実施例においては、実際に使用してパ
ターン認識を行なうと同時に、辞書の修正をも行なうこ
とができる。

次に、この実施例の動作を説明する。

第１図と同様にして得られた未知のカテゴリの入力パタ
ーンＡに対する９０パターンＣは整合部９に送られる。

これとともに、整合部９には、この入力パターンＡが人
力される直前までに辞書メモリ部７に得られた補正され
た辞書Ｈも供給され、この特徴パターンＣと辞！Ｈに属
する全ての＃Ｊｉｆｓパターンとの間の距離が求められ
、得られた距離データ！が全て判定部１０に送られる。

判定部ｌＯでは、これら距離データ■から入力パターン
Ａに対する答カテゴリや候補カテゴリが選択される。

得られた答カテゴリや候補カテゴリＪは特徴パターンＣ
とともに修正部１１に供給され、この特徴パターンＣに
対する答カテゴリが正解カテゴリか否か、候補カテゴリ
のうちいずれが１闘カテゴリかを確認するとともに、誤
りがあれば修正する。

すなわち、この修正部１１において、入力パターンＡの
カテゴリが確定する。

この修正を行なうためには、判定部ｌＯで人カバターン
Ａと選択された答カテゴリや候補カテゴリをディスプレ
イ装置に表示し、ユーザが表示内容を参照しながらカテ
ゴリを修正して正解カテゴリを得る。

一方、学習サンプルメモリ部３には、これまでに供給さ
れた全ての学習サンプルがカテゴリ毎に格納されており
、上記入力パターンＡの特徴パターンＣは、学習サンプ
ルメモリ部３に該当するカテゴリの学習サンプルとして
格納される。そして、このカテゴリについて、辞書計算
部４で全ての学習サンプルから標準パターンと閾値が算
出され、さらに、第１図の実施例と同様にして、辞書修
正部６で閾値が修正され、辞書メモリ部７に上記入力パ
ターンＡが入力されたことによる新たに修正された辞書
が得られる。

辞書メモリ部７の辞書中にないカテゴリの入力パターン
Ａが入力された場合には、判定部１０では、この入力パ
ターンＡのみが表示され、修正部１１において、これに
対するカテゴリが設定される。学習サンプルが１つでも
あるカテゴリでは、第１図の実施例と同様に、標準パタ
ーンと零でない閾値が設定される。

このように、この実施例では、カテゴリが未知の入力パ
ターンを用いて辞書の作成が可能となり、したがって、
辞書メモリ部７の辞書を用いてパターン認識しながら、
この辞書の作成および逐次の修正ができることになる。

なお、この実施例では、全ての入力パターンを学習サン
プルとしたが、次のような特徴パターンを学習サンプル
としてもよい。

■　ユーザが必要認めた特徴パターン ■　入力パターンをパターン認識したときに、エラーあ
るいはりジェツトとなった特徴パターン ■　上記■の特徴パターンのうち、ユーザが必要と認め
る特徴パターン以上の学習サンプルの選択、判断処理は、修正部１１で
行なうことができる。

また、この実施例では、辞書メモリ部５から辞書を読み
だし、辞書修正部６でｆ１正して整合部に供給すること
もでき、この場合には、辞書メモリ部７を除くことがで
きる。

以上、本発明の実施例について説明したが、本発明はこ
れら実施例のみに限定されるものではない、以下、本発
明に含まれるこれら実施例のいくつかの変形例を示す。

（１）　　閾値を次のいずれかのように設定してもよい
。

＋８）　　カテゴリ毎に設定する。

山）　全カテゴリにわたって等しくする。

ｔｃ＞　　各カテゴリの各特徴毎に設定する。

上記ｔａｇ、　（ｃｌにおいては、カテゴリ毎にその学
習サンプル数に応じて閾値を補正する。（ｂ）において
は、全カテゴリについての平均学習サンプル数。

最小学習サンプル数、最大学習サンプル数などに応じて
閾値を補正する。

（２）　　閾値を、標準パターンと各学習サンプルとの
間の平均距離に所定の定数係数を乗じたものとすること
ができる。

（３）１カテゴリ当り標準パターンと閾値との複数組を
設定してもよい、これによると、パターン認識性能はよ
り向上する。

（４）　　パターン認識を行なう場合には、入力パター
ンと標準パターンとの間の距離の代りに、両者の類僚度
を用いてもよい。

（５）　　上記夫々の実施例では、同−力テゴリの学習
サンプルが全て学習サンプルメモリ部３に格納されて後
、これらの学習サンプルから辞書を作成していたが、学
習サンプルが与える毎に逐次辞書を作り直してい（よう
にしてもよい、この場合には、新たに与えられた学習サ
ンプルとこれまでの辞書とから新たな辞書を作ることが
できる。

（６）上記実施例では、入力パターンと標準パターンと
の間の距離が閾値以下となるカテゴリを答カテゴリある
いは候補カテゴリとしたが、各距離を評価し、これらが
予め設定された所定の関係にあるカテゴリを答カテゴリ
あるいは候補カテゴリとしでもよい、評価の基準として
は、たとえば、最小路２と次に短い距離との差が所定の
範囲外であるとき、この最小距離に対するカテゴリを答
カテゴリとする、標準パターンが最小距離に、ある正定
数を加えた距離内にある全てのカテゴリを候補カテゴリ
とするなどがある。

以上、上記実施例の変形例を示したが、これらの論理的
に妥当な組み合わせであってもよい。

〔発明の効果〕

以上説明したように、本発明によれば、学習サンプル数
が少なくても、パターン認識に際し、入力パターンの正
解カテゴリが高い確率で候補カテゴリに含まれ、また、
入力パターンに対する正解カテゴリ以外の異カテゴリが
候補カテゴリとなる確率を非常に低くする辞書を形成す
ることができる。

【図面の簡単な説明】

第１図は本発明によるパターン認識用辞書の形成方式の
一実施例を示すブロック図、第２図〜第４図は第１図に
おける辞書補正部の動作を説明するためのグラフ図、第
５図は本発明によるパターン認識用辞書の形成方式の他
の実施例を示すブロック図、第６図は入力パターンに対
する答カテゴリや候補カテゴリの選択方法を示す説明図
、第７図は従来技術における学習サンプル数とカテゴリ
の閾値との関係を示す説明図、第８図および第９図は夫
々従来の入力パターンの特徴抽出方法を示す説明図であ
る。１・・・・パターン観測部、２・・・・特徴抽出部、３
・・・・学習サンプルメモリ部、４・・・・辞書計算部
、５・・・・辞書メモリ部、６・・・・辞書補正部、７
・・・・辞書メモリ部、９・・・・整合部、ＩＯ・・・
・判定部、１１・・・・修正部。代理人　　弁理士　　弐　顕次部（外１名）范１区第２図蓼習ザンプル数ｎ第３図（Ｇ）　　　　　　　　　　　（ｂ）第４図（０）　　　　　　　　　　　　（ｂ）地６図（Ｇ）　　　　　　　　　　　　（ｂ）嶌７図（Ｃ）　　　　　　（ｄ）尾９図

Claims

【特許請求の範囲】

（１）入力パターンの特徴を抽出して得られる特徴パタ
ーンを学習サンプルとし、該学習サンプルによつて形成
されたカテゴリ毎の標準パターンと閾値との組からなる
パターン認識用辞書の形成方式において、前記学習サン
プルによつて形成された前記標準パターンと閾値との組
からなるパターン認識用辞書を前記学習サンプル数に応
じて修正する手段を設け、該パターン認識用辞書におけ
る各カテゴリの範囲を、前記学習サンプルの数にかかわ
らず、前記学習サンプルの数を充分多くした場合と同程
度に設定することができるようにしたことを特徴とする
パターン認識用辞書の作成方式。
（２）特許請求の範囲第（１）項において、前記手段は
、前記パターン認識用辞書における閾値のみを修正する
ことを特徴とするパターン認識用辞書の作成方式。
（３）特許請求の範囲第（２）項において、前記閾値は
、学習サンプルの増加とともに広義の単調減少する関数
で修正されることを特徴とするパターン認識用辞書の作
成方式。
（４）特許請求の範囲第（２）項において、前記閾値は
、学習サンプル数が区分され、該学習サンプルが増加す
るにつれて該区分毎に階段状に単調減少する関数で修正
されることを特徴とするパターン認識用辞書の作成方式
。
（５）特許請求の範囲第（１）項、第（２）項、第（３
）項または第（４）項において、前記入力パターンに対
する前記特徴パターンは、該入力パターンが入力される
以前の前記パターン認識用辞書によつてカテゴリが判定
されて前記学習サンプルとなり、前記手段は前記入力パ
ターンの入力毎に該入力パターンに対する学習パターン
をも含めて修正することを特徴とするパターン認識用辞
書の作成方式。