JPH08508128A

JPH08508128A - 分布マップを用いる画像の分類方法及び装置

Info

Publication number: JPH08508128A
Application number: JP7512094A
Authority: JP
Inventors: ティンカムホー; ヘンリースパルディングバード
Original assignee: AT&T Corp
Current assignee: AT&T Corp
Priority date: 1993-10-15
Filing date: 1994-10-13
Publication date: 1996-08-27
Anticipated expiration: 2016-11-12
Also published as: JP3228938B2; EP0674794A1; KR950704755A; CA2150110C; US5825925A; EP0674794A4; DE69423607T2; CA2150110A1; WO1995010820A1; DE69423607D1; EP0674794B1

Abstract

(57)【要約】画像分類器は入力画像を受信し、複数の画像クラスのうちの一つを各入力画像に割当てる。画像分類器は複数のクラス分布マップを有する。各マップは学習画像について評価された複数の特徴に基づき、各マップは対応するクラスの属する学習画像のうちの少なくとも一つを生じる特徴値を示す。画像分類器は複数の特徴を入力画像について評価することによりテストマップを構成する手段を更に有する。画像分類器は、どのクラス分布マップがテストマップに対して最小の距離を有するか識別するために、テストマップとクラス分布マップを比較する手段を更に有する。特徴のうちの少なくとも一つは、少なくとも一つの画像クラスの形状に関連するルールに従って定義される。

Description

【発明の詳細な説明】分布マップを用いる画像の分類方法及び装置技術分野本発明は一般的に、画像の自動解釈に関する。更に詳細には、本発明は機械印刷又は手書記号の画像の分類又は認識に関する。背景技術画像解釈の重要な領域は光学文字認識（ＯＣＲ）である。光学文字認識では、記号の画像は記号を示す２進符号に自動的に翻訳される。光学文字認識における主要な問題は、画像がけばけばしい似たような形状の記号（すなわち、縮退、歪み又は欠損を有する画像）を識別することである。これらの画像欠損は、手書きスタイルの変動、タイプフェース及びテキストのサイズ並びに空間サンプリング速度、光学歪み及び印刷及びイメージングの物性によるその他の作用等の特性などのような様々な理由により生じる。これらの作用の複雑性は、これらの作用を定量的に、しかも徹底的に説明しようとする試みを最近まで拒み続けてきた。従って、画像の本当の字類条件分布は、理想的な記号形状の完全な知識が与えられたとしても、詳細に分析予測することはできない。実際、これらの分布は、相当な費用で収集され地域現状データの表示がされた画像の有限データセットの形で経験的にのみ利用可能である。これらのデータセットがたとえ無数にあろうとも、これらのデータセットは実際に生じる様々な画像に比べたら疎らである。従来技術の自動的に学習できる方法は、入力画像について評価された特徴群を所定のクラスに付随された特徴値の分布群と比較することにより未知入力画像を大まかに分類する。この方法では、“特徴”は、画像に入力される時に、実数を戻す関数である。各画像クラスに付随する特徴値の群又は分布は、この特徴を学習セット（すなわち、各々その真正クラスのラベルを有する画像群）に適用することにより構成される。特徴は複雑に変化する。例えば、W.W.Bledose et al.,”Pattern Recognition and Reading by Machine,”1959 Proceedings of the Eastern Joint Computer Conference ,Academic Press（1959）174-181には、ランダムに選択された画素対に基づく特徴に関する研究が記載されている。各画素の可能な数値は、これらの画素の可能な論理状態に対応する、００，０１，１０，１１の４種類の２進値である。この方法は、実際の光学文字読取装置で使用するには十分な精度を有しない。一層複雑な特徴を使用する、つい最近の分類方法であっても、分離文字認識問題の極めて低い精度しか得られない。このような場合、不正確性は分類方法における欠陥（例えば、不完全に選択された特徴）によるか、又は学習セットの低品質（例えば、非常に少ないサンプル）によるのかあるいはその両方によるのか否か不明確である。この不明確性と大きな典型的な学習セットを取得する費用によれば、最近の大抵のＯＣＲ研究は、特徴分布の補間、平滑化及び解析的モデル化の様々な方法を用いて、使用可能な疎らな学習セットを近似する発見的方法に焦点が合わせられている。これを行うために、分布の形式に関する多くの簡易化仮定（例えば、簡単に接続された、単峰、凸、解析的又はパラメトリック（例えば、多次元ガウス）などである）が必然的に呼出される。しかし、有効性を証明した多くの機能は、これらの簡単化仮定が為された場合に、非常に複雑であり、極めて不完全にモデル化された分布を有する。その結果、これらの簡単化仮定は、画像分類器の信頼性を低下させる不正確性を導入する。別の方法（“最近接点”方法と呼ばれることがある）では、クラス毎に少数のプロトタイプ画像のみを記憶し、この疎らなセットから真正な分布を帰納するという目的で、固定グローバル画像距離Ｄ（ｘ，ｙ）≧０（画像Ｘと画像ｙの任意の２個の対間の距離関数）が使用される。この方法は必ずしも望ましくない。なぜなら、単一のグローバル距離関数が全てのクラス分布の複雑性を正確にモデル化するとは思われないからである。従って、当業者は今まで、特徴分布の実際的な表示から生じる正確性を有する強力な特徴（すなわち、少なくとも２つの異なるクラスから選択された画像について評価された場合に、大幅に異なる値を高い確率で有する特徴）を結合できる実際的な画像分類方法を提供することができなかった。発明の開示本発明によれば、クラス距離ｄ_c（ｘ）≧０の同族類を構成する。各クラスｃについて、それぞれ未知画像ｘから特定のクラスｃまでの距離を計算する。完全（又はほぼ完全）距離の同族類とすると、最小距離に従って分類することができる。ｄ_c（ｘ）が最小のクラスｃはＸに関する好ましいクラスとして戻される。全ての画像ｘ及び全てのクラスｃについて、ｄ_c（ｘ）＝０の場合、Ｘがクラスｃ内のものである場合のみ、クラス距離ｄ_c（ｘ）≧０は完全である。完全距離は、その分布内がゼロで、その範囲外では厳密に正である、このクラスについて “理想的インディケータ関数”の一種として機能する。言うまでもなく、実際には、このような距離は常に完全であるとは限らないが、距離は極めて接近させることができる。本発明の分類方法は、このような完全又はほぼ完全な距離で使用できる。その結果、本発明の方法は、高い正確度（少なくとも従来の最良の競合方法と同程度である）、優れた拒否動作（幾つかのありきたりの競合方法より性能が優れている）及び学習中の迅速な収束（これにより実行中の再学習と自動特殊化を可能にする）を達成できる。本発明によれば、各クラスについて、特徴値の経験的なクラス条件的分布の詳細な、しかし空間効率的な表示（分布マップと呼ぶ）を作成する。実例的な分布マップでは、各特徴の各値は、この特徴値がこのクラスに関する学習データ中に生じる場合にのみ、１に設定されるビットにより示される。使用する場合、本発明による画像分類器は、入力画像について評価された特徴に基づくテストマップを学習画像群に基づく複数のクラス分布マップと比較する。入力画像は、テストマップに対して最小距離を有するクラス分布マップのクラスに割り当てられる。或る代表的な実施例では、テストマップに対して最小距離を有する分布マップは、テストマップと同じような最大数の特徴値を有する分布マップである。従って、広い意味において、本発明は、入力画像を受信し、この入力画像を学習画像の学習セットと比較することにより、入力画像を複数の画像クラスのうちの一つに割り当てる画像分類器である。画像分類器は複数のクラス分布マップを有する。これらの各マップは学習画像について評価された複数の特徴に基づく。また、各マップは、対応するクラスに属する学習画像用の学習セットに少なくとも１回は生じる特徴値を示す。画像分類器は更に、入力画像について複数の特徴を評価することによりテストマップを構成する手段と、クラス分類マップのうちのどのマップがテストマップに対して最小の距離を有するか識別するために、テストマップとクラス分布マップを比較する手段を有する。重要なことは、少なくとも一つの特徴が、少なくとも一つの画像クラスの画像の形状に関するルールに従って定義されることである。図面の簡単な説明第１図は本発明について有用な実例的な学習プロセスの流れ図である。第２図は本発明による実例的なテストプロセスの流れ図である。第３図は実例的なクラス分布マップである。第４図はテストマップから第３図のクラス分布マップまでの距離の実例的な計算を示す。第５図及び第６図は新たな特徴フォーム（例えば、学習画像の入力表示）を構成する或る可能な手順を説明する。簡単化のために、図５により示されるスペースは２次元のもである。第７図は印刷された漢字を示す単一サンプルの実例的な分布マップである。第８図は漢字の各クラスの３種類の分布マップの群である。発明を実施するための最良の形態画像欠陥の実際的モデルの擬ランダムシミュレーションにより学習セットの質を高めるか又は生成することが望ましいことが発見された。例えば、H.S.Baird ，”Document Image Defect Models,”in H.S．Baird et al.，Eds.，Structure d Document Image Analysis ，Springer-Verlag（1992）には、画像欠陥のパラメータ付きモデルが開示されている。このモデルは、印刷及び画像取得のフィジックス（physics）に近ずく、高品質プロトタイプ画像で動作する、分布アルゴリズムを決定するパラメータの分布を特定する。分布からの擬ランダムサンプリングにより、無限サイズの学習及びテストセットを生成させることができる。従って、学習セットのサイズに関する本発明の計算環境によりインポーズされる制限以外の制限は存在しない。また、学習及びテストセットは両方とも同じ分布からランダムに選択されるので、学習セットは構成により示される。適当な距離特徴の選択には大きな自由度が存在する。しかし、光学文字認識（ＯＣＲ）の分野で周知の多数の特徴は、本発明の方法のような完全距離方法で申し分なく行われることが発見された。（代表的な特徴は画像画素値の下位多項式関数である。）更に、自動構成特徴のアルゴリズムは高い精度の分類をサポートする小さな特徴群を発見するのに有効であり得ることが発見された。前記のように、若干の識別はランダムに選択された画素対と同じくらい簡単な特徴により与えられる（Bledsoeの前掲書参照）。しかし、少なくとも一つの画像クラスの画像の形状に関するルールに従って少なくとも一つの特徴が定義される場合、精度が更に改善されることが発見された。すなわち、高度に有効な特徴は一般的に、演鐸的に選択される特徴である。なぜなら、（例えば、学習セットで示されるような）少なくとも一対の画像クラス間の若干の識別を与えることが公知だからである。実例として、特徴は、学習セットに対する性能にしたがって既知の特徴のリストから選択することができる。別法として、特徴は学習セットに関して構成することもできる。（特徴の構成方法の一例は下記で説明する。）従って、特徴は最初から手作業で特定することもできるし、又は学習セットの試験中に自動的に構成することもできるし、あるいはこれらを組み合わせることもできる。何れの場合も、幾つかの個数Ｍの特徴が最後に選択される。各特徴の範囲は多くともＶ個の別個値からなることが必要である。Ｍ個の特徴値のベクトルとして、学習セット内か又は（分類すべき）テストセット内であるか否か全ての画像を示す。各クラスについて分布マップを構成する。好ましい分布マップでは、各特徴の各値は、この特徴の値がこのクラスの学習データに生じる場合及びこの場合のみ、１に設定されるビットにより示される。各クラス分布マップはＭ^*Ｎ個のビットを有する。認識中、入力画像は次のように実例的に分類される。ａ）入力画像に関する特徴値のベクトルを計算する，ｂ）入力値がクラスの分布マップに生じない各特徴のクラス−距離に１を加えることにより、各クラスに対する負でない整数距離を計算する，ｃ）この距離が最小であるクラスの入力画像を割り当てる，ｄ）１個以上の距離間にタイ（tie）が存在する画像を場合により棄却するか又は“ 不明瞭”の印をつける，ｅ）最小距離と次の最小距離との間のギャップが所定の閾値未満である画像を場合により棄却するか又は“不明瞭”の印をつける，及びｆ）最小距離が所定の閾値を越える画像を場合により棄却する。例えば、第１図の流れ図に図示された学習プロセスは、入力として、所定のＦ個の異なるフォントとＦ個のフォントの各々で示されるＮ個の記号（各々、個別クラスに対応する）の文字形状のアウトライン作図を取得する。この入力は所定の欠陥モデルを特定する一連のパラメータ値も包含する。このプロセスの出力は分布マップである。Ｆ及びＮの他に、数値定数はＭ個の数値特徴、（正規化された）特徴の最大整数値Ｖ及び各記号−フォント対について生成されるべきＤ個の歪曲サンプルも包含する。各フォントにおける各記号について、アウトライン形状作図を読み出し（ステップＡ）、所定の欠陥モデルに従ってＤ個の歪曲サンプル画像を生成する（ステップＢ）。これらの各歪曲画像について、Ｍ個の数値特徴を抽出し（ステップＣ）、これらの各特徴の値を１−Ｖの範囲内に存在する値νに正規化する（ステップＤ）。そして、対応するビットを分布マップ内の論理１に設定する（ステップＥ）。また、例えば、図２の流れ図に図示されたテストプロセスは、入力として、分布マップと未知クラスの画像を取得する。このプロセスの出力は距離の昇順に記憶された、フォーム（クラスインデックス、距離）対のリストである。Ｍ個の数値特徴が入力画像から抽出される（ステップＦ）。各特徴は前記のように正規化され（ステップＧ）、正規化特徴値νが得られる。各特徴について、現行のクラス−特徴−値組合せに対応する入力分布マップにおけるビットｂが検索される（ステップＨ）。このビットがＯＦＦの場合、現行クラスに対応する距離アレイの要素は１まで増分される（ステップＩ）。距離アレイの要素が全て評価された後、これらは昇順に記憶される（ステップＪ）。この記憶アレイは直接、テストプロセスの出力となる。テストプロセスを第３図及び第４図を参照することにより更に例証する。テスト画像から抽出された特徴は図４の行１０に列挙された値を有する。図３のクラス分布マップの対応する列にも生じる各特徴値に関する同じ数字の行２０に“０ ” が挿入される。“１”は、クラス分布マップの対応列に生じない各特徴値について挿入される。図３のマップにより示されるクラスについて、距離アレイの対応する要素は図４の行２０内のエントリを加算することにより評価される。高品質の学習データ、すなわち、正確に表示し、適正なサイズよりも大きなデータを有することが望ましい。このため、最小の学習セットは少なくともｋ^*Ｖ個のサンプル／クラスを包含しなければならない。ここで、ｋは１よりも大きな整数である。好ましくは、ｋは少なくとも１０である。なぜなら、クラス当たり１０^*Ｖ個のサンプルよりもかなり少ない学習セットは、かなりの入射速度を有する特徴値を含むことができないからである。学習セットが真正な欠陥分布に対する極近似値からランダムに選択された場合、この最小サイズ基準ヘルプは、真正な分布中に生じることができる各特徴値は高い蓋然性で、学習セット中にも生じる。実例的な認識プロセスでは、各特徴は、各クラス距離により計算された最終“ 距離”に０又は１を与えることができる。すなわち、たとえ幾つかの特徴の範囲（個別的特徴値の数）が他のものよりも大きかったとしても、各特徴は不整合に対し同じペナルテイを課す。Ｖの選択は成功の必須要件である。Ｖが小さい（例えば、５未満）場合、特徴はうまく識別できないものと思われる。Ｖが大きい（例えば、５００超）場合、分布マップは望ましくないほど大きく、必要な学習データの量は過大である。従って、Ｖの好ましい範囲は５〜５００である。このような範囲を特徴値の“適度に粗い量子化”と呼ぶ。特徴の数は予め固定する必要はない。むしろ、学習セットの統計量に応じて、学習中に成長することができる。完全距離の特徴の構成第５図及び第６図を参照しながら、関数の特定の同族類から特徴を選択する方法を下記に説明する。この方法により最大識別の達成が保証される。この方法は新たな特徴を追加することにより学習セットの不明確性を徐々に除去する。全てのクラスが識別されるか又は固有の不明確性だけが残る場合、終了が約束される。この方法は各クラスｃについて順番に繰返される。各繰返しにおいて、全ての学習サンプルはグループＳ₁とグループＳ₂の２つに分離される。ここで、Ｓ₁はクラスｃの画像（図中、黒丸で示されている）を包含し、Ｓ₂はその他の全てのクラスの画像（図中、白丸で示されている）を包含する。各グループのサンプル平均３０，４０を計算した。直線５０はサンプル平均を通して引かれている。その後、この直線上にサンプルをプロジェクション（投射）した。（幾つかのプロジェクション例を第５図に点線で示す。）次いで、プロジェクション範囲を、第６図に示されるように、固定数のセグメントに均等に分割する。或るクラスのサンプルのプロジェクションがこのセグメント上に存在する場合、このセグメントはこのクラスについて“ｏｎ”とマークされる。直線５０は、（前記のような意味の）“特徴”と思料される。セグメントに対するインデックスはこの特徴が取り得る値である。マークされたセグメントはこの特徴の分布マップを形成する。Ｓ₁及びＳ₂の双方についてマークされたセグメントが存在しない場合、Ｓ₁における画像について識別特徴を得たことになり、この方法は（クラスｃについて）終了する。さもなければ、Ｓ₁は余分なものが取り除かれ、Ｓ₂と重複するサンプルだけが残される。（例えば、第６図のセグメント２はＳ₁及びＳ₂の双方についてマークされる。）その後、余分なものが取り除かれたＳ₁及びＳ₂における全ての画像を用いてこの方法が繰返される。Ｓ₁内の全てのサンプルがＳ₂からのサンプルと重複する場合、Ｓ₁は半分ずつに分割され、各半分についてこの方法を適用する。何れかのＳ₁が空になるまで又はプロジェクションによってＳ₁及びＳ₂ を分離できなくなるまで（例えば、Ｓ₁及びＳ₂の両方の全ての画像が同一である場合）、これを継続する。実施例印刷された漢字において最も普遍的に使用される４種類のフォント（宋（Song ），方宋（Fang Song），黒（Hei）及び開（Kai））用の分類器を作製した。テキストサイズは７ポイント〜１４ポイントの範囲内であり、空間サンプリング速度は４００画素／インチである。試験はGuoBiao符号化GB2312-80，レベル１の全ての３７５５文字クラスを包含した。（Code of Chinese Graphic Character fo r Information Interchange,Primary Set （GB2312-80）,National Standards Bu reau，Be1jing，China（1980）参照）印刷漢字認識システムで普遍的に使用される幾つかの特徴を選択する。（S.Mori et al.，”Research on Machine Recognition of Handprin ted Characters,”IEEE Trans．on Pattern Analysis and Machine Intelligenc e PAMI-6，4，（July 1984）386-405参照）入力文字の２値画像は最初、簡単なスケーリング及びセンタリングにより４８×４８２進値画素マトリックスにサイズ正規化された。すなわち、各画像は、多くとも２²³⁰⁴１０⁶⁹⁴個別ポイントを含有する、４８×４８＝２３０４ディメンジョンの２進値ベクトルスペース内のポイントにマップされる。垂直及び水平プロジェクションプロファイル，外部輪郭線から外接ボックスまでの距離及びストローク方向の分布からなる、３種類の整数値セットを使用した。プロジェクション特徴を次のように計算する。画像エリアを上下半分ずつに分割し、（各列内の黒画素の数を計数する）垂直プロジェクションプロファイルをそれぞれについて計算する。同様に、２つの水平プロジェクションプロファイルを左半分及び右半分について取得する。次いで、これら４個のプロファイルを連結し、４８×４＝１９６ディメンジョンのベクトルを生成する。各プロジェクション特徴の整数値は［０，２４］の範囲内に存在する。輪郭線特徴は外接ボックスの４つの端部の各々から文字の外部輪郭線までの距離である。各列について、ボックスの上端から列の最初の黒画素までの距離及び下端から最後の黒画素までの距離を計算する。同様に、各行について、左端から最も左側の黒画素までの距離及び右端から最も右側の黒画素までの距離を計算した。これらの距離は４８×４＝１９２ディメンジョンのベクトルを生成する。各輪郭線特徴の整数値は［０，４８］の範囲内に存在する。ストローク方向特徴をラン・レングス分析により次のように計算する。各黒画素から、黒ランが４つの方向（水平，ＮＥ−ＳＷ対角線，垂直及びＮＷ−ＳＥ対角線）に拡張されるに応じて、この画素を含有する黒ランの長さを計算する。次いで、この画素に、ラン・レングスが最大である方向を標識する。次いで、画像エリアを１６個の（１２×１２）平方領域に区分けし、各領域内の４種類のタイプの各々の画素の個数を計数する。これらの計数値を１６×４＝６４ディメンジョンのベクトルに記憶する。各ストローク方向特徴の整数値は［０，１４４］の範囲内に存在する。従って、各文字画像は、多くとも２５¹⁹²×４９¹⁹²×１４⁵⁶⁴１０⁷³¹個別ポイントを含有する、１９２＋１９２＋６４＝４４８ディメンジョンの整数値ベクトル空間内のポイントにマップされる。輪郭線及びストローク方向特徴の両方の整数値範囲を、プロジェクション特徴の範囲に整合する［０，２４］内に収まるように圧縮する。クラス当たり８００個のサンプルを有する学習セットを生成した。従って、各特徴について、今までの特徴値のサンプルよりも３２倍も多いサンプルを有する。歪曲サンプルを生成するために、印刷、光学及びデジタル化による欠陥の明示的、定量的なパラメータ化モデルと、このモデルを実現するための擬ランダム画像発生器を使用する。モデルパラメータは、出力（ポイント単位）の公称テキストサイズ、出力空間サンプリング速度（画素／インチ単位のデジタル化解像度）、ポイントスプレッド関数（出力画素単位の、ガウス汚点カーネルの標準的エラー）、デジタル化閾値（強度単位、０．０は白を示し、１．０は黒を示す）、画素センサ中の感度分布（閾値に加えられるノイズターム）、画素中のジッタ分布（すなわち、出力画素単位の、典型的平方格子からのセンサ中心の不一致）、回転（スキュー角度）、ストレッチング係数（水平及び垂直の両方）及び画素格子に対する翻訳オフセットを特定する。学習セットデータの公称テキストサイズは７，９，１１及び１３ポイントであり、テストセットの場合は８，１０，１２及び１４ポイントである。擬ランダム発生器はこれらパラメータの分布仕様を受容する。各パラメータはそれぞれ独立にランダム化される。これらの試験で使用される分布は次の通りである。デジタル化解像度は４００画素／インチに固定する。ガウス汚点カーネルの標準的エラーは画像毎に変化し、通常、平均０．７、標準エラー０．３（出力画素）で変化する。２進化閾値は画像毎に変化し、通常、平均０．２５、標準エラー０．０４（強度）で変化する。画素センサ感度は画素毎に変化し、通常、平均０．１２５、標準エラー０．０４（強度）で変化する。ジッタは画素毎に変化し、通常、平均０．２、標準エラー０．１（出力画素）で変化する。スキューは画像毎に変化し、通常、平均０、標準エラー０．７°で変化する。幅に影響を及ぼす乗算係数は［０．８５，１．１５］の間隔で一律に変化し、高さに影響を及ぼす乗算係数は、通常、平均１．０、標準エラー０．０２で変化する。翻訳オフセットは［０，１］（出力画素単位）で一律に選択される。フォント／サイズ／記号のトリプルの各々について、各フォント／記号対の総数２００個の学習／テストセットについて、また、各記号の総数８００セットについて５０個のサンプルを生成する。各学習サンプルについて特徴抽出機を適用する。結果は、４４８ディメンジョンの整数値ベクトル又は同値的に、４４８×２５＝１１２００ディメンジョンの２進値ベクトルの何れかとして見做すことができる。これは“分布マップ”と呼ばれる。単一のサンプルに関する分布マップでは、各特徴は２５ビットで示され、単一サンプルの場合、単一ビットは、特徴の値を示す１に設定される。このような分布マップを第７図に示す。各クラスについて、８００個の学習サンプルに関する分布マップを、これらのブール共用体を計算することにより、一つのマップに併合する。このようなクラス分布マップでは、学習セット内で少なくとも一度は生じる各特徴値は１に設定されたビットにより示される。また、０値ビットは決して生じない特徴値を示す。この試験で使用された最初の３つのクラスの分布マップを第８図に示す。分類器は記憶域の全３７７５分布マップ群（総数３７７５×１１２００４２．１メガビット又は５．２６メガバイト）により完全に説明される。テスト中、各文字画像の特徴を抽出し、そして、各クラスについて、特徴をクラス分布マップに整合させる。これは、４４８ビットベクトルを計算することにより行う。この場合、この特徴がクラス分布マップ内で生じる場合にのみ、各特徴に対応するビットは１に設定される。最後に、このクラスの“距離”は、全て１の値を有する典型的ベクトルに対するこのベクトルのハミング距離であると見做される。完全ＧＢ２３１２−８０レベル１における３７５５クラスについて分類器の性能を評価した。分類器を３７５５クラスの各々の８００サンプルについて学習させた。総数８００×３７５５＝３００４０００サンプルをテストした。表１に分類結果を示す。表２は最適選択に関する様々なサイズの近傍におけるエラー数及び正確率を示す。（すなわち、正解クラスが所定の近傍内のどこにでも存在する場合、“正確”カウントがされる。）

Claims

【特許請求の範囲】１．入力画像を受信し、この入力画像を学習画像の学習セットと比較することにより、この入力画像を複数の画像クラスのうちの一つに割当てる画像分類器であり、該分類器は、ａ）複数のクラス分布マップと、ここで、前記各マップは学習画像について評価された複数の特徴に基づき、また、前記各マップは、対応するクラスに属する学習画像に関する学習セット内で少なくとも１回は生じる特徴値を示す，ｂ）入力画像について複数の特徴を評価することによりテストマップを構成する手段と，ｃ）どのクラス分布マップがテストマップに対して最小の距離を有するか識別し、これにより入力画像を識別クラス分布マップのクラスに割当てるために、テストマップをクラス分布マップと比較する手段とからなり、ｄ）少なくとも一つの特徴は、少なくとも一つの画像クラスの画像形状に関するルールに従って定義されることを特徴とする画像分類器。２．入力画像を受信するステップと、入力画像を学習画像の学習セットと比較するステップと、この比較ステップに基づいて、入力画像を複数の画像クラスのうちの一つに割当てるステップとからなり、前記比較ステップは、ａ）複数の数値画像特徴を入力画像について評価し，ｂ）この入力画像について評価された画像特徴値を示すテストマップを構成し，ｃ）テストマップを複数のクラス分布マップの各々と比較し、前記各クラス分布マップは個別画像クラスに対応し、前記各マップは学習画像について評価された複数の特徴に基づき、前記各マップは対応するクラスに属する学習画像に関する学習セット内で少なくとも１回は生じる特徴値を示す，ｄ）前記（ｃ）の過程で、どのクラス分布マップがテストマップに対して最小の距離を有するか識別し，そして、ｅ）割当てステップは、入力画像を、（ｄ）で識別された最小距離を有するクラスに割当てることからなる文字認識方法であり、ｆ）ステップ（ａ）は、少なくとも一つの画像クラスの画像形状に関するルールに従って定義される少なくとも一つの画像特徴を評価することからなることを特徴とする文字認識方法。