JP2000512046A - 統計に基づくパターン識別のための方法及び装置 - Google Patents

統計に基づくパターン識別のための方法及び装置

Info

Publication number
JP2000512046A
JP2000512046A JP10501110A JP50111098A JP2000512046A JP 2000512046 A JP2000512046 A JP 2000512046A JP 10501110 A JP10501110 A JP 10501110A JP 50111098 A JP50111098 A JP 50111098A JP 2000512046 A JP2000512046 A JP 2000512046A
Authority
JP
Japan
Prior art keywords
class
classifier
vector
classifiers
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10501110A
Other languages
English (en)
Inventor
ブロイアー トーマス
ハニッシュ ヴィルフリート
フランケ ユルゲン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JP2000512046A publication Critical patent/JP2000512046A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24317Piecewise classification, i.e. whereby each classification requires several discriminant rules
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2453Classification techniques relating to the decision surface non-linear, e.g. polynomial classifier

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Nonlinear Science (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 本発明は統計に基づくパターン識別のための方法及び装置に関し、この方法では、識別すべき対象に対して2クラスクラシフィケータ又はマルチクラスクラシフィケータの完全な集合に基づいてクラス集合の各目標クラスへの所属度を数値によって推定し、この数値は多項クラシフィケータの縦続的な適用によって得られる。本発明では、全ての2クラスクラシフィケータ又はマルチクラスクラシフィケータの中から、これら全ての2クラスクラシフィケータ又はマルチクラスクラシフィケータの推定ベクトルスペクトラムを介して、全ての識別すべきクラスパターンが十分に存在している学習標本検査において、次のような2クラスクラシフィケータ又はマルチクラスクラシフィケータの選択を行う、すなわちこれら2クラスクラシフィケータ又はマルチクラスクラシフィケータの推定が推定ベクトルスペクトラムを介して計算される分離する上で重要なスカラー値の最小化に最も強く寄与するような2クラスクラシフィケータ又はマルチクラスクラシフィケータの選択を行う。次いで選択された2クラスクラシフィケータ又はマルチクラスクラシフィケータを用いて拡大された学習標本検査を介して推定ベクトルを形成し、この推定ベクトルから多項式による結合によって展開された特徴ベクトルを生成し、この特徴ベクトルに基づいて全目標クラスに対する推定のために評価クラシフィケータを形成する。

Description

【発明の詳細な説明】 統計に基づくパターン識別のための方法及び装置 記述 パターン識別は電子データ処理の時代においてますます重要性を増している。 その適用領域は自動化技術から機械的な画像及びテクスト処理にまで広がり、こ の機械的な画像及びテクスト処理ではパターン識別は自動手紙分配(住所読み取 り)のために又は書式又は文書の評価のために使用されている。この場合パター ン識別の目的は、電子的に事前処理された画像情報にパターンの真の意味内容と 一致する標識を高い確実性で割り当てることである。統計的に基礎付けられたパ ターン識別方法はデジタル化された画像情報を推定する。この推定からパターン のクラスへのこのパターンの所属度を読みとることができる。目標クラスがK個 与えられている場合、一般的に次のようなクラスが選ばれる。すなわちこのクラ スの推定結果が全K個の推定の最大値に相応するようなクラスが選ばれる。最大 値と推定された目標クラスが真の目標クラス(意味内容)に頻繁に一致すればす るほど、識別システムはそれだけ信頼性が高いと見なされる。2クラスクラシフ ィケータ(Zweiklassen-Klassifikator)の完全な集合から成るこれまで使用さ れてきたネットクラシフィ ケータ(Netzklassifikator)は、全ての可能なK*(K−1)/2個のクラスペ アに対してそれぞれ2クラスクラシフィケータを計算することから発生する。上 記ネットクラシフィケータはK個の目標クラスを決定しなくてはならない。読み 取り動作においては、存在するパターンにおいて2クラスクラシフィケータの各 々が、基礎となる2つの目標クラスのうちの1つへのこのパターンの所属度推定 を送出する。K*(K−1)/2個の推定が発生し、これらK*(K−1)/2個 の推定は互いに独立している。これらK*(K−1)/2個の推定からK個の推 定が、つまり各目標クラス毎に1つの推定が形成される。この理論はこの点にお いてWojciech W.SiedleckiのA formula for multiclass distributed classifie rs,Pattern Recognition Letters 15 (1994)に記載の数学的規則を提示する。こ れらのクラシフィケータの実用は、この規則の適用可能性が不十分にしか満たさ れないことを示す。というのも、2クラスクラシフィケータがその適応されたク ラス領域には所属しない未知のパターンを推定するやいなや、この2クラスクラ シフィケータは統計的な事後確率を与えないからである。実際にはこれはスイッ チメカニズムができるだけ早期にこのパターンに所属しないクラシフィケータを 非活性化しなくてはならないことを意味する。これまで実際に使用されてきたス イッチ規則はかなりヒューリスティックな特徴を帯びて いた。従って、ネットクラシフィケータの処理には統計学的には制御できない恣 意の要素が入り込んでいる。測定可能な統計的な特性を免れないパラメータのこ の規則に基づいた処理によって、分類結果は本質的に劣化する。さらにネットク ラシフィケータの規則に基づいた処理は、変更された標本検査によってこのクラ シフィケータシステムを効果的に再トレーニングする可能性を妨げる。決定すべ きクラスが30又はそれより多くある場合、さらにネットクラシフィケータの使 用は次のような原理的な問題に直面する: 1.記憶すべき成分(ペアクラシフィケータ(Paarklassifikator))の総数が クラス総数(K*(K−1)/2)の2乗に従って増える。 2.成分に関する推定の評価及びこの成分に関する推定を信頼できる全体的推定 にまとめあげることは、クラス数の増加に伴ってますます不確実になる。 3.ネットクラシフィケータをその地方固有の書体に適合させることにより適応 動作に多額のコストがかかってしまう。 請求項1及び8に記載の本発明の課題は統計学に基づくパターン識別方法及び この方法を実現するための装置を提供することであり、この方法は、クラス数が 多い場合の前述した従来技術の困難を回避しつつ、是認できるコストで普遍的な 識別という課題がリアルタイムで可能なように解決することであり、さらにネッ トクラシフィケータの規則に基づく処理を回避することである。 本発明により得られる利点はとりわけヒューリスティックなスイッチ規則を回 避することによって識別の確実性を大きく高めることである。2クラスクラシフ ィケータ又はマルチクラスクラシフィケータの選択及び評価クラシフィケータの 生成の後で、適用の全統計がこの評価クラシフィケータに基づくモーメント行列 で表現される。評価クラシフィケータに結合した2クラスクラシフィケータ又は マルチクラスクラシフィケータの縮小された系列を記憶しさえすればよいので、 非常に経済的なメモリの利用が達成される。画像特徴処理に関連して多項クラシ フィケータは全ての演算を加算、乗算及び自然数の配置によって実施するので、 目標ハードウェアにおいて浮動小数点シミュレーションのような比較的複雑な計 算を完全に削除できる。またメモリコストのかかるテーブル装置の設置も行わな い。これらの事情により目標ハードウェアのデザインの際には実行時間の最適化 に全力をかければよい。本発明の有利な実施形態は、従属請求項から得られる。 請求項2記載の実施形態では、スカラー分離値(分類値)として判定空間におけ る2乗誤差の和が選択される。この場合の利点は、線形クラシフィケータの計算 によって現れる線形回帰の経過に明らかに残差の最小化への寄与に応じて成分の 間に順位が構成されること である。この順位は自由に使用可能な2クラスクラシフィケータ又はマルチクラ スクラシフィケータから選択するために利用される。この選択は結果的にペアク ラシフィケータの縮小された集合を形成する。残差を最小化するための方法は詳 しくはSchuermann,Statistischer Polynomklassifikator,R.Oldenburg Verlag,1 977に記述されている。 請求項3記載の実施形態はスカラー分離値として推定ベクトルの分布空間にお けるエントロピーを使用する。エントロピーの評価のためにこの場合全ての状態 の集合に亘って全てのペアクラシフィケータ推定の各状態の出現頻度を算出する 。次いで最小エントロピーを作り出すような部分系を求める。請求項4記載の実 施形態では、比較的大きい目標クラス集合を複数の目標クラス集合に分割する。 これら複数の目標クラス集合のに対してそれぞれ2クラスクラシフィケータ又は マルチクラスクラシフィケータの選択を行ないそこから評価クラシフィケータを 生成する。評価クラシフィケータの結果から次いで最終的な全体推定を求める。 最終的な全体推定は様々な方式で計算できる: 1.請求項5記載の実施形態では、評価クラシフィケータの結果ベクトルから 直交座標に拡張された積ベクトルが形成される。この積ベクトルから次いで全体 推定を算出する最終的な2乗評価クラシフィケータが形成される。 2.請求項6記載の実施形態では、同様に直交座標の積ベクトルが形成される 。これは部分空間変換Uを用いて縮小されたベクトルに変換され、この縮小され たベクトルの中から変換行列Uの固有値分布に従って最も重要な成分だけが2乗 クラシフィケータの適応に使用される。この2乗クラシフィケータは次いで変換 されかつ縮小されたベクトルを目標クラスの評価ベクトルに写像する。 3.請求項7記載の実施形態では、クラス集合のグループに関して学習を行っ たメタクラスクラシフィケータが、2クラスクラシフィケータ又はマルチクラス クラシフィケータの各選択の活性化の前にこれらグループに関して推定を行う。 次いで、所定の閾値を越える推定値を有する、グループの記号に対する2クラス クラシフィケータ又はマルチクラスクラシフィケータが活性化される。次いで全 体推定を求めるために、グループ評価と記号目標クラスに対してそれぞれ所属の 記号評価クラシフィケータの評価が統一的な規則に則って結合され、この結果、 このように得られる全記号推定に亘る和が1に正規化可能な数を生ずる。第1の 方法は最も精確な結果を与えるが、最も大きな計算技術コストがかかる。他方で 第2及び第3の方法は計算技術コストの低減に寄与する。 本発明の変換は5つのフェーズに分かれる。本発明の各フェーズを次に実施例 によって図面を参照しつつ 詳しく説明する。 図1はネットクラシフィケータのペアクラシフィケータの完全な集合を生成す る際の経過を示す。 図2はペアクラシフィケータの縮小された集合を生成する際の経過を示す。 図3は評価クラシフィケータの生成の際の経過を示す。 図4は本発明の装置におけるパターン識別の経過を示す。 図5はメタクラスクラシフィケータを使用して大きなクラス総数を有するパタ ーン識別の際の経過を示す。 本発明を以下に2クラスクラシフィケータ(ペアクラシフィケータ)の集合に 基づいて説明する。しかし、本発明は原理的にこの限定に制限されない。 ネットクラシフィケータの生成 図1によればプロセスステップはバイナリ画像により開始される。学習標本検 査の各画像に対してバイナ 像の黒色ピクセルは1で表され、他方で白色ピクセルは0で符号化されている。 付加的に各パターンには人によって行われる基準識別が実施される。この基準識 別はパターンの意味内容を一義的に検出する。正規化は局所的及び大局的なピク セルの割合の測定に基づい てバイナリ画像をグレイスケール画像に変換する。こ じ、各成分はスケーリング範囲[0,255]の中のグ 主軸変換される。この行列ベクトル乗算の結果は画像 る。2次元Wベクトル(W1,W2)に対して例えば結合規則は: PSL1=LIN1,2QUAD11,12,22であり、これは次のxベクトル を生成する: 後で生成される推定値が和において1に正規化されるように、第1の成分にはい つも1を予め割り当てる。スの各ペア(i,j)に対して生成される。クラスiはこの場合人がクラスiに所属す ると見なす記号のみを含む。各モーメント行列にはSchuermann J.,Polynomklass ifikatoren fuer die Zeichenerkennungに記述された方法に従って回帰が行われ る。公式(1)に従って次い られる。ネットクラシフィケータとしてはこれによりK*(K−1)/2個のペ アクラシフィケータの集合が成立する。これらペアクラシフィケータの各々(2 ク ラス判定子)は相応のパターンデータに亘って学習しているので、これらペアク ラシフィケータの各々(2クラス判定子)は自由に処理できるK個の目標クラス から精確に2個の目標クラスを識別する。次の関係式が成り立つ: 値ベクトルであり、p(i)はクラスiの出現頻度である。 はクラスiに対する値d(i,j)を推定し、この場合次式が成り立つ: クラシフィケータ係数A(i,j)[l]はこの場合常に次式が成り立つように調整され る: d(i,j)+d(j,i)=l (4) ペアクラシフィケータの総数の縮小 このプロセスステップは図2に概略的に図示されている。ネットクラシフィケ ータの生成後、このネットクラシフィケータの推定ベクトルスペクトラム{d(i, j)}は、クラス別に近似的に均一に分布された学習標本検 査を介して検出される。この学習標本検査には識別される全てのクラスパターン が十分に入っている。分類 の集合である。この集合は全てのペアクラシフィケータを有する学習標本検査の 分類によって得られる。個々のdベクトルは、学習標本検査の記号の展開された 、次いでこのスカラー積の結果をペアクラシフィケー 。次に特徴集合{d(i,j)}に対する統計的な操作を介して、目標条件として分離す る上で大いに重要なスカラー を求める。例として次の2つのスカラー分類値に基づいて説明する: D(I)判定空間における2乗誤差の和S2 この場合クラシフィケータALinは式(1)により生 成される。それ故このクラシフィケータALinは線形である。というのも、式(2 )によるモーメント行列の計算のためにはxベクトルとして第1の位置において d(i,j)から構成されている。この変形実施形態は次の様な利点を有する。すなわ ち、線形クラシフィケータ らかに残差の最小化への寄与に応じて順位が成分d(i,j)の中に構成されるという 利点である。この順位はK*(K−1)/2個の使用可能なペアクラシフィケー タの中から選択するために利用される。この選択は結果的にペアクラシフィケー タの縮小された集合を形成する。残差を漸減するための方法にはことではもはや くわしく説明する必要はない。詳細にSchuermann J.,Polynomklassifikatoren f uer die Zeichenerkennung,Kapital 7に記述されている。選択の際には現在順位 によって75個の最重要な成分に限定している。この限定は適応に使用される計 算機のメインメモリ容量に依存しており、従って原理上の限定ではない。従って 、特徴集合{d(i,j)に亘る線形回帰の結果はペアクラシフィケータの配列された 集合{A(iα,jα)}α=1,...,75であり、これらペアクラシフィケータでは変化す るインデックスαによって2乗残差の縮小への寄与が相対的に落ちて行く。さら に別の適応経過ではこの選択された集合がペ ア分類にさらに使用される。 d(i,j)分布空間におけるエントロピー 2クラス判定子の構造化されていない集合のエントロピーHを形成するために は次の表現を計算する必要がある: 表現p(I|d(i,j))は、語の定義通り、クラシフィケータA(i,j)が所定の推定d( i,j)においてクラスIのパターンを分類したことに対するベイズの事後確率であ る。ベイズの公式: を使用し、そして次の定義: を使用すれば、エントロピーHを経験的なエントロピーH*によって任意に精確 に近似することもできる。パ ラメータ: UR:=下限推定閾値 OR:=上限推定閾値 MAX:=ヒストグラムの区画の総数 は推定ベクトルスペクトラムに基づいて定められる。次いでパラメータNi,j, α, J がパターンの学習標本検査を介して選択される。Ni,j, α,Jを求めた後で次のパ ラメータが得られる: 計算を実施するとエントロピーに結びついた全ての統計的パラメータが求めら れる。今や次のような部分系を定めることができる。すなわち、 1. この部分系の個々のエントロピーの和において最小の全体エントロピーが 生成され、さらに 2. この部分系の成分が相互に統計的にできるだけ小さい相関を有するような 部分系を定めることができる。 上記2つの要求は次の選択規準に従うことによって計算される: 1.エントロピー順位: 同一のエントロピーのクラシフィケータに至るまで一義的な系列A(iα,jα)をによって定める。 2.帰納法の開始: れは最小のエントロピーのクラシフィケータである。 3.kからk+1までの帰納法: 自由な角度パラメータΘcritは勾配法によって所定の総数の選択された成分が 成立するように調整される。選択規準をより細かくすることは相関係数COR(i.j; k,l)の最小化によって達成される。フィルタ条件(25)はこの場合: となる。 よって、それぞれ2個のペアクラシフィケータの間の許容される最大相関係数 はχcritによって制限される。さらに相関係数は対称性条件: を満たす。 この方法は上述の分類値に対して実施されるが、原 理的にはこれに限定されない。本発明の従属請求項は他の分類値に基づく方法の 特徴に関連する。 評価クラシフィケータの生成 このプロセスステップは図3に示されている。図3では(RNK)と記されて いるペアクラシフィケータ 定クラス毎に少なくとも9000パターンを含む拡張された学習標本検査を介し て推定ベクトルの計算に使用される。次元75の個々のベクトルから構成される 特徴集合{d(iα,jα)}が成立し、各パターンに対して目標識別子(パターンの意 味内容)が画像特徴集合から同時に記入されている。各特徴ベクトルを介して多 項式に み付け平均によって生成される。次いで回帰法がクラス毎の評価クラシフィケー タを次式によって生成する:ここでP(I)はクラスIの出現頻度である。これによって、ペアクラシフィケータ 推定と個々のクラスに対する全体推定との間の関係に関する他の仮定なしにこの 関係をd(i,j)空間における近似的な統計的分布から計算す るインスツルメントが作られる。ペアクラシフィケータ推定と全体推定との間の 最適な関係に対する計算上の近似は、基礎となる学習標本検査が全体的なものに なればなるほど良好になる。この方法の成果は、とりわけ適当な学習標本検査の 選択の際の恣意の程度が仮説的数学的関連の構築の際に行われる恣意の程度より も制限されることに現れる。ペアクラシフィケータの縮小された集合及びこの集 合に結合された評価クラシフィケータの生成によって適応フェーズは完了する。 この適用の全統計は今や評価クラシフィケータの基礎となるモーメント行列に表 現されている。このモーメント行列は次の適応過程のためにアーカイブに保管さ れる。適当な評価クラシフィケータと結びついたペアクラシフィケータの縮小さ れた系列のみが統合されて積になる。よって、この方法は極端に圧縮された情報 単位(モーメント行列)を生成できる。この情報単位はパターン識別の所与の適 用を表し、将来の反復(地方固有の適合)のためのスタート対象として使用可能 である。 本発明の方法の相応の装置での使用法 このプロセスステップは図4に概略的に示されている。この方法は、リアルタ イムシステムにおいて配列され縮小されたペアクラシフィケータの系列を適用す ること及びそれぞれの適用に適合した評価クラシフィ ケータを使用することを許す。どの評価クラシフィケータが適用事例にとって最 高の成果をもたらすのか不十分にしか分からない場合に使用の申し出が多くなり 、読み出しテストは最適な評価クラシフィケータを示す。目標ハードウェアへの 最小限の要求は、次のコンポーネントが存在していることを条件とする: 1.NORM:バイナリ化された特徴ベクトルを従来技術に応じた正規化方法に よって変換し、一定の長さの入力ベクトル(vベクトル)に格納するモジュール 。 2.POLY:一定の写像規則に従って、正規化されたwベクトルを、分類のた めの入力ベクトルとして使用される多項式展開されたxベクトルに変換するモジ ュール。 3.MAT:外部マイクロプログラムを介して制御された、整数ベクトル間のス カラー積を計算する行列乗算装置。 4.STORE:中間値を格納しクラシフィケータ係数をアドレス指定するため のメモリ。 5.ALGO:制御命令乃至は実施可能なマシーンコードを格納するための命令 レジスタ。 メモリは、中間結果の格納及び読み出しのためのユニットSTOREI及び不 変の値を読み出すためのユニットSTORE2に分割される。 上述の方法に対して図4に記載された操作が必要で ある。この場合命令レジスタALGOによって制御されて順番に次のようなステ ップが実施される: 1. 識別プロセスがピクセル画像の読み込みによってスタートする。パターン 走査の後でこのパターンが れる。原則的にバイナリの1には黒色ピクセルが対応し、0には白色ピクセルが 対応する。NORMは行及び列毎のピクセル密度の測定に基づいてバイナリ画素 を組み替えて、結果として16×16画像行列に相応 レースケール画像の各画素は256個のグレースケール段でスケーリングされて いる。NORMはこのベク出す。この主軸変換行列は、適応フェーズにおいて特 される。行列ベクトル乗算が実施される。結果は変換 STORE1に格納される。 TORE1から読み出し、リストPSL1をSTOR のように結合すべきか、という制御情報を含んでいる。xベクトルがSTORE 1に格納される。 4. モジュールMATがSTORE1からxベクトルを読み出し、RNKの行 列要素を読み出す。このR 納されている。MATは各Aベクトル毎にxベクトルとのスカラー積を形成する 。よって、Aベクトルと同数のスカラー積が成立する。これらスカラー積はAベ クトルの順番でdベクトルになる。これらをMATはSTORE1に格納する。 5. モジュールPOLYがSTORE1からdベクトルを読み出し、STOR E2からPSL2を読み出す。PSL2をdベクトルに適用することによって、 POLYは今やXベクトルを構成する。XベクトルをSTORE1に格納する。 6. XベクトルがモジュールMATによってSTORE1から読み出され、他 方でMATは今度は評価クラシフィケータのA行列をSTORE2から読み出す 。この行列は評価クラシフィケータがクラスを推定するのと同数のAベクトルを 含む。MATは読み出しの後で各Aベクトルに対してXベクトルとのスカラー積 を実施する。このスカラー積はAベクトルの順番でDベクトルに束ねられる。こ れらをMATはSTORE1に書き込む。 このループが経過するとSTORE1に結果としてDベクトルがいつでも使用 可能状態で存在する。このDベクトルは、判定問題のK個のクラスの各々に対し て数字間隔[0,1]の推定を含んでいる。最大推定値に対応するクラシフィケー タの評価を受け入れるか拒否するかは後続処理モジュールの問題である。分類に よる後続処理の支援は次のことによって保証されている。すなわち、適応フェー ズから評価クラシフィケータの連続推定スペクトラムが周知であり、この連続推 定スペクトラムからコストモデルの適用の際に推定の拒否乃至は受け入れに対し て統計的に防護された閾値が導出されうる。さらに推定ベクトル統計が読み出し 動作の際に周期的に検出されるならば、閾値の動的な事後調整に関する統計的な 予想が導出される。 普遍的な文字数字併用識別(アルファアニューメリック・リコグニション)への 応用 10個の数字、30個の大文字、30個の小文字及び20個の特殊記号から構 成される一般的なクラス集合の識別の際には、全体として少なくとも90個のク ラスを判別しなくてはならない。識別問題を完全なネットクラシフィケータによ って解決するつもりならば、これら90個のクラスには4005個のペアクラシ フィケータが相応するだろう。従って、従来の読み取り電子装置のメモリ容量も 計算能力にも過負荷となる。90個の意味内容クラスの代わりに、識別理論的な 理由から、同一の記号クラスのそれぞれ典型的な書体形式を表すいわゆるゲシュ タルトクラス(Gestaltkla ssen)を導入するすれば、この問題はますます厳しくなる。ゲシュタルトクラス を基礎とすれば、200クラスまで分割される。 この問題は、グループネットクラシフィケータ及びグループ評価クラシフィケ ータからなるメタクラスクラシフィケータが学習することにより解決される。こ のクラシフィケータ系は図5に図示されている。メタクラスクラシフィケータは この場合記号のグループを識別する。グループに対するクラスタリングは距離( Metrik)を介して実施される。この距離は個々のゲシュタルトクラスのモーメン ト行列に基づいて計算される。この場合、グループは互いに類似したゲシュタル トクラスが同一のグループに入るように構成される。グループのモーメント行列 はグループの中にあるゲシュタルトクラスの全てのモーメント行列に亘る重み付 け平均によって得られる。それぞれせいぜい30個のゲシュタルトクラスを含む 例えば8個のグループがある場合、メタクラスクラシフィケータ自体はネットク ラシフィケータと本発明により生成される評価クラシフィケータとの結合として 実現される。その後で各グループペアに対してペアクラシフィケータが得られる 。グループネットクラシフィケータはこの場合28個 8個のペアクラシフィケータに基づいてグループ評価 ラシフィケータはクラスとして8個のグループを推定する。次のステップでは、 ゲシュタルトクラスの各グ 方法に従って学習する。読み取りフェーズでまず最初にグループ評価クラシフィ ケータは、当該記号がどのグループに所属するのかを判定する。続いて判定され た1つ又は複数のグループに対応する縮小された記号ネットクラシフィケータが 閾値に依存して活性化される。この縮小された記号ネットクラシフィケータはグ ループにおいて代表的な各ゲシュタルトクラス毎に推定値を生成する。統計的基 礎に基づいて各グループ毎に閾値τIが調整される。この閾値τIは、グループ評 価クラシフィケータのどの推定品質(Schaetzguete)DI以上の相応の縮小された 記号ネットクラシフィケータ 計算コストでこれら縮小された記号ネットクラシフィケータのうちの少なくとも 1つがいつも高い確実性で正しい識別結果を有するように、これら閾値は調整さ れる。複数の記号評価クラシフィケータの結果が存在する場合、活性化された記 号評価クラシフィケータ との乗算の前に活性化されなかった記号評価クラシフィケータの推定値に1/ク ラス総数を予め掛けること によって、正規化された全体結果を得る。この分類手順によって普遍的な文字数 字併用識別問題は本発明の方法に完全に基づいて構成できる。 さらに別の解決方法を以下に挙げる: 1.基本クラシフィケータとしてマルチクラス判定子を取り入れること 本発明の方法は、原理的に2クラス判定子の集合を介する評価クラシフィケー タの適応に限定されるものではなく、マルチクラス判定子の集合にまで拡張され る。よって、n個のクラス判定子から成る集合において、n番目のクラスが、全 ての存在するクラスに関して同一の判定子の残りの(n−1)個のクラスに対す る補完クラスとなりうる。 2.本発明のクラシフィケータによるカスケードシステム 自動的な読み取り動作を実施してみると、すでに存在するパターンに対して比 較的弱く構築された識別モジュールがあまりにも低い推定品質を示す場合にのみ コントロール構造体が高度に構築された識別モジュールを呼び出すことによって 、一定の読み取り性能の場合には相当なコスト低減が可能であることがわかる。 本発明のクラシフィケータはこの戦略に完璧に組み込まれる。同一の基本クラシ フィケータに基づいて構成され縦続的に分類を行う本発明のクラシフィケータの システムが構成される。この場合、(n+1)番目の 評価クラシフィケータはn番目の評価クラシフィケータがあまりよく推定できな かったパターンによってトレーニングされる。実際の読み取り動作ではこのカス ケードは一般に最初の評価クラシフィケータの後で打ち切られるが、しかし珍し く難しいパターンの場合には引き続き継続され、これにより計算負荷上昇が小さ くても読み取り率は高まる。
【手続補正書】特許法第184条の8第1項 【提出日】平成10年5月29日(1998.5.29) 【補正内容】 請求の範囲 1. 統計に基づくパターン識別のための方法であって、該方法は識別すべき 対象に対して2クラスクラシフィケータ又はマルチクラスクラシフィケータの完 全な集合に基づいてクラス集合の各目標クラスへの所属度を数値によって推定し 、該数値は多項クラシフィケータの縦続的な適用によって得られる、統計に基づ くパターン識別のための方法において、 全ての2クラスクラシフィケータ又はマルチクラスクラシフィケータの中から 、これら全ての2クラスクラシフィケータ又はマルチクラスクラシフィケータの 推定ベクトルスペクトラムを介して、全ての識別すべきクラスパターンが十分に 存在している学習標本検査において、次のような2クラスクラシフィケータ又は マルチクラスクラシフィケータの選択を行い、すなわちこれら2クラスクラシフ ィケータ又はマルチクラスクラシフィケータの推定が推定ベクトルスペクトラム を介して計算される分離する上で重要なスカラー値の最小化に最も強く寄与する ような2クラスクラシフィケータ又はマルチクラスクラシフィケータの選択を行 い、 さらに選択された2クラスクラシフィケータ又はマルチクラスクラシフィケー タを用いて拡大された学習標本検査を介して推定ベクトルを形成し、該推定ベク トルから多項式による結合によって展開された特徴ベクトルを生成し、該特徴ベ クトルに基づいて全目標クラスに対する推定のために評価クラシフィケータを計 算することを特徴とする、統計に基づくパターン識別のための方法。 2. スカラー分離値として判定空間における2乗誤差の和を選択することを 特徴とする請求項1記載の方法。 3. スカラー分離値として分布空間におけるエントロピーを選択し、2クラ スクラシフィケータ又はマルチクラスクラシフィケータ推定の各特徴状態の出現 頻度は全ての特徴状態の集合に亘って求められることを特徴とする請求項1記載 の方法。 4. 比較的大きな目標クラス集合を複数の目標クラス集合に分割し、該複数 の目標クラス集合に対してそれぞれ2クラスクラシフィケータ又はマルチクラス クラシフィケータを選択し、そこから評価クラシフィケータを生成し、 該評価クラシフィケータの結果から最終的な全体推定を求めることを特徴とする 請求項1〜3記載の方法。 5. 評価クラシフィケータの結果ベクトルから直交座標に拡張された積ベク トルを形成し、該積ベクトルから全体推定を算出する最終的な2乗評価クラシフ ィケータを形成することを特徴とする請求項4記載の方法。 6. 評価クラシフィケータの結果ベクトルから直交座標に拡張された積ベク トルを形成し、該積ベクトルを部分空間変換を用いて変換されたベクトルにし、 該変換されたベクトルの中で変換行列の固有値分布に相応して最も重要な成分の みを2乗クラシフィケータの適応のために使用し、該2乗クラシフィケータは、 変換され縮小されたベクトルを目標クラスに対する推定ベクトルに写像すること を特徴とする請求項4記載のパターン識別方法。 7. クラス集合のグループに亘ってトレーニングされる2クラスクラシフィ ケータ又はマルチクラスクラシフィケータのそれぞれの選択の活性化の前に、前 記グループに亘る推定値を生成し、 その後で、前記グループの記号に対する次のような2クラスクラシフィケータ 又はマルチクラスクラシフィケータを活性化し、すなわち推定値が一定の閾値よ り上にあるような2クラスクラシフィケータ又はマルチクラスクラシフィケータ を活性化し、 次いで、全体推定を求めるために、各グループに含まれる記号クラスに対して それぞれ所属の記号評価クラシフィケータの推定値とグループ推定値とを統一的 な規則に従って結合し、このように結合された記号推定値の和が1に正規化可能 な数を生ずることを特徴とする請求項4記載の方法。 8. 統計に基づくパターン識別のための装置であ って、該装置は識別すべき対象に対して2クラスクラシフィケータ又はマルチク ラスクラシフィケータの完全な集合に基づいてクラス集合の各目標クラスへの所 属度を数値によって推定し、該数値は多項クラシフィケータの縦続的な適用によ って得られる、統計に基づくパターン識別のための装置において、 全ての2クラスクラシフィケータ又はマルチクラスクラシフィケータの完全な 集合の中から、これら全ての2クラスクラシフィケータ又はマルチクラスクラシ フィケータの推定ベクトルスペクトラムに基づいて、全ての識別すべきクラスパ ターンが十分に存在している学習標本検査を介して、2クラスクラシフィケータ 又はマルチクラスクラシフィケータの推定が推定ベクトルスペクトラムを介して 計算される分離する上で重要なスカラー値の最小化に最も強く寄与するような2 クラスクラシフィケータ又はマルチクラスクラシフィケータの統計的に最適な選 択を行うための手段を有し、 多項式に展開される特徴ベクトルを生成するための手段を有し、該特徴ベクト ルは選択された2クラスクラシフィケータ又はマルチクラスクラシフィケータの 系の構造を表し、さらに前記特徴ベクトルは拡大された学習標本検査を介して形 成され、 評価クラシフィケータの計算のための手段を有し、該評価クラシフィケータは 前記選択された2クラスク ラシフィケータ又はマルチクラスクラシフィケータの系の多項式による結合によ って展開された特徴ベクトルから推定ベクトルを計算し、該推定ベクトルは、各 目標クラス毎に、パターンの前記クラスへの分類されたパターンの所属度の近似 的な事後確率としての数値を含む、統計に基づくパターン識別のための装置。
───────────────────────────────────────────────────── 【要約の続き】 ケータを用いて拡大された学習標本検査を介して推定ベ クトルを形成し、この推定ベクトルから多項式による結 合によって展開された特徴ベクトルを生成し、この特徴 ベクトルに基づいて全目標クラスに対する推定のために 評価クラシフィケータを形成する。

Claims (1)

  1. 【特許請求の範囲】 1. 統計に基づくパターン識別のための方法であって、該方法は識別すべき 対象に対して2クラスクラシフィケータ又はマルチクラスクラシフィケータの完 全な集合に基づいてクラス集合の各目標クラスへの所属度を数値によって推定し 、該数値は多項クラシフィケータの縦続的な適用によって得られる、統計に基づ くパターン識別のための方法において、 全ての2クラスクラシフィケータ又はマルチクラスクラシフィケータの中から 、これら全ての2クラスクラシフィケータ又はマルチクラスクラシフィケータの 推定ベクトルスペクトラムを介して、全ての識別すべきクラスパターンが十分に 存在している学習標本検査において、次のような2クラスクラシフィケータ又は マルチクラスクラシフィケータの選択を行い、すなわちこれら2クラスクラシフ ィケータ又はマルチクラスクラシフィケータの推定値が推定ベクトルスペクトラ ムを介して計算される分離する上で重要なスカラー値の最小化に最も強く寄与す るような2クラスクラシフィケータ又はマルチクラスクラシフィケータの選択を 行い、 さらに選択された2クラスクラシフィケータ又はマルチクラスクラシフィケー タを用いて拡大された学習標本検査を介して推定ベクトルを形成し、該推定ベク トルから多項式による結合によって展開された特徴ベクトルを生成し、該特徴ベ クトルに基づいて全目標クラスに対する推定のために評価クラシフィケータを計 算することを特徴とする、統計に基づくパターン識別のための方法。 2. スカラー分離値として判定空間における2乗誤差の和を選択することを 特徴とする請求項1記載の方法。 3. スカラー分離値として分布空間におけるエントロピーを選択し、各特徴 状態の出現頻度は全ての特徴状態の集合に亘って求められることを特徴とする請 求項1記載の方法。 4. 比較的大きな目標クラス集合を複数の目標クラス集合に分割し、該複数 の目標クラス集合に対してそれぞれ2クラスクラシフィケータ又はマルチクラス クラシフィケータを選択し、そこから評価クラシフィケータを生成し、 該評価クラシフィケータの結果から最終的な全体推定を求めることを特徴とする 請求項13記載の方法。 5. 評価クラシフィケータの結果ベクトルから直交座標に拡張された積ベク トルを形成し、該積ベクトルから全体推定を算出する最終的な2乗評価クラシフ ィケータを形成することを特徴とする請求項4記載の方法。 6. 評価クラシフィケータの結果ベクトルから直 交座標に拡張された積ベクトルを形成し、該積ベクトルを部分空間変換を用いて 変換されたベクトルにし、該変換されたベクトルの中で変換行列の固有値分布に 相応して最も重要な成分のみを2乗クラシフィケータの適応のために使用し、該 2乗クラシフィケータは、変換され縮小されたベクトルを目標クラスに対する推 定ベクトルに写像することを特徴とする請求項4記載のパターン識別方法。 7. クラス集合のグループに亘ってトレーニングされる2クラスクラシフィ ケータ又はマルチクラスクラシフィケータのそれぞれの選択の活性化の前に、前 記グループに亘る推定値を生成し、 その後で、前記グループの記号に対する次のような2クラスクラシフィケータ 又はマルチクラスクラシフィケータを活性化し、すなわち推定値が一定の閾値よ り上にあるような2クラスクラシフィケータ又はマルチクラスクラシフィケータ を活性化し、 次いで、全体推定を求めるために、各グループに含まれる記号クラスに対して それぞれ所属の記号評価クラシフィケータの推定値とグループ推定値とを統一的 な規則に従って結合し、このように結合された記号推定値の和が1に正規化可能 な数を生ずることを特徴とする請求項4記載の方法。 8. 請求項1記載の方法を適用してパターン識別をするための装置において 、 可変的な長さのバイナリ化された入力ベクトルをグレースケール段に従ってス ケーリングされた一定の長さの出力ベクトルに変換するための手段(NORM) 、 正規化された入力ベクトルを多項式によって拡張されたベクトルに変換するた めの手段(POLY)、 整数ベクトル間のスカラー積を計算するために行列乗算を実施するための手段 (MAT)、 中間値を格納するための記憶のための及びクラシフィケータ係数をアドレス指 定するための手段(STORE)、 制御命令を格納するための手段及び実施可能なマシーンコード命令レジスタを 特徴とする請求項1記載の方法を適用してパターン識別をするための装置。
JP10501110A 1996-06-08 1997-05-23 統計に基づくパターン識別のための方法及び装置 Pending JP2000512046A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19623033.0 1996-06-08
DE19623033A DE19623033C1 (de) 1996-06-08 1996-06-08 Verfahren und Anordnung zur Mustererkennung auf statistischer Basis
PCT/EP1997/002649 WO1997048069A1 (de) 1996-06-08 1997-05-23 Verfahren und anordnung zur mustererkennung auf statistischer basis

Publications (1)

Publication Number Publication Date
JP2000512046A true JP2000512046A (ja) 2000-09-12

Family

ID=7796481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10501110A Pending JP2000512046A (ja) 1996-06-08 1997-05-23 統計に基づくパターン識別のための方法及び装置

Country Status (6)

Country Link
US (1) US6205247B1 (ja)
EP (1) EP0978088B1 (ja)
JP (1) JP2000512046A (ja)
DE (2) DE19623033C1 (ja)
TW (1) TW344063B (ja)
WO (1) WO1997048069A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000033160A2 (en) 1998-12-03 2000-06-08 Expanse Networks, Inc. Subscriber characterization and advertisement monitoring system
US7240355B1 (en) 1998-12-03 2007-07-03 Prime Research Alliance E., Inc. Subscriber characterization system with filters
US7150030B1 (en) 1998-12-03 2006-12-12 Prime Research Alliance, Inc. Subscriber characterization system
US7949565B1 (en) 1998-12-03 2011-05-24 Prime Research Alliance E., Inc. Privacy-protected advertising system
EP1190373B1 (de) * 1999-05-12 2002-12-04 Siemens Aktiengesellschaft Verfahren zum adresslesen
KR100400500B1 (ko) 2000-08-21 2003-10-08 삼성전자주식회사 특징 벡터 데이터 공간의 인덱싱 방법
DE10132013B4 (de) * 2001-07-03 2004-04-08 Siemens Ag Multimodale Biometrie
AU2003228334A1 (en) * 2002-03-19 2003-10-08 E-Book Systems Pte Ltd Tracking electronic book reading pattern
US7487148B2 (en) * 2003-02-28 2009-02-03 Eaton Corporation System and method for analyzing data
US7418128B2 (en) * 2003-07-31 2008-08-26 Microsoft Corporation Elastic distortions for automatic generation of labeled data
US20060018549A1 (en) * 2004-07-20 2006-01-26 Jianming Liang System and method for object characterization of toboggan-based clusters
US20060209063A1 (en) * 2004-10-12 2006-09-21 Jianming Liang Toboggan-based method for automatic detection and segmentation of objects in image data
US7450766B2 (en) * 2004-10-26 2008-11-11 Hewlett-Packard Development Company, L.P. Classifier performance
US7519567B2 (en) * 2005-10-31 2009-04-14 Hewlett-Packard Development Company, L.P. Enhanced classification of marginal instances
JP4948379B2 (ja) * 2007-12-18 2012-06-06 キヤノン株式会社 パターン識別器生成方法、情報処理装置、プログラム及び記憶媒体
DE102008061995A1 (de) 2008-12-12 2010-06-17 Siemens Aktiengesellschaft Anordnung und Verfahren zur Anzeige einer Meldung an einen Straßenverkehrsteilnehmer
US8442309B2 (en) * 2009-06-04 2013-05-14 Honda Motor Co., Ltd. Semantic scene segmentation using random multinomial logit (RML)
US8458677B2 (en) * 2009-08-20 2013-06-04 International Business Machines Corporation Generating code adapted for interlinking legacy scalar code and extended vector code
JP5258915B2 (ja) * 2011-02-28 2013-08-07 株式会社デンソーアイティーラボラトリ 特徴変換装置、それを含む類似情報探索装置、コード化パラメータ生成方法、及びコンピュータ・プログラム
WO2013039474A1 (en) * 2011-09-12 2013-03-21 Hewlett-Packard Development Company, L.P. Distance-based image analysis
US8892562B2 (en) * 2012-07-26 2014-11-18 Xerox Corporation Categorization of multi-page documents by anisotropic diffusion
JP6193779B2 (ja) * 2013-06-03 2017-09-06 株式会社デンソーアイティーラボラトリ 特徴量変換装置、学習装置、認識装置、及び特徴量変換プログラム
JP6260442B2 (ja) * 2014-05-02 2018-01-17 富士通株式会社 情報処理方法及びプログラム
WO2018192492A1 (zh) * 2017-04-20 2018-10-25 上海寒武纪信息科技有限公司 一种运算装置及相关产品
CN121605398A (zh) * 2022-09-21 2026-03-03 京东方科技集团股份有限公司 一种文本识别方法、模型及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5671333A (en) * 1994-04-07 1997-09-23 Lucent Technologies Inc. Training apparatus and method
US5854855A (en) * 1994-09-09 1998-12-29 Motorola, Inc. Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
US5859925A (en) * 1995-08-08 1999-01-12 Apple Computer, Inc. Classifying system having a single neural network architecture for multiple input representations
US5805731A (en) * 1995-08-08 1998-09-08 Apple Computer, Inc. Adaptive statistical classifier which provides reliable estimates or output classes having low probabilities
US5796924A (en) * 1996-03-19 1998-08-18 Motorola, Inc. Method and system for selecting pattern recognition training vectors

Also Published As

Publication number Publication date
US6205247B1 (en) 2001-03-20
WO1997048069A1 (de) 1997-12-18
EP0978088B1 (de) 2001-11-28
EP0978088A1 (de) 2000-02-09
TW344063B (en) 1998-11-01
DE59705593D1 (de) 2002-01-10
DE19623033C1 (de) 1997-10-16

Similar Documents

Publication Publication Date Title
JP2000512046A (ja) 統計に基づくパターン識別のための方法及び装置
Liu et al. An embedded feature selection method for imbalanced data classification
Mishina et al. Boosted random forest
RU2707147C1 (ru) Обучение нейронной сети посредством специализированных функций потерь
US9002101B2 (en) Recognition device, recognition method, and computer program product
JP3088171B2 (ja) 自己組織型パタ−ン分類システム及び分類方法
US8108324B2 (en) Forward feature selection for support vector machines
WO2021188354A1 (en) Automated and adaptive design and training of neural networks
US20200143209A1 (en) Task dependent adaptive metric for classifying pieces of data
Gao et al. Edited AdaBoost by weighted kNN
Basu et al. Handwritten Bangla digit recognition using classifier combination through DS technique
Alias et al. Fingerprint classification using support vector machine
CN112766423A (zh) 人脸识别模型的训练方法、装置、计算机设备及存储介质
CN116977021A (zh) 基于大数据的系统对接自动推单方法
Upadhyay et al. Improvised number identification using SVM and random forest classifiers
Shankarampeta et al. Few-Shot Class Incremental Learning with Generative Feature Replay.
CN118212455A (zh) 档案扫描件自动识别归类方法、装置及电子设备
Soumya et al. Classification of ancient epigraphs into different periods using random forests
US11593621B2 (en) Information processing apparatus, information processing method, and computer program product
CN118891641A (zh) 信息处理装置和信息处理方法
US20250111690A1 (en) Method for adaptively encoding positions of textual objects in a document
Joshi et al. Evaluation of supervised machine learning models for handwritten digit recognition
Patsei et al. Multi-class object classification model based on error-correcting output codes
Shirazi et al. Persian logo recognition using local binary patterns
JPH08115387A (ja) パターン認識装置