JPH06501803A

JPH06501803A - 抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法

Info

Publication number: JPH06501803A
Application number: JP3517931A
Authority: JP
Inventors: クレンネル，ノルベルト
Original assignee: ユニシス・コーポレイション; ツェー・ゲー・カー・コンピュータ・ゲゼルシャフト・コンスタンツ・ミット・ベシュレンクテル・ハフツング
Priority date: 1990-09-28
Filing date: 1991-09-26
Publication date: 1994-02-24
Also published as: AU8853291A; EP0551392A1; WO1992006447A2; CA2091998A1; WO1992006447A3

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法発明の背景この発明は、一般的には文書上のデータを自動的に認識するための改良された手段および方法に関し、より特定的には、小切手、送状および送金文書のような財務文書上の金額情報を自動的に認識するための改良された手段および方法に関する。

今日の金融サービス業は膨大な量の文書を効率的に処理するという大きな問題に直面している。文書支払方式か衰えるだろうという予測は実現していない。実際、文書支払方式は世界的に成長し、増大し続けると予期されている。

したかってそのような文書を処理するための改良された方法を考案する不可欠な必要性かある。

文書処理に対する支援として画像化技術を使用することは、たとえば米国特許第４，２０５，７８０号、第４，２６４．８０８号、第４，６７２，１８６号、および第４゜８８８．８１２号に開示されるように、文書処理を有意に改良する１方法として認識されてきた。一般的に、画像化は文書を光学的に走査し、電子的に処理されかつ後の検索および表示のために（磁気ディスクドライブおよび／または光学メモリのような）大容量記憶媒体に格納される電子画像をつくり出すことを含む。文書画像化は文書の取扱いおよび移動を減する機会を提供するということは明らかである、なぜならこれらの電子画像は実際の文書に代わって使用され得るからである。たとえば、文書画像は記憶装置から検索され、ワークステーションに表示され、そこてはオペレータは文書を直接的に検視することなく、観察された画像に基づいて金額データおよび他の情報を入力することができる。

文書処理システムにおいて画像化を利用することは存意な改良を提供し得るか、文書からのデータをオペレータか検視しかつ入力する必要性は、達成できる文書処理速度および効率を限定し続ける。

発明の概要および目的この発明に従って、文書処理の速度および効率のさらなる増大は、文書上のデータを自動的に位置決定し、抽出しかつ認識する改良された方法、より特定的には、小切手、送状および送金文書のような財務文書処理システムにおける使用に必要とされる高速で有利に動作し得る改良された方法を提供することによって可能にされる。

米国特許第４，４４９．２３９号、第４．　２０１．　９７８号、第４，４６８．８０８号、第４，９１８．７４０号、第４，５２３，３３０号、第４，６８５，１４１号、第３゜８３２．６８２号および欧州特許第ＥＰ−０．１１１，９３０号は当該技術分野において公知である種々の自動データ認識手法を開示する。

目的、特徴、利点および使用のみならずこの発明の特定的性質は、添付の図面に加えて以下の詳細な説明から明白になるであろう。

図面の簡単な説明図１は、米国において広く使用されている梨の典型的な小切手を例示する。

図２は、一般的にこの発明か組み入れられてもよい文書処理システムを例示する。

図３は、この発明に従った自動額面金額（ｃｏｕｒｔｅｓｙ　ａｍ。

ｕｎｔ）読取機によって実行される種々の操作ステップを一般的に例示するフローチャートである。

図４は、図３の「＄位置決定」ステップ１０２を達成するための好ましい態様を例示するフローチャートである。

図５は、図２のイメージモジュール１４によって提供される典型的なグレーレベル画像である。

図６は、図５に表わされるグレーレベル画像からのシードおよびマスク２値画像の並列発生および記憶のための装置を例示するブロック図である。

図７は、図４のステップｌ０２Ｂによって確立される典型的な［＄ｊシードサーチエリア＄ｓＡを例示する。

図８は、図４のステップ１０２Ｂによって確立される典型的な「＄Ｊマスクサーチエリア＄ＭＡを例示する。

図９は、図３の「額面金額抽出」ステップ１０４を達成するための好ましい態様を例示するフローチャートである。

図１Ｏは、図９のステップ１０４Ｂによって確立される典型的な額面金額シードサーチエリアＣ，Ａ、ＳＡを例示する。

図１１は、図９のステップ１０４Ｂによって確立される典型的な額面金額マスクサーチエリアＣ，Ａ、ＭＡを例示する。

図１２は、図３の「φ部分を分離かつ類別」ステップ１１０を達成するための好ましい態様を例示するフローチャートである。

図１３は、（図９のステップ１０４Ｊにおいて明瞭化の前の）異質な連結構成要素群６２および６３を含む典型的な抽出された額面金額を例示する。

図１４−１６は、図９のステップ１０４Ｊにおける明瞭化の後の典型的な抽出された額面金額を例示する。

図１７−１８は、いかに「ψ」文字か下線を引かれた２桁の数字からなる「φ」フィールドから抽出されるかを例示する。

図１９−２１は、いかにして「φ」文字が分数からなるＵφ」フィールドから抽出されるかを例示する。

詳細な説明同様な数字および文字は全図面にわたって同様なエレメントを参照する。

この詳細な説明の目的のために、この発明は財務文書を処理するための文書処理システムにおいて小切手上のドル金額（具体的に「額面金額）と称される）を自動的に認識するのに適用されるように例示されるであろう。しかしなから、この発明は財務上およびその他のデータ認識応用の別の型のみならず文書の別の型にもまた適用可能であるということか理解されるべきである。

最近に図１を参照すると、そこでは米国において広く使用される盟の小切手ＩＯか例示される。小切手ｌＯは「＄」通貨記号１０ａおよび関連の金額１０ｂを有し、それは金融業界では「額面金額」と典型的には称される。この額面金額を認識する読取機は典型的には額面金額読取機（ＣＡＲ）と称される。額面金額１０ｂは機械印刷されるかまたは図１に示されるように手書きされてもよい。

図１に示される典型的な小切手ｌＯは、小切手の左下に符号化された機械読取り可能なデータＩＯｃをもまた含み、それは小切手か振り出される銀行の識別、顧客の預金口座番号、および小切手番号のような識別情報を提供するのに役立つ。

典型的にはこの符号化された機械読取り可能なデータ１０ｃは磁性インクで与えられ、それは頭字語て「ＭＩＣＲＪ　（磁気インク文字認識）と呼ばれる。

図２はこの発明か組み込まれてもよい文書処理システムを一般的に例示する。処理されるべき文書は典型的には財務文書てあり、図１に例示される型の小切手を含む。図２に示されるように、これらの財務文書１０は文書プロセッサ１２に与えられ、従来の態様で、その機械は文書から符号化されたデータを読取り、文書の画像を取込みかつ処理し、その文書をポケット（図示されていない）に区分けする。

図２における文書プロセッサ１２は文書の画像を取込み、取込まれた文書画像を処理しかつ圧縮し、それから圧縮された文書画像をディスクドライブのような記憶装置１６に伝送するイメージングモジュール１４を含む。ワークステーション１９はワークステーションオペレータによるデータの表示および入力のために、検視された画像からの額面金額のような文書画像を記憶装置１６から受け取る。

演算処理装置（ＣＰＵ）２０はシステムの全体の制御と、（記憶装置１６を経て）文書プロセッサ１２およびワークステーション１９によってそこへ伝送された文書情報のためのデータベースの維持とをまた与える。

図２の文書プロセッサ１２はさらに、図１に例示されるように小切手上の額面金額を自動的に認識するためのイメージングモジュール１４に結合される額面金額読取機１８を含む。図１の文書処理システムにおいてそのような額面金額読取１１１８を提供することの重要な利点は、金額かうまく読取られた小切手は、ワークステーション１８て画像を検視することによってそれらの額面金額を読取られかつ入力される必要かないということである。

額面金額読取機（ＣＡＲ）１８はこの発明に従って額面金額の自動認識を提供するために、イメージモジュール１４からそこへ与えられた文書画像を演算処理するために適当なプログラミングに加えて、複数のマイクロプロセッサ、ＲＡＭ、ＲＯＭおよび別の関連の回路を典型的に含む。ＣＡＲＩ８にそういったものを設ける態様はここでの開示によって明白となるであろう。

図３は、小切手上の額面金額を認識する際に図２のＣＡＲＩ８によって実行される種々の操作ステップを一般的に例示するフローチャートである。このフローチャートは例として与えられるのであって、発明の範囲を限定するものとして考えられるへきてはないということか理解されるへきである。たとえば、ここに示されるあるステップか省略されてもよく、別のステップか加えられてもよく、かつ／またはステップの配列か変更されてもよい。

ステップ１００によって示されるように、ＣＡＲ１８は図２のイメージングモジュール１４から小切手のグレーレヘル画像を受け取る。ＣＡＲは図１における’ ＄Ｊ１０ａを位置決定しくステップＩ　Ｏ２）　、それから関連の額面金額１０ｂを抽出する（ステップ１０４）。抽出された額面金額か機械印刷されているかまたは手書きかという判断かそれからなされる（ステップ１０６）。もし機械印刷であるならば、比較的単純な額面金額認識か実行され（ステップ＋０８）、結果か出力される（ステップ１１８）。

もし抽出された額面金額か手書きであると判断されると（ステップ１０６）、より複雑な分析か要求される。そのような場合、「φ」部分１０ｂ−１（図１）はまず分離されかつ類別され（ステップ１１０）、「φ」文字かそれから類別に基づいて抽出される（ステップ１１２）。結果として抽出された「φ」文字はそれから認識される（ステップ１１４）。

「φｊ文字かうまく認識された後（ステップ１１４）、ドル文字か認識される（ステップｌｌ６）。ＣＡＲ１８（図２）はそれから認識された額面金額または拒絶信号を出力する（ステップ１１８）。図２のシステムにおいて、このＣＡＲ出力はＣＰＵ２０に送られる。もし図３のステップのいずれかの間に拒絶状態が検出されると、拒絶出力が即座に与えられ残りのステップは停止される。図３に示されるように、額面金額の「φ」部分の抽出゛および認識はドル部分より先に実行される、なぜならそれは拒絶を生み出しかちであるからである。ＣＡＲによって与えられた認識された額面金額出力は、認識プロセスの間に生み出された信頼指示に基づく信頼値を伴ってもよいということか理解されるであろう。図３における認識ステップ１０６．１０８．１１４および＋１６は、前述の特許において開示されたような公知の認識技術を使用して提供され得るということもまた理解されるであろう。

図３に例示されるステップの各々の説明か以下に述へられる。

ステップ１００（図３）このステップの間、図２におけるイメージングモジュール１４は、ＣＡＲ，１８に少なくとも「＄」文字１０ａおよび関連の額面金額１０ｂを含む小切手の部分のグレースケール画像（図５に例示されるような）を提供する。図５に例示されるサイズは例としてのみであるということか理解されるへきである。

ステップ１０２（図３）このステップの間、「＄」文字１０ａ　（図５）か位置決定される。明らかに、アスタリスク「＊」または別の適切な記号のような「＄」以外の通貨文字も位置決定文字として使用され得る。

ステップ１０４（図３）このステップの間、額面金額１０ｂ（図５）は先に位置決定された「＄」文字１０ａを位置決定ガイドとして使用して抽出される。

たちのかまたは手書きされたものかということに関する判断かなされる。もしそれか機械印刷されたものであるならば、動作はステップ１０８に進む。もしそれが手書きであるならば、動作はステップ１１０に進む。

ステップ１０８（図３）もし額面金額か機械印刷されたものと判断されると、比較的単純な認識か認識された機械印刷の型に基ついてなされる。

ステップ１１０（図３）もし額面金額か手書きであると判断されるならば、より複雑な分析か要求され、それは「φノ部分１０ｂ−１　（図５）の、ドル部分１０ｂ−２からの分離で始まる。分離された［ψＪ部分はそれから類別される。

ステップ１１２（図３）このステップの間、「ψ」文字は、ステップ１１０でなされた類別に基づいて抽出される。

ステップ１１４このステップの間、抽出された「ψ］文字は認識される。

ステップ１１６　（図３）このステップの間、額面金額の「＄」文字１０ｂ−２（図５）が認識され、額面金額の認識を完了する。

ステップ１１８（図３）このステップの間、ＣＡＲｌ　８は（図２のＣＰＵ２０に）認識された額面金額または拒絶信号を出力する。拒絶信号は、もし拒絶状態が先のステップのいずれかの間に検出されるならば、ＣＡＲによって提供され、そのような場合、それ以後のステップは停止される。認識された額面金額はまた信頼値を伴ってもよい。

図３に示された種々のステップはここで詳細に考察され図３においてステップ１０２を達成するための好ましい態様は、この発明に従って、図４におけるステップ１０２八からステップ１０２Ｈを参照して次に考察されるであろう。ステップ１０２の目的は図５における小切手ＩＯ上の「＄」文字を位置決定することであるということか念頭におかれるであろう。

ステップ１０２Ａ（図４）このステップの間、しきい値処理は図２のイメージモジュール１４によって与えられる（図５の）グレーレベル画像から、複数の２値画像を得るのに使用される。これらの２値画像の導出は、グレーレベル画像は各ピクセルが複数のグレーレベル値の１つを存するピクセル（画素）のＸ−Ｙマトリックスとして電気的に典型的に表わされるということに注目することによって理解されるであろう。たとえば、各ピクセルは１５が黒てありＯか白である２値番号Ｏないし１５に対応する４ヒツトで表わされる１６のグレーレベル値を備え得る。得られた２値画像の各々はこれらのグレーレベル値の異なった１つを、グレーレベル画像を２値画像に変換する際、しきい値として使うことによって生み出される。たとえば、もし８のしきい値か特定の２値画像を生み出すのに使われるならば、その２値画像はそのグレーレベル値か８またはそれよりも大きいピクセルを黒ビクセルとして有し、２値画像の他のピクセルはすへて白である。

ここで考察されるこの発明の特定の実施例のために、３つの２値画像か、３つの異なったしきい値高、中および低を使用してグレーレベル画像（図５）から得られる。高しきい値２値画像は「＄」　シート画像と称され、中２値画像は額面金額シート画像と称され、低しきい値２値画像はマスク画像と称されるであろう。

以下に説明されるように、「＄」　シート画像は「＄」文字１０ａ　（図５）を位置決定するために使用され、額面金額２値画像は、額面金額ｌＯｂを抽出するために使用され、かつマスク画像は両方の目的のために使用される。

図６に例示されるように、認識速度を増大するために、グレーレベル画像か図２のイメージモジュール１４から受け取られると、シードおよびマスク画像かコンバータ３４．３６および３８各々によって同時に発生され得、結果としての２値画像はそれぞれのランダムアクセスメモリ（ＲＡＭ）４４．４６および４８に検索可能に格納される。

ステップ１０２Ｂ（図４）このステップの間、「＄」　シードおよびマスク画像上のサーチエリアは「＄」文字を位置決定する際に使用するために確立される。図７はシード画像のための「＄ｊ　シード画像サーチエリア＄ＳＡの例を示し、図８はマスク画像のための「＄Ｊマスクサーチエリア＄ＭＡの例を示す。図７および図８はシートおよびマスク画像を得るための異なったしきい値を使用することによって生み出された効果もまた例示する。この点ては、図８の「＄」マスクサーチェリア＄ＭＡは（使用された低しきい値のため）図７の「＄」シートサーチエリア＄ＳＡよりも多い異質な黒ピクセル（ノイズ）を含むということに注目されたい。

考察される特定の実施例の目的のために、図７の所望された「＄」　シードサーチエリア＄ＳＡは公知であると仮定されるであろう。たとえばその位置はＣＰＵ２０　（図２）において先に格納することもてき、または小切手１０（図１）上の機械読取り可能線１０ｃを読取ることからも得られるであろう。代わりに、「＄ノ文字が位置決定されるまで全体画像のサーチをすることもてきる。

ステップ１０２ｃ、１０２Ｄおよび１０２Ｅ（図４）ステップ１０２Ｃの間、図７における「＄」シードサーチエリア＄ＳＡは「新しい」黒ピクセルのために走査される。以下に説明されるように、「新しいＪ黒ピクセルはシードサーチエリア＄ＳＡにおいてまた考慮されて（ａｃｃｏｕｎｔｅｄ　ｆｏｒ）いないものである。典型的には、垂直方向の列単位の走査か使用される、なぜならそれは金額文字よりも前に遭遇される「＄」文字を位置決定する際に、存利であるためである。もし、走査の間、新しい黒ピクセルか発見されなければ（ステップ１０２Ｄ）、図５の「＄」シー）・サーチエリア＄ＳＡの最後の垂直方向列か走査されたかとうかの判断かなされる（ステップ１０２Ｅ）。そのような場合、拒絶か発生される。拒絶は、もし認識プロセスに割り当てられた最大時間か終了するとまた発生し得るということか、また理解されるへきである。これはいずれか１つの小切手のための認識プロセスか、小切手処理速度の要求と相反する、時間を超過するということを防ぐためになされる。

もしステップ１０２Ｅの間に、垂直方向走査か完了されていないと判断されるならば、動作はステップ１０２Ｃに戻り、「＄ｊシードサーチエリア＄ＳＡの走査方向において新しい黒ピクセルをサーチし続ける。

ステップ１０２Ｆ、１０２Ｇおよび１０２Ｈ（図４）もし新しい黒ビクセルがステップ１０２Ｄの間に発見されるならば、動作はステップ１０２Ｆに進む。ステ・ツブ１０２Ｆの間に、「＄ｊシードサーチエリア＄ＳＡ（図７）において発見されたシード黒ピクセル（ステップ１０２Ｄ）は、「＄」マスクサーチエリア＄ＭＡ（図８）を使用して成長させられ、ピクセルの連結群を発生し、それは以下に記号ＣＣと称されるであろう。ＣＣか発生される態様が次に説明されるであろう。

図７の「＄」シードサーチエリア＄ＳＡがまず参照される。「＄」文字１０ａはおおよそ完全であるように見えるてあろうか、１０’ａて示されるように種々の切れ目を伴い、一方で隣接の額面金額１０ｂの数字「８」はより大きく広い切れ目１０’ｂを有する。これは、「＄」文字は普通額面金額文字よりも存意に高度なコントラストを存し、より高品質の印刷！プロセスを使用してつくり出されるため予期されることである。（先に説明されたように、）比較的高いしきい値か「＄」　シート画像を得るために使用されるため、図７における「＄」　ソードサーチエリア＄ＳＡは３２ｓのようなほんの少しの、広く間隔をあけられた異質の黒ピクセルを含むということにもまた注目されたい。

次に図８における「＄」マスクサーチエリア＄〜ＩＡを参照すると、（前に説明されたように）それはより低いしきい値を使用して得られる。より低いしきい値処理のため、「＄ノ文字１０ａは完全であるか、一方で隣接の額面金額１０ｂの「８」はまた幾らかの切れ目１０”ｂを含むということか見られるであろう。また、図８の「＄」マスクサーチエリア＄ＭＡにおいて３２ｍのような、図７の「＄ｊシートサーチエリア＄ＳＡにおいてよりも有意に多い異質な黒ピクセルかある。加えて、「＄」マスクサーチエリア＄ＭＡは額面金額枠３３による黒ビクセルを含む。

図４におけるステップ１０２Ｄおよび１０２Ｆは、「＄」文字を位置決定しかつ認識するのに（それぞれ図７および８の）「＄」　シードおよびマスクサーチエリア＄ＳＡおよび＄ＭＡの両方を利用する。より特定的には、新しい黒ビクセルか図７の「＄」シートサーチエリア＄ＳＡにおいて発見されると（ステップｌ０２Ｄ）、図８の「＄」マスクサーチエリア＄ＭＡにおける対応する位置を存するピクセルか位置決定される。たとえば、もし図７における３４ｓか「＄Ｊシートサーチエリア＄ＳＡにおいて発見された新しい黒ピクセルであるならば（ステップ１０２Ｄ）、図８の「＄」マスクサーチエリア＄ＭＡにおける対応して位置決定される黒ピクセル３４ｍか位置決定される。これは図６のそれぞれ「＄」　シードおよびマスクＲＡＭ４４および４８において格納されたシードおよびマスク画像を使用して実現され得、それはたとえば、対応するシードおよびマスクピクセルか対応するアドレスを存するように構成されてもよい。

ステップｌ０２Ｆの実行において行なわれる次の動作は、「＄」マスクサーチエリア＄ＭＡにおける黒ピクセル３４ｍ（図８）を成長させ、３４ｍに連結されだすへての黒ピクセルからなるＣＣを発生することである。これはたとえば、図６のマスクＲＡＭ４８を使用して達成されてもよい。

黒ピクセル３４ｍ（図８）から始まって、黒ビクセル３４ｍ（図８）にすぐ隣接するピクセル位置に対応するアドレスでの黒ピクセルがあるかどうかに関する判断がなされる。

同様の判断か、新規に判断された黒ビクセルの各々についてなされ、ＣＣを形成するすべての連結黒ピクセルか識別されるまで再度繰返される。これらの識別された黒ビクセルのアドレスは、黒ピクセル３４ｒｎから発生されたＣＣを構成する。図６におけるマスクＲＡＭ４６は、たとえばＣＣを形成する識別された黒ピクセルのアドレスを格納するのに使用されてもよい。

さらに図７および図８を参照すると、もし図７の「＄」シートサーチエリア＄ＳＡにおいて発見された新しいビクセル（ステップ１０２Ｄ）か「＄」文字１０ａの黒ビクセル３４ｓであるならば、図８の「＄」マスクサーチエリア＄ＭＡにおける対応する黒ピクセル３４ｍの成長によってつくり出された結果としてのＣＣ（ステップｌ０２Ｆ）はＣＣ−１であり、それは「＄」文字１０ａである。これは図８の「＄」マスクサーチエリア＄ＭＡにおける「＄」文字のすへてのピクセルが連結されるためである。

他方、もし「＄ｊ文字か存在せず、「＄」シードサーチエリア＄ＳＡ（図７）において発見された新しい黒ピクセルか数字「８」のピクセル３６ｓてあったと仮定すると、図８の対応する黒ビクセル３６ｍの成長はＣＣ−２を発生し、それは切れ目１０’ｂのために「８」の上部の部分にすぎないと忠われるてあろう。

ステップｌ０２ＦのＣＣの発生に従って、動作はステップ１０２Ｇに進み、そこでは発生されたＣＣのサイズ、幾何学的形状および位置か、「＄」文字の適当な候補かどうか、または拒絶されるへきかとうかという比較的早い判断をなすために使用され、それによって比較的により時間を消費する認識プロセスを避ける。

ＣＣか「＄」候補であると判断されるときのみ（ステップ１０２Ｇ）、動作はステップ１０２Ｈに進み、そこでは従来の文字認識か、ＣＣか「＄」文字であるかどうかを判断するために実行される。たとえは前述の米国特許第４゜４４９．２３９号において説明された分類器手法は認識のために使用されてもよい。もしＣＣかステップ１０２Ｇにおいて適当な「＄」の候補であると判断されない場合、またはもしＣＣかステップ１０２Ｈにおいて「＄」であると認識されない場合、動作はステップ１０２Ｃに戻り、図７の「＄」　シードサーチエリア＄ＳＡにおいて新しい黒ピクセルを走査し続ける。しかしながらもし、ＣＣがステップ１０２Ｈにおいて「＄」文字と認識されるならば、「＄」文字は位置決定される。そのような場合、さらなる走査は行なわれず、動作は図３のステップ１０４に進み、額面金額を抽出する。

ステップｌ０２Ｅと関連して先に述へたように、走査の終わりに達するときに、もし「＄」文字の認識がなされなければ、拒絶か発生する。もし追加的サーチエリアが「＄」文字のために走査されることか所望されるならば、走査の終わりに拒絶を生み出す代わりに、動作は図４のステップ１０２Ｂまて戻り、新しいシードおよびマスクサーチエリアを確立する。追加的サーチエリアのこの走査は所望されるたけの回数、または中断か発生するまで続けられてもよい。

ステップ１０２Ｆの前述の説明から、ステップ１０２Ｃで参照された「新しい」黒ピクセルは、ステップ１０２Ｆの間に「＄Ｊマスクサーチエリアにおいての成長の結果として先に発見されなかったしのである、なぜなら先に識別された黒ピクセルを成長させる必要はないからである。そのような先に識別されたシートピクセルか、「＄」マスクサーチエリアにおいて成長されることを防ぐ種々の可能な方法かある。説明されている実施例において、図４のステップ１０２Ｆにおけるマスク成長の間「＄」マスクサーチエリア＄ＭＡにおける対応するビクセルを識別すると、（図６の「＄」　シート画像ＲＡ〜１４４に格納された）「＄ノノート画像からシートピクセルを削除することによってこの目的を達成することか有利であるということかわかった。したかって、ステップｌ０２Ｆにおける先の成長の間識別された黒ビクセルは、ステップ１０２Ｃの走査の閲見られず、ゆえに「＄」文字を位置決定するのに必要な時間を減する。この節約は、シート画像か、その導出に使用される高しきい値の結果としての比較的僅かな「ノイズ」黒ピクセルを含むために節約された時間にさらに加えられるものである。そのような高しきい値の使用は可能である。

ＣＣを発生するための上に説明されたシード／マスク成長手法は小切手１０（図１）上の「＄」文字１０ａを位置決定するのにさらに利点となることか理解されるであろう、なぜなら「＄」文字は普通高品質および高いコントラストを備えて印刷され、「＄Ｊマスクサーチエリア＄ＭＡ（図８）にお１する切れ目をつくるようには、巴われないからである。このように、上に説明されたように（ステップ１０２Ｇおよび１０２Ｈ）、認識のために発生されたＣＣの各々を提出することは、他の印または（先に考察された数字「８」のような）文字と比へて「＄」文字か認識される可能性をかなり高くする。

ＣＣを発生するためのシート／マスク成長手法はこの発明の範囲内において多くの変形を受けるということかさらに理解されるへきである。たとえばＣＣを発生するために使われる「連結性Ｊ　（ｃｏｎｎｅｃｔｉｖｉｔｙ）の定義は、異なった環境下で特定の型の文字の認識に対処するのに種々の様式で変化され得る。

たとえば、「連結性」の定義は（垂直、水平および／または特定の対角線のような）１つまたは２つ以上の特定の方向に制限されるように変更され得る。連結性の定義における別のあり得る変化は、特定の環境において「連結された」ピクセル間に発生する１つ（または２つ以上）のビクセル切れ目を許容し得る。

ステップ１０４の詳細な説明図３におけるステップ１０４を達成するための好ましい態様は図９のステップ１０４Ａから１０４Ｊを参照して次に考察されるであろう。ステップ１０４の目的は図Ｉに示される額面金額１０ｂを抽出することであるということが念頭におかれるであろう。

ステップｌ０４Ａ（図９）このステップの間、動作は額面金額１０ｂ（図５）を抽出することに切り替わり、額面金額の位置はステップ１０２（図３および図４）における「＄」文字１０ａをうまく位置決定することに基づいて決定されてきた。ステップ１０４の説明か進行するに従って、ステップ１０２において「＄」を位置決定するために説明された基本的なシード／マスク手法は額面金額抽出にも使用されるか、いくらか異なった態様で使用されるということか明白になるであろう。

ステップ！０４Ｂ　（図９）このステップの間、シートおよびマスクサーチエリアは図３のステップ１０２において「＄」文字の位置を決定したことに基づいて額面金額の抽出のために確立される。図ＩＯは額面金額シートサーチェリアＣ，Ａ、ＳＡの例を示し、一方で図１１はいくらかのより大きい額面金額マスクサーチエリアＣ，Ａ、ＭＡの例を示す。図１１のＣ，Ａ。

ＭＡは額面金額枠３３より下に突き出すかもしれない額面金額部分を含むのに十分なサイズであるということに注目されたい。またこの点において、額面金額の「７ノは図１０の額面金額サーチエリアＣ，Ａ、ＳＡに全部は含まれないけれとも、「７」は図１１のより大きい額面金額マスクサーチエリアＣ，Ａ、ＭＡにおけるシート／マスク成長の結果として全部抽出されるであろうということにも注目されたい。

ここに説明される好ましい実施例において、「＄」の位置決定のために使用されたのと同じ（図６のＲＡＭ４８に格納された）マスク画像か金額抽出のために使用されるか、（図６のＲＡＭ４６に格納された）額面金額シート画像は「＄」文字を位置決定するために使用された（ＲＡＭ４４における）「＄」　シード画像の代わりに金額抽出のために使用される。これは、「＄」　シード画像しきい値か先に説明されたように、高度なコントラスト　「＄」文字を利用するために高く選択され、それはより大きいコントラスト変化の範囲を有する額面金額文字にとってふされしくないため、行なわれる。図１Ｏは額面金額シートサーチエリアＣ，Ａ、ＳＡのためのしきい値の可能な選択の例を示し、そこでは枠３３（図５）は低コントラストの異質なビクセル（ノイズ）と同様、現われない。この点で、額面金額のすへての部分が図１０の額面金額サーチエリアＣ，Ａ、ＳＡに含まれる必要はないということか理解されるへきである。図１１のＣ，Ａ、ＭＡにおけるシード／マスク成長の結果としての額面金額の適切な抽出を提供するために、額面金額の十分な部分か図１０のＣ，Ａ、ＳＡに含まれることのみか要求される。

ステップ１０４Ｃ，１０４Ｄ、１０４Ｅおよび１０４Ｆ（図９）これらのステップは通常の額面金額に関して、走査の終わりの後（ステップ１０２Ｅ）拒絶かないこと、動作は代わりにステップ１０６　（図３）に進むことを除いて、図４のそれぞれのステップ１０２Ｃ，１０２Ｄ、１０２Ｅ、および１０２Ｆのために先に説明されたものと一般的に同してあってもよい。ステップ１０４Ｃ，１０４Ｄ、１０４Ｅおよびｌ０４Ｆはゆえに詳細には考察されないであろう。

額面金額シートサーチェリアＣ，Ａ、　ＳＡ　（図１０）の走査の間にＦ新しいノ黒ピクセルか発見されるたびに、額面金額マスクサーチエリアＣ，Ａ、ＭＡ　（図ＩＩ）における成長は（先に規定されたように）ＣＣをつくり出す。

ステップｌ０４Ｇ（図９）図４のステップ１０２Ｇと同様に、このステップはステップ１０４Ｆで発生されたＣＣか、ＣＣのサイズ、幾何学的形状および位置に基ついて適当であるかとうかをテストする。額面金額抽出の目的のために、ステップ１０４Ｇにおけるこのテストは発生されたＣＣか額面金額の一部であるらしいかどうかを判断する。たとえば、発生されたＣＣか額面金額の部分であるらしいかどうかを判断するための役に立つ根拠は、たとえば図１１の線５５のように額面金額マスクサーチエリアＣ，Ａ、〜ｆＡの枠５２（図１１）まで延在するかどうかを判断することである。そのような発生されたＣＣか額面金額の一部であることはほとんどない。

ステップ１０４Ｈ（図９）もし発生されたＣＣかステップ１０４Ｇにおいて額面金額の一部ではないらしいと判断されるならば、動作はステップｌ０４Ｈに進み、発生されたＣＣを廃棄し、動作はステップ１０４Ｃに戻り、図１０の額面金額シートサーチェリアＣ，Ａ、ＳＡにおける新しい黒ビクセルを走査し続はステ・！ブ１０４１（図９）もし発生されたＣＣかステップ１０４Ｇにおいて額面金額の一部であるらしいと判断されるならば、動作はステップ１０４１に進み、そこで発生されたＣＣを（たとえば図６におけるＲＡＭメモリ４６内に）後の使用のために格納する。動作はそれからステップ１０４Ｃに戻り、図１０の額面金額シートサーチエリアＣ，Ａ、ＳＡにおける新しい黒ピクセルを走査し続ける。

ステップ１０４ｒを離れる前に、発生されたＣＣか「＄ｊ文字を位置決定するのに使用される方法（図３および図４のステップ１０２）と額面金額抽出および認識のために使用される方法との間の違いに注目することは役に立ってあろう。「＄」文字を位置決定するために、発生されたＣＣの各々は認識目的のためのものと考えられるということか念頭におかれるであろう、なぜなら「＄」文字は高品質の印刷で提供され普通高度なコントラストを存し切れ目を有さないからである。しかしなから、額面金額抽出のために発生されたＣＣは文字の断片的な部分にすぎないかもしれない、なぜなら額面金額文字は、特に手書きされるとき、幾つかの切れ目を存するかもしれないからである。このように、額面金額文字は複数の発生されたＣＣからなるかもしれない。したかって、額面金額を抽出かつ認識する際に、（図４のステップ１０２Ｈにおいて）「＄」文字を位置決定するときになされるようには、発生されたＣＣを認識するという試みはなされない。代わりに、額面金額の一部であるらしいと判断された各ＣＣは、全体の額面金額エリアか走査されるまでストアされ（ステップ１０４Ｉ）、れたＣＣか格納されていることになるであろう。これらの格納されたＣＣは抽出された額面金額を構成する。図１３は上に説明されるように抽出されたそのような格納された額面金額の例である。このように、額面金額に関して、ＣＣを発生するためのシート／マスク成長手法は主に認識のための額面金額抽出および格納の特に有利な方法として投薬型的にステップ１０４Ｊは（走査の終わりをテストする）ステップ１０４Ｅを介して、額面金額、シードサーチエリアＣ，Ａ、ＳＡ　（図１０）の走査か完了され、額面金額の一部であるらしいすへての発生されたＣＣか格納された後に到達される。ステップ１０４Ｊの目的は、この格納された抽出された額面金額（図１３）を６２および６３て例示されるような異質なＣＣを除去することによって明瞭にすることである。使用される１つの手法は、６２のような異質なＣＣかもし額面金額領域の上と下との予め定められた量たけ間隔をあけられている場合には、それらを削除することである。これはたとえば上部および下部境界線を有する領域を規定するために全体金額フィールドを水平に投影することによって達成されてもよい。これらの境界線の上または下の、図１３における６２のようなＣＣはそれから削除される。もし投影が複数の領域を生み出すならば、適切な上部および下部境界線は「＄」文字を含む領域に対応するものである。

額面金額の右に位置する図３における６３のような異質のＣＣの除去はより複雑な問題を引き起こす、なぜならそれらは額面金額の一部であるかもしれないからである。これらのＣＣか異質かどうかを判断するための特に有利な方法は、最も右のＣＣとＣＣの左の最も近い黒ビクセルとの間の水平間隔かＣＣの水平幅より予め定められた量だけ大きいという条件に基づく。もしこの条件に合致するならば、ＣＣは異質なものと考えられ、削除される。いかにこの条件が実現され得るかという例は図１３に関して説明されるであろう。この例のために、額面金額領域は左から右に番号付けられた列に分割され、各列は１ピクセルに等しい幅を有すると考えられる。最初に、以下の列の位置決定は抽出された額面金額から判断される、Ｃ１＝黒ピクセルを有する最も右の列。

Ｃ２＝ＣＩの左の最小幅Ｗを備える０列の隣りのエリアの最も右の列。

Ｃ３＝黒ビクセルを存する、Ｃ２の左隣りの列。

もし以下の条件に合致するならば、（Ｃ２−Ｃ３）＞Ｋ　（ＣＩ−Ｃ２）ＣＩおよびＣ３の間に置かれだすへての黒ビクセル素子６３は削除される。典型的に、Ｗは３つの列の幅に対応する幅を有してもよく、Ｗは単一の文字の部分によっては上の条件か満たされないように選択される。Ｋは典型的には１．５の値を存してもよい。ＷおよびＫのこれらの値は額面金額か異質なＣＣと間違えられないことを保証するように選択される。上のことは、条件か合致し続ける限り反復的に繰返される。条件か合致し損ねたとき、テストは終了し動作は図３の次のステップ１０６に進む。

ステップ１１０の詳細な説明（図１２）ステップ１１０はもしステップ１０４の間に抽出された額面金額か手書きであると判断されたならば到達されるということか図３から理解されるであろう。ステップ１１０の目的は「ψ」部分１０ｂ− １（図１）を額面金額１０ｂのトル部分ｊｏｂ−２から分離することである。ステップ１１０を、この発明に従って達成するための好ましい態様は、図１２のステップｌｌ０ＡからｌｌＯＨを参照して次に考察されるであろう。額面金額の「８７部分および「φ」部分は以下に「＄」フィールドおよび「φ」フィールドとそれぞれ称されるであろう。

ステップｌｌ０Ａ（図１２）ステップｌｌ０Ａの間、抽出された額面金額はピリオドまたは小数点（「」）の存在をサーチされる。そのようなピリオドまたは小数点は、もちろん額面金額の「＄」および「φ」フィールドの間の分離を示し、その検出はしたかってこれらのフィールドを分離するための根拠として使用される。

ピリオドの存在を検出するための好ましい方法は図１４に関して説明されるであろう。この目的のために、抽出された額面金額は、図６のＲＡＭメモリ４６に格納された抽出された額面金額の画像の列単位の走査を使用する等により左から右に調査される。

もし図１３におけるＰＣのような潜在的なピリオド候補か発見されると、上部線ＵＬおよび下部線ＬＬ（図１４）か（図１４の数字「９」のような）ＰＣのすぐ左の額面金額部分のために決定される。線は上から下へと番号付けられる。潜在的ピリオド候補ＰＣは、もし以下の条件か満たされれば、実際のピリオド候補と考えられる。

（１）　潜在的ピリオド候補ＰＣの高さは１／２　（ＵＬ−ＬＬ）よりも大きくない。

（２）　潜在的ピリオド候補ＰＣは所定の量よりも少ない輻Ｗを存する。

（３）　潜在的ピリオド候補ＰＣの平均の線数はＩ／２（ＵＬ＋ＬＬ）よりも少ない。

典型的には、３つまでのピリオド候補か上の測定に基づき識別されることか可能である。動作はそれから［Ｎ１２のステップｌｌ０Ｂに進む。

ステップｌ　ＩＯＢの間、ステップｌｌ０Ａにおいて決定された３つまでのピリオド候補は、たとえば前述の特許において開示されたような公知の統計学的分類技術を使用して調査される。もし１以上のピリオド候補か受け入れ可能であるとわかったら、最も右の１つか「＄」および「φ」フィールドを分離するものであるとして選ばれ、動作は図１２のステップ１ｌＯＧに進む。

しかしなからもし１つのピリオドも識別されなければ、動作はステップｌｌ０Ｃに進み別の根拠で「＄」および「φ」フィールドを分離しようとする。

ステップｌｌ０Ｃ（図１２）ステップ１１０Ｃの間、図５に示されるように、額面金額の「ψ」フィールドの添字（ｓｕｂｓｃｒｉｐｔ　ｉｎｇ）は額面金額の「＄」および　「φ」フィールドの分離に関する根拠として調査される。この目的のために、抽出された額面金額は再び左から右へと調査され、（たとえば図１４における数字「５」のような）上付きに書かれた文字ＳＣの開始を検出する。

潜在的ピリオド候補のサーチを説明するステップ１１０Ｂと同様に、上部線ＵＬおよび下部線ＬＬ（図１５）は（図１５の数字「７」のように）候補の上付きに書かれた文字ＳＣのすぐ左の額面金額部分のために決定される。再び線は上から下へと番号付けられる。候補の上付きに書かれた文字ＳＣはもし以下の条件か満たされると実際の上付きに書かれた文字と考えられる。

（１）　候補の上付きに書かれた額面金額文字の底の線番号は１／３　（２ＬＬ＋ＵＬ）より大きくない。

（２）　候補の上付きに書かれた文字ＳＣの高さは少なくともｌ／３　（ＬＬ− ＵＬ）である。

（３）　候補の上付きに書かれた文字ＳＣは（図１５の数字「７」のような）すぐ左の額面金額部分から少なくとも１白列だけ分離される。０列は黒ピクセルを有さない列である。

（４）　候補の上付きに書かれた額面金額文字ＳＣのすぐ右の額面金額部分ＳＣ ’　（図１４の数字「０」）はＳＣの下部線番号プラスその高さの半分よりも大きくない下部線番号を有する。

上記の条件を満たす第１の候補は、上付きに書かれた「φ」フィールドの開始であると考えられる。

動作はそれから図１２のステップｌｌ０Ｄに進む。

ステップｌｌ０Ｄ（図１２）ステップｌｌ０Ｄはステップｌｌ０Ｃで実行された上付きに書かれた「ψ」フィールドのサーチの結果を受け取る。

もし上付きに書かれた文字が見つけられたら、「＄」および「φ」フィールドの分離のための根拠が決定され、動作はステップｌｌ０Ｇに進む。

しかしながらもし上付きに書かれた「ψ」フィールドが見つけられなければ、動作は図１２のステップｌｌ０Ｅに進み、「＄」および「φ」フィールドの分離のための別の根拠を見つける。

ステップｌｌ０Ｅ（図１２）ステップｌｌ０Ｅの間、図１６および図１７に示されるように、複合「φ」フィールドの存在は「＄」および「ψ」フィールドの分離のための根拠として調査される。図１６は下線を存する２つの上付きに書かれた数字からなる複合「ψノフィールドの第１（７）盟を示すということか見られるであろう。図１７は「ψ」金額か分数として与えられる複合「ψ」フィールドの第２の堅を示す。

複合「φ」フィールドか存在するかとうかを判断するために、抽出された額面金額は、先に説明されたステップ１１０Ａおよびｌｌ０Ｃのように右から左へと再度調査される。複合「φ」フィールドのサーチに際し、以下のことか決定される（図１６および図１７を参照）。

（１）　抽出された額面金額の最後に占められた列Ｃ１゜（２）　最後に占められた列Ｃ１の左の第１の０列Ｃ２゜（３）　０列Ｃ２の右に位置する額面金額部分によって占められる第１の線Ｌｌ。

図１６および図１７に示されるように、ＣＩ、Ｃ２およびＬｌの値はそれが複合「φ」フィールドの適切な候補であるかどうかについてのテストのために抽出された額面金額の特定の部分の枠を決める。テストは種々の可能な「φ」フィールド型および、特に、図１６および図１７に示される複合「ψ」フィールド型を認識するように特定的に設計される統計学的分類技術を使用して達成される。そのような統計学的分類技術か実現される態様は上記の特許から明白であろう。

もし、図１６および図１７に示されるように複合「φ」フィールドか認識されるならば、列Ｃ２は「＄」および「φ」フィールドの間の分離列であると考えられる。Ｃ２は最後に占められた列ＣＩの左の第１の０列であるということか念頭におかれるであろう。

ステップｌｌＯＨにおける動作の結果はそれから図１２のステップｌｌ０Ｆに送られる。

ステップｌｌ０Ｆ（図１２）ステップｌｌ０Ｆはステップｌｌ０Ｅにおいて実行される複合「φ」フィールドのサーチの結果を受け取る。もし複合「ψ」フィールドか発見されたら、列Ｃ２は「＄」および「φ」フィールドの分離の根拠として役に立ち、動作は図１２のステップｌｌ０Ｇへ進む。

しかしながら、もし複合「ψ」フィールドが見つけられなければ、拒絶か発生する、なぜなら額面金額の「＄」および「φ」フィールドを分離するための根拠が見つけられずかつ分離のためのさらなる根拠かないからである。この点において、分離を提供するためのさらなる根拠がまた与えられてもよいということが理解されるへきである。

図１２の上の説明から、ピリオドを見つけるか（ステップ１１０Ａおよびｌｌ０Ｂ）、上付きに書かれた「ψ」フィールドを見つけるか（ステップｌｌ０ｃおよび１１０Ｄ）、または複合「φ」フィールドを発見するか（ステップｌｌ０Ｅおよびｌｌ０Ｆ）のいずれかに基づいて、額面金額の「φ」および「＄」フィールドを分離するための根拠を発見した結果として動作はステップ１１０Ｇに進むということが理解されるであろう。

したかってステップｌｌ０Ｇは分離のために見つけられた特定の根拠（ピリオド、上付きに書かれることまたは複合「φ」フィールド）を使用して「φ」フィールドを分離する。

またステップｌｌ０Ｇの間、分離された「φ」フィールドは前述の特許において開示されたような統計学的分類技術を使用して幾つかの型の１つとして類別される。説明されている好ましい実施例のためにステップｌｌ０Ｇによって与えられ得る類別は２つの０．２桁の数字、下線付き２桁の数字および分数である。別の類別も与えられ得る。

もし許容可能な類別かステップ１１０Ｇにおいて決定されるならば、動作は図１２におけるステップ１１２に進み、さもなければ拒絶か発生する。

ステップ１１２（図面の簡単な説明この発明に従ってステップ１１２を達成するための好ましい態様か次に考察されるであろう。ステップ１１２の目的は「φ」フィールドのために決定された類別に基づいて「φ）文字を抽出することであることが念頭におかれる。

説明されている好ましい実施例において与えられた種々の類別のためのステップ１１２における動作は以下に説明この類別に関して、「ψＪフィールドの値は０であるということが即座に知られ、したがって動作はさらなる処理を伴わず図３のステップ１１６に進む。典型的には、この類別は分離の根拠かピリオドまたは上付きに書かれたｒφ」フィールドの検出であるところでのみ使用される。

２桁の数字この類別に関しては、［φノフィールドの数字は直接利用可能であり、ゆえに動作はさらなる処理を伴わず認識のための図３におけるステップ１１４に進む。「２つの０」類別と同じく、この類別は典型的には分離のための根拠がピリオドまたは上付きに書かれた「φ」フィールドの検出であるところでのみ使用される。

下線を引かれた２桁の数字この類別に関しては、「φ」フィールドが下線を引かれた「３６」からなる図１８および図１９に例示されるように「φ」文字のみが残るように動作は下線を除去することに向けられる。この目的を達成するための好ましい具体例は以下に説明される。

まず下線の勾配か以下のように決定される。「φ」フィールドの各列に関して、第１の黒ピクセルに対する白ピクセルの数か下部端縁からカウントされる。もし２つの連続する列のこれらの個数の差か量に関して４より大きければ、不連続の部分か存在する。「φ」フィールドにおける不連続のすへての部分および２つの不連続の部分の間の最も大きい列範囲か決定される。この最も大きい列範囲において、下線かまた予期される。２つの画像の座標点（ｘｉ、ｙｌ）および（ｘ２．ｙ２）は以下のように規定される。

ｘｌ＝列範囲の開始列。

ＹＩ＝列ｘｌにおける下部端縁から第１の黒ビクセルまでの白ビクセルの数。

Ｘ２＝列範囲の終わりの列。

ｙ２＝列ｘ２における下部端縁から第１の黒ピクセルまでの白ビクセルの数。

下線の勾配ＳＬは以下の方程式によって定められる。

ＳＬ＝　（ｙ２−ｙ　１）／　（ｘ２−ｘｉ）発見された下線を削除するために、勾配ＳＬのｎ直線の集合および１の垂直間隔か形成される。直線の数ｎは下線の勾配に依存し、以下のように確立される。

その他の時　ｎ＝３２さらに、開始点かこれらの直線の上に、これらの直線に沿って走査ステップ幅１で右からおよび左からｒｅＪフィールドを走査するために確立される。

左からの走査の場合、ＸＩ（ｉ）＝＝ｒφ」フィールドの第１の列（すべての直線に関して）　ｙｌ　（ｉ）　＝ｙ　開始＋１−１（ｉ番目の直線に関しては）この場合、ｙ−開始は（ｘｉ　ｙｌ）か第１の直線の走査点て発生するように確立される。

右からの走査の場合、ｘｒ（ｉ）＝ｒφｊフィールドの最後の列（すへての直線に関して）ｙｒ　（ｉ）　＝ｙ　開始＋１−１（ｉ番目の直線に関して）この場合、ｙ−開始は（ｘ　２．　ｙ　２）か第１の直線の走査点で発生するように確立される。

「φ」フィールドはこれらの直線に沿って走査され、その目的は可能な限りにおいてその直線より下には完全な下線は生じるか役に立つ情報は生じないような直線を決定するためである。この目的のために、走査点の個数は、「φ」フィールドの第１の黒ビクセルを備える走査点に関する限りは、右からおよび左からの走査においてずへての走査直線に関してカウントされる。それから、右からの走査コースにおけるおよび左からの走査コースにおけるカウントされた走査点の最大個数を備えた直線か決定される。直線のこの範囲から、一番低いものか選択される。この最も低い直線以下の抽出された「φ」フィールドのすべての部分は削除され、図１９に示される結果を生み出す。上の手順は「ψ」文字か下線を遮断するような状況をも取り扱う。

下線の除去の後（図１９）残った「φ」フィールド構成要素（図１９のｒ３６」）は再び統計学的分類技術を使って確かめられ、２つの０または２桁の数字類別のどちらに入るか決定される。もし類別か２桁の０ならば、動作はステップ１１６に進む、なぜなら「φ」フィールドの値はＯであることか既知であるからである。もし類別が２桁の数字ならば、動作は２桁の数字を認識するためにステップｌ１４に進む。もしいずれの類別も発見されなければ、拒絶が発生する。

分数この類別に関しては、動作は図２０．２１および２２に示されるようにまず分母を除去し、それから分数点を除去する、なぜなら「φ」フィールドは分子「８０」および分母ｒ　１００Ｊを有する分数からなるからである。この目的を達成するための好ましい具体例は以下に説明される。

第１に、フィールドは分数線か予期される列範囲まで調査される。これは、たとえば、最も大きい幅を有する連結構成要素群ＣＣを決定することによって達成されてもよい。

一旦分数線か発見されると、その勾配は座ｆｌ’！ｘＬｙｌ、ｘ２、ｙ２を発見することおよび下線を引かれた複合「φ」フィールドに関して先に説明されたのと同じ態様で勾配を計算することによって決定される。

可能な限り分子および分数線のみか位置する、分割直線かここで確立される。この分割直線は勾配および以下を備える座標ｒｘｌ、ｙｌ十オフセット」で決定される。

その他の時　オフセット＝ｌＯこのように分割直線を確立して、この分割線の下の「φ」フィールド構成要素は削除され、図１９に示された分数の例に関しては、分母ｒｌｏＯＪが削除される結果となるであろう。このように、残りの「φＪフィールド構成要素は、図２１に示される下線を引かれた「８０」となるであろう。

したかって、図２１に例示されるように、分数動作はここまでは下線を引かれた２つの０または２桁の数字という結果になるはずであり、残りの「φ」フィールド構成要素は統計学的分類技術を使って確かめられ、これらの残りの構成部分が実際この下線を引かれた２つのＯまたは下線を引かれた２桁の数字に対応するかどうかを決定する。もしそうならば、動作は、下線を引かれた複合「φ」フィールド類別に関して上に先に説明されたように＃！続し、ＦφＪ文字を抽出しく図２２）、もしそうてなければ、拒絶か発生する。

この発明はここに特定の好ましい実施例について説明されてきたか、具体例、配列および使用において多くの修正および変形かこの発明の範囲内で可能であるということか理解されるへきである。たとえば分類類別の壓および個数のみならず使用されるシードおよびマスク画像ならびにサーチエリアの個数および梨も変化してもよい。さらに、シードおよびマスク画像は２値（２レベル）画像に限定される必要はない。額面金額抽出、「ψノフィールド分離および／または認識のために役に立つ追加的な情報を提供するために、たとえば、マスク画像それ自体がグレーレベル（多レベル）画像であってもよい。さらに処理ステップも追加的な特徴を与えるために追加されてもよく、または説明されたステップも除去されまたは再配列されてもよい。

加えて、この発明はここに説明されたちの以外に多種多様な適応に適合され得る。したかって、以下の請求の範囲はそこに規定された範囲内でのすへての可能な修正および変形を含むものであると考えられるべきである。

ＦＩ口、１　１０ワークヌテージコン１９スナ、アｒｏｏｃｔＢ３Ｅρ１らステー、７’１０２戸９ストア（Ｏｂｐ゛ラＦＩＧ、＋３ＦＩＧ、＋７ＦＩＧ　１８　ＦＩＧ　１９ＦＩＧ　２０　ＦＩＧ、２１　ＦＩＧ、２２国際調査報告国際調査報告フロントページの続き（８１）指定国　ＥＰ（ＡＴ、ＢＥ、ＣＨ，ＤＥ。

ＤＫ、　ＥＳ、　ＦＲ，ＧＢ、　ＧＲ，ＩＴ、　ＬＵ、　ＮＬ、　ＳＥ）、　ＡＵ、　ＣＡ、ＪＰ（７２）発明者　クレンネル、ノルベルトドイツ連邦共和国、デー・７７５２　ライヒエナラ、ステディガセ、１８・アー

Claims

【特許請求の範囲】

１．文書上の財務金額の文字を認識するための電子的に実現される方法であって、前記財務金額は整数部分と可能性のある複数の分数部分表示を有する小数部分とを含み、前記財務金額に対応する画像表示をつくり出すステップと、前記整数および小数部分に関して少なくとも１つの予め定められた複数の識別分離特性を見つけるために前記画像表示を調査するステップと、前記議別分離特性の１つを前記調査するステップ中に見つけることに基づいて前記整数および小数部分を分離するステップと、分離された小数部分を、前記可能性のある複数の分数部分表示のいずれが分離された小数部分に対応するかに基づき、複数の類別のうちの１つに類別するステップと、前記類別するステップに基づいて分離された小数部分の文字を抽出するステップとを含む、方法。
２．前記画像表示は格納されたディジタル表示である、請求項１に記載の方法。
３．前記ディジタル表示は２値表示である、請求項２に記載の方法。
４．もし前記予め定められた複数の識別分離特性が前記調査するステップの間に見つからないとき、さらなる認識動作を拒絶するステップをさらに含む、請求項１に記載の方法。
５．前記つくり出すステップは前記財務金額の一部ではない異質の画像部分を位置決定するために前記画像表示を調査するステップと、前記異質の画像部分を前記財務金額に関するそれらの位置に基づき取り除くステップとを含む、請求項１に記載の方法。
６．前記予め定められた複数の識別分離特性は前記財務金額の前記整数および小数部分間のピリオドの存在を含み、前記調査するステップは前記ピリオドの存在をその大きさおよび位置に基づき決定する、請求項１に記載の方法。
７．前記予め定められた複数の識別分離特性は前記小数部分における上付きにされた文字の存在を含み、前記調査するステップは前記上付きにされた文字の存在をその大きさおよび位置に基づき決定する、請求項１に記載の方法。
８．前記複数の識別分離特性は前記小数部分における複合文字配列の存在を含み、前記調査するステップは前記複合文字配列の存在を統計的分類技術を使用して決定する、請求項１に記載の方法。
９．前記複合文字配列は下線を付けられた文字を含む、請求項８に記載の方法。
１０．前記複合文字配列は分数を含む、請求項８に記載の方法。
１１．前記整数部分はドルに対応し、前記小数部分はセントに対応する、請求項１に記載の方法。
１２．前記複数の類別は２つの０を含む、請求項１１に記載の方法。
１３．前記複数の類別は２桁の数字を含む、請求項１１に記載の方法。
１４．前記複数の類別は下に下線を有する２つの隣接する数字からなる下線を付けられた２桁の数字を含む、請求項１１に記載の方法。
１５．前記複数の類別は分子、分母およびそれらの間の分数線を含む分数を含む、請求項１１に記載の方法。
１６．前記複数の類別は２桁の数字と、下線付きの２桁の数字と、分子、分母およびそれらの間の分数線を含む分数とを含む、請求項１１に記載の方法。
１７．前記抽出するステップは前記下線の位置および勾配を決定するステップと、下線を削除するステップを含む、請求項１４または１６に記載の方法。
１８．前記抽出するステップは前記分数線の位置および勾配を決定するステップと、前記分数繰下の分母および分数線を削除するステップとを含む、請求項１５または１６に記載の方法。
１９．文書上の予め定められた金額データを認識するための方法であって、前記予め定められた金額データに対応する画像表示をつくり出すステップを含み、前記画像表示は前記予め定められた金額データの一部ではない異質のデータを含み、前記異質の画像部分を位置決定するために前記画像表示を調査するステップと、前記異質の画像部分を前記予め定められた金額データに関するそれらの位置に基づき取り除くステップとを含む、方法。
２０．前記予め定められたデータは上部および下部境界線を有する隣接した文字の群であり、前記取り除くステップは異質の画像部分がもし前記境界線の上および下から予め定められた量、間隔をあけられると削除するステップを含む、請求項５または１９に記載の方法。
２１．前記境界線は前記文字の群を投影して前記文字を取り囲む領域をつくることによって決定される、請求項２０に記載の方法。
２２．前記財務金額は行に配列され、前記異質の画像部分は前記行の辺に隣接して配置される１つまたはそれより多い異質の副画像部分を含み、前記取り除くステップは前記財務金額の最も近い部分と前記異質の副画像部分との間隔が前記副画像部分の幅より大きい予め定められた量であるという条件に基づき異質の副画像部分を削除するステップを含む、請求項５または１９に記載の方法。
２３．前記削除するステップは前記条件が継続して満たされているをり反復して繰返される、請求項２２に記載の方法。