JPH06501803A - 抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法 - Google Patents
抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法Info
- Publication number
- JPH06501803A JPH06501803A JP3517931A JP51793191A JPH06501803A JP H06501803 A JPH06501803 A JP H06501803A JP 3517931 A JP3517931 A JP 3517931A JP 51793191 A JP51793191 A JP 51793191A JP H06501803 A JPH06501803 A JP H06501803A
- Authority
- JP
- Japan
- Prior art keywords
- image
- face value
- characters
- character
- examining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/274—Syntactic or semantic context, e.g. balancing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法
発明の背景
この発明は、一般的には文書上のデータを自動的に認識するための改良された手
段および方法に関し、より特定的には、小切手、送状および送金文書のような財
務文書上の金額情報を自動的に認識するための改良された手段および方法に関す
る。
今日の金融サービス業は膨大な量の文書を効率的に処理するという大きな問題に
直面している。文書支払方式か衰えるだろうという予測は実現していない。実際
、文書支払方式は世界的に成長し、増大し続けると予期されている。
したかってそのような文書を処理するための改良された方法を考案する不可欠な
必要性かある。
文書処理に対する支援として画像化技術を使用することは、たとえば米国特許第
4,205,780号、第4,264.808号、第4,672,186号、お
よび第4゜888.812号に開示されるように、文書処理を有意に改良する1
方法として認識されてきた。一般的に、画像化は文書を光学的に走査し、電子的
に処理されかつ後の検索および表示のために(磁気ディスクドライブおよび/ま
たは光学メモリのような)大容量記憶媒体に格納される電子画像をつくり出すこ
とを含む。文書画像化は文書の取扱いおよび移動を減する機会を提供するという
ことは明らかである、なぜならこれらの電子画像は実際の文書に代わって使用さ
れ得るからである。たとえば、文書画像は記憶装置から検索され、ワークステー
ションに表示され、そこてはオペレータは文書を直接的に検視することなく、観
察された画像に基づいて金額データおよび他の情報を入力することができる。
文書処理システムにおいて画像化を利用することは存意な改良を提供し得るか、
文書からのデータをオペレータか検視しかつ入力する必要性は、達成できる文書
処理速度および効率を限定し続ける。
発明の概要および目的
この発明に従って、文書処理の速度および効率のさらなる増大は、文書上のデー
タを自動的に位置決定し、抽出しかつ認識する改良された方法、より特定的には
、小切手、送状および送金文書のような財務文書処理システムにおける使用に必
要とされる高速で有利に動作し得る改良された方法を提供することによって可能
にされる。
米国特許第4,449.239号、第4. 201. 978号、第4,468
.808号、第4,918.740号、第4,523,330号、第4,685
,141号、第3゜832.682号および欧州特許第EP−0.111,93
0号は当該技術分野において公知である種々の自動データ認識手法を開示する。
目的、特徴、利点および使用のみならずこの発明の特定的性質は、添付の図面に
加えて以下の詳細な説明から明白になるであろう。
図面の簡単な説明
図1は、米国において広く使用されている梨の典型的な小切手を例示する。
図2は、一般的にこの発明か組み入れられてもよい文書処理システムを例示する
。
図3は、この発明に従った自動額面金額(courtesy am。
unt)読取機によって実行される種々の操作ステップを一般的に例示するフロ
ーチャートである。
図4は、図3の「$位置決定」ステップ102を達成するための好ましい態様を
例示するフローチャートである。
図5は、図2のイメージモジュール14によって提供される典型的なグレーレベ
ル画像である。
図6は、図5に表わされるグレーレベル画像からのシードおよびマスク2値画像
の並列発生および記憶のための装置を例示するブロック図である。
図7は、図4のステップl02Bによって確立される典型的な[$jシードサー
チエリア$sAを例示する。
図8は、図4のステップ102Bによって確立される典型的な「$Jマスクサー
チエリア$MAを例示する。
図9は、図3の「額面金額抽出」ステップ104を達成するための好ましい態様
を例示するフローチャートである。
図1Oは、図9のステップ104Bによって確立される典型的な額面金額シード
サーチエリアC,A、SAを例示する。
図11は、図9のステップ104Bによって確立される典型的な額面金額マスク
サーチエリアC,A、MAを例示する。
図12は、図3の「φ部分を分離かつ類別」ステップ110を達成するための好
ましい態様を例示するフローチャートである。
図13は、(図9のステップ104Jにおいて明瞭化の前の)異質な連結構成要
素群62および63を含む典型的な抽出された額面金額を例示する。
図14−16は、図9のステップ104Jにおける明瞭化の後の典型的な抽出さ
れた額面金額を例示する。
図17−18は、いかに「ψ」文字か下線を引かれた2桁の数字からなる「φ」
フィールドから抽出されるかを例示する。
図19−21は、いかにして「φ」文字が分数からなるUφ」フィールドから抽
出されるかを例示する。
詳細な説明
同様な数字および文字は全図面にわたって同様なエレメントを参照する。
この詳細な説明の目的のために、この発明は財務文書を処理するための文書処理
システムにおいて小切手上のドル金額(具体的に「額面金額)と称される)を自
動的に認識するのに適用されるように例示されるであろう。しかしなから、この
発明は財務上およびその他のデータ認識応用の別の型のみならず文書の別の型に
もまた適用可能であるということか理解されるべきである。
最近に図1を参照すると、そこでは米国において広く使用される盟の小切手IO
か例示される。小切手lOは「$」通貨記号10aおよび関連の金額10bを有
し、それは金融業界では「額面金額」と典型的には称される。この額面金額を認
識する読取機は典型的には額面金額読取機(CAR)と称される。額面金額10
bは機械印刷されるかまたは図1に示されるように手書きされてもよい。
図1に示される典型的な小切手lOは、小切手の左下に符号化された機械読取り
可能なデータIOcをもまた含み、それは小切手か振り出される銀行の識別、顧
客の預金口座番号、および小切手番号のような識別情報を提供するのに役立つ。
典型的にはこの符号化された機械読取り可能なデータ10cは磁性インクで与え
られ、それは頭字語て「MICRJ (磁気インク文字認識)と呼ばれる。
図2はこの発明か組み込まれてもよい文書処理システムを一般的に例示する。処
理されるべき文書は典型的には財務文書てあり、図1に例示される型の小切手を
含む。図2に示されるように、これらの財務文書10は文書プロセッサ12に与
えられ、従来の態様で、その機械は文書から符号化されたデータを読取り、文書
の画像を取込みかつ処理し、その文書をポケット(図示されていない)に区分け
する。
図2における文書プロセッサ12は文書の画像を取込み、取込まれた文書画像を
処理しかつ圧縮し、それから圧縮された文書画像をディスクドライブのような記
憶装置16に伝送するイメージングモジュール14を含む。ワークステーション
19はワークステーションオペレータによるデータの表示および入力のために、
検視された画像からの額面金額のような文書画像を記憶装置16から受け取る。
演算処理装置(CPU)20はシステムの全体の制御と、(記憶装置16を経て
)文書プロセッサ12およびワークステーション19によってそこへ伝送された
文書情報のためのデータベースの維持とをまた与える。
図2の文書プロセッサ12はさらに、図1に例示されるように小切手上の額面金
額を自動的に認識するためのイメージングモジュール14に結合される額面金額
読取機18を含む。図1の文書処理システムにおいてそのような額面金額読取1
118を提供することの重要な利点は、金額かうまく読取られた小切手は、ワー
クステーション18て画像を検視することによってそれらの額面金額を読取られ
かつ入力される必要かないということである。
額面金額読取機(CAR)18はこの発明に従って額面金額の自動認識を提供す
るために、イメージモジュール14からそこへ与えられた文書画像を演算処理す
るために適当なプログラミングに加えて、複数のマイクロプロセッサ、RAM、
ROMおよび別の関連の回路を典型的に含む。CARI8にそういったものを設
ける態様はここでの開示によって明白となるであろう。
図3は、小切手上の額面金額を認識する際に図2のCARI8によって実行され
る種々の操作ステップを一般的に例示するフローチャートである。このフローチ
ャートは例として与えられるのであって、発明の範囲を限定するものとして考え
られるへきてはないということか理解されるへきである。たとえば、ここに示さ
れるあるステップか省略されてもよく、別のステップか加えられてもよく、かつ
/またはステップの配列か変更されてもよい。
ステップ100によって示されるように、CAR18は図2のイメージングモジ
ュール14から小切手のグレーレヘル画像を受け取る。CARは図1における’
$J10aを位置決定しくステップI O2) 、それから関連の額面金額10
bを抽出する(ステップ104)。抽出された額面金額か機械印刷されているか
または手書きかという判断かそれからなされる(ステップ106)。もし機械印
刷であるならば、比較的単純な額面金額認識か実行され(ステップ+08)、結
果か出力される(ステップ118)。
もし抽出された額面金額か手書きであると判断されると(ステップ106)、よ
り複雑な分析か要求される。そのような場合、「φ」部分10b−1(図1)は
まず分離されかつ類別され(ステップ110)、「φ」文字かそれから類別に基
づいて抽出される(ステップ112)。結果として抽出された「φ」文字はそれ
から認識される(ステップ114)。
「φj文字かうまく認識された後(ステップ114)、ドル文字か認識される(
ステップll6)。CAR18(図2)はそれから認識された額面金額または拒
絶信号を出力する(ステップ118)。図2のシステムにおいて、このCAR出
力はCPU20に送られる。もし図3のステップのいずれかの間に拒絶状態が検
出されると、拒絶出力が即座に与えられ残りのステップは停止される。図3に示
されるように、額面金額の「φ」部分の抽出゛および認識はドル部分より先に実
行される、なぜならそれは拒絶を生み出しかちであるからである。CARによっ
て与えられた認識された額面金額出力は、認識プロセスの間に生み出された信頼
指示に基づく信頼値を伴ってもよいということか理解されるであろう。図3にお
ける認識ステップ106.108.114および+16は、前述の特許において
開示されたような公知の認識技術を使用して提供され得るということもまた理解
されるであろう。
図3に例示されるステップの各々の説明か以下に述へられる。
ステップ100(図3)
このステップの間、図2におけるイメージングモジュール14は、CAR,18
に少なくとも「$」文字10aおよび関連の額面金額10bを含む小切手の部分
のグレースケール画像(図5に例示されるような)を提供する。図5に例示され
るサイズは例としてのみであるということか理解されるへきである。
ステップ102(図3)
このステップの間、「$」文字10a (図5)か位置決定される。明らかに、
アスタリスク「*」または別の適切な記号のような「$」以外の通貨文字も位置
決定文字として使用され得る。
ステップ104(図3)
このステップの間、額面金額10b(図5)は先に位置決定された「$」文字1
0aを位置決定ガイドとして使用して抽出される。
たちのかまたは手書きされたものかということに関する判断かなされる。もしそ
れか機械印刷されたものであるならば、動作はステップ108に進む。もしそれ
が手書きであるならば、動作はステップ110に進む。
ステップ108(図3)
もし額面金額か機械印刷されたものと判断されると、比較的単純な認識か認識さ
れた機械印刷の型に基ついてなされる。
ステップ110(図3)
もし額面金額か手書きであると判断されるならば、より複雑な分析か要求され、
それは「φノ部分10b−1 (図5)の、ドル部分10b−2からの分離で始
まる。分離された[ψJ部分はそれから類別される。
ステップ112(図3)
このステップの間、「ψ」文字は、ステップ110でなされた類別に基づいて抽
出される。
ステップ114
このステップの間、抽出された「ψ]文字は認識される。
ステップ116 (図3)
このステップの間、額面金額の「$」文字10b−2(図5)が認識され、額面
金額の認識を完了する。
ステップ118(図3)
このステップの間、CARl 8は(図2のCPU20に)認識された額面金額
または拒絶信号を出力する。拒絶信号は、もし拒絶状態が先のステップのいずれ
かの間に検出されるならば、CARによって提供され、そのような場合、それ以
後のステップは停止される。認識された額面金額はまた信頼値を伴ってもよい。
図3に示された種々のステップはここで詳細に考察され図3においてステップ1
02を達成するための好ましい態様は、この発明に従って、図4におけるステッ
プ102八からステップ102Hを参照して次に考察されるであろう。ステップ
102の目的は図5における小切手IO上の「$」文字を位置決定することであ
るということか念頭におかれるであろう。
ステップ102A(図4)
このステップの間、しきい値処理は図2のイメージモジュール14によって与え
られる(図5の)グレーレベル画像から、複数の2値画像を得るのに使用される
。これらの2値画像の導出は、グレーレベル画像は各ピクセルが複数のグレーレ
ベル値の1つを存するピクセル(画素)のX−Yマトリックスとして電気的に典
型的に表わされるということに注目することによって理解されるであろう。たと
えば、各ピクセルは15が黒てありOか白である2値番号Oないし15に対応す
る4ヒツトで表わされる16のグレーレベル値を備え得る。得られた2値画像の
各々はこれらのグレーレベル値の異なった1つを、グレーレベル画像を2値画像
に変換する際、しきい値として使うことによって生み出される。たとえば、もし
8のしきい値か特定の2値画像を生み出すのに使われるならば、その2値画像は
そのグレーレベル値か8またはそれよりも大きいピクセルを黒ビクセルとして有
し、2値画像の他のピクセルはすへて白である。
ここで考察されるこの発明の特定の実施例のために、3つの2値画像か、3つの
異なったしきい値高、中および低を使用してグレーレベル画像(図5)から得ら
れる。高しきい値2値画像は「$」 シート画像と称され、中2値画像は額面金
額シート画像と称され、低しきい値2値画像はマスク画像と称されるであろう。
以下に説明されるように、「$」 シート画像は「$」文字10a (図5)を
位置決定するために使用され、額面金額2値画像は、額面金額lObを抽出する
ために使用され、かつマスク画像は両方の目的のために使用される。
図6に例示されるように、認識速度を増大するために、グレーレベル画像か図2
のイメージモジュール14から受け取られると、シードおよびマスク画像かコン
バータ34.36および38各々によって同時に発生され得、結果としての2値
画像はそれぞれのランダムアクセスメモリ(RAM)44.46および48に検
索可能に格納される。
ステップ102B(図4)
このステップの間、「$」 シードおよびマスク画像上のサーチエリアは「$」
文字を位置決定する際に使用するために確立される。図7はシード画像のための
「$j シード画像サーチエリア$SAの例を示し、図8はマスク画像のための
「$Jマスクサーチエリア$MAの例を示す。図7および図8はシートおよびマ
スク画像を得るための異なったしきい値を使用することによって生み出された効
果もまた例示する。この点ては、図8の「$」マスクサーチェリア$MAは(使
用された低しきい値のため)図7の「$」シートサーチエリア$SAよりも多い
異質な黒ピクセル(ノイズ)を含むということに注目されたい。
考察される特定の実施例の目的のために、図7の所望された「$」 シードサー
チエリア$SAは公知であると仮定されるであろう。たとえばその位置はCPU
20 (図2)において先に格納することもてき、または小切手10(図1)上
の機械読取り可能線10cを読取ることからも得られるであろう。代わりに、「
$ノ文字が位置決定されるまで全体画像のサーチをすることもてきる。
ステップ102c、102Dおよび102E(図4)ステップ102Cの間、図
7における「$」シードサーチエリア$SAは「新しい」黒ピクセルのために走
査される。以下に説明されるように、「新しいJ黒ピクセルはシードサーチエリ
ア$SAにおいてまた考慮されて(accounted for)いないもので
ある。典型的には、垂直方向の列単位の走査か使用される、なぜならそれは金額
文字よりも前に遭遇される「$」文字を位置決定する際に、存利であるためであ
る。もし、走査の間、新しい黒ピクセルか発見されなければ(ステップ102D
)、図5の「$」シー)・サーチエリア$SAの最後の垂直方向列か走査された
かとうかの判断かなされる(ステップ102E)。そのような場合、拒絶か発生
される。拒絶は、もし認識プロセスに割り当てられた最大時間か終了するとまた
発生し得るということか、また理解されるへきである。これはいずれか1つの小
切手のための認識プロセスか、小切手処理速度の要求と相反する、時間を超過す
るということを防ぐためになされる。
もしステップ102Eの間に、垂直方向走査か完了されていないと判断されるな
らば、動作はステップ102Cに戻り、「$jシードサーチエリア$SAの走査
方向において新しい黒ピクセルをサーチし続ける。
ステップ102F、102Gおよび102H(図4)もし新しい黒ビクセルがス
テップ102Dの間に発見されるならば、動作はステップ102Fに進む。ステ
・ツブ102Fの間に、「$jシードサーチエリア$SA(図7)において発見
されたシード黒ピクセル(ステップ102D)は、「$」マスクサーチエリア$
MA(図8)を使用して成長させられ、ピクセルの連結群を発生し、それは以下
に記号CCと称されるであろう。CCか発生される態様が次に説明されるであろ
う。
図7の「$」シードサーチエリア$SAがまず参照される。「$」文字10aは
おおよそ完全であるように見えるてあろうか、10’aて示されるように種々の
切れ目を伴い、一方で隣接の額面金額10bの数字「8」はより大きく広い切れ
目10’bを有する。これは、「$」文字は普通額面金額文字よりも存意に高度
なコントラストを存し、より高品質の印刷!プロセスを使用してつくり出される
ため予期されることである。(先に説明されたように、)比較的高いしきい値か
「$」 シート画像を得るために使用されるため、図7における「$」 ソード
サーチエリア$SAは32sのようなほんの少しの、広く間隔をあけられた異質
の黒ピクセルを含むということにもまた注目されたい。
次に図8における「$」マスクサーチエリア$〜IAを参照すると、(前に説明
されたように)それはより低いしきい値を使用して得られる。より低いしきい値
処理のため、「$ノ文字10aは完全であるか、一方で隣接の額面金額10bの
「8」はまた幾らかの切れ目10”bを含むということか見られるであろう。ま
た、図8の「$」マスクサーチエリア$MAにおいて32mのような、図7の「
$jシートサーチエリア$SAにおいてよりも有意に多い異質な黒ピクセルかあ
る。加えて、「$」マスクサーチエリア$MAは額面金額枠33による黒ビクセ
ルを含む。
図4におけるステップ102Dおよび102Fは、「$」文字を位置決定しかつ
認識するのに(それぞれ図7および8の)「$」 シードおよびマスクサーチエ
リア$SAおよび$MAの両方を利用する。より特定的には、新しい黒ビクセル
か図7の「$」シートサーチエリア$SAにおいて発見されると(ステップl0
2D)、図8の「$」マスクサーチエリア$MAにおける対応する位置を存する
ピクセルか位置決定される。たとえば、もし図7における34sか「$Jシート
サーチエリア$SAにおいて発見された新しい黒ピクセルであるならば(ステッ
プ102D)、図8の「$」マスクサーチエリア$MAにおける対応して位置決
定される黒ピクセル34mか位置決定される。これは図6のそれぞれ「$」 シ
ードおよびマスクRAM44および48において格納されたシードおよびマスク
画像を使用して実現され得、それはたとえば、対応するシードおよびマスクピク
セルか対応するアドレスを存するように構成されてもよい。
ステップl02Fの実行において行なわれる次の動作は、「$」マスクサーチエ
リア$MAにおける黒ピクセル34m(図8)を成長させ、34mに連結されだ
すへての黒ピクセルからなるCCを発生することである。これはたとえば、図6
のマスクRAM48を使用して達成されてもよい。
黒ピクセル34m(図8)から始まって、黒ビクセル34m(図8)にすぐ隣接
するピクセル位置に対応するアドレスでの黒ピクセルがあるかどうかに関する判
断がなされる。
同様の判断か、新規に判断された黒ビクセルの各々についてなされ、CCを形成
するすべての連結黒ピクセルか識別されるまで再度繰返される。これらの識別さ
れた黒ビクセルのアドレスは、黒ピクセル34rnから発生されたCCを構成す
る。図6におけるマスクRAM46は、たとえばCCを形成する識別された黒ピ
クセルのアドレスを格納するのに使用されてもよい。
さらに図7および図8を参照すると、もし図7の「$」シートサーチエリア$S
Aにおいて発見された新しいビクセル(ステップ102D)か「$」文字10a
の黒ビクセル34sであるならば、図8の「$」マスクサーチエリア$MAにお
ける対応する黒ピクセル34mの成長によってつくり出された結果としてのCC
(ステップl02F)はCC−1であり、それは「$」文字10aである。これ
は図8の「$」マスクサーチエリア$MAにおける「$」文字のすへてのピクセ
ルが連結されるためである。
他方、もし「$j文字か存在せず、「$」シードサーチエリア$SA(図7)に
おいて発見された新しい黒ピクセルか数字「8」のピクセル36sてあったと仮
定すると、図8の対応する黒ビクセル36mの成長はCC−2を発生し、それは
切れ目10’bのために「8」の上部の部分にすぎないと忠われるてあろう。
ステップl02FのCCの発生に従って、動作はステップ102Gに進み、そこ
では発生されたCCのサイズ、幾何学的形状および位置か、「$」文字の適当な
候補かどうか、または拒絶されるへきかとうかという比較的早い判断をなすため
に使用され、それによって比較的により時間を消費する認識プロセスを避ける。
CCか「$」候補であると判断されるときのみ(ステップ102G)、動作はス
テップ102Hに進み、そこでは従来の文字認識か、CCか「$」文字であるか
どうかを判断するために実行される。たとえは前述の米国特許第4゜449.2
39号において説明された分類器手法は認識のために使用されてもよい。もしC
Cかステップ102Gにおいて適当な「$」の候補であると判断されない場合、
またはもしCCかステップ102Hにおいて「$」であると認識されない場合、
動作はステップ102Cに戻り、図7の「$」 シードサーチエリア$SAにお
いて新しい黒ピクセルを走査し続ける。しかしながらもし、CCがステップ10
2Hにおいて「$」文字と認識されるならば、「$」文字は位置決定される。そ
のような場合、さらなる走査は行なわれず、動作は図3のステップ104に進み
、額面金額を抽出する。
ステップl02Eと関連して先に述へたように、走査の終わりに達するときに、
もし「$」文字の認識がなされなければ、拒絶か発生する。もし追加的サーチエ
リアが「$」文字のために走査されることか所望されるならば、走査の終わりに
拒絶を生み出す代わりに、動作は図4のステップ102Bまて戻り、新しいシー
ドおよびマスクサーチエリアを確立する。追加的サーチエリアのこの走査は所望
されるたけの回数、または中断か発生するまで続けられてもよい。
ステップ102Fの前述の説明から、ステップ102Cで参照された「新しい」
黒ピクセルは、ステップ102Fの間に「$Jマスクサーチエリアにおいての成
長の結果として先に発見されなかったしのである、なぜなら先に識別された黒ピ
クセルを成長させる必要はないからである。そのような先に識別されたシートピ
クセルか、「$」マスクサーチエリアにおいて成長されることを防ぐ種々の可能
な方法かある。説明されている実施例において、図4のステップ102Fにおけ
るマスク成長の間「$」マスクサーチエリア$MAにおける対応するビクセルを
識別すると、(図6の「$」 シート画像RA〜144に格納された)「$ノノ
ート画像からシートピクセルを削除することによってこの目的を達成することか
有利であるということかわかった。したかって、ステップl02Fにおける先の
成長の間識別された黒ビクセルは、ステップ102Cの走査の閲見られず、ゆえ
に「$」文字を位置決定するのに必要な時間を減する。この節約は、シート画像
か、その導出に使用される高しきい値の結果としての比較的僅かな「ノイズ」黒
ピクセルを含むために節約された時間にさらに加えられるものである。そのよう
な高しきい値の使用は可能である。
CCを発生するための上に説明されたシード/マスク成長手法は小切手10(図
1)上の「$」文字10aを位置決定するのにさらに利点となることか理解され
るであろう、なぜなら「$」文字は普通高品質および高いコントラストを備えて
印刷され、「$Jマスクサーチエリア$MA(図8)にお1する切れ目をつくる
ようには、巴われないからである。このように、上に説明されたように(ステッ
プ102Gおよび102H)、認識のために発生されたCCの各々を提出するこ
とは、他の印または(先に考察された数字「8」のような)文字と比へて「$」
文字か認識される可能性をかなり高くする。
CCを発生するためのシート/マスク成長手法はこの発明の範囲内において多く
の変形を受けるということかさらに理解されるへきである。たとえばCCを発生
するために使われる「連結性J (connectivity)の定義は、異な
った環境下で特定の型の文字の認識に対処するのに種々の様式で変化され得る。
たとえば、「連結性」の定義は(垂直、水平および/または特定の対角線のよう
な)1つまたは2つ以上の特定の方向に制限されるように変更され得る。連結性
の定義における別のあり得る変化は、特定の環境において「連結された」ピクセ
ル間に発生する1つ(または2つ以上)のビクセル切れ目を許容し得る。
ステップ104の詳細な説明
図3におけるステップ104を達成するための好ましい態様は図9のステップ1
04Aから104Jを参照して次に考察されるであろう。ステップ104の目的
は図Iに示される額面金額10bを抽出することであるということが念頭におか
れるであろう。
ステップl04A(図9)
このステップの間、動作は額面金額10b(図5)を抽出することに切り替わり
、額面金額の位置はステップ102(図3および図4)における「$」文字10
aをうまく位置決定することに基づいて決定されてきた。ステップ104の説明
か進行するに従って、ステップ102において「$」を位置決定するために説明
された基本的なシード/マスク手法は額面金額抽出にも使用されるか、いくらか
異なった態様で使用されるということか明白になるであろう。
ステップ!04B (図9)
このステップの間、シートおよびマスクサーチエリアは図3のステップ102に
おいて「$」文字の位置を決定したことに基づいて額面金額の抽出のために確立
される。図IOは額面金額シートサーチェリアC,A、SAの例を示し、一方で
図11はいくらかのより大きい額面金額マスクサーチエリアC,A、MAの例を
示す。図11のC,A。
MAは額面金額枠33より下に突き出すかもしれない額面金額部分を含むのに十
分なサイズであるということに注目されたい。またこの点において、額面金額の
「7ノは図10の額面金額サーチエリアC,A、SAに全部は含まれないけれと
も、「7」は図11のより大きい額面金額マスクサーチエリアC,A、MAにお
けるシート/マスク成長の結果として全部抽出されるであろうということにも注
目されたい。
ここに説明される好ましい実施例において、「$」の位置決定のために使用され
たのと同じ(図6のRAM48に格納された)マスク画像か金額抽出のために使
用されるか、(図6のRAM46に格納された)額面金額シート画像は「$」文
字を位置決定するために使用された(RAM44における)「$」 シード画像
の代わりに金額抽出のために使用される。これは、「$」 シード画像しきい値
か先に説明されたように、高度なコントラスト 「$」文字を利用するために高
く選択され、それはより大きいコントラスト変化の範囲を有する額面金額文字に
とってふされしくないため、行なわれる。図1Oは額面金額シートサーチエリア
C,A、SAのためのしきい値の可能な選択の例を示し、そこでは枠33(図5
)は低コントラストの異質なビクセル(ノイズ)と同様、現われない。この点で
、額面金額のすへての部分が図10の額面金額サーチエリアC,A、SAに含ま
れる必要はないということか理解されるへきである。図11のC,A、MAにお
けるシード/マスク成長の結果としての額面金額の適切な抽出を提供するために
、額面金額の十分な部分か図10のC,A、SAに含まれることのみか要求され
る。
ステップ104C,104D、104Eおよび104F(図9)
これらのステップは通常の額面金額に関して、走査の終わりの後(ステップ10
2E)拒絶かないこと、動作は代わりにステップ106 (図3)に進むことを
除いて、図4のそれぞれのステップ102C,102D、102E、および10
2Fのために先に説明されたものと一般的に同してあってもよい。ステップ10
4C,104D、104Eおよびl04Fはゆえに詳細には考察されないであろ
う。
額面金額シートサーチェリアC,A、 SA (図10)の走査の間にF新しい
ノ黒ピクセルか発見されるたびに、額面金額マスクサーチエリアC,A、MA
(図II)における成長は(先に規定されたように)CCをつくり出す。
ステップl04G(図9)
図4のステップ102Gと同様に、このステップはステップ104Fで発生され
たCCか、CCのサイズ、幾何学的形状および位置に基ついて適当であるかとう
かをテストする。額面金額抽出の目的のために、ステップ104Gにおけるこの
テストは発生されたCCか額面金額の一部であるらしいかどうかを判断する。た
とえば、発生されたCCか額面金額の部分であるらしいかどうかを判断するため
の役に立つ根拠は、たとえば図11の線55のように額面金額マスクサーチエリ
アC,A、〜fAの枠52(図11)まで延在するかどうかを判断することであ
る。そのような発生されたCCか額面金額の一部であることはほとんどない。
ステップ104H(図9)
もし発生されたCCかステップ104Gにおいて額面金額の一部ではないらしい
と判断されるならば、動作はステップl04Hに進み、発生されたCCを廃棄し
、動作はステップ104Cに戻り、図10の額面金額シートサーチェリアC,A
、SAにおける新しい黒ビクセルを走査し続はステ・!ブ1041(図9)
もし発生されたCCかステップ104Gにおいて額面金額の一部であるらしいと
判断されるならば、動作はステップ1041に進み、そこで発生されたCCを(
たとえば図6におけるRAMメモリ46内に)後の使用のために格納する。動作
はそれからステップ104Cに戻り、図10の額面金額シートサーチエリアC,
A、SAにおける新しい黒ピクセルを走査し続ける。
ステップ104rを離れる前に、発生されたCCか「$j文字を位置決定するの
に使用される方法(図3および図4のステップ102)と額面金額抽出および認
識のために使用される方法との間の違いに注目することは役に立ってあろう。「
$」文字を位置決定するために、発生されたCCの各々は認識目的のためのもの
と考えられるということか念頭におかれるであろう、なぜなら「$」文字は高品
質の印刷で提供され普通高度なコントラストを存し切れ目を有さないからである
。しかしなから、額面金額抽出のために発生されたCCは文字の断片的な部分に
すぎないかもしれない、なぜなら額面金額文字は、特に手書きされるとき、幾つ
かの切れ目を存するかもしれないからである。このように、額面金額文字は複数
の発生されたCCからなるかもしれない。したかって、額面金額を抽出かつ認識
する際に、(図4のステップ102Hにおいて)「$」文字を位置決定するとき
になされるようには、発生されたCCを認識するという試みはなされない。代わ
りに、額面金額の一部であるらしいと判断された各CCは、全体の額面金額エリ
アか走査されるまでストアされ(ステップ104I)、れたCCか格納されてい
ることになるであろう。これらの格納されたCCは抽出された額面金額を構成す
る。図13は上に説明されるように抽出されたそのような格納された額面金額の
例である。このように、額面金額に関して、CCを発生するためのシート/マス
ク成長手法は主に認識のための額面金額抽出および格納の特に有利な方法として
投薬型的にステップ104Jは(走査の終わりをテストする)ステップ104E
を介して、額面金額、シードサーチエリアC,A、SA (図10)の走査か完
了され、額面金額の一部であるらしいすへての発生されたCCか格納された後に
到達される。ステップ104Jの目的は、この格納された抽出された額面金額(
図13)を62および63て例示されるような異質なCCを除去することによっ
て明瞭にすることである。使用される1つの手法は、62のような異質なCCか
もし額面金額領域の上と下との予め定められた量たけ間隔をあけられている場合
には、それらを削除することである。これはたとえば上部および下部境界線を有
する領域を規定するために全体金額フィールドを水平に投影することによって達
成されてもよい。これらの境界線の上または下の、図13における62のような
CCはそれから削除される。もし投影が複数の領域を生み出すならば、適切な上
部および下部境界線は「$」文字を含む領域に対応するものである。
額面金額の右に位置する図3における63のような異質のCCの除去はより複雑
な問題を引き起こす、なぜならそれらは額面金額の一部であるかもしれないから
である。これらのCCか異質かどうかを判断するための特に有利な方法は、最も
右のCCとCCの左の最も近い黒ビクセルとの間の水平間隔かCCの水平幅より
予め定められた量だけ大きいという条件に基づく。もしこの条件に合致するなら
ば、CCは異質なものと考えられ、削除される。いかにこの条件が実現され得る
かという例は図13に関して説明されるであろう。この例のために、額面金額領
域は左から右に番号付けられた列に分割され、各列は1ピクセルに等しい幅を有
すると考えられる。最初に、以下の列の位置決定は抽出された額面金額から判断
される、
C1=黒ピクセルを有する最も右の列。
C2=CIの左の最小幅Wを備える0列の隣りのエリアの最も右の列。
C3=黒ビクセルを存する、C2の左隣りの列。
もし以下の条件に合致するならば、
(C2−C3)>K (CI−C2)
CIおよびC3の間に置かれだすへての黒ビクセル素子63は削除される。典型
的に、Wは3つの列の幅に対応する幅を有してもよく、Wは単一の文字の部分に
よっては上の条件か満たされないように選択される。Kは典型的には1.5の値
を存してもよい。WおよびKのこれらの値は額面金額か異質なCCと間違えられ
ないことを保証するように選択される。上のことは、条件か合致し続ける限り反
復的に繰返される。条件か合致し損ねたとき、テストは終了し動作は図3の次の
ステップ106に進む。
ステップ110の詳細な説明(図12)ステップ110はもしステップ104の
間に抽出された額面金額か手書きであると判断されたならば到達されるというこ
とか図3から理解されるであろう。ステップ110の目的は「ψ」部分10b−
1(図1)を額面金額10bのトル部分job−2から分離することである。ス
テップ110を、この発明に従って達成するための好ましい態様は、図12のス
テップll0AからllOHを参照して次に考察されるであろう。額面金額の「
87部分および「φ」部分は以下に「$」フィールドおよび「φ」フィールドと
それぞれ称されるであろう。
ステップll0A(図12)
ステップll0Aの間、抽出された額面金額はピリオドまたは小数点(「」)の
存在をサーチされる。そのようなピリオドまたは小数点は、もちろん額面金額の
「$」および「φ」フィールドの間の分離を示し、その検出はしたかってこれら
のフィールドを分離するための根拠として使用される。
ピリオドの存在を検出するための好ましい方法は図14に関して説明されるであ
ろう。この目的のために、抽出された額面金額は、図6のRAMメモリ46に格
納された抽出された額面金額の画像の列単位の走査を使用する等により左から右
に調査される。
もし図13におけるPCのような潜在的なピリオド候補か発見されると、上部線
ULおよび下部線LL(図14)か(図14の数字「9」のような)PCのすぐ
左の額面金額部分のために決定される。線は上から下へと番号付けられる。潜在
的ピリオド候補PCは、もし以下の条件か満たされれば、実際のピリオド候補と
考えられる。
(1) 潜在的ピリオド候補PCの高さは1/2 (UL−LL)よりも大きく
ない。
(2) 潜在的ピリオド候補PCは所定の量よりも少ない輻Wを存する。
(3) 潜在的ピリオド候補PCの平均の線数はI/2(UL+LL)よりも少
ない。
典型的には、3つまでのピリオド候補か上の測定に基づき識別されることか可能
である。動作はそれから[N12のステップll0Bに進む。
ステップl IOBの間、ステップll0Aにおいて決定された3つまでのピリ
オド候補は、たとえば前述の特許において開示されたような公知の統計学的分類
技術を使用して調査される。もし1以上のピリオド候補か受け入れ可能であると
わかったら、最も右の1つか「$」および「φ」フィールドを分離するものであ
るとして選ばれ、動作は図12のステップ1lOGに進む。
しかしなからもし1つのピリオドも識別されなければ、動作はステップll0C
に進み別の根拠で「$」および「φ」フィールドを分離しようとする。
ステップll0C(図12)
ステップ110Cの間、図5に示されるように、額面金額の「ψ」フィールドの
添字(subscript ing)は額面金額の「$」および 「φ」フィー
ルドの分離に関する根拠として調査される。この目的のために、抽出された額面
金額は再び左から右へと調査され、(たとえば図14における数字「5」のよう
な)上付きに書かれた文字SCの開始を検出する。
潜在的ピリオド候補のサーチを説明するステップ110Bと同様に、上部線UL
および下部線LL(図15)は(図15の数字「7」のように)候補の上付きに
書かれた文字SCのすぐ左の額面金額部分のために決定される。再び線は上から
下へと番号付けられる。候補の上付きに書かれた文字SCはもし以下の条件か満
たされると実際の上付きに書かれた文字と考えられる。
(1) 候補の上付きに書かれた額面金額文字の底の線番号は1/3 (2LL
+UL)より大きくない。
(2) 候補の上付きに書かれた文字SCの高さは少なくともl/3 (LL−
UL)である。
(3) 候補の上付きに書かれた文字SCは(図15の数字「7」のような)す
ぐ左の額面金額部分から少なくとも1白列だけ分離される。0列は黒ピクセルを
有さない列である。
(4) 候補の上付きに書かれた額面金額文字SCのすぐ右の額面金額部分SC
’ (図14の数字「0」)はSCの下部線番号プラスその高さの半分よりも大
きくない下部線番号を有する。
上記の条件を満たす第1の候補は、上付きに書かれた「φ」フィールドの開始で
あると考えられる。
動作はそれから図12のステップll0Dに進む。
ステップll0D(図12)
ステップll0Dはステップll0Cで実行された上付きに書かれた「ψ」フィ
ールドのサーチの結果を受け取る。
もし上付きに書かれた文字が見つけられたら、「$」および「φ」フィールドの
分離のための根拠が決定され、動作はステップll0Gに進む。
しかしながらもし上付きに書かれた「ψ」フィールドが見つけられなければ、動
作は図12のステップll0Eに進み、「$」および「φ」フィールドの分離の
ための別の根拠を見つける。
ステップll0E(図12)
ステップll0Eの間、図16および図17に示されるように、複合「φ」フィ
ールドの存在は「$」および「ψ」フィールドの分離のための根拠として調査さ
れる。図16は下線を存する2つの上付きに書かれた数字からなる複合「ψノフ
ィールドの第1(7)盟を示すということか見られるであろう。図17は「ψ」
金額か分数として与えられる複合「ψ」フィールドの第2の堅を示す。
複合「φ」フィールドか存在するかとうかを判断するために、抽出された額面金
額は、先に説明されたステップ110Aおよびll0Cのように右から左へと再
度調査される。複合「φ」フィールドのサーチに際し、以下のことか決定される
(図16および図17を参照)。
(1) 抽出された額面金額の最後に占められた列C1゜(2) 最後に占めら
れた列C1の左の第1の0列C2゜(3) 0列C2の右に位置する額面金額部
分によって占められる第1の線Ll。
図16および図17に示されるように、CI、C2およびLlの値はそれが複合
「φ」フィールドの適切な候補であるかどうかについてのテストのために抽出さ
れた額面金額の特定の部分の枠を決める。テストは種々の可能な「φ」フィール
ド型および、特に、図16および図17に示される複合「ψ」フィールド型を認
識するように特定的に設計される統計学的分類技術を使用して達成される。その
ような統計学的分類技術か実現される態様は上記の特許から明白であろう。
もし、図16および図17に示されるように複合「φ」フィールドか認識される
ならば、列C2は「$」および「φ」フィールドの間の分離列であると考えられ
る。C2は最後に占められた列CIの左の第1の0列であるということか念頭に
おかれるであろう。
ステップllOHにおける動作の結果はそれから図12のステップll0Fに送
られる。
ステップll0F(図12)
ステップll0Fはステップll0Eにおいて実行される複合「φ」フィールド
のサーチの結果を受け取る。もし複合「ψ」フィールドか発見されたら、列C2
は「$」および「φ」フィールドの分離の根拠として役に立ち、動作は図12の
ステップll0Gへ進む。
しかしながら、もし複合「ψ」フィールドが見つけられなければ、拒絶か発生す
る、なぜなら額面金額の「$」および「φ」フィールドを分離するための根拠が
見つけられずかつ分離のためのさらなる根拠かないからである。この点において
、分離を提供するためのさらなる根拠がまた与えられてもよいということが理解
されるへきである。
図12の上の説明から、ピリオドを見つけるか(ステップ110Aおよびll0
B)、上付きに書かれた「ψ」フィールドを見つけるか(ステップll0cおよ
び110D)、または複合「φ」フィールドを発見するか(ステップll0Eお
よびll0F)のいずれかに基づいて、額面金額の「φ」および「$」フィール
ドを分離するための根拠を発見した結果として動作はステップ110Gに進むと
いうことが理解されるであろう。
したかってステップll0Gは分離のために見つけられた特定の根拠(ピリオド
、上付きに書かれることまたは複合「φ」フィールド)を使用して「φ」フィー
ルドを分離する。
またステップll0Gの間、分離された「φ」フィールドは前述の特許において
開示されたような統計学的分類技術を使用して幾つかの型の1つとして類別され
る。説明されている好ましい実施例のためにステップll0Gによって与えられ
得る類別は2つの0.2桁の数字、下線付き2桁の数字および分数である。別の
類別も与えられ得る。
もし許容可能な類別かステップ110Gにおいて決定されるならば、動作は図1
2におけるステップ112に進み、さもなければ拒絶か発生する。
ステップ112(図面の簡単な説明
この発明に従ってステップ112を達成するための好ましい態様か次に考察され
るであろう。ステップ112の目的は「φ」フィールドのために決定された類別
に基づいて「φ)文字を抽出することであることが念頭におかれる。
説明されている好ましい実施例において与えられた種々の類別のためのステップ
112における動作は以下に説明この類別に関して、「ψJフィールドの値は0
であるということが即座に知られ、したがって動作はさらなる処理を伴わず図3
のステップ116に進む。典型的には、この類別は分離の根拠かピリオドまたは
上付きに書かれたrφ」フィールドの検出であるところでのみ使用される。
2桁の数字
この類別に関しては、[φノフィールドの数字は直接利用可能であり、ゆえに動
作はさらなる処理を伴わず認識のための図3におけるステップ114に進む。「
2つの0」類別と同じく、この類別は典型的には分離のための根拠がピリオドま
たは上付きに書かれた「φ」フィールドの検出であるところでのみ使用される。
下線を引かれた2桁の数字
この類別に関しては、「φ」フィールドが下線を引かれた「36」からなる図1
8および図19に例示されるように「φ」文字のみが残るように動作は下線を除
去することに向けられる。この目的を達成するための好ましい具体例は以下に説
明される。
まず下線の勾配か以下のように決定される。「φ」フィールドの各列に関して、
第1の黒ピクセルに対する白ピクセルの数か下部端縁からカウントされる。もし
2つの連続する列のこれらの個数の差か量に関して4より大きければ、不連続の
部分か存在する。「φ」フィールドにおける不連続のすへての部分および2つの
不連続の部分の間の最も大きい列範囲か決定される。この最も大きい列範囲にお
いて、下線かまた予期される。2つの画像の座標点(xi、yl)および(x2
.y2)は以下のように規定される。
xl=列範囲の開始列。
YI=列xlにおける下部端縁から第1の黒ビクセルまでの白ビクセルの数。
X2=列範囲の終わりの列。
y2=列x2における下部端縁から第1の黒ピクセルまでの白ビクセルの数。
下線の勾配SLは以下の方程式によって定められる。
SL= (y2−y 1)/ (x2−xi)発見された下線を削除するために
、勾配SLのn直線の集合および1の垂直間隔か形成される。直線の数nは下線
の勾配に依存し、以下のように確立される。
その他の時 n=32
さらに、開始点かこれらの直線の上に、これらの直線に沿って走査ステップ幅1
で右からおよび左からreJフィールドを走査するために確立される。
左からの走査の場合、
XI(i)==rφ」フィールドの第1の列(すべての直線に関して) yl
(i) =y 開始+1−1(i番目の直線に関しては)
この場合、y−開始は(xi yl)か第1の直線の走査点て発生するように確
立される。
右からの走査の場合、
xr(i)=rφjフィールドの最後の列(すへての直線に関して)
yr (i) =y 開始+1−1(i番目の直線に関して)
この場合、y−開始は(x 2. y 2)か第1の直線の走査点で発生するよ
うに確立される。
「φ」フィールドはこれらの直線に沿って走査され、その目的は可能な限りにお
いてその直線より下には完全な下線は生じるか役に立つ情報は生じないような直
線を決定するためである。この目的のために、走査点の個数は、「φ」フィール
ドの第1の黒ビクセルを備える走査点に関する限りは、右からおよび左からの走
査においてずへての走査直線に関してカウントされる。それから、右からの走査
コースにおけるおよび左からの走査コースにおけるカウントされた走査点の最大
個数を備えた直線か決定される。直線のこの範囲から、一番低いものか選択され
る。この最も低い直線以下の抽出された「φ」フィールドのすべての部分は削除
され、図19に示される結果を生み出す。上の手順は「ψ」文字か下線を遮断す
るような状況をも取り扱う。
下線の除去の後(図19)残った「φ」フィールド構成要素(図19のr36」
)は再び統計学的分類技術を使って確かめられ、2つの0または2桁の数字類別
のどちらに入るか決定される。もし類別か2桁の0ならば、動作はステップ11
6に進む、なぜなら「φ」フィールドの値はOであることか既知であるからであ
る。もし類別が2桁の数字ならば、動作は2桁の数字を認識するためにステップ
l14に進む。もしいずれの類別も発見されなければ、拒絶が発生する。
分数
この類別に関しては、動作は図20.21および22に示されるようにまず分母
を除去し、それから分数点を除去する、なぜなら「φ」フィールドは分子「80
」および分母r 100Jを有する分数からなるからである。この目的を達成す
るための好ましい具体例は以下に説明される。
第1に、フィールドは分数線か予期される列範囲まで調査される。これは、たと
えば、最も大きい幅を有する連結構成要素群CCを決定することによって達成さ
れてもよい。
一旦分数線か発見されると、その勾配は座fl’!xLyl、x2、y2を発見
することおよび下線を引かれた複合「φ」フィールドに関して先に説明されたの
と同じ態様で勾配を計算することによって決定される。
可能な限り分子および分数線のみか位置する、分割直線かここで確立される。こ
の分割直線は勾配および以下を備える座標rxl、yl十オフセット」で決定さ
れる。
その他の時 オフセット=lO
このように分割直線を確立して、この分割線の下の「φ」フィールド構成要素は
削除され、図19に示された分数の例に関しては、分母rloOJが削除される
結果となるであろう。このように、残りの「φJフィールド構成要素は、図21
に示される下線を引かれた「80」となるであろう。
したかって、図21に例示されるように、分数動作はここまでは下線を引かれた
2つの0または2桁の数字という結果になるはずであり、残りの「φ」フィール
ド構成要素は統計学的分類技術を使って確かめられ、これらの残りの構成部分が
実際この下線を引かれた2つのOまたは下線を引かれた2桁の数字に対応するか
どうかを決定する。もしそうならば、動作は、下線を引かれた複合「φ」フィー
ルド類別に関して上に先に説明されたように#!続し、FφJ文字を抽出しく図
22)、もしそうてなければ、拒絶か発生する。
この発明はここに特定の好ましい実施例について説明されてきたか、具体例、配
列および使用において多くの修正および変形かこの発明の範囲内で可能であると
いうことか理解されるへきである。たとえば分類類別の壓および個数のみならず
使用されるシードおよびマスク画像ならびにサーチエリアの個数および梨も変化
してもよい。さらに、シードおよびマスク画像は2値(2レベル)画像に限定さ
れる必要はない。額面金額抽出、「ψノフィールド分離および/または認識のた
めに役に立つ追加的な情報を提供するために、たとえば、マスク画像それ自体が
グレーレベル(多レベル)画像であってもよい。さらに処理ステップも追加的な
特徴を与えるために追加されてもよく、または説明されたステップも除去されま
たは再配列されてもよい。
加えて、この発明はここに説明されたちの以外に多種多様な適応に適合され得る
。したかって、以下の請求の範囲はそこに規定された範囲内でのすへての可能な
修正および変形を含むものであると考えられるべきである。
FI口、1 10
ワークヌテージコン19
スナ、アrooctB3Eρ1ら
ステー、7’102戸9
ストア(Obp゛ラ
FIG、+3
FIG、+7
FIG 18 FIG 19
FIG 20 FIG、21 FIG、22国際調査報告
国際調査報告
フロントページの続き
(81)指定国 EP(AT、BE、CH,DE。
DK、 ES、 FR,GB、 GR,IT、 LU、 NL、 SE)、 A
U、 CA、JP
(72)発明者 クレンネル、ノルベルトドイツ連邦共和国、デー・7752
ライヒエナラ、ステディガセ、18・アー
Claims (23)
- 1.文書上の財務金額の文字を認識するための電子的に実現される方法であって 、前記財務金額は整数部分と可能性のある複数の分数部分表示を有する小数部分 とを含み、前記財務金額に対応する画像表示をつくり出すステップと、 前記整数および小数部分に関して少なくとも1つの予め定められた複数の識別分 離特性を見つけるために前記画像表示を調査するステップと、 前記議別分離特性の1つを前記調査するステップ中に見つけることに基づいて前 記整数および小数部分を分離するステップと、 分離された小数部分を、前記可能性のある複数の分数部分表示のいずれが分離さ れた小数部分に対応するかに基づき、複数の類別のうちの1つに類別するステッ プと、前記類別するステップに基づいて分離された小数部分の文字を抽出するス テップとを含む、方法。
- 2.前記画像表示は格納されたディジタル表示である、請求項1に記載の方法。
- 3.前記ディジタル表示は2値表示である、請求項2に記載の方法。
- 4.もし前記予め定められた複数の識別分離特性が前記調査するステップの間に 見つからないとき、さらなる認識動作を拒絶するステップをさらに含む、請求項 1に記載の方法。
- 5.前記つくり出すステップは前記財務金額の一部ではない異質の画像部分を位 置決定するために前記画像表示を調査するステップと、前記異質の画像部分を前 記財務金額に関するそれらの位置に基づき取り除くステップとを含む、請求項1 に記載の方法。
- 6.前記予め定められた複数の識別分離特性は前記財務金額の前記整数および小 数部分間のピリオドの存在を含み、前記調査するステップは前記ピリオドの存在 をその大きさおよび位置に基づき決定する、請求項1に記載の方法。
- 7.前記予め定められた複数の識別分離特性は前記小数部分における上付きにさ れた文字の存在を含み、前記調査するステップは前記上付きにされた文字の存在 をその大きさおよび位置に基づき決定する、請求項1に記載の方法。
- 8.前記複数の識別分離特性は前記小数部分における複合文字配列の存在を含み 、前記調査するステップは前記複合文字配列の存在を統計的分類技術を使用して 決定する、請求項1に記載の方法。
- 9.前記複合文字配列は下線を付けられた文字を含む、請求項8に記載の方法。
- 10.前記複合文字配列は分数を含む、請求項8に記載の方法。
- 11.前記整数部分はドルに対応し、前記小数部分はセントに対応する、請求項 1に記載の方法。
- 12.前記複数の類別は2つの0を含む、請求項11に記載の方法。
- 13.前記複数の類別は2桁の数字を含む、請求項11に記載の方法。
- 14.前記複数の類別は下に下線を有する2つの隣接する数字からなる下線を付 けられた2桁の数字を含む、請求項11に記載の方法。
- 15.前記複数の類別は分子、分母およびそれらの間の分数線を含む分数を含む 、請求項11に記載の方法。
- 16.前記複数の類別は2桁の数字と、下線付きの2桁の数字と、分子、分母お よびそれらの間の分数線を含む分数とを含む、請求項11に記載の方法。
- 17.前記抽出するステップは前記下線の位置および勾配を決定するステップと 、下線を削除するステップを含む、請求項14または16に記載の方法。
- 18.前記抽出するステップは前記分数線の位置および勾配を決定するステップ と、前記分数繰下の分母および分数線を削除するステップとを含む、請求項15 または16に記載の方法。
- 19.文書上の予め定められた金額データを認識するための方法であって、 前記予め定められた金額データに対応する画像表示をつくり出すステップを含み 、前記画像表示は前記予め定められた金額データの一部ではない異質のデータを 含み、前記異質の画像部分を位置決定するために前記画像表示を調査するステッ プと、 前記異質の画像部分を前記予め定められた金額データに関するそれらの位置に基 づき取り除くステップとを含む、方法。
- 20.前記予め定められたデータは上部および下部境界線を有する隣接した文字 の群であり、前記取り除くステップは異質の画像部分がもし前記境界線の上およ び下から予め定められた量、間隔をあけられると削除するステップを含む、請求 項5または19に記載の方法。
- 21.前記境界線は前記文字の群を投影して前記文字を取り囲む領域をつくるこ とによって決定される、請求項20に記載の方法。
- 22.前記財務金額は行に配列され、前記異質の画像部分は前記行の辺に隣接し て配置される1つまたはそれより多い異質の副画像部分を含み、前記取り除くス テップは前記財務金額の最も近い部分と前記異質の副画像部分との間隔が前記副 画像部分の幅より大きい予め定められた量であるという条件に基づき異質の副画 像部分を削除するステップを含む、請求項5または19に記載の方法。
- 23.前記削除するステップは前記条件が継続して満たされているをり反復して 繰返される、請求項22に記載の方法。
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE4030798 | 1990-09-28 | ||
| DE4030798.0 | 1990-09-28 | ||
| US60041890A | 1990-10-19 | 1990-10-19 | |
| US600,418 | 1990-10-19 | ||
| PCT/US1991/007121 WO1992006447A2 (en) | 1990-09-28 | 1991-09-26 | Character recognition methods including separating and extractingparticular portions from extracted data |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06501803A true JPH06501803A (ja) | 1994-02-24 |
Family
ID=25897309
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3517931A Pending JPH06501803A (ja) | 1990-09-28 | 1991-09-26 | 抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法 |
Country Status (5)
| Country | Link |
|---|---|
| EP (1) | EP0551392A1 (ja) |
| JP (1) | JPH06501803A (ja) |
| AU (1) | AU8853291A (ja) |
| CA (1) | CA2091998A1 (ja) |
| WO (1) | WO1992006447A2 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5444793A (en) * | 1993-06-15 | 1995-08-22 | Ncr Corporation | Method for detecting machine printed monetary amounts in binary images |
| US5600732A (en) * | 1994-12-08 | 1997-02-04 | Banctec, Inc. | Document image analysis method |
| FR2801997A1 (fr) | 1999-12-02 | 2001-06-08 | Itesoft | Technologie adaptative d'analyse automatique de document |
| FR2825171B1 (fr) * | 2001-05-25 | 2004-02-13 | Itesoft Sa | Procede et dispositif de lecture de documents |
| US7653871B2 (en) | 2003-03-27 | 2010-01-26 | General Electric Company | Mathematical decomposition of table-structured electronic documents |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4685141A (en) * | 1983-12-19 | 1987-08-04 | Ncr Canada Ltd - Ncr Canada Ltee | Method and system for finding image data associated with the monetary amount on financial documents |
| WO1988002157A1 (en) * | 1986-09-19 | 1988-03-24 | Arthur Wheeler Holt | Character and pattern recognition machine and method |
-
1991
- 1991-09-26 CA CA002091998A patent/CA2091998A1/en not_active Abandoned
- 1991-09-26 WO PCT/US1991/007121 patent/WO1992006447A2/en not_active Ceased
- 1991-09-26 JP JP3517931A patent/JPH06501803A/ja active Pending
- 1991-09-26 AU AU88532/91A patent/AU8853291A/en not_active Abandoned
- 1991-09-26 EP EP91918519A patent/EP0551392A1/en not_active Withdrawn
Also Published As
| Publication number | Publication date |
|---|---|
| AU8853291A (en) | 1992-04-28 |
| EP0551392A1 (en) | 1993-07-21 |
| WO1992006447A2 (en) | 1992-04-16 |
| CA2091998A1 (en) | 1992-03-29 |
| WO1992006447A3 (en) | 1992-07-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6151423A (en) | Character recognition with document orientation determination | |
| CN100483442C (zh) | 带变体的多重表格的识别、分离和压缩 | |
| US8462394B2 (en) | Document type classification for scanned bitmaps | |
| CA1316606C (en) | Universal character segmentation scheme for multifont ocr images | |
| Aradhye | A generic method for determining up/down orientation of text in roman and non-roman scripts | |
| JPH0587871B2 (ja) | ||
| CN101452532B (zh) | 一种文本无关笔迹鉴别的方法和装置 | |
| EP0551403B1 (en) | Character recognition methods and apparatus for locating and extracting predetermined data from a document | |
| CN111461131B (zh) | 身份证号码信息识别方法、装置、设备及存储介质 | |
| US8200016B2 (en) | Method and apparatus for character string recognition | |
| Rajput et al. | Script identification from handwritten document images using lbp technique at block level | |
| US5721790A (en) | Methods and apparatus for separating integer and fractional portions of a financial amount | |
| JPH06501803A (ja) | 抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法 | |
| US20040024716A1 (en) | Mail sorting processes and systems | |
| Padma et al. | Script Identification from Trilingual Documents using Profile Based Features. | |
| Lam et al. | Differentiating between oriental and European scripts by statistical features | |
| Arlandis et al. | Identification of very similar filled-in forms with a reject option | |
| Adams et al. | Feature extraction methods for form recognition applications. | |
| Mahar et al. | Off-line signature verification of bank cheque having different background colors | |
| Lin et al. | Location of specific items in a document, without using character recognition techniques | |
| Worm et al. | Robust image based document comparison using attributed relational graphs | |
| i Computacio | Filled-in document image identification using landmarks | |
| Lim et al. | Structure analysis of low resolution fax cover pages | |
| Pages | Structure Analysis of Low Resolution | |
| JPH04373090A (ja) | 文字認識装置 |