JPH08504076A - テンプレート除去のため画像を位置合せするための方法および装置 - Google Patents

テンプレート除去のため画像を位置合せするための方法および装置

Info

Publication number
JPH08504076A
JPH08504076A JP7514168A JP51416895A JPH08504076A JP H08504076 A JPH08504076 A JP H08504076A JP 7514168 A JP7514168 A JP 7514168A JP 51416895 A JP51416895 A JP 51416895A JP H08504076 A JPH08504076 A JP H08504076A
Authority
JP
Japan
Prior art keywords
template image
image
line
written
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7514168A
Other languages
English (en)
Other versions
JP2918064B2 (ja
Inventor
ズロトニック,アヴァイド
Original Assignee
インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン filed Critical インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン
Publication of JPH08504076A publication Critical patent/JPH08504076A/ja
Application granted granted Critical
Publication of JP2918064B2 publication Critical patent/JP2918064B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 本発明は、テンプレート除去用の微細位置合せのための改良された方法および装置に関する。この方法には、書き込まれたテンプレート画像と基準テンプレート画像とを、所与の画素列数wの垂直バンドに分割するステップと、OCSアルゴリズムを使用して、本明細書で垂直入力バンドと称する書き込まれたフォームの垂直バンド内の線と基準テンプレート画像の対応するバンド内の線とを相関させるステップと、各線がそれぞれの新位置に移動されている新入力画像を構成するステップとが含まれる。この新画像は、たとえばテンプレート除去などの入力画像として使用される。

Description

【発明の詳細な説明】 テンプレート除去のため画像を位置合せするための方法および装置 [技術分野] 本発明は、画像の位置合せ、具体的には、テンプレートに書き込まれた情報を 、空のテンプレートの画像を除去することによって分離できるようにするために 、空のテンプレートの画像と書き込まれたテンプレートの画像とを位置合せする ための方法および装置に関する。本発明は特に、不変フォームに書き込まれた情 報を、画像のうちで情報内容に寄与しない部分とは別に処理しなければならない 分野に関する。 [背景技術] 紙文書の扱いは、現在のオフィス環境において日課となっている。フォームな どの文書の処理をより効率的にしようとする時には、コンピュータやデータ伝送 ネットワークなどの近代的なデータ処理手段を利用できるようにするため、文書 をディジタル化しなければならない。一旦そのようなシステムで文書を使用でき るようになったならば、文書を記憶装置にロードし、後に検索することができる 。記憶装置と文書の検索は、これに関する1態様に過ぎず、もう一方の、おそら くより重要な態様は、文書に含まれる情報の取り扱いである。 文書に含まれる情報の取り扱いには、通常は、読取り装置による情報の獲得、 獲得した情報の機械可読コードへの変換、後におそらくは繰り返されるであろう 処理のためのコード化された情報の記憶、情報の実際の処理および、処理の結果 の最終的な出力が含まれる。 光学スキャナなどの読取り装置による情報の獲得は、十分に高い解像度で行わ れる必要がある。さもないと、情報内容が不完全になったり、部分的に失われる はずである。読取り装置は通常、大量の走査データをもたらし、この大量のデー タが、高速で信頼性のある処理のために強力なコンピュータと、記憶のために大 きな記憶容量を必要とする。典型的な例として、A4サイズ(279×210m m)の1ページを100画素/cm(画素とは、画像要素を表し、白または黒の ドットである)で走査すると、約700Kバイトの記憶空間が必要になる。ごく あたりまえの分量の文書でも、法外な量の記憶域が必要になる可能性がある。 書き込まれたフォームの画像の大半は、情報内容に寄与しないので、空のフォ ームである標準部分または一定部分(CP)と、書き込まれたデータである可変 部分(VP)を分離するために、異なる方法が開発されてきた。この一定部分( CP)と可変部分(VP)の分離を、テンプレート除去と称するが、これには、 下記の長所がある。 ・記憶域の節約:フォーム画像の多くは、一定部分(CP)の単一のコピーに重 畳された可変部分(VP)から再構成で きる。通常、可変部分(VP)のサイズは、全画像のサイズのごく一部に過ぎず 、記憶域の90%を節約することが可能である。 ・通信の改良:上と同じ理由から、一定部分(CP)と可変部分(VP)を分離 すると、通信量がかなり節約され、したがって、フォーム処理システムに共通す るボトルネックの1つが除去される。 ・光学文字認識(OCR)の精度向上:情況によっては、フォームの一定部分( CP)が、自動文字認識と干渉する可能性がある。可変部分(VP)だけにアク セスできれば、この問題のかなりを除去できる。 一定部分(CP)すなわちフォーム自体の除去のための方法は、たとえば、D .E.Nielsen et al .,著、”Evaluation of Scanner Spectral Response for Insurance Industry Documents”,16/A44 NCI Program,Working Paper No.2 、1973年5月によって報告され、実施されてきた。この方法は、「ドロップ アウト・インク」技法とも称するが、フォームを印刷する時に、通常のスキャナ に透明な特殊なカラー・インクを使用するという発想に基づくものである。この タイプの完成されたフォームを走査する場合、基本的なパターン(すなわちCP )は、スキャナには見えなくなり、可変部分(VP)だけがコンピュータに入力 されるはずである。この手法の明らかな短所は、特殊なインク感度を有するスキ ャナを使用するので、既存のアーカイブにこの手法を適用できないこ とである。また、特殊インクを使用するのは、確かに面倒であり、コストも高い 。「ドロップアウト・インク」技法のもう1つの短所は、フォーム背景は除去し たいが、フォームの印刷方法や印刷に使用される色の種類に影響が及ぶことを望 まないカスタマが存在することである。 書き込まれた情報からフォーム背景を分離するためのもう1つの手法が、欧州 特許出願EP−A−0 411 231(米国特許第5182656号明細書) 、表題「Method for Compressing and Decompressing Forms by Means of very large Symbol Matching(超大記号マッチングによるフォームの圧縮伸長のため の方法)」に開示されている。この手法によれば、空のフォーム(CP)のサン プルを事前に走査し、得られたデータをディジタル化し、コンピュータ・メモリ に記憶してフォーム・ライブラリを作成する。次に、元の、圧縮しようとする書 き込まれたフォーム(F)を走査し、得られたデータをディジタル化し、空のフ ォーム(CP)の表現を検索してこれから減算する。この差が、可変部分(VP )すなわち書き込まれた情報のディジタル表現になる。 そのようなフォーム除去を実行するためには、入力フォーム画像(F)と空の テンプレート(CP)の画像を正確に位置合せすることが必要である。入力フォ ーム画像が、全体的にはテンプレートと位置合せされている、すなわち、オフセ ット、スキュー、スケールの差がない時であっても、通常は、局所的なゆがみが あり、テンプレート(すなわち一定部分C P)をドロップ・アウトする前にそのゆがみを直さなければならない。このよう な局所的なゆがみは、スキャナ動作に一貫性がないか、写真コピーのゆがみの結 果であることが多い。 最終的な位置決めを計算する、すなわち、画像の可変部分(VP)に関して一 定部分(CP)を位置合せする方法が、上で述べた欧州特許出願EP−A−0 411 231(米国特許第5182656号明細書)と、欧州特許出願EP− A−0 411 232(米国特許第5204756号明細書)、表題「Method for High-Quality Compression of Binary Text Images(2進テキスト画像の 高品質圧縮のための方法)」に記載されている。局所歪みが少なく、区分的線形 であると仮定して、入力(F)とテンプレート画像(CP)の両方を小さなブロ ックに分解し、ヒストグラム相関を使用して、対応するブロックの相対オフセッ トを見つける。別個の一貫性保存処理を使用して、異なるブロックに関して計算 されたオフセットの間に衝突が発生しないようにする。あるブロックのヒストグ ラムに十分な情報がない場合には、隣接ブロックのオフセットを使用して、その ブロックの変換を計算する。 実際には、上の技法は非常に良好に機能するが、下記のいくつかの特殊な事例 には、信頼性の向上が必要である。 ・1つのフォームのコピーを複数回繰り返すことでゆがみが累算され、既存技 法の制限要因に直面することになる。 ・スキャナによっては、テンプレートと入力の両方として同一のフォームを使 用しても、ドロップアウト後にきれいな 画像がもたらされない。 ・非常に密に書き込まれた区域のフォーム再構成でのアーチファクトが報告さ れており、このアーチファクトは、わずかな位置決め誤差に対して非常に敏感で ある。 ・テンプレート走査の品質が低い時に、深刻な位置決め誤差がいくつか報告さ れている。 テンプレート除去のための既知の技法は、非線形ゆがみを有する画像の取り扱 いに適していないことがわかっている。 [発明の開示] 本発明の目的は、既知のテンプレート除去技法の信頼性を高めるために、非線 形ゆがみを有する画像の取り扱いを改善することである。 本発明のもう1つの目的は、空の基準テンプレート画像(CP)に対する入力 画像(F)の微細位置合せを達成するために、局所ゆがみを克服することである 。 本発明のもう1つの目的は、微細位置合せ処理の堅牢さを高めた、テンプレー ト除去のための方法および装置を提供することである。 上記の目的は、最適対応サブシーケンス(OCS)・アルゴリズムを使用して 微細位置合せ処理の堅牢さを向上させるという点で達成された。本発明による方 法には、基準テンプレート画像内の線と書き込まれたテンプレート画像内の線の 1方向への射影の対応する対を見つけることによって、前記 線基準テンプレート画像内の前記線と書き込まれたテンプレート画像内の前記線 とを相関させるステップと、前記投影の方向に垂直な方向での対のそれぞれの線 の2つの射影の変位を決定し、前記射影の対の間で一致を達成するために書き込 まれたテンプレート画像の各線の画素を移動しなければならない行または列の数 を評価するステップと、最後のステップで決定されたとおりに、前記射影の方向 に垂直に、書き込まれたテンプレート画像の線の画素をシフトすることによって 、新入力画像(26)を生成するステップとが含まれる。 本発明のもう1つの好ましい実施例では、同一のステップを、上の処理の射影 の方向に関して90゜回転した方向で繰り返す。 もう1つの実施例では、上記の処理を実行する前に、書き込まれたテンプレー ト画像と基準テンプレート画像とをバンドに分割する。この方法には、曲がった 線に簡単に対処できるという長所がある。 [図面の簡単な説明] 第1図は、フォーム・ライブラリへの基準テンプレート画像の記憶と検索を示 し、本発明による水平微細位置合せを示す流れ図である。 第2図は、基準テンプレートの画像と入力テンプレートの画像を示す図である 。 第3図は、本発明によって垂直バンドに分割された、第2 図の基準テンプレート画像と入力テンプレート画像を示す図である。 第4図は、第2図の基準テンプレートと、本発明によって得られた新入力画像 を示す図である。 第5図は、本発明による垂直微細位置合せを示す図である。 第6図は、本発明による装置の概略ブロック図である。 [発明の好ましい実施例] 書き込まれたテンプレートの一定部分(CP)を除去することをテンプレート 除去技法と称するが、その前に、基準テンプレート画像(CP)と称する空のテ ンプレートの画像を、書き込まれたテンプレートの画像に対して正確に位置合せ しなければならない。特に局所ゆがみ、とりわけ非線形のゆがみが、この微細位 置合せの精度に悪影響を及ぼす。書き込まれたテンプレート(F)に関する一定 部分(CP)の位置合せが良ければ良いほど、テンプレート除去処理の結果も良 くなる。微細位置合せ処理全体の堅牢さを改善するために、最適対応サブシーケ ンス(OCS)・アルゴリズムと称するアルゴリズムが採用された。この最適対 応サブシーケンス・アルゴリズムは、無限アルファベット・ペナルティ最小化問 題(infinite alphabet penalty minimisation problem)であるステレオ・マッ チング(stereo matching)に関して既に説明されている。このOCSアルゴリ ズムによる部分文字列マッチングの問題は、論文”Optimal Correspondence of String Su bsequences”,Y.P.Wang他,IEEE Transaction on Pattern Analysis and Mac hine Intelligence,Vol.12,No.11,1990年11月、pp.1080-1087に記 載されている。 以下の節では、テンプレート除去のための微細位置合せに関する修正OCSア ルゴリズムすなわち、フォーム認識用最適サブシーケンス対応の使用を詳細に説 明する。下での問題の定式化は、関数f(i,j,a,b)が、シーケンス要素 aおよびbの他に引数として指標iおよびjをとる点で、通常とは多少異なるこ とに留意されたい。この表記によって、望ましくない一致を制御する際に多少の 柔軟性が得られる。 画素の2つのシーケンスすなわち、A={a0,a1,…,aN}およびB={ b0,b1,…,bM}があり、すべての数値引数に関してf(i,j,a,b) ≧0になる関数f(i,j,a,b)があるものとする。この関数f(i,j, a,b)を使用して、要素aと要素bの間の一致の質を評価する。 OCSは、和 が最大になるインデックス対P[2]の集合である。前記P[2]の集合には、 P={(j0,k0),(j1,k1),…,(jL,kL)} [2] という形でインデックス対が含まれ、 0≦j0<j1<…<jL≦N 0≦k0<k1<…<kL≦M であり、Lは、要素AおよびBのシーケンスの一致した要素の数である。上のス テップの最後に、最大の和[1]とインデックス対のシーケンスPが、出力とし て得られる。本明細書で使用されるOCSアルゴリズムは、下で詳細に説明する 。 ステップ1)ないし4)に従って、行列sを計算する。ただしs(N,M)は 、A={a0,a1,…,aN}およびB={b0,b1,…,bM}に関するOCS 問題のスコアである。 1) S(0,0)=f(a0,b0) 2) for i = 1 to N−1 s(i,0)=MAX{s(i−1,0),f(i,0,ai,b0)} 3) for j = 1 to M−1 s(0,j)=MAX{s(0,j−1),f(0,j,a0,bj)} 4) for i = 1 to N−1 for j = 1 to M−1 s(i,j)=MAX{s(i,j−1),s(i−1,j),s(i −1,j−1)+f(i,j,ai,bj)} ステップ5)ないし9)では、集合Pのインデックス対のシーケンスが、次式 によって計算される。 5) i=N−1, j=M−1 6) while i≧0 and j≧0 7) if i>0 and s(i−1,j)=s(i,j) i=i−1 else 8) if j>0 and s(i,j−1)=s(i,j) j=j−1 else 9) if s(i,j)>0 Pの先頭に(i,j)を挿入 i=i−1 j =j−1 s(N−1,M−1)が、修正OCSアルゴリズムの戻り値であり、Pは、要 求されたインデックスを有する。 本発明の数学的背景が、上で詳細に示された。以下の節では、本発明による方 法を実例に関して説明する。本発明のステップと、準備ステップ1ないし4を、 第1図および第5図の流れ図に示す。 第1図に、基準テンプレート(CP)を走査し(ステップ1)、本発明の微細 位置合せ処理のための基準入力として使用するか、フォーム・ライブラリに記憶 できることが概略的に示されている。このようなライブラリへの記憶とそこから の検索を、ステップ2、3および4に示す。 第2図を参照すると、所与の空の基準テンプレート画像20(CP)があり、 基準テンプレート画像20は、12行の画素と24列の画素からなる。説明を簡 単にするために、この図と後続の図では、基礎となる格子を図示し、黒画素のそ れぞれを、「×」として図示する。水平とは画像の行に平行 な方向を意味し、垂直とは画像の列に平行な方向を意味することに留意されたい 。 基準テンプレート画像20(CP)の左側には、1行あたりの黒画素の個数が 示されている。この数のシーケンスを、A={0,19,0,0,19,0,1 ,2,0,19,0,0}と表すことができる。基準テンプレート画像20は、 通常は記憶装置(フォーム・ライブラリまたは作業バッファ)に記憶され、そこ から簡単に検索できる(ステップ4)。基準テンプレート画像20を走査し記憶 するステップ1ないし4は、必ずしも第1図に示された他のステップを実行する 直前に実行しなくてよい。適切な基準テンプレートを有するデータベースすなわ ち、異なる空のフォーム(CP)を含むデータベースの作成と維持は、本明細書 では示さない。 本発明の第1ステップとして、処理されるテンプレート(通常は書き込まれた テンプレート)を、適当なスキャナによって走査し、このテンプレートの画像2 1(F)を得る。画像21を、以下では入力画像と称する。このステップは、第 1図ではステップ10として示されており、ディジタル化された入力画像21自 体は、第2図に示されている。このテンプレートの内容すなわち、通常は書き込 まれた情報は、本発明による微細位置合せの説明には関係がなく、基準テンプレ ート(CP)として既に使用されたものと同様の空のテンプレートを走査した。 2つの画像すなわち基準テンプレート画像20と入力画像21を比較すると、ス キャナによって導 入された不正確さのために2つの画像がわずかに異なることがわかる。入力画像 21は、11行24列の画素だけを有し、黒画素の一部が失われたり、位置が狂 っている。入力画像の1行あたりの黒画素の個数は、画素のシーケンスB={0 ,18,1,0,10,8,0,3,0,0,18}によって表される。入力画 像21の1行あたりの画素の数と比較した基準テンプレート画像20の1行あた りの画素数を、表1に示す。 入力画像21の一定部分(CP)を除去する前に、局所ゆがみを取り除き、入 力画像21を基準テンプレート画像20に関して正確に位置合せしなければなら ない。 本発明によれば、基準テンプレート画像20と入力画像21の両方を、ここで 垂直のバンド、すなわち、複数列の画素を含むバンドに分割する。このステップ は、第1図のステップ11によって表される。第3図に示されているように、基 準テンプレート画像20は、2つの垂直基準バンド22(CPA)および23( CPB)に分割される。入力画像21は、2つの垂直入力バンド24(FA)およ び25(FB)に分割 される。これら4つの垂直バンドの各行の黒画素の個数を、第3図に示す。 次に、入力画像21の垂直入力バンド24および25のそれぞれと、基準テン プレート画像20の垂直基準バンド22および23とのマッチングを、修正OC Sアルゴリズムを使用して実行する。このステップは、ステップ12に示されて いる。垂直入力バンド24および25内の線の水平射影を垂直基準バンド22お よび23内の線に相関させるために、OCSを使用する。これによって、垂直バ ンド内の前記線の垂直オフセットを決定する。 黒画素のシーケンス(この例ではAA、ABおよびBA、BB)は、垂直バンド内 の線の水平投影であり、f(i,j,a,b)は、これらの黒画素シーケンスの 要素間の一致の質を評価する関数である。表2に、垂直基準バンド22と垂直入 力バンド24のマッチングを示す。文字「―」は、存在しない項目を示す。これ によって、表3の対応する項目を削除することが暗示される。 マッチングされた要素の数は、L=10である。垂直バンドCPBおよびFBの 画素シーケンスABおよびBBのマッチングを、表3に示す。マッチングされた要 素の数は、やはりL =10である。 上のOCSアルゴリズムに従って、前記垂直入力バンドFAおよびFB内の線の 新しい垂直位置が定義される。次に、線 成する。この垂直シフトによる再構成は、第1図ではステッ それ以降の全てのステップ、すなわち、テンプレート除去(第1図のステップ1 4)に直接に、または、第5図の水平微細位置合せステップに、入力画像として 使用される。 本発明による微細位置合せは、この時点で終了して、前記 力画像として使用するか、第5図のステップ50ないし52を実行して、基準テ ンプレート画像20(CP)と新入力画 たとえば画素の行に平行か画素の列に平行など、1方向だけの微細位置合せは 、たとえば書き込まれたフォームを読み取るのにファクシミリを使用する場合、 主に垂直軸に沿ったゆがみが発生するので、このような場合には満足な結果をも たらす可能性がある。この種のゆがみは、モータが機械的に不完全であるために 発生する場合がある。 水平微細位置合せ(ステップ50ないし52)を、以下で説明する。マッチン グ処理の基本原理は、上の例によって既に説明済みであるから、ステップ50な いし52は完全に詳細には説明しない。 を、所与の「高さ」h(h=画素の行の数)を有する水平バンドに分割する。好 ましい例では、テンプレートの全長が24画素しかないので、たとえばh=12 画素/バンドを水平バンドの「高さ」として選択できる。前記新入力画像26 割するステップは、第5図の流れ図のステップ50に示されている。 次に、OSCアルゴリズムを使用して、水平入力バンド内の線と水平基準バン ド内の線とを相関させ、前記バンド内の垂直線の水平オフセットを決定する。Aa およびAbは、水平基準バンド内の線の垂直投影であり、BaおよびBbは、水平 入力バンド内の線の垂直投影である。このステップは、第5図のステップ51に 示されている。マッチング・ステップ12に関して説明したように、マッチング 関数f(i,j,a,b)によって、シーケンスAaとBbの間の一致ならびにAb とBbの間の一致の質を評価する。 最後に、第5図のステップ52に示されるように、水平入力バンド内の垂直線 をその最適位置に移動することによって、 上のアルゴリズムは、下記の最適化方法によって高速化できる。 1.第1のマッチング処理すなわち、垂直バンドによる水平線の位置合せか、第 2のマッチング処理すなわち、水平バンドによる垂直線の位置合せのいずれか一 方だけを実行する。 2.i<j+max_diffまたはj<i+max_diffになる場合にS を評価しない。ただし、max_diffは、応用例に依存する。 3.行i−1の最大値に関してs(i,j)が十分大きい場合には、行iの残り を評価しない。ただし、「十分大きい」は、応用例に依存する。 4.列j−1の最大値に関してs(i,j)が十分大きい場合には、列jの残り を評価しない。ただし、「十分大きい」は、応用例に依存する。 たとえばA4のページからなる文書を処理する時、各ページを「幅」w=25 0画素の垂直バンドに分割し、「高さ」h=250画素の水平バンドに分割する と、よい結果が得られた。本発明のOCSアルゴリズムに使用されるマッチング 関数f(x,y)は、修正可能であることに留意されたい。f(x,y)=|w −(x−y)|やf(x,y)=1+MIN(x,y)が、使用可能なマッチン グ関数の例である。 テンプレート除去のためのシステムの例を、第6図に概略的に示す。このシス テムには、スキャナ61、フォーム・ライブラリ62、作業バッファ63、およ び、プロセッサ64 の一部であるかこれによって制御される微細位置合せユニット65が含まれる。 これらの回路および要素の全てが、たとえばATバスとすることのできるバス6 6によって相互接続される。本発明によれば、前記フォーム・ライブラリ62に 記憶されているものであってもよい基準テンプレート画像が、プロセッサ64の 要求に基づいて前記微細位置合せユニット65に供給される。書き込まれたテン プレートを、スキャナ61によって走査し、その画像を作業バッファ63に転送 する。この作業バッファ63から、要求があった時に画像を検索できる。微細位 置合せユニット65は、プロセッサ、フォーム・ライブラリ62および作業バッ フア63との相互作用によって、本発明による諸ステップを実行する。最後に、 微 レート除去を行うことができる。 上の例のように黒画素と黒画素のシーケンスに対する微細位置合せ処理に基づ くのではなく、白画素と白画素のそれぞれのシーケンスを使用することも可能で ある。さらに、特定の情況の下では、画像の分割が不要になる、すなわち、本発 明に従って行または列の1つのバンドだけが処理されることに留意されたい。本 明細書では、画素の行が、紙の短い辺に平行であるか、その辺に垂直である。行 に対して垂直の画素の列に関しても、同じ事があてはまる。 本発明の技法は、従来のテンプレート除去技法よりはるか に堅牢である。この技法は、古い技法の失敗例を多数用いてテストされ、圧縮の 達成、視覚的品質および速度に関して優れていることが証明されている。

Claims (1)

  1. 【特許請求の範囲】 1.画素の行および列を含む基準テンプレート画像および書き込まれたテンプレ ート画像を位置合せする方法であって、 a)前記基準テンプレート画像内の線および前記書き込まれたテンプレート画 像内の線の1方向への射影の対応する対を見つけることによって、前記基準テン プレート画像内の前記線と前記書き込まれたテンプレート画像内の前記線とを相 関させるステップと、 b)前記射影の方向に垂直な方向での前記対のそれぞれの線の2つの射影の変 位を決定し、前記射影の対の間で一致を達成するために前記書き込まれたテンプ レート画像の各線の画素をシフトしなければならない行または列の数を評価する ステップと、 c)決定された変位を使用して、前記射影の方向に垂直に前記書き込まれたテ ンプレート画像の線の画素をシフトすることによって、新入力画像を生成するス テップと を含む方法。 2.さらに、 a)請求項1のステップa)で選択された射影の方向に垂直な方向の射影を用 いて、前記基準テンプレート画像内および前記新入力画像内の線の射影の対応す る対を見つけることによって、前記基準テンプレート画像内の前記線と前記新入 力画像内の前記線とを相関させるステップと、 b)請求項1のステップa)で選択された前記射影の方向に平行な方向での前 記対のそれぞれの線の2つの射影の変位を決定し、前記射影の対の間で一致を達 成するために前記新入力画像の各線の画素をシフトしなければならない行または 列の数を評価するステップと、 c)決定された変位を使用して、請求項1のステップa)で選択された前記射 影の方向に平行に、前記書き込まれたテンプレート画像の線の画素をシフトする ことによって、新入 を含む、請求項1に記載の方法。 3.請求項1のステップa)ないしc)を実行する前に、前記基準テンプレート 画像が、複数の画素列を有する基準バンドに分割され、前記書き込まれたテンプ レート画像が、複数の画素列を有する対応する入力バンドに分割され、請求項1 のステップa)ないしc)が、基準バンドとそれに対応する入力バンドのそれぞ れについて別々に実行されることを特徴とする、請求項1に記載の方法。 4.請求項2のステップa)ないしc)を実行する前に、前記基準テンプレート 画像が、複数の画素行を有する基準バンドに分割され、前記書き込まれたテンプ レート画像が、複数の画素行を有する対応する入力バンドに分割され、請求項2 のステップa)ないしc)が、基準バンドとそれに対応する入力バンドのそれぞ れについて別々に実行されることを特徴とする、請求項2に記載の方法。 5.前記行に平行な方向の線の射影が、それぞれの画像またはバンドの各行の黒 画素の数を合計することによって決定され、前記列に平行な方向の線の射影が、 それぞれの画像またはバンドの各列の黒画素の数を合計することによって決定さ れることを特徴とする、請求項1、請求項2、請求項3または請求項4に記載の 方法。 6.前記一致が、最適対応シーケンス・アルゴリズムを使用して決定されること を特徴とする、前の請求項のいずれかに記載の方法。 7.前記一致の質を評価するために f(a,b)=1+MIN(a,b) または f(a,b)=|w−(a−b)|およびf(a,b)=|h−(a−b)| というマッチング関数のうちのいずれか一方が使用されることを特徴とする、 請求項6に記載の方法。 8.前記新入力画像および前記基準テンプレートが、前記書き込まれたテンプレ ートの内容から前記基準テンプレートの線を分離するためのテンプレート除去の 入力として使用されることを特徴とする、請求項1、請求項2、請求項3または 請求項4に記載の方法。 9.プロセッサと、基準テンプレート画像および入力された書き込まれたテンプ レート画像を記憶するための記憶装置とを含む、前記基準テンプレート画像と前 記入力テンプレート 画像とを位置合せするための装置であって、 前記基準テンプレート画像内の線および前記書き込まれたテンプレート画像内 の線の1方向への射影の対応する対を見つけることによって、前記基準テンプレ ート画像内の前記線と前記書き込まれたテンプレート画像内の前記線とを相関さ せる手段と、 前記射影の方向に垂直な方向での前記対のそれぞれの線の2つの射影の変位を 決定し、前記射影の対の間で一致を達成するために前記書き込まれたテンプレー ト画像の各線の画素をシフトしなければならない行または列の数を評価する手段 と、 変位を決定する手段によって決定された通りに、前記射影の方向に垂直に、前 記書き込まれたテンプレート画像の線の画素をシフトすることによって、新入力 画像を生成する手段と を含む微細位置合せユニットをさらに含むことを特徴とする装置。 10.さらに、 請求項9の相関手段によって選択された射影の方向に垂直な方向の射影を用い て、前記基準テンプレート画像内および前記新入力画像内の線の射影の対応する 対を見つけることによって、前記基準テンプレート画像内の前記線と前記新入力 画像内の前記線とを相関させる手段と、 請求項9の相関手段によって選択された前記射影の方向に 平行な方向での前記対のそれぞれの線の2つの射影の変位を決定し、前記射影の 対の間で一致を達成するために前記新入力画像の各線の画素をシフトしなければ ならない行または列の数を評価する手段と、 決定された変位を使用して、請求項9の相関手段によって選択された前記射影 の方向に平行に、前記書き込まれたテンプレート画像の線の画素をシフトするこ とによって、新入力 を含む、請求項9に記載の装置。 11.前記基準テンプレート画像を複数の画素列を有する基準バンドに分割し、 前記書き込まれたテンプレート画像を複数の画素列を有する対応する入力バンド に分割する手段を含む、請求項9に記載の装置。 12.前記基準テンプレート画像を複数の画素行を有する基準バンドに分割し、 前記書き込まれたテンプレート画像を複数の画素行を有する対応する入力バンド に分割する手段を含む、請求項10に記載の装置。 13.さらに、テンプレート除去のための手段を含む、請求項9、請求項10、 請求項11または請求項12に記載の装置。
JP7514168A 1993-11-16 1993-11-16 テンプレート除去のため画像を位置合せするための方法および装置 Expired - Lifetime JP2918064B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP1993/003211 WO1995014348A1 (en) 1993-11-16 1993-11-16 Method and apparatus for alignment of images for template elimination

Publications (2)

Publication Number Publication Date
JPH08504076A true JPH08504076A (ja) 1996-04-30
JP2918064B2 JP2918064B2 (ja) 1999-07-12

Family

ID=8165792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7514168A Expired - Lifetime JP2918064B2 (ja) 1993-11-16 1993-11-16 テンプレート除去のため画像を位置合せするための方法および装置

Country Status (4)

Country Link
US (1) US5793887A (ja)
EP (1) EP0679313A1 (ja)
JP (1) JP2918064B2 (ja)
WO (1) WO1995014348A1 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4002655B2 (ja) * 1998-01-06 2007-11-07 株式会社日立製作所 パターン検査方法およびその装置
US6295083B1 (en) * 1998-02-27 2001-09-25 Tektronix, Inc. High precision image alignment detection
US6507662B1 (en) 1998-09-11 2003-01-14 Quid Technologies Llc Method and system for biometric recognition based on electric and/or magnetic properties
US6385342B1 (en) * 1998-11-13 2002-05-07 Xerox Corporation Blocking signature detection for identification of JPEG images
US6507671B1 (en) 1998-12-11 2003-01-14 International Business Machines Corporation Method and system for dropping template from a filled in image
US6499041B1 (en) 1998-12-29 2002-12-24 International Business Machines Corporation Methods, systems and computer program products for copying between templates having associated field designations
US6728426B1 (en) 1999-08-23 2004-04-27 International Business Machines Corporation Compression of form images in gray-level
US6351566B1 (en) 2000-03-02 2002-02-26 International Business Machines Method for image binarization
US6658166B1 (en) * 2000-03-08 2003-12-02 International Business Machines Corporation Correction of distortions in form processing
US6741738B2 (en) 2000-03-13 2004-05-25 Tms, Inc. Method of optical mark recognition
US6778703B1 (en) 2000-04-19 2004-08-17 International Business Machines Corporation Form recognition using reference areas
JP3927353B2 (ja) * 2000-06-15 2007-06-06 株式会社日立製作所 比較検査における画像の位置合せ方法、比較検査方法及び比較検査装置
US7917844B1 (en) 2000-07-14 2011-03-29 International Business Machines Corporation Directory service for form processing
US6760490B1 (en) 2000-09-28 2004-07-06 International Business Machines Corporation Efficient checking of key-in data entry
US6640009B2 (en) 2001-02-06 2003-10-28 International Business Machines Corporation Identification, separation and compression of multiple forms with mutants
JP4112968B2 (ja) 2002-12-26 2008-07-02 富士通株式会社 ビデオテキスト処理装置
RU2003108434A (ru) * 2003-03-28 2004-09-27 "Аби Софтвер Лтд." (CY) Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата
US20110188759A1 (en) * 2003-06-26 2011-08-04 Irina Filimonova Method and System of Pre-Analysis and Automated Classification of Documents
US9224040B2 (en) 2003-03-28 2015-12-29 Abbyy Development Llc Method for object recognition and describing structure of graphical objects
RU2003108433A (ru) * 2003-03-28 2004-09-27 Аби Софтвер Лтд. (Cy) Способ предварительной обработки изображения машиночитаемой формы
US9015573B2 (en) 2003-03-28 2015-04-21 Abbyy Development Llc Object recognition and describing structure of graphical objects
US7305612B2 (en) * 2003-03-31 2007-12-04 Siemens Corporate Research, Inc. Systems and methods for automatic form segmentation for raster-based passive electronic documents
RU2635259C1 (ru) 2016-06-22 2017-11-09 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения типа цифрового документа
JP2009520246A (ja) * 2005-10-25 2009-05-21 キャラクテル リミテッド カスタマゼーションによらない書式データ抽出
US8233714B2 (en) 2006-08-01 2012-07-31 Abbyy Software Ltd. Method and system for creating flexible structure descriptions
US9740692B2 (en) 2006-08-01 2017-08-22 Abbyy Development Llc Creating flexible structure descriptions of documents with repetitive non-regular structures
US8108764B2 (en) * 2007-10-03 2012-01-31 Esker, Inc. Document recognition using static and variable strings to create a document signature
JP6433983B2 (ja) * 2013-04-24 2018-12-05 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 可視化コンピューティングシステム及び可視化方法
US9542137B2 (en) 2014-01-14 2017-01-10 Xerox Corporation Image shift template
US10395133B1 (en) * 2015-05-08 2019-08-27 Open Text Corporation Image box filtering for optical character recognition

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4926489A (en) * 1983-03-11 1990-05-15 Kla Instruments Corporation Reticle inspection system
JP2531605B2 (ja) * 1984-02-24 1996-09-04 株式会社東芝 画像の位置合せ装置
GB2203317B (en) * 1987-04-02 1991-04-03 Ibm Display system
JPH02287684A (ja) * 1989-04-28 1990-11-27 Ibm Japan Ltd イメージ処理装置および方法
IL91220A (en) * 1989-08-04 1995-03-30 Ibm Israel Compression of information
IL91221A (en) * 1989-08-04 1995-03-30 Ibm Israel Binary text compression method
US5542007A (en) * 1993-10-27 1996-07-30 International Business Machines Corporation Form dropout compression method which handles form white-out and writing in shaded and white-out areas of the form

Also Published As

Publication number Publication date
JP2918064B2 (ja) 1999-07-12
EP0679313A1 (en) 1995-11-02
WO1995014348A1 (en) 1995-05-26
US5793887A (en) 1998-08-11

Similar Documents

Publication Publication Date Title
JP2918064B2 (ja) テンプレート除去のため画像を位置合せするための方法および装置
US5182656A (en) Method for compressing and decompressing forms by means of very large symbol matching
EP0658042B1 (en) Dropped-form document image compression
US6334001B2 (en) Iterative smoothing technique for pre-processing mixed raster content planes to improve the quality of a decompressed image and increase document compression ratios
KR0159831B1 (ko) 디지탈 화상의 결함위치 자동식별방법
US6272255B2 (en) Method and apparatus for pre-processing mixed raster content planes to improve the quality of a decompressed image and increase document compression ratios
US5715070A (en) Freely configurable image processing apparatus
JPH04225485A (ja) バーコードを認識する方法
US7133559B2 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
JP3977468B2 (ja) シンボル分類装置
US7986839B2 (en) Image processing method, image processing apparatus, image forming apparatus, and storage medium
KR20010015046A (ko) 구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자자동 인식 방법
JPH0879536A (ja) 画像処理方法
US6507671B1 (en) Method and system for dropping template from a filled in image
US7447363B2 (en) Image processing system with parallel input and restart marker
JPH06149898A (ja) 画像記憶検索装置
JP5517028B2 (ja) 画像処理装置
US6678427B1 (en) Document identification registration system
JP2007129557A (ja) 画像処理システム
JP2908495B2 (ja) 文字画像抽出装置
JP2003198856A (ja) 画像圧縮方法、その復元方法及びそのプログラム
JP2643092B2 (ja) 文書書式上の事前定義されたフィールドの外側に位置する標準外データを処理する方法およびシステム
EP0896295A2 (en) Character recognition method and system
JPS6252337B2 (ja)
JP2000295480A (ja) 画像処理装置及び画像形成装置