JPH1027208A - Form collation method and apparatus - Google Patents

Form collation method and apparatus

Info

Publication number
JPH1027208A
JPH1027208A JP8180959A JP18095996A JPH1027208A JP H1027208 A JPH1027208 A JP H1027208A JP 8180959 A JP8180959 A JP 8180959A JP 18095996 A JP18095996 A JP 18095996A JP H1027208 A JPH1027208 A JP H1027208A
Authority
JP
Japan
Prior art keywords
field
collation
format information
collated
field area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8180959A
Other languages
Japanese (ja)
Inventor
Yuji Yonekura
雄司 米倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Group Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP8180959A priority Critical patent/JPH1027208A/en
Publication of JPH1027208A publication Critical patent/JPH1027208A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 汎用の帳票を効率的に認識する帳票照合装置
を提供する。 【解決手段】 入力画像から被照合帳票の罫線を抽出
し、罫線外周に沿った基準線を基準線特定部12で特定
する。フィールド抽出部13は、抽出された罫線と基準
線から文字記入のためのフィールド位置を表すフォーマ
ット情報を生成する。フォーマット情報修正部16は、
被照合帳票のフォーマット情報に合致するように予め登
録された照合用帳票のフォーマット情報を修正する。帳
票選択部17は、修正されたフォーマット情報が被照合
帳票のフォーマット情報と一定範囲で対応する照合用帳
票を選択し、これを照合結果として出力する。
(57) [Summary] [PROBLEMS] To provide a form collating apparatus for efficiently recognizing general-purpose forms. A ruled line of a form to be verified is extracted from an input image, and a reference line along the outer periphery of the ruled line is specified by a reference line specifying unit. The field extraction unit 13 generates format information indicating a field position for character entry from the extracted ruled line and reference line. The format information correction unit 16
The format information of the collation form registered in advance is corrected so as to match the format information of the collated form. The form selecting unit 17 selects a collation form in which the corrected format information corresponds within a certain range to the format information of the form to be collated, and outputs this as a collation result.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字等を入力する
ためのフィールドが形成された帳票入力画像に含まれる
被照合帳票と予め登録されている複数の照合用帳票のフ
ォーマット情報を照合して、被照合帳票のフォーマット
により合致する照合用帳票を選択する手法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention compares a format of a plurality of collation forms registered in advance with a collated form included in a form input image in which fields for inputting characters and the like are formed. And a method for selecting a collation form that matches the format of the collated form.

【0002】[0002]

【従来の技術】帳票に記載された文字の自動認識を行う
場合、画像として取り込んだ帳票の種類を予め登録され
た複数の照合用帳票との照合により特定するとともに、
その帳票画像における文字等を記入するためのフィール
ド、例えば文字記入フィールドを抽出し、抽出した文字
記入フィールド内の文字を切り出して文字認識処理を施
すのが通常である。この場合、帳票画像からの文字記入
フィールドの抽出は、その帳票のフォーマット情報と照
合用帳票のフォーマット情報との照合によって行われる
が、帳票画像の入力時に生じる位置ずれや帳票サイズの
異同がフォーマット情報の照合の際に問題となる。そこ
で、従来は、文字記入フィールドの位置を決めるための
基準マークを印刷した専用の帳票を使用し、文字記入フ
ィールドの位置を基準マークからの相対位置で定義する
ことによって上記問題を解決していた。また、予め帳票
の所定部位に定型の帳票を識別するための帳票IDを印
刷し、この帳票IDを光学センサ等で認識することで帳
票の種類を特定していた。
2. Description of the Related Art When performing automatic recognition of characters written on a form, the type of a form captured as an image is specified by collating with a plurality of collation forms registered in advance.
Normally, a field for entering a character or the like in the form image, for example, a character entry field is extracted, and characters in the extracted character entry field are cut out and subjected to character recognition processing. In this case, the extraction of the character entry field from the form image is performed by comparing the format information of the form and the format information of the collation form. This is a problem when collating. Therefore, conventionally, the above problem has been solved by using a special form printed with a reference mark for determining the position of the character entry field, and defining the position of the character entry field as a relative position from the reference mark. . In addition, a form ID for identifying a fixed form is printed in advance on a predetermined portion of the form, and the form ID is identified by recognizing the form ID with an optical sensor or the like.

【0003】[0003]

【発明が解決しようとする課題】上述のように、従来
は、帳票画像の入力時に生じる位置ずれや帳票サイズの
異同の問題を解消する上で、基準マークや帳票IDの存
在が不可欠であった。そのため、文字認識を伴う帳票の
照合に際しては、基準マークや帳票IDが印刷された専
用の帳票を用いなければならず、オフィスで使用される
汎用の帳票を使用することができなかった。また、同一
帳票を含む画像であっても、入力の際の解像度が異なる
場合は認識結果が異なるという問題があった。例えば低
解像度で入力した際に、罫線の一部が認識されない場合
や、逆に、ゴミ等の存在によって、実際には存在しない
罫線が誤って認識されてしまう場合があった。
As described above, conventionally, the presence of the reference mark and the form ID is indispensable for solving the problem of the positional deviation and the difference in the form size that occur when the form image is input. . Therefore, when collating a form with character recognition, a special form on which a fiducial mark and a form ID are printed must be used, and a general-purpose form used in an office cannot be used. In addition, even if the images include the same form, if the resolution at the time of input is different, the recognition result is different. For example, when inputting at low resolution, some ruled lines may not be recognized, or conversely, rule lines that do not actually exist may be erroneously recognized due to the presence of dust or the like.

【0004】そこで本発明の課題は、基準マークや帳票
IDが存在しない汎用の帳票であっても、また、帳票画
像の入力時の解像度が異なる場合であっても、同一の帳
票に対しては常に同一の照合結果を得るようにする、改
良された照合手法を提供することにある。本発明の他の
課題は、入力画像に含まれる帳票に対し、予め登録され
た照合用帳票の中から最適なものを的確に選択し得る帳
票照合装置を提供することにある。
[0004] Therefore, an object of the present invention is to provide a general-purpose form having no reference mark or form ID, or a case where the resolution at the time of inputting a form image is different. An object of the present invention is to provide an improved matching method that always obtains the same matching result. Another object of the present invention is to provide a form collating apparatus capable of accurately selecting an optimal form from pre-registered forms for a form contained in an input image.

【0005】[0005]

【課題を解決するための手段】上記課題を解決する本発
明の帳票照合方法は、入力画像に含まれる被照合帳票か
ら文字等を記入するためのフィールドが形成されている
フィールド領域を特定するステップと、予め保持されて
いる複数の照合用帳票のそれぞれのフィールド領域と前
記特定された被照合帳票のフィールド領域のサイズを合
致させるステップと、フィールド領域のサイズが合致し
た各照合用帳票と被照合帳票の個々のフィールド間の対
応関係の有無、フィールド領域のサイズが合致した被照
合帳票のフィールドと各照合用帳票のフィールド領域内
で互いに隣接する複数フィールドからなる統合フィール
ドとの対応関係の有無、あるいはフィールド領域のサイ
ズが合致した各照合用帳票のフィールドと被照合帳票の
フィールド領域内で互いに隣接する複数のフィールドか
らなる統合フィールドとの対応関係の有無、を判定し、
一定範囲で対応する照合用帳票を選択するステップと、
をコンピュータ装置上で実行することを特徴とする。
According to the present invention, there is provided a form collating method for identifying a field area in which a field for writing a character or the like is formed from a collated form included in an input image. Matching each field area of the plurality of collation forms held in advance with the size of the field area of the identified collated form; and comparing each collated form with the matched field area size with the collated form. Whether there is a correspondence between individual fields of the form, whether there is a correspondence between the field of the collated form whose field area size matches and the integrated field consisting of a plurality of fields which are adjacent to each other in the field area of each collation form, Or, in the field area of each collated form and the collated form field where the size of the field area matches Whether correspondence between the integrated field comprising a plurality of fields which are adjacent to each other, determines,
Selecting a corresponding form for verification within a certain range;
Is executed on a computer device.

【0006】この場合、照合用帳票及び被照合帳票にお
けるフィールド同士、またはフィールドと統合フィール
ドとの対応の有無は、例えば、前記フィールド領域の基
準位置からの相対値で表される個々のフィールドないし
統合フィールドの形成位置が互いに一致するか否かによ
り判定する。
In this case, the presence or absence of the correspondence between the fields in the collation form and the collation form or between the field and the integrated field is determined by, for example, individual fields or integrated values represented by relative values from the reference position of the field area. The determination is made based on whether or not the field formation positions match each other.

【0007】また、上記他の課題を解決する本発明の帳
票照合装置は、文字等を記入するためのフィールドが形
成されているフィールド領域の基準位置とこの基準位置
からの相対値で表される個々のフィールドの形成位置と
で表されるフォーマット情報を照合用帳票毎に格納した
フォーマット情報格納手段;入力画像に含まれる被照合
帳票からフィールド領域を特定するとともに個々のフィ
ールドの形成位置をフィールド領域の基準位置からの相
対位置として表すフォーマット情報を生成するフォーマ
ット情報生成手段;各照合用帳票の各々のフィールド領
域と前記被照合帳票のフィールド領域とを比較して両領
域のサイズを合致させるための変形量を算出するフォー
マット情報比較手段;各照合用帳票についての個々のフ
ォーマット情報を前記算出された変形量により修正して
修正フォーマット情報を生成するフォーマット情報修正
手段;及び、この修正フォーマット情報が前記被照合帳
票について生成されたフォーマット情報と一定範囲で合
致する照合用帳票を選択する照合手段;を備えることを
特徴とする。
According to another aspect of the present invention, there is provided a form collating apparatus for solving the above-mentioned problems, which is represented by a reference position of a field area in which a field for writing characters and the like is formed and a relative value from the reference position. Format information storage means for storing format information represented by the formation positions of individual fields for each collation form; a field area is specified from a collated form included in the input image, and the formation position of each field is determined by the field area Format information generating means for generating format information expressed as a relative position from the reference position of the above; for comparing each field area of each collation form with the field area of the collated form to match the sizes of both areas Format information comparing means for calculating the amount of deformation; individual format information for each collation form Format information correction means for correcting the calculated amount of deformation to generate corrected format information; and selecting a collation form in which the corrected format information matches within a certain range with the format information generated for the collated form. Collation means;

【0008】照合手段は、照合用帳票の修正フォーマッ
ト情報と被照合帳票について生成されたフォーマット情
報とを個々のフィールド毎に照合し、一致しないフィー
ルドが存在する場合は、さらに、被照合帳票の一のフィ
ールドと各照合用帳票のフィールド領域内で互いに隣接
する複数フィールド毎、または、各照合用帳票の一のフ
ィールドと被照合帳票のフィールド領域内で互いに隣接
する複数のフィールド毎に照合するように構成する。
The collation means collates the corrected format information of the collation form with the format information generated for the collated form for each individual field. Field and a plurality of fields that are adjacent to each other in the field area of each collation form, or one field of each collation form and a plurality of fields that are mutually adjacent in the field area of the collated form. Configure.

【0009】本発明は、また、上記帳票照合装置をコン
ピュータ装置上で実現する際に用いられる命令記憶媒体
をも提供する。この命令記憶媒体は、コンピュータ装置
によって読み取られ、該コンピュータ装置によって実行
される命令群を実体化して、帳票照合に対する処理ステ
ップをコンピュータ装置上で実現する命令記憶媒体であ
って、前記処理ステップが以下のステップを含んでいる
ものである。 (1)入力画像に含まれる被照合帳票から文字等を記入
するためのフィールドが形成されているフィールド領域
を特定するステップ、(2)予め保持されている複数の
照合用帳票のそれぞれのフィールド領域と前記特定され
た被照合帳票のフィールド領域のサイズを合致させるス
テップ、(3)フィールド領域のサイズが合致した各照
合用帳票と被照合帳票の個々のフィールド間の対応関係
の有無、被照合帳票のフィールドと各照合用帳票のフィ
ールド領域内で互いに隣接する複数フィールドからなる
統合フィールドとの対応関係の有無、または各照合用帳
票のフィールドと被照合帳票のフィールド領域内で互い
に隣接する複数のフィールドからなる統合フィールドと
の対応関係の有無のいずれかを判定し、一定範囲で対応
する照合用帳票を選択するステップ。
The present invention also provides an instruction storage medium used when implementing the form collating apparatus on a computer device. The instruction storage medium is an instruction storage medium that is read by a computer device and that realizes a group of instructions to be executed by the computer device to realize a processing step for form collation on the computer device. Steps are included. (1) identifying a field area in which a field for writing a character or the like is formed from a collated form included in the input image; and (2) a field area of each of a plurality of collation forms stored in advance. (3) the presence or absence of a correspondence relationship between each matching form and the individual field of the collated form where the size of the field area is matched, and the collated form. Field and the integrated field consisting of multiple fields that are adjacent to each other in the field area of each collation form, or multiple fields that are adjacent to each other in the field area of each collation form and the field area of the collated form Judge whether there is a corresponding relationship with the integrated field consisting of -Option steps.

【0010】[0010]

【発明の実施の形態】以下、フィールド領域が罫線によ
って囲まれた被照合帳票を入力するとともに複数の照合
用帳票から被照合帳票の特徴に合致するものを選択する
帳票照合装置を例に挙げて、本発明の実施の形態を詳細
に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a form collating apparatus for inputting a form to be verified whose field area is surrounded by ruled lines and selecting a form matching a characteristic of the form to be verified from a plurality of forms for verification will be described as an example. An embodiment of the present invention will be described in detail.

【0011】図1は、この実施形態による帳票照合装置
のブロック構成図である。この帳票照合装置1は、帳票
入力部10、罫線抽出部11、基準線特定部12、フィ
ールド抽出部13、フォーマット情報格納部14、フォ
ーマット情報比較部15、フォーマット情報修正部1
6、帳票選択部17、及び、照合結果出力部18から構
成される。
FIG. 1 is a block diagram of a form collating apparatus according to this embodiment. The form collating apparatus 1 includes a form input unit 10, a ruled line extracting unit 11, a reference line specifying unit 12, a field extracting unit 13, a format information storing unit 14, a format information comparing unit 15, a format information correcting unit 1,
6, a form selection unit 17 and a collation result output unit 18.

【0012】各処理部は、通常、図示しない命令記憶手
段に記憶された命令群(プログラムと必要なデータ)に
従って、コンピュータ装置のマイクロプロセッサユニッ
トが所要の処理を実行することにより形成される。但
し、上述の命令群は、必ずしもコンピュータ装置と一体
不可分である必要はなく、該コンピュータ装置から分離
した存在であっても良い。この場合は、コンピュータ装
置が読取可能且つコンピュータ装置によって実行可能な
形態で、フレキシブルディスクやCD−ROM(コンパ
クトディスク型ROM)上に物理的に実体化させる必要
がある。また、始点と終点とが明確な態様で把握できる
場合は、上記命令群を通信媒体上で実体化させたもので
あっても良い。
Each processing unit is usually formed by a microprocessor unit of a computer device executing required processing in accordance with an instruction group (program and necessary data) stored in instruction storage means (not shown). However, the above-mentioned instruction group does not necessarily have to be integral with the computer device, and may be separate from the computer device. In this case, it is necessary to make the computer apparatus physically embodied on a flexible disk or a CD-ROM (compact disk type ROM) in a form readable and executable by the computer apparatus. If the start point and the end point can be grasped in a clear manner, the command group may be embodied on a communication medium.

【0013】まず、帳票照合装置1の各処理部の機能を
概説する。帳票入力部10は、例えば汎用のスキャナか
ら取り込んだ画像を罫線抽出部11に渡す。この画像は
被照合帳票が形成されたものである。罫線抽出部11
は、取り込んだ画像から水平方向及び垂直方向の罫線を
抽出するものであり、基準線特定部12は、罫線抽出部
11により抽出された罫線から基準線を特定するもので
ある。基準線については後述する。フィールド抽出部1
3は、抽出された罫線に囲まれたフィールド、例えば文
字記入フィールドを抽出し、その位置やサイズを基準線
からの相対座標の形で帳票選択部17に渡す。フォーマ
ット情報格納部14は、予め登録した照合用帳票につい
てのフォーマット情報を格納したものである。フォーマ
ット情報は帳票の特徴を表す情報であり、本実施形態で
は、帳票の基準座標と帳票内の個々のフィールドの相対
座標をフォーマット情報とする。ここに基準座標とは、
基準線の特定位置の座標、フィールドの相対座標とはフ
ィールドの位置を特定する座標をそれぞれ意味するが、
詳しくは後述する。フォーマット情報比較部15は、被
照合帳票のフォーマット情報とフォーマット情報格納部
14内の各照合用帳票のフォーマット情報とを比較して
両者の位置ずれや拡大・縮小率(変形量)を導出し、こ
れをフォーマット情報修正部16に渡す。フォーマット
情報修正部16は、上記変形量に基づいてフォーマット
情報格納部14内の各照合用帳票のフォーマット情報を
修正し、これを帳票選択部17に渡す。帳票選択部17
は、フォーマット情報が修正された複数の照合用帳票か
ら被照合帳票の特徴と同一または類似のものを選択して
照合結果出力部18に渡す。照合結果出力部18は、選
択された照合用帳票に関する情報を後段処理、例えば文
字切出し手段等へ送るものである。
First, the function of each processing unit of the form collating apparatus 1 will be outlined. The form input unit 10 passes, for example, an image captured from a general-purpose scanner to the ruled line extraction unit 11. This image is an image on which a form to be verified is formed. Ruled line extraction unit 11
Extracts a ruled line in the horizontal direction and the vertical direction from the captured image. The reference line specifying unit 12 specifies a reference line from the ruled line extracted by the ruled line extracting unit 11. The reference line will be described later. Field extractor 1
Reference numeral 3 extracts a field surrounded by the extracted ruled lines, for example, a character entry field, and passes the position and size to the form selection unit 17 in the form of relative coordinates from a reference line. The format information storage unit 14 stores format information about a collation form registered in advance. The format information is information indicating the characteristics of the form. In the present embodiment, the format coordinates include the reference coordinates of the form and the relative coordinates of each field in the form. Here, the reference coordinates are
The coordinates of the specific position of the reference line and the relative coordinates of the field mean the coordinates that specify the position of the field,
Details will be described later. The format information comparing unit 15 compares the format information of the collated form with the format information of each collation form in the format information storage unit 14 to derive a positional deviation and an enlargement / reduction ratio (amount of deformation) between them. This is passed to the format information correction unit 16. The format information correction unit 16 corrects the format information of each collation form in the format information storage unit 14 based on the deformation amount, and passes it to the form selection unit 17. Form selection unit 17
Selects the same or similar feature as the collated form from a plurality of collation forms whose format information has been corrected, and transfers it to the collation result output unit 18. The collation result output unit 18 sends information on the selected collation form to post-processing, for example, to character extraction means.

【0014】次に、この帳票照合装置1の動作例を説明
する。いま、帳票入力部10から被照合帳票の画像が取
り込まれたとする。被照合帳票は既使用のものであり、
フィールドには文字が記入されているものである。取り
込まれた画像は罫線抽出部11に入力され、ここで罫線
が抽出される。説明を簡単にするために、ここでは特
に、罫線全体が実線または破線から成る水平罫線と垂直
罫線とで形成されているものとする。
Next, an example of the operation of the form collating apparatus 1 will be described. Now, it is assumed that the image of the collated form is taken in from the form input unit 10. The collated form is already used,
The field is filled with characters. The captured image is input to the ruled line extraction unit 11, where the ruled lines are extracted. For the sake of simplicity, it is particularly assumed here that the entire ruled line is formed by a horizontal ruled line composed of a solid line or a broken line and a vertical ruled line.

【0015】まず、図2を参照して、実線による水平罫
線の抽出処理を説明する。図2(a)は、画素が認識で
きない程度の小さなスケールで見た場合の水平罫線21
の一例を示した図である。図中、符号22は水平罫線2
1の端点部であり、その部分を画素が認識できる程度の
大きなスケールで見た場合の拡大図が図2(b)であ
る。罫線抽出部11は、画像上を水平方向に走査しなが
ら、図2(b)の中で、符号221ないし224のいず
れかで表された部分のように、黒画素が水平方向に罫線
閾値A以上にわたって連続分布した部分を見い出す。次
に、これらの部分が垂直方向に互いに隣接している部分
を見い出す。これらの部分が見い出された場合、これを
水平罫線と認識する。このようにして認識された水平罫
線は、例えば図2(b)に示されるように、水平方向に
連続する4つの黒画素の束221〜224から形成され
たものである。
First, a process of extracting a horizontal ruled line with a solid line will be described with reference to FIG. FIG. 2A shows a horizontal ruled line 21 when viewed on a small scale such that a pixel cannot be recognized.
FIG. 4 is a diagram showing an example of the above. In the figure, reference numeral 22 denotes a horizontal ruled line 2
FIG. 2B is an enlarged view of the end point of FIG. 1 when the part is viewed on a scale large enough to allow pixels to be recognized. While scanning the image in the horizontal direction, the ruled line extraction unit 11 determines that the black pixels are horizontally aligned with the ruled line threshold A as shown by any of the reference numerals 221 to 224 in FIG. A part distributed continuously over the above is found. Next, the portions where these portions are vertically adjacent to each other are found. When these parts are found, they are recognized as horizontal ruled lines. The horizontal ruled line recognized in this way is formed from a bunch of four black pixels 221 to 224 that are continuous in the horizontal direction, for example, as shown in FIG.

【0016】次に、破線による水平罫線の抽出処理を説
明する。図3(a)は、この場合の水平罫線の一例を示
した図であり、図3(b)はこの水平罫線の部分拡大図
である。罫線抽出部11は、実線の場合と同様に、画像
上を水平方向に走査しながら、黒画素が互いに隣接して
いる領域を見い出し、その外接矩形を求める。次に、求
めた外接矩形の垂直サイズが線幅閾値B以下で、かつ、
水平方向のサイズが破線閾値D以下の矩形を水平破線の
一部とみなす。さらに、水平破線の一部とみなされた外
接矩形の中で、互いの垂直中心座標の差が中心差分閾値
C以下で、水平方向の間隔が破線間隔閾値E以下のもの
を統合していく。このようにして統合された全領域の水
平方向の長さが罫線閾値A以上のものを水平破線と認識
し、これを抽出する。
Next, the process of extracting a horizontal ruled line with a broken line will be described. FIG. 3A is a diagram showing an example of a horizontal ruled line in this case, and FIG. 3B is a partially enlarged view of the horizontal ruled line. As in the case of the solid line, the ruled line extraction unit 11 finds an area where black pixels are adjacent to each other while scanning the image in the horizontal direction, and obtains a circumscribed rectangle thereof. Next, the obtained vertical size of the circumscribed rectangle is equal to or smaller than the line width threshold B, and
A rectangle whose horizontal size is equal to or smaller than the dashed line threshold D is regarded as a part of the horizontal dashed line. Further, among the circumscribed rectangles regarded as a part of the horizontal broken line, those whose difference between the vertical center coordinates is equal to or smaller than the center difference threshold C and whose horizontal interval is equal to or smaller than the broken line interval threshold E are integrated. If the horizontal length of all the regions integrated in this manner is equal to or greater than the ruled line threshold value A, the region is recognized as a horizontal broken line and extracted.

【0017】また、図4(a)に示すように、互いの垂
直中心座標の差が中心差分閾値C以下となる破線1と破
線2の間に黒画素領域(垂直実線)がクロスしている場
合、1本の水平破線41が黒画素部分によって分断され
たものか、あるいは破線1と破線2が独立の破線かを判
定する。この場合は、図4(b)に示される破線間の間
隙領域42に着目し、破線1と黒画素部分、及び黒画素
部分と破線2との間に存在する白画素の共に長さが破線
間隔閾値Eを越えない場合は、2本の破線は1本の破線
41が分断されたものとみなして統合処理を行う。
As shown in FIG. 4A, a black pixel area (solid vertical line) crosses between a broken line 1 and a broken line 2 where the difference between the vertical center coordinates is equal to or less than the center difference threshold value C. In this case, it is determined whether one horizontal broken line 41 is divided by a black pixel portion or whether the broken lines 1 and 2 are independent broken lines. In this case, attention is paid to the gap area 42 between the broken lines shown in FIG. 4B, and the length of each of the white pixels existing between the broken line 1 and the black pixel portion and between the black pixel portion and the broken line 2 is indicated by the broken line. When the distance does not exceed the interval threshold value E, the two broken lines are regarded as one broken line 41 and the integration process is performed.

【0018】最後に破線の両端部の特定処理を行う。一
例として、右端部を特定するための処理を図5(a)と
図5(b)により説明する。図5(a)は、破線51の
端部領域52に黒画素領域が存在する様子を示すもので
あり、図5(b)はその端部領域52の拡大図である。
この右端部特定処理では、白画素の長さが破線間隔閾値
Eを越えない間に黒画素領域が存在するか否かを判定
し、存在する場合は、この黒画素領域を破線51の終端
として更新する。この更新処理を白画素の長さが破線間
隔閾値Eを越えるまで繰り返し、越えた時点で、破線5
1の右端部を特定する。
Finally, a process for specifying both ends of the broken line is performed. As an example, a process for specifying the right end will be described with reference to FIGS. 5A and 5B. FIG. 5A shows a state where a black pixel region exists in an end region 52 indicated by a broken line 51, and FIG. 5B is an enlarged view of the end region 52.
In this right end portion specifying process, it is determined whether or not a black pixel region exists while the length of the white pixel does not exceed the dashed line interval threshold value E. Update. This updating process is repeated until the length of the white pixel exceeds the broken line interval threshold value E.
Identify the right end of 1.

【0019】なお、罫線抽出部11の水平罫線の抽出処
理における水平軸と垂直軸を入れ替えて処理すること
で、同様の手順で垂直罫線をも抽出することができる。
罫線抽出部11によって被照合帳票についての罫線が抽
出されると、その結果が基準線特定部12に送られる。
Note that by replacing the horizontal axis and the vertical axis in the horizontal ruled line extraction process of the ruled line extracting unit 11, the vertical ruled line can be extracted in the same procedure.
When the ruled line extracting unit 11 extracts a ruled line for the collated form, the result is sent to the reference line specifying unit 12.

【0020】基準線特定部12は、罫線抽出部11から
送られた罫線抽出結果に基づいて、水平罫線の中で垂直
座標位置が最小及び最大となる一対の罫線、そして、垂
直罫線の中で水平座標位置が最小及び最大となる一対の
罫線を、それぞれフィールド領域を囲む水平基準線,垂
直基準線としてそれぞれ特定する。このようにして特定
された各基準線は、結局、フィールド領域の最外周に沿
ったものとなる。上記罫線抽出結果と基準線の特定結果
は、フォーマット情報比較部14とフォーマット抽出部
13に送られ、それぞれ独立に処理される。そこで、ま
ず、フォーマット情報比較部14の処理内容を図6を参
照して説明する。
Based on the ruled line extraction result sent from the ruled line extracting unit 11, the reference line specifying unit 12 generates a pair of ruled lines whose vertical coordinate positions are minimum and maximum among horizontal ruled lines, and A pair of ruled lines having the minimum and maximum horizontal coordinate positions are respectively specified as a horizontal reference line and a vertical reference line surrounding the field area. Each of the reference lines specified in this manner eventually follows the outermost periphery of the field region. The ruled line extraction result and the reference line identification result are sent to the format information comparing unit 14 and the format extracting unit 13, and are processed independently. Therefore, first, the processing contents of the format information comparing unit 14 will be described with reference to FIG.

【0021】フォーマット情報比較部14では、フォー
マット情報格納部14に格納された複数の照合用帳票と
被照合帳票とを比較し、両帳票間の位置ずれ量、両帳票
のサイズを合致させるための変形量を水平方向と垂直方
向について求める。図6(a)は、フォーマット情報格
納部14に格納されている照合用帳票の罫線及び基準線
(太線)の例を示しており、図6(b)は、被照合帳票
について、罫線抽出処理部11と基準線特定部12の処
理により得られた罫線及び基準線(太線)の例を示して
いる。図6(a)、(b)に示されるように、ここでは
画面の左上を基準座標(0,0)としている。そして図
6(a)において、X’,Y’はそれぞれ、垂直罫線に
ついて水平座標の小さい方の罫線の水平座標、水平罫線
について垂直座標の小さい方の罫線の垂直座標である。
同様に、図6(b)において、X,Yはそれぞれ、垂直
罫線について水平座標が小さい方の罫線の水平座標、水
平罫線について垂直座標の小さい方の罫線の垂直座標で
ある。このとき、水平方向の位置ずれと垂直方向の位置
ずれは、次式で与えられる。
The format information comparing unit 14 compares a plurality of collation forms stored in the format information storage unit 14 with the collated form, and adjusts the amount of displacement between the two forms and the size of the two forms. The amount of deformation is determined for the horizontal and vertical directions. 6A shows an example of a ruled line and a reference line (thick line) of a collation form stored in the format information storage unit 14. FIG. 6B shows a ruled line extraction process for a collated form. 2 shows an example of ruled lines and reference lines (thick lines) obtained by the processing of the unit 11 and the reference line identification unit 12. As shown in FIGS. 6A and 6B, the upper left of the screen is set as the reference coordinates (0, 0) here. In FIG. 6A, X ′ and Y ′ are the horizontal coordinates of the rule having the smaller horizontal coordinate for the vertical rule, and the vertical coordinates of the rule having the smaller vertical coordinate for the horizontal rule.
Similarly, in FIG. 6B, X and Y are the horizontal coordinates of the rule having the smaller horizontal coordinate for the vertical rule and the vertical coordinates of the rule having the smaller vertical coordinate for the horizontal rule, respectively. At this time, the horizontal displacement and the vertical displacement are given by the following equations.

【0022】[0022]

【数1】水平方向の位置ずれ=X−X’ 垂直方向の位置ずれ=Y−Y’## EQU1 ## Horizontal displacement = X-X 'Vertical displacement = Y-Y'

【0023】さらに図6(a)において、W’,H’
は、それぞれ、2本の垂直基準線の間隔、2本の水平基
準線の間隔である。同様に、図6(b)において、W,
Hは、それぞれ、2本の垂直基準線の間隔、2本の水平
基準線の間隔である。このとき、帳票の基準線を合致さ
せるための水平方向及び垂直方向の変形量、例えば各々
の拡大・縮小率は、次式で与えられる。
Further, in FIG. 6A, W 'and H'
Are the spacing between two vertical reference lines and the spacing between two horizontal reference lines, respectively. Similarly, in FIG. 6B, W,
H is an interval between two vertical reference lines and an interval between two horizontal reference lines, respectively. At this time, the amount of deformation in the horizontal direction and the vertical direction for matching the reference line of the form, for example, each enlargement / reduction ratio is given by the following equation.

【0024】[0024]

【数2】水平方向の拡大・縮小率=W/W’ 垂直方向の拡大・縮小率=H/H’## EQU2 ## Enlargement / reduction ratio in the horizontal direction = W / W 'Enlargement / reduction ratio in the vertical direction = H / H'

【0025】このようにしてフォーマット情報比較部1
4で照合用帳票毎に位置ずれ量、変形量が求められ、そ
の結果がフォーマット情報修正部16に送られる。フォ
ーマット情報修正部16では、フォーマット情報比較部
14で求められた位置ずれ量、変形量に基づいてフォー
マット情報におけるフィールド座標(フィールドの位置
を示す座標)を修正する。一つのフィールド(図6
(a),(b)の斜線で示した部分)の対応関係を示し
た図6(c)を参照して、上記修正処理を説明する。
Thus, the format information comparing section 1
In 4, the amount of displacement and the amount of deformation are obtained for each collation form, and the results are sent to the format information correction unit 16. The format information correction unit 16 corrects the field coordinates (coordinates indicating the position of the field) in the format information based on the positional deviation amount and the deformation amount obtained by the format information comparison unit 14. One field (Fig. 6
The correction process will be described with reference to FIG. 6C showing the correspondence between the hatched portions (a) and (b).

【0026】図6(c)において、座標x’、y’を、
フォーマット情報格納部14の照合用帳票から任意に取
り出したフィールドの水平方向のフィールド座標、垂直
方向のフィールド座標とする。各方向のフィールド座標
は、どちらも基準座標(0,0)から測った相対座標で
ある。フォーマット情報修正部16は、座標x’とy’
を被照合帳票の基準座標(0,0)から測ったフィール
ド座標とみなすことができるように修正を施す。修正さ
れた座標を座標x”とy”とすると、これらは次式によ
り与えられる。
In FIG. 6C, coordinates x 'and y' are represented by
The field coordinates in the horizontal direction and the field coordinates in the vertical direction of the field arbitrarily extracted from the collation form in the format information storage unit 14 are set. The field coordinates in each direction are both relative coordinates measured from the reference coordinates (0, 0). The format information correction unit 16 calculates the coordinates x ′ and y ′
Is corrected so that can be regarded as the field coordinates measured from the reference coordinates (0, 0) of the collated form. Assuming that the modified coordinates are coordinates x ″ and y ″, these are given by the following equations.

【0027】[0027]

【数3】x”=(W/W’)×x’+X−X’ y”=(H/H’)×y’+Y−Y’X ″ = (W / W ′) × x ′ + X−X ′ y ″ = (H / H ′) × y ′ + Y−Y ′

【0028】図6(c)においてこの処理を見れば、左
上座標(x1’、y1’)と右上座標(x2’、y
2’)で指定されるフィールドは、左上座標(x1”、
y1”)と右上座標(x2”、y2”)で指定されるフ
ィールドに修正されたことになる。このようにして照合
用帳票の全てについてフィールド座標が修正され、その
結果が帳票選択部18に送られる。
Looking at this processing in FIG. 6C, the upper left coordinates (x1 ', y1') and the upper right coordinates (x2 ', y
2 ') is the upper left coordinate (x1 ",
y1 ") and the field specified by the upper right coordinates (x2", y2 "). In this way, the field coordinates are corrected for all the collation forms, and the result is transmitted to the form selection unit 18. Sent.

【0029】次に、フィールド抽出部13での処理内容
を図7及び図8を参照して説明する。フィールド抽出部
13では、罫線抽出結果と基準線の特定結果を受けて、
被照合帳票から罫線によって四方を囲まれた個々のフィ
ールドを抽出する。その際、各フィールドのフィールド
座標を生成する。このフィールド座標は基準座標からの
相対座標である。図7は、このフィールド抽出の処理手
順であり、図8はフィールド抽出処理の際の具体例を示
すものである。
Next, the processing contents of the field extracting section 13 will be described with reference to FIGS. The field extraction unit 13 receives the ruled line extraction result and the reference line identification result,
The individual fields surrounded by ruled lines are extracted from the collated form. At this time, field coordinates of each field are generated. These field coordinates are relative coordinates from the reference coordinates. FIG. 7 shows the processing procedure of the field extraction, and FIG. 8 shows a specific example of the field extraction processing.

【0030】フィールド抽出に際しては、まず、図7に
示されるように、ループ(1)として垂直方向に移動し
て水平罫線の着目を変える(ステップS701)。但
し、処理の最初では、着目する水平罫線は垂直座標の最
も小さな水平罫線である。次に、着目した水平罫線を右
に移動して交点の着目を変え(ステップS701)、処
理1を行う。処理1では、水平罫線と垂直罫線が交わる
任意の交点に着目して、その交点にflagAとfla
gBを識別可能な2つの印として付与する(ステップS
703)。図8(a)には、その具体例として、丸印で
表された着目交点にflagAとflagBが付与され
ている様子が示されている。
At the time of field extraction, first, as shown in FIG. 7, the focus of the horizontal ruled line is changed by moving in the vertical direction as a loop (1) (step S701). However, at the beginning of the process, the horizontal ruled line of interest is the horizontal ruled line with the smallest vertical coordinate. Next, the focused horizontal ruled line is moved to the right to change the focus of the intersection (step S701), and the process 1 is performed. In processing 1, attention is paid to an arbitrary intersection where the horizontal ruled line and the vertical ruled line intersect, and flag A and flag
gB is given as two distinguishable marks (step S
703). FIG. 8A shows, as a specific example, a state in which flagA and flagB are assigned to the noted intersection indicated by a circle.

【0031】次に、分岐1に於いて、水平罫線上を走査
しながらflagBの右側に交点が存在するか否かを調
べる(ステップS704)。flagBの右側に交点が
存在すれば(ステップS704:Yes)、図8(b)
のように処理2として交点の着目を右側の交点に移動
し、flagBを着目交点に付け変えて、新たにfla
gCをその着目交点に付与し、分岐2に進む。もし、f
lagBの右側に交点が存在しなければ(ステップS7
04:No)、ループ(2)を再び実行する。
Next, in the branch 1, while scanning on the horizontal ruled line, it is checked whether or not an intersection exists on the right side of the flag B (step S704). If there is an intersection on the right side of flagB (step S704: Yes), FIG.
As processing 2, the focus of the intersection is moved to the right intersection, flagB is changed to the focus intersection, and a new flag
gC is assigned to the noted intersection, and the process proceeds to branch 2. If f
If there is no intersection on the right side of lagB (step S7)
04: No), loop (2) is executed again.

【0032】分岐2では、flagCの下に交点が存在
するか否かを調べる(ステップS706)。flagC
の下に交点が存在する場合(ステップS704:Ye
s)は、図8(d)に例示されるように、処理3として
交点の着目を下側の交点に移動し、flagCを着目交
点に付け変え、そして着目交点に新たにflagDを付
与し、分岐3に進む。flagCの下に交点が存在しな
い場合(ステップS704:No)は、分岐1を再び実
行する。つまり、図8(c)に例示されるように、下に
交点がない交点を飛び越して、下に交点の存在する交点
に着目を移して行く。
In branch 2, it is checked whether or not an intersection exists below flagC (step S706). flagC
If there is an intersection under the line (Step S704: Ye
s), as illustrated in FIG. 8D, as the process 3, the focus of the intersection is moved to the lower intersection, the flag C is changed to the focus intersection, and the flag D is newly added to the focus intersection. Proceed to branch 3. If there is no intersection below flagC (step S704: No), branch 1 is executed again. In other words, as illustrated in FIG. 8C, an intersection having no intersection below is skipped, and attention is shifted to an intersection having an intersection below.

【0033】分岐3では水平罫線上を左方向に走査し
て、flagDの左側に交点が存在するか否かを調べる
(ステップS708)。flagDの左側に交点が存在
する場合(ステップS708:Yes)は、図8(d)
に例示されるように、交点の着目をflagDの左側に
交点に移動し、flagDを着目交点に付け変えて分岐
4に進む。flagDの左側に交点が存在しない場合
(ステップS708:No)は、分岐2を再び実行す
る。つまり、図8(e)に例示されるように、左側に交
点がない交点を下に飛び越して、左側に交点の存在する
交点に着目を移して行く。
In branch 3, the horizontal ruled line is scanned leftward to check whether an intersection exists on the left side of flagD (step S708). If there is an intersection on the left side of flagD (step S708: Yes), FIG.
As shown in the example, the focus of the intersection is moved to the intersection to the left of flagD, the flagD is changed to the intersection of interest, and the process proceeds to branch 4. If there is no intersection on the left side of flagD (step S708: No), branch 2 is executed again. That is, as illustrated in FIG. 8 (e), an intersection having no intersection on the left side is jumped downward, and attention is shifted to an intersection having an intersection on the left side.

【0034】分岐4ではflagDの直上にflagA
が存在するか否かを調べる(ステップS710)。そし
て、flagDの直上にflagAが存在する場合(ス
テップS708:Yes)は、処理5に進む。一方、f
lagDの直上にflagAが存在しない場合(ステッ
プS708:Yes)は、分岐3を再び実行する。つま
り、図8(g)に例示されるように、着目交点の直上に
flagAが存在しない交点を左に飛び越して直上にf
lagAが存在する交点に着目を移す。
In branch 4, flagA is immediately above flagD.
It is checked whether or not exists (step S710). Then, when flagA exists immediately above flagD (step S708: Yes), the process proceeds to processing 5. On the other hand, f
When the flagA does not exist immediately above the flagD (step S708: Yes), the branch 3 is executed again. That is, as illustrated in FIG. 8 (g), an intersection where no flagA exists immediately above the intersection of interest jumps to the left and f.
Focus on the intersection where lagA exists.

【0035】処理5では、図8(h)で例示されるよう
に、flagA、flagB、flagC、flagD
が付与された4点を頂点とする矩形領域(太線)をフィ
ールドとして抽出し、抽出したフィールドを指定するフ
ィールド座標を生成する(ステップS711)。その
後、再びループ(2)に進み、以上で説明したステップ
S703からステップS711の処理を繰り返す。以上
の手順を経て抽出されたフィールド座標の結果は、照合
選択部17に送られる。
In process 5, as illustrated in FIG. 8 (h), flagA, flagB, flagC, flagD
Then, a rectangular area (thick line) having four vertices assigned with is extracted as a field, and field coordinates for designating the extracted field are generated (step S711). Thereafter, the process proceeds to the loop (2) again, and the processes of steps S703 to S711 described above are repeated. The result of the field coordinates extracted through the above procedure is sent to the collation selection unit 17.

【0036】帳票選択部17では、フォーマット情報修
正部16とフィールド抽出部13から送られた結果に基
づいて、被照合帳票と照合用帳票とのフィールドマッチ
ング処理を行う。このフィールドマッチング処理の手順
は図9に示す通りであり、まず、フォーマット情報修正
部16とフィールド抽出部13の処理結果に基づいてフ
ィールドマッチング(1)を行う。ここでは、修正後の
フォーマット情報のフィールド(F”)と被照合帳票の
フィールド(F)との照合を行う(ステップS91)。
各フィールドF”及びFの(左、右、上、下)の座標値
をそれぞれ(x”(l),x”(r),y”(t),
y”(b))、(x(l),x(r),y(t),y
(b))としたとき、照合条件は、下記のように表され
る。
The form selecting unit 17 performs a field matching process between the collated form and the collation form based on the results sent from the format information correcting unit 16 and the field extracting unit 13. The procedure of the field matching process is as shown in FIG. 9. First, field matching (1) is performed based on the processing results of the format information correcting unit 16 and the field extracting unit 13. Here, the field (F ") of the format information after correction is compared with the field (F) of the form to be verified (step S91).
The coordinate values of (left, right, upper, lower) of each field F ″ and F are respectively expressed as (x ″ (l), x ″ (r), y ″ (t),
y "(b)), (x (l), x (r), y (t), y
When (b)) is set, the matching condition is expressed as follows.

【0037】[0037]

【数4】(A1)x”(l)−照合閾値G≦x(l)≦
x”(l)+照合閾値G (A2)x”(r)−照合閾値G≦x(r)≦x”
(r)+照合閾値G (A3)y”(t)−照合閾値G≦y(t)≦y”
(t)+照合閾値G (A4)y”(b)−照合閾値G≦y(b)≦y”
(b)+照合閾値G
## EQU4 ## (A1) x "(l) -collation threshold G≤x (l) ≤
x "(l) + threshold G (A2) x" (r) -threshold G≤x (r) ≤x "
(R) + collation threshold G (A3) y ″ (t) −collation threshold G ≦ y (t) ≦ y ″
(T) + collation threshold G (A4) y ″ (b) −collation threshold G ≦ y (b) ≦ y ″
(B) + collation threshold G

【0038】なお、照合閾値Gは、被照合帳票の画像取
り込みの解像度等を考慮して設定される。上記照合条件
を複数の照合用帳票の全てについて行い、不一致フィー
ルドの数を計数する。そして、不一致フィールド数がゼ
ロか否かを照合用帳票毎に判定し(ステップS92)、
ゼロとなる照合用帳票が存在するときは(ステップS9
2:Yes)、照合一致、即ちその照合用帳票が被照合
帳票と同一フォーマットの帳票であるとみなす(ステッ
プS93)。一方、不一致フィールド数がゼロでないと
きは(ステップS92:No)は、フィールドマッチン
グ(2)に処理を移す。
The collation threshold value G is set in consideration of the resolution of capturing the image of the collated form. The above collation conditions are applied to all of the plurality of collation forms, and the number of mismatch fields is counted. Then, it is determined for each collation form whether or not the number of mismatched fields is zero (step S92),
If there is a collation form that is zero (step S9
2: Yes), collation match, that is, the collation form is regarded as a form having the same format as the collated form (step S93). On the other hand, if the number of unmatched fields is not zero (step S92: No), the process proceeds to field matching (2).

【0039】フィールドマッチング(2)では、フィー
ルド抽出部13において被照合帳票の罫線に途切れ等が
あるために、複数のフィールドを誤って一つのフィール
ドとしてしまった場合を想定し、照合用帳票について隣
接した複数のフィールドを統合し、この統合フィールド
と被照合帳票のフィールドとの照合を実行する(ステッ
プS94)。このステップでは、フィールドマッチング
(1)において不一致となった全てのフィールドFにつ
いて、次の照合条件式を満足するフィールドF”を求め
る。
In the field matching (2), it is assumed that a plurality of fields are mistakenly combined into one field due to a break in the ruled line of the collated form in the field extracting unit 13, and the collation form is adjacent. The plurality of fields thus obtained are integrated, and the integrated field is collated with the fields of the form to be verified (step S94). In this step, a field F ″ that satisfies the following collation condition expression is obtained for all the fields F that did not match in the field matching (1).

【0040】[0040]

【数5】(B1)x”(l)≧x(l)−照合閾値G (B2)x”(r)≦x(r)+照合閾値G (B3)y”(t)≧y(t)−照合閾値G (B4)y”(b)≦y(b)+照合閾値G(B1) x ″ (l) ≧ x (l) −collation threshold G (B2) x ″ (r) ≦ x (r) + collation threshold G (B3) y ″ (t) ≧ y (t ) -Collation threshold G (B4) y ″ (b) ≦ y (b) + collation threshold G

【0041】条件式(B1)〜(B4)を満足するフィ
ールドF”がn個見い出されとき、これらのn個のフィ
ールド全てを統合する。また、統合したフィールドとフ
ィールドFが照合条件(A1)〜(A4)の全てを満た
すとき、n個のフィールドF”がフィールドFと一致し
たものとみなし、ステップS92で求めた不一致フィー
ルド数から数値“n”を差し引く。これにより不一致フ
ィールド数がゼロになった場合は(ステップS95:Y
es)、フォーマットが一致する可能性のある帳票候補
とみなす(ステップS96)。この処理を全てのフィー
ルドについて実施してもゼロとならない場合は(ステッ
プS95:No)、フィールドマッチング(3)に処理
を移す。
When n fields F ″ satisfying the conditional expressions (B1) to (B4) are found, all of these n fields are integrated. Further, the integrated field and the field F are compared with the collation condition (A1). When all of (A4) to (A4) are satisfied, it is considered that the n fields F "coincide with the field F, and the numerical value" n "is subtracted from the number of unmatched fields obtained in step S92. As a result, if the number of mismatched fields becomes zero (step S95: Y
es), it is regarded as a form candidate that may have a matching format (step S96). If the value does not become zero even when this process is performed for all the fields (step S95: No), the process proceeds to field matching (3).

【0042】フィールドマッチング(3)では、フィー
ルド抽出部13において被照合帳票に記入文字や雑音が
あるために、1つのフィールドを誤って複数のフィール
ドに分割して認識した場合を想定して、被照合帳票につ
いて隣接した複数の抽出されたフィールドを統合して、
フィールドマッチングを行う(S97)。このステップ
では、フィールドマッチング(2)において不一致フィ
ールドとされた全てのフォーマットフィールドF”のそ
れぞれについて、以下の条件式を満足するフィールドF
を全て見い出す。
In the field matching (3), it is assumed that one field is erroneously divided into a plurality of fields and recognized by the field extraction unit 13 due to characters and noise in the form to be verified. By integrating multiple extracted fields that are adjacent to each other,
Field matching is performed (S97). In this step, the field F satisfying the following conditional expression is satisfied for each of the format fields F ″ determined as the mismatched field in the field matching (2).
Find all.

【0043】[0043]

【数6】(C1)x(l)≧x”(l)−照合閾値G (C2)x(r)≦x”(r)+照合閾値G (C3)y(t)≧y”(t)−照合閾値G (C4)y(b)≦y”(b)+照合閾値G(C1) x (l) ≧ x ″ (l) −collation threshold G (C2) x (r) ≦ x ″ (r) + collation threshold G (C3) y (t) ≧ y ″ (t )-Collation threshold G (C4) y (b) ≤ y "(b) + collation threshold G

【0044】条件式(C1)〜(C4)を全て満足する
フィールドFがn個見い出されたとき、このn個のフィ
ールドを全て統合する。そして、統合したフィールド
F”が照合条件(A1)〜(A4)の全てを満たすと
き、フィールドF”がn個のフィールドFと一致したも
のとみなして、ステップS95における不一致フィール
ド数から“1”を差し引く。不一致フィールド数がゼロ
になった場合は(ステップS95:Yes)、フォーマ
ットが一致する可能性がある帳票候補とみなす(ステッ
プS96)。一方、ゼロでない場合は(S98:N
o)、照合不一致と判定し(ステップS99)、フィー
ルドマッチング処理を終える。なお、ステップS96に
おいて、帳票候補が複数になる場合は、不一致フィール
ド数の最も少ないものを選択し、これを帳票照合の結果
とする。
When n fields F satisfying all the conditional expressions (C1) to (C4) are found, all the n fields are integrated. When the integrated field F ″ satisfies all of the collation conditions (A1) to (A4), it is considered that the field F ″ matches the n fields F, and “1” is determined from the number of mismatched fields in step S95. Subtract If the number of unmatched fields becomes zero (step S95: Yes), it is regarded as a form candidate that may have a format match (step S96). On the other hand, if it is not zero (S98: N
o), it is determined that there is no matching (step S99), and the field matching process ends. If there are a plurality of form candidates in step S96, the one with the smallest number of mismatched fields is selected, and this is set as the result of form collation.

【0045】このように、本実施形態では、照合用帳票
のフィールド領域のサイズを被照合帳票のフィールド領
域のサイズに合致するように修正し、修正後のフィール
ド領域に含まれるフィールドと被照合帳票内のフィール
ドとを照合するようにしたので、従来のように帳票を識
別するためのマークや基準マークが付与された専用の帳
票を用いる必要がなく、汎用の帳票を利用することがで
きる。また、被照合帳票を画像の形で取り込む際に、罫
線の途切れや、ノイズ成分の混入等によってフィールド
を誤認識した場合であっても正しく照合を行うことがで
きる。
As described above, in the present embodiment, the size of the field area of the collation form is modified to match the size of the field area of the collated form, and the fields included in the modified field area and the collated form are modified. Since the fields are compared with each other, it is not necessary to use a special form provided with a mark for identifying the form or a reference mark as in the related art, and a general-purpose form can be used. Further, when the collated form is captured in the form of an image, the collation can be performed correctly even if the field is erroneously recognized due to a break in ruled lines or the mixing of noise components.

【0046】既存のフォーマット情報が存在しない場
合、つまり帳票についてのフォーマット情報を新規に登
録する場合は、図10に示す処理を行う。フォーマット
情報を登録する場合は、まず、フィールド内に文字等が
記入されていない帳票の画像を帳票入力部10より取り
込む(ステップS101)。罫線抽出部11は、この画
像を走査して水平罫線及び垂直罫線を抽出する(ステッ
プS102)。また、抽出された各罫線の中から垂直基
準線、水平基準線、及び基準座標を特定し、これをフィ
ールド抽出部13とフォーマット情報格納部16へ送る
(ステップS103)。フィールド抽出部13は、当該
帳票のフィールド座標を基準座標の相対値として表し、
これをフォーマット情報格納部16へ送る(ステップS
104)。フォーマット情報格納部16では、以上のス
テップで求めた基準座標とフィールド座標とをフォーマ
ット情報として登録し、次の帳票照合の際に使用可能に
する。
When there is no existing format information, that is, when newly registering format information on a form, the processing shown in FIG. 10 is performed. When registering the format information, first, an image of a form in which characters or the like are not entered in the field is fetched from the form input unit 10 (step S101). The ruled line extracting unit 11 scans this image to extract horizontal ruled lines and vertical ruled lines (step S102). In addition, a vertical reference line, a horizontal reference line, and reference coordinates are specified from among the extracted ruled lines, and are sent to the field extraction unit 13 and the format information storage unit 16 (step S103). The field extracting unit 13 represents the field coordinates of the form as a relative value of the reference coordinates,
This is sent to the format information storage unit 16 (step S
104). In the format information storage unit 16, the reference coordinates and the field coordinates obtained in the above steps are registered as format information, and can be used at the time of the next form collation.

【0047】以上、本発明の実施形態を詳細に説明した
が、本発明は上記実施形態に限定されるものではない。
例えば、本実施形態では、照合用帳票と被照合帳票の垂
直基準線と水平基準線とを特定し、前者の各基準線に囲
まれる領域のサイズを後者の各基準線に囲まれる領域の
サイズに合致するように位置ずれ量や拡大・縮小率を変
えているが、要はフィールド領域のサイズを両帳票にお
いて一致させればよいので、フィールド領域の変形手法
は任意であって良い。また、図9におけるフィールドマ
ッチング(2)処理(S94)とフィールドマッチング
(3)処理(S97)とは必ずしもこの順に実行しなく
ともよく、また、両処理を独立させるようにしても良
い。
Although the embodiments of the present invention have been described in detail, the present invention is not limited to the above embodiments.
For example, in the present embodiment, the vertical reference line and the horizontal reference line of the collation form and the collated form are specified, and the size of the area surrounded by each of the former reference lines is reduced to the size of the area surrounded by each of the latter reference lines. Although the displacement amount and the enlargement / reduction ratio are changed so as to match the field size, the key point is that the size of the field area only needs to be matched in both forms, so that the field area deformation method may be arbitrary. Further, the field matching (2) processing (S94) and the field matching (3) processing (S97) in FIG. 9 do not necessarily have to be executed in this order, and the two processings may be made independent.

【0048】[0048]

【発明の効果】以上の説明から明らかなように、本発明
によれば、汎用の帳票を被照合帳票として用いた場合で
あっても、帳票サイズの相違、位置ずれ、画像取み時の
解像度の変化、雑音等の混入等に対して頑健な照合を行
うことができ、適用用途が拡がる効果がある。また、本
発明のような帳票照合過程を認識系の前段に設けること
により、認識系の構成を簡略にすることができる。
As is apparent from the above description, according to the present invention, even when a general-purpose form is used as a form to be verified, differences in form size, misregistration, and resolution at the time of image capture are obtained. Can be performed robustly against changes in noise, contamination of noise, and the like, and this has the effect of expanding the applications. Further, by providing the form collation process as in the present invention at the preceding stage of the recognition system, the configuration of the recognition system can be simplified.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態に係る帳票照合装置のブロ
ック構成図。
FIG. 1 is a block diagram of a form collating apparatus according to an embodiment of the present invention.

【図2】(a)は本実施形態による被照合帳票イメージ
上の実線による水平罫線の一例を示す図、(b)は前記
水平罫線の端部の拡大図。
FIG. 2A is a diagram illustrating an example of a horizontal ruled line formed by a solid line on an image of a form to be verified according to the present embodiment, and FIG. 2B is an enlarged view of an end of the horizontal ruled line.

【図3】(a)は本実施形態による被照合帳票イメージ
上の破線による水平罫線の一例を示す図、(b)は前記
水平罫線の一部の拡大図。
FIG. 3A is a diagram illustrating an example of a horizontal ruled line formed by a broken line on an image of a form to be verified according to the present embodiment, and FIG. 3B is an enlarged view of a part of the horizontal ruled line.

【図4】(a)は本実施形態による被照合帳票イメージ
上の2本の破線による水平罫線の一例を示す図、(b)
は前記水平罫線の間隙部分の拡大図。
FIG. 4A is a diagram illustrating an example of a horizontal ruled line formed by two broken lines on a collated form image according to the embodiment;
3 is an enlarged view of a gap between the horizontal ruled lines.

【図5】(a)は本実施形態による端部を有する破線に
よる水平罫線の一例を示す図、(b)は前記端部の周辺
拡大図。
5A is a diagram illustrating an example of a horizontal ruled line with a broken line having an end according to the present embodiment, and FIG. 5B is an enlarged view around the end.

【図6】(a)は本実施形態による照合用帳票のフォー
マットの一例を示した図、(b)は本実施形態による被
照合帳票イメージの罫線の一例を示した図、(c)は本
実施形態によるフォーマット情報修正部の処理を説明す
るための図。
6A is a diagram illustrating an example of a format of a collation form according to the embodiment, FIG. 6B is a diagram illustrating an example of a ruled line of a collated form image according to the embodiment, and FIG. FIG. 4 is a diagram for explaining processing of a format information correction unit according to the embodiment.

【図7】本実施形態によるフィールド抽出部の処理手順
の説明図。
FIG. 7 is an explanatory diagram of a processing procedure of a field extracting unit according to the embodiment.

【図8】本実施形態によるフィールド抽出部の各処理に
おける具体例を示した図。
FIG. 8 is a view showing a specific example in each processing of the field extraction unit according to the embodiment.

【図9】本実施形態による帳票照合処理の手順説明図。FIG. 9 is a diagram illustrating a procedure of a form matching process according to the embodiment.

【図10】本実施形態によるフォーマット情報格納部へ
の登録処理の手順説明図。
FIG. 10 is an explanatory diagram of a procedure of a registration process to a format information storage unit according to the embodiment;

【符号の説明】[Explanation of symbols]

1 帳票照合装置 10 帳票入力部 11 罫線抽出部 12 基準線特定部 13 フィールド抽出部 14 フォーマット情報格納部 15 フォーマット情報比較部 16 フォーマット情報修正部 17 帳票照合選択部 18 照合結果出力部 REFERENCE SIGNS LIST 1 form collation device 10 form input unit 11 ruled line extraction unit 12 reference line identification unit 13 field extraction unit 14 format information storage unit 15 format information comparison unit 16 format information correction unit 17 form collation selection unit 18 collation result output unit

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 入力画像に含まれる被照合帳票から文字
等を記入するためのフィールドが形成されているフィー
ルド領域を特定するステップと、 予め保持されている複数の照合用帳票のそれぞれのフィ
ールド領域と前記特定された被照合帳票のフィールド領
域のサイズを合致させるステップと、 フィールド領域のサイズが合致した各照合用帳票と被照
合帳票の個々のフィールド間の対応関係の有無を判定
し、一定範囲で対応する照合用帳票を選択するステップ
と、 をコンピュータ装置上で実行することを特徴とする帳票
照合方法。
1. A step of specifying a field area in which a field for writing a character or the like is formed from a collated form included in an input image, and a field area of each of a plurality of collation forms stored in advance. And matching the size of the field area of the identified document to be verified, and determining whether there is a corresponding relationship between each matching document and the individual field of the document to be verified whose size of the field region matches, Selecting a corresponding collation form in step (c), and executing on a computer device.
【請求項2】 入力画像に含まれる被照合帳票から文字
等を記入するためのフィールドが形成されているフィー
ルド領域を特定するステップと、 予め保持されている複数の照合用帳票のそれぞれのフィ
ールド領域と前記特定された被照合帳票のフィールド領
域のサイズを合致させるステップと、 フィールド領域のサイズが合致した被照合帳票のフィー
ルドと各照合用帳票のフィールド領域内で互いに隣接す
る複数フィールドからなる統合フィールドとの対応関係
の有無を判定し、一定範囲で対応する照合用帳票を選択
するステップと、 をコンピュータ装置上で実行することを特徴とする帳票
照合方法。
2. A step of specifying a field area in which a field for writing a character or the like is formed from a collated form included in an input image, and a field area of each of a plurality of collation forms stored in advance. And matching the size of the specified field area of the collated form, and an integrated field comprising a plurality of fields of the collated form whose field area sizes match and a plurality of adjacent fields within the field area of each collation form Determining the presence or absence of a correspondence relationship with, and selecting a corresponding collation form within a certain range, and executing on a computer device.
【請求項3】 入力画像に含まれる被照合帳票から文字
等を記入するためのフィールドが形成されているフィー
ルド領域を特定するステップと、 予め保持されている複数の照合用帳票のそれぞれのフィ
ールド領域と前記特定された被照合帳票のフィールド領
域のサイズを合致させるステップと、 フィールド領域のサイズが合致した各照合用帳票のフィ
ールドと被照合帳票のフィールド領域内で互いに隣接す
る複数のフィールドからなる統合フィールドとの対応関
係の有無を判定し、一定範囲で対応する照合用帳票を選
択するステップと、 をコンピュータ装置上で実行することを特徴とする帳票
照合方法。
3. A step of specifying a field area in which a field for writing a character or the like is formed from a collated form included in an input image, and a field area of each of a plurality of collation forms stored in advance. And matching the size of the field area of the identified document to be matched, and integrating the fields of each matching document with the matched field area size and a plurality of fields adjacent to each other in the field area of the matched document. Determining the presence or absence of a correspondence relationship with a field, and selecting a matching form in a certain range, on a computer device.
【請求項4】 前記照合用帳票及び被照合帳票における
フィールド同士、またはフィールドと統合フィールドと
の対応の有無を、前記フィールド領域の基準位置からの
相対値で表される個々のフィールドないし統合フィール
ドの形成位置が互いに一致するか否かにより判定するこ
とを特徴とする請求項1ないし3のいずれかの項記載の
帳票照合方法。
4. A method according to claim 1, wherein each of the fields in the collation form and the collated form, or whether there is a correspondence between the field and the integrated field, is performed for each field or integrated field represented by a relative value from a reference position of the field area. 4. The form matching method according to claim 1, wherein the determination is made based on whether or not the forming positions match each other.
【請求項5】 文字等を記入するためのフィールドが形
成されているフィールド領域の基準位置とこの基準位置
からの相対値で表される個々のフィールドの形成位置と
を含むフォーマット情報を照合用帳票毎に格納したフォ
ーマット情報格納手段と、 入力画像に含まれる被照合帳票から前記フィールド領域
を特定するとともに特定したフィールド領域の基準位置
とこの基準位置からの相対値で表される個々のフィール
ドの形成位置とを含むフォーマット情報を生成するフォ
ーマット情報生成手段と、 各照合用帳票のフォーマット情報と前記被照合帳票につ
いて生成されたフォーマット情報とを比較して照合用帳
票と被照合帳票のフィールド領域のサイズを合致させる
ための変形量を算出するフィールド情報比較手段と、 各照合用帳票についての個々フォーマット情報を前記算
出された変形量により修正して修正フォーマット情報を
生成するフォーマット情報修正手段と、 この修正フォーマット情報が前記被照合帳票について生
成されたフォーマット情報と一定範囲で合致する照合用
帳票を選択する照合手段と、 を備えることを特徴とする帳票照合装置。
5. A collation form including format information including a reference position of a field area in which a field for writing a character or the like is formed, and a formation position of each field represented by a relative value from the reference position. Format information storage means stored for each field, and specifying the field area from the collated form included in the input image and forming individual fields represented by a reference position of the specified field area and a relative value from the reference position. Format information generating means for generating format information including a position, and comparing the format information of each collation form with the format information generated for the collated form, the size of the field area of the collation form and the collated form. Field information comparison means for calculating the amount of deformation for matching Format information correcting means for correcting the individual format information according to the calculated amount of deformation to generate corrected format information; and a collating unit for which the corrected format information matches the format information generated for the collated form in a certain range. A form collating apparatus, comprising: a collating means for selecting a form.
【請求項6】 前記照合手段は、照合用帳票の修正フォ
ーマット情報と被照合帳票について生成されたフォーマ
ット情報とを個々のフィールド毎に照合し、一致しない
フィールドが存在する場合は、さらに、被照合帳票の一
のフィールドと各照合用帳票のフィールド領域内で互い
に隣接する複数フィールド毎、または、各照合用帳票の
一のフィールドと被照合帳票のフィールド領域内で互い
に隣接する複数のフィールド毎に照合することを特徴と
する請求項5記載の帳票照合装置。
6. The collating means collates the corrected format information of the collation form with the format information generated for the collated form for each individual field. Match every field adjacent to each other in one field of the form and each field of the form for collation, or multiple fields adjacent to each other in the field area of each field of the form to be collated with each other in the field area of each form for collation 6. The form collating apparatus according to claim 5, wherein:
【請求項7】 コンピュータ装置によって読み取られ、
該コンピュータ装置によって実行される命令群を実体化
して、帳票照合に対する処理ステップを前記コンピュー
タ装置上で実現する命令記憶媒体であって、 前記処理ステップは、 入力画像に含まれる被照合帳票から文字等を記入するた
めのフィールドが形成されているフィールド領域を特定
するステップと、 予め保持されている複数の照合用帳票のそれぞれのフィ
ールド領域と前記特定された被照合帳票のフィールド領
域のサイズを合致させるステップと、 フィールド領域のサイズが合致した各照合用帳票と被照
合帳票の個々のフィールド間の対応関係の有無、被照合
帳票のフィールドと各照合用帳票のフィールド領域内で
互いに隣接する複数フィールドからなる統合フィールド
との対応関係の有無、または各照合用帳票のフィールド
と被照合帳票のフィールド領域内で互いに隣接する複数
のフィールドからなる統合フィールドとの対応関係の有
無のいずれかを判定し、一定範囲で対応する照合用帳票
を選択するステップと、 を含むことを特徴とする命令記憶媒体。
7. A computer readable by a computer device,
An instruction storage medium for realizing a processing step for form collation on the computer apparatus by materializing an instruction group to be executed by the computer apparatus, wherein the processing step comprises: Specifying a field area in which a field for writing a field is formed; and matching the size of each of the field areas of the plurality of collation forms held in advance with the specified field area of the collated form. Step and whether or not there is a correspondence relationship between each matching form and the individual field of the collated form where the size of the field area is matched, from multiple fields adjacent to each other in the field of the collated form and the field area of each collated form Whether there is a corresponding relationship with the integrated field or Determining whether or not there is a corresponding relationship with an integrated field consisting of a plurality of fields adjacent to each other within a field area of the collation form, and selecting a corresponding collation form within a certain range, Instruction storage medium to perform.
JP8180959A 1996-07-10 1996-07-10 Form collation method and apparatus Pending JPH1027208A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8180959A JPH1027208A (en) 1996-07-10 1996-07-10 Form collation method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8180959A JPH1027208A (en) 1996-07-10 1996-07-10 Form collation method and apparatus

Publications (1)

Publication Number Publication Date
JPH1027208A true JPH1027208A (en) 1998-01-27

Family

ID=16092280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8180959A Pending JPH1027208A (en) 1996-07-10 1996-07-10 Form collation method and apparatus

Country Status (1)

Country Link
JP (1) JPH1027208A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007157171A (en) * 2007-01-29 2007-06-21 Fujitsu Ltd Slip collation device
JP2013114678A (en) * 2011-11-30 2013-06-10 Sharp Corp Image determination device and program
JP2016081380A (en) * 2014-10-20 2016-05-16 富士通フロンテック株式会社 Business form processing program and business form processing device
JP2016126636A (en) * 2015-01-07 2016-07-11 コニカミノルタ株式会社 Document identification device and program
WO2020157937A1 (en) * 2019-01-31 2020-08-06 株式会社Pfu Image processing device, control method, and control program
JP2022150300A (en) * 2021-03-26 2022-10-07 キヤノンマーケティングジャパン株式会社 Information processing device, information processing method, and program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007157171A (en) * 2007-01-29 2007-06-21 Fujitsu Ltd Slip collation device
JP2013114678A (en) * 2011-11-30 2013-06-10 Sharp Corp Image determination device and program
JP2016081380A (en) * 2014-10-20 2016-05-16 富士通フロンテック株式会社 Business form processing program and business form processing device
JP2016126636A (en) * 2015-01-07 2016-07-11 コニカミノルタ株式会社 Document identification device and program
WO2020157937A1 (en) * 2019-01-31 2020-08-06 株式会社Pfu Image processing device, control method, and control program
JP2022150300A (en) * 2021-03-26 2022-10-07 キヤノンマーケティングジャパン株式会社 Information processing device, information processing method, and program

Similar Documents

Publication Publication Date Title
JP7013182B2 (en) Information processing equipment, information processing methods and programs
JPH113430A (en) Method for associating input image with reference image, device therefor, and storage medium storing program for implementing the method
JPH08293001A (en) Image processing apparatus, optical character recognition apparatus and methods thereof
JP3636809B2 (en) Image processing method
US7889926B2 (en) Image dictionary creating apparatus, coding apparatus, image dictionary creating method
JP2018055255A (en) Information processing apparatus, information processing method, and program
US8009909B2 (en) Image processing apparatus and its method
US6947596B2 (en) Character recognition method, program and recording medium
US20060008113A1 (en) Image processing system and image processing method
EP0899679B1 (en) Line direction deciding device, image inclination detecting device and image inclination correction device
JPH1027208A (en) Form collation method and apparatus
JP2898562B2 (en) License plate determination method
JP4651876B2 (en) PATTERN IDENTIFICATION DEVICE, PATTERN IDENTIFICATION METHOD, AND PATTERN IDENTIFICATION PROGRAM
JP5691547B2 (en) Image change location extraction device, image change location display device, and program
JP2017138743A (en) Image processing apparatus, image processing method, and program
JP4281236B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium storing image recognition program
JP2868134B2 (en) Image processing method and apparatus
JP3689485B2 (en) Form recognition method
US6678427B1 (en) Document identification registration system
KR102239564B1 (en) System and method for object recognition different by administrative area
JP2000076378A (en) Character recognizing method
KR101991461B1 (en) Character recognition system and method using vectorization of feature points
JP5109548B2 (en) Image processing apparatus and program
JPH10208040A (en) Image processing method and recording medium
JPH10261047A (en) Character recognition device