JPH0696273A - Recognition field retrieving method in business form reader - Google Patents

Recognition field retrieving method in business form reader

Info

Publication number
JPH0696273A
JPH0696273A JP4247709A JP24770992A JPH0696273A JP H0696273 A JPH0696273 A JP H0696273A JP 4247709 A JP4247709 A JP 4247709A JP 24770992 A JP24770992 A JP 24770992A JP H0696273 A JPH0696273 A JP H0696273A
Authority
JP
Japan
Prior art keywords
recognition field
image data
character
image
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4247709A
Other languages
Japanese (ja)
Inventor
Masayuki Morita
正行 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4247709A priority Critical patent/JPH0696273A/en
Publication of JPH0696273A publication Critical patent/JPH0696273A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 帳票読み取り装置における認識フィールド検
索方法に関し、帳票の搬送中のたわみにも対応できる認
識フィールド検索方法を提供することを目的とするもの
である。 【構成】 帳票Sをイメージセンサ24によって読み取
って得た画像データを一旦画像メモリ40に収納し、該
画像メモリ40に収納された画像データより認識フィー
ルドIの位置の文字を検出して、文字データに変換する
ことによって帳票に記載された内容を読み取る帳票読み
取り装置において、上記画像メモリ40よりの画像デー
タの読み出し方向を帳票Sの縦方向に直角とするように
している。上記縦方向として、縦方向認識フィールド位
置に対応する帳票Sの左縦端縁又は右縦端縁より上下
に沿って所定ドット離れた2位置を結ぶ線を求め、
該2位置を結ぶ線に対して、位置より直角な方向
の線を得、該線に基づいて画像データの読み出しを行う
ようにする。
(57) [Abstract] [Purpose] It is an object of the present invention to provide a recognition field search method for a form reading device, which is capable of coping with flexure during conveyance of a form. [Structure] Image data obtained by reading a form S by an image sensor 24 is temporarily stored in an image memory 40, and a character at a position of a recognition field I is detected from the image data stored in the image memory 40 to obtain character data. In the form reading device that reads the contents described in the form by converting the form into the form, the reading direction of the image data from the image memory 40 is set to be perpendicular to the vertical direction of the form S. As the vertical direction, a line connecting two positions vertically separated by a predetermined dot from the left vertical edge or the right vertical edge of the form S corresponding to the vertical recognition field position is obtained.
A line perpendicular to the position connecting the two positions is obtained, and the image data is read based on the line.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は帳票読み取り装置に関
し、特に帳票読み取り装置における認識フィールド検索
方法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a form reading device, and more particularly to a recognition field searching method in the form reading device.

【0002】[0002]

【従来技術】図3は帳票読み取り装置の機械系の概要を
示す側面図、図4は帳票読み取り装置の電気系ブロック
図を示すものである。
2. Description of the Related Art FIG. 3 is a side view showing an outline of a mechanical system of a form reading device, and FIG. 4 is a block diagram of an electric system of the form reading device.

【0003】ホッパ10に載置された帳票Sはピックロ
ーラ11で搬送手段に送り込まれる。搬送経路の途中に
は走査手段20が設けられ、光源21よりの光がスリッ
ト状に集光されて搬送経路に直角に照射される。
The form S placed on the hopper 10 is sent to the conveying means by the pick roller 11. The scanning means 20 is provided in the middle of the transportation path, and the light from the light source 21 is condensed in a slit shape and is irradiated onto the transportation path at a right angle.

【0004】このような構成に基づいて帳票Sが搬送経
路に送り込まれて、光源21よりの光が帳票Sに照射さ
れたとき、その反射光は折り返しミラー22とレンズ2
3を介してイメージセンサ24に入力される。ここで、
帳票Sに記載された文字が光電変換されてアナログの画
像データを得る。
Based on such a structure, when the form S is sent into the conveyance path and the light from the light source 21 is applied to the form S, the reflected light is reflected by the folding mirror 22 and the lens 2.
3 is input to the image sensor 24. here,
The characters written on the form S are photoelectrically converted to obtain analog image data.

【0005】イメージセンサ24で得られたアナログの
画像データはアンプ31を介してA/D変換器32でデ
ィジタルデータに変換され、その後2値化手段33で所
定のスライスレベルで2値化されて画像メモリ40に収
納される。
The analog image data obtained by the image sensor 24 is converted into digital data by an A / D converter 32 via an amplifier 31, and then binarized by a binarizing means 33 at a predetermined slice level. It is stored in the image memory 40.

【0006】このように画像メモリ40に収納された画
像データより文字抽出手段41で1文字ずつその特徴を
抽出し、認識処理手段42で認識辞書43より得られた
基準データを受けとって認識処理を行うようになってい
る。
In this way, the character extraction means 41 extracts the characteristics of each character from the image data stored in the image memory 40, and the recognition processing means 42 receives the reference data obtained from the recognition dictionary 43 and performs the recognition processing. I am supposed to do it.

【0007】図5は上記構成において画像データの取り
込みから文字認識に至る手順を示すものであり、図6
は、その説明図である。ホストCPU50は予め帳票上
の文字認識すべき範囲(以下認識フィールドという)位
置を位置情報として持っており、帳票Sの読み取りに先
立って、該位置情報が認識処理手段42に伝送される
(図5、F111)。次いで、帳票が読み取られ、この
とき、帳票が斜行又は蛇行して読み取り不能であるとき
には、再読み取りがなされる(図5、F112)。そし
て、この読み取りによって得られた画像データが画像メ
モリ40に収納される(図5、F113)。
FIG. 5 shows the procedure from the acquisition of image data to the character recognition in the above configuration.
Is an explanatory diagram thereof. The host CPU 50 has a position in the character recognition range (hereinafter referred to as a recognition field) on the form as position information in advance, and the position information is transmitted to the recognition processing means 42 prior to reading the form S (FIG. 5). , F111). Next, the form is read, and at this time, when the form is skewed or meandering and unreadable, rereading is performed (FIG. 5, F112). Then, the image data obtained by this reading is stored in the image memory 40 (FIG. 5, F113).

【0008】画像メモリ40より画像データを読み出す
とき、まず、画像メモリ40内での帳票S以外の部分
(例えば“1”で表されている)と帳票部分(例えば端
縁部より少なくとも3mmは“0”で表されている)の境
界を読み取って先端縁M0 (図6参照)を決定するとと
もに、その先端縁M0 での走査起点Aと走査終点Bを求
める(図5、F114)。このようにして帳票の先端縁
0 が求められると、それに対して平行に読み出しが開
始される。
When reading image data from the image memory 40, first, a portion other than the form S in the image memory 40 (for example, represented by "1") and a form portion (for example, at least 3 mm from the edge portion is " 0 ") is read to determine the leading edge M 0 (see FIG. 6), and the scanning start point A and scanning end point B at the leading edge M 0 are determined (FIG. 5, F114). When the leading edge M 0 of the form is obtained in this way, reading is started in parallel with it.

【0009】上記したようにホストCPU50は予め帳
票S上の認識フィールドIa…位置を位置情報として持
っており、該認識フィールドIa…の位置情報(通常認
識フィールドの縦方向中間位置)に基づいて該認識フィ
ールドIa…内の文字の抽出が行われる(図5、F11
5)。すなわち、図6に示すように帳票Sの縦方向m1
の位置に3文字の認識フィールドIcがあるとすると、
上記縦方向m1 を起点に上記先端縁M0 に平行に最初の
文字の書き込まれている位置まで探索し、ここで各文字
をホストCPU50から伝送された定義フォーマットで
定める大きさの枠内の画像データを探索する。もし、こ
のとき文字の書き込まれている位置を検索し得なかった
ときは、上記定義された枠より大きな枠(例えば長さで
1.5倍)の枠内の画像データを探索する(図5、F1
15a、F115b)。
As described above, the host CPU 50 previously holds the recognition field Ia ... Position on the form S as the position information, and based on the position information of the recognition field Ia .. (the vertical middle position of the normal recognition field). Characters in the recognition field Ia ... Are extracted (FIG. 5, F11).
5). That is, as shown in FIG. 6, the vertical direction m 1 of the form S is
If there is a 3-character recognition field Ic at the position of,
Searching from the vertical direction m 1 as a starting point to a position where the first character is written in parallel with the leading edge M 0 , each character is within a frame of a size determined by the definition format transmitted from the host CPU 50. Search image data. If the position where the character is written cannot be retrieved at this time, image data in a frame larger than the above-defined frame (for example, 1.5 times in length) is searched (FIG. 5). , F1
15a, F115b).

【0010】その後、各文字の中心位置を決めて特徴を
抽出し、文字認識を行う。更にこの作業は、1つの認識
フィールドに属する文字を左から右に、また、1つの帳
票に属する認識フィールドの上から下に順になされる
(F117)(F118)。
After that, the center position of each character is determined, the feature is extracted, and the character is recognized. Further, this work is performed in the order of the characters belonging to one recognition field from left to right and from the top to the bottom of the recognition field belonging to one form (F117) (F118).

【0011】[0011]

【発明が解決しようとする課題】上記従来の方法は帳票
先端縁M0 に平行に画像メモリ40から画像データを読
み出すようになっている。一方、帳票Sとして使用され
る用紙は、たわみの少ない厚みのある用紙ばかりでな
く、かなり薄い用紙も使用される。従って、図6(a)
に示すように搬送手段で正常に搬送された場合に問題は
ないが、図6(b)に示すように最初は正常(搬送方向
に多少斜きがあってもよいが、途中で左右いずれかの方
向にたわみがない状態)に送り込まれても、途中から何
等かの原因で左右にたわみが生じることがある。
According to the above-mentioned conventional method, the image data is read out from the image memory 40 in parallel with the leading edge M 0 of the form. On the other hand, as the sheet used as the form S, not only a thick sheet with little bending but also a considerably thin sheet is used. Therefore, FIG.
As shown in FIG. 6, there is no problem when the paper is normally conveyed by the conveying means. However, as shown in FIG. Even if it is fed in the direction where there is no bending in the direction of, the bending may occur from side to side for some reason.

【0012】ところが、上記したようにホストCPU5
0は文字のある認識フィールドIa…の位置を位置情報
として持っているので、帳票が途中からたわみはじめる
と、先端縁M0 からの距離m1 の左端からl1 の位置に
あるはずの認識フィールドIa…が、図6(b)に示す
ように、ない場合が生じる。この現象は図6(b)の走
査線nに示すように、走査始点(上記先端縁からの距
離)m1 からの走査距離が長い程顕著に現れる。この場
合にはこの帳票Sの認識フィールドIC内に記載された
文字は、読み取り不能文字あるいは誤文字として認識処
理されることになる。
However, as described above, the host CPU 5
Since 0 has the position of the recognition field Ia with characters as position information, when the form begins to bend halfway, the recognition field supposed to be at the position l 1 from the left end of the distance m 1 from the leading edge M 0. There is a case where Ia ... Is absent as shown in FIG. 6 (b). This phenomenon becomes more prominent as the scanning distance from the scanning start point (distance from the leading edge) m 1 becomes longer, as shown by the scanning line n in FIG. 6B. In this case, the characters written in the recognition field IC of the form S are recognized as unreadable characters or erroneous characters.

【0013】この発明は上記従来の事情に鑑みて提案さ
れたものであって、帳票の搬送中のたわみにも対応でき
る認識フィールド検索方法を提供することを目的とする
ものである。
The present invention has been proposed in view of the above conventional circumstances, and it is an object of the present invention to provide a recognition field search method capable of coping with a flexure of a form during conveyance.

【0014】[0014]

【課題を解決するための手段】この発明は上記目的を達
成するために以下の手段を採用している。すなわち、例
えば図1に示すように、帳票Sをイメージセンサ24に
よって読み取って得た画像データを一旦画像メモリ40
に収納し、該画像メモリ40に収納された画像データよ
り認識フィールドIの位置の文字を検出して、文字デー
タに変換することによって帳票に記載された内容を読み
取る帳票読み取り装置において、上記画像メモリ40よ
りの画像データの読み出し方向を帳票Sの縦方向に直角
とするようにしている。
The present invention employs the following means in order to achieve the above object. That is, for example, as shown in FIG. 1, the image data obtained by reading the form S by the image sensor 24 is temporarily stored in the image memory 40.
In the form reading device for reading the contents described in the form by detecting the character at the position of the recognition field I from the image data stored in the image memory 40 and converting it into the character data, The reading direction of the image data from 40 is perpendicular to the vertical direction of the form S.

【0015】上記縦方向として、縦方向認識フィールド
位置に対応する帳票Sの左縦端縁又は右縦端縁より上
下に沿って所定ドット離れた2位置を結ぶ線を求
め、該2位置を結ぶ線に対して、該位置より直角
な方向の線を得、該線に基づいて画像データの読み出し
を行うようにする。
As the vertical direction, a line connecting two positions vertically separated by a predetermined dot from the left vertical edge or the right vertical edge of the form S corresponding to the vertical recognition field position is obtained, and the two positions are connected. A line perpendicular to the position is obtained with respect to the line, and the image data is read based on the line.

【0016】[0016]

【作用】画像メモリ40上の帳票Sの輪郭線より帳票S
の左端(又は右端)縁を求めることができる。帳票Sに
ゆがみがある場合、ホストCPU50の持つ認識フィー
ルド位置情報と上記左端(右端)縁より直角な線より検
出される実際の認識フィールド位置とは多少の誤差はあ
る。しかしながら、従来のように左端(右端)縁から遠
く離れるに従ってその誤差が大きくなることはなく、従
って解読不能になることはない。
[Function] From the contour line of the form S on the image memory 40, the form S
The left (or right) edge of the can be determined. When the form S is distorted, there is some error between the recognition field position information held by the host CPU 50 and the actual recognition field position detected from the line perpendicular to the left end (right end) edge. However, the error does not increase as the distance from the left edge (right edge) increases as in the conventional case, and thus the error does not become unreadable.

【0017】[0017]

【実施例】図1は本発明の一実施例を示す概念図であ
り、図2は本発明の手順を示すフロー図である。
1 is a conceptual diagram showing an embodiment of the present invention, and FIG. 2 is a flow chart showing the procedure of the present invention.

【0018】まず、作業に先立って認識処理手段42に
予めホストCPU50に入力した帳票フォーマット定義
体の取り込みがなされる(図2、F111)。次いで、
搬送手段と読み取り手段20を駆動して画像データの読
み取りを行い、画像データを画像メモリ40に収納する
(図2、F112→F113)。以上は図5に示した従
来例と同じである。
First of all, prior to the work, the form processing unit 42 previously input to the host CPU 50 is loaded into the recognition processing means 42 (FIG. 2, F111). Then
The conveying means and the reading means 20 are driven to read the image data, and the image data is stored in the image memory 40 (FIG. 2, F112 → F113). The above is the same as the conventional example shown in FIG.

【0019】そして、ホストCPU50より得られた帳
票フォーマットより指定された認識フィールド位置を検
出、すなわち、図1(a) において認識フィールドI1
位置に対応する帳票Sの左端縁位置を検出する(F
1)。次いで、上記位置よりXビット(Xは例えば数
ビット)上昇した位置での位置を得、更に上記位置
よりXビット下降した位置を得る(F2→F3)。
Then, the recognition field position designated by the form format obtained from the host CPU 50 is detected, that is, the left edge position of the form S corresponding to the position of the recognition field I 1 in FIG. 1A is detected ( F
1). Then, a position is obtained at a position that is X bits higher (X is several bits, for example) from the above position, and a position that is X bits lower than the above position is obtained (F2 → F3).

【0020】そして、上記位置を結んだ線に対して
位置を基点に直角方向ラインに沿ってスキャンニン
グをする(F4)。これによって図5に示したと同様認
識フィールドI1 内の記入文字の検索を行い、検出され
た文字の位置決めを行う(F115→F116)ことが
可能となる。ここで、文字が検出できないときには許容
された範囲(例えばフォーマット定義で定めた大きさの
枠の1.5倍の寸法範囲)を探索し、文字の検出を行
う。ここで、文字の検出ができないときには読み取り不
能処理がなされ、更に、このようにして検出された文字
を順次認識処理することになる(F117、F11
8)。
Then, with respect to the line connecting the above-mentioned positions, scanning is performed along a line perpendicular to the position (F4). As a result, similarly to the case shown in FIG. 5, it is possible to search for a written character in the recognition field I 1 and position the detected character (F115 → F116). Here, when a character cannot be detected, an allowable range (for example, a size range of 1.5 times the size of the frame defined by the format definition) is searched to detect the character. Here, when the character cannot be detected, the unreadable process is performed, and further the character thus detected is sequentially recognized (F117, F11).
8).

【0021】以上のようにして文字検索のためのスキャ
ンニングを行うと、左端縁に対して直角のスキャンニン
グができ、たとえ、搬送途中で帳票に多少のたわみがで
きたとしても、ホストCPU50が認識している認識フ
ィールド位置と実際の認識フィールド位置が大きくずれ
ることがなく、リジェクトされる確率が少なくなる。
When the scanning for character retrieval is performed as described above, the scanning at a right angle to the left edge can be performed, and even if the form is slightly bent during conveyance, the host CPU 50 The recognized recognition field position and the actual recognition field position do not largely shift, and the probability of rejection is reduced.

【0022】尚、上記実施例では帳票の左端縁に直角に
スキャンニングする場合についてのみ説明したが、図1
(b)に示すように、右端縁を基準にして認識フィール
ドI 3,4 の中の文字を検索してもよいことはもちろん
である。
In the above embodiment, the left edge of the form is at a right angle.
Only the case of scanning was explained, but Fig. 1
As shown in (b), the recognition field is based on the right edge.
Do I 3,IFourOf course, you can search for characters in
Is.

【0023】[0023]

【発明の効果】本発明は上記したように帳票の縦方向に
直角に画像メモリより画像データを読み出すようにして
いるので、帳票搬送時に帳票のたわみによって生じた位
置ずれによる認識フィールドの登録位置と実際の位置と
の間に大きな誤差が生じず、再読み取り作業をする必要
が少なくなる効果がある。
As described above, according to the present invention, the image data is read out from the image memory at right angles to the vertical direction of the form. Therefore, the registration position of the recognition field due to the positional deviation caused by the bending of the form during conveyance of the form can be obtained. There is an effect that a large error does not occur between the actual position and the need for rereading work.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例概念図である。FIG. 1 is a conceptual diagram of an embodiment of the present invention.

【図2】本発明の手順を示すフロー図である。FIG. 2 is a flow chart showing a procedure of the present invention.

【図3】帳票読み取り装置の機械系構成概念図である。FIG. 3 is a conceptual diagram of a mechanical system configuration of a form reading device.

【図4】帳票読み取り装置の電気系構成を示すブロック
図である。
FIG. 4 is a block diagram showing an electrical system configuration of a form reading device.

【図5】従来例フロー図である。FIG. 5 is a flowchart of a conventional example.

【図6】従来の欠点を説明する概念図である。FIG. 6 is a conceptual diagram illustrating a conventional defect.

【符号の説明】[Explanation of symbols]

A 帳票 I 認識フィールド 24 イメージセンサ 40 画像メモリ A form I recognition field 24 image sensor 40 image memory

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 帳票(S) をイメージセンサ(24)によって
読み取って得た画像データを一旦画像メモリ(40)に収納
し、該画像メモリ(40)に収納された画像データより認識
フィールド(I) の位置の文字を検出して、文字データに
変換することによって帳票に記載された内容を読み取る
帳票読み取り装置において、 上記画像メモリ(40)よりの画像データの読み出し方向を
帳票(S) の縦方向に直角としたことを特徴とする帳票読
み取り装置における認識フィールド検索方法。
1. The image data obtained by reading the form (S) by the image sensor (24) is once stored in the image memory (40), and the recognition field (I) is stored from the image data stored in the image memory (40). ), The character at the position is detected and converted into character data to read the contents described in the form.In the form reading device, the reading direction of the image data from the image memory (40) is set to the vertical direction of the form (S). A method for retrieving a recognition field in a form reading device, which is perpendicular to the direction.
【請求項2】 縦方向認識フィールド位置に対応する
帳票(S) の左縦端縁又は右縦端縁より上下に沿って所定
ドット離れた2位置を結ぶ線に対して直角な方向の
線を得、該線に基づいて画像データの読み出しを行う請
求項1に記載の帳票読み取り装置における認識フィール
ド検索方法。
2. A line in a direction perpendicular to a line connecting two positions vertically separated by a predetermined dot from the left vertical edge or the right vertical edge of the form (S) corresponding to the vertical recognition field position. The recognition field search method in a form reading device according to claim 1, wherein the image data is read based on the line.
JP4247709A 1992-09-17 1992-09-17 Recognition field retrieving method in business form reader Withdrawn JPH0696273A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4247709A JPH0696273A (en) 1992-09-17 1992-09-17 Recognition field retrieving method in business form reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4247709A JPH0696273A (en) 1992-09-17 1992-09-17 Recognition field retrieving method in business form reader

Publications (1)

Publication Number Publication Date
JPH0696273A true JPH0696273A (en) 1994-04-08

Family

ID=17167501

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4247709A Withdrawn JPH0696273A (en) 1992-09-17 1992-09-17 Recognition field retrieving method in business form reader

Country Status (1)

Country Link
JP (1) JPH0696273A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020170758A1 (en) * 2019-02-18 2020-08-27 株式会社ロゼッタ Recognition device, wearable character recognition device, recognition method, and recognition program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020170758A1 (en) * 2019-02-18 2020-08-27 株式会社ロゼッタ Recognition device, wearable character recognition device, recognition method, and recognition program

Similar Documents

Publication Publication Date Title
JPH0564834B2 (en)
JPH0696273A (en) Recognition field retrieving method in business form reader
EP0076332A1 (en) Optical character reader with pre-scanner
JPH0728935A (en) Document image processor
JPH0228785A (en) Optical character reading device
JP2768814B2 (en) Optical character reader
JPH039506B2 (en)
JPS61289476A (en) Format forming system for character reader
JPH036552B2 (en)
JP2000210624A (en) Postal address recognition device
JPS63136181A (en) Character reader
JPS63211082A (en) Character reader
JP2744237B2 (en) Recognition control method
JPH11250179A (en) Character reocognition device and its method
JPS5836391B2 (en) optical character reader
JP2823350B2 (en) Multimedia input device
JPH03123989A (en) Character recognition device
JP2002024743A (en) Image reading system and image reading method
JP2001259532A (en) Reader, sheet processing apparatus, reading method, and sheet processing method
JPS5860381A (en) Skew detection method
JPH0272497A (en) Optical character reader
JPH03250387A (en) Character segmenting system
JPH0340430B2 (en)
JPH01197890A (en) Inclined character recognizing system
JPH05174184A (en) Optical character reader

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19991130