JPH0765111A - Optical character recognition device - Google Patents

Optical character recognition device

Info

Publication number
JPH0765111A
JPH0765111A JP5213048A JP21304893A JPH0765111A JP H0765111 A JPH0765111 A JP H0765111A JP 5213048 A JP5213048 A JP 5213048A JP 21304893 A JP21304893 A JP 21304893A JP H0765111 A JPH0765111 A JP H0765111A
Authority
JP
Japan
Prior art keywords
information
item
result data
character recognition
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5213048A
Other languages
Japanese (ja)
Inventor
Toshihiro Nakamura
敏浩 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5213048A priority Critical patent/JPH0765111A/en
Publication of JPH0765111A publication Critical patent/JPH0765111A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字を読み取るための指定操作が容易であり
ながら、文字認識後のデータ処理に伴う負担が小さい光
学的文字認識装置を提供する。 【構成】 本装置は、レイアウト情報作成部70、出力
順序情報作成部71、記憶部6、文字認識部3を有す
る。指定操作によりレイアウト情報及び出力順序情報を
作成でき、帳票識別情報を指定すると、文字認識部3
は、指定された項目順序に従って各項目に対応する認識
結果データを出力する。これにより、指定操作が容易で
ありながら、処理対象とする帳票の実際の項目順序に拘
らず、出力順序が統一された認識結果データを得ること
ができる。
(57) [Abstract] [Purpose] To provide an optical character recognizing device which can easily perform a designation operation for reading a character and has a small load associated with data processing after character recognition. [Arrangement] This apparatus has a layout information creation unit 70, an output order information creation unit 71, a storage unit 6, and a character recognition unit 3. The layout information and the output sequence information can be created by the designation operation, and when the form identification information is designated, the character recognition unit 3
Outputs recognition result data corresponding to each item in the designated item order. As a result, it is possible to obtain the recognition result data in which the output order is unified regardless of the actual item order of the form to be processed, though the specifying operation is easy.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、光学的文字認識装置
(OCR)に関する。
FIELD OF THE INVENTION The present invention relates to an optical character recognition device (OCR).

【0002】[0002]

【従来の技術】OCRが帳票に記入された文字を認識す
る方法を大別すると、従来より次の3通りの方法が知ら
れている。
2. Description of the Related Art The methods of recognizing characters written on a form by OCR are roughly classified into the following three methods.

【0003】第1の方法は、予め読取領域(フィール
ド)の座標、読取桁数、字種等を指定したテーブル(F
C情報)を作成しておき、そのFC情報に基づいてOC
Rが文字を認識する方法である。第2の方法は、予め読
取領域のレイアウト情報(LC情報)を作成しておき、
そのLC情報に基づいてOCRが読取領域を判別して、
文字を認識する方法である。第3の方法は、OCRが光
学的走査(スキャン)により得られた帳票イメージから
読取領域を自動判別して文字を認識する方法である。な
お、第1の方法によるOCRは、帳票OCRと称せら
れ、第2及び第3の方法によるOCRは、テキストリー
ダと称せられている。
The first method is a table (F) in which the coordinates of the reading area (field), the number of digits to be read, the type of character, etc. are designated in advance.
(C information) is created in advance, and OC is performed based on the FC information.
R is a method for recognizing characters. In the second method, the layout information (LC information) of the reading area is created in advance,
The OCR determines the reading area based on the LC information,
This is a method of recognizing characters. The third method is a method in which the OCR automatically recognizes a reading area from a form image obtained by optical scanning and recognizes a character. The OCR according to the first method is called a form OCR, and the OCRs according to the second and third methods are called a text reader.

【0004】帳票OCRは、認識結果が読取領域の座標
等を指定した通りに得られるため、チェック、編集、演
算等の豊富な機能を実現でき、認識結果がどのような項
目に関するものかが容易に判別できるので、認識結果デ
ータの取扱いが容易となるという長所を有しているが、
各種指定を厳密に行う必要があるため指定に手間がかか
るという欠点を有している。
In the form OCR, since the recognition result is obtained as the coordinates of the reading area are specified, a variety of functions such as checking, editing, and calculation can be realized, and it is easy to know what item the recognition result relates to. However, it has the advantage that the recognition result data can be handled easily.
Since it is necessary to strictly specify each kind of specification, there is a drawback that it takes time and effort to specify.

【0005】一方、テキストリーダは、第2の方法の場
合でもレイアウトの指定が容易に行えるという長所を有
するが、認識結果データが何れの項目に該当するかを判
断することが困難であるという欠点を有する。このた
め、文字認識後のデータ処理に伴う負担が大きくなる。
On the other hand, the text reader has an advantage that the layout can be easily specified even in the case of the second method, but it is difficult to judge which item the recognition result data corresponds to. Have. For this reason, the load of data processing after character recognition increases.

【0006】[0006]

【発明が解決しようとする課題】従って、例えば、振込
依頼書のようにフォーマットが互いに異なる複数の帳票
を集計する場合に、銀行名、支店名、口座番号、受取人
名等の各項目の配列順序が統一されていないため、帳票
OCRでは、指定に手間がかかるという問題があり、テ
キストリーダでは、認識結果データの処理が容易でない
という問題を生ずる。
Therefore, for example, when a plurality of forms having different formats such as a transfer request form are totaled, the arrangement order of each item such as a bank name, a branch name, an account number and a payee name is arranged. However, the form OCR has a problem that it takes a lot of time to specify, and the text reader has a problem that it is not easy to process the recognition result data.

【0007】そこで、本発明は、上記事情に鑑みてなさ
れたものであり、文字を読み取るための指定操作が容易
でありながら、文字認識後のデータ処理に伴う負担が小
さい光学的文字認識装置を提供することを目的とする。
Therefore, the present invention has been made in view of the above circumstances, and provides an optical character recognition device which is easy to perform a designation operation for reading a character but has a small load associated with data processing after character recognition. The purpose is to provide.

【0008】[0008]

【課題を解決するための手段】上記目的を達成するため
に請求項1記載の光学的文字認識装置は、任意の順序で
配列された複数の項目に対応して読取領域がそれぞれ設
けられた帳票を処理対象とし、その帳票の各読取領域に
記入された文字を読み取り、その認識結果データを出力
する光学的文字認識装置において、前記複数の項目のう
ち一部又は全部の項目を選択し、その項目順序を指定す
る指定手段と、この指定手段にて指定された項目順序に
従って各項目に対応する認識結果データを出力する出力
制御手段とを有することを特徴とするものである。
In order to achieve the above object, an optical character recognition device according to a first aspect of the present invention is a form in which reading areas are provided corresponding to a plurality of items arranged in an arbitrary order. In the optical character recognition device that reads the characters entered in each reading area of the form and outputs the recognition result data, select some or all of the plurality of items, and The present invention is characterized by having a specifying means for specifying an item order and an output control means for outputting recognition result data corresponding to each item in accordance with the item order specified by the specifying means.

【0009】また、請求項2記載の光学的文字認識装置
は、任意の順序で配列された複数の項目に対応して読取
領域がそれぞれ設けられた帳票を処理対象とし、その帳
票の各読取領域に記入された文字を読み取り、その認識
結果データを出力する光学的文字認識装置において、指
定操作に基づいて前記読取領域のレイアウト情報を作成
するレイアウト情報作成部と、指定操作に基づいて前記
複数の項目のうち選択された一部又は全部の項目に対応
する各認識結果データの出力順序情報を作成する出力順
序情報作成部と、前記レイアウト情報及び出力順序情報
を対応する帳票識別情報と共に記憶する記憶部と、指定
された帳票識別情報に対応するレイアウト情報及び出力
順序情報を前記記憶部から読み出し、その読み出したレ
イアウト情報及び出力順序情報に基づいて各読取領域に
記入された文字について認識処理を行った後、指定され
た項目順序に従って各項目に対応する認識結果データを
出力する文字認識部とを有することを特徴とするもので
ある。
The optical character recognition device according to a second aspect of the present invention processes a form in which reading areas are provided corresponding to a plurality of items arranged in an arbitrary order, and the reading areas of the form are processed. In the optical character recognition device for reading the character entered in and outputting the recognition result data, a layout information creation unit for creating layout information of the reading area based on a designation operation, and the plurality of layout information based on the designation operation. An output order information creation unit that creates output order information of each recognition result data corresponding to some or all of the selected items, and a storage that stores the layout information and the output order information together with the corresponding form identification information. Section, layout information and output order information corresponding to the specified form identification information are read from the storage section, and the read layout information and And a character recognition unit for outputting recognition result data corresponding to each item according to a specified item order after performing a recognition process on the characters written in each reading area based on the force order information. It is a thing.

【0010】また、請求項3記載の光学的文字認識装置
は、前記レイアウト情報及び出力順序情報が作成済みの
帳票識別情報の一覧表を作成する一覧表作成部を有する
ことを特徴とするものである。
An optical character recognition apparatus according to a third aspect of the present invention is characterized in that it has a list creation unit for creating a list of the form identification information for which the layout information and output order information have been created. is there.

【0011】[0011]

【作用】請求項1記載の光学的文字認識装置によれば、
指定手段にて項目を選択し、その項目順序を指定する
と、出力制御手段は指定された項目順序に従って各項目
に対応する認識結果データを出力する。これにより、指
定操作が容易でありながら、処理対象とする帳票の実際
の項目順序に拘らず、出力順序が統一された認識結果デ
ータを得ることができる。
According to the optical character recognition device of claim 1,
When an item is selected by the designating means and the item order is designated, the output control means outputs the recognition result data corresponding to each item in accordance with the designated item order. As a result, it is possible to obtain the recognition result data in which the output order is unified regardless of the actual item order of the form to be processed, though the specifying operation is easy.

【0012】請求項2記載の光学的文字認識装置によれ
ば、指定操作によりレイアウト情報及び出力順序情報を
作成でき、帳票識別情報を指定すると、文字認識部は、
指定された項目順序に従って各項目に対応する認識結果
データを出力する。これにより、指定操作が容易であり
ながら、処理対象とする帳票の実際の項目順序に拘ら
ず、出力順序が統一された認識結果データを得ることが
できる。
According to the optical character recognition device of the second aspect, the layout information and the output sequence information can be created by the designation operation, and when the form identification information is designated, the character recognition unit
The recognition result data corresponding to each item is output according to the specified item order. As a result, it is possible to obtain the recognition result data in which the output order is unified regardless of the actual item order of the form to be processed, though the specifying operation is easy.

【0013】請求項3記載の光学的文字認識装置によれ
ば、一覧表によりレイアウト情報及び出力順序情報が作
成済みか否かの判断が容易となり、操作者の負担軽減が
図れる。
According to the optical character recognition device of the third aspect, it becomes easy to judge whether or not the layout information and the output sequence information have been created based on the list, and the burden on the operator can be reduced.

【0014】[0014]

【実施例】以下、本発明の実施例を図面を参照して詳述
する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0015】図1は本発明の光学的文字認識装置の一実
施例を示す概略ブロック図である。
FIG. 1 is a schematic block diagram showing an embodiment of the optical character recognition device of the present invention.

【0016】同図に示す本実施例装置は、帳票10のイ
メージ11を検出するスキャナ部1と、その帳票イメー
ジ11を記憶するイメージバッファ2と、帳票10に記
入された文字を認識する文字認識部3と、検出された帳
票イメージ11等を表示する表示部4と、各種の指定操
作、入力操作等を行う入力部5と、後述するレイアウト
情報及び出力順序情報を記憶する記憶部6と、この装置
の各部を制御する制御部7とを有して構成されている。
The apparatus of this embodiment shown in FIG. 1 includes a scanner unit 1 for detecting an image 11 of a form 10, an image buffer 2 for storing the form image 11, and character recognition for recognizing characters written on the form 10. A unit 3, a display unit 4 for displaying the detected form image 11 and the like, an input unit 5 for performing various designation operations and input operations, and a storage unit 6 for storing layout information and output order information described below. The control unit 7 controls each unit of this apparatus.

【0017】次に、上記各部の詳細を説明する。Next, the details of each of the above parts will be described.

【0018】前記スキャナ部1は、光電変換素子を備
え、帳票10を光学的に走査して帳票イメージ11を検
出するものである。
The scanner unit 1 includes a photoelectric conversion element, and optically scans the form 10 to detect the form image 11.

【0019】前記文字認識部3は、イメージバッファ2
に記憶された帳票イメージ11から後述するレイアウト
情報に基づいて各読取領域(図2参照)13内及び項目
12の文字イメージを切り出し、文字認識辞書との照合
により類似度を求め、その類似度の高いものを認識結果
データとして出力するものである。その認識結果データ
は、後述する項目順序情報に従って、出力するようにな
っている。
The character recognizing unit 3 includes an image buffer 2
A character image of each reading area (see FIG. 2) 13 and the item 12 is cut out from the form image 11 stored on the basis of layout information described later, the similarity is obtained by collation with a character recognition dictionary, and the similarity is calculated. The higher one is output as the recognition result data. The recognition result data is output according to the item order information described later.

【0020】前記表示部4は、イメージバッファ2に記
憶された帳票イメージ11や操作者に対する操作の案内
情報等を対話形式で表示するものである。
The display unit 4 displays the form image 11 stored in the image buffer 2 and guidance information for operation for the operator in an interactive form.

【0021】前記入力部5は、マウス、キーボード等を
備え、帳票10上の文字を認識する上で必要な指定操作
例えば帳票10上の各項目12に対応して設けられた読
取領域13のレイアウトの指定を行うものであり、認識
結果後のデータ処理に必要な指定操作例えば各認識結果
データの出力順序の指定を行うものである。また、この
入力部5は、キーボードにより定義モード、読取モード
の如く各種のモードを選択できるようになっており、定
義モード又は読取モードを選択した際に、帳票10の識
別情報(依頼人コード)を入力できるようになってい
る。
The input section 5 is provided with a mouse, a keyboard and the like, and a designated operation necessary for recognizing characters on the form 10, for example, a layout of the reading area 13 provided corresponding to each item 12 on the form 10. The designation operation necessary for data processing after the recognition result, for example, the output order of each recognition result data is designated. In addition, the input unit 5 can select various modes such as a definition mode and a reading mode with a keyboard, and when the definition mode or the reading mode is selected, identification information (client code) of the form 10 is selected. You can enter.

【0022】前記記憶部6は、レイアウト情報を記憶す
るレイアウト情報記憶部60と、出力順序情報を記憶す
る出力順序情報記憶部61とを具備している。
The storage section 6 comprises a layout information storage section 60 for storing layout information and an output order information storage section 61 for storing output order information.

【0023】前記制御部7は、レイアウト情報作成部7
0及び出力順序情報作成部71を具備している。レイア
ウト情報作成部70は、入力部5での指定操作に基づい
てレイアウト情報を作成するものである。出力順序情報
作成部71は、入力部5での指定操作に基づいて項目1
2の出力順序情報を作成するものである。その作成した
レイアウト情報及び出力順序情報は、帳票10のフォー
マットを特定する識別情報(依頼人コード)と共に記憶
部6のレイアウト情報記憶部60及び出力順序情報記憶
部61にそれぞれ記憶するようになっている。本実施例
では、振込依頼書を読取対象としており、この振込依頼
書は依頼人の側でフォーマットが作成されているため、
依頼人コードを特定することにより、帳票10のフォー
マットが特定できるので、依頼人コードを識別情報とし
ている。なお、この識別情報は、帳票10のフォーマッ
トを特定できる情報であるなら、他の情報でもよい。
The control section 7 includes a layout information creating section 7
0 and an output order information creation unit 71 are provided. The layout information creation unit 70 creates layout information based on a designation operation on the input unit 5. The output sequence information creation unit 71 uses the input operation of the input unit 5 to specify the item 1
The second output order information is created. The created layout information and output order information are stored in the layout information storage unit 60 and the output order information storage unit 61 of the storage unit 6 together with the identification information (client code) for specifying the format of the form 10. There is. In this embodiment, the transfer request form is to be read, and the format of this transfer request form has been created on the client side.
Since the format of the form 10 can be specified by specifying the client code, the client code is used as the identification information. Note that this identification information may be other information as long as the information can identify the format of the form 10.

【0024】次に、本実施例の動作を図9,図10に示
すフローチャートに従って説明する。なお、図2に示す
帳票10を読取対象とする場合について説明する。読取
対象の帳票10上には、同図に示すように、任意の順序
で配列された複数の銀行名(上段)12a,支店名(下
段)12b,預金種目12c,口座番号12d,受取人
12e及び金額12f等の各項目12が設けられ、その
各項目12に対応して読取領域13がそれぞれ設けら
れ、各読取領域13に文字が記入されているとする。
Next, the operation of this embodiment will be described with reference to the flow charts shown in FIGS. The case where the form 10 shown in FIG. 2 is the reading target will be described. On the form 10 to be read, as shown in the figure, a plurality of bank names (upper row) 12a, branch names (lower row) 12b, deposit items 12c, account numbers 12d, and recipients 12e arranged in any order. It is assumed that each item 12 such as the amount of money 12f is provided, a reading area 13 is provided corresponding to each item 12, and a character is written in each reading area 13.

【0025】まず、図2に示す帳票10のフォーマット
が未登録であるとする。
First, it is assumed that the format of the form 10 shown in FIG. 2 has not been registered.

【0026】最初に操作者は、入力部5のキーボードを
操作して定義モードを選択し、帳票10の識別情報であ
る依頼人コードを入力する(S1)。
First, the operator operates the keyboard of the input section 5 to select the definition mode and inputs the client code which is the identification information of the form 10 (S1).

【0027】スキャナ部1は、制御部7の制御の下に、
新フォーマットの帳票10のイメージ11を検出し(S
2)、その帳票イメージ11をイメージバッファ2に記
憶する。
Under the control of the control unit 7, the scanner unit 1
The image 11 of the new format form 10 is detected (S
2) The form image 11 is stored in the image buffer 2.

【0028】制御部7は、イメージバッファ2に記憶さ
れた帳票イメージ11を表示部4に表示する(S3)。
その一例を図3に示す。同図に示すように、この表示画
面の左側には、スキャナ部1により検出された帳票イメ
ージ11が白黒の2値化データとして表示される。な
お、入力部5での操作により、画面右側には同図に示す
ように、画面左側の帳票イメージ11を部分的に拡大し
て表示することも可能である。
The control unit 7 displays the form image 11 stored in the image buffer 2 on the display unit 4 (S3).
An example thereof is shown in FIG. As shown in the figure, the form image 11 detected by the scanner unit 1 is displayed on the left side of the display screen as black and white binary data. By operating the input unit 5, the form image 11 on the left side of the screen can be partially enlarged and displayed on the right side of the screen as shown in FIG.

【0029】次に、図4に示すように、入力部5のマウ
スの操作により、画面左側に表示された帳票イメージ1
1上において複数の項目12a乃至12fのうち認識結
果データを必要とする項目12を選択するために、その
必要とする各項目12に対応する読取領域13の中に矩
形状の指定領域14を設定すると、制御部7は、フィー
ルド名15を自動設定する(S4)。同図では、銀行名
12a及び支店名12bの読取領域13中に指定領域1
4を設定し、「AA−2」がフィールド名15として自
動設定されている場合を示す。銀行名12a及び支店名
12b以外に他の項目12を選択する場合は、例えば図
5に示すように、必要な口座番号12d及び受取人12
eの項目12を選択し、これらに対しても同様に行う。
このようにして複数の項目12に対応して設けられた読
取領域13のレイアウトが指定される。
Next, as shown in FIG. 4, the form image 1 displayed on the left side of the screen is operated by operating the mouse of the input unit 5.
In order to select the item 12 that requires the recognition result data among the plurality of items 12a to 12f on the first item, a rectangular designated region 14 is set in the reading region 13 corresponding to each required item 12 Then, the control unit 7 automatically sets the field name 15 (S4). In the figure, the designated area 1 is included in the reading area 13 for the bank name 12a and the branch name 12b.
4 is set and "AA-2" is automatically set as the field name 15. When selecting other items 12 other than the bank name 12a and the branch name 12b, for example, as shown in FIG.
The item 12 of e is selected and the same is done for these.
In this way, the layout of the reading area 13 provided corresponding to the plurality of items 12 is designated.

【0030】続いて制御部7のレイアウト情報作成部7
0は、入力部5にて指定された読取領域13のレイアウ
トに基づいてレイアウト情報を作成し(S5)、帳票1
0の識別情報(依頼人コード)と共にレイアウト情報記
憶部60に記憶する。
Subsequently, the layout information creation section 7 of the control section 7
0 creates layout information based on the layout of the reading area 13 designated by the input unit 5 (S5), and the form 1
It is stored in the layout information storage unit 60 together with the identification information of 0 (client code).

【0031】次に、操作者は、図6に示すように、入力
部5のマウスの操作により、画面左側に表示されている
帳票イメージ11上で、最初に出力する読取領域13の
中にマウスポインタ16を移動させてクリックした後、
次に出力する読取領域13の中にマウスポインタ16を
移動させてクリックし、このように順次操作することに
より、各項目12に対応して設けられた読取領域13の
認識結果データの出力順序を指定する(S6)。画面右
側には、同図に示すように、既に名付けられたフィール
ド名(AA−1,AA−2、…)15が出力順に表示さ
れる。
Next, as shown in FIG. 6, the operator operates the mouse of the input unit 5 to move the mouse into the reading area 13 to be first output on the form image 11 displayed on the left side of the screen. After moving the pointer 16 and clicking,
By moving and clicking the mouse pointer 16 in the reading area 13 to be output next, and sequentially operating in this manner, the output order of the recognition result data of the reading area 13 provided corresponding to each item 12 is changed. Designate (S6). On the right side of the screen, as shown in the figure, the field names (AA-1, AA-2, ...) 15 already named are displayed in the output order.

【0032】続いて制御部7の出力順序情報作成部71
は、入力部5にて指定された出力順序に基づいて出力順
序情報を作成し(S7)、出力順序記憶部61に識別情
報(依頼人コード)と共に記憶する。
Subsequently, the output sequence information creation unit 71 of the control unit 7
Creates output order information based on the output order specified by the input unit 5 (S7) and stores it in the output order storage unit 61 together with the identification information (client code).

【0033】このようにして、帳票10の読取領域13
のレイアウト及び項目12の出力順序が定義される。
In this way, the reading area 13 of the form 10 is read.
And the output order of the item 12 are defined.

【0034】次に、定義済みの帳票10を読み取る場合
について説明する。
Next, the case of reading the defined form 10 will be described.

【0035】まず、操作者は、入力部5のキーボードを
操作して読取モードを選択し、帳票10の識別情報とし
て登録済みの依頼人コードを入力して入力部5のEND
キーを押下する。(S10)。
First, the operator operates the keyboard of the input unit 5 to select the reading mode, inputs the registered client code as the identification information of the form 10, and ENDs the input unit 5.
Press the key. (S10).

【0036】制御部7は、ENDキーの押下に基づき、
帳票10の読取りを開始する。なお、操作者が、入力部
5のESCキーを押下した場合は、制御部7は、レイア
ウト情報及び出力順序情報が作成済みの帳票識別情報の
一覧表である帳票定義済一覧表(依頼人情報)を表示部
4に表示する。
Based on the depression of the END key, the control section 7
The reading of the form 10 is started. When the operator presses the ESC key of the input unit 5, the control unit 7 causes the form definition list (requester information) that is a list of form identification information for which layout information and output order information have been created. ) Is displayed on the display unit 4.

【0037】スキャナ部1は、制御部7の制御の下に、
登録済の帳票10のイメージ11を検出し(S11)、
その帳票イメージ11をイメージバッファ2に記憶す
る。
Under the control of the control unit 7, the scanner unit 1
The image 11 of the registered form 10 is detected (S11),
The form image 11 is stored in the image buffer 2.

【0038】制御部7は、入力部5にて入力された識別
情報(依頼人コード)に対応するレイアウト情報をレイ
アウト情報記憶部60から読み出し、そのレイアウト情
報に基づいて帳票イメージ11から各読取領域13につ
いてレイアウトの解析を行う。
The control unit 7 reads layout information corresponding to the identification information (client code) input by the input unit 5 from the layout information storage unit 60, and based on the layout information, each reading area from the form image 11. The layout of 13 is analyzed.

【0039】文字認識部3は、制御部7によるレイアウ
ト解析結果を用いて読取領域13内に記入された文字及
び項目12の文字の認識を行う。
The character recognition unit 3 recognizes the characters written in the reading area 13 and the characters of the item 12 using the layout analysis result by the control unit 7.

【0040】制御部7は、入力部5にて入力された依頼
人コードに対応する出力順序情報を出力順序記憶部61
から読み出し、図7に示すように、文字認識部3による
各認識結果データA1 ,B1 ,C1 ,A2 ,…を読み出
した出力順序情報に従って制御部7に出力する。すなわ
ち、指定した項目の銀行名12a,支店名12b,口座
番号12d,受取人12eの順序に従い、最初の行に対
する認識結果データA1 ,B1 ,C1 を出力した後、次
の行に対する認識結果データA2 ,B2 ,C2を出力
し、それ以降の行に対しても同様に指定された項目順序
に従ってサイクリックに認識結果データを出力する。
The control unit 7 outputs the output sequence information corresponding to the client code input by the input unit 5 to the output sequence storage unit 61.
7, and outputs the recognition result data A1, B1, C1, A2, ... By the character recognition unit 3 to the control unit 7 in accordance with the read output sequence information. That is, the recognition result data A1, B1, C1 for the first row is output according to the order of the bank name 12a, the branch name 12b, the account number 12d, and the recipient 12e of the designated items, and then the recognition result data A2 for the next row. , B2, C2 are output, and the recognition result data is cyclically output to the subsequent lines in the same order as the specified item order.

【0041】ここで、操作者が認識結果に対する確認や
修正等のために制御部7への出力結果を表示させたい場
合は、入力部5を操作することにより、図8に示すよう
に、表示部4の表示画面に修正画面が表示される。同図
は、銀行名12a,支店名12b,口座番号12d,受
取人12eの如く指定した項目順序に従って認識結果デ
ータの一部が表示されている状態を示している。同図中
斜線を施した領域は、文字イメージを示し、その各文字
イメージの下に認識結果データが表示される。また、同
図中「?」は、認識できなかったか又は認識できても誤
読のおそれがあるためにリジェクトとしたことを示す記
号を意味する。「?」が表示されている場合は、その位
置にマウスポインタ16を移動させて正しい文字を入力
部5のキーボードから入力することにより、正しい文字
データに変換される。
Here, when the operator wants to display the output result to the control unit 7 for confirmation or correction of the recognition result, he / she operates the input unit 5 to display it as shown in FIG. A correction screen is displayed on the display screen of the section 4. The figure shows a state in which a part of the recognition result data is displayed according to the designated item order such as the bank name 12a, the branch name 12b, the account number 12d, and the recipient 12e. The hatched area in the figure shows character images, and the recognition result data is displayed below each character image. Further, "?" In the figure means a symbol indicating that it was rejected because it could not be recognized, or even if it could be recognized, it could be misread. When "?" Is displayed, the mouse pointer 16 is moved to that position and a correct character is input from the keyboard of the input unit 5, whereby the character is converted into correct character data.

【0042】このような上記実施例によれば、読取領域
13のレイアウトの指定は、帳票イメージ12の表示画
面上で各読取領域13中に指定領域14を設定するだけ
で済み、帳票OCRの如く厳密に座標等を指定する必要
がないので、文字を読み取るための指定操作が容易に行
える。また、認識後は、指定した出力順序に従って、各
項目に対応する認識結果データが出力されるので、振込
依頼書のようにフォーマットが異なる帳票を集計する場
合でも、出力順序が統一された出力結果を得ることがで
き、集計等のその後のデータ処理において操作者の負担
を軽減できる。
According to the above-described embodiment, the layout of the reading area 13 can be designated only by setting the designated area 14 in each reading area 13 on the display screen of the form image 12, like the form OCR. Since it is not necessary to strictly specify the coordinates and the like, the specification operation for reading the character can be easily performed. In addition, after recognition, the recognition result data corresponding to each item is output according to the specified output order, so even when tabulating different formats such as a transfer request form, the output result with a uniform output order Can be obtained, and the burden on the operator can be reduced in the subsequent data processing such as tabulation.

【0043】なお、本発明は上記実施例に限定されず、
その要旨を変更しない範囲内で種々に変形実施できる。
例えば、読取領域13のレイアウトの指定の際に、認識
結果データを必要とする項目12を指定したが、項目順
序の指定の際に、必要とする項目12を指定してもよ
い。
The present invention is not limited to the above embodiment,
Various modifications can be made without changing the gist of the invention.
For example, although the item 12 that requires the recognition result data is specified when the layout of the reading area 13 is specified, the required item 12 may be specified when the item order is specified.

【0044】[0044]

【発明の効果】以上詳述した本発明によれば、以下の効
果を奏する。
According to the present invention described in detail above, the following effects can be obtained.

【0045】請求項1記載の発明によれば、指定された
項目順序に従って各項目に対応する認識結果データを出
力するので、指定操作が容易となる。また、処理対象と
する帳票の実際の項目順序に拘らず、出力順序が統一さ
れた認識結果データを得ることができるので、文字認識
後のデータ処理に伴う負担を小さくできる。
According to the first aspect of the present invention, since the recognition result data corresponding to each item is output in the designated item order, the designation operation becomes easy. Further, regardless of the actual item order of the form to be processed, it is possible to obtain the recognition result data in which the output order is unified, so that the burden of data processing after character recognition can be reduced.

【0046】請求項2記載の発明によれば、指定操作に
よりレイアウト情報及び出力順序情報が作成でき、項目
の順序が互いに異なる帳票であっても、出力順序が統一
された認識結果データを得ることができるので、文字を
読み取るための指定操作が容易でありながら、文字認識
後のデータ処理に伴う負担を小さくできる。
According to the second aspect of the invention, the layout information and the output order information can be created by the designation operation, and the recognition result data in which the output order is unified can be obtained even if the forms have different item orders. Since it is possible to specify the character, it is possible to reduce the burden of data processing after character recognition, while making it easy to specify the character.

【0047】請求項3記載の発明によれば、一覧表によ
りレイアウト情報及び出力順序情報が作成済みか否かの
判断が容易となり、操作者の負担軽減が図れる。
According to the third aspect of the present invention, it becomes easy to determine whether the layout information and the output order information have been created from the list, and the burden on the operator can be reduced.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の光学的文字認識装置の一実施例を示す
概略ブロック図
FIG. 1 is a schematic block diagram showing an embodiment of an optical character recognition device of the present invention.

【図2】帳票の一例を示す図FIG. 2 is a diagram showing an example of a form.

【図3】認識結果データの表示画面の一例を示す図FIG. 3 is a diagram showing an example of a display screen of recognition result data.

【図4】読取領域のレイアウトの指定方法を説明するた
めの表示画面の一例を示す図
FIG. 4 is a diagram showing an example of a display screen for explaining a method of designating a layout of a reading area.

【図5】読取領域のレイアウトの指定方法を説明するた
めの表示画面の一例を示す図
FIG. 5 is a diagram showing an example of a display screen for explaining a method of designating a layout of a reading area.

【図6】各項目に対応して設けられた読取領域の認識結
果データの出力順序の指定方法を説明するための表示画
面の一例を示す図
FIG. 6 is a diagram showing an example of a display screen for explaining a method of designating an output order of recognition result data of a reading area provided corresponding to each item.

【図7】認識結果データの出力例を示す図FIG. 7 is a diagram showing an example of output of recognition result data.

【図8】修正画面の一例を示す図FIG. 8 is a diagram showing an example of a correction screen.

【図9】本実施例の動作を示すフローチャートFIG. 9 is a flowchart showing the operation of this embodiment.

【図10】本実施例の動作を示すフローチャートFIG. 10 is a flowchart showing the operation of this embodiment.

【符号の説明】[Explanation of symbols]

3 文字認識部 5 入力部 6 記憶部 60 レイアウト情報記憶部 61 出力順序情報記憶部 7 制御部 70 レイアウト情報作成部 71 出力順序情報作成部 10 帳票 12,12a乃至12f 項目 13 読取領域 3 character recognition unit 5 input unit 6 storage unit 60 layout information storage unit 61 output order information storage unit 7 control unit 70 layout information creation unit 71 output order information creation unit 10 forms 12, 12a to 12f items 13 reading area

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 任意の順序で配列された複数の項目に対
応して読取領域がそれぞれ設けられた帳票を処理対象と
し、その帳票の各読取領域に記入された文字を読み取
り、その認識結果データを出力する光学的文字認識装置
において、 前記複数の項目のうち一部又は全部の項目を選択し、そ
の項目順序を指定する指定手段と、 この指定手段にて指定された項目順序に従って各項目に
対応する認識結果データを出力する出力制御手段と、 を有することを特徴とする光学的文字認識装置。
1. A processing target is a form in which a reading area is provided corresponding to a plurality of items arranged in an arbitrary order, characters read in each reading area of the form are read, and recognition result data thereof is read. In the optical character recognition device for outputting, a part of or all of the plurality of items are selected, and a specifying means for specifying the item order, and each item according to the item order specified by the specifying means. An optical character recognition device, comprising: output control means for outputting corresponding recognition result data.
【請求項2】 任意の順序で配列された複数の項目に対
応して読取領域がそれぞれ設けられた帳票を処理対象と
し、その帳票の各読取領域に記入された文字を読み取
り、その認識結果データを出力する光学的文字認識装置
において、 指定操作に基づいて前記読取領域のレイアウト情報を作
成するレイアウト情報作成部と、 指定操作に基づいて前記複数の項目のうち選択された一
部又は全部の項目に対応する各認識結果データの出力順
序情報を作成する出力順序情報作成部と、 前記レイアウト情報及び出力順序情報を対応する帳票識
別情報と共に記憶する記憶部と、 指定された帳票識別情報に対応するレイアウト情報及び
出力順序情報を前記記憶部から読み出し、その読み出し
たレイアウト情報及び出力順序情報に基づいて各読取領
域に記入された文字について認識処理を行った後、指定
された項目順序に従って各項目に対応する認識結果デー
タを出力する文字認識部と、 を有することを特徴とする光学的文字認識装置。
2. A form in which a reading area is provided corresponding to a plurality of items arranged in an arbitrary order is processed, a character written in each reading area of the form is read, and recognition result data thereof is read. In the optical character recognition device for outputting, a layout information creation unit that creates layout information of the reading area based on a designated operation, and some or all of the selected items of the plurality of items based on the designated operation. Output order information creation unit that creates output order information of each recognition result data corresponding to, a storage unit that stores the layout information and output order information together with corresponding form identification information, and corresponds to the specified form identification information. The layout information and the output order information are read from the storage unit, and are written in each reading area based on the read layout information and the output order information. After the recognition processing for the characters, the optical character recognition apparatus characterized by comprising: a character recognition unit which outputs the recognition result data corresponding to each item according to the specified item order, the.
【請求項3】 前記レイアウト情報及び出力順序情報が
作成済みの帳票識別情報の一覧表を作成する一覧表作成
部を有することを特徴とする請求項1又は2記載の光学
的文字認識装置。
3. The optical character recognition device according to claim 1, further comprising a list creation unit that creates a list of the form identification information for which the layout information and the output order information have been created.
JP5213048A 1993-08-27 1993-08-27 Optical character recognition device Pending JPH0765111A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5213048A JPH0765111A (en) 1993-08-27 1993-08-27 Optical character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5213048A JPH0765111A (en) 1993-08-27 1993-08-27 Optical character recognition device

Publications (1)

Publication Number Publication Date
JPH0765111A true JPH0765111A (en) 1995-03-10

Family

ID=16632666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5213048A Pending JPH0765111A (en) 1993-08-27 1993-08-27 Optical character recognition device

Country Status (1)

Country Link
JP (1) JPH0765111A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109242A (en) * 2000-09-29 2002-04-12 Glory Ltd Method and device for document processing and storage medium stored with document processing program
JP2019117527A (en) * 2017-12-27 2019-07-18 株式会社日本デジタル研究所 Accounting processing apparatus, accounting processing system, accounting processing method and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109242A (en) * 2000-09-29 2002-04-12 Glory Ltd Method and device for document processing and storage medium stored with document processing program
JP2019117527A (en) * 2017-12-27 2019-07-18 株式会社日本デジタル研究所 Accounting processing apparatus, accounting processing system, accounting processing method and program

Similar Documents

Publication Publication Date Title
JP7437837B2 (en) OCR-based document analysis system and method using virtual cells
EP3541057B1 (en) Scan apparatus and scan result display program
JP5844564B2 (en) Form recognition system
KR102561878B1 (en) Ai blue ocr reading system and method based on machine learning
EP1202213B1 (en) Document format identification apparatus and method
KR102165096B1 (en) Online Parts Book Viewer System
JP2005234790A (en) Handwritten form processing system, handwritten form processing method
JPH0765111A (en) Optical character recognition device
JP4356908B2 (en) Automatic financial statement input device
KR20200106472A (en) Cloud-based online parts book service provision method and system
JP3732254B2 (en) Format information generation method and format information generation apparatus
JP3735313B2 (en) Image management system, image management method, and image management program
JP7739834B2 (en) Document reading device, document reading method, and program
JP2003331216A (en) Business form reading method
JP5243228B2 (en) Character recognition device and method for generating confirmation screen of character recognition device
JPH07152856A (en) Optical character reader
JP2007011656A (en) Character recognition system and character recognition method
JP3000349B2 (en) Key input editing method and editing device
JP7766978B2 (en) Voucher structure analysis system, voucher structure analysis method, and voucher structure analysis program
JP2006252575A (en) Financial statement automatic input apparatus and method therefore
JP4216855B2 (en) Data display device, data display method, and data display program
JP3790747B2 (en) Data display device, data display method, and data display program
JP2003099709A (en) Misread character correction method and optical character recognition device
JPH05303661A (en) Acquring/displaying device for partial image data
JPH04348475A (en) Method and device for retrieving image information