JPH08123872A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH08123872A
JPH08123872A JP6255198A JP25519894A JPH08123872A JP H08123872 A JPH08123872 A JP H08123872A JP 6255198 A JP6255198 A JP 6255198A JP 25519894 A JP25519894 A JP 25519894A JP H08123872 A JPH08123872 A JP H08123872A
Authority
JP
Japan
Prior art keywords
format
image
layout
statistical information
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6255198A
Other languages
Japanese (ja)
Inventor
Yoshikazu Kobayashi
美和 小林
Koji Senoo
康二 妹尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6255198A priority Critical patent/JPH08123872A/en
Publication of JPH08123872A publication Critical patent/JPH08123872A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE: To simplify an operation even when a read area is frequency changed or when the different kinds of slips are frequently added, etc. CONSTITUTION: Characters of the slip for which the relative position relation of the entry frames of the read area does not change are recognized based on a format set corresponding to a slip ID. Then, this reader is provided with an image obtaining means for obtaining slip images including the entry frame, a new slip judgement means 12 for judging whether or not the slip is a new slip, an image memory 12 for storing the slip images as image data, a layout analysis means and a format preparation means. The layout analysis means analyzes a layout based on the image data stored in the image memory 12 and the format preparation means prepares the format based on the analyzed result of the layout.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、光学式文字読取装置
(OCR)に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reader (OCR).

【0002】[0002]

【従来の技術】従来、光学式文字読取装置においては、
帳票の帳票イメージを光学系によってイメージセンサに
結像させ、該イメージセンサによって得られた画像信号
をイメージデータに変換し、該イメージデータをメモリ
に書き込むようになっている。そして、前記イメージデ
ータから切り出した文字の特徴を抽出することによって
文字を認識することができるようになっている。
2. Description of the Related Art Conventionally, in an optical character reader,
An image of a form is formed on an image sensor by an optical system, an image signal obtained by the image sensor is converted into image data, and the image data is written in a memory. Then, the character can be recognized by extracting the characteristics of the character cut out from the image data.

【0003】そこで、前記イメージデータから文字を切
り出すために、読取対象となる帳票のどの領域(帳票辺
からの距離で記述)に、どの種類の文字(手書きのアル
ファベット、数字、カナ、記号、漢字等、又は活字のア
ルファベット、数字、カナ、記号、漢字等)が何文字記
入、又は印字されているか等の情報がフォーマットとし
て設定され、該フォーマットは帳票の種類ごとにあらか
じめ登録されるようになっている。
Therefore, in order to cut out characters from the image data, which kind of character (handwritten alphabet, number, kana, symbol, kanji) is written in which area (describe from the side of the form) of the form to be read. Etc., or how many characters such as alphabets, numbers, kana, symbols, and kanji of printed characters are entered or printed as a format, and the format is registered in advance for each type of form. ing.

【0004】そこで、帳票の種類を認識するために、帳
票ID(5桁の活字、数字等)が帳票の所定位置(例え
ば、右上等)に記入、又は印字されるようになってい
る。したがって、光学式文字読取装置は、まず、帳票I
Dを認識し、該当するフォーマットに基づいて帳票の読
取領域において該当文字数の分だけ文字を切り出す。そ
して、切り出された文字は該当文字種の辞書と比較さ
れ、文字の認識が行われる。
Therefore, in order to recognize the type of the form, the form ID (five-digit type, number, etc.) is written or printed at a predetermined position (for example, upper right) of the form. Therefore, the optical character reading device first
D is recognized, and characters are cut out in the reading area of the form according to the corresponding format by the corresponding number of characters. Then, the cut-out character is compared with the dictionary of the corresponding character type to recognize the character.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、前記従
来の光学式文字読取装置においては、フォーマットを登
録する場合、オペレータは帳票の読取領域の寸法、記
入、又は印字される文字の文字種、文字数等を測定し、
光学式文字読取装置に入力する必要があるので、登録に
要する時間が長くなる。また、帳票IDが同一のまま帳
票の読取領域が頻繁に変更される場合、異なる種類の帳
票が頻繁に追加される場合等においては、フォーマット
を変更したり、追加したりしなければならず、それに伴
う作業が煩わしい。
However, in the above-mentioned conventional optical character reader, when registering a format, the operator determines the size of the reading area of the form, the character type of the characters to be written or printed, the number of characters, etc. Measure
Since it is necessary to input to the optical character reader, the time required for registration becomes long. In addition, when the reading area of the form is frequently changed while the form ID is the same, or when different types of forms are frequently added, the format must be changed or added, The work involved is troublesome.

【0006】本発明は、前記従来の光学式文字読取装置
の問題点を解決して、帳票IDが同一のまま帳票の読取
領域が頻繁に変更される場合、異なる種類の帳票が頻繁
に追加される場合等においても、作業が煩わしくなるこ
とがない光学式文字読取装置を提供することを目的とす
る。
The present invention solves the problems of the conventional optical character reading device described above, and when the reading area of the form is frequently changed while the form ID remains the same, different types of forms are frequently added. It is an object of the present invention to provide an optical character reading device that does not make the operation troublesome even in cases such as when.

【0007】[0007]

【課題を解決するための手段】そのために、本発明の光
学式文字読取装置においては、読取領域の記入枠の相対
的な位置関係が変わらない帳票の文字を、帳票IDに対
応させて設定されたフォーマットに基づいて認識するよ
うになっている。そして、記入枠を含む帳票イメージを
取得するイメージ取得手段と、前記帳票が新規帳票であ
るかどうかを判断する新規帳票判断手段と、前記帳票イ
メージをイメージデータとして格納するイメージメモリ
と、該イメージメモリに格納されたイメージデータに基
づいてレイアウトの解析を行うレイアウト解析手段と、
レイアウトの解析結果に基づいてフォーマットを作成す
るフォーマット作成手段とを有する。
Therefore, in the optical character reading apparatus of the present invention, the characters of the form in which the relative positional relationship of the writing frames of the reading area does not change are set in correspondence with the form ID. Different formats are recognized. An image acquisition unit that acquires a form image including an entry frame, a new form determination unit that determines whether the form is a new form, an image memory that stores the form image as image data, and the image memory. Layout analysis means for analyzing the layout based on the image data stored in
And a format creating means for creating a format based on a layout analysis result.

【0008】本発明の他の光学式文字読取装置において
は、帳票の読取結果を示す統計情報が格納された統計情
報テーブルと、該統計情報テーブルを参照して統計情報
を取得し、該統計情報に基づいてフォーマットが不良で
あるかどうかを判断するフォーマット良否判断手段とを
有する。そして、前記レイアウト解析手段は、フォーマ
ットが不良である場合に該当する帳票についてレイアウ
トを解析する。
In another optical character reading device of the present invention, a statistical information table storing statistical information indicating a result of reading a form and statistical information is acquired by referring to the statistical information table, and the statistical information is acquired. Format pass / fail judgment means for judging whether or not the format is defective based on the above. Then, the layout analysis means analyzes the layout of the form corresponding to the case where the format is bad.

【0009】本発明の更に他の光学式文字読取装置にお
いては、読取領域の記入枠の相対的な位置関係が変わら
ない帳票の文字を、帳票IDに対応させて設定されたフ
ォーマットに基づいて認識するようになっている。そし
て、記入枠を含む帳票イメージを取得するイメージ取得
手段と、前記帳票が新規帳票であるかどうかを判断する
新規帳票判断手段と、前記帳票イメージを文字の認識用
のイメージデータとして格納するイメージメモリと、前
記帳票イメージをレイアウト解析用のイメージデータと
して格納するイメージ記憶部と、前記文字の認識と並行
して、前記イメージ記憶部に格納されたイメージデータ
に基づいてレイアウトの解析を行うレイアウト解析手段
と、レイアウトの解析結果に基づいてフォーマットを作
成するフォーマット作成手段とを有する。
In still another optical character reader of the present invention, the characters of the form in which the relative positional relationship of the writing frames in the reading area does not change are recognized based on the format set in correspondence with the form ID. It is supposed to do. An image acquisition unit that acquires a form image including an entry frame, a new form determination unit that determines whether the form is a new form, and an image memory that stores the form image as image data for character recognition. And an image storage unit that stores the form image as image data for layout analysis, and a layout analysis unit that performs layout analysis based on the image data stored in the image storage unit in parallel with recognition of the characters. And a format creating means for creating a format based on the layout analysis result.

【0010】本発明の更に他の光学式文字読取装置にお
いては、帳票の読取結果を示す統計情報が格納された統
計情報テーブルと、該統計情報テーブルを参照して統計
情報を取得し、該統計情報に基づいてフォーマットが不
良であるかどうかを判断するフォーマット良否判断手段
とを有する。そして、前記レイアウト解析手段は、フォ
ーマットが不良である場合に該当する帳票についてレイ
アウトを解析する。
In still another optical character reading device of the present invention, a statistical information table storing statistical information indicating a result of reading a form and statistical information is acquired by referring to the statistical information table and the statistical information is acquired. And a format pass / fail determining means for determining whether or not the format is defective based on the information. Then, the layout analysis means analyzes the layout of the form corresponding to the case where the format is bad.

【0011】[0011]

【作用】本発明によれば、前記のように光学式文字読取
装置においては、読取領域の記入枠の相対的な位置関係
が変わらない帳票の文字を、帳票IDに対応させて設定
されたフォーマットに基づいて認識するようになってい
る。そして、記入枠を含む帳票イメージを取得するイメ
ージ取得手段と、前記帳票が新規帳票であるかどうかを
判断する新規帳票判断手段と、前記帳票イメージをイメ
ージデータとして格納するイメージメモリと、該イメー
ジメモリに格納されたイメージデータに基づいてレイア
ウトの解析を行うレイアウト解析手段と、レイアウトの
解析結果に基づいてフォーマットを作成するフォーマッ
ト作成手段とを有する。
According to the present invention, as described above, in the optical character reading device, the characters of the form in which the relative positional relationship of the writing frames in the reading area does not change are set in correspondence with the form ID. It is based on the recognition. An image acquisition unit that acquires a form image including an entry frame, a new form determination unit that determines whether the form is a new form, an image memory that stores the form image as image data, and the image memory. The layout analysis unit analyzes the layout based on the image data stored in the storage unit, and the format creation unit creates a format based on the layout analysis result.

【0012】この場合、読取動作が開始されると、イメ
ージ取得手段によって帳票イメージが取得され、イメー
ジデータとしてイメージメモリに格納される。次に、該
イメージメモリに格納されたイメージデータは、文字ご
とに切り出され、認識部によって文字が認識される。そ
して、新規帳票判断手段によって前記帳票が新規帳票で
あるかどうかが判断され、新規帳票である場合、レイア
ウト解析手段が、イメージメモリに格納されたイメージ
データに基づいてレイアウトの解析を行う。また、フォ
ーマット作成手段は、レイアウトの解析結果に基づいて
フォーマットを作成する。
In this case, when the reading operation is started, the form image is obtained by the image obtaining means and stored in the image memory as image data. Next, the image data stored in the image memory is cut out for each character and the recognition unit recognizes the character. Then, the new form determination means determines whether or not the form is a new form. If the form is a new form, the layout analysis means analyzes the layout based on the image data stored in the image memory. Also, the format creating means creates a format based on the layout analysis result.

【0013】本発明の他の光学式文字読取装置において
は、帳票の読取結果を示す統計情報が格納された統計情
報テーブルと、該統計情報テーブルを参照して統計情報
を取得し、該統計情報に基づいてフォーマットが不良で
あるかどうかを判断するフォーマット良否判断手段とを
有する。そして、前記レイアウト解析手段は、フォーマ
ットが不良である場合に該当する帳票についてレイアウ
トを解析する。
In another optical character reading apparatus of the present invention, a statistical information table storing statistical information indicating a result of reading a form and statistical information is acquired by referring to the statistical information table, and the statistical information is acquired. Format pass / fail judgment means for judging whether or not the format is defective based on the above. Then, the layout analysis means analyzes the layout of the form corresponding to the case where the format is bad.

【0014】この場合、記入枠の大きさ等が変更される
と、統計情報テーブル内の非通過率が高くなる。そこ
で、前記フォーマット良否判断手段は、統計情報テーブ
ルを参照して統計情報を取得し、該統計情報に基づいて
フォーマットが不良であるかどうかを判断する。そし
て、前記レイアウト解析手段は、フォーマットが不良で
ある場合に該当する帳票についてレイアウトを解析す
る。
In this case, when the size of the entry frame is changed, the non-passage rate in the statistical information table increases. Therefore, the format quality determining unit refers to the statistical information table to acquire the statistical information, and determines whether the format is defective based on the statistical information. Then, the layout analysis means analyzes the layout of the form corresponding to the case where the format is bad.

【0015】本発明の更に他の光学式文字読取装置にお
いては、読取領域の記入枠の相対的な位置関係が変わら
ない帳票の文字を、帳票IDに対応させて設定されたフ
ォーマットに基づいて認識するようになっている。そし
て、記入枠を含む帳票イメージを取得するイメージ取得
手段と、前記帳票が新規帳票であるかどうかを判断する
新規帳票判断手段と、前記帳票イメージを文字の認識用
のイメージデータとして格納するイメージメモリと、前
記帳票イメージをレイアウト解析用のイメージデータと
して格納するイメージ記憶部と、前記文字の認識と並行
して、前記イメージ記憶部に格納されたイメージデータ
に基づいてレイアウトの解析を行うレイアウト解析手段
と、レイアウトの解析結果に基づいてフォーマットを作
成するフォーマット作成手段とを有する。
In still another optical character reading device of the present invention, the characters of the form in which the relative positional relationship of the writing frames in the reading area does not change are recognized based on the format set in correspondence with the form ID. It is supposed to do. An image acquisition unit that acquires a form image including an entry frame, a new form determination unit that determines whether the form is a new form, and an image memory that stores the form image as image data for character recognition. And an image storage unit that stores the form image as image data for layout analysis, and a layout analysis unit that performs layout analysis based on the image data stored in the image storage unit in parallel with recognition of the characters. And a format creating means for creating a format based on the layout analysis result.

【0016】この場合、読取動作が開始されると、イメ
ージ取得手段によって帳票イメージが取得され、イメー
ジデータとしてイメージメモリに格納される。次に、該
イメージメモリに格納されたイメージデータは、文字ご
とに切り出され、認識部によって文字が認識される。ま
た、前記イメージデータはイメージ記憶部に転送され
る。
In this case, when the reading operation is started, the form image is obtained by the image obtaining means and stored in the image memory as image data. Next, the image data stored in the image memory is cut out for each character and the recognition unit recognizes the character. Further, the image data is transferred to the image storage unit.

【0017】そして、新規帳票判断手段によって前記帳
票が新規帳票であるかどうかが判断され、新規帳票であ
る場合はレイアウト解析手段が、イメージ記憶部に格納
されたイメージデータに基づいてレイアウトの解析を行
う。また、フォーマット作成手段は、レイアウトの解析
結果に基づいてフォーマットを作成する。本発明の更に
他の光学式文字読取装置においては、帳票の読取結果を
示す統計情報が格納された統計情報テーブルと、該統計
情報テーブルを参照して統計情報を取得し、該統計情報
に基づいてフォーマットが不良であるかどうかを判断す
るフォーマット良否判断手段とを有する。
Then, the new form determination means determines whether the form is a new form, and if it is a new form, the layout analysis means analyzes the layout based on the image data stored in the image storage unit. To do. Also, the format creating means creates a format based on the layout analysis result. In still another optical character reading device of the present invention, a statistical information table in which statistical information indicating a result of reading a form is stored, the statistical information is acquired by referring to the statistical information table, and based on the statistical information. Format acceptability determining means for determining whether the format is defective.

【0018】そして、前記レイアウト解析手段は、フォ
ーマットが不良である場合に該当する帳票についてレイ
アウトを解析する。この場合、記入枠の大きさ等が変更
されると、統計情報テーブル内の非通過率が高くなる。
そこで、前記フォーマット良否判断手段は、統計情報テ
ーブルを参照して統計情報を取得し、該統計情報に基づ
いてフォーマットが不良であるかどうかを判断する。そ
して、前記レイアウト解析手段は、フォーマットが不良
である場合に該当する帳票についてレイアウトを解析す
る。
Then, the layout analysis means analyzes the layout of the form corresponding to the case where the format is bad. In this case, when the size of the entry frame is changed, the non-passage rate in the statistical information table increases.
Therefore, the format quality determining unit refers to the statistical information table to acquire the statistical information, and determines whether the format is defective based on the statistical information. Then, the layout analysis means analyzes the layout of the form corresponding to the case where the format is bad.

【0019】[0019]

【実施例】以下、本発明の実施例について図面を参照し
ながら詳細に説明する。図1は本発明の第1の実施例に
おける光学式文字読取装置のブロック図、図2は本発明
の第1の実施例における帳票の例を示す図である。図1
において、11はイメージ取得部、12はイメージメモ
リ、13は主制御部、14はフォーマット記憶部、15
は認識部、16は認識結果表示部、17は記憶部であ
る。前記主制御部13は光学式文字読取装置の全体を制
御し、文字切出部21、レイアウト解析部22及び統計
情報部23を有する。
Embodiments of the present invention will now be described in detail with reference to the drawings. FIG. 1 is a block diagram of an optical character reading device according to a first embodiment of the present invention, and FIG. 2 is a diagram showing an example of a form according to the first embodiment of the present invention. FIG.
In FIG. 11, 11 is an image acquisition unit, 12 is an image memory, 13 is a main control unit, 14 is a format storage unit, 15
Is a recognition unit, 16 is a recognition result display unit, and 17 is a storage unit. The main control unit 13 controls the entire optical character reading device, and has a character cutout unit 21, a layout analysis unit 22, and a statistical information unit 23.

【0020】前記イメージ取得部11は、光電変換素子
(CCDセンサ等)から成る図示しないイメージセン
サ、光源(蛍光灯等)、結像器(レンズ等)及び帳票搬
送系等を有し、帳票イメージをイメージデータとして前
記イメージセンサに結像し、前記主制御部13の指令を
受けて前記イメージデータをイメージメモリ12に格納
する。
The image acquisition unit 11 has an image sensor (not shown) including a photoelectric conversion element (CCD sensor, etc.), a light source (fluorescent lamp, etc.), an imager (lens, etc.), and a document transportation system. Is imaged on the image sensor as image data, and the image data is stored in the image memory 12 in response to a command from the main controller 13.

【0021】主制御部13は、前記イメージメモリ12
から文字を切り出して文字パターンを認識部15に送る
と、該認識部15は文字パターンの特徴を抽出し、認識
辞書を参照して文字を認識する。また、図2において、
25は帳票、26は該帳票25の種類ごとに設定された
帳票ID、27は読取領域である。
The main control unit 13 includes the image memory 12
When a character is cut out from and the character pattern is sent to the recognition unit 15, the recognition unit 15 extracts the feature of the character pattern and recognizes the character by referring to the recognition dictionary. In addition, in FIG.
Reference numeral 25 is a form, 26 is a form ID set for each type of the form 25, and 27 is a reading area.

【0022】次に、本発明の第1の実施例についてフロ
ーチャートに基づいて説明する。図3は本発明の第1の
実施例における光学式文字読取装置の動作を示すフロー
チャート、図4は本発明の第1の実施例における統計情
報テーブルの例を示す図である。ステップS1 認識結
果表示部16(図1)の指令によって光学式文字読取装
置の読取動作が開始され、帳票イメージが取得される。
すなわち、図示しない搬送系によって帳票25(図2)
が搬送され、該帳票25の文字記入枠を含む帳票イメー
ジがイメージ取得部11によって光電変換され、イメー
ジデータとしてイメージメモリ12に格納される。ステ
ップS2 帳票25の所定位置に設定された帳票ID2
6が認識される。該帳票ID26は、すべての種類の帳
票25ごとに、又は同じグループごとに設定され、帳票
25の同じ位置に印刷される。前記イメージメモリ12
に格納されたイメージデータは、主制御部13内の文字
切出部21によってイメージメモリ12から文字ごとに
切り出され、認識部15によって文字が認識される。ス
テップS3 主制御部13は、前記帳票25が新規帳票
であるかどうかを判断する。この場合、新規帳票である
かどうかは、前記認識部15によって認識された帳票I
D26がフォーマット記憶部14に記憶されているかど
うかによって判断される。新規帳票である場合はステッ
プS7に、新規帳票でない場合はステップS4に進む。
ステップS4 帳票ID26によって指定されたフォー
マットに基づいて、帳票25内の読取領域27の認識を
行う。この場合、読取領域27の認識は、前記帳票ID
26の認識と同様の方法によって行われる。ステップS
5 主制御部13の統計情報部23は、図4に示す統計
情報テーブルを参照して統計情報を取得する。該統計情
報テーブルは主制御部13内の統計情報部23に格納さ
れている。
Next, a first embodiment of the present invention will be described based on a flow chart. FIG. 3 is a flow chart showing the operation of the optical character reading device in the first embodiment of the present invention, and FIG. 4 is a diagram showing an example of the statistical information table in the first embodiment of the present invention. Step S1 The reading operation of the optical character reading device is started by a command from the recognition result display section 16 (FIG. 1), and the form image is acquired.
That is, the form 25 (FIG. 2) is produced by a transport system not shown.
Is conveyed, the form image including the character entry frame of the form 25 is photoelectrically converted by the image acquisition unit 11, and stored in the image memory 12 as image data. Step S2 Form ID2 set at a predetermined position on the form 25
6 is recognized. The form ID 26 is set for each type of form 25 or for each same group, and is printed at the same position on the form 25. The image memory 12
The image data stored in is cut out for each character from the image memory 12 by the character cutout unit 21 in the main control unit 13, and the recognition unit 15 recognizes the character. Step S3 The main control unit 13 determines whether the form 25 is a new form. In this case, it is determined whether the new form is the form I recognized by the recognition unit 15.
It is determined whether D26 is stored in the format storage unit 14. If it is a new form, the process proceeds to step S7. If it is not a new form, the process proceeds to step S4.
In step S4, the reading area 27 in the form 25 is recognized based on the format designated by the form ID 26. In this case, the reading area 27 is recognized by the form ID.
It is done in a similar way to the recognition of 26. Step S
5. The statistical information unit 23 of the main control unit 13 acquires statistical information by referring to the statistical information table shown in FIG. The statistical information table is stored in the statistical information unit 23 in the main control unit 13.

【0023】前記統計情報テーブルは、帳票ID26、
処理総枚数、リジェクト枚数、非通過率及びフォーマッ
ト良否の情報から成り、帳票25ごとに処理した結果が
格納されるようになっている。そして、該帳票25ごと
の非通過率(=リジェクト枚数/処理総枚数)を計算
し、処理総枚数が所定値(本実施例においては100
枚)以上で、かつ、非通過率が設定値(本実施例では5
0〔%〕)以上の場合、フォーマット良否を“1”にセ
ットするようにしてある。ステップS6 フォーマット
が不良であるかどうかを判断する。この場合、統計情報
テーブルのフォーマット良否が“1”であるかどうかに
よって判断する。フォーマット良否が“1”であるとフ
ォーマットが不良であると判断され、ステップS7に、
フォーマット良否が“0”であるとフォーマットが不良
でないと判断され、ステップS12へ進む。
The statistical information table includes a form ID 26,
The total number of sheets processed, the number of rejected sheets, the non-passage rate, and the information on whether the format is good or bad are stored, and the result of processing each form 25 is stored. Then, the non-passage rate (= rejected number of sheets / total number of processed sheets) for each form 25 is calculated, and the total number of processed sheets is a predetermined value (100 in this embodiment).
Or more and the non-passage rate is a set value (5 in this embodiment).
If it is 0% or more, the quality of the format is set to "1". In step S6, it is determined whether the format is defective. In this case, the determination is made based on whether the format of the statistical information table is "1". If the quality of the format is "1", it is determined that the format is defective, and the process proceeds to step S7.
If the quality of the format is "0", it is determined that the format is not defective, and the process proceeds to step S12.

【0024】ところで、リジェクトが多発してもその要
因(印字濃度、手書き濃度が低い場合等)は様々であ
る。本実施例においてはフォーマット良否を“1”とす
る処理総枚数を100枚と設定し、非通過率を50
〔%〕と設定しているが、前記処理総枚数、非通過率等
を各システムの稼働条件に対応させて設定することがで
きる。ステップS7 主制御部13においてレイアウト
の解析を行う。すなわち、帳票25の記入枠の線分を検
出し、読取領域27を認識する。ステップS8 読取領
域27の仮フォーマットを作成する。ステップS9 主
制御部13及び認識部15は、ステップS8において作
成した仮フォーマットを参照して、イメージメモリ12
に格納されたイメージデータに基づいて文字の切出し及
び認識を行い、文字の読取率が設定値以上であるかどう
かを判断することによって仮フォーマットを確認する。
ここで、読取率とは、イメージメモリ12から切り出さ
れた文字のうち、認識することができたものの率をい
う。ステップS10 仮フォーマットの確認結果が良好
であるかどうかを判断する。良好である場合はステップ
S11に進み、良好でない場合はステップS7に戻り、
解析条件を変更して再びレイアウトの解析を行う。ステ
ップS11 作成した仮フォーマットを正式なフォーマ
ットとしてフォーマット記憶部14に格納して登録す
る。ステップS12 文字の認識結果を出力する。すな
わち、主制御部13から文字の認識結果が認識結果表示
部16に転送され、記憶部17に格納される。ステップ
S13 読み取るべき次の帳票25があるかどうかを判
断する。該帳票25がある場合はステップS1に戻り、
帳票25がない場合は処理を終了する。
By the way, there are various causes (such as low print density and low handwriting density) of the frequent rejections. In this embodiment, the total number of processed sheets for which the quality of the format is “1” is set to 100 and the non-passage rate is set to 50.
Although [%] is set, the total number of sheets processed, the non-passage rate, etc. can be set according to the operating conditions of each system. In step S7, the main controller 13 analyzes the layout. That is, the line segment of the entry frame of the form 25 is detected and the reading area 27 is recognized. In step S8, the temporary format of the reading area 27 is created. In step S9, the main control unit 13 and the recognition unit 15 refer to the temporary format created in step S8 and refer to the image memory 12
The temporary format is confirmed by cutting out and recognizing the character based on the image data stored in and determining whether or not the reading rate of the character is equal to or more than a set value.
Here, the reading rate means the rate of characters that can be recognized among the characters cut out from the image memory 12. In step S10, it is determined whether or not the confirmation result of the temporary format is good. If it is good, the process proceeds to step S11. If it is not good, the process returns to step S7.
Change the analysis conditions and analyze the layout again. Step S11 The created temporary format is stored in the format storage unit 14 as a formal format and registered. In step S12, the character recognition result is output. That is, the character recognition result is transferred from the main control unit 13 to the recognition result display unit 16 and stored in the storage unit 17. In step S13, it is determined whether there is the next form 25 to be read. If the form 25 is present, the process returns to step S1,
If there is no form 25, the process ends.

【0025】次に、読取領域27内の各記入枠の相対的
な位置関係が既知である場合のレイアウトの解析につい
て説明する。図5は本発明の第1の実施例におけるレイ
アウト解析枠を示す図、図6は本発明の第1の実施例に
おけるレイアウト解析座標の算出方法の説明図である。
図6において、帳票イメージ31はイメージメモリ12
(図1)内にイメージデータとして格納される。前記帳
票イメージ31は読取領域30内に位置する帳票ID3
2、記入枠33、該記入枠33内に形成された文字34
等のデータから成る。
Next, the analysis of the layout in the case where the relative positional relationship of the writing frames in the reading area 27 is known will be described. FIG. 5 is a diagram showing a layout analysis frame in the first embodiment of the present invention, and FIG. 6 is an explanatory diagram of a method of calculating layout analysis coordinates in the first embodiment of the present invention.
In FIG. 6, the form image 31 is the image memory 12
It is stored as image data in (FIG. 1). The form image 31 is a form ID 3 located in the reading area 30.
2, the entry frame 33, the characters 34 formed in the entry frame 33
Etc. data.

【0026】また、HX 、HY は、帳票イメージ31の
それぞれX軸方向、Y軸方向の投影(黒点数の総和)で
あり、該帳票イメージ31の外側(背影)は黒点だけで
形成される。そして、X軸方向の投影処理によってX軸
方向の投影HX が得られ、該投影H X をX軸方向枠検出
スライスSX と比較することによって、X軸に平行な線
分を検出することができる。各線分のY軸アドレスは、
帳票イメージ31の上辺を0とし、下辺をyとしたと
き、y1 、y2 、…、y6 になる。
Also, HX, HYOf the form image 31
Projection in the X-axis direction and Y-axis direction (sum of black points)
Yes, the outside (back shadow) of the form image 31 is only black dots.
It is formed. Then, by the projection processing in the X-axis direction, the X-axis
Directional projection HXAnd the projection H XX-axis direction frame detection
Slice SXBy comparing with the line parallel to the X-axis
Minutes can be detected. The Y-axis address of each line segment is
Assuming that the upper side of the form image 31 is 0 and the lower side is y
Come, y1, Y2, ... y6become.

【0027】同様に、Y軸方向の投影処理によってY軸
方向の投影HY が得られ、該投影H Y をY軸方向枠検出
スライスSY と比較することによって、Y軸に平行な線
分を検出することができる。各線分のX軸アドレスは、
帳票イメージ31の左辺を0とし、右辺をxとしたと
き、x1 、x2 、…、x5 になる。なお、X軸方向枠検
出スライスSX 及びY軸方向枠検出スライスSY は値を
変更することができる。
Similarly, Y-axis projection processing is performed in the Y-axis direction.
Directional projection HYAnd the projection H YFrame detection in Y-axis direction
Slice SYBy comparing with the line parallel to the Y-axis
Minutes can be detected. The X-axis address of each line segment is
When the left side of the form image 31 is 0 and the right side is x
X1, X2, ..., xFivebecome. In addition, X-axis direction frame inspection
Out slice SXAnd Y-axis direction frame detection slice SYIs the value
Can be changed.

【0028】また、図5に示すように、前記帳票イメー
ジ31を設定する点A〜Dの各座標は、それぞれ(0,
0)、(x,0)、(x,y)、(0,y)になる。ま
た、X軸に平行な線分Ki (i=0 、1、2、…、5)
と、Y軸に平行な線分Mj (j=0 、1、2、…、4)
との各交点の座標を求めることができる。そして、線分
i とKj の交点の座標を(xi ,yj )とすると、読
取領域30内の各記入枠33の相対的な位置関係が既知
であるので、例えば図6の帳票イメージ31において、
顧客No.の番号(本実施例においては、文字「123
4」)が記入された記入枠33は、線分M1 、M2 、K
O 、K1 によって包囲される図5の斜線領域となる。こ
の場合、フォーマットは、例えば、(x1 ,y0 )、
(x2 ,y1 )の2個の座標によって表される。
Further, as shown in FIG. 5, the coordinates of points A to D for setting the form image 31 are (0,
0), (x, 0), (x, y), (0, y). Also, a line segment K i (i = 0, 1, 2, ..., 5) parallel to the X axis
And a line segment M j (j = 0, 1, 2, ..., 4) parallel to the Y axis
The coordinates of each intersection with and can be obtained. If the coordinates of the intersection of the line segments M i and K j are (x i , y j ), the relative positional relationship of the respective writing frames 33 in the reading area 30 is known. In image 31,
Customer No. Number (in the present embodiment, the character "123
4 ”) is filled in in the frame 33, and the line segments M 1 , M 2 , K
The shaded area in FIG. 5 is surrounded by O and K 1 . In this case, the format is, for example, (x 1 , y 0 ),
It is represented by two coordinates of (x 2 , y 1 ).

【0029】このように、本実施例においては、帳票2
5が新規帳票である場合、レイアウト解析部22、イメ
ージメモリ12に格納されたイメージデータに基づいて
レイアウトの解析を行う。また、主制御部13は、レイ
アウトの解析結果に基づいてフォーマットを作成する。
したがって、異なる種類の帳票25が頻繁に追加される
場合等においても、追加された帳票25ごとにフォーマ
ットを自動的に作成することができるので、フォーマッ
トの作成に伴う作業を簡素化することができる。
Thus, in this embodiment, the form 2
When 5 is a new form, the layout analysis unit 22 analyzes the layout based on the image data stored in the image memory 12. Further, the main control unit 13 creates a format based on the layout analysis result.
Therefore, even when different types of forms 25 are frequently added, the format can be automatically created for each added form 25, and the work involved in creating the format can be simplified. .

【0030】また、統計情報テーブルが配設され、帳票
25が新規帳票でない場合に前記統計テーブルを参照
し、非通過率が高くなりフォーマットが不良になったか
どうかを判断することができる。したがって、帳票ID
32は変化しないが、例えば、読取領域30の各記入枠
33の大きさ等に変更があった場合には、フォーマット
が不良になったことが分かる。なお、この場合、読取領
域30内の各記入枠33の相対的な位置関係は変化がな
いものとする。
Further, when a statistical information table is provided and the form 25 is not a new form, it is possible to judge whether or not the non-passage rate is high and the format is bad by referring to the statistical table. Therefore, the form ID
Although 32 does not change, if the size of each entry frame 33 of the reading area 30 is changed, it can be seen that the format is defective. In this case, it is assumed that the relative positional relationship between the entry frames 33 in the reading area 30 does not change.

【0031】このように、フォーマットが不良であると
判断されると、レイアウトの解析が行われ、新たにフォ
ーマットが作成されて登録されるので、フォーマットの
作成に伴う作業を簡素化することができる。なお、本実
施例においては、X軸方向枠検出スライスSX 及びY軸
方向枠検出スライスSY は値を変更することができる。
また、イメージメモリ12を多値構成にして、多値デー
タを2値データに変換するためのスライスレベルを可変
とし、該スライスレベルを変更することによって、精度
よくレイアウトの解析を行うことができる。
As described above, when it is determined that the format is defective, the layout is analyzed and a new format is newly created and registered. Therefore, the work involved in the format creation can be simplified. . In this embodiment, the values of the X-axis direction frame detection slice S X and the Y-axis direction frame detection slice S Y can be changed.
Further, the image memory 12 has a multi-valued configuration, the slice level for converting multi-valued data into binary data is made variable, and the slice level is changed, whereby the layout can be analyzed accurately.

【0032】次に本発明の第2の実施例について説明す
る。図7は本発明の第2の実施例における光学式文字読
取装置のブロック図である。図において、11はイメー
ジ取得部、12はイメージメモリ、13は主制御部、1
4はフォーマット記憶部、15は認識部、16は認識結
果表示部、17は記憶部である。前記主制御部13は光
学式文字読取装置の全体を制御し、文字切出部21、レ
イアウト解析部22及び統計情報部23を有する。ま
た、前記イメージメモリ12のほかに複数枚分の帳票イ
メージ31(図6)を格納するためのイメージ記憶部5
1が配設される。
Next, a second embodiment of the present invention will be described. FIG. 7 is a block diagram of an optical character reader according to the second embodiment of the present invention. In the figure, 11 is an image acquisition unit, 12 is an image memory, 13 is a main control unit, 1
Reference numeral 4 is a format storage unit, 15 is a recognition unit, 16 is a recognition result display unit, and 17 is a storage unit. The main control unit 13 controls the entire optical character reading device, and has a character cutout unit 21, a layout analysis unit 22, and a statistical information unit 23. In addition to the image memory 12, an image storage unit 5 for storing a plurality of form images 31 (FIG. 6).
1 is provided.

【0033】次に、本発明の第2の実施例についてフロ
ーチャートに基づいて説明する。図8は本発明の第2の
実施例における光学式文字読取装置の動作を示すフロー
チャートである。ステップS21 認識結果表示部16
(図7)の指令によって光学式文字読取装置の読取動作
が開始され、帳票イメージ31が取得される。すなわ
ち、図示しない搬送系によって帳票25(図2)が搬送
され、該帳票25の文字記入枠を含む帳票イメージ31
がイメージ取得部11によって光電変換され、イメージ
データとしてイメージメモリ12に格納される。ステッ
プS22 帳票25の所定位置に設定された帳票ID3
2(図6)が認識される。該帳票ID32は、すべての
種類の帳票25ごとに、又は同じグループごとに設定さ
れ、帳票25の同じ位置に印刷される。前記イメージメ
モリ12に格納されたイメージデータは、主制御部13
内の文字切出部21によってイメージメモリ12から文
字ごとに切り出され、認識部15によって文字が認識さ
れる。ステップS23 主制御部13は、前記帳票25
が新規帳票であるかどうかを判断する。この場合、新規
帳票であるかどうかは、前記認識部15によって認識さ
れた帳票ID32がフォーマット記憶部14に記憶され
ているかどうかによって判断される。新規帳票である場
合はステップS25に、新規帳票でない場合はステップ
S24に進む。ステップS24 帳票ID32によって
指定されたフォーマットに基づいて、帳票25内の読取
領域30の認識を行う。この場合、読取領域30の認識
は、前記帳票ID32の認識と同様の方法によって行わ
れる。ステップS25 帳票25をリジェクトし、ステ
ップS26、33に進み、並列処理を行う。ステップS
26 イメージメモリ12から読み出した帳票イメージ
31のイメージデータをレイアウト解析用としてイメー
ジ記憶部51に転送する。したがって、イメージメモリ
12に次の帳票25の帳票イメージ31を取り込むこと
が可能になる。なお、前記イメージ記憶部51には複数
枚分の帳票イメージ31を格納することができる。ステ
ップS27 主制御部13のレイアウト解析部22が他
の新規帳票のレイアウトの解析中であるかどうかを判断
する。他の新規帳票のレイアウトの解析中である場合
は、当該新規帳票のレイアウト解析を保留し、他の新規
帳票のレイアウトの解析が終了するのを待機する。そし
て、他の新規帳票のレイアウトの解析中でない場合は、
ステップS28に進む。ステップS28 主制御部13
において当該新規帳票のレイアウトの解析を行う。すな
わち、帳票25の記入枠33の線分を検出し、読取領域
30を認識する。ステップS29 読取領域30の仮フ
ォーマットを作成する。ステップS30 主制御部13
及び認識部15は、ステップS29において作成した仮
フォーマットを参照して、イメージメモリ12に格納さ
れたイメージデータに基づいて文字の切出し及び認識を
行い、文字の読取率が設定値以上であるかどうかを判断
することによって仮フォーマットを確認する。ステップ
S31 仮フォーマットの確認結果が良好であるかどう
かを判断する。良好である場合はステップS32に進
み、良好でない場合はステップS28に戻り、解析条件
を変更して再びレイアウトの解析を行う。ステップS3
2 作成した仮フォーマットを正式なフォーマットとし
てフォーマット記憶部14に格納して登録する。ステッ
プS33 文字の認識結果を出力する。すなわち、主制
御部13から文字の認識結果が認識結果表示部16に転
送され、記憶部17に格納される。ステップS34 読
み取るべき次の帳票25があるかどうかを判断する。帳
票25がある場合はステップS21に戻り、帳票25が
ない場合は処理を終了する。
Next, a second embodiment of the present invention will be described based on a flow chart. FIG. 8 is a flow chart showing the operation of the optical character reader according to the second embodiment of the present invention. Step S21 Recognition result display unit 16
The command of (FIG. 7) starts the reading operation of the optical character reader, and the form image 31 is acquired. That is, the form 25 (FIG. 2) is conveyed by a conveyance system (not shown), and the form image 31 including the character entry frame of the form 25 is conveyed.
Is photoelectrically converted by the image acquisition unit 11 and stored in the image memory 12 as image data. Step S22 Form ID3 set at a predetermined position on the form 25
2 (FIG. 6) is recognized. The form ID 32 is set for each type of form 25 or for each same group, and is printed at the same position on the form 25. The image data stored in the image memory 12 is stored in the main controller 13
The character cut-out unit 21 therein cuts out each character from the image memory 12, and the recognition unit 15 recognizes the character. Step S23 The main control unit 13 causes the form 25
Determines whether is a new form. In this case, whether or not it is a new form is determined by whether or not the form ID 32 recognized by the recognition unit 15 is stored in the format storage unit 14. If it is a new form, the process proceeds to step S25. If it is not a new form, the process proceeds to step S24. In step S24, the reading area 30 in the form 25 is recognized based on the format designated by the form ID 32. In this case, the recognition of the reading area 30 is performed by the same method as the recognition of the form ID 32. Step S25 The form 25 is rejected, the process proceeds to steps S26 and 33, and parallel processing is performed. Step S
26 The image data of the form image 31 read from the image memory 12 is transferred to the image storage unit 51 for layout analysis. Therefore, the form image 31 of the next form 25 can be loaded into the image memory 12. The image storage unit 51 can store a plurality of form images 31. In step S27, the layout analysis unit 22 of the main control unit 13 determines whether the layout of another new form is being analyzed. When the layout of another new form is being analyzed, the layout analysis of the new form is suspended, and the analysis of the layout of another new form is waited for. And if the layout of other new forms is not being analyzed,
It proceeds to step S28. Step S28 Main controller 13
At, the layout of the new form is analyzed. That is, the line segment of the entry frame 33 of the form 25 is detected and the reading area 30 is recognized. In step S29, the temporary format of the reading area 30 is created. Step S30 Main controller 13
And the recognition unit 15 refers to the temporary format created in step S29, and cuts out and recognizes the character based on the image data stored in the image memory 12, and determines whether or not the reading rate of the character is equal to or more than a set value. The temporary format is confirmed by judging. In step S31, it is determined whether the confirmation result of the temporary format is good. If it is good, the process proceeds to step S32, and if it is not good, the process returns to step S28 to change the analysis condition and analyze the layout again. Step S3
2 The created temporary format is stored in the format storage unit 14 as an official format and registered. In step S33, the character recognition result is output. That is, the character recognition result is transferred from the main control unit 13 to the recognition result display unit 16 and stored in the storage unit 17. In step S34, it is determined whether there is the next form 25 to be read. If the form 25 is present, the process returns to step S21, and if the form 25 is not present, the process ends.

【0034】このように、文字の認識のためのイメージ
メモリ12及びレイアウトの解析を行うためのイメージ
記憶部51が配設され、読取りの対象となった帳票25
が新規帳票である場合、前記イメージ記憶部51に新規
帳票の帳票イメージ31が格納される。したがって、新
規帳票の帳票イメージ31に基づいてレイアウトの解析
を行うことができるとともに、該解析と並行して文字の
認識を行うことができ、スループットを向上させること
ができる。
As described above, the image memory 12 for recognizing characters and the image storage unit 51 for analyzing the layout are provided, and the form 25 to be read is provided.
Is a new form, the form image 31 of the new form is stored in the image storage unit 51. Therefore, the layout can be analyzed based on the form image 31 of the new form, and the characters can be recognized in parallel with the analysis, and the throughput can be improved.

【0035】なお、本実施例においては、イメージ記憶
部51をイメージメモリ12とは別に配設するようにな
っているが、イメージ記憶部51をイメージメモリ12
内に設定し、アドレス管理によって、レイアウトの解析
用にイメージデータを転送するとともに、イメージメモ
リ12から文字を切り出して文字の認識を行うことがで
きる。
Although the image storage unit 51 is arranged separately from the image memory 12 in this embodiment, the image storage unit 51 is arranged in the image memory 12.
The image data can be transferred for layout analysis and can be cut out from the image memory 12 to recognize the character by setting the address in the inside and managing the address.

【0036】さらに、本実施例においては、レイアウト
の解析と文字の認識を並行して行うことができるので、
レイアウトの解析によって得られる記入枠33の座標
を、複数枚の新規帳票におけるデータの平均値を計算す
ることによって求めることもできる。次に本発明の第3
の実施例について説明する。
Further, in the present embodiment, since the layout analysis and the character recognition can be performed in parallel,
The coordinates of the entry frame 33 obtained by the layout analysis can also be obtained by calculating the average value of the data in a plurality of new forms. Next, the third aspect of the present invention
An example will be described.

【0037】図9は本発明の第3の実施例における光学
式文字読取装置の動作を示すフローチャートである。ス
テップS41 認識結果表示部16(図7)の指令によ
って光学式文字読取装置の読取動作が開始され、帳票イ
メージ31(図6)が取得される。すなわち、図示しな
い搬送系によって帳票25(図2)は搬送され、該帳票
25の記入枠33を含む帳票イメージ31がイメージ取
得部11によって光電変換され、イメージデータとして
イメージメモリ12に格納される。ステップS42 帳
票25の所定位置に設定された帳票ID32が認識され
る。該帳票ID32は、すべての種類の帳票25ごと
に、又は同じグループごとに設定され、帳票25の同じ
位置に印刷される。前記イメージメモリ12に格納され
たイメージデータは、主制御部13内の文字切出部21
によってイメージメモリ12から文字ごとに切り出さ
れ、認識部15によって文字が認識される。ステップS
43 主制御部13は、前記帳票25が新規帳票である
かどうかを判断する。この場合、新規帳票であるかどう
かは、前記認識部15によって認識された帳票ID32
がフォーマット記憶部14に記憶されているかどうかに
よって判断される。新規帳票である場合はステップS4
7に、新規帳票でない場合はステップS44に進む。ス
テップS44 帳票ID32によって指定されたフォー
マットに基づいて、帳票25内の読取領域27の認識を
行う。この場合、読取領域27の認識は、前記帳票ID
32の認識と同様の方法によって行われる。ステップS
45 主制御部13の統計情報部23は、図4に示す統
計情報テーブルを参照して統計情報を取得する。該統計
情報テーブルは主制御部13内の統計情報部23に格納
されている。
FIG. 9 is a flow chart showing the operation of the optical character reader according to the third embodiment of the present invention. Step S41 The reading operation of the optical character reading device is started by the instruction of the recognition result display unit 16 (FIG. 7), and the form image 31 (FIG. 6) is acquired. That is, the form 25 (FIG. 2) is conveyed by a conveying system (not shown), the form image 31 including the entry frame 33 of the form 25 is photoelectrically converted by the image acquisition unit 11, and is stored in the image memory 12 as image data. In step S42, the form ID 32 set in the predetermined position of the form 25 is recognized. The form ID 32 is set for each type of form 25 or for each same group, and is printed at the same position on the form 25. The image data stored in the image memory 12 is stored in the character cutting unit 21 in the main control unit 13.
The characters are cut out from the image memory 12 for each character, and the recognition unit 15 recognizes the characters. Step S
43 The main control unit 13 determines whether the form 25 is a new form. In this case, it is determined whether the new form is the form ID 32 recognized by the recognition unit 15.
Is stored in the format storage unit 14. If it is a new form, step S4
If it is not a new form, the process proceeds to step S44. In step S44, the reading area 27 in the form 25 is recognized based on the format designated by the form ID 32. In this case, the reading area 27 is recognized by the form ID.
It is performed in the same manner as the recognition of 32. Step S
45 The statistical information unit 23 of the main control unit 13 acquires the statistical information by referring to the statistical information table shown in FIG. The statistical information table is stored in the statistical information unit 23 in the main control unit 13.

【0038】前記統計情報テーブルは、帳票ID32、
処理総枚数、リジェクト枚数、非通過率及びフォーマッ
ト良否の情報から成り、帳票25ごとに処理した結果が
格納されるようになっている。そして、該帳票25ごと
の非通過率(=リジェクト枚数/処理総枚数)を計算
し、処理総枚数が所定値(本実施例においては100
枚)以上で、かつ、非通過率が設定値(本実施例では5
0〔%〕)以上の場合、フォーマット良否を“1”にセ
ットするようにしてある。ステップS46 フォーマッ
トが不良であるかどうかを判断する。この場合、統計情
報テーブルのフォーマット良否が“1”であるかどうか
によって判断する。フォーマット良否が“1”であると
フォーマットが不良であると判断され、ステップS47
に、フォーマット良否が“0”であるとフォーマットが
不良でないと判断され、ステップS55に進む。
The statistical information table includes a form ID 32,
The total number of sheets processed, the number of rejected sheets, the non-passage rate, and the information on whether the format is good or bad are stored, and the result of processing each form 25 is stored. Then, the non-passage rate (= rejected number of sheets / total number of processed sheets) for each form 25 is calculated, and the total number of processed sheets is a predetermined value (100 in this embodiment).
Or more and the non-passage rate is a set value (5 in this embodiment).
If it is 0% or more, the quality of the format is set to "1". In step S46, it is determined whether the format is defective. In this case, the determination is made based on whether the format of the statistical information table is "1". If the quality of the format is "1", it is determined that the format is defective, and step S47.
If the quality of the format is "0", it is determined that the format is not defective, and the process proceeds to step S55.

【0039】なお、本実施例においてはフォーマット良
否を“1”とする処理総枚数を100枚と設定し、非通
過率を50〔%〕と設定しているが、前記処理総枚数、
非通過率等を各システムの稼働条件に対応させて設定す
ることができる。ステップS47 帳票をリジェクト
し、ステップS48、55に進み、並列処理を行う。ス
テップS48 イメージメモリ12から読み出した帳票
イメージ31のイメージデータをレイアウト解析用とし
てイメージ記憶部51に転送する。したがって、イメー
ジメモリ12に次の帳票25の帳票イメージ31を取り
込むことが可能になる。なお、前記イメージ記憶部51
には複数枚分の帳票イメージ31を格納することができ
る。ステップS49 主制御部13のレイアウト解析部
22が他の新規帳票のレイアウトの解析中であるかどう
かを判断する。他の新規帳票のレイアウトの解析中であ
る場合は、当該新規帳票のレイアウト解析を保留し、他
の新規帳票のレイアウトの解析が終了するのを待機す
る。そして、他の新規帳票のレイアウトの解析中でない
場合は、ステップS50に進む。ステップS50 主制
御部13において当該新規帳票のレイアウトの解析を行
う。すなわち、帳票25の記入枠33の線分を検出し、
読取領域27を認識する。ステップS51 読取領域2
7の仮フォーマットを作成する。ステップS52 主制
御部13及び認識部15は、ステップS51において作
成した仮フォーマットを参照して、イメージメモリ12
に格納されたイメージデータに基づいて文字の切出し及
び認識を行い、文字の読取率が設定値以上であるかどう
かを判断することによって仮フォーマットを確認する。
ステップS53 仮フォーマットの確認結果が良好であ
るかどうかを判断する。良好である場合はステップS5
4に進み、良好でない場合はステップS50に戻り、解
析条件を変更して再びレイアウトの解析を行う。ステッ
プS54 作成した仮フォーマットを正式なフォーマッ
トとしてフォーマット記憶部14に格納して登録する。
ステップS55 文字の認識結果を出力する。すなわ
ち、主制御部13から文字の認識結果が認識結果表示部
16に転送され、記憶部17に格納される。ステップS
56 読み取るべき次の帳票25があるかどうかを判断
する。該帳票25がある場合はステップS41に戻り、
帳票25がない場合は処理を終了する。
In this embodiment, the total number of processed sheets for which the quality of the format is "1" is set to 100, and the non-passage rate is set to 50%.
The non-passage rate and the like can be set according to the operating conditions of each system. Step S47 The form is rejected, and the process proceeds to steps S48 and 55 to perform parallel processing. In step S48, the image data of the form image 31 read from the image memory 12 is transferred to the image storage unit 51 for layout analysis. Therefore, the form image 31 of the next form 25 can be loaded into the image memory 12. The image storage unit 51
A plurality of form images 31 can be stored in. In step S49, the layout analysis unit 22 of the main control unit 13 determines whether the layout of another new form is being analyzed. When the layout of another new form is being analyzed, the layout analysis of the new form is suspended, and the analysis of the layout of another new form is waited for. When the layout of another new form is not being analyzed, the process proceeds to step S50. In step S50, the main control unit 13 analyzes the layout of the new form. That is, the line segment of the entry frame 33 of the form 25 is detected,
The reading area 27 is recognized. Step S51 Reading area 2
Create a temporary format of 7. In step S52, the main control unit 13 and the recognition unit 15 refer to the temporary format created in step S51 and refer to the image memory 12
The temporary format is confirmed by cutting out and recognizing the character based on the image data stored in and determining whether or not the reading rate of the character is equal to or more than a set value.
In step S53, it is determined whether or not the confirmation result of the temporary format is good. If good, step S5
4, the process returns to step S50 if the condition is not good, the analysis condition is changed, and the layout is analyzed again. Step S54 The created temporary format is stored in the format storage unit 14 as a formal format and registered.
In step S55, the character recognition result is output. That is, the character recognition result is transferred from the main control unit 13 to the recognition result display unit 16 and stored in the storage unit 17. Step S
56 It is determined whether there is the next form 25 to be read. If the form 25 is present, the process returns to step S41,
If there is no form 25, the process ends.

【0040】なお、本実施例においては、X軸方向枠検
出スライスSX 及びY軸方向枠検出スライスSY は値を
変更することができる。イメージメモリ12を多値構成
にして、多値データを2値データに変換するためのスラ
イスレベルを可変とし、該スライスレベルを変更するこ
とによって、精度よくレイアウトの解析を行うことがで
きる。
In this embodiment, the values of the X-axis direction frame detection slice S X and the Y-axis direction frame detection slice S Y can be changed. The image memory 12 has a multi-valued configuration, the slice level for converting multi-valued data into binary data is variable, and the slice level is changed, whereby the layout can be analyzed accurately.

【0041】また、イメージ記憶部51をイメージメモ
リ12とは別に配設するようになっているが、イメージ
記憶部51をイメージメモリ12内に設定し、アドレス
管理によって、レイアウトの解析用にイメージデータを
転送するとともに、イメージメモリ12から文字を切り
出して文字の認識を行うことができる。さらに、本実施
例においては、レイアウトの解析と文字の認識を並行し
て行うことができるので、レイアウトの解析によって得
られる記入枠33の座標を、複数枚の新規帳票における
データの平均値を計算することによって求めることもで
きる。
Although the image storage unit 51 is arranged separately from the image memory 12, the image storage unit 51 is set in the image memory 12 and the image data for layout analysis is set by address management. And the character can be cut out from the image memory 12 to recognize the character. Further, in the present embodiment, since the layout analysis and the character recognition can be performed in parallel, the coordinates of the entry frame 33 obtained by the layout analysis are calculated as the average value of the data in a plurality of new forms. It can also be obtained by doing.

【0042】なお、本発明は前記実施例に限定されるも
のではなく、本発明の趣旨に基づいて種々変形させるこ
とが可能であり、それらを本発明の範囲から排除するも
のではない。
The present invention is not limited to the above-mentioned embodiments, but can be variously modified within the scope of the present invention, and they are not excluded from the scope of the present invention.

【0043】[0043]

【発明の効果】以上詳細に説明したように、本発明によ
れば、光学式文字読取装置においては、読取領域の記入
枠の相対的な位置関係が変わらない帳票の文字を、帳票
IDに対応させて設定されたフォーマットに基づいて認
識するようになっている。そして、記入枠を含む帳票イ
メージを取得するイメージ取得手段と、前記帳票が新規
帳票であるかどうかを判断する新規帳票判断手段と、前
記帳票イメージをイメージデータとして格納するイメー
ジメモリと、該イメージメモリに格納されたイメージデ
ータに基づいてレイアウトの解析を行うレイアウト解析
手段と、レイアウトの解析結果に基づいてフォーマット
を作成するフォーマット作成手段とを有する。
As described above in detail, according to the present invention, in the optical character reading device, the characters of the form in which the relative positional relationship of the writing frames of the reading area does not change correspond to the form ID. The recognition is performed based on the set format. An image acquisition unit that acquires a form image including an entry frame, a new form determination unit that determines whether the form is a new form, an image memory that stores the form image as image data, and the image memory. The layout analysis unit analyzes the layout based on the image data stored in the storage unit, and the format creation unit creates a format based on the layout analysis result.

【0044】この場合、帳票が新規帳票である場合、レ
イアウト解析手段が、イメージメモリに格納されたイメ
ージデータに基づいてレイアウトの解析を行う。また、
フォーマット作成手段は、レイアウトの解析結果に基づ
いてフォーマットを作成する。したがって、異なる種類
の帳票が頻繁に追加される場合等においても、追加され
た帳票ごとにフォーマットを自動的に作成することがで
きるので、フォーマットの作成に伴う作業を簡素化する
ことができる。
In this case, when the form is a new form, the layout analysis means analyzes the layout based on the image data stored in the image memory. Also,
The format creating means creates a format based on the layout analysis result. Therefore, even when different types of forms are frequently added, the format can be automatically created for each added form, and the work involved in creating the format can be simplified.

【0045】本発明の他の光学式文字読取装置において
は、帳票の読取結果を示す統計情報が格納された統計情
報テーブルと、該統計情報テーブルを参照して統計情報
を取得し、該統計情報に基づいてフォーマットが不良で
あるかどうかを判断するフォーマット良否判断手段とを
有する。そして、前記レイアウト解析手段は、フォーマ
ットが不良である場合に該当する帳票についてレイアウ
トを解析する。
In another optical character reader of the present invention, a statistical information table in which statistical information indicating the result of reading a form is stored, and the statistical information is acquired by referring to the statistical information table, and the statistical information is acquired. Format pass / fail judgment means for judging whether or not the format is defective based on the above. Then, the layout analysis means analyzes the layout of the form corresponding to the case where the format is bad.

【0046】この場合、記入枠の大きさ等が変更され、
フォーマットが不良になると、該当する帳票についてレ
イアウトを解析する。したがって、新たにフォーマット
が作成されて登録されるので、フォーマットの作成に伴
う作業を簡素化することができる。本発明の更に他の光
学式文字読取装置においては、読取領域の記入枠の相対
的な位置関係が変わらない帳票の文字を、帳票IDに対
応させて設定されたフォーマットに基づいて認識するよ
うになっている。そして、記入枠を含む帳票イメージを
取得するイメージ取得手段と、前記帳票が新規帳票であ
るかどうかを判断する新規帳票判断手段と、前記帳票イ
メージを文字の認識用のイメージデータとして格納する
イメージメモリと、前記帳票イメージをレイアウト解析
用のイメージデータとして格納するイメージ記憶部と、
前記文字の認識と並行して、前記イメージ記憶部に格納
されたイメージデータに基づいてレイアウトの解析を行
うレイアウト解析手段と、レイアウトの解析結果に基づ
いてフォーマットを作成するフォーマット作成手段とを
有する。
In this case, the size of the entry frame is changed,
When the format becomes bad, the layout is analyzed for the corresponding form. Therefore, since a new format is created and registered, the work involved in creating the format can be simplified. In still another optical character reader of the present invention, the characters of the form in which the relative positional relationship of the writing frames of the reading area does not change are recognized based on the format set in correspondence with the form ID. Has become. An image acquisition unit that acquires a form image including an entry frame, a new form determination unit that determines whether the form is a new form, and an image memory that stores the form image as image data for character recognition. And an image storage unit that stores the form image as image data for layout analysis,
In parallel with the recognition of the character, it has a layout analysis unit that analyzes the layout based on the image data stored in the image storage unit, and a format creation unit that creates a format based on the layout analysis result.

【0047】この場合、帳票が新規帳票である場合、レ
イアウト解析手段が、イメージメモリに格納されたイメ
ージデータに基づいてレイアウトの解析を行う。また、
フォーマット作成手段は、レイアウトの解析結果に基づ
いてフォーマットを作成する。したがって、異なる種類
の帳票が頻繁に追加される場合等においても、追加され
た帳票ごとにフォーマットを自動的に作成することがで
きるので、フォーマットの作成に伴う作業を簡素化する
ことができる。
In this case, when the form is a new form, the layout analysis means analyzes the layout based on the image data stored in the image memory. Also,
The format creating means creates a format based on the layout analysis result. Therefore, even when different types of forms are frequently added, the format can be automatically created for each added form, and the work involved in creating the format can be simplified.

【0048】しかも、文字の認識と並行してレイアウト
の解析を行うことができるので、スループットを向上さ
せることができる。本発明の更に他の光学式文字読取装
置においては、帳票の読取結果を示す統計情報が格納さ
れた統計情報テーブルと、該統計情報テーブルを参照し
て統計情報を取得し、該統計情報に基づいてフォーマッ
トが不良であるかどうかを判断するフォーマット良否判
断手段とを有する。
Moreover, since the layout can be analyzed in parallel with the character recognition, the throughput can be improved. In still another optical character reading device of the present invention, a statistical information table in which statistical information indicating a result of reading a form is stored, the statistical information is acquired by referring to the statistical information table, and based on the statistical information. Format acceptability determining means for determining whether the format is defective.

【0049】そして、前記レイアウト解析手段は、フォ
ーマットが不良である場合に該当する帳票についてレイ
アウトを解析する。この場合、帳票が新規帳票である場
合、レイアウト解析手段が、イメージメモリに格納され
たイメージデータに基づいてレイアウトの解析を行う。
また、フォーマット作成手段は、レイアウトの解析結果
に基づいてフォーマットを作成する。
Then, the layout analysis means analyzes the layout of the form corresponding to the case where the format is bad. In this case, when the form is a new form, the layout analysis means analyzes the layout based on the image data stored in the image memory.
Also, the format creating means creates a format based on the layout analysis result.

【0050】したがって、異なる種類の帳票が頻繁に追
加される場合等においても、追加された帳票ごとにフォ
ーマットを自動的に作成することができるので、フォー
マットの作成に伴う作業を簡素化することができる。ま
た、記入枠の大きさ等が変更され、フォーマットが不良
になると、該当する帳票についてレイアウトを解析す
る。したがって、新たにフォーマットが作成されて登録
されるので、フォーマットの作成に伴う作業を簡素化す
ることができる。
Therefore, even when different types of forms are frequently added, the format can be automatically created for each added form, and the work involved in creating the format can be simplified. it can. When the size of the entry frame is changed and the format becomes defective, the layout of the corresponding form is analyzed. Therefore, since a new format is created and registered, the work involved in creating the format can be simplified.

【0051】しかも、文字の認識と並行してレイアウト
の解析を行うことができるので、スループットを向上さ
せることができる。
Moreover, since the layout can be analyzed in parallel with the recognition of characters, the throughput can be improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例における光学式文字読取
装置のブロック図である。
FIG. 1 is a block diagram of an optical character reader according to a first embodiment of the present invention.

【図2】本発明の第1の実施例における帳票の例を示す
図である。
FIG. 2 is a diagram showing an example of a form according to the first embodiment of the present invention.

【図3】本発明の第1の実施例における光学式文字読取
装置の動作を示すフローチャートである。
FIG. 3 is a flowchart showing an operation of the optical character reading device according to the first embodiment of the present invention.

【図4】本発明の第1の実施例における統計情報テーブ
ルの例を示す図である。
FIG. 4 is a diagram showing an example of a statistical information table in the first embodiment of the present invention.

【図5】本発明の第1の実施例におけるレイアウト解析
枠を示す図である。
FIG. 5 is a diagram showing a layout analysis frame in the first exemplary embodiment of the present invention.

【図6】本発明の第1の実施例におけるレイアウト解析
座標の算出方法の説明図である。
FIG. 6 is an explanatory diagram of a method of calculating layout analysis coordinates according to the first embodiment of this invention.

【図7】本発明の第2の実施例における光学式文字読取
装置のブロック図である。
FIG. 7 is a block diagram of an optical character reading device according to a second embodiment of the present invention.

【図8】本発明の第2の実施例における光学式文字読取
装置の動作を示すフローチャートである。
FIG. 8 is a flowchart showing an operation of the optical character reading device according to the second embodiment of the present invention.

【図9】本発明の第3の実施例における光学式文字読取
装置の動作を示すフローチャートである。
FIG. 9 is a flowchart showing an operation of the optical character reading device in the third embodiment of the present invention.

【符号の説明】[Explanation of symbols]

12 イメージメモリ 13 主制御部 14 フォーマット記憶部 15 認識部 22 レイアウト解析部 23 統計情報部 25 帳票 26、32 帳票ID 27、30 読取領域 31 帳票イメージ 33 記入枠 34 文字 51 イメージ記憶部 HX 、HY 投影 SX X軸方向枠検出スライス SY Y軸方向枠検出スライス A〜D 座標 Mi 、Kj 線分12 image memory 13 main control unit 14 format storage unit 15 recognition unit 22 layout analysis unit 23 statistical information unit 25 forms 26, 32 form ID 27, 30 reading area 31 form image 33 entry frame 34 characters 51 image storage unit H X , H Y projection S X X-axis direction frame detection slice S Y Y-axis direction frame detection slice A to D coordinates M i , K j line segment

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 読取領域の記入枠の相対的な位置関係が
変わらない帳票の文字を、帳票IDに対応させて設定さ
れたフォーマットに基づいて認識する光学式文字読取装
置において、(a)記入枠を含む帳票イメージを取得す
るイメージ取得手段と、(b)前記帳票が新規帳票であ
るかどうかを判断する新規帳票判断手段と、(c)前記
帳票イメージをイメージデータとして格納するイメージ
メモリと、(d)該イメージメモリに格納されたイメー
ジデータに基づいてレイアウトの解析を行うレイアウト
解析手段と、(e)レイアウトの解析結果に基づいてフ
ォーマットを作成するフォーマット作成手段とを有する
ことを特徴とする光学式文字読取装置。
1. An optical character reading device for recognizing characters of a form whose relative positional relationship of entry frames of a reading area does not change based on a format set in correspondence with a form ID. An image acquisition unit that acquires a form image including a frame; (b) a new form determination unit that determines whether the form is a new form; and (c) an image memory that stores the form image as image data. (D) a layout analysis means for analyzing a layout based on the image data stored in the image memory, and (e) a format creation means for creating a format based on the layout analysis result. Optical character reader.
【請求項2】 (a)前記レイアウト解析手段は、前記
読取領域の各記入枠を設定する線分を前記イメージデー
タの投影に基づいて検出する線分検出手段と、前記線分
に基づいて各記入枠の座標を計算する座標計算手段とを
備え、(b)前記フォーマット作成手段は、前記記入枠
の座標に基づいてフォーマットを作成する請求項1に記
載の光学式文字読取装置。
2. (a) The layout analysis means detects a line segment that sets each entry frame of the reading area based on the projection of the image data, and a line segment detection means that detects each line segment based on the line segment. The optical character reader according to claim 1, further comprising: coordinate calculating means for calculating the coordinates of the entry frame, and (b) the format creating means creates a format based on the coordinates of the entry frame.
【請求項3】 (a)帳票の読取結果を示す統計情報が
格納された統計情報テーブルと、(b)該統計情報テー
ブルを参照して統計情報を取得し、該統計情報に基づい
てフォーマットが不良であるかどうかを判断するフォー
マット良否判断手段とを有するとともに、(c)前記レ
イアウト解析手段は、フォーマットが不良である場合に
該当する帳票についてレイアウトを解析する請求項1に
記載の光学式文字読取装置。
3. A statistical information table in which (a) statistical information indicating a reading result of a form is stored, and (b) statistical information is acquired by referring to the statistical information table, and a format based on the statistical information is obtained. The optical character according to claim 1, further comprising a format pass / fail determination unit for determining whether or not the format is defective, and (c) the layout analysis unit analyzes a layout for a form corresponding to the case where the format is defective. Reader.
【請求項4】 読取領域の記入枠の相対的な位置関係が
変わらない帳票の文字を、帳票IDに対応させて設定さ
れたフォーマットに基づいて認識する光学式文字読取装
置において、(a)記入枠を含む帳票イメージを取得す
るイメージ取得手段と、(b)前記帳票が新規帳票であ
るかどうかを判断する新規帳票判断手段と、(c)前記
帳票イメージを文字の認識用のイメージデータとして格
納するイメージメモリと、(d)前記帳票イメージをレ
イアウト解析用のイメージデータとして格納するイメー
ジ記憶部と、(e)前記文字の認識と並行して、前記イ
メージ記憶部に格納されたイメージデータに基づいてレ
イアウトの解析を行うレイアウト解析手段と、(f)レ
イアウトの解析結果に基づいてフォーマットを作成する
フォーマット作成手段とを有することを特徴とする光学
式文字読取装置。
4. An optical character reading device for recognizing characters of a form whose relative positional relationship of entry frames of a reading area does not change on the basis of a format set in correspondence with a form ID. An image acquisition unit that acquires a form image including a frame, (b) a new form determination unit that determines whether the form is a new form, and (c) stores the form image as image data for character recognition. And an image memory for storing the form image as image data for layout analysis, and (e) in parallel with the recognition of the characters, based on the image data stored in the image storage unit. Layout analysis means for performing layout analysis by means of (f) format creation procedure for creating a format based on the layout analysis result. An optical character reader having a step.
【請求項5】 (a)前記レイアウト解析手段は、前記
読取領域の各記入枠を設定する線分を前記イメージデー
タの投影に基づいて検出する線分検出手段と、前記線分
に基づいて各記入枠の座標を計算する座標計算手段とを
備え、(b)前記フォーマット作成手段は、前記記入枠
の座標に基づいてフォーマットを作成する請求項4に記
載の光学式文字読取装置。
5. (a) The layout analysis means detects a line segment that sets each entry frame of the reading area based on the projection of the image data, and a line segment detection means that detects each line segment based on the line segment. 5. The optical character reader according to claim 4, further comprising: coordinate calculating means for calculating the coordinates of the entry frame, and (b) the format creating means creates the format based on the coordinates of the entry frame.
【請求項6】 (a)帳票の読取結果を示す統計情報が
格納された統計情報テーブルと、(b)該統計情報テー
ブルを参照して統計情報を取得し、該統計情報に基づい
てフォーマットが不良であるかどうかを判断するフォー
マット良否判断手段とを有するとともに、(c)前記レ
イアウト解析手段は、フォーマットが不良である場合に
該当する帳票についてレイアウトを解析する請求項4に
記載の光学式文字読取装置。
6. A statistical information table in which (a) statistical information indicating a result of reading a form is stored; and (b) statistical information is acquired by referring to the statistical information table, and the format is based on the statistical information. 5. The optical character according to claim 4, further comprising: a format pass / fail determining unit for determining whether or not the format is defective, and (c) the layout analyzing unit analyzes a layout of a form corresponding to the case where the format is defective. Reader.
JP6255198A 1994-10-20 1994-10-20 Optical character reader Withdrawn JPH08123872A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6255198A JPH08123872A (en) 1994-10-20 1994-10-20 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6255198A JPH08123872A (en) 1994-10-20 1994-10-20 Optical character reader

Publications (1)

Publication Number Publication Date
JPH08123872A true JPH08123872A (en) 1996-05-17

Family

ID=17275395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6255198A Withdrawn JPH08123872A (en) 1994-10-20 1994-10-20 Optical character reader

Country Status (1)

Country Link
JP (1) JPH08123872A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033743A (en) * 2019-08-27 2021-03-01 株式会社日立製作所 Information processing equipment, document identification method, and information processing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033743A (en) * 2019-08-27 2021-03-01 株式会社日立製作所 Information processing equipment, document identification method, and information processing system

Similar Documents

Publication Publication Date Title
US4933979A (en) Data reading apparatus for reading data from form sheet
US5375176A (en) Method and apparatus for automatic character type classification of European script documents
US8306325B2 (en) Text character identification system and method thereof
JP3485020B2 (en) Character recognition method and apparatus, and storage medium
JP3268552B2 (en) Area extraction method, destination area extraction method, destination area extraction apparatus, and image processing apparatus
US10706337B2 (en) Character recognition device, character recognition method, and recording medium
JPH08123872A (en) Optical character reader
JPH06131495A (en) Image information extraction method
JP3276555B2 (en) Format recognition device and character reader
JPH10207978A (en) Pattern matching method and device for characters etc.
JP3022459B2 (en) Form identification registration device
JPH06187450A (en) Pattern recognition method and recognition device
JP2747136B2 (en) Character recognition device
JP3276554B2 (en) Format recognition device and character reader
JP2001126025A (en) OCR format parameter creation method
JPH06301814A (en) Character reader
JP3919390B2 (en) Character recognition device
JP2683711B2 (en) How to recognize / correct character / symbol data
JPH0632074B2 (en) Normalization method
JPH03122786A (en) Optical character reader
JP2004013188A (en) Business form reading device, business form reading method and program therefor
JPH04139593A (en) Postal code number recognition device
JPH05120482A (en) Character recognizing device
JPS5914078A (en) Reader of business form
JPS5953977A (en) Character recognizing device

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020115