JPH08123872A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH08123872A
JPH08123872A JP6255198A JP25519894A JPH08123872A JP H08123872 A JPH08123872 A JP H08123872A JP 6255198 A JP6255198 A JP 6255198A JP 25519894 A JP25519894 A JP 25519894A JP H08123872 A JPH08123872 A JP H08123872A
Authority
JP
Japan
Prior art keywords
format
image
layout
statistical information
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6255198A
Other languages
English (en)
Inventor
Yoshikazu Kobayashi
美和 小林
Koji Senoo
康二 妹尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6255198A priority Critical patent/JPH08123872A/ja
Publication of JPH08123872A publication Critical patent/JPH08123872A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】読取領域が頻繁に変更される場合、異なる種類
の帳票が頻繁に追加される場合等においても、作業を簡
素化する。 【構成】読取領域の記入枠の相対的な位置関係が変わら
ない帳票の文字を、帳票IDに対応させて設定されたフ
ォーマットに基づいて認識するようになっている。そし
て、記入枠を含む帳票イメージを取得するイメージ取得
手段と、前記帳票が新規帳票であるかどうかを判断する
新規帳票判断手段と、前記帳票イメージをイメージデー
タとして格納するイメージメモリ12と、レイアウト解
析手段と、フォーマット作成手段とを有する。レイアウ
ト解析手段が、イメージメモリ12に格納されたイメー
ジデータに基づいてレイアウトの解析を行い、フォーマ
ット作成手段は、レイアウトの解析結果に基づいてフォ
ーマットを作成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学式文字読取装置
(OCR)に関するものである。
【0002】
【従来の技術】従来、光学式文字読取装置においては、
帳票の帳票イメージを光学系によってイメージセンサに
結像させ、該イメージセンサによって得られた画像信号
をイメージデータに変換し、該イメージデータをメモリ
に書き込むようになっている。そして、前記イメージデ
ータから切り出した文字の特徴を抽出することによって
文字を認識することができるようになっている。
【0003】そこで、前記イメージデータから文字を切
り出すために、読取対象となる帳票のどの領域(帳票辺
からの距離で記述)に、どの種類の文字(手書きのアル
ファベット、数字、カナ、記号、漢字等、又は活字のア
ルファベット、数字、カナ、記号、漢字等)が何文字記
入、又は印字されているか等の情報がフォーマットとし
て設定され、該フォーマットは帳票の種類ごとにあらか
じめ登録されるようになっている。
【0004】そこで、帳票の種類を認識するために、帳
票ID(5桁の活字、数字等)が帳票の所定位置(例え
ば、右上等)に記入、又は印字されるようになってい
る。したがって、光学式文字読取装置は、まず、帳票I
Dを認識し、該当するフォーマットに基づいて帳票の読
取領域において該当文字数の分だけ文字を切り出す。そ
して、切り出された文字は該当文字種の辞書と比較さ
れ、文字の認識が行われる。
【0005】
【発明が解決しようとする課題】しかしながら、前記従
来の光学式文字読取装置においては、フォーマットを登
録する場合、オペレータは帳票の読取領域の寸法、記
入、又は印字される文字の文字種、文字数等を測定し、
光学式文字読取装置に入力する必要があるので、登録に
要する時間が長くなる。また、帳票IDが同一のまま帳
票の読取領域が頻繁に変更される場合、異なる種類の帳
票が頻繁に追加される場合等においては、フォーマット
を変更したり、追加したりしなければならず、それに伴
う作業が煩わしい。
【0006】本発明は、前記従来の光学式文字読取装置
の問題点を解決して、帳票IDが同一のまま帳票の読取
領域が頻繁に変更される場合、異なる種類の帳票が頻繁
に追加される場合等においても、作業が煩わしくなるこ
とがない光学式文字読取装置を提供することを目的とす
る。
【0007】
【課題を解決するための手段】そのために、本発明の光
学式文字読取装置においては、読取領域の記入枠の相対
的な位置関係が変わらない帳票の文字を、帳票IDに対
応させて設定されたフォーマットに基づいて認識するよ
うになっている。そして、記入枠を含む帳票イメージを
取得するイメージ取得手段と、前記帳票が新規帳票であ
るかどうかを判断する新規帳票判断手段と、前記帳票イ
メージをイメージデータとして格納するイメージメモリ
と、該イメージメモリに格納されたイメージデータに基
づいてレイアウトの解析を行うレイアウト解析手段と、
レイアウトの解析結果に基づいてフォーマットを作成す
るフォーマット作成手段とを有する。
【0008】本発明の他の光学式文字読取装置において
は、帳票の読取結果を示す統計情報が格納された統計情
報テーブルと、該統計情報テーブルを参照して統計情報
を取得し、該統計情報に基づいてフォーマットが不良で
あるかどうかを判断するフォーマット良否判断手段とを
有する。そして、前記レイアウト解析手段は、フォーマ
ットが不良である場合に該当する帳票についてレイアウ
トを解析する。
【0009】本発明の更に他の光学式文字読取装置にお
いては、読取領域の記入枠の相対的な位置関係が変わら
ない帳票の文字を、帳票IDに対応させて設定されたフ
ォーマットに基づいて認識するようになっている。そし
て、記入枠を含む帳票イメージを取得するイメージ取得
手段と、前記帳票が新規帳票であるかどうかを判断する
新規帳票判断手段と、前記帳票イメージを文字の認識用
のイメージデータとして格納するイメージメモリと、前
記帳票イメージをレイアウト解析用のイメージデータと
して格納するイメージ記憶部と、前記文字の認識と並行
して、前記イメージ記憶部に格納されたイメージデータ
に基づいてレイアウトの解析を行うレイアウト解析手段
と、レイアウトの解析結果に基づいてフォーマットを作
成するフォーマット作成手段とを有する。
【0010】本発明の更に他の光学式文字読取装置にお
いては、帳票の読取結果を示す統計情報が格納された統
計情報テーブルと、該統計情報テーブルを参照して統計
情報を取得し、該統計情報に基づいてフォーマットが不
良であるかどうかを判断するフォーマット良否判断手段
とを有する。そして、前記レイアウト解析手段は、フォ
ーマットが不良である場合に該当する帳票についてレイ
アウトを解析する。
【0011】
【作用】本発明によれば、前記のように光学式文字読取
装置においては、読取領域の記入枠の相対的な位置関係
が変わらない帳票の文字を、帳票IDに対応させて設定
されたフォーマットに基づいて認識するようになってい
る。そして、記入枠を含む帳票イメージを取得するイメ
ージ取得手段と、前記帳票が新規帳票であるかどうかを
判断する新規帳票判断手段と、前記帳票イメージをイメ
ージデータとして格納するイメージメモリと、該イメー
ジメモリに格納されたイメージデータに基づいてレイア
ウトの解析を行うレイアウト解析手段と、レイアウトの
解析結果に基づいてフォーマットを作成するフォーマッ
ト作成手段とを有する。
【0012】この場合、読取動作が開始されると、イメ
ージ取得手段によって帳票イメージが取得され、イメー
ジデータとしてイメージメモリに格納される。次に、該
イメージメモリに格納されたイメージデータは、文字ご
とに切り出され、認識部によって文字が認識される。そ
して、新規帳票判断手段によって前記帳票が新規帳票で
あるかどうかが判断され、新規帳票である場合、レイア
ウト解析手段が、イメージメモリに格納されたイメージ
データに基づいてレイアウトの解析を行う。また、フォ
ーマット作成手段は、レイアウトの解析結果に基づいて
フォーマットを作成する。
【0013】本発明の他の光学式文字読取装置において
は、帳票の読取結果を示す統計情報が格納された統計情
報テーブルと、該統計情報テーブルを参照して統計情報
を取得し、該統計情報に基づいてフォーマットが不良で
あるかどうかを判断するフォーマット良否判断手段とを
有する。そして、前記レイアウト解析手段は、フォーマ
ットが不良である場合に該当する帳票についてレイアウ
トを解析する。
【0014】この場合、記入枠の大きさ等が変更される
と、統計情報テーブル内の非通過率が高くなる。そこ
で、前記フォーマット良否判断手段は、統計情報テーブ
ルを参照して統計情報を取得し、該統計情報に基づいて
フォーマットが不良であるかどうかを判断する。そし
て、前記レイアウト解析手段は、フォーマットが不良で
ある場合に該当する帳票についてレイアウトを解析す
る。
【0015】本発明の更に他の光学式文字読取装置にお
いては、読取領域の記入枠の相対的な位置関係が変わら
ない帳票の文字を、帳票IDに対応させて設定されたフ
ォーマットに基づいて認識するようになっている。そし
て、記入枠を含む帳票イメージを取得するイメージ取得
手段と、前記帳票が新規帳票であるかどうかを判断する
新規帳票判断手段と、前記帳票イメージを文字の認識用
のイメージデータとして格納するイメージメモリと、前
記帳票イメージをレイアウト解析用のイメージデータと
して格納するイメージ記憶部と、前記文字の認識と並行
して、前記イメージ記憶部に格納されたイメージデータ
に基づいてレイアウトの解析を行うレイアウト解析手段
と、レイアウトの解析結果に基づいてフォーマットを作
成するフォーマット作成手段とを有する。
【0016】この場合、読取動作が開始されると、イメ
ージ取得手段によって帳票イメージが取得され、イメー
ジデータとしてイメージメモリに格納される。次に、該
イメージメモリに格納されたイメージデータは、文字ご
とに切り出され、認識部によって文字が認識される。ま
た、前記イメージデータはイメージ記憶部に転送され
る。
【0017】そして、新規帳票判断手段によって前記帳
票が新規帳票であるかどうかが判断され、新規帳票であ
る場合はレイアウト解析手段が、イメージ記憶部に格納
されたイメージデータに基づいてレイアウトの解析を行
う。また、フォーマット作成手段は、レイアウトの解析
結果に基づいてフォーマットを作成する。本発明の更に
他の光学式文字読取装置においては、帳票の読取結果を
示す統計情報が格納された統計情報テーブルと、該統計
情報テーブルを参照して統計情報を取得し、該統計情報
に基づいてフォーマットが不良であるかどうかを判断す
るフォーマット良否判断手段とを有する。
【0018】そして、前記レイアウト解析手段は、フォ
ーマットが不良である場合に該当する帳票についてレイ
アウトを解析する。この場合、記入枠の大きさ等が変更
されると、統計情報テーブル内の非通過率が高くなる。
そこで、前記フォーマット良否判断手段は、統計情報テ
ーブルを参照して統計情報を取得し、該統計情報に基づ
いてフォーマットが不良であるかどうかを判断する。そ
して、前記レイアウト解析手段は、フォーマットが不良
である場合に該当する帳票についてレイアウトを解析す
る。
【0019】
【実施例】以下、本発明の実施例について図面を参照し
ながら詳細に説明する。図1は本発明の第1の実施例に
おける光学式文字読取装置のブロック図、図2は本発明
の第1の実施例における帳票の例を示す図である。図1
において、11はイメージ取得部、12はイメージメモ
リ、13は主制御部、14はフォーマット記憶部、15
は認識部、16は認識結果表示部、17は記憶部であ
る。前記主制御部13は光学式文字読取装置の全体を制
御し、文字切出部21、レイアウト解析部22及び統計
情報部23を有する。
【0020】前記イメージ取得部11は、光電変換素子
(CCDセンサ等)から成る図示しないイメージセン
サ、光源(蛍光灯等)、結像器(レンズ等)及び帳票搬
送系等を有し、帳票イメージをイメージデータとして前
記イメージセンサに結像し、前記主制御部13の指令を
受けて前記イメージデータをイメージメモリ12に格納
する。
【0021】主制御部13は、前記イメージメモリ12
から文字を切り出して文字パターンを認識部15に送る
と、該認識部15は文字パターンの特徴を抽出し、認識
辞書を参照して文字を認識する。また、図2において、
25は帳票、26は該帳票25の種類ごとに設定された
帳票ID、27は読取領域である。
【0022】次に、本発明の第1の実施例についてフロ
ーチャートに基づいて説明する。図3は本発明の第1の
実施例における光学式文字読取装置の動作を示すフロー
チャート、図4は本発明の第1の実施例における統計情
報テーブルの例を示す図である。ステップS1 認識結
果表示部16(図1)の指令によって光学式文字読取装
置の読取動作が開始され、帳票イメージが取得される。
すなわち、図示しない搬送系によって帳票25(図2)
が搬送され、該帳票25の文字記入枠を含む帳票イメー
ジがイメージ取得部11によって光電変換され、イメー
ジデータとしてイメージメモリ12に格納される。ステ
ップS2 帳票25の所定位置に設定された帳票ID2
6が認識される。該帳票ID26は、すべての種類の帳
票25ごとに、又は同じグループごとに設定され、帳票
25の同じ位置に印刷される。前記イメージメモリ12
に格納されたイメージデータは、主制御部13内の文字
切出部21によってイメージメモリ12から文字ごとに
切り出され、認識部15によって文字が認識される。ス
テップS3 主制御部13は、前記帳票25が新規帳票
であるかどうかを判断する。この場合、新規帳票である
かどうかは、前記認識部15によって認識された帳票I
D26がフォーマット記憶部14に記憶されているかど
うかによって判断される。新規帳票である場合はステッ
プS7に、新規帳票でない場合はステップS4に進む。
ステップS4 帳票ID26によって指定されたフォー
マットに基づいて、帳票25内の読取領域27の認識を
行う。この場合、読取領域27の認識は、前記帳票ID
26の認識と同様の方法によって行われる。ステップS
5 主制御部13の統計情報部23は、図4に示す統計
情報テーブルを参照して統計情報を取得する。該統計情
報テーブルは主制御部13内の統計情報部23に格納さ
れている。
【0023】前記統計情報テーブルは、帳票ID26、
処理総枚数、リジェクト枚数、非通過率及びフォーマッ
ト良否の情報から成り、帳票25ごとに処理した結果が
格納されるようになっている。そして、該帳票25ごと
の非通過率(=リジェクト枚数/処理総枚数)を計算
し、処理総枚数が所定値(本実施例においては100
枚)以上で、かつ、非通過率が設定値(本実施例では5
0〔%〕)以上の場合、フォーマット良否を“1”にセ
ットするようにしてある。ステップS6 フォーマット
が不良であるかどうかを判断する。この場合、統計情報
テーブルのフォーマット良否が“1”であるかどうかに
よって判断する。フォーマット良否が“1”であるとフ
ォーマットが不良であると判断され、ステップS7に、
フォーマット良否が“0”であるとフォーマットが不良
でないと判断され、ステップS12へ進む。
【0024】ところで、リジェクトが多発してもその要
因(印字濃度、手書き濃度が低い場合等)は様々であ
る。本実施例においてはフォーマット良否を“1”とす
る処理総枚数を100枚と設定し、非通過率を50
〔%〕と設定しているが、前記処理総枚数、非通過率等
を各システムの稼働条件に対応させて設定することがで
きる。ステップS7 主制御部13においてレイアウト
の解析を行う。すなわち、帳票25の記入枠の線分を検
出し、読取領域27を認識する。ステップS8 読取領
域27の仮フォーマットを作成する。ステップS9 主
制御部13及び認識部15は、ステップS8において作
成した仮フォーマットを参照して、イメージメモリ12
に格納されたイメージデータに基づいて文字の切出し及
び認識を行い、文字の読取率が設定値以上であるかどう
かを判断することによって仮フォーマットを確認する。
ここで、読取率とは、イメージメモリ12から切り出さ
れた文字のうち、認識することができたものの率をい
う。ステップS10 仮フォーマットの確認結果が良好
であるかどうかを判断する。良好である場合はステップ
S11に進み、良好でない場合はステップS7に戻り、
解析条件を変更して再びレイアウトの解析を行う。ステ
ップS11 作成した仮フォーマットを正式なフォーマ
ットとしてフォーマット記憶部14に格納して登録す
る。ステップS12 文字の認識結果を出力する。すな
わち、主制御部13から文字の認識結果が認識結果表示
部16に転送され、記憶部17に格納される。ステップ
S13 読み取るべき次の帳票25があるかどうかを判
断する。該帳票25がある場合はステップS1に戻り、
帳票25がない場合は処理を終了する。
【0025】次に、読取領域27内の各記入枠の相対的
な位置関係が既知である場合のレイアウトの解析につい
て説明する。図5は本発明の第1の実施例におけるレイ
アウト解析枠を示す図、図6は本発明の第1の実施例に
おけるレイアウト解析座標の算出方法の説明図である。
図6において、帳票イメージ31はイメージメモリ12
(図1)内にイメージデータとして格納される。前記帳
票イメージ31は読取領域30内に位置する帳票ID3
2、記入枠33、該記入枠33内に形成された文字34
等のデータから成る。
【0026】また、HX 、HY は、帳票イメージ31の
それぞれX軸方向、Y軸方向の投影(黒点数の総和)で
あり、該帳票イメージ31の外側(背影)は黒点だけで
形成される。そして、X軸方向の投影処理によってX軸
方向の投影HX が得られ、該投影H X をX軸方向枠検出
スライスSX と比較することによって、X軸に平行な線
分を検出することができる。各線分のY軸アドレスは、
帳票イメージ31の上辺を0とし、下辺をyとしたと
き、y1 、y2 、…、y6 になる。
【0027】同様に、Y軸方向の投影処理によってY軸
方向の投影HY が得られ、該投影H Y をY軸方向枠検出
スライスSY と比較することによって、Y軸に平行な線
分を検出することができる。各線分のX軸アドレスは、
帳票イメージ31の左辺を0とし、右辺をxとしたと
き、x1 、x2 、…、x5 になる。なお、X軸方向枠検
出スライスSX 及びY軸方向枠検出スライスSY は値を
変更することができる。
【0028】また、図5に示すように、前記帳票イメー
ジ31を設定する点A〜Dの各座標は、それぞれ(0,
0)、(x,0)、(x,y)、(0,y)になる。ま
た、X軸に平行な線分Ki (i=0 、1、2、…、5)
と、Y軸に平行な線分Mj (j=0 、1、2、…、4)
との各交点の座標を求めることができる。そして、線分
i とKj の交点の座標を(xi ,yj )とすると、読
取領域30内の各記入枠33の相対的な位置関係が既知
であるので、例えば図6の帳票イメージ31において、
顧客No.の番号(本実施例においては、文字「123
4」)が記入された記入枠33は、線分M1 、M2 、K
O 、K1 によって包囲される図5の斜線領域となる。こ
の場合、フォーマットは、例えば、(x1 ,y0 )、
(x2 ,y1 )の2個の座標によって表される。
【0029】このように、本実施例においては、帳票2
5が新規帳票である場合、レイアウト解析部22、イメ
ージメモリ12に格納されたイメージデータに基づいて
レイアウトの解析を行う。また、主制御部13は、レイ
アウトの解析結果に基づいてフォーマットを作成する。
したがって、異なる種類の帳票25が頻繁に追加される
場合等においても、追加された帳票25ごとにフォーマ
ットを自動的に作成することができるので、フォーマッ
トの作成に伴う作業を簡素化することができる。
【0030】また、統計情報テーブルが配設され、帳票
25が新規帳票でない場合に前記統計テーブルを参照
し、非通過率が高くなりフォーマットが不良になったか
どうかを判断することができる。したがって、帳票ID
32は変化しないが、例えば、読取領域30の各記入枠
33の大きさ等に変更があった場合には、フォーマット
が不良になったことが分かる。なお、この場合、読取領
域30内の各記入枠33の相対的な位置関係は変化がな
いものとする。
【0031】このように、フォーマットが不良であると
判断されると、レイアウトの解析が行われ、新たにフォ
ーマットが作成されて登録されるので、フォーマットの
作成に伴う作業を簡素化することができる。なお、本実
施例においては、X軸方向枠検出スライスSX 及びY軸
方向枠検出スライスSY は値を変更することができる。
また、イメージメモリ12を多値構成にして、多値デー
タを2値データに変換するためのスライスレベルを可変
とし、該スライスレベルを変更することによって、精度
よくレイアウトの解析を行うことができる。
【0032】次に本発明の第2の実施例について説明す
る。図7は本発明の第2の実施例における光学式文字読
取装置のブロック図である。図において、11はイメー
ジ取得部、12はイメージメモリ、13は主制御部、1
4はフォーマット記憶部、15は認識部、16は認識結
果表示部、17は記憶部である。前記主制御部13は光
学式文字読取装置の全体を制御し、文字切出部21、レ
イアウト解析部22及び統計情報部23を有する。ま
た、前記イメージメモリ12のほかに複数枚分の帳票イ
メージ31(図6)を格納するためのイメージ記憶部5
1が配設される。
【0033】次に、本発明の第2の実施例についてフロ
ーチャートに基づいて説明する。図8は本発明の第2の
実施例における光学式文字読取装置の動作を示すフロー
チャートである。ステップS21 認識結果表示部16
(図7)の指令によって光学式文字読取装置の読取動作
が開始され、帳票イメージ31が取得される。すなわ
ち、図示しない搬送系によって帳票25(図2)が搬送
され、該帳票25の文字記入枠を含む帳票イメージ31
がイメージ取得部11によって光電変換され、イメージ
データとしてイメージメモリ12に格納される。ステッ
プS22 帳票25の所定位置に設定された帳票ID3
2(図6)が認識される。該帳票ID32は、すべての
種類の帳票25ごとに、又は同じグループごとに設定さ
れ、帳票25の同じ位置に印刷される。前記イメージメ
モリ12に格納されたイメージデータは、主制御部13
内の文字切出部21によってイメージメモリ12から文
字ごとに切り出され、認識部15によって文字が認識さ
れる。ステップS23 主制御部13は、前記帳票25
が新規帳票であるかどうかを判断する。この場合、新規
帳票であるかどうかは、前記認識部15によって認識さ
れた帳票ID32がフォーマット記憶部14に記憶され
ているかどうかによって判断される。新規帳票である場
合はステップS25に、新規帳票でない場合はステップ
S24に進む。ステップS24 帳票ID32によって
指定されたフォーマットに基づいて、帳票25内の読取
領域30の認識を行う。この場合、読取領域30の認識
は、前記帳票ID32の認識と同様の方法によって行わ
れる。ステップS25 帳票25をリジェクトし、ステ
ップS26、33に進み、並列処理を行う。ステップS
26 イメージメモリ12から読み出した帳票イメージ
31のイメージデータをレイアウト解析用としてイメー
ジ記憶部51に転送する。したがって、イメージメモリ
12に次の帳票25の帳票イメージ31を取り込むこと
が可能になる。なお、前記イメージ記憶部51には複数
枚分の帳票イメージ31を格納することができる。ステ
ップS27 主制御部13のレイアウト解析部22が他
の新規帳票のレイアウトの解析中であるかどうかを判断
する。他の新規帳票のレイアウトの解析中である場合
は、当該新規帳票のレイアウト解析を保留し、他の新規
帳票のレイアウトの解析が終了するのを待機する。そし
て、他の新規帳票のレイアウトの解析中でない場合は、
ステップS28に進む。ステップS28 主制御部13
において当該新規帳票のレイアウトの解析を行う。すな
わち、帳票25の記入枠33の線分を検出し、読取領域
30を認識する。ステップS29 読取領域30の仮フ
ォーマットを作成する。ステップS30 主制御部13
及び認識部15は、ステップS29において作成した仮
フォーマットを参照して、イメージメモリ12に格納さ
れたイメージデータに基づいて文字の切出し及び認識を
行い、文字の読取率が設定値以上であるかどうかを判断
することによって仮フォーマットを確認する。ステップ
S31 仮フォーマットの確認結果が良好であるかどう
かを判断する。良好である場合はステップS32に進
み、良好でない場合はステップS28に戻り、解析条件
を変更して再びレイアウトの解析を行う。ステップS3
2 作成した仮フォーマットを正式なフォーマットとし
てフォーマット記憶部14に格納して登録する。ステッ
プS33 文字の認識結果を出力する。すなわち、主制
御部13から文字の認識結果が認識結果表示部16に転
送され、記憶部17に格納される。ステップS34 読
み取るべき次の帳票25があるかどうかを判断する。帳
票25がある場合はステップS21に戻り、帳票25が
ない場合は処理を終了する。
【0034】このように、文字の認識のためのイメージ
メモリ12及びレイアウトの解析を行うためのイメージ
記憶部51が配設され、読取りの対象となった帳票25
が新規帳票である場合、前記イメージ記憶部51に新規
帳票の帳票イメージ31が格納される。したがって、新
規帳票の帳票イメージ31に基づいてレイアウトの解析
を行うことができるとともに、該解析と並行して文字の
認識を行うことができ、スループットを向上させること
ができる。
【0035】なお、本実施例においては、イメージ記憶
部51をイメージメモリ12とは別に配設するようにな
っているが、イメージ記憶部51をイメージメモリ12
内に設定し、アドレス管理によって、レイアウトの解析
用にイメージデータを転送するとともに、イメージメモ
リ12から文字を切り出して文字の認識を行うことがで
きる。
【0036】さらに、本実施例においては、レイアウト
の解析と文字の認識を並行して行うことができるので、
レイアウトの解析によって得られる記入枠33の座標
を、複数枚の新規帳票におけるデータの平均値を計算す
ることによって求めることもできる。次に本発明の第3
の実施例について説明する。
【0037】図9は本発明の第3の実施例における光学
式文字読取装置の動作を示すフローチャートである。ス
テップS41 認識結果表示部16(図7)の指令によ
って光学式文字読取装置の読取動作が開始され、帳票イ
メージ31(図6)が取得される。すなわち、図示しな
い搬送系によって帳票25(図2)は搬送され、該帳票
25の記入枠33を含む帳票イメージ31がイメージ取
得部11によって光電変換され、イメージデータとして
イメージメモリ12に格納される。ステップS42 帳
票25の所定位置に設定された帳票ID32が認識され
る。該帳票ID32は、すべての種類の帳票25ごと
に、又は同じグループごとに設定され、帳票25の同じ
位置に印刷される。前記イメージメモリ12に格納され
たイメージデータは、主制御部13内の文字切出部21
によってイメージメモリ12から文字ごとに切り出さ
れ、認識部15によって文字が認識される。ステップS
43 主制御部13は、前記帳票25が新規帳票である
かどうかを判断する。この場合、新規帳票であるかどう
かは、前記認識部15によって認識された帳票ID32
がフォーマット記憶部14に記憶されているかどうかに
よって判断される。新規帳票である場合はステップS4
7に、新規帳票でない場合はステップS44に進む。ス
テップS44 帳票ID32によって指定されたフォー
マットに基づいて、帳票25内の読取領域27の認識を
行う。この場合、読取領域27の認識は、前記帳票ID
32の認識と同様の方法によって行われる。ステップS
45 主制御部13の統計情報部23は、図4に示す統
計情報テーブルを参照して統計情報を取得する。該統計
情報テーブルは主制御部13内の統計情報部23に格納
されている。
【0038】前記統計情報テーブルは、帳票ID32、
処理総枚数、リジェクト枚数、非通過率及びフォーマッ
ト良否の情報から成り、帳票25ごとに処理した結果が
格納されるようになっている。そして、該帳票25ごと
の非通過率(=リジェクト枚数/処理総枚数)を計算
し、処理総枚数が所定値(本実施例においては100
枚)以上で、かつ、非通過率が設定値(本実施例では5
0〔%〕)以上の場合、フォーマット良否を“1”にセ
ットするようにしてある。ステップS46 フォーマッ
トが不良であるかどうかを判断する。この場合、統計情
報テーブルのフォーマット良否が“1”であるかどうか
によって判断する。フォーマット良否が“1”であると
フォーマットが不良であると判断され、ステップS47
に、フォーマット良否が“0”であるとフォーマットが
不良でないと判断され、ステップS55に進む。
【0039】なお、本実施例においてはフォーマット良
否を“1”とする処理総枚数を100枚と設定し、非通
過率を50〔%〕と設定しているが、前記処理総枚数、
非通過率等を各システムの稼働条件に対応させて設定す
ることができる。ステップS47 帳票をリジェクト
し、ステップS48、55に進み、並列処理を行う。ス
テップS48 イメージメモリ12から読み出した帳票
イメージ31のイメージデータをレイアウト解析用とし
てイメージ記憶部51に転送する。したがって、イメー
ジメモリ12に次の帳票25の帳票イメージ31を取り
込むことが可能になる。なお、前記イメージ記憶部51
には複数枚分の帳票イメージ31を格納することができ
る。ステップS49 主制御部13のレイアウト解析部
22が他の新規帳票のレイアウトの解析中であるかどう
かを判断する。他の新規帳票のレイアウトの解析中であ
る場合は、当該新規帳票のレイアウト解析を保留し、他
の新規帳票のレイアウトの解析が終了するのを待機す
る。そして、他の新規帳票のレイアウトの解析中でない
場合は、ステップS50に進む。ステップS50 主制
御部13において当該新規帳票のレイアウトの解析を行
う。すなわち、帳票25の記入枠33の線分を検出し、
読取領域27を認識する。ステップS51 読取領域2
7の仮フォーマットを作成する。ステップS52 主制
御部13及び認識部15は、ステップS51において作
成した仮フォーマットを参照して、イメージメモリ12
に格納されたイメージデータに基づいて文字の切出し及
び認識を行い、文字の読取率が設定値以上であるかどう
かを判断することによって仮フォーマットを確認する。
ステップS53 仮フォーマットの確認結果が良好であ
るかどうかを判断する。良好である場合はステップS5
4に進み、良好でない場合はステップS50に戻り、解
析条件を変更して再びレイアウトの解析を行う。ステッ
プS54 作成した仮フォーマットを正式なフォーマッ
トとしてフォーマット記憶部14に格納して登録する。
ステップS55 文字の認識結果を出力する。すなわ
ち、主制御部13から文字の認識結果が認識結果表示部
16に転送され、記憶部17に格納される。ステップS
56 読み取るべき次の帳票25があるかどうかを判断
する。該帳票25がある場合はステップS41に戻り、
帳票25がない場合は処理を終了する。
【0040】なお、本実施例においては、X軸方向枠検
出スライスSX 及びY軸方向枠検出スライスSY は値を
変更することができる。イメージメモリ12を多値構成
にして、多値データを2値データに変換するためのスラ
イスレベルを可変とし、該スライスレベルを変更するこ
とによって、精度よくレイアウトの解析を行うことがで
きる。
【0041】また、イメージ記憶部51をイメージメモ
リ12とは別に配設するようになっているが、イメージ
記憶部51をイメージメモリ12内に設定し、アドレス
管理によって、レイアウトの解析用にイメージデータを
転送するとともに、イメージメモリ12から文字を切り
出して文字の認識を行うことができる。さらに、本実施
例においては、レイアウトの解析と文字の認識を並行し
て行うことができるので、レイアウトの解析によって得
られる記入枠33の座標を、複数枚の新規帳票における
データの平均値を計算することによって求めることもで
きる。
【0042】なお、本発明は前記実施例に限定されるも
のではなく、本発明の趣旨に基づいて種々変形させるこ
とが可能であり、それらを本発明の範囲から排除するも
のではない。
【0043】
【発明の効果】以上詳細に説明したように、本発明によ
れば、光学式文字読取装置においては、読取領域の記入
枠の相対的な位置関係が変わらない帳票の文字を、帳票
IDに対応させて設定されたフォーマットに基づいて認
識するようになっている。そして、記入枠を含む帳票イ
メージを取得するイメージ取得手段と、前記帳票が新規
帳票であるかどうかを判断する新規帳票判断手段と、前
記帳票イメージをイメージデータとして格納するイメー
ジメモリと、該イメージメモリに格納されたイメージデ
ータに基づいてレイアウトの解析を行うレイアウト解析
手段と、レイアウトの解析結果に基づいてフォーマット
を作成するフォーマット作成手段とを有する。
【0044】この場合、帳票が新規帳票である場合、レ
イアウト解析手段が、イメージメモリに格納されたイメ
ージデータに基づいてレイアウトの解析を行う。また、
フォーマット作成手段は、レイアウトの解析結果に基づ
いてフォーマットを作成する。したがって、異なる種類
の帳票が頻繁に追加される場合等においても、追加され
た帳票ごとにフォーマットを自動的に作成することがで
きるので、フォーマットの作成に伴う作業を簡素化する
ことができる。
【0045】本発明の他の光学式文字読取装置において
は、帳票の読取結果を示す統計情報が格納された統計情
報テーブルと、該統計情報テーブルを参照して統計情報
を取得し、該統計情報に基づいてフォーマットが不良で
あるかどうかを判断するフォーマット良否判断手段とを
有する。そして、前記レイアウト解析手段は、フォーマ
ットが不良である場合に該当する帳票についてレイアウ
トを解析する。
【0046】この場合、記入枠の大きさ等が変更され、
フォーマットが不良になると、該当する帳票についてレ
イアウトを解析する。したがって、新たにフォーマット
が作成されて登録されるので、フォーマットの作成に伴
う作業を簡素化することができる。本発明の更に他の光
学式文字読取装置においては、読取領域の記入枠の相対
的な位置関係が変わらない帳票の文字を、帳票IDに対
応させて設定されたフォーマットに基づいて認識するよ
うになっている。そして、記入枠を含む帳票イメージを
取得するイメージ取得手段と、前記帳票が新規帳票であ
るかどうかを判断する新規帳票判断手段と、前記帳票イ
メージを文字の認識用のイメージデータとして格納する
イメージメモリと、前記帳票イメージをレイアウト解析
用のイメージデータとして格納するイメージ記憶部と、
前記文字の認識と並行して、前記イメージ記憶部に格納
されたイメージデータに基づいてレイアウトの解析を行
うレイアウト解析手段と、レイアウトの解析結果に基づ
いてフォーマットを作成するフォーマット作成手段とを
有する。
【0047】この場合、帳票が新規帳票である場合、レ
イアウト解析手段が、イメージメモリに格納されたイメ
ージデータに基づいてレイアウトの解析を行う。また、
フォーマット作成手段は、レイアウトの解析結果に基づ
いてフォーマットを作成する。したがって、異なる種類
の帳票が頻繁に追加される場合等においても、追加され
た帳票ごとにフォーマットを自動的に作成することがで
きるので、フォーマットの作成に伴う作業を簡素化する
ことができる。
【0048】しかも、文字の認識と並行してレイアウト
の解析を行うことができるので、スループットを向上さ
せることができる。本発明の更に他の光学式文字読取装
置においては、帳票の読取結果を示す統計情報が格納さ
れた統計情報テーブルと、該統計情報テーブルを参照し
て統計情報を取得し、該統計情報に基づいてフォーマッ
トが不良であるかどうかを判断するフォーマット良否判
断手段とを有する。
【0049】そして、前記レイアウト解析手段は、フォ
ーマットが不良である場合に該当する帳票についてレイ
アウトを解析する。この場合、帳票が新規帳票である場
合、レイアウト解析手段が、イメージメモリに格納され
たイメージデータに基づいてレイアウトの解析を行う。
また、フォーマット作成手段は、レイアウトの解析結果
に基づいてフォーマットを作成する。
【0050】したがって、異なる種類の帳票が頻繁に追
加される場合等においても、追加された帳票ごとにフォ
ーマットを自動的に作成することができるので、フォー
マットの作成に伴う作業を簡素化することができる。ま
た、記入枠の大きさ等が変更され、フォーマットが不良
になると、該当する帳票についてレイアウトを解析す
る。したがって、新たにフォーマットが作成されて登録
されるので、フォーマットの作成に伴う作業を簡素化す
ることができる。
【0051】しかも、文字の認識と並行してレイアウト
の解析を行うことができるので、スループットを向上さ
せることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例における光学式文字読取
装置のブロック図である。
【図2】本発明の第1の実施例における帳票の例を示す
図である。
【図3】本発明の第1の実施例における光学式文字読取
装置の動作を示すフローチャートである。
【図4】本発明の第1の実施例における統計情報テーブ
ルの例を示す図である。
【図5】本発明の第1の実施例におけるレイアウト解析
枠を示す図である。
【図6】本発明の第1の実施例におけるレイアウト解析
座標の算出方法の説明図である。
【図7】本発明の第2の実施例における光学式文字読取
装置のブロック図である。
【図8】本発明の第2の実施例における光学式文字読取
装置の動作を示すフローチャートである。
【図9】本発明の第3の実施例における光学式文字読取
装置の動作を示すフローチャートである。
【符号の説明】
12 イメージメモリ 13 主制御部 14 フォーマット記憶部 15 認識部 22 レイアウト解析部 23 統計情報部 25 帳票 26、32 帳票ID 27、30 読取領域 31 帳票イメージ 33 記入枠 34 文字 51 イメージ記憶部 HX 、HY 投影 SX X軸方向枠検出スライス SY Y軸方向枠検出スライス A〜D 座標 Mi 、Kj 線分

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 読取領域の記入枠の相対的な位置関係が
    変わらない帳票の文字を、帳票IDに対応させて設定さ
    れたフォーマットに基づいて認識する光学式文字読取装
    置において、(a)記入枠を含む帳票イメージを取得す
    るイメージ取得手段と、(b)前記帳票が新規帳票であ
    るかどうかを判断する新規帳票判断手段と、(c)前記
    帳票イメージをイメージデータとして格納するイメージ
    メモリと、(d)該イメージメモリに格納されたイメー
    ジデータに基づいてレイアウトの解析を行うレイアウト
    解析手段と、(e)レイアウトの解析結果に基づいてフ
    ォーマットを作成するフォーマット作成手段とを有する
    ことを特徴とする光学式文字読取装置。
  2. 【請求項2】 (a)前記レイアウト解析手段は、前記
    読取領域の各記入枠を設定する線分を前記イメージデー
    タの投影に基づいて検出する線分検出手段と、前記線分
    に基づいて各記入枠の座標を計算する座標計算手段とを
    備え、(b)前記フォーマット作成手段は、前記記入枠
    の座標に基づいてフォーマットを作成する請求項1に記
    載の光学式文字読取装置。
  3. 【請求項3】 (a)帳票の読取結果を示す統計情報が
    格納された統計情報テーブルと、(b)該統計情報テー
    ブルを参照して統計情報を取得し、該統計情報に基づい
    てフォーマットが不良であるかどうかを判断するフォー
    マット良否判断手段とを有するとともに、(c)前記レ
    イアウト解析手段は、フォーマットが不良である場合に
    該当する帳票についてレイアウトを解析する請求項1に
    記載の光学式文字読取装置。
  4. 【請求項4】 読取領域の記入枠の相対的な位置関係が
    変わらない帳票の文字を、帳票IDに対応させて設定さ
    れたフォーマットに基づいて認識する光学式文字読取装
    置において、(a)記入枠を含む帳票イメージを取得す
    るイメージ取得手段と、(b)前記帳票が新規帳票であ
    るかどうかを判断する新規帳票判断手段と、(c)前記
    帳票イメージを文字の認識用のイメージデータとして格
    納するイメージメモリと、(d)前記帳票イメージをレ
    イアウト解析用のイメージデータとして格納するイメー
    ジ記憶部と、(e)前記文字の認識と並行して、前記イ
    メージ記憶部に格納されたイメージデータに基づいてレ
    イアウトの解析を行うレイアウト解析手段と、(f)レ
    イアウトの解析結果に基づいてフォーマットを作成する
    フォーマット作成手段とを有することを特徴とする光学
    式文字読取装置。
  5. 【請求項5】 (a)前記レイアウト解析手段は、前記
    読取領域の各記入枠を設定する線分を前記イメージデー
    タの投影に基づいて検出する線分検出手段と、前記線分
    に基づいて各記入枠の座標を計算する座標計算手段とを
    備え、(b)前記フォーマット作成手段は、前記記入枠
    の座標に基づいてフォーマットを作成する請求項4に記
    載の光学式文字読取装置。
  6. 【請求項6】 (a)帳票の読取結果を示す統計情報が
    格納された統計情報テーブルと、(b)該統計情報テー
    ブルを参照して統計情報を取得し、該統計情報に基づい
    てフォーマットが不良であるかどうかを判断するフォー
    マット良否判断手段とを有するとともに、(c)前記レ
    イアウト解析手段は、フォーマットが不良である場合に
    該当する帳票についてレイアウトを解析する請求項4に
    記載の光学式文字読取装置。
JP6255198A 1994-10-20 1994-10-20 光学式文字読取装置 Withdrawn JPH08123872A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6255198A JPH08123872A (ja) 1994-10-20 1994-10-20 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6255198A JPH08123872A (ja) 1994-10-20 1994-10-20 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH08123872A true JPH08123872A (ja) 1996-05-17

Family

ID=17275395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6255198A Withdrawn JPH08123872A (ja) 1994-10-20 1994-10-20 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH08123872A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033743A (ja) * 2019-08-27 2021-03-01 株式会社日立製作所 情報処理装置、文書識別方法、及び情報処理システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033743A (ja) * 2019-08-27 2021-03-01 株式会社日立製作所 情報処理装置、文書識別方法、及び情報処理システム

Similar Documents

Publication Publication Date Title
US4933979A (en) Data reading apparatus for reading data from form sheet
US5375176A (en) Method and apparatus for automatic character type classification of European script documents
US8306325B2 (en) Text character identification system and method thereof
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
US10706337B2 (en) Character recognition device, character recognition method, and recording medium
JPH08123872A (ja) 光学式文字読取装置
JPH06131495A (ja) 画像情報抽出方式
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH10207978A (ja) 文字等パターン照合方法及び装置
JP3022459B2 (ja) 帳票識別登録装置
JPH06187450A (ja) パターン認識方法と認識装置
JP2747136B2 (ja) 文字認識装置
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JP2001126025A (ja) Ocr用フォーマットパラメータ作成方法
JPH06301814A (ja) 文字読取装置
JP3919390B2 (ja) 文字認識装置
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JPH0632074B2 (ja) 正規化方法
JPH03122786A (ja) 光学的文字読取装置
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JPH04139593A (ja) 郵便番号認識装置
JPH05120482A (ja) 文字認識装置
JPS5914078A (ja) 帳票読取装置
JPS5953977A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020115