JPH02230366A - 帳票認識装置 - Google Patents
帳票認識装置Info
- Publication number
- JPH02230366A JPH02230366A JP1049800A JP4980089A JPH02230366A JP H02230366 A JPH02230366 A JP H02230366A JP 1049800 A JP1049800 A JP 1049800A JP 4980089 A JP4980089 A JP 4980089A JP H02230366 A JPH02230366 A JP H02230366A
- Authority
- JP
- Japan
- Prior art keywords
- input
- feature vector
- image
- recognition device
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野コ
本発明は、画像の認識処理装置、特に、複数のフォーマ
ット情報を記憶するメモリを有し、入力帳票のフォーマ
ットを識別し、該フォーマット情報に基づき帳票を認識
する装置に関する。
ット情報を記憶するメモリを有し、入力帳票のフォーマ
ットを識別し、該フォーマット情報に基づき帳票を認識
する装置に関する。
[従来の技術]
計算機による文字認識技術の進歩により、オフィス等に
おけるデータの計算機入力作業を自動化するため、光学
文字読み取り装置(OCR)が開発されている。OCR
によるデータの入力は、予めOCRに登録したフォーマ
ットの用紙(OCR帳票》に文字を記入し、OCRはこ
の帳票を画像として入力し、メモリに記憶されたフォー
マット情報に従って文字を切り出し、認識することによ
り実現される。
おけるデータの計算機入力作業を自動化するため、光学
文字読み取り装置(OCR)が開発されている。OCR
によるデータの入力は、予めOCRに登録したフォーマ
ットの用紙(OCR帳票》に文字を記入し、OCRはこ
の帳票を画像として入力し、メモリに記憶されたフォー
マット情報に従って文字を切り出し、認識することによ
り実現される。
一方、OCR帳票はその種類によって読み取るべき文字
の位置や認識結果の処理法を示すフォーマットが異なる
ため、認識処理に先だってこれを識別する必要がある。
の位置や認識結果の処理法を示すフォーマットが異なる
ため、認識処理に先だってこれを識別する必要がある。
このため、複数の異なるフォーマットの帳票をOCRで
読み取る場合は、登録したフォーマット情報の中から入
力する帳票のフォーマットをマニュアル操作で指定する
か、登録した全ての帳票フォーマットに共通する固定位
置にフォーマットの種別を識別するためのID番号等を
プレ印刷し、これを帳票の認識に先だつて認識するなど
の手法が用いられている。
読み取る場合は、登録したフォーマット情報の中から入
力する帳票のフォーマットをマニュアル操作で指定する
か、登録した全ての帳票フォーマットに共通する固定位
置にフォーマットの種別を識別するためのID番号等を
プレ印刷し、これを帳票の認識に先だつて認識するなど
の手法が用いられている。
[発明が解決しようとする課題]
これまでのOCRに代表される帳票認識装置においては
、入力する帳票の固定位置に識別のためのID番号等を
プレ印刷し、これを帳票の認識に先だって認識するなど
の手法を用い、帳票フォーマットを識別している。しか
しながら、既存の多種多様な帳票を認識しようとする場
合、これらの帳票の特定の位置にID番号等のプレ印刷
を一律に要求することは困難であって、必ずしも実現で
きないこともあり得る。ところが、従来技術に依存する
限り、ID番号等のプレ印刷無しでは、これらの帳票を
認識することができないという問題があった。
、入力する帳票の固定位置に識別のためのID番号等を
プレ印刷し、これを帳票の認識に先だって認識するなど
の手法を用い、帳票フォーマットを識別している。しか
しながら、既存の多種多様な帳票を認識しようとする場
合、これらの帳票の特定の位置にID番号等のプレ印刷
を一律に要求することは困難であって、必ずしも実現で
きないこともあり得る。ところが、従来技術に依存する
限り、ID番号等のプレ印刷無しでは、これらの帳票を
認識することができないという問題があった。
本発明は、既存のOCR帳票のように、フォーマットの
種別を識別するためID番号等をプレ印刷することが困
難な既存帳票を認識することを目的とする。
種別を識別するためID番号等をプレ印刷することが困
難な既存帳票を認識することを目的とする。
[課題を解決するための手段]
本発明は、帳票にこうしたフォーマットを識別するため
のID番号等をプレ印刷することなく、帳票中に一般的
に含まれる表フィールドに関する特徴の違いを用いて帳
票フォーマットを識別することを特徴とし、このために
次の手段を備えている。
のID番号等をプレ印刷することなく、帳票中に一般的
に含まれる表フィールドに関する特徴の違いを用いて帳
票フォーマットを識別することを特徴とし、このために
次の手段を備えている。
(a)帳票入力手段。
(b)白連結矩形抽出手段。
(c)特徴ベクトル算出手段
(d)距離計算手段
(e)帳票認識手段
[作用]
本発明の装置は、次のように作用する。
(a)帳票入力手段は、帳票を走査することにより、白
黒2値の画像をイメージメモリに書き込む。
黒2値の画像をイメージメモリに書き込む。
(b)白連結矩形抽出手段は、帳票中の文字データを記
入する表フィールドが帳票の各辺に平行な罫線に囲まれ
た白地の矩形領域であることに着目してこれを抽出する
ため、イメージメモリに書き込まれた帳票画像の白画素
の連結成分を抽出し、さらに各連結成分に外接する入力
帳票の各辺に平行な矩形(以下、白連結矩形と呼ぶ)の
位置座標を出力する。
入する表フィールドが帳票の各辺に平行な罫線に囲まれ
た白地の矩形領域であることに着目してこれを抽出する
ため、イメージメモリに書き込まれた帳票画像の白画素
の連結成分を抽出し、さらに各連結成分に外接する入力
帳票の各辺に平行な矩形(以下、白連結矩形と呼ぶ)の
位置座標を出力する。
(c)特徴ベクトル算出手段は、白連結矩形抽出手段に
より得られた結果を用いて、入力帳票に含まれる白連結
矩形の数および位置、大きさに関する特徴を表す特徴ベ
クトルを算出する。ここで、入力帳票が学習帳票の場合
は、 特徴ベクトルをフォーマットメモリに記憶する。
より得られた結果を用いて、入力帳票に含まれる白連結
矩形の数および位置、大きさに関する特徴を表す特徴ベ
クトルを算出する。ここで、入力帳票が学習帳票の場合
は、 特徴ベクトルをフォーマットメモリに記憶する。
(d)距離計算手段は、入力帳票がテスト帳票の場合、
フォーマットメモリに記憶された帳票種別毎の特徴ベク
トルを読み出し、これらと特徴ベクトル算出手段により
得られた特徴ベクトルの距離をそれぞれ求める。
フォーマットメモリに記憶された帳票種別毎の特徴ベク
トルを読み出し、これらと特徴ベクトル算出手段により
得られた特徴ベクトルの距離をそれぞれ求める。
(e)帳票認識手段は、距離計算手段により得られた出
力の中で最も近いものを選択し、該フォーマットをフォ
ーマットメモリより読み出し、これに従って入力帳票中
の文字をut識する。
力の中で最も近いものを選択し、該フォーマットをフォ
ーマットメモリより読み出し、これに従って入力帳票中
の文字をut識する。
丁実施例]
第1図は、本発明の帳票認識装置の一実施例の構成を示
すブロック図である。 帳票入力部11は、帳票を走査
し、帳票上に記録されている文字記号等を白黒2値の画
像データに変換してイメージメモリ部13に書き込む。
すブロック図である。 帳票入力部11は、帳票を走査
し、帳票上に記録されている文字記号等を白黒2値の画
像データに変換してイメージメモリ部13に書き込む。
白連結矩形抽出部12では、帳票中の文字データを記入
する表フィールドが帳票の各辺に平行な罫線に囲まれた
白地の矩形領域であることに着目してこれを抽出するた
め、イメージメモリ部に書き込まれた帳票画像の白画素
の連結成分を抽出し、さらに各連結成分に外接する入力
帳票の各辺に平行な矩形(以下、白連結矩形と呼ぶ)の
位置座標を出力する。但し、白連結矩形には表フィール
ドの他に文字中の閉領域から抽出されるものも存在する
ため、しきい値を用いてこれらの小さい白連結矩形を取
り除く。
する表フィールドが帳票の各辺に平行な罫線に囲まれた
白地の矩形領域であることに着目してこれを抽出するた
め、イメージメモリ部に書き込まれた帳票画像の白画素
の連結成分を抽出し、さらに各連結成分に外接する入力
帳票の各辺に平行な矩形(以下、白連結矩形と呼ぶ)の
位置座標を出力する。但し、白連結矩形には表フィール
ドの他に文字中の閉領域から抽出されるものも存在する
ため、しきい値を用いてこれらの小さい白連結矩形を取
り除く。
第2図は入力帳票の一例であり、第3図は第2図の入力
帳票を用いて、白連結矩形抽出部l2より出力された白
連結矩形を示す。
帳票を用いて、白連結矩形抽出部l2より出力された白
連結矩形を示す。
第1図の特徴ベクトル算出部14においては、白連結矩
形抽出部12の出力を用いて、入力帳票に含まれる白連
結矩形の数および位置、大きさに関する特徴を表す特徴
ベクトルを出力する。以下に、特徴ベクトルの出力手段
の詳細を述べる。
形抽出部12の出力を用いて、入力帳票に含まれる白連
結矩形の数および位置、大きさに関する特徴を表す特徴
ベクトルを出力する。以下に、特徴ベクトルの出力手段
の詳細を述べる。
入力帳票に含まれる各自連結矩形(1例として第2図の
表フィールド2lに対応して抽出された第3図の白連結
矩形31)が、帳票中の上下および左右のどこにあるか
の情報を特徴ベクトルとして出力するため、入力帳票画
像を縦および横にそれぞれ短冊状にM等分する。ここで
、縦方向にM等分した左からi番目(i=1,・・・,
M)の短冊領域をX,、横方向にM等分した上からj番
目(』=1.・・・,M)の短冊領域をY,とラベル付
けする。
表フィールド2lに対応して抽出された第3図の白連結
矩形31)が、帳票中の上下および左右のどこにあるか
の情報を特徴ベクトルとして出力するため、入力帳票画
像を縦および横にそれぞれ短冊状にM等分する。ここで
、縦方向にM等分した左からi番目(i=1,・・・,
M)の短冊領域をX,、横方向にM等分した上からj番
目(』=1.・・・,M)の短冊領域をY,とラベル付
けする。
次に、どの程度の大きさの白連結矩形が入力帳票に含ま
れるかの情報を特徴ベクトルとして出力するため、各自
連結矩形の横および縦の長さをそれぞれ入力帳票の横お
よび縦の長さで正規化し、これをN段階に量子化して、
各自連結矩形の縦方向の長さ(高さ)をL(k=1,・
・・.N)、横方向の長さ《幅)をL(]=1,・・・
.N)とラベル付けする。
れるかの情報を特徴ベクトルとして出力するため、各自
連結矩形の横および縦の長さをそれぞれ入力帳票の横お
よび縦の長さで正規化し、これをN段階に量子化して、
各自連結矩形の縦方向の長さ(高さ)をL(k=1,・
・・.N)、横方向の長さ《幅)をL(]=1,・・・
.N)とラベル付けする。
特徴ベクトルは、各短冊領域X,およびY,について、
大きさがHkおよびLの白連結矩形の数をそれぞれカウ
ントすることにより算出する。
大きさがHkおよびLの白連結矩形の数をそれぞれカウ
ントすることにより算出する。
カウントの方法には、次の3通りの方法が可能である。
■ 白連結矩形の中心を含む領域でカウントする、
■ 白連結矩形を一部でも含む領域でカウントする、
■ ■の方法で、領域の大きさに対する白連結矩形が占
める割合に応じた重み付けを行ってカウントする。
める割合に応じた重み付けを行ってカウントする。
ここで、特徴ベクトルの次元数Dは
D= 2 x (Mx (N x N))となる。第4
図に、M=N=2の場合について、特徴ベクトルの例を
示す。
図に、M=N=2の場合について、特徴ベクトルの例を
示す。
ここで、第1図の特徴ベクトル算出部14は、入力帳票
が学習帳票の場合、予め本装置で処理対象とする帳票の
フォーマットを記憶させたフォーマットメモリ部16に
該フォーマットの特徴ベクトルを記憶させる。
が学習帳票の場合、予め本装置で処理対象とする帳票の
フォーマットを記憶させたフォーマットメモリ部16に
該フォーマットの特徴ベクトルを記憶させる。
第1図の距離計算部15では、入力帳票がテスト帳票の
場合、特徴ベクトル算出部14の出力結果と、フォーマ
ットメモリ部16に記憶された帳票フォーマットについ
てそれぞれ学習サンプルより得られた平均特徴ベクトル
のユークリッド距離を計算し、結果を出力する。
場合、特徴ベクトル算出部14の出力結果と、フォーマ
ットメモリ部16に記憶された帳票フォーマットについ
てそれぞれ学習サンプルより得られた平均特徴ベクトル
のユークリッド距離を計算し、結果を出力する。
第1図の識別部l7では、距離計算部15より出力され
た距離のうち最も近いものを選択し、該フォーマットを
入力帳票のフォーマットとして帳票認識部l8に出力し
、帳票認識部18において、得られたフォーマットに従
って入力帳票中の文字を認識する。
た距離のうち最も近いものを選択し、該フォーマットを
入力帳票のフォーマットとして帳票認識部l8に出力し
、帳票認識部18において、得られたフォーマットに従
って入力帳票中の文字を認識する。
第5図は、4種類の帳票A,B%C, D (各種類に
つき10枚の帳票を用い、7枚を学習帳票、残り3枚を
テスト帳票とする)について、白連結矩形のカウント方
法として■の方法を用い、M=N=2とした場合の学習
サンプルの平均特徴ベクトル間の距離と、各帳票カテゴ
リ内で平均特徴ベクトルから最も遠いサンプルまでの距
離を求め、各カテゴリ空間が占める範囲を実線で示して
いる。
つき10枚の帳票を用い、7枚を学習帳票、残り3枚を
テスト帳票とする)について、白連結矩形のカウント方
法として■の方法を用い、M=N=2とした場合の学習
サンプルの平均特徴ベクトル間の距離と、各帳票カテゴ
リ内で平均特徴ベクトルから最も遠いサンプルまでの距
離を求め、各カテゴリ空間が占める範囲を実線で示して
いる。
第5図に右いて、4種類の帳票ASBSC,及びDのカ
テゴリ空間51,52、53、及び54を示しているが
、これらの間には重なりがなく、正しく識別できること
が分かる。
テゴリ空間51,52、53、及び54を示しているが
、これらの間には重なりがなく、正しく識別できること
が分かる。
ここで、分割数M右よび量子化数Nを小さくすると《例
えばM=N=1)、特徴ベクトルの次元数は小さくなり
、計算量が少なくなるが、白連結矩形の位置や大きさを
詳細に表現できなくなることから、帳票が傾いて入力さ
れた場合や、文字中の閉領域が誤って表領域として抽出
された場合、および表領域がノイズ等によって分割され
た場合、識別能力が低下することが予想されるため、M
=N=2以上とすることが望ましい。
えばM=N=1)、特徴ベクトルの次元数は小さくなり
、計算量が少なくなるが、白連結矩形の位置や大きさを
詳細に表現できなくなることから、帳票が傾いて入力さ
れた場合や、文字中の閉領域が誤って表領域として抽出
された場合、および表領域がノイズ等によって分割され
た場合、識別能力が低下することが予想されるため、M
=N=2以上とすることが望ましい。
[発明の効果]
以上述べたように、本発明によれば、これまでのOCR
に代表される帳票認識装置において、帳票フォーマット
を識別するためのID番号等をプレ印刷することなく帳
票フォーマットを識別することが可能となる。
に代表される帳票認識装置において、帳票フォーマット
を識別するためのID番号等をプレ印刷することなく帳
票フォーマットを識別することが可能となる。
このため、従来のOCR帳票に加え、既存の多種多様な
帳票の認識が可能となり、データの自勤入力可能な帳票
の種類が著しく拡大される。
帳票の認識が可能となり、データの自勤入力可能な帳票
の種類が著しく拡大される。
第1図は、帳票識別装置の構成例を示すブロック図、第
2図は、入力帳票の例を示す図、第3図は、白連結矩形
の例を示す図、第4図は、特徴ベクトルの例を示す図、
第5図は、4種類の帳票について識別能力の例を示す図
、である。 :帳票入力部 :白連結矩形部 :イメージメモリ部 :特徴ベクトル算出部 :距離計算部 :フォーマットメモリ部 :識別部 :帳票認識部 二表フィールド :白連結矩形 :帳票Aのカテゴリー空間 :帳票Bのカテゴリー空間 :帳票Cのカテゴリー空間 二帳票Dのカテゴリー空間 出願人 エヌ・ティ・ティ・データ通信株式会社代理人
弁理士 金 平 隆 第1図 第 図 C 第5図 手 続 補 正 書(方式) 平成1年6月22日
2図は、入力帳票の例を示す図、第3図は、白連結矩形
の例を示す図、第4図は、特徴ベクトルの例を示す図、
第5図は、4種類の帳票について識別能力の例を示す図
、である。 :帳票入力部 :白連結矩形部 :イメージメモリ部 :特徴ベクトル算出部 :距離計算部 :フォーマットメモリ部 :識別部 :帳票認識部 二表フィールド :白連結矩形 :帳票Aのカテゴリー空間 :帳票Bのカテゴリー空間 :帳票Cのカテゴリー空間 二帳票Dのカテゴリー空間 出願人 エヌ・ティ・ティ・データ通信株式会社代理人
弁理士 金 平 隆 第1図 第 図 C 第5図 手 続 補 正 書(方式) 平成1年6月22日
Claims (4)
- (1)複数のフォーマット情報を記憶するメモリを有す
る帳票認識装置において、帳票を白黒2値画像として入
力する手段と、入力画像中の白画素の連結成分に外接す
る矩形枠を求める手段と、これに基づき入力画像に含ま
れる表フィールドの数、位置、大きさを表す特徴ベクト
ルを算出する手段と、この特徴ベクトルとすでに複数の
異なるフォーマットの帳票についてそれぞれ学習サンプ
ルより得られた平均特徴ベクトルとの距離を求める手段
と、この距離が最も近い帳票のフォーマット情報に従っ
て入力帳票を処理する手段を具備したことを特徴とする
帳票認識装置。 - (2)特許請求の範囲第1項記載の装置において、前記
特徴ベクトルを算出する手段として、入力帳票画像を小
領域に分割し、表フィールドの中心を含む領域で表フィ
ールド数をカウントすることを特徴とする帳票認識装置
。 - (3)特許請求の範囲第1項記載の装置において、前記
特徴ベクトルを算出する手段として、入力帳票画像を小
領域に分割し、表フィールドを一部でも含む領域で表フ
ィールド数をカウントすることを特徴とする帳票認識装
置。 - (4)特許請求の範囲第1項記載の装置において、前記
特徴ベクトルを算出する手段として、入力帳票画像を小
領域に分割し、表フィールドを一部でも含む領域で、領
域の大きさに対する白連結矩形が占める大きさの割合に
応じた重み付けを行って表フィールド数をカウントする
ことを特徴とする帳票認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1049800A JPH02230366A (ja) | 1989-03-03 | 1989-03-03 | 帳票認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1049800A JPH02230366A (ja) | 1989-03-03 | 1989-03-03 | 帳票認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02230366A true JPH02230366A (ja) | 1990-09-12 |
Family
ID=12841223
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1049800A Pending JPH02230366A (ja) | 1989-03-03 | 1989-03-03 | 帳票認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02230366A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0635930A (ja) * | 1992-06-23 | 1994-02-10 | Internatl Business Mach Corp <Ibm> | テーブルデータを処理するシステムと方法 |
| JP2019144771A (ja) * | 2018-02-19 | 2019-08-29 | 株式会社ミラボ | 帳票処理システム及び帳票処理プログラム |
| JP2021009659A (ja) * | 2019-06-28 | 2021-01-28 | 株式会社ミラボ | 情報処理装置及びプログラム |
-
1989
- 1989-03-03 JP JP1049800A patent/JPH02230366A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0635930A (ja) * | 1992-06-23 | 1994-02-10 | Internatl Business Mach Corp <Ibm> | テーブルデータを処理するシステムと方法 |
| JP2019144771A (ja) * | 2018-02-19 | 2019-08-29 | 株式会社ミラボ | 帳票処理システム及び帳票処理プログラム |
| JP2021106054A (ja) * | 2018-02-19 | 2021-07-26 | 株式会社ミラボ | 帳票処理システム及び帳票処理プログラム |
| JP2021009659A (ja) * | 2019-06-28 | 2021-01-28 | 株式会社ミラボ | 情報処理装置及びプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5119433A (en) | Method and system for locating the amount field on a document | |
| US7295694B2 (en) | MICR-based optical character recognition system and method | |
| US9158986B2 (en) | Character segmentation device and character segmentation method | |
| US6038351A (en) | Apparatus and method for multi-entity, mixed document environment document identification and processing | |
| US6014450A (en) | Method and apparatus for address block location | |
| US7711189B2 (en) | Layout analysis program, layout analysis apparatus and layout analysis method | |
| JPH02230366A (ja) | 帳票認識装置 | |
| JPS5991582A (ja) | 文字読取装置 | |
| EP1394726A2 (en) | Image processing for pattern recognition using edge detection and projections along predetermined directions | |
| JPS6316795B2 (ja) | ||
| JP2788506B2 (ja) | 文字認識装置 | |
| CN114202761B (zh) | 一种基于图片信息聚类的信息批量提取方法 | |
| US6142374A (en) | Optical character reader | |
| JP2917396B2 (ja) | 文字認識方式 | |
| JP2909132B2 (ja) | 光学的文字読取装置 | |
| JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
| JPH06111057A (ja) | 光学的文字読取装置 | |
| JP2963474B2 (ja) | 類似文字識別方法 | |
| JP3411795B2 (ja) | 文字認識装置 | |
| JP2616995B2 (ja) | 文字認識装置 | |
| JPH08171609A (ja) | 文字列高速抽出装置 | |
| TW202503699A (zh) | 車牌辨識系統及其方法 | |
| JPH03282791A (ja) | 文字認識方法 | |
| JPH1125214A (ja) | 画像識別装置 | |
| JPH0371380A (ja) | 文字認識装置 |