JPH0822507A - 文書認識装置 - Google Patents
文書認識装置Info
- Publication number
- JPH0822507A JPH0822507A JP6157209A JP15720994A JPH0822507A JP H0822507 A JPH0822507 A JP H0822507A JP 6157209 A JP6157209 A JP 6157209A JP 15720994 A JP15720994 A JP 15720994A JP H0822507 A JPH0822507 A JP H0822507A
- Authority
- JP
- Japan
- Prior art keywords
- rectangle
- black pixel
- attribute
- information
- connected black
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 ノイズに強い文書認識装置を提供することを
目的とする。 【構成】 縮小画像データから検出した連結黒画素矩形
リストを抽出し、罫線属性付与部、文字属性付与部、写
真属性付与部、表属性付与部、罫線属性付与部、読取ノ
イズ検出部、図形属性付与部より、連結黒画素矩形に属
性を設定する。
目的とする。 【構成】 縮小画像データから検出した連結黒画素矩形
リストを抽出し、罫線属性付与部、文字属性付与部、写
真属性付与部、表属性付与部、罫線属性付与部、読取ノ
イズ検出部、図形属性付与部より、連結黒画素矩形に属
性を設定する。
Description
【0001】
【産業上の利用分野】本発明は、文字・表・図形・罫線
が混在する印刷文書を、スキャナ等の光学的手段を用い
て文書画像を取り込み、取り込んだ画像データを基に文
字ブロック・図形ブロック等に領域を分割し、各々のブ
ロックの属性に応じた認識を行う文書認識装置に関する
ものである。
が混在する印刷文書を、スキャナ等の光学的手段を用い
て文書画像を取り込み、取り込んだ画像データを基に文
字ブロック・図形ブロック等に領域を分割し、各々のブ
ロックの属性に応じた認識を行う文書認識装置に関する
ものである。
【0002】
【従来の技術】従来の文書認識の処理過程について以下
説明する。
説明する。
【0003】<ステップ1>スキャナによって取り込ま
れた二値データを解像度が100DPI程度となるよう
に縮小する。
れた二値データを解像度が100DPI程度となるよう
に縮小する。
【0004】<ステップ2>縮小された画像データに対
して、連結黒画素矩形の座標と連結黒画素数をメモリに
格納する。
して、連結黒画素矩形の座標と連結黒画素数をメモリに
格納する。
【0005】<ステップ3>ステップ2で抽出した連結
黒画素矩形の中から、文字を構成する矩形を抽出する。
連結黒画素矩形の幅あるいは高さのうち短い方の長さが
あらかじめ定められた閾値より小さければ、その連結黒
画素矩形に文字の属性が付与する。
黒画素矩形の中から、文字を構成する矩形を抽出する。
連結黒画素矩形の幅あるいは高さのうち短い方の長さが
あらかじめ定められた閾値より小さければ、その連結黒
画素矩形に文字の属性が付与する。
【0006】<ステップ4>ステップ3で文字属性とな
らなかった連結黒画素矩形が写真属性をもつ矩形である
か否かの判定を行う。連結黒画素矩形に対して、矩形内
に微小な矩形があらかじめ定められた閾値以上存在する
か、あるいは、矩形内に占める黒画素の割合があらかじ
め定められた閾値以上あれば、その連結黒画素矩形には
写真属性を付与する。
らなかった連結黒画素矩形が写真属性をもつ矩形である
か否かの判定を行う。連結黒画素矩形に対して、矩形内
に微小な矩形があらかじめ定められた閾値以上存在する
か、あるいは、矩形内に占める黒画素の割合があらかじ
め定められた閾値以上あれば、その連結黒画素矩形には
写真属性を付与する。
【0007】<ステップ5>ステップ3,4で文字・写
真にならなかった残りの連結黒画素矩形に対しては、表
矩形であるか否か、チェックする。矩形内に水平線およ
び垂直線を構成する部分があるか調べ、矩形内に存在す
る水平線あるいは垂直線の数と水平線と垂直線の交点
数、および、矩形内の黒画素の情報から表属性をもつ矩
形と判断する。
真にならなかった残りの連結黒画素矩形に対しては、表
矩形であるか否か、チェックする。矩形内に水平線およ
び垂直線を構成する部分があるか調べ、矩形内に存在す
る水平線あるいは垂直線の数と水平線と垂直線の交点
数、および、矩形内の黒画素の情報から表属性をもつ矩
形と判断する。
【0008】<ステップ6>属性が付与されなかった連
結黒画素矩形に対して図形属性を付与する。
結黒画素矩形に対して図形属性を付与する。
【0009】<ステップ7>以上の処理により、各矩形
に対して、文字、写真、表、図形の属性が付与される。
文字以外の写真、表、図形の属性をもつ矩形について
は、1矩形が1領域を形成するとみなされ、写真、表、
図形の属性をもつ領域が抽出される。
に対して、文字、写真、表、図形の属性が付与される。
文字以外の写真、表、図形の属性をもつ矩形について
は、1矩形が1領域を形成するとみなされ、写真、表、
図形の属性をもつ領域が抽出される。
【0010】<ステップ8>写真、表、図形内に包含さ
れる文字属性をもつ矩形については、その矩形は図形の
一部である可能性が高いため、写真、表、図形内に包含
される文字属性をもつ矩形は黒画素矩形リストから削除
する。
れる文字属性をもつ矩形については、その矩形は図形の
一部である可能性が高いため、写真、表、図形内に包含
される文字属性をもつ矩形は黒画素矩形リストから削除
する。
【0011】<ステップ9>ステップ8で残った文字属
性をもつ矩形に対して、文字列の統合を行い、文字領域
の抽出を行う。
性をもつ矩形に対して、文字列の統合を行い、文字領域
の抽出を行う。
【0012】<ステップ10>文字領域は文字認識、画
像領域は画像圧縮、表領域は表認識、図形領域はベクト
ル化を行い、それぞれの属性に応じた認識結果を得る。
像領域は画像圧縮、表領域は表認識、図形領域はベクト
ル化を行い、それぞれの属性に応じた認識結果を得る。
【0013】
【発明が解決しようとする課題】しかしながら従来技術
では、複数の罫線で構成される領域やスキャナ読み取り
ノイズは、図形領域となってしまうために、内部の文字
も図形の一部となってしまい、ベクトル化してしまうと
いう問題点があった。
では、複数の罫線で構成される領域やスキャナ読み取り
ノイズは、図形領域となってしまうために、内部の文字
も図形の一部となってしまい、ベクトル化してしまうと
いう問題点があった。
【0014】そこでノイズにより認識精度が影響されに
くい文書認識装置を提供することを目的とする。
くい文書認識装置を提供することを目的とする。
【0015】
【課題を解決するための手段】本発明の文書認識装置
は、二値化された文字認識対象文書に対して画像データ
を縮小して縮小画像データとする手段と、縮小画像デー
タから黒画素が連結している箇所を検出し、連結黒画素
に外接する連結黒画素矩形を求め、縮小画像データに対
応した連結黒画素矩形の座標と連結黒画素数を連結黒画
素矩形情報リストとして格納する連結情報格納手段と、
連結黒画素矩形の縦横比が予め定められた閾値以上であ
るものを罫線と判断し、連結黒画素矩形情報の1つとし
て罫線属性を付与する手段と、連結黒画素矩形の辺の長
さが予め定められた閾値以下のものを文字矩形と判断し
連結黒画素矩形情報に文字属性を付与する手段と、連結
黒画素矩形内の黒画素の特徴から写真属性を付与する手
段と、連結黒画素矩形内に水平線および垂直線を構成す
る部分があるか調べ、連結黒画素矩形内に存在する水平
線あるいは垂直線の数と水平線と垂直線の交点数、およ
び、連結黒画素矩形内の黒画素の情報から表と判断し、
連結黒画素矩形情報に表の属性を付与する手段と、水平
線/垂直線情報と連結黒画素矩形内の全黒画素数と連結
黒画素矩形情報格納手段で検出した連結黒画素数を基に
対象矩形が複数の罫線から構成される矩形であるか調
べ、そうであれば矩形情報に罫線の属性を付与する手段
と、さらに、連結黒画素矩形位置情報と矩形内部の黒画
素情報よりその矩形が画像読み取りノイズであるか調
べ、読み取りノイズであった場合にその連結黒画素矩形
の情報を矩形リストより削除する手段と、属性が付与さ
れない残りの矩形に対して図形属性を付与する手段とを
備える。
は、二値化された文字認識対象文書に対して画像データ
を縮小して縮小画像データとする手段と、縮小画像デー
タから黒画素が連結している箇所を検出し、連結黒画素
に外接する連結黒画素矩形を求め、縮小画像データに対
応した連結黒画素矩形の座標と連結黒画素数を連結黒画
素矩形情報リストとして格納する連結情報格納手段と、
連結黒画素矩形の縦横比が予め定められた閾値以上であ
るものを罫線と判断し、連結黒画素矩形情報の1つとし
て罫線属性を付与する手段と、連結黒画素矩形の辺の長
さが予め定められた閾値以下のものを文字矩形と判断し
連結黒画素矩形情報に文字属性を付与する手段と、連結
黒画素矩形内の黒画素の特徴から写真属性を付与する手
段と、連結黒画素矩形内に水平線および垂直線を構成す
る部分があるか調べ、連結黒画素矩形内に存在する水平
線あるいは垂直線の数と水平線と垂直線の交点数、およ
び、連結黒画素矩形内の黒画素の情報から表と判断し、
連結黒画素矩形情報に表の属性を付与する手段と、水平
線/垂直線情報と連結黒画素矩形内の全黒画素数と連結
黒画素矩形情報格納手段で検出した連結黒画素数を基に
対象矩形が複数の罫線から構成される矩形であるか調
べ、そうであれば矩形情報に罫線の属性を付与する手段
と、さらに、連結黒画素矩形位置情報と矩形内部の黒画
素情報よりその矩形が画像読み取りノイズであるか調
べ、読み取りノイズであった場合にその連結黒画素矩形
の情報を矩形リストより削除する手段と、属性が付与さ
れない残りの矩形に対して図形属性を付与する手段とを
備える。
【0016】
【作用】本発明は上記の構成により、従来技術において
図形と判定されていた複数の罫線が結合している領域や
画像読み取りノイズが、罫線領域は罫線領域と判定で
き、スキャナ読み取りノイズはノイズと判定して領域情
報から削除することができる。
図形と判定されていた複数の罫線が結合している領域や
画像読み取りノイズが、罫線領域は罫線領域と判定で
き、スキャナ読み取りノイズはノイズと判定して領域情
報から削除することができる。
【0017】
【実施例】本発明の一実施例について図面を参照して説
明する。図1は本発明の一実施例における文書認識装置
のブロック図である。図1において、1は文書認識を行
う中央処理装置(以下、CPUと略す)であって図2
(本発明の一実施例における文書認識装置の機能ブロッ
ク図)の画像入力部7、画像縮小部8、連結黒画素矩形
リスト作成部9、罫線属性付与部10、文字属性付与部
11、写真属性付与部12、表属性付与部13、罫線属
性付与部14、読取ノイズ検出部15、図形属性付与部
16、認識処理部17を有する。2は領域抽出プログラ
ムが格納されているリードオンリーメモリ(以下、RO
Mと略す)であり、ランダムアクセスメモリ3(以下、
RAMと略す)には、スキャナ4で読み取った画像デー
タが格納される。5は外部からCPU1に対して指令を
与えるためのキーボードであり、6はCPU1によって
認識された認識結果を表示する表示装置である。
明する。図1は本発明の一実施例における文書認識装置
のブロック図である。図1において、1は文書認識を行
う中央処理装置(以下、CPUと略す)であって図2
(本発明の一実施例における文書認識装置の機能ブロッ
ク図)の画像入力部7、画像縮小部8、連結黒画素矩形
リスト作成部9、罫線属性付与部10、文字属性付与部
11、写真属性付与部12、表属性付与部13、罫線属
性付与部14、読取ノイズ検出部15、図形属性付与部
16、認識処理部17を有する。2は領域抽出プログラ
ムが格納されているリードオンリーメモリ(以下、RO
Mと略す)であり、ランダムアクセスメモリ3(以下、
RAMと略す)には、スキャナ4で読み取った画像デー
タが格納される。5は外部からCPU1に対して指令を
与えるためのキーボードであり、6はCPU1によって
認識された認識結果を表示する表示装置である。
【0018】以下、領域分割について、図2、図3(本
発明の一実施例における画像データ例示図)と図7(本
発明の一実施例における文書認識装置のフローチャー
ト)を参照しながら説明する。画像入力部7ではスキャ
ナ4より取り込んだ画像データをRAM3に格納する
(s1)。画像データの座標は左上が原点で、水平方向
の座標をx、垂直方向の座標をyで表わす。画像縮小部
8では、取り込んだ二値画像データを属性判定の高速化
のために100DPIの解像度となるように縮小し、R
AM3に格納する(s2)。
発明の一実施例における画像データ例示図)と図7(本
発明の一実施例における文書認識装置のフローチャー
ト)を参照しながら説明する。画像入力部7ではスキャ
ナ4より取り込んだ画像データをRAM3に格納する
(s1)。画像データの座標は左上が原点で、水平方向
の座標をx、垂直方向の座標をyで表わす。画像縮小部
8では、取り込んだ二値画像データを属性判定の高速化
のために100DPIの解像度となるように縮小し、R
AM3に格納する(s2)。
【0019】連結黒画素矩形リスト作成部9では、RA
M3の縮小二値画像データから、8近傍で連結している
黒画素の連結黒画素矩形を検出し連結黒画素リストを作
成する(s3)。連結黒画素リストに登録される連結黒
画素矩形のデータは、左上の座標(x1,y1)と右下
の座標(x2,y2)と黒画素の数である。本実施例で
は、図3に示す画像データに対して処理を行った結果、
図4(本発明の一実施例における連結黒画素抽出結果の
例示図)に示した連結黒画素矩形を得たものとする。
M3の縮小二値画像データから、8近傍で連結している
黒画素の連結黒画素矩形を検出し連結黒画素リストを作
成する(s3)。連結黒画素リストに登録される連結黒
画素矩形のデータは、左上の座標(x1,y1)と右下
の座標(x2,y2)と黒画素の数である。本実施例で
は、図3に示す画像データに対して処理を行った結果、
図4(本発明の一実施例における連結黒画素抽出結果の
例示図)に示した連結黒画素矩形を得たものとする。
【0020】罫線属性付与部10では、連結黒画素矩形
の縦横比があらかじめ定められた閾値Th_RTO_L
INE以上か否かチェックする(s4)。矩形の縦横比
が閾値Th_RTO_LINE以上あれば、その矩形は
罫線属性をもつものとして、s12へ移行する。
の縦横比があらかじめ定められた閾値Th_RTO_L
INE以上か否かチェックする(s4)。矩形の縦横比
が閾値Th_RTO_LINE以上あれば、その矩形は
罫線属性をもつものとして、s12へ移行する。
【0021】文字属性付与部11では、s4で罫線とな
らなかった連結黒画素矩形に対して、矩形の短辺の長さ
があらかじめ定められた閾値Th_MAX_CHAR以
下で、かつ、領域に占める黒画素の割合が閾値Th_R
TO_CHAR以上あるかチェックする(s5)。矩形
の短辺の長さがあらかじめ定められた閾値Th_MAX
_CHAR以下で、かつ、領域に占める黒画素の割合が
閾値Th_RTO_CHAR以上の場合は文字の属性を
もつ矩形となり、s13へ移行する。図4の矩形22,
23は文字属性をもつ矩形となりs13へすすみ、その
他の矩形の文字以外矩形としてs5へすすむ。
らなかった連結黒画素矩形に対して、矩形の短辺の長さ
があらかじめ定められた閾値Th_MAX_CHAR以
下で、かつ、領域に占める黒画素の割合が閾値Th_R
TO_CHAR以上あるかチェックする(s5)。矩形
の短辺の長さがあらかじめ定められた閾値Th_MAX
_CHAR以下で、かつ、領域に占める黒画素の割合が
閾値Th_RTO_CHAR以上の場合は文字の属性を
もつ矩形となり、s13へ移行する。図4の矩形22,
23は文字属性をもつ矩形となりs13へすすみ、その
他の矩形の文字以外矩形としてs5へすすむ。
【0022】ここで、黒画素密度は以下の計算で算出で
きる。 黒画素密度(d1)=連結黒画素矩形の黒画素数/(矩
形の幅×矩形の高さ)×100(%) 写真属性付与部12では、罫線、文字以外の矩形として
残った矩形に対して、写真の属性をもつ矩形であるか否
かのチェックを行う(s6)。矩形内に占める微小矩形
の割合があらかじめ定められた閾値Th_RTO_IM
G以上で、かつ、微小矩形の個数があらかじめ定められ
た閾値Th_CNT_IMG以上の場合にその矩形は写
真属性をもつ矩形であると判定され、s14へ移行す
る。図4の矩形26が写真属性をもつ矩形となる。
きる。 黒画素密度(d1)=連結黒画素矩形の黒画素数/(矩
形の幅×矩形の高さ)×100(%) 写真属性付与部12では、罫線、文字以外の矩形として
残った矩形に対して、写真の属性をもつ矩形であるか否
かのチェックを行う(s6)。矩形内に占める微小矩形
の割合があらかじめ定められた閾値Th_RTO_IM
G以上で、かつ、微小矩形の個数があらかじめ定められ
た閾値Th_CNT_IMG以上の場合にその矩形は写
真属性をもつ矩形であると判定され、s14へ移行す
る。図4の矩形26が写真属性をもつ矩形となる。
【0023】表属性付与部13では、表の属性をもつ矩
形であるか否かのチェックを行う。まず、その矩形内に
線の成分があるか線成分の検出処理を行う。線成分抽出
の方法は水平方向/垂直方向それぞれに、黒画素の長さ
が閾値Th_LEN_LINE以上あるかチェックし、
検出された線成分を基に表の判定を行う(s7)。検出
された水平線の線の長さが矩形の幅の閾値Th_LEN
_TABLE倍のものが閾値Th_CNT_TABLE
(=3)個以上で、かつ、垂直線の長さが矩形の高さの
閾値Th_LEN_TABLE倍以上のものが閾値Th
_CNT_TABLE個以上あり、さらに、上記のいず
れかの線に対して横切る線が閾値Th_CRS_TAB
LE以上あればその矩形は表となる。図3の画像データ
例では、図4の矩形24が表と決定される。表と決定さ
れた矩形はs15へすすみ、表とならなかったものは第
2の罫線判定処理s8へすすむ。なお図4の矩形20
は、線成分が水平線1、垂直線1であるため表の条件を
満たさない。
形であるか否かのチェックを行う。まず、その矩形内に
線の成分があるか線成分の検出処理を行う。線成分抽出
の方法は水平方向/垂直方向それぞれに、黒画素の長さ
が閾値Th_LEN_LINE以上あるかチェックし、
検出された線成分を基に表の判定を行う(s7)。検出
された水平線の線の長さが矩形の幅の閾値Th_LEN
_TABLE倍のものが閾値Th_CNT_TABLE
(=3)個以上で、かつ、垂直線の長さが矩形の高さの
閾値Th_LEN_TABLE倍以上のものが閾値Th
_CNT_TABLE個以上あり、さらに、上記のいず
れかの線に対して横切る線が閾値Th_CRS_TAB
LE以上あればその矩形は表となる。図3の画像データ
例では、図4の矩形24が表と決定される。表と決定さ
れた矩形はs15へすすみ、表とならなかったものは第
2の罫線判定処理s8へすすむ。なお図4の矩形20
は、線成分が水平線1、垂直線1であるため表の条件を
満たさない。
【0024】罫線属性付与部14では、表とならなかっ
た矩形に対して以下に示す罫線判定を行う(s8)。s
3で検出した連結黒画素矩形黒画素密度と対象矩形内全
黒画素密度の関係から罫線領域であるか判定する。全黒
画素密度は矩形内のすべての黒画素を計数してその数を
矩形の面積で割ったものに100を掛けることにより算
出することができる。
た矩形に対して以下に示す罫線判定を行う(s8)。s
3で検出した連結黒画素矩形黒画素密度と対象矩形内全
黒画素密度の関係から罫線領域であるか判定する。全黒
画素密度は矩形内のすべての黒画素を計数してその数を
矩形の面積で割ったものに100を掛けることにより算
出することができる。
【0025】全黒画素密度(d2)=矩形内のすべての
黒画素数/(矩形の幅×矩形の高さ)×100(%) 検出した全黒画素密度d2が黒画素密度d1の2倍以上
あり、表属性付与部13で検出した水平線が矩形の幅の
閾値Th_LEN_TABLE倍のものがあるか、また
は、垂直線が矩形の高さの閾値Th_LEN_TABL
E倍以上のものがあればその矩形は罫線領域矩形とな
る。罫線矩形と判定されたものはs16へすすみ、罫線
とならなかったものはs9のスキャナ読み取りノイズ検
出処理へ移行する。図4の矩形20は前記条件を満たす
ため罫線属性が付与され、図4の矩形21は罫線とはな
らない。
黒画素数/(矩形の幅×矩形の高さ)×100(%) 検出した全黒画素密度d2が黒画素密度d1の2倍以上
あり、表属性付与部13で検出した水平線が矩形の幅の
閾値Th_LEN_TABLE倍のものがあるか、また
は、垂直線が矩形の高さの閾値Th_LEN_TABL
E倍以上のものがあればその矩形は罫線領域矩形とな
る。罫線矩形と判定されたものはs16へすすみ、罫線
とならなかったものはs9のスキャナ読み取りノイズ検
出処理へ移行する。図4の矩形20は前記条件を満たす
ため罫線属性が付与され、図4の矩形21は罫線とはな
らない。
【0026】読取ノイズ検出部15では、今までに属性
が設定されなかった矩形に対してスキャナ読み取りノイ
ズであるか否か判定を行う(s9)。図4の矩形21は
スキャナ読み取りノイズと判定され、s17へ移行す
る。s17では、スキャナ読み取りノイズと判定された
矩形を、連結黒画素矩形リストから矩形情報を削除す
る。
が設定されなかった矩形に対してスキャナ読み取りノイ
ズであるか否か判定を行う(s9)。図4の矩形21は
スキャナ読み取りノイズと判定され、s17へ移行す
る。s17では、スキャナ読み取りノイズと判定された
矩形を、連結黒画素矩形リストから矩形情報を削除す
る。
【0027】図形属性付与部16では、以上の判定基準
により、属性が決定されていない矩形について図形属性
を付与する(s10)。付与されると、属性毎に認識し
(s11)、処理を終了する。
により、属性が決定されていない矩形について図形属性
を付与する(s10)。付与されると、属性毎に認識し
(s11)、処理を終了する。
【0028】以上の処理により、すべての連結黒画素矩
形に対して、罫線、文字、図形、写真、表のうちのいず
れかの属性が付与されたことになる。罫線あるいは図形
あるいは表あるいは写真の属性が付与された矩形はその
まま1つの領域となる。図形領域に包含された文字属性
をもつ矩形は図形の一部であると判断し連結黒画素矩形
リストから削除する。例えば、図5(本発明の一実施例
における画像データ例示図)の画像データ例に対して、
図6(本発明の一実施例における連結黒画素抽出結果の
例示図)の矩形k12以外の矩形は文字属性が与えられ
ているが、実際には矩形k6〜k9は図形の一部となっ
ている写真領域も図形領域同様の処理を行う。残った文
字矩形に対して、文字列を抽出して、文字列情報を基に
文字領域を抽出する。
形に対して、罫線、文字、図形、写真、表のうちのいず
れかの属性が付与されたことになる。罫線あるいは図形
あるいは表あるいは写真の属性が付与された矩形はその
まま1つの領域となる。図形領域に包含された文字属性
をもつ矩形は図形の一部であると判断し連結黒画素矩形
リストから削除する。例えば、図5(本発明の一実施例
における画像データ例示図)の画像データ例に対して、
図6(本発明の一実施例における連結黒画素抽出結果の
例示図)の矩形k12以外の矩形は文字属性が与えられ
ているが、実際には矩形k6〜k9は図形の一部となっ
ている写真領域も図形領域同様の処理を行う。残った文
字矩形に対して、文字列を抽出して、文字列情報を基に
文字領域を抽出する。
【0029】以上のようにして得たそれぞれの領域に対
して認識処理部17では、文字領域の場合は文字切り出
し処理を施した後、文字認識処理を行う。図形領域の場
合は図形をベクトル化し、表領域の場合は、表の構造認
識を行い、各セルに対して文字認識処理を行う。写真領
域に対しては画像圧縮を行って、情報量の軽減を行う。
して認識処理部17では、文字領域の場合は文字切り出
し処理を施した後、文字認識処理を行う。図形領域の場
合は図形をベクトル化し、表領域の場合は、表の構造認
識を行い、各セルに対して文字認識処理を行う。写真領
域に対しては画像圧縮を行って、情報量の軽減を行う。
【0030】尚、本実施例では、閾値Th_MAX_C
HAR〜Th_CNT_TABLEの値は以下の値とし
た。
HAR〜Th_CNT_TABLEの値は以下の値とし
た。
【0031】 Th_RTO_LINE=25 Th_MAX_CHAR=100 Th_RTO_CHAR=15 Th_RTO_IMG=0.5 Th_CNT_IMG=80 Th_LEN_LINE=25 Th_LEN_TABLE=4/5 Th_CNT_TABLE=3 Th_CRS_TABLE=2
【0032】
【発明の効果】本発明は、二値化された文字認識対象文
書に対して画像データを縮小して縮小画像データとする
手段と、縮小画像データから黒画素が連結している箇所
を検出し、連結黒画素に外接する連結黒画素矩形を求
め、縮小画像データに対応した連結黒画素矩形の座標と
連結黒画素数を連結黒画素矩形情報リストとして格納す
る連結情報格納手段と、連結黒画素矩形の縦横比が予め
定められた閾値以上であるものを罫線と判断し、連結黒
画素矩形情報の1つとして罫線属性を付与する手段と、
連結黒画素矩形の辺の長さが予め定められた閾値以下の
ものを文字矩形と判断し連結黒画素矩形情報に文字属性
を付与する手段と、連結黒画素矩形内の黒画素の特徴か
ら写真属性を付与する手段と、連結黒画素矩形内に水平
線および垂直線を構成する部分があるか調べ、連結黒画
素矩形内に存在する水平線あるいは垂直線の数と水平線
と垂直線の交点数、および、連結黒画素矩形内の黒画素
の情報から表と判断し、連結黒画素矩形情報に表の属性
を付与する手段と、水平線/垂直線情報と連結黒画素矩
形内の全黒画素数と連結黒画素矩形情報格納手段で検出
した連結黒画素数を基に対象矩形が複数の罫線から構成
される矩形であるか調べ、そうであれば矩形情報に罫線
の属性を付与する手段と、さらに、連結黒画素矩形位置
情報と矩形内部の黒画素情報よりその矩形が画像読み取
りノイズであるか調べ、読み取りノイズであった場合に
その連結黒画素矩形の情報を矩形リストより削除する手
段と、属性が付与されない残りの矩形に対して図形属性
を付与する手段とを備えるので、従来では図形と判定さ
れていた複数の罫線が結合している領域や画像読み取り
ノイズが、罫線領域は罫線領域と判定でき、スキャナ読
み取りノイズはノイズと判定して領域情報から削除する
ため、従来では不可能であった罫線で囲まれている文字
領域も罫線領域に統合されることなく、文字領域として
正確に抽出することが可能となり、精度の高い文書認識
が行える。
書に対して画像データを縮小して縮小画像データとする
手段と、縮小画像データから黒画素が連結している箇所
を検出し、連結黒画素に外接する連結黒画素矩形を求
め、縮小画像データに対応した連結黒画素矩形の座標と
連結黒画素数を連結黒画素矩形情報リストとして格納す
る連結情報格納手段と、連結黒画素矩形の縦横比が予め
定められた閾値以上であるものを罫線と判断し、連結黒
画素矩形情報の1つとして罫線属性を付与する手段と、
連結黒画素矩形の辺の長さが予め定められた閾値以下の
ものを文字矩形と判断し連結黒画素矩形情報に文字属性
を付与する手段と、連結黒画素矩形内の黒画素の特徴か
ら写真属性を付与する手段と、連結黒画素矩形内に水平
線および垂直線を構成する部分があるか調べ、連結黒画
素矩形内に存在する水平線あるいは垂直線の数と水平線
と垂直線の交点数、および、連結黒画素矩形内の黒画素
の情報から表と判断し、連結黒画素矩形情報に表の属性
を付与する手段と、水平線/垂直線情報と連結黒画素矩
形内の全黒画素数と連結黒画素矩形情報格納手段で検出
した連結黒画素数を基に対象矩形が複数の罫線から構成
される矩形であるか調べ、そうであれば矩形情報に罫線
の属性を付与する手段と、さらに、連結黒画素矩形位置
情報と矩形内部の黒画素情報よりその矩形が画像読み取
りノイズであるか調べ、読み取りノイズであった場合に
その連結黒画素矩形の情報を矩形リストより削除する手
段と、属性が付与されない残りの矩形に対して図形属性
を付与する手段とを備えるので、従来では図形と判定さ
れていた複数の罫線が結合している領域や画像読み取り
ノイズが、罫線領域は罫線領域と判定でき、スキャナ読
み取りノイズはノイズと判定して領域情報から削除する
ため、従来では不可能であった罫線で囲まれている文字
領域も罫線領域に統合されることなく、文字領域として
正確に抽出することが可能となり、精度の高い文書認識
が行える。
【0033】スキャナ読み取りノイズの検出を、データ
の取り込み時にではなく、文字等の属性を判定する際に
行うため、認識させたい文書自体にコピーノイズがある
文書についてもコピーノイズを削除することが可能であ
る。
の取り込み時にではなく、文字等の属性を判定する際に
行うため、認識させたい文書自体にコピーノイズがある
文書についてもコピーノイズを削除することが可能であ
る。
【図1】本発明の一実施例における文書認識装置のブロ
ック図
ック図
【図2】本発明の一実施例における文書認識装置の機能
ブロック図
ブロック図
【図3】本発明の一実施例における画像データ例示図
【図4】本発明の一実施例における連結黒画素抽出結果
の例示図
の例示図
【図5】本発明の一実施例における画像データ例示図
【図6】本発明の一実施例における連結黒画素抽出結果
の例示図
の例示図
【図7】本発明の一実施例における文書認識装置のフロ
ーチャート
ーチャート
1 CPU 2 ROM 3 RAM 4 スキャナ 5 キーボード 6 表示装置 7 画像入力部 8 画像縮小部 9 連結黒画素矩形リスト作成部 10 罫線属性付与部 11 文字属性付与部 12 写真属性付与部 13 表属性付与部 14 罫線属性付与部 15 読取ノイズ検出部 16 図形属性付与部 17 認識処理部
Claims (1)
- 【請求項1】二値化された文字認識対象文書に対して画
像データを縮小して縮小画像データとする手段と、前記
縮小画像データから黒画素が連結している箇所を検出
し、連結黒画素に外接する連結黒画素矩形を求め、縮小
画像データに対応した連結黒画素矩形の座標と連結黒画
素数を連結黒画素矩形情報リストとして格納する連結情
報格納手段と、連結黒画素矩形の縦横比が予め定められ
た閾値以上であるものを罫線と判断し、連結黒画素矩形
情報の1つとして罫線属性を付与する手段と、連結黒画
素矩形の辺の長さが予め定められた閾値以下のものを文
字矩形と判断し連結黒画素矩形情報に文字属性を付与す
る手段と、連結黒画素矩形内の黒画素の特徴から写真属
性を付与する手段と、連結黒画素矩形内に水平線および
垂直線を構成する部分があるか調べ、連結黒画素矩形内
に存在する水平線あるいは垂直線の数と水平線と垂直線
の交点数、および、連結黒画素矩形内の黒画素の情報か
ら表と判断し、連結黒画素矩形情報に表の属性を付与す
る手段と、前記水平線/垂直線情報と連結黒画素矩形内
の全黒画素数と前記連結黒画素矩形情報格納手段で検出
した連結黒画素数を基に対象矩形が複数の罫線から構成
される矩形であるか調べ、そうであれば矩形情報に罫線
の属性を付与する手段と、さらに、連結黒画素矩形位置
情報と矩形内部の黒画素情報よりその矩形が画像読み取
りノイズであるか調べ、読み取りノイズであった場合に
その連結黒画素矩形の情報を矩形リストより削除する手
段と、属性が付与されない残りの矩形に対して図形属性
を付与する手段とを備えることを特徴とする文書認識装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6157209A JPH0822507A (ja) | 1994-07-08 | 1994-07-08 | 文書認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6157209A JPH0822507A (ja) | 1994-07-08 | 1994-07-08 | 文書認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0822507A true JPH0822507A (ja) | 1996-01-23 |
Family
ID=15644602
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6157209A Pending JPH0822507A (ja) | 1994-07-08 | 1994-07-08 | 文書認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0822507A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003216944A (ja) * | 2002-01-23 | 2003-07-31 | Fujitsu Ltd | 画像結合装置 |
| JP2009070242A (ja) * | 2007-09-14 | 2009-04-02 | Ricoh Co Ltd | 領域分割方法及び装置、並びにプログラム |
| JP2009246930A (ja) * | 2008-03-31 | 2009-10-22 | Sharp Corp | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 |
| CN104469071A (zh) * | 2013-09-19 | 2015-03-25 | 株式会社Pfu | 图像处理装置及图像处理方法 |
-
1994
- 1994-07-08 JP JP6157209A patent/JPH0822507A/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003216944A (ja) * | 2002-01-23 | 2003-07-31 | Fujitsu Ltd | 画像結合装置 |
| JP2009070242A (ja) * | 2007-09-14 | 2009-04-02 | Ricoh Co Ltd | 領域分割方法及び装置、並びにプログラム |
| JP2009246930A (ja) * | 2008-03-31 | 2009-10-22 | Sharp Corp | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 |
| US8385643B2 (en) | 2008-03-31 | 2013-02-26 | Sharp Kabushiki Kaisha | Determination of inputted image to be document or non-document |
| CN104469071A (zh) * | 2013-09-19 | 2015-03-25 | 株式会社Pfu | 图像处理装置及图像处理方法 |
| CN104469071B (zh) * | 2013-09-19 | 2017-12-15 | 株式会社Pfu | 图像处理装置及图像处理方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3308032B2 (ja) | スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置 | |
| JP3278471B2 (ja) | 領域分割方法 | |
| JP3338537B2 (ja) | 画像傾き検出装置 | |
| US6798906B1 (en) | Image processing apparatus and method including line segment data extraction | |
| JPH07192084A (ja) | 文書画像処理方法 | |
| US5502777A (en) | Method and apparatus for recognizing table and figure having many lateral and longitudinal lines | |
| JPH0822507A (ja) | 文書認識装置 | |
| JP3215163B2 (ja) | 罫線識別方法及び領域識別方法 | |
| JP3090342B2 (ja) | 文字列方向判別装置 | |
| JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
| JPH03126181A (ja) | 文書画像の領域分割方法 | |
| JP3406942B2 (ja) | 画像処理装置及び方法 | |
| JP3095470B2 (ja) | 文字認識装置 | |
| JP2902097B2 (ja) | 情報処理装置及び文字認識装置 | |
| EP4576015A1 (en) | Processing multiple documents in an image | |
| JPH0822510A (ja) | 文書認識装置 | |
| JP3220226B2 (ja) | 文字列方向判別方法 | |
| JP3100825B2 (ja) | 線認識方法 | |
| JP2000222577A (ja) | 罫線処理方法、装置および記録媒体 | |
| JPH0575850A (ja) | 画像領域識別装置 | |
| JP2882056B2 (ja) | 特定パターンの識別方法 | |
| JPH0721309A (ja) | 文書認識装置 | |
| JP3145264B2 (ja) | 文字切出し装置 | |
| JP3190794B2 (ja) | 文字切り出し装置 | |
| JP3000480B2 (ja) | 文字領域区切り検出方法 |