JPH0628520A

JPH0628520A - 文字認識装置

Info

Publication number: JPH0628520A
Application number: JP4183357A
Authority: JP
Inventors: Yumiko Ikemure; 由美子池牟▲禮▼
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1992-07-10
Filing date: 1992-07-10
Publication date: 1994-02-04

Abstract

(57)【要約】【目的】罫線内文字領域を正しく抽出する文字認識装
置を提供する。【構成】画像データを文字矩形かそれ以外かに分類す
る文字矩形決定部１０と、文字矩形以外については矩形
内の線成分を抽出し、線成分から表か表以外かを判定す
る表矩形決定部１２と、表以外の外接矩形について、外
接矩形黒画素密度と矩形領域内の全黒画素密度を検出
し、黒画素密度と線成分情報から罫線領域か図形領域か
を判定する罫線領域抽出部を備え、罫線領域と判定した
矩形の矩形情報を抽出されている線成分に入れ替える構
成を有する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、印刷文書のデータベー
ス化や文書の再利用のために、スキャナ等の光学的手段
を用いて文書画像を取り込み、取り込んだ画像データか
ら文字、図形、表、罫線等の属性ごとに領域を抽出し、
各属性に応じた認識処理を行う文字認識装置に関する。

【０００２】

【従来の技術】従来の方式について以下説明する。

【０００３】まず、スキャナによって取り込まれた２値
データから外接矩形を検出し、外接矩形の大きさと外接
矩形の黒画素密度から、文字矩形と文字以外の矩形とに
分類し、分類された文字矩形を統合することによって文
字領域を抽出する。

【０００４】文字以外の矩形については、矩形内に微小
な矩形があらかじめ定められたしきい値以上か、あるい
は、矩形内に占める黒画素密度があらかじめ定められた
しきい値以上あれば、その矩形領域は画像領域となる。

【０００５】文字・画像にならなかった残りの矩形に対
しては、矩形内での罫線候補を検出し、線情報を基に表
か図形かを判断して領域を抽出する。

【０００６】抽出した領域が他の領域と重なる場合は領
域を１つの領域に統合して、文字領域については文字認
識を行う。画像領域は画像圧縮、表領域は表認識、図形
領域はベクトル化を行う。

【０００７】

【発明が解決しようとする課題】しかしながら従来の方
式では、図３に示すような例においては、図７のように
複数の罫線で構成される領域は、表の条件に当てはまら
ないために図形領域となってしまい、内部の文字に対し
てベクトル化するといった課題を有していた。

【０００８】本発明は上記課題を解決するもので、罫線
で囲まれている文字領域を正しく抽出する文字認識装置
の提供を目的とする。

【０００９】

【課題を解決するための手段】本発明は、上記目的を達
成するため、図形領域となった外接矩形について、外接
矩形黒画素密度と矩形領域内の全黒画素密度（図３の例
では外接矩形黒画素密度は外接矩形領域内の全画素数に
対する領域内に占める罫線の黒画素数の割合、矩形領域
内の全黒画素密度は外接矩形領域内の全画素数に対する
外接矩形領域内の罫線と文字を合せた全部の黒画素数の
割合）を検出する。全黒画素密度が外接矩形黒画素密度
の所定の倍数以上で、かつ、図形候補外接矩形内に、図
２の線成分抽出部で抽出した線成分があればその線成分
は罫線と判定格納され、罫線が取り出された図形候補矩
形を削除する構成を有する。

【００１０】

【作用】本発明は上記した構成によって、複数の罫線が
結合している領域に対して１本ずつの罫線として取り出
すことが可能となるため、罫線で囲まれている文字領域
も罫線領域に統合されることなく、文字領域として正確
に抽出するように作用する。

【００１１】

【実施例】本発明の一実施例について図面を参照して説
明する。図１は本実施例における領域分割を実行する装
置のハードウェア構成を示すブロック図である。図１に
おいて、１は領域抽出を行う中央処理装置（以下、ＣＰ
Ｕという）であって図２に示す画像データ入力部７、画
像データ格納部８、外接矩形検出部９、文字矩形決定部
１０、線成分抽出部１１、表矩形決定部１２、罫線領域
抽出部１３、認識処理部１４を含む。２は領域抽出プロ
グラムが格納されているリードオンリメモリ（以下、Ｒ
ＯＭという）である。３はランダムアクセスメモリ（以
下、ＲＡＭという）であって、４のスキャナで読み取っ
た画像データが格納される。５は外部からＣＰＵ１に対
して指令を与えるためのキーボードであり、６はＣＰＵ
１によって認識された認識結果を表示する表示装置であ
る。

【００１２】以下、領域分割処理について、図１ないし
図１０を参照しながら説明する。画像データ入力部７と
画像データ格納部８では、スキャナ４で取り込んだ２値
画像データをＲＡＭ３に格納する（図６のフローチャー
トのｓ１）。画像データの座標は図９に示すように左上
が原点で、水平方向の座標をｘ、垂直方向の座標をｙで
表す。

【００１３】外接矩形検出部９では、格納された画像デ
ータから、８近傍で連結している黒画素の外接矩形と黒
画素の数を検出し（ｓ２）、外接矩形のデータ、すなわ
ち左上の座標（ｘ１，ｙ１）と右下の座標（ｘ２，ｙ
２）と、黒画素の数をＲＡＭ３に格納する。図９に示す
画像データの外接矩形は図１０となり、座標（ｘ１，ｙ
１，ｘ２，ｙ２）＝（３，２，７，８）と、黒画素数１
５が格納される。図３の外接矩形については、図４に示
すように１０個の外接矩形が検出される。

【００１４】文字矩形決定部１０では、外接矩形の短辺
の長さがあらかじめ定められたしきい値Ｔｈ１（＝２
５）以上か、あるいは、領域に占める黒画素の割合がし
きい値Ｔｈ２（＝１５）以下の場合は文字以外の矩形と
判定し、処理を続ける。外接矩形の短辺がしきい値Ｔｈ
１未満で、かつ、外接矩形黒画素密度がしきい値Ｔｈ２
を超える場合は文字領域と判定し、ｓ９へ処理を進める
（ｓ３）。図４の矩形１は、文字以外矩形としてｓ４へ
進み、矩形２〜矩形１０は文字候補としてｓ９へ進む。

【００１５】ここで、黒画素密度は［黒画素密度ｄ１＝
外接矩形の黒画素数／（矩形の幅×矩形の高さ）×１０
０％］として求めた値であって、図４の矩形１は、座標
（ｘ１，ｙ１，ｘ２，ｙ２）＝（５，５，３４，４
４）、黒画素数９８であるので、黒画素密度ｄ１は、
［９８／（（３４−５＋１）×（４４−５＋１））×１
００＝８．１７］となる。

【００１６】文字以外の矩形として残った矩形に対し
て、その矩形内に線の成分があるかどうかを調べる線成
分の検出処理を線成分抽出部１１において行う（ｓ
４）。線成分抽出の方法は水平方向／垂直方向それぞれ
に、黒画素の長さがしきい値Ｔｈ３（＝１０）以上ある
かどうかをチェックする。図４の矩形１の線成分抽出結
果は図５のようになる。こうして検出された線成分を基
に次の表矩形決定部１２では表の判定を行う。検出され
た水平線の線の長さが矩形の幅のしきい値Ｔｈ４（＝４
／５）倍のものがしきい値Ｔｈ５（＝３）個以上で、か
つ、垂直線の長さが矩形の高さのしきい値Ｔｈ４倍以上
のものがしきい値Ｔｈ５個以上あり、さらに、上記のい
ずれかの線に対して横切る線がしきい値Ｔｈ６（＝２）
以上あればその矩形は表と判定する（ｓ５）。表と決定
された矩形はｓ９へジャンプし、表と判定されなかった
ものは罫線判定処理へ進む。図４の矩形１は、線成分が
図５のように水平線２、垂直線１であるため表の条件を
満たさない。したがって、この表と判定されなかった矩
形に対して、罫線領域抽出部１３において、以下に述べ
る罫線判定を行う。

【００１７】ｓ３で検出した外接矩形黒画素密度とｓ６
で検出する矩形内全黒画素密度の関係から罫線領域であ
るかどうかを判定する。全黒画素密度ｄ２は矩形内のす
べての黒画素を計数してその数を矩形の面積で割ったも
のに１００を掛けることにより算出する。図４の矩形１
の全黒画素数は２３９であるので、全黒画素密度ｄ２
は、［２３９／（（３４−５＋１）×（４４−５＋
１））×１００＝１９．９］となる（ｓ６）。ｓ６で検
出した全黒画素密度ｄ２が黒画素密度ｄ１の２倍以上あ
り、線成分抽出部１１で検出した水平線が矩形の幅のし
きい値Ｔｈ７（＝４／５）倍のものがあるか、または、
垂直線が矩形の高さのしきい値Ｔｈ７倍以上のものがあ
れば、その矩形は罫線領域矩形と判定する（ｓ７）。罫
線領域と判定されなかったものは図形領域と判定され、
ｓ９へジャンプする。罫線領域と判定されたものに対し
ては、その矩形情報を削除して、その代わりに線成分抽
出部１１で検出した線情報を追加する（ｓ８）。図４の
矩形１は罫線領域候補矩形と判定され、矩形１は削除さ
れ、図５に示すように線１，線２，線３が追加される。

【００１８】以上の処理によって、図３の画像データに
ついては、文字矩形である図４の矩形２〜矩形１０の９
個と罫線である図５の線１、線２、線３の３個の計１２
個の矩形情報から領域の抽出を行う。このようにして得
られた領域結果を図８に示す。

【００１９】次に、抽出された領域が他領域と重ならな
いかどうかをチェックし、重なる場合は領域を統合する
（ｓ９）。

【００２０】以上のようにして得たそれぞれの領域に対
して認識処理部１４では、文字領域の場合は文字切り出
し処理を施した後、文字認識処理を行う。図形領域の場
合は図形をベクトル化し、表領域の場合は、表の構造認
識を行い、各セルに対して文字認識処理を行う。

【００２１】このように本実施例によると、領域抽出処
理を行う中央処理装置と、領域抽出プログラムが格納さ
れているＲＯＭと、読み取った画像データを格納するＲ
ＡＭと、中央処理装置で認識された結果を表示する表示
装置を備え、中央処理装置は、画像データ入力部、画像
データ格納部、外接矩形検出部、文字矩形決定部、線成
分抽出部、表矩形決定部、罫線領域抽出部、認識処理部
を含み、画像データから文字矩形か、それ以外かに分類
し、文字矩形以外のものから表か、表でないかを判定
し、表以外の矩形について罫線領域か図形領域かを判定
し、罫線領域と判定された矩形に対し、その矩形情報を
線成分に変えて、従来のように罫線領域を１つの図形領
域として抽出することなく、１本ずつの罫線として抽出
するので、罫線で囲まれている文字領域が正しく抽出で
きる。

【００２２】なお、本実施例では、各しきい値は、Ｔｈ
１＝２５、Ｔｈ２＝１５、Ｔｈ３＝１０、Ｔｈ４＝４／
５、Ｔｈ５＝３、Ｔｈ６＝２、Ｔｈ７＝４／５、とした
が、これらの値に限定されるものではない。

【００２３】

【発明の効果】以上の実施例から明らかなように本発明
によると、複数の線が結合している罫線領域を１つの図
形領域として抽出せずに、１本ずつの罫線として取り出
せるので、罫線で囲まれている文字領域は図形領域に統
合されず、文字領域として正確に抽出することが可能と
なり、精度の高い認識が行える文字認識装置を提供でき
る。

【図面の簡単な説明】

【図１】本発明の一実施例における領域分割を実行する
装置のハードウェア構成を示すブロック図

【図２】同装置における機能構成を示すブロック図

【図３】本実施例における画像データ例を示す模式図

【図４】図３の外接矩形検出結果の模式図

【図５】図３の線成分抽出結果の模式図

【図６】本実施例における画像領域分割処理を示すフロ
ーチャート

【図７】画像データの座標の説明図

【図８】本実施例における領域抽出結果を示す模式図

【図９】画像データの一例を示す模式図

【図１０】図９に示す画像データの外接矩形図

【符号の説明】

１ＣＰＵ２ＲＯＭ３ＲＡＭ４スキャナ６表示装置７画像データ入力部８画像データ格納部９外接矩形検出部１０文字矩形決定部１１線成分抽出部１２表矩形決定部１３罫線領域抽出部

Claims

【特許請求の範囲】

【請求項１】文字を読み取り、画像データを生成するス
キャナ、読み取られた画像データを格納するＲＡＭ、文
字領域抽出プログラムが格納されているＲＯＭ、文字領
域抽出処理を行う中央処理装置、前記中央処理装置で認
識された結果を表示する表示装置を備え、前記中央処理
装置の中に、前記スキャナで読み取った画像データを前
記ＲＡＭに格納するための画像データ入力および格納部
と、前記ＲＡＭに格納された画像データにおける黒画素
の外接矩形と黒画素を検出し、外接矩形の座標と黒画素
数を前記ＲＡＭに格納する外接矩形検出部と、前記外接
矩形の大きさを基準値と比較し、外接矩形内全画素数に
対して前記外接矩形の黒画素数の占める割合である黒画
素密度を密度基準値と比較した結果から前記外接矩形が
文字矩形か非文字矩形かを判定する文字矩形決定部と、
前記文字矩形決定部において判定された非文字矩形から
線成分の抽出処理をする線成分抽出部と、前記線成分抽
出部において抽出された線成分の水平線分および垂直線
分の長さをそれぞれの長さ基準値と比較した結果から前
記非文字矩形は表であるか否かを決定する表矩形決定部
と、前記表矩形決定部で表でないと決定された矩形につ
いて前記矩形内全画素数に対する前記矩形内全黒画素数
の割合である全黒画素密度を全密度基準値と比較し、そ
して前記線成分抽出部において抽出された水平および垂
直線分長をそれぞれの長さ基準値と比較した結果から前
記矩形を罫線領域矩形と判定する罫線領域抽出部とを含
み、前記中央処理装置は、前記罫線領域抽出部において
罫線領域矩形と判定された矩形を削除し、前記線成分抽
出部にて抽出された線成分に入れ替え、罫線で囲まれて
いる文字領域を抽出して、文字認識処理が行われるよう
に構成した文字認識装置。