JPH05258102A

JPH05258102A - 文字／図形分離装置

Info

Publication number: JPH05258102A
Application number: JP4086663A
Authority: JP
Inventors: Noboru Shimizu; 昇清水
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1992-03-11
Filing date: 1992-03-11
Publication date: 1993-10-08

Abstract

(57)【要約】【目的】文字／図形／点線を誤りが少なく正確に分離
すること。【構成】入力画像における各黒画素塊の二以上の特徴
を抽出する特徴抽出手段（４１）と、各特徴ごとに２以
上のクラスタの相似度を多値で表している判定ルールを
格納している判定ルール格納手段（４４）と、前記特徴
抽出手段の抽出結果を利用して、各黒画素塊の各特徴ご
とに２以上のクラスタの相似度を計算する演算手段（４
２）と、前記演算手段の計算結果を利用して各黒画素塊
の所属するクラスタの判定を行う領域判定手段（４３）
とを備えた文字／図形分離装置である。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は人間による認識のための
マーク付け等が行われていない一般の文書を認識するた
めの文書画像認識において、文字と図形が混在する文書
画像領域から、文字と図形を分離する文字／図形分離装
置に関するものである。

【０００２】

【従来の技術】従来の文字／図形分離装置としては、入
力画像における各黒画素塊の二以上の特徴を抽出し、そ
の二以上の特徴抽出の結果を利用して、単純に固定閾値
を組み合せて識別を行う文字／図形分離装置（特開平２
−１５９６９０号公報，特開平２−１５９６８０号公報
参照）や、クラスタリングすることにより領域の判定を
行う文字／図形分離装置（特開平３−１０２９６４号公
報参照）がある。単純に固定閾値を組み合せる方法は、
処理が簡単であるが閾値が固定であるため対象又はノイ
ズによっては、誤りが多くなり、閾値の決定方法が試行
錯誤的となり、非常に煩雑である。また、クラスタリン
グ手法は、文字／図形の特徴空間において、クラスタを
形成していることを前提としているが、対象によって
は、クラスタを形成していない場合（具体的には文字の
みの画像を対象としている場合）、無理にでもクラスタ
を形成してしまうなどの誤りが生じていた。また、クラ
スタの数、初期クラスタの中心の決定方法などによって
は結果が変動してしまうという問題があった。また、ク
ラスタの数、初期クラスタの中心値の決定方法において
も煩雑さがあるという問題があった。

【０００３】

【発明が解決しようとする課題】本発明は、上述の従来
技術の欠点を解決することを目的とするものである。つ
まり、本発明は、人間の判断に近い分離ができ、従来手
法と比較して精度のよい文字／図形／点線の分離が可能
な文字／図形分離装置を得ることを目的とするものであ
る。また、本発明は、微妙な閾値設定を行う必要のない
素直な判定ルール用いることができ、閾値設定を簡便に
行うことのできる文字／図形分離装置を得ることを目的
とするものである。

【０００４】

【課題を解決するための手段】本発明は、入力画像にお
ける各黒画素塊の二以上の特徴を抽出する特徴抽出手段
（４１）と、各特徴ごとに２以上のクラスタの相似度を
多値で表している判定ルールを格納している判定ルール
格納手段（４４）と、前記特徴抽出手段の抽出結果を判
定ルールと照合し、各黒画素塊の各特徴ごとに２以上の
クラスタの相似度を計算する演算手段（４２）と、前記
演算手段の計算結果により各黒画素塊の所属するクラス
タの判定を行う領域判定手段（４３）とを備えた文字／
図形分離装置である。

【０００５】

【作用】本発明では、特徴抽出手段（４１）により、入
力された画像における各黒画素塊ごとの特徴量を抽出す
る。各黒画素塊の特徴量としては、たとえば黒画素塊の
面積、偏平率、輪郭線の複雑さなどを用いることができ
る。また、あらかじめ、その特徴量ごとに文字／図形／
点線のクラスタに対する相似度を多値で表している判定
ルールを判定ルール格納手段（４４）に用意しておく。
演算手段（４２）は、特徴抽出手段（４１）により抽出
された各黒画素塊の特徴量を判定ルールと照合して、各
黒画素塊の各特徴ごとに文字／図形／点線のクラスタに
対する相似度を計算する。領域判定手段（４３）は、そ
の計算結果を基に各黒画素塊の所属する文字／図形／点
線のクラスタの判定を行う。本発明は、特徴量ごとに文
字／図形／点線のクラスタに対する相似度を多値で表し
たすなわち関数としての判定ルールを用いて、特徴量ご
とのクラスタに対する相似度を求め、それらを総合して
領域の判定を行うので、文字／図形／点線を誤りが少な
く正確に分離することができる。

【０００６】

【実施例】図２は本発明の一実施例による文書認識装置
全体の概要を示すものである、この装置は、紙の文書画
像を読み取って入力するイメージスキャナ等の画像入力
部１、入力された画像や処理の中間結果などの画像デー
タを格納するイメージメモリ２、各黒画素塊にラベルを
付ける処理を行うラベル付け部３、各黒画素塊の特徴を
抽出し判定ルールと照合して、文字と図形の分離判定を
行う文字／図形分離判定部４、その判定結果を格納する
判定結果格納メモリ５、文字と判定された領域の処理を
行う文字処理部６、図形と判定された領域の処理を行う
図形処理部７、および全体の制御を行う制御部８からな
っている。イメージスキャナ等の画像入力部１から紙の
文書の画像（原画像）をデジタル入力し、その原画像を
イメージメモリ２に格納しておく。その原画像に対し
て、ラベル付け部３により、孤立する黒画素塊それぞれ
を識別できる番号に、その黒画素を置き換える。たとえ
ば、黒画素を‘１’であるとし、３０番目に発見した黒
画素塊の‘１’をすべて‘３１’に置き換える。このラ
ベル付けの方法は既知の方法（たとえば、ＲＯＳＥＮＦ
ＥＬＤ＆ＫＡＫ著「ディジタル画像処理」ｐ．３６０−
３６５参照）を用いることができる。図３に原画像の一
例（２つの孤立している黒画素塊を示す画像）と、ラベ
ル付けされた画像（２つの黒画素塊をそれぞれ４番目と
５番目に発見したことにより、‘５’と‘６’にラベル
付けされていることを示す画像）を示す。

【０００７】文字／図形分離判定部４は、図１に示すよ
うに、黒画素塊の特徴量を抽出する特徴抽出部４１と、
判定ルールを格納した判定ルール格納部４４と、特徴抽
出部４１で抽出した特徴量を判定ルールと照合演算する
演算部４２と、その演算の結果を基に領域の判定を行う
領域判定部４３とを備えている。

【０００８】特徴抽出部４１では、特徴抽出が行われ
る。その処理の内容はラベル付けされた各黒画素塊につ
いて、二以上の種類の特徴量を抽出するものである。本
実施例においては、特徴量として、（１）面積、（２）
偏平率、（３）複雑さの３種類を抽出する。（１）面積の測定特徴量として各黒画素塊の面積は次のようしてに求め
る。ラベル付けされた画像をラスタースキャンし、各々
のラベル番号ごとに画素の数を計数する。図３のラベル
付けされた画像の例では、ラベル番号‘５’の面積は１
９であり、ラベル番号‘６’の面積は１１である。

【０００９】（２）偏平率の測定特徴量として各黒画素塊の偏平率は次のようしてに求め
る。まず、各黒画素塊の外接矩形を求める。外接矩形を
求める方法としては種々の公知の方法があり、それらの
任意の方法を用いればよい。たとえば、画像の輪郭線を
追跡し、黒画素塊を含む要素の最小のＸ座標、Ｙ座標お
よび最大のＸ座標、Ｙ座標を求め、これらの座標から外
接矩形の縦幅および横幅を計算する。これらをもとに、
次式により偏平率を算出する。偏平率＝ｍａｘ（横幅，縦幅）／ｍｉｎ（横幅，縦幅）ただし、ｍａｘ（横幅，縦幅）は外接矩形の横幅と縦幅
のうち大きい方を選択することを表し、ｍｉｎ（横幅，
縦幅）は外接矩形の横幅と縦幅のうち小さい方を選択す
ることを表す。

【００１０】（３）複雑さの測定特徴量として各黒画素塊の複雑さは次のようしてに求め
る。各黒画素塊の輪郭のチェーン符号化を行い、得られ
たチェーン符号をもとに複雑さの計算を行う。輪郭のチ
ェーン符号化の方法は、ラベル付けされた画素に対し
て、右手方向にラベル付けされた画素、左手に白画素が
くる方向、つまり時計回りの方向にラベル付けされた画
素を追跡し、チェーン符号化する。方向によるチェーン
符号の割り当ては、図４に従う。たとえば、図３のラベ
ル番号‘５’の黒画素塊の場合、左上端の画素から追跡
を開始し、右に１１進み、その後左に１１進み、下に７
進み、上に７進み一周する。この輪郭のチェーン符号
は、“０００００００００００２２２２２２２２２２２
３３３３３３３１１１１１１１”となる。輪郭の複雑さ
は、このチェーン符号をもとに、次式により算出する。輪郭の複雑さ＝（チェーン符号の変化回数）／（チェー
ン符号の長さ）たとえば、図３のラベル番号‘５’の黒画素塊の場合、
複雑さは３／３６（＝０．０８３）となる。

【００１１】それぞれの黒画素塊ごとに特徴量と文字／
図形／点線のクラスタらしさを表す変数等を付したデー
タ構造を判定結果格納メモリ５内に定義する。図５の表
５１に示すようにこのデータ構造は各々の黒画素塊ごと
にその黒画素塊のラベル番号（識別子）、特徴量、クラ
スタ（文字／図形／点線）らしさ、および判定結果を格
納する変数が定義されている表である。この表５１内
に、前記特徴抽出部４１により、抽出された各黒画素塊
の特徴量を、表５１内の対応する変数に格納する。以
後、この表５１内のデータを用いて、クラスタの判定処
理を行う。

【００１２】前記特徴抽出部４１により、各黒画塊の特
徴量が抽出された後、演算部４２によって、各黒画素塊
のクラスタ（文字／図形／点線）らしさの計算を行う。
演算部４２による処理の流れを図１２ａおよび図１２ｂ
のフローチャートを用いて説明する。演算部４２では、
まず、判定ルール格納部４４より各クラスタの判定ルー
ルの表（４４１，４４２，４４３）を外部記憶装置のフ
ァイルから読み込む（ステップ９０１）。これは、図
６，７，８に示すように各特徴量ごとにそれぞれのクラ
スタらしさを、そのクラスタらしさの可能性が１番高い
ものを１の値とし、反対にクラスタらしさの可能性が１
番低いものを０の値とするものである。図９，１０，１
１にこの関係を各々グラフ化したものを表す。例えば、
特徴量の面積において、その面積の値が５０である場
合、文字らしさの可能性は０．８となり、図形らしさの
可能性は０．２、点線らしさの可能性は０．２となる。
この表現方法は人間の文字／図形／点線に対する面積か
らの判断ルールを２値ではなく、多値で表していること
になる。

【００１３】以後、各黒画素塊に対して、特徴量から各
クラスタ（文字／図形／点線）らしさを計算する。表５
１内の各黒画素塊に対して、上から順に以下の処理（各
黒画素塊あたりの文字／図形／点線らしさの計算）を、
最後の黒画素塊まで繰り返す（ステップ９０２，９１
４）。

【００１４】まず、表５１内の文字らしさ／図形らしさ
／点線らしさの変数部分を、全て０にクリアする（ステ
ップ９０３）。面積の値は判定ルールの表（図６参照）
の最大値を超えていないかの判定（ステップ９０４）を
する。判定の結果、超えているならば、その面積の値を
判定ルールの表内の最大値とする（ステップ９０５）。
たとえば、面積が１５０の場合はその面積値を強制的に
１００とする。この処理は、判定ルールの対象範囲外の
ものも対象とすることができるようにするためのもので
ある。

【００１５】図６の判定ルールの表４４１から、現在対
象としている黒画素塊の面積値より、対応する文字／図
形／点線らしさの値を取り出す（ステップ９０６）。こ
の値と、表５１内の現在対象としている黒画素塊の文字
らしさの変数とを加算し、表５１内の元の場所に格納す
る（ステップ９０７）。同様に図形らしさ／点線らしさ
について加算する（ステップ９０７）。

【００１６】偏平率の値は、判定ルールの表（図７参
照）の最大値を超えていないかの判定（ステップ９０
８）をする。超えているならば、その偏平率の値を判定
ルールの表内の最大値とする（ステップ９０９）。たと
えば、偏平率が８．０の場合はその偏平率の値を強制的
に６．０とする。判定ルールの対象範囲外のものも対象
とすることができるようにするためである。

【００１７】図７の判定ルールの表４４２から、現在対
象としている黒画素塊の偏平率の値より、対応する文字
／図形／点線らしさの値を取り出す（ステップ９１
０）。この際、偏平率の値は小数点以下第１位までの値
で処理をし、小数点以下第２位の値は切り捨てる。この
値と、表５１内の現在対象としている黒画素塊の文字ら
しさの変数とを加算し、表５１内の元の場所に格納する
（ステップ９１１）。同様に図形らしさ／点線らしさに
ついて加算する（ステップ９１１）。

【００１８】図８の判定ルールの表４４３から、現在対
象としている黒画素塊の複雑さの値より、対応する文字
／図形／点線らしさの値を取り出す（ステップ９１
２）。この際、複雑さの値は小数点以下第２位までの値
で、処理をし、小数点以下第３位の値は切り捨てる。こ
の値と、表５１内の現在対象としている黒画素塊の文字
らしさの変数とを加算し、表５１内の元の場所に格納す
る（ステップ９１３）。同様に図形らしさ／点線らしさ
について加算する（ステップ９１３）。

【００１９】以上の全ての各黒画素塊に対する文字／図
形／点線らしさの計算が終了したら、領域判定部４３に
よって、各黒画素塊の判定を行う。すなわち、領域判定
部４３においては、表５１内の各黒画素塊の文字／図形
／点線らしさを表す変数のうち最大値となっているもの
を、その黒画素塊のクラスタとする。このクラスタの結
果を表５１内の判定結果に格納する。その格納する値と
しては、たとえば文字ならば“１”、図形ならば
“２”、点線ならば“３”の値とする。

【００２０】そして、この表５１内の判定結果を利用し
て、文字と判定された黒画素塊を、ラベル付けされた画
像から抽出し、文字のみの画像を作成し、その画像を文
字処理部６へ渡す。同様にして、図形又は点線のみの画
像を作成し、その画像を図形処理部７へ渡す。文字処理
部６は、文字／図形分離判定部４により文字と判定され
た黒画素塊のみの画像より文字認識などの文字画像用の
処理を行う。図形処理部７は、文字／図形分離判定部４
により図形又は点線と判定された黒画素塊のみの画像よ
り図形のベクトル化、図形認識などの図形画像用の処理
を行う。制御部８は、上記全ての処理の流れを制御して
いる。

【００２１】以上、本発明の実施例を詳述したが、本発
明は前記実施例に限定されるものではなく、特許請求の
範囲に記載された本発明を逸脱することなく、種々の変
更が可能である。（１）本実施例では、３つの特徴（面積，偏平率，複雑
さ）を用いているが、これを他の特徴に変えること、増
やすこと、または減らすことも可能である。（２）本実施例では、３つのクラスタ（文字，図形，点
線）に分けているが、これを２つ（たとえば、文字，図
形など）または４つ以上のクラスタに分けることも可能
である。（３）本実施例では、３つの文字らしさ／図形らしさ／
点線らしさの値から最大値を持つクラスタをその黒画素
塊のクラスタとしているが、最大値と第２番目の値が近
い場合は、判別不可能であったとし、リジェクトとす
る。（４）本実施例では、クラスタらしさの計算法として、
１つの黒画素塊に対して各特徴量におけるクラスタらし
さを加算している。しかし、これを１つの黒画素塊に対
して各特徴量におけるクラスタらしさの平均または重心
等の値を使うようにすることも可能である。

【００２２】

【発明の効果】以上述べたように本発明では、あいまい
性を伴う人間の判定ルールを２値ではなく、多値によっ
て表現することによって、人間の判断に近い領域判定が
できるようになり、従来手法と比較して精度のよい文字
／図形／点線の分離が可能となる。そして、この閾値決
定方法も従来手法のように微妙な閾値設定を行う必要が
なく、この判定ルールを多値によって表すことによって
従来の閾値決定方法より簡便に設定することができる。

【図面の簡単な説明】

【図１】本発明の実施例（図２）における文字／図形
分離判定部の構成を示す図である。

【図２】本発明の実施例の文書認識装置全体の概要を
示すブロック図である。

【図３】ラベル付けを説明する図である。

【図４】チェーン符号化する際のチェーン符号の方向
とそれに割り当てられた符号を示す図である。

【図５】各黒画素塊の特徴量および文字／図形／点線
らしさを格納する表を示す図である。

【図６】面積値から文字／図形／点線らしさを判定す
るルールが格納されている表を示す図である。

【図７】偏平率から文字／図形／点線らしさを判定す
るルールが格納されている表を示す図である。

【図８】複雑さから文字／図形／点線らしさを判定す
るルールが格納されている表を示す図である。

【図９】図６をグラフで表した図である。

【図１０】図７をグラフで表した図である。

【図１１】図８をグラフで表した図である。

【図１２ａ】演算部の処理の流れ（前半）を表したフ
ローチャートである。

【図１２ｂ】演算部の処理の流れ（後半）を表したフ
ローチャートである。

【符号の説明】

１…画像入力部、２…イメージメモリ、３…ラベル
付け部、４…文字／図形分離判定部、４１…特徴抽
出部、４２…演算部、４３…領域判定部、４４…
判定ルール格納部、５…判定結果格納メモリ、６…
文字処理部、７…図形処理部、８…制御部

Claims

【特許請求の範囲】

【請求項１】入力画像における各黒画素塊の特徴を抽
出する特徴抽出手段と、各特徴ごとに２以上のクラスタの相似度を多値で表して
いる判定ルールを格納している判定ルール格納手段と、前記特徴抽出手段の抽出結果を前記判定ルールと照合
し、各黒画素塊の各特徴ごとに２以上のクラスタの相似
度を計算する演算手段と、前記演算手段の計算結果により各黒画素塊の所属するク
ラスタの判定を行う領域判定手段と、を備えたことを特
徴とする文字／図形分離装置。