JPH05258102A - 文字/図形分離装置 - Google Patents

文字/図形分離装置

Info

Publication number
JPH05258102A
JPH05258102A JP4086663A JP8666392A JPH05258102A JP H05258102 A JPH05258102 A JP H05258102A JP 4086663 A JP4086663 A JP 4086663A JP 8666392 A JP8666392 A JP 8666392A JP H05258102 A JPH05258102 A JP H05258102A
Authority
JP
Japan
Prior art keywords
character
graphic
black pixel
pixel block
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4086663A
Other languages
English (en)
Inventor
Noboru Shimizu
昇 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP4086663A priority Critical patent/JPH05258102A/ja
Publication of JPH05258102A publication Critical patent/JPH05258102A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 文字/図形/点線を誤りが少なく正確に分離
すること。 【構成】 入力画像における各黒画素塊の二以上の特徴
を抽出する特徴抽出手段(41)と、各特徴ごとに2以
上のクラスタの相似度を多値で表している判定ルールを
格納している判定ルール格納手段(44)と、前記特徴
抽出手段の抽出結果を利用して、各黒画素塊の各特徴ご
とに2以上のクラスタの相似度を計算する演算手段(4
2)と、前記演算手段の計算結果を利用して各黒画素塊
の所属するクラスタの判定を行う領域判定手段(43)
とを備えた文字/図形分離装置である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は人間による認識のための
マーク付け等が行われていない一般の文書を認識するた
めの文書画像認識において、文字と図形が混在する文書
画像領域から、文字と図形を分離する文字/図形分離装
置に関するものである。
【0002】
【従来の技術】従来の文字/図形分離装置としては、入
力画像における各黒画素塊の二以上の特徴を抽出し、そ
の二以上の特徴抽出の結果を利用して、単純に固定閾値
を組み合せて識別を行う文字/図形分離装置(特開平2
−159690号公報,特開平2−159680号公報
参照)や、クラスタリングすることにより領域の判定を
行う文字/図形分離装置(特開平3−102964号公
報参照)がある。単純に固定閾値を組み合せる方法は、
処理が簡単であるが閾値が固定であるため対象又はノイ
ズによっては、誤りが多くなり、閾値の決定方法が試行
錯誤的となり、非常に煩雑である。また、クラスタリン
グ手法は、文字/図形の特徴空間において、クラスタを
形成していることを前提としているが、対象によって
は、クラスタを形成していない場合(具体的には文字の
みの画像を対象としている場合)、無理にでもクラスタ
を形成してしまうなどの誤りが生じていた。また、クラ
スタの数、初期クラスタの中心の決定方法などによって
は結果が変動してしまうという問題があった。また、ク
ラスタの数、初期クラスタの中心値の決定方法において
も煩雑さがあるという問題があった。
【0003】
【発明が解決しようとする課題】本発明は、上述の従来
技術の欠点を解決することを目的とするものである。つ
まり、本発明は、人間の判断に近い分離ができ、従来手
法と比較して精度のよい文字/図形/点線の分離が可能
な文字/図形分離装置を得ることを目的とするものであ
る。また、本発明は、微妙な閾値設定を行う必要のない
素直な判定ルール用いることができ、閾値設定を簡便に
行うことのできる文字/図形分離装置を得ることを目的
とするものである。
【0004】
【課題を解決するための手段】本発明は、入力画像にお
ける各黒画素塊の二以上の特徴を抽出する特徴抽出手段
(41)と、各特徴ごとに2以上のクラスタの相似度を
多値で表している判定ルールを格納している判定ルール
格納手段(44)と、前記特徴抽出手段の抽出結果を判
定ルールと照合し、各黒画素塊の各特徴ごとに2以上の
クラスタの相似度を計算する演算手段(42)と、前記
演算手段の計算結果により各黒画素塊の所属するクラス
タの判定を行う領域判定手段(43)とを備えた文字/
図形分離装置である。
【0005】
【作用】本発明では、特徴抽出手段(41)により、入
力された画像における各黒画素塊ごとの特徴量を抽出す
る。各黒画素塊の特徴量としては、たとえば黒画素塊の
面積、偏平率、輪郭線の複雑さなどを用いることができ
る。また、あらかじめ、その特徴量ごとに文字/図形/
点線のクラスタに対する相似度を多値で表している判定
ルールを判定ルール格納手段(44)に用意しておく。
演算手段(42)は、特徴抽出手段(41)により抽出
された各黒画素塊の特徴量を判定ルールと照合して、各
黒画素塊の各特徴ごとに文字/図形/点線のクラスタに
対する相似度を計算する。領域判定手段(43)は、そ
の計算結果を基に各黒画素塊の所属する文字/図形/点
線のクラスタの判定を行う。本発明は、特徴量ごとに文
字/図形/点線のクラスタに対する相似度を多値で表し
たすなわち関数としての判定ルールを用いて、特徴量ご
とのクラスタに対する相似度を求め、それらを総合して
領域の判定を行うので、文字/図形/点線を誤りが少な
く正確に分離することができる。
【0006】
【実施例】図2は本発明の一実施例による文書認識装置
全体の概要を示すものである、この装置は、紙の文書画
像を読み取って入力するイメージスキャナ等の画像入力
部1、入力された画像や処理の中間結果などの画像デー
タを格納するイメージメモリ2、各黒画素塊にラベルを
付ける処理を行うラベル付け部3、各黒画素塊の特徴を
抽出し判定ルールと照合して、文字と図形の分離判定を
行う文字/図形分離判定部4、その判定結果を格納する
判定結果格納メモリ5、文字と判定された領域の処理を
行う文字処理部6、図形と判定された領域の処理を行う
図形処理部7、および全体の制御を行う制御部8からな
っている。イメージスキャナ等の画像入力部1から紙の
文書の画像(原画像)をデジタル入力し、その原画像を
イメージメモリ2に格納しておく。その原画像に対し
て、ラベル付け部3により、孤立する黒画素塊それぞれ
を識別できる番号に、その黒画素を置き換える。たとえ
ば、黒画素を‘1’であるとし、30番目に発見した黒
画素塊の‘1’をすべて‘31’に置き換える。このラ
ベル付けの方法は既知の方法(たとえば、ROSENF
ELD&KAK著「ディジタル画像処理」p.360−
365参照)を用いることができる。図3に原画像の一
例(2つの孤立している黒画素塊を示す画像)と、ラベ
ル付けされた画像(2つの黒画素塊をそれぞれ4番目と
5番目に発見したことにより、‘5’と‘6’にラベル
付けされていることを示す画像)を示す。
【0007】文字/図形分離判定部4は、図1に示すよ
うに、黒画素塊の特徴量を抽出する特徴抽出部41と、
判定ルールを格納した判定ルール格納部44と、特徴抽
出部41で抽出した特徴量を判定ルールと照合演算する
演算部42と、その演算の結果を基に領域の判定を行う
領域判定部43とを備えている。
【0008】特徴抽出部41では、特徴抽出が行われ
る。その処理の内容はラベル付けされた各黒画素塊につ
いて、二以上の種類の特徴量を抽出するものである。本
実施例においては、特徴量として、(1)面積、(2)
偏平率、(3)複雑さの3種類を抽出する。 (1)面積の測定 特徴量として各黒画素塊の面積は次のようしてに求め
る。ラベル付けされた画像をラスタースキャンし、各々
のラベル番号ごとに画素の数を計数する。図3のラベル
付けされた画像の例では、ラベル番号‘5’の面積は1
9であり、ラベル番号‘6’の面積は11である。
【0009】(2)偏平率の測定 特徴量として各黒画素塊の偏平率は次のようしてに求め
る。まず、各黒画素塊の外接矩形を求める。外接矩形を
求める方法としては種々の公知の方法があり、それらの
任意の方法を用いればよい。たとえば、画像の輪郭線を
追跡し、黒画素塊を含む要素の最小のX座標、Y座標お
よび最大のX座標、Y座標を求め、これらの座標から外
接矩形の縦幅および横幅を計算する。これらをもとに、
次式により偏平率を算出する。 偏平率=max(横幅,縦幅)/min(横幅,縦幅) ただし、max(横幅,縦幅)は外接矩形の横幅と縦幅
のうち大きい方を選択することを表し、min(横幅,
縦幅)は外接矩形の横幅と縦幅のうち小さい方を選択す
ることを表す。
【0010】(3)複雑さの測定 特徴量として各黒画素塊の複雑さは次のようしてに求め
る。各黒画素塊の輪郭のチェーン符号化を行い、得られ
たチェーン符号をもとに複雑さの計算を行う。輪郭のチ
ェーン符号化の方法は、ラベル付けされた画素に対し
て、右手方向にラベル付けされた画素、左手に白画素が
くる方向、つまり時計回りの方向にラベル付けされた画
素を追跡し、チェーン符号化する。方向によるチェーン
符号の割り当ては、図4に従う。たとえば、図3のラベ
ル番号‘5’の黒画素塊の場合、左上端の画素から追跡
を開始し、右に11進み、その後左に11進み、下に7
進み、上に7進み一周する。この輪郭のチェーン符号
は、“0000000000022222222222
33333331111111”となる。輪郭の複雑さ
は、このチェーン符号をもとに、次式により算出する。 輪郭の複雑さ=(チェーン符号の変化回数)/(チェー
ン符号の長さ) たとえば、図3のラベル番号‘5’の黒画素塊の場合、
複雑さは3/36 (=0.083)となる。
【0011】それぞれの黒画素塊ごとに特徴量と文字/
図形/点線のクラスタらしさを表す変数等を付したデー
タ構造を判定結果格納メモリ5内に定義する。図5の表
51に示すようにこのデータ構造は各々の黒画素塊ごと
にその黒画素塊のラベル番号(識別子)、特徴量、クラ
スタ(文字/図形/点線)らしさ、および判定結果を格
納する変数が定義されている表である。この表51内
に、前記特徴抽出部41により、抽出された各黒画素塊
の特徴量を、表51内の対応する変数に格納する。以
後、この表51内のデータを用いて、クラスタの判定処
理を行う。
【0012】前記特徴抽出部41により、各黒画塊の特
徴量が抽出された後、演算部42によって、各黒画素塊
のクラスタ(文字/図形/点線)らしさの計算を行う。
演算部42による処理の流れを図12aおよび図12b
のフローチャートを用いて説明する。演算部42では、
まず、判定ルール格納部44より各クラスタの判定ルー
ルの表(441,442,443)を外部記憶装置のフ
ァイルから読み込む(ステップ901)。これは、図
6,7,8に示すように各特徴量ごとにそれぞれのクラ
スタらしさを、そのクラスタらしさの可能性が1番高い
ものを1の値とし、反対にクラスタらしさの可能性が1
番低いものを0の値とするものである。図9,10,1
1にこの関係を各々グラフ化したものを表す。例えば、
特徴量の面積において、その面積の値が50である場
合、文字らしさの可能性は0.8となり、図形らしさの
可能性は0.2、点線らしさの可能性は0.2となる。
この表現方法は人間の文字/図形/点線に対する面積か
らの判断ルールを2値ではなく、多値で表していること
になる。
【0013】以後、各黒画素塊に対して、特徴量から各
クラスタ(文字/図形/点線)らしさを計算する。表5
1内の各黒画素塊に対して、上から順に以下の処理(各
黒画素塊あたりの文字/図形/点線らしさの計算)を、
最後の黒画素塊まで繰り返す(ステップ902,91
4)。
【0014】まず、表51内の文字らしさ/図形らしさ
/点線らしさの変数部分を、全て0にクリアする(ステ
ップ903)。面積の値は判定ルールの表(図6参照)
の最大値を超えていないかの判定(ステップ904)を
する。判定の結果、超えているならば、その面積の値を
判定ルールの表内の最大値とする(ステップ905)。
たとえば、面積が150の場合はその面積値を強制的に
100とする。この処理は、判定ルールの対象範囲外の
ものも対象とすることができるようにするためのもので
ある。
【0015】図6の判定ルールの表441から、現在対
象としている黒画素塊の面積値より、対応する文字/図
形/点線らしさの値を取り出す(ステップ906)。こ
の値と、表51内の現在対象としている黒画素塊の文字
らしさの変数とを加算し、表51内の元の場所に格納す
る(ステップ907)。同様に図形らしさ/点線らしさ
について加算する(ステップ907)。
【0016】偏平率の値は、判定ルールの表(図7参
照)の最大値を超えていないかの判定(ステップ90
8)をする。超えているならば、その偏平率の値を判定
ルールの表内の最大値とする(ステップ909)。たと
えば、偏平率が8.0の場合はその偏平率の値を強制的
に6.0とする。判定ルールの対象範囲外のものも対象
とすることができるようにするためである。
【0017】図7の判定ルールの表442から、現在対
象としている黒画素塊の偏平率の値より、対応する文字
/図形/点線らしさの値を取り出す(ステップ 91
0)。この際、偏平率の値は小数点以下第1位までの値
で処理をし、小数点以下第2位の値は切り捨てる。この
値と、表51内の現在対象としている黒画素塊の文字ら
しさの変数とを加算し、表51内の元の場所に格納する
(ステップ911)。同様に図形らしさ/点線らしさに
ついて加算する(ステップ911)。
【0018】図8の判定ルールの表443から、現在対
象としている黒画素塊の複雑さの値より、対応する文字
/図形/点線らしさの値を取り出す(ステップ91
2)。この際、複雑さの値は小数点以下第2位までの値
で、処理をし、小数点以下第3位の値は切り捨てる。こ
の値と、表51内の現在対象としている黒画素塊の文字
らしさの変数とを加算し、表51内の元の場所に格納す
る(ステップ913)。同様に図形らしさ/点線らしさ
について加算する(ステップ913)。
【0019】以上の全ての各黒画素塊に対する文字/図
形/点線らしさの計算が終了したら、領域判定部43に
よって、各黒画素塊の判定を行う。すなわち、領域判定
部43においては、表51内の各黒画素塊の文字/図形
/点線らしさを表す変数のうち最大値となっているもの
を、その黒画素塊のクラスタとする。このクラスタの結
果を表51内の判定結果に格納する。その格納する値と
しては、たとえば文字ならば“1”、図形ならば
“2”、点線ならば“3”の値とする。
【0020】そして、この表51内の判定結果を利用し
て、文字と判定された黒画素塊を、ラベル付けされた画
像から抽出し、文字のみの画像を作成し、その画像を文
字処理部6へ渡す。同様にして、図形又は点線のみの画
像を作成し、その画像を図形処理部7へ渡す。文字処理
部6は、文字/図形分離判定部4により文字と判定され
た黒画素塊のみの画像より文字認識などの文字画像用の
処理を行う。図形処理部7は、文字/図形分離判定部4
により図形又は点線と判定された黒画素塊のみの画像よ
り図形のベクトル化、図形認識などの図形画像用の処理
を行う。制御部8は、上記全ての処理の流れを制御して
いる。
【0021】以上、本発明の実施例を詳述したが、本発
明は前記実施例に限定されるものではなく、特許請求の
範囲に記載された本発明を逸脱することなく、種々の変
更が可能である。 (1)本実施例では、3つの特徴(面積,偏平率,複雑
さ)を用いているが、これを他の特徴に変えること、増
やすこと、または減らすことも可能である。 (2)本実施例では、3つのクラスタ(文字,図形,点
線)に分けているが、これを2つ(たとえば、文字,図
形など)または4つ以上のクラスタに分けることも可能
である。 (3)本実施例では、3つの文字らしさ/図形らしさ/
点線らしさの値から最大値を持つクラスタをその黒画素
塊のクラスタとしているが、最大値と第2番目の値が近
い場合は、判別不可能であったとし、リジェクトとす
る。 (4)本実施例では、クラスタらしさの計算法として、
1つの黒画素塊に対して各特徴量におけるクラスタらし
さを加算している。しかし、これを1つの黒画素塊に対
して各特徴量におけるクラスタらしさの平均または重心
等の値を使うようにすることも可能である。
【0022】
【発明の効果】以上述べたように本発明では、あいまい
性を伴う人間の判定ルールを2値ではなく、多値によっ
て表現することによって、人間の判断に近い領域判定が
できるようになり、従来手法と比較して精度のよい文字
/図形/点線の分離が可能となる。そして、この閾値決
定方法も従来手法のように微妙な閾値設定を行う必要が
なく、この判定ルールを多値によって表すことによって
従来の閾値決定方法より簡便に設定することができる。
【図面の簡単な説明】
【図1】 本発明の実施例(図2)における文字/図形
分離判定部の構成を示す図である。
【図2】 本発明の実施例の文書認識装置全体の概要を
示すブロック図である。
【図3】 ラベル付けを説明する図である。
【図4】 チェーン符号化する際のチェーン符号の方向
とそれに割り当てられた符号を示す図である。
【図5】 各黒画素塊の特徴量および文字/図形/点線
らしさを格納する表を示す図である。
【図6】 面積値から文字/図形/点線らしさを判定す
るルールが格納されている表を示す図である。
【図7】 偏平率から文字/図形/点線らしさを判定す
るルールが格納されている表を示す図である。
【図8】 複雑さから文字/図形/点線らしさを判定す
るルールが格納されている表を示す図である。
【図9】 図6をグラフで表した図である。
【図10】 図7をグラフで表した図である。
【図11】 図8をグラフで表した図である。
【図12a】 演算部の処理の流れ(前半)を表したフ
ローチャートである。
【図12b】 演算部の処理の流れ(後半)を表したフ
ローチャートである。
【符号の説明】
1…画像入力部、 2…イメージメモリ、 3…ラベル
付け部、 4…文字/図形分離判定部、 41…特徴抽
出部、 42…演算部、 43…領域判定部、 44…
判定ルール格納部、 5…判定結果格納メモリ、 6…
文字処理部、7…図形処理部、 8…制御部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力画像における各黒画素塊の特徴を抽
    出する特徴抽出手段と、 各特徴ごとに2以上のクラスタの相似度を多値で表して
    いる判定ルールを格納している判定ルール格納手段と、 前記特徴抽出手段の抽出結果を前記判定ルールと照合
    し、各黒画素塊の各特徴ごとに2以上のクラスタの相似
    度を計算する演算手段と、 前記演算手段の計算結果により各黒画素塊の所属するク
    ラスタの判定を行う領域判定手段と、を備えたことを特
    徴とする文字/図形分離装置。
JP4086663A 1992-03-11 1992-03-11 文字/図形分離装置 Pending JPH05258102A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4086663A JPH05258102A (ja) 1992-03-11 1992-03-11 文字/図形分離装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4086663A JPH05258102A (ja) 1992-03-11 1992-03-11 文字/図形分離装置

Publications (1)

Publication Number Publication Date
JPH05258102A true JPH05258102A (ja) 1993-10-08

Family

ID=13893277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4086663A Pending JPH05258102A (ja) 1992-03-11 1992-03-11 文字/図形分離装置

Country Status (1)

Country Link
JP (1) JPH05258102A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011192094A (ja) * 2010-03-15 2011-09-29 Omron Corp 文字列検知装置、文字評価装置、画像処理装置、文字列検知方法、文字評価方法、制御プログラムおよび記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011192094A (ja) * 2010-03-15 2011-09-29 Omron Corp 文字列検知装置、文字評価装置、画像処理装置、文字列検知方法、文字評価方法、制御プログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
US5048107A (en) Table region identification method
US7980473B2 (en) Camera based code reading
EP0482187A1 (en) Row-by-row segmentation and thresholding for optical character recognition (system and method)
JP2926066B2 (ja) 表認識装置
JP3099797B2 (ja) 文字認識装置
JP2898562B2 (ja) ナンバープレート決定方法
JPH05258102A (ja) 文字/図形分離装置
JP3417635B2 (ja) 侵入物体認識方法
JP2832928B2 (ja) 文字認識方法
JPH03126188A (ja) 文字認識装置
JP3104355B2 (ja) 特徴抽出装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
KR950011065B1 (ko) 문자 인식방법
JP2974167B2 (ja) 文字の大分類認識方法
JPH0656625B2 (ja) 特徴抽出方式
JP3277977B2 (ja) 文字認識方法
JPH10254994A (ja) サイズ識別方法および記憶媒体
JPH0795336B2 (ja) 文字認識方式
JPH02166583A (ja) 文字認識装置
JPS63779A (ja) パターン認識方法
JPH1021332A (ja) 非線形正規化方法
JPH03177985A (ja) 文字データの登録方法
JPS6068485A (ja) 文字分類方式
JP2000113110A (ja) 光学的文字読み取り装置
JPS6116380A (ja) 領域分割方式