JPH07175927A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JPH07175927A
JPH07175927A JP5319801A JP31980193A JPH07175927A JP H07175927 A JPH07175927 A JP H07175927A JP 5319801 A JP5319801 A JP 5319801A JP 31980193 A JP31980193 A JP 31980193A JP H07175927 A JPH07175927 A JP H07175927A
Authority
JP
Japan
Prior art keywords
run
image
ruled line
signal
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5319801A
Other languages
English (en)
Other versions
JP3253201B2 (ja
Inventor
Hiroki Sugano
浩樹 菅野
Gururajiyu Rao
ラオ・グルラジュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP31980193A priority Critical patent/JP3253201B2/ja
Publication of JPH07175927A publication Critical patent/JPH07175927A/ja
Application granted granted Critical
Publication of JP3253201B2 publication Critical patent/JP3253201B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】この発明は、対象画像から抽出した罫線の位置
・長さ等の情報から対象画像の種別を判別でき、文書分
類作業は人手に頼ることなく可能となり、文書の登録
が、効率良く、効率的に行うことが可能となることを目
的とする。 【構成】この発明の画像処理装置は、処理対象画像にお
ける注目画素の画像信号を2値化手段2で2値化し、こ
の2値化した画像信号から黒ラン長をランレングス符号
化手段3で算出し、この符号化されたランレングス符号
から短いランをラン除去手段41で除去し、この短いラ
ンが除去された画像信号を基に、連結するランの領域を
調べ、この領域に外接する矩形をラベリング・外接矩形
抽出手段5で抽出し、この抽出された矩形の大きさによ
り罫線領域を罫線領域判定手段6で判定し、この判定さ
れた罫線領域から画像の種類を画像判定手段7で判別す
るようにしたものである。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、一般オフィスで用い
られる複数の文書画像を対象として、処理対象画像がど
の様な画像に分類できるかを判別処理する画像処理装置
に関する。
【0002】
【従来の技術】一般に、電子ファイリング装置の文書登
録においては、単に文書にタイトルを付けて登録するだ
けでなく、迅速な検索を可能とするために、ファイル構
造を階層的に構築する。つまり、文書を分類し、キャビ
ネットやバインダといったボックスのなかに、従来の紙
文書のファイルと同じ様な概念で登録を行う。
【0003】登録する文書の量が少ない場合は、この文
書分類作業を人手で行っても大した時間を要することは
無いが、大量の文書登録においては文書分類作業はかな
り煩雑な作業となる。
【0004】さらに、帳票等定型フォーマットの文書の
登録では、それらの文書の分類されるボックスは予め決
まっており、この文書分類作業を人手で行うのは非効率
的である。
【0005】しかしながら、この文書分類作業を自動的
に行う方法は確立されておらず、現状の電子ファイリン
グ装置では、いかなる文書についても、文書分類作業は
人手に頼らざるを得ない。
【0006】
【発明が解決しようとする課題】電子ファイリング装置
等、文書の種類を識別判定することが必要な画像処理装
置においては、文書分類作業を自動的に行う方法は搭載
されておらず、文書分類作業は人手に頼っている。した
がって、文書の登録は、煩雑かつかなりの時間を要し、
効率の悪い作業であった。
【0007】この発明では、画像の種類を識別判定する
画像処理装置において、文書画像から罫線情報を抽出す
る。これらの情報をもとに文書画像の種類を識別判定す
ることを目的とする。
【0008】
【課題を解決するための手段】この発明の画像処理装置
は、処理対象画像における注目画素の画像信号を2値化
する2値化手段、この2値化手段により2値化した画像
信号から黒ラン長を算出するランレングス符号化手段、
このランレングス符号化手段により符号化されたランレ
ングス符号から短いランを除去するラン除去手段、この
ラン除去手段により短いランが除去された画像信号を基
に、連結するランの領域を調べ、この領域に外接する矩
形を求める外接矩形抽出手段、この外接矩形抽出手段に
より抽出された矩形の大きさにより罫線領域を判定する
罫線判定手段、およびこの罫線判定手段により判定され
た罫線領域から画像の種類を判別する画像判定手段から
構成されている。
【0009】この発明の画像処理装置は、処理対象画像
における注目画素の画像信号を2値化する2値化手段、
この2値化手段により2値化した画像信号から黒ラン長
を算出するランレングス符号化手段、このランレングス
符号化手段により符号化されたランレングス符号から短
いランを除去するラン除去手段、このラン除去手段によ
り短いランが除去された画像信号を基に、連結するラン
の領域を調べ、この領域に外接する矩形を求める外接矩
形抽出手段、この外接矩形抽出手段により抽出された矩
形の大きさにより罫線領域を判定する罫線判定手段、お
よびこの罫線判定手段により判定された罫線の位置・長
さと予め登録された原稿の罫線の位置・長さとの類似度
により画像の種類を判別する画像判定手段から構成され
ている。
【0010】
【作用】この発明は、処理対象画像における注目画素の
画像信号を2値化し、この2値化した画像信号から黒ラ
ン長を算出し、この符号化されたランレングス符号から
短いランを除去し、この短いランが除去された画像信号
を基に、連結するランの領域を調べ、この領域に外接す
る矩形を抽出し、この抽出された矩形の大きさにより罫
線領域を判定し、この判定された罫線領域から画像の種
類を判別するようにしたものである。
【0011】この発明は、処理対象画像における注目画
素の画像信号を2値化し、この2値化した画像信号から
黒ラン長を算出し、この符号化されたランレングス符号
から短いランを除去し、この短いランが除去された画像
信号を基に、連結するランの領域を調べ、この領域に外
接する矩形を抽出し、この抽出された矩形の大きさによ
り罫線領域を判定し、この判定された罫線領域から罫線
の位置・長さと予め登録された原稿の罫線の位置・長さ
との類似度により画像の種類を判別するようにしたもの
である。
【0012】
【実施例】以下、図面を参照しながらこの発明の一実施
例について説明する。図1はこの発明の原稿種別を判定
する画像処理装置の構成図である。図1において、1は
入力画像信号、2は入力信号を2値化する2値化手段、
21は2値化画像信号、3はランレングス符号化手段、
31はランレングス信号、4はラン除去手段、41はラ
ン除去後の画像信号、5はラベリング・外接矩形抽出手
段、51は矩形信号、7は罫線領域判定手段、61は罫
線領域信号、7は画像判定手段、8は判定信号である。
以下、この発明の原稿種別判定方法を詳細に説明する。
【0013】スキャナ等の入力装置で読み取られた入力
画像信号1は、2値化手段2において、2値化閾値Th
との比較処理を行い2値化され、2値化画像信号21
(0または1)を出力する。ラングレス符号化手段3で
は2値化画像情報21から画像をラン情報に変換する。
このラン情報を元に罫線領域情報61を抽出する。ま
ず、ラン除去手段4では主走査方向および副走査方向の
短いランをそれぞれ除去する。
【0014】次に、ラベリング・外接矩形抽出手段5で
はラン除去手段4で出力された画像信号をもとに連結す
るランを1つの領域として統合(ラベリング)し、その
ラベリングされたそれぞれの領域に外接する矩形を求め
る。罫線領域判定手段6ではこの矩形の大きさにより罫
線領域情報61を出力する。画像判定手段7ではこれら
罫線領域情報61により画像の種類を判定する。
【0015】次に、この発明の原稿種別判定処理を搭載
した画像処理装置の一実施例について説明する。図1は
この実施例に係わる画像処理装置の概略構成図である。
この画像処理装置は一般の文書原稿をイメージ・スキャ
ナ等の読み取り装置にて読み取り入力し、例えば1画素
当り8ビットのデジタルデータとして入力し、この原稿
種類を判定して出力するものである。以下、この実施例
について詳しく説明する。
【0016】図1において、まず1は入力された画像信
号である。入力画像信号1(f)は2値化手段2で所定
の閾値Thと比較し2値化処理を行い、2値化画像信号
21(g)を出力する。2値化手段2は、閾値Thを記
憶する閾値メモリと入力画像信号1(f)と閾値Thを
比較する比較器とで構成される。入力画像信号1が2値
化閾値Thより小さければ2値化画像信号21(g)と
して“0”を出力し、大きければ“1”を出力する。比
較処理は(1)式に示す。
【0017】 g=0 : f<Th g=1 : f≧Th …(1) 図2に2値化手段2の構成を示す。2値化手段2は8ビ
ットの比較器で構成される。8ビットの入力画素信号1
と予め設定した8ビットの閾値Thが比較され、(1)
式に示す条件で2値化画像信号21が出力される。
【0018】次に、ランレングス符号化手段3において
2値化画像信号21からラン情報を作成する。図3はラ
ン情報抽出方法を説明する図であり、以下詳細に説明す
る。図3の(a)は原画像を示す。図3の(b)は原画
像をビットマップ表現したものであり、各マス目が画素
に対応し、斜線部が黒(1)画素、それ以外が白(0)
画素を表す。図3の(b)において、最初の黒画素は座
標(2,1)にありさらに右方向に座標(4.1)迄連
結している。
【0019】また、座標(1,6)の画素は座標(5,
6)迄連結している。このように画素の連結状態を、図
3の(c)に示すように右方向に連結している画素をひ
とまとめとした情報(ラン)に置き換える。さらにこれ
らのランを、ランの始点および長さの情報として出力す
る。例えば、第1番目のランは、始点(2,1)、長さ
3、第2番目のランは、始点(1,2)、長さ1…とい
う具合である。このようにランレングス符号化手段3で
は2値化画像信号21からランの始点および長さをラン
情報として出力する。
【0020】図4にランレングス符号化手段3の構成を
示す。まず、2値化画像信号21により第1のクロック
で1番目の画素がラッチ300にストアされる。続いて
第2のクロックでアンドゲート310では1画素目が
白、2画素目が黒の場合“1”、それ以外では“0”が
出力される。つまり、アンドゲート310の出力311
(ラン開始信号)は黒ランの開始を示す信号である。
【0021】一方、アンドゲート320では1画素目が
黒、2画素目が白の場合“1”、それ以外では“0”が
出力される。つまり、アンドゲート320の出力321
(ラン終了信号)は黒ランの終了を示す信号である。カ
ウンタ330は前述のラン開始信号311によりリセッ
トされ、画像クロック22(CLK)によりカウントさ
れる。カウンタ330の出力信号331は前述のラン終
了信号321によりラッチ360にストアされる。つま
りラッチ360にはラン長がストアされることとなる。
【0022】次に、カウンタ331には画像クロック2
2(CLK)および垂直画像クロック23(VCLK)
が入力され、現在の画像位置(X座標、Y座標)がカウ
ントされる。ラン開始のX座標341およびY座標34
2は前述したラン開始信号311によりそれぞれラッチ
370およびラッチ380にストアされる。セレクタ3
90はラッチ370,380,360にストアされたラ
ン開始のX座標、Y座標、ラン長を、X座標、Y座標、
ラン長の順に選択し出力するもので、セレクト信号35
1はカウンタ350がラン終了信号321のタイミング
から出力する。
【0023】以上の手順で算出したラン情報を元に、ラ
ン除去手段4、ラベリング・外接矩形抽出手段5、罫線
領域判定手段6により罫線領域情報61を出力する。以
下、罫線領域情報61算出方法について詳述する。
【0024】まず、ラン除去手段4は、ランレングス符
号化手段3により求めたラン情報から、短いランの除
去、または長いランの除去をそれぞれ独立に行う。この
手順を詳しく説明する。図5の(a)はランレングス符
号化手段3により求めたランである。まず、短いランの
除去では、ラン長の短いもののみ除去する。図5の
(b)はラン長1のものを除去した例であり、2番目か
ら6番目のランは除去されている。つまり本処理はラン
長をL、短いランのラン長閾値をThs としたとき L<Ths …(2) を満たすランを除去するものである。
【0025】図6の(a)はさらに具体的に文書画像で
あり、罫線および文字から構成される文書の一例であ
る。図6の(a)に対し短いランの除去処理を行うと図
6の(b)に示すようになる。この図からわかるよう
に、本処理では縦の罫線および文字の一部が除去され
る。このラン除去処理では短いランの除去を行う一方長
いランの除去を平行して行う。この処理は長いランのラ
ン長閾値をTh1 としたとき L<Th1 …(3) を満たすランを除去するものである。
【0026】図7は長いランの除去処理の一例を示した
もので、図7の(a)の文書画像に対して、図7の
(b)に示す画像が出力される。図8にラン除去手段4
の回路構成を示す。
【0027】まず、ラッチ410,420,430,4
40にはラン情報31が順次入力され、3クロック毎に
それぞれラン長、Y座標、X座標、ラン長がストアされ
る。比較器450および460は例えば13ビット(A
3版、400dpi(ドットパー インチ)の主走査画
素数に相当する)の比較器で構成され、比較器450で
は閾値Thsとラン長が(2)式に基づいて比較され
(2)式を満たす場合に“0”、それ以外の場合に
“1”が判定信号451として出力される。つまり、閾
値Ths以上のランの場合にのみ“1”が出力され。
【0028】一方、比較器460ではTh1とラン長が
(3)式に基づいて比較され、(3)式を満たす場合に
“0”、それ以外の場合に“1”が判定信号461とし
て出力される。つまり、閾値Th1以下のランの場合に
のみ“1”が出力される。ゲート470はオアゲートで
あり、判定信号451および461のオア信号が判定信
号471として出力される。
【0029】480,482,484はラッチであり、
判定信号471が“1”のときにそれぞれX座標、Y座
標、ラン長がストアされる。カウンタ486はラッチ4
80,482,484にストアされたX座標、Y座標、
ラン長を順次選択するための選択信号を発生するカウン
タで、セレクト信号487によりセレクタ488はX座
標、Y座標、ラン長の順にラッチ480,482,48
4にストアされた信号をラン除去信号41として出力す
る。
【0030】次にラベリング・外接矩形抽出手段5では
ラン除去手段4で出力された画像信号41をもとに連結
するランを1つの領域として統合(ラベリング)する。
図9の(a)はランレングス符号化手段3により求めた
ランを示し、図9の(b)はそのラン情報である。図9
の(a)において第1番目のランは第2番目のランと連
結している。さらに、第1番目のランと第3番目のラン
も連結している。つまり、第1、第2、第3番目のラン
はすべて連結している。このようにラベリング・外接矩
形抽出手段5では連結しているランを1つの領域として
統合(ラベリング)する。図9の(c)は図9の(a)
に示す画像情報をラベリングし、ラベル(A)として出
力したものである。
【0031】また、ラベリング・外接矩形抽出手段5で
は上記のラベリングされたそれぞれの領域に外接する矩
形の位置および大きさを求める。図9の(c)より、ラ
ベル(A)はラン(1)、ラン(2)、ラン(3)が統
合されたものである。ラベリング・外接矩形抽出手段5
では、これらのランの始点(x1,y1)、(x2,y
2)、(x3,y3)のうち最も小さいxおよび最も小
さいyを外接矩形の始点(x0,y0)として求める。
つまり、対象ラベルに含まれるn個のランの始点をそれ
ぞれ(x1,y1)、(x2,y2)…(xn,yn)
としたとき x0=min(x1,x2,…xn) …(4) y0=min(y1,y2,…yn) …(5) として求める。また始点の算出と同様の方法で終点(x
e,ye)を算出し、外接矩形の大きさ(xs,ys)
を以下の式で算出する。
【0032】 xs=xe−x0+1 …(6) ys=ye−y0+1 …(7) 図11は図9の(a)に示すラン情報に対し、以上の手
順で算出した外接矩形情報51である。
【0033】図10はラベリング・外接矩形抽出手段5
の回路構成の一例である。ラン除去手段4の出力信号4
1について、まず第1ライン目のライン情報(ラン開始
位置のX座標、Y座標、ラン長)がセレクタ510を介
してメモリ512に記憶される。メモリ512に記憶さ
れたラン情報はセレクタ514を介し、比較器520,
522,524,526,528において第2ライン目
の情報と比較される。
【0034】以下では第1ライン目のランの開始位置を
X0,Y0、ラン長をL0とし、第2ライン目のランの
開始位置をX1,Y1、ラン長をL1として説明する。
まず比較器520では第1ライン目の第1番目のランの
開始位置X0と第2ライン目の第1番目のランの終了位
置X1+L1を比較する。
【0035】このとき、 X0>X1 であれば比較信号521として“1”をそれ以外では
“0”を出力する。
【0036】以下同様に、比較器522では、 X0>X1+L1 であれば、比較信号523として“1”をそれ以外では
“0”を出力する。
【0037】比較器524では、 X0+L0>X1+L1 であれば、比較信号525として“1”をそれ以外では
“0”を出力する。
【0038】比較器526では、 X0+L0>X1 であれば、比較信号527として“1”をそれ以外では
“0”を出力する。
【0039】比較器528では、 Y0>Y1 であれば、比較信号529として“1”をそれ以外では
“0”を出力する。
【0040】一方、加減算器530ではランが連結した
場合に統合したラン長として X0+L0−X1+1 または X1+L1−X0+1 を計算し、その出力信号531としてX0,Y0,X
1,Y1,X0+L0−X1+1,X1+L1−X0+
1を出力する。
【0041】判定テーブル540では比較信号521,
523,525,527,529を元に6種類の条件を
設定しセレクタ514,544、メモリ546,548
の選択信号およびラン選択信号543を出力する。メモ
リ選択信号545は内部演算用のメモリ546(1ライ
ン分のラン情報を記憶するメモリ)とラベリング結果出
力用のバッファメモリ548を選択する信号で、“0”
のときメモリ546を、“1”のときメモリ548を選
択する。
【0042】また、選択信号542は4ビットの信号で
下位3ビットは以下に説明する6つの条件で決定し、上
位1ビットは比較信号529がそのまま出力される。ま
ず、第1の条件は、比較信号523が“1”の場合で、
この条件では第2ライン目のランは第1ライン目のラン
と連結しておらず、メモリ選択信号541として“0”
を、選択信号542の下位3ビットとして“000”
を、ラン選択信号543として“1”を出力する。第2
の条件は比較信号521が“1”、比較信号523が
“0”、比較信号525が“1”の場合で、この条件で
は第2ライン目のランは第1ライン目のランと連結し、
メモリ選択信号541として“0”を、選択信号542
の下位3ビットとして“001”を、ラン選択信号54
3として“1”を出力する。
【0043】第3の条件は比較信号521が“1”、比
較信号523が“0”、比較信号525が“0”の場合
で、この条件では第2ライン目のランは第1ライン目の
ランと連結し、メモリ選択信号541として“0”を、
選択信号542の下位3ビットとして“010”を、ラ
ン選択信号543として“0”を出力する。第4の条件
は比較信号521が“0”、比較信号523が“1”、
比較信号525が“1”の場合で、この条件では第2ラ
イン目のランは第1ライン目のランと連結し、メモリ選
択信号541として“0”を、選択信号542の下位3
ビットとして“011”を、ラン選択信号543として
“1”を出力する。
【0044】第5の条件は比較信号521が“0”、比
較信号523が“1”、比較信号525が“0”の場合
で、この条件では第2ライン目のランは第1ライン目の
ランと連結し、メモリ選択信号541として“0”を、
選択信号542の下位3ビットとして“100”を、ラ
ン選択信号543として“0”を出力する。第6の条件
は比較信号527が“0”の場合で、この条件では第1
ライン目のランと連結が完了したことを示し、メモリ選
択信号541として“1”を、選択信号542の下位3
ビットとて“101”を、ラン選択信号543として
“0”を出力する。セレクタ544では選択信号542
によりラベル情報を出力する。
【0045】まず、選択信号542の下位3ビットが
“000”の場合はラベルの開始位置として(X1,Y
1)、ラベルのサイズとして(L1、Y−Y1+1(こ
こでYは処理中のライン番号とする))を出力する。選
択信号542の下位3ビットが“001”の場合はY0
とY1のうち小さい信号をY2としたときラベルの開始
位置として(X1,Y2)、ラベルのサイズとして(X
0+L0−X1+1、Y−Y2+1)を出力する。選択
信号542の下位3ビットが“010”の場合はラベル
の開始位置として(X1,Y2)、ラベルのサイズとし
て(L1、Y−Y2+1)を出力する。選択信号542
の下位3ビットが“011”の場合はラベルの開始位置
として(X0,Y2)、ラベルのサイズとして(L0、
Y−Y2+1)を出力する。
【0046】選択信号542の下位3ビットが“10
0”の場合はラベルの開始位置として(X0,Y2)、
ラベルのサイズとして(X1+L1−X0+1、Y−Y
2+1)を出力する。選択信号542の下位3ビットが
“101”の場合はラベルの開始位置として(X0,Y
0)、ラベルのサイズとして(L0、Y−Y0+1)を
出力する。メモリ選択信号541によりセレクタ544
より出力したラベル情報をメモリ546またはメモリ5
48へ出力するかを選択する。
【0047】さらに、ラン選択信号543により第1ラ
イン目のラン情報513および第2ライン目のラン情報
41を更新する。つまりラン選択信号543が“0”の
場合は第1ライン目のラン情報513を次のランに更新
する。また、ラン選択信号543が“1”の場合は第2
ライン目のラン情報41を次のランに更新する。以上の
処理を1ライン終了まで繰りかえす。
【0048】第1ラインの処理が終了すると、メモリ5
46に記憶された第2ライン目のラン情報はセレクタ5
10を介してメモリ512に記憶され、第2ライン目の
ラン情報513と第3ライン目のラン情報41とにより
上記の演算が行われる。以上を1ページ終了まで行う。
【0049】次に、罫線領域判定手段6ではこの外接矩
形情報51より罫線領域情報61を出力する。一般に罫
線の特徴として、横罫線はその画像の横幅が大きく縦幅
は小さい。また、縦罫線は画像の横幅が短く縦幅が長
い。このことを利用し、横幅閾値Th1、縦幅閾値Th
2を設定し、以下の条件を満たすものを外接矩形情報5
1から横罫線として抽出する。
【0050】 xs>th1 かつ ys<th2 …(8) さらに、横幅閾値Th3、縦幅閾値Th4を設定し、以
下の条件を満たすものを外接矩形情報51から縦罫線と
して抽出する。
【0051】 xs<th3 かつ ys<th4 …(9) そして、上記式(8)、式(9)の何れをも満たさない
領域は非罫線領域とする。図12は以下の手順のフロー
を示すものである。
【0052】図6の(c)および図7の(c)はそれぞ
れ図6の(a)および図7の(a)の文書画像を、上述
したラン除去手段4、ラベリング・外接矩形抽出手段
5、罫線領域判定手段6の各手段を通して横罫線領域お
よび縦罫線領域を抽出したものである。
【0053】図13に罫線領域判定手段6の回路構成の
一例を示す。まず矩形信号51として矩形の開始座標
(x,y)およびサイズ(xs,ys)が入力される。
図次しないクロックによりラッチ614,612,61
0にx,y,xsがそれぞれストアされる。比較器62
0,622,624,626ではそれぞれxsとTh
1、ysとTh2、xsとTh3、ysとTh4が比較
され、xs>Th1のとき比較信号621として“1”
それ以外は“0”、ys<Th2のとき比較信号623
として、“1”、それ以外は“0”、xs<Th3のと
き比較信号625として“1”それ以外は“0”、ys
>Th4のとき比較信号627として“1”それ以外は
“0”を出力する。判定回路630では比較信号621
および623が“1”のときまたは比較信号625およ
び627が“1”のとき判定信号631として“1”を
出力しラッチ640,642,644,646にそれぞ
れx,y,xs,ysがストアされる。
【0054】また、罫線種別信号632として比較信号
621および623が“1”のとき“0”を比較信号6
25および627が“1”のときは“1”を出力する。
カウンタ650はラッチ640,642,644,64
6の情報を順次セレクタ660で選択するための選択信
号であり、罫線領域信号61として罫線と判定された矩
形信号のx,y,xs,ys、種類を順次出力するもの
である。
【0055】以上説明した罫線領域信号61を利用し、
画像判定手段7では画像の種類を判定する。以下に、そ
の判定方法を詳しく説明する。罫線領域信号61を用い
て、罫線の位置および長さから判定する。
【0056】まず、対象画像の横罫線の数をnlとし横
罫線の始点を(xl(i),yl(i))とし、の長さ
をll(i)とする。ただし、iは1〜nlとする。ま
た、縦罫線の数をnpとし、縦罫線の始点を(xp
(j),yp(j))とし、長さをlp(j)とする。
ただし、jは1〜npとする。
【0057】ここで、すでに登録してある判定したい画
像の種類がn種あり、この中で画像mの横罫線数、縦罫
線数、横罫線の始点とその長さおよび縦罫線の始点とそ
の長さをNlm ,Npm 、(X1m (k)、Ylm
(k))、Llm (k)、(Xpm (l)、Ypm
(l))、Lpm (l)とする(ただしjは1〜n、k
は1〜Nlm 、lは1〜Npm )。
【0058】まず、対象画像のnl個の横罫線の始点
(xl(1)、yl(2))〜(xl(nl),yl
(nl))それぞれに対し、(Xlm (k)、Ylm
(k))のうち最も距離の近いものを求め(このときの
kをk=oとする)、その距離および長さの差の2乗和
平均Alm を以下の式により求める。
【0059】
【数1】 同様に縦罫線に対してApm を求める。
【0060】
【数2】 さらにそれらの平均Am
【0061】
【数3】 として算出する。このAm を登録済みのn種の画像全て
に対して算出し、最も小さな値Am をもつ画像を対象画
像と同じ種類であると判定する。画像判定手段7はCP
Uおよびメモリで構成される。
【0062】上記したように、処理対象画像における注
目画素の画像信号を2値化手段で2値化し、この2値化
した画像信号から黒ラン長をランレングス符号化手段で
算出し、この符号化されたランレングス符号から短いラ
ンをラン除去手段で除去し、この短いランが除去された
画像信号を基に、連結するランの領域を調べ、この領域
に外接する矩形をラベリング・外接矩形抽出手段で抽出
し、この抽出された矩形の大きさにより罫線領域を罫線
領域判定手段で判定し、この判定された罫線領域から画
像の種類を画像判定手段で判別するようにしたものであ
る。
【0063】これにより、対象画像から抽出した罫線の
位置・長さ等の情報から対象画像の種別を判別できる。
したがって、電子ファイリング装置等、文書の種類を識
別判定することが必要な画像処理装置においては、文書
分類作業は人手に頼ることなく可能となる。この結果、
文書の登録が、効率良く、効率的に行うことが可能とな
る。なお、この発明は上記実施例に限定されるものでは
なく、発明の主旨を変えない範囲において種々の変形が
可能である。
【0064】
【発明の効果】以上詳述したようにこの発明によれば、
対象画像から抽出した罫線の位置・長さ等の情報から対
象画像の種別を判別できる。したがって、電子ファイリ
ング装置等、文書の種類を識別判定することが必要な画
像処理装置においては、文書分類作業は人手に頼ること
なく可能となる。この結果、文書の登録が、効率良く、
効率的に行うことが可能となる。
【図面の簡単な説明】
【図1】この発明の一実施例に係わる画像処理装置を示
す全体構成ブロック図。
【図2】2値化手段の回路構成の一例を示すブロック
図。
【図3】ランレングス符号化の処理説明図。
【図4】ランレングス符号化手段の回路構成の一例を示
すブロック図。
【図5】ラン除去手段の説明図。
【図6】罫線領域判定の一例を示す図。
【図7】罫線領域判定の一例を示す図。
【図8】ラン除去手段の回路構成の一例を示すブロック
図。
【図9】ラベリング手段の説明図。
【図10】ラベリング手段の回路構成の一例を示すブロ
ック図。
【図11】外接矩形抽出手段の説明図。
【図12】罫線領域判定手段の説明図。
【図13】罫線領域判定手段の回路構成の一例を示すブ
ロック図。
【符号の説明】
1…入力画像信号 2…2値化手段 21…2値化画像信号 3…ランレングス符号化手段 31…ランレングス信号 4…ラン除去手段 41…ラン除去後の画像信号 5…ラベリング・外接矩形抽出手段 51…矩形信号 6…罫線領域判定手段 61…罫線領域信号 7…画像判定手段 8…判定信号

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 処理対象画像における注目画素の画像信
    号を2値化する2値化手段と、 この2値化手段により2値化した画像信号から黒ラン長
    を算出するランレングス符号化手段と、 このランレングス符号化手段により符号化されたランレ
    ングス符号から短いランを除去するラン除去手段と、 このラン除去手段により短いランが除去された画像信号
    を基に、連結するランの領域を調べ、この領域に外接す
    る矩形を求める外接矩形抽出手段と、 この外接矩形抽出手段により抽出された矩形の大きさに
    より罫線領域を判定する罫線判定手段と、 この罫線判定手段により判定された罫線領域から画像の
    種類を判別する画像判定手段と、 を具備したことを特徴とする画像処理装置。
  2. 【請求項2】 処理対象画像における注目画素の画像信
    号を2値化する2値化手段と、 この2値化手段により2値化した画像信号から黒ラン長
    を算出するランレングス符号化手段と、 このランレングス符号化手段により符号化されたランレ
    ングス符号から短いランを除去するラン除去手段と、 このラン除去手段により短いランが除去された画像信号
    を基に、連結するランの領域を調べ、この領域に外接す
    る矩形を求める外接矩形抽出手段と、 この外接矩形抽出手段により抽出された矩形の大きさに
    より罫線領域を判定する罫線判定手段と、 この罫線判定手段により判定された罫線の位置・長さと
    予め登録された原稿の罫線の位置・長さとの類似度によ
    り画像の種類を判別する画像判定手段と、 を具備したことを特徴とする画像処理装置。
JP31980193A 1993-12-20 1993-12-20 画像処理装置と画像種類判定方法 Expired - Fee Related JP3253201B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31980193A JP3253201B2 (ja) 1993-12-20 1993-12-20 画像処理装置と画像種類判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31980193A JP3253201B2 (ja) 1993-12-20 1993-12-20 画像処理装置と画像種類判定方法

Publications (2)

Publication Number Publication Date
JPH07175927A true JPH07175927A (ja) 1995-07-14
JP3253201B2 JP3253201B2 (ja) 2002-02-04

Family

ID=18114347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31980193A Expired - Fee Related JP3253201B2 (ja) 1993-12-20 1993-12-20 画像処理装置と画像種類判定方法

Country Status (1)

Country Link
JP (1) JP3253201B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001076154A (ja) * 1999-08-23 2001-03-23 Xerox Corp デジタル画像のセグメント化方法及びデジタル画像処理装置
JP2002288589A (ja) * 2001-03-26 2002-10-04 Ricoh Co Ltd 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
CN111508017A (zh) * 2020-04-08 2020-08-07 中导光电设备股份有限公司 一种弱对比度定位标记中心的方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001076154A (ja) * 1999-08-23 2001-03-23 Xerox Corp デジタル画像のセグメント化方法及びデジタル画像処理装置
JP2002288589A (ja) * 2001-03-26 2002-10-04 Ricoh Co Ltd 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
CN111508017A (zh) * 2020-04-08 2020-08-07 中导光电设备股份有限公司 一种弱对比度定位标记中心的方法和系统
CN111508017B (zh) * 2020-04-08 2023-11-03 中导光电设备股份有限公司 一种弱对比度定位标记中心的方法和系统

Also Published As

Publication number Publication date
JP3253201B2 (ja) 2002-02-04

Similar Documents

Publication Publication Date Title
US5778092A (en) Method and apparatus for compressing color or gray scale documents
JP3748172B2 (ja) 画像処理装置
US7298900B2 (en) Image processing method, image processing apparatus and image processing program
JPH11338976A (ja) 文書画像認識装置、その方法、及び記録媒体
JP2001109844A (ja) 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JP2000181992A (ja) カラー文書画像認識装置
JP2001014421A (ja) バーコード読み取り装置
JPH10198755A (ja) バーコード読み取り装置
JP4582200B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP4928325B2 (ja) 画像処理方法、画像処理装置、プログラムおよび記憶媒体
JP3253201B2 (ja) 画像処理装置と画像種類判定方法
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH11353317A (ja) 図面ファイリング装置、図面識別コード判別装置、図面ファイリングシステム、図面ファイリング方法及び図面識別コード判別方法
JP2002150213A (ja) バーコード読み取り装置
JP3957471B2 (ja) 分離文字列統合装置
JPH08237404A (ja) 光学文字認識モードの選択方法
JPH06150059A (ja) 像域分離装置
JPH05342340A (ja) 画像処理方法及びその装置
JP2708604B2 (ja) 文字認識方法
JPH04316180A (ja) 文書画像の属性判別方法
JP2697085B2 (ja) 画信号処理装置
JP2005208979A (ja) 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置
JPH0535870A (ja) 多値化データを用いた輪郭点抽出法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071122

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121122

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131122

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees