JPS6286465A - 文書画像の領域分割方式 - Google Patents
文書画像の領域分割方式Info
- Publication number
- JPS6286465A JPS6286465A JP60226721A JP22672185A JPS6286465A JP S6286465 A JPS6286465 A JP S6286465A JP 60226721 A JP60226721 A JP 60226721A JP 22672185 A JP22672185 A JP 22672185A JP S6286465 A JPS6286465 A JP S6286465A
- Authority
- JP
- Japan
- Prior art keywords
- area
- rectangle
- rectangles
- character
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は文書を画像として入力し、蓄積する装置に係り
、特に入力された文書画像を文字領域。
、特に入力された文書画像を文字領域。
図形領域、写真領域等に分割する文書画像の領域分割方
式に関する。
式に関する。
従来の文書画像の領域分割方式としては、例えば、文書
画像を縦横方向に投影してヒストグラムを作成し、ヒス
トグラムの極端に変化する場所を判定することにより9
文字列を抽出する方式(秋田、増田: [書式指定情報
によらない紙面構成要素抽出法」電子通信学会論文誌’
83 / 1 v o 1 。
画像を縦横方向に投影してヒストグラムを作成し、ヒス
トグラムの極端に変化する場所を判定することにより9
文字列を抽出する方式(秋田、増田: [書式指定情報
によらない紙面構成要素抽出法」電子通信学会論文誌’
83 / 1 v o 1 。
J66−D、Nα1.第111頁〜第118頁)や、文
書画像の2次元フーリエ変換を用いる方式(星野: 「
印刷文書画像の領域切り分は方法」、特開昭59−55
581号公報)、文書画像中に現われる白ラン、黒ラン
の特徴に着目して領域を分割する方法(村尾、坂井:
「文書画像における構造情報の抽出」、情報処理学会第
21回全国大会予稿集、7H−1,第857頁〜第85
8頁)がある。
書画像の2次元フーリエ変換を用いる方式(星野: 「
印刷文書画像の領域切り分は方法」、特開昭59−55
581号公報)、文書画像中に現われる白ラン、黒ラン
の特徴に着目して領域を分割する方法(村尾、坂井:
「文書画像における構造情報の抽出」、情報処理学会第
21回全国大会予稿集、7H−1,第857頁〜第85
8頁)がある。
文書画像の縦横方向の投影や2次元フーリエ変換を用い
る方式は、画像の大局的情報に基づいており、文書の広
い部分にわたって文字が存在する場合には効率よく判定
9分割を行うことができるが、文字部分が小さい場合に
は困難となる。また、大局的情報を処理するため、全画
像を記憶できるメモリが必要であり、処理量も大きくな
る。
る方式は、画像の大局的情報に基づいており、文書の広
い部分にわたって文字が存在する場合には効率よく判定
9分割を行うことができるが、文字部分が小さい場合に
は困難となる。また、大局的情報を処理するため、全画
像を記憶できるメモリが必要であり、処理量も大きくな
る。
文書画像中の白ラン、黒ランの情徴に着目する方法も、
ランを処理対象とするため、データ処理量が大きくなる
という問題点がある。
ランを処理対象とするため、データ処理量が大きくなる
という問題点がある。
本発明の目的は、大きな画像メモリを必要とせず、処理
効率の良い文書画像の領域分割方式を提供することにあ
る。
効率の良い文書画像の領域分割方式を提供することにあ
る。
上記目的を達成するために、本発明による文書画像の領
域分割方式は、文字領域と図形または写真領域とを含む
文書画像中の連結成分に着目して各連結成分に外接する
矩形を抽出するステップと、上記各外接矩形の隣接関係
から縦書若しくは横書き文字列を構成する文字外接矩形
の平均サイズを求めるステップと、」二記平均サイズを
基準に文字領域と、文字以外の図形または写真領域とを
区別するステップとを含むことを特徴とする。
域分割方式は、文字領域と図形または写真領域とを含む
文書画像中の連結成分に着目して各連結成分に外接する
矩形を抽出するステップと、上記各外接矩形の隣接関係
から縦書若しくは横書き文字列を構成する文字外接矩形
の平均サイズを求めるステップと、」二記平均サイズを
基準に文字領域と、文字以外の図形または写真領域とを
区別するステップとを含むことを特徴とする。
上記本発明の方式は、文書画像における連結成分の外接
矩形が備える次のような性質を利用している。すなわち
、文書中に用いられる文字は一般に縦書き若しくは横書
きの文字列を構成しており、(1)横書文字列の場合は
、高さの類似する矩形が横方向に近接して並ぶ。
矩形が備える次のような性質を利用している。すなわち
、文書中に用いられる文字は一般に縦書き若しくは横書
きの文字列を構成しており、(1)横書文字列の場合は
、高さの類似する矩形が横方向に近接して並ぶ。
(2)縦書文列の場合は、幅の類似する矩形が縦方向に
近接して並ぶ。
近接して並ぶ。
(3)図形領域や写真領域における連結成分の外接矩形
は、文字を構成する連結成分の外接矩形よりも、高さ2
幅がかなり大きく、また、大きさや位置に規則性が類似
性がない。
は、文字を構成する連結成分の外接矩形よりも、高さ2
幅がかなり大きく、また、大きさや位置に規則性が類似
性がない。
(4)文字を構成する連結成分の数は、図形領域や写真
領域を構成する連結成分の数よりも多い。
領域を構成する連結成分の数よりも多い。
従ってこらにの性質を利用すると、例えば、第1図に示
すような手順により、文書画像中の文字部とそれ以外の
領域を、分割することができる。
すような手順により、文書画像中の文字部とそれ以外の
領域を、分割することができる。
即ち、入力された文書画像から連結成分の外接矩形を抽
出する(処理100)。次に、抽出された外矩形の情報
を用いて縦書/横書の判定を行う(処理200)。この
判定は、前記(1)、(2)の性質に着目し、以下に述
べる方法で行う。先ず、縦書を仮定した場合と横書を仮
定した場合のそれぞれについて、文字列を構成すると思
われる互いに隣接する矩形間の距離を画像全体に対して
求め、その平均をとる。この平均値の低い方の仮定が正
しい判定する。縦書/横書判定と同時に、文字の平均高
さ1幅の推定を行う(処理300)。これは、文字列を
構成すると判定された各矩形の高さおよび幅の画像全体
の平均を求めることにより行う。このようにして求まっ
た文字部分の高さ、幅の推定値を基準にし、それにより
も明らかに大きい値の(高さ、幅を持つ矩形を図形領域
および写真を構成するものと仮定し、近隣するものがあ
れば統合して、「図形、写真領域」として抽出する(処
理400)。抽出された「図形、写真領域」について、
原画像を調べ、「図形領域」と「写真領域」を分離する
(処理500)。この場合、図形は白地部分が多く、写
真は黒地部分が多いという一般的性質に着目し、例えば
、各領域内での白黒画素比を求めることにより上記いず
れの領域かを判断する。ここで、白黒画素比を判定の基
準とする場合には、連結成分の外接矩形抽出時に、その
矩形内の白黒画素比を同時に求めておけば、原画像を求
めておけば、原画像を調べることなく、「図形領域」
「写真領域」の分離が可能である。
出する(処理100)。次に、抽出された外矩形の情報
を用いて縦書/横書の判定を行う(処理200)。この
判定は、前記(1)、(2)の性質に着目し、以下に述
べる方法で行う。先ず、縦書を仮定した場合と横書を仮
定した場合のそれぞれについて、文字列を構成すると思
われる互いに隣接する矩形間の距離を画像全体に対して
求め、その平均をとる。この平均値の低い方の仮定が正
しい判定する。縦書/横書判定と同時に、文字の平均高
さ1幅の推定を行う(処理300)。これは、文字列を
構成すると判定された各矩形の高さおよび幅の画像全体
の平均を求めることにより行う。このようにして求まっ
た文字部分の高さ、幅の推定値を基準にし、それにより
も明らかに大きい値の(高さ、幅を持つ矩形を図形領域
および写真を構成するものと仮定し、近隣するものがあ
れば統合して、「図形、写真領域」として抽出する(処
理400)。抽出された「図形、写真領域」について、
原画像を調べ、「図形領域」と「写真領域」を分離する
(処理500)。この場合、図形は白地部分が多く、写
真は黒地部分が多いという一般的性質に着目し、例えば
、各領域内での白黒画素比を求めることにより上記いず
れの領域かを判断する。ここで、白黒画素比を判定の基
準とする場合には、連結成分の外接矩形抽出時に、その
矩形内の白黒画素比を同時に求めておけば、原画像を求
めておけば、原画像を調べることなく、「図形領域」
「写真領域」の分離が可能である。
最後に、文字を構成すると判定された矩形について、縦
書の場合は縦方向、横書の場合は横方向に統合して文字
列を抽出し、各文字列を統合して文字領域を抽出する(
処理600)。
書の場合は縦方向、横書の場合は横方向に統合して文字
列を抽出し、各文字列を統合して文字領域を抽出する(
処理600)。
以下、本発明の詳細な説明する。
第2図は、本発明による領域分割方式の概要説明図であ
る。処理対象となる文書は、入力文書画像データ10と
して、スキャナ等の画像入力装置に入力される。連結成
分外接矩形抽出部11は、入力文書画像データ10から
、連結成分の外接矩形を抽出し、その結果を外接矩形情
報テーブル12に書き込む。この処理は例えば、「ディ
ジタル画像処理J (Rosnfeld、kak著、
長尾真監訳、近代科学社、第353頁〜第361頁)等
で公知の手法を採用できる。矩形情報の表し方には種々
の形式があるが、例えば、縦方向、横方向の最大値。
る。処理対象となる文書は、入力文書画像データ10と
して、スキャナ等の画像入力装置に入力される。連結成
分外接矩形抽出部11は、入力文書画像データ10から
、連結成分の外接矩形を抽出し、その結果を外接矩形情
報テーブル12に書き込む。この処理は例えば、「ディ
ジタル画像処理J (Rosnfeld、kak著、
長尾真監訳、近代科学社、第353頁〜第361頁)等
で公知の手法を採用できる。矩形情報の表し方には種々
の形式があるが、例えば、縦方向、横方向の最大値。
最小値を用いる。131は領域分割処理部であり、〔処
理601):処理200の判定結果が縦書の時、処理6
02を実行し、横書の時、処理604を実行する。
理601):処理200の判定結果が縦書の時、処理6
02を実行し、横書の時、処理604を実行する。
[処理602]:第8図において、r文字」。
「横軸文字」、「縦書文字」と判定される矩形を文字構
成要素とし、これらの中で互いに方向接続条件を満たす
矩形のグループを求める。冬グループの全ての矩形に外
接する矩形を求め、「文字列」とする。
成要素とし、これらの中で互いに方向接続条件を満たす
矩形のグループを求める。冬グループの全ての矩形に外
接する矩形を求め、「文字列」とする。
〔処理603):処理604で求められた「文字列」を
表わす矩形について、横方向で隣接する2つの矩形が次
の条件を満たす時、文字領域として統合可能とする。
表わす矩形について、横方向で隣接する2つの矩形が次
の条件を満たす時、文字領域として統合可能とする。
隣接する2つの矩形をi+ −1(11がiの右隣)と
し、そのX座標、y座標の最大値、最小値を、Xm1n
l、 XmaXI93’+++1nl、 ymaX
l、 !、+m1nJyX maxJ t :l’
m1nd l y lla!Jとすると、(j)
縦方向位置で、重なり合う部分がある。
し、そのX座標、y座標の最大値、最小値を、Xm1n
l、 XmaXI93’+++1nl、 ymaX
l、 !、+m1nJyX maxJ t :l’
m1nd l y lla!Jとすると、(j)
縦方向位置で、重なり合う部分がある。
wax(y+++tnt+ V□nJ)〈++n(’/
maXI ’/ Il+aXj)・・・(14) (5)横方向距離が、2つの矩形の幅の平均のγ1倍以
下である。
maXI ’/ Il+aXj)・・・(14) (5)横方向距離が、2つの矩形の幅の平均のγ1倍以
下である。
xmsna −x+maxt<γI X (0’@ax
t Xmtnt) +(XmaxJ−xmtnz)
) / 2・・・(15) 但し、γ1は、文字列の幅に対する文字列間距離の大き
さの比を示すパラメータで、通常の印刷文書の場合、1
〜2である。
t Xmtnt) +(XmaxJ−xmtnz)
) / 2・・・(15) 但し、γ1は、文字列の幅に対する文字列間距離の大き
さの比を示すパラメータで、通常の印刷文書の場合、1
〜2である。
全ての文字列を示す矩形に対して、上記条件(i)、(
j)を互いに満たす矩形のグループを求め、各グループ
で全矩形に外接する矩形を、「文字領域」として抽出す
る。
j)を互いに満たす矩形のグループを求め、各グループ
で全矩形に外接する矩形を、「文字領域」として抽出す
る。
〔処理604):処理602と同様にして、文字構成要
素のうち、互いに横方向接続条件を満たす矩形のグルー
プを求め、各グループで、全ての矩形に外接する矩形を
求め、「文字列」とする。
素のうち、互いに横方向接続条件を満たす矩形のグルー
プを求め、各グループで、全ての矩形に外接する矩形を
求め、「文字列」とする。
〔処理605):処理604で求められたr文字列」を
表わす矩形について、縦方向で隣接する2つの矩形が次
の条件を満す時、文字領域として統合可能とする。隣接
する2つの矩形をII j Fがjの下降)とすると、 (iii) 横方向位置で、重なり合う部分がある。
表わす矩形について、縦方向で隣接する2つの矩形が次
の条件を満す時、文字領域として統合可能とする。隣接
する2つの矩形をII j Fがjの下降)とすると、 (iii) 横方向位置で、重なり合う部分がある。
+++ax(X++uni 、 xmtna)〈ll
tn(xmaxt XmaxJ) ”’ (
15)(tv ) 縦方向距離が、2つの矩形の高さ
の平均の72倍以下である。
tn(xmaxt XmaxJ) ”’ (
15)(tv ) 縦方向距離が、2つの矩形の高さ
の平均の72倍以下である。
3/ m1n−y maxt < γ2X ((3/
+aaxi Vmlni) +(’/maxa
3/m+nj) ) / 2・・・(16) 但し、γ2は、文字列の高さに対する文字列間距離の大
きさの比を示すパラメータで、通常の印刷文書の場合1
〜2である。
+aaxi Vmlni) +(’/maxa
3/m+nj) ) / 2・・・(16) 但し、γ2は、文字列の高さに対する文字列間距離の大
きさの比を示すパラメータで、通常の印刷文書の場合1
〜2である。
全ての文字列を示す矩形に対して、上記条件(iii)
(tv)を互いに満たす矩形のグループを求め、各グル
ープで、全矩形に外接する矩形を「文字領域」として抽
出する。
(tv)を互いに満たす矩形のグループを求め、各グル
ープで、全矩形に外接する矩形を「文字領域」として抽
出する。
本発明によ41.ば、以下の効果がある。
(1)連結成分のり■接矩形を処理の基本単位としてい
るため、画素やランを基本単位とする処理に比べ、効率
良く文書画像を「文字領域」 「図形領域」「写真領域
」に分割することができる。
るため、画素やランを基本単位とする処理に比べ、効率
良く文書画像を「文字領域」 「図形領域」「写真領域
」に分割することができる。
(2)「図形領域」と「写真領域」の分離以外は。
連結成分の外接矩形情報だけを用いて処理を行っている
。連結成分の外接矩形の抽出はラインメモリがあれば実
行できるたる、「図形領域」と「写真領域」の分離以外
は、ラインメモリだけで実現できる。また、「図形領域
)と「写真領域」の分離も、分離を行う際の特徴量とし
て白黒画素比など、外接矩形抽出時に同時に求めること
のできるのものを用いれば、全処理を、画像全体を記憶
するメモリを用いることなく、ラインメモリのみで実現
することができる。
。連結成分の外接矩形の抽出はラインメモリがあれば実
行できるたる、「図形領域」と「写真領域」の分離以外
は、ラインメモリだけで実現できる。また、「図形領域
)と「写真領域」の分離も、分離を行う際の特徴量とし
て白黒画素比など、外接矩形抽出時に同時に求めること
のできるのものを用いれば、全処理を、画像全体を記憶
するメモリを用いることなく、ラインメモリのみで実現
することができる。
第1図は本発明による領域分割処理の手順を示す全体フ
ロー図、第2図は本発明による領域分割方式の説明図、
第3図は上記領域分割をするためのバードウエフの構成
の1例を示す図、第4図および第5図はそれぞれ横方向
、縦方向の介接条件に関する説明図、第6−1図、第6
−2図、第7図、第9図はそれぞれ第1図の詳細フロー
図、第つからなければ、処理207を実行する。 〔処理205):着目している矩形と見つかった矩形間
の距離dhを求める。着目している矩形のX座標最大値
を、Xmaxi、見つかった矩形のX座標最小値をX+
m1XJとすると、 d h = x m1nd x max+
−(7)dhは負の値を許す
。 〔処理206):横方向で隣接する矩形の組の数Cou
ntHと、矩形間距離の和distHを更新する。また
、着目している矩形の幅Wと高さhで、幅の和νsum
)l、高さの和hsumHを更新する。 〔処理207):横方向と同様に、縦方向隣接条件を満
し、下側で、もつとも近接する矩形を求める。 [処理20B]:縦方向隣接条件を執す矩形が見つかれ
ば処理209を実行し、見つからなければ処理302を
実行する。 〔処理209] :着目している矩形と見つかった矩
形間の短離duを求める。着目している矩形のy差標最
大値を、’l manl、見つかった矩形のy差標最小
値を3’mi。とすると、 d v=’fmsra−y+max+
”’ (8)dvは負の値を許す。 〔処理2103:縦方向で隣接する矩形の組の数Cou
ntVと、矩形間距離の和distVを更新する。また
、着目している矩形の幅Wと高さhで、幅の和wsum
V、高さの和hsumVを更新する。 〔処理211):横方向で隣接する矩形間距離の平均a
vrdHと、縦方向で隣接する矩形間距離の平均avr
dVを求める。 〔処理21.2 ) : avrd)I−avrdV
の値が一εより小さい時、横書と判定、εより大きい時
、縦書と判定する。−ε以上かっε以下の時は、判定不
能とする。ここでEは非負の定数で1判定不能の範囲を
決めるパラメータである。E=0の場合は、avrdH
= avrdVの時のみ、判定不能となる。 〔処理300):処理200の結果に基づき文字の高さ
と幅を推定する。 第7図は、処理300の文字高さ、幅推定の詳細に流れ
を示す図である。 (工2) 〔処理301):処理200での判定結果が縦書の時、
処理302.処理308を、実行し、横書の時、処理3
04.処理305を実行する。 〔処理302)、(処理303] :処理200で縦方
向文字列を構成すると判定された矩形の高さの平均av
rHと幅の平均avrWを求め、推定値とする。 avrH= hsumV / countV
0°“(9)avrW=vsumV/count
V −(10)〔処理304)、[処理
305] :処理200で、横方向文字列を構成する
と判定された矩形の高さの平均a v r l(と幅の
平均avrWを求め、推定値とする。 avrH=hsumH/ countl(−(11)a
vrW=wsumV/countH−(12)〔処理4
00) 処理300で求まった文字の高さ、幅の推定値により、
「図形、写真領域」を抽出する。第8図は、抽出の閾値
を示す図である。ここで、st。 sz、tt、tzはパラメータであり、O<81<1<
s x 、 O< t 1 < 1. < t x。 幅が、(S2) X (aura)より大きいか、高さ
く13) が(tz ) X (aura)より大きい矩形を図形
および写真領域構成要素とし、互いに重なり合う矩形が
あれば、それらに外接する矩形で統合し、「図形、写真
領域」とする。 〔処理500〕 処理4. OOで抽出された「図形、写真領域」におい
て、各領域内での白黒画素比rwbを求める。 領域内の白黒画素比を求めるには、一般に原画像データ
を用いなければならないが、連結成分抽出等に、黒画素
数を同時に求めておけば原画素を調べることなく、白黒
画素を求めることができる。 rwb=numtil/numB ・
+ (13)但し、numV :白画素数、numB
:黒画素数であり、rwb>uの時は、「図形領域J
、rwb<Vの時は、「写真領域」と判定する。u、v
はパラメータで、0 < u < v < ’J。 [処理600〕 処理400で文字構成要素と判定された矩形を統合して
、r文字領域」を抽出する。 第9図は、処理600の詳細フロー図である。 外接矩形情報テーブル12の情報を用いて、第1図の流
れに従って領域分割を行い、領域分割結果14を得る。 この領域分割処理においては、「図形領域」と「写真領
域」を分離するために、原画像データを用いるが、それ
以外の処理は、テーブル12に記憶された外接矩形情報
のみで行うことができる。 第3図は上記処理を行うためのハードウェア構成の1例
を示す。文書画像データは、画像入力装置24により画
像メモリ25に入力される。画像処理装置26は、画像
メモリ25の画像データから連結成分を抽出し、その外
接矩形情報をメイン・メモリ21上の外接矩形情報テー
ブル12に書き込む。領域分割処理は、この外接矩形情
報と画像データを用いて、CPU20が実行する。領域
分割の結果は、画像データと共に画像ファイル27に記
憶される。また、領域分割の結果を、領域の種類ごとに
、異なるパターンでディスプレイ22に表示したり、プ
リンタ等の画像出力装置23かに出力することや、原画
像を領域別に表示、出力することができる。CCPU2
0は、上述した各要素の動作制御も行う。この例では、
高速処理を目的に専用の画像処理装置26を用いたが、
CPU20のプログラム処理により、連結成分の外接矩
形抽出を行う場合は、画像処理装置26は省略すること
ができる。 次に、第1−図に示す処理の詳細について説明する。先
ず、横方向、縦方向隣接条件を第4図に示す矩形−1−
yJにおいて、次のように定義する。 〔横方向隣接条件〕 (1)横方向について、一方が他方を包含する様な関係
にない。 (Xm1nI Xm1□J)X(xmaxi X+
ma□)〉0 ・・・(1)(2)双方の重心の縦方
向位置(y座標)が、2つの矩形の縦方向の重なりの間
にある。 (3)高さが類似している。 1/α< h i/ h J <α (α〉1)αは、
高さ比の範囲を示すパラメータ。 ・・・(3)〔縦
方向隣接条件〕 第5図に示す矩形に、Qにおいて、 (1)縦方向について、一方が他方を包含する様な関係
にない。 (xminh x+mtnk)X(xmaxkxma
xt)>O・= (4)(2)双方の重心の横方向位置
(Xm標)が、2つの矩形の横方向の重なりの間にある
。 maX(y+m1nkt ymtnt)<(gyh+
gyt)<mtn(ymaxh ymaxt)gyk
=(3/+5axh Vma□)/2gyt=(ym
axx y*axk)/ 2 ”’ (5
)(3)幅が類似している。 〔処理の100〕 画像のデータより連結成分の外接矩形を抽出し、その情
報を外接矩形情報テーブルに書き込む。 〔処理200〕 抽出した連結成分の外接矩形情報より、以下の如く文書
画像の縦書横書を判定する。 第6−1.6−2図は、処理200の縦書横書判定の詳
細な流れを示す図である。以下の説明では、連結成分の
外接矩形を矩形と略す。 (処理201):変数の初期化を行う。CountH。 distHは、横方向隣接条件を満し、もつとも近い距
離にある矩形の組の数とその矩形間距離の和、hsum
l(、wsumHはそれらの矩形の幅と高さの和である
。同様に、CountV、distV、 hsumV、
wsumVは、縦方向のそれである。 〔処理202):処理100で求めた矩形、全てについ
て、処理203〜処理21.0を繰り返す。 繰り返し終了時には、処理211を実行する。 [処理203]:着目している矩形に対して、横方向隣
接条件を満し右側でもつとも近接する矩形を求める。右
隣りを求めるのは、矩形の組が重複して処理されるのを
防ぐ手段であり、左隣りを求めても、また重複を考慮し
て両隣りを求めても良す島。 〔処理204):処理203で横方向隣接条件を満す矩
形が見つかれば、処理205を実行し、見8図は矩形の
高さおよび幅による領域の分類を示す図である。 10・・・入力文書画像データ、11・・・連結成分外
接矩形抽出部、12・・・連結成分外接矩形情報テーブ
ル、13・・・領域分割処理部、1−4・・・領域分割
結果、20・・・CPU、21・・・メインメモリ、2
2・・・ディプレイ、23・・・画像出力装置、24・
・・画像入力装置、25・・・画像メモリ、26・・・
画像処理装置、27・・・画像ファイル。
ロー図、第2図は本発明による領域分割方式の説明図、
第3図は上記領域分割をするためのバードウエフの構成
の1例を示す図、第4図および第5図はそれぞれ横方向
、縦方向の介接条件に関する説明図、第6−1図、第6
−2図、第7図、第9図はそれぞれ第1図の詳細フロー
図、第つからなければ、処理207を実行する。 〔処理205):着目している矩形と見つかった矩形間
の距離dhを求める。着目している矩形のX座標最大値
を、Xmaxi、見つかった矩形のX座標最小値をX+
m1XJとすると、 d h = x m1nd x max+
−(7)dhは負の値を許す
。 〔処理206):横方向で隣接する矩形の組の数Cou
ntHと、矩形間距離の和distHを更新する。また
、着目している矩形の幅Wと高さhで、幅の和νsum
)l、高さの和hsumHを更新する。 〔処理207):横方向と同様に、縦方向隣接条件を満
し、下側で、もつとも近接する矩形を求める。 [処理20B]:縦方向隣接条件を執す矩形が見つかれ
ば処理209を実行し、見つからなければ処理302を
実行する。 〔処理209] :着目している矩形と見つかった矩
形間の短離duを求める。着目している矩形のy差標最
大値を、’l manl、見つかった矩形のy差標最小
値を3’mi。とすると、 d v=’fmsra−y+max+
”’ (8)dvは負の値を許す。 〔処理2103:縦方向で隣接する矩形の組の数Cou
ntVと、矩形間距離の和distVを更新する。また
、着目している矩形の幅Wと高さhで、幅の和wsum
V、高さの和hsumVを更新する。 〔処理211):横方向で隣接する矩形間距離の平均a
vrdHと、縦方向で隣接する矩形間距離の平均avr
dVを求める。 〔処理21.2 ) : avrd)I−avrdV
の値が一εより小さい時、横書と判定、εより大きい時
、縦書と判定する。−ε以上かっε以下の時は、判定不
能とする。ここでEは非負の定数で1判定不能の範囲を
決めるパラメータである。E=0の場合は、avrdH
= avrdVの時のみ、判定不能となる。 〔処理300):処理200の結果に基づき文字の高さ
と幅を推定する。 第7図は、処理300の文字高さ、幅推定の詳細に流れ
を示す図である。 (工2) 〔処理301):処理200での判定結果が縦書の時、
処理302.処理308を、実行し、横書の時、処理3
04.処理305を実行する。 〔処理302)、(処理303] :処理200で縦方
向文字列を構成すると判定された矩形の高さの平均av
rHと幅の平均avrWを求め、推定値とする。 avrH= hsumV / countV
0°“(9)avrW=vsumV/count
V −(10)〔処理304)、[処理
305] :処理200で、横方向文字列を構成する
と判定された矩形の高さの平均a v r l(と幅の
平均avrWを求め、推定値とする。 avrH=hsumH/ countl(−(11)a
vrW=wsumV/countH−(12)〔処理4
00) 処理300で求まった文字の高さ、幅の推定値により、
「図形、写真領域」を抽出する。第8図は、抽出の閾値
を示す図である。ここで、st。 sz、tt、tzはパラメータであり、O<81<1<
s x 、 O< t 1 < 1. < t x。 幅が、(S2) X (aura)より大きいか、高さ
く13) が(tz ) X (aura)より大きい矩形を図形
および写真領域構成要素とし、互いに重なり合う矩形が
あれば、それらに外接する矩形で統合し、「図形、写真
領域」とする。 〔処理500〕 処理4. OOで抽出された「図形、写真領域」におい
て、各領域内での白黒画素比rwbを求める。 領域内の白黒画素比を求めるには、一般に原画像データ
を用いなければならないが、連結成分抽出等に、黒画素
数を同時に求めておけば原画素を調べることなく、白黒
画素を求めることができる。 rwb=numtil/numB ・
+ (13)但し、numV :白画素数、numB
:黒画素数であり、rwb>uの時は、「図形領域J
、rwb<Vの時は、「写真領域」と判定する。u、v
はパラメータで、0 < u < v < ’J。 [処理600〕 処理400で文字構成要素と判定された矩形を統合して
、r文字領域」を抽出する。 第9図は、処理600の詳細フロー図である。 外接矩形情報テーブル12の情報を用いて、第1図の流
れに従って領域分割を行い、領域分割結果14を得る。 この領域分割処理においては、「図形領域」と「写真領
域」を分離するために、原画像データを用いるが、それ
以外の処理は、テーブル12に記憶された外接矩形情報
のみで行うことができる。 第3図は上記処理を行うためのハードウェア構成の1例
を示す。文書画像データは、画像入力装置24により画
像メモリ25に入力される。画像処理装置26は、画像
メモリ25の画像データから連結成分を抽出し、その外
接矩形情報をメイン・メモリ21上の外接矩形情報テー
ブル12に書き込む。領域分割処理は、この外接矩形情
報と画像データを用いて、CPU20が実行する。領域
分割の結果は、画像データと共に画像ファイル27に記
憶される。また、領域分割の結果を、領域の種類ごとに
、異なるパターンでディスプレイ22に表示したり、プ
リンタ等の画像出力装置23かに出力することや、原画
像を領域別に表示、出力することができる。CCPU2
0は、上述した各要素の動作制御も行う。この例では、
高速処理を目的に専用の画像処理装置26を用いたが、
CPU20のプログラム処理により、連結成分の外接矩
形抽出を行う場合は、画像処理装置26は省略すること
ができる。 次に、第1−図に示す処理の詳細について説明する。先
ず、横方向、縦方向隣接条件を第4図に示す矩形−1−
yJにおいて、次のように定義する。 〔横方向隣接条件〕 (1)横方向について、一方が他方を包含する様な関係
にない。 (Xm1nI Xm1□J)X(xmaxi X+
ma□)〉0 ・・・(1)(2)双方の重心の縦方
向位置(y座標)が、2つの矩形の縦方向の重なりの間
にある。 (3)高さが類似している。 1/α< h i/ h J <α (α〉1)αは、
高さ比の範囲を示すパラメータ。 ・・・(3)〔縦
方向隣接条件〕 第5図に示す矩形に、Qにおいて、 (1)縦方向について、一方が他方を包含する様な関係
にない。 (xminh x+mtnk)X(xmaxkxma
xt)>O・= (4)(2)双方の重心の横方向位置
(Xm標)が、2つの矩形の横方向の重なりの間にある
。 maX(y+m1nkt ymtnt)<(gyh+
gyt)<mtn(ymaxh ymaxt)gyk
=(3/+5axh Vma□)/2gyt=(ym
axx y*axk)/ 2 ”’ (5
)(3)幅が類似している。 〔処理の100〕 画像のデータより連結成分の外接矩形を抽出し、その情
報を外接矩形情報テーブルに書き込む。 〔処理200〕 抽出した連結成分の外接矩形情報より、以下の如く文書
画像の縦書横書を判定する。 第6−1.6−2図は、処理200の縦書横書判定の詳
細な流れを示す図である。以下の説明では、連結成分の
外接矩形を矩形と略す。 (処理201):変数の初期化を行う。CountH。 distHは、横方向隣接条件を満し、もつとも近い距
離にある矩形の組の数とその矩形間距離の和、hsum
l(、wsumHはそれらの矩形の幅と高さの和である
。同様に、CountV、distV、 hsumV、
wsumVは、縦方向のそれである。 〔処理202):処理100で求めた矩形、全てについ
て、処理203〜処理21.0を繰り返す。 繰り返し終了時には、処理211を実行する。 [処理203]:着目している矩形に対して、横方向隣
接条件を満し右側でもつとも近接する矩形を求める。右
隣りを求めるのは、矩形の組が重複して処理されるのを
防ぐ手段であり、左隣りを求めても、また重複を考慮し
て両隣りを求めても良す島。 〔処理204):処理203で横方向隣接条件を満す矩
形が見つかれば、処理205を実行し、見8図は矩形の
高さおよび幅による領域の分類を示す図である。 10・・・入力文書画像データ、11・・・連結成分外
接矩形抽出部、12・・・連結成分外接矩形情報テーブ
ル、13・・・領域分割処理部、1−4・・・領域分割
結果、20・・・CPU、21・・・メインメモリ、2
2・・・ディプレイ、23・・・画像出力装置、24・
・・画像入力装置、25・・・画像メモリ、26・・・
画像処理装置、27・・・画像ファイル。
Claims (1)
- 文字領域と図形または写真領域とを含む文書画像中の連
結成分に着目して各連結成分に外接する矩形を抽出する
ステップと、上記各外接矩形の隣接関係から縦書若しく
は横書き文字列を構成する文字外接矩形の平なサイズを
求めるステップと、上記平均サイズを基準に文字領域と
、文字以外の図形または写真領域とを区別するステップ
とを含むことを特徴とする文書画像の領域分割方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60226721A JPS6286465A (ja) | 1985-10-14 | 1985-10-14 | 文書画像の領域分割方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60226721A JPS6286465A (ja) | 1985-10-14 | 1985-10-14 | 文書画像の領域分割方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6286465A true JPS6286465A (ja) | 1987-04-20 |
Family
ID=16849584
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60226721A Pending JPS6286465A (ja) | 1985-10-14 | 1985-10-14 | 文書画像の領域分割方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6286465A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005316946A (ja) * | 2004-03-31 | 2005-11-10 | Seiko Epson Corp | レイアウトルール生成システム、レイアウトシステム、レイアウトルール生成プログラム、レイアウトプログラムおよび記憶媒体、並びにレイアウトルール生成方法およびレイアウト方法 |
-
1985
- 1985-10-14 JP JP60226721A patent/JPS6286465A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005316946A (ja) * | 2004-03-31 | 2005-11-10 | Seiko Epson Corp | レイアウトルール生成システム、レイアウトシステム、レイアウトルール生成プログラム、レイアウトプログラムおよび記憶媒体、並びにレイアウトルール生成方法およびレイアウト方法 |
| US7844896B2 (en) | 2004-03-31 | 2010-11-30 | Seiko Epson Corporation | Layout-rule generation system, layout system, layout-rule generation program, layout program, storage medium, method of generating layout rule, and method of layout |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111507251B (zh) | 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质 | |
| CN113486828B (zh) | 图像处理方法、装置、设备和存储介质 | |
| US7170647B2 (en) | Document processing apparatus and method | |
| US8693790B2 (en) | Form template definition method and form template definition apparatus | |
| JP3338537B2 (ja) | 画像傾き検出装置 | |
| JP3950777B2 (ja) | 画像処理方法、画像処理装置および画像処理プログラム | |
| CN112825141B (zh) | 识别文本的方法、装置、识别设备和存储介质 | |
| US20080144971A1 (en) | Model-based dewarping method and apparatus | |
| CN106846339A (zh) | 一种图像检测方法和装置 | |
| US20210133437A1 (en) | System and method for capturing and interpreting images into triple diagrams | |
| RU2626656C2 (ru) | Способ и система определения ориентации изображения текста | |
| US10049476B1 (en) | System and method of creating an editable text and images from a captured image of a hand-drawn and/or static two-dimensional diagram | |
| JPS6286465A (ja) | 文書画像の領域分割方式 | |
| JPH03126181A (ja) | 文書画像の領域分割方法 | |
| JPS62197881A (ja) | 文書画像縦書・横書判定方式 | |
| JP3095470B2 (ja) | 文字認識装置 | |
| JPH02253383A (ja) | 画像処理装置 | |
| JPH10222688A (ja) | 画像処理方法 | |
| JP4587167B2 (ja) | 画像処理装置及び画像処理方法 | |
| JPS62226287A (ja) | 文書画像の領域分割方式 | |
| JP2004240500A (ja) | 画像処理装置、画像処理プログラムおよび記憶媒体 | |
| JP3074210B2 (ja) | 紙文書画像処理装置 | |
| JPH11306282A (ja) | 文字列領域抽出方法及び装置 | |
| JPS6411990B2 (ja) | ||
| JPH11242716A (ja) | 画像処理方法および記録媒体 |