JPH0490082A - 文書文字方向検出装置 - Google Patents

文書文字方向検出装置

Info

Publication number
JPH0490082A
JPH0490082A JP2203983A JP20398390A JPH0490082A JP H0490082 A JPH0490082 A JP H0490082A JP 2203983 A JP2203983 A JP 2203983A JP 20398390 A JP20398390 A JP 20398390A JP H0490082 A JPH0490082 A JP H0490082A
Authority
JP
Japan
Prior art keywords
document
run length
vertical
run
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2203983A
Other languages
English (en)
Other versions
JPH0766413B2 (ja
Inventor
Yutaka Nakamura
豊 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2203983A priority Critical patent/JPH0766413B2/ja
Priority to TW080105940A priority patent/TW206290B/zh
Priority to KR1019910013335A priority patent/KR940009712B1/ko
Publication of JPH0490082A publication Critical patent/JPH0490082A/ja
Publication of JPH0766413B2 publication Critical patent/JPH0766413B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
うに、文字のみの簡単な段組であれば周辺分布により文
字方向の判定ができた。しかし、第13図(b)に示す
ような中間調、図表を含んだ原稿、あるいは同Z (c
 )に示すような複雑な段組の原稿では周辺分布により
文字方向の判定をすることは困難であった。 本発明は、このような従来技術の問題点を解決すること
を目的とするものである。すなわち、本発明は文字のみ
の簡単な原稿のみでなく、中間調や図表の混在した原稿
、段組の複雑な原稿も正確に文書の文字方向を検出する
ことのできる文書文字方向検出装置を提供することを目
的とするものである。 rI1層を解決するための手段】 上記目的を達成するために、本発明は、第1図に示すよ
うに、2値画像において互いに関連する画素群を単位領
域として求める画素領域化手段1と、各隣接する単位領
域間の空白領域の縦方向および横方向のランレングスを
求めるランレングス検出手段2と、縦方向および横方向
のランレングスの出現頻度分布の特徴を抽出するランレ
ングス頻度分布特徴抽出手段3と、抽出された縦および
横方向のランレングスの出現頻度分布の特徴を比較して
文書の文字の方向を判定する方向判定手段4とを備えた
ものである。
【作用】
第9図は文書画像の一例であり、文書は文字、中間調、
図形等から構成されている。ここで文字に着目すると、
文字は行を構成し、横書きの場合、縦方向の文字(行)
間隔よりも横方向の文字間隔が狭い。逆に縦書きの場合
、横方向の文字(行)間隔よりも縦方向の文字間隔が狭
い特性を示す。 本発明はこの特性に着目して、文字間隔の計測を基に文
書の文字の方向を検出するものである。 画素領域化手段Iは、入力flilj像において互いJ
こ関連する画素群、例えば1文字を構成する画素群、一
つの表や図形、を構成する画素群を単位領域として検出
する。画素群から単位領域を抽出する方法としては、例
えば画素群の外接矩形を求めこれを単位領域とする外接
矩形化処理がある。第10図は画素群を単位領域化(外
接矩形化)処理した結果の一例を示すものである。 次にランレングス検出手段2により各隣接する単位領域
間の空白領域の縦方向および横方向のランレングスを求
める。 ランレングス頻度分布特徴抽出手段3は、ランレングス
検出手段2により求めたランレングスから、縦方向およ
び横方向のそれぞれにつきランレングスの出現頻度の分
布を求め、その特徴例えば頻度のピーク値を求める。 方向判定手段4は、ランレングス頻度分布特徴抽出手段
3により求めた縦横の出現頻度の特徴(ピーク値)を比
較し、入力された文書が縦書きであるか、横書きである
かを判定する。第10図および第11図に横書きおよび
縦書きの場合のそれぞれの出現頻度の分布の例を示すが
、これらの図から明らかなように横方向および縦方向の
白ランのランレングスの頻度のピーク値の大小関係は、
横書き文書の場合と縦書き文書の場合で逆になっており
、従って、方向判定手段4は上記大小関係を調べること
により判定を行なうことができるのである。 本発明によれば、文字だけの簡単な原稿のみでなく、中
間調や図表の混在した原稿、段組の複雑な原稿も正確に
文書の文字方向を検出することができる。
【実施例】
以下、本発明を図面に示す実施例により詳細に説明する
。 第2図は本発明の一実施例による文書画像処理装置の全
体構成を示すものである。この文書画像処理装置は、文
書画像をデジタル画像として走査入力するイメージスキ
ャナ21.入力画像を処理のため記憶するイメージメモ
リ22、本発明の文書の文字方向を検出する文字方向抽
出部23、装置全体を制御するCPU24、データバス
25、画像やメツセージを表示するモニター26、キー
ボード27、画像等を格納する外部記憶装置28、およ
び画像を出力するプリンタ29等からなっている。 第3図は第2図における本発明の文字方向検出部23の
構成を示す図である。 文字方向検出部23は外接矩形処理部30と、白ラン検
出処理部31と、頻度分布検出処理部32と、ピーク検
出処理部33と、文字方向判定部34からなっている。 外接矩形処理部30は、第1図の黒画素領域化手段1の
一例であって、2値画像において互いに関連する黒画素
群すなわち互いにつながっている複数の黒画素からなる
領域(例えば各文字の領域)を外接して囲む矩形領域(
単位領域)を生成するものである。この矩形化処理には
従来の任意の方式を用いることができるが、例えば従来
の矩形化処理方式の一例として、画像の輪郭線を追跡す
ることにより黒画素群を矩形で囲む方式がある。この方
式では、黒領域に対して黒画素の連結成分の追跡を行な
うことにより黒画素群を含む要素の最小X、Y座標、最
大X、Y座標を求めることができ、それぞれの構造を持
った黒画素群を矩形で囲むことができるものである。な
お、本発明者はこの従来の方式を改良した方式を提案し
、本出願人によって出願されている(特願平1−870
39号)。この改良された技術を本発明の矩形化処理に
利用するのが好ましい。 上記出願の矩形化処理の例を簡単に説明する。 ここでは−例として文字である「辺」という画像を例と
して説明する。 第4図に「辺」という文字を画素単位で示す。 そこでこの画像に対し゛で第5図(a)に示すマスクパ
ターンを用いて左上から右下に黒画素の連結を行う。注
目画素に対して上の画素、左の画素が共に黒画素であっ
たならば注目画素を黒画素に変換する処理を行う。この
マスク処理を行った例を第5図(b)に示す。黒画素を
右手方向に連結した画像が得られる。 次に第6図(a)に示すマスクパターンで右上から左下
に対して黒画素連結処理を行う。得られた結果を第6図
(b)に示す。先程の処理と逆に左方向に黒画素を連結
した画像が得られる。 次に第7図(a)に示すマスクパターンで左下から右上
に対して黒画素連結処理を行う。得られた結果を第7図
(b)に示す。文字全体がほぼ矩形領域で囲まれてきた
ことがわかる。 最後に第8図(a)に示すマスクパターンで右下から左
上に対して黒画素の連結処理を行う。得られた結果を第
8図(b)に示す。 このように一連の4回の処理を行うことにより文字領域
を矩形で囲むことができる。処理の説明は文字を例にし
て行ったが、この結果は図形、表、中間調に対してもあ
てはまる。第9図は横書きの文書画像の一例を示すもの
であり、第10図は第9図の画像の外接矩形処理後の画
像を示すものである。 白ラン検出処理部31は、第1図におけるランレングス
検出手段2に対応するものであり、上記のようにして得
られた画像に対して横方向、縦方向にそれぞれ走査して
白ランのランレングスを求める処理部である。ランレン
グスを求める処理は従来からある方式から任意に選択し
て利用することができる。 頻度分布検出処理部32は、白ラン検出処理部31によ
り得られた白ランのランレングスを基にその出現頻度の
分布を求めるものである。第11図は横書き文書の場合
のランの頻度分布を表したグラフであり、同図(a)は
横方向の白ランのランレングスの頻度を示し、同図(b
)は縦方向の白ランのランレングスの頻度を示す。また
、第12図は縦書き文書の場合のランの頻度分布を表し
たグラフであり、同図(a)は横方向の白ランのランレ
ングスの頻度を示し、同図(b)は縦横方向の白ランの
ランレングスの頻度を示す。これらの図かられかるよう
に、縦書き文書も横書き文書も、縦方向と横方向の白ラ
ンのランレングスの分布が異なっており、しかも縦書き
文書と横書き文書とでは白ランのランレングスの分布が
逆になっている。この分布の相違により縦書きか横書き
かを判定することができる。 本実施例では、各分布の特徴は出現頻度のピーり値を持
つ白ランのランレングスによって捉える。 ピーク検出処理部33は、頻度の比較により頻度のピー
ク値を有する白ランのランレングスを求めるものである
。上記の頻度分布検出処理部32とピーク検出処理部3
3からなる処理部は、第1図におけるランレングス頻度
分布特徴抽出手段3に対応する。 文字方向判定部34は、第1図における方向判定部4に
対応するものであり、ピーク検出処理部33で求めた横
方向および縦方向の最高頻度のランレングスを比較し、
(横方向のランレングスく縦方向のランレングス)のと
き横書きと判定し、横方向のランレングス〉縦方向のラ
ンレングス)のとき縦書きと判定するものである。 本実施例は、文字間の白ランが基本となっているので、
段組の影響は受けない。第13図(C)のような複雑な
段組で、従来の周辺分布の検出では方向の判定が不可能
であったような文書でも、容易に判定をすることができ
る。また、中間調、図表は通常の文字間隔よりも広いた
め出現頻度分布においてピーク値から外れたところに出
現頻度が位置するので、縦書き/横書きの判定に影響を
及ぼすことがない。そのため、高い精度で文書の文字方
向を検出することができる。 なお、実施例では、すべての外接矩形に対して矩形間の
白ランを求めたが、白ランを求める前処理として、ある
程度大きい矩形は処理対象から外すようにしてもよい。 この前処理を行なうことにより、中間調、図表が文字方
向判定に及ぼす影響を回避することができ、行方向検出
に有効なデータのみを集めることができるため、測定精
度も向上する。
【発明の効果】
本発明によれば、単位領域(外接矩形)を求め、その単
位領域間の空白領域(白ラン)の長さ(ランレングス)
を計測し、出現頻度分布により文字方向の判定をするの
で、文字だけの簡単な原稿のみでなく、中間調や図表の
混在した原稿、段組の複雑な原稿も正確に文書の文字方
向を検出することができる。
【図面の簡単な説明】
第1図は、本発明の基本的構成を示すブロック図である
。 第2図は、本発明の一実施例の文書画像処理装置の構成
を示す図である。 第3図は、第2図における文字方向検出部の構成を示す
図である。 第4図は、文字の画素パターンの一例を示す図である。 第5図(a)は左上から右下へマスク処理を行なう場合
のマスクおよび走査方向を示す図であり、同図(b)は
そのマスク処理の結果を示す図である。 第6図(a)は右上から左下へマスク処理を行なう場合
のマスクおよび走査方向を示す図であり、同図(b)は
そのマスク処理の結果を示す図である。 第7図(a)は左下から右上へマスク処理を行なう場合
のマスクおよび走査方向を示す図であり、同図(b)は
そのマスク処理の結果を示す図である。 第8図(a)は右下から左上へマスク処理を行なう場合
のマスクおよび走査方向を示す図であり、同図(b)は
そのマスク処理の結果を示す図である。 第9図は文書画像の一例を示す図である。 第10図は外接矩形処理後の画像を示す図である。 第11図は横書き文書の場合のランの頻度分布を示す図
であって、(a)は横方向の白ラン長の頻度分布を表す
図、(b)は縦方向の白ラン長の頻度分布を表す図であ
る。 第12図は横書き文書の場合のランの頻度分布を示す図
であって、(a)は横方向の白ラン長の頻度分布を表す
図、(b)は縦方向の白ラン長の頻度分布を表す図であ
る。 第13図は、従来の周辺分布検出による文書文字方向検
出の方式を説明するための図であって、(a)は文字の
みの簡単な段組の場合、(b)は中間調の画像を含んだ
原稿の場合、(c)は複雑な段組の原稿の場合をそれぞ
れ示している。 ■・・・画素領域化手段、2・・・ランレングス検出手
段、3・・・頻度分布特徴抽出手段、4・・・方向判定
手段。 特許出願人 富士ゼロックス株式会社 代 理 人 弁理士 岩上昇 代 理 人 弁理士 1)中隆秀 代 理 人 弁理士 小野寺洋二 第2図 第1図 第4図 (b) 第6図 第7図 (b) 第8図 (b) 第9図 第10し鋳 (b) 第13図 (a) <c>

Claims (1)

  1. 【特許請求の範囲】 2値画像において互いに関連する黒画素群を単位領域と
    して求める黒画素領域化手段と、各隣接する単位領域間
    の空白領域の縦方向および横方向のランレングスを求め
    るランレングス検出手段と、 縦方向および横方向のランレングスの出現頻度分布の特
    徴を抽出するランレングス頻度分布特徴抽出手段と、 抽出された縦および横方向のランレングスの出現頻度分
    布の特徴を比較して文書の文字の方向を判定する方向判
    定手段と を有することを特徴とする文書文字方向検出装置。
JP2203983A 1990-08-02 1990-08-02 文書文字方向検出装置 Expired - Fee Related JPH0766413B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2203983A JPH0766413B2 (ja) 1990-08-02 1990-08-02 文書文字方向検出装置
TW080105940A TW206290B (en) 1990-08-02 1991-07-30 Text character orientation detection method
KR1019910013335A KR940009712B1 (ko) 1990-08-02 1991-08-01 문서문자방향 검출장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2203983A JPH0766413B2 (ja) 1990-08-02 1990-08-02 文書文字方向検出装置

Publications (2)

Publication Number Publication Date
JPH0490082A true JPH0490082A (ja) 1992-03-24
JPH0766413B2 JPH0766413B2 (ja) 1995-07-19

Family

ID=16482852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2203983A Expired - Fee Related JPH0766413B2 (ja) 1990-08-02 1990-08-02 文書文字方向検出装置

Country Status (3)

Country Link
JP (1) JPH0766413B2 (ja)
KR (1) KR940009712B1 (ja)
TW (1) TW206290B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532303B2 (en) 1997-08-29 2003-03-11 Sharp Kabushiki Kaisha Line direction deciding device, image inclination detecting device and image inclination correcting device

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI332635B (en) 2007-01-05 2010-11-01 Compal Electronics Inc Method for determing oriention of chinese words
KR100826577B1 (ko) * 2007-02-26 2008-04-30 덕양산업 주식회사 자동차용 글로브박스의 개폐장치
US20110176154A1 (en) * 2010-01-18 2011-07-21 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532303B2 (en) 1997-08-29 2003-03-11 Sharp Kabushiki Kaisha Line direction deciding device, image inclination detecting device and image inclination correcting device

Also Published As

Publication number Publication date
KR940009712B1 (ko) 1994-10-17
KR920005021A (ko) 1992-03-28
TW206290B (en) 1993-05-21
JPH0766413B2 (ja) 1995-07-19

Similar Documents

Publication Publication Date Title
JPH05236260A (ja) 画像処理装置
JPH05227425A (ja) 自動画像セグメンテーションの改良
JP2001060247A (ja) 画像処理装置および画像処理方法
KR920001798B1 (ko) 화상처리장치
JP2004219291A (ja) 画面の線欠陥検出方法及び装置
JPH0490082A (ja) 文書文字方向検出装置
US8103098B2 (en) Method for generating a non-graphical digital image from an original digital image
JPH08237486A (ja) スキャナ/プリンタにおける文字の平滑化方法
JP3336046B2 (ja) 像域分離装置
JPH0624014B2 (ja) 濃淡画像の処理方法
JPS6359272A (ja) 画像処理装置
KR100537829B1 (ko) 스캔 영상의 상역 분리 방법
JPS60136478A (ja) 画調識別方法
JP2841942B2 (ja) 画像入力装置
JPH0546749B2 (ja)
JP2984291B2 (ja) 画像処理装置及び画像処理方法
JP2019174887A (ja) 画像処理装置
JP2777380B2 (ja) 網点領域検出方法
JP2647458B2 (ja) 網点領域分離装置
JPH06152947A (ja) 画像処理装置
JPH10143607A (ja) 画像処理装置
JPH06215186A (ja) 台紙入力装置
JPS61157156A (ja) 画像処理装置
JPS6032474A (ja) 画像処理装置
JPH0561677B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees