JPH10233930A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JPH10233930A
JPH10233930A JP9037351A JP3735197A JPH10233930A JP H10233930 A JPH10233930 A JP H10233930A JP 9037351 A JP9037351 A JP 9037351A JP 3735197 A JP3735197 A JP 3735197A JP H10233930 A JPH10233930 A JP H10233930A
Authority
JP
Japan
Prior art keywords
character
image
label
black
label image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9037351A
Other languages
English (en)
Inventor
Masaru Sugioka
賢 杉岡
Koji Ito
晃治 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9037351A priority Critical patent/JPH10233930A/ja
Publication of JPH10233930A publication Critical patent/JPH10233930A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 画像データから文字色を正しく判定し、正確
に背景のみを除去する。 【解決手段】 2値画像イメージがラベリング部30に
より、黒画素・白画素別にラベル付けされる。黒画素の
ラベリング結果が黒ラベル画像格納部40へ、白画素の
ラベリング結果が白ラベル画像格納部50へそれぞれ出
力される。文字背景判定部60では、最小矩形法と線幅
判定法によりそれぞれのラベル画像の各ラベルデータが
文字データであるか背景データであるかを判定する。文
字色判定部80では文字ラベルが付された黒ラベル画
像、白ラベル画像の全画素を計数し、画素数が多い方を
文字色と判定する。文字データ出力部90では、判定結
果が黒の場合には、黒ラベル画像格納部40から文字の
黒ラベル画像を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、2値画像イメージ
に含まれるノイズや地紋等を除去するための画像処理装
置に関する。
【0002】
【従来の技術】光学式文字読取装置やファクシミリにお
いては、CCDセンサ等を用いて文書等を光学的に読み
取り、白黒の2値に量子化された文書等の原画像イメー
ジを得る。この原画像イメージは文書等の場合、文字の
画像データ(文字データ)と文字背景部の画像データ
(背景データ)とからなる。一般に、背景データは、画
像処理の妨げとなる不要な雑音を含むことが多く、画像
処理のために背景データから雑音を除去する処理を行な
うことが多い。
【0003】また、文書の中には、新聞の見出し等に見
られるように、文字背景部に縦線、横線、斜線等の線状
模様(図2参照)が入っていたり、小さな点状模様(図
3参照)が散らばっていたりすることがある。この場
合、背景データは模様の画像データ(模様データ)を含
んでいる。このような模様データを含む原画像データの
画像処理を行なうと、画像処理の効率が悪くなったりす
る等の不都合を生じる。例えば、光学的文字読取装置に
おける文字認識処理を行なう場合に、模様データを除去
しないまま文字切り出しを行なうことは非常に困難であ
り、一般的には、背景の模様データを除去する処理を行
なってから文字切り出しを行なっている。
【0004】新聞等の見出し等においては、図2(b)
に示すように、文字線が白画像で構成されている(白文
字)画像が多々ある。黒文字画像と白文字画像とが共に
入力される可能性がある場合は、背景データ除去に先立
ち、文字線の色を判定する必要がある。
【0005】従来では、まず文字色を判定するために、
背景模様が黒っぽい場合は白文字であり、背景模様が白
っぽい場合は黒文字であるという性質を利用し、見出し
の周辺部黒画素密度を求め、黒画素密度が高いときは白
文字、低いときは黒文字と判定していた(文献1『坂井
利之著、「情報基礎学演習」、コロナ社出版』のP55
参照)。
【0006】また、文字色判定後の背景除去の従来の手
法としては、黒ラン長を用いる手法や収縮(縮退)を用
いる手法が知られている(上記文献1のP56参照)。
黒ラン長を用いる方法は、例えば原画像データを縦方
向、横方向にそれぞれ走査し、黒ラン長が所定の閾値よ
り小さい黒ランを除去することにより、文字線より細い
背景の線状模様や点状模様を除去するものである。ま
た、収縮を用いる方法は、例えば原画像全体に4近傍収
縮を背景の線模様がなくなるまで繰り返し、その後、膨
張処理を行なって文字を復元するものである。
【0007】
【発明が解決しようとする課題】しかしながら、従来の
文字色判定では、実際には図2に示すように周辺部の画
像が非常によく似ており、文字の色だけが違うという場
合には区別できない。
【0008】さらに、実際の文字には、図3(a)のよ
うに、黒っぽい背景模様に白の縁取りをした黒文字や、
図3(b)のように、白っぽい背景模様に黒の縁取りを
した白文字などが多く存在する。このような場合、従来
の方式では文字色の判定を誤り、文字が正確に抽出され
ないと言う問題があった。
【0009】また、従来の背景除去の手法では、上記い
ずれの方法も背景の模様が文字線よりも細くなければ正
確な背景除去は不可能である。
【0010】図2(a)に示す線模様付き文字画像は、
文字の横線の一部と背景の線の太さが同等であり、この
ような画像データを黒ラン長を用いて除去しようとする
と、図4(a)に示すように、文字の横線が消失してし
まう。また同様に、収縮と膨張を用いた場合も、図4
(b)に示すように、文字の横線が消失してしまう。図
2(a)のように、文字が明朝体に類似した書体で印刷
された場合、文字の横線が極端に細くなってしまうこと
から、上記のような従来の方法では、背景だけを正確に
除去することができないため、後段の文字切り出し処理
や文字認識処理等の妨げになるという問題があった。
【0011】そのため、画像周辺部から文字色を特定で
きないような画像データにおいても文字色を正しく判定
することのできる画像処理装置が求められている。ま
た、文字の一部が背景データと区別できないほど細くな
っている画像データにおいても正確に背景のみを除去す
ることのできる画像処理装置が求められている。
【0012】
【課題を解決するための手段】かかる課題を解決するた
め、本発明の画像処理装置は、(1) 文字を含む2値画像
イメージデータが入力され、2値画像イメージデータの
黒画素及び白画素のそれぞれにラベリングを行なうラベ
リング手段と、(2) ラベリング手段によって黒画素毎に
連結された黒ラベル画像を格納する黒ラベル画像格納手
段と、(3) ラベリング手段によって白画素毎に連結され
た白ラベル画像を格納する白ラベル画像格納手段と、
(4) 黒ラベル画像格納手段に格納された各黒ラベル画像
及び白ラベル画像格納手段に格納された各白ラベル画像
が文字データか背景データかを判定する文字背景判定手
段と、(5) 文字背景判定手段で文字データと判定された
各黒ラベル画像及び各白ラベル画像を基に入力された2
値画像イメージデータに含まれる文字の色を判定する文
字色判定手段とを備えることを特徴とする。
【0013】ここで、文字色判定手段で判定された文字
色に応じて黒ラベル画像格納手段又は白ラベル画像格納
手段の一方を選択し、選択されたラベル画像格納手段か
ら、文字背景判定手段によって文字データと判定された
ラベル画像を文字データとして出力する文字データ出力
手段をさらに備えることが好ましい。
【0014】
【発明の実施の形態】以下、本発明による画像処理装置
の一実施形態を、図面を参照しながら詳述する。
【0015】ここで、図1がこの実施形態の構成を示す
ブロック図である。図1に示すように、この実施形態の
画像処理装置は、文字・線画等が記録された画像記録媒
体10と、画像記録媒体10から2値画像イメージを得
て、得られた2値画像イメージ(原画像データ)を格納
する画像格納部20と、画像格納部20に格納された原
画像データのそれぞれの画素に対して黒画素及び白画素
のラベリングを行なうラベリング部30と、ラベリング
部30によって得られた黒画素のラベル画像を格納する
黒ラベル画像格納部40と、ラベリング部30によって
得られた白画素のラベル画像を格納する白ラベル画像格
納部50と、ラベル画像の形状や大きさ等から当該ラベ
ル画像が文字データか背景データかを判定する文字背景
判定部60と、ラベリング部30から黒画素及び白画素
のラベル数をそれぞれ受け取り、黒画素、白画素別にラ
ベルテーブルを作成し、文字背景判定結果をラベルテー
ブルに書き込むラベルテーブル書き込み部70と、ラベ
ルテーブル書き込み部70で作成された黒画素のラベル
テーブルと白画素のラベルテーブルとを参照し、原画像
データの文字色を判定する文字色判定部80と、文字色
判定部80で判定した画素のラベル画像とラベルテーブ
ルを受け取り、文字データと判定した画像データを出力
する文字データ出力部90により構成されている。
【0016】次に、上記のような各部から構成されてい
る実施形態の画像処理装置の動作を説明する。
【0017】画像格納部20は、文字・線画等が存在す
る文書等の2値画像イメージが格納されている画像記録
媒体10から、新聞見出しに見られるような背景に複雑
な模様を含み、かつ文字や背景の色が特定されていない
文字画像(原画像データ)を受け取り、例えば白を
「0」、黒を「1」として格納する。
【0018】ラベリング部30では、画像格納部20か
ら原画像データを受け取り、原画像データ全体を走査
し、黒画素、白画素別にラベリングを行なう。
【0019】ここで、ラベリング処理とは、個々の連結
成分を同定するために連結成分ごとに異なるラベルを、
それらの要素である画素に付与する操作で、ラベル付け
とも呼ばれる。ラベリング処理の方法としては、例え
ば、対象とする画素の4近傍(対象画素の上下左右の4
画素)から、対象とする画素と同色の画素を選択し、選
択された画素についても同様の処理を行ない、同色の画
素がなくなるまで繰り返すものを適用できる。同色の画
素がなくなった時点でその連続領域のラベル付けが終了
する。
【0020】図2(a)に示すような線状模様の背景を
持つ黒文字のラベリング処理結果の一例を図5及び図6
に示す。図5は黒画素によるラベリング結果、図6は白
画素によるラベリング結果を示す。なお、図5及び図6
はそれぞれ、図を見易くするために各連結成分のラベル
を1文字の英数字で表現しており、ラベルテーブル(図
7)記載のラベルとは対応していない。
【0021】ラベリング部30は、黒画素のラベリング
結果を黒ラベル画像格納部40へ、白画素のラベリング
結果を白ラベル画像格納部50へそれぞれ出力する。ま
た、ラベリング部30は、黒画素及び白画素のラベル数
をラベルテーブル書き込み部70に出力する。
【0022】黒ラベル画像格納部40及び白ラベル画像
格納部50はそれぞれ、後段の文字背景判定部60と文
字色判定部80とにそれぞれラベル画像を出力すると共
に、文字データ出力部90に対しては、必要に応じてそ
れぞれのラベル画像を出力する。
【0023】ラベルテーブル書込部70では、黒画像の
ラベル数(NB)及び白画像ラベル数(NW)を受け取
り、図7に示すようなラベルテーブルを作成する。黒画
像のラベル数NBは、黒画素で構成される閉領域の数を
示し、白画像のラベル数NWは、白画素で構成される閉
領域の数を示している。上述した図5のラベリング結果
例では1〜9、a〜z、A〜Vにラベル付けされた57
個の閉領域が存在し、黒画像のラベル数NBは57とな
っている。また、図6のラベリング結果例では1〜7、
aにラベル付けされた8個の閉領域が存在し、白画像の
ラベル数NWは8となっている。
【0024】文字背景判定部60では、黒ラベル画像格
納部40から黒ラベリング画像を、白ラベル画像格納部
50から白ラベリング画像を受け取り、それぞれのラベ
ル画像の各ラベルデータが文字データであるか背景デー
タであるかを判定する。
【0025】以下、文字背景判定部60による判定方法
を説明する。ここで、図8は文字背景判定部60の詳細
構成を示しており、図9は文字背景判定部60による判
定処理を示すフローチャートである。
【0026】文字背景判定部60は、矩形判定部62及
び線幅判定部64を備え、黒ラベル画像及び白ラベル画
像のそれぞれの各ラベル画像ごとに判定を行なう(ステ
ップ100〜102)。
【0027】矩形判定部62は、各ラベル画像を走査
し、ラベルの小さいものから順番にそのラベル画像を取
り囲む最小矩形を検出し、最小矩形を検出したら当該矩
形の面積(LS)を求め、予め設定した小さな閾値(T
HL1)と比較し、(1) 式を満たせば、すなわち、矩形
の面積(LS)が閾値(THL1)より小さければ、当
該ラベル画像は背景データであると判定する(ステップ
101)。
【0028】 LS<THL1 …(1) ここで、閾値THL1に小さな値を設定して(1) 式を適
用することにより、当該ラベル画像が微小点であれば
(1) 式が満たされ、このような微小点の背景が正しく背
景データとして判定される。なお、閾値THL1には原
画像データの面積の1000分の1程度を設定すること
が望ましい。これにより、図3(a)に示す点状模様の
白画素や図3(b)に示す点状模様の黒画素が背景デー
タであると判定される。
【0029】次に、矩形判定部62は、上述した矩形の
面積(LS)を、予め設定した大きな閾値(THL2)
と比較し、(2) 式を満たせば、すなわち、矩形の面積
(LS)が閾値(THL2)より大きければ、当該ラベ
ル画像は背景データであると判定する(ステップ10
1)。
【0030】 LS>THL2 …(2) ここで、閾値THL2に大きな値を設定して(2) 式を適
用することにより、当該ラベル画像が文字領域では考え
られない大きさであれば(2) 式が満たされ、このような
大きな連結背景が正しく背景データとして判定される。
なお、閾値THL2には原画像データの面積の4分の1
程度を設定することが望ましい。これにより、図3
(a)に示す点状模様の背景にあたる黒画素や図3
(b)に示す点状模様にあたる白画素が背景データであ
ると判定される。また、図2(a)に示す線状模様の背
景にあたる白画素や図2(b)に示す線状模様の背景に
あたる黒画素が背景データであると判定される。
【0031】上述した閾値THL1は文字データの最小
閾値を示し、閾値THL2は文字データの最大閾値を示
す。
【0032】矩形判定部62において背景データである
と判定したら、ラベルテーブル書込部70にて作成され
た黒画素及び白画素のラベルテーブル内のフラグ(図7
参照)に背景データであることを付与する(ステップ1
04、105)。
【0033】矩形判定部62において、背景データであ
ると判定されなかった場合は、線幅判定部64におい
て、線幅の判定を行なう(ステップ102)。
【0034】線幅判定部64は、当該ラベル画像の線幅
を以下のような方法によって検出する。
【0035】図10に示すようなa0〜a3からなる2
行2列の観測窓を備え、当該ラベル画像格納部40又は
50のメモリ上の画像データを構成する全画素を、観察
窓a0で覗くように、2×2の観測窓をラスタ走査す
る。そして、この2×2の観測窓と、2×2の観測窓か
ら見える当該ラベル画像格納部40又は50のメモリ上
の画素比較を行ない、2×2の観測窓から見える当該ラ
ベル画像格納部40又は50のメモリ上の画素が全て当
該ラベル画像のラベルと同じときにカウントを1増やす
ように順次4点数Qを計算する。また、観測窓a0から
覗いた当該ラベル画像格納部40又は50のメモリ上の
画素が当該ラベル画像のラベルと同じときにカウントを
1つ増やすように順次総点数Aを計数する。但し、4点
数Q及び総点数Aの初期値は0とする。
【0036】例えば、図5の黒ラベル画像のラベルfで
示される黒画像領域を拡大すると図11(a)のように
なる。この黒画像領域に、図10に示す観測窓(a0〜
a3)をスキャンしてみると、4つの窓の全てがfの観
測窓(図11(c)に示す)と全ての画素が同じになる
パターンはない。従って、4点数Q=0となる。観測窓
a0が同じパターンは7つある。従って、総点数A=7
となる。もう1つの例として線幅を1画素だけ増やした
図を図11(b)に示す。この例では、図に点線のハッ
チングで示すパターンのときに観測窓と全ての画素が同
じになる。従って、4点数Q=1となり、総点数A=8
となる。
【0037】次に、線幅判定部64は、次の(3) 式によ
って当該連結成分の平均線幅を算出する。そして、平均
線幅Wを算出したら、(4) 式に示すように、予め設定し
た閾値(THL3)と比較し、(4) 式を満たせば当該ラ
ベル画像は背景データであると判定する。
【0038】 平均線幅W=A/(A−Q) …(3) W<THL3 …(4) ここで、閾値THL3に文字線幅よりも小さな値を設定
することにより、当該ラベル画像が線状模様であるか否
かを判定できる。なお、閾値THL3には、新聞見出し
のように1行で構成されることが多い場合には、原画像
データの幅と高さのうち小さいほうを1文字の大きさと
判断し、その50分の1程度を設定することが望まし
い。これにより、図2(a)に示す線状模様の黒画素や
図2(b)に示す線状模様の白画素が背景データである
と判定される。図11(a)の例では平均線幅W=7/
(7−0)=1、図11(b)の例では平均線幅W=8
/(8−1)=8/7となる。
【0039】図2の画像では、文字の一部が背景の線幅
と同等になるところがあるが、この方法はラベル画像毎
に平均の線幅を検出しているので、文字の一部を背景デ
ータと判断する心配はない。
【0040】線幅判定部64において、背景データであ
ると判定されなかったラベル画像は文字データであると
判定され、ラベルテーブル書込部70によって、作成さ
れた黒画素及び白画素のラベルテーブル内のフラグ(図
7にて「F MOJI」のフラグを立てて示す)に文字
データであることを付与する(ステップ103、10
5)。
【0041】以上のような文字背景判定部60によるラ
ベル画像ごとの判定処理が終了すると、文字色判定部8
0の処理に移行する。
【0042】文字色判定部80においては、黒ラベル画
像格納部40から黒ラベル画像を、白ラベル画像格納部
50から白ラベル画像を受け取り、文字色の判定を行な
う。まず、文字色判定部80は、黒ラベル画像を走査
し、黒画素のラベルテーブル内のフラグがF MOJI
であるラベルが付された黒ラベル画像の全画素を計数す
る。同様に、文字色判定部80は、白ラベル画像を走査
し、白画素のラベルテーブル内のフラグがF MOJI
であるラベルが付された白ラベル画像の全画素を計数す
る。そして、文字色判定部80は、それぞれ計数した画
素数が多い方を文字色と判定する。
【0043】因に、図2(a)のフラグがF MOJI
である白ラベルの画素数、図2(b)のフラグがF M
OJIである黒ラベルの画素数、図3(a)のフラグが
MOJIである白ラベルの画素数、図3(b)のフラ
グがF MOJIである黒ラベルの画素数はいずれも0
個である。これは文字背景判定部60での判定結果が正
しいからである。
【0044】ここで、画素数が多い方を文字色と判定す
るのは、文字背景判定部60での判定結果が多少間違っ
ていても文字色の判定が正しく行なわれるようにするた
めである。
【0045】文字データ出力部90は、文字色判定部8
0から文字色判定結果を受け取り、判定結果が黒の場合
には、黒ラベル画像格納部40から黒ラベル画像とラベ
ルテーブル書込部70から黒画像のラベルテーブルを受
け取り、ラベルテーブル内のフラグがF MOJIであ
るラベルの部分を黒画素、その他を白画素で出力する。
同様に、文字データ出力部90は、文字色判定部80か
ら文字色判定結果が白の場合には、白ラベル画像格納部
50から白ラベル画像とラベルテーブル書込部70から
白画像のラベルテーブルを受け取り、ラベルテーブル内
のフラグがFMOJIであるラベルの部分を黒画素、そ
の他を白画素で出力する。図12にその出力結果を示
す。入力画像が図2(a)、(b)、図3(a)、
(b)のいずれの場合も図12に示すような出力結果に
なる。
【0046】以上のように、上記実施形態によれば、画
像周辺部からだけでは判定できない画像についても正確
に文字色の判定が行なうことができる。その結果、精度
の良い地紋(背景)除去画像を得ることができる。
【0047】さらに、上記実施形態によれば、ラベル画
像毎に線幅を検出しているので、文字の一部が細くなっ
ていても比較的安定した太さの線幅が得られ、それによ
り背景の線模様と文字線との区別が容易に行なえ、細い
文字線部分を消去することなく、線模様のみを除去する
ことができる。そのため、この画像処理装置の後段にお
いて、文字認識等を行なう場合においても、文字切り出
し処理や文字認識処理を正確に行なえる。
【0048】なお、上記実施形態の説明では、文字デー
タと背景データとを区別する方法として矩形判定及び線
幅判定を用いているが、これに限らず、ラベル画像を利
用して文字データと背景データを区別できる方法であれ
ば、本発明に適用できる。
【0049】また、上記実施形態の説明で矩形判定の閾
値(THL1,THL2)及び線幅判定の閾値(THL
3)の例を示したが、これはあくまで1例であってこれ
に限定されるものではない。
【0050】さらに、矩形判定と線幅判定の順番は図9
に示す順番でなく、線幅判定の後に矩形判定を行なって
も良い。
【0051】ラベリングの方法についても、上記実施形
態の説明では、4近傍連結法を用いているが、これに限
定されるものではなく、連結成分が検出できれば他の方
法を用いても良い。
【0052】本発明の画像処理装置への入力画像データ
については、上記実施形態の説明のように画像記録媒体
からの入力に限らず、スキャナやFAX等の他の画像処
理装置からの入力画像データであってもかまわない。
【0053】また、文字色を得るまでの上記実施形態の
構成を、上記実施形態とは異なる用途の画像処理装置に
適用するようにしても良い。例えば、入力画像が白文字
の場合に、黒文字の画像に変換するような画像処理装置
に、文字色を得るまでの上記実施形態の構成を適用する
ことができる。
【0054】
【発明の効果】以上のように、本発明によれば、(1) 文
字を含む2値画像イメージデータが入力され、2値画像
イメージデータの黒画素及び白画素のそれぞれにラベリ
ングを行なうラベリング手段と、(2) ラベリング手段に
よって黒画素毎に連結された黒ラベル画像を格納する黒
ラベル画像格納手段と、(3) ラベリング手段によって白
画素毎に連結された白ラベル画像を格納する白ラベル画
像格納手段と、(4) 黒ラベル画像格納手段に格納された
各黒ラベル画像及び白ラベル画像格納手段に格納された
各白ラベル画像が文字データか背景データかを判定する
文字背景判定手段と、(5) 文字背景判定手段で文字デー
タと判定された各黒ラベル画像及び各白ラベル画像を基
に入力された2値画像イメージデータに含まれる文字の
色を判定する文字色判定手段とを有するので、画像周辺
部から文字色を特定できないような画像データにおいて
も文字色を正しく判定することができる。
【0055】また、文字色判定手段で判定された文字色
に応じて黒ラベル画像格納手段又は白ラベル画像格納手
段の一方を選択し、選択されたラベル画像格納手段か
ら、文字背景判定手段によって文字データと判定された
ラベル画像を文字データとして出力する文字データ出力
手段をさらに備える場合には、地紋等の文字以外の部分
を多く含む画像データにおいても正確に背景のみを除去
することができる。
【図面の簡単な説明】
【図1】実施形態の画像処理装置の基本構成を示すブロ
ック図である。
【図2】線状模様の例を示す説明図である。
【図3】点状模様の例を示す説明図である。
【図4】従来技術の例を示す説明図である。
【図5】実施形態の黒文字の黒ラベル画像を説明する説
明図である。
【図6】実施形態の白文字の白ラベル画像を説明する説
明図である。
【図7】実施形態のラベルテーブルを示す説明図であ
る。
【図8】実施形態の文字背景判定部60の詳細構成を示
すブロック図である。
【図9】実施形態の文字背景判定処理を示すフローチャ
ートである。
【図10】実施形態の線幅検出のための観測窓を示す説
明図である。
【図11】実施形態の線幅判定動作を説明する説明図で
ある。
【図12】実施形態の画像処理装置による地紋除去結果
を説明する説明図である。
【符号の説明】
20…画像格納部、30…ラベリング部、40…黒ラベ
ル画像格納部、50…白ラベル画像格納部、60…文字
背景判定部、62…矩形判定部、64…線幅判定部、7
0…ラベルテーブル書き込み部、80…文字色判定部、
90…文字データ出力部。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 文字を含む2値画像イメージデータが入
    力され、上記2値画像イメージデータの黒画素及び白画
    素のそれぞれにラベリングを行なうラベリング手段と、 上記ラベリング手段によって黒画素毎に連結された黒ラ
    ベル画像を格納する黒ラベル画像格納手段と、 上記ラベリング手段によって白画素毎に連結された白ラ
    ベル画像を格納する白ラベル画像格納手段と、 上記黒ラベル画像格納手段に格納された各黒ラベル画像
    及び上記白ラベル画像格納手段に格納された各白ラベル
    画像が文字データか背景データかを判定する文字背景判
    定手段と、 上記文字背景判定手段で文字データと判定された各黒ラ
    ベル画像及び各白ラベル画像を基に入力された上記2値
    画像イメージデータに含まれる文字の色を判定する文字
    色判定手段とを備えることを特徴とする画像処理装置。
  2. 【請求項2】 上記文字色判定手段は、上記文字背景判
    定手段で文字データと判定された各黒ラベル画像及び各
    白ラベル画像の画素数を、黒ラベル画像及び白ラベル画
    像毎に集計して画素数の多い方を文字色と判定すること
    を特徴とする請求項1に記載の画像処理装置。
  3. 【請求項3】 上記文字背景判定手段は、各ラベル画像
    を囲む最小矩形を検出し、検出された最小矩形の面積が
    予め定められた最小閾値よりも小さい場合、及び、予め
    定められた最大閾値よりも大きい場合にそのラベル画像
    が背景データであると判定することを特徴とする請求項
    1又は2に記載の画像処理装置。
  4. 【請求項4】 上記文字背景判定手段は、各ラベル画像
    の線幅を検出し、検出された線幅が予め設定された線幅
    閾値よりも小さい場合にそのラベル画像が背景データで
    あると判定することを特徴とする請求項1〜3のいずれ
    かに記載の画像処理装置。
  5. 【請求項5】 上記文字色判定手段で判定された文字色
    に応じて上記黒ラベル画像格納手段又は上記白ラベル画
    像格納手段の一方を選択し、選択されたラベル画像格納
    手段から、上記文字背景判定手段によって文字データと
    判定されたラベル画像を文字データとして出力する文字
    データ出力手段をさらに備えることを特徴とする請求項
    1〜4のいずれかに記載の画像処理装置。
  6. 【請求項6】 上記文字背景判定手段は、文字データか
    背景データかの判定結果を各ラベル画像毎に記憶するラ
    ベルテーブルを有し、上記文字データ出力手段は、上記
    ラベルテーブルに文字として記録された各ラベル画像を
    上記文字色判定手段の判定結果に基づいて上記黒ラベル
    画像格納手段又は上記白ラベル画像格納手段から読み出
    すことを特徴とする請求項5に記載の画像処理装置。
  7. 【請求項7】 上記文字データ出力手段は、上記ラベル
    テーブルに文字として記録された各ラベル画像を黒画素
    で出力し、その他を白画素で出力することを特徴とする
    請求項6に記載の画像処理装置。
JP9037351A 1997-02-21 1997-02-21 画像処理装置 Pending JPH10233930A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9037351A JPH10233930A (ja) 1997-02-21 1997-02-21 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9037351A JPH10233930A (ja) 1997-02-21 1997-02-21 画像処理装置

Publications (1)

Publication Number Publication Date
JPH10233930A true JPH10233930A (ja) 1998-09-02

Family

ID=12495150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9037351A Pending JPH10233930A (ja) 1997-02-21 1997-02-21 画像処理装置

Country Status (1)

Country Link
JP (1) JPH10233930A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243016A (ja) * 2007-03-28 2008-10-09 Oki Electric Ind Co Ltd 文字認識方法、文字認識プログラムおよび文字認識装置
JP2009031911A (ja) * 2007-07-25 2009-02-12 Dainippon Printing Co Ltd 皺画像生成装置
CN115222682A (zh) * 2022-07-04 2022-10-21 北京华夏电通科技股份有限公司 一种图片质量检测方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243016A (ja) * 2007-03-28 2008-10-09 Oki Electric Ind Co Ltd 文字認識方法、文字認識プログラムおよび文字認識装置
JP2009031911A (ja) * 2007-07-25 2009-02-12 Dainippon Printing Co Ltd 皺画像生成装置
CN115222682A (zh) * 2022-07-04 2022-10-21 北京华夏电通科技股份有限公司 一种图片质量检测方法及装置

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US20030063802A1 (en) Image processing method, apparatus and system
JPH10261041A (ja) 画像において機械で読み取り可能なマーカの位置を突き止める方法
EP1296283A2 (en) Half-tone dot elimination method and system thereof
JPH10233930A (ja) 画像処理装置
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
JP3763954B2 (ja) 文字認識用の学習データ作成方法および記録媒体
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JPH10232926A (ja) 画像処理装置及びその方法
JPH08237404A (ja) 光学文字認識モードの選択方法
JP3019897B2 (ja) 行切出し方法
JP2003317107A (ja) 罫線抽出方法及び装置
JP2957729B2 (ja) 行方向判定装置
JP4738645B2 (ja) 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
JP2789647B2 (ja) 線画像認識方法
JP2963508B2 (ja) 文字切出し装置
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP3358133B2 (ja) 画像処理装置
JP3020293B2 (ja) 属性判別方法
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JP3100825B2 (ja) 線認識方法
JP2000020714A (ja) 画像処理方法,装置および画像処理機能を格納した記録媒体
JP3281786B2 (ja) 点字複写装置