JP2003189096A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JP2003189096A
JP2003189096A JP2001389764A JP2001389764A JP2003189096A JP 2003189096 A JP2003189096 A JP 2003189096A JP 2001389764 A JP2001389764 A JP 2001389764A JP 2001389764 A JP2001389764 A JP 2001389764A JP 2003189096 A JP2003189096 A JP 2003189096A
Authority
JP
Japan
Prior art keywords
area
image
character
graphic
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001389764A
Other languages
English (en)
Other versions
JP3931651B2 (ja
JP2003189096A5 (ja
Inventor
Tsutomu Yamazaki
勉 山崎
Yoko Fujiwara
葉子 藤原
Yoshinori Tanaka
芳則 田中
Masahiro Ozawa
昌裕 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP2001389764A priority Critical patent/JP3931651B2/ja
Priority to US10/322,700 priority patent/US7340092B2/en
Publication of JP2003189096A publication Critical patent/JP2003189096A/ja
Publication of JP2003189096A5 publication Critical patent/JP2003189096A5/ja
Application granted granted Critical
Publication of JP3931651B2 publication Critical patent/JP3931651B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 読み取った画像データ中の文字領域に対して
適切な処理を実行するために、当該画像データから文字
領域を確実に抽出する。 【解決手段】 受信した画像データから、文字領域が最
先に抽出された後に(S241)、抽出後に残ったデー
タから写真領域と図形領域とが分離される(S243、
S245、S246)。これにより、文字領域は、他の
領域の分離処理の影響を受けて当該他の領域に付随して
抽出されることがなくなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像処理装置に関
し、特に、処理しようとする画像データから、写真領
域、図形領域、および文字領域を分離する領域分離処理
を行う画像処理装置に関する。
【0002】
【従来の技術】原稿を読み取って得られた画像データか
ら、写真領域、図形領域、および文字領域を判別し、そ
れぞれの領域に適応した処理を行った後、各領域を合成
した画像データを出力するという画像処理技術が知られ
ている(たとえば、特開平5−342408号公報参
照)。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来技術においては、画像データ中の各領域の種類を誤り
無く判別することが困難な場合がある。たとえば、画像
データの中で、複数の異なる種類の領域が複雑なレイア
ウトで配置されている場合、あるいは相互に重なって配
置されている場合には、領域の種類を誤判別するおそれ
が大きい。
【0004】たとえば、画像データ中で文字画像が写真
画像または図形画像の上に重なっている場合、文字領域
が判別されないで全体が写真領域または図形領域と判別
されて抽出されるおそれがある。また、抽出された文字
画像を含む領域に対してたとえば写真領域に適応したJ
PEG圧縮処理が施されてしまうと、写真領域の中の文
字画像が劣化して復元したときに判読困難な画像となる
おそれもある。
【0005】このように、画像データから、文字画像が
含まれる文字領域を重点的に抽出し、抽出された領域に
対して文字認識処理などの文字領域に適応した処理を実
行したい場合であっても、文字領域を確実に抽出するこ
とができないために、文字画像に対する文字認識処理を
十分に実行できないばかりか、文字画像に対して不適切
な処理が施されるおそれがあった。
【0006】本発明は、上記従来技術の有する問題点に
鑑みてなされたものであり、本発明の目的は、読み取っ
た画像データ中の文字領域に対して適切な処理を実行す
るために、当該画像データから文字領域を確実に抽出す
ることである。
【0007】
【課題を解決するための手段】本発明の上記目的は、下
記の手段によって達成される。
【0008】(1)処理しようとする画像データから、
写真領域、図形領域、および文字領域を分離する領域分
離手段を有する画像処理装置であって、前記領域分離手
段は、前記画像データから、写真領域および図形領域よ
りも先に文字領域を抽出する文字領域最先抽出手段を備
え、前記画像データから文字領域が抽出されて残ったデ
ータから、写真領域と図形領域とを分離することを特徴
とする画像処理装置。
【0009】(2)前記領域分離手段は、前記画像デー
タから文字領域が抽出されて残ったデータから、図形領
域よりも先に写真領域を抽出する写真領域先行抽出手段
をさらに備えていることを特徴とする上記(1)に記載
の画像処理装置。
【0010】(3)前記領域分離手段は、前記画像デー
タから文字領域が抽出されて残ったデータから、写真領
域よりも先に図形領域を抽出する図形領域先行抽出手段
をさらに備えていることを特徴とする上記(1)に記載
の画像処理装置。
【0011】(4)前記写真領域先行抽出手段は、前記
画像データから文字領域が抽出されて残ったデータに対
して、複数の所定領域に分割し得る第1領域分割処理を
施し、分割された領域のうちで写真領域を抽出する第1
写真領域抽出手段と、前記画像データから文字領域が抽
出されて残ったデータから前記第1写真領域抽出手段に
より写真領域がさらに抽出されて残ったデータに対し
て、前記所定領域よりも小さい複数の領域に分割し得る
第2領域分割処理を施し、分割された領域のうちで写真
領域を抽出する第2写真領域抽出手段とを有することを
特徴とする上記(2)に記載の画像処理装置。
【0012】(5)前記図形領域先行抽出手段は、前記
画像データから文字領域が抽出されて残ったデータに対
して、複数の所定領域に分割し得る第1領域分割処理を
施し、分割された領域のうちで図形領域を抽出する第1
図形領域抽出手段と、前記画像データから文字領域が抽
出されて残ったデータから前記第1図形領域抽出手段に
より図形領域がさらに抽出されて残ったデータに対し
て、前記所定領域よりも小さい複数の領域に分割し得る
第2領域分割処理を施し、分割された領域のうちで図形
領域を抽出する第2図形領域抽出手段とを有することを
特徴とする上記(3)に記載の画像処理装置。
【0013】
【発明の実施の形態】以下、本発明の実施の形態を、図
面を参照して詳細に説明する。
【0014】図1は、本発明の実施形態にかかる画像処
理装置を含む画像処理システムの全体構成を示すブロッ
ク図である。本画像処理システムは、画像処理装置1
と、スキャナ2と、ファイルサーバ3とを備え、これら
はコンピュータネットワーク4を介して相互に通信可能
に接続されている。なお、コンピュータネットワークに
接続される機器の種類および台数は、図1に示す例に限
定されない。
【0015】図2は、本実施形態にかかる画像処理装置
1の構成を示すブロック図である。図2において、画像
処理装置1は、制御部101、記憶部102、操作部1
03、入力インタフェース部104、出力インタフェー
ス部105、領域分離部106、画像処理部108、文
書ファイル作成部109およびファイル形式変換部11
0を備えており、これらは信号をやり取りするためのバ
ス111を介して相互に接続されている。
【0016】制御部101はCPUであり、プログラム
にしたがって上記各部の制御や各種の演算処理等を行
う。記憶部102は、予め各種プログラムやパラメータ
を格納しておくROM、作業領域として一時的にプログ
ラムやデータを記憶するRAM、各種プログラムやパラ
メータを格納し、または画像処理により得られた画像デ
ータ等を一時的に保存するために使用されるハードディ
スク等からなる。
【0017】操作部103は、各種項目の設定、または
動作開始の指示を行うためのキーや操作パネル等から構
成される。図3に示すように、設定可能な項目として
は、画像データの送信先、出力ファイル形式、原稿モー
ド、スキャン条件、スキャン後処理等が挙げられる。
【0018】入力インタフェース部104は、画像デー
タなどのデータや命令等を受信するためのインタフェー
スであり、出力インタフェース部105は、出力ファイ
ルなどのデータや命令等を送信するためのインタフェー
スである。
【0019】領域分離部106は、画像データから、写
真領域、図形領域、および文字領域を分離する。画像処
理部108は、写真領域処理部108a、図形領域処理
部108bおよび文字領域処理部108cからなる。各
領域処理部108a〜108cは、領域分離部106に
よりそれぞれ抽出された文字領域、図形領域、および写
真領域に対して、当該領域の種類に応じた適切な画像処
理を施す。
【0020】文書ファイル作成部109は、写真領域処
理部108a、図形領域処理部108b、および文字領
域処理部108cからそれぞれ送られる処理後の画像が
含まれる各領域を合成して、内部ファイル形式により文
書ファイルを作成する。ファイル形式変換部110は、
内部ファイル形式により作成した文書ファイルを設定さ
れた出力ファイル形式に変換する。なお、出力ファイル
形式としては、各種文書作成ソフトの文書形式や、ポス
トスクリプト(登録商標)、PDF、JPEG、TIF
F等の汎用フォーマットが挙げられる。
【0021】スキャナ2は、原稿を読み取って画像デー
タを取得し、得られた画像データを画像処理装置に送信
する。
【0022】ファイルサーバ3はコンピュータであり、
コンピュータネットワーク4を介して受信したファイル
を格納し、また転送要求に応じて格納したファイルをコ
ンピュータネットワーク上の他の機器に転送する。
【0023】コンピュータネットワーク4は、イーサネ
ット(登録商標)、トークンリング、FDDI等の規格
によりコンピュータや周辺機器、ネットワーク機器等を
接続したLANや、LAN同士を専用線で接続したWA
N等からなる。
【0024】次に、図4を参照して、本実施形態の画像
処理装置1における処理の手順について説明する。な
お、図4のフローチャートにより示されるアルゴリズム
は、画像処理装置1の記憶部102にプログラムとして
記憶されており、制御部101によって実行される。
【0025】まず、ステップS101では、各種項目の
設定が行われる。すなわち、画像データの送信先、出力
ファイル形式、原稿モード、スキャン条件、およびスキ
ャン後処理についての設定が行われる。ここで、画像デ
ータの送信先の設定は、画像出力先装置のIPアドレ
ス、ホスト名、メールアドレス等が入力されることによ
り行われる。出力ファイル形式の設定は、画像出力先装
置に送信する出力ファイルのファイル形式が選択される
ことにより行われる。
【0026】原稿モードの設定は、写真画像が含まれる
写真領域、図形画像が含まれる図形領域、および文字画
像が含まれる文字領域のうちで、どの領域の画像を優先
するかが選択されることにより行われる。ここで、写真
画像とは、写真や絵柄などの連続的に変化する階調のあ
る画像をいう。また、図形画像とは、線やベタ絵などの
たとえばパソコンで作成された画像をいう。
【0027】図3に示すように、本実施形態では、ユー
ザは、操作部103を通して、原稿の内容に応じて、最
も優先して処理したい領域(第1優先領域)と、2番目
に優先して処理したい領域(第2優先領域)とを選択す
ることができる。なお、ユーザによる第1優先領域およ
び/または第2優先領域の選択が行われない場合には、
所定のデフォルト値にしたがって領域の優先順位が決定
される。
【0028】スキャン条件の設定は、スキャン領域、ス
キャン解像度、カラー/モノクロ等が指定されることに
より行われる。スキャン後処理の設定は、文字認識処
理、ベクタ変換処理、画像圧縮方法、減色方法、出力解
像度等が指定されることにより行われる。
【0029】ステップS102では、画像処理の開始命
令があるまで待機する。開始命令は、ユーザが操作部1
03のたとえばスタートキーを操作することにより行わ
れる。
【0030】ステップS103では、スキャナ2に対し
て、出力インタフェース部105を介して原稿読み取り
命令が送信される。ここで、スキャナ2は、画像処理装
置1から原稿読み取り命令を受信すると、所定の位置に
セットされた原稿を読み取って画像データを取得し、得
られた画像データを画像処理装置1に送信する。
【0031】ステップS104では、スキャナ2から、
入力インタフェース部104を介して画像データが受信
されるまで待機する。ここで、スキャナ2から画像デー
タが受信されると、受信した画像データ(RGB画像デ
ータ)は記憶部102に保存される。
【0032】図5は、受信した画像データの一例を模式
的に示す図である。図5に示される画像データは、写真
画像PI1〜PI4、図形画像GI1〜GI3、文字画
像CI1〜CI6、および下地Uから構成される。図示
のように、写真画像PI1の中に図形画像GI3および
文字画像CI1、CI3が配置されており、また、図形
画像GI2の中に写真画像PI3、PI4および文字画
像CI5、CI6が配置されている。ここで、下地と
は、画像データにおける写真領域、図形領域、および文
字領域以外の部分をいい、たとえば元の原稿の印刷され
ていない用紙の色が残っている部分に対応する画像デー
タの部分をいう。
【0033】なお、画像処理の開始命令はコンピュータ
ネットワーク4上の他の機器から、またはスキャナ2か
ら入力されてもよい。
【0034】ステップS105では、領域分離部106
により、スキャナ2から受信した画像データ、つまり処
理しようとする画像データから、写真領域、図形領域、
および文字領域が分離される。本実施形態では、領域分
離部106は、操作部103を通したユーザによる選択
によって設定された原稿モードにしたがって、画像デー
タから第1優先領域を最先に抽出し、当該画像データか
ら第1優先領域が抽出されて残ったデータから、残りの
2つの領域を分離する。さらに、第2優先領域が選択さ
れている場合には、画像データから第1優先領域が抽出
されて残ったデータから、第2優先領域を先に抽出する
ことによって残りの2つの領域を分離する。ここで、3
種類の領域別に各画像が作成され、それぞれの領域は、
各画像を含んだ領域として抽出される。この領域分離処
理の手順についての詳細は後述する。
【0035】ステップS106では、ステップS105
において分離された写真領域に対して、写真領域に適応
した処理が行われる。すなわち、写真領域処理部108
aにより、写真領域内の写真画像は、たとえば、解像度
変換が行われた後、カラー画像の非可逆圧縮処理が行わ
れて、位置情報とともに記憶部102に保存される。
【0036】ステップS107では、ステップS105
において分離された図形領域に対して、図形領域に適応
した処理が行われる。すなわち、図形画像処理部108
bにより、図形領域内の図形画像は、たとえば、スムー
ジング処理、減色処理等が施された後、カラー画像の可
逆圧縮処理が行われて、位置情報とともに記憶部102
に保存される。
【0037】ステップS108では、ステップS105
において分離された文字領域に対して、文字領域に適応
した処理が行われる。すなわち、文字画像処理部108
cにより、文字領域内の文字画像は、たとえば、2値化
された後、1ビットデータの可逆圧縮処理が施されて、
色情報、位置情報とともに記憶部102に保存される。
【0038】ステップS109では、文書ファイル作成
部109により、写真領域処理部108a、図形領域処
理部108b、および文字領域処理部108cからそれ
ぞれ送られた処理後の画像を含む上記3つの領域が合成
されて、文書ファイルが作成される。
【0039】領域の合成は、たとえば図6(A)に示す
ように、メモリ上に写真領域600、図形領域700、
および文字領域800を出力することにより行われる。
ここで、図6(B)に示すように、写真領域600内の
写真画像600a以外の部分、図形領域700内の図形
画像700a以外の部分、文字領域800内の文字画像
800a以外の部分がそれぞれマスク部600b〜80
0bに指定される。なお、各領域600〜800は、画
像600a〜800aについての外接矩形で与えられ
る。マスク部は、メモリ上に先に記憶されている情報を
有効とするためのマスク処理が行われる部分である。ま
ず、写真領域600と図形領域700とがマスク処理さ
れて配置され、その後に、文字領域800がマスク処理
されて配置される。すべての領域についてマスク処理を
行う理由は、各領域内の画像が矩形である場合のみなら
ず、他の領域の画像が中に入り込むような形状である場
合を許容しているからである。こうして、図6(A)に
示すように、3つの領域内の画像が相互に欠損すること
なくメモリ上に出力されて、領域の合成が完了する。
【0040】文字領域を他の領域よりも後で配置する理
由は、後述するように、領域分離処理の際に文字領域を
抽出した後、文字画像が存在していた部分を元の画像デ
ータの背景部で補間する補間処理が行われているためで
ある。つまり、文字領域を他の領域よりも先に配置する
と、後で配置される領域内における補間された部分によ
って文字画像が隠されてしまうことを防止するためであ
る。なお、図形領域を抽出した後、図形画像が存在して
いた部分に対しても補間処理が行われる場合には、写真
領域、図形領域、文字領域の順番でメモリ上に出力され
る。
【0041】ステップS110では、ファイル形式変換
部110により、ステップS109で作成された文書フ
ァイルが、設定された出力ファイル形式に変換される。
【0042】ステップS111では、ステップS110
で得られた出力ファイルが、出力インタフェース部10
5およびコンピュータネットワーク4を介してファイル
サーバ3に送信される。
【0043】本実施形態では、ファイルサーバ3は、コ
ンピュータネットワーク4を介して画像処理装置1から
出力ファイルを受信すると、受信したファイルから文字
画像および図形画像を展開し、文字画像に対して文字認
識処理を施して文字コードデータに変換し、図形画像に
対してベクタ変換処理を施してベクタデータに変換し、
変換後の各データを写真画像とともに再度合成して、所
定のファイル形式に変換して得られた文書ファイルをハ
ードディスク等の記憶装置の所定のディレクトリに格納
する。そして、コンピュータネットワーク4上の他の機
器から当該ファイルの転送要求があると、格納した前記
ファイルをコンピュータネットワーク4を介して前記他
の機器に転送する。
【0044】次に、本実施形態における画像処理装置1
の画像処理の特徴である図4に示したステップS105
の領域分離処理の手順について、さらに詳細に説明す
る。
【0045】図7〜図12は、原稿モードに応じた領域
分離処理の手順を示すフローチャートである。図4のス
テップS101において設定される原稿モードは、全部
で6種類ある。すなわち、原稿モードは、第1優先領域
および第2優先領域が、それぞれ写真領域および図形領
域である第1モード(図7参照)と、それぞれ写真領域
および文字領域である第2モード(図8参照)と、それ
ぞれ図形領域および写真領域である第3モード(図9参
照)と、それぞれ図形領域および文字領域である第4モ
ード(図10参照)と、それぞれ文字領域および写真領
域である第5モード(図11参照)と、それぞれ文字領
域および図形領域である第6モード(図12参照)とか
らなる。
【0046】図7〜図12の各領域分離処理は、2値化
による領域分割、第1写真/図形領域抽出、エッジによ
る領域分割、第2写真/図形領域抽出、写真/図形領域
抽出、および文字領域抽出という、各モードで内容が共
通する処理ブロックを含んでいる。つまり、各領域分離
処理は、原稿モードに応じて優先される領域がそれぞれ
異なり、領域の優先度にしたがって、領域の抽出順がそ
れぞれ異なる。たとえば第1モードの場合、領域の優先
度は、高い方から写真領域、図形領域、文字領域の順と
なり、領域の抽出順もこれと同じである。
【0047】以下、領域分離処理における各処理ブロッ
クの内容について詳細に説明する。ここでは、例として
図7の第1モードの処理順序と同じ順序で、各処理ブロ
ックの内容について具体的な説明を行う。
【0048】(2値化による領域分割)まず、図13を
参照して、2値化による領域分割の手順について説明す
る。
【0049】たとえば図5に示される受信した画像デー
タに基づいて、明度からなる画像、つまり明度画像が作
成される(ステップS301)。次に、明度画像から下
地が除去され(ステップS302)、スムージングフィ
ルタを使用するスムージング処理が行われる(ステップ
S303)。下地およびノイズが除去された明度画像
は、下地の明度レベル(以下、「下地レベル」とい
う。)で、2値化処理される(ステップS304)。こ
れにより、図14に示すように、下地以外の領域を黒く
塗り潰した2値画像が得られる。この2値画像に対し
て、たとえば2次微分フィルタであるラプラシアンフィ
ルタを使用することにより、エッジ検出が行われる(ス
テップS305)。続いて、モフォロジー処理の一種で
あるクロージング(膨張・侵食)処理を実行することに
より、エッジが補間され、エッジから構成される画像、
つまりエッジ画像が得られる(ステップS306、図1
5参照)。図15のエッジ画像は、図14の2値画像の
輪郭線に相当する。
【0050】このように下地レベルで2値化して得られ
た2値画像の輪郭線を検出することによって、相互に接
する複数の領域がある場合にはこれらの領域を一つにま
とめた形で、領域の分割が行われる。第1〜第4モード
においては、図14および図15に示すような4つの大
きな領域と文字領域とが得られる。ただし、文字領域が
優先される第5および第6モードにおいては、2値化に
よる領域分割よりも前に文字領域の抽出が行われるの
で、4つの大きな領域のみが得られる。
【0051】(第1写真/図形領域抽出)次に、図16
および図17を参照して、第1写真/図形領域抽出の手
順について説明する。
【0052】第1写真/図形領域抽出に関する処理は、
下地レベルで2値化して得られた2値画像の輪郭線によ
って区画された各領域(図15の閉曲線で囲まれた領
域)に対してそれぞれ実行される。まず、図15のエッ
ジ画像のエッジの位置に基づいて、第1方向、たとえば
主走査方向に関するエッジ間線分の位置が検出される
(ステップS401)。そして、注目エッジ間線分の位
置に対応する明度画像の画素を使用して、たとえば図1
8に示すようなヒストグラム(第1ヒストグラム)が作
成される(ステップS402)。また、第1ヒストグラ
ムに対して、平均値フィルタ(|1|0|1|)を使用
するスムージング処理を行うことによって、たとえば図
19に示すような第2ヒストグラムが作成される(ステ
ップS403)。続いて、下記の式にしたがって、階調
毎に第1ヒストグラムHist1と第2ヒストグラムHist2
の差を算出し、その合計を特徴量とする(ステップS4
04)。なお、明度は、8ビットデータで表され、25
6階調を有する。
【0053】
【数1】
【0054】次いで、注目エッジ間線分に位置する総画
素数N1と所定の定数T1との比率R1(=N1/T
1)が、算出される(ステップS405)。定数T1
は、写真領域と図形領域とを分離するための第1のパラ
メータである。続いて、閾値である比率R1と特徴量と
が比較される(ステップS406)。特徴量が、比率R
1より大きいと判断される場合(ステップS406:N
O)、第1方向に関するエッジ間線分に位置する画素の
全ては、図形領域に属しているとみなされ、番号を割り
当てる処理であるラベリングが実行され、ラベリングデ
ータが生成される(ステップS407)。すなわち、各
画素に対して領域判定の結果をラベリングする。具体的
には、領域判定の結果が画素位置と対応して保存され
る。一方、特徴量が、比率R1以下であると判断される
場合(ステップS406:YES)、第1方向に関する
エッジ間線分に位置する画素の全ては、写真領域に属し
ているとみなされ、ラベリングデータが生成される(ス
テップS408)。続いて、注目エッジ間線分が、第1
方向に関する最終エッジ間線分であるか否かが判断され
る(ステップS408)。注目エッジ間線分が、最終エ
ッジ間線分でないと判断される場合(ステップS40
8:NO)、ステップS402に戻って、上記処理が繰
り返される。
【0055】次に、図15のエッジ画像に基づいて、第
1方向と直交する方向である第2方向、たとえば副走査
方向に関するエッジ間線分の位置が検出される(ステッ
プS410)。そして、ステップS407およびS40
8で作成されたラベリングデータに基づいて、注目エッ
ジ間線分に位置する総画素数N2と写真領域に属する画
素数N3との比率R2(=N3/N2)が、算出される
(ステップS411)。続いて、比率R2と閾値である
所定の定数T2とが比較される(ステップS412)。
定数T2は、写真領域と図形領域とを分離するための第
2のパラメータである。比率R2が、定数T2よりも小
さいと判断される場合(ステップS412:NO)、第
2方向に関する注目エッジ間線分に存在している画素の
全てが、図形領域に属するとみなされ、ラベリングし直
される(ステップS413)。一方、比率R2が、定数
T2以上と判断される場合(ステップS412:YE
S)、第2方向に関する注目エッジ間線分に位置する画
素の全てが、写真領域に属すると見なされ、ラベリング
し直される(ステップS414)。続いて、注目エッジ
間線分が、第2方向に関する最終エッジ間線分であるか
否かが判断される(ステップS415)。注目エッジ間
線分が、最終エッジ間線分でないと判断される場合(ス
テップS415:NO)、ステップS411に戻って、
上記処理が繰り返される。
【0056】次に、2値化による領域分割により得られ
た一つの領域内で、写真領域に属するとラベリングされ
た画素の数N5と図形領域に属するとラベリングされた
画素の数N4とが比較される(ステップS416)。N
5<N4と判断される場合(ステップS416:N
O)、当該領域は図形領域と判定される(ステップS4
17)。一方、N5≧N4と判断される場合(ステップ
S416:YES)、当該領域は写真領域と判定される
(ステップS418)。そして、写真領域または図形領
域のうち優先度が高い方の領域の判定が確定されるとと
もに、当該領域内の画素の全てが、優先度が高い方の領
域に属するとみなされ、ラベリングし直されて、画像デ
ータから抽出される(ステップS419)。ここで、位
置データに基づいて領域の輪郭を追跡することによって
領域の外接矩形が算出され、外接矩形内の座標位置に対
応していて当該領域に属するとラベリングされた画素を
含む矩形領域が、画像データから抽出される。
【0057】このように第1写真/図形領域抽出におい
ては、2値化による領域分割が行われて得られた領域に
対して、領域の境界であるエッジの間の画像特徴量を算
出することにより、当該領域が写真領域であるか図形領
域であるかが判定される。そして、写真領域の方が図形
領域よりも優先度が高い場合(第1、第2、および第5
モード)、写真領域が確定され、当該領域が矩形領域の
形で抽出される。一方、図形領域の方が写真領域よりも
優先度が高い場合(第3、第4、および第6モード)、
図形領域が確定され、当該領域が矩形領域の形で抽出さ
れる。
【0058】本実施形態では、上記のように、図形領域
の明度分布はある程度均一である一方で、写真領域の明
度分布は分散しているという特徴に基づいて、写真領域
であるかまたは図形領域であるかが判定される。ただ
し、領域の判定方法は、これに限定されるものではな
く、たとえば明度画像から抽出される周波数成分を特徴
量として用いて領域の判定を行ってもよい。
【0059】(エッジによる領域分割)次に、図20を
参照して、エッジによる領域分割の手順について説明す
る。
【0060】エッジによる領域分割は、第1写真/図形
領域抽出によって写真領域または図形領域のうち優先度
が高い方の領域が抽出されて残ったデータに対して、実
行される。
【0061】まず、画像データにおけるR成分画像、G
成分画像、およびB成分画像のそれぞれに対して、たと
えばラプラシアンフィルタなどのエッジ検出フィルタを
使用することにより、エッジ検出が行われる(ステップ
S501〜S503)。続いて、検出されたR成分画
像、G成分画像、およびB成分画像の各エッジの和集合
を得るためのOR処理が行われ(ステップS504)、
さらにエッジの途切れをなくすために、クロージング処
理が行われる(ステップS505)。ここで、第1〜第
4モードの場合、文字領域の抽出がまだ行われていない
段階であるため、文字画像のエッジも検出されてしま
う。しかし、たとえば、領域の外接矩形の大きさ(縦お
よび横寸法)が所定の閾値より小さく、外接矩形の大き
さに対する領域内部の有効画素数の割合が所定の閾値よ
り小さい場合、当該領域は、エッジによる領域分割の対
象から除外される。これにより、文字画像のエッジは、
領域の境界とはみなされなくなる。
【0062】図21は、エッジによる領域分割によって
得られた領域の一例を模式的に示す図であって、(A)
は、第1、第2、または第5モードの場合、(b)は、
第3、第4、または第6モードの場合を示す。ここで、
図21(A)では、第1写真/図形領域抽出によって、
図形領域よりも先に写真領域が既に抽出されている。つ
まり、図21(B)に示す領域P1(領域G3を含
む)、および領域P2は、図21(A)においては写真
領域として抽出済みである。また、図21(B)では、
第1写真/図形領域抽出によって、写真領域よりも先に
図形領域が既に抽出されている。つまり、図21(A)
に示す領域G1、および領域G2(領域P3、P4を含
む)は、図21(B)においては写真領域として抽出済
みである。
【0063】このようにエッジによる領域分割は、第1
写真/図形領域抽出によって写真領域または図形領域の
うち優先度の高い方の領域が抽出されて残ったデータの
中に、優先度の高い方の領域が優先度の低い方の領域上
に重なった状態でまだ残っている場合、あるいは優先度
が高い方の領域が優先度の低い方の領域の内部に含まれ
た状態でまだ残っている場合に、当該優先度が高い方の
領域をさらに抽出するために行われる。つまり、上記エ
ッジを検出することによって、より細かい領域分割が行
われる。
【0064】(第2写真/図形領域抽出)次に、第2写
真/図形領域抽出の手順について説明する。第2写真/
図形領域抽出は、図21に示されるエッジによる領域分
割によって得られた領域に対して、前述した第1写真/
図形領域抽出と同様の処理が再度行われる。これによ
り、第1、第2、および第5モードの場合、第1写真/
図形領域抽出によっては写真領域として抽出されなかっ
た図形領域中の写真領域が抽出される。たとえば図21
(A)では、領域P3、P4が写真領域として追加的に
抽出される。また、第3、第4、および第6モードの場
合、第1写真/図形領域抽出によっては図形領域として
抽出されなかった写真領域中の図形領域が抽出される。
たとえば図21(B)では、領域G3が図形領域として
追加的に抽出される。
【0065】なお、図7〜図12に示される第2写真/
図形領域抽出の終了後に行われる写真/図形領域抽出に
おいては、図21に示されるエッジによる領域分割によ
って得られた領域のうち、第2写真/図形領域抽出によ
って抽出されずに残った領域が抽出される。
【0066】(文字領域抽出)次に、図22を参照し
て、文字領域抽出の手順について説明する。
【0067】ここでは、説明を簡単にするため、たとえ
ば図23に示される画像データに対して、文字領域抽出
に関する処理が行われる場合について説明する。
【0068】まず、画像データに対して、領域統合処理
が行われる(ステップS601)。この処理は、たとえ
ば背景画像上の文字画像、あるいは画素値が異なる文字
画像を含む文字領域をも抽出するための処理である。具
体的には、まず、画像データのうち明度画像に対して、
スムージング処理が施された後、変動閾値による2値化
を行うことにより、エッジ画像が作成される。変動閾値
による2値化処理とは、具体的には、たとえば図24に
示すように、5×5ブロック内の四隅に位置する画素の
階調値の最大値からオフセット値を減算した値を閾値と
して注目画素を2値化する処理である。続いて、得られ
たエッジ画像の主走査方向の黒画素の間隔を計測し、所
定間隔以下である黒画素間の白画素を全て黒画素で置換
して主走査方向に黒画素を連結した連結エッジ画像を作
成する。さらに、得られた連結エッジ画像の副走査方向
に対しても、同様の処理が繰り返され、主副走査方向に
黒画素を連結した連結エッジ画像が得られる。このよう
にして、画像処理装置1は、近隣の黒画素を連結し、画
像データ中で孤立している個々の文字画像を1つの領域
として統合することにより、ある程度まとまった文字列
ごとに1つの領域として抽出することが可能となるもの
である。
【0069】次に、領域抽出処理が行われる(ステップ
S602)。この処理は、連結した黒画素のまとまりを
1領域として別々に抽出する処理である。具体的には、
まず、得られた連結エッジ画像に対し、連結した黒画素
ごとにラベリングが施される。ラベリングと同時に、同
一ラベルの連結した黒画素ごとの外接矩形の位置情報
(幅、高さ、および座標)が検出され、ラベリング画像
が作成される。続いて、ラベリング時に検出された外接
矩形とラベル番号とに基づいて、ラベリング画像から当
該外接矩形で囲まれる領域が局所領域として抽出され
る。ここで、同一ラベル番号の画素だけを含む外接矩形
を抽出することにより、外接矩形同士が重なり合ったレ
イアウトの画像も分離して抽出することが可能となる。
図25は、変動閾値による2値化処理および黒画素の連
結処理を施して得られた連結エッジ画像と、連結エッジ
画像データから得られたラベリング画像において同一ラ
ベルの連結した黒画素ごとに求めた外接矩形とを示す図
である。
【0070】次に、ステップS602において抽出され
た各局所領域に属する画像の斜め方向エッジ成分が特徴
量として抽出され(S603)、斜め方向エッジ成分の
含有率が所定範囲内にある局所領域が、文字領域と判別
される(S604)。文字領域は、図形、写真、罫線等
の他の領域と比較して、小さい領域内に斜め方向エッジ
成分を多く含んでいる。したがって、文字領域特有の周
波数成分として斜め方向エッジ成分を抽出し局所領域に
おける含有率を求めることにより、当該局所領域が文字
領域であるか否かが判定され得る。かかる斜め方向エッ
ジ成分の抽出は、2×2DCT(離散コサイン変換)に
よって得られた周波数成分のうち高周波成分を抽出する
処理と同等である。すなわち、局所領域内の画像に対し
て2×2マトリクスによるDCTを施し、得られた周波
数成分のうちの高周波成分を「0」として逆DCT変換
を行うことにより、高周波成分を除去した復元画像が得
られる。そして、原画像と復元画像との差分を取り出す
ことにより、原画像の高周波成分のみが抽出され得る。
ここで、図26に示すフィルタ処理を施すことにより高
速な処理が可能である。図27は、抽出された高周波成
分を2値化して得られた斜め方向エッジ成分画像の一例
を示す図である。所領局域は、大体において単語単位と
なっている。このため、所領局域が文字領域である場
合、局所領域内の斜め方向エッジ成分の含有率、すなわ
ち、局所領域の面積に対する当該局所領域に属する図2
7の黒画素総数の比率は所定範囲内となる(約0.2〜
20%)。したがって、当該比率が上記範囲内である局
所領域が文字領域と判別される。
【0071】次に、文字画像作成処理が行われる(ステ
ップS605)。すなわち、ステップS604において
文字領域と判別された局所領域内における元の画像デー
タ(スキャナ2から受信した画像データ)を2値化する
ことによって文字部とその背景部とが区別され、文字部
のみからなる文字画像が作成される。2値化する際に使
用される閾値は、文字領域ごとに設定される。文字領域
ごとの閾値の設定方法としては、例えば以下の方法を用
いることができる。まず、文字領域ごとに、当該文字領
域内の画像データの明度画像を用いて、図28(A)に
示すような明度ヒストグラムを作成する。続いて、明度
ヒストグラムを当該文字領域内の画素数に対する百分率
に変換して二次微分を行い、二次微分の結果が所定値以
上であれば「1」、それ以外は「0」を出力することに
よって、図28(B)に示すようなピーク検出用ヒスト
グラムを作成し、ピークを検出する。そして、検出され
たピーク数が2以上のときは両端のピークの中心値、ピ
ーク数が1のときは当該ピークと前記明度ヒストグラム
の左右立ち上がり値(図28(A)における「Lef
t」および「Right」の値)の平均値、ピーク数が
0のときは前記明度ヒストグラムの前記左右立ち上がり
値の中心値を閾値と決定する。このように、文字領域内
の明度ヒストグラムのピーク数によって異なる2値化閾
値を用いるため、たとえば背景画像上の文字画像や反転
文字画像等も、画像が欠けることなく2値化可能とな
る。
【0072】次に、画像補間処理が行われる(ステップ
S606)。すなわち、元の画像データから、文字部の
みからなる文字画像が除去され、除去後の部分が、その
文字画像の背景画素で補間される。ここで、文字画像の
背景画素は、ステップS605において文字領域ごとに
2値化して得られた画像から特定することができる。補
間に使用される背景画素の値は、元のRGB画像データ
における文字画像の背景に相当する画素のRGBごとの
平均値を算出することにより与えられる。
【0073】このように、画像処理装置1は、近隣の黒
画素を連結することにより近接する領域を統合して、統
合された領域を抽出し、文字らしさを表す特徴量を算出
して、この特徴量を用いて抽出された各領域が文字領域
であるか否かを判別し、続いて、文字領域と判別された
領域内の画像データから文字部のみからなる文字画像を
作成する。そして、文字部のみからなる文字画像を除去
した後の部分を背景画素で補間する。
【0074】この文字領域抽出においては、文字画像が
写真画像または図形画像の上に重なっている場合であっ
ても、文字領域の確実な抽出が可能である。ただし、文
字領域よりも写真領域または図形領域が優先される原稿
モードが設定されている場合、写真画像または図形画像
の上に重なっている文字画像は、写真領域または図形領
域の一部として先に抽出されることになる。
【0075】上述のようにして、図7〜図12に示す設
定された原稿モードに応じた領域抽出順序で、スキャナ
から受信した画像データから、写真領域、図形領域、お
よび文字領域が分離される。
【0076】本実施形態によれば、画像データから写真
領域、図形領域、および文字領域を分離する際に、各領
域の抽出順を設定することができ、これにより、どの領
域を優先して抽出するかを制御することが可能となる。
したがって、優先度の高い領域は、その中に他の領域を
含んでいても当該他の領域を包含した状態で優先的に抽
出され、また、他の領域の中に含まれていても優先的に
抽出される。このように、優先度の高い領域は、他の領
域よりも先に抽出されるため他の領域と誤判別されて抽
出されることがなくなり、当該領域に対して不適切な処
理が施されて画像が劣化することが防止される。
【0077】図29〜図34は、図5の画像データか
ら、それぞれ第1〜第6モードの領域分離処理によって
分離された写真領域、図形領域、および文字領域を示す
図であって、(A)は最先に抽出された領域、(B)は
2番目に抽出された領域、(C)は3番目に抽出された
領域を示す。
【0078】第1優先領域が写真領域である場合(第1
および第2モード)、図29(A)および図30(A)
に示すように、受信した画像データから、写真領域が最
先に抽出された後に、残ったデータから図形領域と文字
領域とが分離されるため、写真領域は、他の領域の分離
処理の影響を受けて当該他の領域に付随して抽出される
ことがなくなる。これにより、写真領域は、他の領域と
誤判別されることなく確実に抽出され得る。したがっ
て、写真領域を高画質で再現することを主目的とする場
合、より多くの写真領域を確実に抽出して、当該領域に
対して適切な処理を実行することができる。換言すれ
ば、たとえば写真領域内のある部分が文字領域と誤判別
され、後工程において文字領域に適応した2値化処理が
行われてしまうことを防止することができる。また、た
とえば写真領域内のある部分が図形領域と誤判別され、
後工程において図形領域に適応した減色処理が行われて
単一色で塗り潰されてしまうことを防止することができ
る。つまり、写真領域に対して不適切な処理が施されて
写真画像が劣化することが防止される。また、写真領域
を優先して抽出することにより、元の画像データの内容
が維持される利点がある。すなわち、図形領域または文
字領域であるにもかかわらず当該領域を写真領域と誤判
別したとしても、画像として再現できるため当該領域の
内容が維持される。
【0079】さらに、写真領域抽出後の画像データか
ら、文字領域よりも先に図形領域を抽出する場合(第1
モード)、図形領域内のある部分が文字領域と誤判別さ
れ、後工程において文字領域に適応した処理が行われて
しまうことを防止することができる。したがって、写真
画像および図形画像に対する劣化が少なくなる。また、
写真領域抽出後の画像データから、図形領域よりも先に
文字領域を抽出する場合(第2モード)、図形領域内の
文字画像を抽出することが可能となる。したがって、写
真画像および文字画像に対する劣化が少なくなる。
【0080】第1優先領域が図形領域である場合(第3
および第4モード)、図31(A)および図32(A)
に示すように、受信した画像データから、図形領域が最
先に抽出された後に、残ったデータから写真領域と文字
領域とが分離されるため、図形領域は、他の領域の分離
処理の影響を受けて当該他の領域に付随して抽出される
ことがなくなる。これにより、図形領域は、他の領域と
誤判別されることなく確実に抽出され得る。したがっ
て、ベクタ変換処理などの図形領域に適応した処理を施
すことを主目的とする場合、より多くの図形領域を確実
に抽出して、当該領域に対して適切な処理を実行するこ
とができる。換言すれば、たとえば写真領域の中に図形
領域が重なって配置されている場合、全体が写真領域と
誤判別されJPEG圧縮されてしまってノイズが発生す
ることを防止することができる。また、たとえば文字画
像と間違いやすい図形画像を含む領域が文字領域と誤判
別されてしまって当該領域に対して文字領域に適応した
処理である2値化処理、さらには文字認識処理が実行さ
れることを防止することができる。つまり、図形領域に
対して不適切な処理が施されて図形画像が劣化すること
が防止される。
【0081】さらに、図形領域抽出後の画像データか
ら、文字領域よりも先に写真領域を抽出する場合(第3
モード)、写真領域内のある部分が文字領域と誤判別さ
れ、後工程において文字領域に適応した処理が行われて
しまうことを防止することができる。したがって、図形
画像および写真画像に対する劣化が少なくなる。また、
図形領域抽出後の画像データから、写真領域よりも先に
文字領域を抽出する場合(第4モード)、写真領域内の
文字画像を抽出することが可能となる。したがって、図
形画像および文字画像を劣化させることなく、写真画像
に対して非可逆の圧縮処理を行うことができる。
【0082】第1優先領域が文字領域である場合(第5
および第6モード)、図33(A)および図34(A)
に示すように、受信した画像データから、文字領域が最
先に抽出された後に、残ったデータから写真領域と図形
領域とが分離されるため、文字領域は、他の領域の分離
処理の影響を受けて当該他の領域に付随して抽出される
ことがなくなる。これにより、文字領域は、他の領域と
誤判別されることなく確実に抽出され得る。したがっ
て、文字認識処理などの文字領域に適応した処理を施す
ことを主目的とする場合、より多くの文字領域を確実に
抽出して、当該領域に対して適切な処理を実行すること
ができる。換言すれば、たとえば画像データ中で文字画
像が写真画像または図形画像の上に重なっている場合、
文字領域が判別されないで全体が写真領域または図形領
域と判別されて抽出されてしまって、文字画像に対する
文字認識処理を十分に実行できないばかりか、文字画像
に対して不適切な処理が施されることを防止することが
できる。
【0083】さらに、文字領域抽出後の画像データか
ら、図形領域よりも先に写真領域を抽出する場合(第5
モード)、たとえば図形領域に内包されている写真領域
を抽出することが可能である。したがって、文字画像お
よび写真画像に対する劣化が少なくなる。また、文字領
域抽出後の画像データから、写真領域よりも先に図形領
域を抽出する場合(第6モード)、たとえば写真領域に
内包されている図形領域を抽出することが可能である。
したがって、文字画像および図形画像を劣化させること
なく、写真画像に対して非可逆の圧縮処理を行うことが
できる。
【0084】本発明は、上述した実施の形態のみに限定
されるものではなく、特許請求の範囲内において、種々
改変することができる。
【0085】本発明の画像処理装置は、上記実施形態で
示した態様以外に、スキャナ、パソコン、ワークステー
ション、サーバ等のコンピュータ、デジタル複写機、フ
ァクシミリ装置、およびMFP(multi-function perip
heral)等の機器にも応用することができる。
【0086】また、上記実施形態では、ファイルサーバ
3が、画像処理装置1から受信したファイルから文字画
像および図形画像を展開して、それぞれ文字認識処理お
よびベクタ変換処理を施す構成とされているが、これら
の処理は画像処理装置1により行われてもよい。また、
図7〜図12の各領域分離処理における個々の処理ブロ
ックの内容は適宜変更が可能である。
【0087】また、上記実施形態では、画像処理装置1
は、写真領域、図形領域、および文字領域のうちで画像
データの内容に応じて優先的に抽出される領域を設定す
る構成とされているが、本発明はこれに限定されない。
本発明による画像処理装置では、あらかじめ最先に抽出
される領域が固定されていてもよく、たとえば文字領域
が最先に抽出される領域として固定され得る。また、本
発明による画像処理装置では、あらかじめ領域の抽出順
が固定されていてもよく、たとえば文字領域、写真領域
および図形領域の順、あるいは文字領域、図形領域およ
び写真領域の順が領域の抽出順として固定され得る。
【0088】本発明による画像処理装置および画像処理
方法は、上記各手順を実行するための専用のハードウエ
ア回路によっても、また、上記各手順を記述した所定の
プログラムをCPUが実行することによっても実現する
ことができる。後者により本発明を実現する場合、画像
処理装置を動作させる上記所定のプログラムは、フレキ
シブルディスクやCD−ROM等のコンピュータ読取可
能な記録媒体によって提供されてもよいし、インターネ
ット等のネットワークを介してオンラインで提供されて
もよい。この場合、コンピュータ読取可能な記録媒体に
記録されたプログラムは、通常、ハードディスク等に転
送され記憶される。また、このプログラムは、たとえ
ば、単独のアプリケーションソフトとして提供されても
よいし、画像処理装置の一機能としてその装置のソフト
ウエアに組み込んでもよい。
【0089】なお、上述した本発明の実施形態には、特
許請求の範囲の請求項1〜5に記載した発明以外にも、
以下の付記1〜6に示すような発明が含まれる。
【0090】[付記1] 前記第1領域分割処理は、前
記画像データから文字領域が抽出されて残ったデータに
おける写真領域または図形領域の部分とこれら以外の下
地部分とを区別した2値画像のエッジを検出することに
より、複数の所定領域に分割可能であり、前記第2領域
分割処理は、前記画像データから文字領域が抽出されて
残ったデータから写真領域がさらに抽出されて残ったデ
ータのエッジを検出することにより、前記所定領域より
も小さい複数の領域に分割可能であることを特徴とする
請求項4に記載の画像処理装置。
【0091】[付記2] 前記第1領域分割処理は、前
記画像データから文字領域が抽出されて残ったデータに
おける写真領域または図形領域の部分とこれら以外の下
地部分とを区別した2値画像のエッジを検出することに
より、複数の所定領域に分割可能であり、前記第2領域
分割処理は、前記画像データから文字領域が抽出されて
残ったデータから図形領域がさらに抽出されて残ったデ
ータのエッジを検出することにより、前記所定領域より
も小さい複数の領域に分割可能であることを特徴とする
請求項5に記載の画像処理装置。
【0092】[付記3] 原稿を読み取ることによって
画像データを得る読取手段をさらに有し、前記処理しよ
うとする画像データは、前記読取手段によって得られる
ことを特徴とする請求項1〜5、付記1、2のいずれか
1つに記載の画像処理装置。
【0093】[付記4] 処理しようとする画像データ
から、写真領域、図形領域、および文字領域を分離する
領域分離段階を有する画像処理方法であって、前記領域
分離段階は、前記画像データから、写真領域および図形
領域よりも先に文字領域を抽出し、前記画像データから
文字領域が抽出されて残ったデータから、写真領域と図
形領域とを分離する段階であることを特徴とする画像処
理方法。
【0094】[付記5] 処理しようとする画像データ
から、写真領域、図形領域、および文字領域を分離する
領域分離手順を有する画像処理プログラムであって、前
記領域分離手順は、前記画像データから、写真領域およ
び図形領域よりも先に文字領域を抽出し、前記画像デー
タから文字領域が抽出されて残ったデータから、写真領
域と図形領域とを分離する手順であることを特徴とする
画像処理プログラム。
【0095】[付記6] 付記5に記載の画像処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒
体。
【0096】
【発明の効果】上述したように、本発明の画像処理装置
によれば、処理しようとする画像データから、文字領域
が最先に抽出された後に、残ったデータから写真領域と
図形領域とが分離され得る。このため、文字領域は、他
の領域の分離処理の影響を受けて当該他の領域に付随し
て抽出されることがなくなる。これにより、文字領域
は、他の領域と誤判別されることなく確実に抽出され得
る。したがって、文字認識処理などの文字領域に適応し
た処理を施すことを主目的とする場合、より多くの文字
領域を確実に抽出して、当該領域に対して適切な処理を
実行することができる。
【図面の簡単な説明】
【図1】 本発明の実施形態にかかる画像処理装置を含
む画像処理システムの全体構成を示すブロック図であ
る。
【図2】 画像処理装置の構成の一例を示すブロック図
である。
【図3】 操作部における原稿モード設定画面の一例を
示す図である。
【図4】 画像処理装置における処理の手順を示すフロ
ーチャートである。
【図5】 スキャナから受信した画像データの一例を模
式的に示す図である。
【図6】 領域の合成を説明するための図であって、
(A)は合成後の状態を示す図、(B)は合成前の状態
を示す図である。
【図7】 第1モードの領域分離処理の手順を示すフロ
ーチャートである。
【図8】 第2モードの領域分離処理の手順を示すフロ
ーチャートである。
【図9】 第3モードの領域分離処理の手順を示すフロ
ーチャートである。
【図10】 第4モードの領域分離処理の手順を示すフ
ローチャートである。
【図11】 第5モードの領域分離処理の手順を示すフ
ローチャートである。
【図12】 第6モードの領域分離処理の手順を示すフ
ローチャートである。
【図13】 2値化による領域分割の手順を示すフロー
チャートである。
【図14】 図5の下地以外の領域を黒く塗り潰した2
値画像を示す図である。
【図15】 図14のエッジから構成される画像を示す
図である。
【図16】 第1写真/図形領域抽出の手順を示すフロ
ーチャートである。
【図17】 図16から続く第1写真/図形領域抽出の
手順を示すフローチャートである。
【図18】 第1ヒストグラムを示す図である。
【図19】 第2ヒストグラムを示す図である。
【図20】 エッジによる領域分割の手順を示すフロー
チャートである。
【図21】 エッジによる領域分割によって得られた領
域の一例を模式的に示す図であって、(A)は第1、第
2、または第5モードの場合、(b)は第3、第4、ま
たは第6モードの場合を示す。
【図22】 文字領域抽出の手順を示すフローチャート
である。
【図23】 文字領域抽出の説明のために用いられる画
像データを示す図である。
【図24】 変動閾値による2値化処理を説明するため
の図である。
【図25】 変動閾値による2値化処理および黒画素の
連結処理を施して得られた連結エッジ画像と、連結エッ
ジ画像データから得られたラベリング画像において同一
ラベルの連結した黒画素ごとに求めた外接矩形とを示す
図である。
【図26】 画像データの特徴周波数成分から高周波成
分を除去する際に用いられるフィルタ処理を説明するた
めの図である。
【図27】 抽出された高周波成分を2値化して得られ
た斜め方向エッジ成分画像の一例を示す図である。
【図28】 文字領域内の画像データの明度画像から作
成した(A)明度ヒストグラムと、(B)ピーク検出用
ヒストグラムとの一例を示す図である。
【図29】 第1モードの領域分離処理において、図5
の画像データから、(A)最先に抽出された写真領域、
(B)2番目に抽出された図形領域、および(C)3番
目に抽出された文字領域を示す図である。
【図30】 第2モードの領域分離処理において、図5
の画像データから、(A)最先に抽出された写真領域、
(B)2番目に抽出された文字領域、および(C)3番
目に抽出された図形領域を示す図である。
【図31】 第3モードの領域分離処理において、図5
の画像データから、(A)最先に抽出された図形領域、
(B)2番目に抽出された写真領域、および(C)3番
目に抽出された文字領域を示す図である。
【図32】 第4モードの領域分離処理において、図5
の画像データから、(A)最先に抽出された図形領域、
(B)2番目に抽出された文字領域、および(C)3番
目に抽出された写真領域を示す図である。
【図33】 第5モードの領域分離処理において、図5
の画像データから、(A)最先に抽出された文字領域、
(B)2番目に抽出された写真領域、および(C)3番
目に抽出された図形領域を示す図である。
【図34】 第6モードの領域分離処理において、図5
の画像データから、(A)最先に抽出された文字領域、
(B)2番目に抽出された図形領域、および(C)3番
目に抽出された写真領域を示す図である。
【符号の説明】
1…画像処理装置、 101…制御部、 102…記憶部、 103…操作部、 104…入力インタフェース部、 105…出力インタフェース部、 106…領域分離部、 108…画像処理部、 108a…写真領域処理部、 108b…図形領域処理部、 108c…文字領域処理部、 109…文書ファイル作成部、 110…ファイル形式変換部、 111…バス、 2…スキャナ、 3…ファイルサーバ、 4…コンピュータネットワーク。
フロントページの続き (72)発明者 田中 芳則 大阪市中央区安土町二丁目3番13号 大阪 国際ビル ミノルタ株式会社内 (72)発明者 小澤 昌裕 大阪市中央区安土町二丁目3番13号 大阪 国際ビル ミノルタ株式会社内 Fターム(参考) 5C076 AA01 AA36 BA06 CA10 5C077 MP05 MP07 PP25 PP27 PP28 PP47 PQ19 RR02 5L096 BA17 FA06 FA35 FA44 FA45 GA34

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 処理しようとする画像データから、写真
    領域、図形領域、および文字領域を分離する領域分離手
    段を有する画像処理装置であって、 前記領域分離手段は、 前記画像データから、写真領域および図形領域よりも先
    に文字領域を抽出する文字領域最先抽出手段を備え、前
    記画像データから文字領域が抽出されて残ったデータか
    ら、写真領域と図形領域とを分離することを特徴とする
    画像処理装置。
  2. 【請求項2】 前記領域分離手段は、 前記画像データから文字領域が抽出されて残ったデータ
    から、図形領域よりも先に写真領域を抽出する写真領域
    先行抽出手段をさらに備えていることを特徴とする請求
    項1に記載の画像処理装置。
  3. 【請求項3】 前記領域分離手段は、 前記画像データから文字領域が抽出されて残ったデータ
    から、写真領域よりも先に図形領域を抽出する図形領域
    先行抽出手段をさらに備えていることを特徴とする請求
    項1に記載の画像処理装置。
  4. 【請求項4】 前記写真領域先行抽出手段は、 前記画像データから文字領域が抽出されて残ったデータ
    に対して、複数の所定領域に分割し得る第1領域分割処
    理を施し、分割された領域のうちで写真領域を抽出する
    第1写真領域抽出手段と、 前記画像データから文字領域が抽出されて残ったデータ
    から前記第1写真領域抽出手段により写真領域がさらに
    抽出されて残ったデータに対して、前記所定領域よりも
    小さい複数の領域に分割し得る第2領域分割処理を施
    し、分割された領域のうちで写真領域を抽出する第2写
    真領域抽出手段とを有することを特徴とする請求項2に
    記載の画像処理装置。
  5. 【請求項5】 前記図形領域先行抽出手段は、 前記画像データから文字領域が抽出されて残ったデータ
    に対して、複数の所定領域に分割し得る第1領域分割処
    理を施し、分割された領域のうちで図形領域を抽出する
    第1図形領域抽出手段と、 前記画像データから文字領域が抽出されて残ったデータ
    から前記第1図形領域抽出手段により図形領域がさらに
    抽出されて残ったデータに対して、前記所定領域よりも
    小さい複数の領域に分割し得る第2領域分割処理を施
    し、分割された領域のうちで図形領域を抽出する第2図
    形領域抽出手段とを有することを特徴とする請求項3に
    記載の画像処理装置。
JP2001389764A 2001-12-21 2001-12-21 画像処理装置 Expired - Fee Related JP3931651B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001389764A JP3931651B2 (ja) 2001-12-21 2001-12-21 画像処理装置
US10/322,700 US7340092B2 (en) 2001-12-21 2002-12-19 Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001389764A JP3931651B2 (ja) 2001-12-21 2001-12-21 画像処理装置

Publications (3)

Publication Number Publication Date
JP2003189096A true JP2003189096A (ja) 2003-07-04
JP2003189096A5 JP2003189096A5 (ja) 2005-06-23
JP3931651B2 JP3931651B2 (ja) 2007-06-20

Family

ID=27597886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001389764A Expired - Fee Related JP3931651B2 (ja) 2001-12-21 2001-12-21 画像処理装置

Country Status (1)

Country Link
JP (1) JP3931651B2 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309772A (ja) * 2004-04-21 2005-11-04 Omron Corp 文字成分抽出装置
JP2009089383A (ja) * 2007-10-01 2009-04-23 Toshiba Corp 画像読取装置、画像読取方法
JP2010004137A (ja) * 2008-06-18 2010-01-07 Konica Minolta Business Technologies Inc 画像処理装置および画像処理方法
JP2010004481A (ja) * 2008-06-23 2010-01-07 Canon Inc 画像処理装置及び画像処理方法
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US7692669B2 (en) 2006-05-26 2010-04-06 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method and image processing program
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
JP2010225047A (ja) * 2009-03-25 2010-10-07 Seiko Epson Corp ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体
JP2010532628A (ja) * 2007-06-29 2010-10-07 トムソン ライセンシング 画像中のアーチファクトを低減させる装置および方法
WO2012056610A1 (ja) * 2010-10-25 2012-05-03 日本電気株式会社 コンテンツシーン判定装置
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image
JP2013186610A (ja) * 2012-03-07 2013-09-19 Nikon Systems Inc 文字抽出装置および文字抽出プログラム
JP2018500702A (ja) * 2015-10-30 2018-01-11 小米科技有限責任公司Xiaomi Inc. 領域認識方法及び装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309772A (ja) * 2004-04-21 2005-11-04 Omron Corp 文字成分抽出装置
US7660014B2 (en) 2006-01-17 2010-02-09 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of extracting rule from document image with high precision
US8208744B2 (en) 2006-01-23 2012-06-26 Konica Minolta Business Technologies, Inc. Image processing apparatus capable of accurately and quickly determining character part included in image
US7692669B2 (en) 2006-05-26 2010-04-06 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method and image processing program
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
US8472709B2 (en) 2007-06-29 2013-06-25 Thomson Licensing Apparatus and method for reducing artifacts in images
JP2010532628A (ja) * 2007-06-29 2010-10-07 トムソン ライセンシング 画像中のアーチファクトを低減させる装置および方法
JP2009089383A (ja) * 2007-10-01 2009-04-23 Toshiba Corp 画像読取装置、画像読取方法
JP2010004137A (ja) * 2008-06-18 2010-01-07 Konica Minolta Business Technologies Inc 画像処理装置および画像処理方法
JP2010004481A (ja) * 2008-06-23 2010-01-07 Canon Inc 画像処理装置及び画像処理方法
US8284459B2 (en) 2008-06-23 2012-10-09 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP2010225047A (ja) * 2009-03-25 2010-10-07 Seiko Epson Corp ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体
WO2012056610A1 (ja) * 2010-10-25 2012-05-03 日本電気株式会社 コンテンツシーン判定装置
JP2013186610A (ja) * 2012-03-07 2013-09-19 Nikon Systems Inc 文字抽出装置および文字抽出プログラム
JP2018500702A (ja) * 2015-10-30 2018-01-11 小米科技有限責任公司Xiaomi Inc. 領域認識方法及び装置

Also Published As

Publication number Publication date
JP3931651B2 (ja) 2007-06-20

Similar Documents

Publication Publication Date Title
US7340092B2 (en) Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored
JP4772888B2 (ja) 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
US7903307B2 (en) Image processing method and image processing apparatus
US8384964B2 (en) Image processing apparatus and image processing method
JP3931651B2 (ja) 画像処理装置
JP2009135796A (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像形成装置、記憶媒体
US20030107781A1 (en) Image processing apparatus, image processing method and image processing program
US8620081B2 (en) Image processing apparatus, method, and storage medium for determining attributes
JP4557843B2 (ja) 画像処理装置及びその方法
JP6628279B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP6923037B2 (ja) 画像処理装置、画像処理方法およびプログラム
KR101224936B1 (ko) 화상 처리 장치, 화상 형성 장치, 및 컴퓨터 판독 가능한 매체
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JPH10126631A (ja) 原稿種判定方法、カラー画像処理装置および記録媒体
JP4032735B2 (ja) 画像処理装置および画像処理方法
JP4659789B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
JP4165599B2 (ja) 画像処理装置
JP4032734B2 (ja) 画像処理装置
JP4084537B2 (ja) 画像処理装置、画像処理方法および記録媒体並びに画像形成装置
US7545540B2 (en) Method and system for processing color image data
US20100188670A1 (en) Image processing apparatus, image processing method and program executing the image processing method
JP3882657B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1040373A (ja) 画像処理装置及び方法
JP3882603B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP7248944B2 (ja) 画像処理装置、および、コンピュータプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041006

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20041006

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041006

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20041006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060919

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070305

R150 Certificate of patent or registration of utility model

Ref document number: 3931651

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100323

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110323

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120323

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130323

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140323

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees