JP2000295468A - 画像処理装置 - Google Patents
画像処理装置Info
- Publication number
- JP2000295468A JP2000295468A JP11094981A JP9498199A JP2000295468A JP 2000295468 A JP2000295468 A JP 2000295468A JP 11094981 A JP11094981 A JP 11094981A JP 9498199 A JP9498199 A JP 9498199A JP 2000295468 A JP2000295468 A JP 2000295468A
- Authority
- JP
- Japan
- Prior art keywords
- image
- area
- image data
- document
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
う。 【解決手段】書類の画像を画像入力部101で取り込
み、領域識別部102で取り込んだ画像データから文
字、写真、図、表、網点領域を抽出し、画像種別判定部
103で文字、写真、図、表、網点などと領域毎に識別
された結果から、網点、写真といったキーとなる領域の
有無や、矩形領域の重なりの度合いから文書構造として
の複雑さなどといった特徴量を求めることにより、入力
された画像データがどのような種類の文書であるかの判
定を行い、データ変換部104で判定された文書種類に
したがった画像データ形式の変換処理を行い、画像出力
部105において画像データ形式が変換された出力画像
を出力する。
Description
をファイリングあるいは複写する際に行うデータ形式や
濃度値など変換処理のための画像処理装置に関する。
その画像をハードコピーとして出力したり、イメージフ
ァイルとして保存したりする技術として、複写機および
パソコンにおけるイメージ取り込みに利用される技術
や、ファイリングシステムやデータベースに利用される
技術がある。
像として利用者が見やすくするために画像処理を施す場
合がある。例えば、文書画像に文字が含まれている場
合、ハイパスフィルタ処理を施すことによって、文字の
エッジ部分が強調され、くっきりとした出力になり、読
みやすい文字となる。また、写真の場合、滑らかな階調
を再現するためにローパスフィルタを施すことによっ
て、ざらつき感が無くなり、奇麗な出力となる。同じ写
真であっても、網点で構成された網点写真であるのか、
あるいは、銀塩写真であるのかによって処理を切り替え
ることも可能である。以上のように、文書画像の種類に
よって処理手法を変更することは、ハードコピーとして
出力する際も、イメージファイルとして保存する際にも
非常に有効である。
域がそれぞれ単独にあるいは重なり合って構成されてい
る。したがって、画像処理を行なう場合、文書画像にど
のような領域がどのように構成されているかを検知する
必要がある。
成する要素を識別するために、特願平8−34702号
に記載されているように、レイアウト解析を利用して、
文書画像の構造を抽出する方法がある。この方法では、
2値化処理を行なった後に画素の連結性を調べ、連結し
ている画素同士を領域として抽出し、その位置や大きさ
等の特徴量を利用して識別するものである。この方法の
場合、前処理として2値化を行なっているため、写真等
の中間的な濃度値を含んだ領域を正確に抽出することが
困難であった。
願平10−053317号に記載されているように、多
値画像を複数枚の2値画像に変換し、各々の2値画像に
対してレイアウト解析を行うことにより、写真等の中間
的な濃度値を含んだ領域を正確に抽出するものがある。
この方法では、網点上にある文字といった領域が重なり
合った場合においても、領域の抽出が正しく行えるとい
う利点がある。
構造を持つことがある。例えば、雑誌の表紙やグラフィ
ックが多用された広告など、文字や図、写真が複雑に重
なり合っているものがあげられる。このような文書原稿
に対して、特願平10−053317号に記載されてい
るような矩形による領域識別を行うと、領域が不自然に
分割される場合がある。その領域識別の結果を用いて画
像処理を施すと、逆にユーザにとって見にくいものとな
る恐れがある。
アウト構造を持つ文書原稿も存在する。例えば、写真の
みで構成されていたり、文字のみあるいは文字と網点下
地のみで構成されていたりする場合などがこれに該当す
る。このような場合、文書原稿全体に対して同じ画像処
理を施すことで済むにもかかわらず、領域毎の識別結果
を用いて処理を行うため、処理時間のコストがかかるこ
とが予想される。
処理を行うため不都合が生じる場合があった。
の画像処理装置において、多値画像を複数枚の2値画像
に変換し、各々の2値画像に対してレイアウト解析を利
用して、文書画像の構造を領域として抽出し、その領域
毎の属性にしたがって画像処理を行うため、不自然な領
域が発生して画像の劣化を起こしたり、不要な処理時間
がかかったり効率が悪いといった問題があった。
して効率的に画像処理を行うことのできる画像処理装置
を提供することを目的とする。
は、文書画像を入力する入力手段と、この入力手段で入
力された画像データから画素の特徴を用いて領域を抽出
し、この抽出された領域の属性を識別する領域識別手段
と、この領域識別手段で識別された属性毎の領域の分布
から上記画像データの種類を判定する判定手段とから構
成されている。
力する入力手段と、この入力手段で入力された画像デー
タから画素の特徴を用いて領域を抽出し、この抽出され
た領域の属性を識別する領域識別手段と、この領域識別
手段で識別された属性毎の領域の分布から上記画像デー
タの種類を判定する判定手段と、この判定手段で判定さ
れた種類に応じて上記画像データの解像度、圧縮率、色
数などを変換する変換手段と、この変換手段で変換され
た画像データを出力する出力手段とから構成されてい
る。
力する入力手段と、この入力手段で入力された画像デー
タから画素の特徴を用いて領域を抽出し、この抽出され
た領域の属性を識別する領域識別手段と、この領域識別
手段で識別された属性毎の領域の分布から上記画像デー
タの種類を判定する判定手段と、この判定手段で判定さ
れた種類に応じて濃度変換あるいはフィルタ処理を施し
て上記画像データを補正する補正手段と、この補正手段
で補正された画像データを出力する出力手段とから構成
されている。
力する入力手段と、この入力手段で入力された画像デー
タから画素の特徴を用いて領域を抽出し、この抽出され
た領域の属性を識別する領域識別手段と、この領域識別
手段で識別された属性毎の領域の分布から上記画像デー
タの種類を判定する判定手段と、この判定手段で判定さ
れた種類に応じて上記画像データの画像形式を変更する
変更手段と、この変更手段で変更された画像形式の画像
データを記憶する記憶手段とから構成されている。
力する入力手段と、この入力手段で入力された画像デー
タから画素の特徴を用いて領域を抽出し、この抽出され
た領域の属性を識別する領域識別手段と、この領域識別
手段で識別された属性毎の領域の分布から上記画像デー
タの種類を判定する判定手段と、この判定手段で判定さ
れた種類に応じて、画像ファイリング、印刷、送信、レ
イアウト理解、文字認識、罫線抽出などの画像処理のア
プリケーションを選択し、パラメータを設定後、アプリ
ケーションを起動させ上記画像データの画像処理を行う
処理手段と、この処理手段で画像処理された画像データ
を出力する出力手段とから構成されている。
ついて図面を参照して説明する。
理装置の概略構成を示すものである。図1において、1
01は画像入力部、102は領域識別部、103は画像
種別判定部、104はデータ変換部、105は画像出力
部である。
装置であり、書類を読み取って画像データに変換する装
置であるイメージスキャナ等の画像入力装置により、文
書等の書類から描かれているものを取り込む装置であ
る。なお、本発明における画像入力部はイメージスキャ
ナ等の読み取り装置で構成されたものでも良いし、既に
画像データとしてファイリング装置等に保存された画像
イメージを取り込む装置で構成されても良い。
おいて入力された画像データから文字を持った画素を領
域として識別するものである。まず、画像入力部101
において入力された画像データに対して、周辺画素の濃
度差や彩度などの状態によって複数の2値の画像データ
に分離し、その画像より文字や図形等が物理的にあるい
は論理的に連結されている各領域に分割して抽出し、そ
の領域の位置、大きさ、形状、構造、濃度分布等の特徴
量を計測して、文書要素としての属性を決定する。文書
要素の種類として、文字、写真、図、表、網点などがあ
げられる。
な手法として、既に公知となっているものがあり、例え
ば、特願平10−053317号で開示されている手法
により実現しても良い。この場合、画像分離部102の
出力として、文字画像、中間調画像、下地画像、網点画
像、カラー画像、グレー画像、黒画像の7つの2値分離
画像データが生成される。
な手法として、既に公知となっているものがあり、例え
ば、特願平8−34702号で開示されている手法によ
り実現しても良い。領域識別部102では、単一画像デ
ータからだけではなく、複数画像データでの特徴量をル
ールにしたがって統合し、入力された画像データの領域
属性を決定する。例えば、文字画像と中間調画像の双方
から同じ位置に領域が抽出された場合、その領域の種類
や領域の大きさはどれだけなのかを決定する。具体的な
例として、文字画像上に写真領域が存在し、同じ位置に
中間調画像に中間調画素が存在する場合、連続階調写真
領域と決定する。複数画像データからの領域属性決定の
具体的手法として、既に公知となっているものがあり、
例えば、特願平10−053317号で開示されている
手法により実現しても良い。
が、領域識別部102において文字、写真、図、表、網
点などと領域毎に識別された結果から、網点、写真とい
ったキーとなる領域の有無や、矩形領域の重なりの度合
いから文書構造としての複雑さなどといった特徴量を求
めることにより、入力された画像データがどのような種
類の文書であるのか判定を行う。
ば、1下地が一様であって、文字、図、表などしか存在
しないもの。
か存在しないもの。
点写真が混在していて、なおかつ矩形で領域を抽出する
ことが可能なもの、または文字、図、表、網点のうち少
なくとも一つと連続写真が混在し、なおかつ矩形で領域
を抽出することが可能なもの。
点写真が混在していて、なおかつ矩形で領域を抽出する
ことが不可能なもの、または文字、図、表、網点のうち
少なくとも一つと連続写真が混在し、なおかつ矩形で領
域を抽出することが不可能なもの。
が、画像種別判定部103において判定された文書の種
類にしたがって入力画像データの形式の変更を行う。画
像データの形式の変更とは、例えば、解像度、圧縮率、
色数などを変更することであっても良い。また、属性の
領域情報を画像に変換したものでも良い。属性の領域情
報を画像に変換する具体的な手法として、既に公知とな
っているものがあり、例えば、特願平10−05331
7号で開示されている手法により実現しても良い。
によって変換された画像データを出力するものである。
出力形態としては、ハードコピーであったり、イメージ
ファイルとしてストレイジに保存したりしても良い。
画像処理装置の処理を説明する。
る文書処理手順の例を示すフローチャートである。この
フローチャートを参照しながら本発明による画像処理装
置の処理の流れを説明する。
り取り込む(ステップST201)。すなわち、スキャ
ナ等の画像入力装置を利用して書類から画像を読み取っ
たり、またはファイリングシステム等の画像ファイルデ
ータを入力したりしたものを、画像入力部101により
画像データに変換する。
から1ライン分、または数ライン分ずつ読み取り、周辺
画素の濃度差や彩度などの画素ごとの状態によって複数
の2値画像データに分離され、文字や図形等が物理的に
あるいは論理的に連結されている各領域毎に分割して抽
出し、その領域の位置、大きさ、形状、構造、濃度分布
等の特徴量を計測して領域の種類や重要度等の識別を行
ない、その結果、文字、写真、図、表、網点領域を抽出
する(ステップST202)。入力された画像の全画素
に対して処理が終了するまで繰り返す(ステップST2
03)。
判定部103において、文字、写真、図、表、網点など
と領域毎に識別された結果から、網点、写真といったキ
ーとなる領域の有無や、矩形領域の重なりの度合いから
文書構造としての複雑さなどといった特徴量を求めるこ
とにより、入力された画像データがどのような種類の文
書であるのか判定を行う(ステップST204)。な
お、画像種別判定部103における具体的な処理の内容
の詳細は、図3を参照して後述する。
を決定した後、データ変換部104において、文書種類
にしたがった画像データ形式の変換処理を行う(ステッ
プST205)。なお、データ変換部104における具
体的な処理の内容の詳細は、図5を参照して後述する。
ータ形式を変換した出力画像を出力する(ステップST
206)。
である。次に個々の要素の処理の詳細を説明する。
03における一例としての画像種別判定処理の詳細を示
すフローチャートであり、図2に示したステップST2
04で行われる処理のフローチャートである。画像種別
判定処理は、画素毎の領域識別結果を利用して、入力さ
れた画像データが文書としてどのような種類なのかを判
定する処理である。
一例を説明する。
領域が存在しないものをさす。したがって文字領域の
み、または何もかかれていない白紙の状態のいずれかが
これに該当する。
つ網点領域内に文字領域が存在するものをさす。
つ網点領域内に写真領域が存在し、かつ文字領域が存在
しないものをさす。
域が存在せず、かつ写真領域のみが存在するものをさ
す。
地原稿、網点写真原稿、連続階調原稿のいずれの条件に
当てはまらなく、かつ複雑なレイアウト構造を持ってい
ないで、文字、網点、写真、図表等の領域毎に分割が可
能なものをさす。
字、網点、写真、図表等の領域毎に分割が不可能なもの
は識別不能原稿として、他の原稿と区別する。
域識別部102において識別された複数画像データの領
域の種類や重要度を用いて、入力された画像データの画
素ごとの属性を決定したもので、各々の文書要素ごとの
領域として表されている。
読み取り、網点領域が存在するか調べる(ステップST
301)。網点領域が存在する場合、次に写真領域が存
在するか調べる(ステップST302)。写真領域が存
在する場合、さらに文字領域が存在するか調べる(ステ
ップST303)。もし文字領域が存在するなら、矩形
識別候補原稿152となる。矩形識別候補原稿152
は、この後レイアウト構造の複雑さを検証する処理を行
い、矩形識別原稿または識別不能原稿に分類する。この
処理の詳細な説明は図4を用いて後述する。
ない場合、網点写真原稿153となる。
ない場合、網点領域内に文字領域が存在するか調べる
(ステップST304)。網点領域内に文字領域が存在
する場合、網点下地原稿154となる。網点領域内に文
字領域が存在しない場合、さらに網点領域外に文字領域
が存在しないか調べる(ステップST305)。網点領
域外に文字領域が存在しない場合、網点写真原稿153
となる。網点領域外に文字領域が存在する場合、矩形識
別候補原稿152となる。
ない場合、写真領域が存在するか調べる(ステップST
306)。写真領域が存在しない場合、一様下地原稿1
56となる。写真領域が存在する場合、さらに文字領域
が存在するか調べる(ステップST307)。文字領域
が存在しない場合、連続階調写真原稿155となる。文
字領域が存在する場合、矩形識別候補原稿152とな
る。
矩形識別候補原稿152、網点写真原稿宇153、網点
下地原稿154、連続階調写真原稿155、一様下地原
稿156のいずれかに決定される。
判定部103における一例としての画像種別判定処理の
詳細を示すフローチャートであり、図3に示した矩形識
別候補原稿152に対して行われる処理のフローチャー
トである。
合、レイアウト構造の複雑さを検証する処理を行い、矩
形識別原稿または識別不能原稿に分類するが、その際の
レイアウト構造の複雑さを測る指標の一例として、矩形
領域の重なり度合いを計測しても良い。直接、矩形の重
なりを検証しても良いが、矩形領域の数が多くなると、
比較する回数が劇的に増加することが想定される。そこ
で重なり度合いを予め用意した2次元の投票空間に矩形
サイズを投票し、その投票空間の状態から推定しても良
い(ステップST401)。
を計測するためのものであるため、解像度は元の画像の
解像度より低いもので良い。投票は、矩形領域の座標位
置を投票空間の座標位置に変換した個所にその領域の矩
形サイズなどの特徴を加算することによりなされる。矩
形サイズの例としては、矩形の幅や高さや面積値などの
いずれかを用いることが可能である。また、矩形領域の
属性、つまり、文字、写真、図表、網点などの属性にし
たがって投票値に重みを付けても良い。例えば、写真や
図表のように、レイアウト構造に大きな影響を与える属
性は重み付けを大きくし、文字などは重み付けを小さく
すると、写真や図表の重なった領域の投票値は大きくな
る。レイアウト構造の複雑さを考慮すると、写真や図表
の重なりというのは複雑なものに分類される。したがっ
て、この場合は複雑なものと見做しやすくなる。また、
処理をより高速に行うために、投票する矩形領域を制限
することも可能である。例えば、小さな文字領域はレイ
アウト構造を判定する際に大きな影響を与えるものでは
ないことがある。このような場合、投票する矩形サイズ
を制限することで、投票回数の削減が図られ、その結果
高速になることが予想される。ただし、画像データに存
在する文字領域が小さな文字領域のみで構成されている
場合は、一概に除外することはできない。そのような場
合、領域識別部102の出力である画素属性データの状
態によって制限を調整することも可能である。
了した後、投票空間の特徴量の計測を行う(ステップS
T402)。特徴量としては、例えば最大値や分散など
の統計量を用いても良いし、投票空間を多値画像と見做
して、2値化処理を行った後、領域の抽出を行っても良
い。前者の場合、算出した結果と予め設定しておいた閾
値との比較によって判定することが可能であり、後者の
場合、抽出された領域の図形的特徴を計測することで判
定することが可能である。ステップST402では、前
者の例を用いている。この場合、最大値maxまたは分
散値varが閾値aまたはbより小さいとき、レイアウ
ト構造は複雑ではないと見做し矩形識別原稿157と判
定し、逆に大きい場合、レイアウト構造は複雑と見做し
識別不能原稿158と判定する(ステップST40
3)。
であり、その結果、入力画像データは、網点写真原稿1
53、網点下地原稿154、連続階調写真原稿155、
一様下地原稿156、矩形識別原稿157、識別不能原
稿158のいずれかに決定される。
4における一例としてのデータ変換処理の詳細を示すフ
ローチャートであり、図2に示したステップST205
で行われる処理のフローチャートである。データ変換処
理は、画像種別判定結果を利用して、入力された画像デ
ータの形式を変更する処理である。
03の出力で、入力画像データの種類を表し、網点写真
原稿153、網点下地原稿154、連続階調写真原稿1
55、一様下地原稿156、矩形識別原稿157、識別
不能原稿158のいずれかである。
であるか調べる(ステップST501)。識別不能原稿
でない場合、次に矩形識別原稿であるか調べる(ステッ
プST502)。矩形識別原稿である場合、領域識別部
102で得られた画素属性の情報を利用して、入力画像
データに対して矩形領域毎にデータ変換処理を行う(ス
テップST503)。
圧縮率、色数などがある。予め画素属性毎にデータ変換
処理のルールを設定しておき、そのルールにしたがって
データ変換処理を行わせても良い。例えば、網点写真領
域や連続写真領域の場合、解像度を低くする変換を行っ
たり、圧縮率を上げても著しい画像劣化は見られない場
合があり、情報量の削減が可能となる。また、文字領域
で黒文字しか存在しない場合、多値データを2値に変換
することで同様に情報量の削減が可能となる。このよう
に予め画素属性毎にデータ変換処理のルールを設定して
おくことで、効率の良い画像データに変換することが可
能となる。
62として出力する。
でない場合、画像全体に一様なデータ変換処理を行う
(ステップST504)。一様なデータ変換処理とし
て、例えば、画像種別情報161が網点写真原稿や連続
階調写真であった場合、解像度を低くする変換を行った
り、圧縮率を上げても著しい画像劣化は見られない場合
があり、情報量の削減が可能となる。また、画像種別情
報161が一様下地原稿で黒文字しか存在しない場合、
多値データを2値に変換することで同様に情報量の削減
が可能となる。このようにステップST503と同様に
画像の種類毎にデータ変換処理のルールを設定しておく
ことで、効率の良い画像データに変換することが可能と
なる。なおこの場合、ステップST503のように矩形
領域毎にデータ変換処理を行わないで、画像全体に同一
の処理を施すため、高速に行えるという利点がある。
3と同様に変換画像データ162として出力する。
である場合、領域識別部102で得られた画素属性の情
報を利用したデータ変換処理は行わないで、入力画像デ
ータをそのまま補正画像データとして出力する(ステッ
プST505)。なお、データ変換処理(ステップST
503およびステップST504)は解像度、圧縮率、
色数など入力画像データに対して処理を行うものだけで
はなく、先に説明したように、属性の領域情報を画像デ
ータに変換する処理でも良い。
像データの種類を判定して、判定された画像データの種
類にしたがってデータ変換処理を行うことで、画質の劣
化が少ない効率的な画像データに変換することが可能と
なる。
たがって、適切な濃度変換あるいはフィルタ処理を施し
画像データを補正する画像処理装置である。
概略構成を示すものである。図6において、101は画
像入力部、102は領域識別部、103は画像種別判定
部、106は画像補正部、105は画像出力部であり、
図1で示した第1実施例におけるデータ変換部104を
画像補正部106とした形態をなしている。画像入力部
101、領域識別部102、画像種別判定部103、画
像出力部105は既に説明した通りであるので、ここで
は画像補正部106について説明する。
る文書処理手順の例を示すフローチャートである。図2
に示した図1における構成のフローチャートのうち、デ
ータ変換処理(ステップST205)を画像補正処理
(ステップST207)に変更した形態をなす。
ータの文書としての種類を決定した後、画像補正部10
6において、文書の種類にしたがった適切な濃度変換あ
るいはフィルタ処理を施して画像データを補正する処理
を行う(ステップST207)。
しての画像補正処理の詳細を示すフローチャートであ
り、図7に示したステップST207で行われる処理の
フローチャートである。
03の出力で、入力画像データの種類を表し、網点写真
原稿153、網点下地原稿154、連続階調写真原稿1
55、一様下地原稿156、矩形識別原稿157、識別
不能原稿158のいずれかである。
であるか調べる(ステップST601)。識別不能原稿
でない場合、次に矩形識別原稿であるか調べる(ステッ
プST602)。矩形識別原稿である場合、領域識別部
102で得られた画素属性の情報を利用して、入力画像
データに対して矩形領域毎に画像補正処理を行う(ステ
ップST603)。
理やフィルタ処理などがある。予め画素属性毎に画像補
正処理のルールを設定しておき、そのルールにしたがっ
て画像補正処理を行わせても良い。例えば、文字領域で
あるならば文字が見やすいようにハイパスフィルタ処理
を施したり、網点写真領域ならばモアレがない滑らかな
画像にするためにローパスフィルタ処理を施しても良
い。その結果、品質の良い画像データに補正され、補正
画像データ163として出力することが可能となる。こ
のように予め画素属性毎に画像補正処理のルールを設定
しておくことで、品質の良い画像データに補正すること
が可能となる。
でない場合、画像全体に一様な画像補正処理を行う(ス
テップST604)。一様な画像補正処理として、一様
下地原稿であるならば文字が見やすいように画像全体に
ハイパスフィルタ処理を施したり、網点写真原稿である
ならばモアレがない滑らかな画像にするために画像全体
にローパスフィルタを施しても良い。このようにステッ
プST603と同様に画像の種類毎に画像補正処理のル
ールを設定しておくことで、品質の良い画像データに補
正することが可能となる。なおこの場合、ステップST
603のように矩形領域毎に画像補正処理を行わない
で、画像全体に同一の処理を施すため、高速に行えると
いう利点がある。画像補正処理の結果、ステップST6
03と同様に補正画像データ163として出力する。
である場合、領域識別部102で得られた画素属性の情
報を利用した画像補正処理は行わないで、入力画像デー
タをそのまま補正画像データとして出力する(ステップ
ST605)。
像データの種類を判定して、判定された画像データの種
類にしたがって画像補正処理を行うことで、品質の良い
画像データを得ることが可能となる。
際、画像の種類の判別結果にしたがって、格納する画像
形式を選択し、その形式に変換し、格納する画像処理装
置である。
概略構成を示すものである。図9において、101は画
像入力部、102は領域識別部、103は画像種別判定
部、107は画像形式変更部、105は画像記憶部であ
り、図1で示した第1実施例におけるデータ変換部10
4を画像形式変更部107とし、画像出力部105を画
像記憶部108とした形態をなしている。画像入力部1
01、領域識別部102、画像種別判定部103は既に
説明した通りであるので説明を省略する。画像記憶部1
08は画像形式を変更後の出力先であるため、実質的に
は画像出力部105と同様の動作を行うとみなせる。し
たがって、ここでは画像形式変更部107ついて説明す
る。
ける文書処理手順の例を示すフローチャートである。図
2に示した図1における構成のフローチャートのうち、
データ変換処理(ステップST205)を画像形式変更
処理(ステップST208)に変更した形態をなす。
ータの文書としての種類を決定した後、画像形式変更部
107において、文書の種類にしたがって画像記憶部1
08に格納するのに適した画像形式を選択し、その形式
に変更する処理を行う(ステップST208)。
一例としての画像形式変更処理の詳細を示すフローチャ
ートであり、図10に示したステップST208で行わ
れる処理のフローチャートである。
03の出力で、入力画像データの種類を表し、網点写真
原稿153、網点下地原稿154、連続階調写真原稿1
55、一様下地原稿156、矩形識別原稿157、識別
不能原稿158のいずれかである。
であるか調べる(ステップST701)。識別不能原稿
でない場合、次に矩形識別原稿であるか調べる(ステッ
プST702)。矩形識別原稿である場合、領域識別部
102で得られた画素属性の情報を利用して、入力画像
データに対して矩形領域毎に画像形式変更処理を行う
(ステップST703)。
やTIFF(G4)形式などがある。予め画素属性毎に
画像形式の変更のルールを設定しておき、そのルールに
したがって画像形式変更処理を行わせても良い。例え
ば、文字領域であるならばTIFF(G4)形式に変更
することでデータ量を削減でき、効率の良い画像データ
に変更される。また、網点写真領域や連続階調写真領域
であるならばJPEG形式にすることで、画質の劣化を
抑えつつデータ量の圧縮が可能となり、この場合も効率
の良い画像データに変更される。その結果、形式変更画
像データ164として格納することが可能となる。この
場合、ひとつの画像データから複数の形式を持った画像
データが生成される。したがって格納する際は、それぞ
れ別個に格納されても良い。このとき、元の画像データ
の構造とそこから発生した形式変更画像データ名を参照
ファイルとして保持しておき、復元する際はその参照フ
ァイルを参照して形式変更画像データ164から元の画
像データを再構成することも可能である。このように予
め画素属性毎に画像形式変更処理のルールを設定してお
くことで、データ量を削減した効率の良い画像データ形
式に変更することが可能となる。
でない場合、画像全体に一様な画像形式変更処理を行う
(ステップST704)。一様な画像形式変更処理とし
て、一様下地原稿であるならば写真がないのでTIFF
(G4)形式に変更することでデータ量を削減すること
がで、網点写真原稿や連続階調写真原稿であるならばJ
PEG形式にすることで、画質の劣化を抑えつつデータ
量の圧縮を図ること可能となる。このようにステップS
T703と同様に画像の種類毎に画像形式変更処理のル
ールを設定しておくことで、データ量を削減した効率の
良い画像データ形式に変更することが可能となる。な
お、この場合、ステップST703のように矩形領域毎
に画像形式変更処理を行わないで、画像全体に同一の処
理を施すため、画像形式変更処理が高速に行え、かつ複
数の画像形式が発生することがないため参照ファイルが
不要であり、格納した形式変更画像データからもとの画
像データを復元する際も高速に行えるという利点があ
る。画像形式変更処理の結果、ステップST703と同
様に形式変更画像データ164として格納することが可
能となる。
である場合、領域識別部102で得られた画素属性の情
報を利用した画像形式変更処理は行わないで、入力画像
データをそのまま形式変更画像データとして出力する
(ステップST705)。
像データの種類を判定して、判定された画像データの種
類にしたがって画像形式変更処理を行うことで、効率の
良い画像データに変更することが可能となり、格納する
際の情報量の削減につながる。
たがって、起動するアプリケーションを選択し、起動パ
ラメータを決定し、アプリケーションを起動する画像処
理装置である。
の概略構成を示すものである。図12において、101
は画像入力部、102は領域識別部、103は画像種別
判定部、109はアプリケーション起動部、110はア
プリケーション処理結果出力部であり、図1で示した第
1実施例におけるデータ変換部104をアプリケーショ
ン起動部109とし、画像出力部105をアプリケーシ
ョン処理結果出力部110とした形態をなしている。画
像入力部101、領域識別部102、画像種別判定部1
03は既に説明した通りであるので説明を省略する。ア
プリケーション処理結果出力部110は、アプリケーシ
ョンを起動し、処理が行われた結果の出力先であるた
め、実質的には画像出力部105と同様の動作を行うと
みなせる。したがって、ここではアプリケーション起動
部109について説明する。
おける文書処理手順の例を示すフローチャートである。
図2に示した図1における構成のフローチャートのう
ち、データ変換処理(ステップST205)をアプリケ
ーション起動処理(ステップST209)に、画像出力
処理(ステップST206)をアプリケーション処理結
果出力処理(ステップST210)に変更した形態をな
す。
ータの文書としての種類を決定した後、アプリケーショ
ン起動部109において、文書の種類にしたがって画像
処理を行うのに適したアプリケーションを選択し、起動
パラメータを決定し、アプリケーションを起動する処理
を行う(ステップST209)。
における一例としてアプリケーション起動処理の詳細を
示すフローチャートであり、図13に示したステップS
T209で行われる処理のフローチャートである。
03の出力で、入力画像データの種類を表し、網点写真
原稿153、網点下地原稿154、連続階調写真原稿1
55、一様下地原稿156、矩形識別原稿157、識別
不能原稿158のいずれかである。
であるか調べる(ステップST801)。識別不能原稿
でない場合、次に矩形識別原稿であるか調べる(ステッ
プST802)。矩形識別原稿である場合、領域識別部
102で得られた画素属性の情報を利用して、入力画像
データに対して矩形領域毎にアプリケーションを起動
し、各々の画像処理を行う(ステップST803)。
ファイリング、印刷、FAX送信、レイアウト理解、文
字認識、罫線抽出などの画像処理をおこなうものでも良
い。予め画素属性毎に起動させるアプリケーションのル
ールを設定しておき、そのルールにしたがってアプリケ
ーション起動処理を行わせても良い。例えば、文字領域
であるならばレイアウト理解を行って、段組などの文書
構造の認識を行い、さらに文字認識によって文字をコー
ド化しても良い。また、網点写真領域や連続階調写真領
域であるならば、イメージ保存のために画像ファイリン
グを起動させても良く、さらに印刷する際、その領域が
カラーであるならば、カラーという起動パラメータを付
属させることで、出力先のプリンタをカラープリンタに
自動的に変更させても良い。アプリケーションによって
処理結果は、アプリケーション処理結果データ165と
なり、プリントアウト、ファイル、文字認識結果などさ
まざまな形態をとることも可能である。このように予め
画素属性毎にアプリケーション起動処理のルールを設定
しておくことで、画像データが入力され次第、自動的に
さまざまな処理を行うことが可能となる。
でない場合、アプリケーションを起動して画像全体に一
様な画像処理を行う(ステップST804)。一様な画
像形式変換処理として、一様下地原稿であるならば写真
がないのでレイアウト理解を行って、パラグラフなどの
文書構造の認識を行い、さらに文字認識によって文字を
コード化する処理を行ったりすることができ、網点写真
原稿や連続階調写真原稿であるならばイメージ保存のた
めに画像ファイリングを起動させたり、直接印刷やFA
X送信を行ったりすることが可能である。アプリケーシ
ョンによっての処理の結果は、ステップST803と同
様にアプリケーション処理結果データ165となり、プ
リントアウト、ファイル、文字認識結果などさまざまな
形態をとることも可能である。
である場合、領域識別部102で得られた画素属性の情
報を利用したアプリケーション起動処理は行わないで、
入力画像データをそのままアプリケーション処理結果デ
ータとして出力するか、画像ファイリングなどを起動し
て画像データをそのままファイルとして格納し、後から
ユーザの判断で処理を選択させることも可能である(ス
テップST805)。
像データの種類を判定して、判定された画像データの種
類にしたがって画像処理を行うアプリケーションを起動
させることで、画像データが入力され次第、自動的にさ
まざまな処理を行うことが可能となり、省力化につなが
る。
画像を画像入力部101によって取り込み、これに対し
て領域識別部102において各画素および近傍画素のデ
ータの状況から物理的あるいは論理的に連結しているも
のを一つの領域として抽出したのち、個々の領域の画像
上の位置、大きさ、形状、構造、濃度分布等の特徴量を
計測し、その計測結果を予め定められたルールに基づい
て文書構成要素として文字、写真、網点などの属性を持
った領域として識別を行う。そして、その属性情報等を
もとに画像種別判定部103において入力された文書画
像全体の複雑さなどの特徴から文書の種類を決定し、文
書の種類にしたがってデータ変換部104にて画像デー
タ形式の変換を行うことを可能とするものである。
種類にしたがった適切な濃度変換あるいはフィルタ処理
を施し画像データを補正する処理を行い、画像形式変更
部107において、文書の種類にしたがって画像記憶部
108に格納するのに適した画像形式を選択し、その形
式に変更する処理を行うことを可能にする。
おいて、文書の種類にしたがって画像処理を行うのに適
したアプリケーションを選択し、起動パラメータを決定
し、アプリケーションを起動する処理を行うことも可能
にしたものである。
画像データに対し、文字、写真、図表、網点等の異なる
文書要素を区別して領域抽出し、網点、写真といったキ
ーとなる領域の有無や、矩形領域の重なりの度合いから
文書構造としての複雑さなどといった特徴量を求めるこ
とにより、入力された画像データがどのような種類の文
書であるのか判定を行うことが可能となり、この判定結
果を利用することによって、画質の劣化が少ない効率的
な画像データに変換したり、品質の良い画像データを得
るための画像補正を行えるようになる。
も、画像データに合ったフォーマットを自動的に選択で
き、効率的なファイリングができる。
自動的に画像処理アプリケーションを選択・起動するた
め、省力化につながる。
によれば、文書をハードコピーしたり、イメージデータ
に変換して保存しようとする場合、入力された文書画像
データに対し、文字、図、表、写真、網点等の異なる文
書要素を区別して抽出・識別し、網点、写真といったキ
ーとなる領域の有無や、矩形領域の重なりの度合いから
文書構造としての複雑さなどといった特徴量を求めるこ
とにより、入力された画像データがどのような種類の文
書であるのか判定を行うことが可能となる。この判定結
果を利用して、解像度や圧縮率や色数などのデータ変換
処理やフィルタリング処理を施したり、イメージファイ
ルとして保存する際にも最適な画像フォーマットが選択
でき、効率的なファイリングが行えるようになる。
た画像処理アプリケーションを起動させることができ
る。
画像の劣化を少なくして効率的に画像処理を行うことの
できる画像処理装置を提供することができる。
略構成を示すブロック図。
例を説明するためのフローチャート。
定処理を説明するためのフローチャート。
定処理を説明するためのフローチャート。
処理を説明するためのフローチャート。
略構成を示すブロック図。
例を説明するためのフローチャート。
理を説明するためのフローチャート。
略構成を示すブロック図。
の例を説明するためのフローチャート。
変更処理を説明するためのフローチャート。
概略構成を示すブロック図。
の例を説明するためのフローチャート。
ーション起動処理を説明するためのフローチャート。
Claims (6)
- 【請求項1】 文書画像を入力する入力手段と、 この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、 この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、 を具備したことを特徴とする画像処理装置。 - 【請求項2】 上記判定手段は、一様下地の画像デー
タ、画像全体が網点下地である画像データ、網点写真の
みの画像データ、連続階調写真のみの画像データ、矩形
による領域識別が可能な画像データ、矩形による領域識
別が不可能な画像データのうち少なくとも1つの種類を
判定することを特徴とする請求項1記載の画像処理装
置。 - 【請求項3】 文書画像を入力する入力手段と、 この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、 この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、 この判定手段で判定された種類に応じて上記画像データ
の解像度、圧縮率、色数などを変換する変換手段と、 この変換手段で変換された画像データを出力する出力手
段と、 を具備したことを特徴とする画像処理装置。 - 【請求項4】 文書画像を入力する入力手段と、 この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、 この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、 この判定手段で判定された種類に応じて濃度変換あるい
はフィルタ処理を施して上記画像データを補正する補正
手段と、 この補正手段で補正された画像データを出力する出力手
段と、 を具備したことを特徴とする画像処理装置。 - 【請求項5】 文書画像を入力する入力手段と、 この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、 この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、 この判定手段で判定された種類に応じて上記画像データ
の画像形式を変更する変更手段と、 この変更手段で変更された画像形式の画像データを記憶
する記憶手段と、 を具備したことを特徴とする画像処理装置。 - 【請求項6】 文書画像を入力する入力手段と、 この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、 この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、 この判定手段で判定された種類に応じて、画像ファイリ
ング、印刷、送信、レイアウト理解、文字認識、罫線抽
出などの画像処理のアプリケーションを選択し、パラメ
ータを設定後、アプリケーションを起動させ上記画像デ
ータの画像処理を行う処理手段と、 この処理手段で画像処理された画像データを出力する出
力手段と、 を具備したことを特徴とする画像処理装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11094981A JP2000295468A (ja) | 1999-04-01 | 1999-04-01 | 画像処理装置 |
| US09/528,117 US6868183B1 (en) | 1999-04-01 | 2000-03-17 | Image processing apparatus, image forming apparatus, and image processing method depending on the type of original image |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11094981A JP2000295468A (ja) | 1999-04-01 | 1999-04-01 | 画像処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000295468A true JP2000295468A (ja) | 2000-10-20 |
Family
ID=14125089
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11094981A Pending JP2000295468A (ja) | 1999-04-01 | 1999-04-01 | 画像処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000295468A (ja) |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002373341A (ja) * | 2001-06-15 | 2002-12-26 | Ricoh Co Ltd | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 |
| JP2005309912A (ja) * | 2004-04-23 | 2005-11-04 | Oki Data Corp | 画像形成装置 |
| JP2007193707A (ja) * | 2006-01-20 | 2007-08-02 | Ricoh Co Ltd | 文書電子化装置、文書電子化方法、文書電子化プログラム及び記録媒体 |
| JP2008236421A (ja) * | 2007-03-20 | 2008-10-02 | Konica Minolta Business Technologies Inc | データ変換システムおよびコンピュータプログラム |
| JP2010011450A (ja) * | 2008-06-26 | 2010-01-14 | Toshiba Corp | 画像形成装置及び画像処理方法 |
| JP2010027051A (ja) * | 2008-07-22 | 2010-02-04 | Toshiba Corp | 画像圧縮装置および画像圧縮方法 |
| US7840069B2 (en) | 2004-06-30 | 2010-11-23 | Sharp Laboratories Of America, Inc. | Methods and systems for alternative, complexity-based process selection |
| JP2016032135A (ja) * | 2014-07-25 | 2016-03-07 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置および画像処理プログラム |
| US9766840B2 (en) | 2015-06-29 | 2017-09-19 | Fuji Xerox Co., Ltd. | Non-transitory computer readable medium, information processing apparatus, and information processing method setting character recognition accuracy |
| JP2020068008A (ja) * | 2018-10-19 | 2020-04-30 | ソニー株式会社 | センサ装置、パラメータ設定方法 |
-
1999
- 1999-04-01 JP JP11094981A patent/JP2000295468A/ja active Pending
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002373341A (ja) * | 2001-06-15 | 2002-12-26 | Ricoh Co Ltd | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 |
| JP2005309912A (ja) * | 2004-04-23 | 2005-11-04 | Oki Data Corp | 画像形成装置 |
| US7840069B2 (en) | 2004-06-30 | 2010-11-23 | Sharp Laboratories Of America, Inc. | Methods and systems for alternative, complexity-based process selection |
| JP2007193707A (ja) * | 2006-01-20 | 2007-08-02 | Ricoh Co Ltd | 文書電子化装置、文書電子化方法、文書電子化プログラム及び記録媒体 |
| US8134761B2 (en) | 2006-01-20 | 2012-03-13 | Ricoh Company, Ltd. | Document processing apparatus, method thereof, and program product for executing the method |
| JP2008236421A (ja) * | 2007-03-20 | 2008-10-02 | Konica Minolta Business Technologies Inc | データ変換システムおよびコンピュータプログラム |
| JP2010011450A (ja) * | 2008-06-26 | 2010-01-14 | Toshiba Corp | 画像形成装置及び画像処理方法 |
| JP2010027051A (ja) * | 2008-07-22 | 2010-02-04 | Toshiba Corp | 画像圧縮装置および画像圧縮方法 |
| JP2016032135A (ja) * | 2014-07-25 | 2016-03-07 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置および画像処理プログラム |
| US9451127B2 (en) | 2014-07-25 | 2016-09-20 | Kyocera Document Solutions Inc. | Image processing apparatus and non-transitory computer readable recording medium for encoding halftone image |
| US9766840B2 (en) | 2015-06-29 | 2017-09-19 | Fuji Xerox Co., Ltd. | Non-transitory computer readable medium, information processing apparatus, and information processing method setting character recognition accuracy |
| JP2020068008A (ja) * | 2018-10-19 | 2020-04-30 | ソニー株式会社 | センサ装置、パラメータ設定方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101753777B (zh) | 图像处理装置及方法、图像读取装置、图像发送装置 | |
| JP4469885B2 (ja) | 画像照合装置、画像照合方法、画像データ出力処理装置、プログラム、及び記録媒体 | |
| US20090284801A1 (en) | Image processing apparatus and image processing method | |
| JP4362538B2 (ja) | 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体 | |
| US8184344B2 (en) | Image processing apparatus and image processing method, computer program and storage medium | |
| JP4582204B2 (ja) | 画像処理装置、画像変換方法、およびコンピュータプログラム | |
| CN101753764A (zh) | 图像处理装置及方法、图像读取装置、图像发送装置 | |
| JP2011008549A (ja) | 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体 | |
| CN101520846B (zh) | 图像处理方法、图像处理装置、图像形成装置 | |
| JP4329764B2 (ja) | 画像処理装置および罫線抽出プログラム | |
| JP2000295468A (ja) | 画像処理装置 | |
| JP2008112215A (ja) | 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム | |
| JP4424309B2 (ja) | 画像処理装置、文字判定プログラム、および文字判定方法 | |
| JP4582200B2 (ja) | 画像処理装置、画像変換方法、およびコンピュータプログラム | |
| JP4487003B2 (ja) | 画像データ出力処理装置、画像データ出力処理方法、プログラム及び記録媒体 | |
| JP2003298799A (ja) | 画像処理装置 | |
| JP4396710B2 (ja) | 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム | |
| JP4569162B2 (ja) | 画像処理方法、画像処理プログラムおよび画像処理装置 | |
| JP2010287178A (ja) | 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体 | |
| JP3997696B2 (ja) | 画像処理のための装置、方法及び記録媒体 | |
| JP4792835B2 (ja) | 画像処理装置 | |
| JP5517028B2 (ja) | 画像処理装置 | |
| JP4710672B2 (ja) | 文字色判別装置、文字色判別方法、およびコンピュータプログラム | |
| JP4055525B2 (ja) | 画像処理装置、画像処理方法、及び画像処理プログラム | |
| JP2000295469A (ja) | 画像形成装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051220 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070807 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070828 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071029 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080603 |