JP2000295468A

JP2000295468A - 画像処理装置

Info

Publication number: JP2000295468A
Application number: JP11094981A
Authority: JP
Inventors: Hiroki Sugano; 浩樹菅野; Naoaki Kodaira; 直朗小平; Hiroaki Kubota; 浩明久保田
Original assignee: Toshiba Corp; Toshiba Tec Corp
Current assignee: Toshiba Corp; Toshiba Tec Corp
Priority date: 1999-04-01
Filing date: 1999-04-01
Publication date: 2000-10-20

Abstract

(57)【要約】【課題】画像の劣化を少なくして効率的に画像処理を行
う。【解決手段】書類の画像を画像入力部１０１で取り込
み、領域識別部１０２で取り込んだ画像データから文
字、写真、図、表、網点領域を抽出し、画像種別判定部
１０３で文字、写真、図、表、網点などと領域毎に識別
された結果から、網点、写真といったキーとなる領域の
有無や、矩形領域の重なりの度合いから文書構造として
の複雑さなどといった特徴量を求めることにより、入力
された画像データがどのような種類の文書であるかの判
定を行い、データ変換部１０４で判定された文書種類に
したがった画像データ形式の変換処理を行い、画像出力
部１０５において画像データ形式が変換された出力画像
を出力する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、文書などの画像
をファイリングあるいは複写する際に行うデータ形式や
濃度値など変換処理のための画像処理装置に関する。

【０００２】

【従来の技術】文書画像を画像データとして取り込んで
その画像をハードコピーとして出力したり、イメージフ
ァイルとして保存したりする技術として、複写機および
パソコンにおけるイメージ取り込みに利用される技術
や、ファイリングシステムやデータベースに利用される
技術がある。

【０００３】ハードコピーとして出力する場合、文書画
像として利用者が見やすくするために画像処理を施す場
合がある。例えば、文書画像に文字が含まれている場
合、ハイパスフィルタ処理を施すことによって、文字の
エッジ部分が強調され、くっきりとした出力になり、読
みやすい文字となる。また、写真の場合、滑らかな階調
を再現するためにローパスフィルタを施すことによっ
て、ざらつき感が無くなり、奇麗な出力となる。同じ写
真であっても、網点で構成された網点写真であるのか、
あるいは、銀塩写真であるのかによって処理を切り替え
ることも可能である。以上のように、文書画像の種類に
よって処理手法を変更することは、ハードコピーとして
出力する際も、イメージファイルとして保存する際にも
非常に有効である。

【０００４】文書画像は通常、文字、図表、写真等の領
域がそれぞれ単独にあるいは重なり合って構成されてい
る。したがって、画像処理を行なう場合、文書画像にど
のような領域がどのように構成されているかを検知する
必要がある。

【０００５】従来、文字、網点、写真等の文書画像を構
成する要素を識別するために、特願平８−３４７０２号
に記載されているように、レイアウト解析を利用して、
文書画像の構造を抽出する方法がある。この方法では、
２値化処理を行なった後に画素の連結性を調べ、連結し
ている画素同士を領域として抽出し、その位置や大きさ
等の特徴量を利用して識別するものである。この方法の
場合、前処理として２値化を行なっているため、写真等
の中間的な濃度値を含んだ領域を正確に抽出することが
困難であった。

【０００６】さらに、この方法を拡張した方法として特
願平１０−０５３３１７号に記載されているように、多
値画像を複数枚の２値画像に変換し、各々の２値画像に
対してレイアウト解析を行うことにより、写真等の中間
的な濃度値を含んだ領域を正確に抽出するものがある。
この方法では、網点上にある文字といった領域が重なり
合った場合においても、領域の抽出が正しく行えるとい
う利点がある。

【０００７】さて、実際の文書原稿は複雑なレイアウト
構造を持つことがある。例えば、雑誌の表紙やグラフィ
ックが多用された広告など、文字や図、写真が複雑に重
なり合っているものがあげられる。このような文書原稿
に対して、特願平１０−０５３３１７号に記載されてい
るような矩形による領域識別を行うと、領域が不自然に
分割される場合がある。その領域識別の結果を用いて画
像処理を施すと、逆にユーザにとって見にくいものとな
る恐れがある。

【０００８】また、これとは反対に、非常に単純なレイ
アウト構造を持つ文書原稿も存在する。例えば、写真の
みで構成されていたり、文字のみあるいは文字と網点下
地のみで構成されていたりする場合などがこれに該当す
る。このような場合、文書原稿全体に対して同じ画像処
理を施すことで済むにもかかわらず、領域毎の識別結果
を用いて処理を行うため、処理時間のコストがかかるこ
とが予想される。

【０００９】このように原稿の種別に関わらず、同様な
処理を行うため不都合が生じる場合があった。

【００１０】

【発明が解決しようとする課題】上記したように、従来
の画像処理装置において、多値画像を複数枚の２値画像
に変換し、各々の２値画像に対してレイアウト解析を利
用して、文書画像の構造を領域として抽出し、その領域
毎の属性にしたがって画像処理を行うため、不自然な領
域が発生して画像の劣化を起こしたり、不要な処理時間
がかかったり効率が悪いといった問題があった。

【００１１】そこで、この発明は、画像の劣化を少なく
して効率的に画像処理を行うことのできる画像処理装置
を提供することを目的とする。

【００１２】

【課題を解決するための手段】この発明の画像処理装置
は、文書画像を入力する入力手段と、この入力手段で入
力された画像データから画素の特徴を用いて領域を抽出
し、この抽出された領域の属性を識別する領域識別手段
と、この領域識別手段で識別された属性毎の領域の分布
から上記画像データの種類を判定する判定手段とから構
成されている。

【００１３】この発明の画像処理装置は、文書画像を入
力する入力手段と、この入力手段で入力された画像デー
タから画素の特徴を用いて領域を抽出し、この抽出され
た領域の属性を識別する領域識別手段と、この領域識別
手段で識別された属性毎の領域の分布から上記画像デー
タの種類を判定する判定手段と、この判定手段で判定さ
れた種類に応じて上記画像データの解像度、圧縮率、色
数などを変換する変換手段と、この変換手段で変換され
た画像データを出力する出力手段とから構成されてい
る。

【００１４】この発明の画像処理装置は、文書画像を入
力する入力手段と、この入力手段で入力された画像デー
タから画素の特徴を用いて領域を抽出し、この抽出され
た領域の属性を識別する領域識別手段と、この領域識別
手段で識別された属性毎の領域の分布から上記画像デー
タの種類を判定する判定手段と、この判定手段で判定さ
れた種類に応じて濃度変換あるいはフィルタ処理を施し
て上記画像データを補正する補正手段と、この補正手段
で補正された画像データを出力する出力手段とから構成
されている。

【００１５】この発明の画像処理装置は、文書画像を入
力する入力手段と、この入力手段で入力された画像デー
タから画素の特徴を用いて領域を抽出し、この抽出され
た領域の属性を識別する領域識別手段と、この領域識別
手段で識別された属性毎の領域の分布から上記画像デー
タの種類を判定する判定手段と、この判定手段で判定さ
れた種類に応じて上記画像データの画像形式を変更する
変更手段と、この変更手段で変更された画像形式の画像
データを記憶する記憶手段とから構成されている。

【００１６】この発明の画像処理装置は、文書画像を入
力する入力手段と、この入力手段で入力された画像デー
タから画素の特徴を用いて領域を抽出し、この抽出され
た領域の属性を識別する領域識別手段と、この領域識別
手段で識別された属性毎の領域の分布から上記画像デー
タの種類を判定する判定手段と、この判定手段で判定さ
れた種類に応じて、画像ファイリング、印刷、送信、レ
イアウト理解、文字認識、罫線抽出などの画像処理のア
プリケーションを選択し、パラメータを設定後、アプリ
ケーションを起動させ上記画像データの画像処理を行う
処理手段と、この処理手段で画像処理された画像データ
を出力する出力手段とから構成されている。

【００１７】

【発明の実施の形態】以下、この発明の一実施の形態に
ついて図面を参照して説明する。

【００１８】第１実施例について説明する。

【００１９】図１は、本発明の第１実施例に係る画像処
理装置の概略構成を示すものである。図１において、１
０１は画像入力部、１０２は領域識別部、１０３は画像
種別判定部、１０４はデータ変換部、１０５は画像出力
部である。

【００２０】画像入力部１０１は画像データを入力する
装置であり、書類を読み取って画像データに変換する装
置であるイメージスキャナ等の画像入力装置により、文
書等の書類から描かれているものを取り込む装置であ
る。なお、本発明における画像入力部はイメージスキャ
ナ等の読み取り装置で構成されたものでも良いし、既に
画像データとしてファイリング装置等に保存された画像
イメージを取り込む装置で構成されても良い。

【００２１】領域識別部１０２は、画像入力部１０１に
おいて入力された画像データから文字を持った画素を領
域として識別するものである。まず、画像入力部１０１
において入力された画像データに対して、周辺画素の濃
度差や彩度などの状態によって複数の２値の画像データ
に分離し、その画像より文字や図形等が物理的にあるい
は論理的に連結されている各領域に分割して抽出し、そ
の領域の位置、大きさ、形状、構造、濃度分布等の特徴
量を計測して、文書要素としての属性を決定する。文書
要素の種類として、文字、写真、図、表、網点などがあ
げられる。

【００２２】複数の２値の画像データに分離する具体的
な手法として、既に公知となっているものがあり、例え
ば、特願平１０−０５３３１７号で開示されている手法
により実現しても良い。この場合、画像分離部１０２の
出力として、文字画像、中間調画像、下地画像、網点画
像、カラー画像、グレー画像、黒画像の７つの２値分離
画像データが生成される。

【００２３】また、文書要素の抽出および識別の具体的
な手法として、既に公知となっているものがあり、例え
ば、特願平８−３４７０２号で開示されている手法によ
り実現しても良い。領域識別部１０２では、単一画像デ
ータからだけではなく、複数画像データでの特徴量をル
ールにしたがって統合し、入力された画像データの領域
属性を決定する。例えば、文字画像と中間調画像の双方
から同じ位置に領域が抽出された場合、その領域の種類
や領域の大きさはどれだけなのかを決定する。具体的な
例として、文字画像上に写真領域が存在し、同じ位置に
中間調画像に中間調画素が存在する場合、連続階調写真
領域と決定する。複数画像データからの領域属性決定の
具体的手法として、既に公知となっているものがあり、
例えば、特願平１０−０５３３１７号で開示されている
手法により実現しても良い。

【００２４】画像種別判定部１０３は、詳細は後述する
が、領域識別部１０２において文字、写真、図、表、網
点などと領域毎に識別された結果から、網点、写真とい
ったキーとなる領域の有無や、矩形領域の重なりの度合
いから文書構造としての複雑さなどといった特徴量を求
めることにより、入力された画像データがどのような種
類の文書であるのか判定を行う。

【００２５】ここで言う画像データの種類とは、例え
ば、１下地が一様であって、文字、図、表などしか存在
しないもの。

【００２６】２下地に網点があり、文字、図、表などし
か存在しないもの。

【００２７】３網点写真しか存在しないもの。

【００２８】４連続写真しか存在しないもの。

【００２９】５文字、図、表のうち少なくとも一つと網
点写真が混在していて、なおかつ矩形で領域を抽出する
ことが可能なもの、または文字、図、表、網点のうち少
なくとも一つと連続写真が混在し、なおかつ矩形で領域
を抽出することが可能なもの。

【００３０】６文字、図、表のうち少なくとも一つと網
点写真が混在していて、なおかつ矩形で領域を抽出する
ことが不可能なもの、または文字、図、表、網点のうち
少なくとも一つと連続写真が混在し、なおかつ矩形で領
域を抽出することが不可能なもの。

【００３１】などである。

【００３２】データ変換部１０４は、詳細は後述する
が、画像種別判定部１０３において判定された文書の種
類にしたがって入力画像データの形式の変更を行う。画
像データの形式の変更とは、例えば、解像度、圧縮率、
色数などを変更することであっても良い。また、属性の
領域情報を画像に変換したものでも良い。属性の領域情
報を画像に変換する具体的な手法として、既に公知とな
っているものがあり、例えば、特願平１０−０５３３１
７号で開示されている手法により実現しても良い。

【００３３】画像出力部１０５は、データ変換部１０４
によって変換された画像データを出力するものである。
出力形態としては、ハードコピーであったり、イメージ
ファイルとしてストレイジに保存したりしても良い。

【００３４】次に、このような構成において、本発明の
画像処理装置の処理を説明する。

【００３５】図２は、図１に示した画像処理装置におけ
る文書処理手順の例を示すフローチャートである。この
フローチャートを参照しながら本発明による画像処理装
置の処理の流れを説明する。

【００３６】まず、書類の画像を画像入力部１０１によ
り取り込む（ステップＳＴ２０１）。すなわち、スキャ
ナ等の画像入力装置を利用して書類から画像を読み取っ
たり、またはファイリングシステム等の画像ファイルデ
ータを入力したりしたものを、画像入力部１０１により
画像データに変換する。

【００３７】領域識別部１０２において、画像入力装置
から１ライン分、または数ライン分ずつ読み取り、周辺
画素の濃度差や彩度などの画素ごとの状態によって複数
の２値画像データに分離され、文字や図形等が物理的に
あるいは論理的に連結されている各領域毎に分割して抽
出し、その領域の位置、大きさ、形状、構造、濃度分布
等の特徴量を計測して領域の種類や重要度等の識別を行
ない、その結果、文字、写真、図、表、網点領域を抽出
する（ステップＳＴ２０２）。入力された画像の全画素
に対して処理が終了するまで繰り返す（ステップＳＴ２
０３）。

【００３８】すべての画素属性が決定した後、画像種別
判定部１０３において、文字、写真、図、表、網点など
と領域毎に識別された結果から、網点、写真といったキ
ーとなる領域の有無や、矩形領域の重なりの度合いから
文書構造としての複雑さなどといった特徴量を求めるこ
とにより、入力された画像データがどのような種類の文
書であるのか判定を行う（ステップＳＴ２０４）。な
お、画像種別判定部１０３における具体的な処理の内容
の詳細は、図３を参照して後述する。

【００３９】入力された画像データの文書としての種類
を決定した後、データ変換部１０４において、文書種類
にしたがった画像データ形式の変換処理を行う（ステッ
プＳＴ２０５）。なお、データ変換部１０４における具
体的な処理の内容の詳細は、図５を参照して後述する。

【００４０】最後に画像出力部１０５において、画像デ
ータ形式を変換した出力画像を出力する（ステップＳＴ
２０６）。

【００４１】以上が本画像処理装置の大まかな処理動作
である。次に個々の要素の処理の詳細を説明する。

【００４２】図３は、画像処理装置の画像種別判定部１
０３における一例としての画像種別判定処理の詳細を示
すフローチャートであり、図２に示したステップＳＴ２
０４で行われる処理のフローチャートである。画像種別
判定処理は、画素毎の領域識別結果を利用して、入力さ
れた画像データが文書としてどのような種類なのかを判
定する処理である。

【００４３】まず、本処理において分類する文書種類の
一例を説明する。

【００４４】一様下地原稿の文書とは、写真領域と網点
領域が存在しないものをさす。したがって文字領域の
み、または何もかかれていない白紙の状態のいずれかが
これに該当する。

【００４５】網点下地原稿とは、網点領域が存在し、か
つ網点領域内に文字領域が存在するものをさす。

【００４６】網点写真原稿とは、網点領域が存在し、か
つ網点領域内に写真領域が存在し、かつ文字領域が存在
しないものをさす。

【００４７】連続階調写真原稿とは、網点領域と文字領
域が存在せず、かつ写真領域のみが存在するものをさ
す。

【００４８】矩形識別原稿とは、一様下地原稿、網点下
地原稿、網点写真原稿、連続階調原稿のいずれの条件に
当てはまらなく、かつ複雑なレイアウト構造を持ってい
ないで、文字、網点、写真、図表等の領域毎に分割が可
能なものをさす。

【００４９】なお、複雑なレイアウト構造を持ち、文
字、網点、写真、図表等の領域毎に分割が不可能なもの
は識別不能原稿として、他の原稿と区別する。

【００５０】図３において、画素属性データ１５１は領
域識別部１０２において識別された複数画像データの領
域の種類や重要度を用いて、入力された画像データの画
素ごとの属性を決定したもので、各々の文書要素ごとの
領域として表されている。

【００５１】まず、画素属性データ１５１からデータを
読み取り、網点領域が存在するか調べる（ステップＳＴ
３０１）。網点領域が存在する場合、次に写真領域が存
在するか調べる（ステップＳＴ３０２）。写真領域が存
在する場合、さらに文字領域が存在するか調べる（ステ
ップＳＴ３０３）。もし文字領域が存在するなら、矩形
識別候補原稿１５２となる。矩形識別候補原稿１５２
は、この後レイアウト構造の複雑さを検証する処理を行
い、矩形識別原稿または識別不能原稿に分類する。この
処理の詳細な説明は図４を用いて後述する。

【００５２】ステップＳＴ３０３にて文字領域が存在し
ない場合、網点写真原稿１５３となる。

【００５３】ステップＳＴ３０２にて写真領域が存在し
ない場合、網点領域内に文字領域が存在するか調べる
（ステップＳＴ３０４）。網点領域内に文字領域が存在
する場合、網点下地原稿１５４となる。網点領域内に文
字領域が存在しない場合、さらに網点領域外に文字領域
が存在しないか調べる（ステップＳＴ３０５）。網点領
域外に文字領域が存在しない場合、網点写真原稿１５３
となる。網点領域外に文字領域が存在する場合、矩形識
別候補原稿１５２となる。

【００５４】ステップＳＴ３０１にて網点領域が存在し
ない場合、写真領域が存在するか調べる（ステップＳＴ
３０６）。写真領域が存在しない場合、一様下地原稿１
５６となる。写真領域が存在する場合、さらに文字領域
が存在するか調べる（ステップＳＴ３０７）。文字領域
が存在しない場合、連続階調写真原稿１５５となる。文
字領域が存在する場合、矩形識別候補原稿１５２とな
る。

【００５５】以上の処理によって、入力画像データは、
矩形識別候補原稿１５２、網点写真原稿宇１５３、網点
下地原稿１５４、連続階調写真原稿１５５、一様下地原
稿１５６のいずれかに決定される。

【００５６】図４は、本発明の画像処理装置の画像種別
判定部１０３における一例としての画像種別判定処理の
詳細を示すフローチャートであり、図３に示した矩形識
別候補原稿１５２に対して行われる処理のフローチャー
トである。

【００５７】矩形識別候補原稿１５２と判定された場
合、レイアウト構造の複雑さを検証する処理を行い、矩
形識別原稿または識別不能原稿に分類するが、その際の
レイアウト構造の複雑さを測る指標の一例として、矩形
領域の重なり度合いを計測しても良い。直接、矩形の重
なりを検証しても良いが、矩形領域の数が多くなると、
比較する回数が劇的に増加することが想定される。そこ
で重なり度合いを予め用意した２次元の投票空間に矩形
サイズを投票し、その投票空間の状態から推定しても良
い（ステップＳＴ４０１）。

【００５８】この投票空間は、矩形領域の重なり度合い
を計測するためのものであるため、解像度は元の画像の
解像度より低いもので良い。投票は、矩形領域の座標位
置を投票空間の座標位置に変換した個所にその領域の矩
形サイズなどの特徴を加算することによりなされる。矩
形サイズの例としては、矩形の幅や高さや面積値などの
いずれかを用いることが可能である。また、矩形領域の
属性、つまり、文字、写真、図表、網点などの属性にし
たがって投票値に重みを付けても良い。例えば、写真や
図表のように、レイアウト構造に大きな影響を与える属
性は重み付けを大きくし、文字などは重み付けを小さく
すると、写真や図表の重なった領域の投票値は大きくな
る。レイアウト構造の複雑さを考慮すると、写真や図表
の重なりというのは複雑なものに分類される。したがっ
て、この場合は複雑なものと見做しやすくなる。また、
処理をより高速に行うために、投票する矩形領域を制限
することも可能である。例えば、小さな文字領域はレイ
アウト構造を判定する際に大きな影響を与えるものでは
ないことがある。このような場合、投票する矩形サイズ
を制限することで、投票回数の削減が図られ、その結果
高速になることが予想される。ただし、画像データに存
在する文字領域が小さな文字領域のみで構成されている
場合は、一概に除外することはできない。そのような場
合、領域識別部１０２の出力である画素属性データの状
態によって制限を調整することも可能である。

【００５９】投票空間への矩形サイズの投票がすべて終
了した後、投票空間の特徴量の計測を行う（ステップＳ
Ｔ４０２）。特徴量としては、例えば最大値や分散など
の統計量を用いても良いし、投票空間を多値画像と見做
して、２値化処理を行った後、領域の抽出を行っても良
い。前者の場合、算出した結果と予め設定しておいた閾
値との比較によって判定することが可能であり、後者の
場合、抽出された領域の図形的特徴を計測することで判
定することが可能である。ステップＳＴ４０２では、前
者の例を用いている。この場合、最大値ｍａｘまたは分
散値ｖａｒが閾値ａまたはｂより小さいとき、レイアウ
ト構造は複雑ではないと見做し矩形識別原稿１５７と判
定し、逆に大きい場合、レイアウト構造は複雑と見做し
識別不能原稿１５８と判定する（ステップＳＴ４０
３）。

【００６０】以上が画像種別判定部１０３の詳細な説明
であり、その結果、入力画像データは、網点写真原稿１
５３、網点下地原稿１５４、連続階調写真原稿１５５、
一様下地原稿１５６、矩形識別原稿１５７、識別不能原
稿１５８のいずれかに決定される。

【００６１】図５は、画像処理装置のデータ変換部１０
４における一例としてのデータ変換処理の詳細を示すフ
ローチャートであり、図２に示したステップＳＴ２０５
で行われる処理のフローチャートである。データ変換処
理は、画像種別判定結果を利用して、入力された画像デ
ータの形式を変更する処理である。

【００６２】画像種別情報１６１は、画像種別判定部１
０３の出力で、入力画像データの種類を表し、網点写真
原稿１５３、網点下地原稿１５４、連続階調写真原稿１
５５、一様下地原稿１５６、矩形識別原稿１５７、識別
不能原稿１５８のいずれかである。

【００６３】まず、画像種別情報１６１が識別不能原稿
であるか調べる（ステップＳＴ５０１）。識別不能原稿
でない場合、次に矩形識別原稿であるか調べる（ステッ
プＳＴ５０２）。矩形識別原稿である場合、領域識別部
１０２で得られた画素属性の情報を利用して、入力画像
データに対して矩形領域毎にデータ変換処理を行う（ス
テップＳＴ５０３）。

【００６４】データ変換処理として、例えば、解像度、
圧縮率、色数などがある。予め画素属性毎にデータ変換
処理のルールを設定しておき、そのルールにしたがって
データ変換処理を行わせても良い。例えば、網点写真領
域や連続写真領域の場合、解像度を低くする変換を行っ
たり、圧縮率を上げても著しい画像劣化は見られない場
合があり、情報量の削減が可能となる。また、文字領域
で黒文字しか存在しない場合、多値データを２値に変換
することで同様に情報量の削減が可能となる。このよう
に予め画素属性毎にデータ変換処理のルールを設定して
おくことで、効率の良い画像データに変換することが可
能となる。

【００６５】データ変換処理の結果、変換画像データ１
６２として出力する。

【００６６】また、ステップＳＴ５０２で矩形識別原稿
でない場合、画像全体に一様なデータ変換処理を行う
（ステップＳＴ５０４）。一様なデータ変換処理とし
て、例えば、画像種別情報１６１が網点写真原稿や連続
階調写真であった場合、解像度を低くする変換を行った
り、圧縮率を上げても著しい画像劣化は見られない場合
があり、情報量の削減が可能となる。また、画像種別情
報１６１が一様下地原稿で黒文字しか存在しない場合、
多値データを２値に変換することで同様に情報量の削減
が可能となる。このようにステップＳＴ５０３と同様に
画像の種類毎にデータ変換処理のルールを設定しておく
ことで、効率の良い画像データに変換することが可能と
なる。なおこの場合、ステップＳＴ５０３のように矩形
領域毎にデータ変換処理を行わないで、画像全体に同一
の処理を施すため、高速に行えるという利点がある。

【００６７】データ変換処理の結果、ステップＳＴ５０
３と同様に変換画像データ１６２として出力する。

【００６８】また、ステップＳＴ５０１で識別不能原稿
である場合、領域識別部１０２で得られた画素属性の情
報を利用したデータ変換処理は行わないで、入力画像デ
ータをそのまま補正画像データとして出力する（ステッ
プＳＴ５０５）。なお、データ変換処理（ステップＳＴ
５０３およびステップＳＴ５０４）は解像度、圧縮率、
色数など入力画像データに対して処理を行うものだけで
はなく、先に説明したように、属性の領域情報を画像デ
ータに変換する処理でも良い。

【００６９】このように、領域識別した結果から入力画
像データの種類を判定して、判定された画像データの種
類にしたがってデータ変換処理を行うことで、画質の劣
化が少ない効率的な画像データに変換することが可能と
なる。

【００７０】次に、第２実施例について説明する。

【００７１】第２実施例は、画像の種類の判別結果にし
たがって、適切な濃度変換あるいはフィルタ処理を施し
画像データを補正する画像処理装置である。

【００７２】図６は、第２実施例に係る画像処理装置の
概略構成を示すものである。図６において、１０１は画
像入力部、１０２は領域識別部、１０３は画像種別判定
部、１０６は画像補正部、１０５は画像出力部であり、
図１で示した第１実施例におけるデータ変換部１０４を
画像補正部１０６とした形態をなしている。画像入力部
１０１、領域識別部１０２、画像種別判定部１０３、画
像出力部１０５は既に説明した通りであるので、ここで
は画像補正部１０６について説明する。

【００７３】図７は、図６に示した画像処理装置におけ
る文書処理手順の例を示すフローチャートである。図２
に示した図１における構成のフローチャートのうち、デ
ータ変換処理（ステップＳＴ２０５）を画像補正処理
（ステップＳＴ２０７）に変更した形態をなす。

【００７４】画像種別判定部１０３で入力された画像デ
ータの文書としての種類を決定した後、画像補正部１０
６において、文書の種類にしたがった適切な濃度変換あ
るいはフィルタ処理を施して画像データを補正する処理
を行う（ステップＳＴ２０７）。

【００７５】図８は、画像補正部１０６における一例と
しての画像補正処理の詳細を示すフローチャートであ
り、図７に示したステップＳＴ２０７で行われる処理の
フローチャートである。

【００７６】画像種別情報１６１は、画像種別判定部１
０３の出力で、入力画像データの種類を表し、網点写真
原稿１５３、網点下地原稿１５４、連続階調写真原稿１
５５、一様下地原稿１５６、矩形識別原稿１５７、識別
不能原稿１５８のいずれかである。

【００７７】まず、画像種別情報１６１が識別不能原稿
であるか調べる（ステップＳＴ６０１）。識別不能原稿
でない場合、次に矩形識別原稿であるか調べる（ステッ
プＳＴ６０２）。矩形識別原稿である場合、領域識別部
１０２で得られた画素属性の情報を利用して、入力画像
データに対して矩形領域毎に画像補正処理を行う（ステ
ップＳＴ６０３）。

【００７８】画像補正処理として、例えば、濃度変換処
理やフィルタ処理などがある。予め画素属性毎に画像補
正処理のルールを設定しておき、そのルールにしたがっ
て画像補正処理を行わせても良い。例えば、文字領域で
あるならば文字が見やすいようにハイパスフィルタ処理
を施したり、網点写真領域ならばモアレがない滑らかな
画像にするためにローパスフィルタ処理を施しても良
い。その結果、品質の良い画像データに補正され、補正
画像データ１６３として出力することが可能となる。こ
のように予め画素属性毎に画像補正処理のルールを設定
しておくことで、品質の良い画像データに補正すること
が可能となる。

【００７９】また、ステップＳＴ６０２で矩形識別原稿
でない場合、画像全体に一様な画像補正処理を行う（ス
テップＳＴ６０４）。一様な画像補正処理として、一様
下地原稿であるならば文字が見やすいように画像全体に
ハイパスフィルタ処理を施したり、網点写真原稿である
ならばモアレがない滑らかな画像にするために画像全体
にローパスフィルタを施しても良い。このようにステッ
プＳＴ６０３と同様に画像の種類毎に画像補正処理のル
ールを設定しておくことで、品質の良い画像データに補
正することが可能となる。なおこの場合、ステップＳＴ
６０３のように矩形領域毎に画像補正処理を行わない
で、画像全体に同一の処理を施すため、高速に行えると
いう利点がある。画像補正処理の結果、ステップＳＴ６
０３と同様に補正画像データ１６３として出力する。

【００８０】また、ステップＳＴ６０１で識別不能原稿
である場合、領域識別部１０２で得られた画素属性の情
報を利用した画像補正処理は行わないで、入力画像デー
タをそのまま補正画像データとして出力する（ステップ
ＳＴ６０５）。

【００８１】このように、領域識別した結果から入力画
像データの種類を判定して、判定された画像データの種
類にしたがって画像補正処理を行うことで、品質の良い
画像データを得ることが可能となる。

【００８２】次に、第３実施例について説明する。

【００８３】第３実施例は、画像をファイリングする
際、画像の種類の判別結果にしたがって、格納する画像
形式を選択し、その形式に変換し、格納する画像処理装
置である。

【００８４】図９は、第３実施例に係る画像処理装置の
概略構成を示すものである。図９において、１０１は画
像入力部、１０２は領域識別部、１０３は画像種別判定
部、１０７は画像形式変更部、１０５は画像記憶部であ
り、図１で示した第１実施例におけるデータ変換部１０
４を画像形式変更部１０７とし、画像出力部１０５を画
像記憶部１０８とした形態をなしている。画像入力部１
０１、領域識別部１０２、画像種別判定部１０３は既に
説明した通りであるので説明を省略する。画像記憶部１
０８は画像形式を変更後の出力先であるため、実質的に
は画像出力部１０５と同様の動作を行うとみなせる。し
たがって、ここでは画像形式変更部１０７ついて説明す
る。

【００８５】図１０は、図９に示した画像処理装置にお
ける文書処理手順の例を示すフローチャートである。図
２に示した図１における構成のフローチャートのうち、
データ変換処理（ステップＳＴ２０５）を画像形式変更
処理（ステップＳＴ２０８）に変更した形態をなす。

【００８６】画像種別判定部１０３で入力された画像デ
ータの文書としての種類を決定した後、画像形式変更部
１０７において、文書の種類にしたがって画像記憶部１
０８に格納するのに適した画像形式を選択し、その形式
に変更する処理を行う（ステップＳＴ２０８）。

【００８７】図１１は、画像形式変更部１０７における
一例としての画像形式変更処理の詳細を示すフローチャ
ートであり、図１０に示したステップＳＴ２０８で行わ
れる処理のフローチャートである。

【００８８】画像種別情報１６１は、画像種別判定部１
０３の出力で、入力画像データの種類を表し、網点写真
原稿１５３、網点下地原稿１５４、連続階調写真原稿１
５５、一様下地原稿１５６、矩形識別原稿１５７、識別
不能原稿１５８のいずれかである。

【００８９】まず、画像種別情報１６１が識別不能原稿
であるか調べる（ステップＳＴ７０１）。識別不能原稿
でない場合、次に矩形識別原稿であるか調べる（ステッ
プＳＴ７０２）。矩形識別原稿である場合、領域識別部
１０２で得られた画素属性の情報を利用して、入力画像
データに対して矩形領域毎に画像形式変更処理を行う
（ステップＳＴ７０３）。

【００９０】画像形式としては、例えば、ＪＰＥＧ形式
やＴＩＦＦ（Ｇ４）形式などがある。予め画素属性毎に
画像形式の変更のルールを設定しておき、そのルールに
したがって画像形式変更処理を行わせても良い。例え
ば、文字領域であるならばＴＩＦＦ（Ｇ４）形式に変更
することでデータ量を削減でき、効率の良い画像データ
に変更される。また、網点写真領域や連続階調写真領域
であるならばＪＰＥＧ形式にすることで、画質の劣化を
抑えつつデータ量の圧縮が可能となり、この場合も効率
の良い画像データに変更される。その結果、形式変更画
像データ１６４として格納することが可能となる。この
場合、ひとつの画像データから複数の形式を持った画像
データが生成される。したがって格納する際は、それぞ
れ別個に格納されても良い。このとき、元の画像データ
の構造とそこから発生した形式変更画像データ名を参照
ファイルとして保持しておき、復元する際はその参照フ
ァイルを参照して形式変更画像データ１６４から元の画
像データを再構成することも可能である。このように予
め画素属性毎に画像形式変更処理のルールを設定してお
くことで、データ量を削減した効率の良い画像データ形
式に変更することが可能となる。

【００９１】また、ステップＳＴ７０２で矩形識別原稿
でない場合、画像全体に一様な画像形式変更処理を行う
（ステップＳＴ７０４）。一様な画像形式変更処理とし
て、一様下地原稿であるならば写真がないのでＴＩＦＦ
（Ｇ４）形式に変更することでデータ量を削減すること
がで、網点写真原稿や連続階調写真原稿であるならばＪ
ＰＥＧ形式にすることで、画質の劣化を抑えつつデータ
量の圧縮を図ること可能となる。このようにステップＳ
Ｔ７０３と同様に画像の種類毎に画像形式変更処理のル
ールを設定しておくことで、データ量を削減した効率の
良い画像データ形式に変更することが可能となる。な
お、この場合、ステップＳＴ７０３のように矩形領域毎
に画像形式変更処理を行わないで、画像全体に同一の処
理を施すため、画像形式変更処理が高速に行え、かつ複
数の画像形式が発生することがないため参照ファイルが
不要であり、格納した形式変更画像データからもとの画
像データを復元する際も高速に行えるという利点があ
る。画像形式変更処理の結果、ステップＳＴ７０３と同
様に形式変更画像データ１６４として格納することが可
能となる。

【００９２】また、ステップＳＴ７０１で識別不能原稿
である場合、領域識別部１０２で得られた画素属性の情
報を利用した画像形式変更処理は行わないで、入力画像
データをそのまま形式変更画像データとして出力する
（ステップＳＴ７０５）。

【００９３】このように、領域識別した結果から入力画
像データの種類を判定して、判定された画像データの種
類にしたがって画像形式変更処理を行うことで、効率の
良い画像データに変更することが可能となり、格納する
際の情報量の削減につながる。

【００９４】次に、第４実施例について説明する。

【００９５】第４実施例は、画像の種類の判別結果にし
たがって、起動するアプリケーションを選択し、起動パ
ラメータを決定し、アプリケーションを起動する画像処
理装置である。

【００９６】図１２は、第４実施例に係る画像処理装置
の概略構成を示すものである。図１２において、１０１
は画像入力部、１０２は領域識別部、１０３は画像種別
判定部、１０９はアプリケーション起動部、１１０はア
プリケーション処理結果出力部であり、図１で示した第
１実施例におけるデータ変換部１０４をアプリケーショ
ン起動部１０９とし、画像出力部１０５をアプリケーシ
ョン処理結果出力部１１０とした形態をなしている。画
像入力部１０１、領域識別部１０２、画像種別判定部１
０３は既に説明した通りであるので説明を省略する。ア
プリケーション処理結果出力部１１０は、アプリケーシ
ョンを起動し、処理が行われた結果の出力先であるた
め、実質的には画像出力部１０５と同様の動作を行うと
みなせる。したがって、ここではアプリケーション起動
部１０９について説明する。

【００９７】図１３は、図１２に示した画像処理装置に
おける文書処理手順の例を示すフローチャートである。
図２に示した図１における構成のフローチャートのう
ち、データ変換処理（ステップＳＴ２０５）をアプリケ
ーション起動処理（ステップＳＴ２０９）に、画像出力
処理（ステップＳＴ２０６）をアプリケーション処理結
果出力処理（ステップＳＴ２１０）に変更した形態をな
す。

【００９８】画像種別判定部１０３で入力された画像デ
ータの文書としての種類を決定した後、アプリケーショ
ン起動部１０９において、文書の種類にしたがって画像
処理を行うのに適したアプリケーションを選択し、起動
パラメータを決定し、アプリケーションを起動する処理
を行う（ステップＳＴ２０９）。

【００９９】図１４は、アプリケーション起動部１０９
における一例としてアプリケーション起動処理の詳細を
示すフローチャートであり、図１３に示したステップＳ
Ｔ２０９で行われる処理のフローチャートである。

【０１００】画像種別情報１６１は、画像種別判定部１
０３の出力で、入力画像データの種類を表し、網点写真
原稿１５３、網点下地原稿１５４、連続階調写真原稿１
５５、一様下地原稿１５６、矩形識別原稿１５７、識別
不能原稿１５８のいずれかである。

【０１０１】まず、画像種別情報１６１が識別不能原稿
であるか調べる（ステップＳＴ８０１）。識別不能原稿
でない場合、次に矩形識別原稿であるか調べる（ステッ
プＳＴ８０２）。矩形識別原稿である場合、領域識別部
１０２で得られた画素属性の情報を利用して、入力画像
データに対して矩形領域毎にアプリケーションを起動
し、各々の画像処理を行う（ステップＳＴ８０３）。

【０１０２】アプリケーションとしては、例えば、画像
ファイリング、印刷、ＦＡＸ送信、レイアウト理解、文
字認識、罫線抽出などの画像処理をおこなうものでも良
い。予め画素属性毎に起動させるアプリケーションのル
ールを設定しておき、そのルールにしたがってアプリケ
ーション起動処理を行わせても良い。例えば、文字領域
であるならばレイアウト理解を行って、段組などの文書
構造の認識を行い、さらに文字認識によって文字をコー
ド化しても良い。また、網点写真領域や連続階調写真領
域であるならば、イメージ保存のために画像ファイリン
グを起動させても良く、さらに印刷する際、その領域が
カラーであるならば、カラーという起動パラメータを付
属させることで、出力先のプリンタをカラープリンタに
自動的に変更させても良い。アプリケーションによって
処理結果は、アプリケーション処理結果データ１６５と
なり、プリントアウト、ファイル、文字認識結果などさ
まざまな形態をとることも可能である。このように予め
画素属性毎にアプリケーション起動処理のルールを設定
しておくことで、画像データが入力され次第、自動的に
さまざまな処理を行うことが可能となる。

【０１０３】また、ステップＳＴ８０２で矩形識別原稿
でない場合、アプリケーションを起動して画像全体に一
様な画像処理を行う（ステップＳＴ８０４）。一様な画
像形式変換処理として、一様下地原稿であるならば写真
がないのでレイアウト理解を行って、パラグラフなどの
文書構造の認識を行い、さらに文字認識によって文字を
コード化する処理を行ったりすることができ、網点写真
原稿や連続階調写真原稿であるならばイメージ保存のた
めに画像ファイリングを起動させたり、直接印刷やＦＡ
Ｘ送信を行ったりすることが可能である。アプリケーシ
ョンによっての処理の結果は、ステップＳＴ８０３と同
様にアプリケーション処理結果データ１６５となり、プ
リントアウト、ファイル、文字認識結果などさまざまな
形態をとることも可能である。

【０１０４】また、ステップＳＴ８０１で識別不能原稿
である場合、領域識別部１０２で得られた画素属性の情
報を利用したアプリケーション起動処理は行わないで、
入力画像データをそのままアプリケーション処理結果デ
ータとして出力するか、画像ファイリングなどを起動し
て画像データをそのままファイルとして格納し、後から
ユーザの判断で処理を選択させることも可能である（ス
テップＳＴ８０５）。

【０１０５】このように、領域識別した結果から入力画
像データの種類を判定して、判定された画像データの種
類にしたがって画像処理を行うアプリケーションを起動
させることで、画像データが入力され次第、自動的にさ
まざまな処理を行うことが可能となり、省力化につなが
る。

【０１０６】このように本発明の画像処理装置は、文書
画像を画像入力部１０１によって取り込み、これに対し
て領域識別部１０２において各画素および近傍画素のデ
ータの状況から物理的あるいは論理的に連結しているも
のを一つの領域として抽出したのち、個々の領域の画像
上の位置、大きさ、形状、構造、濃度分布等の特徴量を
計測し、その計測結果を予め定められたルールに基づい
て文書構成要素として文字、写真、網点などの属性を持
った領域として識別を行う。そして、その属性情報等を
もとに画像種別判定部１０３において入力された文書画
像全体の複雑さなどの特徴から文書の種類を決定し、文
書の種類にしたがってデータ変換部１０４にて画像デー
タ形式の変換を行うことを可能とするものである。

【０１０７】また、画像補正部１０６において、文書の
種類にしたがった適切な濃度変換あるいはフィルタ処理
を施し画像データを補正する処理を行い、画像形式変更
部１０７において、文書の種類にしたがって画像記憶部
１０８に格納するのに適した画像形式を選択し、その形
式に変更する処理を行うことを可能にする。

【０１０８】さらに、アプリケーション起動部１０９に
おいて、文書の種類にしたがって画像処理を行うのに適
したアプリケーションを選択し、起動パラメータを決定
し、アプリケーションを起動する処理を行うことも可能
にしたものである。

【０１０９】したがって、本装置により入力された文書
画像データに対し、文字、写真、図表、網点等の異なる
文書要素を区別して領域抽出し、網点、写真といったキ
ーとなる領域の有無や、矩形領域の重なりの度合いから
文書構造としての複雑さなどといった特徴量を求めるこ
とにより、入力された画像データがどのような種類の文
書であるのか判定を行うことが可能となり、この判定結
果を利用することによって、画質の劣化が少ない効率的
な画像データに変換したり、品質の良い画像データを得
るための画像補正を行えるようになる。

【０１１０】また、イメージファイルとして保存する際
も、画像データに合ったフォーマットを自動的に選択で
き、効率的なファイリングができる。

【０１１１】さらに、文書画像データが入力され次第、
自動的に画像処理アプリケーションを選択・起動するた
め、省力化につながる。

【０１１２】以上説明したように上記発明の実施の形態
によれば、文書をハードコピーしたり、イメージデータ
に変換して保存しようとする場合、入力された文書画像
データに対し、文字、図、表、写真、網点等の異なる文
書要素を区別して抽出・識別し、網点、写真といったキ
ーとなる領域の有無や、矩形領域の重なりの度合いから
文書構造としての複雑さなどといった特徴量を求めるこ
とにより、入力された画像データがどのような種類の文
書であるのか判定を行うことが可能となる。この判定結
果を利用して、解像度や圧縮率や色数などのデータ変換
処理やフィルタリング処理を施したり、イメージファイ
ルとして保存する際にも最適な画像フォーマットが選択
でき、効率的なファイリングが行えるようになる。

【０１１３】また、入力画像データを処理するのに適し
た画像処理アプリケーションを起動させることができ
る。

【０１１４】

【発明の効果】以上詳述したようにこの発明によれば、
画像の劣化を少なくして効率的に画像処理を行うことの
できる画像処理装置を提供することができる。

【図面の簡単な説明】

【図１】本発明の第１実施例に係わる画像処理装置の概
略構成を示すブロック図。

【図２】第１実施例の画像処理装置における画像処理の
例を説明するためのフローチャート。

【図３】第１実施例の画像処理装置における画像種別判
定処理を説明するためのフローチャート。

【図４】第１実施例の画像処理装置における画像種別判
定処理を説明するためのフローチャート。

【図５】第１実施例の画像処理装置におけるデータ変換
処理を説明するためのフローチャート。

【図６】本発明の第２実施例に係わる画像処理装置の概
略構成を示すブロック図。

【図７】第２実施例の画像処理装置における画像処理の
例を説明するためのフローチャート。

【図８】第２実施例の画像処理装置における画像補正処
理を説明するためのフローチャート。

【図９】本発明の第３実施例に係わる画像処理装置の概
略構成を示すブロック図。

【図１０】第３実施例の画像処理装置における画像処理
の例を説明するためのフローチャート。

【図１１】第３実施例の画像処理装置における画像形式
変更処理を説明するためのフローチャート。

【図１２】本発明の第４実施例に係わる画像処理装置の
概略構成を示すブロック図。

【図１３】第４実施例の画像処理装置における画像処理
の例を説明するためのフローチャート。

【図１４】第４実施例の画像処理装置におけるアプリケ
ーション起動処理を説明するためのフローチャート。

【符号の説明】

１０１…画像入力部（入力手段）１０２…領域識別部（識別手段）１０３…画像種別判定部（判定手段）１０４…データ変換部（変換手段）１０５…画像出力部（出力手段）１０６…画像補正部（補正手段）１０７…画像形式変更部（変更手段）１０８…画像記憶部（記憶手段）１０９…アプリケーション起動部（起動処理手段）１１０…アプリケーション処理結果出力部（出力手段）

フロントページの続き (72)発明者小平直朗神奈川県川崎市幸区小向東芝町１番地株式会社東芝研究開発センター内 (72)発明者久保田浩明神奈川県川崎市幸区小向東芝町１番地株式会社東芝研究開発センター内Ｆターム(参考） 5B050 BA10 BA15 BA16 BA18 BA19 DA02 DA03 EA04 EA06 EA14 FA01 5B057 BA11 CA08 CA12 CA16 CB08 CB12 CB16 CE06 CE11 CE17 DA08 DB02 DC01 DC36 5C077 LL18 LL19 MP01 MP02 MP05 MP06 PP15 PP20 PP27 PP28 PP37 PQ22 5L096 BA12 BA17 EA03 FA43 FA44 FA45 LA05

Claims

【特許請求の範囲】

【請求項１】文書画像を入力する入力手段と、この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、を具備したことを特徴とする画像処理装置。
【請求項２】上記判定手段は、一様下地の画像デー
タ、画像全体が網点下地である画像データ、網点写真の
みの画像データ、連続階調写真のみの画像データ、矩形
による領域識別が可能な画像データ、矩形による領域識
別が不可能な画像データのうち少なくとも１つの種類を
判定することを特徴とする請求項１記載の画像処理装
置。
【請求項３】文書画像を入力する入力手段と、この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、この判定手段で判定された種類に応じて上記画像データ
の解像度、圧縮率、色数などを変換する変換手段と、この変換手段で変換された画像データを出力する出力手
段と、を具備したことを特徴とする画像処理装置。
【請求項４】文書画像を入力する入力手段と、この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、この判定手段で判定された種類に応じて濃度変換あるい
はフィルタ処理を施して上記画像データを補正する補正
手段と、この補正手段で補正された画像データを出力する出力手
段と、を具備したことを特徴とする画像処理装置。
【請求項５】文書画像を入力する入力手段と、この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、この判定手段で判定された種類に応じて上記画像データ
の画像形式を変更する変更手段と、この変更手段で変更された画像形式の画像データを記憶
する記憶手段と、を具備したことを特徴とする画像処理装置。
【請求項６】文書画像を入力する入力手段と、この入力手段で入力された画像データから画素の特徴を
用いて領域を抽出し、この抽出された領域の属性を識別
する領域識別手段と、この領域識別手段で識別された属性毎の領域の分布から
上記画像データの種類を判定する判定手段と、この判定手段で判定された種類に応じて、画像ファイリ
ング、印刷、送信、レイアウト理解、文字認識、罫線抽
出などの画像処理のアプリケーションを選択し、パラメ
ータを設定後、アプリケーションを起動させ上記画像デ
ータの画像処理を行う処理手段と、この処理手段で画像処理された画像データを出力する出
力手段と、を具備したことを特徴とする画像処理装置。