JP4311663B2 - 文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体 - Google Patents

文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体 Download PDF

Info

Publication number
JP4311663B2
JP4311663B2 JP2004161082A JP2004161082A JP4311663B2 JP 4311663 B2 JP4311663 B2 JP 4311663B2 JP 2004161082 A JP2004161082 A JP 2004161082A JP 2004161082 A JP2004161082 A JP 2004161082A JP 4311663 B2 JP4311663 B2 JP 4311663B2
Authority
JP
Japan
Prior art keywords
image
planes
document
plane
document conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004161082A
Other languages
English (en)
Other versions
JP2005341490A (ja
Inventor
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2004161082A priority Critical patent/JP4311663B2/ja
Priority to EP20050250226 priority patent/EP1555804A3/en
Priority to CNB2005100543009A priority patent/CN100356768C/zh
Priority to US11/037,172 priority patent/US20050180645A1/en
Publication of JP2005341490A publication Critical patent/JP2005341490A/ja
Application granted granted Critical
Publication of JP4311663B2 publication Critical patent/JP4311663B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は、複数のプレーンにオブジェクトの種類に応じた画像を形成し、参照イメージに与えられた階調値により何れかのプレーンを選択することで高い圧縮率を実現すること技術に関する。
従来、入力画像をエッジ部と非エッジ部とに分離し、それぞれ異なる符号化方式で符号化し、符号化後の出力を分離結果に応じて切り替える技術が知られている(特開2003−134344)。この画像処理技術では、エッジ部と非エッジ部との2つの切替のみを行っており、3つ以上には対応していない。
また、入力多値画像から2値画像を生成し、2値画像データを解析して文字部を抽出し、多値画像の中の抽出した文字部に対応する画素を、周辺画素の画素値で置換する(特開2003−046746)。
黒画素データに対応する多値画像データを平均色データで置換も、文字領域を消去して空のフォームを作っているだけで、元画像の再現を行っているわけではない。
特開2003−134344 特開2003−046746
しかし、特許文献1,2の技術では、基本的に、画面分割は文字と背景の二種に分割されるに過ぎず、たとえば、原画像のうちの3種類以上のオブジェクトについて符号化等を行うことができない。
本発明の目的は、複数種類のオブジェクトを含みまたはさらに背景を含む画像を、それぞれ複数のプレーンに分割することで高い圧縮率を実現することができる文書変換装置、文書変換方法、文書変換プログラムおよび当該プログラムが格納された記録媒体を提供することにある。
本発明は、原文書から、枚のプレーンを抽出するプレーン画像抽出手段と、画素ごとに上記2枚のプレーンのうちの何れかを選択するための情報を2階調の値として持ち、上記原文書上の所定のオブジェクトを上記2階調のうちの一の階調の塗潰し画像として含む参照イメージを作成する参照イメージ作成手段と、上記2枚のプレーンおよび上記参照イメージを符号化する符号化手段とを備えた文書変換装置であって、上記プレーン画像抽出手段は、上記参照イメージ上の塗潰し画像の画素により選択されるプレーンの解像度を上記原文書の解像度よりも低い解像度であって予め定められた解像度とするために複数個の画素からなる領域(以下タイルという)を抽出し、上記プレーン上の画素に対応する上記原画像上の上記タイルにおける塗潰し画像の画素値のばらつきを判断し、該ばらつきが小さいときには、上記領域における塗潰し画像の画素値の平均値に応じて、上記プレーン画像上の上記タイルの画素値を決定し、上記ばらつきが大きいときには、上記タイルのサイズをより小さくし、上記サイズを小さくした領域における上記塗潰し画像の画素値のばらつきを判断し、該ばらつきが小さいときには、該塗潰し画像の画素値の平均値に応じて、上記プレーン画像上のタイルの画素値を決定するものである。
上記プレーン画像抽出手段は、上記原文書上のオブジェクトを、上記2枚のプレーンに分けて抽出し、または上記2枚のプレーンおよび上記参照イメージ上に分けて抽出するとよい。
上記符号化手段は、上記2枚のプレーンまたはさらに上記参照イメージを、上記原文書上のオブジェクトの種類に応じた方法により符号化するとよい。
上記符号化手段は、上記2枚のプレーンの少なくとも1つを、他のプレーンの符号化方法とは異なる符号化方法により符号化するとよい。
上記符号化手段により符号化された上記参照イメージおよび上記2枚のプレーンをデータセットに統合する統合手段を備えるとよい。
また、上記文書変換装置は、画像加工または画像補正を行う加工手段を備えるとよい。
また、原文書から、枚のプレーンを抽出するプレーン画像抽出ステップと、画素ごとに上記2枚のプレーンのうちの何れかを選択するための情報を2階調の値として持ち、上記原文書上の所定のオブジェクトを上記2階調のうちの一の階調の塗潰し画像として含む参照イメージを作成する参照イメージ作成ステップと、上記2枚のプレーンおよび上記参照イメージを符号化する符号化ステップとを備えた文書変換方法であって、上記プレーン画像抽出ステップは、上記参照イメージ上の塗潰し画像の画素により選択されるプレーンの解像度を上記原文書の解像度よりも低い解像度であって予め定められた解像度とするために複数個の画素からなる領域(以下タイルという)を抽出し、上記プレーン上の画素に対応する上記原画像上の上記タイルにおける塗潰し画像の画素値のばらつきを判断し、ばらつきが小さいときには、上記領域における塗潰し画像の画素値の平均値に応じて、上記プレーン画像上の上記タイルの画素値を決定し、上記ばらつきが大きいときには、上記タイルのサイズをより小さくし、上記サイズを小さくした領域における上記塗潰し画像の画素値のばらつきを判断し、該ばらつきが小さいときには、該塗潰し画像の画素値の平均値に応じて、上記プレーン画像上のタイルの画素値を決定するものである。
上記プレーン画像抽出ステップは、上記原文書上のオブジェクトを、上記2枚のプレーンに分けて抽出し、または上記2枚のプレーンおよび上記参照イメージ上に分けて抽出するとよい。
上記符号化ステップは、上記2枚のプレーンまたはさらに上記参照イメージを、上記原文書上のオブジェクトの種類に応じた方法により符号化するとよい。
上記符号化ステップは、上記2枚のプレーンの少なくとも1つを、他のプレーンの符号化方法とは異なる符号化方法により符号化するとよい。
上記符号化ステップにより符号化された上記参照イメージおよび上記2枚のプレーンをデータセットに統合する統合ステップを備えるとよい。
また、上記文書変換方法は、画像加工または画像補正を行う加工ステップを備えるとよい。
また、コンピュータを、上記各手段として機能させるための文書変換プログラムも提供する。
また、上記文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体も提供する。
本発明によれば、カラー画像にかかる文書を、画質を大幅に低下させずに、そのファイルサイズを小さくすることができる。また、再現された文書において、文字、罫線、単色で構成される図形などの視認性を保つことができ、さらにグラデュエーションを持つ画像にも適用できる。また、文書画像を複数のプレーンと参照イメージとに分けるので、必要なオブジェクトだけ表示させたり、送信することができる。
〔第1実施形態〕
図1(A),(B)は第1実施形態の文書データ構造を示す説明図である。
図1(B)に示すように、文書データDDは、図1(A)に示す原文書100から抽出したn枚(本実施形態ではn=2)のプレーンPLN(1),PLN(2)と、参照イメージREFとが統合されて構成されている。
原文書100は、図1(A)に示すように、8ビットのカラー画像101と、黒の塗り潰し文字およびグレイの塗り潰し文字102とからなる。
本実施形態では、原文書100に表示された画像は、図1(B)に示すように、当該画像に記載されたオブジェクトに応じて、プレーンPLN(1),PLN(2)に分けて抽出されている。参照イメージREFは、画素ごとにプレーンPLN(1),PLN(2)のうちの1つを選択するための情報をm階調(本実施形態ではm=2)の値A1,A2として持っている。たとえば、A1:「0」、A2:「1」とすることができる。本実施形態では、参照イメージREFは、原文書100上の文字オブジェクトをm階調のうちの1階調の塗潰し画像を含んでいる。この塗潰し画像は、本実施形態では、文字である。
本実施形態では、プレーンPLN(1)はたとえば8ビットのカラー画像であり写真等の圧縮に適した方法により符号化されている。
プレーンPLN(2)は、単純な形状の塗潰し画像の圧縮に適した方法により符号化されており、参照イメージREFの塗潰し画像(文字)に対応する画素の値が、原文書上におけるオブジェクト(文字)の画素値により決定されている。
参照イメージREFは、文字(イメージ画像またはテキストコードにより表された画像)であり文字の圧縮に適した方法により符号化されている。
プレーンPLN(1)はカラー画像であるので、JPEG,JPEG2000などの圧縮方式の適用が好適である。また、プレーンPLN(2)も、JPEG,JPEG2000などの圧縮方式を適用できる。参照イメージREFは、文字画像であるのでMMR圧縮とすることが好ましい。
本実施形態では、図1(A),(B)に示されるように、参照イメージREFの解像度は原文書100の解像度と同じであり、プレーンPLN(2)の解像度は、参照イメージREFの解像度よりも低く設定されている。
プレーンPLN(2)の低解像を低くする場合には、単純に間引きや平均値で低解像度化した画像の画素値を決めると都合が悪いことがある。たとえば、プレーンPLN(2)は文字の色を再現するための画像であるので、文字以外の画素値がプレーンPLN(2)に混入することは好ましくないからである。すなわち、文字以外の部分は黒などの単色で適当に値を決めた画素値であるので、この画素値を低解像度化されたプレーンPLN(2)の画像に反映するのは適当でない。
図2(A),(B),(C)は、プレーンPLN(2)の低解像度化処理の説明図である。図2(A)はプレーンPLN(2)上の画素の値を示し、図2(B)は(A)の参照イメージREFの画素値から、プレーンPLN(2)上の画素の値を決定するための平均値算出用画像GAを示し、図2(C)はプレーンPLN(2)上の画素値を示している。平均値算出用画像GAは、原文書100の、文字オブジェクトの画素値のみを抽出したものであり、プレーンPLN(2)上の画素の値は、平均値算出用画像GAの3×3画素のタイルに含まれる文字オブジェクトの画素値の平均として与えられる。
図2(B)では、参照イメージREFの白画素については、プレーンPLN(1)の画素値が選択され、黒画素については、プレーンPLN(2)上の画素の値(文字オブジェクトの画素値平均値:図では濃いグレイ)が選択される。
図3は、第1実施形態の文書変換装置を示すブロック図であり、この文書変換装置により図1(B)に示す構造の文書データDDを作成することができる。
図3において、文書変換装置11は、プレーン画像抽出手段111と、参照イメージ作成手段112と、加工手段113と、符号化手段114と、統合手段115とを備えている。
プレーン画像抽出手段111は、原文書100から、符号化方法に応じた2枚のプレーンPLN(1),PLN(2)を抽出することができる。
本実施形態では、プレーンPLN(1)はカラー画像である。また、PLN(2)では、オブジェクトの原文書100上での色がカラーである場合に、PLN(2)上のオブジェクトを平均値したカラーとしている。また、参照イメージREFは、白黒画像である。
本実施形態では、プレーンPLN(1)にはカラー写真等が抽出され、プレーンPLN(2)には文字が抽出されるが、これらの抽出に際してのオブジェクトの峻別(文字の抽出、背景の抽出)の技術は周知であるので説明はしない。
参照イメージ作成手段112は、参照イメージREFを作成することができる。
加工手段113は、画像加工または画像補正(解像度変換,フィルタリング処理,明度補正,色調補正,ノイズ除去)を行うことができる。通常この処理により、符号化に際して、圧縮率が高くなる。
たとえば、プレーンPLN(2)は、復元文書100′上で、文字の色だけがわかればよい。したがって、プレーンPLN(2)上の解像度が低く設定されている。また、参照イメージREF上のオブジェクトは、文字であるので、プレーンPLN(2)の解像度を低下させても視認性はさほど低下しない。なお、参照画像REFについて、文字認識処理を行えば、テキストコードが得られる。これを、最終的に生成される一連のデータセットに関連付けて(通常、テキストデータをデータセットに含めて)おけば、復元文書100において、テキストコードによる検索を行うことができる。
また、補間処理等により、解像度を高くする画像処理を行ってもよい。ファイルサイズは大きくなるが写真部などが重要な場合は画質の向上となる。参照イメージREFは、本実施形態では、ドットピッチの変更は行わないが、この変更を行うようにもできる。
参照イメージREFについては、微小な黒画素の連結成分を消去するなどの方法でノイズ除去を行うことができ、これにより符号化に際しての圧縮率が高くなる。
なお、文書がどのよう使われるかに応じて、各プレーンの加工処理を適宜決定できる。たとえば、写真が重要だと考えた場合にはプレーンPLN(1)の解像度を低くしないようにすればよいし、逆に、写真はあまり重要でない場合には、プレーンPLN(1)の解像度を低くし、プレーンPLN(2)の解像度を高めにすればよい。これらは、画質と最終的な情報のサイズとのトレードオフであるので、用途に応じて決定する。
符号化手段114は、プレーンPLN(1),PLN(2)および参照イメージREFを、原文書100上のオブジェクトの種類に応じた方法(当該オブジェクトの圧縮に好適な方法であり、各プレーンで異なる)により符号化することができる。
統合手段115は、符号化手段113により符号化された参照イメージREFおよびn枚のプレーンPLN(1),PLN(2)をデータセットに統合することができる。なお、統合に際して、各プレーンが、どのような属性を持つかの情報(たとえば、写真等のビットマップ画像、文字、背景等の情報)を、データセットに含めておくことで、たとえば、後述する文書復元に際して、操作者にとって不要なプレーンをプレーン除外手段213を用いて除外することができる。これにより、画像表現の際、ある特定のプレーンだけを見ることもできる。この場合は不要な情報は不可視となるので、文書が見やすくなる。また、データ通信に際しては、適宜不要と思われるプレーンをデータセットから除外することで、送受信するデータ量を少なくする(これにより、送受信時間を短くする)ことができる。
図4は、第1実施形態の文書変換方法を示す説明図である。この文書変換方法は、図3の文書変換装置11を用いて実施することができる。
図4において、まず原文書100から、符号化方法に応じた2枚のプレーンPLN(1),PLN(2)を抽出する(プレーン抽出ステップ:S101)。このプレーン抽出ステップS101においては、原文書100上のオブジェクトを、2枚のプレーンPLN(1),PLN(2)に分けて抽出する。
つぎに、各画素に2階調の値A1,A2が付与され、2階調の値に応じて2枚のプレーンPLN(1),PLN(2)うちの何れかを特定するための参照イメージREFを作成する(参照イメージ作成ステップ:S102)。、
さらに、2枚のプレーンPLN(1),PLN(2)について、画像加工または画像補正(解像度変換,フィルタリング処理,明度補正,色調補正,ノイズ除去)を行う(加工ステップ:S103)。プレーンPLN(2)については、上述した解像度変換が行われる。
この後、2枚のプレーンPLN(1),PLN(2)および参照イメージREFを符号化する(符号化ステップ:S104)。符号化ステップS104では。2枚のプレーンPLN(1),PLN(2)および参照イメージREFは、原文書100上のオブジェクト(本実施形態では文字)の種類に応じた方法により符号化する。本実施形態では、2枚のプレーンは、それぞれ異なる符号化方法で符号化している。
そして、符号化ステップS104において符号化された参照イメージREFおよび2枚のプレーンPLN(1),PLN(2)をデータセットに統合する。
なお、プレーンPLN(1)の、原文書100上の文字に対応する画素は、周囲の代表的な色で置き換えることができる。また、プレーンPLN(2)の参照されない領域の画素値を、所定の画素値(たとえば、白、黒等)に置き換えることもできる。
これにより、符号化に際して圧縮効率を向上させることができる。
図5は、第1実施形態の文書復元装置を示す説明図である。
図5において、文書復元装置21は、文書分解・復号化手段211と、階調値取得手段212と、プレーン除外手段213と、プレーン特定手段214と、文書復元手段215とを備えている。本実施形態において文書復元装置21は、文書データDDを取得し、当該文書データから原文書100を復元することができる。
文書分解・復号化手段211は、文書データDDに復号化処理を施し、2枚のプレーンプレーンPLN(1),PLN(2)と参照イメージREFを生成することができる。
階調値取得手段212は、参照イメージREFの画素を走査し、走査された画素に付与されている2階調の値A1,A2の何れかを取得することができる。
プレーン除外手段213は、2枚のプレーンPLN(1),PLN(2)のうち1枚または2枚のプレーンを処理対象から外すことができる。プレーン除外手段213により除外されたプレーンは、プレーン特定手段214による特定の対象には含めないことで、必要なオブジェクトだけを再現画像100′上に表示することができる。
プレーン特定手段214は、2階調の値A1,A2の値に対応するプレーンPLN(1),PLN(2)を特定することができる。
文書復元手段215は、参照イメージREFの画素の位置に与えられている、画素に対応するプレーン特定手段214により特定されたプレーン上の値を抽出し、文書の復元を行い、復元文書100′を得ることができる。
プレーンPLN(2)上でカラーが定義されている場合において、参照イメージREFの画素の階調値がA2であるときには、復元文書100′にはプレーンPLN(2)上で定義された色が反映される。
図6は、第1実施形態の文書復元方法を示す説明図である。この文書復元方法は、図5の文書復元装置21を用いて実施することができる。
図6において、まず文書データDDを、2枚のプレーンPLN(1),PLN(2)および参照イメージREFに分解し、これらに復号化処理を施す(文書分解・復号化ステップ:S201)。
参照イメージREFの画素を走査し、各画素に付与された2階調の値A1,A2を取得する(階調値取得ステップ:S202)。
所定対象となるプレーンを除外する(プレーン除外ステップ:S203)。
2階調の値A1,A2に対応するプレーンを特定する(プレーン特定ステップ:S204)。
プレーン特定ステップS204において特定されたプレーン上の画素の位置に与えられている画素値を抽出し、復元文書100′を生成する(文書復元ステップ:S205)。
〔第2実施形態〕
図7(A),(B),(C)は、プレーンPLN(2)の低解像度化処理に変更を加えた実施形態の説明図である。図7(A)はプレーンPLN(2)上の画素の値を示し、図7(B)は(A)の参照イメージREFの画素値から、プレーンPLN(2)上の画素の値を決定するための平均値算出用画像GAを示し、図7(C)はプレーンPLN(2)上の画素値を示している。
平均値算出用画像GAは、原文書100の、文字オブジェクトの画素値のみを抽出したものであり、プレーンPLN(2)上の画素の値は、平均値算出用画像GAの8×8画素のタイルTに含まれる文字オブジェクトの画素値の平均として与えられる。
図7(B)では、参照イメージREFの白画素については、プレーンPLN(1)の画素値が選択され、黒画素については、プレーンPLN(2)上の画素の値(文字オブジェクトの画素値平均値:図では濃いグレイ)が選択される。
平均値算出用画像GA上の8×8画素のタイルT内の、文字に相当する画素のばらつきが小さいときにはプレーンPLN(2)上の対応する画素の値は同一色に丸められる。また、タイルT内の画素値のばらつきが大きいときには、より小さいサイズのタイル(たとえば、2×2画素のタイル)におけるばらつきを判断し、当該ばらつきが小さいときには当プレーンPLN(2)上の対応する画素の値は同一色に丸めることができる。
図8に上記したプレーンPLN(2)を低解像度化する処理を示すフローチャートである。
まず、平均値算出用画像GA上で8×8画素に相当するタイルTを選択する(S301)。次に、タイルT内の文字位置に相当する画素を抽出し(S302)、該当する画素があるか否かを判断する(S303)。
ステップS303において、タイルT内の文字位置に相当する画素がないときは、プレーンPLN(2)の画素に所定の画素値を付与し(S304)、プレーンPLN(2)の全画素ついて画素値付与を終えたか否かを判断する(S310)。
ステップS303において、タイルT内の文字位置に相当する画素があるときは、当該各画素値の平均および分散を計算し(S305)、分散が所定値よりも大きいか否かを判断する(S306)。分散が所定値よりも大きいときは、平均値算出用画像GA上の8×8画素のタイルTを2×2画素のタイルに再分割し(S307)、再分割したタイル内の文字に相当する画素の画素値の平均値をプレーンPLN(2)の画素に付与し(S308)、プレーンPLN(2)の全画素ついて画素値付与を終えたか否かを判断する(S310)。
ステップS306において、分散が所定値よりも大きいときは、8×8画素のタイルT内の文字相当画素の画素値の平均値をPLN(2)の画素に付与し、プレーンPLN(2)の全画素ついて画素値付与を終えたか否かを判断する(S310)。
S310において、プレーンPLN(2)の全画素ついて画素値付与を終えたときは低解像度化処理を終了する。
本実施形態では、原文書100の色のばらつきを判断して、ばらついている場合はもっと細かい単位で着色を行えば、色が混ざることもない。また、本実施形態では、着色単位を選択的に変化させているので、画質を落とすことなく、圧縮効率を高める効果が期待できる。
なお、色のばらつきを求める方法としては、分散によるもののほかに、無彩色を持つ画素と有彩色を持つ画素の比率を用いてもよい。この場合は、有彩色と無彩色のどちらか一方が支配的に多い場合以外に、色のばらつきが大きいと判断する。無彩色の判断は、ある画素の色が(R,G,B)である場合に、あらかじめ定めておいた閾値thとの間に
|R−G|<th かつ |G−B|<thかつ|B−R|<th
の関係が成り立つ場合に無彩色と判断する方法などが考えられる。
このような、無彩色と有彩色の比率を用いる方法では、有彩色同士が混合している場合は色が混合してしまうが、分散計算に必要な乗算が不要であるので計算のためのコストが小さくて済むという利点がある。
第1実施形態の文書データ構造を示す説明図であり、(A)は原文書を示す図、(B)は各プレーンと参照イメージとが統合された文書データを示す図である。 プレーンPLN(2)の低解像度化処理の説明図であり、(A)はプレーンPLN(2)上の画素の値を示し、(B)は(A)の参照イメージREFの画素値から、プレーンPLN(2)上の画素の値を決定するための平均値算出用画像GAを示し、(C)はプレーンPLN(2)上の画素値を示す図である。 第1実施形態の文書変換装置を示すブロック図である。 第1実施形態の文書変換方法を示す説明図である。 第1実施形態の文書復元装置を示す説明図である。 第1実施形態の文書復元方法を示す説明図である。 図2のプレーンPLN(2)の低解像度化処理に変更を加えた処理の説明図であり、(A)はプレーンPLN(2)上の画素の値を示し、(B)は(A)の参照イメージREFの画素値から、プレーンPLN(2)上の画素の値を決定するための平均値算出用画像GAを示し、(C)はプレーンPLN(2)上の画素値を示す図である。 プレーンPLN(2)を低解像度化する処理を示すフローチャートである。
符号の説明
11 文書変換装置
21 文書復元装置
100 原文書
100′ 復元文書
101 カラー画像
102 文字
103 背景
111 プレーン画像抽出手段
112 参照画像作成手段
113 補正手段
114 符号化手段
115 統合手段
211 文書分解・復号化手段
212 階調値取得手段
213 プレーン除外手段
214 プレーン特定手段
215 文書復元手段
DD 文書データ
A 階調値
PLN(x)(xは、正の整数) プレーン
REF 参照イメージ

Claims (14)

  1. 原文書から、枚のプレーンを抽出するプレーン画像抽出手段と、
    画素ごとに前記枚のプレーンのうちの何れかを選択するための情報を2階調の値として持ち、前記原文書上の所定のオブジェクトを前記階調のうちの一の階調の塗潰し画像として含む参照イメージを作成する参照イメージ作成手段と、
    前記枚のプレーンおよび前記参照イメージを符号化する符号化手段と
    を備えた文書変換装置であって、
    前記プレーン画像抽出手段は、前記参照イメージ上の塗潰し画像の画素により選択されるプレーンの解像度を前記原文書の解像度よりも低い解像度であって予め定められた解像度とするために複数個の画素からなる領域(以下タイルという)を抽出し、
    前記プレーン上の画素に対応する前記原画像上の前記タイルにおける塗潰し画像の画素値のばらつきを判断し、ばらつきが小さいときには、前記領域における塗潰し画像の画素値の平均値に応じて、前記プレーン画像上の前記タイルの画素値を決定し、
    前記ばらつきが大きいときには、前記タイルのサイズをより小さくし、前記サイズを小さくした領域における前記塗潰し画像の画素値のばらつきを判断し、
    該ばらつきが小さいときには、該塗潰し画像の画素値の平均値に応じて、前記プレーン画像上のタイルの画素値を決定することを特徴とする文書変換装置。
  2. 前記プレーン画像抽出手段は、前記原文書上のオブジェクトを、前記枚のプレーンに分けて抽出し、または前記2枚のプレーンおよび前記参照イメージ上に分けて抽出することを特徴とする請求項1に記載の文書変換装置。
  3. 前記符号化手段は、前記枚のプレーンまたはさらに前記参照イメージを、前記原文書上のオブジェクトの種類に応じた方法により符号化することを特徴とする請求項1に記載の文書変換装置。
  4. 前記符号化手段は、前記枚のプレーンの少なくとも1つを、他のプレーンの符号化方法とは異なる符号化方法により符号化することを特徴とする請求項1に記載の文書変換装置。
  5. 前記符号化手段により符号化された前記参照イメージおよび前記枚のプレーンをデータセットに統合する統合手段を備えたことを特徴とする請求項1に記載の文書変換装置。
  6. 画像加工または画像補正を行う加工手段を備えたことを特徴とする請求項1に記載の文書変換装置。
  7. 原文書から、枚のプレーンを抽出するプレーン画像抽出ステップと、
    画素ごとに前記枚のプレーンのうちの何れかを選択するための情報を2階調の値として持ち、前記原文書上の所定のオブジェクトを前記階調のうちの一の階調の塗潰し画像として含む参照イメージを作成する参照イメージ作成ステップと、
    前記枚のプレーンおよび前記参照イメージを符号化する符号化ステップと
    を備えた文書変換方法であって、
    前記プレーン画像抽出ステップは、前記参照イメージ上の塗潰し画像の画素により選択されるプレーンの解像度を前記原文書の解像度よりも低い解像度であって予め定められた解像度とするために複数個の画素からなる領域(以下タイルという)を抽出し、
    前記プレーン上の画素に対応する前記原画像上の前記タイルにおける塗潰し画像の画素値のばらつきを判断し、該ばらつきが小さいときには、前記領域における塗潰し画像の画素値の平均値に応じて、前記プレーン画像上の前記タイルの画素値を決定し、
    前記ばらつきが大きいときには、前記タイルのサイズをより小さくし、前記サイズを小さくした領域における前記塗潰し画像の画素値のばらつきを判断し、
    該ばらつきが小さいときには、該塗潰し画像の画素値の平均値に応じて、前記プレーン画像上のタイルの画素値を決定することを特徴とする文書変換方法。
  8. 前記プレーン画像抽出ステップは、前記原文書上のオブジェクトを、前記枚のプレーンに分けて抽出し、または前記枚のプレーンおよび前記参照イメージ上に分けて抽出することを特徴とする請求項7に記載の文書変換方法。
  9. 前記符号化ステップは、前記枚のプレーンまたはさらに前記参照イメージを、前記原文書上のオブジェクトの種類に応じた方法により符号化することを特徴とする請求項7に記載の文書変換方法。
  10. 前記符号化ステップは、前記枚のプレーンの少なくとも1つを、他のプレーンの符号化方法とは異なる符号化方法により符号化することを特徴とする請求項7に記載の文書変換方法。
  11. 前記符号化ステップにより符号化された前記参照イメージおよび前記枚のプレーンをデータセットに統合する統合ステップを備えたことを特徴とする請求項7に記載の文書変換方法。
  12. 画像加工または画像補正を行う加工ステップを備えたことを特徴とする請求項7に記載の文書変換方法。
  13. コンピュータを、請求項1に記載の各手段として機能させるための文書変換プログラム。
  14. 請求項13に記載の文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2004161082A 2004-01-19 2004-05-31 文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体 Expired - Lifetime JP4311663B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2004161082A JP4311663B2 (ja) 2004-05-31 2004-05-31 文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体
EP20050250226 EP1555804A3 (en) 2004-01-19 2005-01-18 Image processing apparatus, image processing program and storage medium
CNB2005100543009A CN100356768C (zh) 2004-01-19 2005-01-19 图像处理设备和图像处理方法
US11/037,172 US20050180645A1 (en) 2004-01-19 2005-01-19 Image processing apparatus, image processing program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004161082A JP4311663B2 (ja) 2004-05-31 2004-05-31 文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2005341490A JP2005341490A (ja) 2005-12-08
JP4311663B2 true JP4311663B2 (ja) 2009-08-12

Family

ID=35494498

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004161082A Expired - Lifetime JP4311663B2 (ja) 2004-01-19 2004-05-31 文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP4311663B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4893198B2 (ja) * 2006-09-28 2012-03-07 セイコーエプソン株式会社 ファイル生成プログラム、画像処理装置、及びファイル生成方法
JP5482177B2 (ja) * 2009-12-15 2014-04-23 株式会社リコー 符号化装置、プログラム、記録媒体

Also Published As

Publication number Publication date
JP2005341490A (ja) 2005-12-08

Similar Documents

Publication Publication Date Title
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
JP5132517B2 (ja) 画像処理装置および画像処理方法
JP3813387B2 (ja) 情報埋込方法および装置並びに記録媒体
US8503036B2 (en) System and method of improving image quality in digital image scanning and printing by reducing noise in output image data
US7324247B2 (en) Image processing apparatus, image processing program and storage medium storing the program
US8077986B2 (en) Information processing apparatus, method of controlling same and computer program
JP2006005939A (ja) スキャンされた文書用のセグメント化に基づくハイブリッド圧縮機構
US7760399B2 (en) Method and system for encoding color images to black-and-white bitmaps and decoding color images
EP1102474B1 (en) Image processing apparatus, method and memory medium therefor
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
JP2011193394A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2611012B2 (ja) 文字分離符号化方法
JPH07322074A (ja) ディザリングされた2レベル・イメージ・ファイルを処理するためのデータ処理装置および方法
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP4311663B2 (ja) 文書変換装置、文書変換方法、文書変換プログラムおよび記録媒体
JP4446797B2 (ja) 文書復元装置、文書復元方法、文書復元プログラムおよび記録媒体
KR101454208B1 (ko) 하프톤 영상 인코딩 및 디코딩 방법 및 장치
JPH08251420A (ja) カラー画像処理装置
JP4504096B2 (ja) 画像処理装置、プログラム、及び記憶媒体
JP2010098743A (ja) 画像処理装置、画像読取装置、及び画像処理方法
JP2004350182A (ja) データ処理装置、データファイル、データ処理方法、およびプログラム
JP4465654B2 (ja) 画像辞書作成装置、符号化装置、符号化方法及びそのプログラム
JP4753006B2 (ja) 画像符号化装置、画像復号化装置及びこれらのプログラム
JP2005303506A (ja) 画像処理装置、画像処理方法、画像処理用プログラム及び記憶媒体
JP2024080365A (ja) 画像処理装置、その制御方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081224

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090114

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090507

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090508

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4311663

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130522

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140522

Year of fee payment: 5

EXPY Cancellation because of completion of term