JP2004242075A - 画像処理装置および方法 - Google Patents
画像処理装置および方法 Download PDFInfo
- Publication number
- JP2004242075A JP2004242075A JP2003029583A JP2003029583A JP2004242075A JP 2004242075 A JP2004242075 A JP 2004242075A JP 2003029583 A JP2003029583 A JP 2003029583A JP 2003029583 A JP2003029583 A JP 2003029583A JP 2004242075 A JP2004242075 A JP 2004242075A
- Authority
- JP
- Japan
- Prior art keywords
- character
- rectangle
- color
- image
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Abstract
【課題】文字切り処理に色抽出結果をフィードバックし、多値画像の文字食および文字領域情報の抽出を精度良く行う。
【解決手段】カラー画像より文字領域の二値画像を生成する文字領域画像作成手段と、前記文字領域の二値画像に対し文字矩形を作成する文字切り手段と、前記文字矩形の単色判定をおこなう単色判定手段と、非単色の文字矩形が複数種の単色文字集合であることを判定する手段と、上記判定矩形内を文字切りする詳細文字切り手段を有する画像処理装置。
【選択図】 図1
【解決手段】カラー画像より文字領域の二値画像を生成する文字領域画像作成手段と、前記文字領域の二値画像に対し文字矩形を作成する文字切り手段と、前記文字矩形の単色判定をおこなう単色判定手段と、非単色の文字矩形が複数種の単色文字集合であることを判定する手段と、上記判定矩形内を文字切りする詳細文字切り手段を有する画像処理装置。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は画像処理装置および方法に関するものである。
【0002】
【従来の技術】
近年、スキャナの普及により文書の電子化が進んでいる。電子化された紙文書をフルカラービットマップ形式の状態では、A4サイズの場合300dpiで約24Mバイトにもなる。このような大容量のデータは、メイルに添付して送信するのに適したサイズとはいえない。そこで、フルカラー画像を圧縮することが通常行われており、その圧縮方式としてJPEGが知られている。JPEGは写真などの自然画像を圧縮するには非常に効果も高く、画質も良い。しかし一方で、文字部などの高周波部分をJPEG圧縮すると、モスキートノイズと呼ばれる画像劣化が発生し、圧縮率も悪い。そこで、領域分割を行い、文字領域を抜いた下地部分に自然画向きの圧縮方式、単色あるいは小数色の文字領域部分には可逆圧縮方式を施す方法があった。
【0003】
圧縮の際に、領域分割により分けられた文字領域部分は減色してMMRやZIP圧縮を施すとともに色情報を保持し、文字部を抜いた下地部分はJPEG圧縮を施す。展開時には下地画像の上に、文字領域の画像を色情報に従って描画することで、高画質と高圧縮率を両立する画像処理装置を提供している(例えば、特許文献1参照)。
【0004】
上記のような装置においては、文字領域の色情報抽出精度が、画質と圧縮率双方の性能に大きく影響する。そのため、二値画像の文字切り処理を利用して文字色抽出の性能を向上させている(例えば、特許文献2参照)。
【0005】
【特許文献1】
特開2002−077631号公報
【特許文献2】
特開2003−008909号公報
【0006】
【発明が解決しようとしている問題】
しかし、特殊なレイアウトや領域分割の誤り、あるいはノイズや傾きなどの影響で文字切り処理が正しく行われなかった領域に、異なる色の文字が混在する場合、色抽出が正しくおこなわれず、該領域が非文字と認識され画質劣化、圧縮率低下の原因となっていた。
【0007】
たとえば、図13のように画像が傾いており、かつ色の異なる2行が接近している場合、射影を用いた行の分割ができないため文字の切り出しに失敗し、個々の文字に対応する正しい色を抽出できない。その結果この領域は非文字の図形と判断されてしまう。
【0008】
また、図14のように、見出しなど大きな文字と小さな文字が接近している場合、領域分割はこれをひとつの文字列と看倣してしまうことがある。このときも文字切り失敗により、文字毎の単色抽出がおこなえず、非文字の図形とされてしまう。
【0009】
なおこれらの例では、文字が複数種の単色ではなく、すべて同色からなる領域であれば、たとえ文字切りは失敗しても色抽出は自体は正しくおこなわれるので、文字領域内の処理に問題は生じない。そのうえ、文字切り処理自体を例外対応により複雑化していくことには限界があることをふまえると、既存の文字切り処理を用いたうえで、複数色の文字領域に関する例外事象に対処することがより望ましい。
【0010】
本発明は上記従来技術の課題を解決するために成されたものであり、文字切り処理に色抽出の結果をフィードバックして、多値画像の文字色および文字領域情報の抽出を精度良く行う画像処理装置および方法を提供することを目的とする。
【0011】
【課題を解決するための手段】
この発明は下記の構成を備えることにより上記課題を解決できるものである。
【0012】
(1)スキャンされたカラー画像に対し、前記カラー画像より文字領域の二値画像を生成する文字領域画像作成手段と、前記文字領域の二値画像に対し文字矩形を作成する文字切り手段と、前記文字矩形の単色判定をおこなう単色判定手段と、非単色の文字矩形が複数種の単色文字集合であることを判定する手段と、上記判定矩形内を文字切りする詳細文字切り手段と、を有する画像処理装置。
【0013】
(2)前記(1)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、非単色矩形およびそれに隣接する矩形を含めて複数種の単色文字集合であることを判定することを特徴とする画像処理装置。
【0014】
(3)前記(2)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、行間位置が一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理装置。
【0015】
(4)前記(2)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、色分布一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理装置。
【0016】
(5)スキャンされたカラー画像に対し、前記カラー画像より文字領域の二値画像を生成する文字領域画像作成手段と、前記文字領域の二値画像に対し文字矩形を作成する文字切り手段と、前記文字矩形の単色判定をおこなう単色判定手段と、非単色の文字矩形が複数種の単色文字集合であることを判定する手段と、
上記判定矩形内を文字切りする詳細文字切り手段と、を有する画像処理方法。
【0017】
(6)前記(5)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、非単色矩形およびそれに隣接する矩形を含めて複数種の単色文字集合であることを判定することを特徴とする画像処理方法。
【0018】
(7)前記(6)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、行間位置が一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理方法。
【0019】
(8)前記(6)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、色分布一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理方法。
【0020】
【発明の実施の形態】
図1に本発明の第一の実施例のブロック図を示す。
【0021】
100は多値画像より全面二値画像を作成する縮小・二値化部である。101は画像中の文字領域を検出して複数の文字領域座標(109)を作成する文字領域検出部である。102は上記文字領域座標と原画像より、複数の文字領域部分の画像(107)を作成する文字領域画像作成部である。103は上記文字領域画像の黒部分と原画像を参照しながら黒部分の代表色(110)を算出する文字色抽出部である。104は上記文字領域画像の黒画素に対応する原画像上の画素を、周辺の色で塗りつぶし下地多値画像(108)を作成する文字部塗りつぶし部である。105は複数の文字領域画像を圧縮して複数の圧縮コードA(111)を作成する文字領域画像圧縮部である。106は下地多値画像(108)を圧縮して圧縮コードB(112)を作成する下地画像圧縮部である。
【0022】
次に、図1の構成を用いて、スキャナなどで入力した画像データを圧縮する際の処理を、図3のフローチャートを用いて説明する。
【0023】
ステップS301では、縮小・二値化部100にて、入力多値画像に対し二値化処理を行う。その内容を以下簡単に説明する。
【0024】
RGB多値画像に次式のような輝度変換を行って、輝度画像Jを作成する。
【0025】
Y=0.299R+0.587G+0.114B
このとき、入力画像の解像度に応じて解像度変換をおこなってもよい。例えば原画像が300dpiのとき、縦方向、横方向とも4画素ごとに上式の演算を行い、新しい画像Jを作成すると画像JはY8ビット75dpiの画像となる。次に、輝度画像Jのヒストグラムを取り、二値化閾値Tを算出する。輝度画像JをTにて二値化し、全面二値画像Kを作成する。なお、ヒストグラムより閾値Tを算出する際には公知の方法を用いるとする。
【0026】
ステップS302では、文字領域検出部101にて、二値画像に対して領域分割処理をおこない、その結果から文字領域のみを抽出して文字領域座標109を作成する。
【0027】
上記領域分割処理は、USP5680478“Method and Apparatus for character recognition”(Shin−YwanWangら/CanonK.K.)などを用いる。簡単に説明すると、二値画像中の黒画素を輪郭線追跡して得られた塊を抽出し、その形状、大きさ、文字、絵や図、線、表、を分類するとともに、文字と判定される塊の集合から、文字列をなす文字領域を抽出する処理となる。
【0028】
S301およびS302の処理例を示す。例えば図2に示すカラー原稿を入力し、間引いて輝度変換したもののヒストグラムを取ると図12のようになる。このヒストグラムから平均、分散、などのデータを利用して閾値T=199を算出し、二値化した画像は図6のようになる。図6を領域分割処理すると、図7に示すような15個の文字領域が検出される。これらの座標データが図1の109に格納される。
【0029】
ステップS303では、文字領域画像作成部102が、文字領域座標109に基き、それぞれ文字領域ごとに領域内の文字部を黒、背景を白とする二値画像を作成する。この二値画像は、二値化部で得た閾値で多値画像を全面二値化し、それらから切りとって作成してもよいし、文字領域内で多値画像から輝度ヒストグラムを取りなおし、領域毎に最適な二値化閾値を算出して得た二値画像を用いてもよい。
【0030】
ステップS304では、文字色抽出部103が、各文字領域内の代表色を抽出する。ここで代表色数は1に限定してもよいし、領域内に複数色の文字が混在する場合には任意の最大代表色数を選ぶようにすればよい。以下に、ある文字領域に対する文字色抽出処理の詳細を、図4のフローチャートを用いて説明する。
【0031】
S401では、文字領域の二値画像Rより、文字行および個別文字に対応する矩形を抽出する、いわゆる文字切り処理をおこなう。以下に文字切り処理の概要を説明する。
【0032】
まず水平方向の射影と垂直方向の射影をとり、その分散の高いほうを文字列方向とし、その射影の切れ目で行を分割する。さらに個々の行内で先の射影方向と垂直の射影をとりなおし、その切れめより文字行を分割して文字矩形を作成する。以降の処理は文字切りされた矩形毎におこなわれる。図9に文字切り処理の例を示す。
【0033】
S402では文字矩形内の二値画像を細線化した二値画像Pを作成する。これはスキャナ特性やプリント時のアンチエイリアシングにより乱された、文字周辺付近よりの色抽出を回避するためである。図11に細線化の例を示す。
【0034】
S403では、細線化された二値画像Pの各画素に対応する色情報を、元のカラー画像を参照して求め、RGBそれぞれヒストグラムを作成する。もちろん、RGBのかわりにYUVなど他の色空間を用いてもよい。
【0035】
S404では、文字矩形の単色判定を行う。具体的には、RGB各ヒストグラムの分散を求め、あらかじめ定めた閾値と比較し、RGBいずれの分散値も閾値以内の場合は、単色と判定しS405に進む。閾値を超える分散値があった場合は複数色を所持するとしてS406へ進む。
【0036】
S405では、RGB各ヒストグラムから注目文字矩形の代表色を決定する。これは各ヒストグラムのピーク値からなる色をとってもよいし、平均値を用いてもよい。
【0037】
図10に、S403〜S405の処理例を示す。図10(a)の「イ」は黒文字(b)の「ン」は赤文字として、それぞれ代表色のRGB値を得るが、図10(c)の花模様はヒストグラムの分散が大きく、かつ文字切り不能なため、非文字と判定されている。
【0038】
次に、S406では注目の複数色を有す矩形が、非文字であるか、あるいは複数の単色文字の集合であるかを判定する。
【0039】
このS406内の判定処理について、図5のフローチャートを用いて説明する。なお、ここでは水平方向の文字列からなる文字領域の場合について説明するが、垂直方向の文字列の場合は90度方向を入れ換えることで同様の処理が可能である。
【0040】
S501では、入力矩形Cに対し、その高さを閾値Hと比較する。この閾値Hは複数の文字が縦に並んでいる可能性を持つ高さの最小値であり、画像解像度に応じてあらかじめ定める数値である。Hより小さい場合は、矩形Cを非文字と判断して終了する。Hより大きければS502に進む。
【0041】
S502では、矩形C内のみを対象にS401と同様の文字切り処理をおこなう。ただし文字列方向についてはあらたに判定せず、処理中の領域と同じ方向とみなす。
【0042】
S503では、S502の文字切り処理で得た行数が2未満、あるいは行高の閾値t未満の高さの行を含む場合、矩形Cを非文字と判断して終了する。それ以外の場合はS504に進む。
【0043】
S504では、S502の文字切り処理で得た文字行と文字矩形に関して、行毎の文字数の最大値pと最小値qを求める。ただしあらかじめ定めた幅および高さの範囲にない文字矩形は文字数としてカウントしない。ここで、qが0の場合矩形Cは非文字と判断して終了し、p≧2かつq≧1の場合は、矩形Cを複数の単色文字集合と判断して終了する。それ以外の場合、すなわちp=q=1の場合S505へ進む。
【0044】
S505では、矩形Cの右に隣接する矩形に対し、Cと同等の行間の隙間を持つ矩形が連続する数Nをカウントする。具体的には、矩形Cの水平方向の射影の切れ目と、注目矩形の水平方向射影の切れ目を比較して、一致するものをカウントする。また、右隣の矩形と行間が一致した場合、さらにその右隣と比較する、というように行間が一致しなくなるまで範囲を広げてゆく。このグループ化によれば、文字切り処理回数を減らし効率を上げる効果があるが、数Nを文字としての確信度に用いてもよい。たとえば、N≧1でなければ矩形Cを非文字と判定して終了してもよい。
【0045】
S506では、S502の文字切り結果は破棄し、S505で得た矩形集合に外接する領域内に対し、詳細文字切り処理をおこなう。そして、矩形Cおよび、その右に続くN−1個の矩形のすべてを含む領域が、複数種の単色文字の集合であると判定し終了する。
【0046】
図15はS506の詳細文字切り処理に至る例を説明する図である。S401で得られた文字切り矩形C1〜C5において、C1、C2はの単色一文字だが、C3〜C5は異なる色の複数文字を含む矩形になっている。図4処理ではC1、C2を単色と判定した後、C3は単色ではないためS406の処理にはいる。図5に移り、S501〜S504を経てS505により、同一行間を持つ右側の矩形C4とC5を含めた領域で、S506詳細文字切りが行われている。最終的な文字矩形はすべて単色となっており、文字切りの精度が向上されるのがわかる。
【0047】
図4に戻り、S406で非文字と判定された場合はS407に進み、複数種の単色文字と判定された場合はS408に進む。
【0048】
S407では、二値画像Rにおいて、非文字と判定された該文字矩形部分内の黒画素をすべて消去する。これは、該当部分を二値画像から消去することで、後の穴うめ処理の対象外とし、非文字の複雑な色情報を下地側に残して保存するための処理である。消去後、矩形は破棄してS409に進む。
【0049】
S408では、矩形Cを破棄するとともに、その内側に存在する文字矩形をそれぞれを図4処理で未処理の矩形として追加する。これらはS502あるいはS506で作成された文字矩形群に相当し、なお、文字矩形群がS506で作成された場合は、それらのもとになったN−1個の矩形もC同様破棄する。そしてS409に進む。
【0050】
S409にて、未処理の文字矩形が残っていれば、S403に戻って繰り返す。なければS410に進む。
【0051】
S410では、各文字矩形に対応して文字数ぶんの色の集合が作成されているので、これに対して減色処理を施し、合計n色以下にまとめる。本処理はスキャナ処理などの影響で生じた色のばらつきをまとめる為の処理である。具体的減色方法としては、ヒストグラムをとって閾値以上のピークを1個以上抽出し、それらの色は近接ピークと統合する、などの方法があるが、他の種々のクラスタリング手法を用いてもよい。またnの値は任意であるが、圧縮率に影響するので、たかだかn=4程度を妥当とする。
【0052】
図3に戻り、ステップS305では,文字部塗りつぶし部104が、文字領域画像内の黒画素に対応する原画像上の各画素を、周辺の色で塗りつぶし下地多値画像(108)を作成する。本処理の一例を図8を用いて説明する。
【0053】
グラデーション画像を背景とし、「イン」という青色の文字が中央付近に描かれた、図8(a)のような画像を原画像とする。この原画像から(b)のような1つの文字領域の二値画像を得たとする。本実施の形態では、例えば全画像を32×32の領域(以下、パーツ)に分割し、パーツごとの処理をおこなう。図8(c)にパーツ分けの様子を示す。この図では簡単に説明するため、4×3のパーツに分割した状態を示している。各領域の左上の数字はパーツ番号を示す。このとき、パーツ00〜03,10,13,20〜23内には文字がないので、処理は行われない。パーツ11に対しては、対応する二値画像中の画素より、各パーツ内の白部分に対応するカラー画像のRGB値(またはYUV等でも良い)の平均値ave_color11を算出する。そして、原画像上で、二値画像の黒部分にあたる画素このave_color11で塗りつぶす。パーツ22に対しても同様である。
【0054】
このようにすれば、文字の存在する部分の周りの画素の平均値をもって、文字の存在する画素を塗りつぶすことができ、見掛け上自然に文字のみが取り除かれた、下地画像108が生成される。
【0055】
図3に戻り、ステップS306では、文字領域画像圧縮部107にて、文字領域画像にあたる部分二値画像の集合108を圧縮して圧縮コードAを作成する。この際、単色の文字領域はMMR圧縮を施すが、S304にて複数の代表色が抽出された文字領域は、領域内の色情報を保存できる最低必要bit数に変換し、ZIP圧縮をするか、あるいは同一領域を色別に異なる二値画像に分解する形で、それぞれをMMR圧縮を施すようにしてもよい。
【0056】
ステップS307では、下地画像圧縮処理部106にて、下地画像108に対しJPEG圧縮を行い圧縮コードBを作成する。JPEG圧縮処理は一般的なものを用いる。簡単に説明すると、画像をYUVの各成分に分割し、それぞれを小領域(たとえば8x8pixel)ごとにDCT変換し、得られた変換係数を量子化し、符号化することで圧縮コードを得る。なお、文字の取り去られた下地は一般に高い解像度を必要としないため、JPEG圧縮をおこなう前に解像度変換をおこなってもよい。
【0057】
最後に、ステップS308では、文字領域座標(109)、文字領域色情報(110)、圧縮コードC(111)、圧縮コードD(112)の4つをまとめて最終的な画像データとして出力する。また、これらはPDFやXMLのように一般的に共有されるフォーマットで出力してもよい。
【0058】
以上説明したように、本発明によれば、複数種の文字色が混在する文字領域において、文字切り処理が失敗した場合でも、文字色抽出の結果を利用して失敗を検出し、該当領域に詳細文字切り処理をおこなって、正しい文字切り結果を得ることができるので、多値画像の文字色および文字領域情報抽出の精度を向上できる。
【0059】
この効果により、上記実施例のように、色情報付きの二値画像の文字領域と下地画像を分離し、双方を異なる圧縮方法で圧縮して、高画質かつ高圧縮のデータを生成する処理においては、ノイズやレイアウトの例外などに対して性能の劣化しない処理が可能になる。
【0060】
【第二の実施例】
本発明第一の実施例では、複数色を有す文字矩形が、非文字であるか、あるいは複数種の単色文字の集合であるかを判定する処理の過程において、注目矩形の右側にあり、かつ射影を利用して求める行間位置が一致することを条件に、詳細文字切りの範囲を拡大したが、行間の一致ではなく、矩形内のRGBヒストグラムの分布の一致を利用して、詳細文字切りの範囲を拡大するようにしてもよい。
【0061】
特に、接近した色の異なる文字行があり、その一部がノイズの影響で二値画像上で接触している場合など、射影より行間を求めることが困難な場合でも、隣接する矩形で詳細文字切りが必要であるもののグループに含めて正しい文字切り結果を得ることができ、文字色および文字領域情報抽出の精度を向上させることができる。
【0062】
このように、本発明第二の実施例においても、複数種の文字色が混在する文字領域において、文字切り処理が失敗した場合、文字色抽出の結果を利用して失敗を検出し、該当領域に詳細文字切り処理をおこなって正しい文字切り結果を得ることができるので、多値画像の文字色および文字領域情報抽出の精度向上が可能になる。
【0063】
【発明の効果】
本発明によれば、多値画像の文字色および文字領域情報の抽出を精度良く行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る圧縮装置のブロック図である。
【図2】本発明の第1の実施例の文字領域検出処理を説明するための原画像の例を示す図である。
【図3】本発明の第1の実施例のスキャン画像の圧縮処理を説明するためのフローチャートである。
【図4】本発明の第1の実施例の文字色抽出部の処理を説明するためのフローチャートである。
【図5】本発明の第1の実施例の文字判定部の処理を説明するためのフローチャートである。
【図6】本発明の第1の実施例の文字領域検出処理を説明するための二値画像の例を示す図である。
【図7】本発明の第1の実施例の文字領域検出処理を説明するための文字領域の例を示す図である。
【図8】本発明の第1の実施例の文字部塗りつぶし処理を説明するための図である。
【図9】本発明の第1の実施例の文字切り処理を説明するための図である。
【図10】本発明の第1の実施例の文字色抽出処理を説明するための図である。
【図11】本発明の第1の実施例の細線化処理を説明するための図である。
【図12】本発明の第1の実施例の文字領域検出処理を説明するためのヒストグラムを示す図である。
【図13】傾斜した、複数色を有する文字領域に対する文字切り誤りの例である。
【図14】大小、複数色の混在する文字領域に対する文字切り誤りの例である。
【図15】本発明の第1の実施例の詳細文字切り処理の例である。゜
【符号の説明】
100 縮小・二値化部
101 文字領域検出部
102 文字領域画像作成部
103 文字色抽出部
104 文字部塗りつぶし部
105 文字領域画像圧縮部
106 下地画像圧縮部
107 画像
108 下地多値画像
109 文字領域座標
110 文字領域代表色
111 圧縮コードA
112 圧縮コードB
【発明の属する技術分野】
本発明は画像処理装置および方法に関するものである。
【0002】
【従来の技術】
近年、スキャナの普及により文書の電子化が進んでいる。電子化された紙文書をフルカラービットマップ形式の状態では、A4サイズの場合300dpiで約24Mバイトにもなる。このような大容量のデータは、メイルに添付して送信するのに適したサイズとはいえない。そこで、フルカラー画像を圧縮することが通常行われており、その圧縮方式としてJPEGが知られている。JPEGは写真などの自然画像を圧縮するには非常に効果も高く、画質も良い。しかし一方で、文字部などの高周波部分をJPEG圧縮すると、モスキートノイズと呼ばれる画像劣化が発生し、圧縮率も悪い。そこで、領域分割を行い、文字領域を抜いた下地部分に自然画向きの圧縮方式、単色あるいは小数色の文字領域部分には可逆圧縮方式を施す方法があった。
【0003】
圧縮の際に、領域分割により分けられた文字領域部分は減色してMMRやZIP圧縮を施すとともに色情報を保持し、文字部を抜いた下地部分はJPEG圧縮を施す。展開時には下地画像の上に、文字領域の画像を色情報に従って描画することで、高画質と高圧縮率を両立する画像処理装置を提供している(例えば、特許文献1参照)。
【0004】
上記のような装置においては、文字領域の色情報抽出精度が、画質と圧縮率双方の性能に大きく影響する。そのため、二値画像の文字切り処理を利用して文字色抽出の性能を向上させている(例えば、特許文献2参照)。
【0005】
【特許文献1】
特開2002−077631号公報
【特許文献2】
特開2003−008909号公報
【0006】
【発明が解決しようとしている問題】
しかし、特殊なレイアウトや領域分割の誤り、あるいはノイズや傾きなどの影響で文字切り処理が正しく行われなかった領域に、異なる色の文字が混在する場合、色抽出が正しくおこなわれず、該領域が非文字と認識され画質劣化、圧縮率低下の原因となっていた。
【0007】
たとえば、図13のように画像が傾いており、かつ色の異なる2行が接近している場合、射影を用いた行の分割ができないため文字の切り出しに失敗し、個々の文字に対応する正しい色を抽出できない。その結果この領域は非文字の図形と判断されてしまう。
【0008】
また、図14のように、見出しなど大きな文字と小さな文字が接近している場合、領域分割はこれをひとつの文字列と看倣してしまうことがある。このときも文字切り失敗により、文字毎の単色抽出がおこなえず、非文字の図形とされてしまう。
【0009】
なおこれらの例では、文字が複数種の単色ではなく、すべて同色からなる領域であれば、たとえ文字切りは失敗しても色抽出は自体は正しくおこなわれるので、文字領域内の処理に問題は生じない。そのうえ、文字切り処理自体を例外対応により複雑化していくことには限界があることをふまえると、既存の文字切り処理を用いたうえで、複数色の文字領域に関する例外事象に対処することがより望ましい。
【0010】
本発明は上記従来技術の課題を解決するために成されたものであり、文字切り処理に色抽出の結果をフィードバックして、多値画像の文字色および文字領域情報の抽出を精度良く行う画像処理装置および方法を提供することを目的とする。
【0011】
【課題を解決するための手段】
この発明は下記の構成を備えることにより上記課題を解決できるものである。
【0012】
(1)スキャンされたカラー画像に対し、前記カラー画像より文字領域の二値画像を生成する文字領域画像作成手段と、前記文字領域の二値画像に対し文字矩形を作成する文字切り手段と、前記文字矩形の単色判定をおこなう単色判定手段と、非単色の文字矩形が複数種の単色文字集合であることを判定する手段と、上記判定矩形内を文字切りする詳細文字切り手段と、を有する画像処理装置。
【0013】
(2)前記(1)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、非単色矩形およびそれに隣接する矩形を含めて複数種の単色文字集合であることを判定することを特徴とする画像処理装置。
【0014】
(3)前記(2)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、行間位置が一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理装置。
【0015】
(4)前記(2)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、色分布一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理装置。
【0016】
(5)スキャンされたカラー画像に対し、前記カラー画像より文字領域の二値画像を生成する文字領域画像作成手段と、前記文字領域の二値画像に対し文字矩形を作成する文字切り手段と、前記文字矩形の単色判定をおこなう単色判定手段と、非単色の文字矩形が複数種の単色文字集合であることを判定する手段と、
上記判定矩形内を文字切りする詳細文字切り手段と、を有する画像処理方法。
【0017】
(6)前記(5)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、非単色矩形およびそれに隣接する矩形を含めて複数種の単色文字集合であることを判定することを特徴とする画像処理方法。
【0018】
(7)前記(6)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、行間位置が一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理方法。
【0019】
(8)前記(6)記載の文字矩形が複数種の単色文字集合であることを判定する手段は、色分布一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理方法。
【0020】
【発明の実施の形態】
図1に本発明の第一の実施例のブロック図を示す。
【0021】
100は多値画像より全面二値画像を作成する縮小・二値化部である。101は画像中の文字領域を検出して複数の文字領域座標(109)を作成する文字領域検出部である。102は上記文字領域座標と原画像より、複数の文字領域部分の画像(107)を作成する文字領域画像作成部である。103は上記文字領域画像の黒部分と原画像を参照しながら黒部分の代表色(110)を算出する文字色抽出部である。104は上記文字領域画像の黒画素に対応する原画像上の画素を、周辺の色で塗りつぶし下地多値画像(108)を作成する文字部塗りつぶし部である。105は複数の文字領域画像を圧縮して複数の圧縮コードA(111)を作成する文字領域画像圧縮部である。106は下地多値画像(108)を圧縮して圧縮コードB(112)を作成する下地画像圧縮部である。
【0022】
次に、図1の構成を用いて、スキャナなどで入力した画像データを圧縮する際の処理を、図3のフローチャートを用いて説明する。
【0023】
ステップS301では、縮小・二値化部100にて、入力多値画像に対し二値化処理を行う。その内容を以下簡単に説明する。
【0024】
RGB多値画像に次式のような輝度変換を行って、輝度画像Jを作成する。
【0025】
Y=0.299R+0.587G+0.114B
このとき、入力画像の解像度に応じて解像度変換をおこなってもよい。例えば原画像が300dpiのとき、縦方向、横方向とも4画素ごとに上式の演算を行い、新しい画像Jを作成すると画像JはY8ビット75dpiの画像となる。次に、輝度画像Jのヒストグラムを取り、二値化閾値Tを算出する。輝度画像JをTにて二値化し、全面二値画像Kを作成する。なお、ヒストグラムより閾値Tを算出する際には公知の方法を用いるとする。
【0026】
ステップS302では、文字領域検出部101にて、二値画像に対して領域分割処理をおこない、その結果から文字領域のみを抽出して文字領域座標109を作成する。
【0027】
上記領域分割処理は、USP5680478“Method and Apparatus for character recognition”(Shin−YwanWangら/CanonK.K.)などを用いる。簡単に説明すると、二値画像中の黒画素を輪郭線追跡して得られた塊を抽出し、その形状、大きさ、文字、絵や図、線、表、を分類するとともに、文字と判定される塊の集合から、文字列をなす文字領域を抽出する処理となる。
【0028】
S301およびS302の処理例を示す。例えば図2に示すカラー原稿を入力し、間引いて輝度変換したもののヒストグラムを取ると図12のようになる。このヒストグラムから平均、分散、などのデータを利用して閾値T=199を算出し、二値化した画像は図6のようになる。図6を領域分割処理すると、図7に示すような15個の文字領域が検出される。これらの座標データが図1の109に格納される。
【0029】
ステップS303では、文字領域画像作成部102が、文字領域座標109に基き、それぞれ文字領域ごとに領域内の文字部を黒、背景を白とする二値画像を作成する。この二値画像は、二値化部で得た閾値で多値画像を全面二値化し、それらから切りとって作成してもよいし、文字領域内で多値画像から輝度ヒストグラムを取りなおし、領域毎に最適な二値化閾値を算出して得た二値画像を用いてもよい。
【0030】
ステップS304では、文字色抽出部103が、各文字領域内の代表色を抽出する。ここで代表色数は1に限定してもよいし、領域内に複数色の文字が混在する場合には任意の最大代表色数を選ぶようにすればよい。以下に、ある文字領域に対する文字色抽出処理の詳細を、図4のフローチャートを用いて説明する。
【0031】
S401では、文字領域の二値画像Rより、文字行および個別文字に対応する矩形を抽出する、いわゆる文字切り処理をおこなう。以下に文字切り処理の概要を説明する。
【0032】
まず水平方向の射影と垂直方向の射影をとり、その分散の高いほうを文字列方向とし、その射影の切れ目で行を分割する。さらに個々の行内で先の射影方向と垂直の射影をとりなおし、その切れめより文字行を分割して文字矩形を作成する。以降の処理は文字切りされた矩形毎におこなわれる。図9に文字切り処理の例を示す。
【0033】
S402では文字矩形内の二値画像を細線化した二値画像Pを作成する。これはスキャナ特性やプリント時のアンチエイリアシングにより乱された、文字周辺付近よりの色抽出を回避するためである。図11に細線化の例を示す。
【0034】
S403では、細線化された二値画像Pの各画素に対応する色情報を、元のカラー画像を参照して求め、RGBそれぞれヒストグラムを作成する。もちろん、RGBのかわりにYUVなど他の色空間を用いてもよい。
【0035】
S404では、文字矩形の単色判定を行う。具体的には、RGB各ヒストグラムの分散を求め、あらかじめ定めた閾値と比較し、RGBいずれの分散値も閾値以内の場合は、単色と判定しS405に進む。閾値を超える分散値があった場合は複数色を所持するとしてS406へ進む。
【0036】
S405では、RGB各ヒストグラムから注目文字矩形の代表色を決定する。これは各ヒストグラムのピーク値からなる色をとってもよいし、平均値を用いてもよい。
【0037】
図10に、S403〜S405の処理例を示す。図10(a)の「イ」は黒文字(b)の「ン」は赤文字として、それぞれ代表色のRGB値を得るが、図10(c)の花模様はヒストグラムの分散が大きく、かつ文字切り不能なため、非文字と判定されている。
【0038】
次に、S406では注目の複数色を有す矩形が、非文字であるか、あるいは複数の単色文字の集合であるかを判定する。
【0039】
このS406内の判定処理について、図5のフローチャートを用いて説明する。なお、ここでは水平方向の文字列からなる文字領域の場合について説明するが、垂直方向の文字列の場合は90度方向を入れ換えることで同様の処理が可能である。
【0040】
S501では、入力矩形Cに対し、その高さを閾値Hと比較する。この閾値Hは複数の文字が縦に並んでいる可能性を持つ高さの最小値であり、画像解像度に応じてあらかじめ定める数値である。Hより小さい場合は、矩形Cを非文字と判断して終了する。Hより大きければS502に進む。
【0041】
S502では、矩形C内のみを対象にS401と同様の文字切り処理をおこなう。ただし文字列方向についてはあらたに判定せず、処理中の領域と同じ方向とみなす。
【0042】
S503では、S502の文字切り処理で得た行数が2未満、あるいは行高の閾値t未満の高さの行を含む場合、矩形Cを非文字と判断して終了する。それ以外の場合はS504に進む。
【0043】
S504では、S502の文字切り処理で得た文字行と文字矩形に関して、行毎の文字数の最大値pと最小値qを求める。ただしあらかじめ定めた幅および高さの範囲にない文字矩形は文字数としてカウントしない。ここで、qが0の場合矩形Cは非文字と判断して終了し、p≧2かつq≧1の場合は、矩形Cを複数の単色文字集合と判断して終了する。それ以外の場合、すなわちp=q=1の場合S505へ進む。
【0044】
S505では、矩形Cの右に隣接する矩形に対し、Cと同等の行間の隙間を持つ矩形が連続する数Nをカウントする。具体的には、矩形Cの水平方向の射影の切れ目と、注目矩形の水平方向射影の切れ目を比較して、一致するものをカウントする。また、右隣の矩形と行間が一致した場合、さらにその右隣と比較する、というように行間が一致しなくなるまで範囲を広げてゆく。このグループ化によれば、文字切り処理回数を減らし効率を上げる効果があるが、数Nを文字としての確信度に用いてもよい。たとえば、N≧1でなければ矩形Cを非文字と判定して終了してもよい。
【0045】
S506では、S502の文字切り結果は破棄し、S505で得た矩形集合に外接する領域内に対し、詳細文字切り処理をおこなう。そして、矩形Cおよび、その右に続くN−1個の矩形のすべてを含む領域が、複数種の単色文字の集合であると判定し終了する。
【0046】
図15はS506の詳細文字切り処理に至る例を説明する図である。S401で得られた文字切り矩形C1〜C5において、C1、C2はの単色一文字だが、C3〜C5は異なる色の複数文字を含む矩形になっている。図4処理ではC1、C2を単色と判定した後、C3は単色ではないためS406の処理にはいる。図5に移り、S501〜S504を経てS505により、同一行間を持つ右側の矩形C4とC5を含めた領域で、S506詳細文字切りが行われている。最終的な文字矩形はすべて単色となっており、文字切りの精度が向上されるのがわかる。
【0047】
図4に戻り、S406で非文字と判定された場合はS407に進み、複数種の単色文字と判定された場合はS408に進む。
【0048】
S407では、二値画像Rにおいて、非文字と判定された該文字矩形部分内の黒画素をすべて消去する。これは、該当部分を二値画像から消去することで、後の穴うめ処理の対象外とし、非文字の複雑な色情報を下地側に残して保存するための処理である。消去後、矩形は破棄してS409に進む。
【0049】
S408では、矩形Cを破棄するとともに、その内側に存在する文字矩形をそれぞれを図4処理で未処理の矩形として追加する。これらはS502あるいはS506で作成された文字矩形群に相当し、なお、文字矩形群がS506で作成された場合は、それらのもとになったN−1個の矩形もC同様破棄する。そしてS409に進む。
【0050】
S409にて、未処理の文字矩形が残っていれば、S403に戻って繰り返す。なければS410に進む。
【0051】
S410では、各文字矩形に対応して文字数ぶんの色の集合が作成されているので、これに対して減色処理を施し、合計n色以下にまとめる。本処理はスキャナ処理などの影響で生じた色のばらつきをまとめる為の処理である。具体的減色方法としては、ヒストグラムをとって閾値以上のピークを1個以上抽出し、それらの色は近接ピークと統合する、などの方法があるが、他の種々のクラスタリング手法を用いてもよい。またnの値は任意であるが、圧縮率に影響するので、たかだかn=4程度を妥当とする。
【0052】
図3に戻り、ステップS305では,文字部塗りつぶし部104が、文字領域画像内の黒画素に対応する原画像上の各画素を、周辺の色で塗りつぶし下地多値画像(108)を作成する。本処理の一例を図8を用いて説明する。
【0053】
グラデーション画像を背景とし、「イン」という青色の文字が中央付近に描かれた、図8(a)のような画像を原画像とする。この原画像から(b)のような1つの文字領域の二値画像を得たとする。本実施の形態では、例えば全画像を32×32の領域(以下、パーツ)に分割し、パーツごとの処理をおこなう。図8(c)にパーツ分けの様子を示す。この図では簡単に説明するため、4×3のパーツに分割した状態を示している。各領域の左上の数字はパーツ番号を示す。このとき、パーツ00〜03,10,13,20〜23内には文字がないので、処理は行われない。パーツ11に対しては、対応する二値画像中の画素より、各パーツ内の白部分に対応するカラー画像のRGB値(またはYUV等でも良い)の平均値ave_color11を算出する。そして、原画像上で、二値画像の黒部分にあたる画素このave_color11で塗りつぶす。パーツ22に対しても同様である。
【0054】
このようにすれば、文字の存在する部分の周りの画素の平均値をもって、文字の存在する画素を塗りつぶすことができ、見掛け上自然に文字のみが取り除かれた、下地画像108が生成される。
【0055】
図3に戻り、ステップS306では、文字領域画像圧縮部107にて、文字領域画像にあたる部分二値画像の集合108を圧縮して圧縮コードAを作成する。この際、単色の文字領域はMMR圧縮を施すが、S304にて複数の代表色が抽出された文字領域は、領域内の色情報を保存できる最低必要bit数に変換し、ZIP圧縮をするか、あるいは同一領域を色別に異なる二値画像に分解する形で、それぞれをMMR圧縮を施すようにしてもよい。
【0056】
ステップS307では、下地画像圧縮処理部106にて、下地画像108に対しJPEG圧縮を行い圧縮コードBを作成する。JPEG圧縮処理は一般的なものを用いる。簡単に説明すると、画像をYUVの各成分に分割し、それぞれを小領域(たとえば8x8pixel)ごとにDCT変換し、得られた変換係数を量子化し、符号化することで圧縮コードを得る。なお、文字の取り去られた下地は一般に高い解像度を必要としないため、JPEG圧縮をおこなう前に解像度変換をおこなってもよい。
【0057】
最後に、ステップS308では、文字領域座標(109)、文字領域色情報(110)、圧縮コードC(111)、圧縮コードD(112)の4つをまとめて最終的な画像データとして出力する。また、これらはPDFやXMLのように一般的に共有されるフォーマットで出力してもよい。
【0058】
以上説明したように、本発明によれば、複数種の文字色が混在する文字領域において、文字切り処理が失敗した場合でも、文字色抽出の結果を利用して失敗を検出し、該当領域に詳細文字切り処理をおこなって、正しい文字切り結果を得ることができるので、多値画像の文字色および文字領域情報抽出の精度を向上できる。
【0059】
この効果により、上記実施例のように、色情報付きの二値画像の文字領域と下地画像を分離し、双方を異なる圧縮方法で圧縮して、高画質かつ高圧縮のデータを生成する処理においては、ノイズやレイアウトの例外などに対して性能の劣化しない処理が可能になる。
【0060】
【第二の実施例】
本発明第一の実施例では、複数色を有す文字矩形が、非文字であるか、あるいは複数種の単色文字の集合であるかを判定する処理の過程において、注目矩形の右側にあり、かつ射影を利用して求める行間位置が一致することを条件に、詳細文字切りの範囲を拡大したが、行間の一致ではなく、矩形内のRGBヒストグラムの分布の一致を利用して、詳細文字切りの範囲を拡大するようにしてもよい。
【0061】
特に、接近した色の異なる文字行があり、その一部がノイズの影響で二値画像上で接触している場合など、射影より行間を求めることが困難な場合でも、隣接する矩形で詳細文字切りが必要であるもののグループに含めて正しい文字切り結果を得ることができ、文字色および文字領域情報抽出の精度を向上させることができる。
【0062】
このように、本発明第二の実施例においても、複数種の文字色が混在する文字領域において、文字切り処理が失敗した場合、文字色抽出の結果を利用して失敗を検出し、該当領域に詳細文字切り処理をおこなって正しい文字切り結果を得ることができるので、多値画像の文字色および文字領域情報抽出の精度向上が可能になる。
【0063】
【発明の効果】
本発明によれば、多値画像の文字色および文字領域情報の抽出を精度良く行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る圧縮装置のブロック図である。
【図2】本発明の第1の実施例の文字領域検出処理を説明するための原画像の例を示す図である。
【図3】本発明の第1の実施例のスキャン画像の圧縮処理を説明するためのフローチャートである。
【図4】本発明の第1の実施例の文字色抽出部の処理を説明するためのフローチャートである。
【図5】本発明の第1の実施例の文字判定部の処理を説明するためのフローチャートである。
【図6】本発明の第1の実施例の文字領域検出処理を説明するための二値画像の例を示す図である。
【図7】本発明の第1の実施例の文字領域検出処理を説明するための文字領域の例を示す図である。
【図8】本発明の第1の実施例の文字部塗りつぶし処理を説明するための図である。
【図9】本発明の第1の実施例の文字切り処理を説明するための図である。
【図10】本発明の第1の実施例の文字色抽出処理を説明するための図である。
【図11】本発明の第1の実施例の細線化処理を説明するための図である。
【図12】本発明の第1の実施例の文字領域検出処理を説明するためのヒストグラムを示す図である。
【図13】傾斜した、複数色を有する文字領域に対する文字切り誤りの例である。
【図14】大小、複数色の混在する文字領域に対する文字切り誤りの例である。
【図15】本発明の第1の実施例の詳細文字切り処理の例である。゜
【符号の説明】
100 縮小・二値化部
101 文字領域検出部
102 文字領域画像作成部
103 文字色抽出部
104 文字部塗りつぶし部
105 文字領域画像圧縮部
106 下地画像圧縮部
107 画像
108 下地多値画像
109 文字領域座標
110 文字領域代表色
111 圧縮コードA
112 圧縮コードB
Claims (8)
- スキャンされたカラー画像に対し、
前記カラー画像より文字領域の二値画像を生成する文字領域画像作成手段と、
前記文字領域の二値画像に対し文字矩形を作成する文字切り手段と、
前記文字矩形の単色判定をおこなう単色判定手段と、
非単色の文字矩形が複数種の単色文字集合であることを判定する手段と、
上記判定矩形内を文字切りする詳細文字切り手段と、
を有する画像処理装置。 - 前記請求項1記載の文字矩形が複数種の単色文字集合であることを判定する手段は、非単色矩形およびそれに隣接する矩形を含めて複数種の単色文字集合であることを判定することを特徴とする画像処理装置。
- 前記請求項2記載の文字矩形が複数種の単色文字集合であることを判定する手段は、行間位置が一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理装置。
- 前記請求項2記載の文字矩形が複数種の単色文字集合であることを判定する手段は、色分布一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理装置。
- スキャンされたカラー画像に対し、
前記カラー画像より文字領域の二値画像を生成する文字領域画像作成手段と、
前記文字領域の二値画像に対し文字矩形を作成する文字切り手段と、
前記文字矩形の単色判定をおこなう単色判定手段と、
非単色の文字矩形が複数種の単色文字集合であることを判定する手段と、
上記判定矩形内を文字切りする詳細文字切り手段と、
を有する画像処理方法。 - 前記請求項5記載の文字矩形が複数種の単色文字集合であることを判定する手段は、非単色矩形およびそれに隣接する矩形を含めて複数種の単色文字集合であることを判定することを特徴とする画像処理方法。
- 前記請求項6記載の文字矩形が複数種の単色文字集合であることを判定する手段は、行間位置が一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理方法。
- 前記請求項6記載の文字矩形が複数種の単色文字集合であることを判定する手段は、色分布一致する隣接複数矩形の総領域が複数種の単色文字集合であると判定することを特徴とする画像処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003029583A JP2004242075A (ja) | 2003-02-06 | 2003-02-06 | 画像処理装置および方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003029583A JP2004242075A (ja) | 2003-02-06 | 2003-02-06 | 画像処理装置および方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004242075A true JP2004242075A (ja) | 2004-08-26 |
Family
ID=32956724
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003029583A Withdrawn JP2004242075A (ja) | 2003-02-06 | 2003-02-06 | 画像処理装置および方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2004242075A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102008050121A1 (de) | 2008-02-06 | 2009-08-20 | Pfu Ltd., Kahoku | Bildprozessor, Bildverarbeitungsverfahren und Bildverarbeitungsprogramm |
| US8320673B2 (en) | 2009-03-03 | 2012-11-27 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer-readable medium |
| JP2014197804A (ja) * | 2013-03-29 | 2014-10-16 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
| CN110888611A (zh) * | 2018-09-10 | 2020-03-17 | 佳能株式会社 | 图像处理装置和图像处理方法以及存储介质 |
-
2003
- 2003-02-06 JP JP2003029583A patent/JP2004242075A/ja not_active Withdrawn
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102008050121A1 (de) | 2008-02-06 | 2009-08-20 | Pfu Ltd., Kahoku | Bildprozessor, Bildverarbeitungsverfahren und Bildverarbeitungsprogramm |
| US8320673B2 (en) | 2009-03-03 | 2012-11-27 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer-readable medium |
| JP2014197804A (ja) * | 2013-03-29 | 2014-10-16 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
| US9088754B2 (en) | 2013-03-29 | 2015-07-21 | Brother Kogyo Kabushiki Kaisha | Image processing device determining characteristic quantity relating to number of colors |
| CN110888611A (zh) * | 2018-09-10 | 2020-03-17 | 佳能株式会社 | 图像处理装置和图像处理方法以及存储介质 |
| JP2020043461A (ja) * | 2018-09-10 | 2020-03-19 | キヤノン株式会社 | 画像処理装置と画像処理方法、及びプログラム |
| JP7185451B2 (ja) | 2018-09-10 | 2022-12-07 | キヤノン株式会社 | 画像処理装置と画像処理方法、及びプログラム |
| CN110888611B (zh) * | 2018-09-10 | 2024-06-11 | 佳能株式会社 | 图像处理装置和图像处理方法以及存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7376267B2 (en) | Image processing apparatus, image processing method, and program and storage medium therefor | |
| JP5875637B2 (ja) | 画像処理装置、画像処理方法 | |
| US7133565B2 (en) | Image processing apparatus and method | |
| JP5132530B2 (ja) | 画像符号化装置及び画像処理装置及びそれらの制御方法 | |
| US7965892B2 (en) | Image processing apparatus, control method thereof, and program | |
| US8180153B2 (en) | 3+1 layer mixed raster content (MRC) images having a black text layer | |
| US8285035B2 (en) | 3+1 layer mixed raster content (MRC) images having a text layer and processing thereof | |
| US8395813B2 (en) | Subtractive color method, subtractive color processing apparatus, image forming apparatus, and computer-readable storage medium for computer program | |
| JP2005020227A (ja) | 画像圧縮装置 | |
| JP2003228712A (ja) | イメージからテキスト状のピクセルを識別する方法 | |
| JP4366003B2 (ja) | 画像処理装置及び画像処理方法 | |
| JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
| JP6607490B2 (ja) | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 | |
| JP4732250B2 (ja) | 情報処理装置、制御方法、およびコンピュータプログラム | |
| JP4077094B2 (ja) | カラー文書画像認識装置 | |
| JP3715905B2 (ja) | 画像処理装置、画像処理方法、プログラム並びに記憶媒体 | |
| CN103839061B (zh) | 图像处理装置 | |
| US8620081B2 (en) | Image processing apparatus, method, and storage medium for determining attributes | |
| JP4035456B2 (ja) | 画像圧縮方法、画像圧縮装置 | |
| JP2003244447A (ja) | 画像処理装置及び画像処理方法 | |
| US8810877B2 (en) | Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image | |
| JP2020043461A (ja) | 画像処理装置と画像処理方法、及びプログラム | |
| JP2010011450A (ja) | 画像形成装置及び画像処理方法 | |
| JP2004242075A (ja) | 画像処理装置および方法 | |
| JP4116377B2 (ja) | 画像処理方法および画像処理装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060509 |