JP2010267155A - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP2010267155A JP2010267155A JP2009119215A JP2009119215A JP2010267155A JP 2010267155 A JP2010267155 A JP 2010267155A JP 2009119215 A JP2009119215 A JP 2009119215A JP 2009119215 A JP2009119215 A JP 2009119215A JP 2010267155 A JP2010267155 A JP 2010267155A
- Authority
- JP
- Japan
- Prior art keywords
- image
- module
- character
- resolution
- pixel block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003860 storage Methods 0.000 claims abstract description 293
- 238000012795 verification Methods 0.000 claims abstract description 11
- 238000005520 cutting process Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 abstract description 4
- 230000011218 segmentation Effects 0.000 description 159
- 238000010586 diagram Methods 0.000 description 48
- 238000000034 method Methods 0.000 description 26
- 238000009825 accumulation Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】画像処理装置の情報生成手段は、複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成し、記憶手段は、前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶し、照合手段は、受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合し、情報付与手段は、前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する。
【選択図】図1
Description
しかし、スキャン画像である電子文書の流通や蓄積負荷を軽減するために、低解像度で読み取りが行われている。そのため、文字画像の画質は劣化してしまう。
請求項1の発明は、複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成する情報生成手段と、前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶する記憶手段と、受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合する照合手段と、前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する情報付与手段を具備することを特徴とする画像処理装置である。
前述のように、画像読取装置(以下、スキャナともいう)で読み込んだ画像(電子文書)を流通、蓄積等するために低解像度で読み込む場合が多い。
一方、電子文書の文字検索を可能にするために文字認識技術を導入し、例えば、PDF(Portable Document Format)のフォーマットを用いて文書の画像上に、文字認識された文字コードをシステムフォントの透明色で描画することで、検索を可能にすることができるが、文字の画質が悪いと認識率が下がる。
さらに、文字認識して得られた文字コードでシステムフォントを使って描画することで文字品質を上げることができるが、文字認識によってはフォント情報(サイズ、フォント種別等)が得られないため、オリジナルの文書とは外観が変わってしまう。
特にファックスにおける標準モードでは、約200dpi×100dpiという低解像度で読み込むため文字画質が悪く、画質劣化の分散が大きいため文字認識の認識率を下げることとなる。
さらに、既存のフォント認識アルゴリズムも前述したサンプリング周波数と文字位置との関係による外乱を受け、認識精度が落ちることとなる。
つまり、スキャナで読み込むときの文字画像の劣化をシミュレートしたデータベースを用意すれば、例えば既存の文字のパターン認識技術を用いて文字のフォントサイズやフォント種別等までも特定することができ、データベース上で関連付けられた高解像度の文字画像と入れ替えることで、文字画質を向上させ得る。
<実施の形態の基本的な構成例>
図1は、本実施の形態の基本的な構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
なお、1つの画素塊として、1文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。
画素塊として文字を例示し、画素塊の画像として文字画像を例示する。
画像としての文字を示す場合は文字画像とし、その文字を一意に識別するコードによって示されるものの場合は文字と称する。つまり、文字を紙等の媒体に印刷等によって視覚化したものが文字画像である。したがって、1つの文字について、フォント種別、フォントサイズ、解像度等によって複数の文字画像があることになる。また、画素塊に関する情報として、より高解像度の文字画像、文字コード、フォント種別、サイズを含む。
複数解像度情報蓄積モジュール120は、複数解像度情報生成モジュール110によって生成された画素塊の画像とその画素塊に関する情報を記憶する。
低解像度文字画像照合モジュール130は、受け付けた画像内の画素塊の画像と複数解像度情報蓄積モジュール120によって記憶されている画素塊の画像を照合する。
高解像度情報付与モジュール140は、低解像度文字画像照合モジュール130による照合結果に基づいて、複数解像度情報蓄積モジュール120から画素塊に関する情報を抽出して、その画素塊に関する情報を受け付けた画像内の画素塊の画像に付与する。ここで、「画像内の画素塊の画像に付与する」とは、高解像度の画像に置き換える場合も含む。
複数解像度情報生成モジュール110と複数解像度情報蓄積モジュール120は接続されており、複数解像度情報生成モジュール110は、複数解像度情報蓄積モジュール120へ複数解像度文字画像情報112を渡す。複数解像度情報生成モジュール110は、一般に使われると予想されるフォント種、フォントサイズで、ひらがな、カタカナ、英数字、常用漢字等の文字が予め定められた解像度で複数回スキャンされた場合の画像(文字画像ともいう)を生成する。ここで準備する文字は、本実施の形態が使用される場面において対象となる文書に用いられる文字である。これらの文字が印刷された文書を用意しておき、スキャナで読み込む。同じ文書内の文字画像を複数回読み取ることによって、位相が異なる文字画像を得ることができる。これはスキャナが機械系による読取り部分を含んでいるために、同じ文字画像を読み取っても異なる位相の文字画像となってしまうことが経験的に知られている。また、解像度についても複数種の解像度で読み込んでもよい。なお、文書画像から文字画像を切り取る方法は既存の方法を用いる。例えば、予め定められた面積以上(1辺が予め定められた長さ以上等でもよい)を有する空白で区切り、ある方向への射影によって文字画像を切り出すようにしてもよい。
そして、これらの文字画像、文字フォント情報、解像度情報を複数解像度文字画像情報112として生成して、複数解像度情報蓄積モジュール120へ送出する。なお、文字フォント情報、解像度情報は、予め文書を印刷するときに指定されているので、その指定された情報を複数解像度情報生成モジュール110が得て、複数解像度情報蓄積モジュール120へ渡す。
ステップS202では、複数解像度情報生成モジュール110が、1つの文字に対して複数の解像度の文字画像とその文字に関する情報である複数解像度文字画像情報112を生成する。
ステップS204では、複数解像度情報蓄積モジュール120が、文字画像とその文字に関する高解像度情報124等を含む複数解像度文字画像情報112を記憶する。
ステップS302では、本実施の形態が、画像を受け付ける。その画像内から文字画像を切り出す。
ステップS304では、低解像度文字画像照合モジュール130が、画像内の文字画像128と複数解像度情報蓄積モジュール120に記憶されている低解像度文字画像122とを照合する。
ステップS306では、高解像度情報付与モジュール140が、ステップS304で照合された文字画像128に対する高解像度情報124を複数解像度情報蓄積モジュール120から取得する。
ステップS308では、高解像度情報付与モジュール140が、高解像度情報124を文字画像128に付与して出力する。
図4は、第1の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
低解像度画像複数回読取りモジュール420は、辞書文書生成モジュール410によって出力された画像を複数回読み取る。ここでの読み取りとして、例えばスキャナでの画像読み取りが該当する。
文字切り出しモジュール430は、低解像度画像複数回読取りモジュール420によって読み取られた画像内の画素塊の画像を切り出す。
複数解像度情報蓄積モジュール120−4は、文字切り出しモジュール430によって切り出された画素塊の画像に対してその画素塊に関する情報を記憶する。
辞書文書生成モジュール410と低解像度画像複数回読取りモジュール420及び複数解像度情報蓄積モジュール120−4は接続されており、辞書文書生成モジュール410は、低解像度画像複数回読取りモジュール420へ辞書文書412を渡し、また、複数解像度情報蓄積モジュール120−4へ文字コード/フォント情報414を渡す。辞書文書生成モジュール410は、一般に使われると予想されるフォント種、フォントサイズで、ひらがな、カタカナ、英数字、常用漢字等の文字を含む文書を印刷した辞書文書412を生成し、その辞書文書412を低解像度画像複数回読取りモジュール420へ渡し、その辞書文書412の文字毎の文字コード/フォント情報414(フォント情報としてフォント種別、フォントサイズを含む)を複数解像度情報蓄積モジュール120−4へ送出する。文字コード/フォント情報414は、辞書文書412を生成するにあたって指定されたものである。
図5は、複数解像度情報テーブル500のデータ構造例を示す説明図である。複数解像度情報テーブル500は、照合ID欄510、低解像度文字画像欄520、高解像度情報(文字コード)欄530を有している。照合ID欄510は、文字を一意に識別できる符号を記憶し、低解像度文字画像欄520は、その文字を低解像度で読み取った画像であり、その1文字について複数回読み取った文字画像(つまり異なった位相の文字画像)を記憶し、高解像度情報(文字コード)欄530は、その文字画像の文字コードを高解像度情報として記憶する。なお、低解像度文字画像欄520が記憶する文字画像の解像度は、図1の例に示す低解像度文字画像照合モジュール130が受け取る文字画像128の解像度と同等のものである。
低解像度画像複数回読取りモジュール420−7と文字切り出しモジュール430−7、複数解像度情報蓄積モジュール120−7は接続されており、低解像度画像複数回読取りモジュール420−7は、文字切り出しモジュール430−7へ低解像度画像422−7を渡し、また、複数解像度情報蓄積モジュール120−7へ解像度情報424−7を渡す。
文字切り出しモジュール430−7と複数解像度情報蓄積モジュール120−7は接続されており、文字切り出しモジュール430−7は、複数解像度情報蓄積モジュール120−7へ1文字画像432−7を渡す。
複数解像度情報蓄積モジュール120−7と低解像度文字画像照合モジュール130−7、高解像度情報付与モジュール140−7は接続されており、複数解像度情報蓄積モジュール120−7は、低解像度文字画像照合モジュール130−7へ低解像度文字画像122−7を渡し、また、高解像度情報付与モジュール140−7へ文字コード124−7を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−7、フォーマッターモジュール730は接続されており、文字切り出しモジュール720は、文字画像712を1文字毎に切り出して、その切り出しの位置(例えば、文字文書700−A内における矩形である1文字画像722の左上のX、Y座標)を抽出する。低解像度文字画像照合モジュール130−7へ1文字画像722を渡し、また、フォーマッターモジュール730へ1文字画像722、文字位置座標724を渡す。なお、1文字画像722と文字位置座標724は対応している。
低解像度画像複数回読取りモジュール420−8と文字切り出しモジュール430−8、複数解像度情報蓄積モジュール120−8は接続されており、低解像度画像複数回読取りモジュール420−8は、文字切り出しモジュール430−8へ低解像度画像422−8を渡し、また、複数解像度情報蓄積モジュール120−8へ解像度情報424−8を渡す。
文字切り出しモジュール430−8と複数解像度情報蓄積モジュール120−8は接続されており、文字切り出しモジュール430−8は、複数解像度情報蓄積モジュール120−8へ1文字画像432−8を渡す。
複数解像度情報蓄積モジュール120−8と低解像度文字画像照合モジュール130−8、高解像度情報付与モジュール140−8は接続されており、複数解像度情報蓄積モジュール120−8は、低解像度文字画像照合モジュール130−8へ低解像度文字画像122−8を渡し、また、高解像度情報付与モジュール140−8へ文字コード/フォント情報124−8を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−8、ドキュメント化モジュール830は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−8へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
図9は、第2の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
高解像度画像読取りモジュール920は、辞書文書生成モジュール410−9によって出力された画像を読み取る
低解像度画像複数回読取りモジュール420−9は、辞書文書生成モジュール410−9によって出力された画像を複数回、高解像度画像読取りモジュール920よりも低い解像度で読み取る。
高解像度画像読取りモジュール920と低解像度画像複数回読取りモジュール420−9が読み取る画像は、同じ画像である。この画像は、辞書文書生成モジュール410−9によって出力されたものであり、この出力画像は本実施の形態用に辞書文書412−9として利用されるものである。また、高解像度画像読取りモジュール920は、図1の例で示した低解像度文字画像照合モジュール130が受け付けた文字画像128よりも高解像度で読み取る。
文字切り出しモジュール930は、高解像度画像読取りモジュール920によって読み取られた画像内の画素塊の画像を切り出す。
文字切り出しモジュール430−9は、低解像度画像複数回読取りモジュール420−9によって読み取られた画像内の画素塊の画像を切り出す。
複数解像度情報蓄積モジュール120−9は、文字切り出しモジュール430−9によって切り出された画素塊の画像に対してその画素塊に関する情報として文字切り出しモジュール930によって切り出された画素塊の画像を記憶する。
辞書文書生成モジュール410−9と高解像度画像読取りモジュール920、低解像度画像複数回読取りモジュール420−9、複数解像度情報蓄積モジュール120−9は接続されており、辞書文書生成モジュール410−9は、高解像度画像読取りモジュール920、低解像度画像複数回読取りモジュール420−9へ辞書文書412−9を渡し、また、複数解像度情報蓄積モジュール120−9へ文字コード/フォント情報414−9を渡す。図4の例に示す辞書文書生成モジュール410と同等である。
また、複数解像度情報蓄積モジュール120−9が記憶する複数解像度情報として図6の例に示した複数解像度情報テーブル600(複数解像度情報テーブル1200から高解像度情報(高解像度画像)欄1230を外したもの)であってもよい。特にこれは複数解像度情報テーブル1200の代替として用いてもよい。
高解像度画像読取りモジュール920−13と文字切り出しモジュール930−13は接続されており、高解像度画像読取りモジュール920−13は、文字切り出しモジュール930−13へ高解像度画像922−13を渡す。
文字切り出しモジュール930−13と複数解像度情報蓄積モジュール120−13は接続されており、文字切り出しモジュール930−13は、複数解像度情報蓄積モジュール120−13へ1文字画像932−13を渡す。
低解像度画像複数回読取りモジュール420−13と文字切り出しモジュール430−13、複数解像度情報蓄積モジュール120−13は接続されており、低解像度画像複数回読取りモジュール420−13は、文字切り出しモジュール430−13へ低解像度画像422−13を渡し、また、複数解像度情報蓄積モジュール120−13へ解像度情報424−13を渡す。
文字切り出しモジュール430−13と複数解像度情報蓄積モジュール120−13は接続されており、文字切り出しモジュール430−13は、複数解像度情報蓄積モジュール120−13へ1文字画像432−13を渡す。
複数解像度情報蓄積モジュール120−13と低解像度文字画像照合モジュール130−13、高解像度情報付与モジュール140−13は接続されており、複数解像度情報蓄積モジュール120−13は、低解像度文字画像照合モジュール130−13へ低解像度文字画像122−13を渡し、また、高解像度情報付与モジュール140−13へ高解像度文字画像124−13を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−13、高解像度ドキュメント化モジュール1330は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−13へ1文字画像722を渡し、また、高解像度ドキュメント化モジュール1330へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
高解像度画像読取りモジュール920−14と文字切り出しモジュール930−14は接続されており、高解像度画像読取りモジュール920−14は、文字切り出しモジュール930−14へ高解像度画像922−14を渡す。
文字切り出しモジュール930−14と複数解像度情報蓄積モジュール120−14は接続されており、文字切り出しモジュール930−14は、複数解像度情報蓄積モジュール120−14へ1文字画像932−14を渡す。
低解像度画像複数回読取りモジュール420−14と文字切り出しモジュール430−14、複数解像度情報蓄積モジュール120−14は接続されており、低解像度画像複数回読取りモジュール420−14は、文字切り出しモジュール430−14へ低解像度画像422−14を渡し、また、複数解像度情報蓄積モジュール120−14へ解像度情報424−14を渡す。
文字切り出しモジュール430−14と複数解像度情報蓄積モジュール120−14は接続されており、文字切り出しモジュール430−14は、複数解像度情報蓄積モジュール120−14へ1文字画像432−14を渡す。
複数解像度情報蓄積モジュール120−14と低解像度文字画像照合モジュール130−14、高解像度情報付与モジュール140−14は接続されており、複数解像度情報蓄積モジュール120−14は、低解像度文字画像照合モジュール130−14へ低解像度文字画像122−14を渡し、また、高解像度情報付与モジュール140−14へ高解像度文字画像+文字コード124−14を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−14、フォーマッターモジュール730は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−14へ1文字画像722を渡し、また、フォーマッターモジュール730へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
高解像度画像読取りモジュール920−15と文字切り出しモジュール930−15は接続されており、高解像度画像読取りモジュール920−15は、文字切り出しモジュール930−15へ高解像度画像922−15を渡す。
文字切り出しモジュール930−15と複数解像度情報蓄積モジュール120−15は接続されており、文字切り出しモジュール930−15は、複数解像度情報蓄積モジュール120−15へ1文字画像932−15を渡す。
低解像度画像複数回読取りモジュール420−15と文字切り出しモジュール430−15、複数解像度情報蓄積モジュール120−15は接続されており、低解像度画像複数回読取りモジュール420−15は、文字切り出しモジュール430−15へ低解像度画像422−15を渡し、また、複数解像度情報蓄積モジュール120−15へ解像度情報424−15を渡す。
文字切り出しモジュール430−15と複数解像度情報蓄積モジュール120−15は接続されており、文字切り出しモジュール430−15は、複数解像度情報蓄積モジュール120−15へ1文字画像432−15を渡す。
複数解像度情報蓄積モジュール120−15と低解像度文字画像照合モジュール130−15、高解像度情報付与モジュール140−15は接続されており、複数解像度情報蓄積モジュール120−15は、低解像度文字画像照合モジュール130−15へ低解像度文字画像122−15を渡し、また、高解像度情報付与モジュール140−15へ文字コード+フォント情報124−15を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−15、ドキュメント化モジュール830は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−15へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
図16は、第3の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
高解像度画像読取りモジュール1620は、ユーザ文書受付モジュール1610から渡されたユーザ文書1612を読み取る。
文字切り出しモジュール1630は、高解像度画像読取りモジュール1620によって読み取られた画像内の画素塊の画像を切り出す。
低解像度画像複数回読取りモジュール1640は、ユーザ文書受付モジュール1610から渡されたユーザ文書1612を複数回、高解像度画像読取りモジュール1620よりも低い解像度で読み取る。
文字切り出しモジュール1650は、低解像度画像複数回読取りモジュール1640によって読み取られた画像内の画素塊の画像を切り出す。
高解像度画像読取りモジュール1620、低解像度画像複数回読取りモジュール1640が読み取る画像と文字認識処理モジュール1660が認識の対象とする画像は、同じ画像である。この画像は、利用者が実際に利用している文書である。
複数解像度情報蓄積モジュール120−16は、文字切り出しモジュール1650によって切り出された画素塊の画像に対してその画素塊に関する情報として文字切り出しモジュール1630によって切り出された画素塊の画像を記憶する。さらに、複数解像度情報蓄積モジュール120−16は、文字切り出しモジュール1650によって切り出された画素塊の画像に対してその画素塊に関する情報として文字認識処理モジュール1660による認識結果を記憶するようにしてもよい。
ユーザ文書受付モジュール1610と高解像度画像読取りモジュール1620、低解像度画像複数回読取りモジュール1640、文字認識処理モジュール1660は接続されており、ユーザ文書受付モジュール1610は、高解像度画像読取りモジュール1620、低解像度画像複数回読取りモジュール1640、文字認識処理モジュール1660にユーザ文書1612を渡す。例えば利用者によって頻繁に使われているユーザ文書1612を高解像度画像読取りモジュール1620、低解像度画像複数回読取りモジュール1640、文字認識処理モジュール1660へ送出する。
また、第3の具体的な実施の形態を実現するにあたっての全体の構成例は、図13、図14、図15に示すものと同等である。ただし、辞書文書生成モジュール410−13、14、15、高解像度画像読取りモジュール920−13、14、15、文字切り出しモジュール930−13、14、15、低解像度画像複数回読取りモジュール420−13、14、15、文字切り出しモジュール430−13、14、15、複数解像度情報蓄積モジュール120−13、14、15を、図16に示す構成に代替したものである。
図17は、第4の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
高解像度画像読取りモジュール920−17は、辞書文書生成モジュール410−17によって出力された画像を読み取る。高解像度画像読取りモジュール920−17が読み取る解像度は、図1の例に示した低解像度文字画像照合モジュール130が受け取る文字画像128よりも高解像度である。
低解像度多位相スキャン処理モジュール1710は、高解像度画像読取りモジュール920−17によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する。ここで、画像の解像度を低くするとは、図1の例に示した低解像度文字画像照合モジュール130が受け取る文字画像128と同等の解像度にすることである。
文字切り出しモジュール930−17は、高解像度画像読取りモジュール920−17によって読み取られた画像内の画素塊の画像を切り出す。
文字切り出しモジュール430−17は、低解像度多位相スキャン処理モジュール1710によって生成された画像内の画素塊の画像を切り出す。
複数解像度情報蓄積モジュール120−17は、文字切り出しモジュール430−17によって切り出された画素塊の画像に対してその画素塊に関する情報として文字切り出しモジュール930−17によって切り出された画素塊の画像を記憶する。
辞書文書生成モジュール410−17と高解像度画像読取りモジュール920−17、複数解像度情報蓄積モジュール120−17は接続されており、辞書文書生成モジュール410−17は、高解像度画像読取りモジュール920−17に辞書文書412−17を渡し、また、複数解像度情報蓄積モジュール120−17に文字コード/フォント情報414−17を渡す。図9の例に示す辞書文書生成モジュール410−9と同等である。
複数解像度情報蓄積モジュール120−17は、図9の例に示す複数解像度情報蓄積モジュール120−9と同等である。つまり、複数解像度情報蓄積モジュール120−17が蓄積する複数解像度情報としては、図10の例に示す複数解像度情報テーブル1000、図11の例に示す複数解像度情報テーブル1100又は図12の例に示す複数解像度情報テーブル1200がある。
高解像度画像読取りモジュール920−18と文字切り出しモジュール930−18、低解像度多位相スキャン処理モジュール1710−18は接続されており、高解像度画像読取りモジュール920−18は、文字切り出しモジュール930−18、低解像度多位相スキャン処理モジュール1710−18に高解像度画像922−18を渡す。
文字切り出しモジュール930−18と複数解像度情報蓄積モジュール120−18は接続されており、文字切り出しモジュール930−18は、複数解像度情報蓄積モジュール120−18に1文字画像932−18を渡す。
低解像度多位相スキャン処理モジュール1710−18と文字切り出しモジュール430−18、複数解像度情報蓄積モジュール120−18は接続されており、低解像度多位相スキャン処理モジュール1710−18は、文字切り出しモジュール430−18に低解像度画像422−18を渡し、また、複数解像度情報蓄積モジュール120−18に解像度情報1712−18を渡す。
文字切り出しモジュール430−18と複数解像度情報蓄積モジュール120−18は接続されており、文字切り出しモジュール430−18は、複数解像度情報蓄積モジュール120−18に1文字画像432−18を渡す。
複数解像度情報蓄積モジュール120−18と低解像度文字画像照合モジュール130−18、高解像度情報付与モジュール140−18は接続されており、複数解像度情報蓄積モジュール120−18は、低解像度文字画像照合モジュール130−18へ低解像度文字画像122−18を渡し、また、高解像度情報付与モジュール140−18へ高解像度文字画像124−18を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−18、高解像度ドキュメント化モジュール1330は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−18へ1文字画像722を渡し、また、高解像度ドキュメント化モジュール1330へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
高解像度ドキュメント化モジュール1330は、文字文書1800−Bを出力する。図13の例に示した高解像度ドキュメント化モジュール1330と同等である。
高解像度画像読取りモジュール920−19と文字切り出しモジュール930−19、低解像度多位相スキャン処理モジュール1710−19は接続されており、高解像度画像読取りモジュール920−19は、文字切り出しモジュール930−19、低解像度多位相スキャン処理モジュール1710−19に高解像度画像922−19を渡す。
文字切り出しモジュール930−19と複数解像度情報蓄積モジュール120−19は接続されており、文字切り出しモジュール930−19は、複数解像度情報蓄積モジュール120−19に1文字画像932−19を渡す。
低解像度多位相スキャン処理モジュール1710−19と文字切り出しモジュール430−19、複数解像度情報蓄積モジュール120−19は接続されており、低解像度多位相スキャン処理モジュール1710−19は、文字切り出しモジュール430−19に低解像度画像422−19を渡し、また、複数解像度情報蓄積モジュール120−19に解像度情報1712−19を渡す。
文字切り出しモジュール430−19と複数解像度情報蓄積モジュール120−19は接続されており、文字切り出しモジュール430−19は、複数解像度情報蓄積モジュール120−19に1文字画像432−19を渡す。
複数解像度情報蓄積モジュール120−19と低解像度文字画像照合モジュール130−19、高解像度情報付与モジュール140−19は接続されており、複数解像度情報蓄積モジュール120−19は、低解像度文字画像照合モジュール130−19へ低解像度文字画像122−19を渡し、また、高解像度情報付与モジュール140−19へ高解像度文字画像+文字コード124−19を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−19、フォーマッターモジュール730は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−19へ1文字画像722を渡し、また、フォーマッターモジュール730へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
フォーマッターモジュール730は、文字文書1900−B、文字文書1900−Cを出力する。図14の例に示したフォーマッターモジュール730と同等である。
高解像度画像読取りモジュール920−20と文字切り出しモジュール930−20、低解像度多位相スキャン処理モジュール1710−20は接続されており、高解像度画像読取りモジュール920−20は、文字切り出しモジュール930−20、低解像度多位相スキャン処理モジュール1710−20に高解像度画像922−20を渡す。
文字切り出しモジュール930−20と複数解像度情報蓄積モジュール120−20は接続されており、文字切り出しモジュール930−20は、複数解像度情報蓄積モジュール120−20に1文字画像932−20を渡す。
低解像度多位相スキャン処理モジュール1710−20と文字切り出しモジュール430−20、複数解像度情報蓄積モジュール120−20は接続されており、低解像度多位相スキャン処理モジュール1710−20は、文字切り出しモジュール430−20に低解像度画像422−20を渡し、また、複数解像度情報蓄積モジュール120−20に解像度情報1712−20を渡す。
文字切り出しモジュール430−20と複数解像度情報蓄積モジュール120−20は接続されており、文字切り出しモジュール430−20は、複数解像度情報蓄積モジュール120−20に1文字画像432−20を渡す。
複数解像度情報蓄積モジュール120−20と低解像度文字画像照合モジュール130−20、高解像度情報付与モジュール140−20は接続されており、複数解像度情報蓄積モジュール120−20は、低解像度文字画像照合モジュール130−20へ低解像度文字画像122−20を渡し、また、高解像度情報付与モジュール140−20へ文字コード+フォント情報124−20を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−20、ドキュメント化モジュール830は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−20へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
ドキュメント化モジュール830は、文字文書2000−Bを出力する。図15の例に示すドキュメント化モジュール830と同等である。
図21は、第5の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
高解像度画像読取りモジュール1620−21は、画像を読み取る。
低解像度多位相スキャン処理モジュール1710−21は、高解像度画像読取りモジュール1620−21によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する。
文字認識処理モジュール2110は、高解像度画像読取りモジュール1620−21によって読み取られた画像内の画素塊の画像を認識する。また、文字認識処理モジュール2110は、高解像度画像読取りモジュール1620−21から1文字画像1632−21を受け取って認識してもよい。
高解像度画像読取りモジュール1620−21が読み取る画像は、利用者が実際に利用している文書である。
文字切り出しモジュール1630−21は、高解像度画像読取りモジュール1620−21によって読み取られた画像内の画素塊の画像を切り出す。
文字切り出しモジュール430−21は、低解像度多位相スキャン処理モジュール1710−21によって生成された画像内の画素塊の画像を切り出す。
ユーザ文書受付モジュール1610−21と高解像度画像読取りモジュール1620−21は接続されており、ユーザ文書受付モジュール1610−21は、高解像度画像読取りモジュール1620−21へユーザ文書1612−21を渡す。図16の例に示すユーザ文書受付モジュール1610と同等である。
高解像度画像読取りモジュール1620−21と文字切り出しモジュール1630−21、低解像度多位相スキャン処理モジュール1710−21、文字認識処理モジュール2110は接続されており、高解像度画像読取りモジュール1620−21は、文字切り出しモジュール1630−21、低解像度多位相スキャン処理モジュール1710−21、文字認識処理モジュール2110へ高解像度画像1622−21を渡す。図16の例に示す高解像度画像読取りモジュール1620と同等である。
文字切り出しモジュール1630−21と複数解像度情報蓄積モジュール120−21は接続されており、文字切り出しモジュール1630−21は、複数解像度情報蓄積モジュール120−21へ1文字画像1632−21を渡す。図16の例に示す文字切り出しモジュール1630と同等である。
文字切り出しモジュール430−21と複数解像度情報蓄積モジュール120−21は接続されており、文字切り出しモジュール430−21は、複数解像度情報蓄積モジュール120−21へ1文字画像432−21を渡す。図17の例に示す文字切り出しモジュール430−17と同等である。
また、第5の具体的な実施の形態を実現するにあたっての全体の構成例は、図18、図19、図20に示すものと同等である。ただし、辞書文書生成モジュール410−18、19、20、高解像度画像読取りモジュール920−18、19、20、文字切り出しモジュール930−18、19、20、低解像度多位相スキャン処理モジュール1710−18、19、20、文字切り出しモジュール430−18、19、20、複数解像度情報蓄積モジュール120−18、19、20を、図21に示す構成に代替したものである。
図22は、第6の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。いままでの実施の形態は、スキャナで文字画像を読み取って複数解像度情報を生成していたが、この実施の形態では、高解像度の文字画像をラスター処理で生成して、これを用いて複数解像度情報を生成するものである。
フォント描画モジュール2220は、辞書文書文字選択モジュール2210によって選択された画素塊とその画素塊に関する情報に基づいて画素塊の画像を生成する。
低解像度多位相スキャン処理モジュール2230は、フォント描画モジュール2220によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する。
複数解像度情報蓄積モジュール120−22は、低解像度多位相スキャン処理モジュール2230によって処理された画素塊の画像に対してその画素塊に関する情報として辞書文書文字選択モジュール2210によって選択された画素塊に関する情報を記憶する。
辞書文書文字選択モジュール2210とフォント描画モジュール2220、複数解像度情報蓄積モジュール120−22は接続されており、辞書文書文字選択モジュール2210は、フォント描画モジュール2220に文字コード/フォント情報2212を渡し、また、複数解像度情報蓄積モジュール120−22に文字コード/フォント情報2214を渡す。利用者の操作に応じて、複数解像度情報を生成する対象の文字画像を選択する。つまり、対象の文字(文字コード)、フォント情報(フォント種別、フォントサイズ等)を選択する。
フォント描画モジュール2220−23と複数解像度情報蓄積モジュール120−23、低解像度多位相スキャン処理モジュール2230−23は接続されており、フォント描画モジュール2220−23は、複数解像度情報蓄積モジュール120−23、低解像度多位相スキャン処理モジュール2230−23に高解像度1文字画像2222−23を渡す。
低解像度多位相スキャン処理モジュール2230−23と複数解像度情報蓄積モジュール120−23は接続されており、低解像度多位相スキャン処理モジュール2230−23は、複数解像度情報蓄積モジュール120−23に低解像度複数文字画像2232−23、解像度情報2234−23を渡す。
複数解像度情報蓄積モジュール120−23と低解像度文字画像照合モジュール130−23、高解像度情報付与モジュール140−23は接続されており、複数解像度情報蓄積モジュール120−23は、低解像度文字画像照合モジュール130−23へ低解像度文字画像122−23を渡し、また、高解像度情報付与モジュール140−23へ高解像度文字画像124−23を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−23、高解像度ドキュメント化モジュール1330は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−23へ1文字画像722を渡し、また、高解像度ドキュメント化モジュール1330へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
高解像度ドキュメント化モジュール1330は、文字文書2300−Bを出力する。図13の例に示した高解像度ドキュメント化モジュール1330と同等である。
フォント描画モジュール2220−24と複数解像度情報蓄積モジュール120−24、低解像度多位相スキャン処理モジュール2230−24は接続されており、フォント描画モジュール2220−24は、複数解像度情報蓄積モジュール120−24、低解像度多位相スキャン処理モジュール2230−24に高解像度1文字画像2222−24を渡す。
低解像度多位相スキャン処理モジュール2230−24と複数解像度情報蓄積モジュール120−24は接続されており、低解像度多位相スキャン処理モジュール2230−24は、複数解像度情報蓄積モジュール120−24に低解像度複数文字画像2232−24、解像度情報2234−24を渡す。
複数解像度情報蓄積モジュール120−24と低解像度文字画像照合モジュール130−24、高解像度情報付与モジュール140−24は接続されており、複数解像度情報蓄積モジュール120−24は、低解像度文字画像照合モジュール130−24へ低解像度文字画像122−24を渡し、また、高解像度情報付与モジュール140−24へ高解像度文字画像+文字コード124−24を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−24、フォーマッターモジュール730は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−24へ1文字画像722を渡し、また、フォーマッターモジュール730へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
フォーマッターモジュール730は、文字文書2400−B、文字文書2400−Cを出力する。図14の例に示したフォーマッターモジュール730と同等である。
フォント描画モジュール2220−25と複数解像度情報蓄積モジュール120−25、低解像度多位相スキャン処理モジュール2230−25は接続されており、フォント描画モジュール2220−25は、複数解像度情報蓄積モジュール120−25、低解像度多位相スキャン処理モジュール2230−25に高解像度1文字画像2222−25を渡す。
低解像度多位相スキャン処理モジュール2230−25と複数解像度情報蓄積モジュール120−25は接続されており、低解像度多位相スキャン処理モジュール2230−25は、複数解像度情報蓄積モジュール120−25に低解像度複数文字画像2232−25、解像度情報2234−25を渡す。
複数解像度情報蓄積モジュール120−25と低解像度文字画像照合モジュール130−25、高解像度情報付与モジュール140−25は接続されており、複数解像度情報蓄積モジュール120−25は、低解像度文字画像照合モジュール130−25へ低解像度文字画像122−25を渡し、また、高解像度情報付与モジュール140−25へ文字コード+フォント情報124−25を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−25、ドキュメント化モジュール830は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−25へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
ドキュメント化モジュール830は、文字文書2500−Bを出力する。図15の例に示すドキュメント化モジュール830と同等である。
文字切り出しモジュール720は、画像読取りモジュール710によって読み取られた画像内の画素塊の画像を切り出す。
フォント情報決定モジュール2610は、文字切り出しモジュール720によって切り出された画素塊の画像に関する情報を決定する。
文字認識処理モジュール2620は、文字切り出しモジュール720によって切り出された画素塊の画像を認識する。
フォント描画モジュール2630は、文字認識処理モジュール2620による認識結果とフォント情報決定モジュール2610によって決定された画素塊の画像に関する情報に基づいて、画素塊の画像を生成する。フォント描画モジュール2630は、文字切り出しモジュール720によって切り出された画素塊の画像よりも高解像度の画素塊の画像を生成するようにしてもよい。
低解像度多位相スキャン処理モジュール2640は、フォント描画モジュール2630によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する。
照合制御モジュール2690は、低解像度文字画像照合モジュール130−26の照合結果に基づいてフォント情報決定モジュール2610、文字認識処理モジュール2620、フォント描画モジュール2630、低解像度多位相スキャン処理モジュール2640を制御して再度処理を行わせる。
低解像度文字画像照合モジュール130−26は、文字切り出しモジュール720によって切り出された画素塊の画像と低解像度多位相スキャン処理モジュール2640によって生成された画素塊の画像を照合する。
高解像度情報付与モジュール140−26は、低解像度文字画像照合モジュール130−26による照合結果に基づいて、フォント情報決定モジュール2610によって決定された画素塊の画像に関する情報と文字認識処理モジュール2620による認識結果を文字切り出しモジュール720によって切り出された画素塊に付与する。
ドキュメント化モジュール830は、高解像度情報付与モジュール140−26によって付与された画素塊の画像に関する情報と認識結果に基づいて文書情報を生成する。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−26、ドキュメント化モジュール830、フォント情報決定モジュール2610、文字認識処理モジュール2620は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−26、フォント情報決定モジュール2610、文字認識処理モジュール2620へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
文字認識処理モジュール2620とフォント描画モジュール2630、高解像度情報付与モジュール140−26は接続されており、文字認識処理モジュール2620は、文字切り出しモジュール720から渡された1文字画像722を認識して、フォント描画モジュール2630、高解像度情報付与モジュール140−26へ認識結果の文字コード2622を渡す。図16の例に示した文字認識処理モジュール1660と同等である。
低解像度多位相スキャン処理モジュール2640と低解像度文字画像照合モジュール130−26は接続されており、低解像度多位相スキャン処理モジュール2640は、低解像度文字画像照合モジュール130−26に低解像度文字画像2642を渡す。図22の例に示した低解像度多位相スキャン処理モジュール2230と同等である。
ドキュメント化モジュール830は、文字文書2600−Bを出力する。図25の例に示すドキュメント化モジュール830と同等である。
図27は、第1、2、4、6の具体的な実施の形態をファックスとして実現した場合の処理例を示す説明図である。
図27(a)は、準備段階の処理、つまり複数解像度情報生成と蓄積の処理例を示すものである。ファックス2700−Aは、ファックス2700−Bに対して、予め辞書文書2710を送信しておき、受信側のファックス2700−Bでは送信されてきた辞書文書2710に基づいて複数解像度情報を生成して複数解像度情報蓄積モジュール120内に蓄積する。ただし、本準備過程は先に実行しておき、製品であるファックス2700−Bに組み込んでおいてもよい。例えば、送信側と受信側で同じ会社製のファックスを使い、ユーザが送ろうとする辞書文書2710が同じ会社製のプリンター製品で、かつプリンタフォントを使って印刷した場合は、受信側では既知のフォントのみが対象となるので有効である。
図28は、第3、5の具体的な実施の形態をファックスとして実現した場合の処理例を示す説明図である。
図28(a)は、準備段階の処理、つまり複数解像度情報生成と蓄積の処理例を示すものである。ファックス2800−Aは、ファックス2800−Bに対して、予めユーザ文書2810(例えば、利用者が既に使用している文書)を送信しておき、受信側のファックス2800−Bでは送信されてきたユーザ文書2810に基づいて複数解像度情報を生成して複数解像度情報蓄積モジュール120内に蓄積する。特に、帳票系文書に用いられている特殊なフォントで印刷されている場合など、別途辞書文書を生成できない場合は、予めユーザ文書を高解像度でスキャンして受信側のファックス2800−Bに送信しておき、受信側のファックス2800−Bで複数解像度情報を生成し、蓄積しておく。これによって、ユーザ文書が多ければ多いほど、通常処理で高解像度情報が付与される文字が増えることになる。
図29は、第1、2、4、6の具体的な実施の形態をスキャナとして実現した場合の処理例を示す説明図である。
図29(a)は、準備段階の処理、つまり複数解像度情報生成と蓄積の処理例を示すものである。ファックス2900は、予め辞書文書2910を低い解像度で複数回読み取り、より高い解像度で1回読み取り、複数解像度情報を生成して複数解像度情報蓄積モジュール120内に蓄積する。ただし、本準備過程は先に実行しておき、製品であるファックス2900に組み込んでおいてもよいことは前述と同じである。
図30は、第3、5の具体的な実施の形態をスキャナとして実現した場合の処理例を示す説明図である。
図30(a)は、準備段階の処理、つまり複数解像度情報生成と蓄積の処理例を示すものである。ファックス3000は、予めユーザ文書3010(例えば、利用者が既に使用している文書)を低い解像度で複数回読み取り、より高い解像度で1回読み取り、複数解像度情報を生成して複数解像度情報蓄積モジュール120内に蓄積する。特に、帳票系文書に用いられている特殊なフォントで印刷されている場合など、別途辞書文書を生成できない場合は、予めユーザ文書を高解像度でスキャンしてファックス3000で複数解像度情報を生成し、蓄積しておく。これによって、ユーザ文書が多ければ多いほど、通常処理で高解像度情報が付与される文字が増えることになる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…複数解像度情報蓄積モジュール
130…低解像度文字画像照合モジュール
140…高解像度情報付与モジュール
410…辞書文書生成モジュール
420…低解像度画像複数回読取りモジュール
430…文字切り出しモジュール
730…フォーマッターモジュール
830…ドキュメント化モジュール
920…高解像度画像読取りモジュール
930…文字切り出しモジュール
1330…高解像度ドキュメント化モジュール
1610…ユーザ文書受付モジュール
1620…高解像度画像読取りモジュール
1630…文字切り出しモジュール
1640…低解像度画像複数回読取りモジュール
1650…文字切り出しモジュール
1660…文字認識処理モジュール
1710…低解像度多位相スキャン処理モジュール
2110…文字認識処理モジュール
2210…辞書文書文字選択モジュール
2220…フォント描画モジュール
2230…低解像度多位相スキャン処理モジュール
2610…フォント情報決定モジュール
2620…文字認識処理モジュール
2630…フォント描画モジュール
2640…低解像度多位相スキャン処理モジュール
2690…照合制御モジュール
Claims (12)
- 複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成する情報生成手段と、
前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶する記憶手段と、
受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合する照合手段と、
前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する情報付与手段
を具備することを特徴とする画像処理装置。 - 前記情報生成手段は、
複数の種類又はサイズの画素塊の画像を含む画像を出力する出力手段と、
前記出力手段によって出力された画像を複数回読み取る読取り手段と、
前記読取り手段によって読み取られた画像内の画素塊の画像を切り出す切り出し手段
を有し、
前記記憶手段は、前記切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報を記憶する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記情報生成手段は、
複数の種類又はサイズの画素塊の画像を含む画像を出力する出力手段と、
前記出力手段によって出力された画像を読み取る第1の読取り手段と、
前記出力手段によって出力された画像を複数回、前記第1の読取り手段よりも低い解像度で読み取る第2の読取り手段と、
前記第1の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、
前記第2の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第2の切り出し手段
を有し、
前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記情報生成手段は、
画像を読み取る第1の読取り手段と、
前記画像を複数回、前記第1の読取り手段よりも低い解像度で読み取る第2の読取り手段と、
前記第1の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、
前記第2の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第2の切り出し手段
を有し、
前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記情報生成手段は、
複数の種類又はサイズの画素塊の画像を含む画像を出力する出力手段と、
前記出力手段によって出力された画像を読み取る読取り手段と、
前記読取り手段によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、
前記読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、
前記低解像度位相処理手段によって生成された画像内の画素塊の画像を切り出す第2の切り出し手段
を有し、
前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記情報生成手段は、
画像を読み取る読取り手段と、
前記読取り手段によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、
前記読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、
前記低解像度位相処理手段によって生成された画像内の画素塊の画像を切り出す第2の切り出し手段
を有し、
前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記情報生成手段は、
前記画像内の画素塊の画像を認識する認識手段
をさらに有し、
前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記認識手段による認識結果を記憶する
ことを特徴とする請求項4又は6に記載の画像処理装置。 - 前記情報生成手段は、
利用者の操作に応じて、画素塊と該画素塊に関する情報を選択する選択手段と、
前記選択手段によって選択された画素塊と該画素塊に関する情報に基づいて画素塊の画像を生成する画像生成手段と、
前記画像生成手段によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段
を有し、
前記記憶手段は、前記低解像度位相処理手段によって処理された画素塊の画像に対して該画素塊に関する情報として前記選択手段によって選択された前記画素塊に関する情報を記憶する
ことを特徴とする請求項1に記載の画像処理装置。 - 受け付けた画像内の画素塊の画像を切り出す切り出し手段と、
前記切り出し手段によって切り出された画素塊の画像に関する情報を決定する情報決定手段と、
前記切り出し手段によって切り出された画素塊の画像を認識する認識手段と、
前記認識手段による認識結果と前記情報決定手段によって決定された画素塊の画像に関する情報に基づいて、画素塊の画像を生成する画像生成手段と、
前記画像生成手段によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、
前記切り出し手段によって切り出された画素塊の画像と前記低解像度位相処理手段によって生成された画素塊の画像を照合する照合手段と、
前記照合手段による照合結果に基づいて、前記情報決定手段によって決定された画素塊の画像に関する情報と前記認識手段による認識結果を前記切り出し手段によって切り出された画素塊に付与する情報付与手段
を具備することを特徴とする画像処理装置。 - 前記画素塊とは文字であり、前記画素塊に関する情報として文字コード、フォント種別、サイズを含む
ことを特徴とする請求項1から9のいずれか一項に記載の画像処理装置。 - コンピュータを、
複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成する情報生成手段と、
前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶する記憶手段と、
受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合する照合手段と、
前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する情報付与手段
として機能させることを特徴とする画像処理プログラム。 - コンピュータを、
受け付けた画像内の画素塊の画像を切り出す切り出し手段と、
前記切り出し手段によって切り出された画素塊の画像に関する情報を決定する情報決定手段と、
前記切り出し手段によって切り出された画素塊の画像を認識する認識手段と、
前記認識手段による認識結果と前記情報決定手段によって決定された画素塊の画像に関する情報に基づいて、画素塊の画像を生成する画像生成手段と、
前記画像生成手段によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、
前記切り出し手段によって切り出された画素塊の画像と前記低解像度位相処理手段によって生成された画素塊の画像を照合する照合手段と、
前記照合手段による照合結果に基づいて、前記情報決定手段によって決定された画素塊の画像に関する情報と前記認識手段による認識結果を前記切り出し手段によって切り出された画素塊に付与する情報付与手段
として機能させることを特徴とする画像処理プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009119215A JP5526596B2 (ja) | 2009-05-15 | 2009-05-15 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009119215A JP5526596B2 (ja) | 2009-05-15 | 2009-05-15 | 画像処理装置及び画像処理プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010267155A true JP2010267155A (ja) | 2010-11-25 |
| JP5526596B2 JP5526596B2 (ja) | 2014-06-18 |
Family
ID=43364058
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009119215A Expired - Fee Related JP5526596B2 (ja) | 2009-05-15 | 2009-05-15 | 画像処理装置及び画像処理プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5526596B2 (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03214287A (ja) * | 1990-01-19 | 1991-09-19 | Sony Corp | 文字認識装置 |
| JPH03217993A (ja) * | 1990-01-23 | 1991-09-25 | Omron Corp | 文字サイズ認識装置 |
| JPH10240869A (ja) * | 1997-03-03 | 1998-09-11 | Nippon Steel Corp | 文字認識辞書作成装置及び文字認識辞書作成方法 |
-
2009
- 2009-05-15 JP JP2009119215A patent/JP5526596B2/ja not_active Expired - Fee Related
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03214287A (ja) * | 1990-01-19 | 1991-09-19 | Sony Corp | 文字認識装置 |
| JPH03217993A (ja) * | 1990-01-23 | 1991-09-25 | Omron Corp | 文字サイズ認識装置 |
| JPH10240869A (ja) * | 1997-03-03 | 1998-09-11 | Nippon Steel Corp | 文字認識辞書作成装置及び文字認識辞書作成方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5526596B2 (ja) | 2014-06-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8411955B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
| US7391917B2 (en) | Image processing method | |
| JP4600491B2 (ja) | 画像処理装置及び画像処理プログラム | |
| US7623712B2 (en) | Image processing method and apparatus | |
| US8339619B2 (en) | System and image processing method and apparatus for re-using and re-editing images | |
| US8126270B2 (en) | Image processing apparatus and image processing method for performing region segmentation processing | |
| JP5357612B2 (ja) | 下線除去装置 | |
| US7640269B2 (en) | Image processing system and image processing method | |
| US8391607B2 (en) | Image processor and computer readable medium | |
| US20130308862A1 (en) | Image processing apparatus, image processing method, and computer readable medium | |
| JP5365440B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP2006023944A (ja) | 画像処理システム及び画像処理方法 | |
| JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
| US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
| JP4780184B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP5526596B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP5111242B2 (ja) | 画像処理装置及び方法 | |
| US20110033114A1 (en) | Image processing apparatus and computer readable medium | |
| JP6131765B2 (ja) | 情報処理装置及び情報処理プログラム | |
| JP5673277B2 (ja) | 画像処理装置およびプログラム | |
| JP5262778B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP4930288B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP6676955B2 (ja) | 画像処理装置及び画像処理プログラム | |
| JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
| JP4872780B2 (ja) | 画像処理システム及び画像処理プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120418 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130820 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131010 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140318 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140331 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5526596 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |