JP2010267155A - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP2010267155A
JP2010267155A JP2009119215A JP2009119215A JP2010267155A JP 2010267155 A JP2010267155 A JP 2010267155A JP 2009119215 A JP2009119215 A JP 2009119215A JP 2009119215 A JP2009119215 A JP 2009119215A JP 2010267155 A JP2010267155 A JP 2010267155A
Authority
JP
Japan
Prior art keywords
image
module
character
resolution
pixel block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009119215A
Other languages
English (en)
Other versions
JP5526596B2 (ja
Inventor
Kazunori So
一憲 宋
Shunichi Kimura
俊一 木村
Yutaka Koshi
裕 越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2009119215A priority Critical patent/JP5526596B2/ja
Publication of JP2010267155A publication Critical patent/JP2010267155A/ja
Application granted granted Critical
Publication of JP5526596B2 publication Critical patent/JP5526596B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】画素塊に関する情報を画像内の画素塊の画像に付与する場合にあって、その付与する情報はその画像内の画素塊の画像よりも高解像度である画素塊に関する情報とするようにした画像処理装置を提供する。
【解決手段】画像処理装置の情報生成手段は、複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成し、記憶手段は、前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶し、照合手段は、受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合し、情報付与手段は、前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する。
【選択図】図1

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
複写機のデジタル化によって紙文書の再利用を目的とした電子化が盛んになっている。
しかし、スキャン画像である電子文書の流通や蓄積負荷を軽減するために、低解像度で読み取りが行われている。そのため、文字画像の画質は劣化してしまう。
これに関連する技術として、例えば、特許文献1には、多数の認識用サンプル文字データを自動的に生成することを可能とし、ユーザの労力を軽減することができる文字認識辞書作成方法及び文字認識辞書作成装置を提供することを課題とし、文字認識辞書作成部において、イメージデータ入力部は、外部から基本となる文字のイメージデータを取り込み、切り出し部は、イメージデータ入力部によって取り込まれたイメージデータの中から文字の部分を切り出す作業を行って基本イメージデータを得て、外乱処理部は、基本イメージデータに対し、種々の外乱をシミュレートした所定の画像処理を施して、認識用サンプル文字データを生成し、これによって、少数の基本イメージデータから、多数の認識用サンプル文字データが自動的に生成されることが開示されている。
特開平10−240869号公報
本発明は、画素塊に関する情報を画像内の画素塊の画像に付与する場合にあって、その付与する情報はその画像内の画素塊の画像よりも高解像度である画素塊に関する情報とするようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成する情報生成手段と、前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶する記憶手段と、受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合する照合手段と、前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する情報付与手段を具備することを特徴とする画像処理装置である。
請求項2の発明は、前記情報生成手段は、複数の種類又はサイズの画素塊の画像を含む画像を出力する出力手段と、前記出力手段によって出力された画像を複数回読み取る読取り手段と、前記読取り手段によって読み取られた画像内の画素塊の画像を切り出す切り出し手段を有し、前記記憶手段は、前記切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報を記憶することを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記情報生成手段は、複数の種類又はサイズの画素塊の画像を含む画像を出力する出力手段と、前記出力手段によって出力された画像を読み取る第1の読取り手段と、前記出力手段によって出力された画像を複数回、前記第1の読取り手段よりも低い解像度で読み取る第2の読取り手段と、前記第1の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、前記第2の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第2の切り出し手段を有し、前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶することを特徴とする請求項1に記載の画像処理装置である。
請求項4の発明は、前記情報生成手段は、画像を読み取る第1の読取り手段と、前記画像を複数回、前記第1の読取り手段よりも低い解像度で読み取る第2の読取り手段と、前記第1の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、前記第2の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第2の切り出し手段を有し、前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶することを特徴とする請求項1に記載の画像処理装置である。
請求項5の発明は、前記情報生成手段は、複数の種類又はサイズの画素塊の画像を含む画像を出力する出力手段と、前記出力手段によって出力された画像を読み取る読取り手段と、前記読取り手段によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、前記読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、前記低解像度位相処理手段によって生成された画像内の画素塊の画像を切り出す第2の切り出し手段を有し、前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶することを特徴とする請求項1に記載の画像処理装置である。
請求項6の発明は、前記情報生成手段は、画像を読み取る読取り手段と、前記読取り手段によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、前記読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、前記低解像度位相処理手段によって生成された画像内の画素塊の画像を切り出す第2の切り出し手段を有し、前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶することを特徴とする請求項1に記載の画像処理装置である。
請求項7の発明は、前記情報生成手段は、前記画像内の画素塊の画像を認識する認識手段をさらに有し、前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記認識手段による認識結果を記憶することを特徴とする請求項4又は6に記載の画像処理装置である。
請求項8の発明は、前記情報生成手段は、利用者の操作に応じて、画素塊と該画素塊に関する情報を選択する選択手段と、前記選択手段によって選択された画素塊と該画素塊に関する情報に基づいて画素塊の画像を生成する画像生成手段と、前記画像生成手段によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段を有し、前記記憶手段は、前記低解像度位相処理手段によって処理された画素塊の画像に対して該画素塊に関する情報として前記選択手段によって選択された前記画素塊に関する情報を記憶することを特徴とする請求項1に記載の画像処理装置である。
請求項9の発明は、受け付けた画像内の画素塊の画像を切り出す切り出し手段と、前記切り出し手段によって切り出された画素塊の画像に関する情報を決定する情報決定手段と、前記切り出し手段によって切り出された画素塊の画像を認識する認識手段と、前記認識手段による認識結果と前記情報決定手段によって決定された画素塊の画像に関する情報に基づいて、画素塊の画像を生成する画像生成手段と、前記画像生成手段によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、前記切り出し手段によって切り出された画素塊の画像と前記低解像度位相処理手段によって生成された画素塊の画像を照合する照合手段と、前記照合手段による照合結果に基づいて、前記情報決定手段によって決定された画素塊の画像に関する情報と前記認識手段による認識結果を前記切り出し手段によって切り出された画素塊に付与する情報付与手段を具備することを特徴とする画像処理装置である。
請求項10の発明は、前記画素塊とは文字であり、前記画素塊に関する情報として文字コード、フォント種別、サイズを含むことを特徴とする請求項1から9のいずれか一項に記載の画像処理装置である。
請求項11の発明は、コンピュータを、複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成する情報生成手段と、前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶する記憶手段と、受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合する照合手段と、前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する情報付与手段として機能させることを特徴とする画像処理プログラムである。
請求項12の発明は、コンピュータを、受け付けた画像内の画素塊の画像を切り出す切り出し手段と、前記切り出し手段によって切り出された画素塊の画像に関する情報を決定する情報決定手段と、前記切り出し手段によって切り出された画素塊の画像を認識する認識手段と、前記認識手段による認識結果と前記情報決定手段によって決定された画素塊の画像に関する情報に基づいて、画素塊の画像を生成する画像生成手段と、前記画像生成手段によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、前記切り出し手段によって切り出された画素塊の画像と前記低解像度位相処理手段によって生成された画素塊の画像を照合する照合手段と、前記照合手段による照合結果に基づいて、前記情報決定手段によって決定された画素塊の画像に関する情報と前記認識手段による認識結果を前記切り出し手段によって切り出された画素塊に付与する情報付与手段として機能させることを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、画素塊に関する情報を画像内の画素塊の画像に付与する場合にあって、その付与する情報はその画像内の画素塊の画像よりも高解像度である画素塊に関する情報とすることができる。
請求項2の画像処理装置によれば、画像の読み取りによって発生する位相が異なる画素塊の画像を照合の対象とすることができる。
請求項3の画像処理装置によれば、付与する画素塊に関する情報として出力手段によって出力された画素塊の画像を用いることができる。
請求項4の画像処理装置によれば、利用者が実際に用いている画像を基にして照合するための画素塊の画像を生成することができる。
請求項5の画像処理装置によれば、本構成を有していない場合に比較して、少ない回数の読み取りで照合するための画素塊の画像を生成することができる。
請求項6の画像処理装置によれば、本構成を有していない場合に比較して、利用者が実際に用いている画像を基にして少ない回数の読み取りで照合するための画素塊の画像を生成することができる。
請求項7の画像処理装置によれば、本構成を有していない場合に比較して、高解像度である画素塊に関する情報として文字コードを含めることができる。
請求項8の画像処理装置によれば、画像を読み取らなくても位相が異なる画素塊の画像を照合の対象とすることができる。
請求項9の画像処理装置によれば、画素塊に関する情報を画像内の画素塊の画像に付与する場合にあって、対象としている画像内の画素塊の画像を用いて位相が異なる画素塊の画像を生成して照合の対象とし、その付与する情報はその画像内の画素塊の画像よりも高解像度である画素塊に関する情報とすることができる。
請求項10の画像処理装置によれば、文字を含む画像を対象として処理することができる。
請求項11の画像処理プログラムによれば、画素塊に関する情報を画像内の画素塊の画像に付与する場合にあって、その付与する情報はその画像内の画素塊の画像よりも高解像度である画素塊に関する情報とすることができる。
請求項12の画像処理プログラムによれば、画素塊に関する情報を画像内の画素塊の画像に付与する場合にあって、対象としている画像内の画素塊の画像を用いて位相が異なる画素塊の画像を生成して照合の対象とし、その付与する情報はその画像内の画素塊の画像よりも高解像度である画素塊に関する情報とすることができる。
本実施の形態の基本的な構成例についての概念的なモジュール構成図である。 本実施の形態による複数解像度文字画像情報の生成処理例を示すフローチャートである。 本実施の形態による高解像度情報の付与処理例を示すフローチャートである。 第1の具体的な実施の形態の構成例についての概念的なモジュール構成図である。 複数解像度情報テーブルのデータ構造例を示す説明図である。 複数解像度情報テーブルのデータ構造例を示す説明図である。 第1の具体的な実施の形態を実現するにあたっての全体の構成例(1)についてのモジュール構成図である。 第1の具体的な実施の形態を実現するにあたっての全体の構成例(2)についてのモジュール構成図である。 第2の具体的な実施の形態の構成例についての概念的なモジュール構成図である。 複数解像度情報テーブルのデータ構造例を示す説明図である。 複数解像度情報テーブルのデータ構造例を示す説明図である。 複数解像度情報テーブルのデータ構造例を示す説明図である。 第2の具体的な実施の形態を実現するにあたっての全体の構成例(1)についてのモジュール構成図である。 第2の具体的な実施の形態を実現するにあたっての全体の構成例(2)についてのモジュール構成図である。 第2の具体的な実施の形態を実現するにあたっての全体の構成例(3)についてのモジュール構成図である。 第3の具体的な実施の形態の構成例についての概念的なモジュール構成図である。 第4の具体的な実施の形態の構成例についての概念的なモジュール構成図である。 第4の具体的な実施の形態を実現するにあたっての全体の構成例(1)についてのモジュール構成図である。 第4の具体的な実施の形態を実現するにあたっての全体の構成例(2)についてのモジュール構成図である。 第4の具体的な実施の形態を実現するにあたっての全体の構成例(3)についてのモジュール構成図である。 第5の具体的な実施の形態の構成例についての概念的なモジュール構成図である。 第6の具体的な実施の形態の構成例についての概念的なモジュール構成図である。 第6の具体的な実施の形態を実現するにあたっての全体の構成例(1)についてのモジュール構成図である。 第6の具体的な実施の形態を実現するにあたっての全体の構成例(2)についてのモジュール構成図である。 第6の具体的な実施の形態を実現するにあたっての全体の構成例(3)についてのモジュール構成図である。 第6の具体的な実施の形態を実現するにあたっての全体の構成例(4)についてのモジュール構成図である。 第1、2、4、6の具体的な実施の形態をファックスとして実現した場合の処理例を示す説明図である。 第3、5の具体的な実施の形態をファックスとして実現した場合の処理例を示す説明図である。 第1、2、4、6の具体的な実施の形態をスキャナとして実現した場合の処理例を示す説明図である。 第3、5の具体的な実施の形態をスキャナとして実現した場合の処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
まず、本実施の形態の理解を容易にするために、本実施の形態を用いる場面について説明する。
前述のように、画像読取装置(以下、スキャナともいう)で読み込んだ画像(電子文書)を流通、蓄積等するために低解像度で読み込む場合が多い。
一方、電子文書の文字検索を可能にするために文字認識技術を導入し、例えば、PDF(Portable Document Format)のフォーマットを用いて文書の画像上に、文字認識された文字コードをシステムフォントの透明色で描画することで、検索を可能にすることができるが、文字の画質が悪いと認識率が下がる。
さらに、文字認識して得られた文字コードでシステムフォントを使って描画することで文字品質を上げることができるが、文字認識によってはフォント情報(サイズ、フォント種別等)が得られないため、オリジナルの文書とは外観が変わってしまう。
また、スキャナで読み込むときの低解像度化によって、サンプリング周波数と文字位置との関係で、同じ文字でも位置によって様々に劣化した文字が生じる。このことが、文字認識の認識率を下げる原因の1つである。
特にファックスにおける標準モードでは、約200dpi×100dpiという低解像度で読み込むため文字画質が悪く、画質劣化の分散が大きいため文字認識の認識率を下げることとなる。
さらに、既存のフォント認識アルゴリズムも前述したサンプリング周波数と文字位置との関係による外乱を受け、認識精度が落ちることとなる。
本実施の形態は、文書をスキャナで読み込むときに発生する信号劣化のパターンをデータベースとして用いることで、低解像度で読み込まれた文字であっても高解像度の文字に置き換え得るようにし、それに付随して文字認識の認識率も向上させ得るものである。
つまり、スキャナで読み込むときの文字画像の劣化をシミュレートしたデータベースを用意すれば、例えば既存の文字のパターン認識技術を用いて文字のフォントサイズやフォント種別等までも特定することができ、データベース上で関連付けられた高解像度の文字画像と入れ替えることで、文字画質を向上させ得る。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<実施の形態の基本的な構成例>
図1は、本実施の形態の基本的な構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白に囲まれた領域で切り出した画像領域、又は予め定められた間隔で切り出した画像領域等がある。
なお、1つの画素塊として、1文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。
画素塊として文字を例示し、画素塊の画像として文字画像を例示する。
画像としての文字を示す場合は文字画像とし、その文字を一意に識別するコードによって示されるものの場合は文字と称する。つまり、文字を紙等の媒体に印刷等によって視覚化したものが文字画像である。したがって、1つの文字について、フォント種別、フォントサイズ、解像度等によって複数の文字画像があることになる。また、画素塊に関する情報として、より高解像度の文字画像、文字コード、フォント種別、サイズを含む。
本実施の形態である画像処理装置の基本構成例としては、複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120、低解像度文字画像照合モジュール130、高解像度情報付与モジュール140を有している。
複数解像度情報生成モジュール110は、複数の画素塊の画像とその画素塊の画像よりも高解像度であるその画素塊に関する情報を生成する。ここで、「その画素塊の画像よりも高解像度である画素塊に関する情報」とは、その画素塊の画像よりも高解像度の画素塊の画像を生成するための画素塊に関する情報であればよく、例えば、文字コード、フォント種別、高解像度の文字画像等がある。
複数解像度情報蓄積モジュール120は、複数解像度情報生成モジュール110によって生成された画素塊の画像とその画素塊に関する情報を記憶する。
低解像度文字画像照合モジュール130は、受け付けた画像内の画素塊の画像と複数解像度情報蓄積モジュール120によって記憶されている画素塊の画像を照合する。
高解像度情報付与モジュール140は、低解像度文字画像照合モジュール130による照合結果に基づいて、複数解像度情報蓄積モジュール120から画素塊に関する情報を抽出して、その画素塊に関する情報を受け付けた画像内の画素塊の画像に付与する。ここで、「画像内の画素塊の画像に付与する」とは、高解像度の画像に置き換える場合も含む。
より具体例として、各モジュールを説明する。
複数解像度情報生成モジュール110と複数解像度情報蓄積モジュール120は接続されており、複数解像度情報生成モジュール110は、複数解像度情報蓄積モジュール120へ複数解像度文字画像情報112を渡す。複数解像度情報生成モジュール110は、一般に使われると予想されるフォント種、フォントサイズで、ひらがな、カタカナ、英数字、常用漢字等の文字が予め定められた解像度で複数回スキャンされた場合の画像(文字画像ともいう)を生成する。ここで準備する文字は、本実施の形態が使用される場面において対象となる文書に用いられる文字である。これらの文字が印刷された文書を用意しておき、スキャナで読み込む。同じ文書内の文字画像を複数回読み取ることによって、位相が異なる文字画像を得ることができる。これはスキャナが機械系による読取り部分を含んでいるために、同じ文字画像を読み取っても異なる位相の文字画像となってしまうことが経験的に知られている。また、解像度についても複数種の解像度で読み込んでもよい。なお、文書画像から文字画像を切り取る方法は既存の方法を用いる。例えば、予め定められた面積以上(1辺が予め定められた長さ以上等でもよい)を有する空白で区切り、ある方向への射影によって文字画像を切り出すようにしてもよい。
そして、これらの文字画像、文字フォント情報、解像度情報を複数解像度文字画像情報112として生成して、複数解像度情報蓄積モジュール120へ送出する。なお、文字フォント情報、解像度情報は、予め文書を印刷するときに指定されているので、その指定された情報を複数解像度情報生成モジュール110が得て、複数解像度情報蓄積モジュール120へ渡す。
複数解像度情報蓄積モジュール120と低解像度文字画像照合モジュール130、高解像度情報付与モジュール140は接続されており、複数解像度情報蓄積モジュール120は、低解像度文字画像照合モジュール130へ低解像度文字画像122を渡す。また、複数解像度情報蓄積モジュール120は、高解像度情報付与モジュール140へ高解像度情報124を渡し、高解像度情報付与モジュール140は、複数解像度情報蓄積モジュール120へ照合ID142を渡す。複数解像度情報蓄積モジュール120は、複数解像度情報生成モジュール110から送出された複数解像度文字画像情報112を記憶して、その記憶している複数の低解像度文字画像122を低解像度文字画像照合モジュール130へ送出し、高解像度情報付与モジュール140から受け取った照合ID142に関連付けられている高解像度情報124を、高解像度情報付与モジュール140へ送出する。
低解像度文字画像照合モジュール130と高解像度情報付与モジュール140は接続されており、低解像度文字画像照合モジュール130は、高解像度情報付与モジュール140へ照合ID132を渡す。受け付けた文字画像128と複数解像度情報蓄積モジュール120に蓄積された低解像度文字画像122の照合を行い、一致したものがある場合は、その一致した文字を示す照合ID132を、一致しない場合は一致しないことを示す照合ID132(例えば、予め定められた特別な数値、より具体的には0、マイナスの数値等)を高解像度情報付与モジュール140へ送出する。
高解像度情報付与モジュール140は、出力文字画像144を出力する。高解像度情報付与モジュール140は、低解像度文字画像照合モジュール130による照合結果である照合ID132を受け取り、一致したものである場合は、照合ID142(照合ID132)を複数解像度情報蓄積モジュール120へ渡し、その照合ID142(照合ID132)に対応する高解像度情報124を受け取り、低解像度の文字画像128に高解像度情報124を付与して(置き換えてもよい)出力し、一致しない場合は受け付けた文字画像128をそのまま出力する。
図2は、本実施の形態による複数解像度文字画像情報112の生成処理例を示すフローチャートである。
ステップS202では、複数解像度情報生成モジュール110が、1つの文字に対して複数の解像度の文字画像とその文字に関する情報である複数解像度文字画像情報112を生成する。
ステップS204では、複数解像度情報蓄積モジュール120が、文字画像とその文字に関する高解像度情報124等を含む複数解像度文字画像情報112を記憶する。
図3は、本実施の形態による高解像度情報の付与処理例を示すフローチャートである。
ステップS302では、本実施の形態が、画像を受け付ける。その画像内から文字画像を切り出す。
ステップS304では、低解像度文字画像照合モジュール130が、画像内の文字画像128と複数解像度情報蓄積モジュール120に記憶されている低解像度文字画像122とを照合する。
ステップS306では、高解像度情報付与モジュール140が、ステップS304で照合された文字画像128に対する高解像度情報124を複数解像度情報蓄積モジュール120から取得する。
ステップS308では、高解像度情報付与モジュール140が、高解像度情報124を文字画像128に付与して出力する。
<第1の具体的な実施の形態>
図4は、第1の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
図4に示す構成例は、辞書文書生成モジュール410、低解像度画像複数回読取りモジュール420、文字切り出しモジュール430、複数解像度情報蓄積モジュール120−4を有している。辞書文書生成モジュール410、低解像度画像複数回読取りモジュール420、文字切り出しモジュール430は、図1に示した複数解像度情報生成モジュール110の具体的な構成例に該当し、複数解像度情報蓄積モジュール120−4は、図1に示した複数解像度情報蓄積モジュール120に該当する。
辞書文書生成モジュール410は、複数の種類又はサイズの画素塊の画像を含む画像を生成して出力する。ここでの出力として、例えば紙等の媒体への印刷が該当する。
低解像度画像複数回読取りモジュール420は、辞書文書生成モジュール410によって出力された画像を複数回読み取る。ここでの読み取りとして、例えばスキャナでの画像読み取りが該当する。
文字切り出しモジュール430は、低解像度画像複数回読取りモジュール420によって読み取られた画像内の画素塊の画像を切り出す。
複数解像度情報蓄積モジュール120−4は、文字切り出しモジュール430によって切り出された画素塊の画像に対してその画素塊に関する情報を記憶する。
より具体例として、各モジュールを説明する。
辞書文書生成モジュール410と低解像度画像複数回読取りモジュール420及び複数解像度情報蓄積モジュール120−4は接続されており、辞書文書生成モジュール410は、低解像度画像複数回読取りモジュール420へ辞書文書412を渡し、また、複数解像度情報蓄積モジュール120−4へ文字コード/フォント情報414を渡す。辞書文書生成モジュール410は、一般に使われると予想されるフォント種、フォントサイズで、ひらがな、カタカナ、英数字、常用漢字等の文字を含む文書を印刷した辞書文書412を生成し、その辞書文書412を低解像度画像複数回読取りモジュール420へ渡し、その辞書文書412の文字毎の文字コード/フォント情報414(フォント情報としてフォント種別、フォントサイズを含む)を複数解像度情報蓄積モジュール120−4へ送出する。文字コード/フォント情報414は、辞書文書412を生成するにあたって指定されたものである。
低解像度画像複数回読取りモジュール420と文字切り出しモジュール430及び複数解像度情報蓄積モジュール120−4は接続されており、低解像度画像複数回読取りモジュール420は、文字切り出しモジュール430へ低解像度画像422を渡し、また、複数解像度情報蓄積モジュール120−4へ解像度情報424を渡す。低解像度画像複数回読取りモジュール420は、図1の例に示した低解像度文字画像照合モジュール130が受け取る文字画像128の解像度(例えばファックスの標準モードでは約200dpi×100dpi、スキャナでは200dpi×200dpiといった、文字画像128として可能性がある読取り解像度)と同等の解像度で、さらに複数の位相の異なる低解像度画像422を生成するために複数回の読み取りを行い、読み取った低解像度画像422を文字切り出しモジュール430へ送出し、読み取ったときの解像度情報424を複数解像度情報蓄積モジュール120−4へ送出する。
文字切り出しモジュール430と複数解像度情報蓄積モジュール120−4は接続されており、文字切り出しモジュール430は、複数解像度情報蓄積モジュール120−4へ1文字画像432を渡す。文字切り出しモジュール430は、格子状に並んでいる文字を画像処理によって1文字ずつ切り出すか、又はオペレーターが人手を介して切り出し矩形を指定する操作に基づいて文字画像を切り出し、その切り出した1文字画像432を複数解像度情報蓄積モジュール120−4へ送出する。
複数解像度情報蓄積モジュール120−4は、1文字に対して複数の低解像度の1文字画像432と文字コード/フォント情報414をリンクさせ、複数解像度情報として生成し、蓄積する。複数解像度情報としては、図5の例に示す複数解像度情報テーブル500又は図6の例に示す複数解像度情報テーブル600がある。
図5は、複数解像度情報テーブル500のデータ構造例を示す説明図である。複数解像度情報テーブル500は、照合ID欄510、低解像度文字画像欄520、高解像度情報(文字コード)欄530を有している。照合ID欄510は、文字を一意に識別できる符号を記憶し、低解像度文字画像欄520は、その文字を低解像度で読み取った画像であり、その1文字について複数回読み取った文字画像(つまり異なった位相の文字画像)を記憶し、高解像度情報(文字コード)欄530は、その文字画像の文字コードを高解像度情報として記憶する。なお、低解像度文字画像欄520が記憶する文字画像の解像度は、図1の例に示す低解像度文字画像照合モジュール130が受け取る文字画像128の解像度と同等のものである。
図6は、複数解像度情報テーブル600のデータ構造例を示す説明図である。複数解像度情報テーブル600は、照合ID欄610、低解像度文字画像欄620、高解像度情報(文字コード)欄630、高解像度情報(フォント種別)欄640、高解像度情報(フォントサイズ)欄650を有している。照合ID欄610は、文字(文字コード、フォント種別、フォントサイズの組み合わせ)を一意に識別できる符号を記憶する。低解像度文字画像欄620、高解像度情報(文字コード)欄630は、図5の例に示す複数解像度情報テーブル500の低解像度文字画像欄520、高解像度情報(文字コード)欄530と同等であり、高解像度情報(フォント種別)欄640は、その文字のフォント種別を記憶し(例えば、ゴシック等)、高解像度情報(フォントサイズ)欄650は、その文字のフォントサイズを記憶する。つまり、高解像度情報として高解像度情報(文字コード)欄630に記憶されているものの他に高解像度情報(フォント種別)欄640、高解像度情報(フォントサイズ)欄650に記憶されているものがある。
複数解像度情報テーブル500、複数解像度情報テーブル600の使い分け、つまり高解像度情報は目的に応じた実施形態にあわせて以下の2種類がある。複数解像度情報テーブル500は図7の例に示す構成例に用いられ、複数解像度情報テーブル600は図8の例に示す構成例に用いられる。
図7は、第1の具体的な実施の形態を実現するにあたっての全体の構成例(1)についてのモジュール構成図である。これは、文字文書700−Aを受け付けて、文字コードを透明色でラスター化してレイヤー構成とした文字文書700−B、文字文書700−Cを生成する。例えば、PDFの形式では、文字コードをシステムフォントで透明層(文字文書700−C)として付与する。そのために、辞書文書生成モジュール410−7は、文字コード414−7を複数解像度情報蓄積モジュール120−7へ渡し、複数解像度情報蓄積モジュール120−7は図5の例に示した複数解像度情報テーブル500を記憶し、高解像度情報付与モジュール140−7は高解像度情報として文字コードを付与している。
図7に示す全体の構成例は、辞書文書生成モジュール410−7、低解像度画像複数回読取りモジュール420−7、文字切り出しモジュール430−7、複数解像度情報蓄積モジュール120−7、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−7、高解像度情報付与モジュール140−7、フォーマッターモジュール730を有している。
辞書文書生成モジュール410−7と低解像度画像複数回読取りモジュール420−7、複数解像度情報蓄積モジュール120−7は接続されており、辞書文書生成モジュール410−7は、低解像度画像複数回読取りモジュール420−7へ辞書文書412−7を渡し、また、複数解像度情報蓄積モジュール120−7へ文字コード414−7を渡す。
低解像度画像複数回読取りモジュール420−7と文字切り出しモジュール430−7、複数解像度情報蓄積モジュール120−7は接続されており、低解像度画像複数回読取りモジュール420−7は、文字切り出しモジュール430−7へ低解像度画像422−7を渡し、また、複数解像度情報蓄積モジュール120−7へ解像度情報424−7を渡す。
文字切り出しモジュール430−7と複数解像度情報蓄積モジュール120−7は接続されており、文字切り出しモジュール430−7は、複数解像度情報蓄積モジュール120−7へ1文字画像432−7を渡す。
複数解像度情報蓄積モジュール120−7と低解像度文字画像照合モジュール130−7、高解像度情報付与モジュール140−7は接続されており、複数解像度情報蓄積モジュール120−7は、低解像度文字画像照合モジュール130−7へ低解像度文字画像122−7を渡し、また、高解像度情報付与モジュール140−7へ文字コード124−7を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書700−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−7、フォーマッターモジュール730は接続されており、文字切り出しモジュール720は、文字画像712を1文字毎に切り出して、その切り出しの位置(例えば、文字文書700−A内における矩形である1文字画像722の左上のX、Y座標)を抽出する。低解像度文字画像照合モジュール130−7へ1文字画像722を渡し、また、フォーマッターモジュール730へ1文字画像722、文字位置座標724を渡す。なお、1文字画像722と文字位置座標724は対応している。
低解像度文字画像照合モジュール130−7と高解像度情報付与モジュール140−7は接続されており、低解像度文字画像照合モジュール130−7は、高解像度情報付与モジュール140−7へ照合ID132−7を渡す。1文字画像722と複数解像度情報蓄積モジュール120−7からの低解像度文字画像(複数解像度情報テーブル500における低解像度文字画像欄520に記憶されている文字画像)の照合を行い、一致した場合はその照合ID132−7(照合した文字画像に対応する複数解像度情報テーブル500における照合ID欄510に記憶されている符号)を、一致しない場合は照合ID132−7を0として、高解像度情報付与モジュール140−7へ渡す。
高解像度情報付与モジュール140−7と複数解像度情報蓄積モジュール120−7、フォーマッターモジュール730は接続されており、高解像度情報付与モジュール140−7は、複数解像度情報蓄積モジュール120−7へ照合ID142−7を渡し、また、フォーマッターモジュール730へ文字コード144−7を渡す。照合ID132−7が一致した場合(照合ID132−7が0以外の場合)にはその照合ID132−7である照合ID142−7を複数解像度情報蓄積モジュール120−7へ送出し、対応する文字コード124−7を得て、1文字画像722に対応する文字コード144−7としてフォーマッターモジュール730へ送出し、一致しない場合(照合ID132−7が0の場合)は1文字画像722に対応する文字コード144−7として0をフォーマッターモジュール730へ送出する。
フォーマッターモジュール730は、文字文書700−B、文字文書700−Cを出力する。高解像度情報付与モジュール140−7からの文字コード144−7が0以外ならば、その文字コードをラスタライズ化し、1文字画像722を文字切り出しモジュール720から受け取った文字位置座標724に基づいて配置し、例えばPDFフォーマット化し、文字コードをシステムフォントで透明層(文字文書700−C)として添付して出力し、文字コード144−7が0の場合は、文字画像712の1文字画像722を文字位置座標724に基づいて、例えばPDFフォーマット化して出力する。
図8は、第1の具体的な実施の形態を実現するにあたっての全体の構成例(2)についてのモジュール構成図である。これは、文字文書800−Aを受け付けて、文書作成装置(ワープロソフト等)によって作成される形式の電子文書である文字文書800−Bを生成する。つまり、画像である文字文書800−Aを文字コード化させて文字文書800−Bを生成する。そのときにフォント情報も文字文書800−Aと同等のものにする。そのために、辞書文書生成モジュール410−8は、文字コード/フォント情報414−8を複数解像度情報蓄積モジュール120−8へ渡し、複数解像度情報蓄積モジュール120−8は図6の例に示した複数解像度情報テーブル600を記憶し、高解像度情報付与モジュール140−8は高解像度情報として文字コードとフォント情報を付与している。
図8に示す全体の構成例は、辞書文書生成モジュール410−8、低解像度画像複数回読取りモジュール420−8、文字切り出しモジュール430−8、複数解像度情報蓄積モジュール120−8、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−8、高解像度情報付与モジュール140−8、ドキュメント化モジュール830を有している。
辞書文書生成モジュール410−8と低解像度画像複数回読取りモジュール420−8、複数解像度情報蓄積モジュール120−8は接続されており、辞書文書生成モジュール410−8は、低解像度画像複数回読取りモジュール420−8へ辞書文書412−8を渡し、また、複数解像度情報蓄積モジュール120−8へ文字コード/フォント情報414−8を渡す。
低解像度画像複数回読取りモジュール420−8と文字切り出しモジュール430−8、複数解像度情報蓄積モジュール120−8は接続されており、低解像度画像複数回読取りモジュール420−8は、文字切り出しモジュール430−8へ低解像度画像422−8を渡し、また、複数解像度情報蓄積モジュール120−8へ解像度情報424−8を渡す。
文字切り出しモジュール430−8と複数解像度情報蓄積モジュール120−8は接続されており、文字切り出しモジュール430−8は、複数解像度情報蓄積モジュール120−8へ1文字画像432−8を渡す。
複数解像度情報蓄積モジュール120−8と低解像度文字画像照合モジュール130−8、高解像度情報付与モジュール140−8は接続されており、複数解像度情報蓄積モジュール120−8は、低解像度文字画像照合モジュール130−8へ低解像度文字画像122−8を渡し、また、高解像度情報付与モジュール140−8へ文字コード/フォント情報124−8を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書800−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−8、ドキュメント化モジュール830は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−8へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−8と高解像度情報付与モジュール140−8は接続されており、低解像度文字画像照合モジュール130−8は、高解像度情報付与モジュール140−8へ照合ID132−8を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−8と複数解像度情報蓄積モジュール120−8、ドキュメント化モジュール830は接続されており、高解像度情報付与モジュール140−8は、複数解像度情報蓄積モジュール120−8へ照合ID142−8を渡し、また、ドキュメント化モジュール830へ文字コード+フォント情報144−8を渡す。照合ID132−8が一致した場合(照合ID132−8が0以外の場合)にはその照合ID132−8である照合ID142−8を複数解像度情報蓄積モジュール120−8へ送出し、対応する文字コード/フォント情報124−8を得て、1文字画像722に対応する文字コード+フォント情報144−8としてドキュメント化モジュール830へ送出し、一致しない場合(照合ID132−8が0の場合)は1文字画像722に対応する文字コード+フォント情報144−8の文字コードとして0をドキュメント化モジュール830へ送出する。
ドキュメント化モジュール830は、文字文書800−Bを出力する。高解像度情報付与モジュール140−8からの文字コード+フォント情報144−8の文字コードが0以外なら、その文字コードをフォント情報に基づいてラスタライズ化し、1文字画像722を文字切り出しモジュール720から受け取った文字位置座標724に基づいて、例えばワープロソフトによって生成される電子文書である文字文書800−Bに変換して出力し、文字コード+フォント情報144−8の文字コードが0の場合は、文字画像712の1文字画像722を文字位置座標724に基づいて、フォント化(例えば、1文字画像722を特殊な文字コードで特定できるようにする等)し、電子文書化して出力する。
<第2の具体的な実施の形態>
図9は、第2の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
図9に示す構成例は、辞書文書生成モジュール410−9、高解像度画像読取りモジュール920、低解像度画像複数回読取りモジュール420−9、文字切り出しモジュール930、文字切り出しモジュール430−9、複数解像度情報蓄積モジュール120−9を有している。辞書文書生成モジュール410−9、高解像度画像読取りモジュール920、低解像度画像複数回読取りモジュール420−9、文字切り出しモジュール930、文字切り出しモジュール430−9は、図1に示した複数解像度情報生成モジュール110の具体的な構成例に該当し、複数解像度情報蓄積モジュール120−9は、図1に示した複数解像度情報蓄積モジュール120に該当する。
辞書文書生成モジュール410−9は、複数の種類又はサイズの画素塊の画像を含む画像を出力する。図4の例に示した辞書文書生成モジュール410と同等のものである。
高解像度画像読取りモジュール920は、辞書文書生成モジュール410−9によって出力された画像を読み取る
低解像度画像複数回読取りモジュール420−9は、辞書文書生成モジュール410−9によって出力された画像を複数回、高解像度画像読取りモジュール920よりも低い解像度で読み取る。
高解像度画像読取りモジュール920と低解像度画像複数回読取りモジュール420−9が読み取る画像は、同じ画像である。この画像は、辞書文書生成モジュール410−9によって出力されたものであり、この出力画像は本実施の形態用に辞書文書412−9として利用されるものである。また、高解像度画像読取りモジュール920は、図1の例で示した低解像度文字画像照合モジュール130が受け付けた文字画像128よりも高解像度で読み取る。
文字切り出しモジュール930は、高解像度画像読取りモジュール920によって読み取られた画像内の画素塊の画像を切り出す。
文字切り出しモジュール430−9は、低解像度画像複数回読取りモジュール420−9によって読み取られた画像内の画素塊の画像を切り出す。
複数解像度情報蓄積モジュール120−9は、文字切り出しモジュール430−9によって切り出された画素塊の画像に対してその画素塊に関する情報として文字切り出しモジュール930によって切り出された画素塊の画像を記憶する。
より具体例として、各モジュールを説明する。
辞書文書生成モジュール410−9と高解像度画像読取りモジュール920、低解像度画像複数回読取りモジュール420−9、複数解像度情報蓄積モジュール120−9は接続されており、辞書文書生成モジュール410−9は、高解像度画像読取りモジュール920、低解像度画像複数回読取りモジュール420−9へ辞書文書412−9を渡し、また、複数解像度情報蓄積モジュール120−9へ文字コード/フォント情報414−9を渡す。図4の例に示す辞書文書生成モジュール410と同等である。
高解像度画像読取りモジュール920と文字切り出しモジュール930は接続されており、高解像度画像読取りモジュール920は、文字切り出しモジュール930へ高解像度画像922を渡す。高解像度画像読取りモジュール920は、図1の例に示した低解像度文字画像照合モジュール130が受け取る文字画像128の解像度よりも高解像度(例えば600dpi×600dpiの高解像度)で予め定められた回数(例えば1回)スキャナによって読み取り、その読み取った高解像度画像922を文字切り出しモジュール930へ送出する。
文字切り出しモジュール930と複数解像度情報蓄積モジュール120−9は接続されており、文字切り出しモジュール930は、複数解像度情報蓄積モジュール120−9へ1文字画像932を渡す。図4の例に示す文字切り出しモジュール430と同等である。
低解像度画像複数回読取りモジュール420−9と文字切り出しモジュール430−9、複数解像度情報蓄積モジュール120−9は接続されており、低解像度画像複数回読取りモジュール420−9は、文字切り出しモジュール430−9へ低解像度画像422−9を渡し、また、複数解像度情報蓄積モジュール120−9へ解像度情報424−9を渡す。図4の例に示す低解像度画像複数回読取りモジュール420と同等である。
文字切り出しモジュール430−9と複数解像度情報蓄積モジュール120−9は接続されており、文字切り出しモジュール430−9は、複数解像度情報蓄積モジュール120−9へ1文字画像432−9を渡す。図4の例に示す文字切り出しモジュール430と同等である。
複数解像度情報蓄積モジュール120−9は、1文字に対して高解像度の1文字画像932と複数の低解像度の1文字画像432−9と文字コード/フォント情報414−9をリンクさせ、複数解像度情報として生成し、蓄積する。複数解像度情報としては、図10の例に示す複数解像度情報テーブル1000、図11の例に示す複数解像度情報テーブル1100又は図12の例に示す複数解像度情報テーブル1200がある。
図10は、複数解像度情報テーブル1000のデータ構造例を示す説明図である。複数解像度情報テーブル1000は、照合ID欄1010、低解像度文字画像欄1020、高解像度情報(高解像度画像)欄1030を有している。照合ID欄1010、低解像度文字画像欄1020は、図5の例に示す複数解像度情報テーブル500の照合ID欄510、低解像度文字画像欄520と同等である。高解像度情報(高解像度画像)欄1030は、文字切り出しモジュール930から受け取った高解像度の1文字画像932を高解像度情報として記憶する。
図11は、複数解像度情報テーブル1100のデータ構造例を示す説明図である。複数解像度情報テーブル1100は、照合ID欄1110、低解像度文字画像欄1120、高解像度情報(高解像度画像)欄1130、高解像度情報(文字コード)欄1140を有している。照合ID欄1110、低解像度文字画像欄1120、高解像度情報(高解像度画像)欄1130は、図10の例に示す複数解像度情報テーブル1000の照合ID欄1010、低解像度文字画像欄1020、高解像度情報(高解像度画像)欄1030と同等である。高解像度情報(文字コード)欄1140は、その文字画像の文字コードを高解像度情報として記憶する。つまり、高解像度情報として高解像度の文字画像と文字コードを記憶する。
図12は、複数解像度情報テーブル1200のデータ構造例を示す説明図である。複数解像度情報テーブル1200は、照合ID欄1210、低解像度文字画像欄1220、高解像度情報(高解像度画像)欄1230、高解像度情報(文字コード)欄1240、高解像度情報(フォント種別)欄1250、高解像度情報(フォントサイズ)欄1260を有している。照合ID欄1210、低解像度文字画像欄1220、高解像度情報(高解像度画像)欄1230、高解像度情報(文字コード)欄1240は、図11の例に示す複数解像度情報テーブル1100の照合ID欄1110、低解像度文字画像欄1120、高解像度情報(高解像度画像)欄1130、高解像度情報(文字コード)欄1140と同等であり、高解像度情報(フォント種別)欄1250、高解像度情報(フォントサイズ)欄1260は、図6の例に示す複数解像度情報テーブル600の高解像度情報(フォント種別)欄640、高解像度情報(フォントサイズ)欄650と同等である。つまり、高解像度情報として高解像度の文字画像、文字コード、フォント種別、フォントサイズを記憶する。
また、複数解像度情報蓄積モジュール120−9が記憶する複数解像度情報として図6の例に示した複数解像度情報テーブル600(複数解像度情報テーブル1200から高解像度情報(高解像度画像)欄1230を外したもの)であってもよい。特にこれは複数解像度情報テーブル1200の代替として用いてもよい。
複数解像度情報テーブル1000、複数解像度情報テーブル1100、複数解像度情報テーブル1200の使い分け、つまり高解像度情報は目的に応じた実施形態にあわせて以下の3種類がある。複数解像度情報テーブル1000は図13の例に示す構成例に用いられ、複数解像度情報テーブル1100は図14の例に示す構成例に用いられ、複数解像度情報テーブル1200は図15の例に示す構成例に用いられる。
図13は、第2の具体的な実施の形態を実現するにあたっての全体の構成例(1)についてのモジュール構成図である。これは、文字文書1300−Aを受け付けて、より高解像度の文書である文字文書1300−Bを生成する。つまり、比較的低解像度の画像である文字文書1300−Aを高解像度にして文字文書1300−Bを生成する。そのために、複数解像度情報蓄積モジュール120−13は図10の例に示した複数解像度情報テーブル1000を記憶し、高解像度情報付与モジュール140−13は高解像度情報として高解像度の文字画像を付与している。
図13に示す全体の構成例は、辞書文書生成モジュール410−13、高解像度画像読取りモジュール920−13、低解像度画像複数回読取りモジュール420−13、文字切り出しモジュール930−13、文字切り出しモジュール430−13、複数解像度情報蓄積モジュール120−13、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−13、高解像度情報付与モジュール140−13、高解像度ドキュメント化モジュール1330を有している。
辞書文書生成モジュール410−13と高解像度画像読取りモジュール920−13、低解像度画像複数回読取りモジュール420−13、複数解像度情報蓄積モジュール120−13は接続されており、辞書文書生成モジュール410−13は、高解像度画像読取りモジュール920−13、低解像度画像複数回読取りモジュール420−13へ辞書文書412−13を渡し、また、複数解像度情報蓄積モジュール120−13へ文字コード/フォント情報414−13を渡す。
高解像度画像読取りモジュール920−13と文字切り出しモジュール930−13は接続されており、高解像度画像読取りモジュール920−13は、文字切り出しモジュール930−13へ高解像度画像922−13を渡す。
文字切り出しモジュール930−13と複数解像度情報蓄積モジュール120−13は接続されており、文字切り出しモジュール930−13は、複数解像度情報蓄積モジュール120−13へ1文字画像932−13を渡す。
低解像度画像複数回読取りモジュール420−13と文字切り出しモジュール430−13、複数解像度情報蓄積モジュール120−13は接続されており、低解像度画像複数回読取りモジュール420−13は、文字切り出しモジュール430−13へ低解像度画像422−13を渡し、また、複数解像度情報蓄積モジュール120−13へ解像度情報424−13を渡す。
文字切り出しモジュール430−13と複数解像度情報蓄積モジュール120−13は接続されており、文字切り出しモジュール430−13は、複数解像度情報蓄積モジュール120−13へ1文字画像432−13を渡す。
複数解像度情報蓄積モジュール120−13と低解像度文字画像照合モジュール130−13、高解像度情報付与モジュール140−13は接続されており、複数解像度情報蓄積モジュール120−13は、低解像度文字画像照合モジュール130−13へ低解像度文字画像122−13を渡し、また、高解像度情報付与モジュール140−13へ高解像度文字画像124−13を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書1300−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−13、高解像度ドキュメント化モジュール1330は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−13へ1文字画像722を渡し、また、高解像度ドキュメント化モジュール1330へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−13と高解像度情報付与モジュール140−13は接続されており、低解像度文字画像照合モジュール130−13は、高解像度情報付与モジュール140−13へ照合ID132−13を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−13と複数解像度情報蓄積モジュール120−13、高解像度ドキュメント化モジュール1330は接続されており、高解像度情報付与モジュール140−13は、複数解像度情報蓄積モジュール120−13へ照合ID142−13を渡し、また、高解像度ドキュメント化モジュール1330へ高解像度文字画像144−13を渡す。照合ID132−13が一致した場合(照合ID132−13が0以外の場合)にはその照合ID132−13である照合ID142−13を複数解像度情報蓄積モジュール120−13へ送出し、対応する高解像度文字画像124−13を得て、1文字画像722に対応する高解像度文字画像144−13として高解像度ドキュメント化モジュール1330へ送出し、一致しない場合(照合ID132−13が0の場合)は1文字画像722に対応する高解像度文字画像144−13として0を高解像度ドキュメント化モジュール1330へ送出する。
高解像度ドキュメント化モジュール1330は、文字文書1300−Bを出力する。高解像度情報付与モジュール140−13からの高解像度文字画像144−13が0以外ならば、その高解像度文字画像144−13を文字切り出しモジュール720から受け取った文字位置座標724に基づいて配置(つまり、1文字画像722の代わりに高解像度文字画像144−13を配置)し、高解像度文字画像144−13が0ならば、1文字画像722を文字切り出しモジュール720から受け取った文字位置座標724に基づいて配置(つまり、文字文書1300−Aの1文字画像722と同じになる)して出力する。
図14は、第2の具体的な実施の形態を実現するにあたっての全体の構成例(2)についてのモジュール構成図である。これは、文字文書1400−Aを受け付けて、文字コードを透明色でラスター化してレイヤー構成とした文字文書1400−B、文字文書1400−Cを生成する。例えば、PDFの形式では、文字コードをシステムフォントで透明層(文字文書1400−C)として付与する。そのために、辞書文書生成モジュール410−14は、文字コード/フォント情報414−14を複数解像度情報蓄積モジュール120−14へ渡し、複数解像度情報蓄積モジュール120−14は図11の例に示した複数解像度情報テーブル1100を記憶し、高解像度情報付与モジュール140−14は高解像度情報として高解像度の文字画像と文字コードを付与している。
図14に示す全体の構成例は、辞書文書生成モジュール410−14、高解像度画像読取りモジュール920−14、低解像度画像複数回読取りモジュール420−14、文字切り出しモジュール930−14、文字切り出しモジュール430−14、複数解像度情報蓄積モジュール120−14、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−14、高解像度情報付与モジュール140−14、フォーマッターモジュール730を有している。
辞書文書生成モジュール410−14と高解像度画像読取りモジュール920−14、低解像度画像複数回読取りモジュール420−14、複数解像度情報蓄積モジュール120−14は接続されており、辞書文書生成モジュール410−14は、高解像度画像読取りモジュール920−14、低解像度画像複数回読取りモジュール420−14へ辞書文書412−14を渡し、また、複数解像度情報蓄積モジュール120−14へ文字コード/フォント情報414−14を渡す。
高解像度画像読取りモジュール920−14と文字切り出しモジュール930−14は接続されており、高解像度画像読取りモジュール920−14は、文字切り出しモジュール930−14へ高解像度画像922−14を渡す。
文字切り出しモジュール930−14と複数解像度情報蓄積モジュール120−14は接続されており、文字切り出しモジュール930−14は、複数解像度情報蓄積モジュール120−14へ1文字画像932−14を渡す。
低解像度画像複数回読取りモジュール420−14と文字切り出しモジュール430−14、複数解像度情報蓄積モジュール120−14は接続されており、低解像度画像複数回読取りモジュール420−14は、文字切り出しモジュール430−14へ低解像度画像422−14を渡し、また、複数解像度情報蓄積モジュール120−14へ解像度情報424−14を渡す。
文字切り出しモジュール430−14と複数解像度情報蓄積モジュール120−14は接続されており、文字切り出しモジュール430−14は、複数解像度情報蓄積モジュール120−14へ1文字画像432−14を渡す。
複数解像度情報蓄積モジュール120−14と低解像度文字画像照合モジュール130−14、高解像度情報付与モジュール140−14は接続されており、複数解像度情報蓄積モジュール120−14は、低解像度文字画像照合モジュール130−14へ低解像度文字画像122−14を渡し、また、高解像度情報付与モジュール140−14へ高解像度文字画像+文字コード124−14を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書1400−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−14、フォーマッターモジュール730は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−14へ1文字画像722を渡し、また、フォーマッターモジュール730へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−14と高解像度情報付与モジュール140−14は接続されており、低解像度文字画像照合モジュール130−14は、高解像度情報付与モジュール140−14へ照合結果132−14を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−14と複数解像度情報蓄積モジュール120−14、フォーマッターモジュール730は接続されており、高解像度情報付与モジュール140−14は、複数解像度情報蓄積モジュール120−14へ照合ID142−14を渡し、また、フォーマッターモジュール730へ高解像度文字画像+文字コード144−14を渡す。照合結果132−14が一致した場合(照合結果132−14が0以外の場合)にはその照合結果132−14である照合ID142−14を複数解像度情報蓄積モジュール120−14へ送出し、対応する高解像度文字画像+文字コード124−14を得て、1文字画像722に対応する高解像度文字画像+文字コード144−14としてフォーマッターモジュール730へ送出し、一致しない場合(照合結果132−14が0の場合)は1文字画像722に対応する高解像度文字画像+文字コード144−14として0をフォーマッターモジュール730へ送出する。
フォーマッターモジュール730は、文字文書1400−B、文字文書1400−Cを出力する。高解像度情報付与モジュール140−14からの高解像度文字画像+文字コード144−14が0以外なら、高解像度文字画像+文字コード144−14の高解像度の文字画像を文字切り出しモジュール720から受け取った文字位置座標724に基づいて配置し、例えばPDFフォーマット化し、文字コードをシステムフォントで透明層(文字文書1400−C)として添付して出力し、高解像度文字画像+文字コード144−14が0の場合は、文字画像712の1文字画像722を文字位置座標724に基づいて、例えばPDFフォーマット化して出力する。
図15は、第2の具体的な実施の形態を実現するにあたっての全体の構成例(3)についてのモジュール構成図である。これは、文字文書1500−Aを受け付けて、文書作成装置(ワープロソフト等)によって作成される形式の電子文書である文字文書1500−Bを生成する。つまり、画像である文字文書1500−Aを文字コード化させて文字文書1500−Bを生成する。そのときにフォント情報も文字文書1500−Aと同等のものにする。そのために、辞書文書生成モジュール410−15は、文字コード/フォント情報414−15を複数解像度情報蓄積モジュール120−15へ渡し、複数解像度情報蓄積モジュール120−15は図12の例に示した複数解像度情報テーブル1200(又は図6の例に示す複数解像度情報テーブル600)を記憶し、高解像度情報付与モジュール140−15は高解像度情報として文字コードとフォント情報を付与している。
図15に示す全体の構成例は、辞書文書生成モジュール410−15、高解像度画像読取りモジュール920−15、低解像度画像複数回読取りモジュール420−15、文字切り出しモジュール930−15、文字切り出しモジュール430−15、複数解像度情報蓄積モジュール120−15、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−15、高解像度情報付与モジュール140−15、ドキュメント化モジュール830を有している。
辞書文書生成モジュール410−15と高解像度画像読取りモジュール920−15、低解像度画像複数回読取りモジュール420−15、複数解像度情報蓄積モジュール120−15は接続されており、辞書文書生成モジュール410−15は、高解像度画像読取りモジュール920−15、低解像度画像複数回読取りモジュール420−15へ辞書文書412−15を渡し、また、複数解像度情報蓄積モジュール120−15へ文字コード/フォント情報414−15を渡す。
高解像度画像読取りモジュール920−15と文字切り出しモジュール930−15は接続されており、高解像度画像読取りモジュール920−15は、文字切り出しモジュール930−15へ高解像度画像922−15を渡す。
文字切り出しモジュール930−15と複数解像度情報蓄積モジュール120−15は接続されており、文字切り出しモジュール930−15は、複数解像度情報蓄積モジュール120−15へ1文字画像932−15を渡す。
低解像度画像複数回読取りモジュール420−15と文字切り出しモジュール430−15、複数解像度情報蓄積モジュール120−15は接続されており、低解像度画像複数回読取りモジュール420−15は、文字切り出しモジュール430−15へ低解像度画像422−15を渡し、また、複数解像度情報蓄積モジュール120−15へ解像度情報424−15を渡す。
文字切り出しモジュール430−15と複数解像度情報蓄積モジュール120−15は接続されており、文字切り出しモジュール430−15は、複数解像度情報蓄積モジュール120−15へ1文字画像432−15を渡す。
複数解像度情報蓄積モジュール120−15と低解像度文字画像照合モジュール130−15、高解像度情報付与モジュール140−15は接続されており、複数解像度情報蓄積モジュール120−15は、低解像度文字画像照合モジュール130−15へ低解像度文字画像122−15を渡し、また、高解像度情報付与モジュール140−15へ文字コード+フォント情報124−15を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書1500−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−15、ドキュメント化モジュール830は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−15へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−15と高解像度情報付与モジュール140−15は接続されており、低解像度文字画像照合モジュール130−15は、高解像度情報付与モジュール140−15へ照合結果132−15を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−15と複数解像度情報蓄積モジュール120−15、ドキュメント化モジュール830は接続されており、高解像度情報付与モジュール140−15は、複数解像度情報蓄積モジュール120−15へ照合ID142−15を渡し、また、ドキュメント化モジュール830へ文字コード+フォント情報144−15を渡す。照合結果132−15が一致した場合(照合結果132−15が0以外の場合)にはその照合結果132−15である照合ID142−15を複数解像度情報蓄積モジュール120−15へ送出し、対応する文字コード+フォント情報124−15を得て、1文字画像722に対応する文字コード+フォント情報144−15としてドキュメント化モジュール830へ送出し、一致しない場合(照合結果132−15が0の場合)は1文字画像722に対応する文字コード+フォント情報144−15の文字コードとして0をドキュメント化モジュール830へ送出する。
ドキュメント化モジュール830は、文字文書1500−Bを出力する。高解像度情報付与モジュール140−15からの文字コード+フォント情報144−15の文字コードが0以外なら、その文字コードをフォント情報に基づいてラスタライズ化し、1文字画像722を文字切り出しモジュール720から受け取った文字位置座標724に基づいて、例えばワープロソフトによって生成される電子文書である文字文書1500−Bに変換して出力し、文字コード+フォント情報144−15の文字コードが0の場合は、文字画像712の1文字画像722を文字位置座標724に基づいて、フォント化(例えば、1文字画像722を特殊な文字コードで特定できるようにする等)し、電子文書化して出力する。
<第3の具体的な実施の形態>
図16は、第3の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
図16に示す構成例は、ユーザ文書受付モジュール1610、高解像度画像読取りモジュール1620、文字切り出しモジュール1630、低解像度画像複数回読取りモジュール1640、文字切り出しモジュール1650、文字認識処理モジュール1660、複数解像度情報蓄積モジュール120−16を有している。ユーザ文書受付モジュール1610、高解像度画像読取りモジュール1620、文字切り出しモジュール1630、低解像度画像複数回読取りモジュール1640、文字切り出しモジュール1650、文字認識処理モジュール1660は、図1に示した複数解像度情報生成モジュール110の具体的な構成例に該当し、複数解像度情報蓄積モジュール120−16は、図1に示した複数解像度情報蓄積モジュール120に該当する。
ユーザ文書受付モジュール1610は、ユーザ文書1612を高解像度画像読取りモジュール1620、低解像度画像複数回読取りモジュール1640、文字認識処理モジュール1660へ渡す。
高解像度画像読取りモジュール1620は、ユーザ文書受付モジュール1610から渡されたユーザ文書1612を読み取る。
文字切り出しモジュール1630は、高解像度画像読取りモジュール1620によって読み取られた画像内の画素塊の画像を切り出す。
低解像度画像複数回読取りモジュール1640は、ユーザ文書受付モジュール1610から渡されたユーザ文書1612を複数回、高解像度画像読取りモジュール1620よりも低い解像度で読み取る。
文字切り出しモジュール1650は、低解像度画像複数回読取りモジュール1640によって読み取られた画像内の画素塊の画像を切り出す。
文字認識処理モジュール1660は、ユーザ文書受付モジュール1610から渡されたユーザ文書1612内の画素塊の画像を認識する。文字認識処理モジュール1660は、読み取り手段としてのスキャナを有しており、ユーザ文書1612を読み取ってから認識する。また、文字認識処理モジュール1660は、高解像度画像読取りモジュール1620から高解像度画像1622を受け取って認識してもよいし、文字切り出しモジュール1630から1文字画像1632を受け取って認識してもよい。
高解像度画像読取りモジュール1620、低解像度画像複数回読取りモジュール1640が読み取る画像と文字認識処理モジュール1660が認識の対象とする画像は、同じ画像である。この画像は、利用者が実際に利用している文書である。
複数解像度情報蓄積モジュール120−16は、文字切り出しモジュール1650によって切り出された画素塊の画像に対してその画素塊に関する情報として文字切り出しモジュール1630によって切り出された画素塊の画像を記憶する。さらに、複数解像度情報蓄積モジュール120−16は、文字切り出しモジュール1650によって切り出された画素塊の画像に対してその画素塊に関する情報として文字認識処理モジュール1660による認識結果を記憶するようにしてもよい。
より具体例として、各モジュールを説明する。
ユーザ文書受付モジュール1610と高解像度画像読取りモジュール1620、低解像度画像複数回読取りモジュール1640、文字認識処理モジュール1660は接続されており、ユーザ文書受付モジュール1610は、高解像度画像読取りモジュール1620、低解像度画像複数回読取りモジュール1640、文字認識処理モジュール1660にユーザ文書1612を渡す。例えば利用者によって頻繁に使われているユーザ文書1612を高解像度画像読取りモジュール1620、低解像度画像複数回読取りモジュール1640、文字認識処理モジュール1660へ送出する。
高解像度画像読取りモジュール1620と文字切り出しモジュール1630は接続されており、高解像度画像読取りモジュール1620は、文字切り出しモジュール1630に高解像度画像1622を渡す。図9の例に示す高解像度画像読取りモジュール920と同等である。
文字切り出しモジュール1630と複数解像度情報蓄積モジュール120−16は接続されており、文字切り出しモジュール1630は、複数解像度情報蓄積モジュール120−16に1文字画像1632を渡す。図9の例に示す文字切り出しモジュール930と同等である。
低解像度画像複数回読取りモジュール1640と文字切り出しモジュール1650、複数解像度情報蓄積モジュール120−16は接続されており、低解像度画像複数回読取りモジュール1640は、文字切り出しモジュール1650に低解像度画像1642を渡し、また、複数解像度情報蓄積モジュール120−16に解像度情報1644を渡す。図9の例に示す低解像度画像複数回読取りモジュール420−9と同等である。
文字切り出しモジュール1650と複数解像度情報蓄積モジュール120−16は接続されており、文字切り出しモジュール1650は、複数解像度情報蓄積モジュール120−16に1文字画像1652を渡す。図9の例に示す文字切り出しモジュール430−9と同等である。
文字認識処理モジュール1660と複数解像度情報蓄積モジュール120−16は接続されており、文字認識処理モジュール1660は、複数解像度情報蓄積モジュール120−16に文字コード1662を渡す。文字認識処理モジュール1660は、ユーザ文書1612(高解像度画像1622、1文字画像1632でもよい)を対象画像として文字認識する。文字認識の手法は既存の手法を用いる。また、文字認識処理に合わせて、前処理として解像度変換処理等を行ってもよい。また、文字認識できなかった文字は、複数解像度情報蓄積モジュール120−16へ蓄積しなくてもよい。その場合、その文字についての複数解像度情報はなくなってしまう。
複数解像度情報蓄積モジュール120−16は、1文字に対して高解像度の1文字画像1632と複数の低解像度の1文字画像1652と文字コード1662をリンクさせ、複数解像度情報として生成し、蓄積する。複数解像度情報としては、図10の例に示す複数解像度情報テーブル1000、図11の例に示す複数解像度情報テーブル1100又は図12の例に示す複数解像度情報テーブル1200がある。
また、第3の具体的な実施の形態を実現するにあたっての全体の構成例は、図13、図14、図15に示すものと同等である。ただし、辞書文書生成モジュール410−13、14、15、高解像度画像読取りモジュール920−13、14、15、文字切り出しモジュール930−13、14、15、低解像度画像複数回読取りモジュール420−13、14、15、文字切り出しモジュール430−13、14、15、複数解像度情報蓄積モジュール120−13、14、15を、図16に示す構成に代替したものである。
<第4の具体的な実施の形態>
図17は、第4の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
図17に示す構成例は、辞書文書生成モジュール410−17、高解像度画像読取りモジュール920−17、低解像度多位相スキャン処理モジュール1710、文字切り出しモジュール930−17、文字切り出しモジュール430−17、複数解像度情報蓄積モジュール120−17を有している。辞書文書生成モジュール410−17、高解像度画像読取りモジュール920−17、低解像度多位相スキャン処理モジュール1710、文字切り出しモジュール930−17、文字切り出しモジュール430−17は、図1に示した複数解像度情報生成モジュール110の具体的な構成例に該当し、複数解像度情報蓄積モジュール120−17は、図1に示した複数解像度情報蓄積モジュール120に該当する。
辞書文書生成モジュール410−17は、複数の種類又はサイズの画素塊の画像を含む画像を出力する。
高解像度画像読取りモジュール920−17は、辞書文書生成モジュール410−17によって出力された画像を読み取る。高解像度画像読取りモジュール920−17が読み取る解像度は、図1の例に示した低解像度文字画像照合モジュール130が受け取る文字画像128よりも高解像度である。
低解像度多位相スキャン処理モジュール1710は、高解像度画像読取りモジュール920−17によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する。ここで、画像の解像度を低くするとは、図1の例に示した低解像度文字画像照合モジュール130が受け取る文字画像128と同等の解像度にすることである。
文字切り出しモジュール930−17は、高解像度画像読取りモジュール920−17によって読み取られた画像内の画素塊の画像を切り出す。
文字切り出しモジュール430−17は、低解像度多位相スキャン処理モジュール1710によって生成された画像内の画素塊の画像を切り出す。
複数解像度情報蓄積モジュール120−17は、文字切り出しモジュール430−17によって切り出された画素塊の画像に対してその画素塊に関する情報として文字切り出しモジュール930−17によって切り出された画素塊の画像を記憶する。
より具体例として、各モジュールを説明する。
辞書文書生成モジュール410−17と高解像度画像読取りモジュール920−17、複数解像度情報蓄積モジュール120−17は接続されており、辞書文書生成モジュール410−17は、高解像度画像読取りモジュール920−17に辞書文書412−17を渡し、また、複数解像度情報蓄積モジュール120−17に文字コード/フォント情報414−17を渡す。図9の例に示す辞書文書生成モジュール410−9と同等である。
高解像度画像読取りモジュール920−17と文字切り出しモジュール930−17、低解像度多位相スキャン処理モジュール1710は接続されており、高解像度画像読取りモジュール920−17は、文字切り出しモジュール930−17、低解像度多位相スキャン処理モジュール1710に高解像度画像922−17を渡す。図9の例に示す高解像度画像読取りモジュール920と同等である。
文字切り出しモジュール930−17と複数解像度情報蓄積モジュール120−17は接続されており、文字切り出しモジュール930−17は、複数解像度情報蓄積モジュール120−17に1文字画像932−17を渡す。図9の例に示す文字切り出しモジュール930と同等である。
低解像度多位相スキャン処理モジュール1710と文字切り出しモジュール430−17、複数解像度情報蓄積モジュール120−17は接続されており、低解像度多位相スキャン処理モジュール1710は、文字切り出しモジュール430−17に低解像度画像422−17を渡し、また、複数解像度情報蓄積モジュール120−17に解像度情報1712を渡す。低解像度(例えばファックスの標準モードでは約200dpi×100dpi、スキャナでは200dpi×200dpi)で、複数の位相の異なる文字画像の生成のため複数回読取りを行った画像に相当する低解像度画像422−17を生成して文字切り出しモジュール430−17へ送出し、解像度情報1712は複数解像度情報蓄積モジュール120−17へ送出する。つまり、低解像度多位相スキャン処理モジュール1710は、図4の例に示した低解像度画像複数回読取りモジュール420のように実際にスキャナで読み取るわけではなく、スキャナの読み取りをシミュレートして低解像度の文字画像である低解像度画像422−17を生成する。より具体的な例として、高解像度画像922−17に対して既存の縮小処理、そして位相を変換する処理(例えば、移動処理等)を複数回施して、複数の低解像度画像422−17を生成する。
文字切り出しモジュール430−17と複数解像度情報蓄積モジュール120−17は接続されており、文字切り出しモジュール430−17は、複数解像度情報蓄積モジュール120−17に1文字画像432−17を渡す。図9の例に示す文字切り出しモジュール430−9と同等である。
複数解像度情報蓄積モジュール120−17は、図9の例に示す複数解像度情報蓄積モジュール120−9と同等である。つまり、複数解像度情報蓄積モジュール120−17が蓄積する複数解像度情報としては、図10の例に示す複数解像度情報テーブル1000、図11の例に示す複数解像度情報テーブル1100又は図12の例に示す複数解像度情報テーブル1200がある。
図18は、第4の具体的な実施の形態を実現するにあたっての全体の構成例(1)についてのモジュール構成図である。文字文書1800−Aを受け付けて、より高解像度の文書である文字文書1800−Bを生成する。そのために、複数解像度情報蓄積モジュール120−18は図10の例に示した複数解像度情報テーブル1000を記憶し、高解像度情報付与モジュール140−18は高解像度情報として高解像度の文字画像を付与している。図13の例に示す構成例と同等の結果を得ようとするものである。
図18に示す全体の構成例は、辞書文書生成モジュール410−18、高解像度画像読取りモジュール920−18、低解像度多位相スキャン処理モジュール1710−18、文字切り出しモジュール930−18、文字切り出しモジュール430−18、複数解像度情報蓄積モジュール120−18、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−18、高解像度情報付与モジュール140−18、高解像度ドキュメント化モジュール1330を有している。
辞書文書生成モジュール410−18と高解像度画像読取りモジュール920−18、複数解像度情報蓄積モジュール120−18は接続されており、辞書文書生成モジュール410−18は、高解像度画像読取りモジュール920−18に辞書文書412−18を渡し、また、複数解像度情報蓄積モジュール120−18に文字コード/フォント情報414−18を渡す。
高解像度画像読取りモジュール920−18と文字切り出しモジュール930−18、低解像度多位相スキャン処理モジュール1710−18は接続されており、高解像度画像読取りモジュール920−18は、文字切り出しモジュール930−18、低解像度多位相スキャン処理モジュール1710−18に高解像度画像922−18を渡す。
文字切り出しモジュール930−18と複数解像度情報蓄積モジュール120−18は接続されており、文字切り出しモジュール930−18は、複数解像度情報蓄積モジュール120−18に1文字画像932−18を渡す。
低解像度多位相スキャン処理モジュール1710−18と文字切り出しモジュール430−18、複数解像度情報蓄積モジュール120−18は接続されており、低解像度多位相スキャン処理モジュール1710−18は、文字切り出しモジュール430−18に低解像度画像422−18を渡し、また、複数解像度情報蓄積モジュール120−18に解像度情報1712−18を渡す。
文字切り出しモジュール430−18と複数解像度情報蓄積モジュール120−18は接続されており、文字切り出しモジュール430−18は、複数解像度情報蓄積モジュール120−18に1文字画像432−18を渡す。
複数解像度情報蓄積モジュール120−18と低解像度文字画像照合モジュール130−18、高解像度情報付与モジュール140−18は接続されており、複数解像度情報蓄積モジュール120−18は、低解像度文字画像照合モジュール130−18へ低解像度文字画像122−18を渡し、また、高解像度情報付与モジュール140−18へ高解像度文字画像124−18を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書1800−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−18、高解像度ドキュメント化モジュール1330は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−18へ1文字画像722を渡し、また、高解像度ドキュメント化モジュール1330へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−18と高解像度情報付与モジュール140−18は接続されており、低解像度文字画像照合モジュール130−18は、高解像度情報付与モジュール140−18へ照合ID132−18を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−18と複数解像度情報蓄積モジュール120−18、高解像度ドキュメント化モジュール1330は接続されており、高解像度情報付与モジュール140−18は、複数解像度情報蓄積モジュール120−18へ照合ID142−18を渡し、また、高解像度ドキュメント化モジュール1330へ高解像度文字画像144−18を渡す。図13の例に示した高解像度情報付与モジュール140−13と同等である。
高解像度ドキュメント化モジュール1330は、文字文書1800−Bを出力する。図13の例に示した高解像度ドキュメント化モジュール1330と同等である。
図19は、第4の具体的な実施の形態を実現するにあたっての全体の構成例(2)についてのモジュール構成図である。これは、文字文書1900−Aを受け付けて、文字コードを透明色でラスター化してレイヤー構成とした文字文書1900−B、文字文書1900−Cを生成する。そのために、辞書文書生成モジュール410−19は、文字コード/フォント情報414−19を複数解像度情報蓄積モジュール120−19へ渡し、複数解像度情報蓄積モジュール120−19は図11の例に示した複数解像度情報テーブル1100を記憶し、高解像度情報付与モジュール140−19は高解像度情報として高解像度の文字画像と文字コードを付与している。図14の例に示す構成例と同等の結果を得ようとするものである。
図19に示す全体の構成例は、辞書文書生成モジュール410−19、高解像度画像読取りモジュール920−19、低解像度多位相スキャン処理モジュール1710−19、文字切り出しモジュール930−19、文字切り出しモジュール430−19、複数解像度情報蓄積モジュール120−19、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−19、高解像度情報付与モジュール140−19、フォーマッターモジュール730を有している。
辞書文書生成モジュール410−19と高解像度画像読取りモジュール920−19、複数解像度情報蓄積モジュール120−19は接続されており、辞書文書生成モジュール410−19は、高解像度画像読取りモジュール920−19に辞書文書412−19を渡し、また、複数解像度情報蓄積モジュール120−19に文字コード/フォント情報414−19を渡す。
高解像度画像読取りモジュール920−19と文字切り出しモジュール930−19、低解像度多位相スキャン処理モジュール1710−19は接続されており、高解像度画像読取りモジュール920−19は、文字切り出しモジュール930−19、低解像度多位相スキャン処理モジュール1710−19に高解像度画像922−19を渡す。
文字切り出しモジュール930−19と複数解像度情報蓄積モジュール120−19は接続されており、文字切り出しモジュール930−19は、複数解像度情報蓄積モジュール120−19に1文字画像932−19を渡す。
低解像度多位相スキャン処理モジュール1710−19と文字切り出しモジュール430−19、複数解像度情報蓄積モジュール120−19は接続されており、低解像度多位相スキャン処理モジュール1710−19は、文字切り出しモジュール430−19に低解像度画像422−19を渡し、また、複数解像度情報蓄積モジュール120−19に解像度情報1712−19を渡す。
文字切り出しモジュール430−19と複数解像度情報蓄積モジュール120−19は接続されており、文字切り出しモジュール430−19は、複数解像度情報蓄積モジュール120−19に1文字画像432−19を渡す。
複数解像度情報蓄積モジュール120−19と低解像度文字画像照合モジュール130−19、高解像度情報付与モジュール140−19は接続されており、複数解像度情報蓄積モジュール120−19は、低解像度文字画像照合モジュール130−19へ低解像度文字画像122−19を渡し、また、高解像度情報付与モジュール140−19へ高解像度文字画像+文字コード124−19を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書1900−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−19、フォーマッターモジュール730は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−19へ1文字画像722を渡し、また、フォーマッターモジュール730へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−19と高解像度情報付与モジュール140−19は接続されており、低解像度文字画像照合モジュール130−19は、高解像度情報付与モジュール140−19へ照合ID132−19を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−19と複数解像度情報蓄積モジュール120−19、フォーマッターモジュール730は接続されており、高解像度情報付与モジュール140−19は、複数解像度情報蓄積モジュール120−19へ照合ID142−19を渡し、また、フォーマッターモジュール730へ高解像度文字画像+文字コード144−19を渡す。図14の例に示す高解像度情報付与モジュール140−14と同等である。
フォーマッターモジュール730は、文字文書1900−B、文字文書1900−Cを出力する。図14の例に示したフォーマッターモジュール730と同等である。
図20は、第4の具体的な実施の形態を実現するにあたっての全体の構成例(3)についてのモジュール構成図である。これは、文字文書2000−Aを受け付けて、文書作成装置(ワープロソフト等)によって作成される形式の電子文書である文字文書2000−Bを生成する。そのために、辞書文書生成モジュール410−20は、文字コード/フォント情報414−20を複数解像度情報蓄積モジュール120−20へ渡し、複数解像度情報蓄積モジュール120−20は図12の例に示した複数解像度情報テーブル1200(又は図6の例に示す複数解像度情報テーブル600)を記憶し、高解像度情報付与モジュール140−20は高解像度情報として文字コードとフォント情報を付与している。図15の例に示す構成例と同等の結果を得ようとするものである。
図20に示す全体の構成例は、辞書文書生成モジュール410−20、高解像度画像読取りモジュール920−20、低解像度多位相スキャン処理モジュール1710−20、文字切り出しモジュール930−20、文字切り出しモジュール430−20、複数解像度情報蓄積モジュール120−20、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−20、高解像度情報付与モジュール140−20、ドキュメント化モジュール830を有している。
辞書文書生成モジュール410−20と高解像度画像読取りモジュール920−20、複数解像度情報蓄積モジュール120−20は接続されており、辞書文書生成モジュール410−20は、高解像度画像読取りモジュール920−20に辞書文書412−20を渡し、また、複数解像度情報蓄積モジュール120−20に文字コード/フォント情報414−20を渡す。
高解像度画像読取りモジュール920−20と文字切り出しモジュール930−20、低解像度多位相スキャン処理モジュール1710−20は接続されており、高解像度画像読取りモジュール920−20は、文字切り出しモジュール930−20、低解像度多位相スキャン処理モジュール1710−20に高解像度画像922−20を渡す。
文字切り出しモジュール930−20と複数解像度情報蓄積モジュール120−20は接続されており、文字切り出しモジュール930−20は、複数解像度情報蓄積モジュール120−20に1文字画像932−20を渡す。
低解像度多位相スキャン処理モジュール1710−20と文字切り出しモジュール430−20、複数解像度情報蓄積モジュール120−20は接続されており、低解像度多位相スキャン処理モジュール1710−20は、文字切り出しモジュール430−20に低解像度画像422−20を渡し、また、複数解像度情報蓄積モジュール120−20に解像度情報1712−20を渡す。
文字切り出しモジュール430−20と複数解像度情報蓄積モジュール120−20は接続されており、文字切り出しモジュール430−20は、複数解像度情報蓄積モジュール120−20に1文字画像432−20を渡す。
複数解像度情報蓄積モジュール120−20と低解像度文字画像照合モジュール130−20、高解像度情報付与モジュール140−20は接続されており、複数解像度情報蓄積モジュール120−20は、低解像度文字画像照合モジュール130−20へ低解像度文字画像122−20を渡し、また、高解像度情報付与モジュール140−20へ文字コード+フォント情報124−20を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書2000−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−20、ドキュメント化モジュール830は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−20へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−20と高解像度情報付与モジュール140−20は接続されており、低解像度文字画像照合モジュール130−20は、高解像度情報付与モジュール140−20へ照合ID132−20を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−20と複数解像度情報蓄積モジュール120−20、ドキュメント化モジュール830は接続されており、高解像度情報付与モジュール140−20は、複数解像度情報蓄積モジュール120−20へ照合ID142−20を渡し、また、ドキュメント化モジュール830へ文字コード+フォント情報144−20を渡す。図15の例に示す高解像度情報付与モジュール140−15と同等である。
ドキュメント化モジュール830は、文字文書2000−Bを出力する。図15の例に示すドキュメント化モジュール830と同等である。
<第5の具体的な実施の形態>
図21は、第5の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。
図21に示す構成例は、ユーザ文書受付モジュール1610−21、高解像度画像読取りモジュール1620−21、低解像度多位相スキャン処理モジュール1710−21、文字認識処理モジュール2110、文字切り出しモジュール1630−21、文字切り出しモジュール430−21、複数解像度情報蓄積モジュール120−21を有している。ユーザ文書受付モジュール1610−21、高解像度画像読取りモジュール1620−21、低解像度多位相スキャン処理モジュール1710−21、文字認識処理モジュール2110、文字切り出しモジュール1630−21、文字切り出しモジュール430−21は、図1に示した複数解像度情報生成モジュール110の具体的な構成例に該当し、複数解像度情報蓄積モジュール120−21は、図1に示した複数解像度情報蓄積モジュール120に該当する。
ユーザ文書受付モジュール1610−21は、ユーザ文書1612−21を高解像度画像読取りモジュール1620−21へ渡す。
高解像度画像読取りモジュール1620−21は、画像を読み取る。
低解像度多位相スキャン処理モジュール1710−21は、高解像度画像読取りモジュール1620−21によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する。
文字認識処理モジュール2110は、高解像度画像読取りモジュール1620−21によって読み取られた画像内の画素塊の画像を認識する。また、文字認識処理モジュール2110は、高解像度画像読取りモジュール1620−21から1文字画像1632−21を受け取って認識してもよい。
高解像度画像読取りモジュール1620−21が読み取る画像は、利用者が実際に利用している文書である。
文字切り出しモジュール1630−21は、高解像度画像読取りモジュール1620−21によって読み取られた画像内の画素塊の画像を切り出す。
文字切り出しモジュール430−21は、低解像度多位相スキャン処理モジュール1710−21によって生成された画像内の画素塊の画像を切り出す。
複数解像度情報蓄積モジュール120−21は、文字切り出しモジュール430−21によって切り出された画素塊の画像に対してその画素塊に関する情報として文字切り出しモジュール1630−21によって切り出された画素塊の画像を記憶する。さらに、複数解像度情報蓄積モジュール120−21は、文字切り出しモジュール430−21によって切り出された画素塊の画像に対してその画素塊に関する情報として文字認識処理モジュール2110による認識結果を記憶するようにしてもよい。
より具体例として、各モジュールを説明する。
ユーザ文書受付モジュール1610−21と高解像度画像読取りモジュール1620−21は接続されており、ユーザ文書受付モジュール1610−21は、高解像度画像読取りモジュール1620−21へユーザ文書1612−21を渡す。図16の例に示すユーザ文書受付モジュール1610と同等である。
高解像度画像読取りモジュール1620−21と文字切り出しモジュール1630−21、低解像度多位相スキャン処理モジュール1710−21、文字認識処理モジュール2110は接続されており、高解像度画像読取りモジュール1620−21は、文字切り出しモジュール1630−21、低解像度多位相スキャン処理モジュール1710−21、文字認識処理モジュール2110へ高解像度画像1622−21を渡す。図16の例に示す高解像度画像読取りモジュール1620と同等である。
文字切り出しモジュール1630−21と複数解像度情報蓄積モジュール120−21は接続されており、文字切り出しモジュール1630−21は、複数解像度情報蓄積モジュール120−21へ1文字画像1632−21を渡す。図16の例に示す文字切り出しモジュール1630と同等である。
低解像度多位相スキャン処理モジュール1710−21と文字切り出しモジュール430−21、複数解像度情報蓄積モジュール120−21は接続されており、低解像度多位相スキャン処理モジュール1710−21は、文字切り出しモジュール430−21へ低解像度画像422−21を渡し、また、複数解像度情報蓄積モジュール120−21へ解像度情報1712−21を渡す。図17の例に示す低解像度多位相スキャン処理モジュール1710と同等である。
文字切り出しモジュール430−21と複数解像度情報蓄積モジュール120−21は接続されており、文字切り出しモジュール430−21は、複数解像度情報蓄積モジュール120−21へ1文字画像432−21を渡す。図17の例に示す文字切り出しモジュール430−17と同等である。
文字認識処理モジュール2110と複数解像度情報蓄積モジュール120−21は接続されており、文字認識処理モジュール2110は、複数解像度情報蓄積モジュール120−21へ文字コード2112を渡す。文字認識処理モジュール2110は、高解像度画像1622−21(1文字画像1632−21でもよい)を対象画像として文字認識する。文字認識の手法は既存の手法を用いる。また、文字認識処理に合わせて、前処理として解像度変換処理等を行ってもよい。また、文字認識できなかった文字は、複数解像度情報蓄積モジュール120−21へ蓄積しなくてもよい。その場合、その文字についての複数解像度情報はなくなってしまう。
複数解像度情報蓄積モジュール120−21は、1文字に対して高解像度の1文字画像1632−21と複数の低解像度の1文字画像432−21と文字コード2112をリンクさせ、複数解像度情報として生成し、蓄積する。複数解像度情報としては、図10の例に示す複数解像度情報テーブル1000、図11の例に示す複数解像度情報テーブル1100又は図12の例に示す複数解像度情報テーブル1200がある。
また、第5の具体的な実施の形態を実現するにあたっての全体の構成例は、図18、図19、図20に示すものと同等である。ただし、辞書文書生成モジュール410−18、19、20、高解像度画像読取りモジュール920−18、19、20、文字切り出しモジュール930−18、19、20、低解像度多位相スキャン処理モジュール1710−18、19、20、文字切り出しモジュール430−18、19、20、複数解像度情報蓄積モジュール120−18、19、20を、図21に示す構成に代替したものである。
<第6の具体的な実施の形態>
図22は、第6の具体的な実施の形態の構成例についての概念的なモジュール構成図である。つまり、図1に示した実施の形態の基本的な構成例の一部である複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120を具体化したものである。いままでの実施の形態は、スキャナで文字画像を読み取って複数解像度情報を生成していたが、この実施の形態では、高解像度の文字画像をラスター処理で生成して、これを用いて複数解像度情報を生成するものである。
図22に示す構成例は、辞書文書文字選択モジュール2210、フォント描画モジュール2220、低解像度多位相スキャン処理モジュール2230、複数解像度情報蓄積モジュール120−22を有している。辞書文書文字選択モジュール2210、フォント描画モジュール2220、低解像度多位相スキャン処理モジュール2230、は、図1に示した複数解像度情報生成モジュール110の具体的な構成例に該当し、複数解像度情報蓄積モジュール120−22は、図1に示した複数解像度情報蓄積モジュール120に該当する。
辞書文書文字選択モジュール2210は、利用者の操作に応じて、画素塊とその画素塊に関する情報を選択する。
フォント描画モジュール2220は、辞書文書文字選択モジュール2210によって選択された画素塊とその画素塊に関する情報に基づいて画素塊の画像を生成する。
低解像度多位相スキャン処理モジュール2230は、フォント描画モジュール2220によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する。
複数解像度情報蓄積モジュール120−22は、低解像度多位相スキャン処理モジュール2230によって処理された画素塊の画像に対してその画素塊に関する情報として辞書文書文字選択モジュール2210によって選択された画素塊に関する情報を記憶する。
より具体例として、各モジュールを説明する。
辞書文書文字選択モジュール2210とフォント描画モジュール2220、複数解像度情報蓄積モジュール120−22は接続されており、辞書文書文字選択モジュール2210は、フォント描画モジュール2220に文字コード/フォント情報2212を渡し、また、複数解像度情報蓄積モジュール120−22に文字コード/フォント情報2214を渡す。利用者の操作に応じて、複数解像度情報を生成する対象の文字画像を選択する。つまり、対象の文字(文字コード)、フォント情報(フォント種別、フォントサイズ等)を選択する。
フォント描画モジュール2220と複数解像度情報蓄積モジュール120−22、低解像度多位相スキャン処理モジュール2230は接続されており、フォント描画モジュール2220は、複数解像度情報蓄積モジュール120−22に高解像度1文字画像2222を渡す。辞書文書文字選択モジュール2210によって選択された文字コード/フォント情報2212に基づいて、高解像度に文字を描画して高解像度1文字画像2222を生成して、低解像度多位相スキャン処理モジュール2230、複数解像度情報蓄積モジュール120−22へ送出する。なお、フォント描画モジュール2220が生成する文字画像は1文字毎であるので、フォント描画モジュール2220による処理後であって複数解像度情報蓄積モジュール120−22へ渡す前に文字切り出しの処理を行う必要はない。
低解像度多位相スキャン処理モジュール2230と複数解像度情報蓄積モジュール120−22は接続されており、低解像度多位相スキャン処理モジュール2230は、複数解像度情報蓄積モジュール120−22に低解像度複数文字画像2232、解像度情報2234を渡す。図17の例に示す低解像度多位相スキャン処理モジュール1710と同等である。なお、フォント描画モジュール2220が生成する文字画像は1文字毎であるので、低解像度多位相スキャン処理モジュール2230による処理後であって複数解像度情報蓄積モジュール120−22へ渡す前に文字切り出しの処理を行う必要はない。
複数解像度情報蓄積モジュール120−22は、高解像度1文字画像2222と低解像度複数文字画像2232と文字コード/フォント情報2214をリンクさせ、複数解像度情報として生成し、蓄積する。複数解像度情報としては、図10の例に示す複数解像度情報テーブル1000、図11の例に示す複数解像度情報テーブル1100又は図12の例に示す複数解像度情報テーブル1200がある。
図23は、第6の具体的な実施の形態を実現するにあたっての全体の構成例(1)についてのモジュール構成図である。文字文書2300−Aを受け付けて、より高解像度の文書である文字文書2300−Bを生成する。そのために、複数解像度情報蓄積モジュール120−23は図10の例に示した複数解像度情報テーブル1000を記憶し、高解像度情報付与モジュール140−23は高解像度情報として高解像度の文字画像を付与している。図13の例に示す構成例と同等の結果を得ようとするものである。
図23に示す全体の構成例は、辞書文書文字選択モジュール2210−23、フォント描画モジュール2220−23、低解像度多位相スキャン処理モジュール2230−23、複数解像度情報蓄積モジュール120−23、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−23、高解像度情報付与モジュール140−23、高解像度ドキュメント化モジュール1330を有している。
辞書文書文字選択モジュール2210−23とフォント描画モジュール2220−23、複数解像度情報蓄積モジュール120−23は接続されており、辞書文書文字選択モジュール2210−23は、フォント描画モジュール2220−23に文字コード/フォント情報2212−23を渡し、また、複数解像度情報蓄積モジュール120−23に文字コード/フォント情報2214−23を渡す。
フォント描画モジュール2220−23と複数解像度情報蓄積モジュール120−23、低解像度多位相スキャン処理モジュール2230−23は接続されており、フォント描画モジュール2220−23は、複数解像度情報蓄積モジュール120−23、低解像度多位相スキャン処理モジュール2230−23に高解像度1文字画像2222−23を渡す。
低解像度多位相スキャン処理モジュール2230−23と複数解像度情報蓄積モジュール120−23は接続されており、低解像度多位相スキャン処理モジュール2230−23は、複数解像度情報蓄積モジュール120−23に低解像度複数文字画像2232−23、解像度情報2234−23を渡す。
複数解像度情報蓄積モジュール120−23と低解像度文字画像照合モジュール130−23、高解像度情報付与モジュール140−23は接続されており、複数解像度情報蓄積モジュール120−23は、低解像度文字画像照合モジュール130−23へ低解像度文字画像122−23を渡し、また、高解像度情報付与モジュール140−23へ高解像度文字画像124−23を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書2300−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−23、高解像度ドキュメント化モジュール1330は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−23へ1文字画像722を渡し、また、高解像度ドキュメント化モジュール1330へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−23と高解像度情報付与モジュール140−23は接続されており、低解像度文字画像照合モジュール130−23は、高解像度情報付与モジュール140−23へ照合ID132−23を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−23と複数解像度情報蓄積モジュール120−23、高解像度ドキュメント化モジュール1330は接続されており、高解像度情報付与モジュール140−23は、複数解像度情報蓄積モジュール120−23へ照合ID142−23を渡し、また、高解像度ドキュメント化モジュール1330へ高解像度文字画像144−23を渡す。図13の例に示した高解像度情報付与モジュール140−13と同等である。
高解像度ドキュメント化モジュール1330は、文字文書2300−Bを出力する。図13の例に示した高解像度ドキュメント化モジュール1330と同等である。
図24は、第6の具体的な実施の形態を実現するにあたっての全体の構成例(2)についてのモジュール構成図である。これは、文字文書2400−Aを受け付けて、文字コードを透明色でラスター化してレイヤー構成とした文字文書2400−B、文字文書2400−Cを生成する。そのために、辞書文書文字選択モジュール2210−24は、文字コード/フォント情報2212−24を複数解像度情報蓄積モジュール120−24へ渡し、複数解像度情報蓄積モジュール120−24は図11の例に示した複数解像度情報テーブル1100を記憶し、高解像度情報付与モジュール140−24は高解像度情報として高解像度の文字画像と文字コードを付与している。図14の例に示す構成例と同等の結果を得ようとするものである。
図24に示す全体の構成例は、辞書文書文字選択モジュール2210−24、フォント描画モジュール2220−24、低解像度多位相スキャン処理モジュール2230−24、複数解像度情報蓄積モジュール120−24、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−24、高解像度情報付与モジュール140−24、フォーマッターモジュール730を有している。
辞書文書文字選択モジュール2210−24とフォント描画モジュール2220−24、複数解像度情報蓄積モジュール120−24は接続されており、辞書文書文字選択モジュール2210−24は、フォント描画モジュール2220−24に文字コード/フォント情報2212−24を渡し、また、複数解像度情報蓄積モジュール120−24に文字コード/フォント情報2214−24を渡す。
フォント描画モジュール2220−24と複数解像度情報蓄積モジュール120−24、低解像度多位相スキャン処理モジュール2230−24は接続されており、フォント描画モジュール2220−24は、複数解像度情報蓄積モジュール120−24、低解像度多位相スキャン処理モジュール2230−24に高解像度1文字画像2222−24を渡す。
低解像度多位相スキャン処理モジュール2230−24と複数解像度情報蓄積モジュール120−24は接続されており、低解像度多位相スキャン処理モジュール2230−24は、複数解像度情報蓄積モジュール120−24に低解像度複数文字画像2232−24、解像度情報2234−24を渡す。
複数解像度情報蓄積モジュール120−24と低解像度文字画像照合モジュール130−24、高解像度情報付与モジュール140−24は接続されており、複数解像度情報蓄積モジュール120−24は、低解像度文字画像照合モジュール130−24へ低解像度文字画像122−24を渡し、また、高解像度情報付与モジュール140−24へ高解像度文字画像+文字コード124−24を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書2400−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−24、フォーマッターモジュール730は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−24へ1文字画像722を渡し、また、フォーマッターモジュール730へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−24と高解像度情報付与モジュール140−24は接続されており、低解像度文字画像照合モジュール130−24は、高解像度情報付与モジュール140−24へ照合ID132−24を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−24と複数解像度情報蓄積モジュール120−24、フォーマッターモジュール730は接続されており、高解像度情報付与モジュール140−24は、複数解像度情報蓄積モジュール120−24へ照合ID142−24を渡し、また、フォーマッターモジュール730へ高解像度文字画像+文字コード144−24を渡す。図14の例に示す高解像度情報付与モジュール140−14と同等である。
フォーマッターモジュール730は、文字文書2400−B、文字文書2400−Cを出力する。図14の例に示したフォーマッターモジュール730と同等である。
図25は、第6の具体的な実施の形態を実現するにあたっての全体の構成例(3)についてのモジュール構成図である。これは、文字文書2500−Aを受け付けて、文書作成装置(ワープロソフト等)によって作成される形式の電子文書である文字文書2500−Bを生成する。そのために、辞書文書文字選択モジュール2210−25は、文字コード/フォント情報2212−25を複数解像度情報蓄積モジュール120−25へ渡し、複数解像度情報蓄積モジュール120−25は図12の例に示した複数解像度情報テーブル1200(又は図6の例に示す複数解像度情報テーブル600)を記憶し、高解像度情報付与モジュール140−25は高解像度情報として文字コードとフォント情報を付与している。図15の例に示す構成例と同等の結果を得ようとするものである。
図25に示す全体の構成例は、辞書文書文字選択モジュール2210−25、フォント描画モジュール2220−25、低解像度多位相スキャン処理モジュール2230−25、複数解像度情報蓄積モジュール120−25、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−25、高解像度情報付与モジュール140−25、ドキュメント化モジュール830を有している。
辞書文書文字選択モジュール2210−25とフォント描画モジュール2220−25、複数解像度情報蓄積モジュール120−25は接続されており、辞書文書文字選択モジュール2210−25は、フォント描画モジュール2220−25に文字コード/フォント情報2212−25を渡し、また、複数解像度情報蓄積モジュール120−25に文字コード/フォント情報2214−25を渡す。
フォント描画モジュール2220−25と複数解像度情報蓄積モジュール120−25、低解像度多位相スキャン処理モジュール2230−25は接続されており、フォント描画モジュール2220−25は、複数解像度情報蓄積モジュール120−25、低解像度多位相スキャン処理モジュール2230−25に高解像度1文字画像2222−25を渡す。
低解像度多位相スキャン処理モジュール2230−25と複数解像度情報蓄積モジュール120−25は接続されており、低解像度多位相スキャン処理モジュール2230−25は、複数解像度情報蓄積モジュール120−25に低解像度複数文字画像2232−25、解像度情報2234−25を渡す。
複数解像度情報蓄積モジュール120−25と低解像度文字画像照合モジュール130−25、高解像度情報付与モジュール140−25は接続されており、複数解像度情報蓄積モジュール120−25は、低解像度文字画像照合モジュール130−25へ低解像度文字画像122−25を渡し、また、高解像度情報付与モジュール140−25へ文字コード+フォント情報124−25を渡す。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書2500−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−25、ドキュメント化モジュール830は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−25へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
低解像度文字画像照合モジュール130−25と高解像度情報付与モジュール140−25は接続されており、低解像度文字画像照合モジュール130−25は、高解像度情報付与モジュール140−25へ照合ID132−25を渡す。図7の例に示した低解像度文字画像照合モジュール130−7と同等である。
高解像度情報付与モジュール140−25と複数解像度情報蓄積モジュール120−25、ドキュメント化モジュール830は接続されており、高解像度情報付与モジュール140−25は、複数解像度情報蓄積モジュール120−25へ照合ID142−25を渡し、また、ドキュメント化モジュール830へ文字コード+フォント情報144−25を渡す。図15の例に示す高解像度情報付与モジュール140−15と同等である。
ドキュメント化モジュール830は、文字文書2500−Bを出力する。図15の例に示すドキュメント化モジュール830と同等である。
図26は、第6の具体的な実施の形態を実現するにあたっての全体の構成例(4)についてのモジュール構成図である。これは、文字文書2600−Aを受け付けて、文書作成装置(ワープロソフト等)によって作成される形式の電子文書である文字文書2600−Bを生成する。そのために、高解像度情報付与モジュール140−26は高解像度情報として文字コードとフォント情報を付与している。図15の例に示す構成例と同等の結果を得ようとするものである。
図26に示す全体の構成例は、フォント情報決定モジュール2610、文字認識処理モジュール2620、フォント描画モジュール2630、低解像度多位相スキャン処理モジュール2640、照合制御モジュール2690、画像読取りモジュール710、文字切り出しモジュール720、低解像度文字画像照合モジュール130−26、高解像度情報付与モジュール140−26、ドキュメント化モジュール830を有している。
画像読取りモジュール710は、画像を読み取る。
文字切り出しモジュール720は、画像読取りモジュール710によって読み取られた画像内の画素塊の画像を切り出す。
フォント情報決定モジュール2610は、文字切り出しモジュール720によって切り出された画素塊の画像に関する情報を決定する。
文字認識処理モジュール2620は、文字切り出しモジュール720によって切り出された画素塊の画像を認識する。
フォント描画モジュール2630は、文字認識処理モジュール2620による認識結果とフォント情報決定モジュール2610によって決定された画素塊の画像に関する情報に基づいて、画素塊の画像を生成する。フォント描画モジュール2630は、文字切り出しモジュール720によって切り出された画素塊の画像よりも高解像度の画素塊の画像を生成するようにしてもよい。
低解像度多位相スキャン処理モジュール2640は、フォント描画モジュール2630によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する。
照合制御モジュール2690は、低解像度文字画像照合モジュール130−26の照合結果に基づいてフォント情報決定モジュール2610、文字認識処理モジュール2620、フォント描画モジュール2630、低解像度多位相スキャン処理モジュール2640を制御して再度処理を行わせる。
低解像度文字画像照合モジュール130−26は、文字切り出しモジュール720によって切り出された画素塊の画像と低解像度多位相スキャン処理モジュール2640によって生成された画素塊の画像を照合する。
高解像度情報付与モジュール140−26は、低解像度文字画像照合モジュール130−26による照合結果に基づいて、フォント情報決定モジュール2610によって決定された画素塊の画像に関する情報と文字認識処理モジュール2620による認識結果を文字切り出しモジュール720によって切り出された画素塊に付与する。
ドキュメント化モジュール830は、高解像度情報付与モジュール140−26によって付与された画素塊の画像に関する情報と認識結果に基づいて文書情報を生成する。
画像読取りモジュール710と文字切り出しモジュール720は接続されており、画像読取りモジュール710は、文字文書2600−Aを読み取り、文字切り出しモジュール720へ文字画像712を渡す。
文字切り出しモジュール720と低解像度文字画像照合モジュール130−26、ドキュメント化モジュール830、フォント情報決定モジュール2610、文字認識処理モジュール2620は接続されており、文字切り出しモジュール720は、低解像度文字画像照合モジュール130−26、フォント情報決定モジュール2610、文字認識処理モジュール2620へ1文字画像722を渡し、また、ドキュメント化モジュール830へ1文字画像722、文字位置座標724を渡す。図7の例に示した文字切り出しモジュール720と同等である。
フォント情報決定モジュール2610とフォント描画モジュール2630、高解像度情報付与モジュール140−26は接続されており、フォント情報決定モジュール2610は、フォント描画モジュール2630、高解像度情報付与モジュール140−26へフォント情報2612を渡す。文字切り出しモジュール720から渡された1文字画像722のフォントサイズとフォント種別を認識して決定し、フォント情報2612としてフォント描画モジュール2630、高解像度情報付与モジュール140−26へ送出する。フォントサイズとフォント種別の認識は、既存の手法を用いる。
文字認識処理モジュール2620とフォント描画モジュール2630、高解像度情報付与モジュール140−26は接続されており、文字認識処理モジュール2620は、文字切り出しモジュール720から渡された1文字画像722を認識して、フォント描画モジュール2630、高解像度情報付与モジュール140−26へ認識結果の文字コード2622を渡す。図16の例に示した文字認識処理モジュール1660と同等である。
フォント描画モジュール2630と低解像度多位相スキャン処理モジュール2640は接続されており、フォント描画モジュール2630は、フォント情報決定モジュール2610からのフォント情報2612と文字認識処理モジュール2620からの文字コード2622を受け取って文字を描画して、その文字画像を低解像度多位相スキャン処理モジュール2640へ渡す。図22の例に示したフォント描画モジュール2220と同等である。
低解像度多位相スキャン処理モジュール2640と低解像度文字画像照合モジュール130−26は接続されており、低解像度多位相スキャン処理モジュール2640は、低解像度文字画像照合モジュール130−26に低解像度文字画像2642を渡す。図22の例に示した低解像度多位相スキャン処理モジュール2230と同等である。
低解像度文字画像照合モジュール130−26と高解像度情報付与モジュール140−26は接続されており、低解像度文字画像照合モジュール130−26は、高解像度情報付与モジュール140−26へ照合結果132−26を渡す。文字切り出しモジュール720からの1文字画像722と低解像度多位相スキャン処理モジュール2640からの低解像度文字画像2642の照合を行い、一致した場合はその一致した旨の照合結果を高解像度情報付与モジュール140−26へ送出する。一致しない場合はその旨の照合結果を照合制御モジュール2690へ通知する。
照合制御モジュール2690は、制御信号2699Aを用いて、フォント情報決定モジュール2610、文字認識処理モジュール2620、フォント描画モジュール2630、低解像度多位相スキャン処理モジュール2640、低解像度文字画像照合モジュール130−26を制御する。フォント情報決定モジュール2610、文字認識処理モジュール2620、フォント描画モジュール2630、低解像度多位相スキャン処理モジュール2640に制御信号2699Aを送出し、それぞれのパラメータを変更して再度処理を行わせ、その後に再度低解像度文字画像照合モジュール130−26に照合を行わせる。パラメータを変更とは、例えば、フォント情報決定モジュール2610、文字認識処理モジュール2620における認識用辞書の変更等がある。これら処理を一致した旨の照合結果を得るまで繰り返す。又は、予め定められた回数の繰り返しが行われた場合は、照合できなかった旨を照合結果132−26として、低解像度文字画像照合モジュール130−26が高解像度情報付与モジュール140−26へ渡す。
高解像度情報付与モジュール140−26とドキュメント化モジュール830は接続されており、高解像度情報付与モジュール140−26は、ドキュメント化モジュール830へ文字コード+フォント情報144−26を渡す。低解像度文字画像照合モジュール130−26から受け取った照合結果132−26が一致していることを示している場合は、フォント情報決定モジュール2610からのフォント情報2612、文字認識処理モジュール2620からの文字コード2622を文字切り出しモジュール720によって切り出された対応する1文字画像722に付与する。照合結果132−26が照合できなかったことを示している場合は、文字切り出しモジュール720によって切り出された1文字画像722と文字位置座標724をそのまま用いて文字文書2600−Bを生成する旨を示す符号をドキュメント化モジュール830へ渡す。
ドキュメント化モジュール830は、文字文書2600−Bを出力する。図25の例に示すドキュメント化モジュール830と同等である。
<ファックスとしての実現例1>
図27は、第1、2、4、6の具体的な実施の形態をファックスとして実現した場合の処理例を示す説明図である。
図27(a)は、準備段階の処理、つまり複数解像度情報生成と蓄積の処理例を示すものである。ファックス2700−Aは、ファックス2700−Bに対して、予め辞書文書2710を送信しておき、受信側のファックス2700−Bでは送信されてきた辞書文書2710に基づいて複数解像度情報を生成して複数解像度情報蓄積モジュール120内に蓄積する。ただし、本準備過程は先に実行しておき、製品であるファックス2700−Bに組み込んでおいてもよい。例えば、送信側と受信側で同じ会社製のファックスを使い、ユーザが送ろうとする辞書文書2710が同じ会社製のプリンター製品で、かつプリンタフォントを使って印刷した場合は、受信側では既知のフォントのみが対象となるので有効である。
図27(b)は、通常処理、つまり文書を受信してそれを高解像度の文書に変換する処理である。ユーザはファックス2700−Cを用いてユーザ文書2720を送信すると、受信側のファックス2700−Bで劣化したファックス文書2730に高解像度情報が付与された文書として出力される。付与する高解像度情報に応じて出力文書の形態は異なる。例えば、図27(c1)はPDFの形態で文字検索が可能となることを示しており、図27(c2)は電子文書やPDFなどの形態で文字コード化されたことを示しており、図27(c3)は高解像度な文字画像と置き換えられたことを示している。
<ファックスとしての実現例2>
図28は、第3、5の具体的な実施の形態をファックスとして実現した場合の処理例を示す説明図である。
図28(a)は、準備段階の処理、つまり複数解像度情報生成と蓄積の処理例を示すものである。ファックス2800−Aは、ファックス2800−Bに対して、予めユーザ文書2810(例えば、利用者が既に使用している文書)を送信しておき、受信側のファックス2800−Bでは送信されてきたユーザ文書2810に基づいて複数解像度情報を生成して複数解像度情報蓄積モジュール120内に蓄積する。特に、帳票系文書に用いられている特殊なフォントで印刷されている場合など、別途辞書文書を生成できない場合は、予めユーザ文書を高解像度でスキャンして受信側のファックス2800−Bに送信しておき、受信側のファックス2800−Bで複数解像度情報を生成し、蓄積しておく。これによって、ユーザ文書が多ければ多いほど、通常処理で高解像度情報が付与される文字が増えることになる。
図28(b)は、通常処理、つまり文書を受信してそれを高解像度の文書に変換する処理である。ユーザはファックス2800−Cを用いてユーザ文書2820を送信すると、受信側のファックス2800−Bで劣化したファックス文書2830に高解像度情報が付与された文書として出力される。付与する高解像度情報に応じて出力文書の形態は異なる。図28(c1)、(c2)、(c3)は図27(c1)、(c2)、(c3)と同等である。
<スキャナとしての実現例1>
図29は、第1、2、4、6の具体的な実施の形態をスキャナとして実現した場合の処理例を示す説明図である。
図29(a)は、準備段階の処理、つまり複数解像度情報生成と蓄積の処理例を示すものである。ファックス2900は、予め辞書文書2910を低い解像度で複数回読み取り、より高い解像度で1回読み取り、複数解像度情報を生成して複数解像度情報蓄積モジュール120内に蓄積する。ただし、本準備過程は先に実行しておき、製品であるファックス2900に組み込んでおいてもよいことは前述と同じである。
図29(b)は、通常処理、つまり文書を受信してそれを高解像度の文書に変換する処理である。ユーザはファックス2900を用いてユーザ文書2920を読み込ませる。ファックス2900では、劣化しているユーザ文書2920に高解像度情報を付与した文書として出力する。付与する高解像度情報に応じて出力文書の形態は異なる。図29(c1)、(c2)、(c3)は図27(c1)、(c2)、(c3)と同等である。
<スキャナとしての実現例2>
図30は、第3、5の具体的な実施の形態をスキャナとして実現した場合の処理例を示す説明図である。
図30(a)は、準備段階の処理、つまり複数解像度情報生成と蓄積の処理例を示すものである。ファックス3000は、予めユーザ文書3010(例えば、利用者が既に使用している文書)を低い解像度で複数回読み取り、より高い解像度で1回読み取り、複数解像度情報を生成して複数解像度情報蓄積モジュール120内に蓄積する。特に、帳票系文書に用いられている特殊なフォントで印刷されている場合など、別途辞書文書を生成できない場合は、予めユーザ文書を高解像度でスキャンしてファックス3000で複数解像度情報を生成し、蓄積しておく。これによって、ユーザ文書が多ければ多いほど、通常処理で高解像度情報が付与される文字が増えることになる。
図30(b)は、通常処理、つまり文書を受信してそれを高解像度の文書に変換する処理である。ユーザはファックス3000を用いてユーザ文書3020を読み込ませる。ファックス3000では、劣化しているユーザ文書3020に高解像度情報を付与した文書として出力する。付与する高解像度情報に応じて出力文書の形態は異なる。図30(c1)、(c2)、(c3)は図27(c1)、(c2)、(c3)と同等である。
図31を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図31に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部3117と、プリンタなどのデータ出力部3118を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)3101は、前述の実施の形態において説明した各種のモジュール、すなわち、複数解像度情報生成モジュール110、複数解像度情報蓄積モジュール120、低解像度文字画像照合モジュール130、文字切り出しモジュール720、フォーマッターモジュール730等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)3102は、CPU3101が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)3103は、CPU3101の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス3104により相互に接続されている。
ホストバス3104は、ブリッジ3105を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス3106に接続されている。
キーボード3108、マウス等のポインティングデバイス3109は、操作者により操作される入力デバイスである。ディスプレイ3110は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)3111は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU3101によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けた画像や複数解像度情報などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ3112は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体3113に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース3107、外部バス3106、ブリッジ3105、及びホストバス3104を介して接続されているRAM3103に供給する。リムーバブル記録媒体3113も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート3114は、外部接続機器3115を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート3114は、インタフェース3107、及び外部バス3106、ブリッジ3105、ホストバス3104等を介してCPU3101等に接続されている。通信部3116は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部3117は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部3118は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図31に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図31に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図31に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
なお、前述の各種の実施の形態又はモジュールを組み合わせてもよく、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…複数解像度情報生成モジュール
120…複数解像度情報蓄積モジュール
130…低解像度文字画像照合モジュール
140…高解像度情報付与モジュール
410…辞書文書生成モジュール
420…低解像度画像複数回読取りモジュール
430…文字切り出しモジュール
730…フォーマッターモジュール
830…ドキュメント化モジュール
920…高解像度画像読取りモジュール
930…文字切り出しモジュール
1330…高解像度ドキュメント化モジュール
1610…ユーザ文書受付モジュール
1620…高解像度画像読取りモジュール
1630…文字切り出しモジュール
1640…低解像度画像複数回読取りモジュール
1650…文字切り出しモジュール
1660…文字認識処理モジュール
1710…低解像度多位相スキャン処理モジュール
2110…文字認識処理モジュール
2210…辞書文書文字選択モジュール
2220…フォント描画モジュール
2230…低解像度多位相スキャン処理モジュール
2610…フォント情報決定モジュール
2620…文字認識処理モジュール
2630…フォント描画モジュール
2640…低解像度多位相スキャン処理モジュール
2690…照合制御モジュール

Claims (12)

  1. 複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成する情報生成手段と、
    前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶する記憶手段と、
    受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合する照合手段と、
    前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する情報付与手段
    を具備することを特徴とする画像処理装置。
  2. 前記情報生成手段は、
    複数の種類又はサイズの画素塊の画像を含む画像を出力する出力手段と、
    前記出力手段によって出力された画像を複数回読み取る読取り手段と、
    前記読取り手段によって読み取られた画像内の画素塊の画像を切り出す切り出し手段
    を有し、
    前記記憶手段は、前記切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報を記憶する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記情報生成手段は、
    複数の種類又はサイズの画素塊の画像を含む画像を出力する出力手段と、
    前記出力手段によって出力された画像を読み取る第1の読取り手段と、
    前記出力手段によって出力された画像を複数回、前記第1の読取り手段よりも低い解像度で読み取る第2の読取り手段と、
    前記第1の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、
    前記第2の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第2の切り出し手段
    を有し、
    前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶する
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 前記情報生成手段は、
    画像を読み取る第1の読取り手段と、
    前記画像を複数回、前記第1の読取り手段よりも低い解像度で読み取る第2の読取り手段と、
    前記第1の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、
    前記第2の読取り手段によって読み取られた画像内の画素塊の画像を切り出す第2の切り出し手段
    を有し、
    前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶する
    ことを特徴とする請求項1に記載の画像処理装置。
  5. 前記情報生成手段は、
    複数の種類又はサイズの画素塊の画像を含む画像を出力する出力手段と、
    前記出力手段によって出力された画像を読み取る読取り手段と、
    前記読取り手段によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、
    前記読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、
    前記低解像度位相処理手段によって生成された画像内の画素塊の画像を切り出す第2の切り出し手段
    を有し、
    前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶する
    ことを特徴とする請求項1に記載の画像処理装置。
  6. 前記情報生成手段は、
    画像を読み取る読取り手段と、
    前記読取り手段によって読み取られた画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、
    前記読取り手段によって読み取られた画像内の画素塊の画像を切り出す第1の切り出し手段と、
    前記低解像度位相処理手段によって生成された画像内の画素塊の画像を切り出す第2の切り出し手段
    を有し、
    前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記第1の切り出し手段によって切り出された画素塊の画像を記憶する
    ことを特徴とする請求項1に記載の画像処理装置。
  7. 前記情報生成手段は、
    前記画像内の画素塊の画像を認識する認識手段
    をさらに有し、
    前記記憶手段は、前記第2の切り出し手段によって切り出された画素塊の画像に対して該画素塊に関する情報として前記認識手段による認識結果を記憶する
    ことを特徴とする請求項4又は6に記載の画像処理装置。
  8. 前記情報生成手段は、
    利用者の操作に応じて、画素塊と該画素塊に関する情報を選択する選択手段と、
    前記選択手段によって選択された画素塊と該画素塊に関する情報に基づいて画素塊の画像を生成する画像生成手段と、
    前記画像生成手段によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段
    を有し、
    前記記憶手段は、前記低解像度位相処理手段によって処理された画素塊の画像に対して該画素塊に関する情報として前記選択手段によって選択された前記画素塊に関する情報を記憶する
    ことを特徴とする請求項1に記載の画像処理装置。
  9. 受け付けた画像内の画素塊の画像を切り出す切り出し手段と、
    前記切り出し手段によって切り出された画素塊の画像に関する情報を決定する情報決定手段と、
    前記切り出し手段によって切り出された画素塊の画像を認識する認識手段と、
    前記認識手段による認識結果と前記情報決定手段によって決定された画素塊の画像に関する情報に基づいて、画素塊の画像を生成する画像生成手段と、
    前記画像生成手段によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、
    前記切り出し手段によって切り出された画素塊の画像と前記低解像度位相処理手段によって生成された画素塊の画像を照合する照合手段と、
    前記照合手段による照合結果に基づいて、前記情報決定手段によって決定された画素塊の画像に関する情報と前記認識手段による認識結果を前記切り出し手段によって切り出された画素塊に付与する情報付与手段
    を具備することを特徴とする画像処理装置。
  10. 前記画素塊とは文字であり、前記画素塊に関する情報として文字コード、フォント種別、サイズを含む
    ことを特徴とする請求項1から9のいずれか一項に記載の画像処理装置。
  11. コンピュータを、
    複数の画素塊の画像と該画素塊の画像よりも高解像度である該画素塊に関する情報を生成する情報生成手段と、
    前記情報生成手段によって生成された画素塊の画像と該画素塊に関する情報を記憶する記憶手段と、
    受け付けた画像内の画素塊の画像と前記記憶手段によって記憶されている画素塊の画像を照合する照合手段と、
    前記照合手段による照合結果に基づいて、前記記憶手段から画素塊に関する情報を抽出して、該画素塊に関する情報を前記受け付けた画像内の画素塊の画像に付与する情報付与手段
    として機能させることを特徴とする画像処理プログラム。
  12. コンピュータを、
    受け付けた画像内の画素塊の画像を切り出す切り出し手段と、
    前記切り出し手段によって切り出された画素塊の画像に関する情報を決定する情報決定手段と、
    前記切り出し手段によって切り出された画素塊の画像を認識する認識手段と、
    前記認識手段による認識結果と前記情報決定手段によって決定された画素塊の画像に関する情報に基づいて、画素塊の画像を生成する画像生成手段と、
    前記画像生成手段によって生成された画素塊の画像の解像度を低くし、異なる位相の画像を生成する低解像度位相処理手段と、
    前記切り出し手段によって切り出された画素塊の画像と前記低解像度位相処理手段によって生成された画素塊の画像を照合する照合手段と、
    前記照合手段による照合結果に基づいて、前記情報決定手段によって決定された画素塊の画像に関する情報と前記認識手段による認識結果を前記切り出し手段によって切り出された画素塊に付与する情報付与手段
    として機能させることを特徴とする画像処理プログラム。
JP2009119215A 2009-05-15 2009-05-15 画像処理装置及び画像処理プログラム Expired - Fee Related JP5526596B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009119215A JP5526596B2 (ja) 2009-05-15 2009-05-15 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009119215A JP5526596B2 (ja) 2009-05-15 2009-05-15 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2010267155A true JP2010267155A (ja) 2010-11-25
JP5526596B2 JP5526596B2 (ja) 2014-06-18

Family

ID=43364058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009119215A Expired - Fee Related JP5526596B2 (ja) 2009-05-15 2009-05-15 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP5526596B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03214287A (ja) * 1990-01-19 1991-09-19 Sony Corp 文字認識装置
JPH03217993A (ja) * 1990-01-23 1991-09-25 Omron Corp 文字サイズ認識装置
JPH10240869A (ja) * 1997-03-03 1998-09-11 Nippon Steel Corp 文字認識辞書作成装置及び文字認識辞書作成方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03214287A (ja) * 1990-01-19 1991-09-19 Sony Corp 文字認識装置
JPH03217993A (ja) * 1990-01-23 1991-09-25 Omron Corp 文字サイズ認識装置
JPH10240869A (ja) * 1997-03-03 1998-09-11 Nippon Steel Corp 文字認識辞書作成装置及び文字認識辞書作成方法

Also Published As

Publication number Publication date
JP5526596B2 (ja) 2014-06-18

Similar Documents

Publication Publication Date Title
US8411955B2 (en) Image processing apparatus, image processing method and computer-readable medium
US7391917B2 (en) Image processing method
JP4600491B2 (ja) 画像処理装置及び画像処理プログラム
US7623712B2 (en) Image processing method and apparatus
US8339619B2 (en) System and image processing method and apparatus for re-using and re-editing images
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
JP5357612B2 (ja) 下線除去装置
US7640269B2 (en) Image processing system and image processing method
US8391607B2 (en) Image processor and computer readable medium
US20130308862A1 (en) Image processing apparatus, image processing method, and computer readable medium
JP5365440B2 (ja) 画像処理装置及び画像処理プログラム
JP2006023944A (ja) 画像処理システム及び画像処理方法
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
JP5526596B2 (ja) 画像処理装置及び画像処理プログラム
JP5111242B2 (ja) 画像処理装置及び方法
US20110033114A1 (en) Image processing apparatus and computer readable medium
JP6131765B2 (ja) 情報処理装置及び情報処理プログラム
JP5673277B2 (ja) 画像処理装置およびプログラム
JP5262778B2 (ja) 画像処理装置及び画像処理プログラム
JP4930288B2 (ja) 画像処理装置及び画像処理プログラム
JP6676955B2 (ja) 画像処理装置及び画像処理プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP4872780B2 (ja) 画像処理システム及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120418

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140331

R150 Certificate of patent or registration of utility model

Ref document number: 5526596

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees