JP4140221B2 - 画像照合装置および画像照合プログラム - Google Patents
画像照合装置および画像照合プログラム Download PDFInfo
- Publication number
- JP4140221B2 JP4140221B2 JP2001284095A JP2001284095A JP4140221B2 JP 4140221 B2 JP4140221 B2 JP 4140221B2 JP 2001284095 A JP2001284095 A JP 2001284095A JP 2001284095 A JP2001284095 A JP 2001284095A JP 4140221 B2 JP4140221 B2 JP 4140221B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- similarity
- accumulated value
- parameter
- estimated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 93
- 230000009466 transformation Effects 0.000 claims description 56
- 238000012545 processing Methods 0.000 claims description 47
- 238000006243 chemical reaction Methods 0.000 claims description 46
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000013519 translation Methods 0.000 claims description 13
- 238000009825 accumulation Methods 0.000 claims description 8
- 230000005484 gravity Effects 0.000 claims description 8
- 238000012937 correction Methods 0.000 description 55
- 238000010586 diagram Methods 0.000 description 15
- 230000001186 cumulative effect Effects 0.000 description 12
- 238000001514 detection method Methods 0.000 description 11
- 230000000875 corresponding effect Effects 0.000 description 10
- 238000007726 management method Methods 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 238000007476 Maximum Likelihood Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000005266 casting Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、画像データ同士を照合する画像照合装置に関する。
【0002】
【従来の技術】
近年、記憶装置が大容量化し、ネットワークが高速化してきており、これに伴って、文書データや画像データをデータベースに登録して複数の利用者で共有する、文書管理システムが普及しつつある。このような文書管理システムを用いると、他の利用者が作成した文書データや画像データを別の利用者が閲覧、流用することができる。
【0003】
文書管理システムの効率的な運用のためには、蓄積されている大量のデータの中から閲覧や流用の対象となる文書データ等が迅速に見つけ出せるよう、検索機能の充実が望まれている。そこで従来の文書管理システムでは、文書データや画像データをデータベースに登録する際に、登録者やデータベースの管理者が検索のためにキーワードや所定の分類コードを関連づけて登録するなど、検索に配慮した登録を行う必要があって管理者等の負担が大きくなる。
【0004】
また、すでに膨大な文書データ等が蓄積されているような場合、またはデータベースシステムの交換などデータの再登録作業を要する場合、改めて全文書データや画像データに対してキーワード等を入力するのは現実的でない。
【0005】
文書データならば、データベースへの登録処理を自動化するために、システムが文書データからキーワードを抽出する技術や、いわゆる全文検索技術などがある。しかし、紙文書をスキャナ等で読み込んだ文書画像データにはこれらの技術をそのまま適用することはできない。このような画像データに対しては、いわゆるOCR(Optical Character Recognition)技術を利用して画像データ内に含まれているテキスト部分をテキストデータ化し、このテキストデータに対して上記の全文検索等の処理を行なうことになる。
【0006】
【発明が解決しようとする課題】
しかしながら、上記従来の文書管理システムのように、画像データをOCRにて読み込む場合、紙文書に書き込みや押印などのノイズがあったり、文書のレイアウトが複雑である場合は文字認識精度が大幅に低下し、全文検索等の用途に供するには実用的でない。
【0007】
具体的に通常の企業活動では、社内で回覧されてきた紙文書内の記述(例えばグラフなど)を流用して新たな書類を作成したいというような場合がある。この場合、回覧中になされた手書きの書き込みや押印がなければスキャナにより流用したい部分をデータ化して取り込むことも容易であるが、通常これらが存在するために、取り込みが困難になっていることも多い。そこで文書管理システムのデータベースから原本の画像データを取り出したい、という要望が生まれるのであるが、上記従来の文書管理システムでは、全文検索技術等を利用しているので、テキストデータの存在が前提であるうえ、テキストデータがあっても原本が画像データであるときには、レイアウトが複雑であったりすると(グラフなどではレイアウトは極めて複雑になる)、上述のようにOCRの精度が落ち、テキストデータが正しく取り出されず、その結果、検索用のテキストデータが誤ったものとなり、全文検索の際に見落とされてしまうのである。
【0008】
そこで、画像データ同士の比較により、所望の画像データの検索を行う技術(類似画像検索技術)が、例えば「コンピュータ画像処理:応用実践編3,総研出版,pp.187-227,1992」で紹介されている。しかし、この技術は自然画のように自由度の大きい画像データには適しているが、構造的に非常に類似した文書を識別するのは難しく、逆に識別能を高めると文書上の書き込みや押印等のノイズに対する耐性が大きく損なわれることが知られている。
【0009】
また、特開2000-112995号公報には、罫線や線画などの情報のみを用いて画像データの照合を行う技術が開示されている。しかしこの技術ではテキストのみから構成されている文書の照合を行なうことができない。さらに特開平7-282088号公報には、単語長のパターンを照合してテキストを含んだ画像データ同士を照合する技術が開示されている。この技術は単語間が分離しているような言語、例えば英語には適しているが、単語間が必ずしも分離していない日本語にはOCRを用いる必要があり、結局テキストデータを正しく抽出できないような場合には適用できない。
【0010】
本発明は上記実情に鑑みて為されたもので、書き込みや押印等のノイズがあっても安定した結果を得ることができ、OCR等テキストデータを抽出する必要がなく、テキストのみからなる文書データ同士をも照合することのできる画像照合装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
上記従来例の問題点を解決するための本発明は、画像照合装置であって、処理対象となった画像データに対し、複数の所定経路の各々について、経路上の画素値を累算する演算手段と、前記各経路上の画素値を累算した結果を経路の演算順に含んでなる累算値系列を用い、複数の画像データ間の照合処理を行う手段と、を含むことを特徴としている。
【0012】
ここで前記経路は、互いに直交する2つの軸方向のそれぞれに沿って複数配列され、各軸方向ごとに累算値系列が演算され、前記照合処理を行う手段が、各軸方向ごとの累算値系列の比較により照合の処理を行うことも好ましい。さらに、前記照合処理を行う手段が、照合の対象となった各画像データについての累算値系列間の相似性に基づき、照合を行うこととするのも好ましい。
【0013】
また、上記従来例の問題点を解決するための本発明は、前記相似性を検出するために、照合の対象となった各画像データについて、それぞれの累算値系列内での累算値の変化が特徴的となる系列上の位置を表す、系列位置情報を生成し、当該各累算値系列に対する系列位置情報を比較して、少なくとも平行移動量を含んでなる相似変換パラメータを演算し、当該相似変換パラメータを用いて、各累算値系列の相似性を検出することを特徴としている。ここで、相似変換パラメータには、さらに一次変換パラメータを含む。すなわち、相似変換パラメータは、アフィン変換の際に用いられる一次変換係数及び平行移動の量である。また、前記累算値の変化が特徴的となる系列位置情報は、累算値のピーク位置のリストであることが好ましい。
【0014】
さらに、前記相似変換パラメータを決定するために、照合の対象となった各画像データのうち、相異なる画像データについてのピーク位置のリストを参照し、各ピーク位置同士の組み合わせについて相似変換パラメータを推定し、前記組み合わせごとに推定された相似変換パラメータを含んでなる推定相似変換パラメータ群を生成し、当該推定相似変換パラメータ群に含まれる各推定相似変換パラメータに基づき、尤度の高いパラメータとして前記相似変換パラメータを決定することが好ましい。
【0015】
すなわち本発明による画像照合装置では、原本である画像データを検索するために、検索対象となる画像を入力し、該入力した画像の水平・垂直方向の少なくとも一方への投影波形を形成し、該水平または垂直方向の投影波形から特徴量を抽出し、前記入力した画像の投影波形、もしくは照合対象となる基準画像(原本の候補となる画像データ群)の投影波形の少なくとも一方に対して、相似変換処理を行なった変換投影波形を生成し、入力した画像の投影波形から抽出された前記特徴量と、前記基準画像の投影波形から抽出された特徴量との対応関係から、前記投影変換手段で適用する変換パラメータを求め、前記入力した画像の投影波形またはその変換投影波形と、前記基準画像の投影波形またはその変換投影波形との類似度を測定する。
【0016】
具体的に上記抽出される特徴量は、投影波形の局所的ピークであり、該投影波形において検出された全ての局所的ピークの中から、所定の条件を満たすピークの位置のみを選別してピークリスト(系列位置情報)として取り出したものである。
【0017】
さらに変換パラメータを得るための処理は次のようになる。すなわち、前記入力画像のピークリストにおける局所的ピーク位置と、照合対象となる基準画像のピークリストにおける局所的ピーク位置との対応付けを全てのピーク位置の組み合わせについて行ない、最も尤度の高いパラメータを決定するために、(スケーリング補正量)−(平行移動量)平面において該直線上への投票処理を行ない、該投票処理によって前記(スケーリング補正量)−(平行移動量)平面上に形成された投票値のピーク座標を検出し、該ピーク座標に対応するスケーリング補正量及び平行移動量を見いだす。これは、上記の対応付けにおいて対応付けられた2つのピーク位置を一致させるために必要なスケーリング補正量と平行移動量が直線関係を為すことに基づく。
【0018】
これにより、画像上の所定経路に対する投影波形を形成し、比較に係る各画像データの投影波形を利用して照合するので、文書への押印、書き込み等があっても、大域的な投影波形の変化状態(波形そのものや微分波形間の相関係数)は一致したままとなり、かかるノイズ成分が類似度測定に与える影響は限定的となる。また、所定経路を水平・垂直方向への各経路とすることで、特に水平・垂直成分を多く含む文書画像に対して高い照合能力を発揮する。
【0019】
また入力画像の投影波形とデータベース内画像の投影波形との照合に先立って、両波形が最も良く一致するようにアフィン変換による投影波形の相似変換処理を行なうため、入力画像の拡大率の違いや位置ずれを許容することができる。ここで相似変換のためのパラメータ(相似変換パラメータ)は、投票処理、換言すれば多数決原理に基づいて尤度の高いものが求められるため、局所的ピークの検出時に少数の誤検出や検出漏れがあっても補正量は正当なものを求めることができる。
そして、本発明に係る装置は、処理対象となった画像データ及び前記照合の対象となった各画像データについて、それぞれ前記累算値系列の重心位置を計算する手段、を更に備え、前記照合処理を行う手段は、前記処理対象となった画像データの累算値系列の重心位置と、前記照合の対象となった画像データの累算値系列の重心位置と、に基づき、前記相似変換パラメータ中の前記平行移動量の推定存在範囲を限定し、前記推定相似変換パラメータ群から前記平行移動量の推定存在範囲のなかで前記尤度の高いパラメータを前記相似変換パラメータとして決定する。
【0020】
また、参考例の画像照合方法は、処理対象となった画像データに対し、複数の所定経路の各々について、経路上の画素値を累算する工程と、前記各経路上の画素値を累算した結果を経路の演算順に含んでなる累算値系列を用い、複数の画像データ間の照合処理を行う工程と、を含むことを特徴としている。
【0021】
さらに、上記従来例の問題点を解決するための本発明は、画像照合プログラムであって、処理対象となった画像データに対し、複数の所定経路の各々について、経路上の画素値を累算する工程と、前記各経路上の画素値を累算した結果を経路の演算順に含んでなる累算値系列を用い、複数の画像データ間の照合処理を行う工程と、をコンピュータに実行させることを特徴としている。
【0022】
【発明の実施の形態】
本発明の実施の形態について図面を参照しながら説明する。まず、本発明の実施の形態に係る画像照合装置がいかなる原理に基づき画像データ間の照合を行うかについて概括的に説明する。
【0023】
本実施の形態の画像照合装置は、いわば画像データ自体をキーとして、類似する画像データをデータベースから検索するもので、キーとなる画像データは、スキャナ等の画像入力手段によって読み取られ、ラスタ画像データに変換される。そして、このラスタ画像データに対し、水平方向又は垂直方向の少なくとも一方に対する投影波形を形成する。例えば読み込まれる文書が縦書きであるか横書きであるかが予めわかっており、当該方向の投影波形のみで十分個々の文書の特徴を表すことができることがわかっている場合は、一方向のみへの投影を形成するだけでも良いが、画像データの特徴が不明瞭な場合は両方向への投影波形を形成するのが好ましい。
【0024】
ここで投影とは、ラスタ形式の画像データに対し、ある経路に沿って、当該経路上の画素の画素値を累算する処理をいい、当該経路が複数ある場合に、その累算した結果の数列が投影波形をなす。コンピュータ処理による場合には画素値の累算結果が経路ごとに得られ、この累算結果の組(累算値系列)により投影波形をディジタル表現することになる。この場合、現実的には投影波形の形成処理前に公知の傾き補正技術を利用して読み取り時の軽微な傾きを補正しておくことが好ましい。
【0025】
また、データベース内の画像データに対しては、事前に投影波形を作成しておき、画像データと関連づけておくことが好ましい。ここで登録されたデータがスキャナ等によって読み込まれた画像データの場合はそのまま投影波形を生成することができるが、ワープロ等で作成したテキストデータである場合は、これをラスタライズして、画像データに変換し、その後に投影波形の生成を行なう。
【0026】
なお、投影波形は垂直、水平方向のみならず、任意の複数経路上で画素値を累算するものであって構わないが、比較を行うために、各経路は事前に決定しておく必要があり、また累算を行う順序(各経路の順序、すなわち累算値の演算の順序)を同じにしておく必要がある。累算値系列は順列で比較されるものだからである。
【0027】
このようにして、キーとなる画像データの投影波形とデータベース内の画像データとの投影波形が求められ、これらの投影波形の類似度を演算して、類似度の高いものを検索結果としてユーザに提示する。
【0028】
本実施の形態において特徴的なことは、キーとなる画像データに一致する画像データがある場合でも、両画像データの縮尺が変化していたり、読み取りを行う際に異なる解像度で読み取られる可能性があり、投影波形をそのまま比較しても類似度が適切な値とならない場合に配慮して各投影波形に基づき、スケーリングのパラメータを求め、スケーリングの処理を行うことである。また、画像データの読み取りの際の都合によっては画像全体が平行移動した状態で読み取られたり、上下反転したり、縦横が置き換えられたり、傾きをもって読み取られたりする場合もある。このような場合を想定して、投影波形に対し、アフィン変換を施して比較する。これにより相似度によって比較することとなり、検索の正確性を向上できる。
【0029】
ここでアフィン変換の対象となる投影波形は、データベース内の画像データに関するものであってもよいし、キーとなる画像データであってもよい。データベース内の画像データに対してアフィン変換を行う場合、データベース内の画像データに対し、投影波形を事前に演算してあれば、キーとなる画像データを読み取るスキャナの解像度などに合わせて、この事前に演算して得た投影波形を所定のスケール(既定スケール)にスケーリングした、いわば規格化した投影波形を用意しておくことも好ましい。
【0030】
次に、このアフィン変換のためのパラメータ(相似変換パラメータ)を求める方法について概説する。本実施の形態では、相似変換パラメータを求めるために、各投影波形の特徴的部分を抽出し、その位置関係を比較して相似変換パラメータを得る。ここで特徴的部分としては、極値(局所的ピーク)、変曲点などの微分波形特徴量であってもよいし、最大値や、所定値となる位置、重心位置、ピークの幅など投影波形自体から得られる特徴量であってもよい。データベース内の画像データに対しては、これらの特徴量を事前に抽出し、対応する画像データに関連づけておくことも好ましい。
【0031】
例えば各投影波形の局所的ピークが求められた場合、この局所的ピークの位置を求める。通常投影波形内に複数の局所的ピークがあるので、この位置は、位置のリストとなる。この位置のリスト(ピークリスト)が本発明の「系列位置情報」に相当するものとなる。
【0032】
そしてキーとなる画像データの投影波形に関するピークリストと、データベース内の画像データの投影波形に関するピークリストとを比較して相似変換パラメータを求める。この比較処理においては、各ピーク位置を対応付けして相似変換パラメータを求めるのであるが、例えば図1に概略を示すように、比較される2つの投影波形にそれぞれ3つのピーク(A,B,C及びα,β,γ)があり、2つの画像データが同じ画像データである場合に、Aとα、Bとβとを一致させる(正しい)対応付けを行った場合と、Aとβ、Bとγを一致させる(誤った)対応付けをした場合とでは次のように事情が異なる。なお、以下の説明では簡単のため、比較される両画像データの縮尺は一致しているものとする(すなわちスケーリングについては考えない)。なお、図1では説明のため、ピーク以外を平坦で示した。
【0033】
すなわち、Aとαとの関係により求められる平行移動量と、Bとβとの関係により求められる平行移動量とはほぼ一致するのに対し、Aとβとの関係により求められる平行移動量と、Bとγとの関係により求められる平行移動量は一般に異なるのである。
【0034】
そこで、すべての対応付けを総当たり的に試行し、各結果同士を比較して多数決原理により最も尤もらしい値(最尤値)を求めることにより、適切な値が求められることになる。
【0035】
スケーリング補正を要する場合、それぞれのピークリスト内のピーク位置の対応関係からは、スケーリング量kと平行移動量sとの関係が求められる。すなわち、一方の画像データに関連するピーク位置xiと、他方の画像データに関連するピーク位置ξiとを対応づける場合、次の(1)式の関係が得られる。
【0036】
【数1】
【0037】
そして各ピーク位置の総当たり的に対応付けて、(1)式による直線をk−s平面((スケーリング補正量)−(平行移動量)平面)に複数描画すると、理想的には多くの直線が交差する座標が求められ、この座標値(k,s)として正しいスケーリング補正量が求められることとなる。ここで「理想的には」というのは、演算の誤差等の要因により、各直線から求められるkやsは必ずしも一致しないからである。そこで多数決原理により最尤値を選んでk,sを決定することになる。このように正しく対応付けがされた場合に、多数のパラメータの候補がある値近傍に集まることに着目し、多数決原理を利用して最尤値を求めているのである。同様にして、例えば一方の画像データの水平方向に対する投影波形のピークリストと、他方の画像データの垂直方向に対する投影波形のピークリストとが正しく対応づけられる(つまりより多数のパラメータ候補があるパラメータ値近傍に集まる)ならば90度回転したものと判別することができ、この場合に一方のピークリストの順序を入れ替える(要するに一方の投影波形の向きを逆転する)とよりよく対応付けられるとするならば、反転しているものと判別することができるなど、回転、反転、スケーリングなどを含んだ一次変換パラメータを同様の処理によって求めることができる。なお、以下では、説明を簡約にするため、スケーリング補正と平行移動とに限って説明をする。
【0038】
また、ここまでの説明ではキーとなる画像データの投影波形と、データベース内の画像データに対する投影波形とを比較するとしたが、それぞれの波形を微分して得た、微分波形同士を比較しても良い。キーとなる画像データとして複写文書を用いる場合、画像データに写真やドローイングのような中間調領域を含んでいると、その濃度値は大きく変化している場合が多く、その投影波高値も安定しない場合が多い。このような場合でも投影波形の凹凸の様子は多くの場合維持されているので、比較の対象として微分投影波形を用いる方が好ましい場合も多いからである。
【0039】
さらに、ここでは投影波形からピークリストを作成するにあたり、投影波形そのものを用いているが、文字列から生成される投影波形には高周波成分が多く、また書き込みや押印などによるノイズ成分も多く含んでいる一方、相似変換パラメータの推定の際には、行のピッチや各行の長さなどの情報を用いれば十分であり、これら行のピッチなどの形状は投影波形の低域成分に反映される。そこで、ノイズ除去や局所的ピーク検出処理の安定化の観点から、投影波形の低域濾波処理を行う。さらに、低域濾波された投影波形にも微小な凹凸が残っているために、数多くの局所的ピークが検出され、演算量が大きくなるので、相似変換パラメータの推定に必要となる大局的な凹凸を表す局所的ピークの位置のみをピークリストに含めることが好ましい。
【0040】
そこで以下、大局的な凹凸を表す局所的ピークのみを検出する方法について概説する。図2は投影波形の大局的な凹凸の様子を検出するための局所的ピーク検出法を説明する図である。図2において、p(x)は低域濾波後の投影波形の位置xにおける波高値、αは所定のウインドウ幅である。局所的ピーク位置では投影波形の傾きがゼロになるが、これを微分投影波形のゼロ交叉点として求めるかわりに、ウインドウの両端位置での投影波高値を結ぶ直線の傾きにより求める。位置Xaにおけるこの直線の傾きは次の(2)式のS(Xa)に比例する。
【0041】
【数2】
【0042】
このS(Xa)の正負が変化する点が局所的ピーク位置である。ここで当該点が正から負へ変化する凸ピークであるか、負から正へ変化する凹ピークであるかを表す情報をピーク属性情報としてピークリストとともに取得しておくことが好ましい。このように注目位置から一定の距離αだけ離れた点での投影波高値を参照することにより、投影波形の微小な凹凸に影響されることなく、投影波形の大局的な凹凸の様子を表すピーク候補を検出することができる。
【0043】
そしてこれらピーク候補から、相似変換パラメータの検出に有効なピークのみを選別する。相似変換パラメータは投影波形の大局的な凹凸を対応付けることによって求められるため、微小なピークは取り除いた方がよい。
【0044】
図3は局所的ピークを選別する手段の動作原理を示す図である。図3では図2に示した方法により得られた局所的ピークの候補の位置(x1〜x5までの、計5点)が検出されている。この図3の例では、例えばx2やx3における局所的ピークが微小な凹凸として除外したいピーク候補である。
【0045】
微小な局所的ピークを除外するために、本実施の形態では、以下のような処理を行なう。すなわち、ある局所的ピーク位置Xnについて、その位置での投影波高値と、隣接する局所的ピーク位置での波高値との差に関する量Dnを次の(3)式のように求める。
【0046】
【数3】
【0047】
また、位置x1やx5のような片側にのみ隣接する局所的ピークを持つものに関しては、その局所的ピークの波高値との差に対する絶対値をDnとする。
【0048】
このようにして求めたDnと所定のしきい値Tdとが次の(4)式の条件を満たす場合に、位置Xnにおける局所的ピークを実際に比較対照となるピークとしてピークリストに加える。
【0049】
【数4】
【0050】
また、隣接する局所的ピーク位置における投影波高値の差ではなく、(5)式に示すような波高値の比Rnを用いてピークの選別を行なってもよい。
【0051】
【数5】
【0052】
そして、この(5)式により求めたRnと所定のしきい値Trとが(6)式の条件を満たす場合に、位置Xnにおける局所的ピークをピークリストに加える。
【0053】
【数6】
【0054】
さらにピークリスト間の比較に補助的に資する目的で、ピーク属性情報として、投影波形の幅と重心を求めておくことも好ましい。これらの情報は変換パラメータ検出に必須のものではないが、後述するように変換パラメータの検出の高速化や信頼性の向上に役立てることができる。
【0055】
ここでピークの幅を求める場合、投影波形にノイズか含まれておらず、また紙の地色等によるオフセット分も含まれていない場合は、投影波形の非ゼロ区間の幅を以って投影波形の幅とすれば良い。しかし、このような理想的な例は極めて希であるため、実際には投影幅を求めるためには次のような処理を行なう必要がある。
【0056】
図4は投影波形の幅を検出するための処理を説明する図である。実際の投影波形には図4のA,Bの領域のようにノイズや紙の地色等によるオフセット分(地色により画素が部分的に「白」でなくなっているために発生する非ゼロ領域)が含まれている。そこでこれらの成分を除去するためにしきい値処理を行なう。ただし、しきい値付近の波高値が多く存在する場合は、しきい値を越えるか否かの微妙な違いが検出される投影波形の幅に大きく影響するため、図4の例では投影波形に対して2つの相異なるしきい値、ThとTlを設定する。これらのうち低い方のしきい値Tlは、ノイズやオフセット分のほとんどがこの値を下回るように設定され、高い方のしきい値Thは本来の投影波形のほとんどがこの値を上回るように設定される。
【0057】
このようなしきい値を設定した上で、投影波形の幅Wを次の(7)式により求める。
【0058】
【数7】
【0059】
ここで、w(・)は、図5に示すように、0<x<Tlであるようなxで「0」、Th<xとなるようなxで「1」となり、Tl<x<Thでは、「0」から「1」まで線形に変化する関数である。また、Pは投影波形全体を表し、従って(7)式では、投影波形全体に亘って総和することを意味する。このようにしきい値Th、Tl間になだらかな勾配を持つしきい値処理関数を設けることにより、単一しきい値を用いた時に問題となるしきい値付近の投影波形が多く存在する場合でも、検出される投影波形の幅に大きく差が生じないようにすることができる。
【0060】
一方、投影波形の重心位置Gは次の(8)式から求められる。
【0061】
【数8】
【0062】
こうして求められたピークリスト及びピーク属性情報を利用して相似変換パラメータを求める。次に具体的に相似変換パラメータを求める手続きについて概説する。まずキーとなる画像データと、データベース内の比較対象となる画像データとのそれぞれのピークリストを参照し、ピーク位置の対応付けを行なう。ピーク位置の対応付けはピーク属性情報を参照して凸ピークと凹ピークについて別々に行なう。次に対応付けられた2つの局所的ピーク位置を一致させるために必要なスケーリング補正量と平行移動量が直線関係を為すことに基いて、(スケーリング補正量)−(平行移動量)平面において該直線上への投票処理を行なう。このような投票処理を全ての局所的ピーク位置の組合わせについて行なうと、(スケーリング補正量)−(平行移動量)平面上には投票値の累積値の分布が形成される。(スケーリング補正量)−(平行移動量)平面上において、この累積投票値が大きくなる点は、2つの局所的ピークリストが良く一致することを示しているため、その点の座標(スケーリング補正量,平行移動量)が求める相似変換パラメータとなる。
【0063】
すなわち、図6に示すように、投影波形に対する局所的凸ピークリスト(A1〜A3)と、キーとなる画像データの投影波形から求められた局所的凸ピークリスト(B1〜B4)がある場合、上記2つの局所的ピークリストについてピーク位置の対応付けを行なう。例えば局所的ピークA1とB1の対応付けを行なう場合、両者のピーク位置が一致するために必要なスケーリング補正量をk、平行移動量をsとすると、A1の座標「10」と、B1の座標「19」とを用いて、次の(9)式が成り立つ。
【0064】
【数9】
【0065】
この(9)式はkとsに関する一次式であるので、これに基づきk−s平面、即ち(スケーリング補正量)−(平行移動量)平面において一本の直線を描画できる。(9)式の条件に拘束されるk,sを用いれば、比較に係る両画像データは、少なくとも局所的ピーク位置A1とB1では重ね合わせることができる。そこで、補正量の候補としてこの直線上に「一票を投じる」。すなわち、この直線上の各点に投票を行う。後にこの投票数の多い点を最尤点として求めたいのである。
【0066】
また同様にして図6に示した局所的ピークA1を他のB2〜B4にも対応付けることにより、(スケーリング補正量)−(平行移動量)平面において、A1に関しては都合4本の直線上への投票を行なうことになる。一般にあるデータベース内の画像データの投影波形から求められた局所的ピークリストにおけるi番目のピークの位置をAix、キーとなる画像データの投影波形に対する局所的ピークリストにおけるj番目のピークの位置をBjxとすると、両者のピーク位置が一致するために必要なスケーリング補正量k、および平行移動量sの関係は(1)式と同様に、(10)式の関係になる。
【0067】
【数10】
【0068】
そして同様の投票処理を残りの局所的ピークA2およびA3についても行なうことにより、(スケーリング補正量)−(平行移動量)平面上には投票値の累積値の分布が形成される。
【0069】
尚、投票値は上の例のように常に1票を投じる他にも、局所的ピークの波高値情報を反映した投票値を用いることもできる。局所的ピークについては、その波高値の大きなもの同士、あるいは小さなもの同士を対応付けるのが自然であるから、投票値も波高値に応じて変化させる。すなわち投影波形から求められた局所的ピークリストにおけるi番目のピークの波高値をAis、キーとなる画像データの投影波形に対する局所的ピークリストにおけるj番目のピークの波高値をBjsとして、例えば投票値Vを次の(11)式のように定める。
【0070】
【数11】
【0071】
なお、(11)式の投票値を適用するためには、局所的ピークの波高値の最大値が所定の値になるようにするなどの正規化処理を前もって行なっておく必要がある。
【0072】
このようにして(スケーリング補正量)−(平行移動量)平面上に形成された累積投票値は、2つの局所的ピークリストの一致度を反映している。従って、同平面上に形成された累積投票値のピーク点を探索すれば、その点の座標が求める(スケーリング補正量,平行移動量)を表す。この補正量を用いて一方の投影波形に補正を加えることにより、2つの投影波形が最も良く一致することになる。図6の例では(スケーリング補正量,平行移動量)=(0.9,10)において(累積投票値)=3の最大累積投票値を持つことから、登録文書の投影波形を0.9倍し、さらに10だけ平行移動することにより、2つの投影波形が最も良く一致する。
【0073】
ところで、上記の補正量を適用すると、被照合文書側の局所的ピークB3のみがデータベース内の画像データに対応する局所的ピークを持たないことがわかる。このことから、局所的ピークB3は、文書上への書き込みや押印等のノイズによるピーク成分であることと推測される。本実施の形態の相似変換パラメータの検出手続きでは、このようなノイズによる局所的ピークの発生、あるいは検出漏れがあっても、投票処理という多数決原理に基づいて相似変換パラメータが推定されるため、推定される補正量の精度の低下を防止できる。
【0074】
以上の説明では、(スケーリング補正量)−(平行移動量)平面上に形成された累積投票値のピーク点を探索することにより相似変換パラメータの検出を行なったが、これは「理想的」な例であり、実際には局所的ピーク検出時の誤差や、元々の文書の印刷精度などにより、投票を行なう直線群が厳密に一点で交わることは希である。そこで、相似変換パラメータを推定する手続きとして、(スケーリング補正量)−(平行移動量)平面を、図7のようにスケーリング補正量方向にn分割、平行移動量方向にm分割したセルに「量子化」して、各セルの投票値の累計を計算し、該累計が最大となるセルを求める方法も考えられる。そして当該累計が最大となったセルの中心座標(kc,sc)を以って相似変換パラメータの最尤値とする。このようにするとコンピュータ処理にも適合できる。
【0075】
さらに精度を高めるためには、図8に示すように、投票値の累計が最大となるセルを求めた後、投票を行なう直線群の中から該セルを通過する直線群のみを選び、それら直線群から最短距離に位置する点の座標を求め、当該座標を最尤値とする。このような点の座標は以下の手順により求めることができる。
【0076】
まず投票値の累計が最大となるセルを通過する直線群がh本あるとして、それらが(12)式で表されるとする。
【0077】
【数12】
【0078】
ただしi=0,1,…,h−1とする。これらの直線の一つと(スケーリング補正量)−(平行移動量)平面上の一点(k,s)との距離diの間には次の(13)式の関係がある。
【0079】
【数13】
【0080】
点(k,s)から各直線までの距離の2乗和Dは、次の(14)式で示される。
【0081】
【数14】
【0082】
従って、投票値の累計が最大となるセルを通過する直線群から最短距離に位置する点の座標(kl,sl)は、次の(15)、(16)式を連立して解くことによって求めることができる。
【0083】
【数15】
【0084】
さらに、直線群から最短距離に位置する点の座標を求める際に、各直線からの距離を(11)式に定めた投票値Vで重み付けしても良い。投票値Vによる重み付けを行なうことにより、局所的ピークの対応付けが正しく行われている可能性が高い直線を重視した補正量検出が行なわれる。この場合、(14)式は、(17)式のように変更される。
【0085】
【数16】
【0086】
(17)式において、Viはi番目の直線上への投票値である。またピーク属性情報のうち、投影波形の幅と重心の情報は相似変換パラメータの推定における処理の高速化や信頼性の向上に役立てることができる。
【0087】
すなわち、一般に投票処理によるパラメータ推定では、不適切な位置に比較的大きなピークを生じる、いわゆるフォールスピーク(false peak)問題を有している。この効果を軽減するためには、投票空間全体への投票を行なうのではなく、明らかに必要ないと思われる領域への投票を行なわないことが有効である。本実施形態においては投影波形の幅と重心の情報を用いて投票領域を限定することにより、変換パラメータ検出処理を高速化すると同時に、上記問題による効果も軽減することができる。
【0088】
具体的に投影波形の幅を用いて、(スケーリング補正量)−(平行移動量)平面上におけるスケーリング補正量方向の投票領域を限定することができる。データベース内の画像データの投影波形幅をWr、キーとなる画像データの投影波形幅をWiとして次の(18)式に示す投影幅比Rを求めると、相似変換パラメータにおけるスケーリング補正量はRに近い値となるはずである。なぜなら2つの文書が同一の文書であるならば、それらの投影波形も相似形をなしているはずであり、スケーリングの相違は投影幅の比となるはずだからである。
【0089】
【数17】
【0090】
投影波形の幅はノイズや紙の地色等によるオフセット分などに起因する誤差分を含んでいるが、それでもなお、真の補正量、すなわち投票値のピーク位置のスケーリング座標は、(18)式のRに近い値であるはずである。そこで(18)式のRを中心とした所定のスケーリングマージンβを設定し、そのスケーリングマージンβの範囲内に投票領域を限定する。この場合、(スケーリング補正量)−(平行移動量)平面上に描画した各直線のうち、当該スケーリングマージンβの範囲内に「投票した」こととし、当該範囲の外に対しては「投票」しない。
【0091】
また、投影波形の重心位置情報からも投票領域の限定を行なうことができる。すなわち、もし特徴抽出手段により求められた重心位置が正確なものであれば、2つの投影波形の重心位置間には(10)式と同様に次の(19)式の関係が成立するはずである。
【0092】
【数18】
【0093】
ただし、(19)式においてGrとGiはそれぞれ、データベース内の画像データの投影重心位置とキーとなる画像データの投影重心位置である。実際には求められた重心位置の情報にはノイズや紙の地色等によるオフセット分などに起因する誤差分を含んでいるが、それでもなお、真の補正量、すなわち投票値のピーク位置は(19)式で表される直線の近傍に位置するはずである。そこで(19)式の直線を中心として、適当な平行移動量マージンγを設定し、その範囲内に投票領域を限定する。
【0094】
これにより、投票領域を図9に示した範囲に限定し、この領域外の直線上、あるいはそもそもこの領域を通過しない直線上への投票処理を省略し、処理を高速化するとともに、上記false peak問題による効果を低減できる。
【0095】
なお、こうして求められた相似変換パラメータに基いて、投影波形の相似変換処理を行なうにあたり、非サンプリング位置での信号を要する場合など、補間処理を要するときには、広く知られている補間法として最近傍法、線形補間法、cubic convolution(3次畳み込み)法、スプライン補間法など様々なものを利用できる。本実施の形態の装置は特に特定の補間法に依存するものではないので、上に挙げた補間法のいずれを用いてもよい。上記の補間法は多くの文献で解説されているため、その説明を省略する。
【0096】
次に、上述の技法により推定された相似変換パラメータを用いて相似変換した後の投影波形を比較する方法について概説する。理想的には、一方の投影波形を相似変換し、他方の投影波形と比較したとき、両画像データが一致する場合には、これらの投影波形は厳密に一致する。しかし、比較に係る両画像データが同一のものであっても、スキャナの読み取り精度や、キーとなる画像データに押印や書き込みが行われている場合、さらには相似変換パラメータの算出誤差など、様々な理由により両投影波形が厳密に一致することは少ない。また、キーとなる画像データとして複写した後の画像データを用いる場合、文書上にある写真やドローイングのような中間調領域の濃度値は大きく変化している場合が多く、その投影波高値も安定しない場合が多い。従ってノイズ等による投影波形の変形や相似変換パラメータの誤差、文書上の中間調領域に起因する投影波高値の変化などに対しても堅牢な方法で類似度の測定を行なう必要がある。
【0097】
このような投影波形の照合方法として、本実施の形態では投影波形の微分波形間の相関係数を用いる。これは文書上にある中間調領域によって投影波形の一部にオフセットが加えられていても、その微分波形はほとんど影響を受けることがないことに着目したものである。投影波形の微分波形を生成する方法としては、本来の微分波形を用いる以外にも(2)式で示したS(x)を用いることもできる。(2)式のS(x)は投影波形上の微小な凹凸の影響を受けにくいため、投影波形照合にS(x)を用いると良好な結果が得られることになる。
【0098】
データベース内の画像データに対し、相似変換を行い、その相似変換後の微分投影波形をqr(x)、キーとなる画像データの微分投影波形をqi(x)とすると、両者の相関係数rは次の(20)式のように求められる。
【0099】
【数19】
【0100】
また、Lは波形の長さを表す。
【0101】
このようにして水平・垂直の両方向に投影波形を形成した場合、両方向の投影波形に対する相関係数がそれぞれ求められる。出力する画像データの類似度の情報としては、これら2つの相関係数を加味したものとしても良いし、どちらか一方の方向に対して照合処理を行なうだけで十分であることがわかっている場合は、その方向の相関係数を類似度として扱ってもよい。
【0102】
両方向の相関係数を加味して画像データの類似度を求める例としては、水平・垂直方向について求められた相関係数の和を類似度として出力するものがある。また別の例として、2方向の相関係数の荷重和を類似度とする方法もある。この場合、水平方向の相関係数をrh、垂直方向の相関係数をrvとし、水平方向の相関係数の重みをwh、垂直方向の相関係数の重みを1−whとすれば、出力すべき類似度は次の(21)式のように表される。
【0103】
【数20】
【0104】
どちらかの方向の相関係数が文書画像の違いをより強く反映している場合には、(21)式によってその方向により大きな重み付けをして類似度の計算を行なうことにより、照合精度を向上させることができる。
【0105】
さらに、相似変換パラメータの推定により得られた補正量を類似度に反映させることもできる。これは文書のマージン幅やスケールが大きく異なる場合に別文書として扱いたい場合などに適する。この場合、水平・垂直方向の相関係数やスケーリング補正量、平行移動量などの荷重和により定義される合成変量Zを作り、大量の文書サンプルを用いた判別分析により各重みを調整することで、各文書を判別する判別関数を求めることができる。判別分析については多くの文献に解説されているため、詳細は割愛する。
【0106】
一方、両方向の相関係数を用いることなく、どちらか一方向の相関係数を類似度として扱う場合について説明する。一般に横書きの文書の場合、横方向の投影には明確な凹凸が現れるが、縦方向の投影には明確な凹凸が生じない場合が多い。このような場合、縦方向の投影波形の照合結果からは文書を特定するための有益な情報は得られないため、対象となる文書が縦書きであるか横書きであるかが予めわかっている場合には、一方向のみの相関係数を用いて類似度の測定を行なった方が好ましい。また、水平・垂直方向の局所的ピークリストに含まれるピーク数の多い方向のみを類似度測定に使用するのも有効な方法である。
【0107】
これによりキーとなった画像データに対し、最も高い類似度を示す、データベース内に登録された画像データがキーとなった画像データと同一の文書であると判定されることになる。
【0108】
なお、ここまでの説明では、相似変換パラメータの推定時に(スケーリング補正量)−(平行移動量)平面上に形成された累積投票値が最大値を取るピーク点を探索し、そのピーク点の座標を(スケーリング補正量,平行移動量)とする唯一の補正量として用いてきた。しかし、上記平面上では大きな累積投票値を持つ点が複数点形成されることも希ではなく、局所的ピーク検出の過程で多少の誤りが含まれている場合は、累積投票値において2位以下のピーク点に対応する補正量が正しい補正量となる場合もある。このような場合を想定して、上記平面に形成された累積投票値の中で、所定複数のピーク点を求め、それぞれのピーク点に対応する複数通りの補正量で投影波形の変換処理を行なう方法も考えられる。そして、上記複数通りの補正量を用いて変換処理を行なった投影波形を用いて複数通りの類似度を測定し、その最大類似度を最終的な類似度とすることで、より確実な文書画像照合処理を行なうことが可能となる。
【0109】
また、(スケーリング補正量)−(平行移動量)平面上に形成された累積投票値が2つの投影波形の一致度を反映しているという点に着目すれば、この投票値自体を2つの投影波形の類似度と見なすことができる場合もある。もしも局所的ピークの誤検出、あるいは検出漏れが無いことが保証できる場合は、上記投票値自体を類似度として使用し、実際の投影波形を相似変換する必要がなく、また変換後の投影波形などを比較する処理もする必要がない。
【0110】
以上に、本実施の形態の画像照合装置の動作原理を述べたので、以下、本発明の実施の形態に係る画像照合装置の実装例について説明する。本実施の形態の画像照合装置1は、一般的なパーソナルコンピュータを利用して実現でき、図10に示すように制御部11と、記憶部12と、ストレージ13と、外部記憶部14と、スキャナ部15と、表示部16とから基本的に構成されている。
【0111】
ストレージ13は、制御部11によって実行されるオペレーティングシステム等の基本プログラムのほか、画像照合プログラムがインストールされたプログラム格納領域13aと、比較対象となる画像データが蓄積したデータ格納領域13bとを含んでいる。
【0112】
制御部11は、ストレージ13に格納されているプログラムを実行して各種処理を行う。本実施の形態においては、この制御部11が、画像照合プログラムに従い、本発明の演算手段、及び画像データの照合処理を行う手段を実現している。すなわち、この制御部11は、キーとなる画像データがスキャナ部15から入力されると、これを処理対象の画像データとして記憶部12に格納し、事前に設定された複数の経路に沿って画素値を累算し、演算した経路の順に累算値系列として記憶部12に格納する処理(演算処理)を実行する。また、制御部11は、この累算値系列を利用してストレージ13に蓄積されている画像データと、処理対象の画像データとを照合する処理を実行する。これらの処理については、後により詳しく述べる。
【0113】
記憶部12は、制御部11のワークメモリとして動作する。外部記憶部14は、画像照合プログラムなどを格納したコンピュータ読み取り可能な記録媒体(例えばCD−ROMやDVD−ROMなど磁気的乃至光学的に情報を記録したもの)から当該画像照合プログラムなどを読み取って制御部11に出力し、これによりストレージ13にインストールさせる処理を行う。
【0114】
スキャナ部15は、光学的に紙媒体の原稿を読み取り、これを画像データに変換して制御部11に出力する。表示部16は、制御部11から入力される指示に従い、種々の情報を表示する。
【0115】
ここで制御部11の画像照合プログラムの処理についてより詳しく説明する。なお、ストレージ13に蓄積されている画像データについては、予め累算値系列の情報及びピーク位置テーブル(後にその演算方法を説明する)が関連づけられて格納されているものとする。また、以下の説明では累算値の演算の経路は水平方向及び垂直方向であるとし、順序は水平方向については紙面上側から下側へ、垂直方向については左側から右側へ走査した順序であるとする(図11)。図11では実線が演算経路を示し、破線が経路の演算順序を示すために用いられている。
【0116】
制御部11は、スキャナ部15からキーとなる画像データ(処理対象画像データ)の入力を受けてこれを記憶部12に格納して図12に示す処理を開始し、まず当該処理対象の画像データに対し図11(a)に示すような水平方向に延びる複数の経路に沿って、当該経路上の画素値を累算し、各経路での累算結果を演算順に記憶部12に格納する(S1)。同様に図11(b)に示したような垂直方向に延びる複数の経路に沿って、当該経路上の画素値を累算し、各経路での累算結果を演算順に記憶部12に格納する(S2)。これら処理S1及びS2で累算した結果が本発明の累算値系列となる。ここでは第i番目の演算順序の経路に対する累算値をpiと表すこととする。
【0117】
この累算値を演算するにあたり、白黒画像データであれば、白の点の画素値を「0」、黒の点の画素値を「1」として累算すればよいし、中間調を含む多値画像データであれば、例えば白を「0」、黒を「255」等とすればよい。さらにカラー画像データの場合は、その濃度成分を分離して、該濃度画像を上記多値画像と見なして投影値を計算する。濃度成分の分離は、広く知られたカラー値の変換処理により行うことができる。
【0118】
制御部11は、この累算値系列の情報に対し、その高周波成分を除去する低域濾波の処理を行って記憶部12に格納する(S3)。この処理は、例えば隣接する経路の累算値の平均値を演算するなどの公知の処理によって行うことができる。そして低域濾波後の累算値系列について、所定のa(aは整数)の値を用い、(2)式に対応するSi=(pi-a)−(pi+a)についてiを順次変化させながらその正負の変化点を見出し、変化点となったiをピーク候補として取り出す。また、各変化点のiの情報に、正から負へ変化した凸であるか、負から正へ変化した凹であるかを示すピーク属性の情報を関連づけて、記憶部12に図13に示すようなテーブルとして記憶する(S4)。そして(3)〜(6)式に例示したような処理により、隣接ピークとの大きさの差乃至比に基づき、顕著でないピーク候補を処理S4で生成したピーク候補のテーブルから削除し、ピーク位置テーブルを生成する(S5)。
【0119】
また、ここで制御部11は、累算値系列の幅と重心とを(7)及び(8)式により求めて、ピーク位置テーブルに関連づけて記憶部12に格納する(S6)。この処理については、既に概説したものを離散的に扱うことによりコンピュータ処理として実現できるので、詳しい説明を省略する。
【0120】
ここまでの処理により、記憶部12には、ピーク位置テーブルとして上記の局所的ピークリスト、すなわち本発明の系列位置情報が格納されているようになる。
【0121】
次に、制御部11はストレージ13から画像データを順次取り出して(S7)、記憶部12上に所定のn×mの配列を記憶する領域を確保して、この領域の値を「0」に初期化し(S8)、当該取り出した画像データに関連するピーク位置テーブルと、処理S6にて記憶部12に格納したピーク位置テーブルとを比較して、各ピーク位置の対応付け処理を実行する(S9)。この処理は、各ピーク位置テーブル上のピークについてその第1番目と第j番目、第2番目と第j+1番目、…といったような対応付けをjを1から順次設定することによって行う。この処理S9ではそのうちの対応付けの候補の一つを設定する。
【0122】
そして制御部11は、処理S9で設定された対応付けの結果に基づき、(1)式(や(9)式)に基づきスケーリング補正量kと、平行移動量sとの間の関係式を見出して、処理S9にて確保した記憶領域上に「描画」する(S10)。すなわち、スケーリング補正量の最大値がK、平行移動量の最大値がSである場合、(x,y)の位置にある記憶領域がK・x/n、S・y/mの値に対応しているから、この記憶領域が(K・x/n)×k+s=(S・y/m)の関係を満たす場合に、この記憶領域内の値をインクリメント(投票)することになる。これが上記の投票処理に相当する。またここではインクリメントするだけでなく、(11)式により演算される投票値Vを当該記憶領域の値に加算(投票)して上書きしてもよい。
【0123】
制御部11は、さらに処理S8で設定されていない他の組み合わせがあるか否かを判断し(S11)、他の組み合わせがあれば(Yesならば)処理S9に戻って処理を続ける。また、他の組み合わせがなければ(Noならば)、このn×mの記憶領域を参照し、値が最も大きい記憶領域上の位置(xmax,ymax)を検索する(S12)。そして、当該(xmax,ymax)に基づき、スケーリング補正量k、及び平行移動量sを決定し、処理S7で取り出した画像データについて補正処理を行う(S13)。補正後の累算値系列λj(0≦j<nk)は、n個の経路について得られた累算値系列pi(0≦i<n)に対し、λj=plとして求められる。ここでlは、l=Round((j−s)/k)となる整数である。Round(x)はxを四捨五入した整数を表すものとする。また、l<0、またはl≧nとなるjについては、λj=0とする。
【0124】
また、位置(xmax,ymax)に基づきスケーリング補正量k及び平行移動量sを決定する場合には、その中心座標により、k=(K/n)×(xmax+1/2)、s=(S/m)×(ymax+1/2)としてもよいし、(15)式、(16)式を連立して解く方法によってもよい。なお、後者の場合、当該偏微分方程式を解く方法としては、ニュートン法のような数値解法を利用してもよいし、(13)式や(14)式を代入して事前に解析的な解を求めておくこととしてもよい。さらに、明らかに誤りとなる記憶領域上の位置(x,y)について、処理S12に先だって当該記憶領域上の位置(x,y)に「0」を設定することも好適である。明らかに誤りであるか否かは、(18)式に対応した累算値系列内の累算値の個数(系列長)の比によるスケーリング補正量k方向への領域制限、(19)式により求められる重心位置に基づく領域制限を利用することができる。またここでは処理S13の補正処理を処理S7で取り出した画像データに対して行っているが、キーとなる画像データに対して行ってもよい。この場合処理S31のときとはスケーリング補正量は上記kの逆数となり、平行移動量は、上記sと符号が反対のものとなる。
【0125】
そして、この新たな累算値系列λiについて、処理S1,S2で演算したキーとなる画像データに対する累算値系列との比較を行う、照合処理を実行する(S14)。制御部11は、当該照合結果を処理S7で取り出した画像データを識別する情報(例えば当該画像データのファイル名など)に関連づけて記憶部12に格納する(S15)。制御部11は、まだ取り出していない画像データがあるか否かを調べ(S16)、取り出していない画像データがあれば(Yesならば)、処理S6に戻って次の画像データに対して処理S7〜処理16を行い(図12の(A))、取り出していない画像データがなければ(すべての画像データに対して処理を行ったならば;Noならば)、記憶部12に格納された照合処理の結果を表示部16に表示するよう指示して(S17)、処理を終了する。
【0126】
なお、処理S17においては、照合処理の結果、一致度の高い順にソートした画像データの一覧を表示することが好ましい。また、各一覧には、画像データのファイル名を含め、画像データをプレビューしたり、取り出して外部記憶部14に挿入された媒体にコピーを保存できるようにしておくことが好適である。
【0127】
また、制御部11による照合処理(処理S14,S15)では、(20)式で示したような相関係数を演算することによって求めることができる。つまり、水平、垂直の各方向に対し、次の演算を行う。すなわち、ηjについてその差分数列(隣接累算値間の差分からなる系列)に相当するqr(j)と、キーとなる画像データについての累算値系列piについてその差分数列に相当するqi(i)を生成し、これについて系列長Lを用いて、(20)式を演算する。こうして水平、垂直の各方向についての相関係数rh及びrvが演算され、これらを利用して類似度Scoreをrh+rvとして、又は(21)式のようにして求め、この類似度を照合処理の結果として処理S15にて記憶部12に格納することになる。
【0128】
本実施の形態の装置によると、制御部11が、スキャナ部15から入力される画像データを処理対象として所定の複数の経路に順次沿って画素値を累算し、当該累算(演算)順に累算値を配列した累算値系列を用いてストレージ13に蓄積された画像データとの照合を行い、その結果を表示部16に出力する。従って、これを利用すると、回覧された文書を再利用したい場合、これに書き込みや押印があっても、そのままスキャナ部15で文書をスキャンして照合を行わせる。制御部11の処理により、ストレージ13に蓄積された画像データとの照合が行われて、その結果が表示部16に表示され、利用者はこの結果を参照して示された文書をストレージ13から取り出すことができる。
【0129】
【発明の効果】
本発明によると、処理対象となった画像データに対し、複数の所定経路の各々について、経路上の画素値を累算し、各経路上の画素値を累算した結果を経路の演算順に含んでなる累算値系列を用い、複数の画像データ間の照合処理を行う画像照合装置としているので、画像データそのものを用い、その累算値系列というような特徴的な量を比較することで照合を実行することにより、書き込みや押印等のノイズがあっても安定した結果を得ることができ、OCR等テキストデータを抽出する必要がなく、テキストのみからなる文書データ同士をも照合することができる。
【図面の簡単な説明】
【図1】 ピーク位置の対応付けの概要に関する説明図である。
【図2】 投影波形の大局的な凹凸の様子を検出するための局所的ピーク検出方法を表す説明図である。
【図3】 局所的ピークを選別する手段の動作原理を示す説明図である。
【図4】 投影波形の幅を検出するための処理を表す説明図である。
【図5】 投影波形の幅を求めるための関数を表す説明図である。
【図6】 ピークリストの一例を表す説明図である。
【図7】 相似変換パラメータを推定する手続きの概要を表す説明図である。
【図8】 相似変換パラメータを推定する手続きの概要を表す説明図である。
【図9】 投票領域の制限の一例を表す説明図である。
【図10】 本発明の実施の形態に係る画像照合装置の構成ブロック図である。
【図11】 累算値系列の演算方向を表す説明図である。
【図12】 画像照合装置の処理の一例を表すフローチャート図である。
【図13】 ピークリストとしてのピーク位置テーブルの内容の例を表す説明図である。
【符号の説明】
1 画像照合装置、11 制御部、12 記憶部、13 ストレージ、14 外部記憶部、15 スキャナ部、16 表示部。
Claims (4)
- 処理対象となった画像データに対し、複数の所定経路の各々について、経路上の画素値を累算する演算手段と、
前記各経路上の画素値を累算した結果を経路の演算順に含んでなる累算値系列を用い、複数の画像データ間の照合処理を行う手段と、
を含み、
前記照合処理を行う手段が、照合の対象となった各画像データについての累算値系列間の相似性に基づき照合を行い、前記相似性を検出するために、照合の対象となった各画像データについて、それぞれの累算値系列内での累算値の変化が特徴的となる系列上の位置を表す、系列位置情報を生成し、当該各累算値系列に対する系列位置情報を比較して、少なくとも一次変換係数と平行移動量を含んでなる相似変換パラメータを演算し、当該相似変換パラメータを用いて、各累算値系列の相似性を検出し、
前記累算値の変化が特徴的となる系列位置情報は、累算値のピーク位置のリストであり、
前記照合処理を行う手段が、前記相似変換パラメータを決定するために、照合の対象となった各画像データのうち、相異なる画像データについてのピーク位置のリストを参照し、各ピーク位置同士の組み合わせについて相似変換パラメータを推定し、前記組み合わせごとに推定された相似変換パラメータを含んでなる推定相似変換パラメータ群を生成し、当該推定相似変換パラメータ群に含まれる各推定相似変換パラメータに基づき、尤度の高いパラメータとして前記相似変換パラメータを決定する、
画像照合装置であって、
前記処理対象となった画像データ及び前記照合の対象となった各画像データについて、それぞれ前記累算値系列の重心位置を計算する手段、
を更に備え、
前記照合処理を行う手段は、前記処理対象となった画像データの累算値系列の重心位置と、前記照合の対象となった画像データの累算値系列の重心位置と、に基づき、前記相似変換パラメータ中の前記平行移動量の推定存在範囲を限定し、前記推定相似変換パラメータ群から前記平行移動量の推定存在範囲のなかで前記尤度の高いパラメータを前記相似変換パラメータとして決定する、
ことを特徴とする画像照合装置。 - 前記処理対象となった画像データ及び前記照合の対象となった各画像データについて、それぞれ、前記累算値系列の前記演算順方向についての幅を求める手段、
を更に備え、
前記照合処理を行う手段は、前記処理対象となった画像データの累算値系列の幅と、前記照合の対象となった画像データの累算値系列の幅と、に基づき、前記相似変換パラメータ中の前記一次変換係数の推定存在範囲を限定し、前記推定相似変換パラメータ群から前記平行移動量の推定存在範囲と前記一次変換の推定存在範囲との交わりのなかで前記尤度の高いパラメータを前記相似変換パラメータとして決定する、
ことを特徴とする請求項1記載の画像照合装置。 - コンピュータを、
処理対象となった画像データに対し、複数の所定経路の各々について、経路上の画素値を累算する演算手段、
前記各経路上の画素値を累算した結果を経路の演算順に含んでなる累算値系列を用い、複数の画像データ間の照合処理を行う手段、
として機能させるためのプログラムであって、
前記照合処理を行う手段が、照合の対象となった各画像データについての累算値系列間の相似性に基づき照合を行い、前記相似性を検出するために、照合の対象となった各画像データについて、それぞれの累算値系列内での累算値の変化が特徴的となる系列上の位置を表す、系列位置情報を生成し、当該各累算値系列に対する系列位置情報を比較して、少なくとも一次変換係数と平行移動量を含んでなる相似変換パラメータを演算し、当該相似 変換パラメータを用いて、各累算値系列の相似性を検出し、
前記累算値の変化が特徴的となる系列位置情報は、累算値のピーク位置のリストであり、
前記照合処理を行う手段が、前記相似変換パラメータを決定するために、照合の対象となった各画像データのうち、相異なる画像データについてのピーク位置のリストを参照し、各ピーク位置同士の組み合わせについて相似変換パラメータを推定し、前記組み合わせごとに推定された相似変換パラメータを含んでなる推定相似変換パラメータ群を生成し、当該推定相似変換パラメータ群に含まれる各推定相似変換パラメータに基づき、尤度の高いパラメータとして前記相似変換パラメータを決定する、
と共に、前記プログラムは、前記コンピュータを、
前記処理対象となった画像データ及び前記照合の対象となった各画像データについて、それぞれ前記累算値系列の重心位置を計算する手段、
として更に機能させ、
前記照合処理を行う手段は、前記処理対象となった画像データの累算値系列の重心位置と、前記照合の対象となった画像データの累算値系列の重心位置と、に基づき、前記相似変換パラメータ中の前記平行移動量の推定存在範囲を限定し、前記推定相似変換パラメータ群から前記平行移動量の推定存在範囲のなかで前記尤度の高いパラメータを前記相似変換パラメータとして決定する、
ことを特徴とするプログラム。 - 前記コンピュータを、
前記処理対象となった画像データ及び前記照合の対象となった各画像データについて、それぞれ、前記累算値系列の前記演算順方向についての幅を求める手段、
として更に機能させるとともに、
前記照合処理を行う手段は、前記処理対象となった画像データの累算値系列の幅と、前記照合の対象となった画像データの累算値系列の幅と、に基づき、前記相似変換パラメータ中の前記一次変換係数の推定存在範囲を限定し、前記推定相似変換パラメータ群から前記平行移動量の推定存在範囲と前記一次変換の推定存在範囲との交わりのなかで前記尤度の高いパラメータを前記相似変換パラメータとして決定する、
ことを特徴とする請求項3記載のプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001284095A JP4140221B2 (ja) | 2001-09-18 | 2001-09-18 | 画像照合装置および画像照合プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001284095A JP4140221B2 (ja) | 2001-09-18 | 2001-09-18 | 画像照合装置および画像照合プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2003091730A JP2003091730A (ja) | 2003-03-28 |
| JP4140221B2 true JP4140221B2 (ja) | 2008-08-27 |
Family
ID=19107478
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001284095A Expired - Fee Related JP4140221B2 (ja) | 2001-09-18 | 2001-09-18 | 画像照合装置および画像照合プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4140221B2 (ja) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2006008992A1 (ja) * | 2004-07-22 | 2006-01-26 | C4 Technology, Inc. | カメラ付き携帯情報通信端末を用いたWebサイト接続方法 |
| JP4720529B2 (ja) | 2005-03-10 | 2011-07-13 | 富士ゼロックス株式会社 | 画像処理装置、画像形成装置、画像処理方法及びプログラム |
| US7801392B2 (en) | 2005-07-21 | 2010-09-21 | Fuji Xerox Co., Ltd. | Image search system, image search method, and storage medium |
| JP2007172077A (ja) * | 2005-12-19 | 2007-07-05 | Fuji Xerox Co Ltd | 画像検索システム及び方法及びプログラム |
| JP4692377B2 (ja) * | 2006-05-11 | 2011-06-01 | 富士ゼロックス株式会社 | 画像照合装置、画像照合方法及びプログラム |
| JP4687557B2 (ja) * | 2006-05-11 | 2011-05-25 | 富士ゼロックス株式会社 | 画像照合装置及びプログラム |
| JP4687558B2 (ja) * | 2006-05-11 | 2011-05-25 | 富士ゼロックス株式会社 | 画像照合装置、画像照合方法及びプログラム |
| JP5169648B2 (ja) | 2008-09-04 | 2013-03-27 | 富士ゼロックス株式会社 | 原画像探索装置及び原画像探索プログラム |
| JP5304553B2 (ja) * | 2009-09-09 | 2013-10-02 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
| JP7013182B2 (ja) * | 2017-09-21 | 2022-01-31 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
| CN115115681B (zh) * | 2022-07-08 | 2025-05-27 | 中国人民解放军陆军工程大学 | 针对地面目标的红外模型校核计算方法及装置 |
-
2001
- 2001-09-18 JP JP2001284095A patent/JP4140221B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2003091730A (ja) | 2003-03-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101364267B (zh) | 字符识别装置、字符识别方法及计算机产品 | |
| JP6354589B2 (ja) | 物体識別装置、方法及びプログラム | |
| JP5522408B2 (ja) | パターン認識装置 | |
| US6151423A (en) | Character recognition with document orientation determination | |
| EP0543590B1 (en) | Method for comparing word shapes | |
| US8036497B2 (en) | Method, program and apparatus for storing document and/or image using invariant values calculated from feature points and method, program and apparatus for retrieving document based on stored document and/or image | |
| JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
| Cheng et al. | Robust affine invariant feature extraction for image matching | |
| JPH05217019A (ja) | ビジネスフォーム識別システム及び画像処理システム | |
| US8687886B2 (en) | Method and apparatus for document image indexing and retrieval using multi-level document image structure and local features | |
| US6917708B2 (en) | Handwriting recognition by word separation into silhouette bar codes and other feature extraction | |
| CN107491730A (zh) | 一种基于图像处理的化验单识别方法 | |
| JP2001283152A (ja) | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JPH11250261A (ja) | 指紋画像特色相関器 | |
| JP4140221B2 (ja) | 画像照合装置および画像照合プログラム | |
| CN111401099A (zh) | 文本识别方法、装置以及存储介质 | |
| CN101261638A (zh) | 图像搜索的方法、装置及程序 | |
| CN111612045B (zh) | 一种获取目标检测数据集的通用方法 | |
| JP2007172077A (ja) | 画像検索システム及び方法及びプログラム | |
| JP2003109007A (ja) | 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置 | |
| CN101727579B (zh) | 变形字的检测方法、变形字中水印信息的确定方法及装置 | |
| JP3558493B2 (ja) | 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2000322514A (ja) | パターン抽出装置及び文字切り出し装置 | |
| JP4541995B2 (ja) | 図形認識方法 | |
| JP2001506383A (ja) | ピクセルマトリクス上で文字認識を実行する方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050428 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050428 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080213 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080226 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080423 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080520 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080602 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120620 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130620 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140620 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |
