JP5753473B2 - 二次元ビジュアルフィンガープリントを用いる複製ドキュメントコンテンツの検出方法 - Google Patents

二次元ビジュアルフィンガープリントを用いる複製ドキュメントコンテンツの検出方法 Download PDF

Info

Publication number
JP5753473B2
JP5753473B2 JP2011227416A JP2011227416A JP5753473B2 JP 5753473 B2 JP5753473 B2 JP 5753473B2 JP 2011227416 A JP2011227416 A JP 2011227416A JP 2011227416 A JP2011227416 A JP 2011227416A JP 5753473 B2 JP5753473 B2 JP 5753473B2
Authority
JP
Japan
Prior art keywords
fingerprint
document
page
image
keypoint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011227416A
Other languages
English (en)
Other versions
JP2012089132A (ja
JP2012089132A5 (ja
Inventor
ドロン・クレッター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2012089132A publication Critical patent/JP2012089132A/ja
Publication of JP2012089132A5 publication Critical patent/JP2012089132A5/ja
Application granted granted Critical
Publication of JP5753473B2 publication Critical patent/JP5753473B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本出願は、ドキュメントコンテンツの検出に関する。
複製ドキュメントコンテンツを検出する改善された方法への要求が増大している。また、大規模なドキュメントコレクションにおいて複製ドキュメントコンテンツを検出し、前記検出されるドキュメントコンテンツにおいて、複製または相違するドキュメントコンテンツを自動的に強調表示する方法が望まれている。
何らかの複製されたコンテンツを含む任意のページを自動的に発見し、この複製コンテンツまたはかかる発見された各ページとクエリページ画像との違いを自動的に強調表示することには利点がある。また、通常デジタルカメラまたは携帯電話のカメラで画像を走査、またはその写真を撮るプロセスの間に発生するスキュー、捻れ、回転、平行移動、スケール、解像度の変化及びこれらに類似するもの等、所定の画像歪に対してフィンガープリントをロバストにすることにも利点がある。また、アフィン変換または透視変換に対するフィンガープリントのロバスト性をさらに高めることも利点がある。
本開示のプロセスは、複製ドキュメントコンテンツを検出する方法であって、クエリドキュメントページをドキュメント検出システムへ入力することと、二次元ビジュアルフィンガープリント検出プロセスのビジュアルフィンガープリントを用いて、前記クエリドキュメントページをドキュメントコレクションに格納されたドキュメントのページと比較することと、前記二次元ビジュアルフィンガープリントの検出を用いる結果を基礎として、前記クエリドキュメントページの複製または異なるドキュメントコンテンツと、前記格納されたドキュメントコレクションの少なくとも1つのドキュメントページとを、自動的に強調表示することを含む方法を提供する。
また、本開示のプロセスには、大規模なドキュメントコレクションにおいて複製ドキュメントコンテンツを検出し、かつ二次元ビジュアルフィンガープリントを用いて前記検出されるドキュメントコンテンツにおいて複製または相違するドキュメントコンテンツを自動的に強調表示する方法であって、ドキュメントコレクションを生成することと、前記ドキュメントコレクションのドキュメントをビジュアルにフィンガープリントすることと、前記ドキュメントコレクションの前記フィンガープリントされたドキュメントにインデックスを付けることと、前記ドキュメントコレクションの前記ドキュメントの前記インデックスを付けられたフィンガープリントをメモリに記憶することと、クエリドキュメントをコンテンツ検出システムへ提示することと、前記クエリドキュメントをフィンガープリントすることと、前記ドキュメントコレクションの前記ドキュメントの前記インデックスを付けられたフィンガープリントを記憶する前記メモリにおいて、前記クエリドキュメントの前記フィンガープリントを調べることと、前記ドキュメントコレクションにおける、前記クエリドキュメントの前記フィンガープリントにマッチングするフィンガープリントを有するドキュメントのリストを返すことと、前記ドキュメントコレクションにおける前記クエリドキュメントにマッチングするフィンガープリントを有する各ドキュメントについて、フィンガープリント比較を実行することであって、前記比較は、前記フィンガープリントのロケーションと、比較されている前記ドキュメントにおけるその対応する配置とを比較することを含むことと、前記クエリドキュメントと前記ドキュメントコレクションの前記ドキュメントのうちの1つとの間の複製または非複製ドキュメントコレクションの一方を自動的に強調表示することを含む方法を提供する。
複製コンテンツの検出及び違いの強調表示の例を示す。 複製コンテンツの検出及び違いの強調表示の例を示す。 走査されるオリジナルページを示す。 修正された図3を示す。 フィンガープリントのロケーションを示す。 フィンガープリントのロケーションを示す。 フィンガープリントの比較分析の結果を示す。 フィンガープリントの比較分析の結果を示す。 ある環境を提示する。 ある方法を示す。 ある方法を示す。 ある方法を示す。 ある方法である。 三角形の比の取得方法を示す。 三角形の比の量子化である。 ある方法である。 ある方法を示す。 ある方法を示す。 ある方法である。
図1及び図2は、二次元(2D)ビジュアルフィンガープリント及び強調表示の方法を示している。各ドキュメントページ100及び200のビジュアルフィンガープリントが抽出され、これらのフィンガープリントは複製ドキュメントコンテンツを識別するために比較される。アフィンまたは透視不変フィンガープリントを用いることにより、同一コンテンツの対応するドキュメントエリアは、ページの方向性及びスケールに関わらず、マッチングビジュアルフィンガープリントを生み出す。オリジナルページと修正ページとの違いは、強調表示される。
従って調査者は、相違する主要なエリアに迅速に注目することができる(長円形120、210、220で強調表示されている)。
図3は、走査されるオリジナルページ300を示している。図4は、走査される修正ページ400のクエリ画像を示している。クエリページ画像400は、意図的に加えられた(例えば、タイムスタンプ及びドキュメント識別子)、並びにコンテンツ変更修正(例えば、名前の変更及びファックスヘッダ)テキスト注釈を含む。
本出願は、コレクションにおける、クエリページ画像400の何らかの複製されたコンテンツを含む任意のページを自動的に発見し、この複製コンテンツを、またはこのような発見された各ページとクエリページ画像との違いを自動的に強調表示する。
2Dビジュアルフィンガープリント技術は、上記をアドレス指定するために用いられる。まず、ドキュメントコレクション内のページは、ビジュアルフィンガープリントを抽出してフィンガープリントインデックスを構築するように処理される。コレクションへのインデックス付けは一度行われるだけでよく、これは、事前に行われることが可能である。
図5は、図3における走査オリジナルページに関して発見されたフィンガープリントロケーションがそのページの走査オリジナルコンテンツ上にスーパーインポーズされた画像500を示している。フィンガープリントロケーションはノードの円502(1つのサンプリングしか付番されていない)として示され、線分504(1つのサンプリングしか付番されていない)のグリッドメッシュはフィンガープリントロケーションを繋いでいる。
クエリページ画像は、類似方法で処理される。図6は、図4におけるクエリ画像に関して発見されたフィンガープリントロケーションを伴った画像600を示している。フィンガープリントロケーションはノードの円602(1つのサンプリングしか付番されていない)として示され、線分604(1つのサンプリングしか付番されていない)のグリッドメッシュはフィンガープリントロケーションを繋いでいる。
図6におけるクエリ画像のグリッドメッシュ構造を図5における走査オリジナルのグリッドメッシュ構造と比較すると、共通する部分及び異なる部分を識別することができる。
クエリページ画像のフィンガープリントはドキュメントコレクションのフィンガープリントインデックスにおいて、そのコレクションにおける、所定数の類似するフィンガープリントを有する全ページを検索するために調べられる。
マッチングするページはマッチングするフィンガープリントの数を基礎として類似性レベルによって等級を付けられ、降順でソートされる。結果として得られるページは、クエリ画像に対する等級付けされた類似性の順序でユーザへ提示される。
返された各ページに対しては、クエリ画像のフィンガープリントとのフィンガープリント一致関係を決定するためにフィンガープリントの比較分析が実行される。分析は、一意の(非一致)フィンガープリントのクラスタを識別し、各クラスタについて、クラスタの分布及びクラスタの内部またはクラスタに極く近接して発生する一致するフィンガープリントの数、クラスタフィンガープリントの密度、他等の他の要素に比例する2Dビジュアル測度(例えば、長円)を計算する。
結果的に生じる長円集合は、クエリページ画像に対する違いのエリアを自動的に強調表示するために、ビジュアル画像ディスプレイ上へ追加またはスーパーインポーズされる。
図7及び図8は、図4におけるクエリページ画像と図3における走査オリジナルページとのフィンガープリント比較分析の結果を示す。図7は、長円702、704で囲まれた2つの非一致フィンガープリントクラスタで増強された、図3におけるドキュメントページを示している。これらのクラスタは、走査オリジナルページにおける、クエリ画像と共通していないエリアを表す。右下の角におけるクラスタを囲む長円704のコンテンツは、「USW 2159」と記されたドキュメント識別ラベルであり、これはオリジナルドキュメントの一部ではないと理解されることに留意されたい。各ドキュメントには、走査プロセスの一部として一意のラベルがスタンピングされる。この事例における点線は、一意の識別スタンプを示している。
図8は、図4におけるクエリ画像のフィンガープリント比較分析の結果800を、長円802、804、806によって強調表示された図3におけるドキュメントページとの違いと共に示している。図8の上側における2つの実線長円802、804は、オリジナルドキュメントのコンテンツに対する変化、即ちタイムスタンプ及びテキスト修正の各注釈を強調表示している。図8の右下における点線の長円806は、走査プロセスの一部として追加された一意の識別スタンプを示している。図7及び図8には円及びグリッド線が示されているが、実際にはこれらは示されなくてもよく、よって、出力された比較は図1及び図2に示されているもののように見えると思われる。
図4は、図3に示されているオリジナルページの走査/ファックスされたコピーの一例を示しているが、図4の走査/ファックスされた画像は、回転された修正済みのファックスページである。
本明細書に記述されているシステム及び方法は、図9に示されているような環境またはネットワークにおいて動作してもよい。ネットワーク900は一連のワイヤ902等の接続部で構成され、ワイヤ902はワイヤ接合部904で第3のワイヤ906と分岐し、スタンドアロン型周辺デバイスに接続してもよく、または周辺機器を通過してコンピュータ908、909等の他のデバイスへ接続してもよい。ネットワークは、カラープリンタ910またはカラー以外のプリンタ912、カラーレーザプリンタ920、922またはカラーレーザ以外の1つのプリンタ924を組み込んでもよい。またネットワークは、スキャナ930、ファックス機940、写真複写機950、カラー写真複写機952、カラープリンタ/スキャナ/ファックス機のコンビネーション954も組み込んでもよい。またネットワークは、コンピュータ端末960またはスタンドアロン型ハードドライブデータ記憶媒体964も含んでもよい。またネットワークは、無線ネットワーク送受信機970及びラップトップコンピュータ972または複数のラップトップコンピュータ974とのインタフェースも含んでもよい。ネットワークは、インターネット、イントラネットまたは他の通信ネットワークを含む、但しこれらに限定されない任意の形式のネットワーク980と接続してもよい。本システム及び方法は、デジタル静止画カメラ991、デジタルビデオカメラ992、携帯電話993、スキャナ994、パーソナルデータアシスタント995またはドキュメントインデクシングシステム996を含む複数の周辺データ捕捉デバイス990とインタフェースしてもよい。本概念は、単一デバイスを有するネットワークから何千もの、またはそれ以上の接続デバイスを含むネットワークに至る、上述のコンポーネントの様々な組合せを有するネットワークにおいて実装されてもよい。さらに、上述のコンポーネントのうちの様々なものは、記述される概念の実装に有用であり得る幾つかの既知の構成のうちの何れにも配置されるメモリ記憶領域を有してもよい。記憶領域は、RAM、ROM、フラッシュメモリ、ウェブサービス、クラウド記憶ファシリティまたは本出願の概念を組み込むソフトウェアを保持できる他のメモリタイプであってもよい。コンピュータ等、但しこれに限定されない図9のコンポーネントのうちの様々なものは、コンポーネント上にロードされたソフトウェア、またはその他コンポーネントによってアクセス可能なソフトウェアからの命令を処理するためのプロセッサを含む。プロセッサを有するコンポーネントのうちの様々なものは2つ以上のプロセッサを有してもよく、よって命令の処理が複数のプロセッサ間で分割され得ることは理解されるべきである。或いは、単一のプロセッサは命令を分けるように動作することができ、よって処理はマルチスレッド環境において発生することが可能である。コンピュータは上述のもの以外の演算デバイスであってもよく、電子/デジタルプロセッサ並びに、または代替的にグラフィカル電子/デジタルプロセッサ(GPU)を含む。
図10は、大規模なドキュメントコレクションにおける複製ドキュメントコンテンツを検出し、かつ2Dビジュアルフィンガープリントを用いて複製/相違ドキュメントコンテンツを自動的に強調表示する方法1000を示している。まず、ドキュメントコレクション1002にインデックスが付され、フィンガープリントの高速かつ効率的ルックアップ1004に合わせた特別な方法(ファン木の使用等)で編成される。このコンテキストにおけるドキュメントコレクションは、1つのロケーションに物理的に位置決めされても、多くのフォルダ、ドライブ、システム、ネットワーク、リモートサーバ、ウェブサービス及び/またはクラウド記憶ファシリティ、他に及ぶサブコレクションの集合において物理的に分散されてもよい抽象論理的なドキュメントコレクションである。
ビジュアルフィンガープリント及びインデクシングプロセス1004は、コレクション内のドキュメントのページへ適用される。各画像のフィンガープリント及びそのロケーションは、メモリ内に見出されるフィンガープリントルックアップインデックス1006へ追加される。
フィンガープリントルックアップインデックス1006は、所定の1つのドキュメントコレクションについて一度完全に構築されるだけでよい。このようにしてコレクションにインデックスが付されれば、このフィンガープリントインデックスは保存されて再使用されることが可能である。フィンガープリントインデックスは、ドキュメントがコレクションに追加されると、またはコレクションから除去されると、インデックスへ新しいドキュメントのフィンガープリントを追加すること、及び削除されるドキュメントの既存のフィンガープリントを除去することによって増分的に更新されることが可能である。増分更新は、別個のスレッドにおけるバックグラウンドプロセスとして適用されてもよい。
複製ドキュメントコンテンツの検出方法は、クエリページ画像1008によって提示される。クエリページ画像はフィンガープリントされ、これらのフィンガープリントは1010においてフィンガープリントルックアップインデックス内で調べられ、コレクションドキュメントのリスト及びクエリページ画像フィンガープリントに一致するマッチングフィンガープリントの数が返される。返されたコレクションドキュメントのリストは、対応するフィンガープリントの数によって(例えば、最大から最小へ)順序づけされる。必要最小限の対応するフィンガープリントより上のマッチングするトップページのみが保持されてもよい。
コレクション内の各マッチングページについて、メモリから一致するフィンガープリントが検索され、クエリフィンガープリント1012と比較される。このフィンガープリント比較分析は、クエリページ画像とマッチングドキュメントとの間のフィンガープリントの一致関係を決定するために実行される。分析は、フィンガープリントのロケーション及び対応するその配置を考慮する。一致する同一フィンガープリントの集合はマッチングするドキュメントコンテンツの領域を表し、一方で双方の画像における一意の(非一致)フィンガープリントのクラスタはドキュメントコンテンツの違いを表す。プロセスが採用されているアプリケーションに依存して、複製または非複製ドキュメントコンテンツの何れかが自動的に強調表示されてもよい。複製及び略複製コンテンツを検出するアプリケーションでは、複製コンテンツ(どの場合も2画像間で同一である)ではなく、コンテンツの違いを強調表示することが望ましい場合が多い。
違いを自動的に強調表示する一方法は、クエリ及びマッチング画像コレクションドキュメントの一意の(非一致)フィンガープリントの各クラスタの2Dロケーションに関する平均及び標準偏差を計算することである。非一致フィンガープリントの各クラスタについて、長円が計算される。長円のロケーションはクラスタ平均に中心が置かれ、かつ長円のサイズは、クラスタ内のフィンガープリントロケーション分布の推定される二次モーメントに比例する。さらに、長円のサイズは、クラスタ内部またはクラスタに極く近接して発生する任意の一致するフィンガープリントの数及びロケーションに比例して、かつクラスタの複雑さ、形状及びフィンガープリント密度によってさらに制御されてもよい。結果的に生じる長円はビジュアル画像ディスプレイの上に強調色で描かれ、またはスーパーインポーズされ、もしくは別個の画像層またはメタデータに保存される。
図11は、フィンガープリントルックアップインデックス1006(図10参照)を生成するためにドキュメントコレクションのインデクシングの追加的詳細を提供するインデクシング方法1100を示す。インデクシング方法1100は、ページ画像シーケンスを処理することと、ビジュアルフィンガープリントを計算することと、フィンガープリント及びそのロケーションを指定された画像フィンガープリントルックアップインデックスへ追加することから構成される。
本実施形態において、プロセス1100は、走査されるハードコピードキュメント1102及び/または電子的生成ドキュメント1104を含むドキュメントコレクションに関連して使用されるように示されている。異なるドキュメントタイプは、異なる前処理を必要とする。走査されるハードコピードキュメントは、例えばファックスまたはスキャナのノイズ、ページのスキュー及び画像のダークバックグラウンド等の理想的とは言えない状態を含み得る走査されるページ画像から成る。画像処理ステージ1106は、フィンガープリントに先行して画像を修復しかつさらに増強するために含まれてもよい。これに対して、例えばMicrosoft Word、Excel、PowerPointまたはAdobe PDF等の電子ドキュメント1104は、1108において、フィンガープリント用のページ画像シーケンスを生成すべくコンテンツを描くことによってレンダリングされる。
インデクシング方法1100は、コレクション内のドキュメントからのページ画像1110を処理する。ドキュメントをインデクシングする順序は、重大ではない。コレクション内の各ドキュメントについて、システムは、ドキュメントのタイプ、即ち走査されるハードコピーまたは電子ドキュメントがオリジナルであるかどうかを自動的に決定し、かつ適切な処理1106または1108を各々自動的に適用する。
キーポイント識別1112は、各ページ画像における安定しかつ反復可能なキーポイントの識別を担当する。ドキュメントまたは写真ページ画像においてキーポイントを発見する先に開発された方法が、展開されている。ある実施形態は、Kletter、他の「局在化された二次元ビジュアルフィンガープリントを用いてドキュメントコレクションにおけるドキュメント画像を発見する方法及びシステム」と題する米国特許出願第12/147,624号に記述されているワードブロブのセントロイドを基礎としている。
別の実施形態は、Kletterによる「局在化されたスケール空間特性を用いて写真画像における安定したキーポイントを発見するシステム及び方法」と題する米国特許出願第12/147,867号に詳述されている。
アプリケーションに依存して、所定の強度しきい値測度より下で発見されるより弱いキーポイントは放棄されてもよい。
1114では、結果的に得られたキーポイントから2Dビジュアルフィンガープリントが計算される。画像キーポイントからビジュアルフィンガープリントを計算する先に開発された方法が、ジオメトリまたは画像外観を基礎として展開されている。ある実施形態では、ジオメトリを基礎としてドキュメント画像の2Dビジュアルフィンガープリントを計算する方法が、Kletter、他の「局在化された二次元ビジュアルフィンガープリントを用いてドキュメントコレクションにおけるドキュメント画像を発見する方法及びシステム」と題する20080166−US−NPに記述されている。
1116では、結果的に得られたフィンガープリント及びそのロケーションが画像コレクションのフィンガープリントインデックス1006へ追加される。画像のフィンガープリントはインデックスへ追加され、高速かつ効率的なルックアップ(例えば、ファン木の使用等による)を促進するために特別な方法でハッシュされる。ある実施形態では、高速ルックアップ用にメモリ内のフィンガープリントを編成する効率的な一方法がKletter、他の「局在化された二次元ビジュアルフィンガープリントを用いてドキュメントコレクションにおけるドキュメント画像を発見する方法及びシステム」と題する米国特許出願第12/147,624号に記述されている。
Kletterによる「局在化された二次元ビジュアルフィンガープリントを用いて画像コレクションにおいて写真画像を発見するシステムと方法」と題する米国特許出願第12/163,186号には、画像コレクションにおいて写真画像を発見するための別の実施形態が記述されている
コレクション内の各ドキュメントの各ページに対するプロセス1100は、最後のページ画像1118に出合うまで反復される。出合った時点で、結果的に得られたフィンガープリントルックアップインデックス1006(図10も参照)は保存され、かつ再使用されてもよい。フィンガープリントルックアップインデックス1006は、先に段落[0021]において概説したように、追加のページがコレクションに加えられると、またはコレクションから除去されると増分的に更新されることが可能である。
図12は、クエリ画像を使用する2Dビジュアルフィンガープリントを用いて複製ドキュメントコンテンツを検出し、コンテンツの違いを自動的に強調表示しかつページの類似性レベル毎にページへ等級を付けるクエリ処理/方法1200を示している。
クエリ処理1200は、入力にクエリのページが提示されることによって始まる。先に述べたように、本明細書に記述されているシステムは、走査されるドキュメント1202及び電子ドキュメント1204を含む、但しこれに限定されない様々なドキュメントタイプによって動作する。クエリページ自体は、走査されるハードコピードキュメント1202のページであっても、電子ドキュメント1204のページ画像であってもよい。システムは、先に概説したように、ドキュメントのタイプ、即ち走査されるハードコピーまたは電子ドキュメントがオリジナルであるかどうかを(例えば、添付の情報ファイルを読むことによって)自動的に決定し、かつ適切な処理1206、1208を各々自動的に適用する。システムは、フィンガープリントに先立って改善されたクエリ画像1210を生成するために、画像処理を適用して劣化した走査用ハードコピークエリページ1202を清浄化しかつ増強してもよい。或いは、システムは、Microsoft Word、PowerPointまたはPDFドキュメントページの電子クエリページをクエリ画像1210にレンダリングしてもよい。このとき、処理は、ドキュメントコレクションのページ画像ではなくクエリページ画像の画像に対して行われている。
クエリページ画像には、インデクシングの間に用いられる、1212においてキーポイントを識別しかつ1214において2Dビジュアルフィンガープリントを計算する方法と同じ方法が適用される。結果として得られるフィンガープリントは、1216においてコレクションのフィンガープリントルックアップインデックス1006におけるクエリとして調べられ、ドキュメントコレクションから、クエリページ画像フィンガープリントへマッチングする一致フィンガープリントを有するマッチングページのリスト1218が返される。リストは、マッチングする一致フィンガープリントの数、即ちマッチランクによって順序づけされる。
次にプロセスは、1220において、リストからのページの1つをマッチングページ1222として識別する(次ページ画像を得る)。マッチングページ1222の一致フィンガープリントが、メモリインデックス1006から検索される。次に、1226において、マッチングページ1222のフィンガープリントとクエリページ画像のフィンガープリント配置1224とがフィンガープリント比較分析を受ける。このフィンガープリント比較分析は、クエリページ画像とこのマッチングドキュメントページとの間のフィンガープリントの一致関係を決定するために実行される。分析は、フィンガープリントのロケーションと対応する配置とを比較し、クエリ及びマッチングドキュメント画像における一意の(非一致)フィンガープリントのクラスタを識別する。分析は、マッチングするフィンガープリントロケーションを基礎として、マッチングドキュメントページのクエリページ画像との類似性レベルを計算する。
1228では、コンテンツの違いが強調表示される。例えば、各クラスタについて長円が計算される。但し、長円のサイズは、クラスタ内のフィンガープリントロケーションの推定される二次モーメントに比例する。長円のサイズはさらに、クラスタ内部またはクラスタに極く近接して発生する一致フィンガープリントの数及びロケーションに比例して、かつクラスタの複雑さ、形状及びフィンガープリント密度によって調整されてもよい。
返された全ページに対する長円はビジュアル画像ディスプレイの上に強調色で追加またはスーパーインポーズされ、もしくは別個の画像層または注釈付きメタデータに保存される。
フィンガープリント比較分析によって計算された、クエリ画像との指定されたページ類似性レベルに適合する、またはこれを超過する返されたページは各々、一致ドキュメントのリストへ追加される。
プロセスは、1230において、その時点のページ画像がマッチングページのリストの最後のページであるかどうかをチェックする。最後のページでなければ、プロセスは1220においてリストから次のページ画像を取得し、最後のマッチングするページ画像に遭遇するまでコレクション内の返されたページの各々について処理を反復し、1232において完了する。この時点で、マッチングする一致ドキュメントのリストは、複製度が最も高いコンテンツを有するページがまず返されるように、ページ類似性レベルによって等級をつけられる。
最後に、ユーザは一致ドキュメントのリストにざっと目を通すことができる。
以下、キーポイントの識別、フィンガープリントの生成及びファン木の構築に関する上述の論考を、図13−図17に関連して拡大する。
a.1 ドキュメントのキーポイントの検出
キーポイント識別(例えば、図11の1112及び図12の1212)の目的は、ノイズ、光景照明変動及びスキュー、捻れ、回転、平行移動、スケール、解像度変化及びこれらに類似するもの等のアフィン変換のうちの、但しこれらに限定されない少なくとも1つによって劣化された画像バージョンにおいても、できるだけ多くのキーポイントを発見することにある。
図13には、フィンガープリントされるべきターゲット画像1310のドキュメントキーポイントロケーションを検出する一プロセス1300が示されている。
第1の適応しきい値モジュール1320のバイナリ出力画像1325は、CCサイズ推定モジュール1330へ送信される。この場合、CCという用語は「接続されるコンポーネント」の略語であって、同じ極性を有するバイナリピクセルの最大限に接続されたサブグループである。2つのピクセルは、両者間に同じ極性のピクセル経路が存在する場合に限り、同じ接続コンポーネント内に存在する。CCサイズ推定モジュール1330の目的は、ターゲット画像1310について一画像毎に、後続の放射状ブラーモジュール1340において適用されるべきブラーパラメータ1335またはブラーフィルタサイズを動的に推定することにある。ブラーリングプロセスの目的は、ロバストで高信頼的かつ反復可能なキーポイント識別を提供することにある。またブラーリングは、ごま塩ノイズ等のノイズを除去しかつページ上の小さい隔絶された特徴を排除することに役立つ。例えば近似ガウス形状である、但しこれに限定されないブラーフィルタの形状は、望ましくないアーチファクトの導入を防止するに足る滑らかなものであるべきである。
放射状ブラーモジュール1340の出力は、グレースケール画像1345である。適応しきい値モジュール1350は、グレースケール放射状ブラー1340の画像出力1345を適応しきい値化1350によってバイナリ白黒出力1355に変換する。
第2の適応しきい値モジュール1350のバイナリ出力は2値画像1355であり、接続コンポーネントモジュール1360へ転送される。接続コンポーネント法は技術上周知であり、グラフの最大限に接続されたコンポーネントの集合について考察し得る。
重心計算モジュール1370は、接続コンポーネントモジュール1360の出力における各接続コンポーネントの視覚的中心を決定する。接続コンポーネントの各々について、その水平重心位置が、接続コンポーネントの各帰属ピクセルの水平座標を合計しかつその結果を帰属ピクセル総数で除算することによって計算される。垂直重心位置も同様に、各帰属ピクセルの垂直座標を合計して帰属ピクセル数で除算することによって計算される。合計は、接続コンポーネントの分析中にオンザフライで効果的に実行されることが可能である。所定の接続コンポーネントのピクセルメンバのみが、その重心位置に寄与し、他の任意の非帰属ピクセルの「ホール」は無視されることに留意されたい。各接続コンポーネントの視覚的重心はサブピクセル精度で計算されるが、これは、多くの言語において、接続コンポーネントはテキストラインに定置される傾向があるためである。
キーポイント識別段階の最後の処理ステップでは、重心計算モジュール1370からの接続コンポーネント重心位置1375のリストが複製除去モジュール1380によって認証され、複製除去モジュール1380はキーポイント1385のリストを生成する。認証の目的は、2つの接続コンポーネントが所定の許容差レベル内に同じ重心位置を持たないことの保証にある。ほぼ同じ重心位置を有する複製接続コンポーネントは除去される。
複製除去モジュール1380の出力における残りの接続コンポーネント重心のリストは、最終的なクエリキーポイントリスト候補1395となる。キーポイント候補1390の全体数は、入力画像のコンテンツ及び接続コンポーネントの処理タイプに依存する。ある典型的な機械印刷ページには、数百個のキーポイントが存在し得る。
a.2 フィンガープリントの構成
次に、局在的なキーポイントグループからフィンガープリントを計算しかつこれらのフィンガープリントを圧縮してフィンガープリントルックアップインデックスまたはデータベース(例えば、図10、図11、図12の1006)に効率的に記憶するプロセスについて説明する。フィンガープリントは、フィンガープリントのルックアップインデックスまたはデータベースのサイズを縮小しかつ格納要件を低減するために圧縮される。
フィンガープリントは、所定のキーポイントとその最近の(N−1)個の近傍キーポイントとの相対的2D位置から導出される、持続的比率と呼ばれる量子化された変換−不変2D比のシーケンスとして構築される。従って、各フィンガープリントは、特定のキーポイント辺りの小さい画像近傍へ局在化される。フィンガープリントシーケンスは、特定のキーポイントとその最近の(N−1)個の近傍キーポイントとの間の相対的な2Dジオメトリにのみ依存する。近傍キーポイントの数Nは、フィンガープリントの強度に影響する設計パラメータである。
本出願は、通常デジタルカメラまたは携帯電話のカメラで画像を走査する、または写真を撮るプロセスの間に発生するスキュー、捻れ、回転、平行移動、スケール、解像度の変化及びこれらに類似するもの等の、但しこれらに限定されない所定の画像歪に対してフィンガープリントをロバストにする。
図14に示されているように、オブジェクト表面上で三角形ABC1450及び第2の三角形ACD1460を構成する同一直線上にない4つの点{A,B,C,D}(即ち、1410,1420,1430,1440)から成る任意の所定の多角形1400の場合、三角形の面積比(ABC/ACD)1470が任意のアフィン変換下で一定のままであることは技術上周知である。故に、三角形の比1470として示されている1つの三角形の面積比の計算に必要な点は、P=4個のみである。このアフィン変換は、多くの実際的状況におけるカメラ対平坦オブジェクトのジオメトリを説明するための容認できるモデルを提供するために示されている。
別の実施形態において、この変換は、2つの三角形比の積である1つの持続的比率を計算するために、(4ではなく)P=5点を用いて透視変換を処理するように拡張されることが可能である。
従って、単一のフィンガープリントは、時計回り順にソートされた最近のN個の近傍キーポイントによるグループに関する量子化された持続的変換比率のシーケンスで構成される。フィンガープリントのサイズを小さく保つために、変換率はQレベル1480に量子化される。ある実施形態において、Qの値は、便宜的に、2進法の2のべき乗であるように選択されることが可能である。図14Bには、Q=8の場合の量子化プロセスが図14Aの三角形の比1480の量子化として示されている。量子化前の三角形の比の有効範囲(0,∞)は、図14B(1490)に示されているように、「0」から「7」まででラベリングされたQ=8個の区間に分けられる。区間の境界は、代表的ドキュメントの大集合に渡って量子化ラベルの略均一な分布をもたらすように経験的に決定される。到来する三角形比の値1480は、増大する区間境界と順次比較されて第1の高次または等しい区間境界が決定され、この時点でプロセスは終了し、対応するラベル区間が量子化された結果として割り当てられる。例えば、1.0より低くかつ先行する区間境界より高い到来する三角形の比0.8253694には、量子化された値「3」が割り当てられる。
最近近傍法の使用における潜在的問題は、透視変換下では近いことが必ずしも持続されない点にある。任意のアフィン変換または透視変換下では、所定のキーポイントの最近のN個の近傍キーポイントが正確に同じN個のキーポイントであり続けるという保証はあり得ない。それでも、最も近いキーポイントは、もっと遠いキーポイントよりも最近のN個の近傍キーポイントのリスト内に留まる傾向が強い。
上述の問題を克服するために、本出願は、アフィン変換または透視変換に対するフィンガープリントのロバスト性をさらに高めるべく近傍キーポイントのうちの1つまたはそれ以上の不在を許容することを提案する。ある実施形態下では、1つのキーポイントは、局在化された小さい近傍においてアフィン歪が限定的であることを考慮して、除外されることが許容される。従って、所定の各キーポイントは、一度に1つのキーポイントを除外することによって幾つかのフィンガープリントNを生み出す。各フィンガープリントは、残りのキーポイント数、N−1個を放射状の方位順で体系的に歩き、かつP個の点の組合せとして可能な全てのもの(アフィン変換のP=4、透視変換のP=5)について量子化された持続的比率のシーケンスを記録することによって生成される。
図15には、フィンガープリントのプロセス1500が示されている。フィンガープリントプロセス1500への入力は、入力画像1505に関するキーポイント候補1510のリストである。図15におけるフィンガープリントの第1の処理ステップは、キーポイント三角形分割モジュール1520である。この実施形態では、ドロネーまたはキーポイント三角形分割1520は、局在的近傍において所定の各キーポイントに最も近いキーポイントを識別するために使用される。三角形分割のリンクに従うことにより、所定の任意キーポイントに最も近い(N−1)個の近傍キーポイントを効果的に決定することができる。
各キーポイント候補及びその最も近い(N−1)個の近傍キーポイントは、フィンガープリント候補として考慮される。現行のキーポイント候補Kpは各々、入力リスト1510から次のキーポイント取得モジュール1530によって順次選択される。各キーポイントKpについて、最近近傍キーポイント発見モジュール1540は、所定のキーポイントKpへの距離が最も近い(N−1)個の最近キーポイントを識別する。但し、Nは所定の変数である。最近近傍キーポイント発見モジュールは、ドロネーまたはキーポイント三角形分割結果1520を用いて、Kpからの距離の増大順にソートされたKpへの最近キーポイントのリストを返す。返されるリストの最初のエレメントは、常に現行キーポイントKp(距離ゼロ)である。変数Nの値は、1フィンガープリント当たりの演算数として定量化されるフィンガープリントの「強度」または識別力、即ち全体的なシステムパフォーマンスと、結果的に生じるデータベースのサイズまたはフィンガープリントサイズとの間に妥当な得失評価をもたらすように調整される。本例では、値N=8、12または16が使用される。
最近近傍キーポイント発見モジュール1540の点は、面積比のシーケンスがデータベース画像とクエリ画像との間で同じキーポイント/近傍に対して一貫性があるように、一貫した順序で取り入れられる必要がある。時計回り順ソートモジュール1550は、所定のキーポイントに最も近いN個の近傍キーポイントのリストを時計回り方位の増大順にソートする。
時計回り順ソートモジュール1550は、ほぼ同一直線上にあるキーポイントの一般的事例に対してキーポイントの順序づけを安定させるための方法及びシステムを含む。時計回り順ソートモジュール1550は、リスト上の(所定のキーポイントに最も近い)最初のM個の最近近傍キーポイントを用いてサブグループの起原の中心を計算する。但し、M<Nである。最も遠い(N−M)個のキーポイントは、アフィン変換または透視変換下では起原が安定したままであることを保証するために、サブグループの起原の中心の計算には使用されない。時計回り順ソートモジュール1550は、キーポイントの順序づけを決定するために、合計N=8の場合はM=5個の最近近傍キーポイントの平均位置を起原の中心として使用する。
現行の近傍キーポイントクラスタの起原の中心を決定した後、時計回り順ソートモジュール1550は、キーポイントを時計回り方位の増大順にソートすることに進む。ソートは、方位及び距離の双方に基づいて行われる。順序は、時計回り方位の増大順である。2つ以上の点がほぼ同じ方位を有していて、その差が予め規定された許容差レベル内であれば、これらの点は略類似方位の全ての点について距離の増大順にさらに順序づけされる。
N個のキーポイントによる一意の部分集合の各々について、次のサブグループ組合せモジュール1560は、アフィン変換または透視変換の場合に依存して、次のサブグループの組合せであるP=4またはP=5個のキーポイントを体系的かつ系統的に選択する。例えば、N=8の場合、P=4のキーポイントサブグループには一意の組合せが70存在する。
P=4個のキーポイントの次のサブグループの組合せの各々について、圧縮された量子化比率モジュール1570は単一の持続的比率を計算し、かつ予め規定された区間境界しきい値の集合を用いてこれを量子化する。量子化レベルの数Qは、設計パラメータである。これらの例では、Q=8、またはQ=16が使用されている。量子化しきい値は、特定タイプのドキュメントの大型コレクションにおける持続的比率の分布を調査することによって経験的に決定される。
フィンガープリントデータベース1585のサイズをさらに縮小するために、圧縮された量子化比率モジュール1570は、結果的に生じる幾つかの量子化された持続的比率を1つの機械語に圧縮する。例えば、N=8、P=4及びQ=8の場合、70のサブグループ組合せの全体的なフィンガープリントシーケンスは3つ以下の64ビットワードに密に圧縮されることが可能である。本出願のある実施形態では、圧縮されたフィンガープリントのサイズは、合計3つの64ビットワード及び3つの8ビットバイトを占有し、複数のワードまたはバイトに渡って部分的情報を分割する必要はない。
フィンガープリントを計算して圧縮するプロセスは、一度に1つの持続的比率で、最終組合せモジュール1580によって最後の組合せが検出されるまで順次継続する。現行のPサブグループ組合せがまだ最後の組合せ1581でなければ、最終組合せモジュール1580は、次のPサブグループを取得しかつその量子化された持続的比率の計算及びその圧縮へと進むためにこの流れを次のサブグループ組合せモジュール1560へとルーティングして戻す。このプロセスは、1582において最後のPサブグループ組合せが処理されるまで続く。最後のPサブグループ組合せが処理された時点で、結果的に得られる圧縮されたフィンガープリントデータ1583はフィンガープリントデータベース1585へ書き込まれる。フィンガープリントデータは、圧縮された各フィンガープリントデータが利用可能になるにつれて、フィンガープリントデータベース1585へ一度に1つのフィンガープリントについて順次書き込まれることが可能である。
最後に、フィンガープリントを書き込むプロセスは、残りの全てのキーポイントについて、最終キーポイントモジュール1590によって最後のキーポイントが検出されるまで順次継続する。現行のキーポイント組合せがまだ最後のキーポイント1591でなければ、最終キーポイントモジュール1590は、次のキーポイントを取得しかつプロセスを反復してその圧縮されたフィンガープリントの計算及びフィンガープリントデータベース1585へのその追加へと進むためにこの流れを次のキーポイント取得モジュール1530へとルーティングして戻す。フィンガープリントプロセスは、1592において最後のキーポイント組合せの最後の一致フィンガープリントが処理されてフィンガープリントデータベース1585へ追加されるまでこうして継続される。最後のキーポイントがアドレス指定されていれば、1595においてプロセスは終了する。
図16A−図16Bには、フィンガープリントの起原の中心を計算する方法が示されている。図16Aは、所定の画像例1600に関するプロセスを示す。処理画像は、キーポイントまたはワードの重心が円1601−1602等の円によって識別されて示されている。図中の他の円も、やはりワードの重心である。例えば、数字(1−7)もまた、点Xに近い近傍キーポイントであるワードの重心を表している。図16Bは、明瞭さを高めるために背景の処理画像を除去しているが、他は図16Aと同じである。この例では、局在的近傍における7つの追加キーポイント(1−7)を用いてキーポイントXのフィンガープリントが計算される。第1のステップにおいて、このフィンガープリントの起原の中心はキーポイントXに最も近いM=5個のキーポイントを用いて、即ち点{X,1,2,3及び5}の平均位置を用いて計算される。これは、起原の中心を点Xから離れて、かつキーポイントXを含むテキストラインYに沿ってキーポイントの同一直線上にあるラインから離れて、点0への矢印線1620に従って新たな起原の中心へと移動させるものと思われる。7個(1−7)のうちで最も遠い3つのキーポイント(4,6,7)は、任意のアフィン変換または透視変換によって点3つまではシフトされるものと見込むことによって点0の位置を安定させるために、起原の中心の計算には使用されない。第2のステップでは、8個のキーポイント(X及び1−7)の全体集合が、新たに計算されたサブグループの起原の中心(0)に対して時計回り順1610にソートされ、この場合は結果的に、(1,X,2,3,4,5,6,7)という最終的な出力シーケンス順序が得られる。上述の順序づけは、基準点に依存する。基準点として「0」が使用されれば、1は「0」からの点線より上にあることから、結果的なシーケンスは234X5671となっていたであろう。本明細書における代替方法は、Xを基準として使用し続けるがキーポイントの質量は「0」へ移動されるものと見せかけることであり、これにより先に述べたシーケンスがもたらされる。先では、基準として原初のキーポイント位置を保つ一方で、点「0」はXの回りを移動してキーポイントシーケンス順をひっくり返させ得ることから、後者が使用されていた。しかしながらこれは、どちらの場合も達成される必要があるものはターゲット画像及びクエリ画像の双方で同じシーケンスを反復できることであるという理由により、どちらの方法で行うことも可能である。第2のステップの目的は、距離ではなく時計回り順にソートすることである。
所定のキーポイントについて最近のN個の近傍キーポイントの順序づけが確立されると、フィンガープリントを生成することができる。フィンガープリントは、近傍におけるキーポイントによるサイズP=4の連続する部分集合から、一度に1つまたはそれ以上のキーポイントを除外しかつ除外されないキーポイントで残りのサブグループ組合せのシーケンスを構築することによって形成される。従って、サブグループ組合せの圧縮されたシーケンスからフィンガープリントのグループを効果的に構築することができる。N個のキーポイントによるP個の部分集合は、体系的かつ一貫した方式で考察される。その各々について、本明細書で記述しているように、そのP部分集合の持続的面積比を計算しかつその面積比を整数にマッピングすることによって整数が決定される。所定のキーポイントのフィンガープリントの長さは、このようなP個の部分集合の合計数である。これは、N個のキーポイントから一意のP個のキーポイントを選択するための組合せの数によって決定される。例えば、N=8及びP=4であれば、サブグループ組合せとして可能性のある数は70個の持続的比率である。このうち、各々長さが35サブグループ組合せである8個のフィンガープリントは、例えば一度に1つのキーポイントを除外することによって構築されることが可能である。
a.3 高速マッチングのためのフィンガープリント情報の作成
図15において、フィンガープリントデータベース1585内のフィンガープリントは、メモリサイズ及びロード時間を縮小するために圧縮フォーマットで記憶されることから、効率的なフィンガープリントマッチングを促進するために、まず解凍されかつファン木データ構造に従って一意の方法で編成し直されなければならない。フィンガープリントデータベースは、最初の画像クエリ時に一度だけ作成すればよい。(未解凍のフィンガープリントシーケンスを含む)ファン木データ構造はメモリに保持され、かつ続いて任意数の画像クエリにより再使用されることが可能である。
圧縮されたフィンガープリントデータベース1710の作成方法については、先に例示した(図15)。フィンガープリント情報は、フィンガープリントデータベース1710から検索される。フィンガープリントデータベースのエントリは各々、複数のフィンガープリント候補を発生させる。
キーポイント除外モジュール1720は、フィンガープリントキーポイント1730のうちの1つまたはそれ以上を除外することによって複数のフィンガープリントキーポイント組合せ候補を選択する。これは、局在的近傍キーポイント間の1つまたは複数の不在キーポイントを見込んでいる。本実装において、キーポイント除外モジュールは1つのキーポイントを除外する。局在的近傍がN個のキーポイントである場合、各キーポイント毎に1つのデータベースエントリが行われることから、これは、各データベースエントリ毎にN個のフィンガープリント、または1つのキーポイント当たりN個のフィンガープリントを発生させる。
フィンガープリントシーケンスモジュール1750は、各キーポイント毎にN個のフィンガープリント候補のシーケンスを生成する。例えば、N=8のとき、キーポイント除外モジュール1720は、第1のキーポイントを除外して残りの7個のキーポイントを選択することにより第1のフィンガープリントを生成させる。この後、キーポイント除外モジュールは第2のキーポイントを除外して第1のキーポイント及び最後の6個のキーポイントを選択し、第2のフィンガープリントを生成する。このプロセスは、全てのキーポイント組合せが除外されるまで続く。この例では、各データベースエントリは8個のフィンガープリント候補を生成し、各々が7個から4個を選ぶ35通りの長さを有する。
N=8及びP=4のとき、4個のキーポイントによるサブグループの一意の組合せは(8個から4個を選ぶ)=70通りある。これが、キーポイント毎の圧縮フォーマットでデータベース1710に格納される。
次に、1つのキーポイントが不在である場合のフィンガープリントが生成される。しかしながら、どのキーポイントがなくなるかは事前に分からないため、全ての可能性についての準備が行われる。N=8の場合、1つのキーポイントが不在となる可能性は8通り、即ち第1のキーポイント、または第2のキーポイント、または第3のキーポイント、他と、合計8つの場合がある。これらの事例の各々について、異なるフィンガープリントが計算される。この場合の各フィンガープリントは、(原初の8個のうちの1つが不在であるために)7個のキーポイントのみを基礎とする。この場合、各フィンガープリントの長さは(7個から4個を選ぶ)=35であり、それが合計8個存在する。これは、各フィンガープリントが0−7の範囲の35個の整数(量子化比率)のシーケンスから成ることを意味する。8個のフィンガープリントは、ファン木データへ追加される。
クエリ時間では、8個のキーポイント(現行の1つ及び最近の7個)が生成され、かつ同じ方法を使用しかつ同様に一度に1つのキーポイントを除外して再度8個のクエリフィンガープリントが計算される。次に、キーポイントとファン木のコンテンツとのマッチングが試行される。マッチングは、最初にマッチングが達成された時点で停止される。クエリ画像から1つのキーポイントが欠けていれば(どのキーポイントであるかは問題ではない)、8個のうちの1つのクエリフィンガープリントは必ず(他の7個が存在する状態で1つとの)マッチングを有する。どのキーポイントも欠けていなければ(8個全てが存在する)、最初の肯定的マッチの後にプロセスが停止してチェックを続ける必要がない場合を除いて、(7の任意のグループはマッチすることから)8個のマッチが存在することになる。しかしながら、同時に2つ以上のキーポイントが欠けていれば、この位置についてはマッチが存在しない。所望されれば、本システムは、より多くの不在キーポイント(例えば、8個のうちの2個、他)を許容するように方法を拡張することによって、より多くの不在キーポイントを容易に処理することも可能である。
フィンガープリントシーケンスモジュール1750から出力されるフィンガープリントデータ1760は、現行画像のデータベースから検索される一意の画像ID1740と共にフィンガープリントレコード1780を形成する。フィンガープリントレコード1780は、ファン木モジュール1770によってアドレス指定される対応するファン木葉ノード位置に格納される。ファン木葉ノード情報は、対応するフィンガープリントデータ構造1790内にフィンガープリントレコード1780の連結リストとして格納される。ポピュレートは、実数のフィンガープリントに対応する実際のファン木葉ノードのみに行われる。特定の葉ノードに到達する第1のフィンガープリントは、その葉ノードを最初にポピュレートする。同じ葉ノードにおいて期せずして(即ち、同じファン木経路を辿って)再度2つ以上のフィンガープリントが到着すれば、新しいフィンガープリント情報は、新しいフィンガープリント情報をその葉ノード上の先行する最後のフィンガープリント情報と連結することによって、その同じ葉ノードへ追加される。

Claims (1)

  1. 複製ドキュメントコンテンツを検出する方法であって、
    クエリドキュメントページをドキュメント検出システムへ入力することと、
    二次元ビジュアルフィンガープリントの検出プロセスのビジュアルフィンガープリントを用いて、前記クエリドキュメントページをドキュメントコレクションに格納されたドキュメントのページと比較することと、
    前記二次元ビジュアルフィンガープリントの検出を用いる結果を基礎として、前記クエリドキュメントページの複製または異なるドキュメントコンテンツと、前記格納されたドキュメントコレクションの少なくとも1つのドキュメントページとを自動的に強調表示することであって、前記自動的に強調表示することは、非対応フィンガープリントの各クラスタに対して、前記クエリドキュメントページの少なくとも1つ及び前記ドキュメントコレクションの返されるドキュメントの前記ドキュメントページのうちの1つの上へ幾何学的エレメントを生成することを含む、前記自動的に強調表示することと、
    を含み、
    前記方法は、少なくとも電子的プロセッサを用いて実施され、
    前記幾何学的エレメントは前記クラスタの平均に中心が置かれ、かつ前記幾何学的エレメントのサイズは、前記クラスタ内のフィンガープリントロケーション分布の推定される二次モーメントに比例する、
    方法。
JP2011227416A 2010-10-19 2011-10-14 二次元ビジュアルフィンガープリントを用いる複製ドキュメントコンテンツの検出方法 Active JP5753473B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/907,226 US8750624B2 (en) 2010-10-19 2010-10-19 Detection of duplicate document content using two-dimensional visual fingerprinting
US12/907,226 2010-10-19

Publications (3)

Publication Number Publication Date
JP2012089132A JP2012089132A (ja) 2012-05-10
JP2012089132A5 JP2012089132A5 (ja) 2014-11-27
JP5753473B2 true JP5753473B2 (ja) 2015-07-22

Family

ID=44785568

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011227416A Active JP5753473B2 (ja) 2010-10-19 2011-10-14 二次元ビジュアルフィンガープリントを用いる複製ドキュメントコンテンツの検出方法

Country Status (3)

Country Link
US (1) US8750624B2 (ja)
EP (1) EP2444920B1 (ja)
JP (1) JP5753473B2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8943144B2 (en) * 2009-12-10 2015-01-27 International Business Machines Corporation Consolidating duplicate messages for a single destination on a computer network
US8554021B2 (en) 2010-10-19 2013-10-08 Palo Alto Research Center Incorporated Finding similar content in a mixed collection of presentation and rich document content using two-dimensional visual fingerprints
US8527516B1 (en) * 2011-02-25 2013-09-03 Google Inc. Identifying similar digital text volumes
US10685234B2 (en) 2012-03-31 2020-06-16 Xerox Corporation Automatic and semi-automatic metadata generation via inheritance in homogeneous and heterogeneous environments
US8838657B1 (en) 2012-09-07 2014-09-16 Amazon Technologies, Inc. Document fingerprints using block encoding of text
US9773039B2 (en) * 2012-09-14 2017-09-26 Fti Consulting, Inc. Computer-implemented system and method for identifying near duplicate documents
TWI512642B (zh) * 2013-01-25 2015-12-11 Delta Electronics Inc 快速圖形比對方法
US8958651B2 (en) * 2013-05-30 2015-02-17 Seiko Epson Corporation Tree-model-based stereo matching
US10303682B2 (en) 2013-09-21 2019-05-28 Oracle International Corporation Automatic verification and triage of query results
JP6232940B2 (ja) * 2013-11-01 2017-11-22 富士ゼロックス株式会社 画像情報処理装置及びプログラム
CN103714345B (zh) * 2013-12-27 2018-04-06 Tcl集团股份有限公司 一种双目立体视觉检测手指指尖空间位置的方法与系统
US9886422B2 (en) * 2014-08-06 2018-02-06 International Business Machines Corporation Dynamic highlighting of repetitions in electronic documents
US9805099B2 (en) * 2014-10-30 2017-10-31 The Johns Hopkins University Apparatus and method for efficient identification of code similarity
CN105787415B (zh) * 2014-12-18 2020-04-07 富士通株式会社 文档图像的处理装置、方法以及扫描仪
US9836435B2 (en) * 2015-03-19 2017-12-05 International Business Machines Corporation Embedded content suitability scoring
RU2613848C2 (ru) * 2015-09-16 2017-03-21 Общество с ограниченной ответственностью "Аби Девелопмент" Выявление "нечетких" дубликатов изображений с помощью троек смежных оцененных признаков
US11068546B2 (en) 2016-06-02 2021-07-20 Nuix North America Inc. Computer-implemented system and method for analyzing clusters of coded documents
US10229315B2 (en) * 2016-07-27 2019-03-12 Intuit, Inc. Identification of duplicate copies of a form in a document
US20180101540A1 (en) * 2016-10-10 2018-04-12 Facebook, Inc. Diversifying Media Search Results on Online Social Networks
US10083353B2 (en) 2016-10-28 2018-09-25 Intuit Inc. Identifying document forms using digital fingerprints
US10372813B2 (en) 2017-01-17 2019-08-06 International Business Machines Corporation Selective content dissemination
US10318563B2 (en) 2017-08-23 2019-06-11 Lead Technologies, Inc. Apparatus, method, and computer-readable medium for recognition of a digital document
CN109697231A (zh) * 2017-10-24 2019-04-30 北京国双科技有限公司 一种案件文书的显示方法、系统、存储介质和处理器
CN108664900B (zh) * 2018-04-20 2022-05-27 上海掌门科技有限公司 一种用于识别文字作品异同的方法与设备
US20200019583A1 (en) * 2018-07-11 2020-01-16 University Of Southern California Systems and methods for automated repair of webpages
CN109471921A (zh) * 2018-11-23 2019-03-15 深圳市元征科技股份有限公司 一种文本查重方法、装置及设备
CN115087954B (zh) * 2020-02-10 2024-09-10 三菱电机株式会社 画面数据编辑程序存储介质、画面数据编辑装置及画面数据编辑方法
JP7400543B2 (ja) * 2020-02-28 2023-12-19 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN113297888B (zh) * 2020-09-18 2024-06-07 阿里巴巴集团控股有限公司 一种图像内容检测结果核查方法及装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0589190A (ja) * 1991-09-27 1993-04-09 Meidensha Corp 図面情報のチエツク方式
CA2077274C (en) 1991-11-19 1997-07-15 M. Margaret Withgott Method and apparatus for summarizing a document without document image decoding
US5465303A (en) 1993-11-12 1995-11-07 Aeroflex Systems Corporation Automated fingerprint classification/identification system and method
US5465353A (en) 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
US5613014A (en) 1994-10-12 1997-03-18 Martin Marietta Corp. Fingerprint matching system
US5987171A (en) * 1994-11-10 1999-11-16 Canon Kabushiki Kaisha Page analysis system
JP3647075B2 (ja) * 1995-01-26 2005-05-11 キヤノン株式会社 画像検索方法及びその装置
US5850476A (en) 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
US5893908A (en) 1996-11-21 1999-04-13 Ricoh Company Limited Document management system
US6041133A (en) 1996-12-13 2000-03-21 International Business Machines Corporation Method and apparatus for fingerprint matching using transformation parameter clustering based on local feature correspondences
US7844594B1 (en) 1999-06-18 2010-11-30 Surfwax, Inc. Information search, retrieval and distillation into knowledge objects
US20060259524A1 (en) 2003-03-17 2006-11-16 Horton D T Systems and methods for document project management, conversion, and filing
US7359532B2 (en) 2003-12-11 2008-04-15 Intel Corporation Fingerprint minutiae matching using scoring techniques
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
JP4517822B2 (ja) * 2004-11-05 2010-08-04 富士ゼロックス株式会社 画像処理装置及びプログラム
US20060104484A1 (en) 2004-11-16 2006-05-18 Bolle Rudolf M Fingerprint biometric machine representations based on triangles
US20060120686A1 (en) * 2004-12-03 2006-06-08 Frank Liebenow Method, apparatus and system for storage and retrieval of images
JP4533187B2 (ja) * 2005-03-01 2010-09-01 キヤノン株式会社 画像処理装置およびその制御方法
US7519200B2 (en) 2005-05-09 2009-04-14 Like.Com System and method for enabling the use of captured images through recognition
US7403932B2 (en) 2005-07-01 2008-07-22 The Boeing Company Text differentiation methods, systems, and computer program products for content analysis
US7801392B2 (en) 2005-07-21 2010-09-21 Fuji Xerox Co., Ltd. Image search system, image search method, and storage medium
US8103050B2 (en) 2006-01-16 2012-01-24 Thomson Licensing Method for computing a fingerprint of a video sequence
ATE470912T1 (de) 2006-04-28 2010-06-15 Toyota Motor Europ Nv Robuster detektor und deskriptor für einen interessenspunkt
US8244036B2 (en) 2007-01-24 2012-08-14 Bluebeam Software, Inc. Method for emphasizing differences in graphical appearance between an original document and a modified document with annotations
US8055079B2 (en) 2007-03-06 2011-11-08 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, and image forming apparatus
US20090176565A1 (en) 2008-01-07 2009-07-09 Bally Gaming, Inc. Gaming devices for biometrically identifying a player
US8233716B2 (en) 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated System and method for finding stable keypoints in a picture image using localized scale space properties
US8233722B2 (en) * 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated Method and system for finding a document image in a document collection using localized two-dimensional visual fingerprints
US8144947B2 (en) 2008-06-27 2012-03-27 Palo Alto Research Center Incorporated System and method for finding a picture image in an image collection using localized two-dimensional visual fingerprints
US8520941B2 (en) * 2008-12-09 2013-08-27 Xerox Corporation Method and system for document image classification
US8548193B2 (en) 2009-09-03 2013-10-01 Palo Alto Research Center Incorporated Method and apparatus for navigating an electronic magnifier over a target document
US8380588B2 (en) 2010-01-14 2013-02-19 Oracle International Corporation Side-by-side comparison of associations for multi-level bills of material
US8086039B2 (en) 2010-02-05 2011-12-27 Palo Alto Research Center Incorporated Fine-grained visual document fingerprinting for accurate document comparison and retrieval
US9514103B2 (en) 2010-02-05 2016-12-06 Palo Alto Research Center Incorporated Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
US8554021B2 (en) 2010-10-19 2013-10-08 Palo Alto Research Center Incorporated Finding similar content in a mixed collection of presentation and rich document content using two-dimensional visual fingerprints

Also Published As

Publication number Publication date
EP2444920A3 (en) 2013-04-03
JP2012089132A (ja) 2012-05-10
US8750624B2 (en) 2014-06-10
US20120093421A1 (en) 2012-04-19
EP2444920A2 (en) 2012-04-25
EP2444920B1 (en) 2019-08-21

Similar Documents

Publication Publication Date Title
JP5753473B2 (ja) 二次元ビジュアルフィンガープリントを用いる複製ドキュメントコンテンツの検出方法
JP5183578B2 (ja) 局所的視覚的2次元指紋を用いた、文書コレクション内の文書画像を発見する方法およびシステム
JP5662917B2 (ja) 二次元ビジュアルフィンガープリントを用いるプレゼンテーション及びリッチドキュメントコンテンツの混合コレクションにおける類似コンテンツの発見方法
JP5180156B2 (ja) 局所化された2次元の視覚的指紋を使用してイメージコレクション内のピクチャイメージを見つけるシステムおよび方法
US8825682B2 (en) Architecture for mixed media reality retrieval of locations and registration of images
US8510283B2 (en) Automatic adaption of an image recognition system to image capture devices
US8856108B2 (en) Combining results of image retrieval processes
US8868555B2 (en) Computation of a recongnizability score (quality predictor) for image retrieval
US8086039B2 (en) Fine-grained visual document fingerprinting for accurate document comparison and retrieval
US8498487B2 (en) Content-based matching of videos using local spatio-temporal fingerprints
US9020966B2 (en) Client device for interacting with a mixed media reality recognition system
US20130346431A1 (en) Monitoring and Analyzing Creation and Usage of Visual Content
US9171203B2 (en) Scanbox
US8139860B2 (en) Retrieving and sharing electronic documents using paper
Prathima et al. A novel framework for handling duplicate images using hashing techniques
CN117668336A (zh) 文档处理方法及装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141009

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141009

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20141009

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20141205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150522

R150 Certificate of patent or registration of utility model

Ref document number: 5753473

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250