JP3720573B2 - 画像検索装置及び方法 - Google Patents
画像検索装置及び方法 Download PDFInfo
- Publication number
- JP3720573B2 JP3720573B2 JP09013398A JP9013398A JP3720573B2 JP 3720573 B2 JP3720573 B2 JP 3720573B2 JP 09013398 A JP09013398 A JP 09013398A JP 9013398 A JP9013398 A JP 9013398A JP 3720573 B2 JP3720573 B2 JP 3720573B2
- Authority
- JP
- Japan
- Prior art keywords
- label
- image
- image data
- search
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、画像を検索する画像検索装置及び方法に関するものである。
【0002】
【従来の技術】
従来より類似画像を検索するための種々の技術が提案されている。類似画像検索を自然画像について行うための、ある程度実用化されている技術では、色情報を画像特徴量として用いているものが多い。そして、その多くが、色情報に関するヒストグラムを取ることにより、RGBの割合や画像中に多く存在する色の組み合わせを用いて検索を行うものである。
【0003】
【発明が解決しようとする課題】
しかしながら、上記の手法では、色の位置情報が失われてしまうためにその検索精度は必ずしも高くなかった。また、例えば特開平8−249349号には、画像を複数のブロックに分け夫々の特徴量(代表色)を用いたパターンマッチングが開示されている。しかしながら、この手法では、マッチングを行う2つの画像について各ブロック間の特徴量の距離を計算しなければならず、膨大な計算量が必要となってしまう。特に特徴量として代表色を用いると、RGB3個のデータを扱わなければならず、更に計算が複雑なものとなる。また、特徴量そのものを用いて比較を行うので、比較の精度が高くなる反面、画像のアングルが変ったり、物体の位置が変ったりするだけで類似画像検索できなくなってしまうといった問題がある。すなわち、画像のアングルが変ったり、物体の位置が変ったり、あるいは撮影条件による画像特徴量のある程度の違い等を吸収するなど、ある程度の曖昧さを有しながらも適切に画像検索を行うという、いわゆるロバストな類似画像検索を行うことはできなかった。
【0004】
従って、従来技術において自然画像を検索する場合には、画像にキーワードを付与しておき、このキーワードによって画像検索を行うことが普通であった。しかし、このキーワード付け作業は人手のかかる作業であり、更に、キーワード付けが行われていない画像に関しては、縮小画を提示してマニュアルにて選択するという作業が生じ、検索操作を煩雑なものとしていた。
【0005】
本発明は上記の問題点に鑑みてなされたものであり、画像の特徴量の配置を考慮した高速な類似画像の検索を可能とする画像検索装置及び方法を提供することを目的とする。
【0006】
また、本発明の他の目的は、画像の特徴量の配置を考慮した類似画像の検索を行うとともに、撮影条件の変動等による違いを吸収した類似画像検索を可能とする画像検索装置及び方法を提供することにある。
【0007】
また、本発明の他の目的は、特徴量群を1つのラベルで表し、画像をラベル列もしくはラベル行列で表現して画像間の類似度を算出することにより類似度の計算量を減少させ、迅速な類似画像検索を可能とすることにある。
【0008】
また、本発明の他の目的は、ラベル列もしくはラベル行列を適切に管理し、ラベルを用いた画像検索処理の処理速度を著しく向上することにある。
【0009】
また、本発明の他の目的は、元画像と比較先画像の類似度をラベル列もしくはラベル行列の比較によって行う際に、DPマッチングやファジー非決定性オートマトン等のラベル位置の前後の曖昧さを許す手法を適用し、より効果的な類似画像検索を可能とすることにある。
【0010】
【課題を解決するための手段】
上記の目的を達成するための本発明の画像検索装置は以下の構成を備える。即ち、
画像データを複数のブロックに分割し、各ブロックについて取得された特徴量に応じてラベルを付与する付与手段と、
前記付与手段で付与されたラベルを所定のブロック順序に基づいて並べることによりラベル列を生成する生成手段と、
前記生成手段で生成されたラベル列を前記画像データに対応付けて記憶する第1記憶手段と、
前記生成されたラベル列に基づいて、前記画像データをラベルをキーとして、ラベル毎に当該ラベルを含む画像データを示す画像IDを登録するとともに、各画像データにおける当該ラベルの含有数を登録するインデックステーブルを記憶する第2記憶手段と、
検索元となる検索元画像データが与えられた場合、該検索元画像データに対応するラベル列を獲得し、前記インデックステーブルに登録されている画像IDとラベルの含有数とに基づき、該獲得されたラベル列に類似する画像データ群を抽出する抽出手段と、
前記抽出手段で抽出された画像データ群のそれぞれについて、前記第1記憶手段に記憶されたラベル列に基づいて前記検索元画像データに対応する画像データの検索を行う検索手段とを備える。
【0011】
また、本発明の他の形態によれば、上記画像検索装置に対応する画像検索方法、及び該画像検索方法を実現するための制御プログラムを格納する記憶媒体が提供される。
【0012】
【発明の実施の形態】
以下、添付の図面を参照して本発明の好適な一実施形態を説明する。
【0013】
[第1の実施形態]
図1は第1の実施形態による画像検索装置の制御構成を示すブロック図である。同図において、101はCPUであり、本実施形態の画像検索装置における各種制御を実行する。102はROMであり、本装置の立ち上げ時に実行されるブートプログラムや各種データを格納する。103はRAMであり、CPU101が処理するための制御プログラムを格納するとともに、CPU101が各種制御を実行する際の作業領域を提供する。104はキーボード、105はマウスであり、ユーザによる各種入力操作環境を提供する。
【0014】
106は外部記憶装置であり、ハードディスクやフロッピー(登録商標)ディスク、CD−ROM等で構成される。107は表示器である。108はネットワークインターフェースであり、ネットワーク上の各機器との通信を可能とする。109はインターフェース、110は画像読み取りのためのスキャナである。また、111は上記の各構成を接続するバスである。なお、後述の各フローチャートに示される処理を実現する制御プログラムは、ROM102に格納されていてもよいし、外部記憶装置106よりRAM103にロードされてもよい。
【0015】
なお、上記の構成においてスキャナ110や外部記憶装置106はネットワーク上に配置されたもので代用してもよい。
【0016】
図2は第1の実施形態の画像検索装置の機能構成を示すブロック図である。同図において、11はユーザインターフェース部であり、表示器107、キーボード104及びマウス105を用いて、ユーザからの各種の操作入力を検出する。12は画像入力部であり、スキャナ110による画像の読み取りを行う。13は画像メモリであり、画像入力部12によって得られたイメージデータをRAM103の所定の領域に格納する。14は画像特徴量抽出部であり、画像メモリ13に格納した画像について、後述の手順で特徴量を抽出する。15は特徴量ラベル列化部であり、画像特徴量抽出部14によって得られた特徴量に基づいてラベル列を生成する。16はパターンマッチング部であり、指定された画像のラベル列と、画像蓄積部17に蓄積されている画像のラベル列に基づいて、両者の類似度を算出し、類似画像を検索する。
【0017】
17は画像蓄積部であり、画像入力部12等によって得られた画像データを蓄積する。図3は画像蓄積部17における画像データの格納状態を説明する図である。各画像データ112には画像ID111が付与され、画像蓄積部17にはこれらが対になって保持される。18は画像管理データベース(以下、画像管理DB)であり、図8で示されるデータ形態で画像蓄積部17に格納された画像データを管理する。また、19はラベル列インデックスであり、図10に示されるラベル成分インデックスファイルを格納する。なお、ラベル成分インデックスの利用については、図9のフローチャートにより後述する。
【0018】
以上のような構成を備えた本実施形態の画像検索装置の動作例を以下に説明する。なお、以下の例では色に着目した画像特徴量として、赤(R)、緑(G)、青(B)の三色を採用し、3次元の色空間での処理を用いて説明する。
【0019】
[画像の登録処理]
先ず画像登録の際に行う処理を説明する。図4は第1の実施形態による画像登録処理の手順を表すフローチャートである。まず、ステップS11において、ユーザーインターフェース部11を介したユーザの指示により、画像入力部12を用いた画像を読み込み、画像メモリ13に保持する。次に、ステップS12において、この画像を複数のブロックに分割する。本実施形態では、画像を縦横の複数ブロックに分割する。図5は本実施形態による画像のブロック分割例を示す図である。同図に示されるように、本実施形態では、説明のため3×3の計9個のブロックに画像を分割するものとする。次にステップS13において、分割された各ブロックの特徴量を算出し、得られた特徴量を次の手順でラベル化する。
【0020】
なお、本実施形態で用いる3×3への分割はあくまで説明のためのものである。実際には、自然画であれば10×10以上の分割数とするのが好ましい。また、白の無地背景に商品が写っているような場合であれば、13×13以上の分割数とするのが好ましい。
【0021】
図6は本実施形態による多次元特徴量空間を説明する図である。図6に示すように、多次元特徴量空間(RGBカラー空間)を複数のブロック(色ブロック)、即ちセル(色セル)に分割し、夫々のセル(色セル)に対して通し番号でユニークなラベルを付与する。ここで、多次元特徴量空間(RGBカラー空間)を複数のブロックに分けたのは微妙な特徴量(色)の違いを吸収するためである。
【0022】
なお、多次元特徴量空間に関しては、画像特徴量をそのまま用いるものではなく各パラメータを平均と分散を実験によって求め規格化(正規化)した後、例えば、主成分分析等の直交変換を行い、意味のある次元にしたものを用いることが考えられる。なお、「意味のある次元」とは、主成分分析において、寄与率が大きな主成分軸で構成される次元である。
【0023】
ステップS13では、ステップS12で得られた各分割ブロックに対して、定められた画像特徴量計算処理を行い、上記多次元特徴量空間上のどのセルに属するかを求め、対応するラベルを求める。この処理を全てのブロックに対して行う。すなわち、分割画像ブロックに対して、全ての画素がどの色セルに属するかの計算処理を行い、もっとも頻度の多い色セルのラベルをその分割画像ブロックのパラメータラベル(カラーラベル)として決定し、この処理を全てのブロックに対して行う。
【0024】
以上のようにして各ブロックに対してパラメータラベルが付与されると、ステップS14において、各ブロックに付与されたパラメータラベルを所定のブロック順序で並べることにより、パラメータラベル列(以下、ラベル列とする)が生成される。図7はラベル列を生成する際のブロック順序例を説明する図である。同図の分割画像ブロックの升にある数字に従って上記のパラメータラベルを並べ、ラベル列を作る。
【0025】
ここで、図7の(a)では、分割ブロックを右上から左下方向への斜め方向へスキャンしている。これは、比較する画像のアングルの微妙な違い、ずれの影響を少なくするために類似検索対象物体に沿ってなるべく多く連続したラベル列を高い期待値で得るためである。この結果、後で述べるパターンマッチング部16の作用とあいまって、上下左右のどちらのずれに対しても影響の少ないラベル列同士の比較が可能となる。
【0026】
なお、本実施形態に適用可能なスキャンの方法としては、
・水平方向(左から右へのスキャンを上から下へ行う、左から右へのスキャンを下から上へ行う等、4通りのスキャン方法が考えられる)、
・垂直方向(上から下へのスキャンを左から右へ行う等、4通りのスキャン方法が考えられる)、
・斜め方向(四隅の各始点について2方向の斜めスキャンがあり、図7の(a)〜(c)を含む8通りのスキャン方法がある)、
・ジグザグスキャン(JPEG等において採用されているスキャン方法であり、四隅の各始点について2通りのジグザグスキャンがあり、合計8通りのスキャンがある)、
等があげられる。本実施形態では以下の観点から採用すべきスキャン方法を決定する。すなわち、
(1)本実施形態ではラベル列同士の時系列的な比較であり、この順序に逆転が生じることは好ましくない。よって、すべての画像を所定のスキャン方法でスキャンしてラベル列化を行う必要がある。
(2)位置の近いブロックはラベル列中においても近くに位置することが望ましい。
(3)検索したい物体に引っ掛かるブロックのラベルが出来る限り早く現れ、且つ長く続くことがマッチングを行いやすくする。
(4)物体が動いたり、アングルが変わったりしても、ラベルの並びが極端に変わらないようにする。
という条件を満足するスキャン方法を採用する。特に、着目物体の多くが画像中央であることを仮定すると、着目物体を含むブロックが出来るだけスキャンの早いうちに現れ、長くその着目物体をスキャンする期待値が高い方法として、本実施形態では斜め方向のスキャンを採用している。なお、本実施形態では、図7の(a)のような右上から左下方向への斜めスキャンを採用するが、当然、図7の(b)のような例や図7の(c)の様なスキャン方法を採用してもよい。
【0027】
続いてステップS15において、以上のようにして得たラベル列や画像データを画像蓄積部17、画像管理DB18、ラベル列インデックス19に格納する。すなわち、ステップS11で読み込んだ画像データに対して画像IDを取得し、これらをペアにして画像蓄積部17に格納する。そして、当該画像IDに対応付けて図8に示す画像管理DBレコードを生成し、これを画像管理DB18に登録する。
【0028】
以上が画像登録時に行われる処理である。
【0029】
[類似画像検索処理]
次に図9のフローチャートに従って類似画像検索の処理を説明する。図9は第1の実施形態による類似画像検索の処理手順を説明するフローチャートである。なお、第1の実施形態では、予め初期化時において、画像管理DBのラベル系列から、既に登録されている画像のラベル列群を得て、各ラベル成分をキーとするラベル成分インデックスファイル(図10)を生成し、ラベル列インデックス19に格納しておく。なお、ここでいう初期化時とは、システムの立ち上げ時或いはアプリケーションの起動時のいずれでも良い。また、新規の画像登録があり、これを画像DBに登録した場合にも、このラベル成分インデックスの生成を行う。図10は、ラベル成分インデックスのデータ構成例を示す図である。図10に示すように、ラベル成分インデックスには、各ラベル成分毎に、そのラベルを内部に持つラベル列へのアドレス群(列ID群)を有する。なお、このラベル成分インデックスファイルは画像の登録及び削除、変更を反映する必要が生じるまで、作成し直す必要はない。もちろん、毎回画像データの登録時にラベル成分インデックスを追記してゆく方法も存在する。この場合は、図4のステップS15の後で、新たに登録された画像について上述した処理を行う。
【0030】
図10に示すラベル成分インデックスには、ラベル成分をキーとして、そのラベル成分を含む画像IDとそれに含まれる当該ラベルの個数が格納されている。このようなインデックスを用いれば、検索元画像が有するラベル成分を含む画像データの画像IDを直接的に抽出できる。なお、各キー毎に格納されている画像IDを、ラベルの個数にしたがって昇順或いは降順にソートして登録しておけば、より処理速度を向上させることができる。
【0031】
まず、ステップS21において、ユーザーインターフェース部11から類似検索元画像が指定されると、ステップS22において、指定された類似検索元画像の画像IDが取得され、更に画像管理DB18から当該元画像のラベル列(本例ではカラーラベル列)が取得される。
【0032】
次にステップS23において、ラベル成分インデックスファイルを参照し、類似検索元画像のラベル列とある程度以上同一のラベルを含むラベル列群(ラベル系列インデックス中のラベル列)を取得する。これは登録した画像の全てのラベル列との比較を行うと処理が遅くなるので、予め似ているものに絞った後に、類似検索元画像のラベル列と一対一で比較するようにし、処理速度を改善するためである。なお、類似したラベル列とは、類似検索元画像のラベル列と所定数以上の同一もしくは類似のラベルを含むラベル列群をいう。ここで、類似のラベルとは後述の図11のラベル間ペナルティの小さいラベル同士をいう。もちろん、処理が遅くなっても良ければ、登録した画像の全てのラベル列との比較を行い、精度の高い検索を行ってもよい(この場合、ステップS23は省略される)。
【0033】
なお、上述のラベル成分インデックスファイルを用いた画像の絞り込み方としては、次のような方法が考えられる。例えば、本例では9個のラベルからなるラベル列が用いられるが、このラベル列の中央部の3つのラベル(4番目から6番目のラベル)を含む画像を抽出する。一般に、画像の中央部に当該画像の特徴的な情報が存在するからである。
【0034】
次に、ステップS24において、ステップS23で取得した各ラベル列と類似検索元画像のラベル列とを比較し、その類似度を算出する。そして、類似検索元画像のラベル列に最も近いラベル列から順にその類似度とともに検索結果として出力する。
【0035】
ここで、ラベル列同士の類似比較(類似度の算出)を行う方法について述べる。
【0036】
図11はラベル列を比較し類似度を求める際に用いるラベル間のペナルティマトリックスの一例を示す図である。マトリクス中の値が小さい程類似していることになる。例えば、ラベル2とラベル6のペナルティは「7」である。また、同じラベル同士のペナルティは当然のことながら「0」となっている。本マトリクスの使用目的はラベルの類似に応じた距離判定を行うことにある。すなわち、本実施形態では、特徴量空間としてRGBカラー空間を用いているので、色の類似に応じた距離判定が行えることになる。
【0037】
例えば、検索元画像と検索対象画像のラベル列中のそれぞれ対応する位置のラベルの値から図11のペナルティマトリクスを参照して距離を求め、ラベル列中の全ラベルについての距離の和を求めることで、両ラベル列間の距離を得る。例えば、図12に示す例では、検索元画像のラベル列が「112313441」であり、検索対象画像のラベル列が「113224452」であるので、図11のペナルティマトリクスを用いてDPマッチングを行うことにより、図13に示されるように距離(最終解)が求まる。なお、この例では、傾斜制限として次の条件を用いている。すなわち、図14において、格子点(i-1,j),(i-1,j-1),(i,j-1)上のコストをそれぞれg(i-1,j), g(i-1,j-1), g(i,j-1)とし、格子点(i,j)上のペナルティをd(i,j)とした場合に、格子点(i,j)上のコストg(i,j)を以下の漸化式によって求めている。
【0038】
【数1】
【0039】
以上のように、ラベル間のパターンマッチングの際に隣接するセル同士ではペナルティ(距離)を小さくし、遠いものには大きなペナルティを与えるために図11に示すようなラベル間でのペナルティマトリックスを導入する。ステップS24ではこのペナルティマトリックスを考慮し、ラベル列同士を比較するが、その際に、オートマトン等のラベルシーケンスを曖昧に比較できるマッチングを行うようにしてもよい。このような曖昧化の手法を用いることにより、余分なラベルの付加、ラベルの欠落や同じラベルの繰り返しに対しては低いペナルティが与えられとともに、ラベル間のペナルティには図12のカラーラベル間のペナルティマトリックスを用いてラベル列同士の距離計算を行うことで、曖昧なパターンマッチングが行えるようになる。なお、オートマトンとしては、「特開平8−241335のファジー非決定性有限オートマトンを使用した曖昧な文字列検索方法およびシステム」に記載されている「ファジー非決定性有限オートマトン」を適用することができる。このオートマトンでは、各シンボル間の距離(ペナルティー)が多値でして出来、なお、比較するラベル位置を前後曖昧に移動することが出来、トータルの距離が最小(類似度が最大)となるようなラベル列の比較を実現するための手法として、上述のオートマトンの他に、音声認識等において用いられているDPマッチングがあり、この手法も本実施形態に好適に適用できるものである。
【0040】
更に、上述の曖昧なパターンマッチングに加えて、図7の(a)〜(c)のブロック順序の規則を併用することにより、比較する画像のアングルの微妙な違いやずれの影響を少なく、上下左右のどちらのずれに対しても影響の少ないカラーラベル列同士の比較を行うことが可能となる。すなわち、DPマッチングやファジー非決定性オートマトンは、ラベル列の前後の曖昧さを許容するマッチングであり、画像の位置ずれの影響を吸収する性質を有する。また、アングルの違い等により物体の位置が変わり、ブロックによって切りとられる物体の位置が変わることにより、ブロックの色合いも微妙に異なることが予想されるが、この違いは上述のペナルティーマトリクスにより吸収されることになる。このように、DPマッチング或いはファジーオートマトンによる曖昧さを許容するマッチングと、ペナルティーマトリクスによる特徴量の曖昧さの許容との相乗効果によって、上下左右のずれに対して影響の少ないマッチングを可能としている。更に、図7(a)〜(c)のような斜めスキャンにより、物体の位置の変化によるラベル位置の変化が低減されるので、より効果的にマッチング時の物体のずれの影響を低減できる。
【0041】
次に、ステップS25において、画像管理DB18を参照して、画像ID群の各画像IDについてフルパスのファイル名を取得し、これをユーザに提示する。
【0042】
以上のような処理により、画像のアングルが変ったり、物体の位置が変ったり、あるいは撮影条件が変わったりすることによって生じる、色のある程度の違い等を吸収するなど、ロバストな類似画像検索を高速に行うことが可能となる。
【0043】
なお、ブロック化できない1つの画像に対して1つのパラメータを加味した類似検索の場合には、本発明で得られる類似度(ペナルティの総和を用いて作る)を1つの新たなる特徴量として、統計的な距離尺度に基づく検索を行うことも可能である。また、上記実施形態では、類似度が所定値を越える類似画像を検索結果として得るが、類似度の高い画像から順に前もって指定された個数の画像を検索結果として出力するようにしてもよいことはいうまでもない。
【0044】
以上説明したように、第1の実施形態によれば、特徴量群(特徴量空間を分割して得られる特徴量のグループ)を1つのシンボルで表現し(すなわちラベル化し)、ラベル同士の類似度に基づく距離をペナルティーマトリクスによって与える。このため、2つの画像のブロック間の距離の計算量を大幅に減少させることができるとともに、類似した特徴量が同じラベルで表されることになるので、類似画像の検索を良好に行うことができる。
【0045】
また、(1)ペナルティマトリクスによるラベル同士の距離概念を導入し、(2)DPマッチングやファジー非決定性オートマトン等の、比較するラベル位置を前後曖昧に移動させることが出来、トータルの距離が最小(類似度が最大)となるようなラベル列の比較を実現する手法を導入する、ことにより、画像のアングルが多少変わっても検索することが可能となり、雰囲気の似ている画像を検索できるようになる。
【0046】
更に上記実施形態によれば、インデックスデータベース(ラベル成分インデックス(図10))を用いたことにより、画像検索が更に高速化する。
【0047】
[第2の実施形態]
上記第1の実施形態では、特徴量を表すラベルを1次元に並べて、すなわちラベル列として類似画像検索を行った。第2の実施形態では、特徴量を表すラベルの2次元配置を考慮して、すなわちラベル行列を用いて類似画像検索を行う。なお、第2の実施形態による画像検索装置の制御構成は、第1の実施形態(図1)と同様であるのでここでは説明を省略する。
【0048】
図15は本実施形態の画像検索装置の機能構成を示すブロック図である。同図において、ユーザインターフェース部11、画像入力部12、画像メモリ13、画像特徴量抽出部14、画像蓄積部17は第1の実施形態(図2)と同様の構成である。
【0049】
15aは特徴量ラベル行列化部であり、画像特徴量抽出部14によって得られた特徴量に基づいてラベル行列を生成する。16aはパターンマッチング部であり、指定された画像のラベル行列と、画像蓄積部17に蓄積されている画像のラベル行列に対し、後述の2次元DPマッチングを用いて類似度を算出する。18aは画像管理データベース(以下、画像管理DB)であり、図16で示すデータ形態で画像蓄積部17に格納された画像データを管理する。また、19aはラベル行列インデックスであり、図10で示したラベル成分インデックスファイルを格納する。
【0050】
以上のような構成を備えた第2の実施形態の画像検索装置の動作例を以下に説明する。なお、以下の例では色に着目した画像特徴量として、赤(R)、緑(G)、青(B)の三色を採用し、3次元の色空間での処理を用いて説明する。
【0051】
[画像の登録処理]
図17は第2の実施形態による画像登録処理の手順を示すフローチャートである。図17において、ステップS11〜S13は第1の実施形態(図4)で説明した処理と同様である。
【0052】
ステップS11〜S13の処理により、各ブロックに対してパラメータラベルが付与されると、ステップS14aにおいて、各ブロックに付与されたパラメータラベルを所定のブロック順序で並べることにより、パラメータラベル行列(以下、ラベル行列とする)が生成される。図18はラベル行列を生成する際のブロック順序例を説明する図である。同図の分割画像ブロックの升にある数字に従って上記のパラメータラベルを並べ、ラベル行列を作る。なお、画像管理データベース18aやラベル行列インデックス19aにラベル行列を格納するに際しては、上述のように2次元的なラベル行列を所定の順序で1次元に並べたものを格納するが、本実施形態ではこのような1次元の形態のものもラベル行列と称することにする。
【0053】
ここで、図18の(a)では、分割ブロックを左から右へ水平方向へスキャンし、この水平方向のスキャンを上から下へ行う順序となっている。なお、本実施形態に適用可能なスキャンの方法としては、
・水平方向(図18の(a)に示したように、左から右へのスキャンを上から下へ行うという順序の他に、図18の(b)〜(d)に示すように、左から右へのスキャンを下から上へ行う等、4通りのスキャン方法がある)、
・垂直方向(上から下へのスキャンを左から右へ行う等、4通りのスキャン方法が考えられる)、
・図18(e)に示すように、偶数ラインと奇数ラインでスキャンを分ける。
【0054】
なお、第2の実施形態では、図18の(a)に示すスキャン方法を採用するが、上述した他のスキャン方法も適用可能である。
【0055】
続いてステップS15aにおいて、以上のようにして得たラベル行列や画像データを画像蓄積部17、画像管理DB18a、ラベル行列インデックス19aに格納する。すなわち、ステップS11で読み込んだ画像データに対して画像IDを取得し、これらをペアにして画像蓄積部17に格納する。そして、当該画像IDに対応付けて図16に示す画像管理DBレコードを生成し、これを画像管理DB18aに登録する。
【0056】
以上が画像登録時に行われる処理である。
【0057】
[類似画像検索処理]
次に図19のフローチャートに従って類似画像検索の処理を説明する。図19は第2の実施形態による類似画像検索の処理手順を説明するフローチャートである。なお、本実施形態では、予め初期化時において、画像管理DBのラベル系列から、既に登録されている画像のラベル行列群を得て、各ラベル成分をキーとするラベル成分インデックスファイルを生成し、ラベル行列インデックス19aに格納しておく。なお、ここでいう初期化時とは、システムの立ち上げ時或いはアプリケーションの起動時のいずれでも良い。また、新規の画像登録があり、これを画像DBに登録した場合にも、このラベル成分インデックスの生成を行う。
【0058】
本実施形態においても、第1の実施形態で説明したラベル成分インデックス(図10)を用いる。すなわち、ラベル成分インデックスには、各ラベル成分毎に、そのラベルを内部に持つラベル行列へのアドレス群(列ID群)が登録される。なお、このラベル成分インデックスファイルは画像の登録及び削除、変更を反映する必要が生じるまで、作成し直す必要はない。もちろん、第1の実施形態で述べたように、毎回登録時にラベル成分インデックスを追記してゆく方法も存在する。
【0059】
まず、ステップS21において、ユーザーインターフェース部11から類似検索元画像が指定されると、ステップS22aにおいて、指定された類似検索元画像の画像IDが取得され、更に画像管理DB18から当該元画像のラベル行列(本例ではカラーラベル行列)が取得される。
【0060】
次にステップS23aにおいて、ラベル成分インデックスファイルを参照し、類似検索元画像のラベル行列とある程度以上同一のラベルを含むラベル行列群(ラベル系列インデックス中のラベル行列)を取得する。これは登録した画像の全てのラベル列との比較を行うと処理が遅くなるので、予め似ているものに絞った後に、類似検索元画像のラベル行列と一対一で比較するようにし、処理速度を改善するためである。なお、類似したラベル行列とは、類似検索元画像のラベル行列と所定数以上の同一もしくは類似のラベルを含むラベル行列群をいう。ここで、類似のラベルとは図11で説明したラベル間ペナルティの小さいラベル同士をいう。もちろん、処理が遅くなっても良ければ、登録した画像の全てのラベル行列との比較を行い、精度の高い検索を行ってもよい(この場合、ステップS23aは省略される)。
【0061】
次に、ステップS24aにおいて、ステップS23aで取得した各ラベル行列と類似検索元画像のラベル行列とを比較し、その類似度を算出する。そして、類似検索元画像のラベル行列に最も近いラベル行列から順にその類似度とともに検索結果として出力する。
【0062】
ここで、ラベル行列同士の類似比較(類似度の算出)を行う方法について述べる。なお、以下では、ステップS23aで取得したラベル行列を類似比較先画像と称する。
【0063】
また、第2の実施形態においてもラベル行列を比較して類似度を求める際には、第1の実施形態と同様にラベル間のペナルティマトリックス(図11)を用いる。
【0064】
ラベル間のパターンマッチングの際に隣接するセル同士ではペナルティ(距離)を小さくし、遠いものには大きなペナルティを与えるために図12に示すようなラベル間でのペナルティマトリックスを導入する。ステップS24aではこのペナルティマトリックスを考慮し、ラベル行列同士を比較するが、第2の実施形態では、その際に以下に説明する2次元的なDPマッチング(以下、2次元DPマッチングという)を使用する。
【0065】
図20は本実施形態による類似度算出処理を説明する図である。上述のステップS22aにおいて取得された類似検索元画像のラベル行列は、そのスキャン方法に従って図20の(b)のように並べることができる。また、ステップS23aにおいて抽出されたラベル行列群のうちの一つを類似検索元画像とすると、そのラベル行列は図20(a)のように並べることができる。
【0066】
まず、類似比較先画像の第1行目のラベル列「abc」と、類似検索元画像の第1〜第3行目のラベル列(「123」、「456」、「789」)のそれぞれとの距離をDPマッチングによって求め、その距離が最少となるラベル列の類似検索元画像における行番号を類似ライン行列(図20の(c))の該当する位置に記憶する。また、得られた最小距離が所定の閾値よりも大きい場合には、どの行とも類似していないと判断し、類似ライン行列の該当する位置に「!」を記憶する。DPマッチングの性質により、たとえば画像のアングルが水平方向へ多少変わっていたとしても、上記処理により類似する行(ライン)を検出可能である。以上の処理を、類似比較先画像の全ての行(「def」「ghi」)について行うことで、図20の(c)のような列方向の類似ライン行列が得られる。
【0067】
図20の(c)では、「abc」に類似した行が類似検索元画像に存在せず、「def」に類似した行が類似検索元画像の第1行目、「ghi」に類似した行が類似検索元画像の第2行目であったことを示している。以上のようにして得られた類似ライン行列と標準ライン行列(類似検索元画像の行の並びであり、本例では「123」となる)との類似度をDPマッチングを用いて算出し、これを当該類似検索元画像と当該類似比較先画像との類似度として出力する。なお、DPマッチングでは、周知のように、比較するラベルシーケンスが最も類似距離が小さくなるように、比較するラベルシーケンスを伸縮(比較する相手を次に進めないで我慢する)させて比較するという処理を行う。また、何処まで伸縮(我慢)できるかを制約条件(整合窓の幅)で与えることも可能である。
【0068】
図21は第2の実施形態による、2次元DPマッチングを採用した類似度算出の手順を説明するフローチャートである。上記図20を参照して説明した処理を、図21のフローチャートを参照して更に説明する。
【0069】
まず、ステップS101において、類似比較先画像の行番号を表す変数iと、類似検索元画像の行番号を表す変数jを1に初期化し、ともに第1行目を示すように設定する。次に、ステップS102において、類似比較先画像の第i行目のラベル列を取得する。例えば図20の場合、i=1であれば「abc」が取得される。そして、ステップS103において、類似検索元画像の第j行目のラベル列を取得する。例えば、図20において、j=1であれば、「123」が取得される。
【0070】
次にステップS104では、上記ステップS102、S103で得られた2つのラベル列間の距離を、図12で説明した色セルペナルティーマトリクスを用いて、DPマッチングによって求める。そして、ステップS105において、ステップS104で得た距離が、第i行目に関してそれまでに得られた距離の最小値であれば、当該行番号(j)をライン行列要素LINE[i]に記憶する。
【0071】
以上のステップS103からステップS105の処理を、類似検索元画像の全ての行について行う(ステップS106、S107)。以上のようにして、類似比較先画像の第i行目のラベル列に対して、類似検索元画像に含まれる行のうち最も距離の近い行の番号がLINE[i]に格納されることになる。
【0072】
そして、ステップS108において、上記処理でられたLINE[i]と所定の閾値(Thresh)とを比較する。そして、LINE[i]がThresh以上であればステップS109へ進み、いずれの行とも類似していないことを表す「!」をLINE[i]に格納する。
【0073】
以上説明したステップS102からS108の処理を類似比較先画像の全ての行について実行する(ステップS110、S111)ことにより、LINE[1]〜LINE[imax]が得られるので、これを類似ライン行列LINE[]として出力する。
【0074】
次に、ステップS113において、標準ライン行列「12…imax」と類似ライン行列LINE[]とのDPマッチングを行い、両者の距離を算出する。なお、ここで、標準ライン行列とは、1から始まり、列方向に1ずつ増加する行列である。
【0075】
ここで、標準ライン行列と類似ライン行列間のDPマッチングにおいて用いられるペナルティーについて説明する。列方向の類似ライン行列と標準ライン行列とのDPマッチングのペナルティーの設定としては2つの方法が考えられる。すなわち、動的なペナルティーと固定的なペナルティーの2つである。
【0076】
動的なペナルティーとは、動的にライン番号間のペナルティーを設定するものであり、画像によってライン番号間のペナルティーは変化する。本実施形態では、類似検索元画像の自分自身の横(行)方向のラベル行列の距離を求め、これに基づいて各行間のペナルティーを求める。
【0077】
図22は第2の実施形態による動的なペナルティー値の設定手順を示すフローチャートである。ステップS121において、変数iを1に、変数jを2にそれぞれセットする。次に、ステップS122において、類似検索元画像の第i行目のラベル列を取得し、ステップS123において、類似検索もと画像の第j行目のラベル列を取得する。そして、ステップS124において、類似検索元画像の第i行目のラベル列と第j行目のラベル列とについて、色ペナルティーマトリクスを用いてDPマッチングを行い、距離を獲得する。ステップS125では、ステップS124で得たDPマッチングの距離を、類似検索元画像のi行目のラベル列とj行目のラベル列間のペナルティーとしてLINE[i][j]に記憶すると共に、、類似検索元画像のj行目のラベル列とi行目のラベル列間のペナルティーとしてLINE[j][i]に記憶する。
【0078】
ステップS126によって、変数jの値がjmaxとなるまで、ステップS123〜S125の処理が繰返される。この結果、第i行目のラベル列について、i+1〜jmax行目の各ラベル列との間のペナルティー値が決定される。そして、ステップS128、S129、S130により、ステップS123〜S126の処理を変数iの値がimax−1となるまで繰返される。この結果、LINE[i]「j]には、i=jの対角成分を除く全てに、上記処理で決定されたペナルティー値が記憶されることになる。
【0079】
次にステップS131では、上記処理で決定されていないLINE[i][j]の対角成分のペナルティーを決定する。この部分はi=jであり、同一のラベル列であるから、その距離は0であり、従ってペナルティー0が記憶される。また、ステップS132では、「!」に関してペナルティーを決定する。すなわち、「!」に対するペナルティーは、LINE[i][j]の全てのペナルティー値の中で、最大のペナルティー値よりもある程度大きな値を設定する。ただし、このペナルティー値を極端に大きくすると、曖昧にヒットする性質が損なわれてしまう。
【0080】
以上のようにして類似検索元画像に関して計算されたラベル列間のペナルティーを用いて、上記ステップS113におけるDPマッチングを行い、類似度検索元画像と類似比較先画像の類似度を獲得する。
【0081】
一方、固定的なペナルティーでは、DPマッチングのペナルティーとして、ラベルが一致すればペナルティー「0」を、一致しない場合、もしくは「!」との比較であった場合にはある程度の大きさのペナルティーを与える。この場合は類似検索元画像によらず、常に同じペナルティーとなる。このような固定的なペナルティーを用いてステップS113の処理を実行し、類似度検索元画像と類似比較先画像の類似度を決定する。
【0082】
以上説明したマッチング処理は次のような特徴を有する。もし、図20の(a)と(b)が極めて類似していれば、類似ライン行列は「123」となり、その距離は0となる。また、類似ライン行列が「!12」や「212」であれば、類似検索元画像に対して類似比較先画像は下方向へずれたものである可能性があるし、類似ライン行列が「23!」や「233」であれば類似検索元画像に対して類似比較先画像が上方向へずれたものである可能性がある。また、類似ライン行列が「13!」や「!13」であれば、類似検索元画像に対して類似比較先画像が縮小したものである可能性がある。同様に、類似比較先画像が類似検索元画像を拡大したようなものである場合も検出可能である。
【0083】
上述のステップS113で説明したように、類似ライン行列と標準ライン行列との間でDPマッチングを行うことにより、垂直方向へのずれが効果的に吸収される。このため、上述したような、上方向や下方向へのずれ、拡大、縮小等に起因する類似検索元画像と類似比較先画像との相違が効果的に吸収され、良好な類似検索を行うことが可能となる。
【0084】
すなわち、本実施形態の2次元DPマッチングは、ラベル行列の各ラベル列における前後の曖昧さを許容するマッチングであり、画像の位置ずれの影響を吸収する性質を有する。また、アングルの違い等により物体の位置が変わり、ブロックによって切りとられる物体の位置が変わることにより、ブロックの色合いも微妙に異なることが予想されるが、この違いは上述のペナルティーマトリクスにより吸収されることになる。このように、本実施形態の2次元DPマッチングによる曖昧さを許容するマッチングと、ペナルティーマトリクスによる特徴量の曖昧さの許容との相乗効果によって、上下左右拡大、縮小のずれに対しても影響の少ないマッチングを可能としている。
【0085】
ただし、動的なペナルティーと固定的なペナルティーとでは、動的なペナルティーを用いる方が好ましい。例えば、一面麦畑の類似元検索画像があったとした場合、どのラインも似たようなラベル列となることが考えられる。一方、類似比較先画像にも一面麦畑の画像があったとした場合に、この画像の類似ライン行列には全て最初のライン番号1が入り、「111」となってしまう可能性がある。この場合、類似検索元画像のどのラインも似たような画像となっており、ライン番号間のペナルティーが極めて小さくなければ低い距離でのヒットはしない。しかしながら、動的なペナルティーを用いた場合は、ライン番号間のペナルティーが低くなり、類似度の高い結果を得ることができる。
【0086】
一方、固定的なペナルティーを用いると、「123」と「111」ではペナルティー値が大きくなり、類似度が低くなってしまう。
【0087】
ステップS24aでは、以上説明した類似度の算出処理をステップS23aで取得した全ラベル行列について行い、得られた類似度を高い順にソートして、ステップS25aへ進む。ステップS25aにおいて、画像管理DB18aを参照して、画像ID群の各画像IDについてフルパスのファイル名を取得し、これをユーザに提示する。
【0088】
以上のようにして、DPマッチングを水平・鉛直方向、すなわち2次元に行うことにより、水平や鉛直方向、更に斜め方向に画像アングルが変わったり、物体が移動していても検索を行うことが可能である。また、DPマッチングの時系列伸縮特性により、ズームアップ撮影画像やマクロ撮影画像をも検索することが可能となる。
【0089】
なお、上記実施形態では、水平方向のブロック並びに対応するラベル列を用いて類似ライン行列を得たが、垂直方向のブロック並びに対応するラベル列を用いて類似ライン行列を得るようにすることも、上記と同様の手法で実現可能である。
【0090】
以上説明したように、第2の実施形態によれば、特徴量群(特徴量空間を分割して得られる特徴量のグループ)を1つのシンボルで表現し(すなわちラベル化し)、ラベル同士の類似度に基づく距離を上述の2次元DPマッチングとペナルティーマトリクスによって与える。このため、2つの画像のブロック間の距離の計算量を大幅に減少させることができるとともに、類似した特徴量が同じラベルで表されることになるので、類似画像の検索を良好に行うことができる。
【0091】
また、(1)ペナルティマトリクスによるラベル同士の距離概念を導入し、(2)比較するラベル位置を前後曖昧に移動させることが出来、トータルの距離が最小(類似度が最大)となるようなラベル行列の比較を実現する上記2次元DPマッチングを導入したことにより、画像のアングルが多少変わっても検索することが可能となり、雰囲気の似ている画像を検索できるようになる。
【0092】
更に上記実施形態によれば、インデックスデータベース(ラベル成分インデックス)を用いたことにより、画像検索が更に高速化する。
【0093】
すなわち、上記実施形態によれば、画像の特徴量の配置を考慮した類似画像の高速な検索が行われるとともに、撮影条件の変動等による違いを吸収した類似画像の検索が可能となり、従来難しかった画像のアングルが変ったり、物体の位置が変ったり、あるいは他の撮影条件が変動したりすることによる画像の特徴量のある程度の違いを吸収するなど、ロバストな類似画像検索を行うことが可能となる。
【0094】
なお、上記各実施形態においては、自然画像検索を行う例を説明したが、本発明はCGやCAD等の人工的な画像の検索にも適応可能な技術であることは当業者には明らかである。
【0095】
また、上記各実施形態では画像特徴量として色情報を選んだが、本発明はこれに限られるものではなく、その他の画像パラメータを画像分割ブロックごとに求めることで実施することも可能である。
【0096】
また、上記各実施形態では1つの特徴量での認識の例を挙げたが、その他の特徴量での検索結果との論理演算を行うことにより、複数の特徴量からの高速な検索を行うことも可能である。
【0097】
1つの画像に対して複数の画像特徴量を用いた検索を行う場合には、本発明で得られる類似度を1つの新たなる画像特徴量とみなし、複数のパラメータを用いた多変量解析を行い統計的な距離尺度を用いた検索を行うことも可能である。また、上記実施形態では、類似度が所定値を越える類似画像を検索結果として得るが、類似度の高い画像から順に前もって指定された個数の画像を検索結果として出力するようにしてもよいことはいうまでもない。
【0098】
なお、曖昧度を指定することにより、DPマッチングにおけるいわゆる整合窓の幅を変更することにより、検索の曖昧度を所望に設定可能とすることもできる。図23はDPマッチングにおける整合窓を説明する図である。図23において直線AはJ=I+rで表され、直線BはJ=I−rで表される。整合窓の幅はrの値を変更することで行える。したがって、キーボード104から曖昧度を指定することにより、このrの値が変更されるように構成すれば、ユーザの所望の曖昧度(整合窓の幅)で類似度検索を行えるようになる。
【0099】
なお、上記実施形態のような2次元DPマッチングにおいては、水平方向のDPマッチングにおける整合窓の幅と、垂直方向のDPマッチングにおける整合窓の幅とを別々に設定できるようにしてもよい。或いは、両整合窓が異なる変化率で変化するように構成してもよい。このようにすれば、ユーザは、類似画像検索に際してよりきめ細かい曖昧さの設定を行えるようになる。例えば、図18で示されたようなブロック順序を用いた場合において、検索元の画像中における注目物体の横方向への移動を許容したいような場合や、検索元の画像が横長画像であるような場合には、横方向への曖昧度を大きくするために水平方向のDPマッチングにおける整合窓の幅をより大きくすればよい。
【0100】
なお、本発明は、例えばホストコンピュータ,インタフェイス機器,リーダ,プリンタなどの複数の機器から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用してもよい。
【0101】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0102】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0103】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0104】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0105】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0106】
【発明の効果】
以上説明したように本発明によれば、画像の特徴量の配置を考慮した類似画像の検索が可能となる。
【0107】
また、本発明によれば、画像の特徴量の配置を考慮した類似画像の検索が行われるとともに、撮影条件の変動等による違いを吸収した類似画像の検索が可能となり、従来難しかった画像のアングルが変ったり、物体の位置が変ったり、あるいは他の撮影条件が変動したりすることによる画像の特徴量のある程度の違いを吸収するなど、ロバストな類似画像検索を行うことが可能となる。
【0108】
また、本発明によれば、特徴量ラベルに基づいて画像データを登録するインデックステーブルを導入することにより、類似度計算の対象とする画像データを効率よく絞り込むことが可能となり、類似検索の処理速度が著しく向上する。
【0109】
【図面の簡単な説明】
【図1】第1の実施形態による画像検索装置の制御構成を示すブロック図である。
【図2】第1の実施形態の画像検索装置の機能構成を示すブロック図である。
【図3】画像蓄積部17における画像データの格納状態を説明する図である。
【図4】第1の実施形態による画像登録処理の手順を表すフローチャートである。
【図5】本実施形態による画像のブロック分割例を示す図である。
【図6】本実施形態による多次元特徴量空間を説明する図である。
【図7】ラベル列を生成する際のブロック順序例を説明する図である。
【図8】第1の実施形態における、画像管理データベースによる画像データの格納形態を説明する図である。
【図9】第1の実施形態による類似画像検索の処理手順を説明するフローチャートである。
【図10】ラベル成分インデックスのデータ構成例を示す図である。
【図11】ラベル列を比較し類似度を求める際に用いるラベル間のペナルティマトリックスの一例を示す図である。
【図12】DPマッチングによるラベル列間の距離の算出を説明する図である。
【図13】DPマッチングによるラベル列間の距離の算出を説明する図である。
【図14】DPマッチングによるラベル列間の距離の算出を説明する図である。
【図15】本実施形態の画像検索装置の機能構成を示すブロック図である。
【図16】第2の実施形態における、画像管理データベースによる画像データの格納形態を説明する図である。
【図17】第2の実施形態による画像登録処理の手順を示すフローチャートである。
【図18】ラベル行列を生成する際のブロック順序例を説明する図である。
【図19】第2の実施形態による類似画像検索の処理手順を説明するフローチャートである。
【図20】本実施形態による類似度算出処理を説明する図である。
【図21】第2の実施形態による、2次元DPマッチングを採用した類似度算出の手順を説明するフローチャートである。
【図22】第2の実施形態による動的なペナルティー値の設定手順を示すフローチャートである。
【図23】DPマッチングにおける整合窓の調整を説明する図である。
Claims (22)
- 画像データを複数のブロックに分割し、各ブロックについて取得された特徴量に応じてラベルを付与する付与手段と、
前記付与手段で付与されたラベルを所定のブロック順序に基づいて並べることによりラベル列を生成する生成手段と、
前記生成手段で生成されたラベル列を前記画像データに対応付けて記憶する第1記憶手段と、
前記生成されたラベル列に基づいて、前記画像データをラベルをキーとして、ラベル毎に当該ラベルを含む画像データを示す画像IDを登録するとともに、各画像データにおける当該ラベルの含有数を登録するインデックステーブルを記憶する第2記憶手段と、
検索元となる検索元画像データが与えられた場合、該検索元画像データに対応するラベル列を獲得し、前記インデックステーブルに登録されている画像IDとラベルの含有数とに基づき、該獲得されたラベル列に類似する画像データ群を抽出する抽出手段と、
前記抽出手段で抽出された画像データ群のそれぞれについて、前記第1記憶手段に記憶されたラベル列に基づいて前記検索元画像データに対応する画像データの検索を行う検索手段とを備えることを特徴とする画像検索装置。 - 前記インデックステーブルの各ラベル毎に登録される画像データは、当該ラベルの含有数に基づいてソートされている
ことを特徴とする請求項1に記載の画像検索装置。 - 前記ラベルは、多次元特徴量空間を複数のセルに分割して得られたセルの夫々に与えられる固有のラベルであり、
前記付与手段は、前記ブロックの夫々について特徴量を算出し、算出された特徴量が属するセルに付与されているラベルを当該ブロックに付与することを特徴とする請求項1に記載の画像検索装置。 - 前記複数のブロックは画像を縦横複数のブロックに分けて得られたものであり、前記生成手段で用いられるブロック順序は、該複数のブロックを斜め方向に走査する順序であることを特徴とする請求項1に記載の画像検索装置。
- 前記複数のブロックは画像を縦横複数のブロックに分けて得られたものであり、前記生成手段で用いられるブロック順序は、該複数のブロックを水平もしくは鉛直方向に走査する順序であることを特徴とする請求項1に記載の画像検索装置。
- 前記検索手段は、
前記検索元画像データのラベル列と前記抽出手段で抽出された画像データのラベル列との類似度を演算する演算手段と、
前記演算手段による類似度が所定値を越える画像データを検索結果として出力する出力手段とを備えることを特徴とする請求項1に記載の画像検索装置。 - 前記演算手段は、各ラベル値のペアについてペナルティ値を保持するペナルティテーブルを有し、前記検索元画像データのラベル列と前記抽出された画像データのラベル列とから得られる各ラベル値のペアについて該ペナルティテーブルを参照してペナルティ値を取得し、取得されたペナルティ値に基づいて類似度を算出することを特徴とする請求項6に記載の画像検索装置。
- 前記ラベルは、多次元特徴量空間を複数のセルに分割し、得られたセルの夫々に与えられる固有のラベルであり、
前記ペナルティ値は、2つのラベルが表すセル間の距離に基づいて設定される値であることを特徴とする請求項7に記載の画像検索装置。 - 前記演算手段は、検索元画像のラベル列と比較先画像のラベル列との類似度を演算するにおいて、更にラベルの過不足に対するペナルティ値を付与することを特徴とする請求項7に記載の画像検索装置。
- 前記演算手段は、前記ペナルティ値を用いてDPマッチングを行い、類似度を算出することを特徴とする請求項7に記載の画像検索装置。
- 前記抽出手段は、前記第1記憶手段に記憶されたラベル列のうちの、前記検索元画像データのラベル列に含まれるラベルと同一もしくは類似のラベルを所定数以上含むラベル列を前記インデックステーブルを参照して抽出することを特徴とする請求項1に記載の画像検索装置。
- 前記ラベル列が、2次元のラベル行列を表し、
前記検索手段が、
前記検索元画像データのラベル行列より抽出される行単位のラベル列と、前記抽出手段で抽出された画像データのラベル行列より抽出される行単位のラベル列とをDPマッチングによって対応づけて該抽出された画像データの行並びを得る第1マッチング手段と、
前記検索元画像データのラベル行列の行並びと、前記第1マッチング手段で得られた行並びとの類似度をDPマッチングによって求める第2マッチング手段とを備えることを特徴とする請求項1に記載の画像検索装置。 - 前記行単位のラベル列は、画像の水平方向に対応する並び、または、画像の垂直方向に対応する並びであることを特徴とする請求項12に記載の画像検索装置。
- 前記第2マッチング手段によって得られた類似度が所定値を越える画像を検索結果として出力する出力手段を更に備えることを特徴とする請求項12に記載の画像検索装置。
- 前記第1マッチング手段は、各ラベルのペアについてペナルティ値を保持するペナルティテーブルを有し、前記検索元画像のラベル列と前記比較先画像のラベル列との距離をDPマッチング手法を用いて算出するに際して該ペナルティテーブルを参照することを特徴とする請求項12に記載の画像検索装置。
- 前記第2マッチング手段は、行並びにおける各行番号のペアについてペナルティ値を保持する行間ペナルティテーブルを有し、前記検索元画像の行並びと前記比較先画像の行並びの類似度をDPマッチング手法を用いて算出するに際して、該行間ペナルティテーブルを参照することを特徴とする請求項12に記載の画像検索装置。
- 前記元画像データの行方向の各ラベル列の類似度に基づいて各行のペアに関するペナルティー値を決定し、これを前記行間ペナルティテーブルとして保持する保持手段を更に備えることを特徴とする請求項16に記載の画像検索装置。
- 前記第1マッチング手段は、前記元画像データのラベル列と前記記憶手段に記憶されたラベル列との類似度を演算するにおいて、更にラベル比較の系列伸縮に伴うペナルティー及び制約を付与することを特徴とする請求項12に記載の画像検索装置。
- 前記第1マッチング手段で使用するDPマッチングの整合窓の幅を設定する第1設定手段を更に備えることを特徴とする請求項12に記載の画像検索装置。
- 前記第2マッチング手段で使用するDPマッチングの整合窓の幅を設定する第2設定手段を更に備えることを特徴とする請求項12に記載の画像検索装置。
- 画像特徴量算出手段が、メモリに格納された画像データについて、画像を複数のブロックに分割し、各ブロックの画像データから各ブロックの特徴量を算出する算出工程と、
ラベル付与手段が、前記算出工程で算出された特徴量に応じて各ブロックにラベルを付与する付与工程と、
ラベル列生成手段が、前記付与工程で付与されたラベルを所定のブロック順序に基づいて並べることによりラベル列を生成する生成工程と、
第1記憶手段が、前記生成工程で生成されたラベル列を前記画像データに対応付けて画像管理記憶手段に記憶する第1記憶工程と、
第2記憶手段が、前記生成されたラベル列に基づいて、前記画像データをラベルをキーとして、ラベル毎に当該ラベルを含む画像データを示す画像IDを登録するとともに、各画像データにおける当該ラベルの含有数を登録するインデックステーブルをラベル記憶手段に記憶する第2記憶工程と、
抽出手段が、検索元となる検索元画像データの指定に応じて、該検索元画像データに対応するラベル列を前記算出工程、前記付与工程及び前記生成工程により獲得し、前記インデックステーブルに登録されている画像IDとラベルの含有数とに基づき、該獲得されたラベル列に類似する画像データ群を抽出する抽出工程と、
検索手段が、前記抽出工程で抽出された画像データ群のそれぞれについて、前記画像記憶手段に記憶されているラベル列に基づいて前記検索元画像データに対応する画像データを検索してその検索結果データを出力する検索工程とを備えることを特徴とする画像検索方法。 - コンピュータに類似画像検索処理を実行させるために、該コンピュータを、
メモリに格納された画像データについて、画像を複数のブロックに分割し、各ブロックの画像データから各ブロックの特徴量を算出し、算出された特徴量に応じて各ブロックにラベルを付与する付与手段と、
前記付与手段で付与されたラベルを所定のブロック順序に基づいて並べることによりラベル列を生成する生成手段と、
前記生成手段で生成されたラベル列と前記画像データの対応付けデータをメモリに記憶する第1記憶手段と、
前記生成されたラベル列に基づいて、前記画像データをラベルをキーとして、ラベル毎に当該ラベルを含む画像データを示す画像IDを登録するとともに、各画像データにおける当該ラベルの含有数を登録するインデックステーブルをメモリに記憶する第2記憶手段と、
検索元となる検索元画像データの指定に応じて、該検索元画像データに対応するラベル列を獲得し、前記インデックステーブルに登録されている画像IDとラベルの含有数とに基づき、該獲得されたラベル列に類似する画像データ群を抽出する抽出手段と、
前記抽出手段で抽出された画像データ群のそれぞれについて、前記対応付けデータに登録されているラベル列に基づいて前記検索元画像データに対応する画像データを検索してその検索結果データを出力する検索手段とを備える画像検索装置として機能させる制御プログラムを格納したことを特徴とする記憶媒体。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP09013398A JP3720573B2 (ja) | 1998-04-02 | 1998-04-02 | 画像検索装置及び方法 |
| US09/281,783 US6584223B1 (en) | 1998-04-02 | 1999-03-31 | Image search apparatus and method |
| DE69942901T DE69942901D1 (de) | 1998-04-02 | 1999-03-31 | Einrichtung und Verfahren zum Suchen von Bildern |
| EP99302566A EP0947937B1 (en) | 1998-04-02 | 1999-03-31 | Image search apparatus and method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP09013398A JP3720573B2 (ja) | 1998-04-02 | 1998-04-02 | 画像検索装置及び方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11288418A JPH11288418A (ja) | 1999-10-19 |
| JP3720573B2 true JP3720573B2 (ja) | 2005-11-30 |
Family
ID=13990018
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP09013398A Expired - Fee Related JP3720573B2 (ja) | 1998-04-02 | 1998-04-02 | 画像検索装置及び方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3720573B2 (ja) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4610696B2 (ja) * | 2000-06-07 | 2011-01-12 | カシオ計算機株式会社 | 画像処理装置及び記録媒体 |
| JP2003109009A (ja) * | 2001-09-26 | 2003-04-11 | Communication Research Laboratory | 画像の類似性計測方法及び装置 |
| JP4235604B2 (ja) | 2004-11-22 | 2009-03-11 | キヤノン株式会社 | 画像処理装置、画像処理方法、ならびにプログラム |
| JP4968882B2 (ja) | 2005-06-03 | 2012-07-04 | キヤノン株式会社 | 画像検索装置、画像検索方法およびプログラム |
| JP4642697B2 (ja) | 2006-05-24 | 2011-03-02 | Necディスプレイソリューションズ株式会社 | 画像キャッシュメモリを有する画像表示装置 |
| JP4183012B2 (ja) * | 2007-04-16 | 2008-11-19 | カシオ計算機株式会社 | 画像処理装置および記録媒体 |
| JP5277499B2 (ja) * | 2007-05-16 | 2013-08-28 | 株式会社アテロソフト | 情報検索装置 |
| JP4820433B2 (ja) * | 2009-05-14 | 2011-11-24 | 日本電信電話株式会社 | 画像情報検索装置及びプログラム |
| KR102441902B1 (ko) * | 2021-12-10 | 2022-09-13 | 주식회사 이안에스아이티 | 시계열 3차원 시각화 데이터 생성 방법 및 장치 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3311077B2 (ja) * | 1993-05-06 | 2002-08-05 | 松下電器産業株式会社 | 画像検索装置 |
| JPH07160725A (ja) * | 1993-12-03 | 1995-06-23 | Toshiba Corp | 画像検索装置 |
| JP3727967B2 (ja) * | 1995-01-31 | 2005-12-21 | キヤノン株式会社 | 画像検索方法及びその装置 |
| JPH08137908A (ja) * | 1994-11-15 | 1996-05-31 | Canon Inc | 画像検索方法及び装置 |
| JP3199976B2 (ja) * | 1995-03-14 | 2001-08-20 | 正夫 坂内 | 画像データベース装置 |
-
1998
- 1998-04-02 JP JP09013398A patent/JP3720573B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH11288418A (ja) | 1999-10-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6584223B1 (en) | Image search apparatus and method | |
| EP0866409B1 (en) | Image retrieval apparatus and method | |
| Bai et al. | Learning-based efficient graph similarity computation via multi-scale convolutional set matching | |
| JP3754791B2 (ja) | 画像検索装置及び方法 | |
| JP3952592B2 (ja) | 画像検索装置及び方法 | |
| US6691126B1 (en) | Method and apparatus for locating multi-region objects in an image or video database | |
| US6564206B1 (en) | Information search apparatus and method, and storage medium | |
| US7961950B2 (en) | Image processing apparatus, method thereof, and its control method | |
| EP1634135B1 (en) | Systems and methods for source language word pattern matching | |
| EP1993064A2 (en) | Image processing apparatus and image retrieval method | |
| US5359671A (en) | Character-recognition systems and methods with means to measure endpoint features in character bit-maps | |
| CN109101981B (zh) | 一种街景场景下基于全局图像条纹码的回环检测方法 | |
| US5999653A (en) | Fast techniques for searching images using the Hausdorff distance | |
| JP4235604B2 (ja) | 画像処理装置、画像処理方法、ならびにプログラム | |
| JP2004522228A (ja) | ディジタル画像を表現し比較する方法 | |
| CN115145906A (zh) | 一种面向结构化数据的预处理和补全方法 | |
| JP3720573B2 (ja) | 画像検索装置及び方法 | |
| Wang et al. | Chinese document image retrieval system based on proportion of black pixel area in a character image | |
| JP3193658B2 (ja) | データ間結合ルール導出方法及び装置、及び直交凸領域切出方法及び装置 | |
| JP2000311246A (ja) | 類似画像表示方法及び類似画像表示処理プログラムを格納した記録媒体 | |
| JP3720538B2 (ja) | 画像検索装置及び方法 | |
| Schreck et al. | A new metaphor for projection-based visual analysis and data exploration | |
| JP2007079616A (ja) | 情報検索装置、情報検索装置の制御方法、及び制御プログラム | |
| KR102054211B1 (ko) | 이미지 쿼리 기반의 영상 검색 방법 및 시스템 | |
| Munarko et al. | HII: Histogram Inverted Index for Fast Images Retrieval. |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041022 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041221 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050307 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050428 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050822 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050908 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090916 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090916 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100916 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100916 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110916 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110916 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120916 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120916 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130916 Year of fee payment: 8 |
|
| LAPS | Cancellation because of no payment of annual fees |
