JP5018404B2 - 画像識別装置および画像識別方法、並びに、プログラム - Google Patents

画像識別装置および画像識別方法、並びに、プログラム Download PDF

Info

Publication number
JP5018404B2
JP5018404B2 JP2007285164A JP2007285164A JP5018404B2 JP 5018404 B2 JP5018404 B2 JP 5018404B2 JP 2007285164 A JP2007285164 A JP 2007285164A JP 2007285164 A JP2007285164 A JP 2007285164A JP 5018404 B2 JP5018404 B2 JP 5018404B2
Authority
JP
Japan
Prior art keywords
image
model
identification
unit
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007285164A
Other languages
English (en)
Other versions
JP2009116385A5 (ja
JP2009116385A (ja
Inventor
章 中村
嘉昭 岩井
隆之 芦ヶ原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007285164A priority Critical patent/JP5018404B2/ja
Priority to US12/261,190 priority patent/US8374437B2/en
Priority to CN2008101683880A priority patent/CN101425144B/zh
Publication of JP2009116385A publication Critical patent/JP2009116385A/ja
Publication of JP2009116385A5 publication Critical patent/JP2009116385A5/ja
Application granted granted Critical
Publication of JP5018404B2 publication Critical patent/JP5018404B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像識別装置および画像識別方法、並びに、プログラムに関し、特に、画像を識別する処理を行う場合に用いて好適な、画像識別装置および画像識別方法、並びに、プログラムに関する。
認識のためにモデル画像を予め登録し、そのモデル画像と、認識処理のために入力されたクエリ画像のそれぞれから特徴点を抽出し、その周辺の局所特徴量同士をマッチングしたのち、幾何学拘束を用いてミスマッチを除去し、認識を行うものとして、局所特徴量を用いたテクスチャベースの一般物体認識手法がある(例えば、特許文献1参照)。
この技術は、モデル画像およびクエリ画像から特徴点を抽出し、その周辺の局所特徴量を記述し、特徴量同士のマッチングを行い、ハフ変換またはRANSAC等によってアウトライヤ(ミスマッチ)除去を行った後のマッチングペア数で、クエリ画像内の物体の識別をするという手法であった。
特開2004−326693号公報
しかしながら、モデル同士の一部のテクスチャが同じであるときなど、複数のモデル画像同士が類似している場合、上述した特許文献1などのように、マッチペア数でクエリ画像内の物体の一致不一致を判断する一般的な物体認識手法を使用すると、閾値を上回るマッチペアが複数のモデル画像で観測され、複数のモデルに対して「正解」と認識してしまうという可能性がある。
本発明はこのような状況に鑑みてなされたものであり、複数のモデル画像同士が類似している場合であっても、正しく物体を認識することができるようにするものである。
本発明の一側面の画像識別装置は、複数のモデル画像および前記モデル画像の特徴量を記憶し、認識画像の入力を受け、前記認識画像に対応する前記モデル画像を識別する画像識別装置において、前記モデル画像のうち、他の前記モデル画像のうちのいずれかと所定数以上の前記特徴量がマッチした複数の前記モデル画像である類似モデル画像において、前記類似モデル画像間で相関の少ない特徴点である識別特徴点を記憶する記憶手段と、前記認識画像を取得する認識画像取得手段と、前記認識画像取得手段により取得された前記認識画像の特徴量を抽出する認識画像特徴量抽出手段と、前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像との特徴量の相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別する識別手段と、前記認識画像取得手段により取得された前記認識画像と記憶されている前記モデル画像との特徴量のマッチング処理を行い、マッチング処理結果からアウトライヤを除去するマッチング手段とを備え、前記マッチング手段によるマッチングの結果、前記認識画像と所定の閾値以上の特徴量がマッチングした前記モデル画像が所定数以上であるとき、前記識別手段は、所定数以上の前記モデル画像を前記類似モデル画像として、前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像の特徴量との相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別する画像識別装置である。
前記類似モデル画像に対して、前記認識画像に合致するようにアフィン変換を施す変換手段を更に備えさせるようにすることができ、前記識別手段には、前記変換手段により変換された前記類似モデル画像を用いて、前記認識画像に対応する前記類似モデル画像を識別させるようにすることができる。
前記記憶手段により記憶された前記識別特徴点は、マッチ数が多いほど対応する類似モデル画像であると識別される第1の識別特徴点と、マッチ数が少ないほど対応する類似モデル画像であると識別される2の識別特徴点とに分類されるものとすることができる。
前記記憶手段により記憶された前記識別特徴点は、階層構造を有しているものとすることができる。
本発明の一側面の画像識別方法は、複数のモデル画像および前記モデル画像の特徴量を記憶し、認識画像の入力を受け、前記認識画像に対応する前記モデル画像を識別する画像識別方法において、記憶手段が、前記モデル画像のうち、他の前記モデル画像のうちのいずれかと所定数以上の前記特徴量がマッチした複数の前記モデル画像である類似モデル画像において、前記類似モデル画像間で相関の少ない特徴点である識別特徴点を記憶し、認識画像取得手段が、前記認識画像を取得し、認識画像特徴量抽出手段が、前記認識画像取得手段により取得された前記認識画像の特徴量を抽出し、識別手段が、前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像との特徴量の相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別し、マッチング手段が、前記認識画像取得手段により取得された前記認識画像と記憶されている前記モデル画像との特徴量のマッチング処理を行い、マッチング処理結果からアウトライヤを除去するステップを含み、前記マッチングの結果、前記認識画像と所定の閾値以上の特徴量がマッチングした前記モデル画像が所定数以上であるとき、所定数以上の前記モデル画像を前記類似モデル画像として、前記記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像の特徴量との相関を求めることにより、前記認識画像に対応する前記類似モデル画像が識別される画像識別方法である。
本発明の一側面のプログラムは、コンピュータを、複数のモデル画像および前記モデル画像の特徴量を記憶し、認識画像の入力を受け、前記認識画像に対応する前記モデル画像を識別する画像識別装置において、前記モデル画像のうち、他の前記モデル画像のうちのいずれかと所定数以上の前記特徴量がマッチした複数の前記モデル画像である類似モデル画像において、前記類似モデル画像間で相関の少ない特徴点である識別特徴点を記憶する記憶手段と、前記認識画像を取得する認識画像取得手段と、前記認識画像取得手段により取得された前記認識画像の特徴量を抽出する認識画像特徴量抽出手段と、前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像との特徴量の相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別する識別手段と、前記認識画像取得手段により取得された前記認識画像と記憶されている前記モデル画像との特徴量のマッチング処理を行い、マッチング処理結果からアウトライヤを除去するマッチング手段とを備え、前記マッチング手段によるマッチングの結果、前記認識画像と所定の閾値以上の特徴量がマッチングした前記モデル画像が所定数以上であるとき、前記識別手段は、所定数以上の前記モデル画像を前記類似モデル画像として、前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像の特徴量との相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別する画像識別装置として機能させるプログラムである。
本発明の一側面においては、前記モデル画像のうち、他の前記モデル画像のうちのいずれかと所定数以上の前記特徴量がマッチした複数の前記モデル画像である類似モデル画像において、前記類似モデル画像間で相関の少ない特徴点である識別特徴点が記憶され、前記認識画像が取得され、前記取得された前記認識画像の特徴量が抽出され、前記記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像との特徴量の相関を求めることにより、前記認識画像に対応する前記類似モデル画像が識別され、前記取得された前記認識画像と記憶されている前記モデル画像との特徴量のマッチング処理を行い、マッチング処理結果からアウトライヤが除去され、前記マッチングの結果、前記認識画像と所定の閾値以上の特徴量がマッチングした前記モデル画像が所定数以上であるとき、所定数以上の前記モデル画像を前記類似モデル画像として、前記記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像の特徴量との相関を求めることにより、前記認識画像に対応する前記類似モデル画像が識別される。
ネットワークとは、少なくとも2つの装置が接続され、ある装置から、他の装置に対して、情報の伝達をできるようにした仕組みをいう。ネットワークを介して通信する装置は、独立した装置どうしであっても良いし、1つの装置を構成している内部ブロックどうしであっても良い。
また、通信とは、無線通信および有線通信は勿論、無線通信と有線通信とが混在した通信、即ち、ある区間では無線通信が行われ、他の区間では有線通信が行われるようなものであっても良い。さらに、ある装置から他の装置への通信が有線通信で行われ、他の装置からある装置への通信が無線通信で行われるようなものであっても良い。
認識装置、識別特徴点選択部に対応する装置、または、判定処理部に対応する装置は、独立した装置であっても良いし、情報処理装置などの1ブロックであっても良い。
また本発明の一側面によれば、モデル画像のうち、他のモデル画像のうちのいずれかと所定数以上の特徴量がマッチした複数のモデル画像である類似モデル画像において、類似モデル画像間で相関の少ない特徴点である識別特徴点を用いて識別処理を行うことができるので、類似するモデル画像がある場合でも、ロバスト性を維持しながら、正しいモデル画像を識別することができる。
以下、図を参照して、本発明の実施の形態について説明する。
例えば、識別するべきモデルに対応するモデル画像が、図1に示される画像11乃至画像15である場合、それぞれの画像は異なるものであるが、これらの画像は、簡略画21に示される二重丸の部分と星印の部分に記載の文字の左側約半分の領域、および、雲形で示される果物の絵の有無もしくは種類以外は、基本的に同様の形状を有している。
図1に示される画像11乃至画像15に対応する画像データ(以下、単に、画像11乃至画像15と称する)がモデル画像に対応するデータ(以下、単に、モデル画像と称する)として登録され、例えば、画像11に対応する画像がクエリ画像に対応するデータ(以下、単に、クエリ画像と称する)として供給されたとき、識別結果として画像11のみが抽出されるべきであるが、上述した従来のマッチングペア数でクエリ画像内の物体の識別をするような技術では、識別のためのマッチペア数にもよるが、画像11乃至画像15のいずれに対しても、正解であると識別をしてしまう。
特に、モデル画像が多岐にわたる場合、画像11乃至画像15を区別可能なほどにマッチペア数の閾値を大きくしてしまっては、識別が厳密になりすぎてしまい、実際は同一であると認識するべきところを、異なるものであると誤認識してしまう可能性が高くなる。しかしながら、一般的なマッチング処理における閾値の設定レベルでは、上述したように、画像11乃至画像15を正しく識別することが困難である。
そこで、モデル画像の登録時に、例えば、図1の画像11乃至画像15のような類似している画像が存在したとき、それらの画像の相関を求め、相似していない部分の特徴点を抽出しておくことにより、識別処理において、相似していない部分のマッチング結果を利用して、図1の画像11乃至画像15のような類似している画像を識別することができるようにすると好適である。
図2は、モデル画像の登録時に、類似している画像の相関を予め求めておき、識別処理において、相似していない部分のマッチング結果を利用することができる認識装置51の構成を示すブロック図である。
認識装置51は、識別特徴点選択部61と判定処理部62とで構成されている。ここでは、認識装置51として1つの装置であるものとして説明するが、識別特徴点選択部61および判定処理部62が、それぞれ1つの装置として構成されていても良いことは言うまでもない。
識別特徴点選択部61は、モデル画像取得部71、特徴量抽出部72、モデル画像辞書記憶部73、マッチング処理部74、アウトライヤ除去部75、アフィンパラメータ取得部76、アフィン変換処理部77、相関画像生成部78、および、識別特徴点抽出部79により構成されている。
モデル画像取得部71は、識別処理のためのモデル画像を取得し、モデル画像辞書記憶部73および特徴量抽出部72に供給する。供給されるモデル画像には、例えば、図1に示される画像11乃至画像15のように、非常に類似したモデル画像の組が含まれているものとする。
特徴量抽出部72は、モデル画像取得部71から供給されたそれぞれのモデル画像から特徴点を抽出し、特徴点周辺から局所特徴量を抽出して、ベクトル記述する。特徴量抽出部72は、抽出した局所特徴量の情報を、モデル画像辞書記憶部73、マッチング処理部74、および、アウトライヤ除去部75に供給する。
特徴点は、例えば、近傍画素との差の大きな画素を抽出したり、画像データにFFT(Fast Fourier transform)をかけることによって得られる高周波成分が多い画素などを抽出するものとしても良いし、その他の方法により抽出するものであっても良い。また、局所特徴量としては、例えば、ガボアジェット(Gabor Jet)や、ハーウェイブレット(Haar Wavelett)、ガウシアン導関数(Gaussian Derivatives)、SIFT特徴などを用いることができる。
モデル画像辞書記憶部73は、モデル画像取得部71から供給されたそれぞれのモデル画像と、特徴量抽出部72から供給されたそれぞれのモデル画像に対応する局所特徴量とを記憶する。モデル画像辞書記憶部73に記憶されたモデル画像とモデル画像に対応する局所特徴量とは、判定処理部62のモデル画像辞書記憶部91に供給され、クエリ画像とのマッチングに利用される。
マッチング処理部74は、特徴量抽出部72から供給された局所特徴量と、現在モデル画像辞書記憶部73に記憶されているそれぞれのモデル画像の局所特徴量とを、例えば、K-NN(k-NearestNeighbor;最近傍分類法)等の手法でマッチングし、マッチペアを求める。以下、特徴量抽出部72で最も新しく局所特徴量が抽出された、マッチング処理の基準とされるモデル画像を、注目モデル画像と称し、モデル画像辞書記憶部73に既に記憶され、マッチング処理部74において注目モデル画像の局所特徴量との比較に用いられている複数の他のモデル画像と区別するものとする。
そして、マッチング処理部74は、注目モデル画像と、注目モデル画像に対して所定数以上のマッチペア数を有する類似モデル画像と、それらのマッチペアの情報とを、アウトライヤ除去部75に供給する。例えば、図1の画像12乃至15が既にモデル画像辞書記憶部73に記憶されている状態で、図1の画像11がモデル画像として供給されたとき、注目モデル画像である画像11に対して、図1の画像12乃至15が、注目モデル画像に対して所定以上のマッチペア数を有する類似モデル画像として抽出される。
また、マッチング処理部74は、局所特徴量を用いてマッチペアを求めるので、注目モデル画像と、比較される他のモデル画像のそれぞれとが、異なる視点から撮像されたものであったり、それらの大きさが異なるものであっても、正しくマッチングを行うことができる。
アウトライヤ除去部75は、例えば、ハフ変換、または、RANSAC(Random Sample Consensus)等を用いて、マッチング処理部74により検出されたマッチペアから、幾何学拘束を満たさないミスマッチペアを除去する。なお、アウトライヤ除去は、上述した技術以外の、いかなる手法を用いて実行するものであってもよい。アウトライヤ除去部75は、注目モデル画像と、注目モデル画像に対して所定以上のマッチペア数を有する類似モデル画像と、アウトライヤ除去後のマッチペアの情報とを、アフィンパラメータ取得部76に供給する。
アフィンパラメータ取得部76は、残ったマッチペアから、注目モデル画像とそれぞれの類似モデル画像とのアフィンパラメータを求める。アフィン変換は、平行移動および回転変換(ユークリッド変換)に拡大縮小変換を加えた相似変換に、せん断変形を許すような変換であり、元の図形で直線上に並ぶ点は変換後も直線上に並び、平行線は変換後も平行線であるなど、幾何学的性質が保たれる変換である。すなわち、アフィンパラメータ取得部76は、注目モデル画像と、類似モデル画像のそれぞれとが、異なる視点から撮像されたものであったり、それらの大きさが異なるものであるときなどであっても、類似モデル画像のそれぞれの歪みを修正し、注目モデル画像に対応する撮像方向から同じ大きさに撮像された画像に補正するための、回転、拡大縮小、せん断変形、平行移動などのためのパラメータである、アフィンパラメータを求める。
アフィンパラメータ取得部76は、注目モデル画像と、注目モデル画像に対して所定以上のマッチペア数を有する類似モデル画像と、アウトライヤ除去後のマッチペアの情報に加えて、算出されたアフィンパラメータとを、アフィン変換処理部77に供給する。
アフィン変換処理部77は、供給された類似モデル画像をアフィンパラメータで変換し、注目モデル画像に対応する撮像方向から同じ大きさに撮像された画像に補正する。アフィン変換処理部77は、注目モデル画像と、注目モデル画像に対して所定以上のマッチペア数を有するアフィン変換後の類似モデル画像と、アウトライヤ除去後のマッチペアの情報とを、相関画像生成部78に供給する。
相関画像生成部78は、注目モデル画像の特徴点ごとに、その位置での、アフィン変換後の類似モデル画像との特徴量の相関値(特徴量距離)を計算し、得られた特徴点ごとの相関値を識別特徴点抽出部79に供給する。ここで得られる相関値を画像上に対応付けると、注目モデル画像と類似モデル画像との相関を示す相関画像となる。
識別特徴点抽出部79は、注目モデル画像のそれぞれの特徴点における類似モデル画像との相関値に基づいて、相関値がある閾値よりも低い特徴点、または、相関値が低い順から所定数の特徴点を、類似モデル画像との識別に用いて有用な特徴点である識別特徴点として抽出し、判定処理部62の識別特徴点記憶部92に供給する。
例えば、図1の画像12乃至15、または、アフィン変換を行ったときに図1の画像12乃至15に変換される画像が、既にモデル画像辞書記憶部73に記憶されている状態で、モデル画像として図1の画像11が供給されたとき、注目モデル画像である画像11に対して、図1の画像12乃至15またはこれらに対応する画像が、類似モデル画像として抽出される。そして、相関画像生成部78は、注目モデル画像である画像11と、アフィン変換後の類似モデル画像である画像12乃至15のそれぞれとの、注目モデル画像の特徴点における特徴量の相関値を求める。そして、識別特徴点抽出部79は、例えば、図3に示されるように、相関値の低い部分の特徴点を抽出する。
なお、例えば、図1を用いて説明した画像12乃至15のうち、画像12が最も早くモデル画像として識別特徴点選択部61に供給されたとき、画像12は、画像13乃至画像15に対して、類似モデル画像であると登録されるが、それ自身は、類似画像を有するモデル画像として処理されないため、画像12に対しては識別特徴点が抽出されない恐れがある。したがって、例えば、マッチング処理部74が所定数以上のマッチペア数を有する類似モデル画像を検出するとき、類似モデル画像として検出されたモデル画像に類似モデル画像が全く対応付けられていない場合は、更に、注目モデル画像と類似モデル画像の扱いを逆にした場合の識別特徴点の検出処理を実行するものとすると好適である。
また、モデル画像が1枚入力されるのに対して、上述した処理が順次行われるのではなく、予め類似モデル画像同士の組を生成しておき、その組に含まれる画像の組み合わせのすべての相関の平均などに基いて、識別特徴点を抽出するものとしても良い。
そのような場合、例えば、図1を用いて説明した画像11乃至画像15において、マッチング処理部74によりマッチング処理が実行されて、マッチペアが求められ、アウトライヤ除去部75において、マッチペアのアウトライヤが除去された場合、類似モデル画像の組として、画像11乃至画像15が抽出される。
そして、アフィンパラメータ取得部76は、全ての組み合わせのアフィンパラメータを取得する。また、アフィンパラメータ変換処理部77は、それぞれの組み合わせのアフィン変換を行う。そして、相関画像生成部78は、全ての組み合わせにおける相関画像を生成して、その平均値などを求める。そして、識別特徴点抽出部79は、複数の相関画像の平均値などに基づいて、相関値がある閾値よりも低い特徴点、または、相関値が低い順から所定数の特徴点を、類似モデル画像との識別に用いて有用な特徴点である識別特徴点として抽出して、判定処理部62の識別特徴点記憶部92に供給することができる。
次に、図2の認識装置51の判定処理部62は、モデル画像辞書記憶部91、識別特徴点記憶部92、クエリ画像取得部93、特徴量抽出部94、マッチング処理部95、アウトライヤ除去部96、アフィンパラメータ取得部97、アフィン変換処理部98、識別特徴点比較部99、識別処理部100、および、識別結果出力部101を含んで構成されている。
モデル画像辞書記憶部91は、モデル画像辞書記憶部73からモデル画像とモデル画像に対応する局所特徴量との供給を受け、記憶する。
識別特徴点記憶部92は、識別特徴点抽出部79から、類似モデル画像を有する上述した注目モデル画像において、類似モデル画像との相関値が低い特徴点である識別特徴点の情報の供給を受け、記憶する。
クエリ画像取得部93は、識別対象であるクエリ画像を取得する。
特徴量抽出部94は、クエリ画像取得部93から供給されたクエリ画像から、特徴点を抽出し、特徴点周辺から局所特徴量を抽出し、ベクトル記述する。特徴点および特徴量の抽出方法は、特徴量抽出部72と同様である。特徴量抽出部94は、抽出した局所特徴量の情報を、マッチング処理部95、および、アウトライヤ除去部96に供給する。
マッチング処理部95は、特徴量抽出部94から供給された局所特徴量と、モデル画像辞書記憶部91に記憶されているモデル画像に対応する局所特徴量とを、例えば、K-NN等の手法でマッチングし、マッチペアを求める。そして、マッチング処理部95は、クエリ画像と、クエリ画像に対して所定数以上のマッチペア数を有するモデル画像のデータと、それらのマッチペアの情報を、アウトライヤ除去部96に供給する。例えば、図1の画像11乃至画像15がモデル画像としてモデル画像辞書記憶部91に記憶されているとき、図4に示されるクエリ画像111が供給された場合、マッチング処理部95は、画像11乃至画像15を、識別対象である可能性の高いモデル画像として抽出して、アウトライヤ除去部96に供給する。
アウトライヤ除去部96は、ハフ変換、または、RANSAC等を用いて、マッチング処理部95により検出されたマッチペアから、幾何学拘束を満たさないミスマッチペアを除去する。そして、アウトライヤ除去部96は、残ったマッチペア数が所定の閾値よりも多いモデル画像が全く存在しない場合、その結果を識別処理部100に供給する。また、アウトライヤ除去部96は、残ったマッチペア数が所定の閾値よりも多いモデル画像が予め定められた所定の数よりも少ない場合、除去されずに残ったモデル画像とそのマッチペア数を識別処理部100に供給する。また、残ったマッチペア数が所定の閾値を超えているモデル画像が所定の数以上である場合、残ったマッチペア数が所定の閾値よりも多いモデル画像は、上述した類似モデル画像であると考えられる。アウトライヤ除去部96は、類似モデル画像と、クエリ画像と、アウトライヤ除去後のマッチペアの情報とを、アフィンパラメータ取得部97に供給する。
アフィンパラメータ取得部97は、残ったマッチペアから、クエリ画像とそれぞれの類似モデル画像とのアフィンパラメータを求め、クエリ画像、アフィンパラメータ、残ったマッチペア数が所定の閾値よりも多い類似モデル画像、および、アウトライヤ除去後のマッチペアの情報を、アフィン変換処理部98に供給する。
アフィン変換処理部98は、供給された類似モデル画像をアフィンパラメータで変換し、クエリ画像に対応する撮像方向から同じ大きさに撮像された画像に補正する。図4に示されるように、クエリ画像111の類似モデル画像として画像11乃至画像15が抽出された場合、画像11乃至画像15は、アフィン変換処理部98により、アフィン変換後の画像11a乃至画像15aに変換される。アフィン変換処理部98は、クエリ画像、アフィン変換後の類似モデル画像、および、アウトライヤ除去後のマッチペアの情報を、識別特徴点比較部99に供給する。
識別特徴点比較部99は、識別特徴点記憶部92に記憶されているそれぞれのモデル画像の識別特徴点に基づいて、アフィン変換後の類似モデル画像における識別特徴点を求めてその特徴量を算出するとともに、求められた識別特徴点における特徴量と、クエリ画像上の識別特徴点における特徴量との相関値を算出する。すなわち、識別特徴点比較部99は、図4のアフィン変換後の画像11a乃至画像15aの識別特徴点における特徴量と、クエリ画像111の識別特徴点における特徴量との相関値を算出する。識別特徴点比較部99は、相関値の算出結果を、識別処理部100に供給する。
識別処理部100は、アウトライヤ除去部96、または、識別特徴点比較部99から供給された情報に基づいて、識別処理を実行する。すなわち、識別処理部100は、アウトライヤ除去部96において、アウトライヤ除去後に残ったマッチペア数が所定の閾値よりも多い類似モデル画像が予め定められた所定の数よりも少ないと検出された場合、アウトライヤ除去部96から供給されるマッチペア数に基づいて、クエリ画像は、最もマッチペア数の多いモデル画像、または、所定の閾値よりマッチペア数の多い1つまたは複数のモデル画像に対応するものであるとし、その識別結果を、識別結果出力部101に出力する。また、識別処理部100は、アウトライヤ除去部96から、残ったマッチペア数が所定の閾値よりも多い類似モデル画像が全く存在しないことを通知されたとき、クエリ画像はいずれのモデル画像とも一致しないと判定し、判定結果を識別結果出力部101に出力する。
また、識別処理部100は、アウトライヤ除去部96において、アウトライヤ除去後に残ったマッチペア数が所定の閾値を超えている類似モデル画像が所定の数以上であると検出された場合、識別特徴点比較部99から、類似モデル画像とクエリ画像との識別特徴点における特徴量の相関値の供給を受ける。識別処理部100は、供給される特徴量の相関値に基づいて、クエリ画像は、識別特徴点における相関値の平均値が最も高い類似モデル画像、または、平均値の値が所定の閾値よりも高い1つまたは複数の類似モデル画像に対応するものであるとし、その識別結果を、識別結果出力部101に出力する。
識別結果出力部101は、識別処理部100から供給された識別結果を、例えば、表示部に表示したり、音声データとして出力したり、または、所定の伝送路を介して出力するか所定の記録媒体に記録させることなどにより、他の装置に出力する。
認識装置51における類似した画像の識別処理は、例えば、テレビジョン放送等の同一番組のテロップのように、その形式や大きさは略同じであり、文字のみが異なるような画像の識別に適用させることができる。
例えば、図5に示される#1モデル画像121および#2モデル画像122と、クエリ画像123との比較を行う場合について説明する。
#2モデル画像122とクエリ画像123とは、同一であると識別されるべき画像であるが、#1モデル画像121は、#2モデル画像122に対して、その形式や大きさは略同じであり、文字のみが異なる画像である。
したがって、#1モデル画像121と#2モデル画像122とがモデル画像として登録され、クエリ画像123が供給されたとき、識別結果として#2モデル画像122のみが抽出されるべきであるが、上述した従来のマッチングペア数でクエリ画像内の物体の識別をするような技術では、図6に示されるように、#1モデル画像121と#2モデル画像122とのいずれに対しても、所定数以上のマッチペアが抽出されるので、正解であると識別をしてしまう。
そこで、上述した識別特徴点選択部61により、#1モデル画像121と#2モデル画像122との識別特徴点を抽出するものとする。
図7の画像131は、#1モデル画像121と#2モデル画像122とのいずれか一方を注目モデル画像、他方を類似モデル画像としたときの、アフィン変換後のそれぞれの画像をオーバーレイした画像である。画像131から、#1モデル画像121と#2モデル画像122とでは、「現地サポーターも落胆」と「日本代表敗戦の原因」の文字の部分が異なっているが、それ以外は、略、一致していることが分かる。
図7の画像132は、#1モデル画像121と#2モデル画像122との相関画像であり、相関の大きな部分が白く、相関の少ない部分が黒く表示されている。
そして、図7の画像133は、#1モデル画像121と#2モデル画像122とから得られた識別特徴点を示すものである。図2の判定処理部62は、識別特徴点記憶部92に、画像133に示される識別特徴点を記憶する。
図6を用いて説明したように、上述した従来のマッチングペア数でクエリ画像内の物体の識別をするような技術では、クエリ画像123に対して、#1モデル画像121と#2モデル画像122とのいずれにおいても、所定数以上のマッチペアが抽出されてしまい、その両方が、クエリ画像123に対応する画像であると識別されてしまう可能性がある。これに対して、図2の判定処理部62は、図7の画像133に示される識別特徴点において、#1モデル画像121と#2モデル画像122との相関値を求め、これに基づいて、識別処理を行うことができるので、クエリ画像123に対応する画像は、#2モデル画像122であると正しく識別することができる。
すなわち、図2の判定処理部62は、#1モデル画像121と#2モデル画像122とにおいて、「現地サポーターも落胆」と「日本代表敗戦の原因」と記載されている部分に多く含まれる識別特徴点を用いて判定を行うので、クエリ画像123に対応する画像は、#2モデル画像122であると正しく識別することができる。
また、例えば、図1の簡略画21において、雲形で示される部分が類似しているモデル画像がN個存在するが、そのN個は、二重丸部分でa個とb個に分類可能であり、そのb個の類似モデル画像は、星型の部分で完全に分類可能であるなど、モデル画像間の類似の形態が階層構造で表されるとき、または、モデル画像間の類似部分が複数個所あるときなど、類似のモデル画像の判定を、識別特徴点を区別して行ったり、識別特徴点を階層化させて行うことが可能である。
例えば、図8に示されるように、クエリ画像151が入力された判定処理部62のモデル画像辞書記憶部91に、類似モデル画像として、#11モデル画像161乃至#14モデル画像164が記憶されている場合について説明する。
#11モデル画像161乃至#14モデル画像164は、それぞれ、クエリ画像151に対して、類似な部分を有しているので、上述した従来のマッチングペア数でクエリ画像内の物体の識別をするような技術では、#11モデル画像161乃至#14モデル画像164のいずれに対しても、クエリ画像151に対応するものであると識別をしてしまうおそれがある。
#11モデル画像161乃至#14モデル画像164は、それぞれ、相似な部分と相似ではない部分を有している。図9に、#11モデル画像161乃至#14モデル画像164のそれぞれの相関画像を示す。図9の相関画像においては、相関の大きな部分が白く、相関の少ない部分が黒く表示されている。
#11モデル画像161と#12モデル画像162とで異なる部分は、右上のハートマークと、右下の三日月マークの部分である。#11モデル画像161と#13モデル画像163とで異なる部分は、右上のハートマークの部分と、左下の否妻マークの部分である。#11モデル画像161と#14モデル画像164とで異なる部分は、左下の否妻マークの部分である。そして、#12モデル画像162と#13モデル画像163とで異なる部分は、右下の三日月マークの部分と、左下の否妻マークの部分である。#12モデル画像162と#14モデル画像164とで異なる部分は、右上のハートマークと、右下の三日月マークの部分と、左下の否妻マークの部分である。そして、#13モデル画像163と#14モデル画像164とで異なる部分は、右上のハートマークの部分である。
類似モデル画像である#11モデル画像161乃至#14モデル画像164において、左上のスマイルマークは、いずれにおいても同一のため、識別特徴点にはならない。これに対して、マークのない部分は、モデル画像としての特徴が少ない部分であるので、マークのない部分においては、本当に対応するクエリ画像とモデル画像とのそれぞれにおいて、特徴点が抽出されないはずである。換言すれば、マークのない部分においてクエリ画像とモデル画像との特徴量のマッチペアが存在したとき、クエリ画像とモデル画像は類似していないと推定することができる。
また、#11モデル画像161乃至#14モデル画像164において、左上のスマイルマーク以外でマークが記載されている部分は、モデル画像としての特徴が大きい部分であるので、この部分において、クエリ画像とモデル画像との特徴量のマッチペアが存在したとき、クエリ画像とモデル画像とは類似していると推定することができる。
したがって、識別特徴点選択部61の識別特徴点抽出部79は、図10に示されるように、識別特徴点を、2種類に分類し、図中+で示される部分は、モデル画像とクエリ画像の相関値が高いとき、すなわち、対応する特徴点においてマッチペアがあると、クエリ画像とモデル画像は類似していると推定するポジティブ(positive)判定を行う識別特徴点であるものとし、図中×で示される部分は、モデル画像とクエリ画像の相関値が低いとき、すなわち、対応する特徴点においてマッチペアがないと、クエリ画像とモデル画像は類似していると推定するポジティブ(positive)判定を行う識別特徴点であるものとする。
図10において、#11モデル画像161の分類された識別特徴点は、識別特徴点181に示され、#12モデル画像162の分類された識別特徴点は、識別特徴点182に示され、#13モデル画像163の分類された識別特徴点は、識別特徴点183に示され、#14モデル画像164の分類された識別特徴点は、識別特徴点184に示される。
そして、判定処理部62においては、このように分類された識別特徴点を用いることにより、類似モデル画像における類似部分が異なるような場合であっても、識別するために重要な部分と重要ではない部分を区別して、識別処理を行うことができる。
すなわち、図10の識別特徴点181乃至184を利用して、識別特徴点における相関値を算出する判定処理部62の識別特徴点比較部99は、#11モデル画像161とクエリ画像との識別特徴点181における相関値は、右下の部分のみポジティブとなり、#12モデル画像162とクエリ画像との識別特徴点182における相関値は、右上の部分のみポジティブとなり、#13モデル画像163とクエリ画像との識別特徴点183における相関値は、左下、右上、右下の部分においてポジティブとなり、#14モデル画像164とクエリ画像との識別特徴点184における相関値は、右下の部分と左下の部分においてポジティブとなることを検出することができる。これにより、クエリ画像151に対応するモデル画像は、#13モデル画像163であると判定される。
次に、識別特徴点を階層的に分類することにより、類似モデル画像を判別する場合について説明する。
識別特徴点選択部61の識別特徴点抽出部79は、類似モデル画像を複数の類似モデルに分類し、分類を詳細にしていくことにより、最終的には、類似モデルを個々に判別することができるように、階層構造化する。ここでは、図11に示されるように、図8の#11モデル画像161乃至#14モデル画像164を2階層で分類する。1階層目が4つの類似モデルを2つの類似モデル群に識別する類似モデル識別レイヤ1であり、2階層目が類似モデルを個々の類似モデル画像に判別する類似モデル判別レイヤ2である。なお、類似モデル数が多い場合、類似モデル識別レイヤの層の数が多くなる。
まず、識別特徴点選択部61の識別特徴点抽出部79は、あるモデル群同士を識別するのに適した識別特徴点群を選択し、レイヤ1モデル識別特徴点として保持する。例えば、図8の#11モデル画像161乃至#14モデル画像164を、#11モデル画像161および#14モデル画像164と、#12モデル画像162と#13モデル画像163との2つのモデル群に分ける。この2つのモデル群を識別するのに最も適しているのは、右上のハートマークの有無であるから、レイヤ1モデル識別特徴点として右のハートマークの部分が設定される。そして、識別特徴点比較部99においては、#12モデル画像162または#13モデル画像163とクエリ画像とにおいて、この右上の位置の相関価が高いとき、すなわち、マッチペアがあるとき、クエリ画像とモデル画像は類似していると推定するポジティブ(positive)判定が行なわれる。そして、識別特徴点比較部99においては、#11モデル画像161または#14モデル画像164とクエリ画像とにおいて、この右上の位置の相関価が低いとき、すなわち、マッチペアがないとき、クエリ画像とモデル画像は類似していると推定するポジティブ(positive)判定が行なわれる。
そして、識別特徴点選択部61の識別特徴点抽出部79は、それぞれのモデル群に含まれる複数のモデル画像を、更に区別可能な識別特徴点を選択し、レイヤ2モデル識別特徴点として保持する。#11モデル画像161と#14モデル画像164とを識別し、かつ、#12モデル画像162と#13モデル画像163とを識別するのに最も適しているのは、左下の稲妻マークの有無であるので、レイヤ2モデル識別特徴点として左下の稲妻マークの部分が設定される。そして、識別特徴点比較部99においては、#11モデル画像161または#12モデル画像162とクエリ画像とにおいて、この下の位置の相関価が高いとき、すなわち、マッチペアがあるとき、クエリ画像とモデル画像は類似していると推定するポジティブ(positive)判定が行なわれる。そして、識別特徴点比較部99においては、#13モデル画像163または#14モデル画像164とクエリ画像とにおいて、この下の位置の相関価が低いとき、すなわち、マッチペアがないとき、クエリ画像とモデル画像は類似していると推定するポジティブ(positive)判定が行なわれる。
図8の#11モデル画像161乃至#14モデル画像164において、図11に示される階層構造によるレイヤ1モデル識別特徴点とレイヤ2モデル識別特徴点とは、図12に示されるようになる。図12においても、図中+で示される部分は、モデル画像とクエリ画像の相関値が高いとき、すなわち、対応する特徴点においてマッチペアがあると、クエリ画像とモデル画像は類似していると推定するポジティブ(positive)判定を行う識別特徴点であり、図中×で示される部分は、モデル画像とクエリ画像の相関値が低いとき、すなわち、対応する特徴点においてマッチペアがないと、クエリ画像とモデル画像は類似していると推定するポジティブ(positive)判定を行う識別特徴点である。
図12のレイヤ1モデル識別特徴点とレイヤ2モデル識別特徴点を用いて識別特徴点における相関値を算出する判定処理部62の識別特徴点比較部99は、#11モデル画像161においては、いずれの識別特徴点においてもポジティブ判定ではなく、#12モデル画像162においては、レイヤ1モデル識別特徴点のみポジティブとなり、#13モデル画像163においては、レイヤ1モデル識別特徴点とレイヤ2モデル識別特徴点ともポジティブとなり、#14モデル画像164おいては、レイヤ2モデル識別特徴点においてポジティブとなることを算出することができる。すなわち、識別特徴点比較部99は、レイヤ1で、#11モデル画像161と#14モデル画像164はクエリ画像に対応しないことを検出することができ、レイヤ2で、#12モデル画像162はクエリ画像に対応しないことを検出することができる。これにより、クエリ画像151に対応するモデル画像は、#13モデル画像163であると判定される。
このようにして、モデル画像間の類似の形態が階層構造で表されるとき、または、モデル画像間の類似部分複数個所あるときであっても、類似のモデル画像における識別特徴点の抽出を、類似部分を区別して行ったり、階層化させることにより、確実に実行することが可能となる。
次に、図13を参照して、認識装置51の識別特徴点選択部61が実行する処理の第1の例である、識別特徴点抽出処理1について説明する。
ステップS11において、モデル画像取得部71は、識別処理のためのモデル画像を取得し、モデル画像辞書記憶部73および特徴量抽出部72に供給する。
ステップS12において、特徴量抽出部72は、モデル画像取得部71から供給されたそれぞれのモデル画像から、特徴点を抽出し、特徴点周辺から局所特徴量を抽出し、ベクトル記述する。特徴量抽出部72は、抽出した局所特徴量の情報を、モデル画像辞書記憶部73、マッチング処理部74、および、アウトライヤ除去部75に供給する。
ステップS13において、モデル画像辞書記憶部73は、モデル画像取得部71から供給されたそれぞれのモデル画像と、特徴量抽出部72から供給されたそれぞれのモデル画像に対応する局所特徴量とを記憶する。モデル画像辞書記憶部73に記憶されたモデル画像とモデル画像に対応する局所特徴量とは、識別特徴点抽出処理1の終了後、判定処理部62のモデル画像辞書記憶部91に供給され、記憶される。
ステップS14において、マッチング処理部74は、特徴量抽出部72から供給された注目モデル画像の局所特徴量と、現在モデル画像辞書記憶部73に記憶されているそれぞれのモデル画像の局所特徴量とを、例えば、K-NN等の手法でマッチングし、マッチペアを求める。そして、マッチング処理部74は、注目モデル画像と、注目モデル画像に対して所定数以上のマッチペア数を有する類似モデル画像と、それらのマッチペアの情報を、アウトライヤ除去部75に供給する。
ステップS15において、アウトライヤ除去部75は、例えば、ハフ変換、または、RANSAC等を用いて、マッチング処理部74により検出されたマッチペアから、幾何学拘束を満たさないミスマッチペアを除去する。アウトライヤ除去部75は、注目モデル画像に対して所定以上のマッチペア数を有する類似するモデル画像の組である類似モデル画像を抽出し、注目モデル画像と、類似モデル画像と、アウトライヤ除去後のマッチペアの情報を、アフィンパラメータ取得部76に供給する。
ステップS16において、アフィンパラメータ取得部76は、残ったマッチペアから、注目モデル画像とそれぞれの類似モデル画像とのアフィンパラメータを求め、注目モデル画像と、注目モデル画像に対して所定以上のマッチペア数を有する類似モデル画像と、アウトライヤ除去後のマッチペアの情報に加えて、算出されたアフィンパラメータを、アフィン変換処理部77に供給する。
ステップS17において、アフィン変換処理部77は、供給された類似モデル画像をアフィンパラメータで変換し、注目モデル画像に対応する撮像方向から同じ大きさに撮像された画像に補正する。アフィン変換処理部77は、注目モデル画像と、注目モデル画像に対して所定以上のマッチペア数を有するアフィン変換後の類似モデル画像と、アウトライヤ除去後のマッチペアの情報とを、相関画像生成部78に供給する。
ステップS18において、相関画像生成部78は、注目モデル画像の特徴点ごとに、その位置での、アフィン変換後の類似モデル画像との特徴量の相関値(特徴量距離)を計算して、注目モデル画像と類似モデル画像との相関画像を生成し、相関画像、すなわち、得られた特徴点ごとの相関値を示す情報を、識別特徴点抽出部79に供給する。
ステップS19において、識別特徴点抽出部79は、注目モデル画像のそれぞれの特徴点における類似モデル画像との相関値に基づいて、相関値がある閾値よりも低い特徴点、または、相関値が低い順から所定数の特徴点を、類似モデル画像とのモデル識別能力の高い識別特徴点として抽出し、判定処理部62の識別特徴点記憶部92に供給して登録して、処理が終了する。
このような処理により、モデル画像の特徴点における特徴量に加えて、モデル画像ごとに、類似モデル画像とのモデル識別能力の高い識別特徴点を求めることができるので、識別特徴点記憶部92に似識別特徴点が登録された判定処理部62は、類似するモデル画像の識別処理を実行することができる。
なお、ステップS19の処理において、識別特徴点抽出部79は、図8乃至図12を用いて説明したようにして、類似のモデル画像におけるにおける識別特徴点の抽出を、類似部分を区別して行ったり、階層化させるようにしてもよい。
次に、図14を参照して、認識装置51の識別特徴点選択部61が実行する処理の第2の例である、識別特徴点抽出処理2について説明する。
図13を用いて説明した識別特徴点抽出処理1は、モデル画像が類似しているか否かにかかわらずモデル画像を順次入力し、モデル画像が1枚入力されるのに対して、識別特徴点抽出のための処理が順次行われるものであるが、それに対して、識別特徴点抽出処理2は、予め類似モデル画像同士の組を生成しておき、その組に含まれる画像の組み合わせのすべての相関の平均などに基いて、識別特徴点を抽出するものである。
ステップS21乃至ステップS25において、図13のステップS11乃至ステップS15と同様の処理が実行される。すなわち、モデル画像取得部71は、識別処理のためのモデル画像を取得し、特徴量抽出部72は、モデル画像取得部71から供給されたそれぞれのモデル画像から、特徴点を抽出し、特徴点周辺から局所特徴量を抽出し、ベクトル記述する。そして、モデル画像辞書記憶部73は、モデル画像取得部71から供給されたそれぞれのモデル画像と、特徴量抽出部72から供給されたそれぞれのモデル画像に対応する局所特徴量とを記憶する。そして、マッチング処理部74は、注目モデル画像の局所特徴量と、現在モデル画像辞書記憶部73に記憶されているそれぞれのモデル画像の局所特徴量とを、例えば、K-NN等の手法でマッチングし、マッチペアを求め、アウトライヤ除去部75は、例えば、ハフ変換、または、RANSAC等を用いて、マッチング処理部74により検出されたマッチペアから、幾何学拘束を満たさないミスマッチペアを除去する。
ステップS26において、アウトライヤ除去部75は、識別特徴点抽出処理の対象となる全てのモデル画像のマッチングとアウトライヤの除去処理は終了したか否かを判断する。ステップS26において、全てのモデル画像のマッチングとアウトライヤの除去処理は終了していないと判断された場合、処理は、ステップS21に戻り、それ以降の処理が繰り返される。
ステップS26において、全てのモデル画像のマッチングとアウトライヤの除去処理は終了したと判断された場合、ステップS27において、アウトライヤ除去部75は、アウトライヤ除去後の残ったマッチペアに基づいて、類似モデル画像の組を生成し、アフィンパラメータに、類似モデル画像の組の画像データと、アウトライヤ除去後のマッチペアとを、アフィンパラメータ取得部76に供給する。
ステップS28において、アフィンパラメータ取得部76は、類似モデル画像の全ての組み合わせにおいて、アウトライヤ除去後の残ったマッチペアから、注目モデル画像とそれぞれの類似モデル画像とのアフィンパラメータを求め、注目モデル画像と、注目モデル画像に対して所定以上のマッチペア数を有する類似モデル画像と、アウトライヤ除去後のマッチペアの情報に加えて、算出されたアフィンパラメータを、アフィン変換処理部77に供給する。
ステップS29において、アフィン変換処理部77は、類似モデル画像の全ての組み合わせにおいて、供給された類似モデル画像をアフィンパラメータで変換し、注目モデル画像に対応する撮像方向から同じ大きさに撮像された画像に補正する。アフィン変換処理部77は、注目モデル画像と、注目モデル画像に対して所定以上のマッチペア数を有するアフィン変換後の類似モデル画像と、アウトライヤ除去後のマッチペアの情報とを、相関画像生成部78に供給する。
ステップS30において、相関画像生成部78は、類似モデル画像の全ての組み合わせにおいて、注目モデル画像の特徴点ごとに、その位置での、アフィン変換後の類似モデル画像との特徴量の相関値(特徴量距離)を計算して、注目モデル画像と類似モデル画像との相関画像を生成し、その平均を求める。そして、相関画像生成部78は、相関画像の平均値、すなわち、得られた特徴点ごとの相関値の平均値を示す情報を、識別特徴点抽出部79に供給する。
ステップS31において、識別特徴点抽出部79は、注目モデル画像のそれぞれの特徴点における類似モデル画像との相関値の平均値に基づいて、相関値がある閾値よりも低い特徴点、または、相関値が低い順から所定数の特徴点を、類似モデル画像とのモデル識別能力の高い識別特徴点として抽出し、判定処理部62の識別特徴点記憶部92に供給して登録して、処理が終了する。
このような処理により、モデル画像の特徴点における特徴量に加えて、モデル画像ごとに、類似モデル画像とのモデル識別能力の高い識別特徴点を求めることができるので、識別特徴点記憶部92に似識別特徴点が登録された判定処理部62は、類似するモデル画像の識別処理を実行することができる。
なお、ステップS31の処理においても、識別特徴点抽出部79は、図8乃至図12を用いて説明したようにして、類似のモデル画像におけるにおける識別特徴点の抽出を、類似部分を区別して行ったり、階層化させるようにしてもよい。
次に、図15のフローチャートを参照して、認識装置51の判定処理部62が実行する識別判定処理について説明する。
ステップS41において、クエリ画像取得部93は、識別用のクエリ画像を取得する。
ステップS42において、特徴量抽出部94は、クエリ画像取得部93から供給されたクエリ画像から、特徴点を抽出し、特徴点周辺から局所特徴量を抽出し、ベクトル記述する。特徴量抽出部94は、抽出した局所特徴量の情報を、クエリ画像とともに、マッチング処理部95、および、アウトライヤ除去部96に供給する。
ステップS43において、マッチング処理部95は、特徴量抽出部94から供給された局所特徴量と、モデル画像辞書記憶部91に記憶されているモデル画像に対応する局所特徴量とを、例えば、K-NN等の手法でマッチングし、マッチペアを求める。そして、マッチング処理部95は、クエリ画像と、クエリ画像に対して所定数以上のマッチペア数を有するモデル画像である類似モデル画像のデータと、それらのマッチペアの情報を、アウトライヤ除去部96に供給する。
ステップS44において、アウトライヤ除去部96は、ハフ変換、または、RANSAC等を用いて、マッチング処理部95により検出されたマッチペアから、幾何学拘束を満たさないミスマッチペアを除去する。
ステップS45において、アウトライヤ除去部96は、一致度が所定の値以上であるモデル画像が存在したか否かを判断する。ステップS45において、一致度が所定の値以上であるモデル画像が存在しなかったと判断された場合、アウトライヤ除去部96は、その判断結果を識別処理部100に供給に供給し、処理は、後述するステップS51に進む。
ステップS45において、アウトライヤ除去部96は、一致度が所定の値以上であるモデル画像が存在したと判断された場合、ステップS46において、アウトライヤ除去部96は、アウトライヤ除去の後に残ったマッチペア数が所定の閾値よりも多いモデル画像が所定数以上抽出されたか否か、換言すれば、類似モデル画像が存在したか否かを判断する。ステップS46において、モデル画像が所定数以上抽出されなかったと判断された場合、アウトライヤ除去部96は、一致度が所定の値以上であるモデル画像と、除去されずに残ったマッチペア数を識別処理部100に供給して、処理は、後述するステップS50に進む。
ステップS46において、モデル画像が所定数以上抽出されたと判断された場合、ステップS47において、アウトライヤ除去部96は、残ったマッチペア数が所定の閾値よりも多い所定数以上のモデル画像、すなわち、類似モデル画像と、クエリ画像と、アウトライヤ除去後のマッチペアの情報を、アフィンパラメータ取得部97に供給する。アフィンパラメータ取得部97は、残ったマッチペアから、クエリ画像とそれぞれの類似モデル画像とのアフィンパラメータを取得し、クエリ画像、アフィンパラメータ、類似モデル画像、および、アウトライヤ除去後のマッチペアの情報を、アフィン変換処理部98に供給する。
ステップS48において、アフィン変換処理部98は、供給された類似モデル画像をアフィンパラメータで変換し、クエリ画像に対応する撮像方向から同じ大きさに撮像された画像に補正する。アフィン変換処理部98は、クエリ画像、アフィン変換後の類似モデル画像、および、アウトライヤ除去後のマッチペアの情報を、識別特徴点比較部99に供給する。
ステップS49において、識別特徴点比較部99は、識別特徴点記憶部92に記憶されているそれぞれのモデル画像の識別特徴点に基づいて、アフィン変換後の類似モデル画像における識別特徴点を求めてその特徴量を算出するとともに、クエリ画像上の特徴量との識別特徴点における相関値を算出する。
なお、ステップS19の処理において、識別特徴点抽出部79が、図8乃至図12を用いて説明したようにして、類似のモデル画像におけるにおける識別特徴点の抽出を、類似部分を区別して行うか、または、階層化させていた場合、識別特徴点比較部99は、区別された、または、階層化された、それぞれの識別特徴点にしたがって相関値を算出する。
ステップS46において、マッチペア数が所定数以上抽出されなかったと判断された場合、または、ステップS49の処理の終了後、ステップS50において、識別処理部100は、アウトライヤ除去部96から供給されたモデル画像ごとのクエリ画像とのマッチペア数、または、識別特徴点比較部99から供給された類似モデル画像ごとのクエリ画像との識別特徴点における相関値を基に、クエリ画像に対応するモデル画像を識別し、識別結果を識別結果出力部101に出力する。
ステップS45において、一致度が所定の値以上であるモデル画像が存在しなかったと判断された場合、ステップS51において、識別処理部100は、アウトライヤ除去部96からの通知に基づいて、クエリ画像はいずれのモデル画像とも一致しないと判定し、判定結果を識別結果出力部101に出力する。
ステップS50またはステップS51の処理の終了後、ステップS52において、識別結果出力部101は、識別処理部100から供給された識別結果を、例えば、表示部に表示したり、音声データとして出力したり、または、所定の伝送路を介して出力するか所定の記録媒体に記録させることなどにより、他の装置に出力して、処理が終了される。
このような処理により、例えば、図1に示す画像11乃至画像15がモデル画像として登録され、図4を用いて説明したクエリ画像111が入力された場合でも、クエリ画像にそれぞれ多くの特徴点でマッチングしている画像11乃至画像15のなかから、画像12を識別することが可能となる。
以上説明した処理により、認識装置51は、オクルージョンに強く、ロバストであるという一般物体認識器の特徴を保持したまま、類似したモデルが存在した場合でも、どの類似モデルに最も近いかということを正しく識別することが可能となる。
なお、ここでは、認識装置51は1つの装置であるものとして説明したが、識別特徴点選択部61と判定処理部62とは、それぞれ、異なる1つの装置として構成されていても良い。
また、識別特徴点の抽出と、画像の識別処理は連続して行われなくても良く、識別特徴点選択部61と判定処理部62とが、それぞれ、異なる1つの装置として構成され、乖離して設置されていても良いことはいうまでもない。換言すれば、識別特徴点選択部61に対応する装置により生成される識別特徴点が識別特徴点記憶部92に記憶されている判定処理部62に対応する装置は、識別特徴点選択部61に対応する装置と乖離した場所に設置されても単独で画像の識別処理を行うことができる。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。そのソフトウェアは、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。この場合、上述した処理は、図16に示されるようなパーソナルコンピュータ500により実行される。
図16において、CPU(Central Processing Unit)501は、ROM(Read Only Memory)502に記憶されているプログラム、または、記憶部508からRAM(Random Access Memory)503にロードされたプログラムに従って各種の処理を実行する。RAM503にはまた、CPU501が各種の処理を実行する上において必要なデータなどが適宜記憶される。
CPU501、ROM502、およびRAM503は、内部バス504を介して相互に接続されている。この内部バス504にはまた、入出力インターフェース505も接続されている。
入出力インターフェース505には、キーボード、マウスなどよりなる入力部506、CRT,LCDなどよりなるディスプレイ、スピーカなどよりなる出力部507、ハードディスクなどより構成される記憶部508、並びに、モデム、ターミナルアダプタなどより構成される通信部509が接続されている。通信部509は、電話回線やCATVを含む各種のネットワークを介しての通信処理を行う。
入出力インターフェース505にはまた、必要に応じてドライブ510が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどによりなるリムーバブルメディア521が適宜装着され、それから読み出されたコンピュータプログラムが、必要に応じて記憶部508にインストールされる。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、ネットワークや記録媒体からインストールされる。
この記録媒体は、図16に示されるように、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されているリムーバブルメディア521よりなるパッケージメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM502や記憶部508が含まれるハードディスクなどで構成される。
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
なお、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
類似するモデル画像について説明するための図である。 認識装置の構成を示すブロック図である。 識別特徴点について説明するための図である。 クエリ画像の識別について説明するための図である。 テロップへの応用について説明するための図である。 テロップへの応用について説明するための図である。 テロップへの応用について説明するための図である。 類似点が異なる類似モデル画像の例について説明するための図である。 類似点が異なる類似モデル画像の例について説明するための図である。 識別特徴点の分類について説明するための図である。 階層的に類似画像を判別する場合について説明するための図である。 階層的に類似画像を判別する場合について説明するための図である。 識別特徴点抽出処理1について説明するためのフローチャートである。 識別特徴点抽出処理2について説明するためのフローチャートである。 識別判定処理について説明するためのフローチャートである。 パーソナルコンピュータの構成を示すブロック図である。
符号の説明
51 認識装置, 61 識別特徴点選択部, 62 判定処理部, 71 モデル画像取得部, 72特徴量抽出部, 73 モデル画像辞書記憶部, 74 マッチング処理部, 75 アウトライヤ除去部, 76 アフィンパラメータ取得部, 77 アフィン変換処理部, 78 相関画像生成部, 79 識別特徴点抽出部, 91 モデル画像辞書記憶部, 92 識別特徴点記憶部, 93 クエリ画像取得部, 94 特徴量抽出部, 95 マッチング処理部, 96 アウトライヤ除去部, 97 アフィンパラメータ取得部, 98 アフィン変換処理部, 99 識別特徴点比較部, 100 識別処理部, 101 識別結果出力部

Claims (6)

  1. 複数のモデル画像および前記モデル画像の特徴量を記憶し、認識画像の入力を受け、前記認識画像に対応する前記モデル画像を識別する画像識別装置において、
    前記モデル画像のうち、他の前記モデル画像のうちのいずれかと所定数以上の前記特徴量がマッチした複数の前記モデル画像である類似モデル画像において、前記類似モデル画像間で相関の少ない特徴点である識別特徴点を記憶する記憶手段と、
    前記認識画像を取得する認識画像取得手段と、
    前記認識画像取得手段により取得された前記認識画像の特徴量を抽出する認識画像特徴量抽出手段と、
    前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像との特徴量の相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別する識別手段と、
    前記認識画像取得手段により取得された前記認識画像と記憶されている前記モデル画像との特徴量のマッチング処理を行い、マッチング処理結果からアウトライヤを除去するマッチング手段とを備え、
    前記マッチング手段によるマッチングの結果、前記認識画像と所定の閾値以上の特徴量がマッチングした前記モデル画像が所定数以上であるとき、前記識別手段は、所定数以上の前記モデル画像を前記類似モデル画像として、前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像の特徴量との相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別する
    画像識別装置。
  2. 前記類似モデル画像に対して、前記認識画像に合致するようにアフィン変換を施す変換手段を更に備え、
    前記識別手段は、前記変換手段により変換された前記類似モデル画像を用いて、前記認識画像に対応する前記類似モデル画像を識別する
    請求項に記載の画像識別装置。
  3. 前記記憶手段により記憶された前記識別特徴点は、マッチ数が多いほど対応する類似モデル画像であると識別される第1の識別特徴点と、マッチ数が少ないほど対応する類似モデル画像であると識別される2の識別特徴点とに分類される
    請求項に記載の情報処理装置。
  4. 前記記憶手段により記憶された前記識別特徴点は、階層構造を有している
    請求項に記載の情報処理装置。
  5. 複数のモデル画像および前記モデル画像の特徴量を記憶し、認識画像の入力を受け、前記認識画像に対応する前記モデル画像を識別する画像識別方法において、
    記憶手段が、前記モデル画像のうち、他の前記モデル画像のうちのいずれかと所定数以上の前記特徴量がマッチした複数の前記モデル画像である類似モデル画像において、前記類似モデル画像間で相関の少ない特徴点である識別特徴点を記憶し、
    認識画像取得手段が、前記認識画像を取得し、
    認識画像特徴量抽出手段が、前記認識画像取得手段により取得された前記認識画像の特徴量を抽出し、
    識別手段が、前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像との特徴量の相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別し、
    マッチング手段が、前記認識画像取得手段により取得された前記認識画像と記憶されている前記モデル画像との特徴量のマッチング処理を行い、マッチング処理結果からアウトライヤを除去するステップを含み、
    前記マッチングの結果、前記認識画像と所定の閾値以上の特徴量がマッチングした前記モデル画像が所定数以上であるとき、所定数以上の前記モデル画像を前記類似モデル画像として、前記記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像の特徴量との相関を求めることにより、前記認識画像に対応する前記類似モデル画像が識別される
    画像識別方法。
  6. コンピュータを、
    複数のモデル画像および前記モデル画像の特徴量を記憶し、認識画像の入力を受け、前記認識画像に対応する前記モデル画像を識別する画像識別装置において、
    前記モデル画像のうち、他の前記モデル画像のうちのいずれかと所定数以上の前記特徴量がマッチした複数の前記モデル画像である類似モデル画像において、前記類似モデル画像間で相関の少ない特徴点である識別特徴点を記憶する記憶手段と、
    前記認識画像を取得する認識画像取得手段と、
    前記認識画像取得手段により取得された前記認識画像の特徴量を抽出する認識画像特徴量抽出手段と、
    前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像との特徴量の相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別する識別手段と、
    前記認識画像取得手段により取得された前記認識画像と記憶されている前記モデル画像との特徴量のマッチング処理を行い、マッチング処理結果からアウトライヤを除去するマッチング手段とを備え、
    前記マッチング手段によるマッチングの結果、前記認識画像と所定の閾値以上の特徴量がマッチングした前記モデル画像が所定数以上であるとき、前記識別手段は、所定数以上の前記モデル画像を前記類似モデル画像として、前記記憶手段により記憶された前記識別特徴点において、前記類似モデル画像と前記認識画像の特徴量との相関を求めることにより、前記認識画像に対応する前記類似モデル画像を識別する画像識別装置として機能させる
    プログラム。
JP2007285164A 2007-11-01 2007-11-01 画像識別装置および画像識別方法、並びに、プログラム Expired - Fee Related JP5018404B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007285164A JP5018404B2 (ja) 2007-11-01 2007-11-01 画像識別装置および画像識別方法、並びに、プログラム
US12/261,190 US8374437B2 (en) 2007-11-01 2008-10-30 Information processing apparatus, information processing method, image identifying apparatus, image identifying method, and program
CN2008101683880A CN101425144B (zh) 2007-11-01 2008-10-30 信息处理设备及方法、图像识别设备及方法,以及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007285164A JP5018404B2 (ja) 2007-11-01 2007-11-01 画像識別装置および画像識別方法、並びに、プログラム

Publications (3)

Publication Number Publication Date
JP2009116385A JP2009116385A (ja) 2009-05-28
JP2009116385A5 JP2009116385A5 (ja) 2010-11-04
JP5018404B2 true JP5018404B2 (ja) 2012-09-05

Family

ID=40615748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007285164A Expired - Fee Related JP5018404B2 (ja) 2007-11-01 2007-11-01 画像識別装置および画像識別方法、並びに、プログラム

Country Status (3)

Country Link
US (1) US8374437B2 (ja)
JP (1) JP5018404B2 (ja)
CN (1) CN101425144B (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5018404B2 (ja) * 2007-11-01 2012-09-05 ソニー株式会社 画像識別装置および画像識別方法、並びに、プログラム
JP5164222B2 (ja) * 2009-06-25 2013-03-21 Kddi株式会社 画像検索方法およびシステム
US20110103965A1 (en) * 2009-10-30 2011-05-05 General Electric Company Wind turbine blades
US8861864B2 (en) * 2010-03-11 2014-10-14 Qualcomm Incorporated Image feature detection based on application of multiple feature detectors
CN101839722A (zh) * 2010-05-06 2010-09-22 南京航空航天大学 一种中低空下目标自动识别及载体高精度定位方法
ES2384928B1 (es) * 2010-06-25 2013-05-20 Telefónica, S.A. Método y sistema para la identificación rápida y robusta de productos específicos en imágenes.
JP2012033022A (ja) 2010-07-30 2012-02-16 Panasonic Corp 空間における変化領域検出装置及び方法
US20140059857A1 (en) * 2011-05-17 2014-03-06 Panasonic Corporation Method for dismantling refrigerators, refrigerator dismantling device, method for dismantling household electrical appliances, and household electrical appliance dismantling device
JP5755046B2 (ja) 2011-06-22 2015-07-29 キヤノン株式会社 画像認識装置、画像認識方法及びプログラム
JP6098065B2 (ja) * 2011-09-13 2017-03-22 株式会社リコー 画像検査装置、画像検査方法、及びプログラム
JP2013156722A (ja) * 2012-01-27 2013-08-15 Sony Corp 画像処理装置、画像処理方法、学習装置、学習方法およびプログラム
US9430876B1 (en) * 2012-05-10 2016-08-30 Aurasma Limited Intelligent method of determining trigger items in augmented reality environments
US9066200B1 (en) * 2012-05-10 2015-06-23 Longsand Limited User-generated content in a virtual reality environment
CN104584071B (zh) * 2012-08-23 2018-01-26 日本电气株式会社 物体识别装置、物体识别方法
TW201437925A (zh) * 2012-12-28 2014-10-01 Nec Corp 物體識別裝置、方法及電腦程式產品
WO2014169238A1 (en) * 2013-04-11 2014-10-16 Digimarc Corporation Methods for object recognition and related arrangements
US20160070985A1 (en) * 2013-05-02 2016-03-10 Konica Minolta Inc. Image processing apparatus, image processing method, and storage medium storing image processing program thereon
CN105659287B (zh) 2013-08-28 2018-08-17 株式会社理光 图像处理装置、图像处理方法和成像系统
JP6047475B2 (ja) * 2013-11-12 2016-12-21 チームラボ株式会社 画像認識装置、画像認識方法及び画像認識プログラム
TW201531960A (zh) 2013-11-14 2015-08-16 Sicpa Holding Sa 用於驗證產品的圖像分析
JP2015176272A (ja) * 2014-03-14 2015-10-05 オムロン株式会社 画像処理装置、画像処理方法、および画像処理プログラム
CN106062820B (zh) 2014-03-14 2018-12-28 欧姆龙株式会社 图像识别装置、图像传感器、图像识别方法
JP6431302B2 (ja) 2014-06-30 2018-11-28 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US10210427B2 (en) * 2014-07-09 2019-02-19 Slyce Acquisition Inc. Systems, methods, and devices for image matching and object recognition in images
JP6304815B2 (ja) * 2014-08-08 2018-04-04 Kddi株式会社 画像処理装置ならびにその画像特徴検出方法、プログラムおよび装置
JP5933675B1 (ja) * 2014-12-09 2016-06-15 エヌ・ティ・ティ・コムウェア株式会社 情報処理装置、情報処理方法、及びプログラム
CN106354735A (zh) * 2015-07-22 2017-01-25 杭州海康威视数字技术股份有限公司 一种图像中目标的检索方法和装置
CN105956022B (zh) * 2016-04-22 2021-04-16 腾讯科技(深圳)有限公司 电子镜图像处理方法和装置、图像处理方法和装置
US10121237B1 (en) * 2017-04-17 2018-11-06 Rohr, Inc. Component inspection method
US10902257B2 (en) 2017-04-24 2021-01-26 Patek Philippe Sa Geneve Method for identifying a timepiece
CN112800858B (zh) * 2017-07-06 2024-04-26 创新先进技术有限公司 一种模型配置以及图像识别的方法及装置
US11507780B2 (en) 2018-03-05 2022-11-22 Nec Corporation Image analysis device, image analysis method, and image analysis program
CN110580488B (zh) * 2018-06-08 2022-04-01 中南大学 基于字典学习的多工况工业监测方法、装置、设备及介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01102688A (ja) * 1987-10-15 1989-04-20 Nec Corp パターン認識方式
US6453069B1 (en) * 1996-11-20 2002-09-17 Canon Kabushiki Kaisha Method of extracting image from input image using reference image
JP2000123186A (ja) * 1998-10-14 2000-04-28 Canon Inc 被写体認識装置
JP2002183667A (ja) * 2000-12-12 2002-06-28 Ricoh Co Ltd 文字認識装置及び記録媒体
JP4323784B2 (ja) * 2002-12-03 2009-09-02 キヤノン株式会社 文字認識方法
US7417645B2 (en) * 2003-03-27 2008-08-26 Microsoft Corporation Markup language and object model for vector graphics
JP4492036B2 (ja) * 2003-04-28 2010-06-30 ソニー株式会社 画像認識装置及び方法、並びにロボット装置
CN1894703B (zh) * 2003-12-16 2011-04-20 佳能株式会社 模式识别方法和设备
US8050491B2 (en) * 2003-12-17 2011-11-01 United Technologies Corporation CAD modeling system and method
JP2005196678A (ja) * 2004-01-09 2005-07-21 Neucore Technol Inc テンプレートマッチング方法および対象画像領域抽出装置
CA2455359C (en) * 2004-01-16 2013-01-08 Geotango International Corp. System, computer program and method for 3d object measurement, modeling and mapping from single imagery
JP2005210526A (ja) * 2004-01-23 2005-08-04 Konica Minolta Photo Imaging Inc 画像処理装置、撮像装置、画像処理方法、画像データ出力方法、画像処理プログラム及び画像データ出力プログラム
JP4613617B2 (ja) * 2005-01-07 2011-01-19 ソニー株式会社 画像処理システム、学習装置および方法、並びにプログラム
JP2006252272A (ja) * 2005-03-11 2006-09-21 Casio Comput Co Ltd 画像識別装置、画像識別処理プログラム、画像識別処理方法、および登録画像データのデータ構造
US7706603B2 (en) * 2005-04-19 2010-04-27 Siemens Corporation Fast object detection for augmented reality systems
JP4653606B2 (ja) * 2005-05-23 2011-03-16 株式会社東芝 画像認識装置、方法およびプログラム
US7856125B2 (en) * 2006-01-31 2010-12-21 University Of Southern California 3D face reconstruction from 2D images
US8254690B2 (en) * 2007-10-19 2012-08-28 Sony Corporation Information processing apparatus, information processing method, and program
JP5018404B2 (ja) * 2007-11-01 2012-09-05 ソニー株式会社 画像識別装置および画像識別方法、並びに、プログラム

Also Published As

Publication number Publication date
CN101425144B (zh) 2012-05-23
US20090141984A1 (en) 2009-06-04
US8374437B2 (en) 2013-02-12
JP2009116385A (ja) 2009-05-28
CN101425144A (zh) 2009-05-06

Similar Documents

Publication Publication Date Title
JP5018404B2 (ja) 画像識別装置および画像識別方法、並びに、プログラム
EP1693782B1 (en) Method for facial features detection
US8934724B2 (en) Image recognition device, image recognizing method, storage medium that stores computer program for image recognition
US20020051578A1 (en) Method and apparatus for object recognition
US20130287256A1 (en) Method and system for real time image recognition on a mobile device
CN105447532A (zh) 身份认证方法和装置
US20160307057A1 (en) Fully Automatic Tattoo Image Processing And Retrieval
Prakash et al. An efficient ear localization technique
JP6947508B2 (ja) 移動物体検出装置、移動物体検出システム、及び移動物体検出方法
JP2011053953A (ja) 画像処理装置及びプログラム
Parde et al. Face and image representation in deep CNN features
Al-Naser et al. Reconstruction of occluded facial images using asymmetrical principal component analysis
CN103186790A (zh) 对象检测系统和方法
CN102982305A (zh) 信息处理设备和处理信息的方法、存储介质以及程序
JP2022550195A (ja) テキスト認識方法、装置、機器、記憶媒体及びコンピュータプログラム
CN114648771A (zh) 文字识别方法、电子设备和计算机可读存储介质
CN104616019A (zh) 电力设备标牌图像的识别方法
CN112184843B (zh) 图像数据压缩的冗余数据去除系统及方法
Jalilian et al. Persian sign language recognition using radial distance and Fourier transform
JP5848665B2 (ja) 移動物体上動きベクトル検出装置、移動物体上動きベクトル検出方法、およびプログラム
CN116912604B (zh) 模型训练方法、图像识别方法、装置以及计算机存储介质
JP2002117409A (ja) 画像処理方法及びその装置
Juang et al. Vision-based human body posture recognition using support vector machines
Mer et al. From traditional to deep: A survey of image forgery detection techniques
US20180060647A1 (en) Image processing apparatus, non-transitory computer readable medium, and image processing method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100915

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120528

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees