JP4217954B2 - 画像探索装置 - Google Patents

画像探索装置 Download PDF

Info

Publication number
JP4217954B2
JP4217954B2 JP2003033845A JP2003033845A JP4217954B2 JP 4217954 B2 JP4217954 B2 JP 4217954B2 JP 2003033845 A JP2003033845 A JP 2003033845A JP 2003033845 A JP2003033845 A JP 2003033845A JP 4217954 B2 JP4217954 B2 JP 4217954B2
Authority
JP
Japan
Prior art keywords
search
conversion
image data
target
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003033845A
Other languages
English (en)
Other versions
JP2004246477A (ja
Inventor
仁 池田
典司 加藤
洋次 鹿志村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2003033845A priority Critical patent/JP4217954B2/ja
Publication of JP2004246477A publication Critical patent/JP2004246477A/ja
Application granted granted Critical
Publication of JP4217954B2 publication Critical patent/JP4217954B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、写真などの画像データから、顔の部分などといった特定の画像部分を探索する画像探索装置に関する。
【0002】
【従来の技術】
近年、写真等に含まれる特定の対象体、例えば人の顔などの部分を特定し、当該特定した部分に基づいて所定の処理を行うことが考えられている。その一例としては撮影された写真から各人の顔の部分を検出し、当該顔の部分のみを焼き付けたり、または撮像中の映像から人の顔部分を検出して顔の認証処理に供したり、といったものが考えられる。
【0003】
従来の顔画像等、対象体を認識する装置では、対象体の撮像状態(傾き、大きさ、照明状態など)によっては対象体の認識が困難になる場合に対応するため、撮像状態を所定の撮像状態(基準状態)に適合させる処理を行うものがある。
【0004】
従来、この処理では、具体的には撮像状態を変化させながら撮影した学習用画像データを用いてニューラルネットワークを学習させ、当該学習させたニューラルネットワークを利用して処理の対象となった写真での撮像状態が基準状態からどの程度ずれているかを検出し、当該ずれを補正するよう画像処理を行うことが考えられてきた。
【0005】
なお、対象となる画像データから所望のパターンを検出する処理の例としては、特許文献1に開示される、カーネル非線形部分空間法等の方法が知られている。
【0006】
【特許文献1】
特開2001−90274号公報
【0007】
【発明が解決しようとする課題】
しかしながら、例えば人物の顔部分で言えば、横向き加減や上向き加減、首のかしげ具合、照明の具合といった様々な変化があり、従来の基準状態からのずれを検出する処理を行おうとすると、ニューラルネットワークの学習に用いる学習用画像データが上記様々な変化に合わせて大量に必要となる。また、こうした大量の画像データによって学習された結果、ニューラルネットワークの規模も膨大なものとなって、当該処理を現実的な時間内に完了することは不可能であった。
【0008】
また従来の対象体を認識するための装置では、対象体を探索する元となる写真等について、その全体を探索範囲として処理を行っている。このため、処理すべきデータ量も増大してしまい、処理負荷が多大であった。
【0009】
本発明は、上記実情に鑑みて為されたもので、探索の対象体を写真などから探索する処理の負荷を軽減でき、探索の精度を向上できる画像探索装置を提供することをその目的の一つとする。
【0010】
【課題を解決するための手段】
請求項1記載の発明は、処理の対象となった対象画像データ内から、探索の対象となる探索対象の画像データ部分を探索する画像探索装置であって、前記対象画像データ内に、探索領域を少なくとも一つ画定する手段と、変換方法ごとに予め学習獲得された複数の第1変換データベースを参照して、前記画定されたそれぞれの探索領域に含まれる各探索部分データについて適用すべきN1個の変換の方法及び変換の量を含んでなる変換条件を取得し、当該取得した変換条件に基づく変換を、各探索部分データに対して少なくとも一度行う第1変換手段と、前記第1変換手段によって変換された各探索部分データについて、さらに、前記第1変換手段における変換に比べ、変換の方法をN2個(N2はN1とは異なる)とし、変換の量を制限した制限変換条件を、変換方法ごとに予め学習獲得された複数の第2変換データベースを参照して取得し、当該取得した制限変換条件に基づく変換を前記変換された各探索部分データに対して少なくとも一度行い、前記各探索部分データを基準状態へ変換する第2変換手段と、を含み、予め、前記基準状態での画像データを用いて学習獲得された探索データベースを参照し、前記変換後の探索部分データの各々に探索対象が含まれているか否かを判断し、当該判断結果を出力することとしたものである。ここで第1、第2の各変換手段における変換条件の取得の際には、それぞれ探索部分データに基づき所定の特徴量のセットを含んだ特徴量ベクトル情報を演算し、当該特徴量ベクトル情報を用いてそれぞれ第1、第2変換データベースを参照することとなるが、第1変換手段での特徴量ベクトル情報に含まれる特徴量の数N1を、第2変換手段での特徴量ベクトル情報に含まれる特徴量の数N2より少なくして、その精度を粗くしておくこととしてもよい。これによると、第1変換手段における処理負荷が軽減される。
【0011】
請求項2記載の発明は、請求項1に記載の画像探索装置において、前記第1変換手段によって変換された各探索部分データについて、探索対象が含まれているか否かを判断する予備探索手段をさらに有し、当該予備探索手段により、探索対象が含まれていると判断された探索部分データについてのみ、前記第2変換手段が変換を行うこととしたものである。
【0012】
また請求項3記載の発明は、請求項2に記載の画像探索装置において、前記予備探索手段は、第1変換手段によって変換された後の探索部分データについて、探索対象の画像データ例を用いて学習獲得された探索データベースを参照し、前記変換後の探索部分データの各々に探索対象が含まれているか否かを判断することとしたものである。
【0013】
また請求項4記載の発明は、請求項3記載の画像探索装置において、前記探索領域を画定する手段が、探索領域として画定しようとする領域の内部に含まれる画像データのエントロピー、階層エントロピー、色、及び輝度分散、の少なくとも一つを用い、探索領域として実際に画定するか否かを決定することとしたものである。また請求項5記載の発明は、請求項3に記載の画像探索装置において、前記探索領域を画定する手段が、探索領域として画定しようとする領域の内部に含まれる画像データのエントロピーが、所定のしきい値よりも大きい場合には当該探索領域として画定しようとしている領域を実際に探索領域として画定することとしたものである。
【0014】
請求項6記載の発明は、処理の対象となった対象画像データ内から、探索の対象となる探索対象の画像データ部分を探索する画像探索プログラムであって、コンピュータを、前記対象画像データ内に、探索領域を少なくとも一つ画定する手段と、変換方法ごとに予め学習獲得された複数の第1変換データベースを参照して、前記画定されたそれぞれの探索領域に含まれる各探索部分データについて適用すべきN1個の変換の方法及び変換の量を含んでなる変換条件を取得し、当該取得した変換条件に基づく変換を、各探索部分データに対して少なくとも一度行う第1変換手段と、前記第1変換手段によって変換された各探索部分データについて、さらに、前記第1変換手段における変換に比べ、変換の方法をN2個(N2はN1とは異なる)とし、変換の量を制限した制限変換条件を、変換方法ごとに予め学習獲得された複数の第2変換データベースを参照して取得し、当該取得した制限変換条件に基づく変換を前記変換された各探索部分データに対して少なくとも一度行い、前記各探索部分データを基準状態へ変換する第2変換手段と、予め、前記基準状態での画像データを用いて学習獲得された探索データベースを参照し、前記変換後の探索部分データの各々に探索対象が含まれているか否かを判断し、当該判断結果を出力する手段と、として機能させることとしたものである。
【0015】
請求項7記載の発明は、請求項6に記載の画像探索プログラムにおいて、前記第1変換手段としての機能によって変換された各探索部分データについて、探索対象が含まれているか否かを判断し、探索対象が含まれていると判断された探索部分データについてのみ、前記第2変換手段として機能させるよう、前記コンピュータを機能させる手段をさらに含むこととしたものである。
【0016】
請求項8記載の発明は、請求項7に記載の画像探索プログラムにおいて、前記予備探索手段として機能させる際に、第1変換手段によって変換された後の探索部分データについて、探索対象の画像データ例を用いて学習獲得された探索データベースを参照し、前記変換後の探索部分データの各々に探索対象が含まれているか否かを判断させることとしたものである。
【0017】
【発明の実施の形態】
[基本構成]
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る画像探索装置は、図1に示すように、制御部11と、記憶部12と、データベース部13と、表示部14と、操作部15と、外部記憶部16とを含んで構成された、一般的なコンピュータを用いて実現される。このコンピュータは、他の製品、例えばカメラなどに組み込まれたものであっても構わない。
【0018】
制御部11は、記憶部12に格納されているプログラムに従って動作するものであり、処理の対象となった対象画像データのうち、探索領域を少なくとも一つ画定する探索領域画定処理と、基準状態に変換する変換処理と、探索対象が含まれている探索領域を検出する探索処理と、探索結果を用いた所定の処理とを実行する。これらの制御部11の具体的処理内容については、後に詳しく述べる。
【0019】
記憶部12は、制御部11が実行するソフトウエアを格納している。また、この記憶部12は、制御部11がその処理の過程で必要とする種々のデータを保持するワークメモリとしても動作する。具体的にこの記憶部12は、ハードディスクなどの記憶媒体、あるいは半導体メモリ、ないしこれらの組み合わせとして実現できる。
【0020】
データベース部13は、後に説明するように、制御部11の第1変換処理において用いられる第1変換データベース13a、第2変換処理において用いられる第2変換データベース13b、並びに探索処理において用いられる探索データベース13cを含んだデータベースである。このデータベース部13は、具体的にはハードディスクなどの記憶媒体であり、記憶部12がこのデータベース部13を兼ねてもよいが、ここでは説明のため、特に分けて示している。
【0021】
表示部14は、例えばディスプレイ装置やプリンタ装置などであり、制御部11から入力される指示に従い、情報の表示などを行うものである。操作部15は、例えばキーボードやマウスなどであり、ユーザの操作を受け入れて、当該操作の内容を制御部11に出力する。
【0022】
外部記憶部16は、例えばCD−ROMやDVD−ROMなど、コンピュータ可読なリムーバブルメディア(記憶媒体の一種)からプログラムやデータを読み出して制御部11に出力し、制御部11の処理によって記憶部12に格納させる処理を行うものである。本実施の形態に係るプログラムは、例えばCD−ROMなどの可搬的な記憶媒体に格納されて頒布でき、この外部記憶部16を用いて記憶部12に複写されて利用される。なお、本実施の形態に係るプログラムは、こうした記憶媒体だけでなく、ネットワーク上のサーバなどから図示しない通信部を介して記憶部12に複写されることとしてもよい。
【0023】
[制御部11の処理]
ここで、制御部11の処理の内容について具体的に説明する。本実施の形態においては、各処理の対象となる画像データ(対象画像データ)は、外部記憶部16や図示しない通信部を介して外部から入力され、記憶部12に格納される。ここで対象画像データは、一つであっても複数であっても構わない。ユーザが操作部15を操作して、制御部11に対し、特定の対象画像データについて探索対象を探索する処理を行うべき旨の指示(処理開始の指示)を行うと、制御部11は、図2に示す処理を開始する。
【0024】
制御部11は、対象画像データを順次縮小変換しながら、各縮小変換された対象画像データについて探索領域を画定し、各探索領域に含まれる画像データ部分を基準状態に近づける第1変換処理を行い、その後さらに当該各探索領域に含まれる画像データ部分を基準状態により近づける第2変換処理を実行する。そして制御部11は、第2変換処理後の探索領域に含まれる画像データ部分に対して探索処理を実行する。
【0025】
[第1変換処理]
ここでまず、第1変換処理の内容について説明する。本実施の形態において特徴的なことの一つは、この第1変換処理が段階的に、つまり一回ずつ、一つの変換自由度に対応する変換を逐次的に行うようになっていることである。
【0026】
各段階で行うべき変換の内容と変換の量を決定するため、制御部11は、現在選択している探索領域に含まれている画像データ部分に基づいてN1次元の所定の特徴量ベクトル情報を演算する。ここで特徴量ベクトル情報は、探索対象の性状に合わせて選択された、N1個の特徴量要素を含んでなるベクトル量である。
【0027】
本実施の形態では、制御部11は、この特徴量ベクトル情報と、変換データベース13aに格納されている特徴量ベクトル情報とを用いた、カーネル非線形部分空間法によって変換を特定することとして説明する。
【0028】
[第1変換データベース13aの内容]
このカーネル非線形部分空間法は、データを何らかのカテゴリに分類する方法として広く知られているので、詳しい説明を省略するが、その概要を述べれば、N1個の特徴量要素を基底として張られる空間F1において、当該空間F1に含まれる複数の部分空間Ωのそれぞれをデータの分類先であるカテゴリとして認識し、分類しようとするデータに基づいて作成される空間F内の特徴量ベクトル情報(例えばΦとする)を各部分空間Ωに射影し(射影の結果を例えばφとする)、射影前の特徴量ベクトル情報Φと、射影後の特徴量ベクトル情報φとの距離Eが最も小さくなる部分空間Ω(仮に最近接部分空間と呼ぶ)を検出し、分類しようとするデータは、その部分空間Ωによって表されるカテゴリに属すると判断する方法である。
【0029】
そこで学習段階では、同一のカテゴリに属するべき学習用の例示データ(学習サンプル)に対応するN1次元の特徴量ベクトル情報に基づく最近接部分空間Ωが同一となるよう、非線形写像(空間F1への写像、すなわちカーネル関数に含まれるパラメータ等)と、各カテゴリに対応する部分空間Ω間を隔てる超平面との少なくとも一方を調整することとなる。
【0030】
本実施の形態においては、探索対象を基準状態に変換する方法(変換の種類及び量)を決定するために、この変換データベース13aが形成される。つまり、基準状態にあるか否かが不明な画像データに対して、行うべき変換の種類ごとに、変換の量(カテゴリ)を決定できるように変換データベース13aが学習獲得されている。本実施の形態では、画像の回転、平行移動、サイズ変更という、画像に対して行うべき変換の種類(自由度)ごとに、変換データベース13aを作成している。変換の各自由度に対応する変換データベース13aは、対応する変換の変換量をカテゴリとして学習獲得したものである。
【0031】
この学習獲得のため、本実施の形態の変換データベース13aの学習過程では、学習サンプルを次のように生成する。すなわち、所定の基準状態での探索対象である画像データの例を複数用意し、各画像データの例について、変換の自由度ごとに、それぞれの自由度について、互いに異なる変換量での変換が行われた複数の変換画像データを生成する。こうして自由度ごとに生成された変換画像データを、各自由度ごとの学習サンプルとする。具体的に顔を探索対象とする場合、所定の基準状態(所定の撮影条件・姿勢)にある顔の画像データを例として複数用意し、各画像データについて、変換の自由度として、例えば回転・平行移動・サイズ変更等という各自由度ごとに、回転であれば−180度から180度までの範囲で5度ずつ等の角度で回転させた変換画像データを回転の自由度に対する学習サンプルとする。また、平行移動であれば、縦横にそれぞれ5ピクセルずつ移動させた複数の変換画像データを平行移動の自由度に対する学習サンプルとする。なお、これらの学習サンプルは、移動等の変換自由度を含むために、基準状態よりも広い領域の画像データのうちから基準状態の面積を5ピクセルずつ移動させながら取り出すことで生成する。
【0032】
こうして複数の画像データ例のそれぞれについて、さらに自由度ごとにそれぞれ複数の変換が施された複数の画像データを生成し、各画像データにどのような変換を行ったかを表す情報(変換量の大きさ等)を関連づける。
【0033】
なお、ここでは互いに異なる変換量の変換を施した画像データを得るために、変換量を所定のステップ(例えば回転で言えば5度)ずつ変化させながらそれぞれ変換を行った画像データを学習サンプルに含めるようにしたが、所定のステップずつ変化させながらでなくとも、変換量を乱数によって決定しながら変換を行って、それぞれを学習サンプルに含めるようにしてもよい。
【0034】
次に、各自由度ごとの学習サンプルを用いて、各自由度に対応する変換データベース13aを学習させる。
【0035】
[第1変換処理の動作]
制御部11は、こうして学習された各変換データベース13aを用いて、探索領域画定処理によって画定された探索領域の各々について次のように変換処理を行う。すなわち、処理の対象となった探索領域に含まれている画像データ部分(例えば画素値の列としてベクトル値と同視し得る)を、空間F1内のN1次元特徴量ベクトル情報(各変換データベース13aごと、つまり変換の各自由度ごとに定義されている特徴量の組)に写像し、さらにその写像を各部分空間Ωに射影する。そして、射影前の特徴量ベクトル情報と、射影後の特徴量ベクトル情報との距離Eが最小となる変換量を決定する。また制御部11は、距離Eの二乗値Lを演算し、これを誤差として記憶部12に保持する。
【0036】
ここで変換量は、各変換データベース13aに基づき自由度ごとに決定されるが、制御部11は、各自由度に対応する変換量のうち一つを所定の条件(例えば各変換量に対応する距離Eが最小となるもの等の条件)に基づいて選択し、選択した自由度に対応する変換を、選択した変換量の分だけ変換する。
【0037】
つまり、探索領域に含まれている画像データ部分からは、各自由度に対応する各変換データベース13aに学習獲得された情報によって、例えば回転の自由度に対しては10度の回転変換により基準状態に近づき、その誤差がLrであり、平行移動の自由度に対しては左へ5ピクセルの変換で基準状態に近づき、その誤差がLpといった情報が得られるので、この中から、誤差が最小となる自由度の変換を選択する。例えば上述の例の場合、Lr<Lpならば10度の回転変換を探索領域に施して、新たな探索領域を画定する。そして、この新たな探索領域に含まれる画像データ部分をさらに空間F1内の特徴量ベクトル情報に写像し、その写像をさらに各部分空間Ωに射影する。そして、射影前の特徴量ベクトル情報と、射影後の特徴量ベクトル情報との距離Eが最小となる変換量を決定する処理から繰り返す。
【0038】
また、各自由度に対応する変換量がいずれも「0」(つまり無変換)を表すものとなっている場合は、その段階で処理を終了し、さらに未処理の探索領域があれば、当該未処理の探索領域のいずれかを処理の対象として変換処理を行う。
【0039】
なお、ここでは対象画像データのうち、画定された探索領域に含まれる画像データ部分をそのまま用いているが、当該画像データ部分の解像度を低減する処理を行って、粗視データとし、当該粗視データを用いて変換処理を実行してもよい。この場合は、当該粗視データに対応する学習サンプルを用いて、各変換データベース13aを学習獲得させておく。
【0040】
[第2変換処理]
ここでまず、第2変換処理の内容について説明する。本実施の形態において特徴的なことの一つは、この第2変換処理が段階的に、つまり一回ずつ、一つの変換自由度に対応する変換を逐次的に行うようになっていることである。
【0041】
各段階で行うべき変換の内容と変換の量を決定するため、制御部11は、現在選択している探索領域に含まれている画像データ部分に基づいてN2次元の所定の特徴量ベクトル情報を演算する。ここで特徴量ベクトル情報は、探索対象の性状に合わせて選択された、N2個の特徴量要素を含んでなるベクトル量である。本実施の形態においては、第1変換処理によってまず大まかに基準状態に近接させ、ついで第2変換処理を行ってより精密に基準状態に近づける。このため、第2変換処理における特徴ベクトル情報の次元数は、第1変換処理におけるものより大きくする(N2>N1)。これにより、第2変換処理はより精度の高い変換とすることができる。
【0042】
制御部11は、第1変換処理と同様に、このN2次元の特徴量ベクトル情報と、変換データベース11bに格納されている特徴量ベクトル情報とを用いた、カーネル非線形部分空間法によって変換を特定する。
【0043】
[第2変換データベース13bの内容]
第2変換データベース13bは、第1変換データベース13aと同様の方法によって学習獲得されるものであるが、第1変換データベース13aの学習課程では、学習サンプルに基づき、所定N1次元の特徴量ベクトル情報に変換していたのに対し、第2変換データベース13bの学習課程では学習サンプルから所定N2次元の特徴量ベクトル情報に変換して、これを利用した学習を行う点が異なる。
【0044】
[第2変換処理の動作]
制御部11は、各変換自由度ごとに学習獲得されている第2変換データベース13bを用いて、第1変換処理によって変換された探索領域の各々についてさらに第2変換処理を施す。すなわち、処理の対象となった探索領域に含まれている画像データ部分(例えば画素値の列としてベクトル値と同視し得る)を、空間F2内のN2元特徴量ベクトル情報(各第2変換データベース13bごと、つまり変換の各自由度ごとに定義されている特徴量の組)に写像し、さらにその写像を各部分空間Ωに射影する。そして、射影前の特徴量ベクトル情報と、射影後の特徴量ベクトル情報との距離Eが最小となる変換量を決定する。また制御部11は、距離Eの二乗値Lを演算し、これを誤差として記憶部12に保持する。
【0045】
ここで変換量は、第1変換処理の場合と同じく、各第2変換データベース13bに基づき自由度ごとに決定されるが、制御部11は、各自由度に対応する変換量のうち一つを所定の条件(例えば各変換量に対応する距離Eが最小となるもの等の条件)に基づいて選択し、選択した自由度に対応する変換を、選択した変換量の分だけ変換する。
【0046】
つまり、この場合も第1変換処理と同様に、探索領域に含まれている画像データ部分からは、各自由度に対応する各第2変換データベース13bに学習獲得された情報によって、例えば回転の自由度に対しては10度の回転変換により基準状態に近づき、その誤差がLrであり、平行移動の自由度に対しては左へ5ピクセルの変換で基準状態に近づき、その誤差がLpといった情報が得られるので、この中から、誤差が最小となる自由度の変換を選択する。例えば上述の例の場合、Lr<Lpならば10度の回転変換を探索領域に施して、新たな探索領域を画定する。そして、この新たな探索領域に含まれる画像データ部分をさらに空間F2内の特徴量ベクトル情報に写像し、その写像をさらに各部分空間Ωに射影する。そして、射影前の特徴量ベクトル情報と、射影後の特徴量ベクトル情報との距離Eが最小となる変換量を決定する処理から繰り返す。
【0047】
一方各自由度に対応する変換量がいずれも「0」(つまり無変換)を表すものとなっている場合は、その段階で処理を終了し、さらに未処理の探索領域があれば、当該未処理の探索領域のいずれかを処理の対象として変換処理を行う。
【0048】
また、ここでも対象画像データのうち、画定された探索領域に含まれる画像データ部分をそのまま用いているが、当該画像データ部分の解像度を低減する処理を行って、粗視データとし、当該粗視データを用いて第2変換処理を実行してもよい。この場合は、当該粗視データに対応する学習サンプルを用いて、各第2変換データベース13bを学習獲得させておく。
【0049】
なお、これら第1・第2の変換処理において、制御部11は、特徴量ベクトル情報の演算、部分空間への写像、距離の評価、誤差の評価といった処理を各自由度ごとに順次行うのではなく、並列して行ってもよい。
【0050】
さらにここではカーネル非線形部分空間法を用いる場合を例として説明したが、データの分類と、分類時の誤差評価が可能であれば例えばオートエンコーダ等、他の方法を用いても構わない。
【0051】
さらにここでは第2変換処理においても第1変換処理と同様に、各自由度の変換が行われるとして説明したが、第2変換処理においては、変換に係る自由度数を低減してもよい。例えば第1変換処理において最後に施した変換の自由度と同じ自由度の変換だけを行うようにしたり、第2変換処理において最初は変換の自由度を選択するが、第2回目以降の第2変換処理は当該最初の第2変換処理で選択した自由度だけに限って変換を繰り返すようにしてもよい。
【0052】
また、第2変換処理において決定されるカテゴリとしての変換量の最大値を、第1変換処理において決定される変換量の最大値よりも小さく設定しておいてもよい。すなわち、第2変換処理において利用される第2変換データベース13bの学習サンプルは、第1変換データベース13aの学習サンプルよりも変換量の範囲を狭めたものを用いておいてもよい。例えば、第1変換データベース13a用の学習サンプルでは、回転角度−180度から180度までの範囲で10度ずつ回転させた画像データを用い、第2変換データベース13b用の学習サンプルでは、その範囲ときざみ量とをそれぞれ小さくして、−30度から30度までの範囲で3度ずつ回転させた画像データを用いるといったようにする。
【0053】
このように、第2変換処理における変換の条件(変換の自由度又は変換量の少なくとも一方)は第1変換処理に比べて制限されたものであってもよい。
【0054】
[制御部11の処理の流れ]
具体的に制御部11は、まず縮小率Sを最小縮小率(例えば1倍、つまり縮小せず)に設定し(S1)、対象画像データを縮小率Sで縮小する(S2)。そして縮小後の対象画像データのサイズに等しいサイズのマップデータの領域を記憶部12上に確保し、当該領域の値を「偽(false)」に設定して、マップデータの初期化を実行する(S3)。例えば縮小後の対象画像データが1000×1000ピクセルの画像データであれば、1000×1000ビット分の領域を確保し、各ビット値を「0」に初期設定する。
【0055】
次に制御部11は、縮小後の対象画像データについて、少なくとも一つの探索領域を画定する処理を行う(S4)。この探索領域の画定処理については後に詳しく述べる。そして探索領域の一つを選択し(S5)、当該探索領域について第1変換処理を実行する(S6)。
【0056】
制御部11は、続いて、第1変換処理の結果となった探索領域についてさらに第2変換処理を実行し(S7)、これら第1・第2変換処理後の探索領域に含まれる画像データ部分について、探索対象が含まれているか否かを判定する処理(探索処理)を実行する(S8)。ここで探索対象が含まれていると判断されるときには(Yesのときには)、当該変換処理後の探索領域に相当する、マップデータ上の領域の値を「真(true)」に設定する(S9)。そしてさらに選択していない探索領域があるか否かを調べ(S10)、選択していない探索領域があれば(Yesであれば)、処理S5に戻り(A)、当該選択していない探索領域の一つを選択して処理を続ける。
【0057】
一方、処理S8における探索処理の結果、探索対象が含まれていないと判定されるときには(Noのときには)、そのまま処理S10に移行する。また、処理S10において、選択していない探索領域がなければ、つまり、すべての探索領域について変換処理と探索処理とを完了したならば(Noならば)、現在設定されている縮小率Sが事前に定められた最大縮小率を上回っているか否かを調べ(S11)、上回っていなければ(Noならば)、縮小率Sを大きくするように調整して(S12)、処理S2に戻って処理を続ける(B)。ここで、縮小率Sを大きく調整する処理S12は、例えば縮小率Sを所定比で高めるような処理としてもよいし、縮小率Sである倍率に対し、所定乗率ΔSを乗じて、S=S×ΔSとして新たな縮小率Sを定めてもよい。
【0058】
また、処理S11において現在設定されている縮小率Sが事前に定められた最大縮小率を上回っていなければ(Yesならば)、各縮小率での対象画像データに対応するマップデータに基づき、元の(縮小前の)対象画像データ内で、探索対象が含まれている領域を画定して(S13)、処理を終了する。
【0059】
なお、ここでは第1変換処理の後、直ちに第2変換処理を実行しているが、第1変換処理の後で予備的な探索処理(その内容については後に述べる)を行い、この予備的な探索処理の結果、第1変換処理後の探索領域に含まれる画像データ部分に探索対象が含まれる可能性があると判断されたときにのみ第2変換処理を行うようにし、予備的な探索処理の際に第1変換処理後の探索領域に含まれる画像データ部分に探索対象が含まれる可能性はないと判断されたときには、上記の処理S10に移行して処理を続けるようにしてもよい。これによると探索対象が含まれない領域について第2変換処理を行うことがなくなるので、処理負荷をより軽減できる。
【0060】
[探索領域画定処理]
ここで制御部11が探索領域を画定する処理(探索領域画定処理)について説明する。探索領域画定処理は、ユーザから入力された開始点の情報を利用しても、また、所定の条件を満足する領域を自律的に画定することによっても行うことができる。
【0061】
例えばユーザから入力される情報を利用する場合、制御部11は、操作部15などから入力された少なくとも一つの開始点座標の情報に基づき、各開始点座標を左上隅とする予め定められたサイズの矩形領域を探索領域としてそれぞれ画定する。
【0062】
また所定の条件を満足する領域を自律的に検索して画定する場合、制御部11は、(縮小後の)対象画像データの左上隅の座標(例えばX=0,Y=0)を開始点として、予め定められたサイズの矩形領域について所定の画定条件を満足しているか否かを調べ、画定条件を満足しているときには、当該矩形領域を探索領域とするという処理を、開始点を幅方向に所定量ずつ移動しながら(X=X+ΔX)順次行い、開始点が対象画像データの幅を逸脱する(X>対象画像データの幅)と、高さ方向に所定量だけ開始点を移動して(X=0,Y=Y+ΔY)、幅方向の処理を繰り返す。こうして対象画像データ全体のうち、画定条件を満足する領域を探索領域として画定する。
【0063】
なお、ここでは開始点の移動量を幅方向、高さ方向にそれぞれΔX,ΔYとしているが、これら移動量は対象画像データの縮小率Sに応じて、1倍のときのΔX,ΔYに対してΔX/S,ΔY/Sとしてもよい。
【0064】
[探索処理]
次に処理S8で行われる探索処理について説明する。この探索処理では変換処理を完了した探索領域の各々にそれぞれ含まれる画像データ部分について、探索データベース13cを用いて、探索対象が含まれているか否かを判定する。具体的な探索処理の例としては、特開2002−329188号公報に開示された方法などがある。次にその概要を説明する。
【0065】
[探索データベースの学習課程]
この探索データベース13cは、基準状態にある探索対象の画像データの例を学習サンプルとして用い、ニューラルネットワークを学習させて形成する。すなわち、制御部11は、複数の学習サンプルの入力を受けて、その各々について、探索対象の性状に合わせて予め選択された特徴量のセット(特徴量ベクトル)を演算し、学習用データを生成する。次に、この学習用データを用いて、記憶部12に格納されたM×M′の格子空間上に、SOM(自己組織化マップ)によって格子空間マップを形成する。つまり、制御部11は、入力された学習用データである特徴量ベクトルと、各格子ごとに割り当てられた重みベクトルとの距離を所定の測度(例えばユークリッド測度)で演算し、この距離が最小となる格子(最整合ノード)cを検出する。そしてこの最整合ノード近傍の複数の格子について、その重みベクトルを当該入力された特徴量ベクトルを用いて更新する。この処理の繰り返しにより、記憶部12上に格子空間マップが形成され、互いに類似する特徴量ベクトルに対する最整合ノードが連続的な領域を形成するようになる。つまり、この格子空間には、多次元の入力信号である特徴量ベクトルから2次元のマップへの非線形射影が位相を保持したまま形成され、重みの更新により、データの特徴部分が組織化され、その学習成果として類似のデータに反応する格子が近接して存在しているようになる。
【0066】
各学習データに基づく学習が完了すると、次に制御部11は、格子空間マップの各格子をカテゴリに分類する。この分類は、例えば各格子間の距離(各格子に関連づけられた重みベクトル間の距離)に基づいて行うことができ、探索対象に似た画像データに反応する格子群のカテゴリ(探索対象カテゴリ)と、そうでない格子群のカテゴリ(非探索対象カテゴリ)とに分類される。
【0067】
[探索処理の動作]
制御部11は、対象画像データと同じサイズのマップデータを記憶する領域を記憶部12に確保し、当該領域の値を「偽(false)」に初期化する。
【0068】
制御部11は、学習獲得した探索データベース13cを用い、変換処理を完了した探索領域の画像データ部分に基づいて所定の特徴量ベクトルを演算する。そして当該演算した特徴量ベクトルと探索データベース13c内の各格子に関連づけられた重みベクトルとの距離を求め、特徴量ベクトルとの距離が最小となる格子(最整合ノード)を特定し、特定した格子が探索対象カテゴリに属していれば、探索領域に探索対象が含まれていると判断し、特定した格子が非探索対象カテゴリに属していれば、探索領域には探索対象が含まれていないと判断する。
【0069】
[予備的探索処理]
また、第2変換処理を行うか否かを決定するための予備的な探索処理について説明する。この予備的な探索処理は、上記処理S8で行われる探索処理と同様の処理を行ってもよいが、探索処理自体の処理負荷に配慮して、より簡便な処理としておくことも好ましい。
【0070】
例えばこの予備的探索処理としては、第1変換処理後の探索領域に含まれる画像データ部分に基づき、所定の特徴量を演算し、その特徴量が所定の条件を満足しているか否かによって探索対象が含まれている可能性があるか否かを判断するようにしてもよい。一例として、人の顔を探索対象とする場合、人の顔の輪郭部分ではその他の部分に比べてエントロピーが高いので、特徴量としてこのエントロピーを演算し、所定のしきい値(例えば対象画像データ全体の平均的なエントロピー値に基づいて決定されるしきい値)に比べて当該演算したエントロピーの値が高い場合に探索対象が含まれている可能性があると判断する。
【0071】
[制御部11の動作]
本実施の形態の制御部11は、以上のように、探索の対象となった対象画像データを順次縮小しながら、縮小後のそれぞれの対象画像データから探索処理を行う領域を取り出し、当該領域内の画像データ部分を基準状態に近づけるべく第1変換処理を実行し、ついで当該第1変換処理後の画像データ部分に探索対象が含まれているか否かを予備的に探索する。
【0072】
そして、この予備的な探索の結果、探索対象が含まれている可能性があると判断されると、さらに基準状態に近づけるように第2変換処理を実行し、探索対象が当該変換後の探索領域内の画像データに含まれているか否かを判断する。すなわち、制御部11は探索処理の対象となる画像データを基準状態とする処理をまずは粗く行い、ついで細かく行うことで、全体としての処理負荷を軽減する。
【0073】
このように基準状態への変換処理が行われるので、本実施の形態においては、変換前の探索領域の位置が多少ずれていても構わない。また、縮小率が基準状態から多少ずれていたとしても問題とならない。従って従来であれば、0.8倍ずつ縮小した多段階の縮小画像データを生成し、しかも探索領域を1画素ずつずらしながら取り出すようにしていたのに対し、本実施の形態のものでは0.5倍ずつの縮小で構わないし、探索領域を画定する際に、所定の条件を満足する領域を自律的に取り出す場合であっても、ΔXやΔYを6画素等とすることができる。これにより、探索処理の対象となるパターン数を大幅に低減でき、探索の対象体を写真などから探索する処理の負荷を軽減できる。
【0074】
制御部11は、探索対象が含まれていると判断された領域を表すマップデータを探索結果情報として生成するが、このマップデータは各縮小率で縮小された後の対象画像データのそれぞれに対応して複数生成される。そこで、これら複数のマップデータ(それぞれ縮小後の対象画像データのサイズとなっている)を統合的に用いて探索対象が含まれている領域を決定する。
【0075】
例えば、各マップデータを、それぞれの縮小率に応じた拡大率で拡大し、元の対象画像データのサイズに揃えて比較し、すべてのマップデータで共通して「真」となっている領域(どの縮小率の対象画像データに基づいても、探索対象が含まれていると判断された領域)に探索対象が含まれていると判断することとしてもよい。また、いずれか一つのマップデータで「真」となっている領域を探索対象が含まれている領域と判断するようにしてもよい。
【0076】
[探索領域画定処理の変形例]
さらに探索領域画定処理において、制御部11は探索領域として画定しようとする領域について、その内部に含まれる画像データのエントロピーや、階層エントロピー、色、輝度分散、及びこれらのうちの二以上の値の組み合わせを用い、探索領域として実際に画定するか否かを決定してもよい。例えば人物の顔部分を探索する場合、顔の周辺部(輪郭部分)ではエントロピーが高くなるので、エントロピーが所定のしきい値よりも大きい場合には当該探索領域として画定しようとしている領域を実際に探索領域として画定し、そうでない場合には、当該領域を探索領域とせずに、他の処理を続けるようにする。これによると、変換処理・探索処理の対象となる探索領域を合理的に減少させることができ、処理負荷の軽減が図られる。
【0077】
[その他の変形例]
ここまでの説明では、変換処理において行われる変換は、探索領域に関する2次元的な回転、平行移動、拡大縮小(探索領域を拡大縮小し、その内部の画像データ部分を元の(拡大縮小前の)探索領域のサイズに変換して扱えばよい)であり、その結果として、当該探索領域に含まれる画像データ部分が変換されるものとして説明したが、これ以外にも例えば人の顔であれば、姿勢(うつむき加減や振り向き加減)に影響される3次元的な回転等、画像データ部分そのものに対しての変換を含んでもよい。具体的にこのような3次元的な回転などの場合、探索対象の平均的3次元モデルを想定し、当該平均的3次元モデルへ画像データ部分を投射したものを用いて実現することができる。
【0078】
また、探索処理においては探索対象として、例えば人の顔であっても、さらに細かくカテゴリを分けて、年齢や性別、口を開けているか否かなどの条件を含めてもよい。
【0079】
さらに、図2のフローチャート図においては各縮小率における処理を制御部11が順次行うものとしていたが、各縮小率における処理は互いに独立しているので、制御部11は、これらの各縮小率における処理を並列して行ってもよい。
【0080】
[動作]
次に、本実施の形態の画像探索装置の動作について、対象画像データとして与えられた写真の画像データから人の顔部分を探索対象として探索する場合を例として説明する。なお、以下の例では簡単のため、変換の自由度は平行移動(x,y)と、回転(θ)のみであるとして説明する。
【0081】
制御部11は、図示しない外部インタフェースや通信部など、外部から入力される対象画像データを記憶部12に格納し、既に説明した方法で探索領域を画定する。例えば制御部11は、対象画像データを、所定サイズの画像ブロック(その一部が互いに重なり合ってもよい)に区切り、そのうち、例えばエントロピーが所定の値より高い画像ブロックを探索領域として画定する。そして画定された探索領域の一つを選択し、当該選択した探索領域について第1変換処理を実行する。この第1変換処理では、概念的には、基準状態Oから、図3(a)に示すような範囲R1にある画像データ部分が基準状態O近傍に近づけられる。
【0082】
制御部11は、さらに第1変換処理後の画像データ部分に探索対象である人の顔が含まれているか否かを予備的に探索する。この予備的な探索処理は、ニューラルネットワークを利用した本探索処理と同様のものであってもよいし、エントロピーなどの特徴量を用いた簡易なものであってもよい。制御部11は、この予備的な探索処理の結果、第1変換処理後の画像データ部分に探索対象である人の顔が含まれていると判断される場合は、続いて当該画像データ部分に係る探索領域に第2変換処理を実行する。この第2変換処理では、概念的には、図3(a)に対応する図3(b)に示すように、自由度が例えばθ方向(回転)のみで、その変換量の範囲も狭い変換処理(R2)が適用され、画像データ部分を基準状態Oにより近接させる微調整が行われる。
【0083】
制御部11は、この第2変換処理後の探索領域に含まれる画像データ部分に対して探索処理を実行し、探索対象が含まれているか否かを調べ、探索対象が含まれていれば、当該探索処理を行った探索領域に相当する対象画像データの部分を特定する情報を生成する。
【0084】
このように、本実施の形態では、二段階の変換処理を行って、一つの変換データベースを用いるだけの変換処理の場合に比べ、処理負荷を軽減でき、より基準状態に近接させて探索を行わせるため、探索精度も向上できる。
【0085】
なお、ここまでの説明では二段階の変換処理を行う場合を例として示しているが、3回以上の複数回であっても構わない。この場合、段階があがるにつれて変換処理における変換条件をより制限したり、特徴量ベクトル情報の次元数をより高めてもよい。
【0086】
【実施例】
図4(a)は、一種類の変換データベースを用いた変換処理によって基準状態への変換を行った後の画像データが、実際の基準状態からどれだけの誤差を生じていたかを表す分布図であり、図4(b)は、本実施の形態と同様に、二種類の変換データベースを用いて、まずは粗く、次に細かくと2回に分けて変換処理を行った場合に、その結果としての画像データが、実際の基準状態からどれだけの誤差を生じていたかを表す分布図である。各図を参照して理解されるように、本実施の形態の方法によれば、誤差の平均が小さくなり、分布状態からも、より基準状態に近くなるよう変換が為されている。
【0087】
また、前記一種類の変換データベースを用いた変換処理の場合では、収束までに平均的に20回前後の変換処理を要する(各自由度ごとの単位変換がおおよそ20回行われる)のに対し、前記二種類の変換データベースを用いる場合、粗い変換処理に約10回、細かい変換処理に約5回で済んでおり、全体的に変換処理自体の処理負荷も軽減されている。
【図面の簡単な説明】
【図1】 本発明の実施の形態に係る画像探索装置の構成ブロック図である。
【図2】 制御部11の処理の一例を表すフローチャート図である。
【図3】 本発明の実施の形態に係る画像探索装置が行う変換処理の概要を表す説明図である。
【図4】 一種類の変換データベースを用いた変換処理の結果と二種類の変換データベースを用いた二段階の変換処理の結果とを比較した実験結果を表す説明図である。
【符号の説明】
11 制御部、12 記憶部、13 データベース部、14 表示部、15 操作部、16 外部記憶部。

Claims (8)

  1. 処理の対象となった対象画像データ内から、探索の対象となる探索対象の画像データ部分を探索する画像探索装置であって、
    前記対象画像データ内に、探索領域を少なくとも一つ画定する手段と、
    変換方法ごとに予め学習獲得された複数の第1変換データベースを参照して、前記画定されたそれぞれの探索領域に含まれる各探索部分データについて適用すべきN1個の変換の方法及び変換の量を含んでなる変換条件を取得し、当該取得した変換条件に基づく変換を、各探索部分データに対して少なくとも一度行う第1変換手段と、
    前記第1変換手段によって変換された各探索部分データについて、さらに、前記第1変換手段における変換に比べ、変換の方法をN2個(N2はN1とは異なる)とし、変換の量を制限した制限変換条件を、変換方法ごとに予め学習獲得された複数の第2変換データベースを参照して取得し、当該取得した制限変換条件に基づく変換を前記変換された各探索部分データに対して少なくとも一度行い、前記各探索部分データを基準状態へ変換する第2変換手段と、
    を含み、
    予め、前記基準状態での画像データを用いて学習獲得された探索データベースを参照し、前記変換後の探索部分データの各々に探索対象が含まれているか否かを判断し、当該判断結果を出力することを特徴とする画像探索装置。
  2. 請求項1に記載の画像探索装置において、
    前記第1変換手段によって変換された各探索部分データについて、探索対象が含まれているか否かを判断する予備探索手段をさらに有し、
    当該予備探索手段により、探索対象が含まれていると判断された探索部分データについてのみ、前記第2変換手段が変換を行うことを特徴とする画像探索装置。
  3. 請求項2に記載の画像探索装置において、
    前記予備探索手段は、第1変換手段によって変換された後の探索部分データについて、探索対象の画像データ例を用いて学習獲得された探索データベースを参照し、前記変換後の探索部分データの各々に探索対象が含まれているか否かを判断することを特徴とする画像探索装置。
  4. 請求項3に記載の画像探索装置において、
    前記探索領域を画定する手段は、
    探索領域として画定しようとする領域の内部に含まれる画像データのエントロピー、階層エントロピー、色、及び輝度分散、の少なくとも一つを用い、探索領域として実際に画定するか否かを決定することを特徴とする画像探索装置。
  5. 請求項3に記載の画像探索装置において、
    前記探索領域を画定する手段は、
    探索領域として画定しようとする領域の内部に含まれる画像データのエントロピーが、所定のしきい値よりも大きい場合には当該探索領域として画定しようとしている領域を実際に探索領域として画定することを特徴とする画像探索装置。
  6. 処理の対象となった対象画像データ内から、探索の対象となる探索対象の画像データ部分を探索する画像探索プログラムであって、コンピュータを、
    前記対象画像データ内に、探索領域を少なくとも一つ画定する手段と、
    変換方法ごとに予め学習獲得された複数の第1変換データベースを参照して、前記画定されたそれぞれの探索領域に含まれる各探索部分データについて適用すべきN1個の変換の方法及び変換の量を含んでなる変換条件を取得し、当該取得した変換条件に基づく変換を、各探索部分データに対して少なくとも一度行う第1変換手段と、
    前記第1変換手段によって変換された各探索部分データについて、さらに、前記第1変換手段における変換に比べ、変換の方法をN2個(N2はN1とは異なる)とし、変換の量を制限した制限変換条件を、変換方法ごとに予め学習獲得された複数の第2変換データベースを参照して取得し、当該取得した制限変換条件に基づく変換を前記変換された各探索部分データに対して少なくとも一度行い、前記各探索部分データを基準状態へ変換する第2変換手段と、
    予め、前記基準状態での画像データを用いて学習獲得された探索データベースを参照し、前記変換後の探索部分データの各々に探索対象が含まれているか否かを判断し、当該判断結果を出力する手段と、
    として機能させることを特徴とするプログラム。
  7. 請求項6に記載の画像探索プログラムにおいて、
    前記第1変換手段としての機能によって変換された各探索部分データについて、探索対象が含まれているか否かを判断し、探索対象が含まれていると判断された探索部分データについてのみ、前記第2変換手段として機能させるよう、前記コンピュータを機能させる手段をさらに含むことを特徴とする画像探索プログラム。
  8. 請求項7に記載の画像探索プログラムにおいて、
    前記予備探索手段として機能させる際に、第1変換手段によって変換された後の探索部分データについて、探索対象の画像データ例を用いて学習獲得された探索データベースを参照し、前記変換後の探索部分データの各々に探索対象が含まれているか否かを判断させることを特徴とする画像探索プログラム。
JP2003033845A 2003-02-12 2003-02-12 画像探索装置 Expired - Fee Related JP4217954B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003033845A JP4217954B2 (ja) 2003-02-12 2003-02-12 画像探索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003033845A JP4217954B2 (ja) 2003-02-12 2003-02-12 画像探索装置

Publications (2)

Publication Number Publication Date
JP2004246477A JP2004246477A (ja) 2004-09-02
JP4217954B2 true JP4217954B2 (ja) 2009-02-04

Family

ID=33019707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003033845A Expired - Fee Related JP4217954B2 (ja) 2003-02-12 2003-02-12 画像探索装置

Country Status (1)

Country Link
JP (1) JP4217954B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7795296B2 (en) 2001-11-30 2010-09-14 Ajinomoto Co., Inc. Crystals of non-natural-type stereoisomer salt of monatin and use thereof
US8394970B2 (en) 2003-01-09 2013-03-12 Ajinomoto Co., Inc. Process for manufacturing a glutamic acid derivative and a pyroglutamic acid derivative and a novel intermediate in the manufacture thereof

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2454213A (en) * 2007-10-31 2009-05-06 Sony Corp Analyzing a Plurality of Stored Images to Allow Searching
CN116662588B (zh) * 2023-08-01 2023-10-10 山东省大数据中心 一种海量数据智能搜索方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7795296B2 (en) 2001-11-30 2010-09-14 Ajinomoto Co., Inc. Crystals of non-natural-type stereoisomer salt of monatin and use thereof
US8394970B2 (en) 2003-01-09 2013-03-12 Ajinomoto Co., Inc. Process for manufacturing a glutamic acid derivative and a pyroglutamic acid derivative and a novel intermediate in the manufacture thereof

Also Published As

Publication number Publication date
JP2004246477A (ja) 2004-09-02

Similar Documents

Publication Publication Date Title
US7995805B2 (en) Image matching apparatus, image matching method, computer program and computer-readable storage medium
CN110378837B (zh) 基于鱼眼摄像头的目标检测方法、装置和存储介质
KR101896357B1 (ko) 객체를 검출하는 방법, 디바이스 및 프로그램
US20090097746A1 (en) Color classification method, color recognition method, color classification apparatus, color recognition apparatus, color recognition system, computer program, and recording medium
JP2001307096A (ja) 画像認識装置及び方法
US7593566B2 (en) Data recognition device
CN113436080B (zh) 印章图像的处理方法、装置、设备及存储介质
CN108960115B (zh) 基于角点的多方向文本检测方法
JP2006146922A (ja) テンプレート方式の顔検出方法
CN113486879A (zh) 图像区域建议框检测方法、装置、设备及存储介质
JPWO2012046426A1 (ja) 物体検出装置、物体検出方法および物体検出プログラム
JP4217954B2 (ja) 画像探索装置
CN117557754A (zh) 点云语义分割方法、终端设备以及计算机存储介质
CN117372732A (zh) 一种基于深度学习的图像目标检测方法
JP2014010633A (ja) 画像認識装置、画像認識方法、及び画像認識プログラム
JP5625196B2 (ja) 特徴点検出装置、特徴点検出方法、特徴点検出プログラム及び記録媒体
JP4186541B2 (ja) 画像処理装置
JP2002342758A (ja) 視覚認識システム
JP4241074B2 (ja) 画像探索装置
CN113537158A (zh) 一种图像目标检测方法、装置、设备及存储介质
JP4158544B2 (ja) 画像探索装置
CN113657179B (zh) 图像识别及建模方法、装置、电子设备及存储介质
JP5083162B2 (ja) 画像データ判定装置、画像データ判定システム、及びプログラム
JP4050587B2 (ja) 物体識別装置、物体識別方法、この方法のプログラム、およびこのプログラムを記録した記録媒体
JP2017004052A (ja) 学習装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060120

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071112

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080715

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081029

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111121

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111121

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121121

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121121

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131121

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees