JP5591360B2 - 分類及び対象物検出の方法及び装置、撮像装置及び画像処理装置 - Google Patents

分類及び対象物検出の方法及び装置、撮像装置及び画像処理装置 Download PDF

Info

Publication number
JP5591360B2
JP5591360B2 JP2013040008A JP2013040008A JP5591360B2 JP 5591360 B2 JP5591360 B2 JP 5591360B2 JP 2013040008 A JP2013040008 A JP 2013040008A JP 2013040008 A JP2013040008 A JP 2013040008A JP 5591360 B2 JP5591360 B2 JP 5591360B2
Authority
JP
Japan
Prior art keywords
hypersphere
maximum
center
decision
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013040008A
Other languages
English (en)
Other versions
JP2013182620A (ja
Inventor
ジャン ヤン
ジャン ウェンウェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2013182620A publication Critical patent/JP2013182620A/ja
Application granted granted Critical
Publication of JP5591360B2 publication Critical patent/JP5591360B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2453Classification techniques relating to the decision surface non-linear, e.g. polynomial classifier
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Nonlinear Science (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、画像処理及びパターン認識の分野に関し、特に、対象物検出を実行するために分類器をトレーニングする方法及び装置に関する。
コンピュータ画像処理技術の開発が進み、コンピュータビジョンの原理が広く適用されるようになったことに伴い、対象物検出技術によって画像及びビデオからリアルタイムで対象物を探索することが一般的になっている。対象物検出技術は、スマート端末デバイス、スマート交通システム、スマート監視システム、更には軍用対象物検出システムなどの用途で広く実用に供されるようになった。
対象物検出の分野では、1クラス分類方法(one−class method)によりトレーニングされた分類器が広く使用される。M. Moya及びD. Hushの「Network constraints and multi−objective optimization for one−class classification」(Neural Network、9(3):463−474.doi:10.1016/0893−6080(95)00120−4、1996年)に記載されるように、1クラス分類器の場合、1つのクラスの対象物のみを含むトレーニングセットからの学習によって、そのクラスの対象物を可能な他のすべての対象物から弁別できる。例えば、顔/猫/犬を目標とする分類器をカメラに組み込むことができる。
しかし、このような既存の1クラス分類器は、消費者の要求に応えられなくなってきている。カメラを例にとると、ユーザは、ペットのようなある特定の被写体の写真を定期的に撮影する傾向にある。これは、従来の1クラス分類器のような分類器、すなわち単に顔/猫/犬などのある特定のクラスの被写体のみを目的とする分類器ではなく、ユーザ自身により指定される被写体(ペットなど)の外見特徴を学習可能な分類器が望まれていることを意味する。例えば、ユーザは、カメラを持ち上げた時点で自動的にペットに焦点を合わせたり、あるいは自身のカメラで撮影したすべての写真の中からペットに関する写真を見つけたりする傾向がある。
現在、既存の殆どの対象物検出製品は、適切にトレーニングされた分類器を得るために十分な数のサンプルの集合に依存しており、分類器は、対象物の位置の特定を実現するために使用される。しかし、実際の用途によっては、分類器をトレーニングするのに十分な数のサンプルを収集することが困難である。例えば、交通監視システムを介して特定の車両を追跡する場合、その特定の車両に関するサンプルはわずかしかなく、利用可能なサンプルが1つしかないということも考えられる。更に、顧客向け製品では、単純にユーザのみに依存して多数のサンプルを収集することは実用的ではなく、これは低いユーザエクスペリエンスにつながることもある。
従って、(1)可能な対象物のカテゴリが非常に膨大であり、その分布はロングテール理論に従うため、考えられるすべての対象物カテゴリに対応する事前学習済み辞書を準備することは実質的に不可能であるので、事前の知識にまったく依存せず、(2)照明、視点、歪み、ぶれ、回転などの対象物の外観変化を扱うことができると同時に、1つ又はいくつかのサンプルだけでも検出を実行することが可能であり、且つ(3)同一のカテゴリの他のすべての対象物から1つの対象物を十分に分離できる弁別性、例えばユーザの犬を他のユーザの犬から識別可能な弁別性を有する対象物検出方法が望まれる。
従来の対象物検出方法は上記の条件を満たすことができない。例えば、F. Ferrari及びA. Zissermanの「Learning Visual Attributes」(NIPSに掲載、2008年)に「属性」の概念が開示されているが、エンドユーザが対象物の属性を識別する必要がある。
L. Fei−Fei、R. Fergus及びP. Peronaの「A bayesian approach to unsupervised one−shot Learning of object categories」(ICCVに掲載、1134〜1141ページ、2003年)には、ワンショット学習法が開示されている。M. Lewの「Content−based Multimedia Information Retrieval:State of the Art and Challenges」(ACM Trans. MCCA、2006年)並びにJ. Eakins及びM. Grahamの「Content−based Image Retrieval」(Northumbria University、ニューカッスル)には、コンテンツに基づく画像検索方法が開示されているが、これらの方法は共に、対象物を同一のカテゴリの他の対象物から識別するのに十分な精度を備えていない。
Hae Jong Seo及びPeyman Milanfarの「Training−Free Generic Object Detection Using Locally Adaptive Regression Kernels」(IEEE Trans. PAMI、第32巻第9号、1688〜1704ページ、2010年)には、トレーニング不要のLARKに基づく検出方法が開示されているが、この方法は回転不変性を備えておらず、クラス内弁別性も低い。
David G. Loweの「Object recognition from local scale−invariant features」(ICCV.、1150〜1157ページ、1999年)並びにH.Bay、A. Ess、T. Tuytelaars及びL.V. Goolの「SURF:Speeded Up Robust Features」(CVIU、346〜359ページ、20008年)には、SIFT/SURFに基づくローカルポイント整合方法が開示されている。E. Nowak、F. Jurie及びB. Triggsの「Sampling Strategies for Bag−of−Features Image Classification」(ECCV、2006年)には、BOW/Partに基づくモデルが開示されている。これらの方法は、非常に小さな目標を扱うこと及び非剛体対象物歪みを扱うことには適さない。
以上挙げたような従来の種々の方法は、サンプル数が少ない場合に満足できる検出性能を示さない。従って、ごく少数のサンプルを使用して高いロバスト性及び高い弁別性で対象物検出を実現可能である方法及び装置が極めて望ましい。
1つ又はいくつかのサンプルのみを使用することによって有効な分類器をトレーニングする際の妨げになっているのは、少数のサンプルしか利用できない場合の分類器の性能、すなわちロバスト性及び弁別性をどのように制御するかということである。言い換えれば、分類器は、目標対象物のすべての外観変化に適正に対応できなければならないだけではなく、目標対象物を同一カテゴリの他の対象物から正確に識別できなければならない。しかし、利用可能なサンプルの数が少ない場合、図1に示されるように、照明、視点、歪み、ぶれ、回転などの目標対象物について可能なすべての外観変化に対応するためには、サンプルの多様性があまりにも限られている。これが、従来の技術において分類器をトレーニングするために十分な数のサンプルが必要であった理由の1つである。
上記の問題を解決するために、本発明は、新規の分類学習方法及び分類学習装置を提供する。本発明の分類学習方法及び分類学習装置は、分類閾値としてサポートベクトルに基づいて決定超球面を推定してもよい。どのようなサンプルであるかにかかわらず又はサンプルの数にかかわらず、決定超球面は実質的に変化しない。すなわち、どの正の(ポジティブ)サンプルも、決定超球面の中に含まれる確率はほぼ一定である。
本発明の1つの態様によれば、全て又は一部がサポートベクトルとして識別される1以上の特徴ベクトルを含む特徴空間内での分類方法であって、サポートベクトルに従って、特徴空間内で最大超球面を作成する最大超球面作成工程と、サポートベクトルに従って、作成された最大超球面の中心を計算する中心計算工程と、作成された最大超球面の表面積を計算する表面積計算工程と、中心が最大超球面の計算された中心となり、最大超球面との表面積の比が予め定められた値となるように、決定超球面を作成する決定超球面作成工程と、決定超球面の中にある特徴ベクトルを正の(ポジティブ)特徴ベクトルとして分類する分類工程とを有する分類方法が提供される。
本発明の他の特徴及び利点は、添付の図面を参照して以下の説明を読むことにより更に明らかになるだろう。
本明細書に含まれ且つ本明細書の一部を形成する添付の図面は、本発明の実施形態を例示し、以下の詳細な説明と共に本発明の原理を示すために使用される。
図1は、例示的な目標対象物について可能な外観変化を示す図である。 図2Aは、従来の技術によるサポートベクトルデータ記述(SVDD)を示す概略図である。 図2Bは、従来の技術のSVDD分類方法に従った閾値と複数のサンプルとの関係を概略的に示す図である。 図3Aは、本発明に係る分類方法の原理を示す概略図である。 図3Bは、本発明の分類方法に従った閾値と複数のサンプルとの関係を概略的に示す図である。 図4は、本発明の実施形態に係る分類方法を示すフローチャートである。 図5は、本発明の実施形態に係る中心計算ステップを示すフローチャートである。 図6は、本発明の実施形態に係る最小超球面内に存在する特徴ベクトルはただ1つであるか否かを判定する方法を示す図である。 図7は、本発明の実施形態に係る決定超球面作成ステップを示すフローチャートである。 図8は、本発明の実施形態に係る対象物検出方法を示すフローチャートである。 図9A及び図9Bは、本発明の実施形態に係る対象物検出方法によって対象物を識別する一例を示す図である。 図10は、本発明の実施形態に係る分類装置を示す機能ブロック図である。 図11は、本発明の実施形態に係る対象物検出装置を示す機能ブロック図である。 図12は、本発明の実施形態を実現可能なコンピュータシステムのハードウェア構成を示すブロック図である。 図13は、本発明の実施形態を実現可能な撮像装置を示す機能ブロック図である。
添付の図面を参照して、本発明の種々の例示的な実施形態を詳細に説明する。尚、実施形態において説明される構成要素の相対的配置及びステップの相対的配列、数式及び数値は、特に指示のない限り本発明の範囲を限定しない。
以下の少なくとも1つの例示的な実施形態の説明は本質的に単なる例であり、本発明、その適用又は用途を限定することをまったく意図しない。
当業者には周知である技術、方法及び装置は詳細に説明されない場合があるが、本明細書の一部を適宜構成することが意図される。
本明細書で示され且つ説明されるすべての例において、特定の値は、いずれも単なる例であり、本発明を限定すると解釈されるべきではない。従って、例示的な実施形態の他の例では値が異なることもありうるだろう。
尚、添付の図面中、同一の図中符号及び文字は類似する項目を示すので、1つの図においてある項目が定義されている場合、他の図でその項目を更に解説する必要はないと考えられる。
前述のように、ごくわずかな数のサンプルを使用して高いロバスト性及び高い弁別性で対象物検出を実現するためには、目標対象物のほぼすべての外観変化に対応するばかりでなく、同一カテゴリの他の対象物から目標対象物を十分な精度で識別することが可能な分類器を提供する必要がある。
サポートベクトルデータ記述(SVDD)法は、1クラス分類方法の重要な技術である。D. Tax及びR. Duinの「Support vector domain description」(Pattern Recognit. Lett.、第20巻、1191〜1199ページ、1999年)に記載されるように、SVDD法は、可能な限り多くのトレーニングサンプルを囲い込むことができる最小の体積を有する球を発見することを目的としている。図2Aは、SVDD法を説明するための概略図である。図2Aに示される特徴空間の中で、白丸(○)は、トレーニングサンプルに対応する特徴ベクトルを表し、黒丸(●)は、球の境界に位置するサポートベクトルを表す。図示されるように、サポートベクトルは、SVDD法で取得される超球面を定義する。すなわち、SVDD分類器の閾値が判定される。言い換えれば、SVDD法の目的は、図示されるようなサポートベクトルを取得することである。
従来のSVDD法を利用する対象物検出方法の性能及び精度は、トレーニングサンプルをどの程度まで利用可能であるかによって決まる。図2Bは、従来のSVDD法を利用する分類方法に従った閾値と複数のサンプルとの関係を概略的に示す。図2Bにおいて、白丸(○)は元のトレーニングサンプルを表し、黒四角(■)は新たに追加されたトレーニングサンプルを表す。実線の囲み線は、元のトレーニングサンプルに基づいて取得されたSVDD超球面を表し、破線の囲み線は、新たなトレーニングサンプルが追加された後に取得されたSVDD超球面を表す。
図2Bからわかるように、トレーニングサンプルの数が少ない場合、一般にトレーニングサンプルの多様性は低いので、図2Bの実線の囲み線により示されるように、分類器閾値を定義するSVDD超球面は小さくなる。そのような場合、トレーニング後の分類器が目標対象物の多くの外観変化を認識できないこと、すなわち検出率が非常に低くなるために対象物検出に失敗することは明らかである。例えば、ビデオ監視、画像検索などのオンライン適用例において、元の状態で十分な数のトレーニングサンプルがないので、従来の分類方法では、検出率が低いために目標対象物を検出できない。
図2Bに破線の囲み線で示されるように、サンプル数が多くなるにつれて、SVDD超球面は連続的に拡大される。すなわち、分類器の閾値が大きくなる。超球面が拡大された場合、検出率は向上するが、誤検出率も高くなる。すなわち、誤の(ネガティブ)サンプルを正のサンプルとして判定する確率が高くなる。従って、従来のSVDDを利用する対象物検出方法は不安定な性能を有し、サンプル数が少ない場合には機能できない。
図1に関して説明したように、サンプルの特徴空間内で、1つのサンプル(例えば図1の実線で囲まれた正方形により表されるトレーニングサンプル)は、単にごく狭い領域を占めるか又は特徴ベクトルとして特徴付けられることが可能であるが、このサンプルの外観のバリエーションは、サンプルの周囲の広い領域を占めるかもしれない。わずか1つ又は数個のサンプルに従って、現れる可能性があるすべての外観バリエーションを検出するためには、それらの外観変化が占める領域、すなわち図1の楕円形の実線により示される領域を推定することが必要である。
本発明によれば、図3Aに示されるように、特徴空間内で目標対象物の外観変化が占める領域を適切に推定するために、サポートベクトルに基づいて、外観変化が占める最大超球面(半径Rmax)が作成される。次に、最大超球面の中心が推定される。例えば、超球面の中心が推定されるように、最小の超球面(半径Rmin)が推定される。最後に、最大超球面及び推定された中心に基づき、統計的確率に従って分類器の閾値として決定超球面(半径R)が作成される。サンプルの数にかかわらず、作成される決定超球面はほぼ一定の大きさである。[Rmin ,Rmax ]の範囲内のf=Rの分布は、図3Aの右下隅に概略的に示される。
図3Bに示されるように、新たなトレーニングサンプルが追加された後、サポートベクトルにより定義される超球面は著しく拡大されるが(図3Bの実線及び破線により示される)、新たに作成される決定超球面は、元の決定超球面とほぼ同一の大きさである(図3Bの2本の点線により示される)。サポートベクトルに基づいて決定超球面を作成する方法は、以下に詳細に説明される。
尚、本明細書においてはSVDDを例にとって分類器をトレーニングする方法を説明するが、サポートベクトルマシン(SVM)に基づく分類器にも本発明の分類方法を適用可能であることを当業者は理解すべきである。
図4は、本発明の実施形態に係る分類方法を示すフローチャートである。目標トレーニングサンプルを取得した後、それらのサンプルに対して特徴空間が構成される。次に、可能な限り多くのトレーニングサンプルを囲むことが可能な最大超球面の境界がSVDD法によって取得される。すなわち、特徴空間内でサポートベクトルが判定される。従って、判定されたサポートベクトルに従って特徴空間内の最大超球面が作成される(ステップ10、最大超球面作成ステップとも呼ばれる)。
SVDD法に基づく超球面の判定は次の式により表される。
式中、αは超球面の中心であり、Rは超球面の半径であり、Cはペナルティ係数であり、ξはスラック誤差であり、xは超球面を定義するサポートベクトルを表す。
式(1)にラグランジュ乗数を適用すると、次のように双対問題(dual problem)を取得できる。
式中、K(・)は、非負関数値のカーネル関数である。本明細書中、カーネル関数K(・)は、特徴空間内のあらゆる正規化特徴ベクトルzに対して一定であるように選択される。すなわち、K(z,z)は一定である。
一実施形態において、ヒストグラムインタセクションカーネル(HIK)を次のように選択できる(詳細に関してはhttp://c2inet.sce.ntu.edu.sg/Jianxin/projects/libHIK/libHIK_v2.pdfを参照)。
式中、T及びQは特徴ヒストグラムであり、Nはヒストグラムの次元である。
尚、本実施形態は式(3)のHIK関数を例にとって説明されるが、へリンガーのカーネル関数及びジェンセン−シャノンカーネル関数も選択可能であることは当業者には理解されるべきである。
式(2)の双対最適化問題の解を使用して、サポートベクトルx∈SVs及び対応する重みαのセットが取得される。
上述のSVDD法によって取得されたサポートベクトルx及び重みαから、最大超球面の半径Rmaxを計算できる。正規化特徴ベクトルzに関して、超球面の中心までの距離を次のように計算できる。
f(z)=R ≦Rであれば、特徴ベクトルzは超球面の中にあり、このベクトルを目標対象物カテゴリに分類できる。
最大超球面の半径Rmaxを解くために、先の式(4)に従って次の式を取得できる。
先に述べた通り、任意の正規化ベクトルzに対して、K(z,z)は一定である。サポートベクトルx∈SVs及び対応する重みαが式(2)に従って計算されれば、
は一定の値を有する。従って、fmaxを解く鍵は、
の最小値を取得することである。前述のように、カーネル関数K(・)は非負であるので、
となる。
従って、式(5)を次のように簡略化できる。
このようにして、上記の式(6)により最大超球面の半径Rmaxが判定される。
次に、図4のステップ20を説明する。このステップは中心計算ステップとも呼ばれる。最大超球面の中心は、サポートベクトルに従って計算される。すなわち、最短距離fminが判定されるのである。
図5は、本発明の実施形態に係る中心計算ステップの特定の一実現形態を示すフローチャートである。図5に示されるように、まず、式(2)に基づいて計算されたサポートベクトルに従って、特徴空間内の最小超球面が作成される(ステップ210)。上記の式(4)に従って、最短距離fminは次のように表される。
前述のように、すべてのサポートベクトルの判定が終了している条件の下では、任意の正規化特徴ベクトルzに対してfminは一定である。従って、fminを解くことを
の最大値を解くことに変換できる。カーネル関数の定義から、
は特定の値でなければならず、+∞ではないことがわかる。
次に、最小超球面の中に存在する特徴ベクトルがただ1つであるか否か、すなわちf(z)=R ≦Rmin を満たす超球面の中心までの距離を有する特徴ベクトルzはただ1つであるか否かが判定される(ステップ220)。最小超球面の中に存在する特徴ベクトルzがただ1つである場合、その特徴ベクトルがまさに最小超球面及び最大超球面の中心であることを意味する。最小超球面の中に2つ以上の特徴ベクトルが存在する場合、以下に詳細に説明するように、最大超球面の中心として最小超球面の中心を推定する必要がある(ステップ230)。
この例では、説明の便宜上、HIK関数が選択されている。計算速度を増すために、ルックアップテーブルlutが定義される。
式中、xij∈X,X∈SVsであり、Mはサポートベクトルの数であり、Nはサポートベクトルの次元である。
上記の式(8)から、
であることがわかるが、max(lut)は
と等しいとは限らないことがわかる。max(lut)が
の値をとることができる場合、それは、最小超球面の中に特徴ベクトルが1つしか存在しないことを意味する。そのような場合、その特徴ベクトルを超球面の中心と判定でき、
と判定される。
図6を参照すると、最小超球面の中に特徴ベクトルが2つ存在する場合、
であり、この場合fminを評価しなければならない。すなわち、max(lut)を評価しなければならない。
HIKカーネル関数の例では、j番目の次元に関して、次のように定義される。
の平均値は
と定義され、式(8)によれば、
である。従って、N次元特徴ベクトルzに関して、lutの最大値の推定は、N個の次元におけるlutの平均値の最大値を推定すること、すなわち
を推定することと同等である。以下の説明中、統計学の分野における標本推定理論に従って
の範囲が推定される。
中心極限定理によれば、
は標本空間における正規分布に従う。従って、確率Φは累積分布であり、特に次の通りである。
中心極限定理によれば、以下が得られる。
標準誤差
、及び確率Φに従って、標準正規累積分布関数のルックアップテーブルからλを取得でき、
の範囲は[μ−λσ,μ+λσ]と判定される。その結果として、
が判定される。
最後に、式(11)の結果を式(7)に代入すると、fminを推定できる。
次に、図4に戻って説明する。ステップ30(決定超球面作成ステップとも呼ばれる)において、計算された中心及び作成された最大超球面に基づいて決定超球面が作成される。例えば、ステップ20で計算されたfmin及びステップ10で計算されたfmaxを使用して決定超球面が作成される。決定超球面の中心は、作成された最大超球面についての計算された中心と同一である。
図7は、本発明の実施形態に係る決定超球面作成ステップを示すフローチャートである。図7を参照すると、ステップ310において、最大超球面の表面積が次のように計算される。
f(z)は[fmin,fmax]の範囲内でほぼ同一の分布型を有する。以下の説明中、パラメータP、すなわち決定超球面の表面積と最大超球面の表面積との比を表す所定の値を想定する。ステップ20で計算されたRmin及びステップ10で計算されたRmaxを使用することによって、決定超球面の半径Rが生成される(ステップ320)。パラメータPは次のように定義される。
式(13)によれば、決定半球の半径Rを次のように判定できる。
式(14)によれば、特徴ベクトルzに対して適切な閾値、すなわちf(z)が推定される。最後に、すべてのサポートベクトルX∈SVsに対してfが推定される。
はトレーニング後の分類器の閾値である。トレーニングサンプルの数にかかわらず又はどのようなトレーニングサンプルであるかにかかわらず、分類器の誤検出率をパラメータPを有するレベル以下に定常的に抑制できる。すなわち、どの正の特徴ベクトルに関しても、作成された決定超球面に含まれる確率は一定である。尚、パラメータP自体は、正の特徴ベクトルが決定超球面の中に含まれる確率を表わさないが、所定のパラメータPに対して、この確率は一定である。
したがって、決定超球面の中心が計算された最大超球面の中心と一致し且つ決定超球面の表面積と最大超球面の表面積との比が所定の値であるように、決定超球面は作成される。
最後に、図4のステップ40(分類ステップとも呼ばれる)において、特徴空間内で決定超球面の中に特徴ベクトルが存在する場合、その特徴ベクトルは正の特徴ベクトルとして分類される。そうでない場合、特徴ベクトルは誤の(ネガティブ)特徴ベクトルとして分類される。
以上説明した分類方法により、ごくわずかな数のサンプルを使用して、高いロバスト性及び高い弁別性で対象物検出を実現できる。図8は、本発明の実施形態に係る対象物検出方法を示すフローチャートである。
まず、ステップ50(判定ステップとも呼ばれる)において、サポートベクトルの集合が判定される。一実施形態では、サポートベクトルの集合は、受信された1つ又はいくつかのサンプルに基づいて判定される。別の実施形態において、サポートベクトルの集合は、他のトレーニング済み分類器から抽出される。
トレーニングされるべき分類器の高い弁別性及びロバスト性を保証するために、サポートベクトルの数は所定のレベル以上に保持される。一例において、サポートベクトルの数は30以上である。一般に1つの特徴ベクトルは1つのサンプルに対応するので、サンプルの数は所定の値以上である必要がある。サンプルの数が所定の値を下回る場合、サンプルの集合が所定の値に増加するまで、利用可能なサンプルに基づいてシミュレーション演算が実行される。例えば、M. Sheelagh、T. Carpendale、David J. Cowperthwaite及びF. David Fracchaiaの「Information Visualization」(Simon Fraser University、1997年)で説明されている3D歪曲法をサンプルシミュレーションに使用できる。
次に、一定の確率パラメータPが設定され、利用可能な入力サンプルの数にかかわらず安定した検出性能を保持可能な分類器を取得するように、図4に示される分類方法を使用して分類器がトレーニング(すなわち学習)される(ステップ60、トレーニングステップとも呼ばれる)。
ステップ60でトレーニングされた分類器を使用して、画像又はビデオから対象物を検出できる(ステップ70、検出ステップとも呼ばれる)。まず、画像又はビデオフレームから複数の部分領域が生成される。一実施形態において、正のサンプルと同一の大きさを有する検索ウィンドウが最初に設定される。次に、検索ウィンドウの中に含まれる画素を抽出して入力画像の一部分を作成するために、画像又はビデオフレームに沿って検索ウィンドウが徐々に移動される。入力画像全体に沿って検索ウィンドウが移動された後、入力画像はサイズ変更される。所定の値に到達するまで、サイズ変更ステップ及び移動ステップは繰り返される。次に、生成された部分領域の各々から特徴ベクトルが抽出され、トレーニング済み分類器に入力される。最後に、分類器で検出された正のサンプルを有する部分領域が記録され、対象物の大きさ及び場所がグループごとに分類される。これにより、わずかな数のサンプルを使用して、高いロバスト性及び高い弁別性で対象物検出を実現できる。
図9A及び図9Bは、本発明の実施形態の対象物検出方法による対象物の識別の一例を示す。背景、照明条件及び視点などが異なる状況で同一のポメラニアン犬を撮影した7枚のビデオが試験用として選択される。図9Aに示されるように、各ビデオから1つのトレーニングサンプルが選択される。図9Bは、本発明の方法と従来のSVDDを利用した方法との性能の違いを示す。図中、横軸は、各画像の誤検出率、すなわち誤のサンプルを誤って正のサンプルと判定する確率を示し、縦軸は、検出率、すなわち正のサンプルを検出する確率を示す。誤検出率が低いほど、また、検出率が高いほど、対象物検出方法の性能はよいと考えられる。図9Bからわかるように、従来の方法の場合、サンプル数が増加するにつれて誤検出率は増加するが、本発明では、誤検出率はほぼ安定している。更に、利用可能なサンプルの数が少ない場合、従来の方法の検出率は非常に低いが、本発明の方法の検出率は常に高いレベルに保持されている。
図10は、本発明の一実施形態に係る分類装置2000を示す機能ブロック図である。分類装置2000の機能モジュールは、本発明の原理を実行するために、ハードウェア、ソフトウェア又はハードウェアとソフトウェアとの組み合わせにより実現される。先に説明した本発明の原理を実現するために、図10に示される機能ブロックが組み合わされるか又はサブブロックに分割されてもよいことは当業者には理解される。従って、以下の説明は、本明細書において説明される機能ブロックについて可能なあらゆる組み合わせ又は分割又は更なる定義をサポートするだろう。
分類装置2000は、特徴空間内の正の特徴ベクトルを認識可能である。特徴空間は1つ以上の特徴ベクトルを含む。一実施形態において、入力サンプルの特徴ベクトルに基づき、SVDD方法によってサポートベクトルを判定できる。別の実施形態では、他のトレーニング済み分類器からサポートベクトルを抽出できる。
分類装置2000は、最大超球面作成ユニット2010と、中心計算ユニット2020と、決定超球面作成ユニット2030と、分類ユニット2040とを備えてもよい。
最大超球面作成ユニット2010は、サポートベクトルに従って特徴空間内の最大超球面を作成してもよい。中心計算ユニット2020は、サポートベクトルに従って、最大超球面作成ユニット2010により作成された最大超球面の中心を計算してもよい。決定超球面作成ユニット2030は、中心計算ユニット2020により計算された中心及び最大超球面作成ユニット2010により作成された最大超球面に基づいて決定超球面を作成してもよい。決定超球面は分類装置2000の閾値である。分類ユニット2040は、決定超球面作成ユニット2030により作成された決定超球面の中の特徴ベクトルを正の特徴ベクトルとして分類してもよい。一実施形態において、決定超球面は、作成された決定超球面の中に含まれる確率がどの正の特徴ベクトルに関しても一定になるように作成される。
一実施形態において、中心計算ユニット2020は、最小超球面作成ユニット2022と、超球面中心判断ユニット2024と、超球面中心判定ユニット2026とを更に備えてもよい。最小超球面作成ユニット2022は、サポートベクトルに従って特徴空間内の最小超球面を作成してもよい。超球面中心判断ユニット2024は、最小超球面の中に存在する特徴ベクトルがただ1つであるか否かを判断してもよい。最小超球面の中に存在する特徴ベクトルがただ1つである場合、超球面中心判定ユニット2026は、その特徴ベクトルを最大超球面の中心であると判定してもよい。最小超球面の中に特徴ベクトルが2つ以上存在する場合、超球面中心判定ユニット2026は最小超球面の中心を推定する。この中心が最大超球面の中心であると考えられる。
一実施形態において、決定超球面作成ユニット2030は、最大超球面表面積計算ユニット2032と、決定超球面判定ユニット2034とを更に備える。最大超球面表面積計算ユニット2032は、最大超球面作成ユニット2010により作成された最大超球面の表面積を計算してもよい。決定超球面判定ユニット2034は、決定超球面の中心が最大超球面の計算上の中心と一致し且つ決定超球面の表面積と最大超球面表面積計算ユニット2032により計算された最大超球面の表面積との比が所定の値になるように決定超球面を判定してもよい。
一実施形態では、最大超球面作成ユニット2010、中心計算ユニット2020及び決定超球面作成ユニット2030においてカーネル関数K(・)が使用される。このカーネル関数は、特徴空間内の任意の正規化特徴ベクトルzに対して固定されるように選択される。例えば、カーネル関数K(・)はヒストグラムインタセクションカーネルを含んでもよい。
図11は、本発明の実施形態に係る対象物検出装置3000を示す機能ブロック図である。対象物検出装置3000の機能モジュールは、本発明の原理を実行するために、ハードウェア、ソフトウェア又はハードウェアとソフトウェアとの組み合わせにより実現されてもよい。先に説明したような本発明の原理を実現するために、図11に示される機能ブロックが組み合わされるか又はサブブロックに分割されてもよいことは当業者には理解される。従って、以下の説明は、本明細書において説明される機能ブロックについて可能なあらゆる組み合わせ又は分割又は更なる定義をサポートするだろう。
対象物検出装置3000は、判定ユニット3010と、トレーニングユニット3020と、検出ユニット3030とを備えてもよい。
判定ユニット3010はサポートベクトルの集合を判定してもよい。一実施形態において、判定ユニット3010は、1つ以上のサンプルを受信するサンプル受信ユニット3012と、サンプル受信ユニット3012により受信されたサンプルに基づいてサポートベクトルの集合を計算するサポートベクトル計算ユニット3014とを備えてもよい。その代わりに又はこれに加えて、判定ユニット3010は、他のトレーニング済み分類器からサポートベクトルを抽出するサポートベクトル抽出ユニット3016と、サポートベクトル抽出ユニット3016により抽出されたトレーニング済み分類器のサポートベクトルに基づいてサポートベクトルの集合を選択するサポートベクトル選択ユニット3018とを備えてもよい。
トレーニングユニット3020は、判定ユニット3010により判定されたサポートベクトルの集合を使用して図4の分類方法によって分類器をトレーニングしてもよい。検出ユニット3030は、トレーニングされた分類器を使用して画像又はビデオから対象物を検出してもよい。
図12は、本発明の実施形態を実現するために使用可能な計算システム1000のハードウェア構成の一例を示すブロック図である。例えば、コンピュータシステム1000は、デスクトップコンピュータ、タブレットコンピュータ、ラップトップコンピュータ、警報装置、スマートフォン、ゲーム機などの画像処理装置として実現可能である。
図12に示されるように、計算システム1000は計算デバイス1110を備える。計算デバイス1110は、処理ユニット1120と、システムメモリ1130と、着脱不可能な不揮発性メモリインタフェース1140と、着脱可能な不揮発性メモリインタフェース1150と、ユーザ入力インタフェース1160と、ネットワークインタフェース1170と、ビデオインタフェース1190と、出力周辺装置インタフェース1195とを備え、これらの構成要素はシステムバス1121を介して接続されている。
システムメモリ1130は、ROM(読み取り専用メモリ1131)及びRAM(ランダムアクセスメモリ1132)を備える。ROM1131にはBIOS(基本入出力システム)1133が存在する。オペレーティングシステム1134、アプリケーションプログラム1135、他のプログラムモジュール1136及びいくつかのプログラムデータ1137は、RAM1132に存在する。
ハードディスクなどの着脱不可能な不揮発性メモリ1141は、着脱不可能な不揮発性メモリインタフェース1140に接続される。着脱不可能な不揮発性メモリ1141は、例えばオペレーティングシステム1144、アプリケーションプログラム1145、他のプログラムモジュール1146及びいくつかのプログラムデータ1147を記憶する。
例えば、図11に関して説明した対象物検出装置3000をシステムメモリ1130又は着脱不可能な不揮発性メモリ1141にアプリケーションモジュールとして記憶することが可能である。
フロッピー(登録商標)ドライブ1151及びCD−ROMドライブ1155などの着脱可能な不揮発性メモリは、着脱可能な不揮発性メモリインタフェース1150に接続される。例えば、フロッピー(登録商標)ディスクをフロッピー(登録商標)ドライブ1151に挿入可能であり、CD(コンパクトディスク)をCD−ROMドライブ1155に挿入可能である。
マウス1161及びキーボード1162などの入力デバイスは、ユーザ入力インタフェース1160に接続される。
計算デバイス1110は、ネットワークインタフェース1170により遠隔計算デバイス1180に接続可能である。例えば、ネットワークインタフェース1170は、ローカルエリアネットワーク1171を介して遠隔計算デバイス1180に接続可能である。あるいは、ネットワークインタフェース1170はモデム(変復調器)1172に接続可能であり、モデム1172は、ワイドエリアネットワーク1173を介して遠隔計算デバイス1180に接続される。
遠隔計算デバイス1180は、遠隔アプリケーションプログラム1185を記憶するハードディスクなどのメモリ1181を備える。
ビデオインタフェース1190はモニタ1191に接続される。
出力周辺装置インタフェース1195は、プリンタ1196及びスピーカ1197に接続される。
図12に示される計算システムは単なる例であり、本発明、その適用又は用途を限定することはまったく意図されない。
どの実施形態においても、図12に示される計算システムは、独立型コンピュータとして又は1つのデバイスの中の処理システムとして実現可能であり、システムから1つ以上の不要な構成要素を除去すること又はシステムに1つ以上の追加構成要素を追加することが可能である。
一例において、計算システム1000のユーザは、例えば着脱不可能な不揮発性メモリ1141に記憶されている1つ以上の画像サンプルを検出されるべき目標対象物として識別し、次に、検出されるべきサンプルの範囲を指定するために、キーボード1162などの入力デバイスを介して計算システム1000と対話する。その後、システムメモリ1130又は着脱不可能な不揮発性メモリ1141に記憶されている対象物検出モジュールは、図4に示される方法に従って学習する。次に、学習を完了した対象物検出モジュールを使用して、ユーザにより指定されたサンプルの範囲から目標対象物が検出される。最後に、サンプルの範囲から検出された目標対象物がユーザに対して提示される。
図13は、本発明の実施形態に係る撮像装置4000を示す機能ブロック図である。例えば、撮像装置4000はカメラ、ビデオカメラなどとして実現される。図13に示されるように、撮像装置4000は、画像又はビデオを撮影するように構成された光学系4010と、図8の方法に従って動作可能な対象物検出装置4020と、対象物検出装置4020により検出される対象物に焦点を合わせるために光学系4010を制御するように構成された制御ユニット4030とを備える。
一例において、撮像装置4000のユーザは、撮像装置4000を始動した後、撮像を実行する前に、撮像装置4000の記憶装置(図示せず)に記憶されている1つ以上の画像サンプルを追跡されるべき目標対象物として指定する。次に、対象物検出装置4020に含まれる分類器は、図4に示される方法に従ってトレーニングされる。撮像中、対象物検出装置4020は、プレビュー画像(例えばカメラのファインダの中にある画像)の中に検出されるべき目標対象物が含まれているか否かを判定するためにプレビュー画像を自動的に検索する。目標対象物が含まれている場合、対象物検出装置4020は、目標対象物の位置を探索する。最後に、制御ユニット4030は、対象物検出装置4020により検出された目標対象物に焦点を合わせるために光学系4010を制御する。別の例では、ユーザによる目標対象物の指定が撮像装置4000の記憶装置に記録されてもよい。
本発明の方法及び装置は多くの態様で実現可能である。例えば、本発明の方法及び装置は、ソフトウェア、ハードウェア又はソフトウェアとハードウェアとの何らかの組み合わせにより実現可能である。方法のステップの順序は単なる例であり、特に指示のない限り、本発明の方法のステップは、先に説明された特定の順序に限定されない。更に、いくつかの実施形態において、本発明は、記録媒体に記録され且つ本発明に係る方法を実現するための機械可読命令を含むプログラムとして実現可能である。従って、本発明は、本発明に係る方法を実現するためのプログラムが記憶されている記録媒体をも含む。
更に、本発明は画像処理システムにおいても実現可能である。画像処理システムは、特に、プロセッサと、プロセッサに本発明の方法、すなわち分類方法及び/又は対象物検出方法を実行させるプログラムを記憶するメモリとを備える。
本発明のいくつかの特定の実施形態を例によって示したが、上記の例が単なる例であり、本発明の範囲を限定することを意図していないことは当業者には理解されるだろう。本発明の範囲及び精神から逸脱することなく上記の実施形態を変形できることを当業者は理解すべきである。本発明の範囲は添付の特許請求の範囲により定義される。

Claims (19)

  1. 全て又は一部がサポートベクトルとして識別される1以上の特徴ベクトルを含む特徴空間内での分類方法であって、
    前記サポートベクトルに従って、前記特徴空間内で最大超球面を作成する最大超球面作成工程と、
    前記サポートベクトルに従って、前記作成された最大超球面の中心を計算する中心計算工程と、
    前記作成された最大超球面の表面積を計算する表面積計算工程と、
    中心が前記最大超球面の前記計算された中心となり、前記最大超球面との表面積の比が予め定められた値となるように、決定超球面を作成する決定超球面作成工程と、
    前記決定超球面の中にある特徴ベクトルを正の特徴ベクトルとして分類する分類工程と
    を有することを特徴とする分類方法。
  2. 前記決定超球面作成工程において、任意の正の特徴ベクトルが前記作成された決定超球面内に入る確率を一定とするように、前記決定超球面は作成されることを特徴とする、請求項1に記載の分類方法。
  3. 前記中心計算工程は、
    前記サポートベクトルに従って、前記特徴空間内で最小超球面を作成する工程と、
    前記最小超球面内に特徴ベクトルが1つのみ存在するか否かを判定する工程と、
    前記最小超球面内に特徴ベクトルが1つのみ存在する場合、当該1つのみの特徴ベクトルを前記最大超球面の前記中心として決定する工程と、
    前記最小超球面内に1つより多い特徴ベクトルが存在する場合、前記最大超球面の中心として、前記最小超球面の中心を推定する工程と、
    をさらに有することを特徴とする、請求項1に記載の分類方法。
  4. 前記サポートベクトルが予め識別されているか、又は前記1以上の特徴ベクトルに基づいて計算されることを特徴とする、請求項1に記載の分類方法。
  5. 前記最大超球面作成工程において、前記最大超球面がサポートベクトルデータ記述(SVDD)アルゴリズムを用いて作成されることを特徴とする、請求項1に記載の分類方法。
  6. 前記最大超球面作成工程、前記中心計算工程及び前記決定超球面作成工程においてカーネル関数K(・)が用いられ、
    前記特徴空間内の任意の正規化特徴ベクトルzのうちの1つについてK(z,z)が一定となるように前記カーネル関数が選択される
    ことを特徴とする、請求項1に記載の分類方法。
  7. 前記カーネル関数K(・)がヒストグラムインタセクションカーネル(HIK)を含むことを特徴とする、請求項に記載の分類方法。
  8. 全て又は一部がサポートベクトルとして識別される1以上の特徴ベクトルを含む特徴空間内での分類装置であって、
    前記サポートベクトルに従って、前記特徴空間内で最大超球面を作成する最大超球面作成手段と、
    前記サポートベクトルに従って、前記最大超球面作成手段によって作成された前記最大超球面の中心を計算する中心計算手段と、
    前記作成された最大超球面の表面積を計算する表面積計算手段と、
    中心が前記最大超球面の前記計算された中心となり、前記最大超球面との表面積の比が予め定められた値となるように、決定超球面を作成する決定超球面作成手段と、
    前記決定超球面作成手段によって作成された前記決定超球面の中にある特徴ベクトルを正の特徴ベクトルとして分類する分類手段と
    を有することを特徴とする分類装置。
  9. サポートベクトルのセットを決定する決定工程と、
    前記決定工程において決定された前記サポートベクトルのセットに基づいて、請求項1に記載の分類方法を用いて分類器をトレーニングするトレーニング工程と、
    学習済みの前記分類器を用いて画像又はビデオから対象物を検出する検出工程と、
    を有することを特徴とする対象物検出方法。
  10. 前記決定工程が、
    1以上のサンプルを取得するサンプル取得工程と、
    前記取得したサンプルに基づいて前記サポートベクトルのセットを計算するサポートベクトル計算工程と
    を有することを特徴とする、請求項に記載の対象物検出方法。
  11. 前記決定工程が、
    他の学習済みの分類器からサポートベクトルを抽出するサポートベクトル抽出工程と、
    他の学習済みの分類器の前記抽出されたサポートベクトルに基づいて、前記サポートベクトルのセットを選択するサポートベクトル選択工程と、
    を有することを特徴とする、請求項に記載の対象物検出方法。
  12. サポートベクトルのセットを決定する決定手段と、
    前記決定手段において決定された前記サポートベクトルのセットに基づいて、請求項1に記載の分類方法を用いて分類器をトレーニングするトレーニング手段と、
    学習済みの前記分類器を用いて画像又はビデオから対象物を検出する検出手段と、
    を備えることを特徴とする対象物検出装置。
  13. 画像又はビデオを撮像する光学系と、
    請求項12に記載の対象物検出装置と、
    前記対象物検出装置によって検出された前記対象物に焦点を合わせるように前記光学系を制御する制御装置と、
    を備えることを特徴とする撮像装置。
  14. 請求項12に記載の対象物検出装置を備える画像処理装置。
  15. 前記画像処理装置が、デスクトップコンピュータ、タブレットコンピュータ、ラップトップコンピュータ、警報装置、スマートフォン及びゲーム機で構成される群から選択されるものであることを特徴とする、請求項14に記載の画像処理装置。
  16. 請求項に記載の分類装置の各手段としてコンピュータを機能させるプログラムを格納することを特徴とする、コンピュータ読み取り可能な記録媒体。
  17. 請求項12に記載の対象物検出装置の各手段としてコンピュータを機能させるプログラムを格納することを特徴とする、コンピュータ読み取り可能な記録媒体。
  18. プロセッサと、
    前記プロセッサに請求項1に記載の方法を実行させるプログラムを格納するメモリと、
    を備えることを特徴とする画像処理システム。
  19. プロセッサと、
    前記プロセッサに請求項に記載の方法を実行させるプログラムを格納するメモリと、
    を備えることを特徴とする画像処理システム。
JP2013040008A 2012-02-29 2013-02-28 分類及び対象物検出の方法及び装置、撮像装置及び画像処理装置 Expired - Fee Related JP5591360B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210049918.6A CN103295024B (zh) 2012-02-29 2012-02-29 分类与对象检测方法和装置以及图像拍摄和处理设备
CN201210049918.6 2012-02-29

Publications (2)

Publication Number Publication Date
JP2013182620A JP2013182620A (ja) 2013-09-12
JP5591360B2 true JP5591360B2 (ja) 2014-09-17

Family

ID=49002937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013040008A Expired - Fee Related JP5591360B2 (ja) 2012-02-29 2013-02-28 分類及び対象物検出の方法及び装置、撮像装置及び画像処理装置

Country Status (3)

Country Link
US (1) US9141881B2 (ja)
JP (1) JP5591360B2 (ja)
CN (1) CN103295024B (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9262726B2 (en) * 2013-01-17 2016-02-16 Applied Materials, Inc. Using radial basis function networks and hyper-cubes for excursion classification in semi-conductor processing equipment
US9489598B2 (en) * 2014-08-26 2016-11-08 Qualcomm Incorporated Systems and methods for object classification, object detection and memory management
CN105654100A (zh) * 2014-10-30 2016-06-08 诺基亚技术有限公司 利用计算装置识别对象的方法、装置以及电子设备
US11334789B2 (en) 2015-03-17 2022-05-17 Qualcomm Incorporated Feature selection for retraining classifiers
CN106156808B (zh) * 2015-04-23 2019-09-20 佳能株式会社 对象分类器的在线学习方法和设备以及检测方法和设备
KR101650654B1 (ko) * 2015-05-13 2016-08-23 주식회사 지이에스 차폐 다심 케이블을 이용한 보안 펜스의 오동작 필터링 시스템
CN105701510B (zh) * 2016-01-13 2019-03-12 清华大学 一种基于共享模型空间学习的零镜头图像分类方法
US10217001B2 (en) * 2016-04-14 2019-02-26 KickView Corporation Video object data storage and processing system
US10796134B2 (en) * 2017-09-28 2020-10-06 Nec Corporation Long-tail large scale face recognition by non-linear feature level domain adaptation
EP3627403A1 (en) 2018-09-20 2020-03-25 Elektrobit Automotive GmbH Training of a one-shot learning classifier
US10796203B2 (en) 2018-11-30 2020-10-06 International Business Machines Corporation Out-of-sample generating few-shot classification networks
CN109740664B (zh) * 2018-12-28 2023-01-10 东莞中国科学院云计算产业技术创新与育成中心 柔性物体分类方法、装置、计算机设备和存储介质
CN109829380B (zh) * 2018-12-28 2020-06-02 北京旷视科技有限公司 一种狗脸特征点的检测方法、装置、系统及存储介质
CN110796530B (zh) * 2019-09-27 2025-10-21 北京淇瑀信息科技有限公司 用户金融风险识别模型生成方法、装置及电子设备
CN117236423A (zh) * 2023-09-27 2023-12-15 中科曙光国际信息产业有限公司 核函数调用方法、装置、设备、存储介质和程序产品

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295362A (zh) * 2007-04-28 2008-10-29 中国科学院国家天文台 结合支持向量机以及近邻法的模式分类方法
JP4946730B2 (ja) * 2007-08-27 2012-06-06 ソニー株式会社 顔画像処理装置及び顔画像処理方法、並びにコンピュータ・プログラム
US9094444B2 (en) * 2008-12-31 2015-07-28 Telecom Italia S.P.A. Anomaly detection for packet-based networks
US9715723B2 (en) * 2012-04-19 2017-07-25 Applied Materials Israel Ltd Optimization of unknown defect rejection for automatic defect classification

Also Published As

Publication number Publication date
JP2013182620A (ja) 2013-09-12
CN103295024A (zh) 2013-09-11
CN103295024B (zh) 2017-03-01
US9141881B2 (en) 2015-09-22
US20130223726A1 (en) 2013-08-29

Similar Documents

Publication Publication Date Title
JP5591360B2 (ja) 分類及び対象物検出の方法及び装置、撮像装置及び画像処理装置
EP3620979B1 (en) Learning method, learning device for detecting object using edge image and testing method, testing device using the same
Tian et al. Detection and separation of smoke from single image frames
US9552536B2 (en) Image processing device, information storage device, and image processing method
US9165369B1 (en) Multi-object detection and recognition using exclusive non-maximum suppression (eNMS) and classification in cluttered scenes
CN102007499B (zh) 检测数字图像中的脸部表情
US9158995B2 (en) Data driven localization using task-dependent representations
Noh et al. A new framework for background subtraction using multiple cues
US8594385B2 (en) Predicting the aesthetic value of an image
JP5570629B2 (ja) 分類器の学習方法及び装置、並びに処理装置
US8537409B2 (en) Image summarization by a learning approach
Singh et al. Currency recognition on mobile phones
Liu et al. Weakly supervised multiclass video segmentation
CN105512683A (zh) 基于卷积神经网络的目标定位方法及装置
WO2016150240A1 (zh) 身份认证方法和装置
WO2022228325A1 (zh) 行为检测方法、电子设备以及计算机可读存储介质
WO2018100668A1 (en) Image processing device, image processing method, and image processing program
Raj et al. Vacant parking lot detection system using random forest classification
CN113963295A (zh) 视频片段中地标识别方法、装置、设备及存储介质
Khan et al. Dimension invariant model for human head detection
Ghoshal et al. A novel method for binarization of scene text images and its application in text identification
US20140254864A1 (en) System and method for gesture detection through local product map
Ansari Hand Gesture Recognition using fusion of SIFT and HoG with SVM as a Classifier
CN116796022A (zh) 一种图像识别方法、装置、电子设备及存储介质
CN104680123A (zh) 对象识别装置、对象识别方法和程序

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140630

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140729

R151 Written notification of patent or utility model registration

Ref document number: 5591360

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees