JP2012104111A - 多角度の人間顔検知方法及びシステム - Google Patents

多角度の人間顔検知方法及びシステム Download PDF

Info

Publication number
JP2012104111A
JP2012104111A JP2011242389A JP2011242389A JP2012104111A JP 2012104111 A JP2012104111 A JP 2012104111A JP 2011242389 A JP2011242389 A JP 2011242389A JP 2011242389 A JP2011242389 A JP 2011242389A JP 2012104111 A JP2012104111 A JP 2012104111A
Authority
JP
Japan
Prior art keywords
angle
human face
classifier
image data
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011242389A
Other languages
English (en)
Inventor
Cheng Zhong
ジョォン チョン
Xun Yuan
シュヌ ユアヌ
Tong Liu
リィウ トォン
Zhongchao Shi
ジョォンチャオ シ
Gane Wang
ガン ワン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2012104111A publication Critical patent/JP2012104111A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7747Organisation of the process, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Collating Specific Patterns (AREA)

Abstract

【課題】本発明は、多角度の人間顔検知システム及び方法を提供する。
【解決手段】多角度の人間顔検知システムは、画像データを入力する入力装置と、非人間顔の画像データを1次検知する非人間顔拒絶階級分類器と人間顔を含む画像データに角度タグを付与する複数の角度タグ分類器を有する混合分類器と、各々が各々の人間顔角度に対応し、いずれか一つが対応する角度タグ分類器から出力される角度タグ付きの画像データを受け付け、該受け付けられた角度タグ付きの画像データに人間顔が含まれているか否かをさらに検知する複数の角度多段接続分類器と、を備える。
【選択図】図4

Description

本発明は、多角度の人間顔検知方法及びシステムに関し、特に、人間顔角度の迅速に決定することにより人間顔検知を向上することが可能な多角度の人間顔検知方法及びシステムに関する。
迅速かつ正確な物体検知法は、人間顔検知や感情状態分析、テレビ会議制御や分析、通行人保護システム等の、多くの応用の基礎的な動作となっている。このため、Adaboost人間顔検知法(正面顔識別)が大きな成功を収めてから、多くの学者が、該分野の研究に加わっている。しかしながら、デジタルカメラや携帯電話の急速な発展に伴い、正面顔の識別のみでは、日常生活の需要にははるかに及ばず、多くの方法は、多角度の場合の顔検知の課題等、さらに挑戦的な課題に着目しつつある。これは、多角度の場合の迅速かつ正確な人間顔検知の課題を展開することの必要性を物語っている。
米国特許第20070223812B2号(特許文献1参照)には、信頼できる多角度の人間顔検知方法及び装置が提案されている。該特許においては、高性能ではあるが余分度の高い微細構成特徴により、人間顔の特性を表している。また、Adaboost演算法により、このような特徴から最も代表性のある部分特徴を選出して強分類器を構成し、複雑な背景情報から人間顔の位置を検出している。図1には該特許の略図が示されている。該特許の最大の短所としては、所定の角度すべてに対して、対応する人間顔検知器の訓練を行っており、検知工程には、各角度をすべて含むように、すべての検知器を用いる必要があるため、相当な検知時間が必要であるという短所がある。
米国特許第7324671B2号(特許文献2参照)には、多角度の人間顔検知方法及び装置が提案されている。該特許において、人間顔検知システムは、一連の複雑度の逓増する強分類器により、非人間顔データを階級分類器構成の前に位置する階級(複雑度の低い階級)でフィルタリングして除去する。その階級分類器の構成は、ピラミッド式構成であり、粗から精、簡単から複雑への策略により、比較的に簡単な特徴(階級分類器構成における前階級に用いられる特徴)を用いて大量の非人間顔データをフィルタリングして除去することができ、リアルタイムで多角度の人間顔検知システムが得られる。該方法の最大の問題としては、ピラミッド式構成により、検知工程に大量の余分な情報が含まれることになり、検知の速度と精度に影響を及ぼすという問題がある。
米国特許第7457432B2号(特許文献3参照)には、特定物体の検知方法及び装置が提案されている。該特許においては、HAAR特徴を弱特徴として用いている。Real-Adaboost演算法は、検知精度をさらに向上するために、階級分類器構成における各階級の強分類器に対する訓練に用いられ、LUT(検索表)データ構成は、特徴選択速度を向上するために用いられている。ここで、「強分類器」及び「弱特徴」は、ともに当該分野において一般に熟知されている概念である。該特許の主な短所としては、該方法が特定物体の一定の角度範囲内の検知にのみ適用可能で、主に正面顔の識別にしか用いることができず、応用においてある程度の制限があるということである。
このため、従来の多角度の人間顔検知方法においては、顔検知の速度の向上のみならず、如何に顔の角度を検知し、実際の検知工程に用いられる顔検知器の数を減らすかを解決する必要がある。
本発明は、従来技術における前述の課題を解決するためになされたもので、従来の顔検知システムに混合型階級分類器を用いて、入力データに角度タグを付与するとともに、一部の非顔データの走査ウィンドウを一次フィルタすることで、検知システムの実際の操作工程に使用される顔検知器の数を低減することを目的とする。
本発明の一の態様では、画像データを入力する入力装置と、非人間顔の画像データを1次検知する非人間顔拒絶階級分類器と人間顔を含む画像データに角度タグを付与する複数の角度タグ分類器を有する混合分類器と、各々が各々の人間顔角度に対応し、いずれか一つが対応する角度タグ分類器から出力される角度タグ付きの画像データを受け付け、該角度タグ付きの画像データに人間顔が含まれているか否かをさらに検知する複数の角度多段接続分類器と、を備える多角度の人間顔検知システムを提供する。
本発明の人間顔検知システムにおいて、前記入力装置は、原画像の異なる尺度、異なる位置のサブウィンドウをデータ走査し、該サブウィンドウを走査した画像データを混合分類器に入力する画像ウィンドウ走査手段をさらに有する。
本発明の多角度の人間顔検知システムにおいて、前記非人間顔拒絶階級分類器は、各々が複数の弱分類器からなる、複数のサブ分類器を有する。
本発明の多角度の人間顔検知システムにおいて、前記複数の角度タグ分類器の各々が、画像データから抽出された弱特徴に対する応答値を算出し且つ和を求め、最大の和に対応する角度タグ分類器に対応する角度タグを入力された画像データに付与する。
本発明の多角度の人間顔検知システムにおいて、前記弱特徴は、リアルタイム性能を満足可能な各種の局部テクスチャ記述を含むようにした。
本発明の他の態様では、画像データを入力し、非人間顔の画像データを1次検知し、人間顔を含む画像データに角度タグを付与し、角度タグ付きの画像データを受け付け、該受け付けられた角度タグ付きの画像データに人間顔が含まれているか否かをさらに検知する多角度の人間顔検知方法を提供する。
本発明の多角度の人間顔検知方法において、さらに、原画像の異なる尺度、異なる位置のサブウィンドウをデータ走査する。
本発明の多角度の人間顔検知方法において、データ走査を行うとともに、検知ステップに必要な弱特徴を計算する。
本発明の多角度の人間顔検知方法において、前記弱特徴は、リアルタイム性能を満足可能な各種の局部テクスチャ記述を含む。
本発明の多角度の人間顔検知方法において、前記非人間顔の画像データに対する1次検知は、階級構造の分類器により行われる。
本発明の前述の態様により、データは、該分類器を通過する時、正確な人間顔検知が行われるように、角度タグに対応付けられた階級分類器に送り込まれている。このような方式により、人間顔の多角度の課題について、データに角度タグを割り当てることができる。検知速度の課題については、得られた角度タグに対応する人間顔検知器のみを用いることで、大量の時間を節約することができる。
以下の図面による本発明の好適な実施例への詳細な説明により、本発明の以上及びその他の目標、特徴、長所、技術及び産業上の重要性がより理解できるようになる。
従来の多角度の人間顔検知システムの略図である。 各角度分類器の詳細構成図である。 例示として人間顔の正面画像に対する5つの角度を図示する図である。 本発明の実施例に係る、多角度の人間顔検知システムを示す図である。 全体図から走査ウィンドウを抽出することを示す図である。 混合分類器の構成図である。 図6の左側部分の角度タグ分類器の詳細構成図である。 図6と図7における混合分類器42の走査ウィンドウに対する大まかな人間顔の拒絶と、角度タグの付加工程を具体的に説明したフローチャートである。 角度分類器に用いられる弱特徴を示す図である。 角度分類器に用いられる弱分類器を示す図である。
図1は、従来の多角度の人間顔検知システムの略図である。該図において、入力装置1は、画像データの入力に用いられ、角度多段接続分類器組V1、V2、・・・Vnは、それぞれ異なる検知角度に対応している。通常、角度多段接続分類器組V1は、階級分類器V11、V12、・・・V1nを多段接続してなり、角度多段接続分類器組V2は、階級分類器V21、V22、・・・V2nを多段接続してなり、角度多段接続分類器組Vnは、階級分類器Vn1、Vn2、・・・Vnnを多段接続してなり、nは自然数である。角度分類器の参照符号の第1位の下付きの数字は、該分類器の検知角度の番号を表し、第2位の下付きの数字は、対応の多段接続分類器組における該階級分類器の位置順番を表し、換言すると、複数の多段接続分類器の左から第2位の下付きの数字が同じである分類器は、同一階級に属していると見なしてもよいし、同一組における位置の異なる分類器に用いられる特徴は異なってもよいし、異なる組における同一階級の分類器に用いられる特徴は、必ずしも同一となる必要はない。図2は、各角度分類器の詳細構成図である。図2には、各角度の多段接続分類器組にn個の階級分類器が設けられているが、異なる検知角度に用いられる特徴が異なる場合があるため、各多段接続分類器組における弱分類器の数は異なってもよく、換言すると、階級分類器は、必ずしも図2に示されたマトリクス配列に形成される必要はなく、或いは、階級分類器は、必ずしもこのようなマトリクスを充填する必要はないことは、当業者が理解できる。各分類器は、任意の種類の強分類器でもよく、例えば、サポートベクトルマシン(Support Vector Machine, SVM)、Adaboost等の演算法を用いる公知の分類器でよい。各強分類器については、多種の表象局部テクスチャ構造の弱特徴や、その組み合わせにより演算を行ってもよいし、前記弱特徴は、HAAR特徴、多尺度のLBP特徴等の当該分野で通常用いられる特徴でよい。
なお、図2には、3つの検知角度に用いられる3つの多段接続分類器組が示されているが、検知角度を増加しても減少してもよいことは当業者に自明である。例えば、2つの検知角度に用いられるように2つの多段接続分類器組を設けてもよく、4つの検知角度に用いられるように4つの多段接続分類器組を設けてもよく、5つ以上の検知角度に用いられるように5つ以上の多段接続分類器組を設けてもよく、或いは、多角度の特定物体の判断装置の1種の特殊形式として、単一角度検知に用いられるように単に1つの多段接続分類器組を設けてもよい。人間顔の分類器については、人間顔の特定角度の特性による訓練から得られ、所謂角度とは、当該分野においては、通常、物体の、人間顔の正面画像に対する回転角度をいう。
本発明の具体的な実施形態においては、例示的な形式で、人間顔の5つの角度について説明がなされているが、当業者は、実際の需要に応じて異なる数の角度を選択してもよく、その操作フローは、本発明の5つの角度に関するフローと同じである。図3は、例として人間顔の正面画像に対する5つの角度を図示する図である。図3に示されるように、5つの角度は、左から右へ、それぞれ面外回転(rotation off plane,ROP)−45度、面内回転(rotation in
plane,RIP)−45度、正面、面内回転+45度、面外回転+45度である。いわゆる人間顔の正面画像とは、当該分野の公知公認の概念であり、正面画像と微小な回転角度のある画像も、実践上では、正面画像として処理される。同様に、本願においては、人間顔回転45度とした場合も、該角度が必ず45度であることを示しているのではなく、45度前後の一定範囲内の角度を表し、例えば、40度〜50度の範囲のいずれかの角度は、本発明ではすべて45度と見なしている。換言すると、ここでの45度は、単に人間顔の回転角度範囲を表現するものであり、40度〜50度の範囲内の角度は、すべて回転45度と見なされる。該5つの特定角度のサンプルを用いて、角度分類器と人間顔検知器をオフラインで訓練することにより、5つの角度を含む多角度の人間顔検知システムを実現することができる。
図4は、本発明の実施例に係る、多角度の人間顔検知システムを示す図である。図4に示される多角度の人間顔検知システムにおいては、画像入力装置41と、混合分類器42と、角度多段接続分類器組V1、V2、・・・Vnが備えられている。混合分類器42は、画像入力装置41からの画像を受け付け、入力された画像の各フレームに対して分類処理を行う。具体的には、多尺度のローカルバイナリパターン(LBP)により各フレーム画像の走査を行い、各走査ウィンドウに対し、大まかな人間顔判断を行い、人間顔の角度を決定し、その後、人間顔角度タグを人間顔と判定された走査ウィンドウに付与し、該角度タグが付された人間顔走査ウィンドウを、対応する角度多段接続分類器Vi(ここで、iは1−nの正整数である)に入力する。
図5は、全体図から走査ウィンドウを抽出することを示す図であり、異なる尺度と、異なる歩幅のウィンドウにより、全画像上を遍歴し、一連のウィンドウ画像を得る。多角度の人間顔判断装置は、抽出により得られるウィンドウ画像に対しても、ウィンドウが抽出されていない全体画像に対しても、同様の方式で処理を施してもよい。
図6は、混合分類器42の構成図である。図6において、左側は、混合分類器42における角度タグ分類器C1である。図6においては、便宜上、角度タグ分類器C1の構成のみ示されているが、実際の混合分類器42においては、実際の需要に応じて、複数の角度タグ分類器C1、C2、・・・Cnが配置されている。本発明の具体的な実施形態においては、5つの角度タグ分類が用いられている。各角度タグ分類器は、複数の弱分類器からなる。図6に示されるように、角度タグ分類器C1は、弱分類器C11、C12、・・・C1nからなる。図7は、図6の左側部分の角度タグ分類器の詳細構成図である。説明の便宜上、図7には、5つの角度の角度タグ分類器の詳細構成のみ示されている。実験では、図3に示されるように、5つの角度に対する分類が必要となる。本発明では、該目的に応じて、5つのAdaboost角度タグ分類器が構築されている。該角度タグ分類器は、アウトライン学習工程で得られ、その訓練のポジティブサンプルは、人為的に選定した各角度に対応する人間顔画像データであり、ネガティブサンプルは、人間顔データを含まない各種画像である。各分類器は、1つの特定の角度に対応し、該角度は一定の範囲をカバーすることができる。例えば、正面顔分類器は、−5度から+5度までの角度範囲の顔データをカバーすることができる。各分類器は、5つの弱特徴から構成される。画像データが入力されると、各Adaboost分類器は、該データが該角度に属する信頼度を算出し、角度選択器がそのうちの最大値を最終の角度タグとして出力する。図6の右側部分は、混合分類器42における、人間顔に対して大まかな判断を行う非人間顔拒絶階級分類器Rである。本発明の具体的な実施形態においては、該非人間顔拒絶階級分類器Rが、2つの人間顔拒絶サブ分類器RとR2から構成されているが、実際に、当業者は必要に応じて前記サブ分類器の数を決めることができる。各サブ分類器は、複数の弱分類器から構成される。図6に示されるように、サブ分類器R1は、2つの弱分類器R11とR12から構成され、サブ分類器R2は、3つの弱分類器R21、R22、R23から構成されている。
図8は、図6と図7における混合分類器42の走査ウィンドウに対する大まかな人間顔の拒絶と、角度タグの付加工程を具体的に説明したフローチャートである。
図8に示されるように、ステップS81において、画像データを入力する。次に、ステップS82において、入力された画像の各フレームに対し、多尺度のLBPによるウィンドウ走査を行うことにより、多尺度の走査ウィンドウ画像が得られる。次に、ステップS83において、多種boosting演算法により得られた走査ウィンドウの計算から、最も分類能力のある弱特徴を選出するとともに、これらの弱特徴を用いて各特定の角度に対して対応するAdaboost分類器を構築し、これらの弱分類器の応答値(信頼度値)を計算する。これらの弱分類器には、図6及び図7に示されるすべての弱分類器が含まれる。次に、ステップS84において、サブ分類器R1における弱分類器R11及びR12のそれぞれの弱特徴に対する応答値r11及びr12の和が、閾値T1を超えたか否かを判断する。T1を超えた場合、該走査ウィンドウに顔画像が含まれていると判断し、ステップS85に進む。T1を超えていないと、該走査ウィンドウを廃棄し、ステップS82に戻り、次のウィンドウの走査を行う。ステップS85において、サブ分類器R2の弱分類器R21、R22、R23のそれぞれの弱特徴への応答値r21、r22、r23の和が、閾値T2を超えたか否かを判断する。T2を超えた場合、該走査ウィンドウに顔画像が含まれていると判断し、ステップS86に進む。T1を超えていないと、該走査ウィンドウを廃棄し、ステップS82に戻り、次のウィンドウの走査を行う。前記選択により得られた弱特徴を用いて階級分類器を構築し、ステップS84とS85により、非人間顔データの走査ウィンドウに対する拒絶機能を実現することができ、該ステップにおいて、一部の非人間顔データを拒絶することで、以降の処理に必要なデータ量を低減することができ、より迅速な検知速度を得ることができる。
その後、或いはステップS83後に、ステップS86を同期に実行する。図7に示されるように、角度タグ分類器C1、C2、・・・Cnにおいて、各々が、所属する弱分類器の弱特徴に対する応答値の和をそれぞれ計算する。具体的に、画像データ入力時には、各Adaboost角度タグ分類器が、該データの該角度に属する各弱分類器の応答値、例えば、角度タグ分類器C1の各弱分類器C11、C12、・・・C1nの応答値c11、c12、・・・c1nを計算するとともに、該角度に対応する弱分類器の応答値の和Sc、即ち、該角度に対応する信頼度値を計算することになる。その後、ステップS87において、選択器70により、各角度タグ分類器C1、C2、・・・Cnの前記箇所に対応する信頼度値から、最大値を選択するとともに、該最大値を、対応する角度タグ分類器に対応する角度タグに伴い、角度多段接続分類器組V1、V2、・・・Vnにおける対応する角度多段接続分類器へ出力する。
本発明の前記実施形態によると、同一の弱特徴を用いて、大まかな人間顔の拒絶と、角度タグの付加の2つの機能を同一分類器に統合することができる。このため、本発明の実施例においては、本発明の多角度の人間顔検知システムにおける混合分類器42により、画像データが人間顔であるか否かを一次判断し、画像データの角度分類を行うことができる。人間顔であると判断された場合は、混合分類器42は、該角度分類結果に応じて、自動的にデータに対して角度タグ表記を行い、該角度タグが付されたデータは、該角度タグに対応付けられた角度階級分類器(人間顔検知器)に送り込まれ、正確な判断がなされる。ここで、各人間顔検知器は、例えば、正面、プラス・マイナス45度の面内回転、プラス・マイナス45度の面外回転のような、特定の角度を有する人間顔サンプルの訓練から生成され、図3に示されるように、これらの角度は、訓練前に人為的に定めてもよい。このため、ある入力データに対応する角度タグを得た後、該データを該角度の人間顔検知器に直接入力することができる。複数の角度の人間顔検知器を訓練することができ、これらの検知器から最終の人間顔検知結果を出力することができるため、多角度の人間顔検知の目的を実現することができる。人間顔検知器の以降の動作については、当業者が従来の技術により実施してもよい。
以下、本発明に用いられる多種boosting演算法の主なステップの例について説明する。以下のステップ1〜3が含まれる。
1. C個の分類を保存し、各分類にNのサンプルがあり、初期化サンプルの分布D(x)=1/(C*N)とする。
2. t=1,2,……Tに対し、
最も有効な弱特徴を選択し、各分類の弱分類器を構築し、サンプル分布を更新する。
3. 最終の分類器
該演算法において、ステップ1で訓練データへの必要な初期化を行い、式中、Cは、種別の数であり、Nは各種サンプルの数であり、D0(x)は、各サンプルの初期重みである。
ステップ2において、多種boosting策略により、最も有効な特徴を選出する。該工程は、T回を含み、毎回は現データ状態下の最も有効な1特徴を選出する。Tは選択された特徴の総数である。主な工程は、以下の通りである。
最も有効な弱特徴を検索する。
分割線形関数における各分割間隔について、重み累積和の最大の種類を見つける。該種類は、該分割間隔におけるポジティブの種類と見なされ、その重み累計和は、Dposとなる。また、他の種類は、すべてネガティブの種類と見なされる。
データ分布(1種類対(C−1)種類)を均衡化にするために、該分割間隔から選択されたポジティブの種類サンプルの重みを、(C−1)*Dposまで増加する。
関数を最大化にする。
ここで、
Dpos,bin(x)は、該分割間隔(ヒストグラムの1区間(bin)に対応する)に位置するポジティブサンプルの重みであり、Dneg,bin(x)は、該分割間隔に位置するネガティブサンプルの重みである。sDposは、該分割間隔に位置するポジティブサンプルの重み均衡化後の重みの和であり、sDneg は、該分割間隔に位置するネガティブサンプルの重み均衡化後の重みの和である。
弱分類器を構築する。
その後、訓練サンプルの重みを更新する。
式中、cは、サンプルの種別であり、tは、多種boosting演算法の特徴選択時における回数であり、Dc,t(X)は、該状態下のデータの重みである。
ステップ3において、選択した弱分類器を組み合わせることにより、各種に対応する角度分類器が得られる。ここで、hc,tは、第c種の第t個の弱分類器を表し、Hは、第c種に対応する多種boosting演算法により構成される角度分類器を表す。多種boosting演算法においては、すべての分類器(n個の角度に対応するn個の分類器)が同一の特徴を共有してもよい。例えば、1つの分類器に5つの特徴を算出することが必要となる場合は、5つの分類器も、5つの特徴のみを算出すればよい。このため、このような策略により検知の時間を大幅に低減することができる。
前述の工程においては、図9に示されるような弱特徴と、図10に示されるような弱分類器が用いられている。図9は、角度分類器に用いられる弱特徴を示している。該弱特徴には、MSLBP(多尺度のローカルバイナリパターン)のテクスチャ記述が用いられる。LBPパターン値の計算工程は、前述のステップ1〜3に示された通りである。先ず、入力された白黒階調のテクスチャに対して正規化を行い、即ち、周囲の8つの隣接領域の白黒階調値と中心の白黒階調値との比較を行う。隣接領域の白黒階調値が中心の白黒階調値よりも高いと、1に正規化され、隣接領域の白黒階調値が中心の白黒階調値よりも低いと、0に正規化される。次に、正規化後のパターン値と対応する重み付けテンプレート(予め設定される)の点乗積により、最終のLBPパターン値が得られる。LBPの主なメリットは、テクスチャ中心領域とその8つの隣接領域の白黒階調との比較特性を記述することが可能で、白黒階調テクスチャの局部比較分布情報を表すことができる。図10は、角度分類器に用いられる弱分類器を示している。該弱分類器は、分割線形関数であり、ヒストグラム形式で保存される。ヒストグラムの各区間は、LBP特徴の各パターンに対応している。ヒストグラムの各区間の値は、該パターンが人間顔データに該当する信頼度を表している。
下記表は、本発明の多角度の人間顔検知システム及び方法の実例の実験結果である。
前記表は、異なる数の弱特徴数(1〜5)を用いて、角度分類性能に対する比較実験結果である。表には、異なる弱特徴数で検知された各角度の正確率が明記されている。角度タグ分類器は、多角度の人間顔検知システムの初期段階に位置しているため、すべての入力データが該分類器に対して計算することが必要となる。このため、リアルタイムで迅速な検知速度を実現するために、ここでは、非常に少ない数の特徴(5未満)のみで、該分類器を構築している。実験結果によると、5つの弱特徴のみで角度分類器を構築する場合、いずれかの角度においても、92%以上の識別率が得られることが判明され、採用した特徴及び利用した多種boosting演算法による分類器の角度分類に対する有効性が証明されたことになる。
本発明は人間顔の角度について説明されたが、従来技術も本発明も、手のひら、通行人等の、他の各種物体の処理が可能である。どのような物体で、どのような特徴で、どのような角度であるかに関わらず、ジョブの処理前に予め指定し、かつサンプルで訓練を行うことができれば、対応する分類器を得ることができ、多段接続分類器組を構成し、異なる角度に対して訓練を行うと、多角度の判断や、検知処理が可能な複数の多段接続分類器組を得ることができ、これにより、本発明の前述の多角度検知方法及びシステムを実現することができる。
明細書における一連の動作は、ハードウェアや、ソフトウェアや、ハードウェアとソフトウェアの組み合わせから実行することができる。ソフトウェアにより該一連の動作を実行時には、コンピュータプログラムを専用ハードウェアが内蔵されたコンピュータのメモリにインストールし、コンピュータにより該コンピュータプログラムを実行させてもよい。或いは、コンピュータプログラムを各種の処理が実行可能な汎用コンピュータにインストールし、コンピュータにより該コンピュータプログラムを実行させてもよい。
例えば、コンピュータプログラムを記録媒体であるハードディスクやROMに予め保存してもよい。一時または永久的にコンピュータプログラムをフロッピや、CD−ROM(CD読み出し専用メモリー)や、MO(光磁気ディスク)や、DVD(デジタル多用途ディスク)や、磁気ディスクや、半導体メモリ等のような移動記録媒体に記憶(記録)し、このような移動記録媒体をパッケージとして提供してもよい。
前述の具体的な実施例を参照し、本発明を詳細に説明したが、本発明の精神を逸脱しない範囲内で、実施例に修正や代替を加えることが可能なことは言うまでもない。換言すると、本発明は説明の形式で開示されており、制限的に解釈されるものではない。本発明の要旨は、添付された請求範囲で判断されるべきである。
本発明は、多角度の人間顔検知方法及びシステムに関し、特に、人間顔角度の迅速に決定することにより人間顔検知を向上することが可能な多角度の人間顔検知方法及びシステムに関する分野に利用可能である。
米国特許第20070223812B2号 米国特許第7324671B2号 米国特許第7457432B2号

Claims (10)

  1. 画像データを入力する入力装置と、
    非人間顔の画像データを1次検知する非人間顔拒絶階級分類器と人間顔を含む画像データに角度タグを付与する複数の角度タグ分類器を有する混合分類器と、
    各々が各々の人間顔角度に対応し、いずれか一つが対応する角度タグ分類器から出力される角度タグ付きの画像データを受け付け、該受け付けられた角度タグ付きの画像データに人間顔が含まれているか否かをさらに検知する複数の角度多段接続分類器と、を備える多角度の人間顔検知システム。
  2. 前記入力装置は、原画像の異なる尺度、異なる位置のサブウィンドウをデータ走査し、該サブウィンドウを走査した画像データを混合分類器へ入力する画像ウィンドウ走査手段をさらに有する請求項1に記載の多角度の人間顔検知システム。
  3. 前記非人間顔拒絶階級分類器は、各々が複数の弱分類器からなる、複数のサブ分類器を有する請求項1に記載の多角度の人間顔検知システム。
  4. 前記複数の角度タグ分類器の各々が、画像データから抽出された弱特徴に対する応答値を算出し且つ和を求め、最大の和に対応する角度タグ分類器に対応する角度タグを入力された画像データに付与する請求項3に記載の多角度の人間顔検知システム。
  5. 前記弱特徴は、リアルタイム性能を満足可能な各種の局部テクスチャ記述を含む請求項4に記載の多角度の人間顔検知システム。
  6. 画像データを入力し、
    非人間顔の画像データを1次検知し、人間顔を含む画像データに角度タグを付与し、
    角度タグ付きの画像データを受け付け、該受け付けられた角度タグ付きの画像データに人間顔が含まれているか否かをさらに検知する多角度の人間顔検知方法。
  7. 原画像の異なる尺度、異なる位置のサブウィンドウをデータ走査する請求項6に記載の多角度の人間顔検知方法。
  8. データ走査を行うとともに、検知ステップに必要な弱特徴を計算する請求項7に記載の多角度の人間顔検知方法。
  9. 前記弱特徴は、リアルタイム性能を満足可能な各種の局部テクスチャ記述を含む請求項7に記載の多角度の人間顔検知方法。
  10. 前記非人間顔の画像データに対する1次検知は、階級構造の分類器により行われる請求項7に記載の多角度の人間顔検知方法。
JP2011242389A 2010-11-05 2011-11-04 多角度の人間顔検知方法及びシステム Pending JP2012104111A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201010532710.0 2010-11-05
CN2010105327100A CN102467655A (zh) 2010-11-05 2010-11-05 多角度人脸检测方法和系统

Publications (1)

Publication Number Publication Date
JP2012104111A true JP2012104111A (ja) 2012-05-31

Family

ID=44992600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011242389A Pending JP2012104111A (ja) 2010-11-05 2011-11-04 多角度の人間顔検知方法及びシステム

Country Status (4)

Country Link
US (1) US20120114250A1 (ja)
EP (1) EP2450831A3 (ja)
JP (1) JP2012104111A (ja)
CN (1) CN102467655A (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9183447B1 (en) * 2011-06-09 2015-11-10 Mobileye Vision Technologies Ltd. Object detection using candidate object alignment
CN102799874A (zh) * 2012-07-23 2012-11-28 常州蓝城信息科技有限公司 一种基于人脸识别软件的身份识别系统
CN102819433A (zh) * 2012-07-23 2012-12-12 常州蓝城信息科技有限公司 一种人脸识别软件系统的方法
US11594072B1 (en) 2012-09-07 2023-02-28 Stone Lock Global, Inc. Methods and apparatus for access control using biometric verification
US11017211B1 (en) 2012-09-07 2021-05-25 Stone Lock Global, Inc. Methods and apparatus for biometric verification
CN103679127B (zh) 2012-09-24 2017-08-04 株式会社理光 检测道路路面的可行驶区域的方法和装置
CN103679691B (zh) 2012-09-24 2016-11-16 株式会社理光 连续型道路分割物检测方法和装置
CN103198330B (zh) * 2013-03-19 2016-08-17 东南大学 基于深度视频流的实时人脸姿态估计方法
CN104219488B (zh) * 2013-05-31 2019-01-11 索尼公司 目标图像的生成方法和装置、以及视频监控系统
CN103543817A (zh) * 2013-08-14 2014-01-29 南通腾启电子商务有限公司 一种新型计算机节能系统
CN105809125B (zh) * 2016-03-06 2020-03-13 北京工业大学 基于多核心arm平台的人脸识别系统
CN107491719A (zh) * 2016-08-31 2017-12-19 彭梅 基于物联网技术的汽车尾气在线监测系统
CN106503687B (zh) * 2016-11-09 2019-04-05 合肥工业大学 融合人脸多角度特征的监控视频人物身份识别系统及其方法
US10282592B2 (en) 2017-01-12 2019-05-07 Icatch Technology Inc. Face detecting method and face detecting system
CN107301378B (zh) * 2017-05-26 2020-03-17 上海交通大学 图像中多分类器集成的行人检测方法和系统
CN107247936A (zh) * 2017-05-31 2017-10-13 北京小米移动软件有限公司 图像识别方法及装置
CN107368797A (zh) * 2017-07-06 2017-11-21 湖南中云飞华信息技术有限公司 多角度并行的人脸检测方法、装置及终端设备
US11138473B1 (en) 2018-07-15 2021-10-05 University Of South Florida Systems and methods for expert-assisted classification
CN109145765B (zh) * 2018-07-27 2021-01-15 华南理工大学 人脸检测方法、装置、计算机设备和存储介质
CN109190512A (zh) * 2018-08-13 2019-01-11 成都盯盯科技有限公司 人脸检测方法、装置、设备及存储介质
CA3109748A1 (en) * 2018-08-17 2020-02-20 Stone Lock Global, Inc. Methods and apparatus for facial recognition
CN111627045B (zh) * 2020-05-06 2021-11-02 佳都科技集团股份有限公司 单镜头下的多行人在线跟踪方法、装置、设备及存储介质
USD976904S1 (en) 2020-12-18 2023-01-31 Stone Lock Global, Inc. Biometric scanner
CN113449713B (zh) * 2021-09-01 2021-11-19 北京美摄网络科技有限公司 一种清洗人脸检测模型的训练数据的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005209137A (ja) * 2003-12-26 2005-08-04 Mitsubishi Heavy Ind Ltd 対象物認識方法及び対象物認識装置、並びに顔方向識別装置
JP2007066010A (ja) * 2005-08-31 2007-03-15 Fujifilm Corp 判別器学習方法および対象判別装置ならびにプログラム
JP2009086926A (ja) * 2007-09-28 2009-04-23 Kddi Corp 画像認識方法および装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6944319B1 (en) * 1999-09-13 2005-09-13 Microsoft Corporation Pose-invariant face recognition system and process
JP4526639B2 (ja) * 2000-03-02 2010-08-18 本田技研工業株式会社 顔認識装置およびその方法
US7050607B2 (en) * 2001-12-08 2006-05-23 Microsoft Corp. System and method for multi-view face detection
US7542592B2 (en) * 2004-03-29 2009-06-02 Siemesn Corporate Research, Inc. Systems and methods for face detection and recognition using infrared imaging
CN100405388C (zh) 2004-05-14 2008-07-23 欧姆龙株式会社 特定被摄体检测装置
JP2007264742A (ja) 2006-03-27 2007-10-11 Fujifilm Corp 顔検出方法おならびにこれを用いた撮影装置
US8155399B2 (en) * 2007-06-12 2012-04-10 Utc Fire & Security Corporation Generic face alignment via boosting
US7822696B2 (en) * 2007-07-13 2010-10-26 Microsoft Corporation Histogram-based classifiers having variable bin sizes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005209137A (ja) * 2003-12-26 2005-08-04 Mitsubishi Heavy Ind Ltd 対象物認識方法及び対象物認識装置、並びに顔方向識別装置
JP2007066010A (ja) * 2005-08-31 2007-03-15 Fujifilm Corp 判別器学習方法および対象判別装置ならびにプログラム
JP2009086926A (ja) * 2007-09-28 2009-04-23 Kddi Corp 画像認識方法および装置

Also Published As

Publication number Publication date
CN102467655A (zh) 2012-05-23
EP2450831A3 (en) 2012-08-22
EP2450831A2 (en) 2012-05-09
US20120114250A1 (en) 2012-05-10

Similar Documents

Publication Publication Date Title
JP2012104111A (ja) 多角度の人間顔検知方法及びシステム
Paisitkriangkrai et al. Fast pedestrian detection using a cascade of boosted covariance features
CN101609509B (zh) 一种基于预分类器的图像物体检测方法及系统
Kumar et al. Transfer learning-based object detection models for improved diagnosis of tomato leaf disease
JP5063632B2 (ja) 学習モデル生成装置、対象物検出システム、及びプログラム
US10810433B2 (en) Method and system for tracking objects
CN106022223A (zh) 一种高维局部二值模式人脸识别方法及系统
CN118379589A (zh) 基于多模态融合的光伏板异常状态检测方法及相关设备
Liu et al. Related HOG features for human detection using cascaded adaboost and SVM classifiers
Tang et al. Histogram of template for human detection
CN105354547A (zh) 一种结合纹理和彩色特征的行人检测方法
Zhou et al. A pipeline architecture for traffic sign classification on an FPGA
CN109165592B (zh) 一种基于pico算法的实时可旋转的人脸检测方法
Overett et al. Boosting a heterogeneous pool of fast hog features for pedestrian and sign detection
Yuan et al. A combined pedestrian detection method based on haar-like features and hog features
Bhuvaneswari et al. Amalgamation of Image Features for Medical Image Classification with Ensemble of Classifiers
CN114663803B (zh) 基于视频流的物流中心挂装类服装分类方法及装置
JP2014153837A (ja) 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム
Cooley et al. Saliency detection and object classification
Javed et al. Human movement recognition using euclidean distance: a tricky approach
Cai et al. SVM-KNN algorithm for image classification based on enhanced HOG feature
Huang et al. Extreme learning machine based traffic sign detection
Wang et al. Multi features combination for automated zooplankton classification
Overett et al. Fast features for time constrained object detection
Muhammad et al. Race recognition using local descriptors

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160202