JP2017117024A - 画像認識装置、画像認識方法、及び撮像装置 - Google Patents

画像認識装置、画像認識方法、及び撮像装置 Download PDF

Info

Publication number
JP2017117024A
JP2017117024A JP2015249147A JP2015249147A JP2017117024A JP 2017117024 A JP2017117024 A JP 2017117024A JP 2015249147 A JP2015249147 A JP 2015249147A JP 2015249147 A JP2015249147 A JP 2015249147A JP 2017117024 A JP2017117024 A JP 2017117024A
Authority
JP
Japan
Prior art keywords
face
detection model
image recognition
organ
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015249147A
Other languages
English (en)
Inventor
雄司 金田
Yuji Kaneda
雄司 金田
佐藤 博
Hiroshi Sato
博 佐藤
崇士 鈴木
Takashi Suzuki
崇士 鈴木
俊亮 中野
Toshiaki Nakano
俊亮 中野
敦夫 野本
Atsuo Nomoto
敦夫 野本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015249147A priority Critical patent/JP2017117024A/ja
Publication of JP2017117024A publication Critical patent/JP2017117024A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】高精度で、かつ安定的な顔向き検出を実現できる画像認識装置を提供すること。
【解決手段】顔の画像を取得する画像取得手段と、前記顔の状態を検出する顔状態検出手段と、前記顔の状態に基づいて、顔向き検出モデルの切り替えを行う顔向き検出モデル切り替え手段と、前記顔向き検出モデル切り替え手段で選択された前記顔向き検出モデルを使用して前記顔の向きを検出する顔向き検出手段と、から構成されることを特徴とする。
【選択図】図1

Description

本発明は、画像認識装置、画像認識方法、及び撮像装置に関する。
顔の画像認識技術、例えば、表情認識によるカメラのオートシャッター、個人認証によるセキュリティや画像検索などの多くのアプリケーションに有用であるため、様々な技術が提案されている。その中で、照明などの環境変動や、表情や顔の向きなどの被写体自身の変動が顔の画像認識精度の劣化要因となっている。そのため、これらの変動を何らかの手段によって検出し、その検出結果に基づいた認識処理を実施する手法が数多く提案されている。
このような様々な変動を検出する技術の1つとして、顔の向きを検出する技術がある。
特許文献1は、顔画像から目尻や目頭などの顔器官を検出し、検出した顔器官の幾何情報を使用して顔の向きを検出する幾何情報ベースの手法を開示している。
一方、特許文献2は、顔の向きに関する様々な辞書を用意し、この辞書とのマッチングにより顔の向きを検出するアピアランスベースの手法を開示している。
特開2007−265367号公報 特許第03790680号公報
特許文献1のような幾何情報ベースの手法は、顔器官位置などの局所的な情報を使用しているため、顔の向きが大きく回転していない場合、影がない比較的良好な照明条件の場合では、高精度な顔向き検出が可能である。
しかし、顔が大きく回転して一部の顔器官が隠れる、もしくは、照明変動が良好でない場合には、期待値から大きくかけ離れた特徴点が検出され、その結果、でたらめな顔向き検出結果となる可能性がある。
一方、特許文献2のようなアピアランスベースの手法は、顔の輪郭エッジなど大局的で、冗長な情報を使用しているため、変動などに頑健であり、安定した顔向き検出が可能である。しかし、幾何情報ベース並みの高精度な顔向き検出は困難であるという問題がある。
そこで、本発明は、高精度で、かつ安定的な顔向き検出を実現できる画像認識装置を提供することを目的とする。
上記の目的を達成するために、本発明に係る画像認識装置は、幾何情報ベース方式とアピアランスペース方式の異なる2つの顔向き検出手法を用意し、被写体の状況に応じて、どちらか一方の最適な方式を選択し、選択された手法を使用して、顔向き検出を実施する。これにより、高精度で、かつ安定的な顔向き検出を実現する。
そのために、本発明の画像認識装置は、
顔の画像を取得する画像取得手段と、
前記顔の状態を検出する顔状態検出手段と、
前記顔の状態に基づいて、顔向き検出モデルの切り替えを行う顔向き検出モデル切り替え手段と、
前記顔向き検出モデル切り替え手段で選択された前記顔向き検出モデルを使用して前記顔の向きを検出する顔向き検出手段と、
から構成されることを特徴とする。
本発明に係る画像認識装置によれば、被写体の状況を検出し、その状況に基づいて、幾何情報ベース方式、もしくはアピアランスペース方式を選択することで、高精度で、かつ安定的な顔向き検出が可能となる。
本発明の第1の実施形態の全体構成を示した図である。 顔向き検出モデル切り替え部の詳細構成を示した図である。 本発明の第1の実施形態の全体フローを示した図である。 顔状態検出における第1の詳細例を示した図である。 顔向きを示した図である。 顔状態検出における第2の詳細例を示した図である。 顔表面に影がない場合とある場合を示した図である。 顔領域を4つのブロックに分割した例を示した図である。 サングラスをしている顔を示した図である。 本発明の第2の実施形態における顔向き検出モデル切り替え部の詳細構成を示した図である。 本発明の第2の実施形態の全体フローを示した図である。 顔領域を左目、右目、口の3つのブロックに分割した例を示した図である。 目領域に影が存在する場合の顔器官検出結果の例を示している。 20点全ての顔器官を使用した顔器官検出モデルと、18点(右目の上下瞼の器官を除いた)顔器官検出モデルを示した図である。 顔領域を左目、右目、口の3つのブロックに分割した時の各ブロックの照明条件に基づいて、顔器官検出モデルを選択するフローを示している。 顔向き検出部の詳細構成を示した図である。 顔向き検出部の詳細フローを示した図である。 検出した目頭と目尻の顔器官から上下瞼、検出した左右の口端点から上下唇の顔器官を推定する式を示した図である。
以下、本発明を実施するための形態を図面に基づいて説明する。
本発明の第1の実施形態について説明する。
先に述べたように、顔器官検出位置に基づく幾何情報ベースの顔向き検出方式は、変動が混入しないような良好な条件下では、高精度な顔向き検出が可能である一方、様々な変動が混入する良好でない条件下では、顔器官位置が大きくズレ、極端に顔向き検出精度が劣化するといった問題がある。
一方、エッジやヒストグラムに基づくアピアランスベースの顔向き検出方式は、変動の混入に関わらず、安定した顔向き検出が可能であるが、幾何情報ベースの顔向き検出方式と比較すると、高精度化が難しいといった問題がある。
そこで、本発明の第1の実施形態では、幾何情報ベース方式とアピアランスペース方式の異なる2つの顔向き検出手法を用意し、被写体の状況に応じて、どちらか一方の最適な方式を選択し、選択された手法を使用して、顔向き検出を実施する。これにより、高精度で、かつ安定的な顔向き検出を実現する。
図1は本発明の第1の実施形態の全体構成を示しており、画像取得部100、顔検出部110、画像正規化部130、顔状態検出部140、顔向き検出モデル切り替え部150、顔向き検出部160から構成される。また、図2は顔向き検出モデル切り替え部150の詳細を示しており、特徴抽出部151、顔器官検出部152で構成される。
図3は全体フローを示しており、以下では、図3の全体フローに沿って説明する。
ステップS1000では、画像取得部100において、レンズなどの集光素子、光を電気信号に変換するCMOSやCCDなどの撮像素子、アナログ信号をデジタル信号に変換するAD変換器を通過することによって、得られたデジタル画像データを取得する。また、間引き処理等を行うことによって、例えば、VGA(640×480[pixel])やQVGA(320×240[pixel])に変換した顔画像を取得することも可能である。
ステップS1100では、顔検出部110において、ステップS1000で取得したデジタル画像データに対して物体領域の重心位置検出をする。なお、本発明の第1の実施形態では、顔領域の中心位置である。顔検出処理は、非特許文献1のような手法があり、本実施形態1においては、この技術を使用する。
[非特許文献1] P. Viola, M. Jones, “Rapid Object Detection using a Boosted Cascade of Simple Features”, in Proc. Of CVPR, vol.1, pp.511-518, December, 2001
なお、顔検出処理では、目や口などの顔パーツを検出することでデジタル画像データ中に顔が存在するか否かを判定する手法がよく用いられている。そのため、ステップS1100では、顔の中心座標(x,y)と共に、左右の眼の中心座標(x,y)や口の中心座標(x,y)を取得することが可能である。
ステップS1200では、ステップ1100で顔が検出されたかどうかを判定する。顔が検出された場合にはステップS1300へ進む。一方、顔が検出されなかった場合にはステップS1000に戻り、次の画像を取得する。
ステップS1300では、画像正規化部130において、ステップS1100における顔検出処理によって得られる、顔の中心座標(x,y)、左右の眼の中心座標(x,y)、口の中心座標(x,y)を使用して画像の切り出しと正規化処理を行う。なお、正規化処理には、アフィン変換を使用する。この正規化処理によって、例えば、左右の眼の中心座標間の距離が50[pixcel]で、かつ、左右の眼の中心座標を結ぶ直線が平行、つまり、顔が正立するようになる。
ステップS1400では、顔状態検出部140において、まずは、ステップS1300で生成された正規化画像に対して特徴抽出を行う。特徴は、非特許文献2のようなLocal Binary Patternのヒストグラムや、非特許文献3のような輝度勾配のヒストグラムなど、様々な特徴が考えられるが、本発明の第1の実施形態では、非特許文献3の輝度勾配のヒストグラム(以下、HOG特徴)を使用する。
[非特許文献2] C. Shan, T. Gritti, “Learning discriminative lbp-histogram bins for facial expression recognition”, Proc. British Machine Vision Conference, 2008
[非特許文献3] N. Dalal, B. Triggs, “Histograms of Oriented Gradients for Human Detection”, Computer Vision and Pattern Recognition (CVPR), 2005
次に、抽出した特徴を使用して、顔の状態を検出する。顔の状態とは、顔が一定角度以上回転しているかどうか、顔表面に影が存在するかどうか、メガネなどを装着しているかどうかなどである。
ステップS1420では、ステップS1400で検出した顔の状態に基づいて、より詳細な顔向きを検出するためにモデルの切り替えをする。つまり、顔の状態に基づいて、変動に対して弱い一方で高精度化が可能な幾何情報を使用した顔向き検出方式(顔器官位置検出モデル)と、変動に頑健である一方で幾何情報を使用した顔向き検出方式と比べると高精度化が難しいアピアランス情報を使用した顔向き検出方式(アピアランス特徴抽出モデル)とを、切り替えるようにしている。
以下では切り替え方法について、幾つかのバリエーションと共に詳細な説明をする。
「切り替え方法1」大まかな顔の向き検出結果に基づく切り替え
顔が一定以上回転すると、目や口などの一部の顔器官が隠れてしまうため、正確に顔器官を検出することができず、その状態で顔向き検出を実施しても、結果が期待される顔向きとは大きくかけ離れてしまう問題がある。
そこで、変動にロバストなアピアランス特徴を使用して、大まかな顔の回転量を検出し、その検出結果に基づいて、詳細な顔の向き検出に顔器官位置検出モデルを使用するか、アピアランス特徴抽出モデルを使用するか選択する。図4は一例を示している。
ステップS1401では、大まかな顔の向きを検出するための特徴抽出を行う。例えば、上述したようにHOG特徴を抽出する。
ステップS1402では、顔向きクラス判定を行う。顔向きクラス判定とは、本発明の第1の実施形態では、顔の向きが所定の角度未満なのか、所定の角度以上なのか、2値判定を行う。例えば、図5のように、ほぼ正面向きの顔14011、14012、14013なのか、横向き14010、14014なのか2値判定を行う。判定に使用する識別器には、非特許文献1で使用されているSupport Vector Machine(以下、SVM)を使用する。SVMを使用する場合には、予め学習が必要であり、例えば、ほぼ正面向きの顔14011、14012、14013から抽出した大量のHOG特徴と、横向き14010、14012から抽出した大量のHOG特徴を用意し、これらの特徴を使用して学習する。学習の際、ほぼ正面向きの顔14011、14012、14013に対して正のラベル、横向き14010、14014に対して負のラベルを割り当てることにより、SVMからの結果が正の値であれば顔がほぼ正面を向いている、負の値であれば横を向いているという判定結果になる。なお、SVMのカーネルには、線形関数、非線形関数など様々な関数が選択できるが、本発明の第1の実施形態では線形関数を使用する。
ステップS1403では、ステップS1402での判定結果に基づいて、詳細な顔の向き検出に顔器官位置検出モデルを使用するか、アピアランス特徴抽出モデルを使用するか選択する。ステップS1402で、顔向きがほぼ正面向きであると判定された場合、つまり、ステップS1402での結果が正の値の場合にはステップS1404に進み、詳細な顔向き検出に幾何情報ベースの顔器官位置検出モデルが選択される。一方で、横向きであると判定された場合には、つまり、ステップS1402での結果が負の値の場合にはステップS1405に進み、詳細な顔向き検出にアピアランス特徴抽出モデルが選択される。
「切り替え方法2」.影の有無判定結果に基づく切り替え
先に述べた顔向きによる顔器官の隠れ以外にも照明変動による影の影響により、顔器官検出結果に大きな位置ズレが生じ、その結果、期待される顔向き検出結果と大きく異なる場合がある。
そこで、変動にロバストなアピアランスベース特徴を使用して、顔表面の照明変動による影を検出した後、その結果に基づいて、より詳細な顔向きを検出する方式を切り替えるようにする。図6はそのフローを示している。
ステップS1406では、影の有無判定をするための特徴抽出を行う。例えば、上述したようにHOG特徴を抽出する。
ステップS1407では、影の有無判定を行う。影の有無判定とは、図7のように、顔の表面に影が存在するか否かの判定を行う。図7の顔14015は顔表面に影がない顔、顔14016は顔表面に影がある顔を示している。影の有無判定には、先に述べた顔向きクラス判定同様に、SVMを使用する。学習には、顔表面に影がない図7の顔画像14015と、顔表面に影がある顔画像14016を大量に用意し、これらの顔画像から抽出したHOG特徴を使用する。なお、影の有無判定では、図8の顔画像14017のように、顔画像を複数のブロックに分割し、各ブロック毎に判定する方法でも構わない。
ステップS1408では、ステップS1407での判定結果に基づいて、詳細な顔の向き検出に顔器官位置検出モデルを使用するか、アピアランス特徴抽出モデルを使用するか選択する。顔表面に影がない場合には、ステップS1409に進み、詳細な顔向き検出に幾何情報ベースの顔器官位置検出モデルが選択される。一方で、顔表面に影がある場合には、ステップS1410に進み、詳細な顔向き検出にアピアランスベースのアピアランス特徴抽出モデルが選択される。
「切り替え方法3」.装飾物の判定結果に基づく切り替え
更に、メガネなどの装飾物によって、顔器官に隠れが生じる場合もある。この場合も同様に、変動にロバストなアピアランスベース特徴を顔全体ではなくて、図9のように顔の一部の領域14018から抽出し、メガネなどの装飾物が存在するかどうかを判定する。なお、ステップS1300で顔の中心が所定の位置、かつ、顔の大きさが所定の大きさになるように正規化されているため、ここで設定される領域は固定された領域で構わない。
メガネなどの装飾物を検出する処理の詳細については、上述した顔向きや影の有無の場合と同様であるため、処理を省略する。
以上、顔向き検出方式を切り替える条件は、多数存在するが、以下では、最初に述べた「切り替え方法1」の大まかな顔の向き検出結果に基づく切り替え方法として説明を行う。
ステップS1420では、ステップS1400において、詳細な顔の向き検出にアピアランス特徴抽出モデルが選択された場合には、ステップS1510に進む。つまり、ある一定以上回転した顔向きに対しては、アピアランス情報に基づくアピアランス特徴抽出モデルを選択する。
ステップS1510では、特徴抽出部151において、顔器官の隠れなどの影響を受けにくい、ステップS1400で抽出したHOG特徴などのアピアランス特徴を再度抽出する。なお、被写体の顔向きを、より詳細に検出するため、ステップS1401における特徴抽出とは別のパラメータを使用するようにしても良い。例えば、HOG特徴では横軸を輝度勾配方向、縦軸を輝度勾配強度としたヒストグラムを生成しているが、横軸の輝度勾配方向のビンの数を細分化することで、より細かな特徴を抽出可能である。
ステップS1601では、顔向き検出部160において、ステップS1510で抽出したアピアランス特徴を使用して、顔向きの角度を検出する。顔向きの角度を検出する方法として、非特許文献4のように、Support Vector Regressor(以下、SVR)などの回帰モデルを使用する。
[非特許文献4] E. Murphy-Chutorian, M. Manubhai Trivedi, “Head Pose Estimation in Computer Vision: A Survey”, IEEE Transaction on Pattern Analysis and Machine Intelligence, 2008
この場合には、HOG特徴と、それに対応する顔向きの角度をペアとして、SVRを学習させることで、顔向きの角度を検出することが可能である。
一方、ステップS1420では、ステップS1400において、詳細な顔の向き検出に顔器官位置検出モデルが選択された場合には、ステップS1520に進む。つまり、ほぼ正面向きの顔向きに対しては、幾何情報に基づく顔器官位置検出モデルを選択する。
ステップS1520では、顔器官検出部152において、特許文献1や非特許文献5のような方法で顔器官位置検出を行う。
[非特許文献5] K.Kinoshita, Y.Konishi, S.Lao, M.Kawade, “A Fast and Robust Facial Feature Detection and 3D Head Pose Estimation based on 3D Model Fitting”, MIRU2008
ステップS1600では、顔向き検出部160において、非特許文献4のように、ステップS1600で検出された顔器官座標の相対関係から顔向きの角度を検出する。ステップS1601同様に、回帰モデルを使用する場合には、顔器官座標(Xn,Yn)から1つの特徴ベクトルを生成し、それに対応する顔向きの角度をラベルとして学習する。
以上のように、顔器官検出位置に基づく幾何情報ベースの顔向き検出は、変動が混入しないような条件下では、高精度な顔向き検出が可能である一方、様々な変動が混入する条件下では、顔器官位置が大きくズレ、極端に性能が劣化するといった問題がある。例えば、顔向きが一定以上回転した場合の顔器官の隠れなどである。一方、エッジやヒストグラムに基づくアピアランスベースの顔向き検出は、様々な変動の混入に関わらず、安定した顔向き検出が可能である。
このような特徴から、顔の向きなど被写体の状況を検出し、その状況に基づいて、幾何情報ベース方式、もしくはアピアランスペース方式を選択することで、高精度で、かつ安定的な顔向き検出が可能となる。
本発明の第2の実施形態について説明する。
第1の実施形態では、影の有無やメガネの装飾物による隠れなどを検出し、その検出結果に基づいて、アピアランス特徴抽出モデル、もしくは顔器官位置検出モデルのどちらか一方の顔向き検出方式を選択するようにした。つまり、顔検出方式の異なる2つの方式を切り替えるようにしていた。
第2の実施形態では、異なる2つの方式を切り替えるのではなく、顔器官位置検出モデルだけを使用する。但し、被写体の状態、つまり、影の有無やメガネの装飾物による隠れなどに基づいて、顔器官位置検出モデルで用いる顔器官検出モデルを切り替えるようにしている。
本発明の第2の実施形態の全体構成は、第1の実施形態と同様に図1で構成される。但し、顔向き検出モデル切り替え部150は、第1の実施形態とは異なり、図10ように顔器官検出モデル記憶部250、顔器官検出モデル選択部260、顔器官検出部270で構成されている。また、図11はその全体フローを示しており、以下では、図11の全体フローに沿って説明する。
ステップS2000からステップS2300までは本発明の第1の実施形態と同様のため説明を省略する。
ステップS2400では、顔状態検出部240において、まず、第1の実施形態と同様にHOG特徴などの特徴抽出を実施する。次に、顔表面の影やメガネなどの装飾物の有無などを検出することで、顔器官検出を実施する前に顔器官が正確に検出可能かどうかを予測する。顔状態検出には、本発明の第1の実施形態で説明したようにSVMを使用する。
図12の左図(2501)は顔表面に影のない照明条件が良好な場合、右図(2502)は右目の一部に影が発生し、照明条件が良好でない場合を示している。例えば、1つの目に対して、目頭、目尻、上瞼、下瞼の4つの顔器官を検出する場合、影などの照明変動の影響により、顔器官位置がズレてしまう可能性がある。目頭や目尻など顔表面上で特徴的なコーナーエッジを検出する場合には照明条件が良好でない場合にも比較的正確に検出可能である。しかし、上瞼、下瞼の水平エッジなど様々な変動により容易に発生しうる特徴的ではないエッジを検出する場合には、図13のように、影の境界を、上瞼2505、下瞼2506として誤検出する可能性がある。
そこで、ステップS2500では、図12のように顔表面を幾つかのブロックに分割し、ブロック毎に影などを検出することで、顔器官を正確に検出可能かどうか顔器官検出実施前に判定する。
ステップS2600では、顔器官検出モデル選択部260において、ステップS2400での顔状態検出結果に基づいて、顔器官検出モデル記憶部250に記憶されている顔器官検出モデルの中から1つの顔器官検出モデルを選択する。顔器官検出モデルには、非特許文献4のように、Active Apperance Model(以下、AAM)やActive Shape Model(以下、ASM)を使用する。
例えば、図12の左図のように影のない照明条件が良好な場合には、図14の左図のように12点の顔器官を使用したモデル2601を使用する。一方、図12の右図のように右目の一部に影がある照明条件が良好でない場合には、照明変動の影響を受け易い顔器官を除外した図14の右図のような10点のモデル2602を使用する。つまり、各ブロックの状態に応じて顔器官検出モデルを切り替えるようにする。なお、顔器官検出モデルMは、モデル形状を表す基底ベクトル群Vと各基底ベクトルに係る係数Bで構成されている。そのため、顔器官検出モデル記憶部250には、モデル形状を表す基底ベクトルVと各基底ベクトルに係る係数Bなどのパラメータが記憶されており、各ブロックの状態に応じてパラメータが選択される。なお、本発明の第2の実施形態では、図14に示す12点の顔器官検出モデルを使用しているが、鼻の穴など別の顔器官を使用しても良く、これに限られるわけではない。
図15は顔領域を図12のように左目、右目、口の3つのブロックに分割し、各ブロックでの影の有無に基づいて、顔器官検出モデルを選択しているフローを示している。
以下では、各ブロックでの判定結果に基づいて、顔器官検出モデルを選択する図15のフローに関して詳細な説明をする。
ステップS2603において、左目を含むブロック内に影があるかどうかを判定する。左目を含むブロック内に影がある場合には、ステップS2604へ進む。
ステップS2604において、右目を含むブロック内に影があるかどうかを判定する。右目を含むブロック内に影がある場合には、ステップS2605へ進む。
ステップS2605において、口を含むブロック内に影があるかどうかを判定する。口を含むブロック内に影がある場合には、ステップS2606へ進む。
ステップS2606において、左目、右目、口のブロック内に影があり、左右目の上下瞼と上下唇が正確に検出できないと予想されるため、左右目の上下瞼と上下唇を除外したモデル(1)を選択する。
ステップS2605において、口を含むブロック内に影がない場合には、ステップS2607に進む。
ステップS2607において、左目、右目のブロック内に影があり、左右目の上下瞼が正確に検出できないと予想されるため、左右目の上下瞼を除外したモデル(2)を選択する。
ステップS2604において、右目を含むブロック内に影がない場合には、ステップS2608に進む。
ステップS2608において、口を含むブロック内に影があるかどうかを判定する。口を含むブロック内に影がある場合には、ステップS2609へ進む。
ステップS2609において、左目、口を含むブロック内に影があり、左目の上下瞼、口の上下唇が正確に検出できないと予想されるため、左目の上下瞼、口の上下唇を除外したモデル(3)を選択する。
ステップS2608において、口を含むブロック内に影がない場合には、ステップS2610に進む。
ステップS2610において、左目を含むブロック内に影があり、左目の上下瞼が正確に検出できないと予想されるため、左目の上下瞼を除外したモデル(4)を選択する。
ステップS2603において、左目を含むブロック内に影がない場合には、ステップS2611に進む。
ステップS2611において、右目を含むブロック内に影があるかどうかを判定する。右目を含むブロック内に影がある場合には、ステップS2612へ進む。
ステップS2612において、口を含むブロック内に影があるかどうかを判定する。口を含むブロック内に影がある場合には、ステップS2613へ進む。
ステップS2613において、右目、口を含むブロック内に影があり、右目の上下瞼、口の上下唇が正確に検出できないと予想されるため、右目の上下瞼、口の上下唇を除外したモデル(5)を選択する。
ステップS2612において、口を含むブロック内に影がない場合には、ステップS2614に進む。
ステップS2614において、右目を含むブロック内に影があり、右目の上下瞼が正確に検出できないと予想されるため、右目の上下瞼を除外したモデル(6)を選択する。
ステップS2611において、右目を含むブロック内に影がない場合には、ステップS2615に進む。
ステップS2615において、口を含むブロック内に影があるかどうかを判定する。口を含むブロック内に影がある場合には、ステップS2616へ進む。
ステップS2616において、口を含むブロック内に影があり、上下唇が正確に検出できないと予想されるため、上下唇を除外したモデル(7)を選択する。
ステップS2615において、口を含むブロック内に影がない場合には、ステップS2617に進む。
ステップS2617において、顔表面全体で影がない照明条件が良好な場合には、全ての顔器官を使用したモデル(8)を選択する。
以上のように、各ブロックの状態に応じた顔器官検出モデルの切り替えについて説明した。
ステップS2700では、ステップS2600で選択された顔器官検出モデルを使用して、顔器官検出を行う。非特許文献5は、その例を示している。
ステップS2800では、顔向き検出部160において、ステップS2700で検出した顔器官位置を使用して顔向き検出を行う。なお、一部の顔器官検出モデルを使用する、つまり、図15のステップS2606、S2607、S2609、S2610、S2613、S2614、S2616を通った場合には、左右目の上下瞼、上下唇のいずれかの顔器官が得られない。例えば、図15において顔器官検出モデル(1)(S2606)が選択された場合には、左右の目頭、左右の目尻、口両端の6点の顔器官が検出されるが、左右目の上下瞼、上下唇の6点の顔器官位置は得られない。そこで、このような場合には、顔器官位置の補間を実施する。
図16は顔向き検出部160の詳細を示しており、顔器官位置補間部300、顔向き角度検出部310で構成される。また、ステップS2800の詳細フローを示したのが図17である。
ステップS2801では、所定の顔器官が全て検出したかどうか判定する。所定の顔器官が全て検出した場合にはステップS2804へ進む。一方、所定の顔器官が全て検出しなかった場合にはステップS2802へ進む。
ステップS2802では、顔器官位置を補間するかどうか判定する。顔器官位置を補間しない場合にはステップS2804へ進む。顔器官位置を補間する場合には、ステップS2803へ進む。
ステップS2803では、顔器官位置補正部290において、検出しなかった顔器官位置の補間を行う。例えば、検出した顔器官位置に基づいて、平均的な顔器官位置を設定する。図18は検出した顔器官(左右の目頭、左右の目尻、口両端)に基づく位置を設定する例を示している。図18の中塗丸は顔器官検出モデルによって検出された顔器官、中塗でない丸は検出した顔器官(左右の目頭、左右の目尻、口両端)に基づく位置である。図18の上瞼のy座標にあるa、下瞼のy座標にあるb、上唇のy座標にあるc、下唇のy座標にあるdは夫々定数であり、これらの定数a,b,c,dは、ステップS2300で正規化された顔から算出した統計的な平均値である。
ステップS2804では、顔向き角度検出部310において、本発明の第1の実施形態同様に、顔器官位置の幾何情報を使用して顔向きの角度検出を行う。
以上のように、顔器官検出位置に基づく幾何情報ベースの顔向き検出方式は、変動が混入しないような条件下では、高精度な顔向き検出が可能である一方、様々な変動が混入する条件下では、顔器官位置が大きくズレ、極端に性能が劣化するといった問題がある。特に、目頭や目尻などの顔表面に特徴的な顔器官と比べ、上下瞼や上下唇などの顔器官は変動による影響が非常に大きい。
そこで、本発明では、顔を複数のブロックに分割し、ブロック毎に影の有無などを検出することで、正確な顔器官検出が可能かどうか判定し、その判定結果に応じて顔器官検出モデルを選択するようにしている。このような手法により、高精度で、かつ安定的な幾何情報ベースの顔向き検出が可能となる。
100 画像取得部、110 顔検出部、130 画像正規化部、
140 顔状態検出部、150 顔向き検出モデル切り替え部、160 顔向き検出部

Claims (20)

  1. 顔の画像を取得する画像取得手段と、
    前記顔の状態を検出する顔状態検出手段と、
    前記顔の状態に基づいて、顔向き検出モデルの切り替えを行う顔向き検出モデル切り替え手段と、
    前記顔向き検出モデル切り替え手段で選択された前記顔向き検出モデルを使用して前記顔の向きを検出する顔向き検出手段と、
    から構成されることを特徴とする画像認識装置。
  2. 前記顔向き検出モデル切り替え手段は、前記顔の状態に基づいて、複数の顔向き検出手法の中から1つを選択することを特徴とする請求項1に記載の画像認識装置。
  3. 前記顔向き検出手法は、前記顔から顔器官位置を検出する顔器官位置検出モデル、前記顔からアピアランス特徴を抽出するアピアランス特徴抽出モデルであることを特徴とする請求項2に記載の画像認識装置。
  4. 前記状態とは顔の向きの回転量であり、前記顔の向きの回転量に基づいて、顔向き検出手法を選択することを特徴とする請求項2に記載の画像認識装置。
  5. 前記顔の向きが一定以上回転している場合には前記アピアランス特徴抽出モデル、前記顔の向きが一定以上回転していない場合には前記顔器官位置検出モデルを使用することを特徴とする請求項4に記載の画像認識装置。
  6. 前記状態とは顔表面における影の有無であり、前記顔向き検出モデル切り替え手段では、前記顔表面において影が存在する場合には前記アピアランス特徴抽出モデル、前記顔表面において影が存在しない場合には前記顔器官位置検出モデルを使用することを特徴とする請求項2に記載の画像認識装置。
  7. 前記状態とは装飾物の有無であり、前記顔向き検出モデル切り替え手段では、前記装飾物が存在する場合には前記アピアランス特徴抽出モデル、前記装飾物が存在しない場合には前記顔器官位置検出モデルを使用することを特徴とする請求項2に記載の画像認識装置。
  8. 更に、複数の顔器官検出モデルを記憶する顔器官検出モデル記憶部を備え、前記顔の状態に基づいて前記顔器官検出モデルを選択することを特徴とする請求項1乃至請求項7の何れか一項に記載の画像認識装置。
  9. 更に、前記顔向き検出手段は、前記顔器官検出モデルによって、検出されなかった顔器官が存在する場合には、前記検出されなかった顔器官を補間する顔器官位置補間部を備えることを特徴とする請求項1乃至請求項8の何れか一項に記載の画像認識装置。
  10. 前記顔の向きは、角度を算出することを特徴とする請求項1乃至請求項9の何れか一項に記載の画像認識装置。
  11. 顔の画像を取得する画像取得工程と、
    前記顔の状態を検出する顔状態検出工程と、
    前記顔の状態に基づいて、顔向き検出モデルの切り替えを行う顔向き検出モデル切り替え工程と、
    前記顔向き検出モデル切り替え工程で選択された前記顔向き検出モデルを使用して前記顔の向きを検出する顔向き検出工程と、
    から構成される画像認識方法。
  12. 前記顔向き検出モデル切り替え工程は、前記顔の状態に基づいて、複数の顔向き検出手法の中から1つを選択することを特徴とする請求項11に記載の画像認識方法。
  13. 前記顔向き検出手法は、前記顔から顔器官位置を検出する顔器官位置検出モデル、前記顔からアピアランス特徴を抽出するアピアランス特徴抽出モデルであることを特徴とする請求項12に記載の画像認識方法。
  14. 前記状態とは顔の向きの回転量であり、前記顔の向きの回転量に基づいて、顔向き検出手法を選択することを特徴とする請求項12に記載の画像認識方法。
  15. 前記顔の向きが一定以上回転している場合には前記アピアランス特徴抽出モデル、前記顔の向きが一定以上回転していない場合には前記顔器官位置検出モデルを使用することを特徴とする請求項14に記載の画像認識方法。
  16. 前記状態とは顔表面における影の有無であり、前記顔向き検出モデル切り替え工程では、前記顔表面において影が存在する場合には前記アピアランス特徴抽出モデル、前記顔表面において影が存在しない場合には前記顔器官位置検出モデルを使用することを特徴とする請求項12に記載の画像認識方法。
  17. 前記状態とは装飾物の有無であり、前記顔向き検出モデル切り替え工程では、前記装飾物が存在する場合には前記アピアランス特徴抽出モデル、前記装飾物が存在しない場合には前記顔器官位置検出モデルを使用することを特徴とする請求項12に記載の画像認識方法。
  18. 更に、複数の顔器官検出モデルを記憶する顔器官検出モデル記憶部を備え、前記顔の状態に基づいて前記顔器官検出モデルを選択することを特徴とする請求項11乃至請求項17の何れか一項に記載の画像認識方法。
  19. 更に、前記顔向き検出工程は、前記顔器官検出モデルによって、検出されなかった顔器官が存在する場合には、前記検出されなかった顔器官を補間する顔器官位置補間部を備えることを特徴とする請求項11乃至請求項18の何れか一項に記載の画像認識方法。
  20. 前記顔の向きは、角度を算出することを特徴とする請求項11乃至請求項19の何れか一項に記載の画像認識方法。
JP2015249147A 2015-12-22 2015-12-22 画像認識装置、画像認識方法、及び撮像装置 Pending JP2017117024A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015249147A JP2017117024A (ja) 2015-12-22 2015-12-22 画像認識装置、画像認識方法、及び撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015249147A JP2017117024A (ja) 2015-12-22 2015-12-22 画像認識装置、画像認識方法、及び撮像装置

Publications (1)

Publication Number Publication Date
JP2017117024A true JP2017117024A (ja) 2017-06-29

Family

ID=59231796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015249147A Pending JP2017117024A (ja) 2015-12-22 2015-12-22 画像認識装置、画像認識方法、及び撮像装置

Country Status (1)

Country Link
JP (1) JP2017117024A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020046928A (ja) * 2018-09-19 2020-03-26 キヤノン株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム
JP2020135551A (ja) * 2019-02-21 2020-08-31 セコム株式会社 対象物認識装置、対象物認識方法、及び対象物認識プログラム
WO2022250063A1 (ja) * 2021-05-26 2022-12-01 キヤノン株式会社 顔認証を行う画像処理装置および画像処理方法
JP2022182960A (ja) * 2021-05-26 2022-12-08 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
WO2023238365A1 (ja) * 2022-06-10 2023-12-14 富士通株式会社 顔特徴情報抽出方法、顔特徴情報抽出装置、及び顔特徴情報抽出プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020046928A (ja) * 2018-09-19 2020-03-26 キヤノン株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム
US11188788B2 (en) 2018-09-19 2021-11-30 Canon Kabushiki Kaisha System and method to determine a timing update for an image recognition model
JP7463052B2 (ja) 2018-09-19 2024-04-08 キヤノン株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム
JP2020135551A (ja) * 2019-02-21 2020-08-31 セコム株式会社 対象物認識装置、対象物認識方法、及び対象物認識プログラム
WO2022250063A1 (ja) * 2021-05-26 2022-12-01 キヤノン株式会社 顔認証を行う画像処理装置および画像処理方法
JP2022182960A (ja) * 2021-05-26 2022-12-08 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP7346528B2 (ja) 2021-05-26 2023-09-19 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
WO2023238365A1 (ja) * 2022-06-10 2023-12-14 富士通株式会社 顔特徴情報抽出方法、顔特徴情報抽出装置、及び顔特徴情報抽出プログラム

Similar Documents

Publication Publication Date Title
US10684681B2 (en) Neural network image processing apparatus
US10198823B1 (en) Segmentation of object image data from background image data
US9965865B1 (en) Image data segmentation using depth data
EP3241151B1 (en) An image face processing method and apparatus
US6925122B2 (en) Method for video-based nose location tracking and hands-free computer input devices based thereon
CN107852533B (zh) 三维内容生成装置及其三维内容生成方法
Rekik et al. A new visual speech recognition approach for RGB-D cameras
Reale et al. Nebula feature: A space-time feature for posed and spontaneous 4D facial behavior analysis
US9305206B2 (en) Method for enhancing depth maps
WO2022095721A1 (zh) 参数估算模型的训练方法、装置、设备和存储介质
JP6351243B2 (ja) 画像処理装置、画像処理方法
CN102622589A (zh) 一种基于gpu的多光谱人脸检测方法
JP2017117024A (ja) 画像認識装置、画像認識方法、及び撮像装置
Narzillo et al. Peculiarities of face detection and recognition
CN111586428A (zh) 具有虚拟人物上妆功能的化妆品直播系统及方法
WO2018173314A1 (ja) 顔認識装置
Conde et al. Multimodal 2D, 2.5 D & 3D Face Verification
US11354860B1 (en) Object reconstruction using media data
CN107153806B (zh) 一种人脸检测方法及装置
US12062130B2 (en) Object reconstruction using media data
Tin Robust Algorithm for face detection in color images
CN113724302B (zh) 一种个性化眼镜定制方法及定制系统
JPWO2020065790A1 (ja) 推定装置、推定方法、およびプログラム
WO2023023464A1 (en) Object reconstruction using media data
Lin et al. A feature-based gender recognition method based on color information