JP6973876B2 - 顔認識方法、顔認識装置及び顔認識方法を実行するコンピュータプログラム - Google Patents

顔認識方法、顔認識装置及び顔認識方法を実行するコンピュータプログラム Download PDF

Info

Publication number
JP6973876B2
JP6973876B2 JP2020542097A JP2020542097A JP6973876B2 JP 6973876 B2 JP6973876 B2 JP 6973876B2 JP 2020542097 A JP2020542097 A JP 2020542097A JP 2020542097 A JP2020542097 A JP 2020542097A JP 6973876 B2 JP6973876 B2 JP 6973876B2
Authority
JP
Japan
Prior art keywords
recognition result
face
reliability
distance
face image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020542097A
Other languages
English (en)
Other versions
JP2021513700A (ja
Inventor
▲習▼▲華▼ 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2021513700A publication Critical patent/JP2021513700A/ja
Application granted granted Critical
Publication of JP6973876B2 publication Critical patent/JP6973876B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/50Maintenance of biometric data or enrolment thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Description

本願は、2018年03月22日に中国特許庁に提出された、出願番号が201810239389.3であり、発明の名称が「顔認識方法及び装置」である中国特許出願に基づく優先権を主張し、その全ての内容は参照することにより本願に組み込まれる。
本発明は、画像処理の技術分野に関し、特に顔認識方法及び装置に関する。
場合によっては、取得された顔画像に対して顔認識を行い、顔画像に対応する顔識別子を決定する必要がある。顔識別子は、特定の人物の識別子であってもよいし、それに対応する人物顔画像の識別子であってもよい。事前訓練された分類器を使用して人物顔認識を実現してもよい。分類器の各クラスは、即ち、データベース内の各顔識別子である。サーバは、認識対象の顔画像を取得するごとに、該顔画像の特徴ベクトルを抽出してもよく、さらに、抽出された特徴ベクトルを、事前訓練された分類器に入力することにより、該顔画像に対応する顔識別子を取得してもよい。
本願の実施例は、顔認識の効率を向上できる顔認識方法及び装置を提供する。
本願の実施例の顔認識方法は、
認識対象の顔画像を取得し、前記顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出するステップと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第1認識結果として決定し、各第1距離集合の中で前記第1認識結果に対応する最小距離に基づいて、前記第1認識結果に対応する第1信頼度を決定するステップと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得し、各第2距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第2距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第2認識結果として決定し、各第2距離集合の中で前記第2認識結果に対応する最小距離に基づいて、前記第2認識結果に対応する第2信頼度を決定するステップと、
前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップと、を含んでもよい。
本願の実施例の顔認識装置は、
認識対象の顔画像を取得し、前記顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出する取得モジュールと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第1認識結果として決定し、各第1距離集合の中で前記第1認識結果に対応する最小距離に基づいて、前記第1認識結果に対応する第1信頼度を決定する第1計算モジュールと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得し、各第2距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第2距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第2認識結果として決定し、各第2距離集合の中で前記第2認識結果に対応する最小距離に基づいて、前記第2認識結果に対応する第2信頼度を決定する第2計算モジュールと、
前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定する決定モジュールと、を備えてもよい。
本願の実施例のサーバは、プロセッサとメモリとを備え、前記メモリには、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶され、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、前記プロセッサによりロードされて実行されることで、前記顔認識方法を実現させるようにしてもよい。
本願の実施例のコンピュータ読み取り可能な記憶媒体は、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶しており、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、前記顔認識方法を実現させるようにしてもよい。
本願の実施例では、サーバは、認識対象の顔画像を取得した後、顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出することができ、さらに、各目標特徴ベクトルと、各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合に基づいて、顔画像に対応する第1認識結果及びそれに対応する第1信頼度を決定することができる。少なくとも1つの目標特徴ベクトルを決定した後、各目標特徴ベクトルと、各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得することもでき、さらに、各第2距離集合に基づいて、顔画像に対応する第2認識結果及びそれに対応する第2信頼度を決定することができる。第1認識結果及びそれに対応する第1信頼度と、第2認識結果及びそれに対応する第2信頼度とを決定した後、顔画像に対応する顔認識結果及びそれに対応する信頼度を決定することができる。このように、第1認識結果と第2認識結果とを融合することにより、顔画像に対応する顔認識結果を決定することができ、分類器を事前訓練する必要がなくなり、さらに、新しい顔識別子を追加するときに分類器を再訓練することを回避することができ、これにより、顔認識の効率を向上させることができる。
本願の実施例の構成をより明確に説明するために、以下、実施例の説明に必要な図面を簡単的に紹介する。明らかに、以下の説明における図面は本願のいくつかの実施例を示しているにすぎず、当業者にとって、創造的な労働をせずに、これらの図面から他の図面を得ることもできる。
本願の実施例で提供された実施環境の模式図である。 本願の実施例で提供された顔認識方法のフローチャートである。 本願の実施例で提供されたフレームワークの模式図である。 本願の実施例で提供されたフレームワークの模式図である。 本願の実施例で提供された顔認識方法のフローチャートである。 本願の実施例で提供された顔認識装置の構成の模式図である。 本願の実施例で提供された顔認識装置の構成の模式図である。 本願の実施例で提供されたサーバの構成の模式図である。
本願の目的、構成、及びメリットをより明確にするために、以下、図面を参照しながら、本願の実施形態をさらに詳しく説明する。
本願の実施例は、顔認識方法を提供している。この方法は、図1(a)に示すように、実行主体が、例えば、端末又はサーバなどの1つ又は複数のコンピューティングデバイスであり、端末及びサーバの両方によって実現することもできる。ここで、端末は、顔認識機能を有する任意の端末であってもよく、例えば、パーソナルコンピュータなどの端末であってもよい。サーバは、顔認識機能を有するサーバであってもよく、例えば、顔認識機能を有するバックグラウンドサーバなどであってもよい。端末及びサーバの両方により実現される場合は、端末が、認識対象の顔画像を取得した後、この顔画像を認識対象の顔画像としてサーバに送信してもよく、さらに、サーバが、認識対象の顔画像に対応する顔認識結果を決定してもよい。以下、実行主体がサーバである場合を例にして詳しく説明するが、他の場合は、それと同様であるため、ここでは説明を省略する。
サーバは、プロセッサ、メモリなどの部品を含んでもよい。プロセッサは、CPUなどであってもよい。プロセッサは、平均探索アルゴリズムによって、顔画像に対応する第1認識結果を決定し、近傍探索アルゴリズムによって、顔画像に対応する第2認識結果を決定し、第1認識結果及び第2認識結果に基づいて、顔画像に対応する顔認識結果を決定するなどの処理を実行してもよい。メモリは、RAM、Flashなどであってもよく、受信されたデータ、処理過程に必要なデータ、処理過程中に生成されたデータなど、例えば、第1認識結果及び第2認識結果などを記憶することに利用可能である。
一部のシナリオでは、サーバは、認識対象の顔画像に対して顔認識処理を行ってもよい。例えば、顔認証打刻のシナリオにおいて、サーバは、画像撮影装置によって認識対象の人物顔画像を取得し、この認識対象の人物顔画像に対して顔認識処理を行ってもよい。また例えば、顔認識によって、取得された顔画像が、探索する人物であるか否かを決定するシナリオにおいて、複数の場所に画像撮影装置を配置してもよく、サーバは、各画像撮影装置から送信された顔画像を取得した後、これら顔画像のいずれに対しても、顔認識を行って、顔画像における人物が、探索する人物であるか否かを決定してもよい。
顔認識の関連技術では、サーバは、データベース内の各顔識別子に対応するサンプル顔画像を取得した後、各サンプル顔画像の特徴ベクトルを抽出し、各特徴ベクトル及びそれに対応する顔識別子に基づいて、マルチクラス分類器を訓練することができる。分類器の各クラスは、データベース内の各顔識別子である。この場合、新しい顔識別子をデータベースに追加する必要があるたびに、分類器を再訓練することにより、追加された顔識別子がクラスに含まれる分類器を取得する必要があり、分類器の拡張性が低く、コストが高い。
本願の構成では、サーバは、認識対象の顔画像を取得した後、平均探索アルゴリズム及び近傍探索アルゴリズムのそれぞれによって、顔画像に対応する第1認識結果及び第2認識結果を決定し、第1認識結果及び第2認識結果に基づいて、顔画像に対応する顔認識結果を取得し、即ち、顔画像に対応する顔識別子を取得することができる。このようにして、サーバは、平均探索アルゴリズムと近傍探索アルゴリズムとを融合することにより、顔画像に対応する顔識別子を決定することができる。本願の構成では、分類器を訓練する必要がなく、新しい顔識別子を追加するときに分類器を再訓練することを回避する。本願の構成によれば、顔認識の効率を向上させることもできる。また、本願の構成では、平均探索アルゴリズムによって決定された顔認識結果及び信頼度と、近傍探索アルゴリズムによって決定された顔認識結果及び信頼度とを融合することにより、顔認識の正確性を高めることができるとともに、正しい認識に高信頼度を付与することもで、これにより、顔認識の再現率を向上させることができる。さらに、本願の実施例で提供された方法は、適用範囲が広く、例えば、1人当たり1つのみの訓練サンプル顔画像(SIPP:single image per−person)に適用でき、融合シナリオ、及び顔認識が必要な他のシナリオにも適用できる。
図1(b)に示すように、いくつかの実施例の処理フローは、下記のステップを含んでもよい。
ステップ101で、認識対象の顔画像を取得し、顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出する。
ここで、顔画像は、顔を含む画像であってもよく、例えば、人物の顔を含む人物顔画像であってもよい。
実施において、一部のシナリオでは、サーバは、認識対象の顔画像に対して顔認識処理を行ってもよい。例えば、顔認証での打刻のシナリオにおいて、サーバは、画像撮影装置によって認識対象の人物顔画像を取得してもよく、さらに、この認識対象の人物顔画像に対して顔認識処理を行ってもよい。また例えば、顔認識によって、取得された顔画像が、探索する人物であるか否かを決定するシナリオにおいて、複数の場所に画像撮影装置を配置してもよく、サーバは、各画像撮影装置から送信された顔画像を取得した後、これら顔画像のいずれに対しても、顔認識を行って、顔画像における人物が、探索する人物であるか否かを決定してもよい。
サーバは、認識対象の顔画像を取得し、さらに、ディープネットワークによって、顔画像に対応する少なくとも1つの特徴ベクトル(目標特徴ベクトルと呼ばれてもよい)qを抽出してもよい。ここで、qは、顔画像自体に対応する特徴ベクトルであってもよいし、画像水増し後の複数の顔画像のそれぞれに対応する特徴ベクトルであってもよいし、画像水増し後の複数の顔画像のそれぞれに対応する特徴ベクトルの平均ベクトルであってもよい。サーバは、適用シナリオに応じて、認識対象の顔画像を取得してもよい。例えば、顔認証打刻のシナリオでは、サーバは、企業が配置した画像撮影装置により撮像された顔画像を取得してもよい。顔認識によって、取得された顔画像が、探索する人物であるか否かを決定するシナリオでは、サーバは、交通管理などの部門が配置した画像撮影装置により撮像された顔画像を取得してもよい。
ステップ102で、各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、顔画像に対応する第1認識結果として決定し、各第1距離集合の中で第1認識結果に対応する最小距離に基づいて、第1認識結果に対応する第1信頼度を決定する。
ここで、第1信頼度は、顔画像に対応する顔識別子が第1認識結果であることの可能性、信頼性を示すために使用できる。
実施において、サーバには、各顔識別子に対応するサンプル顔画像が予め記憶されてもよい。ここで、各顔識別子に対応するサンプル顔画像の数は、同じであってもよく、異なってもよい。各顔識別子に対応するサンプル顔画像は、直接取得された元の顔画像(元の顔画像は、撮像された顔画像であってもよい)を含んでもよく、元の顔画像を基に画像水増しによって取得されたサンプル顔画像を含んでもよい。各顔識別子ごとに、サーバは、ディープネットワークによって、該顔識別子に対応する各サンプル顔画像の特徴ベクトルを抽出することにより、該顔識別子に対応する少なくとも1つの特徴ベクトルを取得し、さらに、該顔識別子に対応する少なくとも1つの特徴ベクトルの平均ベクトルを計算してもよい。データベース内の顔識別子の数がk(kは正の整数)であり、各顔識別子それぞれがmk個のサンプル顔画像(mは正の整数)に対応するとすると、各顔識別子に対応する少なくとも1つの特徴ベクトル及び平均ベクトルは、次のとおりとしてもよい。
p11、p12、…p1m1、平均ベクトル:mp1
p21、p22、…p2m2、平均ベクトル:mp2
…、…、…
pk1、pk2、…pkmk、平均ベクトル:mpk
少なくとも1つの目標特徴ベクトルを決定した後、目標特徴ベクトルqが、顔画像自体に対応する特徴ベクトル、又は画像水増し後の複数の顔画像に対応する平均ベクトルである場合、サーバは、目標特徴ベクトルqと、上記の各顔識別子に対応する平均ベクトルmpi(i=1...k)との距離(該距離は、ユークリッド距離であってもよく、コサイン距離であってもよく、他のタイプのベクトル距離であってもよい)を計算することにより、第1距離集合を取得してもよい。第1距離集合を取得した後、サーバは、最小距離に対応する顔識別子を、認識対象の顔画像に対応する第1認識結果id1として決定してもよい。
いくつかの実施例では、サーバには、距離閾値が予め設定されてもよい。ここで、距離閾値は、コサイン距離の距離閾値であってもよいし、ユークリッド距離の距離閾値であってもよい。サーバは、第1距離集合を取得した後、最小距離を所定の距離閾値と比較してもよい。最小距離が所定の距離閾値未満である場合、最小距離に対応する顔識別子を、認識対象の顔画像に対応する第1認識結果id1として決定し、最小距離が所定の距離閾値未満でない場合、認識は失敗する。
いくつかの実施例では、画像水増しによって、認識対象の顔画像の複数の顔画像(複数の顔画像は、認識対象の顔画像と、画像水増し後の少なくとも1つの顔画像とを含む)が取得される場合、即ち、顔画像が複数の目標特徴ベクトルに対応する場合、各顔画像ごとに、サーバは、該顔画像の目標特徴ベクトルと、上記の各顔識別子に対応する平均ベクトルmpiとの距離を計算することにより、該顔画像に対応する第1距離集合を取得し、さらに、最小距離に対応する顔識別子を、該顔画像に対応する顔識別子として決定してもよい。各顔画像に対応する顔識別子を取得した後、サーバは、出現回数が最も多い顔識別子を、認識対象の顔画像に対応する第1認識結果として決定してもよい。つまり、顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出した後、サーバは、平均探索アルゴリズムによって、顔画像に対応する第1認識結果と、第1認識結果に対応する第1信頼度とを決定してもよい。ここで、平均探索アルゴリズムは、平均ベクトルと比較することにより認識結果を決定するアルゴリズムであってもよい。
認識対象の顔画像を取得した後、サーバは、顔画像に対応する第1認識結果に加えて、第1認識結果に対応する第1信頼度s1も決定してもよい。例えば、サーバは、各第1距離集合の中で第1認識結果に対応する距離を取得し、各距離のうちの最小距離を決定し、第1認識結果に対応する各距離のうちの最小距離に基づいて、第1信頼度を決定してもよい。例えば、第1認識結果に対応する各距離のうちの最小距離の逆数を第1信頼度として決定してもよい。
ステップ103で、各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得し、各第2距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第2距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、顔画像に対応する第2認識結果として決定し、各第2距離集合の中で第2認識結果に対応する最小距離に基づいて、第2認識結果に対応する第2信頼度を決定する。
ここで、第2信頼度は、顔画像に対応する顔識別子が第2認識結果であることの可能性、信頼性を示すために使用できる。
実施において、少なくとも1つの目標特徴ベクトルを決定した後、目標特徴ベクトルqが、顔画像自体に対応する特徴ベクトル、又は画像水増し後の複数の顔画像に対応する平均ベクトルである場合、サーバは、目標特徴ベクトルqと各サンプル顔画像の特徴ベクトルとの距離を計算することにより、第2距離集合を取得し、さらに、各第2距離集合のそれぞれから、距離が最小となる所定の数の距離を選択するか、所定の距離閾値未満の目標距離を選択してもよい。目標距離を選択した後、サーバは、各目標距離に対応する顔識別子を決定してもよく、さらに、それぞれ異なる顔識別子に対応する出現回数をカウントし、出現回数が最も多い目標顔識別子を、認識対象の顔画像に対応する第2認識結果として決定してもよい。
いくつかの実施例では、画像水増しによって、認識対象の顔画像の複数の顔画像が取得される場合、即ち、顔画像が複数の目標特徴ベクトルに対応する場合、各顔画像ごとに、サーバは、該顔画像の目標特徴ベクトルと、上記の各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、該顔画像に対応する第2距離集合を取得してもよい。さらに、各第2距離集合のそれぞれから、距離が最小となる所定の数の距離を選択するか、所定の距離閾値未満の目標距離を選択する。各第2距離集合に対応する目標距離を選択した後、サーバは、各目標距離に対応する顔識別子を決定し、それぞれ異なる顔識別子に対応する出現回数をカウントし、出現回数が最も多い目標顔識別子を決定してもよい。各目標特徴ベクトルに対応する目標顔識別子を取得した後、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、顔画像に対応する第2認識結果として決定してもよい。つまり、顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出した後、サーバは、近傍探索アルゴリズムによって、顔画像に対応する第2認識結果と、第2認識結果に対応する第2信頼度とを決定してもよい。ここで、近傍探索アルゴリズムは、各サンプル顔画像に対応する特徴ベクトルと比較することにより認識結果を決定するアルゴリズムであってもよく、局所性鋭敏型ハッシュ(LSH:Local Sensitive Hashing)アルゴリズムであってもよい。
認識対象の顔画像を取得した後、サーバは、顔画像に対応する第2認識結果に加えて、第2認識結果に対応する第2信頼度s2も決定してもよい。例えば、サーバは、各第2距離集合の中で第2認識結果に対応する各距離を取得してもよく、さらに、第2認識結果に対応する各距離のうちの最小距離を決定してもよく、第2認識結果に対応する各距離のうちの最小距離に基づいて、第2信頼度を決定してもよい。例えば、第2認識結果に対応する各距離のうちの最小距離の逆数を第2信頼度として決定してもよい。
ステップ104で、第1認識結果と、第1認識結果に対応する第1信頼度と、第2認識結果と、第2認識結果に対応する第2信頼度とに基づいて、顔画像に対応する顔認識結果と、顔認識結果に対応する信頼度とを決定する。
実施において、第1認識結果と、第1認識結果に対応する第1信頼度と、第2認識結果と、第2認識結果に対応する第2信頼度とを決定した後、サーバは、第1認識結果と、第1認識結果に対応する第1信頼度と、第2認識結果と、第2認識結果に対応する第2信頼度とに基づいて、認識対象の顔画像に対応する顔認識結果f_idと、顔認識結果に対応する信頼度f_scoreを決定してもよい。例えば、何らかの条件により、第1認識結果及び第2認識結果のうちの一方を、顔画像に対応する顔認識結果として決定してもよい。ここで、本願の構成の処理フレームワークは、図2(a)に示すとおりである。
いくつかの実施例では、本願の構成の全体的なフローは、図2(b)に示すとおりであってもよい。ここで、CNN_fesは、特徴ベクトルを抽出するためのディープネットワークであり、basesetは、対応するサンプル顔画像の数が多い顔識別子の集合であってもよく、novelsetは、対応するサンプル顔画像の数が少ない顔識別子の集合であってもよく、augmented−novelsetは、画像水増し後のnovelsetであってもよく、Modified SVD augmentation moduleは、改良SVD水増しモジュールであってもよく、NN module:LSH feature poolは、LSHに基づく近傍探索モジュールであってもよく、Mean search feature poolは、平均探索モジュールであってもよく、Hyper merge moduleは、ステップ104に対応する融合モジュールであってもよい。
各実施例では、顔認識結果を決定する方式によって、ステップ104の処理過程は様々であり得る。いくつかのケースでの実現方式を以下に示す。
ケース1:第1認識結果と第2認識結果とが同じである場合、第1認識結果又は第2認識結果を、顔画像に対応する顔認識結果として決定し、第1信頼度及び第2信頼度のうちの最大信頼度を、顔認識結果に対応する信頼度として決定する。
実施において、第1認識結果及び第2認識結果を決定した後、サーバは、第1認識結果と第2認識結果とが同じであるか否かを決定してもよい。第1認識結果と第2認識結果とが同じである場合、サーバは、第1認識結果又は第2認識結果を、顔画像に対応する顔認識結果として決定してもよい。これに応じて、サーバは、第1信頼度及び第2信頼度のうちの最大信頼度を決定し、さらに、それを顔認識結果に対応する信頼度として決定してもよい。
ここで、第1認識結果と第2認識結果とが同じである場合は、今回正しく認識される確率が高く、即ち、顔画像に実際に対応する顔識別子が第1認識結果又は第2認識結果である可能性が高く、第1認識結果又は第2認識結果を、顔画像に対応する顔認識結果として決定することの信頼性が高いことを示している。したがって、このような処理により、顔認識の正確率を向上させることができるとともに、認識結果の信頼度を高めることができ、即ち、正しい認識に高信頼度を付与することができ、これにより、顔認識の再現率を向上させることができる。
ケース2:第1認識結果と第2認識結果とが異なり、かつ第2信頼度と第1信頼度との差が第1所定閾値より大きい場合、第2認識結果を、顔画像に対応する顔認識結果として決定し、第2信頼度を、顔認識結果に対応する信頼度として決定する。
実施において、第1認識結果と第2認識結果とが異なる場合、サーバは、上記の方式で決定された第1認識結果に対応する第1信頼度と第2認識結果に対応する第2信頼度とを取得してもよい。第1信頼度と第2信頼度との大小関係に基づいて、第1認識結果及び第2認識結果のうちの一方を、顔画像に対応する顔認識結果として決定してもよい。
例えば、第1認識結果と第2認識結果とが異なる場合、サーバは、さらに、第1信頼度と第2信頼度との大きさを比較してもよい。第2信頼度と第1信頼度との差が第1所定閾値より大きい場合、サーバは、第2認識結果を、顔画像に対応する顔認識結果として決定してもよい。これに応じて、サーバは、第2信頼度を、顔認識結果に対応する信頼度として決定してもよい。
ここで、第2信頼度が第1信頼度より第1所定閾値だけ大きい場合は、近傍探索アルゴリズムによって決定された第2認識結果が、平均探索アルゴリズムによって決定された第1認識結果よりも信頼できることを示している。したがって、このような処理により、顔認識の正確率を向上させることができるとともに、認識結果の信頼度を高めることができ、即ち、正しい認識に高信頼度を付与することができ、これにより、顔認識の再現率を向上させることができる。
ケース3:第1認識結果と第2認識結果とが異なり、かつ第1信頼度と第2信頼度との差が第2所定閾値より大きい場合、第1認識結果を、顔画像に対応する顔認識結果として決定し、第1信頼度を、顔認識結果に対応する信頼度として決定する。
実施において、サーバには、第2所定閾値が予め記憶されてもよい。ここで、第1所定閾値及び第2所定閾値は、同じであってもよく、異なってもよい。第1認識結果と第2認識結果とが異なり、かつ第1信頼度と第2信頼度との差が第2所定閾値より大きい場合、サーバは、第1認識結果を、顔画像に対応する顔認識結果及び信頼度として決定してもよい。これに応じて、第1信頼度を、顔認識結果に対応する信頼度として決定してもよい
ここで、第2信頼度が第1信頼度より第2所定閾値だけ低い場合は、平均探索アルゴリズムによって決定された第1認識結果が、近傍探索アルゴリズムによって決定された第2認識結果よりも信頼できることを示している。したがって、このような処理により、顔認識の正確率を向上させることができるとともに、認識結果の信頼度を高めることができ、即ち、正しい認識に高信頼度を付与することができ、これにより、顔認識の再現率を向上させることができる。
ケース4:第1認識結果と第2認識結果とが異なり、かつ第2信頼度と第1信頼度との差が第1所定閾値未満であり、かつ、第1信頼度と第2信頼度との差が第2所定閾値未満である場合、第1認識結果を顔画像に対応する顔認識結果として決定し、第1信頼度と第2信頼度のうちの最小の信頼度を顔認識結果に対応する信頼度として決定する。
実施において、第1認識結果と第2認識結果とが異なり、かつ第2信頼度と第1信頼度との差が第1所定閾値未満であり、かつ、第1信頼度と第2信頼度との差が第2所定閾値未満である場合、サーバは、第1認識結果を、顔画像に対応する顔認識結果として決定してもよい。これに応じて、サーバは、第1信頼度及び第2信頼度のうちの最小信頼度を、顔画像に対応する信頼度として決定してもよい。
ここで、平均探索アルゴリズムによって決定された認識結果の正確性は、近傍探索アルゴリズムによって決定された認識結果の正確性より高いことがよくある。第1認識結果と第2認識結果とが異なる場合は、今回正しく認識される確率が比較的低いことを示している。したがって、このような処理は、今回の顔認識の状況を正しく反映できる。
ケース5:第1認識結果と、第1認識結果に対応する第1信頼度と、第2認識結果と、第2認識結果に対応する信頼度とを、事前訓練された顔認識モデルに入力することにより、顔画像に対応する顔認識結果と、顔認識結果に対応する信頼度とを取得する。
実施において、サーバには、サンプル顔画像に基づいて訓練された顔認識モデルが予め記憶されてもよい。ここで、顔認識モデルへの入力は、平均探索アルゴリズムによって決定された顔認識結果及びそれに対応する信頼度と、近傍探索アルゴリズムによって決定された顔認識結果及びそれに対応する信頼度とであってもよい。ここで、顔認識モデルは、意思決定モデル、ニューラルネットワークモデルなどであってもよい。サーバは、第1認識結果と、第1認識結果に対応する第1信頼度と、第2認識結果と、第2認識結果に対応する第2信頼度とを決定した後、第1認識結果と、第1信頼度と、第2認識結果と、第2信頼度とを、事前訓練された顔認識モデルに入力することにより、顔認識モデルからの出力を取得してもよい。これにより、顔画像に対応する顔認識結果、及びそれに対応する信頼度を取得することができる。
ここで、サーバは、上記の複数のケース1〜の任意のケースを組み合わせた処理をサポートできる。
各実施例では、顔認識モデルの訓練過程は、以下のようにしてもよい。各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、第1距離集合を取得する。第1距離集合の中の最小距離に対応する顔識別子を、各訓練顔画像に対応する第1認識結果として決定する。第1距離集合の中の、前記第1認識結果に対応する最小距離に基づいて、第1認識結果に対応する第1信頼度を決定する。各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、第2距離集合を取得する。第2距離集合の中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定する。各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を、各訓練顔画像に対応する第2認識結果として決定する。第2距離集合の中の、第2認識結果に対応する最小距離に基づいて、第2認識結果に対応する第2信頼度を決定する。各訓練顔画像に対応する第1認識結果と、第1信頼度と、第2認識結果と、第2信頼度とを顔認識モデルに入力することにより、各訓練顔画像に対応する認識結果及び信頼度を取得する。取得された、各訓練顔画像に対応する顔認識結果及び信頼度と、予め設定された、各訓練顔画像に対応する顔認識結果及び信頼度とに基づいて、顔認識モデルのモデルパラメータを調整することにより、訓練された顔認識モデルを取得する。
実施において、サーバには、大量の顔識別子に対応する訓練顔画像が予め記憶されてもよい。ここで、直接取得されたある顔識別子に対応する元の顔画像の数が少ない場合、サーバは、直接取得された元の顔画像に対して画像水増し処理を行うことにより、複数のサンプル顔画像を取得してもよい(この場合、該顔識別子に対応する訓練顔画像は、元の顔画像と、画像水増しによって取得された訓練顔画像とを含む)。各訓練顔画像ごとに、サーバは、ディープネットワークによって該訓練顔画像の特徴ベクトルを抽出してもよく、さらに、各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、第1距離集合を取得してもよい。第1距離集合の中の最小距離に対応する顔識別子を、各訓練顔画像に対応する第1認識結果として決定する。これに応じて、サーバは、第1距離集合の中の、第1認識結果に対応する最小距離を取得してもよい。さらに、最小距離に基づいて、第1認識結果に対応する第1信頼度を決定してもよい。
第1認識結果及び第1信頼度に加えて、サーバは、第2認識結果及びそれに対応する第2信頼度も決定してもよい。例えば、各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、第2距離集合を取得してもよい。第2距離集合の中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定する。さらに、各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を、各訓練顔画像に対応する第2認識結果として決定してもよい。これに応じて、サーバは、第2距離集合の中の、第2認識結果に対応する最小距離を取得してもよい。さらに、最小距離に基づいて、第2認識結果に対応する第2信頼度を決定してもよい。
各訓練顔画像に対応する第1認識結果と、第1信頼度と、第2認識結果と、第2信頼度とを決定した後、サーバは、訓練顔画像に対応する第1認識結果と、第1信頼度と、第2認識結果と、第2信頼度とを顔認識モデルに入力することにより、各訓練顔画像に対応する顔認識結果及び信頼度を取得してもよい。ここで、顔認識モデルにより取得された顔認識結果及び信頼度には、顔認識モデルのモデルパラメータが含まれる。
各訓練顔画像に対応する顔認識結果及び信頼度を取得した後、取得された顔認識結果を、予め設定された、訓練顔画像に対応する顔認識結果に近くし、取得された信頼度を、予め設定された、訓練顔画像に対応する信頼度に近くする訓練原則(例えば、両者間の差を目的関数として決定し、さらに、目的関数の最小値を計算する方法によって、顔認識モデルを訓練する)に基づいて、顔認識モデルを訓練し、即ち、顔認識モデルのモデルパラメータを調整することにより(ここで、勾配降下法によって顔認識モデルを訓練してもよい)、訓練された顔認識モデルを取得してもよい。ここで、予め設定された、訓練顔画像に対応する顔認識結果は、訓練顔画像に実際に対応する顔認識結果であってもよい。各訓練顔画像ごとに、該訓練顔画像に対応する第1認識結果及び/又は第2認識結果が、該訓練顔画像に実際に対応する顔識別子と同じである場合、該訓練顔画像に対応する信頼度を高く設定してもよく、該訓練顔画像に対応する第1認識結果及び/又は第2認識結果が、該訓練顔画像に実際に対応する顔識別子と異なる場合、該訓練顔画像に対応する信頼度を低く設定してもよい。
本願の構成では、平均探索アルゴリズムによって決定された顔認識結果と、近傍探索アルゴリズムによって決定された顔認識結果とを融合することにより、顔認識の正確率を向上させることができ、上記の2つのアルゴリズムによって決定された信頼度を融合することにより、正しい認識に高信頼度を付与することができ、これにより、顔認識の再現率を向上させることができる。
いくつかの実施例では、本願の構成は、多数のシナリオに適用でき、使用範囲が広く、SIPPシナリオに適用できるし、融合シナリオにも適用できる(融合シナリオとは、データベースにおいて、一部の顔識別子が1つのサンプル顔画像に対応し、一部の顔識別子が複数のサンプル顔画像に対応するシナリオである)。
いくつかの実施例では、顔認識モデルによって、顔画像に対応する顔認識結果を決定する場合について、本願の実施例は、図3に示されるフローをさらに提供している。
ステップ301で、認識対象の顔画像を取得し、顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出する。
ステップ302で、各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、顔画像に対応する第1認識結果として決定し、各第1距離集合の中で第1認識結果に対応する最小距離に基づいて、第1認識結果に対応する第1信頼度を決定する。
ステップ303で、各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得し、各第2距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第2距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、顔画像に対応する第2認識結果として決定し、各第2距離集合の中で第2認識結果に対応する最小距離に基づいて、第2認識結果に対応する第2信頼度を決定する。
ステップ304で、第1認識結果と、第1認識結果に対応する第1信頼度と、第2認識結果と、第2認識結果に対応する信頼度とを、事前訓練された顔認識モデルに入力することにより、顔画像に対応する顔認識結果と、顔認識結果に対応する信頼度とを取得する。
実施において、サーバには、サンプル顔画像に基づいて訓練された顔認識モデルが予め記憶されてもよい。実施において、サーバには、サンプル顔画像に基づいて訓練された顔認識モデルが予め記憶されてもよい。ここで、顔認識モデルへの入力は、平均探索アルゴリズムによって決定された顔認識結果及びそれに対応する信頼度と、近傍探索アルゴリズムによって決定された顔認識結果及びそれに対応する信頼度とであってもよい。ここで、顔認識モデルは、意思決定モデル、ニューラルネットワークモデルなどであってもよい。サーバは、第1認識結果と、第1認識結果に対応する第1信頼度と、第2認識結果と、第2認識結果に対応する第2信頼度とを決定した後、第1認識結果と、第1信頼度と、第2認識結果と、第2信頼度とを、事前訓練された顔認識モデルに入力することにより、顔認識モデルからの出力を取得してもよい。これにより、顔画像に対応する顔認識結果、及びそれに対応する信頼度を取得することができる。
本願の実施例では、サーバは、認識対象の顔画像を取得した後、顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出することができ、さらに、各目標特徴ベクトルと、各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合に基づいて、顔画像に対応する第1認識結果及びそれに対応する第1信頼度を決定することができる。少なくとも1つの目標特徴ベクトルを決定した後、各目標特徴ベクトルと、各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得することもでき、さらに、各第2距離集合に基づいて、顔画像に対応する第2認識結果及びそれに対応する第2信頼度を決定することができる。第1認識結果及びそれに対応する第1信頼度と、第2認識結果及びそれに対応する第2信頼度とを決定した後、顔画像に対応する顔認識結果及びそれに対応する信頼度を決定することができる。このように、第1認識結果と第2認識結果とを融合することにより、顔画像に対応する顔認識結果を決定することができ、分類器を事前訓練する必要がなくなり、さらに、新しい顔識別子を追加するときに分類器を再訓練することを回避することができ、これにより、顔認識の効率を向上させることができる。
同じ技術的構想に基づき、本願の実施例は、図4に示すような顔認識装置をさらに提供している。該装置は、上記サーバであってもよい。該装置は、
認識対象の顔画像を取得し、前記顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出する取得モジュール410と、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第1認識結果として決定し、各第1距離集合の中で前記第1認識結果に対応する最小距離に基づいて、前記第1認識結果に対応する第1信頼度を決定する第1計算モジュール420と、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得し、各第2距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第2距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第2認識結果として決定し、各第2距離集合の中で前記第2認識結果に対応する最小距離に基づいて、前記第2認識結果に対応する第2信頼度を決定する第2計算モジュール430と、
前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定する決定モジュール440と、を備える。
各実施例では、前記決定モジュール440は、
前記第1認識結果と前記第2認識結果とが同じである場合、前記第1認識結果又は前記第2認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第1信頼度及び前記第2信頼度のうちの最大信頼度を、前記顔認識結果に対応する信頼度として決定する。
各実施例では、前記決定モジュール440は、
前記第1認識結果と前記第2認識結果とが異なり、かつ前記第2信頼度と前記第1信頼度との差が第1所定閾値より大きい場合、前記第2認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第2信頼度を、前記顔認識結果に対応する信頼度として決定する。
各実施例では、前記決定モジュール440は、
前記第1認識結果と前記第2認識結果とが異なり、かつ前記第1信頼度と前記第2信頼度との差が第2所定閾値より大きい場合、前記第1認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第1信頼度を、前記顔認識結果に対応する信頼度として決定する。
各実施例では、前記決定モジュール440は、
前記第1認識結果と前記第2認識結果とが異なり、かつ前記第2信頼度と前記第1信頼度との差が第1所定閾値未満であり、かつ、前記第1信頼度と前記第2信頼度との差が第2所定閾値未満である場合、前記第1認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第1信頼度及び前記第2信頼度のうちの最小信頼度を、前記顔認識結果に対応する信頼度として決定する。
各実施例では、前記決定モジュール440は、
前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とを、事前訓練された顔認識モデルに入力することにより、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを取得する。
各実施例では、図5に示すように、前記装置は、
各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、第1距離集合を取得し、第1距離集合の中の最小距離に対応する顔識別子を、各訓練顔画像に対応する第1認識結果として決定し、第1距離集合の中の、前記第1認識結果に対応する最小距離に基づいて、第1認識結果に対応する第1信頼度を決定する第3計算モジュール450と、
各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、第2距離集合を取得し、第2距離集合の中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を、各訓練顔画像に対応する第2認識結果として決定し、第2距離集合の中の、第2認識結果に対応する最小距離に基づいて、第2認識結果に対応する第2信頼度を決定する第4計算モジュール460と、
各訓練顔画像に対応する第1認識結果と、第1信頼度と、第2認識結果と、第2信頼度とを、顔認識モデルに入力することにより、各訓練顔画像に対応する顔認識結果及び信頼度を取得する入力モジュール470と、
取得された、各訓練顔画像に対応する顔認識結果及び信頼度と、予め設定された、各訓練顔画像に対応する顔認識結果及び信頼度とに基づいて、前記顔認識モデルのモデルパラメータを調整することにより、訓練された顔認識モデルを取得する訓練モジュール480と、をさらに備える。
本願の実施例では、サーバは、認識対象の顔画像を取得した後、顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出することができ、さらに、各目標特徴ベクトルと、各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合に基づいて、顔画像に対応する第1認識結果及びそれに対応する第1信頼度を決定することができる。少なくとも1つの目標特徴ベクトルを決定した後、各目標特徴ベクトルと、各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得することもでき、さらに、各第2距離集合に基づいて、顔画像に対応する第2認識結果及びそれに対応する第2信頼度を決定することができる。第1認識結果及びそれに対応する第1信頼度と、第2認識結果及びそれに対応する第2信頼度とを決定した後、顔画像に対応する顔認識結果及びそれに対応する信頼度を決定することができる。このように、第1認識結果と第2認識結果とを融合することにより、顔画像に対応する顔認識結果を決定することができ、分類器を事前訓練する必要がなくなり、さらに、新しい顔識別子を追加するときに分類器を再訓練することを回避することができ、これにより、顔認識の効率を向上させることができる。
説明すべきものとして、上記実施例で提供された顔認識装置について、上記の各機能モジュールの分割のみを例にして顔認識を説明しているが、実際の適用では、必要に応じて、上記の機能を、異なる機能モジュールによって完了するように割り当て、即ち、上記の機能の全部又は一部を完了するために、サーバの内部構成を異なる機能モジュールに分割してもよい。いくつかの実施例では、上記実施例で提供された顔認識装置は、顔認識方法の実施例とは同じ構想に属し、その具体的な実現過程の詳細については、方法の実施例を参照すればよく、ここでは説明を省略する。
図6は、本願の実施例で提供されたコンピューティングデバイスの構成の模式図である。このコンピューティングデバイス600は、配置や性能の相違により大きく異なる場合があり、1つ又は複数のプロセッサ(CPU:central processing units)601と、1つ又は複数のメモリ602とを備えてもよい。ここで、前記メモリ602には、少なくとも1つの命令が記憶されており、前記少なくとも1つの命令は、前記プロセッサ601によりロードされて実行されることで、前記顔認識方法を実現する。
例示的な実施例では、非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供している。前記記憶媒体には、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶されており、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、前記顔認識方法を実現する。
本願の実施例では、サーバは、認識対象の顔画像を取得した後、顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出することができ、さらに、各目標特徴ベクトルと、各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合に基づいて、顔画像に対応する第1認識結果及びそれに対応する第1信頼度を決定することができる。少なくとも1つの目標特徴ベクトルを決定した後、各目標特徴ベクトルと、各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得することもでき、さらに、各第2距離集合に基づいて、顔画像に対応する第2認識結果及びそれに対応する第2信頼度を決定することができる。第1認識結果及びそれに対応する第1信頼度と、第2認識結果及びそれに対応する第2信頼度とを決定した後、顔画像に対応する顔認識結果及びそれに対応する信頼度を決定することができる。このように、第1認識結果と第2認識結果とを融合することにより、顔画像に対応する顔認識結果を決定することができ、分類器を事前訓練する必要がなくなり、さらに、新しい顔識別子を追加するときに分類器を再訓練することを回避することができ、これにより、顔認識の効率を向上させることができる。
当業者であれば理解できるように、上記実施例を実現するためのステップの全部又は一部は、ハードウェアによって実行されてもよいし、プログラムによって関連ハードウェアに指示することにより実行されてもよい。前記プログラムは、コンピュータ読み取り可能な記憶媒体に記憶されてもよい。上記で言及された記憶媒体は、読み出し専用メモリ、磁気ディスク、又は光ディスクなどであってもよい。
上記のように、特許請求の範囲は、上記の例で説明された実施形態に限定されるべきではなく、明細書を全体として最も広く解釈すべきである。
410 取得モジュール
420 第1計算モジュール
430 第2計算モジュール
440 決定モジュール
450 第3計算モジュール
460 第4計算モジュール
470 入力モジュール
480 訓練モジュール
600 コンピューティングデバイス
601 プロセッサ
602 メモリ

Claims (16)

  1. 少なくとも1つのコンピューティングデバイスにより実行される顔認識方法であって、
    認識対象の顔画像を取得し、前記顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出するステップと、
    各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第1認識結果として決定し、各第1距離集合の中で前記第1認識結果に対応する最小距離に基づいて、前記第1認識結果に対応する第1信頼度を決定するステップと、
    各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得し、各第2距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第2距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第2認識結果として決定し、各第2距離集合の中で前記第2認識結果に対応する最小距離に基づいて、前記第2認識結果に対応する第2信頼度を決定するステップと、
    前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップと、
    を含む顔認識方法。
  2. 前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
    前記第1認識結果と前記第2認識結果とが同じである場合、前記第1認識結果又は前記第2認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第1信頼度及び前記第2信頼度のうちの最大信頼度を、前記顔認識結果に対応する信頼度として決定するステップを含む、
    請求項1に記載の方法。
  3. 前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
    前記第1認識結果と前記第2認識結果とが異なり、かつ前記第2信頼度と前記第1信頼度との差が第1所定閾値より大きい場合、前記第2認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第2信頼度を、前記顔認識結果に対応する信頼度として決定するステップを含む、
    請求項1に記載の方法。
  4. 前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
    前記第1認識結果と前記第2認識結果とが異なり、かつ前記第1信頼度と前記第2信頼度との差が第2所定閾値より大きい場合、前記第1認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第1信頼度を、前記顔認識結果に対応する信頼度として決定するステップを含む、
    請求項1に記載の方法。
  5. 前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
    前記第1認識結果と前記第2認識結果とが異なり、かつ前記第2信頼度と前記第1信頼度との差が第1所定閾値未満であり、かつ、前記第1信頼度と前記第2信頼度との差が第2所定閾値未満である場合、前記第1認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第1信頼度及び前記第2信頼度のうちの最小信頼度を、前記顔認識結果に対応する信頼度として決定するステップを含む、
    請求項1に記載の方法。
  6. 前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
    前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とを、事前訓練された顔認識モデルに入力することにより、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを取得するステップを含む、
    請求項1に記載の方法。
  7. 各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、第1距離集合を取得し、第1距離集合の中の最小距離に対応する顔識別子を、各訓練顔画像に対応する第1認識結果として決定し、第1距離集合の中の、第1認識結果に対応する最小距離に基づいて、第1認識結果に対応する第1信頼度を決定するステップと、
    各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、第2距離集合を取得し、第2距離集合の中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を、各訓練顔画像に対応する第2認識結果として決定し、第2距離集合の中の、第2認識結果に対応する最小距離に基づいて、第2認識結果に対応する第2信頼度を決定するステップと、
    各訓練顔画像に対応する第1認識結果、第1信頼度、第2認識結果、及び第2信頼度を、顔認識モデルに入力することにより、各訓練顔画像に対応する顔認識結果及び信頼度を取得するステップと、
    取得された、各訓練顔画像に対応する顔認識結果及び信頼度と、予め設定された、各訓練顔画像に対応する顔認識結果及び信頼度とに基づいて、前記顔認識モデルのモデルパラメータを調整することにより、訓練された顔認識モデルを取得するステップと、
    をさらに含む請求項6に記載の方法。
  8. 顔認識装置であって、
    認識対象の顔画像を取得し、前記顔画像に対応する少なくとも1つの目標特徴ベクトルを抽出する取得モジュールと、
    各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第1距離集合を取得し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第1距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第1認識結果として決定し、各第1距離集合の中で前記第1認識結果に対応する最小距離に基づいて、前記第1認識結果に対応する第1信頼度を決定する第1計算モジュールと、
    各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第2距離集合を取得し、各第2距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第2距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第2認識結果として決定し、各第2距離集合の中で前記第2認識結果に対応する最小距離に基づいて、前記第2認識結果に対応する第2信頼度を決定する第2計算モジュールと、
    前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定する決定モジュールと、
    を備える顔認識装置。
  9. 前記決定モジュールは、
    前記第1認識結果と前記第2認識結果とが同じである場合、前記第1認識結果又は前記第2認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第1信頼度及び前記第2信頼度のうちの最大信頼度を、前記顔認識結果に対応する信頼度として決定する、
    請求項8に記載の装置。
  10. 前記決定モジュールは、
    前記第1認識結果と前記第2認識結果とが異なり、かつ前記第2信頼度と前記第1信頼度との差が第1所定閾値より大きい場合、前記第2認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第2信頼度を、前記顔認識結果に対応する信頼度として決定する、
    請求項8に記載の装置。
  11. 前記決定モジュールは、
    前記第1認識結果と前記第2認識結果とが異なり、かつ前記第1信頼度と前記第2信頼度との差が第2所定閾値より大きい場合、前記第1認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第1信頼度を、前記顔認識結果に対応する信頼度として決定する、
    請求項8に記載の装置。
  12. 前記決定モジュールは、
    前記第1認識結果と前記第2認識結果とが異なり、かつ前記第2信頼度と前記第1信頼度との差が第1所定閾値未満であり、かつ、前記第1信頼度と前記第2信頼度との差が第2所定閾値未満である場合、前記第1認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第1信頼度及び前記第2信頼度のうちの最小信頼度を、前記顔認識結果に対応する信頼度として決定する、
    請求項8に記載の装置。
  13. 前記決定モジュールは、
    前記第1認識結果と、前記第1認識結果に対応する第1信頼度と、前記第2認識結果と、前記第2認識結果に対応する第2信頼度とを、事前訓練された顔認識モデルに入力することにより、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを取得する、
    請求項8に記載の装置。
  14. プロセッサとメモリとを備えるサーバであって、前記メモリには、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットが記憶され、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、前記プロセッサによりロードされて実行されることで、請求項1〜7のいずれか1項に記載の顔認識方法を実現させるサーバ。
  15. 少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶したコンピュータ読み取り可能な記憶媒体であって、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、請求項1〜7のいずれか1項に記載の顔認識方法を実現させるコンピュータ読み取り可能な記憶媒体。
  16. 請求項1〜7のいずれか1項に記載の顔認識方法をコンピューティングデバイスに実行させるコンピュータプログラム。
JP2020542097A 2018-03-22 2019-02-28 顔認識方法、顔認識装置及び顔認識方法を実行するコンピュータプログラム Active JP6973876B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810239389.3A CN108491794B (zh) 2018-03-22 2018-03-22 面部识别的方法和装置
CN201810239389.3 2018-03-22
PCT/CN2019/076398 WO2019179295A1 (zh) 2018-03-22 2019-02-28 面部识别的方法和装置

Publications (2)

Publication Number Publication Date
JP2021513700A JP2021513700A (ja) 2021-05-27
JP6973876B2 true JP6973876B2 (ja) 2021-12-01

Family

ID=63319001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020542097A Active JP6973876B2 (ja) 2018-03-22 2019-02-28 顔認識方法、顔認識装置及び顔認識方法を実行するコンピュータプログラム

Country Status (5)

Country Link
US (1) US11138412B2 (ja)
EP (1) EP3757873B1 (ja)
JP (1) JP6973876B2 (ja)
CN (1) CN108491794B (ja)
WO (1) WO2019179295A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491794B (zh) * 2018-03-22 2023-04-07 腾讯科技(深圳)有限公司 面部识别的方法和装置
CN109766882B (zh) * 2018-12-18 2020-11-20 北京诺亦腾科技有限公司 人体光点的标签识别方法、装置
WO2020124390A1 (zh) * 2018-12-18 2020-06-25 华为技术有限公司 一种面部属性的识别方法及电子设备
CN109815839B (zh) * 2018-12-29 2021-10-08 深圳云天励飞技术有限公司 微服务架构下的徘徊人员识别方法及相关产品
US11074733B2 (en) * 2019-03-15 2021-07-27 Neocortext, Inc. Face-swapping apparatus and method
CN110210307B (zh) * 2019-04-30 2023-11-28 中国银联股份有限公司 人脸样本库部署方法、基于人脸识别业务处理方法及装置
CN110163175A (zh) * 2019-05-28 2019-08-23 杭州电子科技大学 一种基于改进vgg-16网络的步态识别方法及系统
CN110505498B (zh) * 2019-09-03 2021-04-02 腾讯科技(深圳)有限公司 视频的处理、播放方法、装置及计算机可读介质
CN111242230A (zh) * 2020-01-17 2020-06-05 腾讯科技(深圳)有限公司 基于人工智能的图像处理方法及图像分类模型训练方法
CN111507232B (zh) * 2020-04-10 2023-07-21 盛景智能科技(嘉兴)有限公司 多模态多策略融合的陌生人识别方法和系统
CN111626193A (zh) * 2020-05-26 2020-09-04 北京嘀嘀无限科技发展有限公司 一种面部识别方法、面部识别装置及可读存储介质
JP7589032B2 (ja) * 2020-12-02 2024-11-25 日本放送協会 学習データ生成装置、人物識別装置、学習データ生成方法及び学習データ生成プログラム
CN114758397B (zh) * 2022-04-26 2025-10-24 京东科技信息技术有限公司 模型训练方法和装置、人脸识别方法和设备、存储介质
US12164613B2 (en) * 2022-05-10 2024-12-10 Bank Of America Corporation Creating feature based image recognition subclasses for identity verification

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178773B (zh) * 2007-12-13 2010-08-11 北京中星微电子有限公司 基于特征提取和分类器的图像识别系统及方法
CN101226590B (zh) * 2008-01-31 2010-06-02 湖南创合世纪智能技术有限公司 一种人脸识别方法
CN101561874B (zh) * 2008-07-17 2011-10-26 清华大学 一种人脸虚拟图像生成的方法
CN101719222B (zh) * 2009-11-27 2014-02-12 北京中星微电子有限公司 分类器训练方法和装置以及人脸认证方法和装置
US11074495B2 (en) * 2013-02-28 2021-07-27 Z Advanced Computing, Inc. (Zac) System and method for extremely efficient image and pattern recognition and artificial intelligence platform
KR20140055819A (ko) * 2012-11-01 2014-05-09 삼성전자주식회사 얼굴인식장치 및 그 제어방법
KR101475155B1 (ko) * 2013-10-14 2014-12-19 삼성물산 주식회사 전기 비저항을 이용한 터널 막장 전방 지반조건 예측방법
WO2015121797A1 (en) * 2014-02-12 2015-08-20 Kaddymatic Inc Control system of a self-moving cart, in particular a golf caddie
CN104484650B (zh) * 2014-12-09 2017-09-12 北京信息科技大学 素描人脸识别的方法和装置
CN105844283B (zh) * 2015-01-16 2019-06-07 阿里巴巴集团控股有限公司 用于识别图像类目归属的方法、图像搜索方法及装置
CN104808921A (zh) * 2015-05-08 2015-07-29 三星电子(中国)研发中心 进行信息提醒的方法及装置
US10769255B2 (en) * 2015-11-11 2020-09-08 Samsung Electronics Co., Ltd. Methods and apparatuses for adaptively updating enrollment database for user authentication
CN105956518A (zh) * 2016-04-21 2016-09-21 腾讯科技(深圳)有限公司 一种人脸识别方法、装置和系统
CN107423306B (zh) * 2016-05-24 2021-01-29 华为技术有限公司 一种图像检索方法及装置
CN106022317A (zh) * 2016-06-27 2016-10-12 北京小米移动软件有限公司 人脸识别方法及装置
CN106250858B (zh) * 2016-08-05 2021-08-13 重庆中科云从科技有限公司 一种融合多种人脸识别算法的识别方法及系统
CN107220614B (zh) * 2017-05-24 2021-08-10 北京小米移动软件有限公司 图像识别方法、装置及计算机可读存储介质
CN107315795B (zh) * 2017-06-15 2019-08-02 武汉大学 联合特定人物和场景的视频实例检索方法及系统
CN107403168B (zh) * 2017-08-07 2020-08-11 青岛有锁智能科技有限公司 一种面部识别系统
CN107545277B (zh) * 2017-08-11 2023-07-11 腾讯科技(上海)有限公司 模型训练、身份验证方法、装置、存储介质和计算机设备
CN107818313B (zh) * 2017-11-20 2019-05-14 腾讯科技(深圳)有限公司 活体识别方法、装置和存储介质
CN108491794B (zh) * 2018-03-22 2023-04-07 腾讯科技(深圳)有限公司 面部识别的方法和装置

Also Published As

Publication number Publication date
EP3757873B1 (en) 2024-08-07
WO2019179295A1 (zh) 2019-09-26
EP3757873A4 (en) 2021-03-31
CN108491794A (zh) 2018-09-04
JP2021513700A (ja) 2021-05-27
US20200293761A1 (en) 2020-09-17
CN108491794B (zh) 2023-04-07
EP3757873A1 (en) 2020-12-30
US11138412B2 (en) 2021-10-05

Similar Documents

Publication Publication Date Title
JP6973876B2 (ja) 顔認識方法、顔認識装置及び顔認識方法を実行するコンピュータプログラム
KR102084900B1 (ko) 사용자 신원 검증 방법, 장치 및 시스템
US12062105B2 (en) Utilizing multiple stacked machine learning models to detect deepfake content
KR101647691B1 (ko) 하이브리드 기반의 영상 클러스터링 방법 및 이를 운용하는 서버
US11335127B2 (en) Media processing method, related apparatus, and storage medium
EP3890333A1 (en) Video cutting method and apparatus, computer device and storage medium
US20190303943A1 (en) User classification using a deep forest network
JP6921694B2 (ja) 監視システム
KR20160083900A (ko) 얼굴 표현을 위한 시스템 및 방법
KR102261054B1 (ko) 카메라에 연결되는 고속 얼굴 인식 장치
KR20160011916A (ko) 얼굴 인식을 통한 사용자 식별 방법 및 장치
US20190347472A1 (en) Method and system for image identification
KR20220076398A (ko) Ar장치를 위한 객체 인식 처리 장치 및 방법
WO2019080908A1 (zh) 实现图像识别的图像处理方法及装置、电子设备
CN113642519A (zh) 一种人脸识别系统和人脸识别方法
US12223709B2 (en) Methods for more effectively moderating one or more images and devices thereof
CN108664526A (zh) 检索的方法和设备
CN107679457A (zh) 用户身份校验方法及装置
WO2024183465A9 (zh) 一种模型确定方法和相关装置
CN108875502A (zh) 人脸识别方法和装置
Hassan et al. The case of face recognition on mobile devices
KR20210037672A (ko) 신원 인식 방법, 컴퓨터 판독 가능 저장 매체, 단말 디바이스 및 장치
KR20210058157A (ko) 얼굴 이미지 기반 사용자 식별 장치 및 방법
US20230067285A1 (en) Linkage data generator
CN113792795A (zh) 基于网关设备的变电站设备识别方法、装置和网关设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200803

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200803

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211028

R150 Certificate of patent or registration of utility model

Ref document number: 6973876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250