JP6973876B2

JP6973876B2 - 顔認識方法、顔認識装置及び顔認識方法を実行するコンピュータプログラム

Info

Publication number: JP6973876B2
Application number: JP2020542097A
Authority: JP
Inventors: ▲習▼▲華▼ 李
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-03-22
Filing date: 2019-02-28
Publication date: 2021-12-01
Anticipated expiration: 2039-02-28
Also published as: EP3757873B1; WO2019179295A1; EP3757873A4; CN108491794A; JP2021513700A; US20200293761A1; CN108491794B; EP3757873A1; US11138412B2

Description

本願は、２０１８年０３月２２日に中国特許庁に提出された、出願番号が２０１８１０２３９３８９．３であり、発明の名称が「顔認識方法及び装置」である中国特許出願に基づく優先権を主張し、その全ての内容は参照することにより本願に組み込まれる。

本発明は、画像処理の技術分野に関し、特に顔認識方法及び装置に関する。

場合によっては、取得された顔画像に対して顔認識を行い、顔画像に対応する顔識別子を決定する必要がある。顔識別子は、特定の人物の識別子であってもよいし、それに対応する人物顔画像の識別子であってもよい。事前訓練された分類器を使用して人物顔認識を実現してもよい。分類器の各クラスは、即ち、データベース内の各顔識別子である。サーバは、認識対象の顔画像を取得するごとに、該顔画像の特徴ベクトルを抽出してもよく、さらに、抽出された特徴ベクトルを、事前訓練された分類器に入力することにより、該顔画像に対応する顔識別子を取得してもよい。

本願の実施例は、顔認識の効率を向上できる顔認識方法及び装置を提供する。

本願の実施例の顔認識方法は、
認識対象の顔画像を取得し、前記顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出するステップと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第１距離集合を取得し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第１認識結果として決定し、各第１距離集合の中で前記第１認識結果に対応する最小距離に基づいて、前記第１認識結果に対応する第１信頼度を決定するステップと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第２距離集合を取得し、各第２距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第２距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第２認識結果として決定し、各第２距離集合の中で前記第２認識結果に対応する最小距離に基づいて、前記第２認識結果に対応する第２信頼度を決定するステップと、
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップと、を含んでもよい。

本願の実施例の顔認識装置は、
認識対象の顔画像を取得し、前記顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出する取得モジュールと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第１距離集合を取得し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第１認識結果として決定し、各第１距離集合の中で前記第１認識結果に対応する最小距離に基づいて、前記第１認識結果に対応する第１信頼度を決定する第１計算モジュールと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第２距離集合を取得し、各第２距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第２距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第２認識結果として決定し、各第２距離集合の中で前記第２認識結果に対応する最小距離に基づいて、前記第２認識結果に対応する第２信頼度を決定する第２計算モジュールと、
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定する決定モジュールと、を備えてもよい。

本願の実施例のサーバは、プロセッサとメモリとを備え、前記メモリには、少なくとも１つの命令、少なくとも１つのプログラム、コードセット又は命令セットが記憶され、前記少なくとも１つの命令、前記少なくとも１つのプログラム、前記コードセット又は命令セットは、前記プロセッサによりロードされて実行されることで、前記顔認識方法を実現させるようにしてもよい。

本願の実施例のコンピュータ読み取り可能な記憶媒体は、少なくとも１つの命令、少なくとも１つのプログラム、コードセット又は命令セットを記憶しており、前記少なくとも１つの命令、前記少なくとも１つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、前記顔認識方法を実現させるようにしてもよい。

本願の実施例では、サーバは、認識対象の顔画像を取得した後、顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出することができ、さらに、各目標特徴ベクトルと、各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第１距離集合を取得し、各第１距離集合に基づいて、顔画像に対応する第１認識結果及びそれに対応する第１信頼度を決定することができる。少なくとも１つの目標特徴ベクトルを決定した後、各目標特徴ベクトルと、各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第２距離集合を取得することもでき、さらに、各第２距離集合に基づいて、顔画像に対応する第２認識結果及びそれに対応する第２信頼度を決定することができる。第１認識結果及びそれに対応する第１信頼度と、第２認識結果及びそれに対応する第２信頼度とを決定した後、顔画像に対応する顔認識結果及びそれに対応する信頼度を決定することができる。このように、第１認識結果と第２認識結果とを融合することにより、顔画像に対応する顔認識結果を決定することができ、分類器を事前訓練する必要がなくなり、さらに、新しい顔識別子を追加するときに分類器を再訓練することを回避することができ、これにより、顔認識の効率を向上させることができる。

本願の実施例の構成をより明確に説明するために、以下、実施例の説明に必要な図面を簡単的に紹介する。明らかに、以下の説明における図面は本願のいくつかの実施例を示しているにすぎず、当業者にとって、創造的な労働をせずに、これらの図面から他の図面を得ることもできる。

本願の実施例で提供された実施環境の模式図である。本願の実施例で提供された顔認識方法のフローチャートである。本願の実施例で提供されたフレームワークの模式図である。本願の実施例で提供されたフレームワークの模式図である。本願の実施例で提供された顔認識方法のフローチャートである。本願の実施例で提供された顔認識装置の構成の模式図である。本願の実施例で提供された顔認識装置の構成の模式図である。本願の実施例で提供されたサーバの構成の模式図である。

本願の目的、構成、及びメリットをより明確にするために、以下、図面を参照しながら、本願の実施形態をさらに詳しく説明する。

本願の実施例は、顔認識方法を提供している。この方法は、図１（ａ）に示すように、実行主体が、例えば、端末又はサーバなどの１つ又は複数のコンピューティングデバイスであり、端末及びサーバの両方によって実現することもできる。ここで、端末は、顔認識機能を有する任意の端末であってもよく、例えば、パーソナルコンピュータなどの端末であってもよい。サーバは、顔認識機能を有するサーバであってもよく、例えば、顔認識機能を有するバックグラウンドサーバなどであってもよい。端末及びサーバの両方により実現される場合は、端末が、認識対象の顔画像を取得した後、この顔画像を認識対象の顔画像としてサーバに送信してもよく、さらに、サーバが、認識対象の顔画像に対応する顔認識結果を決定してもよい。以下、実行主体がサーバである場合を例にして詳しく説明するが、他の場合は、それと同様であるため、ここでは説明を省略する。

サーバは、プロセッサ、メモリなどの部品を含んでもよい。プロセッサは、ＣＰＵなどであってもよい。プロセッサは、平均探索アルゴリズムによって、顔画像に対応する第１認識結果を決定し、近傍探索アルゴリズムによって、顔画像に対応する第２認識結果を決定し、第１認識結果及び第２認識結果に基づいて、顔画像に対応する顔認識結果を決定するなどの処理を実行してもよい。メモリは、ＲＡＭ、Ｆｌａｓｈなどであってもよく、受信されたデータ、処理過程に必要なデータ、処理過程中に生成されたデータなど、例えば、第１認識結果及び第２認識結果などを記憶することに利用可能である。

一部のシナリオでは、サーバは、認識対象の顔画像に対して顔認識処理を行ってもよい。例えば、顔認証打刻のシナリオにおいて、サーバは、画像撮影装置によって認識対象の人物顔画像を取得し、この認識対象の人物顔画像に対して顔認識処理を行ってもよい。また例えば、顔認識によって、取得された顔画像が、探索する人物であるか否かを決定するシナリオにおいて、複数の場所に画像撮影装置を配置してもよく、サーバは、各画像撮影装置から送信された顔画像を取得した後、これら顔画像のいずれに対しても、顔認識を行って、顔画像における人物が、探索する人物であるか否かを決定してもよい。

顔認識の関連技術では、サーバは、データベース内の各顔識別子に対応するサンプル顔画像を取得した後、各サンプル顔画像の特徴ベクトルを抽出し、各特徴ベクトル及びそれに対応する顔識別子に基づいて、マルチクラス分類器を訓練することができる。分類器の各クラスは、データベース内の各顔識別子である。この場合、新しい顔識別子をデータベースに追加する必要があるたびに、分類器を再訓練することにより、追加された顔識別子がクラスに含まれる分類器を取得する必要があり、分類器の拡張性が低く、コストが高い。

本願の構成では、サーバは、認識対象の顔画像を取得した後、平均探索アルゴリズム及び近傍探索アルゴリズムのそれぞれによって、顔画像に対応する第１認識結果及び第２認識結果を決定し、第１認識結果及び第２認識結果に基づいて、顔画像に対応する顔認識結果を取得し、即ち、顔画像に対応する顔識別子を取得することができる。このようにして、サーバは、平均探索アルゴリズムと近傍探索アルゴリズムとを融合することにより、顔画像に対応する顔識別子を決定することができる。本願の構成では、分類器を訓練する必要がなく、新しい顔識別子を追加するときに分類器を再訓練することを回避する。本願の構成によれば、顔認識の効率を向上させることもできる。また、本願の構成では、平均探索アルゴリズムによって決定された顔認識結果及び信頼度と、近傍探索アルゴリズムによって決定された顔認識結果及び信頼度とを融合することにより、顔認識の正確性を高めることができるとともに、正しい認識に高信頼度を付与することもで、これにより、顔認識の再現率を向上させることができる。さらに、本願の実施例で提供された方法は、適用範囲が広く、例えば、１人当たり１つのみの訓練サンプル顔画像（ＳＩＰＰ：ｓｉｎｇｌｅｉｍａｇｅｐｅｒ−ｐｅｒｓｏｎ）に適用でき、融合シナリオ、及び顔認識が必要な他のシナリオにも適用できる。

図１（ｂ）に示すように、いくつかの実施例の処理フローは、下記のステップを含んでもよい。
ステップ１０１で、認識対象の顔画像を取得し、顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出する。
ここで、顔画像は、顔を含む画像であってもよく、例えば、人物の顔を含む人物顔画像であってもよい。

実施において、一部のシナリオでは、サーバは、認識対象の顔画像に対して顔認識処理を行ってもよい。例えば、顔認証での打刻のシナリオにおいて、サーバは、画像撮影装置によって認識対象の人物顔画像を取得してもよく、さらに、この認識対象の人物顔画像に対して顔認識処理を行ってもよい。また例えば、顔認識によって、取得された顔画像が、探索する人物であるか否かを決定するシナリオにおいて、複数の場所に画像撮影装置を配置してもよく、サーバは、各画像撮影装置から送信された顔画像を取得した後、これら顔画像のいずれに対しても、顔認識を行って、顔画像における人物が、探索する人物であるか否かを決定してもよい。

サーバは、認識対象の顔画像を取得し、さらに、ディープネットワークによって、顔画像に対応する少なくとも１つの特徴ベクトル（目標特徴ベクトルと呼ばれてもよい）ｑを抽出してもよい。ここで、ｑは、顔画像自体に対応する特徴ベクトルであってもよいし、画像水増し後の複数の顔画像のそれぞれに対応する特徴ベクトルであってもよいし、画像水増し後の複数の顔画像のそれぞれに対応する特徴ベクトルの平均ベクトルであってもよい。サーバは、適用シナリオに応じて、認識対象の顔画像を取得してもよい。例えば、顔認証打刻のシナリオでは、サーバは、企業が配置した画像撮影装置により撮像された顔画像を取得してもよい。顔認識によって、取得された顔画像が、探索する人物であるか否かを決定するシナリオでは、サーバは、交通管理などの部門が配置した画像撮影装置により撮像された顔画像を取得してもよい。

ステップ１０２で、各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第１距離集合を取得し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、顔画像に対応する第１認識結果として決定し、各第１距離集合の中で第１認識結果に対応する最小距離に基づいて、第１認識結果に対応する第１信頼度を決定する。
ここで、第１信頼度は、顔画像に対応する顔識別子が第１認識結果であることの可能性、信頼性を示すために使用できる。

実施において、サーバには、各顔識別子に対応するサンプル顔画像が予め記憶されてもよい。ここで、各顔識別子に対応するサンプル顔画像の数は、同じであってもよく、異なってもよい。各顔識別子に対応するサンプル顔画像は、直接取得された元の顔画像（元の顔画像は、撮像された顔画像であってもよい）を含んでもよく、元の顔画像を基に画像水増しによって取得されたサンプル顔画像を含んでもよい。各顔識別子ごとに、サーバは、ディープネットワークによって、該顔識別子に対応する各サンプル顔画像の特徴ベクトルを抽出することにより、該顔識別子に対応する少なくとも１つの特徴ベクトルを取得し、さらに、該顔識別子に対応する少なくとも１つの特徴ベクトルの平均ベクトルを計算してもよい。データベース内の顔識別子の数がｋ（ｋは正の整数）であり、各顔識別子それぞれがｍｋ個のサンプル顔画像（ｍは正の整数）に対応するとすると、各顔識別子に対応する少なくとも１つの特徴ベクトル及び平均ベクトルは、次のとおりとしてもよい。
ｐ１１、ｐ１２、…ｐ１ｍ１、平均ベクトル：ｍｐ１
ｐ２１、ｐ２２、…ｐ２ｍ２、平均ベクトル：ｍｐ２
…、…、…
ｐｋ１、ｐｋ２、…ｐｋｍｋ、平均ベクトル：ｍｐｋ

少なくとも１つの目標特徴ベクトルを決定した後、目標特徴ベクトルｑが、顔画像自体に対応する特徴ベクトル、又は画像水増し後の複数の顔画像に対応する平均ベクトルである場合、サーバは、目標特徴ベクトルｑと、上記の各顔識別子に対応する平均ベクトルｍｐｉ（ｉ＝１．．．ｋ）との距離（該距離は、ユークリッド距離であってもよく、コサイン距離であってもよく、他のタイプのベクトル距離であってもよい）を計算することにより、第１距離集合を取得してもよい。第１距離集合を取得した後、サーバは、最小距離に対応する顔識別子を、認識対象の顔画像に対応する第１認識結果ｉｄ１として決定してもよい。

いくつかの実施例では、サーバには、距離閾値が予め設定されてもよい。ここで、距離閾値は、コサイン距離の距離閾値であってもよいし、ユークリッド距離の距離閾値であってもよい。サーバは、第１距離集合を取得した後、最小距離を所定の距離閾値と比較してもよい。最小距離が所定の距離閾値未満である場合、最小距離に対応する顔識別子を、認識対象の顔画像に対応する第１認識結果ｉｄ１として決定し、最小距離が所定の距離閾値未満でない場合、認識は失敗する。

いくつかの実施例では、画像水増しによって、認識対象の顔画像の複数の顔画像（複数の顔画像は、認識対象の顔画像と、画像水増し後の少なくとも１つの顔画像とを含む）が取得される場合、即ち、顔画像が複数の目標特徴ベクトルに対応する場合、各顔画像ごとに、サーバは、該顔画像の目標特徴ベクトルと、上記の各顔識別子に対応する平均ベクトルｍｐｉとの距離を計算することにより、該顔画像に対応する第１距離集合を取得し、さらに、最小距離に対応する顔識別子を、該顔画像に対応する顔識別子として決定してもよい。各顔画像に対応する顔識別子を取得した後、サーバは、出現回数が最も多い顔識別子を、認識対象の顔画像に対応する第１認識結果として決定してもよい。つまり、顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出した後、サーバは、平均探索アルゴリズムによって、顔画像に対応する第１認識結果と、第１認識結果に対応する第１信頼度とを決定してもよい。ここで、平均探索アルゴリズムは、平均ベクトルと比較することにより認識結果を決定するアルゴリズムであってもよい。

認識対象の顔画像を取得した後、サーバは、顔画像に対応する第１認識結果に加えて、第１認識結果に対応する第１信頼度ｓ１も決定してもよい。例えば、サーバは、各第１距離集合の中で第１認識結果に対応する距離を取得し、各距離のうちの最小距離を決定し、第１認識結果に対応する各距離のうちの最小距離に基づいて、第１信頼度を決定してもよい。例えば、第１認識結果に対応する各距離のうちの最小距離の逆数を第１信頼度として決定してもよい。

ステップ１０３で、各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第２距離集合を取得し、各第２距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第２距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、顔画像に対応する第２認識結果として決定し、各第２距離集合の中で第２認識結果に対応する最小距離に基づいて、第２認識結果に対応する第２信頼度を決定する。
ここで、第２信頼度は、顔画像に対応する顔識別子が第２認識結果であることの可能性、信頼性を示すために使用できる。

実施において、少なくとも１つの目標特徴ベクトルを決定した後、目標特徴ベクトルｑが、顔画像自体に対応する特徴ベクトル、又は画像水増し後の複数の顔画像に対応する平均ベクトルである場合、サーバは、目標特徴ベクトルｑと各サンプル顔画像の特徴ベクトルとの距離を計算することにより、第２距離集合を取得し、さらに、各第２距離集合のそれぞれから、距離が最小となる所定の数の距離を選択するか、所定の距離閾値未満の目標距離を選択してもよい。目標距離を選択した後、サーバは、各目標距離に対応する顔識別子を決定してもよく、さらに、それぞれ異なる顔識別子に対応する出現回数をカウントし、出現回数が最も多い目標顔識別子を、認識対象の顔画像に対応する第２認識結果として決定してもよい。

いくつかの実施例では、画像水増しによって、認識対象の顔画像の複数の顔画像が取得される場合、即ち、顔画像が複数の目標特徴ベクトルに対応する場合、各顔画像ごとに、サーバは、該顔画像の目標特徴ベクトルと、上記の各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、該顔画像に対応する第２距離集合を取得してもよい。さらに、各第２距離集合のそれぞれから、距離が最小となる所定の数の距離を選択するか、所定の距離閾値未満の目標距離を選択する。各第２距離集合に対応する目標距離を選択した後、サーバは、各目標距離に対応する顔識別子を決定し、それぞれ異なる顔識別子に対応する出現回数をカウントし、出現回数が最も多い目標顔識別子を決定してもよい。各目標特徴ベクトルに対応する目標顔識別子を取得した後、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、顔画像に対応する第２認識結果として決定してもよい。つまり、顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出した後、サーバは、近傍探索アルゴリズムによって、顔画像に対応する第２認識結果と、第２認識結果に対応する第２信頼度とを決定してもよい。ここで、近傍探索アルゴリズムは、各サンプル顔画像に対応する特徴ベクトルと比較することにより認識結果を決定するアルゴリズムであってもよく、局所性鋭敏型ハッシュ（ＬＳＨ：ＬｏｃａｌＳｅｎｓｉｔｉｖｅＨａｓｈｉｎｇ）アルゴリズムであってもよい。

認識対象の顔画像を取得した後、サーバは、顔画像に対応する第２認識結果に加えて、第２認識結果に対応する第２信頼度ｓ２も決定してもよい。例えば、サーバは、各第２距離集合の中で第２認識結果に対応する各距離を取得してもよく、さらに、第２認識結果に対応する各距離のうちの最小距離を決定してもよく、第２認識結果に対応する各距離のうちの最小距離に基づいて、第２信頼度を決定してもよい。例えば、第２認識結果に対応する各距離のうちの最小距離の逆数を第２信頼度として決定してもよい。

ステップ１０４で、第１認識結果と、第１認識結果に対応する第１信頼度と、第２認識結果と、第２認識結果に対応する第２信頼度とに基づいて、顔画像に対応する顔認識結果と、顔認識結果に対応する信頼度とを決定する。

実施において、第１認識結果と、第１認識結果に対応する第１信頼度と、第２認識結果と、第２認識結果に対応する第２信頼度とを決定した後、サーバは、第１認識結果と、第１認識結果に対応する第１信頼度と、第２認識結果と、第２認識結果に対応する第２信頼度とに基づいて、認識対象の顔画像に対応する顔認識結果ｆ＿ｉｄと、顔認識結果に対応する信頼度ｆ＿ｓｃｏｒｅを決定してもよい。例えば、何らかの条件により、第１認識結果及び第２認識結果のうちの一方を、顔画像に対応する顔認識結果として決定してもよい。ここで、本願の構成の処理フレームワークは、図２（ａ）に示すとおりである。

いくつかの実施例では、本願の構成の全体的なフローは、図２（ｂ）に示すとおりであってもよい。ここで、ＣＮＮ＿ｆｅｓは、特徴ベクトルを抽出するためのディープネットワークであり、ｂａｓｅｓｅｔは、対応するサンプル顔画像の数が多い顔識別子の集合であってもよく、ｎｏｖｅｌｓｅｔは、対応するサンプル顔画像の数が少ない顔識別子の集合であってもよく、ａｕｇｍｅｎｔｅｄ−ｎｏｖｅｌｓｅｔは、画像水増し後のｎｏｖｅｌｓｅｔであってもよく、ＭｏｄｉｆｉｅｄＳＶＤａｕｇｍｅｎｔａｔｉｏｎｍｏｄｕｌｅは、改良ＳＶＤ水増しモジュールであってもよく、ＮＮｍｏｄｕｌｅ：ＬＳＨｆｅａｔｕｒｅｐｏｏｌは、ＬＳＨに基づく近傍探索モジュールであってもよく、Ｍｅａｎｓｅａｒｃｈｆｅａｔｕｒｅｐｏｏｌは、平均探索モジュールであってもよく、Ｈｙｐｅｒｍｅｒｇｅｍｏｄｕｌｅは、ステップ１０４に対応する融合モジュールであってもよい。

各実施例では、顔認識結果を決定する方式によって、ステップ１０４の処理過程は様々であり得る。いくつかのケースでの実現方式を以下に示す。

ケース１：第１認識結果と第２認識結果とが同じである場合、第１認識結果又は第２認識結果を、顔画像に対応する顔認識結果として決定し、第１信頼度及び第２信頼度のうちの最大信頼度を、顔認識結果に対応する信頼度として決定する。

実施において、第１認識結果及び第２認識結果を決定した後、サーバは、第１認識結果と第２認識結果とが同じであるか否かを決定してもよい。第１認識結果と第２認識結果とが同じである場合、サーバは、第１認識結果又は第２認識結果を、顔画像に対応する顔認識結果として決定してもよい。これに応じて、サーバは、第１信頼度及び第２信頼度のうちの最大信頼度を決定し、さらに、それを顔認識結果に対応する信頼度として決定してもよい。

ここで、第１認識結果と第２認識結果とが同じである場合は、今回正しく認識される確率が高く、即ち、顔画像に実際に対応する顔識別子が第１認識結果又は第２認識結果である可能性が高く、第１認識結果又は第２認識結果を、顔画像に対応する顔認識結果として決定することの信頼性が高いことを示している。したがって、このような処理により、顔認識の正確率を向上させることができるとともに、認識結果の信頼度を高めることができ、即ち、正しい認識に高信頼度を付与することができ、これにより、顔認識の再現率を向上させることができる。

ケース２：第１認識結果と第２認識結果とが異なり、かつ第２信頼度と第１信頼度との差が第１所定閾値より大きい場合、第２認識結果を、顔画像に対応する顔認識結果として決定し、第２信頼度を、顔認識結果に対応する信頼度として決定する。

実施において、第１認識結果と第２認識結果とが異なる場合、サーバは、上記の方式で決定された第１認識結果に対応する第１信頼度と第２認識結果に対応する第２信頼度とを取得してもよい。第１信頼度と第２信頼度との大小関係に基づいて、第１認識結果及び第２認識結果のうちの一方を、顔画像に対応する顔認識結果として決定してもよい。

例えば、第１認識結果と第２認識結果とが異なる場合、サーバは、さらに、第１信頼度と第２信頼度との大きさを比較してもよい。第２信頼度と第１信頼度との差が第１所定閾値より大きい場合、サーバは、第２認識結果を、顔画像に対応する顔認識結果として決定してもよい。これに応じて、サーバは、第２信頼度を、顔認識結果に対応する信頼度として決定してもよい。

ここで、第２信頼度が第１信頼度より第１所定閾値だけ大きい場合は、近傍探索アルゴリズムによって決定された第２認識結果が、平均探索アルゴリズムによって決定された第１認識結果よりも信頼できることを示している。したがって、このような処理により、顔認識の正確率を向上させることができるとともに、認識結果の信頼度を高めることができ、即ち、正しい認識に高信頼度を付与することができ、これにより、顔認識の再現率を向上させることができる。

ケース３：第１認識結果と第２認識結果とが異なり、かつ第１信頼度と第２信頼度との差が第２所定閾値より大きい場合、第１認識結果を、顔画像に対応する顔認識結果として決定し、第１信頼度を、顔認識結果に対応する信頼度として決定する。

実施において、サーバには、第２所定閾値が予め記憶されてもよい。ここで、第１所定閾値及び第２所定閾値は、同じであってもよく、異なってもよい。第１認識結果と第２認識結果とが異なり、かつ第１信頼度と第２信頼度との差が第２所定閾値より大きい場合、サーバは、第１認識結果を、顔画像に対応する顔認識結果及び信頼度として決定してもよい。これに応じて、第１信頼度を、顔認識結果に対応する信頼度として決定してもよい。

ここで、第２信頼度が第１信頼度より第２所定閾値だけ低い場合は、平均探索アルゴリズムによって決定された第１認識結果が、近傍探索アルゴリズムによって決定された第２認識結果よりも信頼できることを示している。したがって、このような処理により、顔認識の正確率を向上させることができるとともに、認識結果の信頼度を高めることができ、即ち、正しい認識に高信頼度を付与することができ、これにより、顔認識の再現率を向上させることができる。

ケース４：第１認識結果と第２認識結果とが異なり、かつ第２信頼度と第１信頼度との差が第１所定閾値未満であり、かつ、第１信頼度と第２信頼度との差が第２所定閾値未満である場合、第１認識結果を顔画像に対応する顔認識結果として決定し、第１信頼度と第２信頼度のうちの最小の信頼度を顔認識結果に対応する信頼度として決定する。

実施において、第１認識結果と第２認識結果とが異なり、かつ第２信頼度と第１信頼度との差が第１所定閾値未満であり、かつ、第１信頼度と第２信頼度との差が第２所定閾値未満である場合、サーバは、第１認識結果を、顔画像に対応する顔認識結果として決定してもよい。これに応じて、サーバは、第１信頼度及び第２信頼度のうちの最小信頼度を、顔画像に対応する信頼度として決定してもよい。

ここで、平均探索アルゴリズムによって決定された認識結果の正確性は、近傍探索アルゴリズムによって決定された認識結果の正確性より高いことがよくある。第１認識結果と第２認識結果とが異なる場合は、今回正しく認識される確率が比較的低いことを示している。したがって、このような処理は、今回の顔認識の状況を正しく反映できる。

ケース５：第１認識結果と、第１認識結果に対応する第１信頼度と、第２認識結果と、第２認識結果に対応する信頼度とを、事前訓練された顔認識モデルに入力することにより、顔画像に対応する顔認識結果と、顔認識結果に対応する信頼度とを取得する。

実施において、サーバには、サンプル顔画像に基づいて訓練された顔認識モデルが予め記憶されてもよい。ここで、顔認識モデルへの入力は、平均探索アルゴリズムによって決定された顔認識結果及びそれに対応する信頼度と、近傍探索アルゴリズムによって決定された顔認識結果及びそれに対応する信頼度とであってもよい。ここで、顔認識モデルは、意思決定モデル、ニューラルネットワークモデルなどであってもよい。サーバは、第１認識結果と、第１認識結果に対応する第１信頼度と、第２認識結果と、第２認識結果に対応する第２信頼度とを決定した後、第１認識結果と、第１信頼度と、第２認識結果と、第２信頼度とを、事前訓練された顔認識モデルに入力することにより、顔認識モデルからの出力を取得してもよい。これにより、顔画像に対応する顔認識結果、及びそれに対応する信頼度を取得することができる。

ここで、サーバは、上記の複数のケース１〜５の任意のケースを組み合わせた処理をサポートできる。

各実施例では、顔認識モデルの訓練過程は、以下のようにしてもよい。各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、第１距離集合を取得する。第１距離集合の中の最小距離に対応する顔識別子を、各訓練顔画像に対応する第１認識結果として決定する。第１距離集合の中の、前記第１認識結果に対応する最小距離に基づいて、第１認識結果に対応する第１信頼度を決定する。各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、第２距離集合を取得する。第２距離集合の中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定する。各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を、各訓練顔画像に対応する第２認識結果として決定する。第２距離集合の中の、第２認識結果に対応する最小距離に基づいて、第２認識結果に対応する第２信頼度を決定する。各訓練顔画像に対応する第１認識結果と、第１信頼度と、第２認識結果と、第２信頼度とを顔認識モデルに入力することにより、各訓練顔画像に対応する認識結果及び信頼度を取得する。取得された、各訓練顔画像に対応する顔認識結果及び信頼度と、予め設定された、各訓練顔画像に対応する顔認識結果及び信頼度とに基づいて、顔認識モデルのモデルパラメータを調整することにより、訓練された顔認識モデルを取得する。

実施において、サーバには、大量の顔識別子に対応する訓練顔画像が予め記憶されてもよい。ここで、直接取得されたある顔識別子に対応する元の顔画像の数が少ない場合、サーバは、直接取得された元の顔画像に対して画像水増し処理を行うことにより、複数のサンプル顔画像を取得してもよい（この場合、該顔識別子に対応する訓練顔画像は、元の顔画像と、画像水増しによって取得された訓練顔画像とを含む）。各訓練顔画像ごとに、サーバは、ディープネットワークによって該訓練顔画像の特徴ベクトルを抽出してもよく、さらに、各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、第１距離集合を取得してもよい。第１距離集合の中の最小距離に対応する顔識別子を、各訓練顔画像に対応する第１認識結果として決定する。これに応じて、サーバは、第１距離集合の中の、第１認識結果に対応する最小距離を取得してもよい。さらに、最小距離に基づいて、第１認識結果に対応する第１信頼度を決定してもよい。

第１認識結果及び第１信頼度に加えて、サーバは、第２認識結果及びそれに対応する第２信頼度も決定してもよい。例えば、各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、第２距離集合を取得してもよい。第２距離集合の中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定する。さらに、各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を、各訓練顔画像に対応する第２認識結果として決定してもよい。これに応じて、サーバは、第２距離集合の中の、第２認識結果に対応する最小距離を取得してもよい。さらに、最小距離に基づいて、第２認識結果に対応する第２信頼度を決定してもよい。

各訓練顔画像に対応する第１認識結果と、第１信頼度と、第２認識結果と、第２信頼度とを決定した後、サーバは、訓練顔画像に対応する第１認識結果と、第１信頼度と、第２認識結果と、第２信頼度とを顔認識モデルに入力することにより、各訓練顔画像に対応する顔認識結果及び信頼度を取得してもよい。ここで、顔認識モデルにより取得された顔認識結果及び信頼度には、顔認識モデルのモデルパラメータが含まれる。

各訓練顔画像に対応する顔認識結果及び信頼度を取得した後、取得された顔認識結果を、予め設定された、訓練顔画像に対応する顔認識結果に近くし、取得された信頼度を、予め設定された、訓練顔画像に対応する信頼度に近くする訓練原則（例えば、両者間の差を目的関数として決定し、さらに、目的関数の最小値を計算する方法によって、顔認識モデルを訓練する）に基づいて、顔認識モデルを訓練し、即ち、顔認識モデルのモデルパラメータを調整することにより（ここで、勾配降下法によって顔認識モデルを訓練してもよい）、訓練された顔認識モデルを取得してもよい。ここで、予め設定された、訓練顔画像に対応する顔認識結果は、訓練顔画像に実際に対応する顔認識結果であってもよい。各訓練顔画像ごとに、該訓練顔画像に対応する第１認識結果及び／又は第２認識結果が、該訓練顔画像に実際に対応する顔識別子と同じである場合、該訓練顔画像に対応する信頼度を高く設定してもよく、該訓練顔画像に対応する第１認識結果及び／又は第２認識結果が、該訓練顔画像に実際に対応する顔識別子と異なる場合、該訓練顔画像に対応する信頼度を低く設定してもよい。

本願の構成では、平均探索アルゴリズムによって決定された顔認識結果と、近傍探索アルゴリズムによって決定された顔認識結果とを融合することにより、顔認識の正確率を向上させることができ、上記の２つのアルゴリズムによって決定された信頼度を融合することにより、正しい認識に高信頼度を付与することができ、これにより、顔認識の再現率を向上させることができる。

いくつかの実施例では、本願の構成は、多数のシナリオに適用でき、使用範囲が広く、ＳＩＰＰシナリオに適用できるし、融合シナリオにも適用できる（融合シナリオとは、データベースにおいて、一部の顔識別子が１つのサンプル顔画像に対応し、一部の顔識別子が複数のサンプル顔画像に対応するシナリオである）。

いくつかの実施例では、顔認識モデルによって、顔画像に対応する顔認識結果を決定する場合について、本願の実施例は、図３に示されるフローをさらに提供している。
ステップ３０１で、認識対象の顔画像を取得し、顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出する。

ステップ３０２で、各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第１距離集合を取得し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、顔画像に対応する第１認識結果として決定し、各第１距離集合の中で第１認識結果に対応する最小距離に基づいて、第１認識結果に対応する第１信頼度を決定する。

ステップ３０３で、各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第２距離集合を取得し、各第２距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第２距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、顔画像に対応する第２認識結果として決定し、各第２距離集合の中で第２認識結果に対応する最小距離に基づいて、第２認識結果に対応する第２信頼度を決定する。

ステップ３０４で、第１認識結果と、第１認識結果に対応する第１信頼度と、第２認識結果と、第２認識結果に対応する信頼度とを、事前訓練された顔認識モデルに入力することにより、顔画像に対応する顔認識結果と、顔認識結果に対応する信頼度とを取得する。

実施において、サーバには、サンプル顔画像に基づいて訓練された顔認識モデルが予め記憶されてもよい。実施において、サーバには、サンプル顔画像に基づいて訓練された顔認識モデルが予め記憶されてもよい。ここで、顔認識モデルへの入力は、平均探索アルゴリズムによって決定された顔認識結果及びそれに対応する信頼度と、近傍探索アルゴリズムによって決定された顔認識結果及びそれに対応する信頼度とであってもよい。ここで、顔認識モデルは、意思決定モデル、ニューラルネットワークモデルなどであってもよい。サーバは、第１認識結果と、第１認識結果に対応する第１信頼度と、第２認識結果と、第２認識結果に対応する第２信頼度とを決定した後、第１認識結果と、第１信頼度と、第２認識結果と、第２信頼度とを、事前訓練された顔認識モデルに入力することにより、顔認識モデルからの出力を取得してもよい。これにより、顔画像に対応する顔認識結果、及びそれに対応する信頼度を取得することができる。

同じ技術的構想に基づき、本願の実施例は、図４に示すような顔認識装置をさらに提供している。該装置は、上記サーバであってもよい。該装置は、
認識対象の顔画像を取得し、前記顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出する取得モジュール４１０と、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第１距離集合を取得し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第１認識結果として決定し、各第１距離集合の中で前記第１認識結果に対応する最小距離に基づいて、前記第１認識結果に対応する第１信頼度を決定する第１計算モジュール４２０と、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第２距離集合を取得し、各第２距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第２距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第２認識結果として決定し、各第２距離集合の中で前記第２認識結果に対応する最小距離に基づいて、前記第２認識結果に対応する第２信頼度を決定する第２計算モジュール４３０と、
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定する決定モジュール４４０と、を備える。

各実施例では、前記決定モジュール４４０は、
前記第１認識結果と前記第２認識結果とが同じである場合、前記第１認識結果又は前記第２認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第１信頼度及び前記第２信頼度のうちの最大信頼度を、前記顔認識結果に対応する信頼度として決定する。
各実施例では、前記決定モジュール４４０は、
前記第１認識結果と前記第２認識結果とが異なり、かつ前記第２信頼度と前記第１信頼度との差が第１所定閾値より大きい場合、前記第２認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第２信頼度を、前記顔認識結果に対応する信頼度として決定する。

各実施例では、前記決定モジュール４４０は、
前記第１認識結果と前記第２認識結果とが異なり、かつ前記第１信頼度と前記第２信頼度との差が第２所定閾値より大きい場合、前記第１認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第１信頼度を、前記顔認識結果に対応する信頼度として決定する。

各実施例では、前記決定モジュール４４０は、
前記第１認識結果と前記第２認識結果とが異なり、かつ前記第２信頼度と前記第１信頼度との差が第１所定閾値未満であり、かつ、前記第１信頼度と前記第２信頼度との差が第２所定閾値未満である場合、前記第１認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第１信頼度及び前記第２信頼度のうちの最小信頼度を、前記顔認識結果に対応する信頼度として決定する。

各実施例では、前記決定モジュール４４０は、
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とを、事前訓練された顔認識モデルに入力することにより、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを取得する。

各実施例では、図５に示すように、前記装置は、
各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、第１距離集合を取得し、第１距離集合の中の最小距離に対応する顔識別子を、各訓練顔画像に対応する第１認識結果として決定し、第１距離集合の中の、前記第１認識結果に対応する最小距離に基づいて、第１認識結果に対応する第１信頼度を決定する第３計算モジュール４５０と、
各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、第２距離集合を取得し、第２距離集合の中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を、各訓練顔画像に対応する第２認識結果として決定し、第２距離集合の中の、第２認識結果に対応する最小距離に基づいて、第２認識結果に対応する第２信頼度を決定する第４計算モジュール４６０と、
各訓練顔画像に対応する第１認識結果と、第１信頼度と、第２認識結果と、第２信頼度とを、顔認識モデルに入力することにより、各訓練顔画像に対応する顔認識結果及び信頼度を取得する入力モジュール４７０と、
取得された、各訓練顔画像に対応する顔認識結果及び信頼度と、予め設定された、各訓練顔画像に対応する顔認識結果及び信頼度とに基づいて、前記顔認識モデルのモデルパラメータを調整することにより、訓練された顔認識モデルを取得する訓練モジュール４８０と、をさらに備える。

説明すべきものとして、上記実施例で提供された顔認識装置について、上記の各機能モジュールの分割のみを例にして顔認識を説明しているが、実際の適用では、必要に応じて、上記の機能を、異なる機能モジュールによって完了するように割り当て、即ち、上記の機能の全部又は一部を完了するために、サーバの内部構成を異なる機能モジュールに分割してもよい。いくつかの実施例では、上記実施例で提供された顔認識装置は、顔認識方法の実施例とは同じ構想に属し、その具体的な実現過程の詳細については、方法の実施例を参照すればよく、ここでは説明を省略する。

図６は、本願の実施例で提供されたコンピューティングデバイスの構成の模式図である。このコンピューティングデバイス６００は、配置や性能の相違により大きく異なる場合があり、１つ又は複数のプロセッサ（ＣＰＵ：ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔｓ）６０１と、１つ又は複数のメモリ６０２とを備えてもよい。ここで、前記メモリ６０２には、少なくとも１つの命令が記憶されており、前記少なくとも１つの命令は、前記プロセッサ６０１によりロードされて実行されることで、前記顔認識方法を実現する。

例示的な実施例では、非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供している。前記記憶媒体には、少なくとも１つの命令、少なくとも１つのプログラム、コードセット又は命令セットが記憶されており、前記少なくとも１つの命令、前記少なくとも１つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、前記顔認識方法を実現する。

当業者であれば理解できるように、上記実施例を実現するためのステップの全部又は一部は、ハードウェアによって実行されてもよいし、プログラムによって関連ハードウェアに指示することにより実行されてもよい。前記プログラムは、コンピュータ読み取り可能な記憶媒体に記憶されてもよい。上記で言及された記憶媒体は、読み出し専用メモリ、磁気ディスク、又は光ディスクなどであってもよい。
上記のように、特許請求の範囲は、上記の例で説明された実施形態に限定されるべきではなく、明細書を全体として最も広く解釈すべきである。

４１０取得モジュール
４２０第１計算モジュール
４３０第２計算モジュール
４４０決定モジュール
４５０第３計算モジュール
４６０第４計算モジュール
４７０入力モジュール
４８０訓練モジュール
６００コンピューティングデバイス
６０１プロセッサ
６０２メモリ

Claims

少なくとも１つのコンピューティングデバイスにより実行される顔認識方法であって、
認識対象の顔画像を取得し、前記顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出するステップと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第１距離集合を取得し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第１認識結果として決定し、各第１距離集合の中で前記第１認識結果に対応する最小距離に基づいて、前記第１認識結果に対応する第１信頼度を決定するステップと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第２距離集合を取得し、各第２距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第２距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第２認識結果として決定し、各第２距離集合の中で前記第２認識結果に対応する最小距離に基づいて、前記第２認識結果に対応する第２信頼度を決定するステップと、
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップと、
を含む顔認識方法。
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
前記第１認識結果と前記第２認識結果とが同じである場合、前記第１認識結果又は前記第２認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第１信頼度及び前記第２信頼度のうちの最大信頼度を、前記顔認識結果に対応する信頼度として決定するステップを含む、
請求項１に記載の方法。
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
前記第１認識結果と前記第２認識結果とが異なり、かつ前記第２信頼度と前記第１信頼度との差が第１所定閾値より大きい場合、前記第２認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第２信頼度を、前記顔認識結果に対応する信頼度として決定するステップを含む、
請求項１に記載の方法。
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
前記第１認識結果と前記第２認識結果とが異なり、かつ前記第１信頼度と前記第２信頼度との差が第２所定閾値より大きい場合、前記第１認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第１信頼度を、前記顔認識結果に対応する信頼度として決定するステップを含む、
請求項１に記載の方法。
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
前記第１認識結果と前記第２認識結果とが異なり、かつ前記第２信頼度と前記第１信頼度との差が第１所定閾値未満であり、かつ、前記第１信頼度と前記第２信頼度との差が第２所定閾値未満である場合、前記第１認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第１信頼度及び前記第２信頼度のうちの最小信頼度を、前記顔認識結果に対応する信頼度として決定するステップを含む、
請求項１に記載の方法。
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定するステップは、
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とを、事前訓練された顔認識モデルに入力することにより、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを取得するステップを含む、
請求項１に記載の方法。
各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、第１距離集合を取得し、第１距離集合の中の最小距離に対応する顔識別子を、各訓練顔画像に対応する第１認識結果として決定し、第１距離集合の中の、第１認識結果に対応する最小距離に基づいて、第１認識結果に対応する第１信頼度を決定するステップと、
各訓練顔画像に対応する特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、第２距離集合を取得し、第２距離集合の中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を、各訓練顔画像に対応する第２認識結果として決定し、第２距離集合の中の、第２認識結果に対応する最小距離に基づいて、第２認識結果に対応する第２信頼度を決定するステップと、
各訓練顔画像に対応する第１認識結果、第１信頼度、第２認識結果、及び第２信頼度を、顔認識モデルに入力することにより、各訓練顔画像に対応する顔認識結果及び信頼度を取得するステップと、
取得された、各訓練顔画像に対応する顔認識結果及び信頼度と、予め設定された、各訓練顔画像に対応する顔認識結果及び信頼度とに基づいて、前記顔認識モデルのモデルパラメータを調整することにより、訓練された顔認識モデルを取得するステップと、
をさらに含む請求項６に記載の方法。
顔認識装置であって、
認識対象の顔画像を取得し、前記顔画像に対応する少なくとも１つの目標特徴ベクトルを抽出する取得モジュールと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する平均ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第１距離集合を取得し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子を決定し、各第１距離集合のそれぞれの中の最小距離に対応する顔識別子の中から、出現回数が最も多い顔識別子を、前記顔画像に対応する第１認識結果として決定し、各第１距離集合の中で前記第１認識結果に対応する最小距離に基づいて、前記第１認識結果に対応する第１信頼度を決定する第１計算モジュールと、
各目標特徴ベクトルと、データベースに予め記憶されている各顔識別子に対応する各特徴ベクトルとの距離を計算することにより、各目標特徴ベクトルに対応する第２距離集合を取得し、各第２距離集合のそれぞれの中の、所定の選択条件を満たす目標距離に対応する顔識別子を決定し、各第２距離集合のそれぞれの中の各目標距離に対応する顔識別子の中から、出現回数が最も多い目標顔識別子を決定し、各目標顔識別子の中から、出現回数が最も多い目標顔識別子を、前記顔画像に対応する第２認識結果として決定し、各第２距離集合の中で前記第２認識結果に対応する最小距離に基づいて、前記第２認識結果に対応する第２信頼度を決定する第２計算モジュールと、
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とに基づいて、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを決定する決定モジュールと、
を備える顔認識装置。
前記決定モジュールは、
前記第１認識結果と前記第２認識結果とが同じである場合、前記第１認識結果又は前記第２認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第１信頼度及び前記第２信頼度のうちの最大信頼度を、前記顔認識結果に対応する信頼度として決定する、
請求項８に記載の装置。
前記決定モジュールは、
前記第１認識結果と前記第２認識結果とが異なり、かつ前記第２信頼度と前記第１信頼度との差が第１所定閾値より大きい場合、前記第２認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第２信頼度を、前記顔認識結果に対応する信頼度として決定する、
請求項８に記載の装置。
前記決定モジュールは、
前記第１認識結果と前記第２認識結果とが異なり、かつ前記第１信頼度と前記第２信頼度との差が第２所定閾値より大きい場合、前記第１認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第１信頼度を、前記顔認識結果に対応する信頼度として決定する、
請求項８に記載の装置。
前記決定モジュールは、
前記第１認識結果と前記第２認識結果とが異なり、かつ前記第２信頼度と前記第１信頼度との差が第１所定閾値未満であり、かつ、前記第１信頼度と前記第２信頼度との差が第２所定閾値未満である場合、前記第１認識結果を、前記顔画像に対応する顔認識結果として決定し、前記第１信頼度及び前記第２信頼度のうちの最小信頼度を、前記顔認識結果に対応する信頼度として決定する、
請求項８に記載の装置。
前記決定モジュールは、
前記第１認識結果と、前記第１認識結果に対応する第１信頼度と、前記第２認識結果と、前記第２認識結果に対応する第２信頼度とを、事前訓練された顔認識モデルに入力することにより、前記顔画像に対応する顔認識結果と、前記顔認識結果に対応する信頼度とを取得する、
請求項８に記載の装置。
プロセッサとメモリとを備えるサーバであって、前記メモリには、少なくとも１つの命令、少なくとも１つのプログラム、コードセット又は命令セットが記憶され、前記少なくとも１つの命令、前記少なくとも１つのプログラム、前記コードセット又は命令セットは、前記プロセッサによりロードされて実行されることで、請求項１〜７のいずれか１項に記載の顔認識方法を実現させるサーバ。
少なくとも１つの命令、少なくとも１つのプログラム、コードセット又は命令セットを記憶したコンピュータ読み取り可能な記憶媒体であって、前記少なくとも１つの命令、前記少なくとも１つのプログラム、前記コードセット又は命令セットは、プロセッサによりロードされて実行されることで、請求項１〜７のいずれか１項に記載の顔認識方法を実現させるコンピュータ読み取り可能な記憶媒体。
請求項１〜７のいずれか１項に記載の顔認識方法をコンピューティングデバイスに実行させるコンピュータプログラム。