JPH1055444A - Dctをベースとするフィーチャー・ベクトルを使った顔の認識 - Google Patents

Dctをベースとするフィーチャー・ベクトルを使った顔の認識

Info

Publication number
JPH1055444A
JPH1055444A JP9115461A JP11546197A JPH1055444A JP H1055444 A JPH1055444 A JP H1055444A JP 9115461 A JP9115461 A JP 9115461A JP 11546197 A JP11546197 A JP 11546197A JP H1055444 A JPH1055444 A JP H1055444A
Authority
JP
Japan
Prior art keywords
codebook
given object
known objects
generating
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9115461A
Other languages
English (en)
Other versions
JP3649311B2 (ja
Inventor
Christine Irene Podilchuk
アイレン ポデルチュック クリスチン
Xiaoyu Zhang
ツァン キシアオユ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JPH1055444A publication Critical patent/JPH1055444A/ja
Application granted granted Critical
Publication of JP3649311B2 publication Critical patent/JP3649311B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Collating Specific Patterns (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 DCTをベースとするフィーチャー・ベクト
ルを用いて顔の認識率を向上させる。 【解決手段】 入力画像信号中の所与のオブジェクト
は、データベースに保存された複数の既知のオブジェク
トの1つと比較され、その際、既知のオブジェクトの各
々の保存された表示は、既知のオブジェクトを含むトレ
ーニング画像信号に基づいて生成されたコードブックを
含む。第1の例示としての実施例は、所与のオブジェク
トをブロックに分解するステップと、各エンコーディン
グがコードブックの1つを使ったオブジェクトのコーデ
ィングからなる、所与のオブジェクトの複数のエンコー
ディングを行うステップと、各エンコーディングについ
てコーディング誤差を決定するステップと、コーディン
グの誤差に基づいて所与のオブジェクトを既知のオブジ
ェクトの1つと比較するステップとを含む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、概して、自動化画
像分析の分野に関し、特に画像に含まれる人間の顔を認
識および識別する問題に関する。
【0002】
【従来の技術、及び、発明が解決しようとする課題】検
証と識別を含む、静止画像またはビデオ・データからの
顔の認識は大きなデータベースのビデオ検索、保安上の
アクセスなどの無数のマルチメディア適用例を含む広い
範囲の商業的な適用例がある。顔を認識する際の問題
は、一般に以下のように説明される。静止画像またはビ
デオ・シーケンスが入力として与えられると、必要とさ
れるタスクは、例えば以前に保存された顔のデータベー
スの内容に基づいて、入力された画像の中に1つかそれ
以上の人物を認識することである。高品質の顔認識シス
テムは、照明、背景、顔の表情、位置、縮尺に変化があ
る時や、入力された画像とデータベースの元になるトレ
ーニング画像の間に髪型の違いがあっても、入力された
画像すなわちテスト画像と保存されたデータベースを一
致させることができるはずである。
【0003】顔識別の問題は、詳細には、入力された画
像の人物が保存されたデータベースに含まれる人物の誰
かに一致するか、もし一致するなら、どの人物と一致す
るかを判定する、一対多マッピングをシステムが行うこ
とを要求する。他方、顔の認証の問題は、入力された画
像が(充分に)データベースの中の1人の特定の個人の
データ(通常そのアイデンティティがシステムを使う人
物によって要求される個人のためのデータ)に一致する
かを判定する、一対一マッピングをシステムが行うこと
を要求する。顔の認証がセキュリティの分野で利用され
る一方、顔の識別はセキュリティと同様、新聞報道のよ
うな分野で利用され、そこでは多数のマルチメディア・
データベースから特定の個人の画像を検索できることが
望ましい。
【0004】通常の顔認識システムは、3つの部分、す
なわち、データを分割して重要な部分または特徴を抽出
する前処理ステップ、特徴選択ステップ、分類付けステ
ップからなる。例えば、前処理ステップは、入力された
画像を粗分割して背景のデータから顔のデータを分離す
るステップからなるか、または特徴を生じるために使わ
れる目、鼻、口といった顔の部分の位置を見つけるため
のより細かな分割を含む。前処理ステップはまた、顔の
部分同士の位置関係といったフィーチャー・ベクトルを
抽出する。いずれにしても、一度前処理がなされると、
対象となる部分、すなわち顔は、通常画像の他の部分か
ら抽出されて(寸法と位置について)標準化される。こ
うした前処理は従来通りで、本技術に普通に熟練した者
には周知であるので、ここでの残りの議論は顔認識プロ
セスの特徴抽出および分類付け部分に焦点を当てる。
【0005】重要な顔の部分を抽出したり、または特定
の顔の部分同士の位置関係を判定して、それらをデータ
ベースと比較する識別用の特徴として使うことに基づく
多数の顔認識のための技術が使われたり、および/また
は提案されてきた。あいにく、これらの方法は通常顔の
部分を非常に高い精度で位置決めする能力に依存する。
このことは画像が非常に良く管理された環境で捉えられ
ないと、非常に困難である。さらに、これらの技術の大
部分は画像のエッジの正確な検出や、照明の変化や多く
の量のノイズを伴う質の低い画像に対して特に強くない
ローカル操作に依存する。
【0006】例えば、眼の間の距離、口の幅、眼から鼻
への距離、眼から口までの距離といった位置関係を測定
し、これらのパラメータを、それに対して入力(すなわ
ち、テスト)データとトレーニング・データ(すなわ
ち、データベースに保存されたデータ)の間で突き合わ
される特徴として使おうとする技術は、例えば、R.B
runelli、T.Poggio、「位置的特徴を通
じた顔の認識」、Proc.Europe.Conf.
on Computer Vision、pp.792−
800、1992を含む。
【0007】他方、特徴選択プロセスのための顔の部分
の位置決めに依存しない技術は、例えば、顔の認識のた
めに良く知られたKarhunen−Loeve変換を
使うL.Sirovich、M.Kirby、「人間の
顔の特徴づけのためのロー・ディメンショナル手続
き」、J.Opt.Soc.Amer.、vol4、p
p.519−524と、顔の検出と認識のために「固有
の顔」を定義して使用するM.A.Turk、A.P.
Pentland、「固有の顔を使った顔の認識」Pr
oc.Int.Conf.on Patt.Reco
g.、pp.586−591、1991を含む。これら
のアプローチの各々では、各人の顔は本質的に、あらか
じめ定義された「固有の顔」の集合に適用される重みの
ベクトルとして示される。この特定のアプローチの弱点
の1つは、入力された画像が「固有の顔」を計算するた
めに収集された画像と縮尺や頭の位置の点で同じでない
場合、認識率が大きく低下する点である。
【0008】最後に、顔の認識のためにニューラル・ネ
ットワークも利用される。しかし、ニューラル・ネット
ワークのアプローチは、通常大量のトレーニング・デー
タ(例えば、データベース中の各人について、数百の画
像)を必要とするので、大きなデータベースが必要にな
るため、このアプローチを非実用的なものにしている。
上記で説明された従来技術のアプローチは他のものと同
様、R.Chellappa、C.L.Wilson、
S.Sirohey、「人間と機械による顔の認識:概
観」、Proceedings of the IEE
E、1995年5月で説明されている。
【0009】
【課題を解決するための手段】本発明は、顔の画像デー
タに固有の特性の何らかの事前知識を組み込むことな
く、一般的な画像の統計を利用する信号処理アプローチ
を利用するので有利である。もちろん、これは、大部分
が発見的方法に基づき、一般的に、広い範囲の入力画像
の変化に対して特に強くない、上記で説明された従来技
術の「コンピュータ・ビジョン」アプローチとは対照的
である。詳細には、本発明によれば、画像の中の顔とい
うオブジェクトの認識は、認識されるオブジェクト(例
えば、顔)を含む画像の一部がコード化され、それによ
って生じたコード化データが、既知のオブジェクト・デ
ータベースに保存された、前にコード化されたトレーニ
ング・データと一致する画像の一部を含む、信号圧縮技
術(すなわち、コーディング技術)を使って達成され
る。画像圧縮技術を使うことによって、各オブジェクト
(例えば、人物の顔)は、小さな数の集合によって表す
ことができるので有利である。
【0010】例えば、本発明のある例示としての実施例
によれば、オブジェクト(例えば、顔)を含む入力画像
の一部がピクセル・データのブロックに分解され、各ブ
ロックのピクセル・データに対して、例えば、ディスク
リート・コサイン変換(DCT)のような(リニア)変
換が行われ、変換されたブロックは「ベクトル量子化」
(VQ)され、各人物についてコードベクトルのコード
ブックを発生する。(ブロックをベースとする変換はブ
ロックの信号エネルギーを、少数の有意な変換係数にコ
ンパクト化する効果を持ち、この係数は有利にもブロッ
クを表すために使用できるので有利である。トレーニン
グ集合の中のデータの各ブロックを示す変換係数は、コ
ードベクトルのコードブックを生成するために使われ
る。)一般に、入力されるベクトルの数は、コードブッ
クに保存されたコードベクトルの数よりはるかに大き
い。従って、トレーニング・データを示すために必要な
データの量はさらに圧縮されるので有利である。
【0011】ブロックをベースとする変換(DCTを含
む)とベクトル量子化(VQ)は共に画像コーディング
の分野で共通して使われる周知の技術であり、本技術に
普通に熟練した者には周知の技術である。ディスクリー
ト・コサイン変換は、例えばN.Ahmed、T.Na
tarajan、K.Rao、「ディスクリート・コサ
イン変換」、IEEE Trans.Comput.、
vol23、pp.90−93、1974に説明され、
ベクトル量子化は、例えばY.Linde、A.Buz
o、R.M.Gray、「ベクトル量子化設計のための
アルゴリズム」、IEEE Trans.Commu
n.、COM−28、pp.84−95、1990に説
明されている。トレーニング・データからコードブック
のコードベクトルを生成するために有利にも利用される
例示としての技術の1つは「k平均クラスタリング」と
して知られ、これも本技術に普通に熟練した者には周知
の技術で、例えば、S.P.Lloyd、「PCMにお
ける最小二乗量子化」、IEEE Trans.Inf
orm.Theory、IT−28、pp.127−1
35、1982に説明されている。「ディスクリート・
コサイン変換」、「ベクトル量子化設計のためのアルゴ
リズム」、「PCMにおける最小二乗量子化」はそれぞ
れ、ここで発表されたのと同様に、参照によってここに
組み込まれている。
【0012】本発明のある例示された実施例によれば、
入力画像信号の中の所与のオブジェクトはデータベース
の中に保存された複数の既知のオブジェクトの1つと一
致するが、その際、各既知のオブジェクトの保存された
表示は、既知のオブジェクトを含むトレーニング画像信
号に基づいて生成するコードブックを含む。第1の例示
としての実施例は、所与のオブジェクトをブロックに分
解するステップと、各エンコーディングがコードブック
の1つを使ったオブジェクトのコーディングからなる、
所与のオブジェクトの複数のエンコーディングを行うス
テップと、各エンコーディングについてコーディングの
誤差を判定するステップと、コーディングの誤差に基づ
いて、所与のオブジェクトを既知のオブジェクトの1つ
と突き合わせるステップとを含む。第2の例示としての
実施例は、所与のオブジェクトをブロックに分解するス
テップと、ブロックに基づいて所与のオブジェクトに対
応するコードブックを生成するステップと、所与のオブ
ジェクトに対応するコードブックを各既知のオブジェク
トに対応するコードブックと比較するステップと、所与
のオブジェクトをコードブックの比較に基づいて既知の
オブジェクトの1つと突き合わせるステップとを含む。
【0013】
【発明の実施の形態】図1は、既知の顔のためのデータ
が、本発明の例示としての実施例に従って構成されるデ
ータベース発生プロセスの略図である。各々が既知の個
人の顔の異なった「絵」を含む多数の異なったトレーニ
ング画像が、有利にも図1のプロセスに提供され、それ
によって、異なった照明、背景、顔の表情、姿勢、縮尺
等といった種々の条件下での所与の既知の顔の画像をよ
り完全に反映するコードブックが作り出される。詳細に
は、図1のプロセスは有利にも、その顔がデータベース
に含まれている各人物について繰り返されるので、異な
ったコードブックが、トレーニング集合の中の異なった
人物の各々について、図1のプロセスによって生成され
る。図示されるように、1つかそれ以上のトレーニング
画像(各々が、トレーニング集合の中のi番目の人物の
顔の画像を含む)が処理され、その1人の特定の人物の
ためのコードベクトルの集合を含む、コードブック23
−iとなる。
【0014】図面を参照すると、(上記で説明したよう
に)第1プリプロセッサ21は入力された画像から関心
のある領域(すなわち、顔)を抽出し、縮尺を標準化す
る。従って、それ以降の処理はすべて、有利にも顔につ
いて(しかも顔だけについて)行うことができ、システ
ムに提出される顔はすべて同じ縮尺(すなわち、サイ
ズ)となる。プリプロセッサ21によって行われる前処
理は従来通りで本技術に熟練した者には周知である。
【0015】前処理が完了した後、画像の抽出された部
分はブロックに分解され、各ブロックに対して、変換2
2によって、リニアな、ブロックをベースとする変換が
行われる。ブロックは、例えば、8×8の寸法の領域
(すなわち、8ピクセル対8ピクセルの寸法の正方形)
からなるか、または、16×16の寸法でも良い。ブロ
ックは画像の範囲にわたって隣接しているか、または、
好適には、重なっている(例えば、各範囲について2ピ
クセルずつ)。リニア変換の演算子を元の信号に適用す
ることによって、より有効な表現が得られ、そこではデ
ータは統計的に独立(または少なくとも非相関的)であ
る。さらに、リニア変換はまた、一般にすべての信号圧
縮技術にとって望ましい特性である、大きなエネルギー
のコンパクト化を提供する。画像データ圧縮の分野で普
通に使われる変換の1つが2方向ディスクリート・コサ
イン変換(DCT)であり、本技術に普通に熟練した者
には周知である。DCTは上記で言及した長所の各々を
提供し、現在静止画像と動画の両方について、すべての
国際圧縮規格のための基礎単位である。
【0016】変換22の変換を各画像ブロックに行うこ
とによって、これらのブロックの各々は少数のDCT係
数によって表示できるので有利である。特に、変換22
は、(B×B)ブロックの変換から得られる(B×B)
係数から、最大の信号エネルギー内容を持つ(L)係数
のみを提供する。例えば、ブロックの寸法が8×8(す
なわち、B=8)の時、L=8というDCTの係数が提
供されるので有利である。また、例えば、ブロックの寸
法が16×16(すなわち、B=16)の時、L=16
というDCTの係数が提供されるので有利である。本技
術に普通に熟練した者には周知であるように、最大の信
号エネルギー内容を持つDCT係数は通常低い周波数の
係数に対応する。
【0017】トレーニング・データ中の各ブロックにつ
いて(生成され提供された)DCT係数は、組み合わさ
れて対応するベクトルとなり、その結果生じたベクトル
の集合は、コードブック発生装置25によって、VQコ
ードブックをデザインするために使われる。このコード
ブックはデータベース中の所与の既知の個人の顔を表す
データを含んでいる。コードブック・ベクトルの数は、
通常それらが生成される元となった(DCT)ベクトル
の総数よりはるかに小さいことに留意されたい。例え
ば、1000以上の入力ベクトルが有利にもコードブッ
ク発生装置25に供給され、それらは100以下(例え
ば64)のコードブック・ベクトル(すなわち、コード
ベクトル)を含むコードブックにマッピングされる。コ
ードブック発生装置25によって行われるコードブック
のデザインは、例えば、良く知られた「k平均クラスタ
リング」技術か、または信号圧縮の分野で良く知られて
いる、トレーニング・ベクトルのデータからコードブッ
クをデザインするための従来の技術からなる。
【0018】図3は図1の例示としてのトレーニングの
手続きのコードブック発生装置25によって行われるコ
ードブック発生プロセスの例示としての流れ図である。
上記で説明したように、有利にも顔がデータベースに示
される各人物について行われる、図1のプロセスの終了
結果は、その人物の顔を含む1つかそれ以上のトレーニ
ング画像に基づいて、所与の人物のためのコードブック
を生成することである。従って、コードブックCp が、
各人物について生成されるので、p=1、2、...、
N。この時Nは、データベース中の人物(すなわち、
顔)の数である。各コードブックは複数のコードベクト
ルyi からなり、この時i=1、2、...Mであり、
この時Mは各コードブックのサイズ(すなわち、そこに
含まれるコードベクトルの数)である。この例では、M
は64に等しい。各コードベクトルは、上記で説明した
ように、Lの値(すなわち、DCT係数)からなる。こ
の例では、ブロックは8×8の寸法であり、Lは8であ
る。
【0019】図3に示す例示としての手続きは、トレー
ニング・ベクトルを一連の「中間」コードブックCp 0
p 1、...Cp m...と繰り返し突き合わせ、各反復
の際に、最終的な基準が合致するまでコードブックを変
更する(すなわち、コードブックCp mを改良されたコー
ドブックCp m+1によって置き換える)、反復プロセスを
含む。最終的な反復から生じたコードブックは、データ
ベースの中の特定の個人の顔を表すために使われるコー
ドブックになるので有利である。
【0020】詳細には、図3の例示としての手続きは、
最初の反復で使われるコードブックCp 0を初期化して、
コードベクトルの無作為の集合にする、ステップ31か
ら始まる。これらの無作為に選ばれたコードベクトル
は、例えば、トレーニング集合からの最初のMベクトル
を含むか、または、無作為の値を生成することによって
選択される。その後、各反復mで、ステップ32は、ト
レーニング・ベクトルの(完全な)集合を使って、「ク
ラスタ集合」を形成するが、それは本技術に熟練した者
には周知である。詳細には、各トレーニング・ベクトル
j (この時j=1、2、...J)は、コードブック
p mの中の各コードベクトルyp i(この時i=1、
2、...M)と突き合わされ、誤差関数d(xj ,y
p i)を計算する。この突き合わせの結果、各トレーニン
グ・ベクトルxj は、対応する1つのコードベクトルy
i に関連するクラスタの集合Ri に割り当てられ、すな
わち以下の式となる。 Ri ={x:d(x,yp i)<d(x,yP k)すべてに
ついてk≠i} すなわち、各クラスタの集合Ri は、すべてのトレーニ
ング・ベクトルxからなり、トレーニング・ベクトルx
とi番目のコードベクトルyp iの間の誤差(すなわち、
差)は、トレーニング・ベクトルxとコードブックの中
の他のどのコードベクトルとの間の誤差よりも小さい。
言い換えれば、各トレーニング・ベクトルは、誤差関数
d(x,y)によって決定される、「最も近い」現行の
コードブックの中のコードベクトルに関連するクラスタ
に割り当てられる。誤差関数d(x,y)は何らかの適
当な誤差の計量である。例えば、d(x,y)は、本技
術に普通に熟練した者には周知の、従来の平均二乗誤差
(mse)の計量である。
【0021】ステップ33では、新しいコードブックC
p m+1が、ステップ32の分析から生じたクラスタの集合
に基づく次の反復で使うために展開される。詳細には、
各クラスタの集合Ri について、集合の重心(すなわ
ち、集合の中の独立したベクトルのn次元の加重平均)
が計算される。その後、(次の反復のための)新しいコ
ードブックが、各i=1,2、...、Mについて、計
算された重心cent(Ri )を含むように構成され
る。誤差の計量として平均二乗誤差が使われる場合、重
心は減少して算術的平均になることに留意されたい。す
なわち、Ri =xj(j=1,2、...、‖Ri ‖)
であり、‖Ri ‖が集合Ri の濃度 (すなわち、元の
個数)である時、次の式になる。
【数1】
【0022】ステップ34では、所与の反復に関する総
ひずみの大きさDm が、トレーニング・ベクトルの各々
とそれがクラスタをなす重心の間の距離に基づいて計算
される。すなわち、 Dm =Σd(xj ,cent(Ri )) であり、この時、合計はすべてのj=1,2、...、
Jについて(すなわち、すべてのトレーニング・ベクト
ルについて)行われる。こうして、Dm は、コードブッ
クCp mがトレーニング・ベクトルの所与の集合をコード
化する正確さの度合いを含む。最後に、決定ステップ3
5は、前の反復から現在の反復へのコードブックの質の
改善の度合いを測定するために、計算されたひずみの大
きさ(Dm)と前の反復の際計算されたひずみの大きさ
(Dm-1 )の間の差を計算する。この差が所定のしきい
値TD 以下である場合、さらに反復を行うことによって
得られそうなコードブックの質の改善は小さいので、反
復は有利にも終了される。
【0023】一度既知の顔を表すコードブックのデータ
ベースが作り出されると、顔の認識が、本発明の原理に
従って、データベースに含まれるコードブックの集合に
基づいて行われる。図2は、本発明の例示としての実施
例による顔認識プロセスの略図である。例えば、図1お
よび図3の例示としての手続きを使って生成したものと
して、コードブックのデータベース(例えば、コードブ
ック23−1,23−2、...、23−N)を与えら
れると、図2に示すような例示としての実施例は、入力
画像信号からなる人物の顔を識別する(または顔の同一
性を検証する)ために使われる。
【0024】第1に、図1の例示としてのコードブック
発生プロセスと同一の方法で、プリプロセッサ21は入
力された画像から関心のある領域(すなわち、顔)を抽
出し、縮尺を標準化する。従って、これ以降の処理はす
べて、有利にも顔について、(しかも顔だけについて)
行われ、システムに提示される顔はすべて同じ縮尺(す
なわち、サイズ)である。ここでも、プリプロセッサ2
1によって行われる前処理は、従来通りであり、本技術
に熟練した者には周知である。
【0025】前処理が完了した後、再び図1の例示され
たコードブック発生プロセスと同一の方法によって、入
力された画像の抽出された部分がブロックに分解され、
変換22によって、リニアな、ブロックをベースとする
変換が各ブロックについて行われる。ここでも、ブロッ
クは、例えば、8×8の寸法かまたは16×16の寸法
であり、それらは画像空間にわたって隣接しているか、
好適には、重なり合っている。コードブック23−1か
ら23−Nの生成の際に使われたのと同じ(DCTのよ
うな)変換が、図2の顔認識プロセスでも使われるので
有利である。さらに、同じブロックのサイズが使われる
ので有利であり、同じ(L)係数の集合が提供されるの
で有利である。
【0026】一度DCT入力ベクトルが変換22によっ
て提供されると、選別機24が、(既知の)顔のコード
ブック23−1から23−Nに基づいて、入力された画
像に含まれる顔を識別する(または、顔の検証の場合、
検証する)ために使われる。詳細には、選別機24は、
例えば、どのコードブックが入力された画像から得られ
た入力ベクトルと最も良く一致するかを判断する。顔識
別の場合、「最も一致する」コードブックに関連する顔
が最も有力な候補として識別される。しかし、比較の基
礎となる誤差の計量(例えば、以下の議論を参照)が、
既知の顔のコードブックのいずれについても「十分に」
小さな総誤差の値(例えば、所定のしきい値以下)を提
供せず、(それによって「十分に良い」組み合わせが見
つからないことが示される)場合、システムは既知の顔
のいずれをも入力された画像の顔として認識しない。む
しろ、システムは単純に、顔が画像の中にある人物は、
実際に、顔のデータが以前に収集され、データベースに
保存された人々の中の誰でもないと判断する。
【0027】顔の検証の場合、システムは、要求された
アイデンティティが、入力された画像の中の顔と最も良
く一致すると判断された既知の顔のコードブックと一致
するかどうかに基づいて、要求されたアイデンティティ
を検証または拒絶(すなわち、検証に失敗)する。また
は、システムは入力された画像が、要求されたアイデン
ティティの顔に関連する特定のコードブックに関して分
析された時得られる総誤差の計量が「十分に」小さく、
それによって入力された画像の中の顔と要求されたアイ
デンティティの顔の間に十分「良好な」一致が示される
かどうかに基づいて、要求されたアイデンティティを検
証または拒絶する。
【0028】本発明のある実施例によれば、どの既知の
顔のコードブックが入力された画像の顔と最良の一致を
提供するかの決定は、多数の異なった方法で行うことが
できる。例えば、図2の例示としての顔認識プロセスの
選別機24の動作の2つの例示としての実施例が、それ
ぞれ図4および図5に示される。
【0029】図4は、本発明の第1の例示としての実施
例による図2の例示としての顔認識プロセスの選別機2
4の動作の流れ図である。この実施例によれば、既知の
顔のコードブックの各々は入力画像ベクトルをエンコー
ディングするために使われ、総コーディング誤差はその
エンコーディングの各々について決定される。その後、
総コーディング誤差の最も低いエンコーディングが決定
され、そのエンコーディングで使われたコードブックに
対応する顔が、入力された画像の顔と最も良く一致する
顔として識別される。
【0030】詳細には、図4を参照すると、例示として
のプロセスはステップ41から始まり、そこでは入力さ
れた画像ベクトルの複数の従来のVQコードブックのエ
ンコーディングが行われ、こうしたエンコーディングの
各々は既知の顔のコードブック(すなわち、コードブッ
ク23−1から23−N)の異なった1つを使って行わ
れる。詳細には、また本技術に普通に熟練した者には周
知であるように、これらのエンコーディングの各々は、
入力された画像ベクトルのための所与のコードブックか
らのコードベクトルの1つを選択することからなり、そ
の際、選択は、例えば平均二乗誤差のような誤差の計量
に基づいてなされる。
【0031】選択されたコードベクトルは、入力された
ベクトルとの「最良の一致」を提供するものである。す
なわち、コードベクトルは、各入力ベクトルについて、
入力ベクトルとコーディング(すなわち、選択されたコ
ードベクトル)の間の誤差(すなわち、差)を有利にも
最小にするように選択される。従って、コードベクトル
p iを含む各コードブックCp (この時p=1,
2、...、N)について、各入力ベクトルxj (この
時j=1、2、...、J)は各コードベクトルと比較
され、最小の誤差を生じる1つが決定され、誤差関数d
(x,y)が与えられる。詳細には、コードブックCp
を使った入力ベクトルxj のコーディングに関する最小
誤差を表すdp min(xj )は、各入力ベクトルxj につ
いて、以下のように決定される。
【0032】dp min(xj )={d(xj ,yp i):d
(xj ,yp i)<d(xj ,yp k) すべてk≠i、但しi、k=1、2、...M}
【0033】各エンコーディングが行われた後、図4の
例示としての手続きのステップ44は、各エンコーディ
ングについて(すなわち、すべてのp=1、
2、...、Nについて)総誤差Dp を計算する。これ
らの総誤差は単に個別のコーディング誤差の合計であ
り、以下のように計算される。 Dp =Σdp min(xj ) この時合計はすべてのj=1、2、...、Jについて
行われ、dp min(xj )の個別の値は、上記で示したよ
うに、各入力ベクトルxj のコーディングの際に、対応
するコードブックCp を使って決定される。従って、こ
れらの総誤差の値はコードブックの各々について行われ
たエンコーディングの全体的な質(すなわち、正確さ)
を表す。(もちろん、ステップ44が、ステップ41で
行われるエンコーディングから分離した別個の動作とし
て行われる必要を回避して、これらの総誤差の値がま
た、有利にもエンコーディング・プロセスの間にそれ自
体の一部として計算されることもあることに留意された
い。)
【0034】図4の例示としての手続きを完了すると、
ステップ45は、エンコーディング全体から得られた最
小の総誤差の値(すなわち、Dp が最小になるpの値)
を判断し、ステップ46は、最小の総誤差(すなわち、
最上のエンコーディング)を達成したエンコーディング
の際に使われたコードブックによって示される既知の顔
を選択する。この方法で、入力された画像から得られた
顔は、関連するコードブックが与えられた顔の「最良
の」エンコーディングを生じるデータベースの中の既知
の顔として識別されるので有利である。
【0035】図5は、本発明の第2の例示としての実施
例による図2の例示としての顔認識プロセスの選別機2
4の動作の流れ図である。この例示としての実施例は、
図4の例示としての実施例よりもわずかに性能を低下さ
せるだけで、コンピュータの使用上より簡単な技術が提
供される。詳細には、この第2の例示としての実施例
は、入力された画像についてコードブックを生成し、そ
の後「最上の一致」を決定するためにこのコードブック
を既知の顔のコードブックの各々と比較する。ここで
も、図4の例示された手続きのように、最も低い総誤差
が、最上の一致を示すものと考えられる。しかし、図4
および図5の例示としての手続きの間の差は、(J)個
の入力ベクトルの各々のコーディング(それは、例え
ば、数千のベクトルのコーディングを必要とする)より
もむしろ、図5の手続きの中で、ステップ42が例示す
るように、M個(例えば64)のコードベクトルだけを
含むコードブックを発生することにある。その後、この
より制限されたベクトルの集合(すなわち、通常J>>
Mの時、J個の入力ベクトルでなく、M個のコードベク
トル)が、N個のコードブックを使ってエンコードされ
(ステップ43)、これらの(簡単な)エンコーディン
グの各々から得られた総誤差が(ステップ44〜46
で)使われて、最小の総誤差を持つコードブックによっ
て表される既知の顔を選択する。
【0036】詳細には、ステップ42のコードブックの
生成は、本質的には図3で示したような、既知の顔のコ
ードブックを生成する単に例示的に使われたのと同じ手
続きからなる。しかし、この場合、図3の例示としての
トレーニングの手続きは、トレーニング画像データでは
なく、入力画像データに適用される。(トレーニング画
像ベクトルが有利にも得られる潜在的に多くの画像があ
るのに対して、入力画像ベクトルが得られるのは通常1
つの画像だけしかないことに留意すべきである。)従っ
て、図4の例示としての手続きの代わりに、図5の例示
としての手続きを使うことの利点は、N個のコードブッ
クの各々について、J個の(入力画像から得られた)コ
ードベクトルを、M個の(トレーニング画像から得られ
た)コードベクトルと比較しなければならないのとは違
って、N個のコードブックの各々について、M個の(入
力画像から得られた)コードベクトルをM個の(トレー
ニング画像から得られた)コードベクトルと比較するだ
けで良いということである。通常、J>>Mなので、こ
のことは計算量の大きな節約になるので有利である。こ
こでも、使われる誤差の計量は平均二乗誤差であるか、
または、本技術に普通に熟練した者には周知の、何らか
の他の誤差の計量でもよい。
【0037】ここでは本発明の多数の特定の実施例が示
され説明されたが、これらの実施例は、本発明の原理の
適用例の中で考案できる多くのありうる特定の配置を例
示したものに過ぎないことが理解されるべきである。例
えば、上記の説明は人間の顔の認識に焦点を当てている
が、本技術に熟練した者には、本発明の技術が、所与の
オブジェクトが、その表示がデータベースに保存されて
いる複数の既知のオブジェクトの1つと一致する、何ら
かの一般的な画像認識に適用可能なことが理解されるだ
ろう。さらに、上記で説明された本発明の実施例は、例
えば、入力ベクトルとコードベクトルの間の差を測定す
るために平均二乗誤差を利用しているが、他の実施例
は、例えば、知覚的基準を組み込んだ知覚的計量を含
む、他の誤差の計量を使うことができる。こうした知覚
的計量は本技術に熟練した者には周知である。本技術に
普通に熟練した者によって、本発明の精神と範囲から逸
脱することなく、本発明の原理に従って無数の多様な装
置が得られる。
【図面の簡単な説明】
【図1】既知の顔のためのデータが本発明の例示として
の実施例に従って構成される、データベース発生プロセ
スの略図である。
【図2】本発明の例示としての実施例による顔認識プロ
セスの略図である。
【図3】図1の例示としてのデータベース発生プロセス
の例示としてのコードブック発生装置の流れ図である。
【図4】本発明の第1の例示としての実施例による図2
の例示としての顔認識プロセスの選別機の流れ図であ
る。
【図5】本発明の第2の例示としての実施例による図2
の例示としての顔認識プロセスの選別機の流れ図であ
る。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 キシアオユ ツァン アメリカ合衆国 08854 ニュージャーシ ィ,ピスカッタウェイ,アパートメント ナンバー274,ロイヤル ドライヴ 60

Claims (35)

    【特許請求の範囲】
  1. 【請求項1】 入力画像信号に含まれる所与のオブジェ
    クトを複数の既知のオブジェクトの1つと突き合わせる
    方法であって、既知のオブジェクトの各々の表示がデー
    タベースに保存されており、それに対応するコードブッ
    クからなり、各コードブックが、対応する既知のオブジ
    ェクトからなる、1つかそれ以上の対応するトレーニン
    グ画像信号に基づいて生成した複数のコードベクトルか
    らなり、該方法が、 所与のオブジェクトを含む入力画像信号の一部を複数の
    ブロックに分解するステップと、 各入力ベクトルが対応するブロックに基づく、複数のブ
    ロックに対応する複数の入力ベクトルを生成するステッ
    プと、 所与のオブジェクトを、1つかそれ以上の入力ベクトル
    と、既知のオブジェクトに対応する1つかそれ以上のコ
    ードブックに含まれる1つかそれ以上のコードベクトル
    に基づく既知のオブジェクトの1つと突き合わせるステ
    ップとを含む方法。
  2. 【請求項2】 所与のオブジェクトを既知のオブジェク
    トの1つと突き合わせるステップが、 各エンコーディングが、対応する1つのコードブックに
    含まれる1つかそれ以上のコードベクトルに基づく1つ
    かそれ以上の入力ベクトルのコーディングからなる、入
    力画像信号の少なくとも一部の複数のエンコーディング
    を行うステップと、 複数のエンコーディングに対応する複数のコーディング
    誤差を判断するステップと、 複数のコーディング誤差に基づいて、所与のオブジェク
    トを既知のオブジェクトの1つと突き合わせるステップ
    とを含む、請求項1に記載の方法。
  3. 【請求項3】 コーディング誤差が平均二乗誤差からな
    る、請求項2に記載の方法。
  4. 【請求項4】 複数のコーディング誤差を比較して、最
    も小さいコーディング誤差を決定するステップを含み、
    その際、所与のオブジェクトを既知のオブジェクトの1
    つと突き合わせるステップが、入力画像信号の少なくと
    も一部がエンコードされた時、最も小さいコーディング
    誤差を発生したコードブックに対応する既知のオブジェ
    クトを選択するステップをさらに含む、請求項2に記載
    の方法。
  5. 【請求項5】 所与のオブジェクトを既知のオブジェク
    トの1つと突き合わせるステップが、 1つかそれ以上の入力ベクトルに基づいて、所与のオブ
    ジェクトに対応するコードブックを生成するステップ
    と、 所与のオブジェクトに対応するコードブックを、既知の
    オブジェクトに対応する1つかそれ以上のコードブック
    と比較するステップと、 所与のオブジェクトに対応するコードブックと、既知の
    オブジェクトに対応するコードブックとの比較に基づい
    て、所与のオブジェクトを既知のオブジェクトの1つと
    突き合わせるステップとを含む、請求項1に記載の方
    法。
  6. 【請求項6】 所与のオブジェクトに対応するコードブ
    ックを既知のオブジェクトに対応するコードブックと比
    較するステップが、各比較について平均二乗誤差を計算
    するステップを含む、請求項5に記載の方法。
  7. 【請求項7】 計算された平均二乗誤差から最小の平均
    二乗誤差を決定するステップをさらに含み、所与のオブ
    ジェクトを既知のオブジェクトの1つと突き合わせるス
    テップが、所与のオブジェクトに対応するコードブック
    と比較する時最小の平均二乗誤差を生じるコードブック
    と対応する既知のオブジェクトを選択するステップを含
    む、請求項6に記載の方法。
  8. 【請求項8】 入力ベクトルを生成するステップが、ブ
    ロックにリニア変換を行うステップと、変換されたブロ
    ックに基づいて入力ベクトルを生成するステップとを含
    む、請求項1に記載の方法。
  9. 【請求項9】 リニア変換が、ディスクリート・コサイ
    ン変換を含む、請求項8に記載の方法。
  10. 【請求項10】 既知のオブジェクトに対応するコード
    ブックがベクトル量子化コードブックを含む、請求項1
    に記載の方法。
  11. 【請求項11】 既知のオブジェクトに対応するコード
    ブックに含まれるコードベクトルが、k平均クラスタリ
    ング技術を使って、1つかそれ以上の対応するトレーニ
    ング画像信号から生成された、請求項1に記載の方法。
  12. 【請求項12】 所与のオブジェクトを、所与のオブジ
    ェクトと一致する既知のオブジェクトとして識別するス
    テップをさらに含む、請求項1に記載の方法。
  13. 【請求項13】 所与のオブジェクトの要求されたアイ
    デンティフィケーションが所与のオブジェクトと一致す
    る既知のオブジェクトからなることを検証するステップ
    をさらに含む、請求項1に記載の方法。
  14. 【請求項14】 所与のオブジェクトと既知のオブジェ
    クトの各々が人間の顔を含む、請求項1に記載の方法。
  15. 【請求項15】 既知のオブジェクトの複数の表示を含
    むデータベースを生成する方法であって、データベース
    は入力画像信号に含まれる所与のオブジェクトを既知の
    オブジェクトの1つと突き合わせる際に使うためのもの
    であって、既知のオブジェクトの表示の各々が対応する
    コードブックからなり、該方法が、 既知のオブジェクトの各々について、各トレーニング画
    像信号の一部が既知のオブジェクトを含む、1つかそれ
    以上のトレーニング画像信号の各々の一部を複数のブロ
    ックに分解するステップと、 既知のオブジェクトの各々について、各トレーニング・
    ベクトルが対応するブロックに基づく、複数のブロック
    に対応する複数のトレーニング・ベクトルを生成するス
    テップと、 既知のオブジェクトの各々について、既知のオブジェク
    トを含むトレーニング画像信号から生成された1つかそ
    れ以上のトレーニング・ベクトルに基づいて、対応する
    コードブックを生成するステップとを含む方法。
  16. 【請求項16】 トレーニング・ベクトルを生成するス
    テップが、ブロックにリニア変換を行うステップと、変
    換されたブロックに基づいてトレーニング・ベクトルを
    生成するステップとを含む、請求項15に記載の方法。
  17. 【請求項17】 リニア変換がディスクリート・コサイ
    ン変換を含む、請求項16に記載の方法。
  18. 【請求項18】 生成されたコードブックの各々がベク
    トル量子化コードブックを含む、請求項15に記載の方
    法。
  19. 【請求項19】 コードブックの各々が、k平均クラス
    タリング技術を使って、対応するトレーニング・ベクト
    ルから生成する、請求項15に記載の方法。
  20. 【請求項20】 所与のオブジェクトと既知のオブジェ
    クトの各々が人間の顔を含む、請求項15に記載の方
    法。
  21. 【請求項21】 入力画像信号からなる所与のオブジェ
    クトを複数の既知のオブジェクトの1つと突き合わせる
    ためのシステムであって、既知のオブジェクトの各々の
    表示がデータベースに保存されて対応するコードブック
    からなり、各コードブックが、対応する既知のオブジェ
    クトを含む1つかそれ以上の対応するトレーニング画像
    信号に基づいて生成された複数のコードベクトルからな
    り、該システムが、 所与のオブジェクトを含む入力画像信号の一部を複数の
    ブロックに分解するための手段と、 各入力ベクトルが対応するブロックに基づく、複数のブ
    ロックに対応する複数の入力ベクトルを生成するための
    手段と、 1つかそれ以上の入力ベクトルと、既知のオブジェクト
    に対応する1つかそれ以上のコードブックに含まれる1
    つかそれ以上のコードベクトルに基づいて、所与のオブ
    ジェクトを既知のオブジェクトの1つと突き合わせるた
    めの手段とを備えてなるシステム。
  22. 【請求項22】 所与のオブジェクトを既知のオブジェ
    クトの1つと突き合わせるための手段が、 各エンコーディングが、コードブックの対応する1つに
    含まれる1つかそれ以上のコードベクトルに基づく1つ
    かそれ以上の入力ベクトルのコーディングを含む、入力
    画像信号の少なくとも一部分の複数のエンコーディング
    を行うための手段と、 複数のエンコーディングに対応する複数のコーディング
    誤差を判断するための手段と、 複数のコーディング誤差に基づいて、所与のオブジェク
    トを既知のオブジェクトの1つと突き合わせるための手
    段とを備えてなる、請求項21に記載のシステム。
  23. 【請求項23】 複数のコーディング誤差を比較して最
    小のコーディング誤差を決定するコンパレータをさらに
    含み、所与のオブジェクトを既知のオブジェクトの1つ
    と突き合わせるための手段が、入力画像信号の少なくと
    も一部がエンコードされた時、最も小さなコーディング
    誤差を発生したコードブックに対応する既知のオブジェ
    クトを選択するセレクタを含む、請求項22に記載の方
    法。
  24. 【請求項24】 所与のオブジェクトを既知のオブジェ
    クトの1つと突き合わせるための手段が、 1つかそれ以上の入力ベクトルに基づいて、所与のオブ
    ジェクトに対応するコードブックを生成するための手段
    と、 所与のオブジェクトに対応するコードブックを、既知の
    オブジェクトに対応する1つかそれ以上のコードブック
    と比較するコンパレータと、 所与のオブジェクトに対応するコードブックと、既知の
    オブジェクトに対応するコードブックとの比較に基づい
    て、所与のオブジェクトを既知のオブジェクトの1つと
    突き合わせるための手段とを備えてなる、請求項21に
    記載のシステム。
  25. 【請求項25】 コンパレータが各比較について、平均
    二乗誤差を計算する、請求項24に記載のシステム。
  26. 【請求項26】 計算された平均二乗誤差から最小の平
    均二乗誤差を決定するための手段をさらに含み、所与の
    オブジェクトを既知のオブジェクトの1つと突き合わせ
    るための手段が、既知のオブジェクトと対応するコード
    ブックと比較される時最小の平均二乗誤差となるコード
    ブックに対応する既知のオブジェクトを選択するセレク
    タを含む、請求項25に記載のシステム。
  27. 【請求項27】 所与のオブジェクトに対応するコード
    ブックを生成するための手段が、k平均クラスタリング
    技術を行うための手段を含む、請求項24に記載のシス
    テム。
  28. 【請求項28】 入力ベクトルを生成するための手段
    が、ブロックにリニア変換を行うための手段と、変換さ
    れたブロックに基づいて入力ベクトルを生成するための
    手段とを備えてなる、請求項21に記載のシステム。
  29. 【請求項29】 所与のオブジェクトを、所与のオブジ
    ェクトと一致する既知のオブジェクトとして識別するた
    めの手段をさらに含む、請求項21に記載のシステム。
  30. 【請求項30】 所与のオブジェクトの要求されたアイ
    デンティフィケーションが、所与のオブジェクトと一致
    した既知のオブジェクトを含むことを検証するための手
    段をさらに含む、請求項21に記載のシステム。
  31. 【請求項31】 所与のオブジェクトと、各既知のオブ
    ジェクトが人間の顔を含む、請求項21に記載のシステ
    ム。
  32. 【請求項32】 既知のオブジェクトの複数の表示から
    なるデータベースを生成するためのシステムであって、
    そのデータベースが入力画像信号に含まれる所与のオブ
    ジェクトを既知のオブジェクトの1つと突き合わせる際
    に使うためのもので、既知のオブジェクトの表示の各々
    が対応するコードブックを含み、該システムが、 既知のオブジェクトの各々に適用される、各トレーニン
    グ画像信号の一部が既知のオブジェクトを含む、1つか
    それ以上のトレーニング画像信号の各々の一部を複数の
    ブロックに分解するための手段と、 既知のオブジェクトの各々に適用される、各トレーニン
    グ・ベクトルが対応するブロックに基づく、複数のブロ
    ックに対応する複数のトレーニング・ベクトルを生成す
    るための手段と、 既知のオブジェクトの各々に適用される、既知のオブジ
    ェクトを含むトレーニング画像信号から生成された1つ
    かそれ以上のトレーニング・ベクトルに基づいて、対応
    するコードブックを生成するための手段とを備えてなる
    システム。
  33. 【請求項33】 トレーニング・ベクトルを生成するた
    めの手段が、ブロックにリニア変換を行うための手段
    と、変換されたブロックに基づいてトレーニング・ベク
    トルを生成するための手段とを備えてなる、請求項32
    に記載のシステム。
  34. 【請求項34】 コードブックを生成するための手段
    が、k平均クラスタリング技術を行うための手段を備え
    てなる、請求項32に記載のシステム。
  35. 【請求項35】 所与のオブジェクトと各既知のオブジ
    ェクトが人間の顔を含む、請求項32に記載のシステ
    ム。
JP11546197A 1996-05-06 1997-05-06 Dctをベースとするフィーチャー・ベクトルを使った顔の認識 Expired - Fee Related JP3649311B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/643,685 US5802208A (en) 1996-05-06 1996-05-06 Face recognition using DCT-based feature vectors
US08/643685 1996-05-06

Publications (2)

Publication Number Publication Date
JPH1055444A true JPH1055444A (ja) 1998-02-24
JP3649311B2 JP3649311B2 (ja) 2005-05-18

Family

ID=24581863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11546197A Expired - Fee Related JP3649311B2 (ja) 1996-05-06 1997-05-06 Dctをベースとするフィーチャー・ベクトルを使った顔の認識

Country Status (4)

Country Link
US (1) US5802208A (ja)
EP (1) EP0806739B1 (ja)
JP (1) JP3649311B2 (ja)
DE (1) DE69718553T2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122522A (ja) * 2003-10-17 2005-05-12 Hitachi Ltd ユニークコード生成装置および方法、ならびにプログラム、記録媒体
US6996257B2 (en) 2000-12-19 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for lighting- and view -angle-invariant face description with first- and second-order eigenfeatures
KR100714112B1 (ko) 2005-12-09 2007-05-02 한국전자통신연구원 얼굴 인식 인증 방법 및 장치

Families Citing this family (139)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
USRE47908E1 (en) 1991-12-23 2020-03-17 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
USRE46310E1 (en) 1991-12-23 2017-02-14 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
USRE48056E1 (en) 1991-12-23 2020-06-16 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
KR970073120A (ko) * 1996-04-15 1997-11-07 이준 블럭 단위의 벡터 양자화된 신호의 복호화 방법
US6819783B2 (en) 1996-09-04 2004-11-16 Centerframe, Llc Obtaining person-specific images in a public venue
JP2918499B2 (ja) * 1996-09-17 1999-07-12 株式会社エイ・ティ・アール人間情報通信研究所 顔画像情報変換方法および顔画像情報変換装置
KR100295225B1 (ko) * 1997-07-31 2001-07-12 윤종용 컴퓨터에서 영상정보 검색장치 및 방법
JPH11250071A (ja) * 1998-02-26 1999-09-17 Minolta Co Ltd 画像データベースの構築方法および画像データベース装置並びに画像情報記憶媒体
US6332139B1 (en) * 1998-11-09 2001-12-18 Mega Chips Corporation Information communication system
US20030059124A1 (en) * 1999-04-16 2003-03-27 Viisage Technology, Inc. Real-time facial recognition and verification system
JP2001014052A (ja) * 1999-06-25 2001-01-19 Toshiba Corp コンピュータシステムの個人認証方法、コンピュータシステム、及び記録媒体
US6636619B1 (en) 1999-07-07 2003-10-21 Zhongfei Zhang Computer based method and apparatus for object recognition
US6501857B1 (en) * 1999-07-20 2002-12-31 Craig Gotsman Method and system for detecting and classifying objects in an image
US20020143862A1 (en) * 2000-05-19 2002-10-03 Atitania Ltd. Method and apparatus for transferring information between a source and a destination on a network
WO2002019137A1 (en) * 2000-08-29 2002-03-07 Imageid Ltd. Indexing, storage & retrieval of digital images
CN1606758A (zh) 2000-08-31 2005-04-13 雷泰克公司 传感器和成像系统
US6763148B1 (en) 2000-11-13 2004-07-13 Visual Key, Inc. Image recognition methods
US6968092B1 (en) * 2001-08-21 2005-11-22 Cisco Systems Canada Co. System and method for reduced codebook vector quantization
US7113916B1 (en) * 2001-09-07 2006-09-26 Hill Daniel A Method of facial coding monitoring for the purpose of gauging the impact and appeal of commercially-related stimuli
AU2002362085A1 (en) * 2001-12-07 2003-07-09 Canesta Inc. User interface for electronic devices
US6734798B2 (en) 2002-01-31 2004-05-11 Ervin M. Smith Fuel dispenser with a human detection and recognition system
US10242255B2 (en) 2002-02-15 2019-03-26 Microsoft Technology Licensing, Llc Gesture recognition system using depth perceptive sensors
US7340077B2 (en) * 2002-02-15 2008-03-04 Canesta, Inc. Gesture recognition system using depth perceptive sensors
AU2003219926A1 (en) * 2002-02-26 2003-09-09 Canesta, Inc. Method and apparatus for recognizing objects
US7369685B2 (en) * 2002-04-05 2008-05-06 Identix Corporation Vision-based operating method and system
US20040052418A1 (en) * 2002-04-05 2004-03-18 Bruno Delean Method and apparatus for probabilistic image analysis
JP4703115B2 (ja) 2002-04-12 2011-06-15 エージェンシー フォー サイエンス,テクノロジー アンド リサーチ 顔プロトタイプ合成システム
US7151530B2 (en) 2002-08-20 2006-12-19 Canesta, Inc. System and method for determining an input selected by a user through a virtual interface
AU2003260047A1 (en) * 2002-08-29 2004-03-19 Paul Rudolf Associative memory device and method based on wave propagation
US7321699B2 (en) 2002-09-06 2008-01-22 Rytec Corporation Signal intensity range transformation apparatus and method
US7526120B2 (en) * 2002-09-11 2009-04-28 Canesta, Inc. System and method for providing intelligent airbag deployment
US20040066500A1 (en) * 2002-10-02 2004-04-08 Gokturk Salih Burak Occupancy detection and measurement system and method
US8494286B2 (en) 2008-02-05 2013-07-23 DigitalOptics Corporation Europe Limited Face detection in mid-shot digital images
US7269292B2 (en) 2003-06-26 2007-09-11 Fotonation Vision Limited Digital image adjustable compression and resolution using face detection information
US8593542B2 (en) 2005-12-27 2013-11-26 DigitalOptics Corporation Europe Limited Foreground/background separation using reference images
US7620218B2 (en) 2006-08-11 2009-11-17 Fotonation Ireland Limited Real-time face tracking with reference images
US8896725B2 (en) 2007-06-21 2014-11-25 Fotonation Limited Image capture device with contemporaneous reference image capture mechanism
US8553949B2 (en) 2004-01-22 2013-10-08 DigitalOptics Corporation Europe Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US9692964B2 (en) 2003-06-26 2017-06-27 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US7792335B2 (en) 2006-02-24 2010-09-07 Fotonation Vision Limited Method and apparatus for selective disqualification of digital images
US7616233B2 (en) 2003-06-26 2009-11-10 Fotonation Vision Limited Perfecting of digital image capture parameters within acquisition devices using face detection
US7565030B2 (en) 2003-06-26 2009-07-21 Fotonation Vision Limited Detecting orientation of digital images using face detection information
US8498452B2 (en) 2003-06-26 2013-07-30 DigitalOptics Corporation Europe Limited Digital image processing using face detection information
US7844076B2 (en) 2003-06-26 2010-11-30 Fotonation Vision Limited Digital image processing using face detection and skin tone information
US8363951B2 (en) 2007-03-05 2013-01-29 DigitalOptics Corporation Europe Limited Face recognition training method and apparatus
US8989453B2 (en) 2003-06-26 2015-03-24 Fotonation Limited Digital image processing using face detection information
US8330831B2 (en) 2003-08-05 2012-12-11 DigitalOptics Corporation Europe Limited Method of gathering visual meta data using a reference image
US8155397B2 (en) 2007-09-26 2012-04-10 DigitalOptics Corporation Europe Limited Face tracking in a camera processor
US9129381B2 (en) 2003-06-26 2015-09-08 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US7440593B1 (en) * 2003-06-26 2008-10-21 Fotonation Vision Limited Method of improving orientation and color balance of digital images using face detection information
US7792970B2 (en) 2005-06-17 2010-09-07 Fotonation Vision Limited Method for establishing a paired connection between media devices
US7574016B2 (en) 2003-06-26 2009-08-11 Fotonation Vision Limited Digital image processing using face detection information
US8682097B2 (en) 2006-02-14 2014-03-25 DigitalOptics Corporation Europe Limited Digital image enhancement with reference images
US8948468B2 (en) 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US7471846B2 (en) 2003-06-26 2008-12-30 Fotonation Vision Limited Perfecting the effect of flash within an image acquisition devices using face detection
US7643684B2 (en) * 2003-07-15 2010-01-05 Samsung Electronics Co., Ltd. Apparatus for and method of constructing multi-view face database, and apparatus for and method of generating multi-view face descriptor
US7439074B2 (en) * 2003-09-30 2008-10-21 Hoa Duc Nguyen Method of analysis of alcohol by mass spectrometry
US7564994B1 (en) * 2004-01-22 2009-07-21 Fotonation Vision Limited Classification system for consumer digital images using automatic workflow and face detection and recognition
WO2006014095A1 (fr) * 2004-08-04 2006-02-09 Daulet Kulenov Procede de formation d'une base de karhunen-loeve pour reconnaissance de visages
US8320641B2 (en) * 2004-10-28 2012-11-27 DigitalOptics Corporation Europe Limited Method and apparatus for red-eye detection using preview or other reference images
US8503800B2 (en) 2007-03-05 2013-08-06 DigitalOptics Corporation Europe Limited Illumination detection using classifier chains
US7715597B2 (en) 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
US8488023B2 (en) * 2009-05-20 2013-07-16 DigitalOptics Corporation Europe Limited Identifying facial expressions in acquired digital images
US7315631B1 (en) 2006-08-11 2008-01-01 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US8009871B2 (en) 2005-02-08 2011-08-30 Microsoft Corporation Method and system to segment depth images and to detect shapes in three-dimensionally acquired data
US8235725B1 (en) 2005-02-20 2012-08-07 Sensory Logic, Inc. Computerized method of assessing consumer reaction to a business stimulus employing facial coding
WO2006091869A2 (en) 2005-02-25 2006-08-31 Youfinder Intellectual Property Licensing Limited Liability Company Automated indexing for distributing event photography
US20060193520A1 (en) * 2005-02-28 2006-08-31 Takeshi Mita Object detection apparatus, learning apparatus, object detection system, object detection method and object detection program
WO2007011709A2 (en) * 2005-07-18 2007-01-25 Youfinder Intellectual Property Licensing Limited Liability Company Manually-assisted automated indexing of images using facial recognition
US9015740B2 (en) 2005-12-12 2015-04-21 The Nielsen Company (Us), Llc Systems and methods to wirelessly meter audio/visual devices
US7804983B2 (en) 2006-02-24 2010-09-28 Fotonation Vision Limited Digital image acquisition control and correction method and apparatus
US7965875B2 (en) 2006-06-12 2011-06-21 Tessera Technologies Ireland Limited Advances in extending the AAM techniques from grayscale to color images
US8467570B2 (en) * 2006-06-14 2013-06-18 Honeywell International Inc. Tracking system with fused motion and object detection
US7930199B1 (en) 2006-07-21 2011-04-19 Sensory Logic, Inc. Method and report assessing consumer reaction to a stimulus by matching eye position with facial coding
WO2008015586A2 (en) 2006-08-02 2008-02-07 Fotonation Vision Limited Face recognition with combined pca-based datasets
US7403643B2 (en) 2006-08-11 2008-07-22 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US7916897B2 (en) 2006-08-11 2011-03-29 Tessera Technologies Ireland Limited Face tracking for controlling imaging parameters
US8315463B2 (en) * 2006-11-14 2012-11-20 Eastman Kodak Company User interface for face recognition
KR100855631B1 (ko) 2006-12-26 2008-09-01 (주)엔토시스 특징벡터 검출장치 및 방법, 그리고, 이를 이용한얼굴인식장치 및 방법
US8055067B2 (en) 2007-01-18 2011-11-08 DigitalOptics Corporation Europe Limited Color segmentation
DE602008001607D1 (de) * 2007-02-28 2010-08-05 Fotonation Vision Ltd Trennung der direktionalen beleuchtungsvariabilität in der statistischen gesichtsmodellierung auf basis von texturraumzerlegungen
EP2188759A1 (en) 2007-03-05 2010-05-26 Fotonation Vision Limited Face searching and detection in a digital image acquisition device
WO2008109622A1 (en) 2007-03-05 2008-09-12 Fotonation Vision Limited Face categorization and annotation of a mobile phone contact list
KR101464397B1 (ko) 2007-03-29 2014-11-28 더 닐슨 컴퍼니 (유에스) 엘엘씨 마케팅 및 엔터테인먼트 효과의 분석
GB2447976B (en) * 2007-03-30 2011-04-27 Sony Uk Ltd Apparatus and method of image capture
US9886981B2 (en) 2007-05-01 2018-02-06 The Nielsen Company (Us), Llc Neuro-feedback based stimulus compression device
US8392253B2 (en) 2007-05-16 2013-03-05 The Nielsen Company (Us), Llc Neuro-physiology and neuro-behavioral based stimulus targeting system
JP2008294584A (ja) * 2007-05-22 2008-12-04 Panasonic Corp ダイジェスト再生装置及び方法
US7916971B2 (en) 2007-05-24 2011-03-29 Tessera Technologies Ireland Limited Image processing method and apparatus
US7991199B2 (en) * 2007-06-29 2011-08-02 Microsoft Corporation Object identification and verification using transform vector quantization
KR20100038107A (ko) 2007-07-30 2010-04-12 뉴로포커스, 인크. 신경-반응 자극 및 자극 속성 공명 추정기
US20090041311A1 (en) * 2007-08-09 2009-02-12 Jon Hundley Facial recognition based content blocking system
US8386313B2 (en) 2007-08-28 2013-02-26 The Nielsen Company (Us), Llc Stimulus placement system using subject neuro-response measurements
US8392255B2 (en) 2007-08-29 2013-03-05 The Nielsen Company (Us), Llc Content based selection and meta tagging of advertisement breaks
US20090083129A1 (en) 2007-09-20 2009-03-26 Neurofocus, Inc. Personalized content delivery using neuro-response priming data
US8327395B2 (en) 2007-10-02 2012-12-04 The Nielsen Company (Us), Llc System providing actionable insights based on physiological responses from viewers of media
EP2214550A1 (en) 2007-10-31 2010-08-11 Emsense Corporation Systems and methods providing distributed collection and centralized processing of physiological responses from viewers
US8064653B2 (en) * 2007-11-29 2011-11-22 Viewdle, Inc. Method and system of person identification by facial image
US8750578B2 (en) 2008-01-29 2014-06-10 DigitalOptics Corporation Europe Limited Detecting facial expressions in digital images
US7855737B2 (en) 2008-03-26 2010-12-21 Fotonation Ireland Limited Method of making a digital camera image of a scene including the camera user
WO2010012448A2 (en) 2008-07-30 2010-02-04 Fotonation Ireland Limited Automatic face and skin beautification using face detection
WO2010063463A2 (en) 2008-12-05 2010-06-10 Fotonation Ireland Limited Face recognition using face tracker classifier data
US20100250325A1 (en) 2009-03-24 2010-09-30 Neurofocus, Inc. Neurological profiles for market matching and stimulus presentation
US8600100B2 (en) * 2009-04-16 2013-12-03 Sensory Logic, Inc. Method of assessing people's self-presentation and actions to evaluate personality type, behavioral tendencies, credibility, motivations and other insights through facial muscle activity and expressions
US8326002B2 (en) * 2009-08-13 2012-12-04 Sensory Logic, Inc. Methods of facial coding scoring for optimally identifying consumers' responses to arrive at effective, incisive, actionable conclusions
US10987015B2 (en) 2009-08-24 2021-04-27 Nielsen Consumer Llc Dry electrodes for electroencephalography
US8392268B2 (en) 2009-09-02 2013-03-05 Image Holdings Method and system of displaying, managing and selling images in an event photography environment
US8332281B2 (en) 2009-09-02 2012-12-11 Image Holdings Method of displaying, managing and selling images in an event photography environment
US8379917B2 (en) 2009-10-02 2013-02-19 DigitalOptics Corporation Europe Limited Face recognition performance using additional image features
US20110106750A1 (en) * 2009-10-29 2011-05-05 Neurofocus, Inc. Generating ratings predictions using neuro-response data
US9560984B2 (en) 2009-10-29 2017-02-07 The Nielsen Company (Us), Llc Analysis of controlled and automatic attention for introduction of stimulus material
US8684742B2 (en) 2010-04-19 2014-04-01 Innerscope Research, Inc. Short imagery task (SIT) research method
US8655428B2 (en) 2010-05-12 2014-02-18 The Nielsen Company (Us), Llc Neuro-response data synchronization
KR20120040015A (ko) * 2010-10-18 2012-04-26 한국전자통신연구원 벡터 분류기 및 그것의 벡터 분류 방법
US9323980B2 (en) 2011-05-13 2016-04-26 Microsoft Technology Licensing, Llc Pose-robust recognition
US9251402B2 (en) * 2011-05-13 2016-02-02 Microsoft Technology Licensing, Llc Association and prediction in facial recognition
US9569986B2 (en) 2012-02-27 2017-02-14 The Nielsen Company (Us), Llc System and method for gathering and analyzing biometric user feedback for use in social media and advertising applications
CA2819853A1 (en) * 2012-06-28 2013-12-28 Frederik Hoffmann Passenger service unit with gesture control
US9576175B2 (en) * 2014-05-16 2017-02-21 Verizon Patent And Licensing Inc. Generating emoticons based on an image of a face
US9936250B2 (en) 2015-05-19 2018-04-03 The Nielsen Company (Us), Llc Methods and apparatus to adjust content presented to an individual
KR102518243B1 (ko) * 2016-01-05 2023-04-06 한국전자통신연구원 관상학적 특징 정보를 이용한 얼굴인식 장치 및 방법
CN114693289A (zh) 2016-06-11 2022-07-01 苹果公司 用于交易的用户界面
US10621581B2 (en) 2016-06-11 2020-04-14 Apple Inc. User interface for transactions
US9842330B1 (en) 2016-09-06 2017-12-12 Apple Inc. User interfaces for stored-value accounts
US10789550B2 (en) * 2017-04-13 2020-09-29 Battelle Memorial Institute System and method for generating test vectors
US10304209B2 (en) 2017-04-19 2019-05-28 The Nielsen Company (Us), Llc Methods and systems to increase accuracy of eye tracking
CN114363278B (zh) * 2017-05-16 2023-06-23 苹果公司 用于消息传送的方法、电子设备以及计算机可读存储介质
US11221744B2 (en) 2017-05-16 2022-01-11 Apple Inc. User interfaces for peer-to-peer transfers
CN112561537A (zh) 2018-06-03 2021-03-26 苹果公司 用于转账账户的用户界面
US11100498B2 (en) 2018-06-03 2021-08-24 Apple Inc. User interfaces for transfer accounts
US11328352B2 (en) 2019-03-24 2022-05-10 Apple Inc. User interfaces for managing an account
US12118562B2 (en) 2020-05-29 2024-10-15 Apple Inc. Configuring an account for a second user identity
US11983702B2 (en) 2021-02-01 2024-05-14 Apple Inc. Displaying a representation of a card with a layered structure
US11921992B2 (en) 2021-05-14 2024-03-05 Apple Inc. User interfaces related to time
US11784956B2 (en) 2021-09-20 2023-10-10 Apple Inc. Requests to add assets to an asset account
US11900725B2 (en) * 2021-12-02 2024-02-13 Optum, Inc. Authentication and facial recognition through analysis of optometric prescription data

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8415996D0 (en) * 1984-06-22 1984-07-25 Bank Of England Image model
WO1991006051A1 (en) * 1989-10-13 1991-05-02 Oilfield Systems Limited System and method for handling data
US5313532A (en) * 1990-01-23 1994-05-17 Massachusetts Institute Of Technology Recognition of patterns in images
JP2710188B2 (ja) * 1991-10-03 1998-02-10 インターナショナル・ビジネス・マシーンズ・コーポレイション データ処理システムとユーザの間で対話を生成する方法およびデータ処理装置
FR2693615B1 (fr) * 1992-07-07 1994-08-26 Thomson Csf Procédé d'identification d'objets dans une image.
AU6938894A (en) * 1994-03-03 1995-09-18 Alexandr Sergeevich Dmitriev Method of objects recognition

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6996257B2 (en) 2000-12-19 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for lighting- and view -angle-invariant face description with first- and second-order eigenfeatures
JP2005122522A (ja) * 2003-10-17 2005-05-12 Hitachi Ltd ユニークコード生成装置および方法、ならびにプログラム、記録媒体
KR100714112B1 (ko) 2005-12-09 2007-05-02 한국전자통신연구원 얼굴 인식 인증 방법 및 장치

Also Published As

Publication number Publication date
EP0806739A3 (en) 1999-01-20
DE69718553D1 (de) 2003-02-27
DE69718553T2 (de) 2003-08-14
EP0806739A2 (en) 1997-11-12
US5802208A (en) 1998-09-01
EP0806739B1 (en) 2003-01-22
JP3649311B2 (ja) 2005-05-18

Similar Documents

Publication Publication Date Title
JP3649311B2 (ja) Dctをベースとするフィーチャー・ベクトルを使った顔の認識
CN107194433B (zh) 一种基于深度自编码网络的雷达一维距离像目标识别方法
EP1433118B1 (en) System and method of face recognition using portions of learned model
CN108537743A (zh) 一种基于生成对抗网络的面部图像增强方法
CN112966574A (zh) 人体三维关键点预测方法、装置及电子设备
CN109063666A (zh) 基于深度可分离卷积的轻量化人脸识别方法及系统
JP2005149506A (ja) 対象物自動認識照合方法および装置
US20050226509A1 (en) Efficient classification of three dimensional face models for human identification and other applications
WO2006097902A2 (en) Method of performing face recognition
CN113240394A (zh) 一种基于人工智能的电力营业厅服务方法
US20030113002A1 (en) Identification of people using video and audio eigen features
CN110827832A (zh) 一种视频身份的识别设备及其方法
CN116543419B (zh) 基于嵌入式平台的酒店卫勤人员穿戴检测方法及系统
CN109657707A (zh) 一种基于观测矩阵变换维度的图像分类方法
CN112766157B (zh) 一种基于解纠缠表示学习的跨年龄人脸图像识别方法
CN112257688A (zh) 一种基于gwo-oselm的非接触式手掌活体检测方法及装置
CN111931757A (zh) 基于mdlbp分块直方图和pca降维的指静脉快速排序方法及装置
González-Jiménez et al. Modeling Gabor coefficients via generalized Gaussian distributions for face recognition
JPH1021394A (ja) 個人照合装置
CN108319935A (zh) 基于区域稀疏的人脸族群识别算法
Matsui et al. Feature selection by genetic algorithm for MRI segmentation
Tsapatsoulis et al. Face extraction from non-uniform background and recognition in compressed domain
JP2004272326A (ja) 部分空間成分特徴を用いた顔面描写および認識用の確率的顔面成分融合方法
CN119172528A (zh) ViNR用户音视频感知评价方法
Turaga et al. Face recognition using mixtures of principal components

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050209

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080225

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090225

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090225

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100225

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110225

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110225

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120225

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130225

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140225

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees