JP2004192603A - パターン特徴抽出方法及びその装置 - Google Patents
パターン特徴抽出方法及びその装置 Download PDFInfo
- Publication number
- JP2004192603A JP2004192603A JP2003068916A JP2003068916A JP2004192603A JP 2004192603 A JP2004192603 A JP 2004192603A JP 2003068916 A JP2003068916 A JP 2003068916A JP 2003068916 A JP2003068916 A JP 2003068916A JP 2004192603 A JP2004192603 A JP 2004192603A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- vector
- image
- matrix
- discriminant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/169—Holistic features and representations, i.e. based on the facial image taken as a whole
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Image Processing (AREA)
- Collating Specific Patterns (AREA)
Abstract
【解決手段】入力のパターンの特徴量をその要素のベクトルに分解し、それぞれの特徴 ベクトルについて各々判別分析によって得られる判別行列を予め用意し、その判別行列によって規定される判別空間に各特徴ベクトルを射影して次元を圧縮した後に、得られた特徴ベクトルを合わせて、再度判別行列によって再度射影 することによって、特徴ベクトルを算出する。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、パターン認識の分野における画像特徴抽出方法および画像特徴抽出装置、ならびにそのプログラムに関し、入力特徴ベクトルから、認識に有効な特徴ベクトルを抽出し、特徴次元を圧縮するための特徴ベクトルの変換技術に関する。
【0002】
【従来の技術】
従来より、パターン認識の分野では、入力されたパターンから特徴ベクトルを抽出し、その特徴ベクトルから識別に有効な特徴ベクトルを抽出し、各々のパターンから得られた特徴ベクトルを比較することによって、例えば、文字や人物の顔などのパターンの類似度を判定することが行われている。
【0003】
例えば、顔認識の場合では、目の位置等によって正規化された顔画像の画素値をラスター走査することで、一次元特徴ベクトルに変換し、この特徴ベクトルを入力特徴ベクトルとして用い、主成分分析(非特許文献1:Moghaddam他, ”Probabilistic Visual Learning for Object Detection”, IEEE Transactions onPattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp.696−710, 1997)や特徴ベクトルの主成分に対して線形判別分析(非特許文献2:W. Zhao他, ”Discriminant Analysis of Principal Components for Face Recognition,” Proceedings of the IEEE Third International Conference on Automatic Face and Gesture Recognition, pp. 336−341, 1998)を行うことで次元を削減し、得られた特徴ベクトルを用いて、顔による個人の同定等を行う。
【0004】
これらの方法では、予め用意した学習サンプルに対して、共分散行列やク ラス内共分散行列・クラス間共分散行列を計算し、それらの共分散行列における固有値問題の解として得られる基底ベクトルを求め、これらの基底ベクトルを用いて、入力特徴ベクトルの特徴を変換する。
【0005】
ここで、線形判別分析についてより詳しく説明する。
線形判別分析は、N次元特徴ベクトルxがあるときに、この特徴ベクトルをある変換行列Wによって変換したときに得られるM次元ベクトルy(=WTx)のクラス内共分散行列 SWに対するクラス間共分散行列SBの比を最大化するような変換行列Wを求める方 法である。このような分散比の評価関数として、行列式を用いて評価式の(数1)が定義される。
【0006】
【数1】
【0007】
ここで、クラス内共分散行列ΣWおよびクラス間共分散行列ΣBは、学習サンプルにおける特徴ベクトルxの集合におけるC個のクラスωi(i=1,2,...,C;それらのデータ数ni)のそれぞれの内部における共分散行列Σiとクラスの間の共分散行列であり、それぞれ(数2)および(数3)によって表される。
【0008】
【数2】
【0009】
【数3】
【0010】
ここで、miはクラスωiの平均ベクトル(数4)、mはパターン全体におけるxの平均ベクトルである(数5)。
【0011】
【数4】
【0012】
【数5】
【0013】
各クラスωiの事前確率P(ωi)が、予めサンプル数niを反映しているならば、P(ω i)=ni/nを仮定すれ ばよい。そうでなく等確率を仮定できるならば、P(ωi)=1/Cとすればよい。
【0014】
(数1)を最大にする変換行列Wは、列ベクトルwiの固有値問題である(数6)のM個の大きい固有値に対応する一般化された固有ベクトルのセットとして求められる。このようにして求められた変換行列Wを判別行列と呼ぶ。
【0015】
【数6】
【0016】
なお従来の線形判別分析法については、例えば、非特許文献5:「パターン識別」 (Richard O. Duda他、尾上守夫監訳、新技術コミュニケーションズ,2001年, pp.113−122)に記載されている。
入力特徴ベクトルxの次元数が特に大きい場合、少ない学習データを用いた場合にはΣWが正則ではなくなり、(数6)の固有値問題を通常の方法では解くことができなくなる。
【0017】
また、特許文献1:特開平7−296169号公報でも述べられているように、共分散行列の固有値が小さい高次成分は、パラメータの推定誤差が大きいことが知られており、これが認識精度に悪影響を与える。
このため、前述のW. Zhaoらの論文では入力特徴ベクトルの主成分分析を行い、固有値が大きな主成分に対して、判別分析を適用している。つまり、図2に示すように、主成分分析によって得られる基底行列を用いて入力特徴ベクトルを射影することで主成分を抽出した後に、判別分析によって得られる判別行列を基底行列として、主成分を射影することで、識別に有効な特徴ベクトルの抽出を行う。
【0018】
また、特許文献1:特開平7−296169号公報に記載されている特徴変換行列の演算方式では、 全共分散行列ΣTの高次の固有値及び対応する固有ベクトルを削除等することによって、次元数を削減し、削減された特徴空間において、判別分析を適用している。これも全共分散行列の高次の固有値及び対応する固有ベクトルを削除することが主成分分析によって、固有値が大きな主成分のみの空間で判別分析を行うという意味では、W. Zhaoの方法と同様に 高次特徴を除去し、安定なパラメータ推定を行う効果をもたらす。
【0019】
【特許文献1】
特開平7−296169号公報
【0020】
【非特許文献1】
Moghaddam他, ”Probabilistic Visual Learning for Object Detection”,IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp.696−710, 1997)
【0021】
【非特許文献2】
W. Zhao他,”Discriminant Analysis of Principal Components for Face Recognition,” Proceedings of the IEEE Third International Conference on Automatic Face and Gesture Recognition, pp. 336−341, 1998)
【0022】
【非特許文献3】
Kernel−based Optimized Feature Vectors Selection and Discriminant Analysis for Face Recognition,”Proceeding of IAPR International Conferenceon Pattern Recognition(ICPR), Vol.II, pp. 362−365, 2002
【0023】
【非特許文献4】
Generalized Disciminant Analysis Using a Kernel Approach,”Nueural Computation, Vol.12, pp2385−2404, 2000
【0024】
【非特許文献5】
「パターン識別」 (Richard O. Duda他、尾上守夫監訳、新技術コミュニケーションズ,2001年, pp.113−122)
【0025】
【発明が解決しようとする課題】
しかしながら、全共分散行列ΣTを用いた主成分分析は、特徴空間内での分散が大きい軸方向に順番に直交する軸を選択しているに過ぎず、パターン識別の性能とは無関係に特徴軸の選択が行われる。このために、パターン識別に有効な特徴軸が失われる。
【0026】
例えば、特徴ベクトルxが3つの要素からなっており(x= (x1,x2,x3)T)、x1やx2の分散は大きいが、パターン識別には無関係な特徴であり、x3 はパターン識別には有効だが、分散が小さい場合(クラス間分散/クラス内分散、つまりフィッシャ比が大きいが、それぞれの分散の値自体はx1やx2に比較して十分に小さい場合)に主成分分析を行ない、2次元だけを選択すると、x1やx2に関わる特徴空間が選択されてしまい、識別に有効なx3の寄与は無視されてしまう。
【0027】
この現象を図を用いて説明すれば、図3の(a)が x1とx2が張る平面におおよそ垂直な方向から見たデータの分布で、黒丸と白丸がクラスの違うデータ点を表しているとする。x1と x2が張る空間(この図では、平面)で見た場合、黒丸と白丸を識別できないが、図3(b)のようにこの平面と直交するx3の特徴軸で見ると、黒丸の白丸は分離すること ができる。しかし、分散の大きい軸を選択してしまうと、x1とx2で張る平面が 特徴空間として選ばれ図3の(a)を見て判別を行おうとすることに等しく、判別を行うことが困難となる。
【0028】
これは、従来の技術で、主成分分析や(全)共分散行列の固有値の小さい空間を削除するという技術では避けられない現象である。
【0029】
本発明は、前述のような従来技術の問題点に鑑み、入力のパターン特徴ベクトルから、判別に有効な特徴ベクトルを抽出し、特徴次元を圧縮する際に、判別に有効な特徴量の削減を抑制し、より効率の良い特徴抽出を行うための特徴ベクトルの変換技術を提供することにある。
【0030】
【課題を解決するための手段】
本発明によれば、パターン特徴を線形変換を用いて特徴次元を圧縮するパターン特徴抽出方法において、パターン特徴を複数の特徴ベクトルxiで表現し、それぞれの特徴ベクトルxiに対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを予め求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、前記の判別行列Wiおよび判別行列WTによって特定される線形変換によって、パターンの特徴ベクトルを変換することで、特徴次元を圧縮することを特徴とする。
【0031】
前記のパターン特徴抽出方法において、パターン特徴を複数の特徴ベクトルxiに分割し、それぞれの特徴ベクトルxiについて、判別行列Wiを用いて、線形変換yi=Wi Txiを行い特徴ベクトルyiを算出し、算出された特徴ベクトルyiを合わせたベクトルyについて、判別行列WTを用いて、線形変換z=WT Tyを計算し、特徴ベクトルzを算出することで、パターン特徴の次元数を圧縮することを特徴とする。
【0032】
また、前記のパターン特徴抽出方法において、それぞれの判別行列WiおよびW Tによって特定される行列Wを予め計算しておき、前記行列Wを用いて、入力特徴ベクトルxiを合わせた特徴ベクトルxと行列Wの線形変換z=WTxを計算し、特徴ベクトルzを算出することで、パターン特徴の次元数を圧縮してもよい。
【0033】
この発明を画像に対して適用する場合には、画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特徴抽出方法において、画像中の予め定めた複数のサンプル点集合Siについて、複数のサンプル点から得られる画素値からなる特徴ベクトルxiとして抽出し、それぞれの特徴ベクトルxiに対して、線形 判別分析により求められる各特徴ベクトルの判別行列Wiを予め求め、さらにそれらの判別行列を用いて ベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、前記判別行列Wiおよび前記判別行列WTによって特定される線形変換によって、画像サンプル集合毎の特徴ベクトルを変換することで、画像から特徴量を抽出することを特徴とする。
【0034】
その一つの方法として、複数のサンプル点からなる複数の特徴ベクトルxiについて、判別行列Wiを用いて、線形変換yi=Wi Txiを行い特徴ベクトルyiを算出し、算出された特徴ベクトルyiを合わせたベクトルyについて、判別行列WTを用いて、線形変換z=WT Tyを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出すればよい。
【0035】
また、前述の画像特徴抽出方法において、それぞれの判別行列WiおよびWTによって特定される行列Wを予め計算しておき、前記行列Wを用いて、特徴ベクトルxiを合わせたベクトルxと行列Wの線形変換z=WTxを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出してもよい。
【0036】
また、画像を予め定めた複数の局所領域に分割し、その複数の局所領域毎に特徴量を抽出し、それらの特徴量を特徴ベクトルxiとして表現し、それぞれの特徴ベクトルxiに対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを予め求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、前記判別行列Wiおよび前記判別行列WTによって特定される線形変換によって、局所領域の特徴ベクトルを変換することで、画像から特徴量を抽出すればよい。
【0037】
前述の画像特徴抽出方法において、画像の局所領域の特徴ベクトルxiについて、 判別行列Wiを用いて、線形変換yi=Wi Txiを行い特徴ベクトルyiを算出し、算出された特徴ベクトルyiを合わせたベクトルyについて、判別行列WTを用いて、線形変換z=WT Tyを計算 し、特徴ベクトルzを算出することで、画像から特徴量を抽出する。
【0038】
あるいは、前述の画像特徴抽出方法において、それぞれの判別行列WiおよびWTによって特定される行列Wを予め計算しておき、前記行列Wを用いて、特徴ベクトルxiを合わせたベクトルxと行列Wの線形変換z=WTxを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出してもよい。
【0039】
本発明の画像から特徴量を抽出することを特徴とする画像特徴抽出方法の有効な実施方法として、画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特徴抽出方法において、画像を二次元フーリエ変換し、二次元フーリエ変換の実数成分と虚数成分を特徴ベクトルx1として抽出し、二次元フーリエ変換のパワースペクトラムを算出し、そのパワースペクトラムを特徴ベクトルx2として抽出し、それぞれの特徴ベクトルxi(i=1,2)に対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、前記判別行列Wiおよび前記判別行列WTによって特定される線形変換によって特徴ベクトルを変換することを特徴とする。
【0040】
また、画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特徴特徴抽出方法において、画像を二次元フーリエ変換し、二次元フーリエ変換の実数成分と虚数成分を特徴ベクトルx1として抽出し、二次元フーリエ変換のパワースペクトラムを算出し、そのパワースペクトラムを特徴ベクトルx2として抽出し、それぞれの特徴ベクトルxi(i=1,2)の主成分に対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、特徴ベクトルxiの主成分に対する判別行列 Wiおよび判別行列WTによって特定される線形変換によって、フーリエ成分の実成分と虚成分に対する特徴ベクトルx1とフーリエ成分のパワースペクトラムに対する特徴ベクトルx2を次元削減するように変換することで、画像から特徴量を抽出することを特徴とする。
【0041】
前述の画像特徴抽出方法において、 フーリエ変換による実数成分と虚数成分による特徴ベクトルx1を主成分に変換する変換行列Ψ1と、その主成分に対する判別行列W1によって表される基底行列Φ1(=(W1 TΨ1 T)T)を用いて、特徴ベクトルx1の主成分の判別特徴を線形変換y1=Φ1 Tx1により算出し、得られた特徴ベクトルy1の大きさを予め定めた大きさに正規化し、また、フーリエ変換によるパワースペクトラムによる特徴ベクトルx2を主成分に変換する変換行列Ψ2と、その主成分に対する判別行列W2によって表される基底行列Φ2(=(W2 TΨ2 T)T)を用いて、特徴ベクトルx2の主成分の判別特徴を線形変換y2=Φ2 Tx2により算出し、得られた特徴ベクトルy2の大きさを予め定めた大きさに正規化し、二つの特徴ベクトルy1とy2を合わせた特徴ベクトルyについて、判別行列WTを用いて、線形変換z=WT Tyを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出することを特徴とする。
【0042】
【発明の実施の形態】
(第一の実施の形態)
本発明の実施の形態について図面を参照して詳細に説明する。図1は、本発明のパターン特徴抽出装置を用いたパターン特徴抽出装置を示すブロック図である。
【0043】
以下、パターン特徴抽出装置について詳細に説明する。
図1に示すように、本発明によるパターン特徴抽出装置は、入力特徴ベクトルx1を線形変換する第1の線形変換手段11と、入力特徴ベクトルx2を線形変換する第2の線形変換手段12と、線形変換手段11と線形変換手段12によって変換し、次元削減された特徴ベクトルを入力として、線形変換を行う第3の線形変換手段13を備える。前述のそれぞれの線形変換手段は、それぞれ対応した判別行列記憶手段14、15、16に記憶されている予め学習によって求めておいた判別行列を用いて、判別分析による基底変換を行う。
【0044】
入力される特徴ベクトルx1、x2は、文字認識や顔認識などでそれらの目的に応じて抽出される特徴量であり、例えば画像の勾配特性から計算される方向特徴や画像の画素値そのものである濃淡特徴等で、複数の要素がある。この際に、例えば、N1個の方向特徴を一方の特徴ベクトルx1として、もう一方のN2個の濃淡値を特徴ベクトルx2として入力する。
【0045】
判別行列記憶手段14や判別行列記憶手段15は、特徴ベクトルx1および特徴ベクトルx2について、線形判別分析を行い、これにより得られる判別行列W1、W2をそれぞれ記憶する。
【0046】
判別行列は、前述したように予め用意した学習サンプルにおける特徴ベクトルについて、そのクラスに応じて、クラス内共分散行列ΣW((数2))、クラス間共分散行列ΣB((数3))を計算すればよい。また、各クラスωiの事前確率P(ωi)は、サンプル数niを反映させて、P(ωi)=ni/nとすればよい。
【0047】
これらの共分散行列に対して、(数6)で表される固有値問題の大きい固有値に対応する固有ベクトルwiを選択することで、判別行列を予め求めておくことができる。
【0048】
それぞれの特徴ベクトルx1、x2について、入力特徴次元N1やN2よりも小さいM1次元、M2次元の基底を選ぶとすると、判別基底への射影変換によってそれぞれM1、M2次元の特徴ベクトルy1、y2を得ることができる。
【0049】
【数7】
【0050】
ここで、W1、W2の行列の大きさは、それぞれM1×N1、M2×N2となる。
射影する特徴空間の次元数M1、M2を大幅に小さくすることによって、効率良く特徴次元数を削減でき、データ量の削減や高速化に効果があるが、特徴次元数を大幅に小さくしすぎる場合には、判別性能の劣化をもたらす。これは、特徴次元数を削減することによって、判別に有効な特徴量が失われるためである。
【0051】
このため、特徴ベクトルの次元数M1やM2等は、学習サンプル数との兼ね合いに影響されやすい量であり、実験に基づいて定めることが望ましい。
【0052】
第3の線形変換手段13では、第1および第2の線形変換手段によって計算されたy1、y2を入力特徴ベクトルyとして、判別空間への射影を行う。判別行列記憶手段16に登録しておく判別行列W3は、第1、第2の判別行列を計算した場合と同様に学習サンプルから求める。但し、入力特徴ベクトルyは次の(数8)で表されるように、要素を並べたベクトルである。
【0053】
【数8】
【0054】
(数7)と同様に基底行列W3(行列の大きさは、L×(M1+M2))によって、L次元の特徴ベクトルyを(数9)により射影し、出力となる特徴ベクトルzを得る。
【0055】
【数9】
【0056】
このように特徴ベクトルをそれぞれ分割して、少ない次元数の特徴ベクトルの学習サンプルに対して、線形判別分析を行うことによって、高い次元の特徴成分で生じやすい推定誤りを抑制し、且つ、判別に有効な特徴を捉えることができる。
【0057】
前述の例では、3つの線形変換手段を備えて、並列的・段階的に処理を行う場合について示したが、線形判別手段は、基本的に積和演算器を備えていれば実現できるので、線形変換を行う入力特徴ベクトルに合わせて、読み出す判別行列を切替え線形変換手段を使い回すように実現することも可能である。このように一つの線形変換手段を使うことで、必要な演算器の規模を小さくすることができる。
【0058】
さらに、出力特徴ベクトルzの演算は、(数7)、(数8)、(数9)から分かるように、(数10)と書き表すことができる。
【0059】
【数10】
【0060】
つまり、各判別行列を用いた線形変換は、一つの行列による線形変換にまとめることができる。段階的な演算を行う場合の積和演算回数は、L×(M1+M2)+M1N1+M2N2であり、一つの行列にまとめた場合には、L×(N1+N2)となり、例えば、N1=N2=500、M1=M2=200、L=100 とした場合には、段階的な演算で240,000回の積和演算が必要となり、後者の演算では100,000回の積和演算が必要となり、後者のような一括演算を行う場合の方が演算量が少なく、高速な演算が可能となる。式からも分かるように最終的な次元数Lを小さくする場合には、一括的な演算方法を用いた方が演算量を削減することができ、有効である。
【0061】
(第二の実施の形態)
さて、前述の例では、方向特徴と濃淡特徴というように特徴の種類が異なる場合の特徴を融合する際に、それぞれの特徴毎に判別分析を施した特徴ベクトルに対して、繰り返し判別分析を行っているが、一つの特徴に対する複数要素を複数の特徴ベクトルに分割して、それぞれの要素集合を入力特徴として判別分析し、その射影されたベクトルをさらに判別分析しても構わない。
【0062】
第二の実施例では、顔画像の特徴抽出装置について説明する。
第二の発明による顔画像特徴抽出装置では、図4に示すように入力顔画像の濃淡特徴を分解する画像特徴分解手段41と、特徴ベクトルに対応する判別行列に従って特徴ベクトルを射影する線形変換手段42と、前記のそれぞれの判別行列を記憶する判別行列記憶手段43を備えている。
【0063】
顔画像の特徴抽出する技術については、前述のW.Zhaoらの論文に示されているように、顔画像を目位置などで位置合わせした後に、その濃淡値をベクトル特徴とする方法がある。
【0064】
第二の発明でも原特徴としてはどうように画像の画素の濃淡値を入力特徴として取り扱うが、画像サイズが例えば左右の目の中心位置を(14,23)、(29,23)の座標に正規化した42×54画素=2352次元と大きな画像特徴となる。このような大きな特徴次元では、限られた学習サンプルを用いて直接的に線形判別分析を行っても精度良い特徴抽出を行うことは困難であり、画像特徴の要素を分解し、その分解された特徴に対して判別分析を行い、判別行列を求めることで、主成分分析等を適用した場合に生じる特徴の劣化を抑制する。
【0065】
画像特徴を分解するための方法の一つが画像を分割することであり、例えば、図5に示すように画像を一つの大きさが14×18画素(=252次元)の大きさに9分割し、それぞれの大きさの局所画像を特徴ベクトルxi(i=1,2,3,...,9)とし、それぞれの部分画像に対して学習サンプルを用いて判別分析を行い、それぞれの特徴ベクトルに対応する判別行列Wiを求めておく。
【0066】
なお、画像を分割する際に領域間にオーバーラップを持たせておくことで、その境界領域の画素間の相関に基づく特徴量を特徴ベクトルに反映させることができるので、オーバーラップをさせてサンプルするようにしておいてもよい。
【0067】
特徴次元数が252次元と原画像より大幅に少なくなることで、人数で数百人程度の各人の画像を数枚、計数千枚程度の顔画像をサンプルとすることで、判別分析による基底行列を精度を保って計算することができる。これが原特徴のまま(2352次元)と大きい場合には、判別分析による特徴で性能を得るためには、数千名以上の顔画像サンプルを必要となることが予想されるが、実際問題としてこのような大規模な画像データを収集することは困難であるために、実現できない。
【0068】
第一段階の判別特徴によって、例えば、各局所領域毎に20次元の特徴に 圧縮するとすると、それらの出力特徴ベクトルは、9領域×20次元=180次元の特徴ベクトルとなる。この特徴ベクトルに対してさらに判別分析を行うことで、次元数を例えば50次元程度に効率的に圧縮できる。この第二段階目の判別行列も判別行列記憶手段43に記憶し、線形変換手段42により、第一段階の判別特徴の180次元ベクトルを入力として、再度判別分析を行う。なお、予め第一段目の判別行列と第二段目の判別行列を(数10)で示したように予め計算しておいてもよいが、252次元×9領域を20次元×9領域に圧縮し、その180次元を50次元に変換する場合では、二段階に分けて計算した方が使用メモリも、演算量も半分以下となるので、効率的である。
【0069】
このように局所的・段階的に判別分析を適用することで、識別能力の高い顔特徴を抽出することができるようになる。これは、文字認識でいえば、例えば「大」と「犬」の識別を行おうとしたときに、文字画像全体を主成分分析して固有値が大きい成分抜き出すと、「大」と「犬」を識別する「`」の特徴が失われてしまいやすい(このため、類似文字識別では主成分分析による固有値が大きい部分の特徴よりも、ある特定の高次特徴を用いることが行われる場合もある)。局所領域に分割して判別特徴を抜き出すことの有効性は、文字認識 における類似文字識別における現象と類似しており、識別しやすい特徴を空間 的に限定することで、全体的に主成分の判別分析を行う場合よりも、単位次元 あたりの精度を確保できるようになると考えられる。
【0070】
また、画像特徴分割手段41では、局所領域毎に画像を分割して、特徴ベクトルを構成するのではなく、画像全体からサンプリングして分割してもよい。例えば、一次特徴を9分の1の252次元の9つのベクトルに分割する場合には、図6に示すように3x3の領域からサンプリングする。つまり、サンプリングされた画像は、僅かな位置の違いのある縮小画像となる。この縮小画像をラスター走査することで、9つの特徴ベクトルに変換する。このような特徴ベクトルを一次ベクトルとして判別成分を計算し、その判別成分を統合して再度判別分析を行ってもよい。
【0071】
(第三の実施の形態)
本発明による別の実施の形態について図面を参照して詳細に説明する。図7は、本発明の顔メタデータ生成装置を用いた顔画像マッチングシステムを示すブロック図である。
【0072】
以下、顔画像マッチングシステムについて詳細に説明する。
図1に示すように、本発明による顔画像マッチングシステムでは、顔画像を入力する顔画像入力部71と、顔メタデータを生成する顔メタデータ生成部72と、抽出された顔メタデータを蓄積する顔メタデータ蓄積部73と、顔メタデータから顔の類似度を算出する顔類似度算出部74と、顔画像を蓄積する顔画像データベース75と、画像の登録要求・検索要求に応じて、画像の入力・メタデータの生成・メタデータの蓄積・顔類似度の算出の制御を行う制御部76と顔画像や他の情報を表示するディスプレイの表示部77と、が設けられている。
【0073】
また、顔メタデータ生成部72は、入力された顔画像から顔領域を切り出す領域切り出し手段721と、切り出された領域の顔特徴を抽出する顔パターン特徴抽出手段722によって構成され、顔の特徴ベクトルを抽出することで、顔画像に関するメタデータを生成する。
【0074】
顔画像の登録時には、スキャナあるいはビデオカメラなどの画像入力部71で顔写真等を顔の大きさや位置を合わせた上で入力する。あるいは、人物の顔を直接ビデオカメラなどから入力しても構わない。この場合には、前述のMohaddamの文献に示されているような顔検出技術を用いて、入力された画像の顔位置を検出し、顔画像の大きさ等を自動的に正規化する方がよいであろう。
【0075】
また、入力された顔画像は必要に応じて顔画像データベース75に登録する。顔画像登録と同時に、顔メタデータ生成部72によって顔メタデータを生成し、顔メタデータ蓄積部73に蓄積する。
【0076】
検索時には登録時と同様に顔画像入力部71によって顔画像を入力し、顔メタデータ生成部72にて顔メタデータを生成する。生成された顔メタデータは、一旦顔メタデータ蓄積部73に登録するか、または、直接に顔類似度算出部74へ送られる。
【0077】
検索では、予め入力された顔画像がデータベース中にあるかどうかを確認する場合(顔同定)には、顔メタデータ蓄積部73に登録されたデータの一つ一つとの類似度を算出する。最も類似度が高い結果に基づいて制御部76では、顔画像データベース75から、顔画像を選び、表示部77等に顔画像の表示を行い、検索画像と登録画像における顔の同一性を作業者が確認する。
【0078】
一方、予めID番号等で特定された顔画像と検索の顔画像が一致するかどうかを確認する場合(顔識別)では、特定されたID番号の顔画像と一致するか、否かを顔類似度算出部74にて計算し、予め決められた類似度よりも類似度が低い場合には、一致しないと判定し、類似度が高い場合には一致すると判定し、その結果を表示部77に表示する。このシステムを入室管理用に用いるならば、顔画像を表示する変わりに、制御部76から自動ドアに対して、その開閉制御信号を送ることで、自動ドアの制御によって入室管理を行うことができる。
【0079】
上記のように、顔画像マッチングシステムは動作するが、このような動作はコンピュータシステム上で実現することもできる。例えば、次に詳述するようなメタデータ生成を実行するメタデータ生成プログラム及び類似度算出プログラムをそれぞれメモリに格納しておき、これらをプログラム制御プロセッサによってそれぞれ実行することで、顔画像マッチングを実現することができる。
【0080】
次に、この顔画像マッチングシステムの動作、特に顔メタデータ生成部72と顔類似度算出部74について、詳細に説明する。
【0081】
(1)顔メタデータ生成
顔メタデータ生成部72では、位置と大きさを正規化した画像I(x,y)を用いて、顔特徴量を抽出する。位置と大きさの正規化は、例えば、目位置が(16,24)、(31,24)、サイズが46×56画素となるように画像を正規化しておくとよい。以下では、このサイズに画像が正規化されている場合について説明する。
【0082】
次に、領域切り出し手段721によって顔画像の予め設定した顔画像の複数の局所領域を切り出す。例えば、上記の画像を例えば、一つは正規化した画像全体(これをf(x,y)とする)ともう一つは、顔を中心とした中心領域の32×32画素の領域g(x,y)である。 これは、両目の位置が(9,12)と(24,12)の位置となるように切り出せばよい。
【0083】
顔の中心領域を前述のように切り出すのは、これは髪型等に影響をされない範囲を切り出すことで、髪型の変化するような場合(例えば、家庭内ロボットで顔照合を用いる際に入浴前後で髪型が変化しても照合できるようにするため)でも安定な特徴を抽出するためのものであるが、髪型等が変化しない場合 (映像クリップ中におけるシーン内の人物同定などの場合)には、髪型を含んだ形で照合を行うことで照合性能の向上が期待できるので、髪型を含んだような 大きな顔画像と顔の中心部分の小さな顔画像に対して、顔画像を切り出す。
【0084】
次に顔画像特徴抽出手段722では、切り出された二つの領域f(x,y)を2次元の離散フーリエ変換によって、フーリエ変換し、顔画像の特徴を抽出する。
【0085】
図8に顔画像特徴抽出手段722のより詳しい構成について示す。この顔画像特徴抽出手段では、正規化し切り出された画像を離散フーリエ変換するフーリエ変換手段81と、フーリエ変換したフーリエ周波数成分のパワースペクトラムを算出するフーリエパワー算出手段82と、フーリエ変換手段81によって算出されたフーリエ周波数成分の実成分と虚成分をラスター走査した特徴ベクトルによって、1次元特徴ベクトルとみなして、その特徴ベクトルの主成分に対して判別特徴を抽出する線形変換手段83とその変換のための基底行列を記憶する基底行列記憶手段84、および、パワースペクトラムを同様に主成分の判別特徴を抽出する線形変換手段85とその変換のための基底行列を記憶する基底行列記憶手段86を備える。さらに、フーリエ特徴の実数成分と虚数成分の判別特徴、および、パワースペクトルの判別特徴をそれぞれ大きさ1のベクトルに正規化し、その二つの特徴ベクトルを統合したベクトルに対して、そのベクトルの判別特徴を算出する線形変換手段88とその判別特徴のための判別行列を記憶する判別行列記憶手段89を備える。
【0086】
このような構成によって、フーリエ周波数特徴を抽出した後に、フーリエ周波数成分の実数部と虚数部を要素とした特徴ベクトルと、パワースペクトラムを要素とした特徴ベクトルに対して、それぞれ主成分の判別特徴を計算し、それぞれを統合した特徴ベクトルに対して再度判別特徴を計算することで、顔の特徴量を計算する。
【0087】
以下では、それぞれの動作についてより詳しく説明する。
フーリエ変換手段81では、入力された画像f(x,y)(x=0,1,2,...M−1,y=0,1,2,...,N−1)に対して、(数11)に従って、2次元の離散フーリエ変換し、そのフーリエ特徴F(u,v)を計算する。この方法は広く知られており、例えば、文献(Rosenfeldら、”ディジタル画像処理”、pp.20−26,近代科学社)に述べられているので、ここでは説明を省略する。
【0088】
【数11】
【0089】
フーリエパワー算出手段では、(数12)に従ってフーリエ特徴F(u,v)の大きさを求めフーリエパワースペクトラム|F(u,v)|を算出する。
【0090】
【数12】
【0091】
このようにして得られる二次元のフーリエスペクトルF(u,v)や|F(u,v)| は2次元の実成分のみの画像を変換しているので、得られるフーリエ周波数成分は対称なものとなる。このため、これらのスペクトル画像F(u,v)、|F(u,v)| はu=0,1,...,M−1; v=0,1,...,N−1のM×N個の成分を持つが、その半分の成分 u=0,1,...,M−1; v=0,1,...,N−1のM×N/2個の成分と、残りの半分の成分は、実質的に同等な成分となる。このため、特徴ベクトルとしては、半分の成分を用いて、以降の処理を行えばよい。当然のことながら、特徴ベクトルの要素として用いられない成分をフーリエ変換手段81やフーリエパワー算出手段82の演算で省略することで、演算の簡略化を図ることができる。
【0092】
次に、線形変換手段83では、周波数特徴として抽出された特徴量をベクトルとして取り扱う。予め規定しておく部分空間は、学習用の顔画像セットを用意し、対応する切り出し領域の周波数特徴ベクトルの主成分の判別分析によって得られる基底ベクトル(固有ベクトル)によって定める。この基底ベクトルの求め方については、W. Zhaoの文献をはじめとして様々は文献で説明されている一般的に広く知られた方法であるので、ここでは説明を省略する。ここで判別分析を直接行わないのは、フーリエ変換によって得られる特徴ベクトルの次元数が判別分析を直接取り扱うには大きすぎるためであり、既に指摘したような主成分判別分析における問題点は残るものの第一段階目の特徴ベクトルの抽出としては、一つの選択ではある。また、ここに判別分析を繰り返す方法による基底行列を用いて構わない。
【0093】
つまり、基底行列記憶手段84に記憶する主成分の判別行列Φ1は、周波数特徴の実成分と虚成分をラスター走査によって1次元化した特徴ベクトルx1の主成分の判別分析を行うことによって予め学習サンプルから求めることができる。ここで、フーリエ特徴は複素数として取り扱う必要は必ずしもなく、虚数成分も単なる別の特徴要素として、実数として取り扱って構わない。
【0094】
主成分への基底行列をΨ1、その主成分のベクトルを判別分析した判別行列をW1とすれば、主成分の判別行列Φ1は、(数13)によって書き表される。
【0095】
【数13】
【0096】
なお、主成分分析によって削減する次元数は、もとの特徴フーリエ特徴の1/10程度(200次元前後)にすればよく、その後、この判別行列によって70次元程度に削減する。この基底行列を予め学習サンプルから計算しておき、 基底行列記憶手段84に記憶される情報として用いる。
【0097】
フーリエパワースペクトラム|F(u,v)|についても同様にそのスペクトルをラスター走査によって、1次元特徴ベクトルx2として表し、その特徴ベクトルの主成分の判別分析を行うことによって得られる基底行列Φ2 T=Ψ2 TW 2 Tを学習サンプルから予め求めておく。
【0098】
このように、フーリエ特徴のそれぞれの成分について主成分判別特徴を計算することで、フーリエ成分の実成分と虚成分の特徴ベクトルx1の主成分の判別特徴y1と、パワースペクトルの特徴ベクトルx2の主成分の判別特徴y2を得ることができる。
【0099】
正規化手段87では、得られた特徴ベクトルの大きさをそれぞれ例えば長さ1の単位ベクトルに正規化する。ここで、ベクトルを測る原点をどこにするかで、ベクトル長は変わるので、その基準位置も予め定めておく必要があるが、これは射影された特徴ベクトルyiの学習サンプルから求めた平均ベクトルmiを用いて、基準点とすればよい。平均ベクトルを基準点とすることで、基準点の周りに特徴ベクトルが分布するようになり、特にガウシアン分布であるならば、等方的に分布するようになるので、特徴ベクトルを最終的に量子化するような場合の分布域 の領域を限定することが容易にできるようになる。
【0100】
つまり、特徴ベクトルyiをその平均ベクトルmiによって、単位ベクトルに正規化したベクトルyi oは、(数14)と表される。
【0101】
【数14】
【0102】
このように正規化手段を設け、フーリエパワーの実数と虚数に関わる特徴ベクトルy1と、パワーに関わる特徴ベクトルy2を単位ベクトルに正規化しておくことで、異種の特徴量である二つの特徴量の間の大きさの正規化をしておき、特徴ベクトルの分布特性を安定化させることができる。また、既に次元削減の過程で判別に 必要な特徴空間の中での大きさを正規化しているので、削除された雑音をより多く含む特徴空間で正規化する場合よりも、雑音に影響されにくい正規化が実 現できるためである。この正規化により、単なる線形変換では除去が難しい全体的な照明強度に比例する変動成分のような変動要素の影響をとり除くことができる。
【0103】
このように正規化した特徴ベクトルy1 oとy2 oを(数8)と同様 に一つの特徴ベクトルyに統合し、統合された特徴ベクトルyに対して、線形判別分析を行い得られる基底行列W3を用いて判別空間に射影することで、出力特徴ベクトルzを得ることができる。このための判別行列W3を判別行列記憶手段89に記憶し ておき、線形変換手段88では、このための射影の演算を行い、例えば、24次元の特徴ベクトルzを算出する。
【0104】
なお、出力特徴ベクトルzを、一要素あたり例えば5ビットに量子化する場合には、各要素の大きさを正規化しておく必要があるが、例えば、各要素の分散値に応じて、正規化を施しておく。
【0105】
つまり、特徴ベクトルzの各要素ziの学習サンプルにおける標準偏差の値σiを求めておき、zo = 16zi/3σiというように正規化を施し、これを例えば5ビッ トなら、−16から15の値に量子化すればよい。
【0106】
この際の正規化は、各要素に標準偏差の逆数をかけている演算となるので、σiを対角要素とする行列Σを考えると、正規化されたベクトルzoは、zo=Σzとなる。つまり、単なる線形変換であるので、予め、判別行列W3に対してΣを(数15)のように施しておいてもよい。
【0107】
【数15】
【0108】
このように正規化しておくことで、量子化に必要な値域補正を行うことができる利点があるばかりではなく、標準偏差値による正規化であるので、照合時にパターン間距離のノルムを演算する際に単なるL2ノルムを計算するだけで、マハラノビス距離による演算を行うことが可能となり、照合時における演算量を削減することが可能となる。
【0109】
このように顔画像特徴抽出手段122では、正規化された画像f(x,y)に対して特徴ベクトルzfを抽出する際の説明を行ったが、顔の中心部分のみを切り出した画像g(x,y)に対しても、前述と同様に顔画像特徴抽出手段122によって特徴ベクトルzgを抽出する。二つの特徴ベクトルzfと特徴ベクトルzgを顔メタデータ生成部を顔特徴量zとして抽出する。
【0110】
なお、前述したように上記顔メタデータ生成手順をコンピュータプログラ ムによってコンピュータに実行させることもできる。
【0111】
(2)顔類似度算出
次に顔類似度算出部74の動作について説明する。
顔類似度算出部74では、二つの顔メタデータから得られるそれぞれK次 元特徴ベクトルz1、z2を用いて、二つの顔の間の類似度d(z1,z2)を算出する。
例えば、(数16)の二乗距離によって類似度を算出する。
【0112】
【数16】
【0113】
αiは重み係数で例えば各特徴次元ziの標準偏差の逆数等を用いればマハラノビス距離による計算となり、予め(数15)等によって特徴ベクトルを正規化してある場合には、基底行列が予め分散値によって正規化してあるので、前述の通り マハラノビス距離となっている。また、(数3)の比較する各特徴ベクトルのなす余弦によって類似度を算出してもよい。
【0114】
【数17】
【0115】
なお、距離を用いた場合には値が大きいほど類似度は小さいこと(顔が似ていない)を意味し、余弦を用いた場合には値が大きいほど類似度が大きいこと(顔が似ている)を意味する。
【0116】
ここまでの説明では、一枚の顔画像が登録され、一枚の顔画像を用いて検索する場合について説明したが、一人の顔に対して複数の画像が登録され、一枚の顔画像を用いて検索する場合には、例えば、登録側の複数の顔メタデータをそれぞれ、類似度の算出をすればよい。
【0117】
同様に1つの顔当たりの複数枚の画像登録と複数画像による検索の場合も、 各組み合わせの類似度の平均や最小値を求めることで、類似度を算出することで、一つの顔データに対する類似度を算出することができる。これは、動画像を複数画像と見倣すことで、本発明のマッチングシステムを動画像における顔認識に対しても適用できることを意味する。
【0118】
以上、本発明を実施の形態を適宜図面を参照して説明したが、本発明は、コンピュータが実行可能なプログラムによっても実現できることは言うまでもない。
【0119】
(第四の実施の形態)
本発明による別の実施の形態について図面を参照して詳細に説明する。本発明は、第3の発明における顔メタデータ生成部72を改良するものである。第3の発明では、入力顔画像をフーリエ変換を行うことで得られるフーリエ周波数成分の実数部と虚数部を要素とした特徴ベクトルと、パワースペクトラムを要素とした特徴ベクトルに対して、それぞれの主成分の判別特徴を計算し、それぞれを統合した特徴ベクトルに対して再度判別特徴を計算することで、顔の特徴量を計算している。この場合、フーリエパワースペクトルが入力画像全体の特徴量を反映しているために、入力画素にノイズが多い成分(例えば、相対的な位置が変化しやすい口の周りの画素など)もパワースペクトルの中に他の画素と等しく反映されてしまい、判別分析によって有効な特徴量を選択しても、十分な性能が得られない場合があった。このような場合には入力画像を領域分割し、その局所領域毎にフーリエ変換し、各局所領域毎のパワースペクトルを特徴量として、判別分析することで、局所的に判別性能が悪い(クラス内分散が大きい)領域の特徴量の影響を判別分析によって、低減することができる。
【0120】
図9は実施例を説明するための図で、特徴抽出処理のフローを表している。この実施例では、例えば、32x32画素の領域を16x16画素の4領域、8x8画素の16領域、4x4画素の64領域、2x2画素の256領域、1x1画素の1024領域(実質的に入力画像と同じなので、入力画像そのままでよい)に分割し、その各々の分割された領域でフーリエ変換を行う。この処理フローをまとめた図が図10である。このようにして得られた各領域のパワースペクトル全ての1024x5次元=5120次元の特徴量を抽出する。この次元数では通常の学習データが少ない場合では次元数が多いので、予め主成分分析を行い、次元数を削減するような主成分分析の基底を求めておく。例えば、次元数としては300次元程度が適当である。この次元数の特徴ベクトルについてさらに判別分析を行い、次元数を削減し、判別性能のよい特徴軸に対応する基底を求める。主成分分析と判別分析に対応する基底を予め計算しておく(これをPCLDA射影基底Ψとする)。
【0121】
5120次元の特徴をこのPCLDA基底を用いた射影基底Ψを用いて線形演算によって射影することで、判別特徴zを得ることができる。さらに量子化等を施すことで、顔の特徴量となる。なお、5120次元の特徴量はフーリエパワースペクトルの対称性等を考慮したり、高周波成分を除去して、予め使わないことにすれば、次元数を削減でき、高速な学習、必要とされるデータ量の削減、高速な特徴抽出を可能とすることができるので、適宜次元数を削減することが望ましい。
【0122】
このように領域をブロック化し、フーリエスペクトラムを多重化することで、画像特徴と同値な特徴量(1024分割の場合)から、順に平行移動の普遍性を持った特徴量と局所的な特徴量の表現を多重に持つことができる。その多重で冗長な特徴表現の中から、判別分析によって、識別に有効な特徴量を選択することで、コンパクトで識別性能のよい特徴量を得ることができる。フーリエパワースペクトルは、画像に対して非線形な演算であり、これは画像を単に線形演算によって処理する判別分析を適用するだけでは得られない有効な特徴量を計算することができる。ここでは主成分に対して線形判別分析を行う場合について説明したが、カーネル判別分析(Kernel Fisher Discriminant Analysis,KFDAあるいはKernelDiscriminant Analysis: KDA 、Generalized Discriminant Analysis: GDAなどと呼ばれるカーネルテクニックを用いた判別分析)を用いて、2段階目の特徴抽出を行っても構わない。例えば、カーネル判別分析については、Q. Liu らの文献(非特許文献3:”Kernel−based Optimized Feature Vectors Selection and Discriminant Analysis for Face Recognition,”Proceeding of IAPR International Conference on Pattern Recognition(ICPR), Vol.II, pp. 362−365, 2002)やG. Baudat の文献(非特許文献4:”Generalized Disciminant Analysis Using a Kernel Approach,”Neural Computation, Vol.12, pp2385−2404,2000)に詳しく解説されているので、それらを参照されたい。 このようにカーネル判別分析を用いて特徴を抽出することで、非線形による特徴抽出の効果をさらに発揮することができ、有効な特徴を抽出することができる。
【0123】
しかし、この場合、5120次元と大きな特徴ベクトルを取り扱うので、主成分分析を行う場合でも、大量のメモリ、大量の学習データが必要となる。図11は、このような問題を避けるべく、各ブロック毎に主成分分析・判別分析を個別に行い、その後、2段階で判別分析(Linear Discriminant Analysis: LDA)を行うことで、演算量を削減することができる。この場合には、各領域毎に1024次元(対称性を考慮して半分にすると、512次元)の特徴量を用いて、主成分分析と判別分析を行い基底行列Ψi(i=0,1,2,..,5)を求めておく。そして、その後それぞれの平均値を用いて特徴ベクトルを正規化し、二段階目のLDA射影を行う。このようにブロック毎に処理を行うことで、学習の際に要求されるデータ数や計算機資源を減少させることができ、学習の最適化の時間削減等を行うことできる。なお、高速に演算を行いたい場合には、ベクトル正規化の処理を省き、予めPCLDA射影の基底行列とLDA射影の基底行列を計算しておくことで、演算の高速化を図ることができる。
【0124】
図12はまた別の実施例を説明するための図で、特徴抽出処理のフローを表している。この実施例では、このような領域分割を複数段階(図では2段階)で行い、局所領域のフーリエパワースペクトルが持つ並進普遍性と、局所領域の信頼性を考慮するように多重にパワースペクトラムを多重な解像度で抽出し、判別分析のための特徴量として抽出し、その中で判別分析で求められた最も優れた特徴空間利用して、特徴抽出を行う。
【0125】
例えば、入力画像f(x,y)が32x32画素の場合には、図10に示すように全体画像のパワースペクトル|F(u,v)|とそれを4分割した16x16画素の4つの領域のそれぞれのパワースペクトラム|F1 1(u,v)|, |F1 2(u,v)| ,|F1 3(u,v)| ,|F1 4(u,v)|、8x8画素の16個の領域に分割した|F2 1(u,v)|, |F2 1(u,v)|,・・・,|F2 16(u,v)|を特徴ベクトルを抽出する。但し、実画像のフーリエパワースペクトルの対称性を考慮して、その1/2を抽出すればよい。また、判別分析における特徴ベクトルの大きさが大きくなることを避けるために、判別に対して高周波成分をサンプリングしないで、特徴ベクトルを構成してもよい。例えば、低周波成分に対応する1/4のスペクトルをサンプリングして特徴ベクトルを構成することで、必要となる学習サンプル数を低減したり、学習や認識に必要な処理時間の軽減を行うことができる。また、学習データ数が少ない場合には、予め主成分分析して特徴次元数を減らした後に判別分析を行っても良い。
【0126】
さて、このように抽出した特徴ベクトルx2 fを用いて、予め用意した学習セットを用いて判別分析を行い、その基底行列Ψ2 fを求めておく。図9では主成分に対する判別特徴の抽出(Principal Component Linear Discriminant Analysis: PCLDA)の射影を行っている例を示している。特徴ベクトルx2 fを基底行列Ψ2 fを用いて射影し、その射影された特徴ベクトルの平均と大きさを正規化し、特徴ベクトルy2 fを算出する。
【0127】
同様にフーリエ周波数の実数成分と虚数成分を統合した特徴ベクトルx2 fについても、基底行列Ψ1 fを用いて線形演算処理により特徴ベクトルを射影し、次元数を削減した特徴ベクトルを求め、そのベクトルの平均と大きさを正規化した特徴ベクトルy1 fを算出する。これらを統合した特徴ベクトルを判別基底Ψ3 fを用いて、再度射影し、特徴ベクトルzfを得る。これを例えば5bitに量子化することで、顔特徴量を抽出する。
【0128】
なお、入力が44x56画素の大きさに正規化された顔画像である場合には、中心部分の32x32画素に上述の処理を施して、顔特徴量を抽出するとともに、顔全体の44x56画素の領域についても、44x56画素の全体領域と、22x28画素の4領域、11x14画素の16画素に多重に分割した領域についてそれぞれ顔特徴量を抽出する。図13は、別の実施例を表しており、各局所領域毎に実数成分と虚数成分とパワースペクトルを合わせてPCLDAを行う場合や、図14のように実数成分と虚数成分を合わせた特徴とパワースペクトルとを個別にPCLDA射影し、最後にLDA射影を行っている例である。
【0129】
(第五の実施の形態)
本発明による別の実施の形態について図面を用いて詳細に説明する。
本発明を用いた顔特徴記述方法および顔特徴の記述子の実施例を表わす。図15には、顔の特徴記述の一例として、ISO/IEC FDIS 15938−3“Information technology Multimedia content description interface− Part3: Visual”におけるDDL表現文法(Description Definition Language Representation Syntax)を用いて顔特徴量の記述について表わしている。
【0130】
ここでは、AdvancedFaceRecognitionと名付けた顔特徴の記述について、それぞれ”FourierFeature”,”CentralFourierFeature”と名付ける要素を有しており、FouirerFeatureやCentralFourierFeatureは、符号なし5ビットの整数でそれぞれ24次元から63次元の要素を持つことができることを表わしている。図16は、そのデータ表現に対してバイナリー表現文法(Binary Representation Syntax)を用いた場合の規則を表わしており、FourierFeature、CentralFourierFeatureの配列要素の大きさを符号なし6ビットの整数でnumOfFourierFeature、numOfCentralFourierに格納し、FourierFeature、CentralFoureirFeatureのそれぞれの要素が5ビットの符号なし整数で格納されることを表わしている。
【0131】
本発明を用いたこのような顔特徴の記述子について、より詳細に説明する。
●numOfFourierFeature
このフィールドは、FourierFeatureの配列の大きさを規定する。値の許容範囲は、24から63である。
●numOfCentralFourierFeature
このフィールドは、CentralFourierFeatureの配列の大きさを規定する。値の許容範囲は、24から63である。
●FourierFeature
この要素は、正規化顔画像のフーリエ特性の階層的LDAに基づく顔特徴を表している。正規化顔画像は、原画像を各行46個の輝度値を持つ56行の画像に大きさを変換することによって得られる。正規化画像における両目の中心位置は、右目、左目がそれぞれ、24行目の16列目及び31列目に位置していなければならない。
【0132】
FourierFeatureの要素は、二つの特徴ベクトルから抽出される。一つは、フーリエスペクトルベクトルx1 fであり、もう一つは、マルチブロックフーリエ強度ベクトルx2 fである。図17は、フーリエ特徴の抽出過程を図示している。正規化画像が与えられたら、その要素を抽出するために、次の5つの処理ステップを実行しなければならない。
【0133】
(1)フーリエスペクトルベクトルx1 fの抽出
(2)マルチブロックフーリエ強度ベクトルx2 fの抽出
(3)PCLDA基底行列Ψ1 f、Ψ2 fを用いた特徴ベクトルの射影と、単位ベクトルy1 f、y2 fへの正規化
(4)LDA基底行列Ψ3 fを用いた、単位ベクトルの結合フーリエベクトルの射影
(5)射影ベクトルZfの量子化
【0134】
STEP−1) フーリエスペクトルベクトルの抽出
与えられた正規化画像f(x,y)に対するフーリエスペクトルF(u,v)を(数18)式により計算する。
【0135】
【数18】
【0136】
ここで、M=46、N=56である。フーリエスペクトルベクトルx1 fは、フーリエスペクトルを走査して得られる成分の集合によって定義される。図18は、フーリエスペクトルの走査方法を示している。走査は、フーリエ空間における二つの領域、領域Aと領域B、に対して実行される。走査規則を図19にまとめる。ここで、SR(u, v)は、領域Rの左上の座標を表し、ER(u,v) は領域Rの右下の点をそれぞれ表す。それ故に、フーリエスペクトルベクトルx1 fは(数19)式によって表現される。
【0137】
【数19】
x1 fの次元数は644次元である。
【0138】
STEP 2) マルチブロックフーリエ強度ベクトルの抽出
マルチブロックフーリエ強度ベクトルを正規化顔画像の部分画像のフーリエ強度から抽出する。部分画像としては、(a) 全体画像、(b) 4分の1画像、(c) 16分の1画像の3つのタイプの画像が使われる。
【0139】
(a)全体画像
全体画像f1 0(x,y)は、正規化画像f(x,y)の画像境界の両側の列を取り除き、44x56の画像サイズに切り出すことで得ることができる。これは、(数20)式によって与えられる。
【0140】
【数20】
【0141】
(b)4分の1画像
4分の1画像は、全体画像f1 0(x,y)を4ブロックfk 1(x,y)(k=1,2,3,4)に等分割することによって、得ることができる。
【0142】
【数21】
ここで、sk 1=(k−1)%2、tk 1=(k−1)/2 である。
【0143】
(c)16分の1画像
16分の1画像は、f1 0(x,y)を16ブロックfk 2(x,y)(k=1,2,3,・・・,16)に等分割することによって得られ、次式によって与えられる。
【0144】
【数22】
ここで、sk 2=(k−1)%4、tk 2=(k−1)/4 である。
【0145】
これらの画像から、フーリエ強度|Fk j(u,v)|を次の(数23)式のように計算する。
【0146】
【数23】
Mjは各々の部分画像の幅を表し、M0=44, M1=22, M2=11である。Njは部分画像の高さを表し、N0=56, N1=28, N2=14である。
【0147】
マルチブロックフーリエ強度ベクトルは、1) 全体画像(k=1), 2) 4分の1画像(k=1,2,3,4), 及び 3) 16分の1画像(k=1,2,・・・,16)の順に、各々の強度|Fk j(u,v)|の低周波数領域を走査することによって得られる。走査領域は、図19に定義している。
【0148】
それ故に、マルチブロックフーリエ強度ベクトルx2 fは、(数24)式で表現される。
【0149】
【数24】
x2 fの次元数は856次元である。
【0150】
STEP 3) PCLDA 射影とベクトル正規化
フーリエスペクトルベクトルx1 fとマルチブロックフーリエ強度ベクトルx2 fをそれぞれPCLDA基底行列Ψ1 fとΨ2 fを用いて射影し、単位ベクトルy1 fとy2 fに正規化する。正規化ベクトルyk f (k=1,2) は次式によって与えられる。
【0151】
【数25】
ここで、PCLDA 基底行列Ψk fと平均ベクトルmk fは、xk fの主成分の判別分析によって得られる基底行列と射影して得られる平均ベクトルであり、予め計算してあるテーブルを参照する。y1 fとy2 f の次元数はそれぞれ70次元と80次元である。
【0152】
STEP 4) 結合フーリエベクトルのLDA射影
正規化ベクトルy1 fとy2 fを150次元の結合フーリエベクトルy3 fを成すように連結し、LDA基底行列を用いて射影する。射影ベクトルzfは次式で与えられる。
【0153】
【数26】
【0154】
STEP 5) 量子化
zfの要素を次式を用いて5ビットの符号なし整数の範囲に丸める。
【0155】
【数27】
【0156】
量子化された要素は、FourierFeatureの配列として保存する。FourierFeature[0] は、量子化された第一要素w0 fを表し、FourierFeature[numOfFourierFeature−1] は、第numOfFourierFeature番目の要素wf numOfFourierFeature−1に対応する。
【0157】
●CentralFourierFeature
この要素は、正規化顔画像の中心部分のフーリエ特性の階層的LDAに基づく顔特徴を表している。CentralFourierFeatureはFourierFeatureと同様な方法により抽出する。
【0158】
中心部分g(x,y)は、次式に示すように画像f(x,y)の始点(7,12)から32x32画素の大きさに切り出すことによって得られる。
【0159】
【数28】
【0160】
STEP 1) フーリエスペクトルベクトルの抽出
g(x,y) のフーリエスペクトルG(u,v)を(数29)式によって計算する。
【0161】
【数29】
ここで、M=32, N=32である。256次元のフーリエスペクトルベクトルx1 g は、フーリエスペクトルG(u,v)を図20で定義したように走査することによって得ることができる。
【0162】
STEP 2) マルチブロックフーリエ強度ベクトルの抽出
マルチブロックフーリエ強度ベクトルx2 gを(a) 中心部分g1 0(x,y), (b) 4分の1画像gk 1(x,y)(k=1,2,3,4), 及び(c) 16分の1画像gk 2(x,y)(k=1,2,3,・・・,16)のフーリエ強度から抽出する。
【0163】
(a)中心部分
【数30】
【0164】
(b)4分の1画像
【数31】
ここで、sk 1=(k−1)%2、tk 1(k−1)/2 である。
【0165】
(c)16分の1画像
【数32】
ここで、sk 2=(k−1)%4、tk 2=(k−1)/4 である。
【0166】
それぞれの画像のフーリエ強度|Gk j(u,v)|を、(数33)式のように計算する。
【0167】
【数33】
ここで、M0=32,M1=16, M2=8, N0=32, N1=16, N2=8である。マルチブロックフーリエ強度ベクトルx2 gは、図20に定義するようにそれぞれの強度|Gk j(u,v)|を走査することによって得られる。
【0168】
STEP 3−5)の処理は、FourierFeatureと同じである。CentralFourierFeatureのための基底行列Ψ1 g,Ψ2 g,Ψ3 g および平均ベクトルm1 g,m2 g もまたそれぞれの予め計算してテーブルとして用意しておいたものを参照する。
【0169】
CentralFourierFeatureの配列の大きさは、numOfCentralFourierFeatureに制限される。
【0170】
このようにして得られた顔特徴記述データは、記述長がコンパクトでありながら、高い認識性能を有する顔特徴の記述データとなり、データの保存や伝送に効率的な表現となる。
【0171】
なお、本発明をコンピュータで動作可能なプログラムで実現してもかまわない。この場合、第五の実施の形態であれば、図17中のステップ1〜ステップ5で示された機能をコンピュータが読み取り可能なプログラムで記述し、このプログラムをコンピュータ上で機能させることで本発明を実現可能である。また図17に記載された例を装置として構成する場合は、図21のブロック図に記載された機能の全部または一部を実現すればよい。
【0172】
【発明の効果】
本発明によるパターン特徴抽出により、入力のパターン特徴ベクトルから、その要素ベクトル毎に判別分析による判別に有効な特徴ベクトルを抽出し、得られた特徴ベクトルを再度判別分析による判別行列を用いた特徴抽出を行うことで、特徴次元を圧縮する際に、判別に有効な特徴量の削減を抑制し、より効率の良い特徴抽出を行うための特徴ベクトルの変換を行うことができる。
【0173】
特にパターンの特徴量が多いにも関わらず、判別分析を行う際に必要な学習サンプル数が限られているような場合に特に有効であり、必ずしも主成分分析を用いることなく、識別に有効な特徴の損失を抑えた上で特徴次元数を削減することができる。
【図面の簡単な説明】
【図1】本発明の実施形態によるパターン特徴抽出装置の構成を示すブロック図である。
【図2】従来技術を説明するための図である。
【図3】パターン特徴の分布を説明するための図である。
【図4】本発明による第二の実施形態によるパターン特徴抽出装置の構成を示すブロック図である。
【図5】本発明による実施形態を説明するための図である。
【図6】本発明による実施形態を説明するための図である。
【図7】本発明による第三の実施形態による顔画像マッチングシステムの 構成を示すブロック図である。
【図8】本発明による実施形態を説明するための図である。
【図9】本発明による実施形態を説明するための図である。
【図10】本発明による実施形態を説明するための図である。
【図11】本発明による実施形態を説明するための図である。
【図12】本発明による実施形態を説明するための図である。
【図13】本発明による実施形態を説明するための図である。
【図14】本発明による実施形態を説明するための図である。
【図15】本発明の第五の実施の形態における顔記述の一例を示すための図である。
【図16】本発明の第五の実施の形態におけるバイナリー表現文法(Binary RepresentationSyntax)を用いた場合の規則の一例を示す図である。
【図17】本発明の第5の実施の形態におけるフーリエ特徴(FourierFeature)を抽出するための説明図である。
【図18】本発明の第5の実施の形態におけるフーリエスペクトルの走査方法の一例を示すための図である。
【図19】本発明の第5の実施の形態におけるフーリエスペクトルの走査規則の一例を示すためのテーブルである。
【図20】本発明の第5の実施の形態におけるCentralFourierFeature要素のためのフーリエ空間における走査領域の一例を示すテーブルである。
【図21】本発明の第5の実施の形態におけるブロック図の一例を示す図である。
【符号の説明】
11: 第一の線形変換手段11
12: 第二の線形変換手段12
13: 第三の線形変換手段13
14: 第一の判別行列記憶手段14
15: 第二の判別行列記憶手段15
16: 第三の判別行列記憶手段16
Claims (21)
- パターン特徴を線形変換を用いて特徴次元を圧縮するパターン特徴抽出方法において、
パターン特徴を複数の特徴ベクトルxiで表現し、それぞれの特徴ベクトルxiに対して、線形判別分析により求められる各特徴ベクトルの判別行列W iを予め求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、
前記判別行列Wiおよび前記判別行列WTによって特定される線形変換によって、パターンの特徴ベクトルを変換することで、特徴次元を圧縮することを特徴とするパターン特徴抽出方法。 - 請求項1に記載のパターン特徴抽出方法において、
パターン特徴を複数の特徴ベクトルxiに分割し、
それぞれの特徴ベクトルxiについて、前記判別行列Wiを用いて、線形変換yi=W i Tx iを行い特徴ベクトルyiを算出し、
算出された特徴ベクトルyiを合わせたベクトルyについて、前記判別行列WTを用いて、線形変換z=WT Tyを計算し、特徴ベクトルzを算出することで、
パターン特徴の次元数を圧縮することを特徴とするパターン特徴抽出方法。 - 請求項1に記載のパターン特徴抽出方法において、
それぞれの判別行列WiおよびWTによって特定される行列Wを予め計算しておき、
前記行列Wを用いて、入力特徴ベクトルxiを合わせた特徴ベクトルxと行列Wの線形変換z=WTxを計算し、特徴ベクトルzを算出することで、
パターン特徴の次元数を圧縮することを特徴とするパターン特徴抽出方法。 - 画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特徴抽出方法において、
画像中の予め定めた複数のサンプル点集合Siについて、複数のサンプル点から得られる画素値からなる特徴ベクトルxiとして抽出し、
それぞれの特徴ベクトルxiに対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを予め求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、
前記判別行列Wiおよび前記判別行列WTによって特定される線形変換によって、画像サンプル集合毎の特徴ベクトルを変換することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - 請求項4に記載の画像特徴抽出方法において、
複数のサンプル点からなる複数の特徴ベクトルxiについて、判別行列Wiを用いて、線形変換yi=Wi Txiを行い特徴ベクトルyiを算出し、
算出された特徴ベクトルyiを合わせたベクトルyについて、判別行列WTを用いて、線形変換z=WT Tyを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - 請求項4に記載の画像特徴抽出方法において、
それぞれの判別行列WiおよびWTによって特定される行列Wを予め計算しておき、
前記行列Wを用いて、特徴ベクトルxiを合わせたベクトルxと行列Wの線形変換z= WTxを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出することを特徴とする画像特徴特徴抽出方法。 - 画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特徴抽出方法において、
画像を予め定めた複数の局所領域に分割し、その複数の局所領域毎に特徴量を抽出し、
それらの特徴量を特徴ベクトルxiとして表現し、それぞれの特徴ベクトルxiに対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを予め求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、
前記判別行列Wiおよび前記判別行列WTによって特定される線形変換によって、局所領域の特徴ベクトルを変換することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - 請求項7に記載の画像特徴抽出方法において、
画像の局所領域の特徴ベクトルxiについて、判別行列Wiを用いて、線形変換yi=W i Txiを行い特徴ベクトルyiを算出し、
算出された特徴ベクトルyiを合わせたベクトルyについて、判別行列WTを用いて、線形変換z=WT Tyを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - 請求項8に記載の画像特徴抽出方法において、
それぞれの判別行列WiおよびWTによって特定される行列Wを予め計算しておき、
前記行列Wを用いて、特徴ベクトルxiを合わせたベクトルxと行列Wの線形変換z= WTxを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - 画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特徴抽出方法において、
画像を二次元フーリエ変換し、
二次元フーリエ変換の実数成分と虚数成分を特徴ベクトルx1として抽出し、
二次元フーリエ変換のパワースペクトラムを算出し、そのパワースペクトラムを特徴ベクトルx2として抽出し、
それぞれの特徴ベクトルxi(i=1,2)に対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、
前記判別行列Wiおよび判別行列WTによって特定される線形変換によって特徴ベクトルを変換することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - 画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特徴特徴抽出方法において、
画像を二次元フーリエ変換し、
二次元フーリエ変換の実数成分と虚数成分を特徴ベクトルx1として抽出し、二次元フーリエ変換のパワースペクトラムを算出し、そのパワースペクトラムを特徴ベクトルx2として抽出し、
それぞれの特徴ベクトルxi(i=1,2)の主成分に対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、 特徴ベクトルxiの主成分に対する判別行列 Wiおよび判別行列WTによって特定される線形変換によって、フーリエ成分の実成分と虚成分に対する特徴ベクトルx1とフーリエ成分のパワースペクトラムに対する特徴ベクトルx2を次元削減するように変換することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - 画像を複数の領域に分割し、そのそれぞれの領域において二次元フーリエパワースペクトラムを算出することを特徴とする画像特徴抽出方法。
- 請求項12の画像特徴抽出方法において、画像の分割の仕方を複数に持つことで、異なる大きさの領域の多重に領域を分割し、その分割された領域それぞれについて、二次元フーリエパワースペクトルを算出することを特徴とする画像特徴抽出方法。
- 請求項12あるいは請求項13に記載の画像特徴抽出方法において、
得られた二次元フーリエパワースペクトルに対して、カーネル判別分析による特徴抽出を行うことで特徴次元を削減し、有効な特徴量を抽出することを特徴とする画像特徴抽出方法。 - 請求項12あるいは請求項13に記載の画像特徴抽出方法において、
得られた二次元フーリエパワースペクトルに対して、予め線形判別分析により得られる判別行列を用いて、線形変換によって特徴次元を削減することを特徴とする画像特徴抽出方法。 - 画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特徴抽出方法において、
画像を二次元フーリエ変換し、
二次元フーリエ変換の実数成分と虚数成分を特徴ベクトルx1として抽出し、
前記の画像のを二次元フーリエ変換のパワースペクトラムを算出し、
さらに前記の画像を複数に分割し、その各々の領域について二次元フーリエ変換のパワースペクトラムを算出し、それぞれのパワースペクトルを合成したベクトルを特徴ベクトルx2として抽出し、
それぞれの特徴ベクトルxi(i=1,2)に対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、
前記判別行列Wiおよび判別行列WTによって特定される線形変換によって特徴ベクトルを変換することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - 画像から特徴量を抽出し、得られた特徴を線形変換を用いて特徴次元を圧縮することで画像特徴を抽出することを特徴とする画像特徴特徴抽出方法において、
画像を二次元フーリエ変換し、
二次元フーリエ変換の実数成分と虚数成分を特徴ベクトルx1として抽出し、
前記の画像の二次元フーリエ変換のパワースペクトラムを算出し、
さらに前記の画像を複数に分割し、その各々の領域について二次元フーリエ変換のパワースペクトラムを算出し、それぞれのパワースペクトルを合成したベクトルを特徴ベクトルx2として抽出し、
それぞれの特徴ベクトルxi(i=1,2)の主成分に対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、 特徴ベクトルxiの主成分に対する判別行列 Wiおよび判別行列WTによって特定される線形変換によって、フーリエ成分の実成分と虚成分に対する特徴ベクトルx1とフーリエ成分のパワースペクトラムに対する特徴ベクトルx2を次元削減するように変換することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - 請求項11に記載の画像特徴抽出方法において、
フーリエ変換による実数成分と虚数成分による特徴ベクトルx1を主成分に変換する変換行列Ψ1と、その主成分に対する判別行列W1によって表される基底行列Φ1(=(W1 TΨ1 T)T)を用いて、特徴ベクトルx1の主成分の判別特徴を線形変換y1=Φ1 Tx1により算出し、
得られた特徴ベクトルy1の大きさを予め定めた大きさに正規化し、
フーリエ変換によるパワースペクトラムによる特徴ベクトルx2を主成分に変換する変換行列Ψ2と、その主成分に対する判別行列W2によって表される基底行列Φ2(=(W2 TΨ2 T)T)を用いて、特徴ベクトルx2の主成分の判別特徴を線形変換y2=Φ2 Tx2により算出し、
得られた特徴ベクトルy2の大きさを予め定めた大きさに正規化し、
二つの特徴ベクトルy1とy2を合わせた特徴ベクトルyについて、判別行列WTを用いて、線形変換z=WT Tyを計算し、特徴ベクトルzを算出することで、画像から特徴量を抽出することを特徴とする画像特徴抽出方法。 - パターン特徴を線形変換を用いて特徴次元を圧縮するパターン特徴抽出装置において、
パターン特徴を複数の特徴ベクトルで表現し、それぞれの特徴ベクトルxiに対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを求め、さらにそれらの判別行列を用いてベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、
前記判別行列Wiおよび前記判別行列WTによって特定される基底行列を記憶する基底行列記憶手段と、
基底行列記憶手段によって記憶される基底行列を用いて、パターンのの特徴ベクトルを変換する線形変換手段を備え、
パターンの特徴ベクトルを変換することで、特徴次元を圧縮することを特徴とするパターン特徴抽出装置。 - コンピュータに、パターン特徴を線形変換を用いて特徴次元を圧縮するパターン特徴抽出をさせるためのコンピュータプログラムにおいて、
パターン特徴を複数の特徴ベクトルxiで表現し、それぞれの特徴ベクトルxiに対して、線形判別分析により求められる各特徴ベクトルの判別行列Wiを予め求め、さらにそれらの判別行列を用いて ベクトルxiを線形変換することによって得られる各ベクトルyiを合わせた特徴ベクトルyについて、線形判別分析により判別行列WTを予め求めておき、
前記判別行列Wiおよび判別行列WTによって特定される線形変換によって、パターンの特徴ベクトルを変換するステップを有することで特徴次元を圧縮することを特徴とするパターン特徴抽出プログラム。 - 正規化画像を入力とし、予め定められた計算式を用いて前記正規化画像に対するフーリエスペクトルを計算することで、フーリエスペクトルベクトルを求めるステップと、
前記正規化画像の部分画像のフーリエ強度から、マルチブロックフーリエ強度ベクトルの抽出を行うステップと、
前記フーリエスペクトルベクトルと前記マルチブロック強度ベクトルとを基底行列を用いた特徴ベクトルの射影を行い、それぞれの正規化ベクトルを得るステップと、
前記正規化ベクトルを結合フーリエベクトルを成すように連結し、この連結された値を第2の基底行列を用いて射影ベクトルを得るステップと、
前記射影ベクトルを量子化することでフーリエ特徴を抽出するステップ
を有することを特徴とする画像特徴抽出方法。
Priority Applications (10)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003068916A JP4292837B2 (ja) | 2002-07-16 | 2003-03-13 | パターン特徴抽出方法及びその装置 |
| US10/512,194 US20050201595A1 (en) | 2002-07-16 | 2003-07-04 | Pattern characteristic extraction method and device for the same |
| AT03741208T ATE511680T1 (de) | 2002-07-16 | 2003-07-04 | Extraktionsverfahren für strukturcharakteristika und einrichtung dafür |
| EP03741208A EP1522962B1 (en) | 2002-07-16 | 2003-07-04 | Pattern characteristic extraction method and device for the same |
| CN2007101121408A CN101082955B (zh) | 2002-07-16 | 2003-07-04 | 模式特征提取方法及用于执行该方法的设备 |
| KR1020047017016A KR100578614B1 (ko) | 2002-07-16 | 2003-07-04 | 패턴 특징 추출 방법 및 그 장치 |
| PCT/JP2003/008556 WO2004008391A1 (ja) | 2002-07-16 | 2003-07-04 | パターン特徴抽出方法及びその装置 |
| EP09173514.2A EP2149852B1 (en) | 2002-07-16 | 2003-07-04 | Pattern feature extraction method and device for the same |
| HK06110698.8A HK1090157B (en) | 2002-07-16 | 2003-07-04 | Pattern characteristic extraction method and device for the same |
| US12/133,084 US8116571B2 (en) | 2002-07-16 | 2008-06-04 | Pattern feature extraction via fourier amplitudes of a block image |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002207022 | 2002-07-16 | ||
| JP2002300594 | 2002-10-15 | ||
| JP2003068916A JP4292837B2 (ja) | 2002-07-16 | 2003-03-13 | パターン特徴抽出方法及びその装置 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009013764A Division JP4770932B2 (ja) | 2002-07-16 | 2009-01-26 | パターン特徴抽出方法及びその装置 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2004192603A true JP2004192603A (ja) | 2004-07-08 |
| JP2004192603A5 JP2004192603A5 (ja) | 2007-03-22 |
| JP4292837B2 JP4292837B2 (ja) | 2009-07-08 |
Family
ID=30118927
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003068916A Expired - Lifetime JP4292837B2 (ja) | 2002-07-16 | 2003-03-13 | パターン特徴抽出方法及びその装置 |
Country Status (6)
| Country | Link |
|---|---|
| US (2) | US20050201595A1 (ja) |
| EP (2) | EP2149852B1 (ja) |
| JP (1) | JP4292837B2 (ja) |
| KR (1) | KR100578614B1 (ja) |
| AT (1) | ATE511680T1 (ja) |
| WO (1) | WO2004008391A1 (ja) |
Cited By (28)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006012130A (ja) * | 2004-05-17 | 2006-01-12 | Mitsubishi Electric Information Technology Centre Europa Bv | 画像を表現する方法、この方法の使用により導出される記述子、この記述子の送信、受信、および記憶のいずれかを含む使用ないし記述子の記憶装置、顔の認識、検出、または分類を行う方法及び装置ないしそのコンピュータプログラム及びコンピュータ読み取り可能な記憶媒体 |
| WO2006129551A1 (ja) * | 2005-05-31 | 2006-12-07 | Nec Corporation | パタン照合方法、パタン照合システム及びパタン照合プログラム |
| KR100682987B1 (ko) * | 2005-12-08 | 2007-02-15 | 한국전자통신연구원 | 선형판별 분석기법을 이용한 3차원 동작인식 장치 및 그방법 |
| WO2007049560A1 (ja) * | 2005-10-24 | 2007-05-03 | Nec Corporation | 係数決定方法、特徴抽出方法、システム及びプログラム、並びにパタン照合方法、システム及びプログラム |
| JP2007114413A (ja) * | 2005-10-19 | 2007-05-10 | Toshiba Corp | 音声非音声判別装置、音声区間検出装置、音声非音声判別方法、音声区間検出方法、音声非音声判別プログラムおよび音声区間検出プログラム |
| WO2007066953A1 (en) * | 2005-12-08 | 2007-06-14 | Electronics And Telecommunications Research Institute | Apparatus for recognizing three-dimensional motion using linear discriminant analysis |
| JP2007329779A (ja) * | 2006-06-09 | 2007-12-20 | Fuji Xerox Co Ltd | 欠陥分類システム、画像形成装置および欠陥分類プログラム |
| WO2008133235A1 (ja) * | 2007-04-23 | 2008-11-06 | Nec Corporation | 2次元パターンのマッチング方法、特徴抽出方法、これらに用いる装置及びプログラム |
| JP2008269573A (ja) * | 2007-02-09 | 2008-11-06 | Denso Corp | 演算装置及びプログラム |
| JP2009014415A (ja) * | 2007-07-02 | 2009-01-22 | National Institute Of Advanced Industrial & Technology | 物体認識装置および物体認識方法 |
| JP2009076012A (ja) * | 2007-09-25 | 2009-04-09 | Toyota Central R&D Labs Inc | 物体識別装置 |
| JP2009140267A (ja) * | 2007-12-07 | 2009-06-25 | Jfe Steel Corp | 鉄鋼プロセスの異常予知方法および装置 |
| WO2010004958A1 (ja) * | 2008-07-10 | 2010-01-14 | 日本電気株式会社 | 個人認証システム、個人認証方法 |
| JP2010157212A (ja) * | 2008-12-30 | 2010-07-15 | Mitsubishi Electric Research Laboratories Inc | 未知の顔の入力画像を既知の顔の基準画像と比較する方法 |
| JP2011227772A (ja) * | 2010-04-21 | 2011-11-10 | Nippon Hoso Kyokai <Nhk> | 画像分類装置及びプログラム |
| US8099277B2 (en) | 2006-09-27 | 2012-01-17 | Kabushiki Kaisha Toshiba | Speech-duration detector and computer program product therefor |
| US8195005B2 (en) | 2006-02-01 | 2012-06-05 | Nec Corporation | Image processing, image feature extraction and image matching apparatuses, methods and programs, and image matching system |
| US8380500B2 (en) | 2008-04-03 | 2013-02-19 | Kabushiki Kaisha Toshiba | Apparatus, method, and computer program product for judging speech/non-speech |
| JP2013131209A (ja) * | 2011-12-20 | 2013-07-04 | Apple Inc | 顔特徴ベクトルの構築 |
| JP2013171329A (ja) * | 2012-02-17 | 2013-09-02 | Nippon Telegr & Teleph Corp <Ntt> | データ分類予測装置、方法、及びプログラム |
| KR101322524B1 (ko) | 2009-01-23 | 2013-10-28 | 닛본 덴끼 가부시끼가이샤 | 화상 시그너처 추출 디바이스 |
| KR101351132B1 (ko) * | 2012-12-27 | 2014-01-14 | 조선대학교산학협력단 | 이방성의 웨이블릿 변환에 기반한 이미지 분할장치 및 그 방법 |
| US8805013B2 (en) | 2011-06-16 | 2014-08-12 | Shinkawa Ltd. | Pattern position detecting method |
| EP2830003A2 (en) | 2013-07-26 | 2015-01-28 | Fujitsu Limited | Image processing apparatus and method |
| JP2015184775A (ja) * | 2014-03-20 | 2015-10-22 | 株式会社東芝 | 次元削減装置、方法及びプログラム |
| US10008129B2 (en) | 2009-03-20 | 2018-06-26 | The Johns Hopkins University | Systems for quantifying clinical skill |
| JPWO2022244250A1 (ja) * | 2021-05-21 | 2022-11-24 | ||
| US12400474B2 (en) | 2021-03-12 | 2025-08-26 | Canon Kabushiki Kaisha | Information identification processing apparatus, information identification processing method, image identification system, and storage medium |
Families Citing this family (49)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4295118B2 (ja) * | 2002-03-27 | 2009-07-15 | ノキア コーポレイション | パターン認識 |
| JP4292837B2 (ja) | 2002-07-16 | 2009-07-08 | 日本電気株式会社 | パターン特徴抽出方法及びその装置 |
| JP4770932B2 (ja) * | 2002-07-16 | 2011-09-14 | 日本電気株式会社 | パターン特徴抽出方法及びその装置 |
| EP1411459B1 (en) * | 2002-10-15 | 2009-05-13 | Samsung Electronics Co., Ltd. | Method and apparatus for extracting feature vector used for face recognition and retrieval |
| JP4483334B2 (ja) * | 2004-02-18 | 2010-06-16 | 富士ゼロックス株式会社 | 画像処理装置 |
| US7689010B2 (en) * | 2004-12-03 | 2010-03-30 | Invacare International Sarl | Facial feature analysis system |
| US20060148323A1 (en) * | 2004-12-03 | 2006-07-06 | Ulrich Canzler | Facial feature analysis system |
| KR100723406B1 (ko) * | 2005-06-20 | 2007-05-30 | 삼성전자주식회사 | 국부이진패턴 구별 방법을 이용한 얼굴 검증 방법 및 장치 |
| JP4539494B2 (ja) * | 2005-08-23 | 2010-09-08 | コニカミノルタホールディングス株式会社 | 認証装置、認証方法及びプログラム |
| JP4658788B2 (ja) * | 2005-12-06 | 2011-03-23 | 株式会社日立国際電気 | 画像処理装置、画像処理方法およびプログラム |
| KR100723417B1 (ko) * | 2005-12-23 | 2007-05-30 | 삼성전자주식회사 | 얼굴 인식 방법, 그 장치, 이를 위한 얼굴 영상에서 특징추출 방법 및 그 장치 |
| JP5170961B2 (ja) * | 2006-02-01 | 2013-03-27 | ソニー株式会社 | 画像処理システム、画像処理装置および方法、プログラム、並びに記録媒体 |
| KR100771244B1 (ko) * | 2006-06-12 | 2007-10-29 | 삼성전자주식회사 | 동영상 데이터 처리 방법 및 장치 |
| US7734097B1 (en) * | 2006-08-01 | 2010-06-08 | Mitsubishi Electric Research Laboratories, Inc. | Detecting objects in images with covariance matrices |
| JP4197019B2 (ja) * | 2006-08-02 | 2008-12-17 | ソニー株式会社 | 撮像装置および表情評価装置 |
| US7724960B1 (en) | 2006-09-08 | 2010-05-25 | University Of Central Florida Research Foundation Inc. | Recognition and classification based on principal component analysis in the transform domain |
| US8068551B2 (en) * | 2007-09-06 | 2011-11-29 | Sharp Laboratories Of America, Inc. | Systems and methods for designing a reference signal to be transmitted in a multiplexed cellular system |
| CN101414348A (zh) * | 2007-10-19 | 2009-04-22 | 三星电子株式会社 | 多角度人脸识别方法和系统 |
| JP5081590B2 (ja) * | 2007-11-14 | 2012-11-28 | 株式会社日立ハイテクノロジーズ | 欠陥観察分類方法及びその装置 |
| US8208731B2 (en) * | 2008-04-07 | 2012-06-26 | Microsoft Corporation | Image descriptor quantization |
| JP5294342B2 (ja) * | 2008-04-28 | 2013-09-18 | 公立大学法人大阪府立大学 | 物体認識用画像データベースの作成方法、処理装置および処理用プログラム |
| EP2284791B1 (en) | 2008-04-30 | 2014-01-01 | Osaka Prefecture University Public Corporation | Method of creating three-dimensional object identifying image database, processing apparatus and processing program |
| US8218880B2 (en) | 2008-05-29 | 2012-07-10 | Microsoft Corporation | Linear laplacian discrimination for feature extraction |
| US8024152B2 (en) * | 2008-09-23 | 2011-09-20 | Microsoft Corporation | Tensor linear laplacian discrimination for feature extraction |
| WO2010041731A1 (ja) * | 2008-10-10 | 2010-04-15 | 日本電気株式会社 | 照合装置、照合方法、及びプログラム |
| JP5459312B2 (ja) * | 2009-03-27 | 2014-04-02 | 日本電気株式会社 | パターン照合装置、パターン照合方法及びパターン照合プログラム |
| KR101355299B1 (ko) * | 2009-04-14 | 2014-01-23 | 닛본 덴끼 가부시끼가이샤 | 이미지 시그니처 추출 장치 |
| JP2012027687A (ja) * | 2010-07-23 | 2012-02-09 | Casio Comput Co Ltd | 画像処理装置及びプログラム |
| US8838147B2 (en) * | 2011-08-31 | 2014-09-16 | Nokia Corporation | Method and apparatus for determining environmental context utilizing features obtained by multiple radio receivers |
| US9355303B2 (en) * | 2011-12-04 | 2016-05-31 | King Saud University | Face recognition using multilayered discriminant analysis |
| JP5649601B2 (ja) * | 2012-03-14 | 2015-01-07 | 株式会社東芝 | 照合装置、方法及びプログラム |
| CN103514432B (zh) * | 2012-06-25 | 2017-09-01 | 诺基亚技术有限公司 | 人脸特征提取方法、设备和计算机程序产品 |
| KR20140107044A (ko) * | 2013-02-27 | 2014-09-04 | 삼성전자주식회사 | 이미지 서브 시스템 |
| WO2014167880A1 (ja) | 2013-04-09 | 2014-10-16 | 株式会社日立国際電気 | 画像検索装置、画像検索方法、および記録媒体 |
| CN103473544A (zh) * | 2013-04-28 | 2013-12-25 | 南京理工大学 | 一种鲁棒的人体特征快速提取方法 |
| JP6167733B2 (ja) * | 2013-07-30 | 2017-07-26 | 富士通株式会社 | 生体特徴ベクトル抽出装置、生体特徴ベクトル抽出方法、および生体特徴ベクトル抽出プログラム |
| CN105096304B (zh) * | 2014-05-22 | 2018-01-02 | 华为技术有限公司 | 一种图像特征的估计方法和设备 |
| KR102077260B1 (ko) * | 2014-08-08 | 2020-02-13 | 삼성전자주식회사 | 확룔 모델에 기반한 신뢰도를 이용하여 얼굴을 인식하는 방법 및 장치 |
| US9652664B1 (en) | 2014-12-30 | 2017-05-16 | Morphotrust Usa, Llc | Facial recognition using fractal features |
| US10366279B2 (en) | 2017-08-29 | 2019-07-30 | Bank Of America Corporation | System for execution of multiple events based on image data extraction and evaluation |
| CN108171216A (zh) * | 2018-01-22 | 2018-06-15 | 扬州大学 | 一种用于人脸识别的稀疏噪声矩阵分解方法 |
| US11521460B2 (en) | 2018-07-25 | 2022-12-06 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
| US10878657B2 (en) | 2018-07-25 | 2020-12-29 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
| US11222199B2 (en) * | 2018-12-05 | 2022-01-11 | International Business Machines Corporation | Automatically suggesting behavioral adjustments during video conferences |
| CN109919276A (zh) * | 2019-01-13 | 2019-06-21 | 湖南省农业信息与工程研究所 | 一种基于产品表面纹理图像特征的防伪方法 |
| US11244169B2 (en) | 2020-06-15 | 2022-02-08 | Bank Of America Corporation | System for executing multiple events based on video data extraction and evaluation |
| CN112115881B (zh) * | 2020-09-21 | 2023-09-26 | 国网重庆市电力公司长寿供电分公司 | 基于鲁棒鉴别特征学习的图像特征提取方法 |
| CN113743485B (zh) * | 2021-08-23 | 2025-02-18 | 江苏大学 | 一种基于傅里叶域主成分分析的数据降维方法 |
| CN116347104B (zh) * | 2023-05-22 | 2023-10-17 | 宁波康达凯能医疗科技有限公司 | 基于高效判别分析的帧内图像编码方法、装置及存储介质 |
Family Cites Families (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4259661A (en) * | 1978-09-01 | 1981-03-31 | Burroughs Corporation | Apparatus and method for recognizing a pattern |
| JPH04292837A (ja) | 1991-03-20 | 1992-10-16 | Fujitsu Ltd | プラズマディスプレイパネル |
| US20020009208A1 (en) * | 1995-08-09 | 2002-01-24 | Adnan Alattar | Authentication of physical and electronic media objects using digital watermarks |
| JPH09508505A (ja) | 1994-01-19 | 1997-08-26 | ユニバーシティー オブ ストラスクライド | フラクタルデータコンプレッション |
| US5684890A (en) * | 1994-02-28 | 1997-11-04 | Nec Corporation | Three-dimensional reference image segmenting method and apparatus |
| JP3022946B2 (ja) | 1994-04-20 | 2000-03-21 | 株式会社エヌ・ティ・ティ・データ | パターン認識用特徴ベクトルの次元圧縮のための特徴変換行列の演算方式 |
| WO1997005566A1 (en) * | 1995-07-26 | 1997-02-13 | Identification Technologies International, Inc. | System for object verification and identification |
| JP3305551B2 (ja) | 1995-11-30 | 2002-07-22 | 日本電信電話株式会社 | 特定対称物体判定方法 |
| JP2739856B2 (ja) * | 1995-12-18 | 1998-04-15 | 日本電気株式会社 | 指掌紋画像処理装置 |
| US6021219A (en) * | 1997-01-07 | 2000-02-01 | Lucent Technologies Inc. | Methods and apparatus for distinguishing among several visual patterns |
| JPH11196262A (ja) * | 1997-11-07 | 1999-07-21 | Matsushita Electric Ind Co Ltd | デジタル情報埋込み・抽出装置および方法並びに当該方法を実行するためのプログラムを記録した媒体 |
| JP2000222572A (ja) | 1999-01-28 | 2000-08-11 | Toshiba Tec Corp | 性別の判定方法 |
| JP3809305B2 (ja) * | 1999-07-27 | 2006-08-16 | キヤノン株式会社 | 画像検索装置及び画像検索方法及びコンピュータ読み取り可能な記憶媒体 |
| GB0013016D0 (en) | 2000-05-26 | 2000-07-19 | Univ Surrey | Personal identity authentication process and system |
| JP4292837B2 (ja) * | 2002-07-16 | 2009-07-08 | 日本電気株式会社 | パターン特徴抽出方法及びその装置 |
-
2003
- 2003-03-13 JP JP2003068916A patent/JP4292837B2/ja not_active Expired - Lifetime
- 2003-07-04 EP EP09173514.2A patent/EP2149852B1/en not_active Expired - Lifetime
- 2003-07-04 EP EP03741208A patent/EP1522962B1/en not_active Expired - Lifetime
- 2003-07-04 US US10/512,194 patent/US20050201595A1/en not_active Abandoned
- 2003-07-04 WO PCT/JP2003/008556 patent/WO2004008391A1/ja not_active Ceased
- 2003-07-04 AT AT03741208T patent/ATE511680T1/de not_active IP Right Cessation
- 2003-07-04 KR KR1020047017016A patent/KR100578614B1/ko not_active Expired - Lifetime
-
2008
- 2008-06-04 US US12/133,084 patent/US8116571B2/en not_active Expired - Fee Related
Cited By (40)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006012130A (ja) * | 2004-05-17 | 2006-01-12 | Mitsubishi Electric Information Technology Centre Europa Bv | 画像を表現する方法、この方法の使用により導出される記述子、この記述子の送信、受信、および記憶のいずれかを含む使用ないし記述子の記憶装置、顔の認識、検出、または分類を行う方法及び装置ないしそのコンピュータプログラム及びコンピュータ読み取り可能な記憶媒体 |
| WO2006129551A1 (ja) * | 2005-05-31 | 2006-12-07 | Nec Corporation | パタン照合方法、パタン照合システム及びパタン照合プログラム |
| JP2007114413A (ja) * | 2005-10-19 | 2007-05-10 | Toshiba Corp | 音声非音声判別装置、音声区間検出装置、音声非音声判別方法、音声区間検出方法、音声非音声判別プログラムおよび音声区間検出プログラム |
| US8121357B2 (en) | 2005-10-24 | 2012-02-21 | Nec Corporation | Coefficient determining method, feature extracting method, system, and program, and pattern checking method, system, and program |
| WO2007049560A1 (ja) * | 2005-10-24 | 2007-05-03 | Nec Corporation | 係数決定方法、特徴抽出方法、システム及びプログラム、並びにパタン照合方法、システム及びプログラム |
| KR100682987B1 (ko) * | 2005-12-08 | 2007-02-15 | 한국전자통신연구원 | 선형판별 분석기법을 이용한 3차원 동작인식 장치 및 그방법 |
| WO2007066953A1 (en) * | 2005-12-08 | 2007-06-14 | Electronics And Telecommunications Research Institute | Apparatus for recognizing three-dimensional motion using linear discriminant analysis |
| US8195005B2 (en) | 2006-02-01 | 2012-06-05 | Nec Corporation | Image processing, image feature extraction and image matching apparatuses, methods and programs, and image matching system |
| JP2007329779A (ja) * | 2006-06-09 | 2007-12-20 | Fuji Xerox Co Ltd | 欠陥分類システム、画像形成装置および欠陥分類プログラム |
| US8099277B2 (en) | 2006-09-27 | 2012-01-17 | Kabushiki Kaisha Toshiba | Speech-duration detector and computer program product therefor |
| JP2008269573A (ja) * | 2007-02-09 | 2008-11-06 | Denso Corp | 演算装置及びプログラム |
| JPWO2008133235A1 (ja) * | 2007-04-23 | 2010-07-29 | 日本電気株式会社 | 2次元パターンのマッチング方法、特徴抽出方法、これらに用いる装置及びプログラム |
| WO2008133235A1 (ja) * | 2007-04-23 | 2008-11-06 | Nec Corporation | 2次元パターンのマッチング方法、特徴抽出方法、これらに用いる装置及びプログラム |
| US8606019B2 (en) | 2007-04-23 | 2013-12-10 | Nec Corporation | Matching method for two-dimensional pattern, feature extracting method, apparatus used for the methods, and programs |
| JP2009014415A (ja) * | 2007-07-02 | 2009-01-22 | National Institute Of Advanced Industrial & Technology | 物体認識装置および物体認識方法 |
| JP2009076012A (ja) * | 2007-09-25 | 2009-04-09 | Toyota Central R&D Labs Inc | 物体識別装置 |
| JP2009140267A (ja) * | 2007-12-07 | 2009-06-25 | Jfe Steel Corp | 鉄鋼プロセスの異常予知方法および装置 |
| US8380500B2 (en) | 2008-04-03 | 2013-02-19 | Kabushiki Kaisha Toshiba | Apparatus, method, and computer program product for judging speech/non-speech |
| US8553983B2 (en) | 2008-07-10 | 2013-10-08 | Nec Corporation | Personal authentication system and personal authentication method |
| WO2010004958A1 (ja) * | 2008-07-10 | 2010-01-14 | 日本電気株式会社 | 個人認証システム、個人認証方法 |
| JP5418991B2 (ja) * | 2008-07-10 | 2014-02-19 | 日本電気株式会社 | 個人認証システム、個人認証方法 |
| JP2010157212A (ja) * | 2008-12-30 | 2010-07-15 | Mitsubishi Electric Research Laboratories Inc | 未知の顔の入力画像を既知の顔の基準画像と比較する方法 |
| KR101322524B1 (ko) | 2009-01-23 | 2013-10-28 | 닛본 덴끼 가부시끼가이샤 | 화상 시그너처 추출 디바이스 |
| KR101914303B1 (ko) * | 2009-03-20 | 2018-11-01 | 더 존스 홉킨스 유니버시티 | 전문 기술을 정량화하는 방법 및 시스템 |
| US10008129B2 (en) | 2009-03-20 | 2018-06-26 | The Johns Hopkins University | Systems for quantifying clinical skill |
| JP2011227772A (ja) * | 2010-04-21 | 2011-11-10 | Nippon Hoso Kyokai <Nhk> | 画像分類装置及びプログラム |
| US8805013B2 (en) | 2011-06-16 | 2014-08-12 | Shinkawa Ltd. | Pattern position detecting method |
| JP2013131209A (ja) * | 2011-12-20 | 2013-07-04 | Apple Inc | 顔特徴ベクトルの構築 |
| KR101481225B1 (ko) * | 2011-12-20 | 2015-01-09 | 애플 인크. | 안면 특징 벡터 구성 |
| JP2013171329A (ja) * | 2012-02-17 | 2013-09-02 | Nippon Telegr & Teleph Corp <Ntt> | データ分類予測装置、方法、及びプログラム |
| KR101351132B1 (ko) * | 2012-12-27 | 2014-01-14 | 조선대학교산학협력단 | 이방성의 웨이블릿 변환에 기반한 이미지 분할장치 및 그 방법 |
| EP2830003A2 (en) | 2013-07-26 | 2015-01-28 | Fujitsu Limited | Image processing apparatus and method |
| US9405956B2 (en) | 2013-07-26 | 2016-08-02 | Fujitsu Limited | Image processing apparatus and method |
| US9483710B1 (en) | 2013-07-26 | 2016-11-01 | Fujitsu Limited | Image processing apparatus and method |
| JP2015184775A (ja) * | 2014-03-20 | 2015-10-22 | 株式会社東芝 | 次元削減装置、方法及びプログラム |
| US9704065B2 (en) | 2014-03-20 | 2017-07-11 | Kabushiki Kaisha Toshiba | Dimension reduction apparatus, dimension reduction method, and computer program product |
| US12400474B2 (en) | 2021-03-12 | 2025-08-26 | Canon Kabushiki Kaisha | Information identification processing apparatus, information identification processing method, image identification system, and storage medium |
| JPWO2022244250A1 (ja) * | 2021-05-21 | 2022-11-24 | ||
| WO2022244250A1 (ja) * | 2021-05-21 | 2022-11-24 | 日本電気株式会社 | 情報生成装置、判定装置、情報生成方法、判定方法及び記憶媒体 |
| JP7670127B2 (ja) | 2021-05-21 | 2025-04-30 | 日本電気株式会社 | 情報生成装置、判定装置、情報生成方法、判定方法及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| EP1522962A4 (en) | 2007-12-26 |
| US8116571B2 (en) | 2012-02-14 |
| US20050201595A1 (en) | 2005-09-15 |
| US20080304750A1 (en) | 2008-12-11 |
| JP4292837B2 (ja) | 2009-07-08 |
| EP2149852B1 (en) | 2016-01-06 |
| HK1090157A1 (zh) | 2006-12-15 |
| KR100578614B1 (ko) | 2006-05-10 |
| ATE511680T1 (de) | 2011-06-15 |
| EP1522962B1 (en) | 2011-06-01 |
| WO2004008391A1 (ja) | 2004-01-22 |
| KR20050009698A (ko) | 2005-01-25 |
| EP2149852A1 (en) | 2010-02-03 |
| EP1522962A1 (en) | 2005-04-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4292837B2 (ja) | パターン特徴抽出方法及びその装置 | |
| JP4770932B2 (ja) | パターン特徴抽出方法及びその装置 | |
| JP3872778B2 (ja) | 結合された成分記述子を用いた顔検索方法及びその装置 | |
| US8842891B2 (en) | Ultra-low dimensional representation for face recognition under varying expressions | |
| JP4589625B2 (ja) | カーネルフィッシャーフェイスを使用した顔認識 | |
| KR100731937B1 (ko) | 얼굴 메타 데이터 생성 | |
| CN1700241B (zh) | 面部描述和识别的方法和装置 | |
| JP2005512201A5 (ja) | ||
| CN102982528A (zh) | 图像处理装置及图像处理方法 | |
| Tapia et al. | Selfie periocular verification using an efficient super-resolution approach | |
| JP2008251039A (ja) | 画像認識システム及びその認識方法並びにプログラム | |
| JP4682670B2 (ja) | 類似画像検索方法および類似画像検索装置 | |
| JP4099981B2 (ja) | 画像認識システム、画像認識方法および画像認識プログラム | |
| KR20040079637A (ko) | 3차원 얼굴기술자를 이용한 얼굴인식방법 및 장치 | |
| Deepa et al. | Challenging aspects for facial feature extraction and age estimation | |
| CN100421127C (zh) | 模式特征提取方法及用于执行该方法的设备 | |
| HK1090157B (en) | Pattern characteristic extraction method and device for the same | |
| Tuffour | Enhancing facial recognition: A comparative analysis of image preprocessing techniques in PCA, KL expansion and SVD | |
| KR20040101221A (ko) | 고차 고유 성분을 이용한 안면 기술 및 인식 방법, 및 그장치 | |
| Forczmański | Comparison of tensor unfolding variants for 2DPCA-Based color facial portraits recognition | |
| Saffarini | Face Recognition at a Distance Using Average Pixel Super Resolution | |
| Saffarini | Deanship of Graduation Studies Al-Quds University | |
| Li | Robust Face Recognition based on Color and Depth Information | |
| Katadound | Face recognition: study and comparison of PCA and EBGM algorithms | |
| Wall | Context-based algorithm for face detection |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050310 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060216 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060911 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070115 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070129 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080611 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080826 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081027 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081125 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090126 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090203 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090317 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090330 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120417 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4292837 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120417 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130417 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130417 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140417 Year of fee payment: 5 |
|
| EXPY | Cancellation because of completion of term |
