WO2005111936A1 - パラメタ推定方法、パラメタ推定装置および照合方法 - Google Patents

パラメタ推定方法、パラメタ推定装置および照合方法 Download PDF

Info

Publication number
WO2005111936A1
WO2005111936A1 PCT/JP2005/008006 JP2005008006W WO2005111936A1 WO 2005111936 A1 WO2005111936 A1 WO 2005111936A1 JP 2005008006 W JP2005008006 W JP 2005008006W WO 2005111936 A1 WO2005111936 A1 WO 2005111936A1
Authority
WO
WIPO (PCT)
Prior art keywords
learning
parameter
face image
face
input data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2005/008006
Other languages
English (en)
French (fr)
Inventor
Kenji Nagao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NAGAO ETSUKO
Panasonic Holdings Corp
Original Assignee
NAGAO ETSUKO
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NAGAO ETSUKO, Matsushita Electric Industrial Co Ltd filed Critical NAGAO ETSUKO
Priority to US11/596,431 priority Critical patent/US7760933B2/en
Priority to EP05737145.2A priority patent/EP1758059A4/en
Priority to CN2005800155586A priority patent/CN1954342B/zh
Publication of WO2005111936A1 publication Critical patent/WO2005111936A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships

Definitions

  • the present invention relates to a parameter estimating method for estimating a specific parameter with respect to input data force, a parameter estimating apparatus, and a matching method using the same.
  • a process of estimating a specific parameter from an input image is a general process in pattern information processing. For example, processing to extract the position of the eyes and nose from the human face image and processing to extract the position of the vehicle image license plate are applicable.
  • the parameter estimation method, parameter estimation device, and collation method of the present invention have been made in view of these problems, and have a short processing time, a short processing time, and an accurate parameter for input data at a low processing cost. It is intended to be estimated.
  • the parameter estimation method of the present invention expresses an arithmetic method for estimating the maximum posterior probability for input data by using an inner product related to the input data, replacing the inner product with a kernel function, and The feature is to estimate the parameters using the calculation results.
  • FIG. 1 is a block diagram of a parameter estimation device according to Embodiment 1 of the present invention.
  • FIG. 2 is a flowchart of a parameter estimating apparatus according to Embodiment 1 of the present invention.
  • FIG. 3 is a block diagram of a face image matching device according to Embodiment 2 of the present invention.
  • FIG. 4 is a flowchart of a face image collating apparatus according to Embodiment 2 of the present invention.
  • FIG. 5 is a diagram showing an example of feature points of a face input by a user.
  • FIG. 6 is a diagram showing some examples of eye positions extracted in Embodiment 2 of the present invention.
  • FIG. 7A is a diagram showing the sensitivity of eye position estimation when the imaging distance of the face image matching device according to Embodiment 2 of the present invention is changed.
  • FIG. 7B is a diagram showing sensitivity of eye position estimation when the imaging angle of the face image matching device according to Embodiment 2 of the present invention is changed.
  • FIG. 8A is a diagram showing the sensitivity of eye position estimation to the movement of the face position within the screen of a face image photographed with a frontal force.
  • FIG. 8B is a diagram showing the sensitivity of eye position estimation with respect to the movement of the face position within the screen of a face image photographed diagonally.
  • FIG. 9 is a diagram showing the number of iterations and the sensitivity of eye position estimation.
  • FIG. 10 is a block diagram of a face image matching device according to Embodiment 3 of the present invention.
  • FIG. 11 is a flowchart of a face image matching device according to Embodiments 3 and 4 of the present invention.
  • an operation method for estimating the maximum posterior probability for input data is represented by an inner product related to the input data, the inner product is replaced with a kernel function, and the parameter is estimated using a calculation result of the kernel function. It is characterized by doing. With this method, parameters for input data can be accurately estimated with a short processing time or a small processing cost.
  • the parameter estimation method of the present invention includes a step of learning a correlation between a plurality of learning input data whose parameters to be estimated are known and a parameter corresponding to each of the learning input data. And estimating the parameters of the input data for estimation for which the power parameter is unknown using the learned correlation.
  • Estimating the parameters of the input data for estimation According to this method, it is possible to accurately estimate parameters for input data with a short processing time or a small processing cost using a computer system.
  • the parameter estimating apparatus of the present invention includes: a learning unit that learns a correlation between a plurality of learning input data whose parameters to be estimated are known and a parameter corresponding to each of the learning input data; Estimating means for estimating the parameters of the estimation input data whose parameters to be unknown are learned using the learned correlation, wherein the learning means uses a plurality of learning input data whose parameters to be estimated are known.
  • a learning kernel matrix calculating means for calculating a learning kernel matrix; and an eigenvalue calculating means for calculating an eigenvalue and an eigenvector of an inverse matrix of the learning kernel matrix, wherein the estimating means includes an estimating input for which the parameter to be estimated is unknown.
  • Estimation kernel calculating means for calculating an estimation kernel using data and input data for learning, a learning kernel matrix, and eigenvalues of an inverse matrix of the learning kernel matrix Characterized in that e Bei and parameter calculation means for calculating the parameters of the estimated input data using its own vector.
  • the input data for estimation and the input data for learning may be an image including a face
  • the parameter to be estimated may be coordinates of a feature point of the face.
  • the matching method of the present invention is a matching method using the parameter estimation device of the present invention and a face image database, wherein the coordinates of the feature points of the face with respect to the face image to be matched using the parameter estimation device. After estimating the face area, the face area is cut out based on the coordinates of the feature points of the face, and the face image registered in the face image database is compared with the cut out face area. This According to the method, it is possible to cut out a face area used for face matching from a face image with a short processing time and a small processing time, and a small processing cost.
  • the matching method of the present invention is a matching method using the parameter estimating device of the present invention and a face image database, and estimates the coordinates of the feature points of the face by using the parameter estimating device to obtain the feature of the face.
  • the face image normalization operation for normalizing the image area based on the coordinates of the points is repeated a plurality of times, the face area is cut out based on the coordinates of the feature points of the face, and the face image registered in the face image database and the cut out face area are extracted. Collated with the selected face area.
  • the input data for estimation and the input data for learning may be an image including a face
  • the parameter to be estimated may be height information of the face image.
  • a matching method of the present invention is a matching method using the parameter estimating device of the present invention and a face image database, and estimates height information for a face image to be matched using the parameter estimating device. Then, based on the height information of the face image, the two-dimensional image viewed from the same angle as the face image registered in the face image database is synthesized and collated. According to this method, even if the face image faces in an arbitrary direction, it can be compared with the face image database registered as the front or side face image.
  • a matching method is a matching method using the parameter estimating device according to claim 7 and a face image database, and is registered in a face image database using the parameter estimating device. After estimating the height information for the face image that is present, a two-dimensional image viewed from an angle other than the registered face image is synthesized and additionally registered in the face image database. According to this method, the input face image is registered in the face image database! Since the face image can be directly collated, high-speed collation can be performed.
  • FIG. 1 is a block diagram of a parameter estimating apparatus according to Embodiment 1 of the present invention, which is realized by a computer system.
  • the parameter estimating apparatus 100 includes a data input unit 10 for exchanging data with an external device, a CPU 20 for performing data processing, and a program storage unit. And work memory 30, secondary storage (hard disk, magneto-optical disk, etc.) 40 for storing large-scale data such as input data for parameter estimation and correlation data, display 50 as a system console, A mouse 60 is provided as a machine interface, and the above blocks are connected to a system bus 90.
  • the CPU 20 functions as a learning kernel matrix calculating unit 22 and an eigenvalue calculating unit 23 of a learning unit by executing a corresponding program, and as an estimated kernel calculating unit 26 and a parameter calculating unit 27 of an estimating unit. work.
  • an area for storing various data described later is secured.
  • the parameter estimating apparatus 100 is based on the fact that there is a correlation between input data to be estimated and parameters to be estimated. In other words, for many input data for learning, the parameters of which are to be estimated, the correlation between the input data and the parameters is learned at a glance, and any correlation between the input data and the parameters can be made using this correlation.
  • the parameter for is estimated.
  • the operation of the step of learning the correlation between input data and parameters using a learning sample (hereinafter, referred to as “off-line processing”) will be described.
  • the input data is n-dimensional input vector I
  • the parameters for input vector I are m-dimensional parameter vectors Q
  • the total number of training samples is N.
  • FIG. 2 is a flowchart of the parameter estimating apparatus 100 according to Embodiment 1 of the present invention. The following flow is executed by executing the program stored in the CPU 20 and the memory 30.
  • the CPU 20 calculates (Equation 2) as follows. Then, a deviation parameter vector from the average parameter vector Q a is obtained, transferred to the secondary storage device 40, and stored (S12).
  • the eigenvalue ⁇ and the eigenvector a k are transferred to and stored in the secondary storage device 40 (S15). here
  • M indicates the number of independent eigenvectors, and the maximum is equal to the number N of training samples.
  • K e represents a deviation learning kernel matrix.
  • the data necessary to represent the correlation between the input vector I and the parameter vector Q is further processed in order to simplify the calculation in the estimating step after the uniform force.
  • the deviation parameter obtained above Using the tuttle Q e , the deviation learning kernel matrix K e , the eigenvalues and the eigenvectors o; k , (i ij k
  • Equation 6 M m-dimensional constant vectors ⁇ are obtained based on Equation 6).
  • a secondary storage device 4 0 has an average parameter vector Q a determined in the processing described above, constant vector Omega, constant vector gamma, eigenvectors a k is stored.
  • Q a constant vector Omega
  • eigenvectors a k is stored.
  • online processing a step of actually estimating parameters for input data for which parameters are to be estimated.
  • the following flow is executed by the CPU 20 executing the program stored in the memory 30.
  • input data for which parameters are to be estimated are input to the data input unit 10 as an input vector I, and stored in the secondary storage device 40 (S 20).
  • the obtained estimated kernel K is transferred to the secondary storage device 40 and stored (S21).
  • the estimated kernel K obtained in 21 is read from the secondary storage device 40, and a parameter vector Q indicating a parameter to be estimated is calculated using (Equation 9). Then, the estimated parameter parameter Q is stored in the secondary storage device 40 (S22).
  • the CPU 20 functions as estimating means.
  • the optimal value of the scale ⁇ differs depending on the input vector to be estimated and the parameter to be estimated, which did not mention the scale ⁇ of the Gaussian kernel. Therefore, it is desirable to determine the value while conducting a metametric estimation experiment.
  • the present inventors have been studying a MAP (maximum posteriori) estimation method as a method for estimating parameters from image signals. If the simultaneous distribution of the input image I and the parameter Q to be estimated is a random vector following a Gaussian distribution, the optimal estimate of the parameter Q can be obtained using (Equation 10).
  • Equation 10 is similar to the equation used for so-called multiple regression analysis. However, if the relationship between the input image I and the parameter Q to be estimated becomes more complicated, and their joint distribution cannot be represented by a Gaussian distribution, then it is difficult to estimate with this simple mathematical formula. It became clear experimentally.
  • Kernel trick a new concept which has been introduced into an image recognition technique called a support vector machine and has obtained good results. I paid attention. This is a method of performing non-linear transformation of an input vector and performing linear discrimination in that space.
  • the present inventors have studied the introduction of “kernel trick” into the MAP estimation method, and as a result, have established a new parameter estimation method called KMAP. The details are described below.
  • the input vector I is nonlinearly transformed using the nonlinear function ⁇ .
  • Equation 12 if the non-linearly converted statistic is to be calculated as it is, an enormous calculation in a higher-dimensional space is required. If the operations on the transformed input vector ⁇ can be grouped into the inner product form ⁇ - ⁇ ⁇ ⁇ ⁇ , this can be replaced with the kernel ⁇ ( ⁇ , ⁇ ), greatly reducing the computational complexity. Can be.
  • [ ⁇ ]
  • A diag [l] each sigma _1 eigenvectors, eigenvalues
  • the eigenvalue is the deviation learning kernel matrix K e as shown in (Equation 14).
  • the expansion coefficient o; k at this time is the k-th eigenvalue of the deviation learning kernel matrix K e
  • the average parameter vector Q a , the constant vector ⁇ , the constant vector ⁇ , and the eigenvector a k are obtained in advance using N learning samples, and the input k
  • the parameter Q can be estimated using (Equation 6) to (Equation 9).
  • a polynomial kernel As the kernel, a polynomial kernel, a sigmoid kernel, a Gaussian kernel, or the like can be used. However, what kind of kernel to use depends on the input vector to be estimated and the parameter to be estimated. It is desirable to determine the kernel while conducting parameter estimation experiments.
  • FIG. 3 is a block diagram of a face image matching device according to Embodiment 2 of the present invention.
  • the parameter estimating apparatus 100 is configured by a computer system as in the first embodiment, and the blocks are denoted by the same reference numerals as in the first embodiment, and description thereof is omitted.
  • a video camera 110 for capturing a face image of a person is connected to the face image matching device 200.
  • a face image database 140 in which a face image of a previously registered person is also connected.
  • Face image matching apparatus 200 first finds the coordinates of feature points such as eyes, nose, eyebrows, and mouth from the input face image using parameter estimation apparatus 100 in the first embodiment. Next, face image matching apparatus 200 cuts out a face area used for face matching based on the coordinates of the feature points. Specifically, for example, a face area is defined as a square area in which the length of one side is twice as long as the distance between the eyes with the coordinates of the nose as the center, and the upper and lower sides are parallel to a straight line connecting the eyes. Then, the cut out face area is compared with the face image registered in face image database 140.
  • a matching method for example, a method such as an eigenface method using principal component analysis, which is a statistical method, can be used.
  • the operation of the parameter estimating apparatus 100 that finds the coordinates of the feature points such as eyes, nose, eyebrows, and mouth from the input face image will be described in detail.
  • the total number of learning face images is N
  • the input vector is an n-dimensional vector in which the values of each pixel of the i-th learning face image are arranged in raster scan order
  • the position coordinates of each feature point are m-dimensional parameter vectors Q .
  • FIG. 4 is a flowchart of the parameter estimating apparatus 100 used in the face image matching apparatus 200 according to Embodiment 2 of the present invention.
  • the camera 110 captures learning face images for N persons.
  • the learning face images that is, the learning input vector I.
  • FIG. 5 is a diagram showing an example of the facial feature points input by the user.
  • the X and Y coordinates of each of the right eyebrow, right eye, left eyebrow, left eye, nose and mouth are input by the user as feature point coordinates.
  • the CPU 20 sequentially arranges and connects the coordinate values of each of the feature points input to each of the learning face images to form a learning parameter vector Qi, and stores it in the secondary storage device 40 (S31).
  • the CPU 20 calculates the average parameter vector Q a and the constant beta using Equations (1) to (7).
  • ⁇ , a constant vector ⁇ , and an eigenvector a k and store them in the secondary storage device 40 (S32 k
  • the above is the processing performed by the parameter estimation device 100 offline.
  • the data input unit 10 inputs a face image to be collated, arranges the values of each pixel of the face image in raster scan order, converts it into an input vector I, and transfers it to the secondary storage device 40 (S40). .
  • the parameter vector Q indicating the parameter to be estimated is calculated using (Equation 9).
  • the estimated parameter vector Q is stored in the secondary storage device 40 (S42).
  • the CPU 20 decomposes the parameter vector Q into the coordinate data of the feature quantity and displays it on the display together with the input face image (S43). This is the operation to find the coordinates of feature points such as eyes, nose, eyebrows, and mouth from the input face image.
  • a face area used for face authentication is cut out based on the coordinates of the feature points, and the cut out face area is compared with a face image registered in the face image database 140.
  • FIG. 6 is a diagram showing some examples of eye positions extracted in the second embodiment of the present invention.
  • the positions of the extracted eyes are indicated by X marks on the input image.
  • FIG. 7 shows the sensitivity of eye position estimation of the face image matching device according to Embodiment 2 of the present invention.
  • 7A is a diagram when the photographing distance is changed
  • FIG. 7B is a diagram when the photographing angle is changed.
  • the horizontal axis shows the estimated eye position error in pixel units
  • the vertical axis shows the cumulative extraction rate (correction of the estimated eye position coordinates when the error shown on the horizontal axis is allowed). Therefore, the higher the cumulative extraction rate in the range where the error is small, the higher the sensitivity of position estimation.
  • KMAP cumulative extraction rate
  • FIG. 8 is a diagram showing the sensitivity of eye position estimation with respect to the movement of the face position within the screen.
  • FIG. 8A is for a face image taken from the front
  • FIG. 8B is a face taken from an oblique direction. It is for images.
  • the moving image was created artificially using the rotation target Gaussian distribution.
  • the variance of the movement amount was set to 0, 10, 20, and 30 pixels
  • the variance of the rotation angle was 45 degrees
  • the average power of the reduction ratio was ⁇ times
  • the variance was 0.5 times.
  • FIGS. 8A and 8B show the sensitivity of eye position estimation in each method with respect to the variance of each movement amount.
  • the method of repeatedly using the KMAP method is as follows. First, the eye position is estimated using the KMAP method, and then the image region is normalized using the estimated eye position. Then, the eye position is estimated again by the KMAP method using the normalized face image. Such a method of repeating the KM AP method n times will be referred to as KMAP (n).
  • KMAP (n) KMAP, KMAP (2), KMAP (3), and MLG for a face image having a dispersive power S of 30 pixels.
  • the speed of eye position estimation by KMAP was 0.8 seconds per image. According to the MLG method, it was 6 seconds per image (when using a processor equivalent to Pentium IV (registered trademark)). This Thus, according to the KMAP method, not only the estimation accuracy was improved, but also the calculation time was significantly reduced. As described above, it has become possible to accurately determine the feature points of input data with a short processing time and therefore with a small processing cost.
  • a face image matching device that estimates height information of a face image using parameter estimation device 100 in the first embodiment will be described.
  • FIG. 10 is a block diagram of a face image matching device according to Embodiment 3 of the present invention.
  • the face image matching device 300 is configured by a computer system as in the second embodiment.
  • the difference from the block diagram of the face image matching device 200 is that two cameras 110 and 115 are provided to capture face images from two directions.
  • the face image matching device 300 first estimates the height information of the input face image using the parameter estimating device 100. Next, based on the estimated three-dimensional face image information, a two-dimensional face image viewed from the same angle as the face image registered in the face image database 140 is synthesized and registered. This is for collating with a face image.
  • a method of synthesizing a two-dimensional face image from three-dimensional face image information for example, a known method such as rendering in CG (computer graphics) can be used.
  • CG computer graphics
  • a technique such as a unique face method using principal component analysis, which is a statistical technique, can be applied.
  • the operation of estimating the height information of the input face image using the face image matching device 300 will be described.
  • the operation of the offline processing for learning the correlation between the input image and the height information of the input image using the learning face image will be described.
  • As a method of learning height information it is possible to learn height information independently for each pixel of the input image.However, the input image is divided into a plurality of regions, and the average of each region is calculated. You may learn height information. In this case, the dimension of the parameter vector to be estimated can be reduced, which is more practical.
  • the total number of learning face images is N.
  • FIG. 11 is a flowchart of the parameter estimating apparatus 100 used in the face image matching apparatus 300 according to Embodiment 3 of the present invention.
  • two cameras 110 and 115 that capture faces from different directions capture learning face images for N persons.
  • the data input unit 10 transfers and stores these face images to the secondary storage device 40.
  • the learning face image captured by one of the cameras 110 is used as a learning input vector I by arranging the values of each pixel in raster scan order (S50).
  • the CPU 20 creates three-dimensional information of the face image based on the two learning face images stored in the secondary storage device 40. This is performed using a known method such as rendering using CG.
  • the height information of each pixel or each region is sequentially arranged and connected to form one vector, which is referred to as a learning parameter vector Q.
  • the learning parameter vector Q is stored in the secondary storage device 40 (S51) 0
  • the CPU 20 obtains the average parameter vector Q a , the constant vector ⁇ , the constant vector ⁇ , and the eigenvector a k using (Equation 1) to (Equation 7) and stores them in the secondary storage device 40.
  • Equation 1 the average parameter vector Q a , the constant vector ⁇ , the constant vector ⁇ , and the eigenvector a k using (Equation 1) to (Equation 7) and stores them in the secondary storage device 40.
  • the above is the processing performed by the parameter estimating apparatus 100 offline.
  • the data input unit 10 inputs a face image to be collated, arranges the values of each pixel of the face image in raster scan order, converts the values into an input vector I, and transfers the input vector I to the secondary storage device 40 (S60).
  • the average parameter vector Q a , the constant vector ⁇ , the constant vector ⁇ , the eigenvector a k , and the estimated kernel K obtained in step S61, which are obtained by the offline processing, are read from the secondary storage device ki 40, and (Equation 9) ) Is used to calculate the parameter vector Q indicating the parameter to be estimated.
  • the estimated parameter vector Q is stored in the secondary storage device 40 (S62).
  • the CPU 20 converts the parameter vector into height information of the face image (S63). Up to this is the operation for estimating the height information of the input face image.
  • the estimated height information is added to the face image to be collated in this way to obtain three-dimensional face information. Thereafter, as described above, based on the three-dimensional face image information, a two-dimensional face image viewed from the same angle as the face image registered in the face image database 140 is synthesized, and registered with this. ! / Pull the face area used for face authentication based on the coordinates of the feature points that are to be compared with the face image, and match the cut face area with the face image registered in the face image database 140. Collate.
  • a front face image or a face image oriented in another direction is synthesized using a two-dimensional face image oriented in an arbitrary direction. can do. Therefore, even if the face image faces in an arbitrary direction, it is possible to collate with the face image database registered as the face image facing forward or sideways.
  • Embodiment 3 by estimating the height information of the face image to be compared, the two-dimensional face viewed from the same angle as the face image registered in the face image database is estimated.
  • the images were synthesized and collated.
  • the height information is estimated for a face image facing the front that has already been registered in the face image database, and face images in several directions are newly registered as a database and collated with them. If a face image to be collated is to be collated, a face image collation device may be configured in the form of ⁇ ⁇ .
  • Embodiment 4 will be described below in detail.
  • the block diagram of the face image matching device according to the fourth embodiment of the present invention is configured by a computer system as in the third embodiment, and the block diagram is the same as that in the third embodiment, and therefore the description is omitted.
  • the operation of the face image matching device according to Embodiment 4 of the present invention will be described below with reference to the flowchart shown in FIG.
  • a learning face image for two cameras 110 and a camera 115 that captures faces with different directional forces is taken.
  • the data input unit 10 transfers and stores these face images to the secondary storage device 40.
  • the learning face image captured by one of the cameras 110 is used as a learning input vector I by arranging the values of each pixel in raster scan order (S50).
  • the CPU 20 creates three-dimensional information of the face image based on the two learning face images stored in the secondary storage device 40.
  • the height information of each pixel or each region is arranged in order and connected to form one vector, which is referred to as a learning parameter vector Q.
  • the learning parameter vector Q is stored in the secondary storage device 40 (S51).
  • the CPU 20 calculates (Equation 1) Using Equation 7, the average parameter vector Q a , the constant vector ⁇ , the constant vector ⁇ ,
  • the k tuttle a k is obtained and stored in the secondary storage device 40 (S52).
  • the data input unit 10 arranges the values of the respective pixels of the front-facing face image already registered in the face image database 140 in the raster scan order, converts them into an input vector I, and converts them into a secondary storage device. Transfer to 40 (S60).
  • the parameter is read from the secondary storage device 40, the parameter parameter Q indicating the parameter to be estimated is calculated using (Equation 9), and stored in the secondary storage device 40 (S62).
  • the CPU 20 converts the parameter vector into height information of the face image.
  • the estimated height information is added to the registered face image to obtain three-dimensional face information (S63).
  • two-dimensional face images viewed from angles such as right, diagonally right, diagonally left, diagonally left, diagonally upward, and diagonally downward are synthesized.
  • the composite image of is newly registered in the face image database 140.
  • the above processing is performed on each of the registered face images that are not powerful when viewed from one direction, and the two-dimensional face images viewed from each direction are synthesized and registered as a database.
  • the face image matching device 300 uses the camera 110 to capture a face image to be compared. Then, a face area used for face authentication is cut out based on the coordinates of the feature point to be checked, and the cut out face area is checked against a face image registered in face image database 140.
  • the number of face images to be registered in the face image database increases, but the face image and the face image database input in online processing! Since it is possible to directly collate with the face images registered in the source, the collation can be performed at high speed.
  • the operation shown in the flowchart is performed by the CPU reading the program.
  • a configuration including a dedicated processor for executing learning means, learning kernel matrix calculating means, eigenvalue calculating means, estimating means, estimated kernel calculating means, parameter calculating means, and the like may be adopted.
  • a computer program product that is a storage medium including instructions that can be used to program a computer that implements the present invention is included in the scope of the present invention.
  • These storage media include disks such as flexible disks, optical disks, CDROMs, and magnetic disks, ROMs, RAMs, EPROMs, EEPROMs, magneto-optical cards, memory cards, DVDs, and the like.
  • Embodiments 2 to 4 an example in which the parameter estimation device of the present invention is used for image matching is shown.
  • Force data other than an image is input as force input data to be used for a matching device other than image matching.
  • be able to For example, by inputting voice data as input data, it can be used for a voice verification device.
  • a parameter estimating method it is possible to provide a parameter estimating method, a parameter estimating device, and a matching method that can accurately estimate parameters for input data with a short processing time or a small processing cost.
  • the present invention can provide a parameter estimation method, a parameter estimation device, and a collation method that can accurately estimate parameters for input data with a short processing time or a small processing cost. This is effective for a parameter estimation method for estimating a parameter, a parameter estimation device, and a matching method using the same.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)
  • Image Processing (AREA)

Abstract

 入力データに対して最大事後確率推定を行いパラメタを推定するパラメタ推定方法において、入力データに関する演算を入力データに関する内積で表し、内積をカーネル関数に置き換え、カーネル関数の計算結果を用いてパラメタを推定する。推定すべきパラメタが既知である複数の学習用入力データと学習用入力データのそれぞれに対応するパラメタとの相関を学習するステップ(オフライン動作)と、推定すべきパラメタが未知である推定用入力データに対するパラメタを学習した相関を用いて推定するステップ(オンライン動作)とを有する。

Description

明 細 書
ノ、 °ラメタ推定方法、パラメタ推定装置および照合方法
技術分野
[0001] 本発明は、入力データ力も特定のノ ラメタを推定するパラメタ推定方法、ノ ラメタ推 定装置およびこれを用いた照合方法に関する。
背景技術
[0002] 入力された画像から特定のパラメタを推定する処理は、パターン情報処理において 一般的な処理である。例えば人物顔画像から目や鼻の位置を取り出す処理や、車両 画像力 ナンバープレートの位置を抽出する処理がそれにあたる。
[0003] 従来、このような処理に対してもっともポピュラーな方法はテンプレートを用いて比 較照合する照合フィルタ一法と言われるもので、多くの使用例が提案されている。こ のような方法にもとづく顔の特徴抽出方法の一例力 R. Brunelli, T. Poggio, "F ace Recognition: Features versus Template , IEEE Trans. Patt. Anal . Machine Intell. , vol. PAMI— 8, pp. 34—43, 1993 に詳しく報告されて いる。
[0004] これら従来の方法における課題はコンピュータの処理時間が長い、あるいはそれに ともなって処理コストが高くなることである。正規化相関を類似度基準とする場合、入 力画像の画素数を S、テンプレートの画素数を Tとすると、乗算を単位演算として 2 X TX S回の演算が必要となる。これを顔画像の特徴点抽出にあてはめると、 S = 150 X 150 = 22500 (pel)、 T= 50 X 20= 1000 (pel)の場合、乗算だけで 2 X 1000 X 22500=4500万回となり、いくらコンピュータの演算速度が向上したといえ莫大な 演算コストを要することになる。
[0005] また、照合に用いるテンプレートとしては全学習データの平均等のデータを用いる ことが多ぐ環境によってうまく照合できない場合が多い。このため入力画像に応じて テンプレートを複数用意して類似度計算を行う手法がある。し力しながら、テンプレー トの数に応じて処理量が増大するため、コンピュータの処理時間がさらに大きくなつ てしまうという問題があった。 発明の開示
[0006] 本発明のパラメタ推定方法、パラメタ推定装置および照合方法はこれらの課題に鑑 みなされたものであり、短 、処理時間あるいは少な!/、処理コストで入力データに対す るパラメタを正確に推定することを目的とする。
[0007] 上記課題を解決するため、本発明のパラメタ推定方法は、入力データに対して最 大事後確率推定を行う演算方法を入力データに関する内積で表し、内積をカーネル 関数に置き換え、カーネル関数の計算結果を用いてパラメタを推定することを特徴と する。
図面の簡単な説明
[0008] [図 1]図 1は本発明の実施の形態 1におけるパラメタ推定装置のブロック図である。
[図 2]図 2は本発明の実施の形態 1におけるパラメタ推定装置のフローチャートである
[図 3]図 3は本発明の実施の形態 2における顔画像照合装置のブロック図である。
[図 4]図 4は本発明の実施の形態 2における顔画像照合装置のフローチャートである
[図 5]図 5はユーザにより入力された顔の特徴点の一例を示す図である。
[図 6]図 6は本発明の実施の形態 2において抽出された目位置のいくつかの例を示 す図である。
[図 7A]図 7Aは本発明の実施の形態 2における顔画像照合装置の撮像距離を変化さ せたときの目位置推定の感度を示す図である。
[図 7B]図 7Bは本発明の実施の形態 2における顔画像照合装置の撮像角度を変化さ せたときの目位置推定の感度を示す図である。
[図 8A]図 8Aは正面力 撮影した顔画像の画面内での顔位置の移動に対する目位 置推定の感度を示す図である。
[図 8B]図 8Bは斜め力 撮影した顔画像の画面内での顔位置の移動に対する目位 置推定の感度を示す図である。
[図 9]図 9は反復回数と目位置推定の感度を示す図である。
[図 10]図 10は本発明の実施の形態 3における顔画像照合装置のブロック図である。 [図 11]図 11は本発明の実施の形態 3および 4における顔画像照合装置のフローチヤ ートである。
符号の説明
[0009] 10 データ入力部
20 CPU
22 学習カーネル行列計算手段
23 固有値計算手段
26 推定カーネル計算手段
27 パラメタ算出手段
30 メモリ
40 二次記憶装置
50 ディスプレイ
60 マウス
90 システムノ^:ス
100 パラメタ推定装置
110, 115 (ビデオ)カメラ
140 顔画像データベース
200, 300 顔画像照合装置
発明を実施するための最良の形態
[0010] 本発明のパラメタ推定方法は、入力データに対して最大事後確率推定を行う演算 方法を入力データに関する内積で表し、内積をカーネル関数に置き換え、カーネル 関数の計算結果を用いてパラメタを推定することを特徴とする。この方法により、短い 処理時間あるいは少ない処理コストで入力データに対するパラメタを正確に推定する ことが可能となる。
[0011] また、本発明のパラメタ推定方法は、推定すべきパラメタが既知である複数の学習 用入力データと学習用入力データのそれぞれに対応するパラメタとの相関を学習す るステップと、推定すべきパラメタが未知である推定用入力データに対するパラメタを 学習した相関を用いて推定するステップとを有し、学習するステップは、推定すべき ノ メタが既知である複数の学習用入力データを用いて学習カーネル行列を計算す るステップと、学習カーネル行列の逆行列の固有値および固有ベクトルを求めるステ ップとを有し、推定するステップは、推定すべきパラメタが未知である推定用入力デ ータと学習用入力データとを用いて推定カーネルを計算するステップと、学習カーネ ル行列、学習カーネル行列の逆行列の固有値とその固有ベクトルとを用いて推定用 入力データのパラメタを推定するステップとを有する。この方法により、コンピュータシ ステムを用いて、短 、処理時間あるいは少な 、処理コストで入力データに対するパラ メタを正確に推定することが可能となる。
[0012] また、本発明のパラメタ推定装置は、推定すべきパラメタが既知である複数の学習 用入力データと学習用入力データのそれぞれに対応するパラメタとの相関を学習す る学習手段と、推定すべきパラメタが未知である推定用入力データのパラメタを学習 した相関を用いて推定する推定手段とを備え、学習手段は、推定すべきパラメタが既 知である複数の学習用入力データを用いて学習カーネル行列を計算する学習カー ネル行列計算手段と、学習カーネル行列の逆行列の固有値および固有ベクトルを求 める固有値計算手段とを備え、推定手段は、推定すべきパラメタが未知である推定 用入力データと学習用入力データとを用いて推定カーネルを計算する推定カーネル 計算手段と、学習カーネル行列、学習カーネル行列の逆行列の固有値、その固有 ベクトルとを用いて推定用入力データのパラメタを算出するパラメタ算出手段とを備 えたことを特徴とする。この構成により、短い処理時間あるいは少ない処理コストで入 力データに対するパラメタを正確に推定するパラメタ推定装置を実現することが可能 となる。
[0013] また、本発明のパラメタ推定装置は、推定用入力データおよび学習用入力データ が顔を含む画像であり、推定すべきパラメタが顔の特徴点の座標であってもよい。こ の構成により、顔照合装置に適したパラメタ推定装置を提供できる。
[0014] また、本発明の照合方法は、本発明のパラメタ推定装置と顔画像データベースとを 用いた照合方法であって、パラメタ推定装置を用いて照合すべき顔画像に対する顔 の特徴点の座標を推定した後、顔の特徴点の座標にもとづき顔領域を切り出し、顔 画像データベースに登録されて ヽる顔画像と切り出された顔領域とを照合する。この 方法により、短 、処理時間ある!/、は少な!/、処理コストで顔画像から顔照合に用いる 顔領域を切り出すことが可能となる。
[0015] また、本発明の照合方法は、本発明のパラメタ推定装置と顔画像データベースとを 用いた照合方法であって、パラメタ推定装置を用いて顔の特徴点の座標を推定し顔 の特徴点の座標にもとづき画像領域を正規化する顔画像正規化動作を複数回繰り 返した後、顔の特徴点の座標にもとづき顔領域を切り出し、顔画像データベースに登 録されている顔画像と切り出された顔領域とを照合する。この方法により、画面内で 顔位置が大きく移動している顔画像に対しても精度よく特徴点の座標を推定すること が可能となる。
[0016] また、本発明のパラメタ推定装置は、推定用入力データおよび学習用入力データ が顔を含む画像であり、推定すべきパラメタが顔画像の高さ情報であってもよい。こ の構成により、 2次元顔画像から 3次元の立体的な顔情報を推定できる。
[0017] また、本発明の照合方法は、本発明のパラメタ推定装置と顔画像データベースとを 用いた照合方法であって、パラメタ推定装置を用いて照合すべき顔画像に対する高 さ情報を推定した後、顔画像の高さ情報にもとづき顔画像データベースに登録され ている顔画像と同一の角度から見た 2次元画像を合成し照合する。この方法により、 任意の方向を向いた顔画像であっても正面あるいは横向きの顔画像として登録され た顔画像データベースとの照合が可能となる。
[0018] また、本発明の照合方法は、請求項 7に記載のパラメタ推定装置と顔画像データべ 一スとを用いた照合方法であって、パラメタ推定装置を用いて顔画像データベースに 登録されている顔画像に対する高さ情報を推定した後、登録されている顔画像以外 の角度カゝら見た 2次元画像を合成して、顔画像データベースに追加登録する。この 方法によれば、入力した顔画像と顔画像データベースに登録されて!ヽる顔画像とを 直接照合することができるので高速に照合することができる。
[0019] (実施の形態 1)
図 1は、本発明の実施の形態 1におけるパラメタ推定装置のブロック図であり、コン ピュータシステムで実現したものである。ノ ラメタ推定装置 100は、外部機器とのデー タのやりとりを行うデータ入力部 10、データ処理を行う CPU20、プログラム格納用お よびワーク用のメモリ 30、パラメタ推定用入力データや相関データ等、大規模なデー タを保存するための二次記憶装置 (ハードディスクや光磁気ディスク等) 40、システム コンソールとしてのディスプレイ 50、マン一マシンインターフェースとしてのマウス 60 を備え、上記各ブロックはシステムバス 90に接続されている。
[0020] CPU20は、対応するプログラムを実行することにより、学習手段の学習カーネル行 列計算手段 22、固有値計算手段 23として働き、また、推定手段の推定カーネル計 算手段 26、パラメタ算出手段 27として働く。二次記憶装置 40には、後述する各種の データを記憶する領域が確保されて 、る。
[0021] パラメタ推定装置 100は、推定対象である入力データと推定すべきパラメタとの間 に相関関係があることにもとづいている。すなわち、推定すべきパラメタのわ力つてい る多くの学習用入力データに対して、入力データとパラメタとの相関をあら力じめ学 習しておき、この相関関係を用いて任意の入力データに対するパラメタを推定するよ うにしたものである。
[0022] まず、学習サンプルを用いて入力データとパラメタとの相関を学習するステップ(以 下、「オフライン処理」と記す)の動作について説明する。あら力じめ推定すべきパラメ タのわかって 、る入力データを n次元の入力ベクトル I、入力ベクトル Iに対するパラメ タを m次元のパラメタベクトル Qとし、学習サンプルの総数を Nとする。
[0023] 図 2は本発明の実施の形態 1におけるパラメタ推定装置 100のフローチャートであ る。なお、 CPU20力メモリ 30に格納されたプログラムを実行することで以下のフロー を実行する。
[0024] まず、データ入力部 10には、 N個の入力ベクトル I (i= 1〜N)とパラメタベクトル Q を入力し、二次記憶装置 40に格納する(S10)。
[0025] 次に、 CPU20は、(数式 1)にしたがって、 N個のパラメタベクトル Qから平均パラメ タベクトル Qaを求め、二次記憶装置 40に転送し格納する(S 11)。
[0026] [数 1] -- '
[0027] 続 、て CPU20は、(数式 2)にしたが!、、 N個のパラメタベクトル Qのそれぞれに対 して、平均パラメタベクトル Qaからの偏差パラメタベクトル を求め、二次記憶装置 4 0に転送し格納する(S 12)。
[0028] [数 2]
Q- = Qi - Qa
[0029] 次に CPU20は学習カーネル行列計算手段 22として、入力ベクトル I、 Iから学習力 一ネル行列 K (i、 j = l〜N)を求める。カーネルとしては多項式カーネル、シグモイド
ij
カーネル等が使用できる力 本実施の形態においては (数式 3)に示すガウスカーネ ルを使用した。求めた学習カーネル行列 Kは二次記憶装置 40に転送し格納する(S
13)。
[0030] [数 3]
Figure imgf000009_0001
[0031] 続いて、平均値のまわりの偏差学習カーネル行列 Keを (数式 4)にもとづいて求め
、求めた偏差学習カーネル行列 Keを二次記憶装置 40に転送し格納する(S14)。
[0032] [数 4]
Figure imgf000009_0002
[0033] 次に CPU20は固有値計算手段 23として、偏差学習カーネル行列 Keの固有方程 式(数式 5)を解き、固有値え (k= l〜M)および固有ベクトル a kを求める。求めた
k
固有値 λ および固有ベクトル a kを二次記憶装置 40に転送し格納する(S15)。ここ
k
で Mは独立な固有ベクトルの数を示しており、最大は学習サンプルの数 Nに等しい。
[0034] [数 5]
Kcak = lkak
[0035] ここで、 Keは偏差学習カーネル行列を表す。以上で、入力ベクトル Iとパラメタべタト ル Qとの相関を表すために必要なデータはそろった力 後の推定するステップにお ける計算を簡略ィ匕するために、さらに次の計算を行う。上記で求めた偏差パラメタべ タトル Qe、偏差学習カーネル行列 Ke、固有値え および固有ベクトル o;kを用いて、( i ij k
数式 6)にもとづき M個の m次元定数ベクトル Γを求め、さらに、定数ベクトル Γ 、学
k k 習カーネル行列 K、固有ベクトル a kを用いて、(数式 7)にしたがって m次元定数べ
1]
タトル Ωを求める。これら定数ベクトル Γ、定数ベクトル Ωは二次記憶装置 40に格納
k
される(S16)。
[0036] 園
Figure imgf000010_0001
[0037] [数 7] ^ ^ )
[0038] 以上が、パラメタ推定装置 100のオフラインで実行する処理であり、二次記憶装置 4 0には、上述の処理で求めた平均パラメタベクトル Qa、定数ベクトル Ω、定数ベクトル Γ 、固有ベクトル a kが格納されている。このようにオフライン処理においては CPU2 k
0は学習手段として働く。
[0039] つぎに、パラメタを推定すべき入力データに対して、実際にパラメタを推定するステ ップ (以下、「オンライン処理」と記す)について説明する。なお、オンライン処理にお いても CPU20がメモリ 30に格納されたプログラムを実行することで以下のフローを実 行する。
[0040] まず、データ入力部 10には、パラメタを推定すべき入力データを入力ベクトル Iとし て入力し、二次記憶装置 40に格納する(S20)。
[0041] 次に CPU20は推定カーネル計算手段 26として、(数式 8)にもとづいて、推定カー ネル (i= l〜N)を求める。求めた推定カーネル Kは二次記憶装置 40に転送し格 納する(S21)。
[0042] [数 8]
Figure imgf000010_0002
[0043] そして、 CPU20はパラメタ算出手段 27として、オフライン処理で求めた平均パラメ タベクトル Qa、定数ベクトル Ω、定数ベクトル Γ、固有ベクトル a k、およびステップ S
21で求めた推定カーネル Kを二次記憶装置 40から読出し、(数式 9)を用いて推定 すべきパラメタを示すパラメタベクトル Qを計算する。そして、推定されたパラメタべタト ル Qを二次記憶装置 40に格納する(S22)。
[0044] [数 9]
Figure imgf000011_0001
[0045] このようにオンライン処理においては CPU20は推定手段として働く。以上の説明の 中ではガウスカーネルのスケール σについて言及しなかった力 推定対象である入 力ベクトルおよび推定すべきパラメタによりスケール σの最適値が異なる。したがって 、ノ メタ推定実験を行 、ながら値を決めることが望ま 、。
[0046] ここで、(数式 1)〜(数式 9)を用いた計算によってパラメタの推定が可能な理由を 説明する。
[0047] 以前より本発明者らは画像信号からパラメタを推定する方法として MAP (maximu m a posteriori)推定法について検討してきた。入力画像 Iと推定すべきパラメタ Q の同時分布がガウス分布にしたがうランダムベクトルである場合、ノ ラメタ Qの最適推 定値は (数式 10)を用いて求めることができる。
[0048] [数 10]
Q ^ Q" + Σ ∑:1 (Ι - Ια ) [0049] ここで、∑ はクロス共分散行列、∑ _1は分散共分散行列の逆行列である。
[0050] (数式 10)はいわゆる重回帰分析に用いられる数式と類似のものである。し力しなが ら入力画像 Iと推定すべきパラメタ Qとの関係がより複雑となり、それらの同時分布が ガウス分布で表せな 、場合には、この単純な数式ではうまく推定できな 、ことが実験 的に明らかになつてきた。
[0051] そこで本発明者らは、サポートベクタマシンと呼ばれる画像認識手法に対して導入 され、良好な結果が得られている「カーネルトリック」と呼ばれる新しい考え方につい て注目した。これは、入力ベクトルを非線形変換してその空間で線形の識別を行う方 法である。本発明者らは、 MAP推定法に「カーネルトリック」を導入する検討を行った 結果、 KMAPと称する新規なパラメタ推定方法を確立した。以下にその詳細につい て説明する。
[0052] (数式 11)に示すように、非線形関数 φを用いて入力ベクトル Iを非線形変換する。
ここで、変換された入力ベクトル φ (I )とパラメタ Qとの同時分布がガウス分布になると 仮定すると、パラメタ Qは、(数式 12)で表される。ここで φ (I )を φと略記した。
[0053] [数 11]
[0054] [数 12]
[0055] (数式 12)を計算する上で、非線形に変換された統計量をそのまま計算しょうとする と、より高次元空間での莫大な計算が必要となる。し力しながら、変換された入力べク トル φに関する演算を内積の形 φ - ώにまとめることができれば、これをカーネル Κ ( φ , Φ )に置き換えることができ、計算量を大幅に減らすことができる。
1 ]
[0056] まず、分散共分散行列の逆行列∑ _1が (数式 13)のように展開できることに注目
Φ
する。ここで、 Φ = [ Φ ]、 A = diag [ l ]はそれぞれ∑ _1の固有ベクトル、固有値
k k φ
行列である。一方、固有値え は (数式 14)に示すように偏差学習カーネル行列 Ke
k ij =Κε ( , φ )の固有値でもある。
1 ]
[0057] [数 13]
Σ 1 = ΦΛ !ΦΤ [0058] [数 14]
Kca k = kka k
[0059] そして固有ベクトル Φは変換された入力ベクトル φを用いて (数式 15)のように展
k i
開できる。また、このときの展開係数 o; kは偏差学習カーネル行列 Keの k番目の固有
1]
ベクトルとして得られる。したがって、これらを代入することにより、分散共分散行列の 逆行列∑ —1を (数式 16)のように書換えることができる。
[0060] [数 15]
Φ
[0061] [数 16]
Figure imgf000013_0001
[0062] つぎに、クロス共分散行列∑ は (数式 17)で得られる。そこで、(数式 16)と (数式 17)を (数式 12)に代入し計算順序を入れ替えて、内積 φ · φを学習カーネル行列
Kで置き換えることにより、(数式 9)が得られる。
[0063] [数 17]
[0064] したがって、あらかじめ N個の学習サンプルを用いて、平均パラメタベクトル Qa、定 数ベクトル Ω、定数ベクトル Γ 、固有ベクトル a kを求めておき、推定対象である入力 k
ベクトルが入力されたとき、(数式 6)〜 (数式 9)を用いてパラメタ Qを推定することが できる。
[0065] カーネルとしては、多項式カーネル、シグモイドカーネル、ガウスカーネル等を用い ることができるが、どのようなカーネルを用いるかについては、推定対象である入力べ タトルおよび推定すべきパラメタにより依存するので、パラメタ推定実験を行いながら カーネルを決定することが望まし 、。
[0066] (実施の形態 2)
本発明の実施の形態 2では、実施の形態 1におけるパラメタ推定装置 100を用いて 顔画像の中から特徴点の座標を推定した顔画像照合装置にっ ヽて説明する。
[0067] 図 3は、本発明の実施の形態 2における顔画像照合装置のブロック図である。パラメ タ推定装置 100は実施の形態 1と同様に、コンピュータシステムで構成され、各ブロッ クには実施の形態 1と同じ符号を付して説明を省略する。顔画像照合装置 200には 、人物の顔画像を撮影するためのビデオカメラ 110が接続されている。さらに、あらか じめ登録された人物の顔画像^^めた顔画像データベース 140も接続されている。
[0068] 顔画像照合装置 200は、まず実施の形態 1におけるパラメタ推定装置 100を用い て、入力された顔画像の中から目、鼻、眉、口等の特徴点の座標を見出す。つぎ〖こ 顔画像照合装置 200は、特徴点の座標をもとに顔照合に用いる顔領域を切り出す。 具体的には、例えば、鼻の座標を中心として一辺の長さが両目の間隔の 2倍であり 上下の辺が両目を結ぶ直線と平行であるような正方形領域を顔領域とする。そして、 切り出された顔領域と顔画像データベース 140に登録されている顔画像とを照合す る。照合の方法としては、例えば統計的手法である主成分分析を利用した固有顔法 等の手法を用いることができる。
[0069] 以下に、入力された顔画像の中から目、鼻、眉、口等の特徴点の座標を見出すパ ラメタ推定装置 100の動作について詳しく説明する。
[0070] まず、学習用顔画像を用いて、入力画像と特徴点の座標との相関を学習するオフ ライン処理の動作について説明する。学習用顔画像の総数を Nとし、 i番目の学習用 顔画像の各画素の値をラスタスキャン順に並べた n次元のベクトルを入力ベクトル 各特徴点の位置座標を m次元のパラメタベクトル Qとする。
[0071] 図 4は本発明の実施の形態 2における顔画像照合装置 200に用いられているパラ メタ推定装置 100のフローチャートである。まず、カメラ 110は N人分の学習用顔画像 を撮影する。そしてデータ入力部 10は、それぞれの顔画像の各画素の値をラスタス キャン順に並べて学習用入力ベクトル I (i= l〜N)を作成し、二次記憶装置 40に転 送し格納する(S30)。つぎに、二次記憶装置 40に記憶した学習用顔画像 (すなわち 学習用入力ベクトル I.)をディスプレイ 50に 1枚ずつ表示する。そして、ユーザがこの 学習用顔画像を見ながらマウス 60を用いて手動で顔の特徴点を入力する。図 5はュ 一ザが入力した顔の特徴点の一例を示す図である。顔画像の原点を基準に、右眉、 右目、左眉、左目、鼻および口のそれぞれの X座標、 Y座標が特徴点座標としてュ 一ザにより入力される。 CPU20は、それぞれの学習用顔画像に対して入力された各 特徴点の座標値を順に並べて連結して学習用パラメタベクトル Qiとし、二次記憶装 置 40に格納する(S31)。
[0072] 次に CPU20は、(数式 1)〜(数式 7)を用いて平均パラメタベクトル Qa、定数べタト ル Ω、定数ベクトル Γ、固有ベクトル a kを求め、二次記憶装置 40に格納する(S32 k
)。以上が、パラメタ推定装置 100のオフラインで実行する処理である。
[0073] 次に、オンライン処理について説明する。
[0074] まず、データ入力部 10は、照合すべき顔画像を入力し、顔画像の各画素の値をラ スタスキャン順に並べて入力ベクトル Iに変換し二次記憶装置 40に転送する(S40)。 次に CPU20は、(数式 8)〖こもとづいて、推定カーネル K (i= l〜N)を求め、二次記 憶装置 40に転送し格納する(S41)。そして、オフライン処理で求めた平均パラメタべ タトル Qa、定数ベクトル Ω、定数ベクトル Γ、固有ベクトル
k ο およびステップ S41で 求めた推定カーネル Kを二次記憶装置 40から読出し、(数式 9)を用いて推定すベ きパラメタを示すパラメタベクトル Qを計算する。そして、推定されたパラメタベクトル Q を二次記憶装置 40に格納する(S42)。次に CPU20は、パラメタベクトル Qを特徴量 の座標データに分解し、入力顔画像とともにディスプレイ上に表示する(S43)。ここま でが入力された顔画像の中から目、鼻、眉、口等の特徴点の座標を見出す動作であ る。
[0075] その後、上述したように、特徴点の座標をもとに顔認証に用いる顔領域を切り出し、 切り出された顔領域と顔画像データベース 140に登録されている顔画像とを照合す る。
[0076] つぎに、実施の形態 2における顔画像照合装置 200において、 KMAPを用いた特 徴点推定、特に顔画像の中から目の位置を推定した実験とその結果を示す。被験者 2000人に対して角度と距離を変えて撮影した顔画像 7200枚を用いて、本発明の実 施の形態 2における KMAPの推定精度およびその安定性を評価した。比較のため に、 (i)ガウス分布を使用した最大推定値 (maximum likelihood)を基本とするテ ンプレートマッチング(以下、「MLG」と記す)、(ii) Eigenface法(以下、「EF」と記す )、 (iii)ガウス分布を使用した従来の MAP推定法 (以下、「TMAP」と記す)を用いた 推定を同時に行った。
[0077] 図 6は本発明の実施の形態 2において抽出された目位置のいくつかの例を示す図 である。図 6には、抽出された目の位置を入力画像上に X印で示してある。
[0078] 図 7は本発明の実施の形態 2における顔画像照合装置の目位置推定の感度を示 す図であり、図 7Aは撮影する距離を変化させたときの図、図 7Bは撮影する角度を変 ィ匕させたときの図である。横軸は推定した目位置の誤差を画素単位で示し、縦軸は 累積抽出率 (横軸に示す誤差を許容した場合における、推定した目位置座標の正し さ)を示している。したがって、誤差が小さい範囲で累積抽出率が大きくなるほど目位 置推定の感度が高いことを示す。このように、いずれの場合においても KMAPによる 推定方法が他の方法に比べて優れていることが実証できた。
[0079] 図 8は画面内での顔位置の移動に対する目位置推定の感度を示す図であり、図 8 Aは正面カゝら撮影した顔画像に対するもの、図 8Bは斜め方向から撮影した顔画像に 対するものである。移動画像は回転対象ガウス分布を使用して人為的に作成した。 移動量の分散は、 0, 10, 20, 30画素とし、回転角度の分散は 45度、縮小率の平均 力 ^倍、分散が 0. 5倍とした。図 8A、図 8Bには各移動量の分散に対するそれぞれ の方法における目位置推定の感度を示している。 MLG法、および EF法の性能は移 動量の変化に影響されな 、ので移動量の分散 0に対する結果のみを示して 、る。図 8A、図 8Bともに、移動量の分散が 20画素程度までなら KMAP法が他の方法より優 れており、 30画素を超えると MLG法が KMAP法をわずかに上回っていることがわか る。これらの結果より、移動量の分散が大きくなるにつれ、 KMAP法の性能は低下し 、 MLGを利用した従来の方法が一見優れているように見受けられる。しかしながら、 つぎに述べるように、 KMAP法を反復的に用いることで、よい性能が得られることが わかった。
[0080] KMAP法を反復的に用いる方法は以下のとおりである。まず KMAP法を使用して 目位置を推定し、つぎに推定した目位置を使用して画像領域を正規化する。そして 正規化した顔画像を用いて再び KMAP法により目位置を推定する。このように KM AP法を n回反復する方法を KMAP (n)と記することにする。図 9は、移動量の分散 力 S 30画素である顔画像に対する KMAP (1) =KMAP、 KMAP (2)、 KMAP (3)、 MLGのそれぞれによる目位置推定の感度を示すグラフである。このように反復回数 nが増すにつれて KMAP (n)の性能が改善されることを実証できた。
[0081] KMAPによる目位置推定の速度は、 1画像あたり 0. 8秒であった。 MLG法では 1 画像あたり 6秒であった (ペンティアム IV (登録商標)相当のプロセッサ使用時)。この ように、 KMAP法によれば推定精度が向上するだけでなぐ計算時間も大幅に短縮 することができた。このように、短い処理時間、したがって少ない処理コストで入力デ ータの特徴点を正確に求めることが可能となった。
[0082] (実施の形態 3)
本発明の実施の形態 3では、実施の形態 1におけるパラメタ推定装置 100を用いて 顔画像の高さ情報を推定した顔画像照合装置について説明する。
[0083] 図 10は本発明の実施の形態 3における顔画像照合装置のブロック図である。顔画 像照合装置 300は実施の形態 2と同様にコンピュータシステムで構成されている。顔 画像照合装置 200のブロック図と異なるところは、 2方向からの顔画像を撮影するた めに、 2台のカメラ 110、 115を備えている点である。
[0084] この顔画像照合装置 300は、まずパラメタ推定装置 100を用いて入力された顔画 像の高さ情報を推定する。つぎに、推定された 3次元の顔画像情報をもとに、顔画像 データベース 140に登録されている顔画像と同一の角度から見た 2次元顔画像を合 成し、これと登録されている顔画像とを照合するものである。 3次元顔画像情報から 2 次元顔画像を合成する方法としては、例えば CG (コンピュータグラフィックス)におけ るレンダリング等の既知の方法を用いることができる。また顔画像の照合には、例え ば統計的手法である主成分分析を利用した固有顔法等の手法を適用できる。
[0085] 以下に、上記顔画像照合装置 300を用いて、入力された顔画像の高さ情報を推定 する動作について説明する。まず、学習用顔画像を用いて、入力画像と入力画像の 高さ情報との相関を学習するオフライン処理の動作について説明する。高さ情報の 学習方法としては、入力画像の各画素のそれぞれに対して独立に高さ情報を学習す ることも可能ではあるが、入力画像を複数の領域に分割し各領域毎の平均の高さ情 報を学習してもよい。この場合、推定すべきパラメタベクトルの次元を減らすことがで きるので、より実用的である。
[0086] 本実施の形態においても実施の形態 2と同様に、学習用顔画像の総数を Nとする。
そして、 i番目の学習用顔画像の各画素の値をラスタスキャン順に並べた n次元のベ タトルを入力ベクトル I、学習用顔画像の各画素あるいは各領域の高さ情報をラスタ スキャン順に準じて並べたものを m次元のパラメタベクトル Qとする。 [0087] 図 11は本発明の実施の形態 3における顔画像照合装置 300に用いられているパラ メタ推定装置 100のフローチャートである。まず、異なった方向から顔を撮影する 2台 のカメラ 110およびカメラ 115が N人分の学習用顔画像を撮影する。データ入力部 1 0はこれらの顔画像を二次記憶装置 40に転送し格納する。このうち一方のカメラ 110 で撮影した学習用顔画像は、各画素の値をラスタスキャン順に並べ学習用入力べク トル Iとして用いられる(S50)。つぎに、 CPU20は、二次記憶装置 40に記憶した 2枚 の学習用顔画像にもとづいて顔画像の 3次元情報を作成する。これは CGを用いたレ ンダリング等の既知の方法を用いて実行する。各画素あるいは各領域の高さ情報は 順に並べて連結してひとつのベクトルとし、これを学習用パラメタベクトル Qとする。学 習用パラメタベクトル Qは二次記憶装置 40に格納される (S51) 0
[0088] つぎに、 CPU20は、(数式 1)〜(数式 7)を用いて平均パラメタベクトル Qa、定数べ タトル Ω、定数ベクトル Γ、固有ベクトル a kを求め、二次記憶装置 40に格納する(S
k
52)。以上が、ノ ラメタ推定装置 100のオフラインで実行する処理である。
[0089] つぎに、オンライン処理について説明する。まず、データ入力部 10は、照合すべき 顔画像を入力し、顔画像の各画素の値をラスタスキャン順に並べて入力ベクトル Iに 変換し二次記憶装置 40に転送する(S60)。つぎに CPU20は、(数式 8)にもとづい て、推定カーネル K (i= l〜N)を求め二次記憶装置 40に転送し格納する(S61)。 そして、オフライン処理で求めた平均パラメタベクトル Qa、定数ベクトル Ω、定数べタト ル Γ、固有ベクトル a k、およびステップ S61で求めた推定カーネル Kを二次記憶装 k i 置 40から読出し、(数式 9)を用いて推定すべきパラメタを示すパラメタベクトル Qを計 算する。そして、推定されたパラメタベクトル Qを二次記憶装置 40に格納する(S62) 。つぎに CPU20はパラメタベクトルを顔画像の高さ情報に変換する(S63)。ここまで が入力された顔画像の高さ情報を推定する動作である。
[0090] このようにして照合すべき顔画像に対して推定した高さ情報を加え、 3次元顔情報 とする。その後、上述したように、 3次元の顔画像情報をもとに、顔画像データベース 140に登録されている顔画像と同一の角度から見た 2次元顔画像を合成し、これと登 録されて!/ヽる顔画像とを照合する特徴点の座標をもとに顔認証に用いる顔領域を切 り出し、切り出された顔領域と顔画像データベース 140に登録されて 、る顔画像とを 照合する。
[0091] 以上のように本発明の実施の形態 3によれば、任意の方向を向いた 2次元の顔画 像を用いて正面の顔画像、あるいは他の方向を向 、た顔画像を合成することができ る。したがって、任意の方向を向いた顔画像であっても、正面あるいは横向きの顔画 像として登録された顔画像データベースとの照合が可能となる。
[0092] なお、実施の形態 3においては、照合すべき顔画像に対してその高さ情報を推定 することによって、顔画像データベースに登録されている顔画像と同一の角度から見 た 2次元顔画像を合成し、照合を行うものであった。しかし、本発明のパラメタ推定装 置を応用して上記以外の顔画像照合装置を構成することも、もちろん可能である。例 えば、顔画像データベースにすでに登録されている正面向きの顔画像に対してその 高さ情報を推定し、いくつかの方向を向いた顔画像をデータベースとして新たに登録 しておき、それらと照合すべき顔画像とを照合すると!ヽぅ形式にて顔画像照合装置を 構成してもよ 、。以下に実施の形態 4としてその詳細につ 、て説明する。
[0093] (実施の形態 4)
本発明の実施の形態 4における顔画像照合装置のブロック図は実施の形態 3と同 様にコンピュータシステムで構成されており、ブロック図も実施の形態 3と同様である ため説明を省略する。また、以下では、図 11に示したフローチャートを用いて本発明 の実施の形態 4における顔画像照合装置の動作を説明する。
[0094] 学習用顔画像を用いて入力画像と入力画像の高さ情報との相関を学習するオフラ イン処理の動作についても実施の形態 3と同様である。
[0095] すなわち、まず、異なった方向力も顔を撮影する 2台のカメラ 110およびカメラ 115 力 人分の学習用顔画像を撮影する。データ入力部 10はこれらの顔画像を二次記 憶装置 40に転送し格納する。このうち一方のカメラ 110で撮影した学習用顔画像は 、各画素の値をラスタスキャン順に並べ学習用入力ベクトル Iとして用いられる (S50) 。つぎに、 CPU20は、二次記憶装置 40に記憶した 2枚の学習用顔画像にもとづい て顔画像の 3次元情報を作成する。各画素あるいは各領域の高さ情報は順に並べて 連結してひとつのベクトルとし、これを学習用パラメタベクトル Qとする。学習用パラメ タベクトル Qは二次記憶装置 40に格納される(S51)。そして CPU20は、(数式 1)〜 (数式 7)を用いて平均パラメタベクトル Qa、定数ベクトル Ω、定数ベクトル Γ、固有べ
k タトル a kを求め、二次記憶装置 40に格納する(S52)。
[0096] つぎに、顔画像データベース 140にすでに登録されている正面向きの顔画像のお のおのに対して、いくつかの方向を向いた顔画像を合成しデータベースとして新たに 登録する。具体的には、まず、データ入力部 10は、顔画像データベース 140にすで に登録されている正面向きの顔画像の各画素の値をラスタスキャン順に並べて入力 ベクトル Iに変換し二次記憶装置 40に転送する(S60)。つぎに CPU20は、(数式 8) にもとづいて、推定カーネル K (i= l〜N)を求め二次記憶装置 40に転送し格納す る(S61)。そして、オフライン処理で求めた平均パラメタベクトル Qa、定数ベクトル Ω、 定数ベクトル Γ、固有ベクトル ο およびステップ S61で求めた推定カーネル Κを
k i 二次記憶装置 40から読出し、(数式 9)を用いて推定すべきパラメタを示すパラメタべ タトル Qを計算し二次記憶装置 40に格納する(S62)。つぎに CPU20はパラメタべク トルを顔画像の高さ情報に変換する。そして、登録されている顔画像に対して推定し た高さ情報を加え 3次元顔情報とする(S63)。その後、 3次元の顔画像情報をもとに 、右方向、斜め右方向、斜め左方向、左方向、斜め上方向、斜め下方向等の角度か ら見た 2次元顔画像を合成し、これらの合成画像を顔画像データベース 140に新た に登録する。 1方向から見た顔画像し力持たな 、登録顔画像のそれぞれにつ 、て以 上の処理を行 、、各方向から見た 2次元顔画像を合成しデータベースとして登録す る。
[0097] 以上の準備を顔画像照合装置 300のオフラインで実行しておくと、オンライン処理 が以下のように非常に簡素化される。顔画像照合装置 300は、カメラ 110を用いて照 合すべき顔画像を撮影する。そして、照合する特徴点の座標をもとに顔認証に用い る顔領域を切り出し、切り出された顔領域と顔画像データベース 140に登録されて ヽ る顔画像とを照合する。
[0098] 以上のように本発明の実施の形態 4によれば、顔画像データベースに登録すべき 顔画像の数は増えるが、オンライン処理にお!、て入力した顔画像と顔画像データべ ースに登録されている顔画像とを直接照合することができるので高速に照合を行うこ とがでさる。 [0099] なお、実施の形態 1〜4においては、 CPUがプログラムを読み込むことで、フローチ ヤートに示した動作を行う構成とした。しかし、学習手段、学習カーネル行列計算手 段、固有値計算手段、推定手段、推定カーネル計算手段、パラメタ算出手段等を実 行する専用のプロセッサを備えた構成であってもよ 、。
[0100] また、本発明を実施するコンピュータをプログラムするために使用できる命令を含む 記憶媒体であるコンピュータプログラム製品が本発明の範囲に含まれる。これらの記 憶媒体は、フレキシブルディスク、光ディスク、 CDROM、磁気ディスク等のディスク、 ROM, RAM, EPROM、 EEPROM、磁気光カード、メモリカード、 DVD等である。
[0101] また、実施の形態 2〜4においては本発明のパラメタ推定装置を画像照合に用いた 例を示した力 入力データとして画像以外のデータを入力することで画像照合以外 の照合装置に用いることができる。例えば、入力データとして音声データを入力する ことで音声照合装置に用いることができる。
[0102] 本発明によれば、短い処理時間あるいは少ない処理コストで入力データに対する パラメタを正確に推定することができるパラメタ推定方法、パラメタ推定装置および照 合方法を提供することができる。
産業上の利用可能性
[0103] 本発明は、短い処理時間あるいは少ない処理コストで入力データに対するパラメタ を正確に推定することができるパラメタ推定方法、パラメタ推定装置および照合方法 を提供することができるので、入力データ力も特定のノラメタを推定するパラメタ推定 方法、パラメタ推定装置およびこれを用いた照合方法等に有効である。

Claims

請求の範囲
[1] 入力データに対して最大事後確率推定を行う演算方法を前記入力データに関する 内積で表し、前記内積をカーネル関数に置き換え、前記カーネル関数の計算結果を 用いてパラメタを推定するパラメタ推定方法。
[2] 推定すべきパラメタが既知である複数の学習用入力データと前記学習用入力データ のそれぞれに対応するパラメタとの相関を学習するステップと、
推定すべきパラメタが未知である推定用入力データに対するパラメタを前記学習した 相関を用いて推定するステップとを有し、
前記学習するステップは、前記推定すべきパラメタが既知である複数の学習用入力 データを用いて学習カーネル行列を計算するステップと、前記学習カーネル行列の 逆行列の固有値および固有ベクトルを求めるステップとを有し、
前記推定するステップは、前記推定すべきパラメタが未知である推定用入力データと 前記学習用入力データとを用いて推定カーネルを計算するステップと、前記学習力 一ネル行列、前記学習カーネル行列の逆行列の固有値、その固有ベクトルとを用い て前記推定用入力データのパラメタを推定するステップとを有することを特徴とする パラメタ推定方法。
[3] 推定すべきパラメタが既知である複数の学習用入力データと前記学習用入力データ のそれぞれに対応するパラメタとの相関を学習する学習手段と、
推定すべきパラメタが未知である推定用入力データのパラメタを前記学習した相関を 用いて推定する推定手段とを備え、
前記学習手段は、前記推定すべきパラメタが既知である複数の学習用入力データを 用いて学習カーネル行列を計算する学習カーネル行列計算手段と、前記学習カー ネル行列の逆行列の固有値および固有ベクトルを求める固有値計算手段とを備え、 前記推定手段は、前記推定すべきパラメタが未知である推定用入力データと前記学 習用入力データとを用いて推定カーネルを計算する推定カーネル計算手段と、前記 学習カーネル行列、前記学習カーネル行列の逆行列の固有値、その固有ベクトルと を用いて前記推定用入力データのパラメタを算出するパラメタ算出手段とを備えたこ とを特徴とするパラメタ推定装置。
[4] 前記推定用入力データおよび前記学習用入力データは顔を含む画像であり、推定 すべきパラメタは顔の特徴点の座標であることを特徴とする請求項 3に記載のパラメ タ推定装置。
[5] 請求項 4に記載のパラメタ推定装置と、顔画像データベースとを用いた照合方法であ つて、
前記パラメタ推定装置を用いて照合すべき顔画像に対する顔の特徴点の座標を推 定した後、前記顔の特徴点の座標にもとづき顔領域を切り出し、前記顔画像データ ベースに登録されている顔画像と前記切り出された顔領域とを照合することを特徴と する照合方法。
[6] 請求項 4に記載のパラメタ推定装置と、顔画像データベースとを用いた照合方法であ つて、
前記パラメタ推定装置を用いて顔の特徴点の座標を推定し前記顔の特徴点の座標 にもとづき画像領域を正規化する顔画像正規化動作を複数回繰り返した後、前記顔 の特徴点の座標にもとづき顔領域を切り出し、前記顔画像データベースに登録され て ヽる顔画像と前記切り出された顔領域とを照合することを特徴とする照合方法。
[7] 前記推定用入力データおよび前記学習用入力データは顔を含む画像であり、推定 すべきパラメタは顔画像の高さ情報であることを特徴とする請求項 3に記載のパラメタ 推定装置。
[8] 請求項 7に記載のパラメタ推定装置と顔画像データベースとを用いた照合方法であ つて、
前記パラメタ推定装置を用いて照合すべき顔画像に対する高さ情報を推定した後、 前記顔画像の高さ情報にもとづき前記顔画像データベースに登録されている顔画像 と同一の角度力 見た 2次元画像を合成し照合することを特徴とする照合方法。
[9] 請求項 7に記載のパラメタ推定装置と顔画像データベースとを用いた照合方法であ つて、
前記パラメタ推定装置を用いて前記顔画像データベースに登録されて!ヽる顔画像に 対する高さ情報を推定した後、前記登録されている顔画像以外の角度から見た 2次 元画像を合成して、前記顔画像データベースに追加登録したことを特徴とする照合
900800/S00Zdf/X3d ZZ 9C6lll/S00Z OAV
PCT/JP2005/008006 2004-05-14 2005-04-27 パラメタ推定方法、パラメタ推定装置および照合方法 Ceased WO2005111936A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US11/596,431 US7760933B2 (en) 2004-05-14 2005-04-27 Parameter estimation method, parameter estimation device and collation method
EP05737145.2A EP1758059A4 (en) 2004-05-14 2005-04-27 PARAMETER METHOD, PARAMETER EQUIPMENT AND COLLATION METHOD
CN2005800155586A CN1954342B (zh) 2004-05-14 2005-04-27 参数推定方法、参数推定装置及对照方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-144504 2004-05-14
JP2004144504A JP4321350B2 (ja) 2004-05-14 2004-05-14 パラメタ推定方法、パラメタ推定装置および照合方法

Publications (1)

Publication Number Publication Date
WO2005111936A1 true WO2005111936A1 (ja) 2005-11-24

Family

ID=35394356

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/008006 Ceased WO2005111936A1 (ja) 2004-05-14 2005-04-27 パラメタ推定方法、パラメタ推定装置および照合方法

Country Status (5)

Country Link
US (1) US7760933B2 (ja)
EP (1) EP1758059A4 (ja)
JP (1) JP4321350B2 (ja)
CN (1) CN1954342B (ja)
WO (1) WO2005111936A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314614A (zh) * 2011-10-24 2012-01-11 北京大学 一种基于类共享多核学习的图像语义分类方法
EP2441857A2 (en) 2008-10-23 2012-04-18 P2i Ltd Vacuum processing apparatus

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8638846B1 (en) * 2003-06-23 2014-01-28 At&T Intellectual Property Ii, L.P. Systems and methods for encoding and decoding video streams
JP4939968B2 (ja) * 2007-02-15 2012-05-30 株式会社日立製作所 監視画像処理方法、監視システム及び監視画像処理プログラム
JP4837602B2 (ja) * 2007-03-12 2011-12-14 富士フイルム株式会社 画像トリミング装置および方法並びにプログラム
KR20250099420A (ko) 2007-09-24 2025-07-01 애플 인크. 전자 장치 내의 내장형 인증 시스템들
US8600120B2 (en) 2008-01-03 2013-12-03 Apple Inc. Personal computing device control using face detection and recognition
US8208731B2 (en) * 2008-04-07 2012-06-26 Microsoft Corporation Image descriptor quantization
JP5418061B2 (ja) * 2009-08-20 2014-02-19 沖電気工業株式会社 遠隔コミュニケーション装置、遠隔コミュニケーション方法、および遠隔コミュニケーションシステム
JP5923723B2 (ja) * 2011-06-02 2016-05-25 パナソニックIpマネジメント株式会社 人物属性推定システム、人物属性推定装置、及び人物属性推定方法
US8638385B2 (en) 2011-06-05 2014-01-28 Apple Inc. Device, method, and graphical user interface for accessing an application in a locked device
US9002322B2 (en) 2011-09-29 2015-04-07 Apple Inc. Authentication with secondary approver
EP2850510A2 (en) 2012-05-18 2015-03-25 Apple Inc. Device, method, and graphical user interface for manipulating user interfaces based on fingerprint sensor inputs
CN103413115B (zh) * 2013-06-06 2016-09-28 温州大学 一种基于数据流形分布的非线性图像特征选择方法
US9898642B2 (en) 2013-09-09 2018-02-20 Apple Inc. Device, method, and graphical user interface for manipulating user interfaces based on fingerprint sensor inputs
US20150133798A1 (en) * 2013-11-13 2015-05-14 The Regents Of The University Of California Methods for noninvasive intracranial pressure calibration without the need for invasive icp
US9324067B2 (en) 2014-05-29 2016-04-26 Apple Inc. User interface for payments
CN105306097B (zh) * 2014-06-18 2019-07-26 中兴通讯股份有限公司 一种随机接入信号的检测方法、装置和系统
KR102077260B1 (ko) * 2014-08-08 2020-02-13 삼성전자주식회사 확룔 모델에 기반한 신뢰도를 이용하여 얼굴을 인식하는 방법 및 장치
US9762791B2 (en) * 2014-11-07 2017-09-12 Intel Corporation Production of face images having preferred perspective angles
DK179186B1 (en) 2016-05-19 2018-01-15 Apple Inc REMOTE AUTHORIZATION TO CONTINUE WITH AN ACTION
DK179471B1 (en) 2016-09-23 2018-11-26 Apple Inc. IMAGE DATA FOR ENHANCED USER INTERACTIONS
KR102185854B1 (ko) 2017-09-09 2020-12-02 애플 인크. 생체측정 인증의 구현
KR102389678B1 (ko) 2017-09-09 2022-04-21 애플 인크. 생체측정 인증의 구현
US10949497B2 (en) * 2018-01-26 2021-03-16 Crocus Energy High-speed multi-input tracker based on in-memory operations of time-dependent data
US11170085B2 (en) 2018-06-03 2021-11-09 Apple Inc. Implementation of biometric authentication
US11295223B2 (en) 2018-06-12 2022-04-05 International Business Machines Corporation Quantum feature kernel estimation using an alternating two layer quantum circuit
US10860096B2 (en) 2018-09-28 2020-12-08 Apple Inc. Device control using gaze information
US11100349B2 (en) 2018-09-28 2021-08-24 Apple Inc. Audio assisted enrollment
EP4264460B1 (en) 2021-01-25 2025-12-24 Apple Inc. Implementation of biometric authentication
WO2022185644A1 (ja) * 2021-03-03 2022-09-09 富士フイルム株式会社 画像処理装置、画像処理装置の作動方法、画像処理装置の作動プログラム、並びに学習方法
US12210603B2 (en) 2021-03-04 2025-01-28 Apple Inc. User interface for enrolling a biometric feature
US12216754B2 (en) 2021-05-10 2025-02-04 Apple Inc. User interfaces for authenticating to perform secure operations

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090274A (ja) * 1998-09-16 2000-03-31 Nippon Telegr & Teleph Corp <Ntt> パターン識別方法及びパターン識別プログラムを記録した記録媒体
JP2001266145A (ja) * 2000-03-22 2001-09-28 Matsushita Electric Ind Co Ltd パラメタ推定方法及びその装置
JP2003173444A (ja) * 2001-09-25 2003-06-20 Matsushita Electric Ind Co Ltd 複合照合装置
JP2004030552A (ja) * 2001-09-25 2004-01-29 Matsushita Electric Ind Co Ltd パラメタ推定装置及びデータ照合装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090274A (ja) * 1998-09-16 2000-03-31 Nippon Telegr & Teleph Corp <Ntt> パターン識別方法及びパターン識別プログラムを記録した記録媒体
JP2001266145A (ja) * 2000-03-22 2001-09-28 Matsushita Electric Ind Co Ltd パラメタ推定方法及びその装置
JP2003173444A (ja) * 2001-09-25 2003-06-20 Matsushita Electric Ind Co Ltd 複合照合装置
JP2004030552A (ja) * 2001-09-25 2004-01-29 Matsushita Electric Ind Co Ltd パラメタ推定装置及びデータ照合装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
IZOE S. ET AL.: "Gazo no Fractal-sei ni Motozuita Kernel Shuseibun Bunseki ni yoru Shahei Ryoiki no Gengazo Suitei", THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS GIJUTSU KENKYU HOKOKU, vol. 101, no. 362, 11 October 2001 (2001-10-11), pages 55 - 62, XP008114986 *
MAEDA E.: "Tsukai! Support Vector Machine", JOHO SHORI, IPSJ MAGAZINE, 15 July 2001 (2001-07-15), pages 676 - 683, XP008114987 *
TSUDA H.: "Support Vector Machine towa Nanika", THE JOURNAL OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, vol. 83, no. 6, 25 June 2000 (2000-06-25), pages 460 - 466, XP008114989 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2441857A2 (en) 2008-10-23 2012-04-18 P2i Ltd Vacuum processing apparatus
CN102314614A (zh) * 2011-10-24 2012-01-11 北京大学 一种基于类共享多核学习的图像语义分类方法
CN102314614B (zh) * 2011-10-24 2013-06-05 北京大学 一种基于类共享多核学习的图像语义分类方法

Also Published As

Publication number Publication date
US7760933B2 (en) 2010-07-20
JP4321350B2 (ja) 2009-08-26
EP1758059A1 (en) 2007-02-28
US20070230773A1 (en) 2007-10-04
CN1954342A (zh) 2007-04-25
EP1758059A4 (en) 2013-08-21
JP2005327076A (ja) 2005-11-24
CN1954342B (zh) 2010-04-21

Similar Documents

Publication Publication Date Title
JP4321350B2 (ja) パラメタ推定方法、パラメタ推定装置および照合方法
CN100472559C (zh) 特征点检测装置、特征点检测方法
Bhagavatula et al. Faster than real-time facial alignment: A 3d spatial transformer network approach in unconstrained poses
US9053388B2 (en) Image processing apparatus and method, and computer-readable storage medium
JP5406705B2 (ja) データ補正装置及び方法
US10755145B2 (en) 3D spatial transformer network
US7925060B2 (en) Authentication system and registration system related to facial feature information
JP4595750B2 (ja) 画像処理装置および方法、並びにプログラム
EP2353126B1 (en) Keypoint descriptor generation by complex wavelet analysis
JP4466951B2 (ja) 立体結合顔形状の位置合わせ
CN109684969B (zh) 凝视位置估计方法、计算机设备及存储介质
CN107016319A (zh) 一种关键点定位方法和装置
Sung et al. Pose-Robust Facial Expression Recognition Using View-Based 2D $+ $ 3D AAM
CN109934926B (zh) 模型数据处理方法、装置、可读存储介质和设备
JP2021503139A (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN117372604A (zh) 一种3d人脸模型生成方法、装置、设备及可读存储介质
CN112990047A (zh) 一种结合面部角度信息的多姿态人脸验证方法
JP3476710B2 (ja) ユークリッド的な3次元情報の復元方法、および3次元情報復元装置
WO2015176502A1 (zh) 一种图像特征的估计方法和设备
CN112488058A (zh) 面部跟踪方法、装置、设备和存储介质
US12573162B2 (en) Modelling method for making a virtual model of a user&#39;s head
JP7623994B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP4068888B2 (ja) アイリス推定装置およびアイリス照合装置
CN103310219B (zh) 配准对象形状的精度评估方法和设备、配准的方法和设备
Fan et al. 3D hand skeleton model estimation from a depth image

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2005737145

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 11596431

Country of ref document: US

Ref document number: 2007230773

Country of ref document: US

Ref document number: 200580015558.6

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

WWP Wipo information: published in national office

Ref document number: 2005737145

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 11596431

Country of ref document: US