WO2014032496A1 - 一种人脸特征点定位方法、装置及存储介质 - Google Patents

一种人脸特征点定位方法、装置及存储介质 Download PDF

Info

Publication number
WO2014032496A1
WO2014032496A1 PCT/CN2013/080526 CN2013080526W WO2014032496A1 WO 2014032496 A1 WO2014032496 A1 WO 2014032496A1 CN 2013080526 W CN2013080526 W CN 2013080526W WO 2014032496 A1 WO2014032496 A1 WO 2014032496A1
Authority
WO
WIPO (PCT)
Prior art keywords
face
feature point
human eye
fitting
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/CN2013/080526
Other languages
English (en)
French (fr)
Inventor
饶丰
陈波
肖斌
刘海龙
熊鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to EP13832559.2A priority Critical patent/EP2863335A4/en
Priority to US14/417,909 priority patent/US20150302240A1/en
Priority to JP2015521969A priority patent/JP2015522200A/ja
Publication of WO2014032496A1 publication Critical patent/WO2014032496A1/zh
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction

Definitions

  • the present invention belongs to the field of Internet technologies, and in particular, to a method, device, and storage medium for locating a feature point of a face.
  • Face feature point location is a technique for performing face detection on a video stream using digital image processing and pattern recognition techniques, and accurately positioning and tracking key points of the face. The purpose is to determine the key feature points of the face by positioning. And study the shape information of the main organs such as the mouth.
  • the prior art solution is configured by the face detection technology.
  • the initial position of the face that is located by the face detection result is not accurate enough, which results in the positioning of the key points of the face is not accurate enough, and the key points of the face are easily caused. Failure.
  • the prior art adopts the ASM algorithm on the face feature point fitting algorithm, and the ASM algorithm only considers the shape information, and the accuracy is not high.
  • the invention provides a method, a device and a storage medium for locating a feature point of a face, aiming at solving the problem that the key point of the face fails to be fitted and the fitting accuracy is not high due to the inaccurate positioning of the key points of the face in the prior art. problem.
  • the present invention is implemented in this way, a method for locating a facial feature point, comprising the following steps: initial positioning of a face position by combining face detection and human eye matching, and obtaining preliminary positioning information;
  • a technical solution of another embodiment of the present invention is: a facial feature point locating device, comprising a face detecting module, a feature point fitting module and a feature point locating module, wherein the face detecting module is configured to pass a face detecting technology And the human eye matching technology performs preliminary positioning on the face position; the feature point fitting module is configured to perform face feature point fitting according to the preliminary positioning information, and the feature point positioning module completes the face feature point positioning according to the fitting result.
  • the present invention also provides a storage medium containing computer executable instructions for performing a face feature point location method, the face feature point location method comprising the steps of:
  • the face feature point location is completed according to the fitting result.
  • the technical solution of the present invention has the following advantages or advantages:
  • the face feature point positioning method, device and storage medium according to the embodiment of the present invention combine face detection technology and human eye matching technology to initially locate a face position, which is better than only a person. Face detection can locate face location information more accurately.
  • the Inverse Compositional algorithm is used to fit the face feature points to complete the precise location of the face feature points.
  • the apparent values such as the gradient values in the X and y directions and the edge corner features are added, which makes the fitting of the face feature points more accurate and effectively reduces the original AAM model fitting process. It is easy to fall into the problem of local minimization and poor anti-interference ability.
  • FIG. 1 is a flowchart of a method for locating a face feature point according to a first embodiment of the present invention
  • FIG. 2 is a flowchart of a method for locating a face feature point according to a second embodiment of the present invention
  • FIG. 3 is a schematic diagram of a human eye search ROI region of a face feature point localization method according to an embodiment of the present invention.
  • FIG. 4 is a schematic diagram of a marked point of a face feature point of a face feature point localization method according to an embodiment of the present invention
  • FIG. 5 is a flowchart of modeling a face feature point shape model of a face feature point localization method according to an embodiment of the present invention
  • FIG. 6 is a schematic structural diagram of an apparatus for positioning a face feature point according to an embodiment of the present invention. Preferred embodiment of the invention
  • FIG. 1 is a flowchart of a method for positioning a face feature point according to a first embodiment of the present invention.
  • a method for positioning a face feature point according to a first embodiment of the present invention includes the following steps:
  • S 100 preliminary positioning of the face position by combining face detection and human eye matching
  • the embodiment of the present invention uses a cascaded Harr feature classifier to detect a face, obtain initial position information of the face and initial face size information s, and use the human eye matching algorithm to match the position information of the eyes, Positioning is more accurate using only face detection methods.
  • S110 performing face feature point fitting according to at least one feature of preliminary positioning information and AAM (active apparent model);
  • the characteristics of the AAM include features such as gray scale, gradient, edge and corner points; the embodiment of the present invention combines the gray value, the gradient value of the X and y axis directions, the edge sum by the AAM algorithm.
  • a plurality of features, such as corner points, are used as the apparent model of the AAM model, so that the fitting position of the face feature points is also more accurate.
  • the Inverse Compositional algorithm is used to perform facial feature point fitting. Hehe.
  • S120 Perform facial feature point positioning according to the fitting result.
  • the binocular image can be obtained according to the position of the face feature point, and in the next frame image, the next frame image is determined by the human eye search ROI region (abbreviation of Region Of Interest, in image processing)
  • ROI region abbreviation of Region Of Interest, in image processing
  • region of interest and the image of the human eye in the image of the previous frame in the ROI region is used as a template, and the image matching algorithm is used to obtain the position of both eyes in the current frame;
  • the ROI region is determined by the ROI region center and the eye.
  • Center coincidence, eye_height, eye_width are the height and width of the eye
  • roi_height, roi_width are the height and width of the ROI area of the eye search, respectively,
  • the face feature point localization method combines the face detection technology and the human eye matching technology to initially locate the face position, and can more accurately locate the face position information than using only the face detection.
  • FIG. 2 it is a flowchart of a method for positioning a face feature point according to a second embodiment of the present invention.
  • a method for positioning a face feature point according to a second embodiment of the present invention includes the following steps:
  • S210 determining whether the image of the previous frame detects the human eye, if yes, executing S220; if not, executing S240;
  • the embodiment of the present invention uses the human eye matching algorithm to perform human eye matching while face detection, which is more accurate than using only the face detection method.
  • S220 Searching in the ROI (abbreviation of Region Of Interest, term “interesting region” in image processing) to match the initial position information of the human eye;
  • the ROI area is determined by the fact that the center of the ROI area coincides with the center of the eye, eye_height, eye_width are the height and width of the eye, and roi_height, roi_width are the height and width of the ROI area of the eye search respectively.
  • FIG. 3 It is a schematic diagram of the ROI area of the human eye search of the present invention. In the middle of the smaller border, there is a left-eye image, and the outer large border is a left-eye search. ROI area, where
  • the matching result image w, y) is the most matching position in the ROI area ⁇ , and the human eye image ⁇ at the maximum value.
  • S230 performing facial feature point fitting according to initial position information of the human eye, and executing S260;
  • S240 Perform face detection, and determine whether a face is detected, if yes, execute S250, if not, re-execute S200;
  • the embodiment of the present invention uses a cascaded Harr feature classifier to detect a face, and obtains initial position information and initial face size information of the face.
  • S250 obtaining initial position information (x, y) of the face and initial face size information s, and combining the gray value, the initial position of the face x, and the gradient value in the y-axis direction according to the initial position and size information of the face AAM face feature point fitting, features such as edges and corner points;
  • the face feature point After obtaining the initial position and size information, combining the gray value, the initial position of the face x, the gradient value of the y-axis direction, the edge and the corner point as the apparent model of the AAM, the face feature point The fitting is performed to make the fitting position of the face feature points more precise.
  • the apparent model is a parameter that uses a two-norm minimization strategy to match unknown targets.
  • the ASM (Active Shape Model) of the face feature point can be represented by the vector 5 ⁇ ... ⁇ , ⁇
  • 82 face label points are used.
  • FIG. 4 is a schematic diagram of the label points of the face feature points of the present invention.
  • ⁇ model a certain amount of facial expression images are collected, and the position coordinates of 82 facial feature points are manually labeled as shown in FIG. 4, and the coordinate vectors ⁇ , ⁇ ... ⁇ , ⁇ ) of the facial feature points are obtained.
  • Procrustes algorithm is used to geometrically align the coordinate vector of the face feature points, and then the training data is subjected to PCA (principal components analysis) to obtain
  • the method for modeling a face feature point shape model of the present invention comprises the following steps:
  • S253 Record the average shape of the initial estimation as and use this as the reference coordinate system;
  • S254 calibrate the feature point coordinate vector of all training samples to the current average shape by affine transformation;
  • S257 determining whether the average shape after calibration is greater than a given threshold, and if so, re-executing S254; if not, executing S258;
  • the AAM table is obtained by mapping the points in the area surrounded by the ASM shape model to the average shape.
  • View model A where the mapping algorithm can adopt the segmentation affine mapping algorithm; similarly, the AAM apparent model can be learned by PCA, and Where A is the average appearance and A is the PCA basis of the AAM apparent model, which is the PCA-based coefficient.
  • the modeling method of the AAM apparent model is as follows: Each training sample is mapped into an average shape, and then three kinds of features of gray value, gradient value of X-axis y-axis, edge value and corner point feature value are respectively calculated as apparent models.
  • the gray value is calculated as: ⁇ , for each sample to be mapped to a gray image within the average shape, then the grayscale apparent model value is:
  • the X-axis y-axis gradient values are calculated using the sobel operator (Sobel operator/Sobel operator, one of the operators in image processing, mainly used for edge detection) to calculate the X-axis y-axis gradient values:
  • a dx (x, y) G x (x, y) 2 ;
  • a dy (x, y) G y (x, y) 2 ;
  • the edge angle feature ⁇ is calculated as follows: After obtaining the X-axis y-axis gradient value, set:
  • Edge ⁇ (x, y) G x (x, y) ⁇ G x (x, y);
  • Edge yy (x, y) G y (x, y) ⁇ G y (x, y);
  • Edge (x,y) G x (x,y)-G (x,y); Then use 3x3 Gaussian window to filter ( ⁇ ), £ , ⁇ respectively, and get:
  • the Inverse Compositional (inverse synthesis algorithm, which is a commonly used algorithm in the art) algorithm is used to fit the facial feature points, and the specifics include:
  • the initial four global affine transformation parameters obtained by the human eye matching algorithm are transformed into the input image ⁇ , and 1 II)),
  • w is defined as a piecewise affine mapping from the basic shape to the current shape s,
  • w a 2-dimensional similarity transformation, which is a similar transformation parameter
  • S270 Performing facial feature point localization according to the fitting result, and acquiring a human eye image according to the facial feature point, and the human eye image in the previous frame image is used as a template to match the position of the two eyes in the next frame image in the ROI region of the human eye. .
  • a binocular image may be obtained according to the position of the face feature point, and in the next frame image, the next frame image is determined by the human eye search ROI region, and the human eye image in the previous frame image in the ROI region is used as a template. Use the image matching algorithm to rematch the position of both eyes in the current frame.
  • the method for locating facial feature points performs facial feature point fitting using the Inverse Compositional algorithm according to the preliminary positioning information combined with the gradation, gradient, edge and corner feature. Complete the precise positioning of the face feature points.
  • the apparent values such as the gradient values in the X and y directions and the edge corner features are added, which makes the fitting of the face feature points more accurate and effectively reduces the original AAM model fitting process. It is easy to fall into the problem of local minimization and poor anti-interference ability.
  • FIG. 6 is a schematic structural diagram of an apparatus for positioning a facial feature point of the present invention.
  • the device for locating a facial feature point of the present invention comprises a face detection module, a feature point fitting module and a feature point locating module, wherein the face detection module is configured to perform preliminary positioning on the face position by combining face detection and human eye matching;
  • the face detection module uses the cascaded Harr feature classifier to detect the face, obtains the initial position information (x, y) of the face and the initial face size information s, and uses the human eye matching algorithm to match the position information of the eyes.
  • the feature point fitting module is used to perform face feature point fitting according to the preliminary positioning information and the AAM apparent model; wherein the AAM apparent model includes grayscale, gradient, edge and angle. Point feature, etc.; the feature point location module performs facial feature point location according to the fitting result.
  • the face detection module includes a human eye detection unit and a face detection unit, wherein
  • the human eye detecting unit is configured to determine whether the image of the previous frame detects the human eye, and if so, in the human eye ROI
  • ROI area determination method is that ROI area center and eye center coincide, eye_height, eye_width are eye height and width respectively , roi_height, roi_width are the height and width of the ROI area of the eye search respectively.
  • FIG. 3 is a schematic diagram of the ROI area of the human eye search of the present invention.
  • the middle small frame is the left eye picture
  • the outer large frame is the left eye. ⁇ Search for the ROI area
  • Roi _ height ⁇ ⁇ eye _ height
  • the matching algorithm is specifically: ⁇ , for the human eye image, for searching the ROI region, for matching the result image, Bay ' J
  • the matching result image is the ROI area and the human eye image at the maximum value.
  • the face detecting unit is configured to perform face detection, and determine whether a face is detected, and if yes, obtain initial position information (x, y) of the face and initial face size information s; if not, re-enter the video;
  • the embodiment of the present invention uses a cascading Harr feature classifier to detect a face, and obtains an initial position of the face and initial face size information.
  • the feature point fitting module includes a human eye fitting unit, a face fitting unit and a fitting judging unit, wherein the human eye fitting unit is configured to perform AAM facial feature point fitting according to initial position information of the human eye, and The judging unit judges whether the fitting is successful;
  • the face fitting unit is configured to perform AAM facial feature point fitting according to the initial position and size information of the face combined with the gray value, the initial position of the face x, the gradient value of the y-axis direction, the edge and the corner point. And determining whether the fitting is successful by fitting the judgment unit; wherein, after obtaining the initial position and size information, combining the gray value, the initial position of the face x, the gradient value of the y-axis direction, the edge and the corner point as the AAM
  • the apparent model which fits the face feature points, makes the fitting position of the face feature points more precise.
  • the ASM (Active Shape Model) of the face feature point can be represented by a vector S ⁇ ⁇ 'y" ⁇ , which is the position coordinate of the first point.
  • FIG. 4 is a schematic diagram of the marking points of the face feature points of the present invention.
  • FIG. 4 is a schematic diagram of the marking points of the face feature points of the present invention.
  • S ( ⁇ , ⁇ 2 , y 2 ... x i2 , y i2 ), geometrically align the coordinate vector of the face feature point with the p r0C mstes algorithm, and then perform PCA on the training data (principal components analysis, main Component analysis) learning, getting,
  • A A 0 + ⁇ A i A i
  • A is the average appearance and A is the PCA basis of the apparent model, which is the PCA-based coefficient.
  • the modeling method of the apparent model is as follows: Each training sample is mapped into an average shape, and then three kinds of characteristics of gray value, gradient value of X-axis y-axis, edge value of edge and corner point are respectively calculated as apparent The model; wherein, the gray value is calculated as: for each sample to be mapped to a gray image within the average shape, the grayscale apparent model value is:
  • the X-axis y-axis gradient values are calculated using the sobel operator (Sobel operator/Sorbe operator, one of the operators in image processing, mainly used for edge detection) to calculate the X-axis y-axis gradient values:
  • a dy (x,y) G y (x,y) 2 ;
  • the edge corner feature 4 ⁇ md corner is calculated as: After obtaining the X-axis y-axis gradient value,
  • Edge ⁇ (x,y) G x (x,y)-G x (x,y);
  • Edge yy (x, y) G y (x, y) ⁇ G y (x, y);
  • Edge xy (x,y) G x (x,y)-G y (x,y); Then use 3x3 Gaussian windows for £ , , £ , £ , respectively
  • the Inverse Compositional (inverse synthesis algorithm is a commonly used algorithm in the art) algorithm is used to fit the facial feature points, and the following includes: an initial according to a face detection or a human eye matching algorithm.
  • the four global affine transformation parameters transform the input image ⁇ , resulting in 1 (N(w(x 1 W , w is defined as the segment from the basic shape s to the current shape s) Affine mapping, w is a 2-dimensional similar transformation, which is a similar transformation parameter, then
  • the fitting determining unit is configured to determine whether the face feature point is successfully fitted, and if yes, locate the face feature point through the feature point positioning module, and if not, re-enter the video;
  • the feature point positioning module is configured to complete the face feature point positioning according to the fitting result, and acquire the human eye image according to the face feature point, and use the human eye image in the one frame image of the human eye detection unit as a template in the ROI region of the human eye. Matching the positions of the two eyes in the next frame image; wherein, the binocular image can be obtained according to the position of the face feature point, and in the next frame image, the next frame image is determined by the human eye search ROI region, and the image of the previous frame in the ROI region is The human eye image in the image is used as a template to obtain the position of both eyes in the current frame using an image matching algorithm.
  • the face feature point locating method, device and storage medium combine face detection technology and human eye matching technology to initially locate a face position, and can more accurately locate face position information than using only face detection;
  • the Inverse Compositional algorithm is used to fit the facial feature points to complete the precise location of the facial feature points.
  • the apparent values such as the gradient values in the X and y directions and the edge corner features are added, which makes the fitting of the face feature points more accurate and effectively reduces the original AAM model fitting process. It is easy to fall into the problem of local minimization and poor anti-interference ability.

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geometry (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Ophthalmology & Optometry (AREA)
  • Image Analysis (AREA)

Description

一种人脸特征点定位方法、 装置及存储介质 技术领域
本发明属于互联网技术领域, 尤其涉及一种人脸特征点定位方法、 装置 及存储介质。
背景技术
人脸面部的关键特征点定位既是人脸识别研究中的一个关键问题, 也是 图形学和计算机视觉领域的一个级别问题。 人脸特征点定位是采用数字图像 处理和模式识别等技术对一段视频流进行人脸检测, 并对人脸关键点进行精 确定位并跟踪的技术, 目的是通过定位的人脸关键特征点来确定和研究嘴巴 等主要器官的形状信息。
现有技术方案通过人脸检测技术进行定位, 但现有技术中依靠人脸检测 结果所定位的人脸初始位置不够精确, 导致对人脸关键点的定位不够精确, 容易造成人脸关键点拟合失败。 另外, 现有技术在人脸特征点拟合算法上采 用 ASM算法, ASM算法只考虑了形状信息, 准确率不高。
发明内容
本发明提供了一种人脸特征点定位方法、 装置及存储介质, 旨在解决现 有技术中由于人脸关键点的定位不够精确造成人脸关键点拟合失败且拟合 准确率不高的问题。
本发明是这样实现的, 一种人脸特征点定位方法, 包括以下步骤: 结合人脸检测和人眼匹配对人脸位置进行初步定位 ,并获取初步定位信 息;
根据初步定位信息进行人脸特征点拟合;
根据拟合结果完成人脸特征点定位。 本发明另一实施例的技术方案为: 一种人脸特征点定位装置, 包括人脸 检测模块、 特征点拟合模块及特征点定位模块, 所述人脸检测模块用于通过 人脸检测技术和人眼匹配技术对人脸位置进行初步定位; 所述特征点拟合模 块用于根据初步定位信息进行人脸特征点拟合, 所述特征点定位模块根据拟 合结果完成人脸特征点定位。
此外, 本发明还提供一种包含计算机可执行指令的存储介质, 该计算机 可执行指令用于执行一种人脸特征点定位方法, 该人脸特征点定位方法包括 以下步骤:
结合人脸检测和人眼匹配对人脸位置进行初步定位,并获取初步定位信 息;
根据初步定位信息进行人脸特征点拟合;
根据拟合结果完成人脸特征点定位。
本发明的技术方案具有如下优点或有益效果: 本发明实施例的人脸特征 点定位方法、 装置及存储介质结合人脸检测技术和人眼匹配技术对人脸位置 进行初步定位, 比只使用人脸检测能更精确的定位人脸位置信息; 根据初步 定位信息结合灰度, 梯度、 边缘和角点特征的使用 Inverse Compositional算 法进行人脸特征点拟合, 完成人脸特征点的精确定位。 在 AAM模型中, 增 加了 X , y轴方向的梯度值以及边缘角点特征等表观模型, 使得人脸特征点 的拟合更加精确, 并有效的减少了原有的 AAM模型拟合过程中容易陷入局 部最小化及抗干扰能力差的问题。
附图概述
附图 1是本发明第一实施例人脸特征点定位方法的流程图;
附图 2是本发明第二实施例人脸特征点定位方法的流程图;
附图 3是本发明实施例人脸特征点定位方法的人眼搜索 ROI 区域示意 图;
附图 4是本发明实施例人脸特征点定位方法的人脸特征点的标注点示意 图;
附图 5是本发明实施例人脸特征点定位方法的人脸特征点形状模型建模 的流程图;
附图 6是本发明实施例的人脸特征点定位的装置的结构示意图。 本发明的较佳实施方式
为了使本发明的目的、 技术方案及优点更加清楚明白, 以下结合附图及 实施例, 对本发明进行进一步详细说明。 应当理解, 此处所描述的具体实施 例仅仅用以解释本发明, 并不用于限定本发明。
请参阅图 1 , 是本发明第一实施例人脸特征点定位的方法的流程图。 本 发明第一实施例人脸特征点定位的方法包括以下步骤:
S 100: 结合人脸检测和人眼匹配对人脸位置进行初步定位;
在 S100中,本发明实施例使用级联的 Harr特征分类器对人脸进行检测, 获得人脸的初始位置信息和初始人脸大小信息 s, 同时使用人眼匹配算法匹 配双眼的位置信息, 比只使用人脸检测方法定位更加精确。
S110: 根据初步定位信息及 AAM (主动表观模型) 的至少一特征进行 人脸特征点拟合;
在 S110中, AAM (主动表观模型) 的特则包括灰度、 梯度、 边缘和角 点等特征; 本发明实施例通过 AAM算法结合灰度值、 X , y轴方向的梯度值、 边缘和角点等多个特征做为 AAM模型的表观模型, 使人脸特征点的拟合位 置也更精确; 在本发明实施例中, 使用 Inverse Compositional (反向合成 )算 法进行人脸特征点拟合。
S120: 根据拟合结果完成人脸特征点定位。 在 S120 中, 人脸特征点定位后, 可以根据人脸特征点的位置得到双眼 图像,在下一帧图像中,确定下一帧图像人眼搜索 ROI区域( Region Of Interest 的缩写, 图像处理中的术语"感兴趣区域"), 并在 ROI区域内以上一帧图像 中的人眼图像作为模板,使用图像匹配算法,得到当前帧中双眼的位置; ROI 区域的确定方法为, ROI区域中心和眼睛中心重合, eye_height, eye_width分 别为眼睛的高度和宽度, roi_height, roi_width分别为眼睛搜索 ROI区域的高 度和宽度, 其中,
roi _ height - α · eye _ height;
roi _ width - β · eye _ width; a, P为 ROI区域大小控制系数, 在本技术方案中取 α = 3= 2
本发明实施例的人脸特征点定位方法结合人脸检测技术和人眼匹配技 术对人脸位置进行初步定位, 比只使用人脸检测能更精确的定位人脸位置信 息。
请参阅图 2, 是本发明第二实施例人脸特征点定位的方法的流程图。 本 发明第二实施例人脸特征点定位的方法包括以下步骤:
S200: 输入视频, 获取所述视频中对应的人脸图像信息;
S210: 判断上一帧图像是否检测出人眼, 如果是, 执行 S220; 如果否, 执行 S240;
在 S210 中, 本发明实施例在人脸检测的同时使用人眼匹配算法进行人 目艮匹配, 比只使用人脸检测方法定位更加精确。
S220: 在人眼 ROI ( Region Of Interest的缩写, 图像处理中的术语 "感 兴趣区域" ) 区域内进行搜索, 匹配人眼的初始位置信息;
在 S220 中, ROI 区域确定方法为, ROI 区域中心和眼睛中心重合, eye_height, eye_width分别为眼睛的高度和宽度, roi_height, roi_width分别为 眼睛搜索 ROI区域的高度和宽度, 具体请一并参阅图 3, 是本发明人眼搜索 ROI区域示意图。 中间较小边框内为左眼图片, 外部较大边框内为左眼搜索 ROI区域, 其中,
roi _ height - α · eye _ height
roi width - β · eye width; α, 为 ROI区域大小控制系数, 在本发明实施例中取 α = 3,^ = 2 ; 人眼匹 配算法具体为: Γ , 为人眼图像, , 为搜索 ROI区域, W ,) 为匹配结 果图像, 贝' J
Figure imgf000006_0001
其中,匹配结果图像 w ,y)在最大值时即为在 ROI区域 ^, 和人眼图像 Γ 中最匹配的位置。
S230: 根据人眼的初始位置信息进行 ΑΑΜ人脸特征点拟合, 并执行 S260;
S240: 进行人脸检测, 并判断是否检测出人脸, 如果是, 执行 S250, 如 果否, 重新执行 S200;
在 S240中,本发明实施例使用级联的 Harr特征分类器对人脸进行检测, 获得人脸的初始位置信息和初始人脸大小信息。
S250: 获得人脸的初始位置信息 (x,y )和初始人脸大小信息 s, 并根据 人脸的初始位置和大小信息结合灰度值、 人脸的初始位置 x,y轴方向的梯度 值、 边缘和角点等特征进行 AAM人脸特征点拟合;
在 S250 中, 在获得初始位置和大小信息后, 结合灰度值、 人脸的初始 位置 x,y轴方向的梯度值、 边缘和角点等特征作为 AAM的表观模型, 对人 脸特征点进行拟合, 使人脸特征点的拟合位置也更精确。 表观模型为一种参 使用二范数最小化策略对未知目标进行匹配。 其中, 人脸特征点的 ASM(Active Shape Model,主动形状模型)可由矢量 5 ^ … ^表示, ^ 为第 个点的位置坐标, 在本发明实施例中, 采用了 82个人脸标注点, 具体 请参阅图 4, 是本发明人脸特征点的标注点示意图。 在 ΑΑΜ模型训练过程 中, 采集一定量的人脸表情图片, 按照图 4所示手动标注 82个人脸特征点 的位置坐标, 得到人脸特征点的坐标矢量 ^ ^ , ^…^,^) , 对人脸特征 点的坐标矢量进行 Procrustes算法进行几何对齐, 然后对训练数据进行 PCA ( principle components analysis , 主成分分析 ) 学习, 得到,
S = S0 +∑PiSi
i=l 其中, 为平均形状, 为形状的 PCA基, A为 PCA基的系数, 在拟 合过程中计算出不同的 A即可得到相应的 ASM形状模型的矢量 具体请 一并参阅图 5, 是本发明人脸特征点形状模型建模的方法的流程图。 本发明 人脸特征点形状模型建模的方法包括以下步骤:
S251: 对所有人脸特征点的坐标矢量去除均值, 转移到质心坐标系下;
S252: 选择一个样本作为初始的平均形状, 并校准尺寸使得 W = 1;
S253: 将初始估计的平均形状记为 并将此作为参考坐标系; S254: 将所有训练样本的特征点坐标矢量通过仿射变换校准到当前平均 形状上;
S255: 对校准后的所有样本重新计算平均形状;
S256: 将当前的平均形状校准到 上, 并且使得 ^卜1 ;
S257: 判断校准后的平均形状是否大于给定阈值, 如果是, 重新执行 S254; 如果否, 执行 S258;
S258: 通过 PCA方法将对齐后的样本进行统计形状建模, 得: s = s0 + fj Pisi
i=l
根据 ASM形状模型所包围区域内的点映射到平均形状,即得到 AAM表 观模型 A, 其中, 映射算法可采用分段仿射映射算法; 同理, 对 AAM表观 模型可以进行 PCA学习, 得到,
Figure imgf000008_0001
其中, A为平均表观, A为 AAM表观模型的 PCA基, 为 PCA基的 系数。
AAM表观模型的建模方法具体为: 将每个训练样本映射到平均形状中, 然后分别计算灰度值、 X轴 y轴的梯度值、 边缘和角点特征值三类特征作为 表观模型; 其中, 灰度值 的计算方法为: ^, 为每个样本映射到平均 形状内的灰度图像, 则灰度表观模型值为:
X轴 y轴梯度值的计算方法为: 使用 sobel算子( Sobel operator/索贝尔 算子,是图像处理中的算子之一, 主要用作边缘检测 )计算 X轴 y轴梯度值:
Figure imgf000008_0002
y轴梯度值的表观模型值 及 用以下公式获得
Adx(x,y) = Gx(x,y)2;
Ady(x,y) = Gy(x,y)2; 边缘角点特征 α 的计算方法为: 得到 X轴 y轴方向梯度值后 , 设:
Edge^ (x, y) = Gx (x, y) · Gx (x, y);
Edgeyy (x, y) = Gy (x, y) · Gy (x, y);
Edge (x,y) = Gx(x,y)-G (x,y); 然后采用 3x3的 Gaussian窗分别对 (υ),£ ,^^ 进行 滤波, 得:
1 2 1
Edge^ (x, y) 2 4 2 *Edge x,y)
1 2 1
1 2 1
Edge (x, y ) 2 4 2 *Edge (x,y)
1 2 1
1 2 1
Edge (x, y) 2 4 2 *Edge (x,y)
1 2 1 用以下公式计算得到边缘和角点特征:
A (γ ν) =
(Edge^ (x, y ) + Edge (x, y )f - 2 · (Edge^ (x, y ) · Edge (x, y ) - Edge (x, y ) · Edge (x, y ) 由于灰度值、 x轴 y轴方向梯度值、 边缘和角点等特征不在同一个尺度 下, 所以计算完后需要将三个特征值归一化到同一尺度下, 在本发明实施方 式中, 选用 Sigmoidal方法进行特征值归一, 具体为:
Kay , ) = Kay KA gray , + Kay ));
= y) K X + );
y) = y) /( ν、 y) + );
A. (x,y)
A (x,y)/(A
归一化后, 三类特征都处于同一个尺度下, 每一个训练样本对应三类特 征及四个特征值;得到四个特征值的 AAM表观模型后,通过 PCA进行学习, 得到:
Λ = Λ, +∑ Α·
i=l
在本发明实施方式中, 使用 Inverse Compositional (反向合成算法, 是本 领域内一种常用算法)算法对人脸特征点进行拟合, 具体包括: 根据人脸检 测或人眼匹配算法得到的初始的四个全局仿射变换参数 ,对输入图像 ^, 进行变换, 得 1 I I )), w定义为从基本形状 到当前形状 s的分段 仿射映射 , w 为 2 维相似变换, 为相似变换参数, 则
1 + a -b x t
N(x\q)= +
L b 1 + b丄^ 」, 其中, q = ( ,b,tx,ty、, 可以通过人眼匹配算法计 算得到, 对变换后的图像计算三类特征表观模型得 AWW^W^ )); 计算 表 观 模 型 差 值 A(/(Noy(jcip))i¾)-A) c) . 计 算
(Vq p) = H-^SDT.(A(I(N(W(x\p)) I ^))-^ W) . 其中, H为 Hessian矩阵(海 赛矩阵, 是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵) , ^为最速下降图, 训练模型时预先计算好的, 由以下公式计算得到:
Figure imgf000010_0001
H = ^SD' SD. 更新 形 状 参数 (N oW)(x; q,p)^(N oW)(x; q, p) o(N oW)(x; Vq, Vp) 1 , 直 到 ||(V^Vp)||-
S260: 判断人脸特征点是否拟合成功, 如果是, 执行 S270, 如果否, 重 新执行 S200;
S270: 根据拟合结果完成人脸特征点定位, 并根据人脸特征点获取人眼 图像,以上一帧图像中的人眼图像作为模板在人眼 ROI区域内匹配下一帧图 像中双眼的位置。
在 S270 中, 可以根据人脸特征点的位置得到双眼图像, 在下一帧图像 中, 确定下一帧图像人眼搜索 ROI区域, 并在 ROI区域内以上一帧图像中 的人眼图像作为模板, 使用图像匹配算法, 重新匹配当前帧中双眼的位置。
本发明实施例的人脸特征点定位的方法根据初步定位信息结合灰度, 梯 度、 边缘和角点特征的使用 Inverse Compositional算法进行人脸特征点拟合, 完成人脸特征点的精确定位。 在 AAM模型中, 增加了 X , y轴方向的梯度值 以及边缘角点特征等表观模型, 使得人脸特征点的拟合更加精确, 并有效的 减少了原有的 AAM模型拟合过程中容易陷入局部最小化及抗干扰能力差的 问题。
请参阅图 6, 是本发明人脸特征点定位的装置的结构示意图。 本发明人 脸特征点定位的装置包括人脸检测模块、 特征点拟合模块及特征点定位模 块, 人脸检测模块用于结合人脸检测和人眼匹配对人脸位置进行初步定位; 其中,人脸检测模块使用级联的 Harr特征分类器对人脸进行检测,获得人脸 的初始位置信息 (x,y )和初始人脸大小信息 s, 同时使用人眼匹配算法匹配 双眼的位置信息, 比只使用人脸检测方法定位更加精确; 特征点拟合模块用 于根据初步定位信息结合 AAM表观模型进行人脸特征点拟合; 其中, AAM 表观模型包括灰度、 梯度、 边缘和角点等特征; 特征点定位模块根据拟合结 果完成人脸特征点定位。
人脸检测模块包括人眼检测单元和人脸检测单元, 其中,
人眼检测单元用于判断上一帧图像是否检测出人眼,如果是,在人眼 ROI
( Region Of Interest的缩写, 图像处理中的术语"感兴趣区域)区域内进行搜 索, 匹配人眼的位置信息; 如果否, 则通过人脸检测单元进行人脸检测; 其 中, 本发明实施例在人脸检测的同时使用人眼匹配算法进行人眼匹配, 比只 使用人脸检测方法定位更加精确; ROI区域确定方法为, ROI区域中心和眼 睛中心重合, eye_height, eye_width 分别为眼睛的高度和宽度, roi_height, roi_width分别为眼睛搜索 ROI区域的高度和宽度, 具体请一并参阅图 3, 是 本发明人眼搜索 ROI区域示意图。 中间较小边框内为左眼图片, 外部较大边 框内为左目艮搜索 ROI区域, 其中,
roi _ height = α · eye _ height;
roi width = β · eye width; α, β为 ROI区域大小控制系数, 在本发明实施例中取 α = 3,^ = 2 ; 人眼匹 配算法具体为: Γ , 为人眼图像, 为搜索 ROI区域, 为匹配结 果图像, 贝' J
Figure imgf000012_0001
其中,匹配结果图像 在最大值时即为在 ROI区域 和人眼图像
Γ 中最匹配的位置。
人脸检测单元用于进行人脸检测, 并判断是否检测出人脸, 如果是, 获 得人脸的初始位置信息 (x,y )和初始人脸大小信息 s; 如果否, 则重新输入 视频; 其中, 本发明实施例使用级联的 Harr特征分类器对人脸进行检测, 获 得人脸的初始位置和初始人脸大小信息。
特征点拟合模块包括人眼拟合单元、 人脸拟合单元和拟合判断单元, 其 人眼拟合单元用于根据人眼的初始位置信息进行 AAM人脸特征点拟 合, 并通过拟合判断单元判断拟合是否成功;
人脸拟合单元用于根据人脸的初始位置和大小信息结合灰度值、 人脸的 初始位置 x,y轴方向的梯度值、 边缘和角点等特征进行 AAM人脸特征点拟 合, 并通过拟合判断单元判断拟合是否成功; 其中, 在获得初始位置和大小 信息后, 结合灰度值、 人脸的初始位置 x,y轴方向的梯度值、 边缘和角点等 特征作为 AAM的表观模型, 对人脸特征点进行拟合, 使人脸特征点的拟合 位置也更精确。 其中, 人脸特征点的 ASM(Active Shape Model, 主动形状模 型)可由矢量 S ^^ ^^ ' y" }表示, 为第 个点的位置坐标, 在本发明实施 例中, 采用了 82个人脸标注点, 具体请参阅图 4, 是本发明人脸特征点的标 注点示意图。 在 AAM模型训练过程中, 采集一定量的人脸表情图片, 按照 图 4所示手动标注 82个人脸特征点的位置坐标, 得到人脸特征点的坐标矢 量 S = (Μι , χ2 , y2...xi2 , yi2) , 对人脸特征点的坐标矢量进行 pr0Cmstes算法进行 几何对齐, 然后对训练数据进行 PCA ( principle components analysis, 主成分 分析) 学习, 得到,
s = s0 + fj Pisi
i=l 其中, 为平均形状, 为形状的 PCA基, A为 PCA基的系数, 在拟 合过程中计算出不同的 即可得到相应的形状模型的矢量 本发明人脸特 征点形状模型建模具体包括: 对所有人脸特征点的坐标矢量去除均值, 转移 到质心坐标系下;选择一个样本作为初始的平均形状,并校准尺寸使得 1^1=1; 将初始估计的平均形状记为 并将此作为参考坐标系; 将所有训练样本的 特征点坐标矢量通过仿射变换校准到当前平均形状上; 对校准后的所有样本 重新计算平均形状; 将当前的平均形状校准到 上, 并且使得 = 1 ; 判断校 准后的平均形状是否大于给定阈值, 如果是, 重新变换校准所有训练样本的 特征点坐标矢量; 如果否, 通过 PCA 方法将对齐后的样本进行统计形状建 模, 得:
S = S0 +∑PiSi 根据形状模型所包围区域内的点映射到平均形状, 即得到表观模型 A , 其中, 映射算法可采用分段仿射映射算法; 同理, 对表观模型可以进行 PCA 学习, 得到,
A = A0 +∑AiAi
i=l 其中, A为平均表观, A为表观模型的 PCA基, 为 PCA基的系数。 表观模型的建模方法具体为: 将每个训练样本映射到平均形状中, 然后 分别计算灰度值、 X轴 y轴的梯度值、 边缘和角点特征值三类特征作为表观 模型; 其中, 灰度值 的计算方法为: 为每个样本映射到平均形状 内的灰度图像, 则灰度表观模型值为:
X轴 y轴梯度值的计算方法为: 使用 sobel算子( Sobel operator/索贝 算子,是图像处理中的算子之一, 主要用作边缘检测 )计算 X轴 y轴梯度值:
-1 0 1
G x,y) ■2 0 2
-1 0 1
1 -2 -1
Gy(x,y) 0 0 0
1 2 1
则 x轴 y轴梯度值的表观模型值 及 用以下公式获得:
Figure imgf000014_0001
Ady(x,y) = Gy(x,y)2; 边缘角点特征 4^ md corner的计算方法为: 得到 X轴 y轴方向梯度值后 ,
Edge^ (x,y) = Gx(x,y)-Gx(x,y);
Edgeyy (x, y) = Gy (x, y) · Gy (x, y);
Edgexy(x,y) = Gx(x,y)-Gy(x,y); 然后采用 3x3的 Gaussian窗分别对£ , ,££ , 进行
Figure imgf000014_0002
1 2 1
Edge^ (x, y ) 2 4 2
1 2 1
1 2 1
Edge (x, y ) 2 4 2 *ED,y);
1 2 1
1 2 1
Edge (x, y) 2 4 2 *Edge (x,y)
1 2 1 用以下公式计算得到边缘和角点特征:
A edge _ and _ corner
(Edge^ (x, y) + Edgeyy (x, y)) - 2 · (Edge^ (x, y) · Edgeyy (x, y) - Edge^ (x, y) · Edge^ (x, y)) 由于灰度值、 x轴 y轴方向梯度值、 边缘和角点等特征不在同一个尺 度下, 所以计算完后需要将三个特征值归一化到同一尺度下, 在本发明实施 方式 中 选用 Sigmoidal 方法进行特征值归 具体为
Kay ) = Kay ) 'i a ) + Kay ));
y) = y) /( (x, y) + Adx (x, y ));
y y) = y) /(A -d¾y y) + A ld¾y、 );
A le.dge _ and _ corner (x,y)
A edge _ and _ corner (x,y)/(A ledge _ and _ corner iedge_and—cor er
归一化后, 三类特征都处于同一个尺度下, 每一个训练样本对应三类特 征及四个特征值; 得到四个特征值的表观模型后, 通过 PCA进行学习, 得 到:
Figure imgf000015_0001
在本发明实施方式中, 使用 Inverse Compositional (反向合成算法, 是本 领域内一种常用算法)算法对人脸特征点进行拟合, 具体包括: 根据人脸检 测或人眼匹配算法得到的初始的四个全局仿射变换参数 对输入图像 ^, 进行变换, 得 1 (N(w(x 1 W , w定义为从基本形状 s。到当前形状 s的分段 仿射映射 , w 为 2 维相似变换, 为相似变换参数, 则
N(x\q)
Figure imgf000016_0002
, 其中, q = (fl,b,tx,ty、, 可以通过人眼匹配算法计 算得到, 对变换后的图像计算三类特征表观模型得 AWWWWW)^)); 计算 表 观 模 型 差 值 A(/(Noy(jcip))i¾)-A)W . 计 算 (Vq p) = H-^SDT.(A(l(N(W(x\p))\q))- x)). 其中, H为 Hessian矩阵(海 赛矩阵, 是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵) , 为最速下降图, 训练模型时预先计算好的, 由以下公式计算得到:
Figure imgf000016_0001
H = D' SD · 更新形状参数 (N oW)^ ^ p) ^ N oW^ ^ p) °(N oW">(^ ^p 1 , 直到
|(νήτ,νΡ)| 。 拟合判断单元用于判断人脸特征点是否拟合成功, 如果是, 通过特征点 定位模块定位人脸特征点, 如果否, 则重新输入视频;
特征点定位模块用于根据拟合结果完成人脸特征点定位, 并根据人脸特 征点获取人眼图像, 通过人眼检测单元以上一帧图像中的人眼图像作为模板 在人眼 ROI区域内匹配下一帧图像中双眼的位置; 其中, 可以根据人脸特征 点的位置得到双眼图像, 在下一帧图像中, 确定下一帧图像人眼搜索 ROI 区域, 并在 ROI区域内以上一帧图像中的人眼图像作为模板, 使用图像匹配 算法, 得到当前帧中双眼的位置。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以 通过硬件来完成, 也可以通过程序来指令相关的硬件完成, 所述的程序可以 存储于一种计算机可读存储介质中, 并被至少一个处理器执行, 以实现图 1、 图 2和图 5所述的方法流程。 上述提到的存储介质可以是只读存储器, 磁盘或 光盘等。
本发明实施例的人脸特征点定位方法、 装置及存储介质结合人脸检测技 术和人眼匹配技术对人脸位置进行初步定位, 比只使用人脸检测能更精确的 定位人脸位置信息; 根据初步定位信息结合灰度, 梯度、 边缘和角点特征的 使用 Inverse Compositional算法进行人脸特征点拟合, 完成人脸特征点的精 确定位。 在 AAM模型中, 增加了 X , y轴方向的梯度值以及边缘角点特征等 表观模型, 使得人脸特征点的拟合更加精确, 并有效的减少了原有的 AAM 模型拟合过程中容易陷入局部最小化及抗干扰能力差的问题。
以上所述仅为本发明的较佳实施例而已, 并不用以限制本发明, 凡在本 发明的精神和原则之内所作的任何修改、 等同替换和改进等, 均应包含在本 发明的保护范围之内。

Claims

权 利 要 求 书
1、 一种人脸特征点定位方法, 其特征在于, 包括以下步骤:
结合人脸检测和人眼匹配对人脸位置进行初步定位,并获取初步定位信 息;
根据初步定位信息进行人脸特征点拟合;
根据拟合结果完成人脸特征点定位。
2、 根据权利要求 1所述的人脸特征点定位方法, 其特征在于, 结合人脸 检测和人眼匹配对人脸位置进行初步定位,并获取初步定位信息的步骤具体 为: 通过级联的特征分类器对人脸进行检测, 获得人脸的初始位置信息和初 始人脸大小信息。
3、 根据权利要求 1或 2所述的人脸特征点定位方法, 其特征在于, 在所 述结合人脸检测技术和人眼匹配技术对人脸位置进行初步定位并获取初步 定位信息的步骤前还包括:输入视频,获取所述视频中对应的人脸图像信息, 其中,所述初步定位包括获取双眼初始位置、人脸初始位置及人脸初始大小。
4、 根据权利要求 1所述的人脸特征点定位方法, 其特征在于, 所述结合 人脸检测和人眼匹配对人脸位置进行初步定位包括: 判断上一帧图像是否检 测出人眼, 如果是, 通过人眼匹配技术进行初步定位; 如果否, 进行人脸检 测定位。
5、 根据权利要求 1或 4所述的人脸特征点定位方法, 其特征在于, 所述 通过人眼匹配对人脸位置进行初步定位包括: 在人眼感兴趣区域 ROI内进行 搜索, 匹配人眼的初始位置信息, 并根据人眼的初始位置信息进行人脸特征 点拟合。
6、 根据权利要求 4所述的人脸特征点定位方法, 其特征在于, 所述进行 人脸检测定位包括: 进行人脸检测, 并判断是否检测出人脸, 如果是, 获得 人脸的初始位置信息和初始人脸大小信息, 并根据人脸的初始位置和大小信 息结合灰度值、人脸的初始位置 x,y轴方向的梯度值、 边缘和角点特征进行人 脸特征点拟合; 如果否, 则重新输入视频。
7、 根据权利要求 3所述的人脸特征点定位方法, 其特征在于, 所述进行 人脸特征点拟合后还包括: 判断人脸特征点是否拟合成功, 如果是, 根据拟 合结果完成人脸特征点定位, 并根据人脸特征点获取人眼图像, 以上一帧图 像中的人眼图像作为模板在人眼感兴趣区域内匹配下一帧图像中双眼的位 置; 如果否, 重新输入视频。
8、 一种人脸特征点定位装置, 其特征在于, 包括人脸检测模块、 特征 点拟合模块及特征点定位模块, 所述人脸检测模块用于通过人脸检测技术和 人眼匹配技术对人脸位置进行初步定位; 所述特征点拟合模块用于根据初步 定位信息进行人脸特征点拟合, 所述特征点定位模块根据拟合结果完成人脸 特征点定位。
9、 根据权利要求 8所述的人脸特征点定位装置, 其特征在于, 所述人脸 检测模块通过人脸检测技术对人脸位置进行初步定位为: 通过级联的特征分 类器对人脸进行检测, 获得人脸的初始位置信息和初始人脸大小信息。
10、 根据权利要求 8或 9所述的人脸特征点定位装置, 其特征在于, 所述 人脸检测模块包括人眼检测单元和人脸检测单元,
所述人眼检测单元用于判断上一帧图像是否检测出人眼, 如果是, 在人 目艮感兴趣区域内进行搜索, 匹配人眼的位置信息; 如果否, 则通过人脸检测 单元进行人脸检测;
所述人脸检测单元用于进行人脸检测,并判断是否检测出人脸,如果是, 获得人脸的初始位置信息和初始人脸大小信息; 如果否, 则重新输入视频。
11、 根据权利要求 8或 9所述的人脸特征点定位装置, 其特征在于, 所述 特征点拟合模块包括人眼拟合单元和人脸拟合单元,
所述人眼拟合单元用于根据人眼的初始位置信息进行人脸特征点拟合, 并通过拟合判断单元判断拟合是否成功;
所述人脸拟合单元用于根据人脸的初始位置和大小信息结合灰度值、人 脸的初始位置 x,y轴方向的梯度值、 边缘和角点特征进行人脸特征点拟合, 并 通过拟合判断单元判断拟合是否成功。
12、 根据权利要求 11所述的人脸特征点定位装置, 其特征在于, 所述特 征点拟合模块还包括拟合判断单元,
所述拟合判断单元用于判断人脸特征点是否拟合成功, 如果是, 通过特 征点定位模块定位人脸特征点; 如果否, 则重新输入视频。
13、 根据权利要求 11 所述的人脸特征点定位装置, 其特征在于, 所述 特征点定位模块用于根据拟合结果完成人脸特征点定位, 并根据人脸特征点 获取人眼图像, 通过人眼检测单元以上一帧图像中的人眼图像作为模板在人 眼感兴趣区域内匹配下一帧图像中双眼的位置。
14、 一个或多个包含计算机可执行指令的存储介质, 所述计算机可执行 指令用于执行一种人脸特征点定位方法, 其特征在于, 该人脸特征点定位方 法包括以下步骤:
结合人脸检测和人眼匹配对人脸位置进行初步定位,并获取初步定位信 息;
根据初步定位信息进行人脸特征点拟合;
根据拟合结果完成人脸特征点定位。
PCT/CN2013/080526 2012-08-28 2013-07-31 一种人脸特征点定位方法、装置及存储介质 Ceased WO2014032496A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP13832559.2A EP2863335A4 (en) 2012-08-28 2013-07-31 METHOD, DEVICE AND STORAGE MEDIUM FOR LOCATING CHARACTER POINTS ON A HUMAN FACE
US14/417,909 US20150302240A1 (en) 2012-08-28 2013-07-31 Method and device for locating feature points on human face and storage medium
JP2015521969A JP2015522200A (ja) 2012-08-28 2013-07-31 人顔特徴点の位置決め方法、装置及び記憶媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210309313.6 2012-08-28
CN201210309313.6A CN103632129A (zh) 2012-08-28 2012-08-28 一种人脸特征点定位方法及装置

Publications (1)

Publication Number Publication Date
WO2014032496A1 true WO2014032496A1 (zh) 2014-03-06

Family

ID=50182463

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/080526 Ceased WO2014032496A1 (zh) 2012-08-28 2013-07-31 一种人脸特征点定位方法、装置及存储介质

Country Status (5)

Country Link
US (1) US20150302240A1 (zh)
EP (1) EP2863335A4 (zh)
JP (1) JP2015522200A (zh)
CN (1) CN103632129A (zh)
WO (1) WO2014032496A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902635A (zh) * 2019-03-04 2019-06-18 司法鉴定科学研究院 一种基于示例图形的人像特征标识方法
CN109919081A (zh) * 2019-03-04 2019-06-21 司法鉴定科学研究院 一种自动化辅助人像特征标识方法
EP3146504B1 (fr) * 2014-05-20 2021-03-10 Essilor International Procédé de construction d'un modèle du visage d'un individu, procédé et dispositif d'analyse de posture utilisant un tel modèle

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102834843B (zh) * 2010-04-02 2016-11-16 诺基亚技术有限公司 用于面部检测的方法和装置
CN103888680B (zh) * 2014-03-28 2017-07-11 中国科学技术大学 一种摄像头曝光时间的调节方法
CN104318264B (zh) * 2014-10-14 2018-02-02 武汉科技大学 一种基于人眼优先拟合的人脸特征点跟踪方法
CN105868767B (zh) * 2015-01-19 2020-02-18 阿里巴巴集团控股有限公司 人脸特征点定位方法和装置
CN104966046B (zh) * 2015-05-20 2017-07-21 腾讯科技(深圳)有限公司 一种人脸关键点位定位结果的评估方法,及评估装置
CN105354531B (zh) * 2015-09-22 2019-05-21 成都通甲优博科技有限责任公司 一种面部关键点的标注方法
CN105718885B (zh) * 2016-01-20 2018-11-09 南京邮电大学 一种人脸特征点跟踪方法
CN105718913B (zh) * 2016-01-26 2018-11-02 浙江捷尚视觉科技股份有限公司 一种鲁棒的人脸特征点定位方法
CN105938551A (zh) * 2016-06-28 2016-09-14 深圳市唯特视科技有限公司 一种基于视频数据的人脸特定区域提取方法
CN106228113A (zh) * 2016-07-12 2016-12-14 电子科技大学 基于aam的人脸特征点快速对齐方法
CN106446766A (zh) * 2016-07-25 2017-02-22 浙江工业大学 一种视频中人脸特征点的稳定检测方法
CN106125941B (zh) * 2016-08-12 2023-03-10 东南大学 多设备切换控制装置及多设备控制系统
US10521892B2 (en) * 2016-08-31 2019-12-31 Adobe Inc. Image lighting transfer via multi-dimensional histogram matching
CN106548521A (zh) * 2016-11-24 2017-03-29 北京三体高创科技有限公司 一种联合2d+3d主动外观模型的人脸对齐方法及系统
US10860841B2 (en) * 2016-12-29 2020-12-08 Samsung Electronics Co., Ltd. Facial expression image processing method and apparatus
CN108961149B (zh) * 2017-05-27 2022-01-07 北京旷视科技有限公司 图像处理方法、装置和系统及存储介质
CN107403145B (zh) * 2017-07-14 2021-03-09 北京小米移动软件有限公司 图像特征点定位方法及装置
CN107578000B (zh) * 2017-08-25 2023-10-31 百度在线网络技术(北京)有限公司 用于处理图像的方法及装置
KR101977174B1 (ko) * 2017-09-13 2019-05-10 이재준 영상 분석 방법, 장치 및 컴퓨터 프로그램
KR101923405B1 (ko) * 2018-01-09 2018-11-29 전남대학교산학협력단 기하학적 변환이 적용된 aam을 이용한 사람의 얼굴 검출 및 모델링시스템
CN108765551B (zh) * 2018-05-15 2022-02-01 福建省天奕网络科技有限公司 一种实现3d模型捏脸的方法及终端
CN110738082B (zh) * 2018-07-20 2023-01-24 北京陌陌信息技术有限公司 人脸关键点的定位方法、装置、设备及介质
CN111259711A (zh) * 2018-12-03 2020-06-09 北京嘀嘀无限科技发展有限公司 一种识别唇动的方法和系统
CN110070083A (zh) * 2019-04-24 2019-07-30 深圳市微埃智能科技有限公司 图像处理方法、装置、电子设备和计算机可读存储介质
CN110472674B (zh) * 2019-07-31 2023-07-18 苏州中科全象智能科技有限公司 一种基于边缘和梯度特征的模板匹配算法
JP7579674B2 (ja) * 2019-11-07 2024-11-08 ハイパーコネクト リミテッド ライアビリティ カンパニー 画像変換装置及び方法、並びにコンピュータ読み取り可能な記録媒体
CN111932604B (zh) * 2020-08-24 2025-01-14 腾讯音乐娱乐科技(深圳)有限公司 人耳特征距离测量的方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1687957A (zh) * 2005-06-02 2005-10-26 上海交通大学 结合局部搜索和活动外观模型的人脸特征点定位方法
CN1731416A (zh) * 2005-08-04 2006-02-08 上海交通大学 快速且精确的人脸特征点定位方法
US20060133672A1 (en) * 2004-12-22 2006-06-22 Fuji Photo Film Co., Ltd. Image processing method, image processing apparatus, and computer readable medium, in which an image processing program is recorded
CN1794265A (zh) * 2005-12-31 2006-06-28 北京中星微电子有限公司 基于视频的面部表情识别方法及装置
CN101216882A (zh) * 2007-12-28 2008-07-09 北京中星微电子有限公司 一种人脸眼角与嘴角定位与跟踪的方法及装置
CN101339606A (zh) * 2008-08-14 2009-01-07 北京中星微电子有限公司 一种人脸关键器官外轮廓特征点定位与跟踪的方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774591A (en) * 1995-12-15 1998-06-30 Xerox Corporation Apparatus and method for recognizing facial expressions and facial gestures in a sequence of images
WO2006051607A1 (ja) * 2004-11-12 2006-05-18 Omron Corporation 顔特徴点検出装置、特徴点検出装置
US8488023B2 (en) * 2009-05-20 2013-07-16 DigitalOptics Corporation Europe Limited Identifying facial expressions in acquired digital images
US7643659B2 (en) * 2005-12-31 2010-01-05 Arcsoft, Inc. Facial feature detection on mobile devices
JP2010186288A (ja) * 2009-02-12 2010-08-26 Seiko Epson Corp 顔画像の所定のテクスチャー特徴量を変更する画像処理
JP5493676B2 (ja) * 2009-10-14 2014-05-14 富士通株式会社 眼位置認識装置
JP5702960B2 (ja) * 2010-07-12 2015-04-15 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060133672A1 (en) * 2004-12-22 2006-06-22 Fuji Photo Film Co., Ltd. Image processing method, image processing apparatus, and computer readable medium, in which an image processing program is recorded
CN1687957A (zh) * 2005-06-02 2005-10-26 上海交通大学 结合局部搜索和活动外观模型的人脸特征点定位方法
CN1731416A (zh) * 2005-08-04 2006-02-08 上海交通大学 快速且精确的人脸特征点定位方法
CN1794265A (zh) * 2005-12-31 2006-06-28 北京中星微电子有限公司 基于视频的面部表情识别方法及装置
CN101216882A (zh) * 2007-12-28 2008-07-09 北京中星微电子有限公司 一种人脸眼角与嘴角定位与跟踪的方法及装置
CN101339606A (zh) * 2008-08-14 2009-01-07 北京中星微电子有限公司 一种人脸关键器官外轮廓特征点定位与跟踪的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2863335A4 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3146504B1 (fr) * 2014-05-20 2021-03-10 Essilor International Procédé de construction d'un modèle du visage d'un individu, procédé et dispositif d'analyse de posture utilisant un tel modèle
CN109902635A (zh) * 2019-03-04 2019-06-18 司法鉴定科学研究院 一种基于示例图形的人像特征标识方法
CN109919081A (zh) * 2019-03-04 2019-06-21 司法鉴定科学研究院 一种自动化辅助人像特征标识方法

Also Published As

Publication number Publication date
EP2863335A4 (en) 2016-03-30
CN103632129A (zh) 2014-03-12
JP2015522200A (ja) 2015-08-03
US20150302240A1 (en) 2015-10-22
EP2863335A1 (en) 2015-04-22

Similar Documents

Publication Publication Date Title
WO2014032496A1 (zh) 一种人脸特征点定位方法、装置及存储介质
WO2018086607A1 (zh) 一种目标跟踪方法及电子设备、存储介质
CN108230383A (zh) 手部三维数据确定方法、装置及电子设备
CN110363047A (zh) 人脸识别的方法、装置、电子设备和存储介质
US11633235B2 (en) Hybrid hardware and computer vision-based tracking system and method
WO2022021029A1 (zh) 检测模型训练方法、装置、检测模型使用方法及存储介质
WO2015067084A1 (zh) 人眼定位方法和装置
WO2015165365A1 (zh) 一种人脸识别方法及系统
JP2007042072A (ja) 追跡装置
CN110647156B (zh) 基于目标物对接环的对接设备位姿调整方法、系统
JP2007283108A (ja) 画像の位置合わせを容易にするシステム及び方法
AU2017235896A1 (en) Registration of a magnetic tracking system with an imaging device
CN108428249A (zh) 一种基于光流跟踪和双几何模型的初始位姿估计方法
CN109993021A (zh) 人脸正脸检测方法、装置及电子设备
CN1892702B (zh) 追踪装置
CN113409287A (zh) 人脸图像质量的评估方法、装置、设备及存储介质
WO2020087322A1 (zh) 车道线识别方法和装置、车辆
CN111353325A (zh) 关键点检测模型训练方法及装置
WO2014205787A1 (zh) 一种基于混合图像模板的车辆检测方法
CN104166996A (zh) 一种基于边缘及颜色双特征空间直方图的人眼跟踪方法
CN104809465A (zh) 分类器训练方法、目标检测、分割或分类方法和装置
CN107808165B (zh) 一种基于susan角点检测的红外图像匹配方法
CN109993090A (zh) 基于级联回归森林和图像灰度特征的虹膜中心定位方法
WO2015131710A1 (zh) 人眼定位方法及装置
CN116051869B (zh) 融合ovr-svm和psnr相似度的图像标签匹配方法及系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13832559

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2013832559

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2015521969

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14417909

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE