WO2022042670A1

WO2022042670A1 - 基于眼部状态检测的图像处理方法、装置及存储介质

Info

Publication number: WO2022042670A1
Application number: PCT/CN2021/114881
Authority: WO
Inventors: 徐旺; 陈光辉; 许译天
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Beijing ByteDance Network Technology Co Ltd
Priority date: 2020-08-31
Filing date: 2021-08-27
Publication date: 2022-03-03
Anticipated expiration: 2023-02-28
Also published as: EP4206975A4; EP4206975B1; EP4206975A1; CN112036311A; JP7822369B2; JP2023540273A; US20230140313A1; US11842569B2

Abstract

本公开提供了一种基于眼部状态检测的图像处理方法、装置、设备及存储介质，所述方法包括：对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像，然后从中确定出该目标人脸对应的目标效果图像，最终将该目标效果图像合成到待处理图像集中的基准图像上，得到待处理图像集对应的目标图像。本公开基于眼部状态检测确定每张人脸的目标效果图像，然后将各个目标效果图像合成到基准图像上，能够提高目标图像中每张人脸眼部状态的效果，保证目标图像的质量，提高用户对目标图像的满意度。

Description

基于眼部状态检测的图像处理方法、装置及存储介质

本申请要求于2020年08月31日提交国家知识产权局、申请号为202010899317.9、申请名称为“基于眼部状态检测的图像处理方法、装置及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及图片数据处理领域，尤其涉及一种基于眼部状态检测的图像处理方法、装置、设备及存储介质。

背景技术

在拍摄照片时，拍摄得到的照片中人的眼部状态会出现不理想(例如“有人闭眼”)的问题，导致用户需要重拍，甚至反复重拍的情况。尤其是在多人拍摄合影时，更容易出现“有人闭眼”、“有人未注视镜头”等眼部状态不理想的问题，进而导致的反复重拍的情况，影响用户的拍摄体验。

目前，通常是用户基于反复拍摄得到的多张照片，人工选择出大多数人的眼部状态较为理想的照片作为最终的合影照片。而在选择出的合影照片中，一定程度上还会存在人的眼部状态不理想的问题，无法在合影照片中展现出本次拍摄过程中每个人最佳的眼部状态。因此，一定程度上降低了用户对最终的合影照片的满意度。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种基于眼部状态检测的图像处理方法、装置、设备及存储介质，能够改善合影照片中每个人的眼部状态效果，保证了合影照片的质量，提高了用户对最终的合影照片的满意度。

第一方面，本公开提供了一种基于眼部状态检测的图像处理方法，所述方法包括：

对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像；其中，所述待处理图像集包括连续的多帧图像，所述多帧图像中的每一帧图像包括至少一张人脸；

基于所述眼部状态符合预设条件的目标区域图像，确定所述目标人脸对应的目标效果图像；

将所述目标人脸对应的目标效果图像合成到所述待处理图像集中的基准图像上，得到所述待处理图像集对应的目标图像。

一种可选的实施方式中，所述预设条件包括眼睛开合程度值大于预设开合阈值。

一种可选的实施方式中，所述对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像，包括：

从待处理图像集中确定目标人脸的人脸图像；

对所述目标人脸的人脸图像进行眼部状态检测，得到所述目标人脸的人脸图像中眼部状态符合预设条件的人脸图像，作为目标区域图像。

一种可选的实施方式中，所述对所述目标人脸的人脸图像进行眼部状态检测，包括：

从所述目标人脸的人脸图像中提取所述目标人脸的人眼图像；

对所述目标人脸的人眼图像进行眼部状态检测。

从待处理图像集中确定目标人脸的人眼图像；

对所述目标人脸的人眼图像进行眼部状态检测，得到所述目标人脸的人眼图像中眼部状态符合预设条件的人眼图像，作为目标区域图像。

一种可选的实施方式中，所述对所述目标人脸的人眼图像进行眼部状态检测，包括：

确定所述目标人脸的人眼图像中的人眼关键点的位置信息；

基于所述人眼关键点的位置信息，确定所述人眼图像对应的眼部状态。

一种可选的实施方式中，所述确定所述目标人脸的人眼图像中的人眼关键点的位置信息，包括：

将所述目标人脸的人眼图像输入到第一模型中，得到所述人眼图像中的人眼关键点的位置信息；其中，所述第一模型是基于标记有人眼关键点的位置信息的人眼图像样本训练得到。

确定所述目标人脸的人眼图像中的人眼状态值；其中，所述人眼状态值包括睁眼状态值和闭眼状态值；

基于所述人眼状态值，确定所述人眼图像对应的眼部状态。

一种可选的实施方式中，所述确定所述目标人脸的人眼图像中的人眼状态值，包括：

将所述目标人脸的人眼图像输入至第二模型中，得到所述人眼图像中的人眼状态值；其中，所述第二模型是基于标记有人眼状态值的人眼图像样本训练得到。

一种可选的实施方式中，所述人眼图像对应的眼部状态基于人眼竖直方向睁开宽度与水平方向两个眼角距离的比例值确定；所述人眼竖直方向睁开宽度与水平方向两个眼角距离的比例值是基于所述人眼关键点的位置信息确定。

一种可选的实施方式中，所述对待处理图像集中目标人脸的眼部状态进行检测之前，还包括：

根据对快门键的触发操作，获取包括当前图像帧和以所述当前图像帧为结束帧的连续多帧预览图像，作为待处理图像集。

一种可选的实施方式中，所述将所述目标人脸对应的目标效果图像合成到所述待处理图像集中的基准图像上，得到所述待处理图像集对应的目标图像之前，还包括：

将所述待处理图像集中按下快门键对应的当前图像帧，确定为基准图像。

一种可选的实施方式中，所述基于所述眼部状态符合预设条件的目标区域图像，确定所述目标人脸对应的目标效果图像，包括：

将所述目标人脸的眼部状态符合预设条件的目标区域图像中，眼睛开合程度值最大的目标区域图像，确定为所述目标人脸对应的目标效果图像。

一种可选的实施方式中，所述从待处理图像集中确定目标人脸的人脸图像，包括：

对待处理图像集中的基准图像进行人脸检测，确定所述基准图像上各个人脸的位置信息；

根据所述人脸的位置信息，确定所述待处理图像集中的图像上与所述各个人脸中目标人脸的位置信息对应的人脸图像，作为所述目标人脸的人脸图像。

对待处理图像集中的每张图像进行人脸检测，得到人脸图像；

将相似度大于预设相似阈值的人脸图像，确定为目标人脸的人脸图像。

第二方面，本公开提供了一种基于眼部状态检测的图像处理装置，所述装置包括：

第一检测模块，用于对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像；其中，所述待处理图像集包括连续的多帧图像，所述多帧图像中的每一帧图像包括至少一张人脸；

第一确定模块，用于基于所述眼部状态符合预设条件的目标区域图像，确定所述目标人脸对应的目标效果图像；

合成模块，用于将所述目标人脸对应的目标效果图像合成到所述待处理图像集中的基准图像上，得到所述待处理图像集对应的目标图像。

第三方面，本公开提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现上述的方法。

第四方面，本公开提供了一种设备，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现上述的方法。

本公开提供的技术方案与现有技术相比具有如下优点：

本公开提供了一种基于眼部状态检测的图像处理方法，首先对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像，然后从眼部状态符合预设条件的目标区域图像中确定出该目标人脸对应的目标效果图像，最终将该目标效果图像合成到待处理图像集中的基准图像上，得到待处理图像集对应的目标图像。本公开通过对眼部状态进行检测，确定每张人脸的目标效果图像，然后将每张人脸的目标效果图像合成到基准图像中，能够提高最终得到的目标图像中每个人的眼部状态效果，提高了目标图像的质量，一定程度上提高了用户对目标图像的满意度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的一种基于眼部状态检测的图像处理方法的流程图；

图2为本公开实施例提供的一种人眼图像提取的示意图；

图3为本公开实施例提供的一种人眼图像中的人眼关键点的示意图；

图4为本公开实施例提供的另一种基于眼部状态检测的图像处理方法的流程图；

图5为本公开实施例提供的一种基于眼部状态检测的图像处理装置结构框图；

图6为本公开实施例提供的一种基于眼部状态检测的图像处理设备结构框图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

图像(例如合影照片)中人的眼部状态是评价一张图像质量的因素。以图像为合影照片为例，实际拍摄场景中，为了在合影照片中展示出本次拍摄过程中每个人最佳的眼部状态，通过反复多次重拍的方式拍摄多张合影照片，然后从多张合影照片中人工选择出理想的合影照片。

上述反复多次重拍的方式，不仅会降低人们的拍照体验，而且也不能保证重拍的合影照片中每个人的眼部状态较为理想，影响用户对合影照片的满意度。

为此，本公开提供了一种基于眼部状态检测的图像处理方法，首先对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像，然后从该眼部状态符合预设条件的目标区域图像中确定出该目标人脸对应的目标效果图像，最终将该目标效果图像合成到待处理图像集中的基准图像上，得到待处理图像集对应的目标图像。

基于上述拍照场景，本公开实施例提供的基于眼部状态检测的图像处理方法能够在拍摄合影照片之后，通过对合影照片中人的眼部状态进行检测，确定合影照片中每张人脸的目标效果图像，然后将该每张人脸的目标效果图像合成到原合影照片中，使得最终的合影照片上每个人的眼部状态效果较好，提高了合影照片的质量，提高了用户对合影照片的满意度。

基于此，本公开实施例提供了一种基于眼部状态检测的图像处理方法，参考图1，为本公开实施例提供的一种基于眼部状态检测的图像处理方法的流程图，该方法包括：

S101：对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像。

其中，该预设条件包括眼睛开合程序值大于预设开合阈值，所述待处理图像集包括连续的多帧图像，所述多帧图像中的每一帧图像包括至少一张人脸。

一种可选的实施方式中，在拍摄照片的场景下，当检测到对快门键的触发操作(例如按下快门键)时，获取包括当前图像帧和以当前图像帧为结束帧的连续多帧预览图像，作为连续的多帧图像，得到本公开实施例中的待处理图像集。

实际应用中，相机预览模式下，在相机预览界面中的预览图像是以preview预览流的形式进行存储的。本公开实施例在相机预览模式下，检测到按下快门键时，不仅获取当前图像帧，即相机拍摄的照片，还需要从已存储的preview预览流的预览图片中，获取最新的N帧预览图像。然后，将该最新的N帧预览图像与当前图像帧共同构成待处理图像集。通常待处理图像集中包括8帧图像或者16帧图像，本公开实施例不限制待处理图像集中的图像的个数。在另一些实施例中，待处理图像集中还可以包括更多帧图像。

另一种可选的实施方式中，在拍摄照片的场景下，如果当前模式为连拍模式，则在检测到按下快门键的触发操作时，获取连拍得到的多帧图像，作为连续的多帧图像，得到本公开实施例中的待处理图像集。

本公开实施例中，在获取到待处理图像集之后，对待处理图像集中目标人脸的眼部状态进行检测。目标人脸可以是待处理图像集中图像上多张人脸中的同一个人对应的人脸。

一种可选的实施方式中，对待处理图像集中目标人脸的眼部状态进行检测，可以包括：从待处理图像集中确定目标人脸的人脸图像，然后对该目标人脸的人脸图像进行眼部状态检测，得到该目标人脸的人脸图像中眼部状态符合预设条件的人脸图像，作为目标区域图像。

本公开实施例至少提供以下两种从待处理图像集中确定目标人脸的人脸图像的方法，以下分别介绍：

一种可选的实施方式中，对待处理图像集中的基准图像进行人脸检测，确定基准图像上各个人脸的位置信息。然后根据各个人脸的位置信息，确定待处理图像集中的图像上与该各个人脸中目标人脸的位置信息对应的人脸图像，作为该目标人脸的人脸图像。

实际应用中，由于在一次拍摄过程中，按下快门键对应的当前图像帧通常为本次拍摄中大多数人的眼部状态较佳的图像。因此，本公开实施例可以将待处理图像集中的按下快门键对应的当前图像帧，确定为基准图像。如此在该基准图像的基础上，确定各个人脸的位置信息，然后基于该各个人脸的位置信息进一步确定目标人脸对应的人脸图像，能够提高该目标人脸对应的人脸图像的准确性。

本公开实施例中，在确定待处理图像集中的基准图像之后，可以基于机器学习模型对基准图像进行人脸检测，以确定基准图像上每张人脸的位置信息。由于在一次拍摄过程中连拍的多帧图像上各个人脸的位置信息基本相同。因此，可以基于基准图像上确定的每张人脸的位置信息，进一步确定待处理图像集中其他图像上的目标人脸对应的人脸图像。可以理解的是，在待处理图像集中每张图像上的同一个位置的人脸图像属于同一个人的人脸图像。

其中，目标人脸的人脸图像可以为包括该目标人脸的最小矩形区域。该包括目标人脸的最小矩形区域可以基于目标人脸的位置信息确定。

另一种可选的实施方式中，还可以结合人脸检测和相似度计算的方式，从待处理图像集中确定目标人脸的人脸图像。具体的，对待处理图像集中的各个图像进行人脸检测，得到人脸图像。然后将相似度大于预设相似阈值的人脸图像，确定为目标人脸的人脸图像。

实际应用中，由于目标人脸的人脸图像的相似度较高，因此本公开实施例在确定待处理图像集中各个图像上的人脸图像之后，可以基于人脸图像的相似度确定目标人脸的人脸图像。具体的，将相似度大于预设相似阈值的人脸图像，确定为目标人脸的人脸图像。

本公开实施例中，在对人脸图像进行眼部状态检测的过程中，首先从人脸图像中提取人眼图像，然后对人眼图像进行眼部状态检测，完成对应的人脸图像的眼部状态检测。本公开实施例提供了一种对人眼图像进行眼部状态检测的方法，后续进行介绍。

在另一种可选实施方式中，对待处理图像集中目标人脸的眼部状态进行检测的过程中，可以从待处理图像集中确定目标人脸的人眼图像，然后对目标人脸的人眼图像进行眼部状态检测，得到目标人脸的人眼图像中眼部状态符合预设条件的人眼图像，作为目标区域图像。

实际应用中，可以利用机器学习模型对待处理图集中的基准图像进行人眼检测，以确定基准图像上的人眼的位置信息。然后可以基于基准图像上确定的人眼的位置信息，进一步确定待处理图像集中各个图像上的人眼对应的人眼图像。需要说明的是，在待处理图像集中每张图像上的同一个位置的人眼图像属于同一人的人眼图像。

其中，人眼图像可以为包括人眼的最小矩形区域。具体的，人眼图像可以为包括左眼的最小矩形区域，也可以为包括右眼的最小矩形区域，还可以为同时包括左眼和右眼的最小矩形区域。

另一种可选的实施方式中，还可以结合人眼检测和相似度计算的方式，从待处理图像集中确定目标人脸的人眼图像。具体的，对待处理图像集中的各个图像进行人眼检测，得到人眼图像。然后，将相似度大于预设相似阈值的人眼图像，确定为目标人脸的人眼图像。

本公开实施例中，在对待处理图像集中目标人脸的眼部状态进行检测之后，得到每张人脸的眼部状态符合预设条件的目标区域图像。其中，目标区域图像可以是人脸图像，也可以是人眼图像。

本公开实施例中，可以基于人眼图像中的人眼关键点的位置信息或者人眼状态值，或者人眼关键点的位置信息和人眼状态值的结合，确定该人眼图像对应的眼部状态。本公开实施例提供了一种确定人眼图像对应的眼部状态的具体实现方式，后续进行介绍。

S102：基于所述眼部状态符合预设条件的目标区域图像，确定所述目标人脸对应的目标效果图像。

实际应用中，理想的照片中每个人的眼部状态通常是睁眼状态，同时眼睛睁开的程度应该符合一定标准。因此，本公开实施例首先确定目标人脸的眼部状态符合预设条件的目标区域图像，然后基于确定的目标区域图像，进一步确定每张人脸对应的目标效果图像。其中，眼部状态符合预设条件可以指，眼睛开合程度值大于预设开合阈值。

一种可选的实施方式中，可以将目标人脸的目标区域图像中眼睛开合程度值最大的目标区域图像，确定为该目标人脸对应的目标效果图像，以提高目标图像中每张人脸的人眼睁开程度，进而提高用户对目标图像的满意度。

另一种可选的实施方式中，可以将目标人脸的目标区域图像中的任意一张目标区域图像，确定为该目标人脸对应的目标效果图像，以满足用户对目标图像中人脸的眼部状态效果的基本要求。

一种可选的实施方式中，如果确定基准图像上的某张人脸(例如第一张人脸)的眼部状态符合预设条件，则可以不针对该第一张人脸进行合成，以提高图像处理的效率。

S103：将所述目标人脸对应的目标效果图像合成到所述待处理图像集中的基准图像上，得到所述待处理图像集对应的目标图像。

本公开实施例中，在确定每张人脸对应的目标效果图像之后，将该目标效果图像合成到待处理图像集中基准图像上，进而得到待处理图像集对应的目标图像。

由于目标图像基于目标效果图像得到。因此，目标图像能够最大程度上提高图像上每个人的眼部状态的效果，从而提高了目标图像的质量，一定程度上提高了用户对目标图像的满意度。

一种可选的实施方式中，每张人脸对应的目标效果图像具有位置信息，基于该目标效果图像的位置信息将该目标效果图像合成到基准图像上的对应位置。

需要说明的是，本公开实施例中还可以将待处理图像集中的任一张图像确定为基准图像。本公开实施例不具体限定基准图像的确定方式，本领域技术人员可以根据实际需要进行选择。

本公开实施例提供的基于眼部状态检测的图像处理方法中，首先对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像，然后从眼部状态符合预设条件的目标区域图像中确定出该目标人脸对应的目标效果图像，最终，将该目标效果图像合成到待处理图像集中的基准图像上，得到待处理图像集对应的目标图像。本公开实施例通过对眼部状态进行检测，确定每张人脸的目标效果图像，然后每张人脸的目标效果图像合成到基准图像中，能够提高目标图像中每个人的眼部状态效果，提高了目标图像的质量，一定程度上提高了用户对目标图像的满意度。

本公开实施例提供的基于眼部状态检测的图像处理方法中，可以基于人眼关键点的位置信息，确定人眼图像对应的眼部状态。

一种可选的实施方式中，如图2所示，分别从8帧的人脸图像中提取到对应的人眼图像。然后，针对每一张人眼图像，确定该人眼图像中的人眼关键点的位置信息，接着基于人眼关键点的位置信息，确定该人眼图像对应的眼部状态。在一种实现方式中，将该目标人脸的人眼图像对应的眼部状态作为该目标人脸对应的人脸图像的眼部状态，其中，眼部状态可以利用眼睛开合程度值表示。

如图3所示，人眼关键点可以分别为眼部的左眼角关键点1、上眼睑上的关键点2和3、右眼角关键点4、下眼睑上的关键点5和6。在确定上述6个人眼关键点之后，基于各个人眼关键点的位置信息确定眼睛开合程度值。

一种可选的实施方式中，可以将图3中的关键点1到关键点4之间的距离作为水平方向两个眼角距离，以及将关键点2到关键6的距离与关键点3到关键5的距离的平均值，作为人眼竖直方向睁开宽度。然后将人眼竖直方向睁开宽度与水平方向两个眼角距离的比例值，确定为眼睛开合程度值。

一种可选的实施方式中，可以利用机器学习模型确定人眼关键点的位置信息。具体的，利用标记有人眼关键点的位置信息的人眼图像样本对第一模型进行训练，将人眼图像输入至训练后的第一模型中，经过第一模型的处理后，输出该人眼图像中的人眼关键点的位置信息。

另外，本公开实施例提供的基于眼部状态检测的图像处理方法中，还可以基于人眼状态值，确定人眼图像对应的眼部状态。其中，人眼状态值包括睁眼状态值和闭眼状态值。具体的，人眼状态值可以为[0,1]范围内的数值，人眼状态值的数值越大，说明眼部开合程度值越大；相反的，人眼状态值越小，说明眼部开合程度值越小。具体的，闭眼状态值可以为[0，0.5)范围内的数值，而睁眼状态值可以为[0.5，1]范围内的数值；在另一些实施例，闭眼状态值可以为[0，0.5]范围内的数值，而睁眼状态值可以为(0.5，1]范围内的数值。

一种可选的实施方式中，可以利用机器学习模型确定人眼状态值。具体的，利用基于标记有人眼状态值的人眼图像样本对第二模型进行训练，将人眼图像输入至训练后的第二模型中，经过第二模型的处理后，输出该人眼图像的人眼状态值。

本公开实施例中，可以通过人眼状态值确定人眼图像对应的眼部状态，并将目标人脸的人眼状态值最大的目标区域图像确定为目标效果图像。

为了提高眼部状态检测的准确率，本公开实施例可以结合人眼关键点的位置信息和人眼状态值，确定人脸图像对应的眼睛开合程度值，从而提高基于眼睛开合程度值确定得到的目标效果图像的准确率，进而提高目标图像的质量。

本公开实施例提供了一种基于眼部状态检测的图像处理方法，参考图4，为本公开实施例提供的另一种基于眼部状态检测的图像处理方法的流程图，该方法包括：

S401：基于待处理图像集确定属于目标人脸的人脸图像。

其中，所述待处理图像集中包括以按下快门键对应的当前图像帧为结束帧的连续多帧预览图像。

本公开实施例中的S401可以参照上述实施例的描述进行理解，在此不再赘述。

S402：从所述目标人脸图像中提取人眼图像。

参考图2，在确定属于目标人脸的人脸图像之后，基于确定的目标人脸的人脸图像，提取属于目标人脸的人眼图像。

一种可选的实施方式中，对人脸图像进行眼部检测，确定人脸图像中眼部的位置信息，然后基于眼部的位置信息，确定包含眼部的矩形框区域，并将该矩形框区域从人脸图像中提取出来。将该提取出的矩形区域对应的图像作为人眼图像。其中，眼部检测的方式不做过多说明。

实际应用中，考虑到人脸图像上的两只眼睛的眼部状态基本相同。因此，本公开实施例提取到的人眼图像可以仅包括人脸图像中的其中一只眼睛，从而提高图像处理的效率。

S403：确定所述人眼图像中人眼状态值和人眼关键点的位置信息。

本公开实施例中，在提取到人眼图像之后，确定人眼图像中人眼状态值和人眼关键点的位置信息。

一种可选的实施方式中，可以利用机器学习模型确定人眼状态值和人眼关键点的位置信息。具体的，利用基于标记有人眼关键点的位置信息和人眼状态值的人眼图像样本对第三模型进行训练，将人眼图像输入至训练后的第三模型中，经过第三模型的处理后，输出该人眼图像的人眼状态值和人眼关键点的位置信息。

S404：基于所述人眼状态值和所述人眼关键点的位置信息，确定所述人脸图像对应的眼睛开合程度值。

本公开实施例中，在确定所述人眼图像中人眼状态值和人眼关键点的位置信息之后，可以基于所述人眼关键点的位置信息，确定所述人脸图像上的人眼竖直方向睁开宽度与水平方向两个眼角距离的比例值。然后，结合所述人眼竖直方向睁开宽度与水平方向两个眼角距离的比例值和所述人眼状态值，确定所述人脸图像对应的眼睛开合程度值。

一种可选的实施方式中，参考图3，可以利用公式(1)计算人脸图像对应的眼睛开合程度值，其中，公式(1)如下：

其中，Open_Degree(OD)用于表示人脸图像对应的眼睛开合程度值；H_d用于表示图3中的关键点1和关键点4之间的欧式距离，V_d_1用于表示图3中的关键点2和关键点6之间的欧式距离，V_d_2用于表示图3中的关键点3和关键点5之间的欧式距离；round()用于表示对参数进行四舍五入取整，Eye_State用于表示人眼状态值，在[0,1]之间。

S405：从属于目标人脸的人脸图像中，确定眼睛开合程度值大于预设开合阈值的人脸图像。

本公开实施例中，在确定属于目标人脸的人脸图像之后，针对任意一张人脸的人脸图像，首先基于眼睛开合程度值，剔除闭眼状态的人脸图像。然后基于眼睛开合程度值剔除眼睛开合程度值低于或等于预设开合阈值的人脸图像。也可以根据眼睛开合程度值对剩余的人脸图像进行排序，确定开合程度值大于预设开合阈值的人脸图像。

一种可选的实施方式中，如果在某张人脸的人脸图像中不存在眼睛开合程度值大于预设开合阈值的人脸图像，则可以不对基准图像上该张人脸对应的人脸图像进行处理，保留基准图像中该张人脸的效果。

S406：从所述眼睛开合程度值大于预设开合阈值的人脸图像中，确定所述目标人脸对应的目标效果图像。

本公开实施例中，在确定出每张人脸的眼睛开合程度值大于预设开合阈值的人脸图像之后。该方法可以从目标人脸对应的人脸图像中，随机选择一张眼睛开合程度值大于预设开合阈值的人脸图像，将随机选择出的人脸图像作为该目标人脸对应的目标效果图像，以提高目标图像中该目标人脸上眼部状态效果。对于其他人脸对应的人脸图像，可以进行类似的处理，进而得到其他人脸对应的目标效果图像。

一种可选的实施方式中，由于眼睛开合程度值越大，说明眼睛睁开的程度越大，越能够体现最佳的眼部状态。因此，本公开实施例从眼睛开合程度值大于预设开合阈值的人脸图像中，选择眼睛开合程度值最大的人脸图像作为该目标人脸对应的目标效果图像，以最大化提高目标图像中该目标人脸上眼部状态的效果。

S407：将所述目标人脸对应的目标效果图像合成到所述待处理图像集中的基准图像上，得到所述待处理图像集对应的目标图像。

本公开实施例中，在确定每张人脸对应的目标效果图像之后，将各个目标效果图像均合成至基准图像中，最终得到待处理图像集对应的目标图像。

在多人拍摄场景中，基于本公开提供的基于眼部状态检测的图像处理方法，能够仅拍摄一次合影照片，即可使合影照片中尽可能多的人的眼部状态的效果较佳，无需反复多次重拍，提高了用户的合照拍摄体验，同时也能够为用户提供满意度较高的合影照片。

与上述方法实施例基于同一个发明构思，本公开还提供了一种基于眼部状态检测的图像处理装置，参考图5，为本公开实施例提供的一种基于眼部状态检测的图像处理装置，所述装置包括：

第一检测模块501，用于对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像；其中，所述待处理图像集包括连续的多帧图像，所述多帧图像中的每一帧图像包括至少一张人脸；

第一确定模块502，用于基于所述眼部状态符合预设条件的目标区域图像，确定所述目标人脸对应的目标效果图像；

合成模块503，用于将所述目标人脸对应的目标效果图像合成到所述待处理图像集中的预设基准图像上，得到所述待处理图像集对应的目标图像。

一种可选的实施方式中，所述第一检测模块，包括：

第一确定子模块，用于从待处理图像集中确定目标人脸的人脸图像；

第一检测子模块，用于对所述目标人脸的人脸图像进行眼部状态检测，得到所述目标人脸的人脸图像中眼部状态符合预设条件的人脸图像，作为目标区域图像。

一种可选的实施方式中，所述第一检测子模块，包括：

提取子模块，用于从所述目标人脸的人脸图像中提取所述目标人脸的人眼图像；

第二检测子模块，用于对所述目标人脸的人眼图像进行眼部状态检测。

一种可选的实施方式中，所述第一检测模块，包括：

第二确定子模块，用于从待处理图像集中确定目标人脸的人眼图像；

第三检测子模块，用于对所述目标人脸的人眼图像进行眼部状态检测，得到所述目标人脸的人眼图像中眼部状态符合预设条件的人眼图像，作为目标区域图像。

一种可选的实施方式中，所述第二检测模块或所述第三检测子模块，包括：

第三确定子模块，用于确定所述目标人脸的人眼图像中的人眼关键点的位置信息；

第四确定子模块，用于基于所述人眼关键点的位置信息，确定所述人眼图像对应的眼部状态。

一种可选的实施方式中，所述第三确定子模块，具体用于：

第五确定子模块，用于确定所述目标人脸的人眼图像中的人眼状态值；其中，所述人眼状态值包括睁眼状态值和闭眼状态值；

第六确定子模块，用于基于所述人眼状态值，确定所述人眼图像对应的眼部状态。

一种可选的实施方式中，所述第五确定子模块，具体用于：

一种可选的实施方式中，所述人眼图像对应的眼部状态基于人眼竖直方向睁开宽度与水平方向两个眼角距离的比例值确定；所述人眼竖直方向睁开宽度与水平方向两个眼角距离的比例值基于所述人眼关键点的位置信息确定。

一种可选的实施方式中，所述装置还包括：

获取模块，用于根据对快门键的触发操作，获取包括当前图像帧和以所述当前图像帧为结束帧的连续多帧预览图像，作为待处理图像集。

一种可选的实施方式中，所述装置还包括：

第二确定模块，用于将所述待处理图像集中按下快门键对应的当前图像帧，确定为基准图像。

一种可选的实施方式中，所述第一确定模块，具体用于：

一种可选的实施方式中，所述第一确定子模块，包括：

第七确定子模块，用于对待处理图像集中的基准图像进行人脸检测，确定所述基准图像上各个人脸的位置信息；

第八确定子模块，用于根据所述各个人脸的位置信息，确定所述待处理图像集中的图像上与所述各个人脸中目标人脸的位置信息对应的人脸图像，作为所述人脸的人脸图像。

一种可选的实施方式中，所述第一确定子模块，包括：

第四检测子模块，用于分别对待处理图像集中的每张图像进行人脸检测，得到人脸图像；

第九确定子模块，用于将相似度大于预设相似阈值的人脸图像，确定为目标人脸的人脸图像。

本公开实施例提供的基于眼部状态检测的图像处理装置中，对待处理图像集中目标人脸的眼部状态进行检测，得到所述目标人脸的眼部状态符合预设条件的目标区域图像，然后从眼部状态符合预设条件的目标区域图像中确定出该人脸对应的目标效果图像，最终将该目标效果图像合成到待处理图像集中的基准图像上，得到待处理图像集对应的目标图像。本公开实施例通过对眼部状态进行检测，确定每张人脸的目标效果图像，然后将每张人脸的目标效果图像合成到基准图像中，能够提高最终得到的目标图像中每个人的眼部状态效果，提高了目标图像的质量，一定程度上提高了用户对目标图像的满意度。

另外，本公开实施例还提供了一种基于眼部状态检测的图像处理设备，参见图6所示，可以包括：

处理器601、存储器602、输入装置603和输出装置604。基于眼部状态检测的图像处理设备中的处理器601的数量可以一个或多个，图6中以一个处理器为例。在本公开的一些实施例中，处理器601、存储器602、输入装置603和输出装置604可通过总线或其它方式连接，其中，图6中以通过总线连接为例。

存储器602可用于存储软件程序以及模块，处理器601通过运行存储在存储器602的软件程序以及模块，从而执行基于眼部状态检测的图像处理设备的各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外，存储器602可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置603可用于接收输入的数字或字符信息，以及产生与基于眼部状态检测的图像处理设备的用户设置以及功能控制有关的信号输入。

具体在本实施例中，处理器601会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中，并由处理器601来运行存储在存储器602中的应用程序，从而实现上述基于眼部状态检测的图像处理设备的各种功能。

本公开实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现上述的方法。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种基于眼部状态检测的图像处理方法，其特征在于，所述方法包括：

对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像；其中，所述待处理图像集包括连续的多帧图像，所述多帧图像中的每一帧图像包括至少一张人脸；

基于所述眼部状态符合预设条件的目标区域图像，确定所述目标人脸对应的目标效果图像；

将所述目标人脸对应的目标效果图像合成到所述待处理图像集中的基准图像上，得到所述待处理图像集对应的目标图像。
根据权利要求1所述的方法，其特征在于，所述预设条件包括眼睛开合程度值大于预设开合阈值。
根据权利要求1所述的方法，其特征在于，所述对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像，包括：

从待处理图像集中确定目标人脸的人脸图像；

对所述目标人脸的人脸图像进行眼部状态检测，得到所述目标人脸的人脸图像中眼部状态符合预设条件的人脸图像，作为目标区域图像。
根据权利要求3所述的方法，其特征在于，所述对所述目标人脸的人脸图像进行眼部状态检测，包括：

从所述目标人脸的人脸图像中提取所述目标人脸的人眼图像；

对所述目标人脸的人眼图像进行眼部状态检测。
根据权利要求1所述的方法，其特征在于，所述对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像，包括：

从待处理图像集中确定目标人脸的人眼图像；

对所述目标人脸的人眼图像进行眼部状态检测，得到所述目标人脸的人眼图像中眼部状态符合预设条件的人眼图像，作为目标区域图像。
根据权利要求4或5所述的方法，其特征在于，所述对所述目标人脸的人眼图像进行眼部状态检测，包括：

确定所述目标人脸的人眼图像中的人眼关键点的位置信息；

基于所述人眼关键点的位置信息，确定所述人眼图像对应的眼部状态。
根据权利要求6所述的方法，其特征在于，所述确定所述目标人脸的人眼图像中的人眼关键点的位置信息，包括：

将所述目标人脸的人眼图像输入到第一模型中，得到所述人眼图像中的人眼关键点的位置信息；其中，所述第一模型是基于标记有人眼关键点的位置信息的人眼图像样本训练得到。
根据权利要求4或5所述的方法，其特征在于，所述对所述目标人脸的人眼图像进行眼部状态检测，包括：

确定所述目标人脸的人眼图像中的人眼状态值；其中，所述人眼状态值包括睁眼状态值和闭眼状态值；

基于所述人眼状态值，确定所述人眼图像对应的眼部状态。
根据权利要求8所述的方法，其特征在于，所述确定所述目标人脸的人眼图像中的人眼状态值，包括：

将所述目标人脸的人眼图像输入至第二模型中，得到所述人眼图像中的人眼状态值；其中，所述第二模型是基于标记有人眼状态值的人眼图像样本训练得到。
根据权利要求7所述的方法，其特征在于，所述人眼图像对应的眼部状态基于人眼竖直方向睁开宽度与水平方向两个眼角距离的比例值确定；所述人眼竖直方向睁开宽度与水平方向两个眼角距离的比例值基于所述人眼关键点的位置信息确定。
根据权利要求1所述的方法，其特征在于，所述对待处理图像集中目标人脸的眼部状态进行检测之前，还包括：

根据对快门键的触发操作，获取包括当前图像帧和以所述当前图像帧为结束帧的连续多帧预览图像，作为待处理图像集。
根据权利要求1所述的方法，其特征在于，所述将所述目标人脸对应的目标效果图像合成到所述待处理图像集中的基准图像上，得到所述待处理图像集对应的目标图像之前，还包括：

将所述待处理图像集中按下快门键对应的当前图像帧，确定为基准图像。
根据权利要求1所述的方法，其特征在于，所述基于所述眼部状态符合预设条件的目标区域图像，确定所述目标人脸对应的目标效果图像，包括：

将所述目标人脸的眼部状态符合预设条件的目标区域图像中，眼睛开合程度值最大的目标区域图像，确定为所述目标人脸对应的目标效果图像。
根据权利要求3所述的方法，其特征在于，所述从待处理图像集中确定目标人脸的人脸图像，包括：

对待处理图像集中的基准图像进行人脸检测，确定所述基准图像上各个人脸的位置信息；

根据所述各个人脸的位置信息，确定所述待处理图像集中的图像上与所述各个人脸中目标人脸的位置信息对应的人脸图像，作为所述目标人脸的人脸图像。
根据权利要求3所述的方法，其特征在于，所述从待处理图像集中确定目标人脸的人脸图像，包括：

对待处理图像集中的每张图像进行人脸检测，得到人脸图像；

将相似度大于预设相似阈值的人脸图像，确定为目标人脸的人脸图像。
一种基于眼部状态检测的图像处理装置，其特征在于，所述装置包括：

第一检测模块，用于对待处理图像集中目标人脸的眼部状态进行检测，得到所述眼部状态符合预设条件的目标区域图像；其中，所述待处理图像集包括连续的多帧图像，所述多帧图像中的每一帧图像包括至少一张人脸；

第一确定模块，用于基于所述眼部状态符合预设条件的目标区域图像，确定所述目标人脸对应的目标效果图像；

合成模块，用于将所述目标人脸对应的目标效果图像合成到所述待处理图像集中的基准图像上，得到所述待处理图像集对应的目标图像。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现如权利要求1-15任一项所述的方法。
一种设备，其特征在于，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-15任一项所述的方法。