WO2019214201A1

WO2019214201A1 - 活体检测方法及装置、系统、电子设备、存储介质

Info

Publication number: WO2019214201A1
Application number: PCT/CN2018/115499
Authority: WO
Inventors: 杨凯; 暴天鹏; 张瑞; 吴立威
Original assignee: Beijing Sensetime Technology Development Co Ltd
Current assignee: Beijing Sensetime Technology Development Co Ltd
Priority date: 2018-05-10
Filing date: 2018-11-14
Publication date: 2019-11-14
Anticipated expiration: 2020-11-10
Also published as: JP2020522764A; EP3584745A1; US20190347823A1; CN108764069B; JP6852150B2; CN108764069A; EP3584745A4; KR20190129826A; US10930010B2

Abstract

本公开实施例涉及活体检测方法及装置、设备、存储介质。该方法包括：获取第一传感器感测到的目标对象的深度信息和第二传感器感测到的目标图像；对所述目标图像进行关键点检测，得到所述目标对象的关键点信息；基于所述目标对象的深度信息和所述目标对象的关键点信息，得到所述目标对象的活体检测结果。

Description

活体检测方法及装置、系统、电子设备、存储介质

相关申请的交叉引用

本申请基于申请号为201810444105.4、申请日为2018年05月10日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此以全文引入的方式引入本申请。

技术领域

本公开涉及计算机视觉技术领域，尤其涉及一种活体检测方法及装置、系统、电子设备、存储介质。

背景技术

目前，人脸识别技术已被广泛应用于人脸解锁、人脸支付、无人超市和视频监控等场景中。然而，人脸识别技术存在容易被人脸的实体照片、人脸的电子照片或者包含人脸的视频等形式的假体人脸攻击的风险。因此，活体检测是人脸识别中必不可少的一个环节。

发明内容

有鉴于此，本公开实施例提出了一种活体检测方法及装置。

根据本公开实施例的一方面，提供了一种活体检测方法，包括：获取第一传感器感测到的目标对象的深度信息和第二传感器感测到的目标图像；对所述目标图像进行关键点检测，得到所述目标对象的关键点信息；基于所述目标对象的深度信息和所述目标对象的关键点信息，得到所述目标对象的活体检测结果。

在一些实施例中，所述目标对象为人脸。

在一些实施例中，所述第二传感器为图像传感器，例如，所述第二传感器为RGB传感器或者近红外传感器。

在一些实施例中，所述第一传感器为深度传感器，例如，所述第一传感器为飞行时间TOF传感器或结构光传感器。

在一些实施例中，第一传感器和所述第二传感器集成在同一器件中，例如集成在3D摄像头中。

在一些实施例中，在对所述目标图像进行关键点检测之前，所述方法还包括：

根据所述第一传感器的参数以及所述第二传感器的参数，对齐所述目标对象的深度信息和所述目标图像。

在一些实施例中，基于所述目标对象的深度信息和所述目标对象的关键点信息，得到所述目标对象的活体检测结果，包括：

基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息；

基于所述目标对象的关键点信息，得到第二特征信息；

基于所述第一特征信息和所述第二特征信息，确定所述目标对象的活体检测结果。

在一些实施例中，基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息，包括：将所述目标对象的深度信息和所述目标对象的关键点信息输入第一神经网络进行处理，得到第一特征信息；

基于所述目标对象的关键点信息，得到第二特征信息，包括：将所述目标图像和所述目标对象的关键点信息输入第二神经网络进行处理，得到第二特征信息。

在一些实施例中，所述第一神经网络和所述第二神经网络具有相同的网络结构。

在一些实施例中，基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息，包括：对所述目标对象的深度信息和所述目标对象的关键点信息进行卷积处理，得到第一卷积结果；对所述第一卷积结果进行下采样处理，得到第一下采样结果；基于所述第一下采样结果，得到第一特征信息。

在一些实施例中，基于所述目标对象的关键点信息，得到第二特征信息，包括：

对所述目标图像和所述目标对象的关键点信息进行卷积处理，得到第二卷积结果；

对所述第二卷积结果进行下采样处理，得到第二下采样结果；

基于所述第二下采样结果，得到第二特征信息。

在一些实施例中，基于所述第一特征信息和所述第二特征信息，确定所述目标对象的活体检测结果，包括：对所述第一特征信息和所述第二特征信息进行融合处理，得到第三特征信息；根据所述第三特征信息，确定所述目标对象的活体检测结果。

在一些实施例中，根据所述第三特征信息，确定活体检测结果，包括：

基于所述第三特征信息，得到所述目标对象为活体的概率；

根据所述目标对象为活体的概率，确定所述目标对象的活体检测结果。

根据本公开实施例的另一方面，提供了一种活体检测装置，包括：

获取模块，配置为获取第一传感器感测到的目标对象的深度信息和第二传感器感测到的目标图像；

检测模块，配置为对所述目标图像进行关键点检测，得到所述目标对象的关键点信息；

确定模块，配置为基于所述目标对象的深度信息和所述目标对象的关键点信息，得到所述目标对象的活体检测结果。

在一些实施例中，所述目标对象为人脸。

在一些实施例中，所述装置还包括：对齐模块，配置为根据所述第一传感器的参数以及所述第二传感器的参数，对齐所述目标对象的深度信息和所述目标图像。

在一些实施例中，所述确定模块包括：第一确定子模块，配置为基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息；第二确定子模块，配置为基于所述目标对象的关键点信息，得到第二特征信息；第三确定子模块，配置为基于所述第一特征信息和所述第二特征信息，确定所述目标对象的活体检测结果。

在一些实施例中，所述第一确定子模块配置为：将所述目标对象的深度信息和所述目标对象的关键点信息输入第一神经网络进行处理，得到第一特征信息；

所述第二确定子模块配置为：将所述目标图像和所述目标对象的关键点信息输入第二神经网络进行处理，得到第二特征信息。

在一些实施例中，所述第一确定子模块包括：第一卷积单元，配置为对所述目标对象的深度信息和所述目标对象的关键点信息进行卷积处理，得到第一卷积结果；第一下采样单元，配置为对所述第一卷积结果进行下采样处理，得到第一下采样结果；第一确定单元，配置为基于所述第一下采样结果，得到第一特征信息。

在一些实施例中，所述第二确定子模块包括：第二卷积单元，配置为对所述目标图像和所述目标对象的关键点信息进行卷积处理，得到第二卷积结果；第二下采样单元，配置为对所述第二卷积结果进行下采样处理，得到第二下采样结果；第二确定单元，配置为基于所述第二下采样结果，得到第二特征信息。

在一些实施例中，所述第三确定子模块包括：全连接单元，配置为对所述第一特征信息和所述第二特征信息进行融合处理，得到第三特征信息；第三确定单元，配置为根据所述第三特征信息，确定所述目标对象的活体检测结果。

在一些实施例中，所述第三确定单元包括：第一确定子单元，配置为基于所述第三特征信息，得到所述目标对象为活体的概率；第二确定子单元，配置为根据所述目标对象为活体的概率，确定所述目标对象的活体检测结果。

本公开实施例提供的活体检测装置用于执行上述任意实施例中的活体检测方法，包括用于执行上述任意可能的活体检测方法的步骤和/或流程的模块和单元。

根据本公开实施例的另一方面，提供了一种活体检测装置，包括：处理器；配置为存储处理器可执行指令的存储器；其中，所述处理器被配置为执行上述方法。

根据本公开实施例的另一方面，提供了一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其中，所述计算机程序指令被处理器执行时实现上述方法。

根据本公开实施例的另一方面，提供了一种活体检测系统，包括：上述的活体检测装置、所述第一传感器和所述第二传感器。

根据本公开实施例的另一方面，提供了一种活体检测系统，包括：上述的非易失性计算机可读存储介质、所述第一传感器和所述第二传感器。

根据本公开实施例的另一方面，提供了一种电子设备，包括：

第一传感器，配置为检测目标对象的深度信息；

第二传感器，配置为采集包括所述目标对象的目标图像；

处理器，配置为对所述第二传感器采集到的目标对象进行关键点检测，得到所述目标对象的关键点信息，并基于所述第一传感器检测到的所述目标对象的深度信息和所述目标对象的关键点信息，得到所述目标对象的活体检测结果。

在一些实施例中，所述第二传感器为RGB传感器或者近红外传感器。

在一些实施例中，所述第一传感器为飞行时间TOF传感器或结构光传感器。

在一些实施例中，所述处理器还配置为：根据所述第一传感器的参数以及所述第二传感器的参数，对齐所述目标对象的深度信息和所述目标图像。

在一些实施例中，所述处理器配置为：基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息；基于所述目标对象的关键点信息，得到第二特征信息；基于所述第一特征信息和所述第二特征信息，确定所述目标对象的活体检测结果。

在一些实施例中，所述处理器配置为：将所述目标对象的深度信息和所述目标对象的关键点信息输入第一神经网络进行处理，得到第一特征信息；

在一些实施例中，所述处理器配置为：对所述目标对象的深度信息和所述目标对象的关键点信息进行卷积处理，得到第一卷积结果；对所述第一卷积结果进行下采样处理，得到第一下采样结果；基于所述第一下采样结果，得到第一特征信息。

在一些实施例中，所述处理器配置为：对所述目标图像和所述目标对象的关键点信息进行卷积处理，得到第二卷积结果；对所述第二卷积结果进行下采样处理，得到第二下采样结果；基于所述第二下采样结果，得到第二特征信息。

在一些实施例中，所述处理器配置为：对所述第一特征信息和所述第二特征信息进行融合处理，得到第三特征信息；根据所述第三特征信息，确定所述目标对象的活体检测结果。

在一些实施例中，所述处理器配置为：基于所述第三特征信息，得到所述目标对象为活体的概率；根据所述目标对象为活体的概率，确定所述目标对象的活体检测结果。

本公开的各方面的活体检测方法通过结合目标对象的深度信息和目标图像进行活体检测，由此能够利用目标对象的深度信息和目标图像中的目标对象的关键点信息进行活体检测，从而能够提高活体检测的准确性。根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面，并且用于解释本公开的原理。

图1示出根据本公开实施例的活体检测方法的流程图。

图2示出根据本公开实施例的活体检测方法的一示例性的流程图。

图3示出根据本公开实施例的活体检测方法步骤S13的一示例性的流程图。

图4A示出根据本公开实施例应用于人脸的活体检测装置的框图。

图4B示出根据本公开实施例的图4A中的数据预处理模块的框图。

图4C示出根据本公开实施例的图4A中的深度神经网络模块的框图。

图5示出根据本公开实施例的活体检测方法步骤S131的一示例性的流程图。

图6示出根据本公开实施例的活体检测方法步骤S132的一示例性的流程图。

图7示出根据本公开实施例的活体检测方法步骤S133的一示例性的流程图。

图8示出根据本公开实施例的活体检测方法步骤S1332的一示例性的流程图。

图9示出根据本公开实施例的活体检测装置的框图。

图10示出根据本公开实施例的活体检测装置的一示例性的框图。

图11是根据一示例性实施例示出的一种活体检测装置800的框图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。另外，为了更好的说明本公开，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本公开实施例同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本公开实施例的主旨。

图1示出根据本公开实施例的活体检测方法的流程图。该方法可以应用于手机、平板电脑、数码相机或者门禁设备等具有人脸识别功能的终端设备中。该方法可以应用于人脸解锁、人脸支付、无人超市和视频监控等场景中。如图1所示，该方法包括步骤S11至步骤S13。

在步骤S11中，获取第一传感器感测到的目标对象的深度信息和第二传感器感测到的目标图像。

在一些实施例中，目标对象为人脸。在一些实施例中，第一传感器为三维传感器。例如，第一传感器可以为ToF(Time of Flight，飞行时间)传感器、结构光传感器、双目传感器或者其他类型的深度传感器。通过三维传感器获取目标对象的深度信息，可以获得高精度的深度信息。本公开实施例利用包含目标对象的深度信息进行活体检测，能够充分挖掘目标对象的深度信息，从而能够提高活体检测的准确性。例如，当目标对象为人脸时，本公开实施例利用包含人脸的深度信息进行活体检测，能够充分挖掘人脸数据的深度信息，从而能够提高活体人脸检测的准确性。

需要说明的是，尽管以ToF传感器、结构光传感器和双目传感器介绍了第一传感器如上，但本领域技术人员能够理解，本公开实施例应不限于此。本领域技术人员可以根据实际应用场景需求和/或个人喜好灵活选择第一传感器的类型，只要能够通过第一传感器感测到目标对象的深度信息即可。

在本公开实施例中，目标对象的深度信息可以为任意能够体现目标对象的深度的信息，本公开实施例对目标对象的深度信息的具体实现不做限定。在一些实施例中，目标对象的深度信息可以为目标对象的深度图像。在另一些实施例中，目标对象的深度信息可以为目标对象的点云。其中，目标对象的点云可以记录目标对象的各个点的三维坐标。在另一些实施例中，目标对象的深度信息可以为记录目标对象的各个点的深度的表格或其他类型的文件。

在一些实施例中，第二传感器可以为RGB(Red，红；Green，绿；Blue，蓝)传感器或者近红外传感器。若第二传感器为RGB传感器或其他类型的图像传感器，则第二传感器感测到的目标图像为RGB图像。若第二传感器为近红外传感器，则第二传感器感测到的目标图像为近红外图像。其中，近红外图像可以为带光斑的近红外图像，也可以为不带光斑的近红外图像，等等。需要说明的是，尽管以RGB传感器和近红外传感器介绍了第二传感器如上，但本领域技术人员能够理解，本公开实施例应不限于此。本领域技术人员可以根据实际应用场景需求和/或个人喜好灵活选择第二传感器的类型，只要能通过第二传感器感测到的目标图像获取目标对象的关键点信息即可。

在一些实施例中，通过3D摄像头采集深度图和目标图像，其中，3D摄像头包括用于采集图像的图像传感器和用于采集深度信息的深度传感器。例如，终端设备通过自身设置的3D摄像头采集目标对象的三维信息。在另一些实施例中，从其他设备处获取深度信息和目标图像，例如，接收终端设备发送的活体检测请求，所述活体检测请求携带所述深度信息和目标图像。

在步骤S12中，对目标图像进行关键点检测，得到目标对象的关键点信息。

其中，目标对象的关键点信息可以包括目标对象的关键点的位置信息。

在本公开实施例中，若目标对象为人脸，则目标对象的关键点可以包括眼睛关键点、眉毛关键点、鼻子关键点、嘴巴关键点和人脸轮廓关键点等中的一项或多项。其中，眼睛关键点可以包括眼睛轮廓关键点、眼角关键点和瞳孔关键点等中的一项或多项。

在步骤S13中，基于目标对象的深度信息和目标对象的关键点信息，得到目标对象的活体检测结果。

其中，目标对象的活体检测结果可以为目标对象为活体或者目标对象为假体，例如目标对象的活体检测结果可以为目标对象为活体人脸或者目标对象为假体人脸。

本公开实施例通过结合目标对象的深度信息和目标图像进行活体检测，由此能够利用目标对象的深度信息和目标图像中的目标对象的关键点信息进行活体检测，从而能够提高活体检测的准确性。

图2示出根据本公开实施例的活体检测方法的一示例性的流程图。如图2所示，该方法可以包括步骤S21至步骤S24。

在步骤S21中，获取第一传感器感测到的目标对象的深度信息和第二传感器感测到的目标图像。其中，对步骤S21参见上文对步骤S11的描述。在步骤S22中，根据第一传感器的参数以及第二传感器的参数，对齐目标对象的深度信息和目标图像。

在一些实施例中，可以对目标图像的深度信息进行转换处理，以使得转换处理后的深度信息和目标图像对齐。例如，若目标对象的深度信息为目标对象的深度图像，则根据第一传感器的参数矩阵和第二传感器的参数矩阵，确定第一传感器的参数矩阵至第二传感器的参数矩阵的转换矩阵；根据该转换矩阵，转换目标对象的深度图像。

在另一些实施例中，可以对目标图像进行转换处理，以使得转换处理后的目标图像与深度信息对齐。例如，若目标对象的深度信息为目标对象的深度图像，则根据第一传感器的参数矩阵和第二传感器的参数矩阵，确定第二传感器的参数矩阵至第一传感器的参数矩阵的转换矩阵；根据该转换矩阵，转换目标图像。

在本公开实施例中，第一传感器的参数可以包括第一传感器的内参数和/或外参数，第二传感器的参数可以包括第二传感器的内参数和/或外参数。

在本公开实施例中，当目标对象的深度信息为目标对象的深度图像时，通过对齐目标对象的深度信息和目标图像，能够使目标对象的深度图像和目标图像中相应的部分在两个图像中的位置相同。

在步骤S23中，对目标图像进行关键点检测，得到目标对象的关键点信息。其中，对步骤S23参见上文对步骤S12的描述。

在步骤S24中，基于目标对象的深度信息和目标对象的关键点信息，得到目标对象的活体检测结果。其中，对步骤S24参见上文对步骤S13的描述。

图3示出根据本公开实施例的活体检测方法步骤S13的一示例性的流程图。如图3所示，步骤S13可以包括步骤S131至步骤S133。

在步骤S131中，基于目标对象的深度信息和目标对象的关键点信息，得到第一特征信息。

在一些实施例中，基于目标对象的深度信息和目标对象的关键点信息，得到第一特征信息，包括：将目标对象的深度信息和目标对象的关键点信息输入第一神经网络进行处理，得到第一特征信息。作为该实现方式的一个示例，第一神经网络可以包括卷积层、下采样层和全连接层。例如，第一神经网络可以包括一级卷积层、一级下采样层和一级全连接层。其中，该级卷积层可以包括一个或多个卷积层，该级下采样层可以包括一个或多个下采样层，该级全连接层可以包括一个或多个全连接层。又如，第一神经网络可以包括多级卷积层、多级下采样层和一级全连接层。其中，每级卷积层可以包括一个或多个卷积层，每级下采样层可以包括一个或多个下采样层，该级全连接层可以包括一个或多个全连接层。其中，第i级卷积层后级联第i级下采样层，第i级下采样层后级联第i+1级卷积层，第n级下采样层后级联全连接层，其中，i和n均为正整数，1≤i≤n，n表示第一神经网络中卷积层和下采样层的级数。

作为该实现方式的另一个示例，第一神经网络可以包括卷积层、下采样层、归一化层和全连接层。例如，第一神经网络可以包括一级卷积层、一个归一化层、一级下采样层和一级全连接层。其中，该级卷积层可以包括一个或多个卷积层，该级下采样层可以包括一个或多个下采样层，该级全连接层可以包括一个或多个全连接层。

又如，第一神经网络可以包括多级卷积层、多个归一化层和多级下采样层和一级全连接层。其中，每级卷积层可以包括一个或多个卷积层，每级下采样层可以包括一个或多个下采样层，该级全连接层可以包括一个或多个全连接层。其中，第i级卷积层后级联第i个归一化层，第i个归一化层后级联第i级下采样层，第i级下采样层后级联第i+1级卷积层，第n级下采样层后级联全连接层，其中，i和n均为正整数，1≤i≤n，n表示第一神经网络中卷积层、下采样层的级数和归一化层的个数。

在步骤S132中，基于目标对象的关键点信息，得到第二特征信息。

在一些实施例中，基于目标对象的关键点信息，得到第二特征信息，包括：将目标图像和目标对象的关键点信息输入第二神经网络进行处理，得到第二特征信息。

作为该实现方式的一个示例，第二神经网络可以包括卷积层、下采样层和全连接层。

例如，第二神经网络可以包括一级卷积层、一级下采样层和一级全连接层。其中，该级卷积层可以包括一个或多个卷积层，该级下采样层可以包括一个或多个下采样层，该级全连接层可以包括一个或多个全连接层。又如，第二神经网络可以包括多级卷积层、多级下采样层和一级全连接层。其中，每级卷积层可以包括一个或多个卷积层，每级下采样层可以包括一个或多个下采样层，该级全连接层可以包括一个或多个全连接层。其中，第j级卷积层后级联第j级下采样层，第j级下采样层后级联第j+1级卷积层，第m级下采样层后级联全连接层，其中，j和m均为正整数，1≤j≤m，m表示第二神经网络中卷积层和下采样层的级数。

作为该实现方式的另一个示例，第二神经网络可以包括卷积层、下采样层、归一化层和全连接层。例如，第二神经网络可以包括一级卷积层、一个归一化层、一级下采样层和一级全连接层。其中，该级卷积层可以包括一个或多个卷积层，该级下采样层可以包括一个或多个下采样层，该级全连接层可以包括一个或多个全连接层。又如，第二神经网络可以包括多级卷积层、多个归一化层和多级下采样层和一级全连接层。其中，每级卷积层可以包括一个或多个卷积层，每级下采样层可以包括一个或多个下采样层，该级全连接层可以包括一个或多个全连接层。其中，第j级卷积层后级联第j个归一化层，第j个归一化层后级联第j级下采样层，第j级下采样层后级联第j+1级卷积层，第m级下采样层后级联全连接层，其中，j和m均为正整数，1≤j≤m，m表示第二神经网络中卷积层、下采样层的级数和归一化层的个数。

在一些实施例中，第一神经网络和第二神经网络具有相同的网络结构。

在步骤S133中，基于第一特征信息和第二特征信息，确定目标对象的活体检测结果。

需要说明的是，本公开实施例不对步骤S131和步骤S132执行的先后顺序进行限定，只要步骤S131和步骤S132在步骤S133之前执行即可。例如，可以先执行步骤S131 再执行步骤S132，或者可以先执行步骤S132再执行步骤S131，或者可以同时执行步骤S131和步骤S132。

图5示出根据本公开实施例的活体检测方法步骤S131的一示例性的流程图。如图5所示，步骤S131可以包括步骤S1311至步骤S1313。

在步骤S1311中，对目标对象的深度信息和目标对象的关键点信息进行卷积处理，得到第一卷积结果。

在步骤S1312中，对第一卷积结果进行下采样处理，得到第一下采样结果。

在一些实施例中，可以通过一级卷积层和一级下采样层对目标对象的深度信息和目标对象的关键点信息进行卷积处理和下采样处理。其中，其中，该级卷积层可以包括一个或多个卷积层，该级下采样层可以包括一个或多个下采样层。

在另一种可能的实现方式中，可以通过多级卷积层和多级下采样层对目标对象的深度信息和目标对象的关键点信息进行卷积处理和下采样处理。其中，每级卷积层可以包括一个或多个卷积层，每级下采样层可以包括一个或多个下采样层。

在一些实施例中，对第一卷积结果进行下采样处理，得到第一下采样结果，可以包括：对第一卷积结果进行归一化处理，得到第一归一化结果；对第一归一化结果进行下采样处理，得到第一下采样结果。

在步骤S1313中，基于第一下采样结果，得到第一特征信息。

在一些实施例中，可以将第一下采样结果输入全连接层，通过全连接层对第一下采样结果进行融合处理(例如全连接运算)，得到第一特征信息。

图6示出根据本公开实施例的活体检测方法步骤S132的一示例性的流程图。如图6所示，步骤S132可以包括步骤S1321至步骤S1323。

在步骤S1321中，对目标图像和目标对象的关键点信息进行卷积处理，得到第二卷积结果。

在步骤S1322中，对第二卷积结果进行下采样处理，得到第二下采样结果。

在一些实施例中，可以通过一级卷积层和一级下采样层对目标图像和目标对象的关键点信息进行卷积处理和下采样处理。其中，该级卷积层可以包括一个或多个卷积层，该级下采样层可以包括一个或多个下采样层。在另一种可能的实现方式中，可以通过多级卷积层和多级下采样层对目标图像和目标对象的关键点信息进行卷积处理和下采样处理。其中，每级卷积层可以包括一个或多个卷积层，每级下采样层可以包括一个或多个下采样层。在一些实施例中，对第二卷积结果进行下采样处理，得到第二下采样结果，可以包括：对第二卷积结果进行归一化处理，得到第二归一化结果；对第二归一化结果进行下采样处理，得到第二下采样结果。

在步骤S1323中，基于第二下采样结果，得到第二特征信息。

在一些实施例中，可以将第二下采样结果输入全连接层，通过全连接层对第二下采样结果进行融合处理(例如全连接运算)，得到第二特征信息。

图7示出根据本公开实施例的活体检测方法步骤S133的一示例性的流程图。如图 7所示，步骤S133可以包括步骤S1331和步骤S1332。

在步骤S1331中，对第一特征信息和第二特征信息进行融合处理(例如全连接运算)，得到第三特征信息。

在一些实施例中，可以对第一特征信息和第二特征信息进行连接(例如通道叠加)或者相加处理，得到第三特征信息。在一个例子中，通过全连接层对第一特征信息和第二特征信息进行全连接运算，得到第三特征信息。

在步骤S1332中，根据第三特征信息，确定目标对象的活体检测结果。

图8示出根据本公开实施例的活体检测方法步骤S1332的一示例性的流程图。如图8所示，步骤S1332可以包括步骤S13321和步骤S13322。

在步骤S13321中，基于第三特征信息，得到目标对象为活体的概率。

在一些实施例中，可以将第三特征信息输入Softmax层中，通过Softmax层得到目标对象为活体的概率。作为该实现方式的一个示例，Softmax层可以包括两个神经元，其中，一个神经元代表目标对象为活体的概率，另一个神经元代表目标对象为假体的概率。

在步骤S13322中，根据目标对象为活体的概率，确定目标对象的活体检测结果。

在一些实施例中，根据目标对象为活体的概率，确定目标对象的活体检测结果，包括：若目标对象为活体的概率大于第一阈值，则确定目标对象的活体检测结果为目标对象为活体；若目标对象为活体的概率小于或等于第一阈值，则确定目标对象的活体检测结果为假体。需要说明的是，尽管以图8所示的流程介绍了步骤S1332的实现方式如上，但本领域技术人员能够理解，本公开实施例应不限于此。在另一种可能的实现方式中，可以基于第三特征信息，得到目标对象为假体的概率，并根据目标对象为假体的概率，确定目标对象的活体检测结果。在该实现方式中，若目标对象为假体的概率大于第二阈值，则确定目标对象的活体检测结果为目标对象为假体；若目标对象为假体的概率小于或等于第二阈值，则确定目标对象的活体检测结果为活体。

本公开实施例通过结合目标对象的深度信息和目标图像进行活体检测，由此能够利用目标对象的深度信息和目标图像中的目标对象的关键点信息进行活体检测，从而能够提高活体检测的准确性，且计算复杂度较低，在摄像头轻微摇晃或者震动的情况下仍然能够获得较为准确的活体检测结果。

随着人脸识别技术的发展，人脸识别的准确度已经能够超越指纹，因此被广泛应用到各种场景中，如视频监控、人脸解锁、人脸支付等应用。但是，人脸识别存在着容易被hack(攻击)的风险，活体检测是人脸识别应用中必不可少的一个环节。

单目活体检测使用普通摄像头采集到的图像作为输入，存在容易被高清无痕hack图像通过的缺点。双目活体检测技术通过两个摄像头(普通RGB摄像头或普通近红外摄像头)作为输入，性能比单目活体检测更加优越。但是通过双目匹配来计算人脸深度分布信息，存在着计算量大、深度信息精确度低的缺点，且摄像头在摇晃，震动等情况下容易出现摄像头参数变化而导致计算失效的情况。近年来，三维(3D，3Dimensions) 传感器技术突飞猛进，包括飞行时间(Time Of Flight，TOF)传感器、结构光传感器、双目传感器等，使得用户能够方便的直接从传感器(Sensor)获得高精度的深度信息。本公开实施例将3D数据和近红外数据或RGB色彩模式的数据作为输入，利用近红外图或RGB图求得人脸关键点信息，然后融合人脸3D深度图、近红外或RGB图、人脸关键点信息、眼角特征、瞳孔特征等一项或多项，利用深度学习模型，能够对真实人脸和hack进行更有效的区分。

图4A示出根据本公开实施例的应用于人脸的活体检测装置的示意性框图。如图4A所示，该活体检测装置包括输入模块41、数据预处理模块42、深度神经网络模块43和检测结果输出模块44。

输入模块41，适用于不同硬件模组的数据输入，输入模块的数据输入形式包含以下中的一种或多种：深度图，纯近红外图，带光斑的近红外图，RGB图，等等。具体的组合形式由不同的硬件方案所确定。

数据预处理模块42，用于对输入模块输入的数据进行预处理，得到深度神经网络所需要的数据。图4B示出了根据本公开实施例的图4A中的数据预处理模块42的一种实现方式的示例性框图，其中，数据预处理模块的输入包括：深度传感器所获得的深度图和图像传感器获得的图像(纯近红外图，带光斑的红外图，RGB图等)，图4B所示的例子中以深度图421和近红外图422作为数据预处理模块42的输入。在一些可能的实现方式中，数据预处理模块对输入数据的处理过程如下：图像对齐矫正423和人脸关键点检测424，其中人脸关键点检测可以利用人脸关键点模型实现。

在图像对齐矫正423中，如果深度图和近红外图(或RGB图)不是同步对齐的，则需要根据相机的参数矩阵对输入的深度图和近红外图进行对齐/校正，以实现图像对齐。

在人脸关键点检测424中，将近红外图(或者RGB图)输入到人脸关键点模型进行人脸关键点检测，得到人脸关键点信息425。

数据预处理模块的输出：输出形式和输入相对应，包括对齐校正后的人脸深度图(对应于输入的深度图421)和人脸近红外图(对应于输入的近红外图422)以及人脸关键点信息。在一些实施例中，深度神经网络模块43是二分类模型，例如，对于真实的人脸，分类的标签(label)为0；对于hack的人脸，分类的label为1。再例如，对于真实的人脸，分类的标签(label)为1；对于hack的人脸，分类的label为0，等等。图4C示出根据本公开实施例的图4A中的深度神经网络模块的一个例子的框图，如图4C所示，深度神经网络模块的输入包括：经过数据预处理模块后得到的人脸深度图431、人脸近红外图432(或者其他形式的二维人脸图像)以及人脸关键点信息433。在一些实施例中，深度神经网络模块的输出包括：判别分数，即判别为真人或hack的概率。深度神经网络的输出是一个二元值，将输出分数与预设的阈值进行比较，其中，阈值的设定可以根据准确率和召回率进行调节，例如，神经网络的输出分数若大于阈值，则判别为hack,若小于阈值，则判别为活体，等等。

在图4C所示的例子中，深度神经网络是一个多支路模型，支路的数量由输入图像的数量决定，图4C以人脸深度图和人脸近红外图为例，深度神经网络包括两个分支，每个支路包括多个卷积层434、下采样层435和全连接层436，其中，人脸深度图431和人脸关键点信息433输入到第一分支进行特征提取处理，人脸近红外图432和人脸关键点信息433输入到第二分支进行特征提取处理，最后将多支路提取到的特征连接到一起输入到全连接层437，最后经过Softmax层438的处理得到输出结果，输出层的神经元个数为2，分别代表真人和hack的概率。需要说明的是，图4C的两个分支的输入都包括人脸关键点信息，而全连接层437正是利用人脸关键点信息，将两个分支的全连接层436的输出的特征信息融合在一起，假设第一分支中全连接层436的输出的是第一特征信息，第二分支中全连接层436的输出的是第二特征信息，而全连接层437利用人脸关键点信息通过全连接运算将第一特征信息和第二特征信息融合在一起。换句话说，本公开实施例中，利用人脸关键点信息，融合人脸深度图和人脸近红外图，从而得到最终的输出结果。

检测结果输出模块44的输出方式有多种。在一个例子中，对于真实的人脸，输出的结果标识为0；对于hack的人脸，输出的结果标识为1，但本公开实施例对此不做限定。

本公开实施例提供的技术方案，具有以下至少一种特点：

1)在一些实施例中，一方面，联合具有深度信息的3D传感器和其他辅助图像，如近红外图像，RGB图像等。即利用多种新型3D数据，作为人脸深度数据分布的基础。另一方面，提出的框架可以适用于多种3D传感器的输入形式，包括TOF相机提供的3D深度图+近红外图；结构光相机提供的3D深度图+带光斑的近红外图；3D深度图+RGB图；3D深度图+近红外图+RGB图以及包含3D深度图和近红外图或RGB图的其他形式。而相关技术中，以普通摄像头和双目为主，没有充分挖掘人脸数据的深度信息，存在着容易被高清无痕hack攻击通过的缺点，而本公开实施例利用3D传感器采集到的人脸深度图，能够防止平面的hack攻击。

2)在一些实施例中，融合了3D深度信息，其他近红外数据或RGB数据，人脸关键点信息以及眼角和瞳孔特征，通过深度学习模型的训练来区分真人和hack。而相关检测方法中，以单一的数据为主，没有利用多模态数据之间的相关性和互补性。也就是说，普通的双目计算深度的方法，存在着计算复杂度高、精度低的缺陷，而本公开实施例能够有效利用当前的3D传感技术获得更精准的3D人脸数据分布。

3)在一些实施例中，融合了多支路模型，多支路模型能够充分融合多模态的数据，而且兼容多种数据形态，能够通过神经网络学习到真实的人脸信息特征。而本公开实施例融合了人脸深度信息、近红外人脸信息或RGB图人脸信息、人脸关键点信息以及眼角、眼睛、瞳孔等多维度的生物特征融合技术，弥补了单一技术容易被针对hack的缺点。

图9示出根据本公开实施例的活体检测装置的框图。如图9所示，该装置包括：获取模块91，配置为获取第一传感器感测到的目标对象的深度信息和第二传感器感测到的目标图像；检测模块92，配置为对目标图像进行关键点检测，得到目标对象的关键点信息；确定模块93，配置为基于目标对象的深度信息和目标对象的关键点信息，得到目标对象的活体检测结果。在一些实施例中，目标对象为人脸。在一些实施例中，第二传感器为RGB传感器或者近红外传感器。

图10示出根据本公开实施例的活体检测装置的一示例性的框图。如图10所示：

在一些实施例中，该装置还包括：对齐模块94，配置为根据第一传感器的参数以及第二传感器的参数，对齐目标对象的深度信息和目标图像。

在一些实施例中，确定模块93包括：第一确定子模块931，配置为基于目标对象的深度信息和目标对象的关键点信息，得到第一特征信息；第二确定子模块932，配置为基于目标对象的关键点信息，得到第二特征信息；第三确定子模块933，配置为基于第一特征信息和第二特征信息，确定目标对象的活体检测结果。

在一些实施例中，第一确定子模块931配置为：将目标对象的深度信息和目标对象的关键点信息输入第一神经网络进行处理，得到第一特征信息；第二确定子模块932配置为：将目标图像和目标对象的关键点信息输入第二神经网络进行处理，得到第二特征信息。在一些实施例中，第一神经网络和第二神经网络具有相同的网络结构。

在一些实施例中，第一确定子模块931包括：第一卷积单元，配置为对目标对象的深度信息和目标对象的关键点信息进行卷积处理，得到第一卷积结果；第一下采样单元，配置为对第一卷积结果进行下采样处理，得到第一下采样结果；第一确定单元，配置为基于第一下采样结果，得到第一特征信息。

在一些实施例中，第二确定子模块932包括：第二卷积单元，配置为对目标图像和目标对象的关键点信息进行卷积处理，得到第二卷积结果；第二下采样单元，配置为对第二卷积结果进行下采样处理，得到第二下采样结果；第二确定单元，配置为基于第二下采样结果，得到第二特征信息。

在一些实施例中，第三确定子模块933包括：全连接单元，配置为对第一特征信息和第二特征信息进行融合处理(例如全连接运算)，得到第三特征信息；第三确定单元，配置为根据第三特征信息，确定目标对象的活体检测结果。

在一些实施例中，第三确定单元包括：第一确定子单元，配置为基于第三特征信息，得到目标对象为活体的概率；第二确定子单元，配置为根据目标对象为活体的概率，确定目标对象的活体检测结果。本公开实施例通过结合目标对象的深度信息和目标图像进行活体检测，由此能够利用目标对象的深度信息和目标图像中的目标对象的关键点信息进行活体检测，从而能够提高活体检测的准确性，防止假体图像攻击。

图11是根据一示例性实施例示出的一种活体检测装置800的框图。例如，装置800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。参照图11，装置800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当装置800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为装置800提供各个方面的状态评估。例如，传感器组件814可以检测到装置800的打开/关闭状态，组件的相对定位，例如所述组件为装置800的显示器和小键盘，传感器组件814还可以检测装置800或装置800一个组件的位置改变，用户与装置800接触的存在或不存在，装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。在示例性实施例中，还提供了一种非易失性计算机可读存储介质，例如包括计算机程序指令的存储器804，上述计算机程序指令可由装置800的处理器820执行以完成上述方法。

本公开实施例可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开实施例操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开实施例的各个方面。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开实施例的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开实施例的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

一种活体检测方法，包括：获取第一传感器感测到的目标对象的深度信息和第二传感器感测到的目标图像；对所述目标图像进行关键点检测，得到所述目标对象的关键点信息；基于所述目标对象的深度信息和所述目标对象的关键点信息，得到所述目标对象的活体检测结果。
根据权利要求1所述的方法，所述目标对象为人脸。
根据权利要求1或2所述的方法，所述第二传感器为RGB传感器或者近红外传感器。
根据权利要求1至3中任意一项所述的方法，所述第一传感器为飞行时间TOF传感器或结构光传感器。
根据权利要求1至4中任意一项所述的方法，在对所述目标图像进行关键点检测之前，所述方法还包括：根据所述第一传感器的参数以及所述第二传感器的参数，对齐所述目标对象的深度信息和所述目标图像。
根据权利要求1至5中任意一项所述的方法，基于所述目标对象的深度信息和所述目标对象的关键点信息，得到所述目标对象的活体检测结果，包括：基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息；基于所述目标对象的关键点信息，得到第二特征信息；基于所述第一特征信息和所述第二特征信息，确定所述目标对象的活体检测结果。
根据权利要求6所述的方法，基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息，包括：将所述目标对象的深度信息和所述目标对象的关键点信息输入第一神经网络进行处理，得到第一特征信息；

基于所述目标对象的关键点信息，得到第二特征信息，包括：将所述目标图像和所述目标对象的关键点信息输入第二神经网络进行处理，得到第二特征信息。
根据权利要求6或7所述的方法，基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息，包括：对所述目标对象的深度信息和所述目标对象的关键点信息进行卷积处理，得到第一卷积结果；对所述第一卷积结果进行下采样处理，得到第一下采样结果；基于所述第一下采样结果，得到第一特征信息。
根据权利要求6至8中任意一项所述的方法，基于所述目标对象的关键点信息，得到第二特征信息，包括：对所述目标图像和所述目标对象的关键点信息进行卷积处理，得到第二卷积结果；对所述第二卷积结果进行下采样处理，得到第二下采样结果；基于所述第二下采样结果，得到第二特征信息。
根据权利要求6至9中任意一项所述的方法，基于所述第一特征信息和所述第二特征信息，确定所述目标对象的活体检测结果，包括：对所述第一特征信息和所述第二特征信息进行融合处理，得到第三特征信息；根据所述第三特征信息，确定所述目标对象的活体检测结果。
根据权利要求10所述的方法，根据所述第三特征信息，确定活体检测结果，包括：基于所述第三特征信息，得到所述目标对象为活体的概率；

根据所述目标对象为活体的概率，确定所述目标对象的活体检测结果。
一种活体检测装置，包括：获取模块，配置为获取第一传感器感测到的目标对象的深度信息和第二传感器感测到的目标图像；检测模块，配置为对所述目标图像进行关键点检测，得到所述目标对象的关键点信息；确定模块，配置为基于所述目标对象的深度信息和所述目标对象的关键点信息，得到所述目标对象的活体检测结果。
根据权利要求12所述的装置，所述目标对象为人脸。
根据权利要求12或13所述的装置，所述第二传感器为RGB传感器或者近红外传感器。
根据权利要求12至14中任意一项所述的装置，所述第一传感器为飞行时间TOF传感器或结构光传感器。
根据权利要求12至15中任意一项所述的装置，所述装置还包括：对齐模块，配置为根据所述第一传感器的参数以及所述第二传感器的参数，对齐所述目标对象的深度信息和所述目标图像。
根据权利要求12至16中任意一项所述的装置，所述确定模块包括：第一确定子模块，配置为基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息；第二确定子模块，配置为基于所述目标对象的关键点信息，得到第二特征信息；第三确定子模块，配置为基于所述第一特征信息和所述第二特征信息，确定所述目标对象的活体检测结果。
根据权利要求17所述的装置，所述第一确定子模块配置为：将所述目标对象的深度信息和所述目标对象的关键点信息输入第一神经网络进行处理，得到第一特征信息；所述第二确定子模块配置为：将所述目标图像和所述目标对象的关键点信息输入第二神经网络进行处理，得到第二特征信息。
根据权利要求17或18所述的装置，所述第一确定子模块包括：第一卷积单元，配置为对所述目标对象的深度信息和所述目标对象的关键点信息进行卷积处理，得到第一卷积结果；第一下采样单元，配置为对所述第一卷积结果进行下采样处理，得到第一下采样结果；第一确定单元，配置为基于所述第一下采样结果，得到第一特征信息。
根据权利要求17至19中任意一项所述的装置，所述第二确定子模块包括：第二卷积单元，配置为对所述目标图像和所述目标对象的关键点信息进行卷积处理，得到第二卷积结果；第二下采样单元，配置为对所述第二卷积结果进行下采样处理，得到第二下采样结果；第二确定单元，配置为基于所述第二下采样结果，得到第二特征信息。
根据权利要求17至20中任意一项所述的装置，所述第三确定子模块包括：全连接单元，配置为对所述第一特征信息和所述第二特征信息进行融合处理，得到第三特征信息；第三确定单元，配置为根据所述第三特征信息，确定所述目标对象的活体检测结果。
根据权利要求21所述的装置，所述第三确定单元包括：第一确定子单元，配置为基于所述第三特征信息，得到所述目标对象为活体的概率；第二确定子单元，配置为根据所述目标对象为活体的概率，确定所述目标对象的活体检测结果。
一种活体检测装置，包括：存储器，配置为存储计算机可读指令；处理器，配置为执行所述存储器中存储的计算机可读指令，其中，对所述计算机可读指令的执行使得所述处理器执行权利要求1至11中任意一项所述的方法。
一种非易失性计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现权利要求1至11中任意一项所述的方法。
一种活体检测系统，包括：权利要求23所述的活体检测装置、所述第一传感器和所述第二传感器。
一种活体检测系统，包括：权利要求24所述的非易失性计算机可读存储介质、所述第一传感器和所述第二传感器。
一种电子设备，包括：第一传感器，配置为检测目标对象的深度信息；第二传感器，配置为采集包括所述目标对象的目标图像；处理器，配置为对所述第二传感器采集到的目标对象进行关键点检测，得到所述目标对象的关键点信息，并基于所述第一传感器检测到的所述目标对象的深度信息和所述目标对象的关键点信息，得到所述目标对象的活体检测结果。
根据权利要求27所述的电子设备，所述第二传感器为RGB传感器或者近红外传感器。
根据权利要求27或28所述的电子设备，所述第一传感器为飞行时间TOF传感器或结构光传感器。
根据权利要求27至29中任意一项所述的电子设备，所述处理器还配置为：根据所述第一传感器的参数以及所述第二传感器的参数，对齐所述目标对象的深度信息和所述目标图像。
根据权利要求27至30中任意一项所述的电子设备，所述处理器配置为：基于所述目标对象的深度信息和所述目标对象的关键点信息，得到第一特征信息；基于所述目标对象的关键点信息，得到第二特征信息；基于所述第一特征信息和所述第二特征信息，确定所述目标对象的活体检测结果。
根据权利要求31所述的电子设备，所述处理器配置为：将所述目标对象的深度信息和所述目标对象的关键点信息输入第一神经网络进行处理，得到第一特征信息；

基于所述目标对象的关键点信息，得到第二特征信息，包括：将所述目标图像和所述目标对象的关键点信息输入第二神经网络进行处理，得到第二特征信息。
根据权利要求31或32所述的电子设备，所述处理器配置为：对所述目标对象的深度信息和所述目标对象的关键点信息进行卷积处理，得到第一卷积结果；对所述第一卷积结果进行下采样处理，得到第一下采样结果；基于所述第一下采样结果，得到第一特征信息。
根据权利要求31至33中任意一项所述的电子设备，所述处理器配置为：对所述目标图像和所述目标对象的关键点信息进行卷积处理，得到第二卷积结果；对所述第二卷积结果进行下采样处理，得到第二下采样结果；基于所述第二下采样结果，得到第二特征信息。
根据权利要求31至34中任意一项所述的电子设备，所述处理器配置为：对所述第一特征信息和所述第二特征信息进行融合处理，得到第三特征信息；根据所述第三特征信息，确定所述目标对象的活体检测结果。
根据权利要求35所述的电子设备，所述处理器配置为：

基于所述第三特征信息，得到所述目标对象为活体的概率；

根据所述目标对象为活体的概率，确定所述目标对象的活体检测结果。