WO2022037258A1

WO2022037258A1 - 图像真伪检测方法、装置、计算机设备和存储介质

Info

Publication number: WO2022037258A1
Application number: PCT/CN2021/102723
Authority: WO
Inventors: 姚太平; 王鑫瑶; 丁守鸿; 李季檩; 吴运声
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-08-18
Filing date: 2021-06-28
Publication date: 2022-02-24
Anticipated expiration: 2023-02-18
Also published as: EP4123503A1; CN111709408A; CN111709408B; US20230116801A1; US12597278B2; EP4123503A4

Abstract

一种图像真伪检测方法，由计算机设备执行。所述方法包括：获取待检测图像（S202）；将待检测图像输入至生成对抗网络的生成器中，通过生成器输出与待检测图像对应的伪像图；伪像图用于表征待检测图像与真实图像间的差异；其中，生成对抗网络在训练阶段还包括鉴别器；在训练阶段，生成器用于输出与样本图像对应的预测伪像图，并基于预测伪像图生成拟合图像；鉴别器用于对拟合图像进行真实性鉴别，以辅助生成器学习到虚假图像与真实图像间的差异特征（S204）；基于伪像图中的伪像信息，确定待检测图像的真伪检测结果（S206）。

Description

图像真伪检测方法、装置、计算机设备和存储介质

本申请要求于2020年08月18日提交中国专利局，申请号为202010829031.3、发明名称为“图像真伪检测方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理技术领域，特别是涉及一种图像真伪检测方法、装置、计算机设备和存储介质。

背景技术

目前随着图像编辑技术的发展，人们可以随意编辑图像中的内容，从而导致越来越多以假乱真的高质量虚假图像涌现出来，这将严重影响目前落地的图像识别系统的安全性。因此，在安防应用方面，检测输入图像是否经过了编辑，日趋成为网络安全中的重要环节。

传统方案中对图像进行真伪鉴别的方式主要是通过检测图像中的某些特定瑕疵，来判定待检测图像是否为虚假图像。比如，可以通过检测图像中的全局光照和局部光照的匹配程度，来对图像的真伪进行判断。但是随着图像编辑技术的不断发展，某些特定的瑕疵将会不复存在，从而导致图像真伪检测的准确性较低。

发明内容

本申请各实施例提供了一种图像真伪检测方法、装置、计算机设备和存储介质。

一种图像真伪检测方法，由计算机设备执行，所述方法包括：

获取待检测图像；

将所述待检测图像输入至生成对抗网络的生成器中，通过所述生成器输出与所述待检测图像对应的伪像图；所述伪像图用于表征所述待检测图像与真实图像间的差异；其中，所述生成对抗网络在训练阶段还包括鉴别器；在所述训练阶段，所述生成器用于输出与样本图像对应的预测伪像图，并基于所述预测伪像图生成拟合图像；所述鉴别器用于对所述拟合图像进行真实性鉴别，以辅助所述生成器学习到虚假图像与真实图像间的差异特征；及

基于所述伪像图确定所述待检测图像的真伪检测结果。

一种图像真伪检测装置，所述装置包括：

图像获取模块，用于获取待检测图像；

伪像图生成模块，用于将所述待检测图像输入至生成对抗网络的生成器中，通过所述生成器输出与所述待检测图像对应的伪像图；所述伪像图用于表征所述待检测图像与真实图像间的差异；其中，所述生成对抗网络在训练阶段还包括鉴别器；在所述训练阶段，所述生成器用于输出与样本图像对应的预测伪像图，并基于所述预测伪像图生成拟合图像；所述鉴别器用于对所述拟合图像进行真实性鉴别，以辅助所述生成器学习到虚假图像与真实图像间的差异特征；及

判定模块，用于基于所述伪像图确定所述待检测图像的真伪检测结果。

一种计算机设备，包括存储器和一个或多个处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述一个或多个处理器执行以下步骤：

获取待检测图像；

将所述待检测图像输入至生成对抗网络的生成器中，通过所述生成器输出与所述待检测图像对应的伪像图；所述伪像图用于表征所述待检测图像与真实图像间的差异；其中，所述生成对抗网络在训练阶段还包括鉴别器；在所述训练阶段，生成器用于输出与样本图像对应的预测伪像图，并基于所述预测伪像图生成拟合图像；所述鉴别器用于对所述拟合图像进行真实性鉴别，以辅助所述生成器学习到虚假图像与真实图像间的差异特征；及

基于所述伪像图确定所述待检测图像的真伪检测结果。

一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

获取待检测图像；

基于所述伪像图确定所述待检测图像的真伪检测结果。

获取样本图像、及各所述样本图像对应的图像标签；所述样本图像包括真实样本图像和虚假样本图像；所述图像标签包括虚假区域标签和图像真伪标签；

将各所述样本图像分别输入至生成对抗网络中待训练的生成器，通过所述待训练的生成器输出与各所述样本图像分别对应的预测伪像图，并根据各所述预测伪像图，生成与所述样本图像分别对应的拟合图像；

将所述样本图像和所述拟合图像分别输入至所述生成对抗网络中待训练的鉴别器中，输出第一虚假区域预测结果和第一视觉真实预测结果；

基于所述第一虚假区域预测结果与相对应的虚假区域标签间的第一差异、以及所述第一视觉真实预测结果与相对应的图像真伪标签间的第二差异，对所述待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止；

将所述拟合图像输入至通过所述第一训练得到的鉴别器中，输出所述拟合图像的第二虚假区域预测结果和第二视觉真实预测结果；

基于所述第二虚假区域预测结果与所述真实样本图像所对应的虚假区域标签间的第三差异、以及所述第二视觉真实预测结果与所述真实样本图像所对应的图像真伪标签间的第四差异，对所述待训练的生成器进行第二训练，直至达到第二训练停止条件时停止；及

交替进行所述第一训练和所述第二训练，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络；所述训练好的生成对抗网络中的生成器用于对待检测图像进行图像真伪检测。

一种图像真伪检测装置，其特征在于，所述装置包括：

获取模块，用于获取样本图像、及各所述样本图像对应的图像标签；所述样本图像包括真实样本图像和虚假样本图像；所述图像标签包括虚假区域标签和图像真伪标签；

拟合图像生成模块，用于将各所述样本图像分别输入至生成对抗网络中待训练的生成器，通过所述待训练的生成器输出与各所述样本图像分别对应的预测伪像图，并根据各所述预测伪像图，生成与所述样本图像分别对应的拟合图像；

训练模块，用于将所述样本图像和所述拟合图像分别输入至生成对抗网络中待训练的鉴别器中，输出第一虚假区域预测结果和第一视觉真实预测结果；

所述训练模块，还用于基于所述第一虚假区域预测结果与相对应的虚假区域标签间的第一差异、以及所述第一视觉真实预测结果与相对应的图像真伪标签间的第二差异，对所述待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止；

所述训练模块，用于将所述拟合图像输入至通过所述第一训练得到的鉴别器中，输出所述拟合图像的第二虚假区域预测结果和第二视觉真实预测结果；

所述训练模块，还用于基于所述第二虚假区域预测结果与所述真实样本图像所对应的虚假区域标签间的第三差异、以及所述第二视觉真实预测结果与所述真实样本图像所对应的图像真伪标签间的第四差异，对所述待训练的生成器进行第二训练，直至达到第二训练停止条件时停止；及

所述训练模块，还用于交替进行所述第一训练和所述第二训练，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络；所述训练好的生成对抗网络中的生成器用于对待检测图像进行图像真伪检测。

附图说明

图1为一个实施例中图像真伪检测方法的应用环境图；

图2为一个实施例中图像真伪检测方法的流程示意图；

图3为一个实施例中生成器的网络结构示意图；

图4为一个实施例中人脸图像提取示意图；

图5为一个实施例中虚假区域标签的示意图；

图6为一个实施例中基于生成器、虚假区域鉴别器及视觉真进行对抗训练的示意图；

图7为一个具体实施例中图像真伪检测方法的流程示意图；

图8为另一个具体实施例中图像真伪检测方法的流程示意图；

图9为又一个具体实施例中图像真伪检测方法的流程示意图；

图10为再一个具体实施例中图像真伪检测方法的流程示意图；

图11为一个实施例中图像真伪检测方法装置的结构框图；

图12为另一个实施例中图像真伪检测方法装置的结构框图；

图13为又一个实施例中图像真伪检测方法装置的结构框图；

图14为一个实施例中计算机设备的内部结构图。

具体实施方式

图1为一个实施例中图像真伪检测方法的应用环境图。参照图1，该图像真伪检测方法应用于图像真伪检测系统。该图像真伪检测系统包括终端102和服务器104。终端102和服务器104 通过网络连接。终端102具体可以是台式终端或移动终端，移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端102和服务器104均可单独用于执行本申请实施例中提供的图像真伪检测方法。终端102和服务器104也可协同用于执行本申请实施例中提供的图像真伪检测方法。

需要说明的是，上述服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

还需要说明的是，本申请具体涉及人工智能领域中的计算机视觉技术和机器学习技术(Machine Learning,ML)。计算机视觉技术(Computer Vision,CV)是指用摄影机和电脑代替人眼对目标进行检测、识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。

本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。除非上下文另外清楚地指出，否则单数形式“一个”、“一”或者“该”等类似词语也不表示数量限制，而是表示存在至少一个。

在其中一个实施例中，如图2所示，提供了一种图像真伪检测方法，以该方法应用于计算机设备进行说明，该计算机设备具体可以是图1中的终端或服务器。其中，该图像真伪检测方法包括以下步骤：

步骤S202，获取待检测图像。

具体地，当需要对图像的真伪进行检测时，用户可以直接上传待检测图像至计算机设备，以使计算机设备对待检测图像进行真伪检测。其中，待检测图像的真伪检测结果可以包括待检测图像为虚假图像、以及检测图像为真实图像。当待检测图像为虚假图像时，表示待检测图像中的部分或全部图像内容已被编辑；当待检测图像为真实图像时，表示待检测图像中的图像内容未被编辑。

步骤S204，将待检测图像输入至生成对抗网络的生成器中，通过生成器输出与待检测图像对应的伪像图；伪像图用于表征待检测图像与真实图像间的差异。其中，生成对抗网络在训练阶段还包括鉴别器；在训练阶段，生成器用于输出与样本图像对应的预测伪像图，并基于预测伪像图生成拟合图像；鉴别器用于对拟合图像进行真实性鉴别，以辅助生成器学习到虚假图像与真实图像间的差异特征。

其中，生成对抗网络是包括生成器(Generative Model)和鉴别器(Discriminative Model)的深度学习模型，其通过框架中的生成器和判别器之间的互相博弈学习，而得到可信的输出。其中，训练后的生成器是指具有提取出待检测图像中的伪像信息能力的模型，具体可以是以样本图像作为训练数据，进行学习训练得到的用于将伪像信息从样本图像中分离出来的模型；鉴别器是具有对由生成器输出伪像图所构成的拟合图像的可靠性进行鉴别的模型，其具体可以是以拟合图像作为训练数据，进行学习训练得到的模型。

对于生成器而言，在使用阶段，可用于对图像的真伪进行检测；在训练阶段，其用于对图像中的伪像信息进行学习，并根据学习得到的伪像信息生成预测伪像图和拟合图像。对于鉴别器而言，在训练阶段，可用于对生成器输出的基于预测伪像图所生成的拟合图像进行真实性鉴别，以使生成器根据真实性鉴别结果调整提取出的伪像信息，从而学习到虚假图像与真实图像间的差异特征。

伪像图是表征待检测图像与真实图像间的差异的图像数据，其可以对待检测图像中被编辑的图像内容进行像素级别的定位。伪像信息是伪像图包含的用于表征被编辑的图像内容的信息，其具体可以为伪像图中的各像素点的像素值。拟合图像是合成图像，具体可以是通过待检测图像和伪像图合成的贴近真实图像的图像。在其中一个实施例中，拟合图像可以是从待检测图像中去对应除伪像图中的伪像信息后得到的图像，即将待检测图像进行还原处理后，得到的未包含有编辑的图像内容的图像数据。

具体地，在使用阶段，计算机设备可将待检测图像输入至生成对抗网络的生成器中，由生成器提取出待检测图像中的图像特征，并基于图像特征，确定待检测图像中被编辑的图像内容所对应的虚假区域，以及基于图像特征，预测被编辑的图像内容与真实的图像内容之间的差异。进一步地，生成器根据虚假区域以及预测得到的被编辑的图像内容与真实的图像内容之间的差异，生成对应的伪像图。其中，图像特征是可以反映出图像真伪特征的数据。图像特征可以反映出待检测图像像素点的颜色值分布、亮度值分布、及各像素点之间的关联关系等其中的一种或多种特征信息。其中，虚假区域是指图像中被编辑的图像内容所对应的图像区域。

比如，用户可对人脸图像中的面部进行美化调节得到经过编辑后的图像，该图像即可作为待检测图像。生成器可基于从待检测图像中提取出的图像特征，确定待检测图像中被编辑的图像内容为面部，那么相应地，可以确定与被编辑的图像内容对应的虚假区域为面部区域。进一步地，生成器获取预设的初始伪像图，并根据图像特征，预测用户对面部进行美化调节的美化程度，根据美化程度，对初始伪像图中的与虚假区域对应的目标区域中的各像素点的像素值进行调整，得到与待检测图像对应的伪像图。当计算机设备从待检测图像中去除伪像图中的伪像信息后，就可以得到未进行美化调节的原始人脸图像，即得到与待检测图像对应的拟合图像。其中，初始伪像图可以为一张与待检测图像尺寸相同的全黑图。

在训练阶段，计算机设备获取样本图像，并将样本图像输入待训练的生成器，由待训练的生成器确定与样本图像对应的预测伪像图，并根据样本图像以及预测伪像图，确定对应的拟合图像。进一步地，计算机设备将拟合图像作为鉴别器的输入，由鉴别器对生成器所生成的拟合图像的真实性进行鉴别，并将真实性鉴别结果反馈至生成器，以使生成器根据接收到的真实性鉴别结果，对应调整模型参数，直至鉴别器将生成器生成的拟合图像的真实性鉴别为真。如此，便实现了基于鉴别器辅助生成器学习到虚假图像与真实图像之间的本质区别。

由于可以基于鉴别器的鉴别结果衡量拟合图像的生成质量，因此，只有当生成器学习到虚假图像与真实图像之间的本质区别时，才能基于本质区别确定真实、可靠的伪像信息，从而根据真实、可靠的伪像信息输出被鉴别器鉴别为真的合理的拟合图像，进而在使用阶段时，生成器输出的伪像信息就能很好的表征待检测图像与真实图像间的差异。

在其中一个实施例中，生成对抗网络可以为GAN(Generative Adversarial Networks，生成式对抗网络)网络，也可以为在此基础上改进的生成式对抗网络。

在其中一个实施例中，生成器和鉴别器可以包括各种类型的机器学习模型。机器学习模型可以包括线性模型和非线性模型。例如，机器学习模型可以包括回归模型、支持向量机、基于决策树的模型、贝叶斯模型和/或神经网络(例如，深度神经网络)。例如，神经网络可以包括前馈神经网络、递归神经网络(例如，长短期记忆递归神经网络)、卷积神经网络或其他形式的神经网络。需要说明，生成器和鉴别器不一定限于是神经网络，还可以包括其他形式的机器学习模型。

在其中一个实施例中，生成器包括编码网络和解码网络；上述通过生成器输出与待检测图像对应的伪像图包括：基于编码网络提取待检测图像中的图像特征；基于解码网络对提取出的图像特征进行解码，得到与待检测图像对应的伪像图。

参考图3，如图3所示，生成器可以为任意的Encoder-Decoder(编码-解码)网络结构，其中，生成器中的编码网络用于提取出待检测图像中的图像特征，解码网络用于根据图像特征，解析出与待检测图像对应的伪像图，并根据伪像图确定待检测图像的真伪检测结果。在待检测图像为真实图像时，表明待检测图像中的图像内容未经过替换或编辑；在待检测图像为虚假图像时，表明待检测图像中的图像内容经过替换或编辑。图3示出了一个实施例中生成器的网络结构示意图。

步骤S206，基于伪像图确定待检测图像的真伪检测结果。

其中，真伪检测是以机器学习模型为导向的图像处理任务。在图像检测的应用领域，例如在身份认证领域、人脸支付领域、或安防领域等，常采用机器学习模型识别更为可靠的差异特征，从而根据差异特征，确定待检测图像的真伪检测结果。

具体地，计算机设备确定伪像图中的伪像信息，并根据伪像信息对待检测图像的真伪进行检测。比如，计算机设备根据伪像图中的伪像信息确定待检测图像中的虚假区域的区域大小，当虚假区域的区域大小大于或等于预设区域阈值时，将待检测图像判定为虚假图像；当虚假区域的区域大小小于预设区域阈值时，将待检测图像判定为真实图像。又比如，计算机设备根据伪像图中的伪像信息，确定待检测图像中是否具有编辑痕迹，若具有编辑痕迹，则将待检测图像判定为虚假图像；若不具有编辑痕迹，则将待检测图像判定为真实图像。本实施例在此不作限定。

在其中一个实施例中，基于伪像图确定待检测图像的真伪检测结果，包括：确定伪像图所包括的各像素点的像素值；基于各像素点的像素值确定与伪像图对应的平均像素值；当平均像素值大于等于像素阈值时，确定待检测图像为虚假图像；当平均像素值小于所述像素阈值时，确定待检测图像为真实图像。

具体地，计算机设备对伪像图中所包含的像素总数进行统计，以及确定各像素的像素值，并对各像素的像素值进行叠加，得到总像素值。进一步地，计算机设备可将总像素值除以像素总数，得到与伪像图对应的平均像素值，并在平均像素值大于或等于预设像素阈值时，将待检测图像判定为虚假图像；当平均像素值小于预设像素阈值时，将待检测图像判定为真实图像。比如，在上述举例中，当生成器输出的伪像图与初始伪像图一致，即该输出的伪像图为全黑图时，计算得到的平均像素值即为零，小于预设像素阈值，从而计算机设备将伪像图为全黑的待检测图像判定为真实图像；当生成器输出的伪像图不为全黑图时，此时的平均像素值不为零，大于预设的像素值，从而计算机设备将伪像图不为全黑的待检测图像判定为虚假图像。其中，预设的像素阈值可以根据需要自定义，如可根据伪像图的准确程度确定像素阈值，或根据图像真伪检测的精度要求确定像素阈值等，本申请实施例对此不作限定。

在其中一个实施例中，各像素点的像素值可以为以RGB(红、绿、蓝)三原色表示的数值，还可以是基于其他颜色维度所确定的数值等，本申请实施例对此不做限定。

在其中一个实施例中，计算机设备可以基于预设的像素值检测算法对伪像图中的像素值进行检测，从而确定各像素的像素值。其中，像素值检测算法可根据需要自定义，如可基于matlab中的imread函数读取伪像图中的各像素点的像素值，或基于OpenCV中的at函数读取伪像图中的各像素点的像素值。

上述图像真伪检测方法，当获取得到待检测图像时，通过将待检测图像输入对抗网络中的生成器，可以基于生成器输出真实且合理的，用于表征待检测图像与真实图像间的差异的伪像图，如此，便能基于伪像图中的伪像信息，确定待检测图像的真伪检测结果。由于生成器可以通过与鉴别器之间的对抗训练，学习到真实图像与虚假图像之间的最本质区别特征，因此，相比于传统的通过检测图像中的某些特定瑕疵，来对图像进行真伪检测，本申请无需依赖特定瑕疵，并在待检测图像不存在特定瑕疵时，依旧能够通过确定待检测图像与真实图像之间的区别特征，来确定待检测图像的真伪检测结果，如此，大大提升了图像检测的泛化性。

并且，由于生成器是通过与鉴别器进行对抗训练而得，而鉴别器可以用于对生成器输出的预测伪像图所生成的拟合图像进行真实性鉴别，因此，训练后的生成器可以学习到虚假图像与真实图像间的本质差异特征，从而生成真实且合理的伪像信息，进而对待检测图像进行准确判断。

在其中一个实施例中，待检测图像包括待检测的人脸图像，获取待检测图像，包括：获取包括有人脸的待检测视频；对待检测视频进行解析得到对应的视频帧；对视频帧进行人脸检测，并基于人脸检测的结果从视频帧中裁剪出包括有人脸区域的人脸图像。

具体地，上述图像真伪检测方法具体可用于对人脸图像进行真伪检测。当需要对人脸图像进行真伪检测时，计算机设备可获取包括人脸的待检测视频，并对待检测视频进行解析，得到对应的视频帧。其中，待检测视频具体可以为基于监控设备采集得到的监控视频或从互联网下载得到的媒体视频等，本实施例在此不作限定。

计算机设备基于人脸检测算法对视频帧进行人脸检测，得到人脸图像。其中，人脸图像是指视频帧中人脸所在区域的局部图像。参考图4，如图4所示，人脸所在区域是人脸在视频帧中的位置。计算机设备可通过人脸检测算法识别视频帧中的人脸区域。人脸检测算法可根据需要自定义，如可为OpenCV人脸检测算法、系统自带的人脸检测算法或者优图人脸检测算法等。人脸检测算法可以返回视频帧中是否包含人脸以及具体的人脸区域，如通过矩形框标识人脸的位置。计算机设备在确定视频帧中的人脸区域后，可沿该人脸区域截取视频帧得到人脸图像。单帧视频帧可截取得到一个或多个人脸图像。在本实施例中，人脸图像可以仅包括人脸面部区域的图像。图4示出了一个实施例中人脸图像提取示意图。

在其中一个实施例中，监控设备在采集到视频后，可检测该视频中是否存在人脸，若存在人脸，则将该视频作为待检测视频发送至计算机设备，计算机设备从而获取到包括人脸的待检测视频。

在其中一个实施例中，对待检测视频进行解析后，可得到多帧对应的视频帧，从而计算机设备可以按照上述的图像真伪检测方法对每张视频帧均进行真伪检测，也可仅对部分视频帧进行真伪检测。本实施例在此不作限定。由于人脸图像的真伪严重影响安防检测的准确性，因此通过确定待检测视频中的人脸图像，并对人脸图像进行真伪检测，可以减少安防系统误将虚假人脸图像判定为真实人脸图像，并将虚假人脸图像所对应的不法分子误认为合法公民的概率，从而大大提升了安防系统的安全性。

上述实施例中，当获取得到待检测视频帧时，通过对待检测视频进行解析，可以得到对应的视频帧；通过得到对应的视频帧，可以从视频帧中剪裁出包括有人脸区域的人脸图像，从而计算机设备可以仅关注包括有人脸区域的人脸图像，而无需关注非人脸区域，如此，便提升了图像真伪检测的效率。

在其中一个实施例中，上述图像真伪检测方法还包括给虚假图像添加标记信息的步骤，该步骤具体包括：当待检测图像的真伪检测结果表示待检测图像为虚假图像时，获取对应的标记信息；将标记信息添加至待检测图像中；标记信息用于表征待检测图像为虚假图像。

具体地，当基于伪像图中的伪像信息确定待检测图像为虚假图像时，计算机设备可获取预设的用于区分虚假图像与真实图像的标记信息，并将此标记信息添加至待检测图像中。其中，标记信息以及将标记信息添加至待检测图像中的方式可以根据需要自定义，比如，可以将标记信息设置为字符“虚假图像”，从而可以将字符“虚假图像”添加至待检测图像的图像名称中，或者将字符“虚假图像”以水印的方式添加至待检测图像中。

在其中一个实施例中，计算机设备可以对待检测视频中，添加有标记信息的视频帧的数量进行统计，并根据统计得到的视频帧的数量，确定是否需要在待检测视频中添加用于区分虚假视频与真实视频的区分信息。比如，当添加有标记信息的待检测视频帧的数量值大于或等于预设的数量阈值时，表明此待检测视频为虚假视频，从而计算机设备可在待检测视频中添加区分信息，以使用户基于视频中的区分信息，确定视频的真伪。如此，便能提升视频内容的可信度。

在其中一个实施例中，当计算机设备可确定待检测图像为虚假图像时，可进一步分析该虚假图像的来源，比如该虚假图像具体是通过那些图像处理技术编辑得到，或者该虚假图像具体是通过哪些软件编辑得到等。进而，计算机设备可基于与该虚假图像相关的来源信息，获取对应的标记信息，将该标记信息添加至待检测图像中。

比如，在某些多媒体平台上，用户可随意上传经过编辑的换脸视频。换脸视频的广泛传播使得媒体的公信力不断下降，容易对用户产生误导。通过本申请各实施例提供的图像真伪检测方法可以帮助平台进行视频筛查，对检测出来的伪造视频加上显著标记，如“由A应用制作”，确保视频内容的可信度，保证社会公信力。本申请各实施例所提供的图像真伪检测方法，有助于公安司法证据验伪，防范犯罪嫌疑人利用人脸编辑等相关技术伪造证据。可应用于人脸核身、司法验证工具或图片视频鉴真等产品中。

上述实施例中，可以在待检测图像中添加用于区分真实图像以及虚假图像的标记信息，从而实现从海量的图像数据中筛选标记出虚假图像。并且，后续可以基于标记信息快速确定图像的真伪，进一步提升了图像真伪检测的效率。

在其中一个实施例中，上述图像真伪检测方法还包括对生成对抗网络进行训练的步骤，该步骤具体包括：获取样本图像、以及各样本图像所对应的图像标签；将各所述样本图像输入至生成对抗网络中待训练的生成器，通过待训练的生成器输出与各样本图像分别对应的预测伪像图；根据预测伪像图，生成与样本图像对应的拟合图像；基于样本图像、图像标签及拟合图像对生成对抗网络中的生成器和鉴别器进行迭代对抗训练，直至达到迭代停止条件时停止训练。

其中，样本图像是用于对生成对抗网络进行训练的图像，具体可以包括真实样本图像和虚假样本图像。真实样本图像是未经过图像编辑的图像数据，虚假样本图像是经过图像编辑后得到的图像数据。

如上文所述，传统方式主要是通过检测图像中的某些特定瑕疵，来判定待检测图像是否为虚假图像。容易发现，这种方式并没有很好泛化性。在身份识别、人脸支付、安防保护等实际应用场景中，由于现场环境的复杂性，常常会导致采集的待检测图像不具有特定的瑕疵，从而使得在对待检测图像进行真伪检测的过程中，因未能检测出特定瑕疵，而导致图像真伪检测的检测结果失真。

为了提升图像真伪检测的准确性和泛化性，本申请的实施例构建了生成器以及鉴别器，并通过对生成器以及鉴别器进行联合对抗训练，使得生成器能够学习到真实图像与虚假图像之间的本质区别，进而用于进行图像真伪检测。比如，在人脸支付场景中，计算机设备可在基于人脸图像进行支付之前，通过训练好的鉴别器判断该人脸图像是否为编辑的虚假图像，并在确定该人脸图像为虚假图像时，暂停人脸支付，以提升人脸支付的安全性。又比如，在安防保护领域，计算机设备可通过训练好的鉴别器实时对监控视频流中的视频帧进行图像真伪检测，并在基于图像真伪检测结果确定监控视频流为虚假视频时，及时向安保人员下发告警通知。

具体地，当获取得到样本图像以及对应的图像标签时，计算机设备可将样本图像输入至生成对抗网络中的生成器，由待训练的生成器对样本图像进行编码解码操作，从而输出预测伪像图。生成器还可根据预测伪像图和样本图像，生成对应的拟合图像。当获取得到拟合图像时，计算机设备通过样本图像、图像标签、以及拟合图像对生成对抗网络中的生成器和鉴别器进行迭代对抗训练，直至达到迭代停止条件时停止训练。其中，训练停止条件可以是到达预设的迭代次数、达到预设迭代时间、或生成器以及鉴别器的模型性能打到预设性能等。

在其中一个实施例中，开发人员可以从网络中下载大量图像，并对部分图像进行编辑，从而得到真实样本图像以及虚假样本图像。

在其中一个实施例中，由于生成对抗网络的Batch Normalization(批标准化)影响，在训练阶段，计算机设备可以选择轮流将真实样本图像和虚假样本图像输入至待训练的生成器，或者将真实样本图像以及虚假样本图像成对输入。

在其中一个实施例中，待训练的生成器以及鉴别器均可以是由人工神经网络构成的模型。人工神经网络(Artificial Neural Networks，简写为ANNs)，也简称为神经网络(NNs)或称作连接模型(Connection Model)。人工神经网络可从信息处理角度对人脑神经元网络进行抽象，以建立某种模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。其中，神经网络模型可以为CNN(Convolutional Neural Network，卷积神经网络)模型、DNN(Deep Neural Network，深度神经网络)模型和RNN(Recurrent Neural Network，循环神经网络)模型等。

其中，卷积神经网络包括卷积层(Convolutional Layer)和池化层(Pooling Layer)。深度神经网络包括输入层、隐含层和输出层，层与层之间是全连接的关系。循环神经网络是一种对序列数据建模的神经网络，即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中，即隐藏层之间的节点不再无连接而是有连接的，并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。循环神经网络模型，比如LSTM(Long Short-Term Memory Neural Network，长短时记忆神经网络)模型，BiLSTM(Bi-directional Long Short-Term Memory，双向长短时记忆神经网络)等。

上述实施例中，通过将生成器以及鉴别器进行对抗训练，使得训练后的生成器可以学习到最本质的真实图像与虚假图像之间的差异特征，从而满足现实场景中，对未包含有特定瑕疵的图像的检测需求。

在其中一个实施例中，根据预测伪像图，生成与样本图像对应的拟合图像，包括：对样本图像和相应的预测伪像图进行像素匹配，确定样本图像和预测伪像图中对应相同像素位置的第一像素点和第二像素点；将第一像素点的像素值减去相同像素位置处的第二像素点的像素值，得到与相应像素位置对应的拟合像素值；基于各像素位置分别对应的拟合像素值，确定样本图像的拟合图像。

具体地，由于预测伪像图与样本图像的尺寸相同，因此，生成器可以对样本图像和相应的预测伪像图进行像素匹配，从而根据像素匹配结果，确定样本图像和伪像图像中对应相同像素位置的第一像素点和第二像素点。其中，为了描述方便，下述将样本图像中的像素点称作第一像素点，将预测伪像图中的像素点称作第二像素点。生成器对各像素位置进行遍历，将第一像素点的像素值减去具有相同位置的第二像素点的像素值，得到与相应像素位置对应的拟合像素值，并将各像素位置分别对应的拟合像素值，作为与样本图像对应的拟合图像中各像素点的像素值，从而确定样本图像的拟合图像。

在其中一个实施例中，还可以将第一像素点的像素值加上对应相同像素位置处的第二像素点的像素值，得到与相应像素位置对应的拟合像素值，并根据基于各像素位置分别对应的拟合像素值，确定样本图像的拟合图像；或将第一像素点的像素值加上/减去对应相同像素位置处的第二像素点的像素值，得到与相应像素位置对应的拟合像素值，并对拟合像素值进行处理，如将拟合像素输入预设的拟合图像处理网络中，得到样本图像的拟合图像。本实施例在此不作限定。

上述实施例中，生成器仅需将第一像素点的像素值减去相同像素位置处的第二像素点的像素值，即可得对应到拟合图像，如此，大大提升了拟合图像的生成效率。

在其中一个实施例中，基于样本图像、图像标签、及拟合图像对生成对抗网络中的生成器和鉴别器进行迭代对抗训练，直至达到迭代停止条件时停止训练，包括：基于样本图像、图像标签及拟合图像对生成对抗网络中待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止；将拟合图像输入至通过第一训练得到的鉴别器中，以对拟合图像进行真实性鉴别，输出拟合图像的真实性预测结果；根据拟合图像的真实性预测结果对生成对抗网络中待训练的生成器进行第二训练，直至达到第二训练停止条件时停止；返回基于样本图像、图像标签及拟合图像对生成对抗网络中待训练的鉴别器进行第一训练的步骤并继续执行，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络。

具体地，计算机设备可交替对生成器和鉴别器进行训练，直至达到迭代停止条件时结束训练。计算机设备可在生成器后添加梯度反转层，由梯度反转层将生成器与鉴别器串联，形成生成对抗网络。当需要对生成对抗网络进行训练时，计算机设备固定生成器、及鉴别器其中一个模型的模型参数，将固定了模型参数的模型置为固定状态，将未固定模型参数的模型置为非固定状态，并对应调整处于非固定状态的模型的模型参数。当处于非固定状态的模型的模型参数调整完毕时，计算机设备将处于固定状态的模型置为非固定状态，以及将处于非固定状态的模型置为固定状态，返回对应调整处于非固定状态的模型的模型参数的步骤，直至达到迭代停止条件。比如，当固定生成器中的模型参数时，计算机设备基于生成器的输出对应调整鉴别器的模型参数，直至达到第一训练停止条件。进一步地，计算机设备转为固定达到第一训练停止条件的鉴别器的模型参数，并基于鉴别器的输出对应调整生成器的模型参数，直至达到第二训练停止条件。如此反复，直至达到迭代停止条件时停止迭代。

当固定生成器的模型参数，对鉴别器进行第一训练时，计算机设备将样本图像以及拟合图像作为输入图像输入至待训练的鉴别器，由待训练的鉴别器对输入图像的真实性进行鉴别。进一步地，待训练的鉴别器基于鉴别结果和图像标签确定鉴别器损失，通过鉴别器损失函数确定下降梯度，并根据下降梯度对应调整模型参数，直至达到第一训练停止条件。其中，第一训练停止条件可以是鉴别结果与图像标签之间的差异达到预设的最小值，或训练迭代次数达到预设的迭代次数，亦或鉴别器的鉴别性能达到预设性能等。

当固定鉴别器的模型参数，对生成器进行第二训练时，计算机设备将生成器输出的拟合图像输入至通过第一训练得到的鉴别器中，由通过第一训练得到的鉴别器对拟合图像进行真实性鉴别，输出拟合图像的真实性预测结果，并将真实性预测结果通过梯度反转层输入至待训练的生成器。待训练的生成器通过真实性预测结果对应调整模型参数，直至达到第二训练停止条件。其中，第二训练停止条件可以是真实性预测结果为真，或训练迭代次数达到预设的迭代次数，亦或生成器的性能达到预设性能等。

在其中一个实施例中，生成对抗网络中的生成器和鉴别器支持灵活独立选择，单独每个模型均可实现最优配置，而不需要妥协任意一个环节的性能。换言之，本申请所涉及的生成器和鉴别器分别可以自由选择擅长相应领域的专用模型。

本实施例中，基于生成器和鉴别器分别对应损失函数对生成对抗网络进行联合训练，使得生成对抗网络中的生成器和鉴别器均能达到良好的性能，从而基于训练后的生成器所提取出的伪像图具有良好的可信度。

在其中一个实施例中，样本图像包括真实样本图像和虚假样本图像；图像标签包括虚假区域标签和图像真伪标签；鉴别器包括虚假区域鉴别器和视觉真实鉴别器；基于样本图像、图像标签及拟合图像对生成对抗网络中待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止，包括：将真实样本图像和虚假样本图像分别输入至虚假区域鉴别器，通过虚假区域鉴别器输出真实样本图像和虚假样本图像分别对应的第一虚假区域预测结果；基于真实样本图像和虚假样本图像分别对应的第一虚假区域预测结果和虚假区域标签，确定第一虚假区域损失；将真实样本图像和拟合图像分别作为输入图像输入至视觉真实鉴别器，输出与输入图像对应的第一视觉真实预测结果；基于输入图像所对应的第一视觉真实预测结果和图像真伪标签，确定第一视觉真实损失；根据第一虚假区域损失和第一视觉真实损失构建鉴别器损失函数；通过鉴别器损失函数对虚假区域鉴别器和视觉真实鉴别器进行第一训练，直至达到第一训练停止条件时停止。

其中，图像标签包括虚假区域标签以及图像真伪标签；虚假区域标签是指用于标识样本图像中的虚假区域的标签，比如，该虚假区域标签可以为用以将虚假区域进行框选的矩形框等。图像真伪标签是指用于表征样本图像的真伪的信息，比如，当样本图像为真实图像时，可以将此样本图像的真伪标签设置为“1”；当样本图像为虚假图像时，可以将此样本图像的真伪标签设置为“0”。

为了对生成器输出的拟合图像的真实性进行准确鉴别，本申请的实施例构造有虚假区域鉴别器以及视觉真实鉴别器。其中，虚假区域鉴别器用于对拟合图像中的虚假区域进行鉴别，在理想状态下，生成器输出的拟合图像应不包含有虚假区域，从而虚假区域鉴别器判定拟合图像中的虚假区域为空。视觉真实鉴别器用于对拟合图像的真实性进行鉴别，即视觉真实鉴别器用于鉴别拟合图像是否为真实图像，在理想状态下，生成器输出的拟合图像应贴近真实图像，从而视觉真实鉴别器判定拟合图像的真实性为真。

具体地，当对采集得到的图像进行编辑，得到虚假样本图像时，开发人员对虚假样本图像设置图像真伪标签，以及确定虚假样本图像中的图像编辑区域，基于图像编辑区域设置虚假区域标签。

当需要对鉴别器进行第一训练时，计算机设备将真实样本图像和虚假样本图像输入至虚假区域鉴别器，通过虚假区域鉴别器分别确定真实样本图像和虚假样本图像中的虚假区域，并基于虚假区域输出真实样本图像和虚假样本图像分别对应的第一虚假区域预测结果。虚假区域鉴别器确定第一虚假区域预测结果与对应的虚假区域标签之间的差异，根据第一虚假区域预测结果与对应的虚假区域标签之间的差异确定第一虚假区域损失。其中，第一虚假区域损失具体可以是均方误差、绝对值误差、Log-Cosh损失、分位数损失、理想分位数损失、或交叉熵损失等。以绝对值误差为例，当虚假区域鉴别器为DMask，第一虚假区域预测结果为DMask(input)，虚假区域标签为mask _gt时，第一虚假区域损失即为Loss _DMask＝|DMask(input)-mask _gt|。

与此同时，计算机设备将真实样本图像和拟合图像分别作为输入图像输入至视觉真实鉴别器，基于视觉真实鉴别器对输入图像的真实性进行鉴别，得到第一视觉真实预测结果。视觉真实鉴别器确定第一视觉真实预测结果与对应的图像真伪标签之间的差异，根据第一视觉真实预测结果与对应的图像真伪标签之间的差异确定第一视觉真实损失。以第一视觉真实损失为交叉熵损失为例，当视觉真实鉴别器为DVisual，第一视觉真实预测结果为DVisual(x)，图像真伪标签为cls _gt，交叉熵损失为BCE时，第一视觉真实损失函数即为Loss _DVisual＝BCE(DVisual(x),cls _gt)。

进一步地，计算机设备通过多种预设逻辑运算对第一虚假区域损失和第一视觉真实损失进行融合，得到鉴别器损失函数，并通过鉴别器损失函数对虚假区域鉴别器和视觉真实鉴别器进行训练，直至达到第一训练停止条件时停止。其中，预设逻辑运算包括但不限于四则混合运算、加权求和、或机器学习算法等。

以加权求和为例，在上述举例中，假设加权因子为r ₁和r ₂，则鉴别器损失函数为Loss _D＝r ₁Loss _Dmask+r ₂Loss _Dvisual。其中，加权因子可以是根据经验或实验设定的数值，如0.1。

本实施例中，通过对虚假区域鉴别器以及视觉真实鉴别器进行训练，使得训练后的虚假区域鉴别器可以对生成器输出的拟合图像中的虚假区域进行鉴别，以促进生成器学习到更为准确的伪像信息；使得视觉真实鉴别器可以对生成器输出的拟合图像的真实性进行鉴别，以促进生成器输出更为真实的拟合图像；两者相辅相成，从而提升生成器的可靠性。

在其中一个实施例中，该虚假区域鉴别器主要是为了使拟合图像更加真实，因而也可以用二分类鉴别器、或depth(深度)鉴别器等代替。

在其中一个实施例中，虚假区域标签的生成步骤包括：将第一预设图像的像素值设置为第一值，得到真实样本图像的虚假区域标签；第一预设图像与真实样本图像的尺寸相同；确定虚假样本图像中的虚假区域；将第二预设图像中与虚假区域对应的目标区域的像素值设置为第二值，并将第二预设图像中除目标区域之外的其他区域的像素值设置为第一值，得到虚假样本图像的虚假区域标签；其中，第二预设图像与虚假样本图像的尺寸相同，且第二值与第一值不同。

具体地，在当前样本图像为真实样本图像时，计算机设备获取第一预设图像，并将第一预设图像中各像素点的像素值设置为第一值。比如，参考图5，计算机设备将第一预设图像中各像素点的像素值置为用以表示黑色的(0)，从而得到如图5所示的虚假区域标签。在当前样本图像为虚假样本图像时，计算机设备确定虚假样本图像中的虚假区域，以及获取第二预设图像，并将第二预设图像中与虚假区域对应的目标区域的像素值设置为第二值，将第二预设图像中除目标区域之外的其他区域的像素值设置为第一值。比如，参考图6，计算机设备将目标区域的像素值置为用以标识白色的(1)，将除目标区域之外的其余区域的像素值置为用以表示黑色的(0)。图5示出了一个实施例的虚假区域标签的示意图。

值的注意的是，第一预设图像以及第二预设图像与样本图像的尺寸相同；第二值与第一值不同；第一预设图像与第二预设图像可以相同，也可以不同。

在其中一个实施例中，当虚假样本图像为包含有人脸的人脸图像时，计算机设备通过预设的人脸检测算法，检测虚假样本图像中的人脸轮廓，并根据人脸轮廓确定虚假区域，根据虚假区域生成对应的虚假区域标签。

上述实施例中，通过将虚假区域标签进行二值化，不仅可以基于二值化后的虚假区域标签准确定位出虚假区域，而且可以简化鉴别器回归训练的复杂度，从而提升生成对抗网络训练的效率。

在其中一个实施例中，真实性预测结果包括第二虚假区域预测结果和第二视觉真实预测结果；将拟合图像输入至通过第一训练得到的鉴别器中，以对拟合图像进行真实性鉴别，输出拟合图像的真实性预测别结果，包括：将拟合图像输入至通过第一训练得到的虚假区域鉴别器中，输出与拟合图像对应的第二虚假区域预测结果；将拟合图像输入至通过第一训练得到的视觉真实鉴别器中，输出与拟合图像对应的第二视觉真实预测结果。

具体地，当固定鉴别器的模型参数，对生成器进行训练时，计算机设备将样本图像输入至生成器，由生成器输出与样本图像对应的拟合图像，并将拟合图像输入至通过第一训练得到的虚假区域鉴别器和视觉真实鉴别器中。虚假区域鉴别器和视觉真实鉴别器按照上述方法对拟合图像进行鉴别，并根据鉴别结果对应输出第二虚假区域预测结果和第二视觉真实预测结果。

本实施例中，由于可以基于虚假区域鉴别器以及视觉生成鉴别器对拟合图像进行鉴别，使得后续可以根据鉴别结果对应调整生成器模型参数，从而得到可信的生成器。

在其中一个实施例中，根据拟合图像的真实性预测结果对生成对抗网络中待训练的生成器进行第二训练，直至达到第二训练停止条件时停止，包括：基于与拟合图像对应的第二虚假区域预测结果以及与真实样本图像对应的虚假区域标签，确定第二虚假区域损失；基于与拟合图像对应的第二视觉真实预测结果以及与真实样本图像对应的图像真伪标签，确定第二视觉真实损失；根据第二虚假区域损失和第二视觉真实损失构建生成器损失函数；通过生成器损失函数对生成对抗网络中待训练的生成器进行训练，直至达到第二训练停止条件时停止。

具体地，生成器确定第二虚假区域预测结果与对应的真实样本图像之间的差异，并根据第二虚假区域预测结果与对应的真实样本图像之间的差异确定第二虚假区域损失。以第二虚假区域损失为绝对值误差为例，当虚假区域鉴别器为DMask，第二虚假区域预测结果为DMask(live)，与真实样本图像对应的虚假区域标签为zeromap时，第二虚假区域损失即为Loss _GMask＝|(DMask(live)-zeromap|。其中，zeromap可以为一张与真实样本图像尺寸相同的全黑图。

与此同时，生成器确定第二视觉真实预测结果以及真实样本图像对应的图像真伪标签之间的差异，根据第二视觉真实预测结果以及真实样本图像对应的图像真伪标签之间的差异确定第二真实损失。以第二视觉真实损失为交叉熵损失为例，当视觉真实鉴别器为DVisual，第二视觉真实预测结果为DVisual(live)，与真实样本图像对应的图像真伪标签为1，交叉熵损失为BCE时，第一视觉真实损失函数即为Loss _GVisual＝BCE(DVisual(live),1)。

进一步地，计算机设备通过多种预设逻辑运算对第二虚假区域损失和第二视觉真实损失进行融合，得到生成器损失函数，并通过生成器损失函数对生成器进行训练，直至达到第二训练停止条件时停止。

以加权求和为例，在上述举例中，假设加权因子为r ₃和r ₄，则对应的生成器损失函数为Loss _G＝r ₃Loss _Dmask+r ₄Loss _Gvisual。

本实施例中，由于可以通过第二虚假区域损失以及第二视觉真实损失对生成器进行约束，因此，经第二虚假区域损失以及第二视觉真实损失联合训练后的生成器所输出的拟合图像不仅可以无限接近真实图像，而且所包含的虚假区域可以为空。

在其中一个实施例中，上述图像真伪检测方法还包括：确定与真实样本图像所对应的预测伪像图；基于真实样本图像对应的预测伪像图与真实样本图像对应的虚假区域标签间的差异，确定伪像损失；根据第二虚假区域损失和第二视觉真实损失构建生成器损失函数，包括：根据伪像损失、第二虚假区域损失及第二视觉真实损失，构建生成器损失函数。

具体地，由于在理想状态下，当输入的样本图像为真实样本图像时，生成器所输出的预测伪像图应该与真实样本图像对应的虚假区域标签一致，因此，可以对真实样本图像添加伪像损失，基于伪像损失对生成器进行训练，以使训练后的生成器输出的真实样本图像对应的预测伪像图，能够与真实样本图像对应的虚假区域标签一致。

当将真实样本图像输入生成器，并基于生成器输出预测伪像图时，计算机设备确定真实样本图像对应的预测伪像图与真实样本图像对应的虚假区域标签之间的差异，并根据差异确定对应的伪像损失。以伪像损失为绝对值误差为例，当与真实样本图像对应的预测伪像图为artifact _A，与真实样本图像对应的虚假区域标签为zeromap时，伪像损失即为Loss _Gartifact＝|(artifact _A-zeromap|。

进一步地，计算机设备通过多种预设逻辑运算对伪像损失、第二虚假区域损失以及第二视觉真实损失进行融合，得到生成器损失函数，并通过生成器损失函数对生成器进行训练，直至达到第二训练停止条件时停止。以加权求和为例，在上述举例中，假设加权因子为r ₅、r ₆及r ₇，则生成器损失函数为Loss _G＝r ₅Loss _Gartifact+r ₆Loss _Gmask+r ₇Loss _Gvisual。

在其中一个实施例中，参考图6，图6示出了一个实施例中基于生成器、虚假区域鉴别器以及视觉真进行对抗训练的示意图。如图6所示，当对生成器进行第二训练时，可以将真实样本图像以及虚假样本图像作为样本图像输入至生成器中，由生成器中的编码网络提取样本图像中的图像特征，由生成器中的解码器对提取出的图像特征进行解码，从而得到与真实样本图像对应的预测伪像图以及与虚假样本图像对应的预测伪像图。进一步地，生成器将真实样本图像减去对应的预测伪像图，以及将虚假样本图像减去对应的预测伪像图，得到与真实样本图像以及虚假样本图像分别对应的拟合图像，并将拟合图像输入至虚假区域鉴别器、视觉真实鉴别器，由虚假区域鉴别器和视觉真实鉴别器对输入的拟合图像的真实性进行鉴别，得到第二虚假区域预测结果和第二视觉真实预测结果，并将第二虚假区域预测结果和第二视觉真实预测结果返回至生成器，以使生成器根据返回的第二虚假区域预测结果和第二视觉真实预测结果对应调整模型参数。

当对虚假区域鉴别器以及视觉真实鉴别器进行训练时，计算机设备将样本图像输入至虚假区域鉴别器，由虚假区域鉴别器输出与样本图像对应的第一虚假区域预测结果，以及将真实样本图像和拟合图像作为输入图像输入视觉真实鉴别器，由视觉真实鉴别器输出对应的第一视觉真实预测结果。计算机设备基于样本图像所对应的第一虚假区域预测结果和虚假区域标签，确定第一虚假区域损失，以及基于输入图像所对应的第一视觉真实预测结果和图像真伪标签，确定第一视觉真实损失，并根据第一虚假区域损失和第一视觉真实损失构建鉴别器损失函数；通过鉴别器损失函数对所述虚假区域鉴别器和所述视觉真实鉴别器进行第一训练，直至达到第一训练停止条件时停止。计算机设备交替进行第一训练和第二训练，直至达到迭代停止条件。

上述实施例中，通过对真实样本图像的预测伪像图设置约束，使得训练后的生成器可以准确区分真实图像和虚假图像，从而提升了图像真伪检测的准确性。

在一个具体实施例中，如图7所示，本申请提供的图像真伪检测方法包括以下步骤：

S702，获取包括有人脸的待检测视频，对待检测视频进行解析得到对应的视频帧。

S704，对视频帧进行人脸检测，并基于人脸检测的结果从视频帧中裁剪出包括有人脸区域的人脸图像，得到待检测图像。

S706，将待检测图像输入至生成对抗网络的生成器中，通过生成器输出与待检测图像对应的伪像图；伪像图用于表征待检测图像与真实图像间的差异；其中，生成对抗网络在训练阶段还包括鉴别器；在训练阶段，鉴别器用于对基于生成器输出的预测伪像图所生成的拟合图像进行真实性鉴别，以辅助生成器学习到虚假图像与真实图像间的差异特征。

S708，确定伪像图所包括的各像素点的像素值，基于各像素点的像素值确定与伪像图对应的平均像素值。

S710，当平均像素值大于等于像素阈值时，确定待检测图像为虚假图像；当平均像素值小于像素阈值时，确定待检测图像为真实图像；当待检测图像的真伪检测结果表示待检测图像为虚假图像时，获取对应的标记信息；将标记信息添加至待检测图像中；标记信息用于表征待检测图像为虚假图像。

在另一个具体实施例中，如图8所示，本申请提供的图像真伪检测方法包括以下步骤：

S802，获取样本图像以及各样本图像所对应的图像标签；图像标签包括虚假区域标签和图像真伪标签。

S804，将各样本图像输入至生成对抗网络中待训练的生成器，通过待训练的生成器输出与各样本图像分别对应的预测伪像图；

S806，对样本图像和相应的预测伪像图进行像素匹配，确定样本图像和预测伪像图中对应相同像素位置的第一像素点和第二像素点。

S808，将第一像素点的像素值减去相同像素位置处的第二像素点的像素值，得到与相应像素位置对应的拟合像素值；基于各像素位置分别对应的拟合像素值，确定样本图像的拟合图像。

S810，将样本图像分别输入至虚假区域鉴别器，通过虚假区域鉴别器输出与样本图像对应的第一虚假区域预测结果；基于样本图像所对应的第一虚假区域预测结果和虚假区域标签，确定第一虚假区域损失。

S812，样本图像包括真实样本图像，将真实样本图像和拟合图像分别作为输入图像输入至视觉真实鉴别器，输出与输入图像对应的第一视觉真实预测结果；基于输入图像所对应的第一视觉真实预测结果和图像真伪标签，确定第一视觉真实损失。

S814，根据第一虚假区域损失和第一视觉真实损失构建鉴别器损失函数；通过鉴别器损失函数对虚假区域鉴别器和视觉真实鉴别器进行训练，直至达到第一训练停止条件时停止。

S816，将拟合图像输入至通过第一训练得到的虚假区域鉴别器中，输出与拟合图像对应的第二虚假区域预测结果；将拟合图像输入至通过第一训练得到的视觉真实鉴别器中，输出与拟合图像对应的第二视觉真实预测结果。

S818，基于与拟合图像对应的第二虚假区域预测结果及与真实样本图像对应的虚假区域标签，确定第二虚假区域损失；基于与拟合图像对应的第二视觉真实预测结果及与真实样本图像对应的图像真伪标签，确定第二视觉真实损失。

S820，确定与真实样本图像所对应的预测伪像图；基于真实样本图像对应的预测伪像图与真实样本图像对应的虚假区域标签间的差异，确定伪像损失。

S822，根据伪像损失、第二虚假区域损失及第二视觉真实损失，构建生成器损失函数；通过生成器损失函数对生成对抗网络中待训练的生成器进行训练，直至达到第二训练停止条件时停止。

S824，返回基于样本图像、图像标签、及拟合图像对生成对抗网络中待训练的鉴别器进行第一训练的步骤并继续执行，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络。

S826，获取待检测图像。

S828，将待检测图像输入至生成对抗网络的生成器中，通过生成器输出与待检测图像对应的伪像图；伪像图用于表征待检测图像与真实图像间的差异；其中，生成对抗网络在训练阶段还包括鉴别器；在训练阶段，鉴别器用于对基于生成器输出的预测伪像图所生成的拟合图像进行真实性鉴别，以辅助生成器学习到虚假图像与真实图像间的差异特征。

S830，基于伪像图确定待检测图像的真伪检测结果。

在另一个具体实施例中，如图9所示，本申请提供的图像真伪检测方法包括以下步骤：

S902，将第一预设图像的像素值设置为第一值，得到真实样本图像的虚假区域标签；第一预设图像与真实样本图像的尺寸相同。

S904，确定虚假样本图像中的虚假区域。

S906，将第二预设图像中与虚假区域对应的目标区域的像素值设置为第二值，并将第二预设图像中除目标区域之外的其他区域的像素值设置为第一值，得到虚假样本图像的虚假区域标签；其中，第二预设图像与虚假样本图像的尺寸相同，且第二值与第一值不同。

S908，获取样本图像以及各样本图像所对应的虚假区域标签和图像真伪标签。

S910，将各样本图像输入至生成对抗网络中待训练的生成器，通过待训练的生成器输出与各样本图像分别对应的预测伪像图。

S912，根据预测伪像图，生成与样本图像对应的拟合图像；基于样本图像、图像标签及拟合图像对生成对抗网络中的生成器和鉴别器进行迭代对抗训练，直至达到迭代停止条件时停止训练。

S914，获取待检测图像。

S916，将待检测图像输入至生成对抗网络的生成器中，通过生成器输出与待检测图像对应的伪像图；伪像图用于表征待检测图像与真实图像间的差异；其中，生成对抗网络在训练阶段还包括鉴别器；在训练阶段，鉴别器用于对基于生成器输出的预测伪像图所生成的拟合图像进行真实性鉴别，以辅助生成器学习到虚假图像与真实图像间的差异特征。

S918，基于伪像图确定待检测图像的真伪检测结果。

本申请还提供了一种图像真伪检测方法，以应用与计算机设备为例进行说明，该计算机设备具体可以是图1中的终端或服务器。其中，如图10所示，该图像真伪检测方法包括：

S1002，获取样本图像及各样本图像对应的图像标签；样本图像包括真实样本图像和虚假样本图像；图像标签包括虚假区域标签和图像真伪标签。

具体地，当需要对生成对抗网络进行训练时，可将样本图像以及样本图像对应的图像标签输入至计算机设备中。其中，样本图像包括真实样本图像以及虚假样本图像；图像标签包括虚假区域标签以及图像真伪标签。

S1004，将各真实样本图像和虚假样本图像分别输入至生成对抗网络中待训练的生成器，通过待训练的生成器输出各真实样本图像和虚假样本图像分别对应的预测伪像图，并根据各预测伪像图，生成真实样本图像和虚假样本图像分别对应的拟合图像。

S1006，将真实样本图像、虚假样本图像和拟合图像分别输入至生成对抗网络中待训练的鉴别器中，输出第一虚假区域预测结果和第一视觉真实预测结果。

S1008，基于第一虚假区域预测结果与相对应的虚假区域标签间的第一差异、以及第一视觉真实预测结果与相对应的图像真伪标签间的第二差异，对待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止。

具体地，计算机设备将各样本图像输入至生成对抗网络中的待训练的生成器中，由待训练的生成器输出与各样本图像对应的预测伪像图，并将各样本图像减去对应的预测伪像图，得到与各样本图像分别对应的拟合图像。计算机设备将样本图像和拟合图像输入至生成对抗网络中的待训练的鉴别器中，由待训练的鉴别器输出第一虚假区域预测结果和第一视觉真实预测结果。计算机设备确定第一虚假区域预测结果与相应的虚假区域标签之间的第一差异、以及第一视觉真实预测结果与相应的图像真伪标签之间的第二差异，并根据第一差异以及第二差异构建鉴别器的损失函数，基于鉴别器的损失函数对待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止。

其中，鉴别器包括虚假区域鉴别器以及视觉真实鉴别器；第一差异具体可以是上述实施例中提及的第一虚假区域损失表示、第二差异具体可以是上述实施例中提及的第一视觉真实损失表示；第一差异以及第二差异的确定方式，可分别按照上述的第一虚假区域损失及第一视觉真实损失的计算方式计算得到。其中，计算机设备进行第一训练的具体内容可参考前述实施例中的相关描述。

其中，将样本图像和拟合图像分别输入至生成对抗网络中待训练的鉴别器中，输出第一虚假区域预测结果和第一视觉真实预测结果；基于第一虚假区域预测结果与相对应的虚假区域标签间的第一差异以及第一视觉真实预测结果与相对应的图像真伪标签间的第二差异，对待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止，包括：将样本图像分别输入至虚假区域鉴别器，通过虚假区域鉴别器输出与样本图像对应的第一虚假区域预测结果；基于样本图像所对应的第一虚假区域预测结果和虚假区域标签，确定第一虚假区域损失；将真实样本图像和拟合图像分别作为输入图像输入至视觉真实鉴别器，输出与输入图像对应的第一视觉真实预测结果；基于输入图像所对应的第一视觉真实预测结果和图像真伪标签，确定第一视觉真实损失；根据第一虚假区域损失和第一视觉真实损失构建鉴别器损失函数；通过鉴别器损失函数对虚假区域鉴别器和视觉真实鉴别器进行第一训练，直至达到第一训练停止条件时停止。

S1010，将拟合图像输入至通过第一训练得到的鉴别器中，输出拟合图像的第二虚假区域预测结果和第二视觉真实预测结果。

具体地，计算机设备将拟合图像输入至经第一训练得到的鉴别器中，由经第一训练的鉴别器输出拟合图像的第二虚假区域预测结果以及第二视觉真实预测结果。

其中，将拟合图像输入至通过第一训练得到的鉴别器中，输出拟合图像的第二虚假区域预测结果和第二视觉真实预测结果，包括：将拟合图像输入至通过第一训练得到的虚假区域鉴别器中，输出与拟合图像对应的第二虚假区域预测结果；将拟合图像输入至通过第一训练得到的视觉真实鉴别器中，输出与拟合图像对应的第二视觉真实预测结果。

S1012，基于第二虚假区域预测结果与真实样本图像所对应的虚假区域标签间的第三差异以及第二视觉真实预测结果与真实样本图像所对应的图像真伪标签间的第四差异，对待训练的生成器进行第二训练，直至达到第二训练停止条件时停止。

具体地，计算机设备确定第二虚假区域预测结果与真实样本图像对应的虚假区域标签之间的第三差异，以及确定第二视觉真实预测结果与真实样本图像对应的图像真伪标签之间的第四差异，根据第三差异以及第四差异构建生成器的损失函数，基于生成器的损失函数对生成器进行第二训练，直至达到第二训练停止条件时停止。

其中，第三差异具体可通过上述实施例的第二虚假区域损失表示；第四差异可通过上述实施例的第二视觉真实损失表示；第三差异以及第四差异的确定方式，可分别按照上述实施例的第二虚假区域损失及第二视觉真实损失的计算方式计算得到。其中，计算机设备进行第二训练的具体内容可参考前述实施例中的相关描述。

其中，基于第二虚假区域预测结果与真实样本图像所对应的虚假区域标签间的第三差异以及第二视觉真实预测结果与真实样本图像所对应的图像真伪标签间的第四差异，对待训练的生成器进行第二训练，直至达到第二训练停止条件时停止，包括：基于与拟合图像对应的第二虚假区域预测结果以及与真实样本图像对应的虚假区域标签，确定第二虚假区域损失；基于与拟合图像对应的第二视觉真实预测结果以及与真实样本图像对应的图像真伪标签，确定第二视觉真实损失；根据第二虚假区域损失和第二视觉真实损失构建生成器损失函数；通过生成器损失函数对生成对抗网络中待训练的生成器进行第二训练，直至达到第二训练停止条件时停止。

S1014，交替进行第一训练和第二训练，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络；训练好的生成对抗网络中的生成器用于对待检测图像进行图像真伪检测。

具体地，计算机设备交替进行第一训练以及第二训练，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络，并将待检测图像输入至训练好的生成对抗网络中的生成器，由训练好的生成器输出待检测图像对应的伪像图，并基于伪像图确定待检测图像的真伪检测结果。

在其中一个实施例中，还可以确定第五差异，根据第五差异、第四差异及第三差异，构建生成器损失函数。其中，第五差异具体可通过上述的伪像损失表示。第五差异的确定方式包括：确定与真实样本图像对应的预测伪像图；将真实样本图像对应的预测伪像图与真实样本图像对应的虚假区域标签间的差异，作为第五差异。

上述图像真伪检测方法，通过对生成器和鉴别器进行对抗训练，在训练过程中，生成器用于学习伪像图，并基于伪像图合成拟合图像；鉴别器在一方面学习到真实样本图像和虚假样本图像所对应的虚假区域信息，以具备对拟合图像的虚假区域的重建能力，在另一方面，可以学习到真实样本图像和拟合图像间的区别，以具备鉴别拟合图像的真实性的能力。这样迭代对抗训练后，可使得训练后的生成对抗网络中的生成器和鉴别器均能达到良好的性能，从而基于训练后的生成器所提取出的伪像图具有良好的可信度。

本申请还提供一种应用场景，该应用场景应用上述的图像真伪检测方法。具体地，该图像真伪检测方法在该应用场景的应用如下：

当基于账号管理应用对用户账号进行冻结之前，为了保证账号安全，账号管理应用可以通过调用图像采集装置采集当前用户的人脸图像，并将当前用户的人脸图像发送至服务器，由服务器对当前用户的人脸图像进行人脸验证。当服务器接收到当前用户的人脸图像，服务器将当前用户的人脸图像输入至生成对抗网络中的生成器，通过生成器确定与待检测图像对应的伪像图，并基于伪像图中的伪像信息，对当前用户的人脸图像的真伪进行判定，从而在当前用户的人脸图像为虚假图像时，账号管理应用拒绝对用户账号进行冻结；在当前用户的人脸图像为真实图像时，账号管理应用对用户账号进行冻结。

应该理解的是，虽然图2、图7、图8、图9和图10的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2、图7、图8、图9和图10中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在其中一个实施例中，如图11所示，提供了一种图像真伪检测装置1100，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：图像获取模块1102、伪像图生成模块1104和判定模块1106，其中：

图像获取模块1102，用于获取待检测图像。

伪像图生成模块1104，用于将待检测图像输入至生成对抗网络的生成器中，通过生成器输出与待检测图像对应的伪像图；伪像图用于表征待检测图像与真实图像间的差异；其中，生成对抗网络在训练阶段还包括鉴别器；在训练阶段，生成器用于输出与样本图像对应的预测伪像图，并基于预测伪像图生成拟合图像；鉴别器用于对拟合图像进行真实性鉴别，以辅助生成器学习到虚假图像与真实图像间的差异特征；

判定模块1106，用于基于伪像图确定待检测图像的真伪检测结果。

在其中一个实施例中，如图12所示，图像获取模块1102还用包括视频解析模块1121，用于获取包括有人脸的待检测视频；对待检测视频进行解析得到对应的视频帧；对视频帧进行人脸检测，并基于人脸检测的结果从视频帧中裁剪出包括有人脸区域的人脸图像。

在其中一个实施例中，判定模块1106还用于确定伪像图所包括的各像素点的像素值；基于各像素点的像素值确定与伪像图对应的平均像素值；当平均像素值大于等于像素阈值时，确定待检测图像为虚假图像；当平均像素值小于像素阈值时，确定待检测图像为真实图像。

在其中一个实施例中，图像真伪检测装置1100还用于当待检测图像的真伪检测结果表示待检测图像为虚假图像时，获取对应的标记信息；将标记信息添加至待检测图像中；标记信息用于表征待检测图像为虚假图像。

在其中一个实施例中，图像真伪检测装置1100还包括模型训练模块1108，用于获取样本图像、以及各样本图像所对应的图像标签；将各样本图像输入至生成对抗网络中待训练的生成器，通过待训练的生成器输出与各样本图像分别对应的预测伪像图；根据预测伪像图，生成与样本图像对应的拟合图像；基于样本图像、图像标签及拟合图像对生成对抗网络中的生成器和鉴别器进行迭代对抗训练，直至达到迭代停止条件时停止训练。

在其中一个实施例中，模型训练模块1108还用于对样本图像和相应的预测伪像图进行像素匹配，确定样本图像和预测伪像图中相应相同像素位置的第一像素点和第二像素点；将第一像素点的像素值减去相同像素位置处的第二像素点的像素值，得到与相应像素位置对应的拟合像素值；基于各像素位置分别对应的拟合像素值，确定样本图像的拟合图像。

在其中一个实施例中，模型训练模块1108还用于基于样本图像、图像标签及拟合图像对生成对抗网络中待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止；将拟合图像输入至通过第一训练得到的鉴别器中，以对拟合图像进行真实性鉴别，输出拟合图像的真实性预测结果；根据拟合图像的真实性预测结果对生成对抗网络中待训练的生成器进行第二训练，直至达到第二训练停止条件时停止；返回基于样本图像、图像标签及拟合图像对生成对抗网络中待训练的鉴别器进行第一训练的步骤并继续执行，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络。

在其中一个实施例中，样本图像包括真实样本图像和虚假样本图像；图像标签包括虚假区域标签和图像真伪标签；鉴别器包括虚假区域鉴别器和视觉真实鉴别器；模型训练模块1108还包括鉴别器训练模块1181，用于将真实样本图像和虚假样本图像分别输入至虚假区域鉴别器，通过虚假区域鉴别器输出真实样本图像和虚假样本图像分别对应的第一虚假区域预测结果；基于真实样本图像和虚假样本图像分别对应的第一虚假区域预测结果和虚假区域标签，确定第一虚假区域损失；将真实样本图像和拟合图像分别作为输入图像输入至视觉真实鉴别器，通过视觉真实鉴别器输出与输入图像对应的第一视觉真实预测结果；基于输入图像所对应的第一视觉真实预测结果和图像真伪标签，确定第一视觉真实损失；根据第一虚假区域损失和第一视觉真实损失构建鉴别器损失函数；通过鉴别器损失函数对虚假区域鉴别器和视觉真实鉴别器进行第一训练，直至达到第一训练停止条件时停止。

在其中一个实施例中，鉴别器训练模块1181还用于将第一预设图像的像素值设置为第一值，得到真实样本图像的虚假区域标签；第一预设图像与真实样本图像的尺寸相同；确定虚假样本图像中的虚假区域；将第二预设图像中与虚假区域对应的目标区域的像素值设置为第二值，并将第二预设图像中除目标区域之外的其他区域的像素值设置为第一值，得到虚假样本图像的虚假区域标签；其中，第二预设图像与虚假样本图像的尺寸相同，且第二值与第一值不同。

在其中一个实施例中，真实性预测结果包括第二虚假区域预测结果和第二视觉真实预测结果；模型训练模块1108还包括生成器训练模块1182，用于将拟合图像输入至通过第一训练得到的虚假区域鉴别器中，输出与拟合图像对应的第二虚假区域预测结果；将拟合图像输入至通过第一训练得到的视觉真实鉴别器中，输出与拟合图像对应的第二视觉真实预测结果。

在其中一个实施例中，生成器训练模块1182还用于基于与拟合图像对应的第二虚假区域预测结果以及与真实样本图像对应的虚假区域标签，确定第二虚假区域损失；基于与拟合图像对应的第二视觉真实预测结果以及与真实样本图像对应的图像真伪标签，确定第二视觉真实损失；根据第二虚假区域损失和第二视觉真实损失构建生成器损失函数；通过生成器损失函数对生成对抗网络中待训练的生成器进行第二训练，直至达到第二训练停止条件时停止。

在其中一个实施例中，生成器训练模块1182还用于确定与真实样本图像所对应的预测伪像图；基于真实样本图像对应的预测伪像图与真实样本图像对应的虚假区域标签间的差异，确定伪像损失；根据第二虚假区域损失和第二视觉真实损失构建生成器损失函数，包括：根据伪像损失、第二虚假区域损失及第二视觉真实损失，构建生成器损失函数。

如图13所示，提供了一种图像真伪检测装置1300，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：获取模块1302、拟合图像生成模块1304和训练模块1306，其中：

获取模块1302，用于获取样本图像及各样本图像对应的图像标签；样本图像包括真实样本图像和虚假样本图像；图像标签包括虚假区域标签和图像真伪标签；

拟合图像生成模块1304，用于将各真实样本图像和虚假样本图像分别输入至生成对抗网络中待训练的生成器，通过待训练的生成器输出各真实样本图像和虚假样本图像分别对应的预测伪像图，并根据各预测伪像图，生成真实样本图像和虚假样本图像分别对应的拟合图像；

训练模块1306，用于将真实样本图像、虚假样本图像和拟合图像分别输入至生成对抗网络中待训练的鉴别器中，输出第一虚假区域预测结果和第一视觉真实预测结果；

训练模块1306，还用于基于第一虚假区域预测结果与相对应的虚假区域标签间的第一差异以及第一视觉真实预测结果与相对应的图像真伪标签间的第二差异，对待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止；

训练模块1306，用于将拟合图像输入至通过第一训练得到的鉴别器中，输出拟合图像的第二虚假区域预测结果和第二视觉真实预测结果；

训练模块1306，还用于基于第二虚假区域预测结果与真实样本图像所对应的虚假区域标签间的第三差异以及第二视觉真实预测结果与真实样本图像所对应的图像真伪标签间的第四差异，对待训练的生成器进行第二训练，直至达到第二训练停止条件时停止；

训练模块1306，还用于交替进行第一训练和第二训练，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络；训练好的生成对抗网络中的生成器用于对待检测图像进行图像真伪检测。

关于图像真伪检测装置的具体限定可以参见上文中对于图像真伪检测方法的限定，在此不再赘述。上述图像真伪检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在其中一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图14所示。该计算机设备包括通过系统总线连接的处理器、存储器和模型接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图像真伪检测数据。该计算机设备的模型接口用于与外部的终端通过模型连接通信。该计算机程序被处理器执行时以实现一种图像真伪检测方法。

本领域技术人员可以理解，图14中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在其中一个实施例中，还提供了一种计算机设备，包括存储器和一个或多个处理器，存储器中存储有计算机程序可读指令，计算机可读指令被所述处理器执行时，使得一个或多个处理器执行执行上述各方法实施例中的步骤。

在其中一个实施例中，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方法实施例中的步骤。

在其中一个实施例中，提供了一个或多个存储有计算机可读指令的非易失性可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

Claims

一种图像真伪检测方法，由计算机设备执行，所述方法包括：

获取待检测图像；

将所述待检测图像输入至生成对抗网络的生成器中，通过所述生成器输出与所述待检测图像对应的伪像图；所述伪像图用于表征所述待检测图像与真实图像间的差异；其中，所述生成对抗网络在训练阶段还包括鉴别器；在所述训练阶段，所述生成器用于输出与样本图像对应的预测伪像图，并基于所述预测伪像图生成拟合图像；所述鉴别器用于对所述拟合图像进行真实性鉴别，以辅助所述生成器学习到虚假图像与真实图像间的差异特征；及

基于所述伪像图确定所述待检测图像的真伪检测结果。
根据权利要求1所述的方法，其特征在于，所述待检测图像包括待检测的人脸图像，所述获取待检测图像，包括：

获取包括有人脸的待检测视频；

对所述待检测视频进行解析得到对应的视频帧；及

对所述视频帧进行人脸检测，并基于人脸检测的结果从所述视频帧中裁剪出包括有人脸区域的人脸图像。
根据权利要求1所述的方法，其特征在于，所述基于所述伪像图确定所述待检测图像的真伪检测结果，包括：

确定所述伪像图所包括的各像素点的像素值；

基于各所述像素点的像素值确定与所述伪像图对应的平均像素值；

当所述平均像素值大于等于像素阈值时，确定所述待检测图像为虚假图像；及

当所述平均像素值小于所述像素阈值时，确定所述待检测图像为真实图像。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

当所述待检测图像的真伪检测结果表示所述待检测图像为虚假图像时，获取对应的标记信息；及

将所述标记信息添加至所述待检测图像中；所述标记信息用于表征所述待检测图像为虚假图像。
根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：

获取样本图像以及各所述样本图像所对应的图像标签；

将各所述样本图像输入至所述生成对抗网络中待训练的生成器，通过所述待训练的生成器输出与各所述样本图像分别对应的预测伪像图；

根据所述预测伪像图，生成与所述样本图像对应的拟合图像；及

基于所述样本图像、所述图像标签及所述拟合图像对所述生成对抗网络中的生成器和鉴别器进行迭代对抗训练，直至达到迭代停止条件时停止训练。
根据权利要求5所述的方法，其特征在于，所述根据所述预测伪像图，生成与所述样本图像对应的拟合图像，包括：

对所述样本图像和相应的预测伪像图进行像素匹配，确定所述样本图像和所述预测伪像图中对应相同像素位置的第一像素点和第二像素点；

将所述第一像素点的像素值减去相同像素位置处的第二像素点的像素值，得到与相应像素位置对应的拟合像素值；及

基于各像素位置分别对应的拟合像素值，确定所述样本图像的拟合图像。
根据权利要求5所述的方法，其特征在于，所述基于所述样本图像、所述图像标签及所述拟合图像对所述生成对抗网络中的生成器和鉴别器进行迭代对抗训练，直至达到迭代停止条件时停止训练，包括：

基于所述样本图像、所述图像标签及所述拟合图像对所述生成对抗网络中待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止；

将所述拟合图像输入至通过所述第一训练得到的鉴别器中，以对所述拟合图像进行真实性鉴别，输出所述拟合图像的真实性预测结果；

根据所述拟合图像的真实性预测结果对所述生成对抗网络中待训练的生成器进行第二训练，直至达到第二训练停止条件时停止；及

返回基于所述样本图像、所述图像标签及所述拟合图像对所述生成对抗网络中待训练的鉴别器进行第一训练的步骤并继续执行，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络。
根据权利要求7所述的方法，其特征在于，所述样本图像包括真实样本图像和虚假样本图像；所述图像标签包括虚假区域标签和图像真伪标签；所述鉴别器包括虚假区域鉴别器和视觉真实鉴别器；

所述基于所述样本图像、所述图像标签及所述拟合图像对所述生成对抗网络中待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止包括：

将所述真实样本图像和所述虚假样本图像分别输入至虚假区域鉴别器，通过所述虚假区域鉴别器输出所述真实样本图像和所述虚假样本图像分别对应的第一虚假区域预测结果；

基于所述真实样本图像和所述虚假样本图像分别对应的第一虚假区域预测结果和虚假区域标签，确定第一虚假区域损失；

将所述真实样本图像和所述拟合图像分别作为输入图像输入至视觉真实鉴别器，输出与所述输入图像对应的第一视觉真实预测结果；

基于所述输入图像所对应的第一视觉真实预测结果和图像真伪标签，确定第一视觉真实损失；

根据所述第一虚假区域损失和第一视觉真实损失构建鉴别器损失函数；及

通过所述鉴别器损失函数对所述虚假区域鉴别器和所述视觉真实鉴别器进行第一训练，直至达到第一训练停止条件时停止。
根据权利要求8所述的方法，其特征在于，所述虚假区域标签的生成步骤包括：

将第一预设图像的像素值设置为第一值，得到所述真实样本图像的虚假区域标签；所述第一预设图像与所述真实样本图像的尺寸相同；

确定所述虚假样本图像中的虚假区域；及

将第二预设图像中与所述虚假区域对应的目标区域的像素值设置为第二值，并将所述第二预设图像中除所述目标区域之外的其他区域的像素值设置为所述第一值，得到所述虚假样本图像的虚假区域标签；其中，所述第二预设图像与所述虚假样本图像的尺寸相同，且所述第二值与所述第一值不同。
根据权利要求7所述的方法，其特征在于，所述真实性预测结果包括第二虚假区域预测结果和第二视觉真实预测结果；所述将所述拟合图像输入至通过所述第一训练得到的鉴别器中，以对所述拟合图像进行真实性鉴别，输出所述拟合图像的真实性预测结果，包括：

将所述拟合图像输入至通过所述第一训练得到的虚假区域鉴别器中，输出与所述拟合图像对应的第二虚假区域预测结果；及

将所述拟合图像输入至通过所述第一训练得到的视觉真实鉴别器中，输出与所述拟合图像对应的第二视觉真实预测结果。
根据权利要求10所述的方法，其特征在于，所述根据所述拟合图像的真实性预测结果对所述生成对抗网络中待训练的生成器进行第二训练，直至达到第二训练停止条件时停止，包括：

基于与所述拟合图像对应的第二虚假区域预测结果以及与真实样本图像对应的虚假区域标签，确定第二虚假区域损失；

基于与所述拟合图像对应的第二视觉真实预测结果以及与真实样本图像对应的图像真伪标签，确定第二视觉真实损失；

根据所述第二虚假区域损失和第二视觉真实损失构建生成器损失函数；及

通过所述生成器损失函数对所述生成对抗网络中待训练的生成器进行第二训练，直至达到第二训练停止条件时停止。
根据权利要求11所述的方法，其特征在于，所述方法还包括：

确定与所述真实样本图像对应的预测伪像图；及

基于所述真实样本图像对应的预测伪像图与所述真实样本图像对应的虚假区域标签间的差异，确定伪像损失；

所述根据所述第二虚假区域损失和第二视觉真实损失构建生成器损失函数，包括：

根据所述伪像损失、所述第二虚假区域损失及所述第二视觉真实损失，构建生成器损失函数。
一种图像真伪检测方法，由计算机设备执行，所述方法包括：

获取样本图像及各所述样本图像对应的图像标签；所述样本图像包括真实样本图像和虚假样本图像；所述图像标签包括虚假区域标签和图像真伪标签；

将各真实样本图像和虚假样本图像分别输入至生成对抗网络中待训练的生成器，通过所述待训练的生成器输出各真实样本图像和虚假样本图像分别对应的预测伪像图，并根据各所述预测伪像图，生成真实样本图像和虚假样本图像分别对应的拟合图像；

将所述真实样本图像、所述虚假样本图像和所述拟合图像分别输入至所述生成对抗网络中待训练的鉴别器中，输出第一虚假区域预测结果和第一视觉真实预测结果；

基于所述第一虚假区域预测结果与相对应的虚假区域标签间的第一差异以及所述第一视觉真实预测结果与相对应的图像真伪标签间的第二差异，对所述待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止；

将所述拟合图像输入至通过所述第一训练得到的鉴别器中，输出所述拟合图像的第二虚假区域预测结果和第二视觉真实预测结果；

基于所述第二虚假区域预测结果与所述真实样本图像所对应的虚假区域标签间的第三差异以及所述第二视觉真实预测结果与所述真实样本图像所对应的图像真伪标签间的第四差异，对所述待训练的生成器进行第二训练，直至达到第二训练停止条件时停止；及

交替进行所述第一训练和所述第二训练，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络；所述训练好的生成对抗网络中的生成器用于对待检测图像进行图像真伪检测。
一种图像真伪检测装置，其特征在于，所述装置包括：

图像获取模块，用于获取待检测图像；

伪像图生成模块，用于将所述待检测图像输入至生成对抗网络的生成器中，通过所述生成器输出与所述待检测图像对应的伪像图；所述伪像图用于表征所述待检测图像与真实图像间的差异；其中，所述生成对抗网络在训练阶段还包括鉴别器；在所述训练阶段，所述生成器用于输出与样本图像对应的预测伪像图，并基于所述预测伪像图生成拟合图像；所述鉴别器用于对所述拟合图像进行真实性鉴别，以辅助所述生成器学习到虚假图像与真实图像间的差异特征；及

判定模块，用于基于所述伪像图确定所述待检测图像的真伪检测结果。
根据权利要求14所述的装置，其特征在于，所述图像获取模块还包括视频解析模块，用于获取包括有人脸的待检测视频；对所述待检测视频进行解析得到对应的视频帧；及对所述视频帧进行人脸检测，并基于人脸检测的结果从所述视频帧中裁剪出包括有人脸区域的人脸图像。
根据权利要求14所述的装置，其特征在于，所述判定模块还用于确定所述伪像图所包括的各像素点的像素值；基于各所述像素点的像素值确定与所述伪像图对应的平均像素值；当所述平均像素值大于等于像素阈值时，确定所述待检测图像为虚假图像；及当所述平均像素值小于所述像素阈值时，确定所述待检测图像为真实图像。
根据权利要求14所述的装置，其特征在于，所述图像真伪检测装置还用于当所述待检测图像的真伪检测结果表示所述待检测图像为虚假图像时，获取对应的标记信息；及将所述标记信息添加至所述待检测图像中；所述标记信息用于表征所述待检测图像为虚假图像。
一种图像真伪检测装置，其特征在于，所述装置包括：

获取模块，用于获取样本图像及各所述样本图像对应的图像标签；所述样本图像包括真实样本图像和虚假样本图像；所述图像标签包括虚假区域标签和图像真伪标签；

拟合图像生成模块，用于将各真实样本图像和虚假样本图像分别输入至生成对抗网络中待训练的生成器，通过所述待训练的生成器输出各真实样本图像和虚假样本图像分别对应的预测伪像图，并根据各所述预测伪像图，生成真实样本图像和虚假样本图像分别对应的拟合图像；

训练模块，用于将所述真实样本图像、所述虚假样本图像和所述拟合图像分别输入至生成对抗网络中待训练的鉴别器中，输出第一虚假区域预测结果和第一视觉真实预测结果；

所述训练模块，还用于基于所述第一虚假区域预测结果与相对应的虚假区域标签间的第一差异以及所述第一视觉真实预测结果与相对应的图像真伪标签间的第二差异，对所述待训练的鉴别器进行第一训练，直至达到第一训练停止条件时停止；

所述训练模块，用于将所述拟合图像输入至通过所述第一训练得到的鉴别器中，输出所述拟合图像的第二虚假区域预测结果和第二视觉真实预测结果；

所述训练模块，还用于基于所述第二虚假区域预测结果与所述真实样本图像所对应的虚假区域标签间的第三差异以及所述第二视觉真实预测结果与所述真实样本图像所对应的图像真伪标签间的第四差异，对所述待训练的生成器进行第二训练，直至达到第二训练停止条件时停止；及

所述训练模块，还用于交替进行所述第一训练和所述第二训练，直至达到迭代停止条件时停止训练，得到训练好的生成对抗网络；所述训练好的生成对抗网络中的生成器用于对待检测图像进行图像真伪检测。
一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如权利要求1至13中任一项所述方法的步骤。
一种计算机设备，包括存储器和一个或多个处理器，所述存储器存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述方法的步骤。