WO2018036293A1

WO2018036293A1 - 图像分割方法、装置及全卷积网络系统

Info

Publication number: WO2018036293A1
Application number: PCT/CN2017/092614
Authority: WO
Inventors: 孙海鸣; 谢迪; 浦世亮
Original assignee: Hangzhou Hikvision Digital Technology Co Ltd
Current assignee: Hangzhou Hikvision Digital Technology Co Ltd
Priority date: 2016-08-26
Filing date: 2017-07-12
Publication date: 2018-03-01
Anticipated expiration: 2019-02-26
Also published as: EP3506200A4; EP3506200B1; CN107784654A; CN107784654B; EP3506200A1; US20190228529A1; US11151723B2

Abstract

本申请实施例提供了一种图像分割方法、装置及全卷积网络系统。其中，所述方法包括：获得待处理的目标图像；获得目标图像的图像特征数据；将图像特征数据输入至预先训练得到的用于图像分割的目标网络中，得到输出结果；目标网络为包括混合上下文网络结构的全卷积网络，所述混合上下文网络结构用于将自身所提取的多个具有预定尺度范围的参考特征融合为目标特征，目标特征为与所分割图像中目标对象的尺度范围相匹配的特征；目标网络通过具有不同尺度范围的目标对象的样本图像训练而成；基于输出结果，得到目标图像所对应的图像分割结果。通过本方案可以在保证大的感受野的前提下，提升对图像中不同尺度范围的目标对象的分割有效性。

Description

图像分割方法、装置及全卷积网络系统

本申请要求于2016年8月26日提交中国专利局、申请号为201610734168.4发明名称为“图像分割方法、装置及全卷积网络系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及机器视觉技术领域，特别是涉及图像分割方法、装置及全卷积网络系统。

背景技术

语义分割和场景标记等类型的图像分割在很多应用场景中都有着十分重要的作用，例如图片理解、自动驾驶等应用场景，这样使得图像分割对于机器理解图像有着重要的意义；其中，所谓的语义分割为：给定一张图像，对于图像中的像素做分类；所谓的场景标记为：按照图像语义对图像中的区域进行标记。而近年来，全卷积网络为图像的语义分割和场景标记带来了显著的性能提升，具体的，通过借助全卷积网络良好的分类性能，对图像中的像素进行密集的类别预测，最后借助条件随机场一类的方法，综合预测最终结果。相关技术中，用于图像分割的全卷积网络主要是由卷积层、池化层和激活层构成的网络，且全卷积网络相对于卷积网络不存在全连接层。

其中，全卷积网络中，大的感受野意味着更多的空间上下文信息被考虑，可以增加预测准确性，所谓感受野为输出特征图的某个节点的响应对应的输入图像的区域。相关技术中增大感受野的方式包括两种：其一，增加卷积核的大小，其二，增加池化层；其中，对于第一种方式而言，会带来参数的膨胀，也就是需要被训练的参数过多，导致无法被正常训练；而对于第二种方式而言，由于池化层的存在，使得网络中的特征图的空间尺寸随着网络的加深而逐渐变小，导致分辨率变低，最终使得全卷积网络对于图像中的目标的边缘往往预测结果不佳，如果增加池化层，无疑导致图像中小目标的预测精度下降。由于存在上述问题，多孔卷积被提出，一定程度上解决了上述问题。其中，多孔卷积通过在卷积核中填充零元素，达到了增大卷积核同时不会导致参数爆炸，而且，多孔卷积可以帮助移除网络中的部分池化层，使得特征图随着网络的加深保持不变。这些优点，使得多孔卷积在图像分割应用中得到广泛的应用。

另外，在图像分割的具体应用中，图像中目标对象的尺度具有差异性，也就是说，有非常大的目标，也有非常小的目标。而一个全卷积网络往往有其所适用的尺度范围，也就是最适合处理哪个尺度范围的目标对象，举例而言：在多孔卷积中选择不同的膨胀系数，往往会使得全卷积网络适用不同的尺度范围。并且，全卷积网络中，卷积操作提取的特征的尺度范围，不但和卷积层的感受野成正比，同时也和该卷积层的膨胀系数成正比，而且，所提取的特征的尺度如果较大，会导致尺度小的目标对象被忽略。因此，如何在保证大的感受野的前提下，对图像中不同尺度范围的目标对象进行有效分割，是一个值得关注的问题，

相关技术中，存在一种ASPP(Atrous spatial pyramid pooling)的结构的全卷积网络，具体为：构建多个分支，每个分支由具有不同膨胀系数的多孔卷积构成，然后综合多个分支的结果进行预测。但是，由于膨胀系数固定，最适合处理哪个尺度范围的目标对象也即被确定了，导致所适用的目标对象被固定，自由度不够。

可见，如何在保证大的感受野的前提下，提升对图像中不同尺度范围的目标对象的分割有效性，是一个亟待解决的问题。

发明内容

本申请实施例的目的在于提供一种图像分割方法、装置及全卷积网络系统，以在保证大的感受野的前提下，提升对图像中不同尺度范围的目标对象的分割有效性。具体技术方案如下：

第一方面，本申请实施例提供了一种图像分割方法，包括：

获得待处理的目标图像；

获得所述目标图像的图像特征数据；

将所述图像特征数据输入至预先训练得到的用于图像分割的目标网络中，得到输出结果；其中，所述目标网络为包括混合上下文网络结构的全卷积网络，所述混合上下文网络结构用于将自身所提取的多个具有预定尺度范围的参考特征融合为目标特征，所述目标特征为与所分割图像中目标对象的尺度范围相匹配的特征；所述目标网络通过具有不同尺度范围的目标对象的样本图像训练而成；

基于所述输出结果，得到所述目标图像所对应的图像分割结果。

可选的，所述混合上下文网络结构具体为非多孔卷积与多孔卷积相结合的卷积结构。

可选的，所述混合上下文网络结构包括：至少一个混合上下文组件；

每一混合上下文组件均包括：多孔卷积分支、非多孔卷积分支、通道串联层和非多孔卷积层，其中，所述多孔卷积分支和所述非多孔卷积分支分别对所在的混合上下文组件的输入内容进行卷积处理，所述通道串联层将所述多孔卷积分支的卷积结果以及所述非多孔卷积分支的卷积结果进行串联处理，所述非多孔卷积层对所述通道串联层的处理结果进行卷积处理并将所得的卷积结果作为所在的混合上下文组件的输出内容进行输出。

可选的，所述多孔卷积分支中包括至少一个多孔卷积，所述非多孔卷积中包括至少一个非多孔卷积。

可选的，所述混合上下文组件采用下述卷积公式对输入内容进行卷积处理：

其中，F_i表示第i层的输入特征图，F_i+1表示第i层的输出特征图，W_k表示多孔卷积分支和非多孔卷积分支的参数，b_k表示多孔卷积分支和非多孔卷积分支的偏移项，ψ表示多孔卷积分支和非多孔卷积分支的激活函数，c()表示在通道坐标轴上串联所有的输入矩阵，W_i表示非多孔卷积层的参数，b_i表示非多孔卷积层的偏移项，

表示非多孔卷积层的激活函数。

可选的，所述目标网络的训练过程为：

构建包括混合上下文网络结构的初始全卷积网络；

获得各个样本图像的图像特征数据；

将各个样本图像的图像特征数据输入至所述初始全卷积网络中进行训练；

当各个训练样本所对应的输出结果均与相应图像分割真值的损失值低于预定阈值时，训练过程结束，得到目标网络。

第二方面，本申请实施例提供了一种图像分割装置，包括：

目标图像获得模块，用于获得待处理的目标图像；

图像特征数据获得模块，用于获得所述目标图像的图像特征数据；

图像分割模块，用于将所述图像特征数据输入至预先训练得到的用于图像分割的目标网络中，得到输出结果；其中，所述目标网络为包括混合上下文网络结构的全卷积网络，所述混合上下文网络结构用于将自身所提取的多个具有预定尺度范围的参考特征融合为目标特征，所述目标特征为与所分割图像中目标对象的尺度范围相匹配的特征；所述目标网络通过具有不同尺度范围的目标对象的样本图像训练而成；

结果获得模块，用于基于所述输出结果，得到所述目标图像所对应的图像分割结果。

表示非多孔卷积层的激活函数。

可选的，所述目标网络由训练模块训练而成，所述训练模块包括：

构建单元，用于构建包括混合上下文网络结构的初始全卷积网络；

特征数据获得单元，用于获得各个样本图像的图像特征数据；

训练单元，用于将各个样本图像的图像特征数据输入至所述初始全卷积网络中进行训练；

判断单元，用于当各个训练样本所对应的输出结果均与相应图像分割真值的损失值低于预定阈值时，训练过程结束，得到目标网络。

第三方面，本申请实施例还提供了一种全卷积网络系统，包括：混合上下文网络结构；

所述混合上下文网络结构包括：至少一个混合上下文组件；

表示非多孔卷积层的激活函数。

第四方面，本申请实施例还提供了一种电子设备，包括：

处理器、存储器；

所述存储器存储可执行程序代码；

所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于在运行时执行本申请第一方面所述的一种图像分割方法。

第五方面，本申请提供了一种存储介质，其中，该存储介质用于存储可执行程序代码，所述可执行程序代码用于在运行时执行本申请第一方面所述的一种图像分割方法。

本申请实施例中，用于图像分割的目标网络为具有混合上下文网络结构的全卷积网络，该混合上下文网络结构能够将自身所提取的多个具有预定尺度范围的参考特征融合为：与所分割图像中目标对象的尺度范围相匹配的特征，使得图像中的各个尺度范围的目标对象均不被忽略，同时，感受野依赖具有最大膨胀系数的卷积，因此，通过本方案可以在保证大的感受野的前提下，提升对图像中不同尺度范围的目标对象的分割有效性。

附图说明

为了更清楚地说明本申请实施例和现有技术的技术方案，下面对实施例和现有技术中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例所提供的一种图像分割方法的流程图；

图2为本申请实施例所提供的混合上下文组件的结构示意图；

图3为本申请实施例所列举的用于分割图像的目标网络的示意图；

图4为本申请实施例中目标网络的训练过程的流程图；

图5为本申请实施例所提供的一种图像分割装置的结构示意图；

图6为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了在保证大的感受野的前提下，提升对图像中不同尺度范围的目标对象的分割有效性，本申请实施例提供了一种图像分割方法、装置及全卷积网络。其中，本申请实施例所涉及的图像分割可以指：对图像的语义分割，或者，对图像的场景标记，可选地，还可以指其他对图像中区域进行划分的方式，在此不做限定。

下面首先对本申请实施例所提供的一种图像分割方法进行介绍。

需要说明的是，本申请实施例所提供的一种图像分割方法的执行主体可以为一种图像分割装置，其中，该图像分割装置可以为相关技术中图像处理软件中的功能插件，也可以为独立的功能软件，这都是合理的；另外，该图像分割装置可以应用于电子设备中，该电子设备可以包括终端设备或服务器设备，这也是合理的。

如图1所示，本申请实施例所提供的一种图像分割方法，可以包括如下步骤：

S101，获得待处理的目标图像；

其中，所谓的获得待处理的目标图像可以为：从本地获得待处理的目标图像，或者，从网络中下载获得待处理的目标图像，等等，这都是合理的。并且，该目标图像中可以包含不同尺度范围的目标对象，例如，该目标图像为路边摄像头所拍摄的监控图像，该目标图像中包括属于近景的汽车和行人，还包括属于远景的小鸟，其中，该属于近景的汽车和行人为大尺度范围的目标对象，该属于远景的小鸟为小尺度范围的目标对象。

需要强调的是，大小尺度范围的设定是一个相对的概念，并不是指某个具体的尺度范围；但是，对于现有技术中的全卷积网络而言，如果该网络善于处理尺度较大的目标对象，通常就不适合处理尺度较小的目标对象，大小是相对的，举例而言：相关技术中的全卷积网络A适合处理100*100像素的目标对象，那么10*10的目标对象就是小尺度范围的目标对象，该小尺度范围的目标对象则会被该全卷积网络A忽略，类似的，如果全卷积网络B适合处理1000*1000的目标对象时，100*100的目标对象可以被认为是小尺度范围的目标对象，该小尺度范围的目标对象则会被该全卷积网络B忽略。也就是说，利用相关技术中的全卷积网络的图像分割方法所适用的尺度范围具有局限性，而本申请实施例所提供的图像分割方法利用包含混合上下文网络结构的目标网络，目的在于扩大所适用的尺度范围。

S102，获得该目标图像的图像特征数据；

为了对目标图像进行图像分割，可以获得目标图像的图像特征数据，其中，该图像特征数据能够唯一确定出该目标图像。

具体的，该图像特征数据可以包括但不局限于颜色通道值，其中，对于RGB图像而言，其颜色通道值为RGB通道值，RGB图像和RGB通道值中的“R”代表红色Red，“G”代表绿色Green，“B”代表蓝色Blue。可以理解的是，该图像分割装置可以调用外部的颜色提取器提取颜色通道值，也可以通过内置的程序代码自行提取颜色通道值，这都是合理的，其中，颜色提取器为能够提取图像中像素点的颜色通道值的功能软件。

S103，将该图像特征数据输入至预先训练得到的用于图像分割的目标网络中，得到输出结果；其中，该目标网络为包括混合上下文网络结构的全卷积网络，该混合上下文网络结构用于将自身所提取的多个具有预定尺度范围的参考特征融合为目标特征，该目标特征为与所分割图像中目标对象的尺度范围相匹配的特征；该目标网络通过具有不同尺度范围的目标对象的样本图像训练而成；

为了在保证大的感受野的前提下，提升对图像中不同尺度范围的目标对象的分割有效性，预先训练得到用于图像分割的目标网络，该目标网络为包括混合上下文网络结构的全卷积网络，也就是说，该目标网络属于全卷积网络，但是该目标网络在包括卷积层、池化层和激活层的基础上，还额外增加有混合上下文网络结构，具体的，该混合上下文网络结构用于将自身所提取的多个具有预定尺度范围的参考特征融合为目标特征，该目标特征为与所分割图像中目标对象的尺度范围相匹配的特征。其中，卷积层用于进行卷积处理，池化层用于进行上采样或下采用处理，激活层用于引入非线性因素，并且，对于一个全卷积网络结构而言，可以仅仅具有一个激活层，而多个卷积层和池化层，并且，池化层和激活层位于卷积层之后。

可以理解的是，由于目标网络中增加有混合上下文网络结构，可以融合来自不同尺度范围的特征图的特征，从而形成与所分割图像中目标对象的尺度范围相匹配的特征，这样使得该目标网络能够通过对样本图像的学习，自动调节自身适应的尺度范围，需要强调的是，在训练该目标网络时，可以利用具有不同尺度范围的目标对象的样本图像。为了布局清楚，后续对该目标网络的训练过程进行介绍。

在分割该目标图像的过程中，可以在获得该目标图像的图像特征数据后，将所获得的该目标图像的图像特征数据作为输入内容输入至该目标网络中，得到输出结果。

具体的，该混合上下文网络结构具体为非多孔卷积与多孔卷积相结合的卷积结构。其中，多孔卷积为通过在卷积核中填充零元素来扩大卷积核的一种卷积，非多孔卷积为：卷积核中未填充零元素以扩大卷积核的普通卷积。另外，需要强调的是，膨胀系数是和多孔卷积相关的属性，普通卷积，即非多孔卷积的膨胀系数为1，如果在普通卷积的卷积核的两个元素之间添加一个零，膨胀系数则为2，以此类推，添加N个零，膨胀系数则为(N+1)。

在一种实现方式中，该混合上下文网络结构包括：至少一个混合上下文组件；

如图2所示，每一混合上下文组件均包括：多孔卷积分支、非多孔卷积分支、通道串联层和非多孔卷积层，其中，该多孔卷积分支和该非多孔卷积分支分别对所在的混合上下文组件的输入内容进行卷积处理，该通道串联层将该多孔卷积分支的卷积结果以及该非多孔卷积分支的卷积结果进行串联处理，该非多孔卷积层对该通道串联层的处理结果进行卷积处理并将所得的卷积结果作为所在的混合上下文组件的输出内容进行输出。

需要强调的是，该混合上下文组件的输入可以是任何一个特征图，然后该特征图分别经过多孔卷积分支和非多孔卷积分支的卷积处理，在并行的卷积处理过程中，分别提取不同的预定尺度范围的特征，预定尺度范围受膨胀系数影响，然后，通过通道串联层和非多孔卷积层的处理，实现从不同的预定尺度范围的特征中筛选出新尺度范围的特征作为输出，该新尺度范围的特征为与所分割图像中目标对象的尺度范围相匹配的特征。

本领域技术人员可以理解的是，对于相关技术中的全卷积网络而言，其某一个卷积层的卷积核的膨胀系数是固定的，随着感受野的增大，其卷积核提取的特征的尺度范围也随着变大，如下的公式(1)表示一个卷积层，

其中，W_i表示第i层的卷积核参数，F_i表示第i层的输入特征图，F_i+1表示第i层的输出特征图，b_i表示偏移项，

表示激活函数，其中，W_i中的所有卷积核都是同样大小，同样膨胀系数的。

而对于混合上下文网络结构而言，如果将一个混合上下文组件看作为一个卷积层，那么，该混合上下文组件采用如下卷积公式(2)进行卷积处理：

表示非多孔卷积层的激活函数。其中，c具体是让两个四维的矩阵，在第二个维度上连接起来，变成一个矩阵，举例而言，n*c1*h*w的矩阵和n*c2*h*w的矩阵合并起来，变成n*(c1+c2)*h*w。另外，需要强调的是，F表示特征图，是一个矩阵，而感受野是指特征图中的一个元素对应到原图有多大的区域，感受野可以看作为是这个特征图的一个属性。

具体的，W_i的卷积核大小可以为1。W_k既可以是一个多孔卷积也可以是一个非多孔卷积。可以理解的是，卷积提取的特征的尺度范围和卷积的膨胀系数是成正比的，也就是说，提供给W_i筛选的特征中，既有大尺度的特征，也有小尺度的特征。

可以理解的是，F_i+1的感受野依赖具有最大膨胀系数的卷积。也就是说，F_i+1可以具有较大的感受野的同时，根据所输入图像的尺度范围选择来输出大尺度的特征或者小尺度的特征，或者它们的混合物，即输出所分割图像中目标对象的尺度范围相匹配的特征，而不是像相关技术中全卷积网络，只能输出某一个尺度的特征。这无疑给了目标网络更大的自由度，目标网络可以从指定的样本图像中学习到什么样的尺度组合是最好的。

可以理解的是，该多孔卷积分支中包括至少一个多孔卷积，该非多孔卷积中包括至少一个非多孔卷积。并且，当混合上下文网络结构包括至少两个混合上下文组件时，该至少两个混合上下文组件串联相接。另外，可以理解的是，当该混合上下文网络结构包括多个多孔卷积分支时，该混合上下文网络结构中必然存在多个多孔卷积，而当该混合上下文网络结构中的任一多孔卷积分支中包括多个多孔卷积时，该混合上下文网络结构中也会存在多个多孔卷积；进一步的，当混合上下文网络结构中存在多个多孔卷积时，多个多孔卷积的膨胀系数可以根据实际情况进行设定，本申请实施例对此不做限定。

需要强调的是，在具体应用时，该混合上下文网络结构可以设置在整个目标网络的后半段，当然并不局限于此，而由于整个网络形态的复杂和多样化，对于该混合上下文网络结构在网络中的具体位置，本申请实施例不做限定。可以理解的是，对于本申请实施例所提供的包含上下文混合网络结构的目标网络而言，从功能的角度，可以被划分为三个部分，第一部分为分类预测模块，第二部分为上下文综合判断模块，第三部分为修正模块，其中，混合上下文网络结构即为该上下文综合判断模块；具体的，分类预测模块用于对特征图中像素点所属的类别进行初步预测，上下文综合判断模块用于在分类预测模块的基础上基于更多的上下文信息来进行分类，而修正模块用于在上下文综合判断模块的输出结果的基础上来基于更加细节的信息修正边缘和小目标对象。

举例而言：在如图3所示的目标网络的一种结构示意图中，混合上下文网络结构包括5个混合上下文组件，每个混合上下文组件中的多孔卷积分支包括一个多孔卷积，非多孔卷分支包括一个非多孔卷积，另外，222*224，112*112等为特征图的大小，通过特征图的大小值体现特征图的空间尺寸在网络运行中的改变。需要强调的是，图3的左半边为上述的分类预测模块所对应的分类预测流程，并且，由于该分类预测流程所对应的具体网络结构是一个由分类网络转化而来的FCN网络，且该分类网络可以是已存在的任一主流的分类网络，因此，图3中仅仅给出了特征图的示意，以从对特征图的处理的角度来来介绍具体的分类预测过程，其中，FCN网络为Fully Convolutional Networks，FCN网络将传统卷积神经网络的全连接层转化成一个个的卷积层，该FCN网络试图从抽象的特征中恢复出每个像素所属的类别，即从图像级别的分类进一步延伸到像素级别的分类。

S104，基于该输出结果，得到该目标图像所对应的图像分割结果。

在得到输出结果后，可以基于该输出结果，得到该目标图像所对应的图像分割结果。可以理解的是，该目标网络的输出结果为某些特征数据，可以根据这些特征数据生成该目标图像所对应的图像分割结果。

为了方案清楚，下面介绍该目标网络的训练过程。

具体的，如图4所示，所述目标网络的训练过程可以为：

S201，构建包括混合上下文网络结构的初始全卷积网络；

所谓构建包括混合上下文网络结构的初始全卷积网络即为构建一个包含混合上下文网络结构的全卷积网络，该全卷积网络中所涉及的多孔卷积和非多孔卷积的膨胀系数在构建目标网络时被设置完成。

需要强调的是，该初始全卷积网络为需要被训练的网络结构，也即参数未被训练得到的目标网络；并且，该初始全卷积网络中还包括卷积层、激活层、池化层，其中，混合上下文网络结构在初始全卷积网络中的具体位置可以根据实际情况自行设定，该初始全卷积网络中的卷积层、激活层和池化层的数量以及位置关系，可以根据实际情况设定。可选地，所构建的该初始全卷积网络中的卷积层、激活层和池化层之间的位置关系可以遵循一定的设计原则，举例而言：池化层和激活层在卷积层之后。

S202，获得各个样本图像的图像特征数据；

其中，样本图像的图像特征数据可以包括但不局限于颜色通道值，其中，对于RGB图像而言，其颜色通道值为RGB通道值；可选地，所获得的样本图像的图像特征数据与前述的获得目标图像的图像特征数据的类型相同。

S203，将各个样本图像的图像特征数据输入至初始全卷积网络中进行训练；

S204，当各个训练样本所对应的输出结果均与相应图像分割真值的损失值低于预定阈值时，训练过程结束，得到目标网络。

在获得各个样本图像的图像特征数据后，可以将各个样本图像的图像特征数据作为输入内容输入至初始全卷积网络中进行训练，并且，可以实时检测各个训练样本所对应的输出结果均与相应图像分割真值的损失值是否低于预定阈值，当各个训练样本所对应的输出结果均与相应图像分割真值的损失值低于预定阈值时，训练过程结束，得到目标网络，其中，每一样本图像对应的图像分割真值通过人工标注得到，且图像分割真值具体指样本图像被图像分割后的图像数据。

另外，需要说明的是，当各个训练样本所对应的输出结果与相应图像分割真值的损失值低于预定阈值时，可以利用优化算法对该初始全卷积网络进行网络优化。具体的，所谓优化指调整该初始全卷积网络中的参数，举例而言，卷积的卷积核和步长等等。另外，对该初始全卷积网络进行网络优化所采用的优化算法可以采用梯度下降法，其中，梯度下降法的基本处理思想为沿梯度下降的方向求解极小值(也可以沿梯度上升方向求解极大值)，具体的梯度下降法可以包括但不局限于SGD(stochastic gradient descent，随机梯度下降)算法或Mini批梯度算法。

相应于上述方法实施例，本申请实施例还提供了一种图像分割装置。

如图5所示，本申请实施例所提供的一种图像分割装置，可以包括：

目标图像获得模块310，用于获得待处理的目标图像；

图像特征数据获得模块320，用于获得该目标图像的图像特征数据；

图像分割模块330，用于将该图像特征数据输入至预先训练得到的用于图像分割的目标网络中，得到输出结果；其中，该目标网络为包括混合上下文网络结构的全卷积网络，该混合上下文网络结构用于将自身所提取的多个具有预定尺度范围的参考特征融合为目标特征，该目标特征为与所分割图像中目标对象的尺度范围相匹配的特征；该目标网络通过具有不同尺度范围的目标对象的样本图像训练而成；

结果获得模块340，用于基于该输出结果，得到该目标图像所对应的图像分割结果。

具体的，该混合上下文网络结构具体为非多孔卷积与多孔卷积相结合的卷积结构。

在一种具体实现方式中，该混合上下文网络结构可以包括：至少一个混合上下文组件；

每一混合上下文组件均包括：多孔卷积分支、非多孔卷积分支、通道串联层和非多孔卷积层，其中，该多孔卷积分支和该非多孔卷积分支分别对所在的混合上下文组件的输入内容进行卷积处理，该通道串联层将该多孔卷积分支的卷积结果以及该非多孔卷积分支的卷积结果进行串联处理，该非多孔卷积层对该通道串联层的处理结果进行卷积处理并将所得的卷积结果作为所在的混合上下文组件的输出内容进行输出。

具体的，该多孔卷积分支中包括至少一个多孔卷积，该非多孔卷积中包括至少一个非多孔卷积。

具体的，该混合上下文组件采用下述卷积公式对输入内容进行卷积处理：

表示非多孔卷积层的激活函数。

具体的，该目标网络由训练模块训练而成，该训练模块包括：

训练单元，用于将各个样本图像的图像特征数据输入至该初始全卷积网络中进行训练；

本申请实施例还提供了一种全卷积网络系统，可以应用于图像分割，当然并不局限与此。具体的，该全卷积网络系统包括：混合上下文网络结构；

该混合上下文网络结构包括：至少一个多个混合上下文组件；

需要强调的是，本申请实施例所提供的全卷积网络为：在包括卷积层、池化层和激活层的同时还包括有混合上下文网络结构的网络结构。

其中，混合上下文组件的结构可以参见图2所示。并且，当混合上下文网络结构所包括的混合上下文组件为至少两个时，该至少两个混合上下文组件串联相接。

可以理解的是，由于全卷积网络增加有混合上下文网络结构，可以融合来自不同尺度范围的特征图的特征，从而形成与所分割图像中目标对象的尺度范围相匹配的特征，这样使得该目标网络能够通过对样本图像的学习，自动调节自身适应的尺度范围，其中，在训练该全卷积网络时，可以利用具有不同尺度范围的目标对象的样本图像。

在具体应用时，该混合上下文网络结构可以设置在整个目标网络的后半段，当然并不局限于此，而由于整个网络形态的复杂和多样化，对于该混合上下文网络结构在网络中的具体位置，本申请实施例不做限定。可以理解的是，对于本申请实施例所提供的包含上下文混合网络结构的目标网络而言，从功能的角度，可以被划分为三个部分，第一部分为分类预测模块，第二部分为上下文综合判断模块，第三部分为修正模块，其中，混合上下文网络结构即为该上下文综合判断模块；具体的，分类预测模块用于对特征图中像素点所属的类别进行初步预测，上下文综合判断模块用于在分类预测模块的基础上基于更多的上下文信息来进行分类，，而修正模块用于在上下文综合判断模块的输出结果的基础上来基于更加细节的信息修正边缘和小目标对象。举例而言：在如图3所示的目标网络的一种结构示意图中，混合上下文网络结构包括5个混合上下文组件，每个混合上下文组件中的多孔卷积分支包括一个多孔卷积，非多孔卷分支包括一个非多孔卷积，另外，222*224，112*112等为特征图的大小，通过特征图的大小值体现特征图的空间尺寸在网络运行中的改变。需要强调的是，图3的左半边为上述的分类预测模块所对应的分类预测流程，并且，由于该分类预测流程所对应的具体网络结构是一个由分类网络转化而来的FCN网络，且该分类网络可以是已存在的任一主流的分类网络，因此，图3中仅仅给出了特征图的示意，以从对特征图的处理的角度来来介绍具体的分类预测过程，其中，FCN网络为Fully Convolutional Networks，FCN网络将传统卷积神经网络的全连接层转化成一个个的卷积层，该FCN网络试图从抽象的特征中恢复出每个像素所属的类别，即从图像级别的分类进一步延伸到像素级别的分类。

具体的，该多孔卷积分支中包括至少一个多孔卷积，该非多孔卷积中包括至少一个非多孔卷积。另外，可以理解的是，当该混合上下文网络结构包括多个多孔卷积分支时，该混合上下文网络结构中必然存在多个多孔卷积，而当该混合上下文网络结构中的任一多孔卷积分支中包括多个多孔卷积时，该混合上下文网络结构中也会存在多个多孔卷积；进一步的，当混合上下文网络结构中存在多个多孔卷积时，多个多孔卷积的膨胀系数可以根据实际情况进行设定，本申请实施例对此不做限定。

并且，可以理解的是，F_i+1的感受野依赖具有最大膨胀系数的卷积。也就是说，F_i+1可以具有较大的感受野的同时，根据所输入图像的尺度范围选择输出大尺度的特征或者小尺度的特征，或者它们的混合物，即输出所分割图像中目标对象的尺度范围相匹配的特征而不是像相关技术中全卷积网络，只能输出某一个尺度的特征。这无疑给了目标网络更大的自由度，目标网络可以从指定的样本图像中学习到什么样的尺度组合是最好的。

相应地，本申请实施例还提供了一种电子设备，可以包括：

处理器、存储器；

所述存储器存储可执行程序代码；

所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于在运行时执行本申请实施例所述的一种图像分割方法，其中，所述图像分割方法包括：

获得待处理的目标图像；

获得所述目标图像的图像特征数据；

相应地，如图6所示，本申请实施例还提供了一种电子设备，可以包括：

处理器410、存储器420、通信接口430和总线440；

所述处理器410、所述存储器420和所述通信接口430通过所述总线440连接并完成相互间的通信；

所述存储器420存储可执行程序代码；

所述处理器410通过读取所述存储器420中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于在运行时执行本申请实施例所述的一种图像分割方法，其中，所述图像分割方法包括：

获得待处理的目标图像；

获得所述目标图像的图像特征数据；

相应地，本申请实施例还提供了一种存储介质，其中，该存储介质用于存储可执行程序代码，所述可执行程序代码用于在运行时执行本申请实施例所述的一种图像分割方法，其中，所述图像分割方法包括：

获得待处理的目标图像；

获得所述目标图像的图像特征数据；

相应地，本申请实施例还提供了一种应用程序，其中，该应用程序用于在运行时执行本申请实施例所述的一种图像分割方法，其中，所述图像分割方法包括：

获得待处理的目标图像；

获得所述目标图像的图像特征数据；

对于装置/电子设备/存储介质/应用程序实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机可读取存储介质中，这里所称得的存储介质，如：ROM/RAM、磁碟、光盘等。

以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

Claims

一种图像分割方法，其特征在于，包括：

获得待处理的目标图像；

获得所述目标图像的图像特征数据；

将所述图像特征数据输入至预先训练得到的用于图像分割的目标网络中，得到输出结果；其中，所述目标网络为包括混合上下文网络结构的全卷积网络，所述混合上下文网络结构用于将自身所提取的多个具有预定尺度范围的参考特征融合为目标特征，所述目标特征为与所分割图像中目标对象的尺度范围相匹配的特征；所述目标网络通过具有不同尺度范围的目标对象的样本图像训练而成；

基于所述输出结果，得到所述目标图像所对应的图像分割结果。
根据权利要求1所述的方法，其特征在于，所述混合上下文网络结构具体为非多孔卷积与多孔卷积相结合的卷积结构。
根据权利要求2所述的方法，其特征在于，所述混合上下文网络结构包括：至少一个混合上下文组件；

每一混合上下文组件均包括：多孔卷积分支、非多孔卷积分支、通道串联层和非多孔卷积层，其中，所述多孔卷积分支和所述非多孔卷积分支分别对所在的混合上下文组件的输入内容进行卷积处理，所述通道串联层将所述多孔卷积分支的卷积结果以及所述非多孔卷积分支的卷积结果进行串联处理，所述非多孔卷积层对所述通道串联层的处理结果进行卷积处理并将所得的卷积结果作为所在的混合上下文组件的输出内容进行输出。
根据权利要求3所述的方法，其特征在于，所述多孔卷积分支中包括至少一个多孔卷积，所述非多孔卷积中包括至少一个非多孔卷积。
根据权利要求3所述的方法，其特征在于，所述混合上下文组件采用下述卷积公式对输入内容进行卷积处理：

其中，F_i表示第i层的输入特征图，F_i+1表示第i层的输出特征图，W_k表示多孔卷积分支和非多孔卷积分支的参数，b_k表示多孔卷积分支和非多孔卷积分支的偏移项，ψ表示多孔卷积分支和非多孔卷积分支的激活函数，c()表示在通道坐标轴上串联所有的输入矩阵，W_i表示非多孔卷积层的参数，b_i表示非多孔卷积层的偏移项，
表示非多孔卷积层的激活函数。
根据权利要求1-5任一项所述的方法，其特征在于，所述目标网络的训练过程为：

构建包括混合上下文网络结构的初始全卷积网络；

获得各个样本图像的图像特征数据；

将各个样本图像的图像特征数据输入至所述初始全卷积网络中进行训练；

当各个训练样本所对应的输出结果均与相应图像分割真值的损失值低于预定阈值时，训练过程结束，得到目标网络。
一种图像分割装置，其特征在于，包括：

目标图像获得模块，用于获得待处理的目标图像；

图像特征数据获得模块，用于获得所述目标图像的图像特征数据；

图像分割模块，用于将所述图像特征数据输入至预先训练得到的用于图像分割的目标网络中，得到输出结果；其中，所述目标网络为包括混合上下文网络结构的全卷积网络，所述混合上下文网络结构用于将自身所提取的多个具有预定尺度范围的参考特征融合为目标特征，所述目标特征为与所分割图像中目标对象的尺度范围相匹配的特征；所述目标网络通过具有不同尺度范围的目标对象的样本图像训练而成；

结果获得模块，用于基于所述输出结果，得到所述目标图像所对应的图像分割结果。
根据权利要求7所述的装置，其特征在于，所述混合上下文网络结构具体为非多孔卷积与多孔卷积相结合的卷积结构。
根据权利要求8所述的装置，其特征在于，所述混合上下文网络结构包括：至少一个混合上下文组件；

每一混合上下文组件均包括：多孔卷积分支、非多孔卷积分支、通道串联层和非多孔卷积层，其中，所述多孔卷积分支和所述非多孔卷积分支分别对所在的混合上下文组件的输入内容进行卷积处理，所述通道串联层将所述多孔卷积分支的卷积结果以及所述非多孔卷积分支的卷积结果进行串联处理，所述非多孔卷积层对所述通道串联层的处理结果进行卷积处理并将所得的卷积结果作为所在的混合上下文组件的输出内容进行输出。
根据权利要求9所述的装置，其特征在于，所述多孔卷积分支中包括至少一个多孔卷积，所述非多孔卷积中包括至少一个非多孔卷积。
根据权利要求9所述的装置，其特征在于，所述混合上下文组件采用下述卷积公式对输入内容进行卷积处理：

其中，F_i表示第i层的输入特征图，F_i+1表示第i层的输出特征图，W_k表示多孔卷积分支和非多孔卷积分支的参数，b_k表示多孔卷积分支和非多孔卷积分支的偏移项，ψ表示多孔卷积分支和非多孔卷积分支的激活函数，c()表示在通道坐标轴上串联所有的输入矩阵，W_i表示非多孔卷积层的参数，b_i表示非多孔卷积层的偏移项，
表示非多孔卷积层的激活函数。
根据权利要求7-11任一项所述的装置，其特征在于，所述目标网络由训练模块训练而成，所述训练模块包括：

构建单元，用于构建包括混合上下文网络结构的初始全卷积网络；

特征数据获得单元，用于获得各个样本图像的图像特征数据；

训练单元，用于将各个样本图像的图像特征数据输入至所述初始全卷积网络中进行训练；

判断单元，用于当各个训练样本所对应的输出结果均与相应图像分割真值的损失值低于预定阈值时，训练过程结束，得到目标网络。
一种全卷积网络系统，其特征在于，包括：混合上下文网络结构；

所述混合上下文网络结构包括：至少一个混合上下文组件；

每一混合上下文组件均包括：多孔卷积分支、非多孔卷积分支、通道串联层和非多孔卷积层，其中，所述多孔卷积分支和所述非多孔卷积分支分别对所在的混合上下文组件的输入内容进行卷积处理，所述通道串联层将所述多孔卷积分支的卷积结果以及所述非多孔卷积分支的卷积结果进行串联处理，所述非多孔卷积层对所述通道串联层的处理结果进行卷积处理并将所得的卷积结果作为所在的混合上下文组件的输出内容进行输出。
根据权利要求13所述的全卷积网络系统，其特征在于，所述多孔卷积分支中包括至少一个多孔卷积，所述非多孔卷积中包括至少一个非多孔卷积。
根据权利要求13或14所述的全卷积网络系统，其特征在于，所述混合上下文组件采用下述卷积公式对输入内容进行卷积处理：

其中，F_i表示第i层的输入特征图，F_i+1表示第i层的输出特征图，W_k表示多孔卷积分支和非多孔卷积分支的参数，b_k表示多孔卷积分支和非多孔卷积分支的偏移项，ψ表示多孔卷积分支和非多孔卷积分支的激活函数，c()表示在通道坐标轴上串联所有的输入矩阵，W_i表示非多孔卷积层的参数，b_i表示非多孔卷积层的偏移项，
表示非多孔卷积层的激活函数。
一种电子设备，其特征在于，包括：

处理器、存储器；

所述存储器存储可执行程序代码；

所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于执行如权利要求1-6任一项所述的一种图像分割方法。
一种存储介质，其特征在于，所述存储介质用于存储可执行程序代码，所述可执行程序代码用于在运行时执行如权利要求1-6任一项所述的一种图像分割方法。