WO2020038243A1

WO2020038243A1 - 一种视频摘要生成方法、装置、计算设备和存储介质

Info

Publication number: WO2020038243A1
Application number: PCT/CN2019/100051
Authority: WO
Inventors: 张�浩; 黄湘琦; 陈泳君
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-08-21
Filing date: 2019-08-09
Publication date: 2020-02-27
Anticipated expiration: 2021-02-21
Also published as: US11347792B2; CN110166851B; CN110166851A; US20200409996A1; EP3843418A4; EP3843418A1; EP3843418B1

Abstract

本申请实施例公开了一种视频摘要生成方法、装置、计算设备、和存储介质，本申请实施例中方法包括：根据选择的筛选条件，获取用于生成视频摘要的目标筛选条件；根据目标筛选条件在视频数据库中查找结构化图像数据，得到符合目标筛选条件的结构化图像数据，所述结构化图像数据为结构化存储的目标跟踪序列的数据；对结构化图像数据进行视频合成，生成视频摘要。

Description

一种视频摘要生成方法、装置、计算设备和存储介质

本申请要求于2018年8月21日提交中国专利局、申请号为201810955587.X、名称为“一种视频摘要生成方法、装置和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信技术领域，具体涉及一种视频摘要生成方法、装置、计算设备和存储介质。

背景

视频摘要的英文名是Video Abstract，它是一个可以概括原始视频主要内容的技术。随着我们对视频数据处理的要求不断提高和视频数据量的不断增多，人们需要为一长段视频建立一段摘要来快速浏览以便更好地利用它。通过视频摘要技术，让我们在基于内容的视频检索中不仅仅能利用文字，而且能够充分利用音视频信息。视频摘要技术解决的问题是如何使视频数据有效的表示和快速的访问，它是利用对视频内容的分析来减小视频存储、分类和索引的代价，提高视频的使用效率、可用性和可访问性，是基于内容的视频分析技术的发展。

技术内容

本申请实施例提供了一种视频摘要生成方法，该方法包括：

获取用于生成视频摘要的目标筛选条件；

根据所述目标筛选条件在视频数据库中查找结构化图像数据，得到符合所述目标筛选条件的结构化图像数据，所述结构化图像数据为结构化存储的图像数据；

对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。

本申请实施例提供一种视频摘要生成装置，该装置包括：

第一获取单元，用于获取用于生成视频摘要的目标筛选条件；

查找单元，用于根据所述目标筛选条件在视频数据库中查找结构化图像数据，得到符合所述目标筛选条件的结构化图像数据，所述结构化图像数据为结构化存储的图像数据；

生成单元，用于对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。

本申请实施例还提供一种计算设备，包括处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置执行本申请实施例所述的视频摘要生成方法。

本申请实施例还提供一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本申请实施例所述的视频摘要生成方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的视频摘要生成系统的一个实施例示意图；

图2A是本申请实施例提供的视频摘要生成方法的一个实施例示意图；

图2B为本申请实施例所述的步骤S102的具体流程图；

图2C为本申请实施例中对待处理视频处理并将处理结果存储到该视频数据库的步骤的具体流程图；

图2D为本申请实施例所述的步骤S121的具体流程图；

图2E为本申请实施例所述的步骤S213的具体流程图；

图2F为本申请实施例所述的步骤S312的具体流程图；

图2G为本申请实施例所述的步骤S413的具体流程图；

图2H为本申请实施例所述的步骤S214的具体流程图；

图2I为本申请实施例所述的步骤S123的具体流程图；

图3是本申请实施例提供的每帧图像的单通道灰度图及每帧图像中的局部特征图合成每帧图像的有效图像的一个实施例示意图；

图4是本申请实施例提供的视频摘要生成方法的另一个实施例示意图；

图5是本申请实施例提供的视频摘要生成应用场景的一个实施例示意图；

图6A是本申请实施例提供的视频摘要生成装置的一个实施例示意图

图6B是本申请实施例中查找单元的结构示意图；

图6C是本申请实施例中属性分析单元的结构示意图；

图7是本申请实施例提供的服务器设备的结构示意图。

实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在以下的说明中，本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明，除非另有说明。因此，这些步骤及操作将有数次提到由计算机执行，本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处，其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置，其具有由该数据格式所定义的特定特性。但是，本申请原理以上述文字来说明，其并不代表为一种限制，本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。

本文所使用的术语「模块」可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而在一些实施例中，本文所述的装置及方法以软件的方式进行实施，当然也可在硬件上进行实施，均在本申请保护范围之内。

视频摘要是一个可以概括原始视频主要内容的技术。随着我们对视频数据处理的要求不断提高和视频数据量的不断增多，人们需要为一长段视频建立一段摘要来快速浏览以便更好地利用它。通过视频摘要技术，让我们在基于内容的视频检索中不仅仅能利用文字，而且能够充分利用音视频信息。视频摘要的作用主要是便于存储和视频的浏览或查找，相对于原始的视频资料，视频摘要的长度要短很多，节省了存储时间、空间，视频摘要保留了原内容的要点，所以对于用户来说，浏览或查找视频摘要比浏览原始视频要节省时间。

相关技术中，对视频内容的处理较为简单，并且也没有对视频内容进行数据结构化处理，无法实现视频内容的快速筛选和检索，导致使用场景和应用场景较为受限。

本申请实施例提供一种视频摘要生成方法、装置、计算设备和存储介质。

请参阅图1，图1是本申请实施例提供的视频摘要生成系统示意图，如图1所示，该视频摘要生成系统包括服务器设备101，该服务器设备101可以是一台服务器，也可以是由若干台服务器组成的服务器集群，或者是一个云计算服务中心。

本申请实施例中，该视频摘要生成系统具有生成视频摘要的功能，具体的，该视频摘要生成系统可以包括视频摘要生成装置102，该视频摘要生成装置102具体可以集成在服务器设备101中，该服务器设备101即图1中的服务器设备，该服务器设备101主要用于采用获取生成视频摘要的目标筛选条件；根据目标筛选条件在视频数据库中查找结构化图像数据，得到符合所述目标筛选条件的结构化图像数据，所述结构化图像数据为结构化存储的图像数据；对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。

该视频摘要生成系统还可以包括一个或多个第一终端设备103，该第一终端设备103可以作为图像采集设备，例如摄像头或带有摄像头的个人计算机(PC)、笔记本电脑、智能手机、PAD或者平板电脑等，可以对图像进行采集，并将采集到的图像转换为计算机可读的形式，例如视频等。图1中仅示出一个第一终端设备103，需要说明的是，在实际应用中根据需要可以设置一个或多个第一终端设备103。

该视频摘要生成系统还可以包括存储器104，用于存储视频数据库，该视频数据库中保存有视频数据，该视频数据可以是一个或多个第一终端设备103拍摄的视频数据，例如一个或多个监控摄像头拍摄的监控视频数据，也可以是其他影视视频数据，该视频数据中包括以目标跟踪序列为单位的结构化图像数据，以供用户进行视频内容的检索，生成视频摘要。

该视频摘要生成系统还可以包括第二终端设备105，用于展示从服务器设备101接收到的所述服务器设备101生成的视频摘要，其中，第二终端设备105可以是个人计算机(PC)、笔记本电脑等智能终端设备，也可以是智能手机、PAD或者平板电脑等智能移动终端设备。

需要说明的是，图1所示的视频摘要生成系统的场景示意图仅仅是一个示例，本申请实施例描述的视频摘要生成系统以及场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着视频摘要生成系统的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

下面结合具体实施例进行详细说明。

在本实施例中，将从视频摘要生成装置的角度进行描述，该视频摘要生成装置具体可以集成在服务器设备中。

本申请提供一种视频摘要生成方法，该方法包括：获取用于生成视频摘要的目标筛选条件；根据目标筛选条件在视频数据库中查找结构化图像数据，得到符合所述目标筛选条件的结构化图像数据，所述结构化图像数据为结构化存储的图像数据；对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。

在一些实施例中，请参阅图2A，本申请实施例中视频摘要生成方法由服务器设备执行，包括以下步骤：

S101、获取用于生成视频摘要的目标筛选条件；

本申请实施例中，在用户需要在预设的视频数据库中进行视频内容筛选时，可以在预设的筛选选项中选择筛选条件以得到目标筛选条件，筛选选项具体可以根据实际应用需要进行设置，例如，颜色选项(如红色，黑色或不限制等)，物体类别选项(如人或车辆等，具体的还可以是男人或女人，汽车或自行车等)，目标轨迹方向选项(如目标轨迹方向为从南到北)等。

在一些实施例中，若用户未在筛选选项中选择，则目标筛选条件为默认的筛选条件，例如若用户未在筛选选项中选择，返回值为空，则对筛选选项中默认全选。

在用户在预设的筛选选项中选择筛选条件后，即可得到目标筛选条件，该目标筛选条件中包括筛选选项中选择的对应的关键词，该关键词中可以包括一个或多个目标关键词，例如，红色、男人和汽车等，表示需要在视频数据库中查找具有红色、男人和汽车等目标属性特征的图像数据。

可以理解的是，目标筛选条件还可以同时包括生成视频摘要的其他一些设置条件，具体可以根据实际应用需求进行设置，例如，目标筛选条件中包括目标合成密度，目标合成密度表示在生成的视频摘要中每帧图像中目标的个数，在本申请一些实施例中，还可以设置目标合成密度的高、中和低三个档位，每个档位对应一个目标合成密度，例如目标合成密度为低档位时，表示在生成的视频摘要中每帧图像中目标的个数为3个，目标合成密度为中档位时，表示在生成的视频摘要中每帧图像中目标的个数为6个，目标合成密度为高档位时，表示在生成的视频摘要中每帧图像中目标的个数为9个。又或者目标筛选条件中包括筛选时间范围，例如2018.3.1～2018.3.2，当然还可以进一步包括小时、分钟或秒的信息。

本申请实施例中，在用户选择进行视频内容筛选时，视频摘要生成装置即获取用户在筛选选项中选择的筛选条件，获取该目标筛选条件。

S102、根据目标筛选条件在视频数据库中查找结构化图像数据，得到符合目标筛选条件的结构化图像数据，所述结构化图像数据为结构化存储的图像数据。

具体的，该视频数据库中保存有视频图像的结构化图像数据，例如视频数据库中保存有以目标跟踪序列为单位的结构化图像数据。此时，图2B为本申请实施例所述的步骤S102的具体流程图，参见图2B，根据目标筛选条件在视频数据库中查找结构化图像数据，得到符合目标筛选条件的结构化图像数据可以包括：

S123，根据目标筛选条件在视频数据库中确定筛选出的目标跟踪序列。

在一些实施例中，如前所述，视频数据库中保存有以目标跟踪序列为单位的结构化图像数据。而目标跟踪序列是对待处理视频中的目标进行跟踪，当跟踪结束或达到预设数量帧后，得到的待处理视频中包含该跟踪目标的帧序列。

在一些实施例中，目标跟踪序列的数据包括所述目标跟踪序列的标识信息、所述目标跟踪序列的属性信息和所述目标跟踪序列中每个前景图像。

在一些实施例中，筛选出的目标跟踪序列为视频数据库中具有与目标筛选条件中的关键词相同属性信息的目标跟踪序列。

S124，从所述视频数据库中获取所述筛选出的目标跟踪序列的结构化图像数据，以得到符合目标筛选条件的结构化图像数据。

本申请实施例中，会在该视频数据库中保存有以目标跟踪序列为单位的结构化图像数据，结构化数据也称作行数据，是由二维表结构来逻辑表达和实现的数据，严格地遵循数据格式与长度规范，主要通过关系型数据库进行存储和管理。本申请实施例中，图像数据以结构化数据的格式存储，即结构化图像数据。

一般情况下，为了保存特定来源的视频数据，会单独设置一个视频数据库，对于本申请实施例中该视频数据库中保存的视频数据，可以是一个或多个监控摄像头拍摄的监控视频数据，即本申请实施例中视频数据库可以为小区监控视频数据库、路口监控视频数据库、车库监控视频数据库或商场监控视频数据库等监控视频数据库，可以理解的是，在本申请其他实施例中，该视频数据库还可以其他影视视频数据库，因此，本申请实施例中视频数据库可以是任何需要进行视频内容检索的视频数据库，此处不做具体限定。

对于视频数据库来说，会时时更新存储新的视频数据，因此对于待存入该视频数据库中的待处理视频，会进行一些处理，以便后续视频内容检索时方便生成视频摘要及查找。因此本申请实施例中在所述获取用于生成视频摘要的目标筛选条件之前，还可以包括对待处理视频处理并将处理结果存储到该视频数据库的步骤，图2C示出了对待处理视频进行处理并将处理结果存储到视频数据库的流程图。如图2C所示，本申请实施例中还可以包括：

S120，获取待处理视频；

S121，对待处理视频进行属性分析，以从待处理视频中确定目标跟踪序列，并获取待处理视频中各目标跟踪序列的结构化图像数据；

S122，将各目标跟踪序列的结构化图像数据存储在视频数据库中。

其中，待处理视频可以待存入视频数据库中的视频数据，假设视频数据库为监控视频数据库，该待处理视频可以是某个时间段新增的视频数据，例如，某一天新增的视频数据，或者某一小时新增的视频数据，或者半天内新增的视频数据等，具体可以根据实际场景需要进行设置。

具体的，图2D示出了步骤S121的具体流程图。如图2D所示，具体可以包括：

S211，获取待处理视频中的待处理图像；

S212，对待处理图像进行前景提取，得到所述待处理图像中每帧图像的前景图像；

S213，利用待处理图像的前景图像进行属性分析，以获取待处理图像中各目标跟踪序列的属性分析结果；

在一些实施例中，将待处理图像中的当前帧中的待选目标框和上一帧目标框进行比较，取其中特征响应最强(即待选目标框中的图像与上一帧目标框图像匹配度最高)的目标作为跟踪目标，对该目标进行跟踪。当某个跟踪目标跟踪结束，或者达到预设数量(例如1000帧)的跟踪帧数后，即完成对该目标的跟踪，此时得到的待处理图像中包含该跟踪目标的帧序列为目标跟踪序列。

在一些实施例中，在获取待处理图像中的目标跟踪序列之后，即对每个目标跟踪序列进行属性分析之后，获取属性分析结果，该属性分析结果可以包括每个目标跟踪序列的属性信息。

S214，将属性分析结果保存到预设的结构化的目标属性数据结构中，得到各目标跟踪序列的结构化图像数据。

其中，获取待处理视频中的待处理图像可以获取待处理视频中每帧图像，由于对于监控视频来说，有可能存在长时间没有多少变化的监控图像，因此为了提高后续处理效率，获取待处理视频中的待处理图像也可以是获取待处理视频中的关键帧图像，在获取待处理视频中的关键帧图像时，即获取待处理视频中的待处理图像具体可以包括：对待处理视频进行关键帧检测，得到待处理视频中的关键帧；将关键帧作为待处理图像。在对待处理视频进行关键帧检测时，可以采用现有的关键帧提取算法。利用关键帧检测可以将如待处理视频中大量重复无太大变化图像中仅选取一个关键帧，或者不选取(如一段监控图像中没有任何目标的情况下)。

本申请实施例中可以预先进行背景建模，以对待处理图像进行前景提取，得到待处理图像中每帧图像的前景图像。背景建模后，可以快速实现对待处理图像进行前景提取，得到待处理图像中每帧图像的前景图像的过程，该过程步骤具体可以包括：将待处理图像中每帧图像转换为单通道灰度图；提取待处理图像中每帧图像中预设类型的局部特征图；根据每帧图像的单通道灰度图及每帧图像中的局部特征图，确定待处理图像中每帧图像的前景图像。进一步的，根据每帧图像的单通道灰度图及每帧图像中的局部特征图，确定待处理图像中每帧图像的前景图像可以包括：将每帧图像的单通道灰度图及每帧图像中的局部特征图，合成每帧图像的有效图像；利用每帧图像的有效图像与预设的混合高斯模型进行匹配，得到待处理图像中每帧图像的前景图像。

下面以一个示例作出说明，如图3所示，在背景建模里，混合高斯模式的输入为一个多通道的图像(d)，该图像的不同通道对应了不同的数据源(b)(c)；待处理图像中的视频帧(a)通常是彩色图像，即RGB(Red，Green，Blue)三通道图像(彩色是由红色、绿色、蓝色按不同比例混合而来，因此彩色图像包含了三个分别代表红色通道、绿色通道和蓝色通道的单色图)；在一个实施例中，每帧图像的RGB三通道图像(a)被压缩合成为每帧图像的单通道灰度图(b)，作为混合高斯模型输入的多通道图(d)的一个通道，而基于每帧图像的RGB三通道图像(a)提取的局部特征(如纹理、形状等特征)图(c)作为混合高斯建模输入的多通道图(d)的其他通道，共同贴合成一个多通道的图(d)(即为每帧图像的有效图像)，作为混合高斯模型的输入。

需要说明的，在利用每帧图像的有效图像与预设的混合高斯模型进行匹配，得到待处理图像中每帧图像的前景图像的过程中，混合高斯模型在从有效图像中分离前景和背景信息的同时，也会缓慢的逐渐更新自己，使得其保存和维护的背景信息与最新的背景信息保持一致。具体的，即在利用混合高斯获得一帧前景图像(此时相应的背景图像也确定了)后更新混合高斯模型，由于在分离图像得到前景图像和背景图像的过程中，更新混合高斯模型为本领域技术常用技术手段，具体细节此处不再赘述。

在通过背景建模得到待处理图像中每帧图像的前景图像之后，还可以对得到的前景图像进行进一步处理，例如通过对前景分割图膨胀后提取轮廓再填充的技术手段，可以进一步减少前景图像孔洞和残缺，使得提取的前景图像具有更好的效果。。

在对待处理图像进行前景提取，得到待处理图像中每帧图像的前景图像的过程中，由于每帧图像是由前景和背景图像组成的，在每帧图像提取前景图像后，该帧图像的背景图像即可确定了，可以对背景图像进行相应的保存，以方便后续使用，若待处理视频为监控视频，对于监控视频来说，由于监控摄像头一般情况下是固定的，拍摄角度也是固定的，这样拍出来的图像的背景图像相对比较固定，例如一直对着某个路口，拍摄出来的视频背景就一直是该路口的背景图像。因此，背景图像的保存可以是按照预设时长进行保存，或者与前景图像的预设帧数比例来保存(即每个背景图像对应每个目标跟踪序列中预设帧数的前景图像)，例如，待处理视频每个30分钟保存一个背景图像，目标跟踪序列在这个时间段的前景图对应该背景图像，或者，每保存1000帧前景图像，保存一帧背景图像，即一帧背景图像对应1000帧前景图像，通过这种方式可以对每个目标跟踪序列保存对应的背景图像。

另外，图2E示出了步骤S213的具体流程图。如图2E所示，步骤S213可以包括：

S311，对待处理图像的前景图像进行目标跟踪，以获取待处理图像中的目标跟踪序列；

S312，对每个目标跟踪序列进行属性分析，以获取各目标跟踪序列的属性分析结果，该属性分析结果中包括每个目标跟踪序列的属性信息。

其中，利用待处理图像的前景图像进行属性分析，以获取各目标跟踪序列的属性分析结果可以采用预设目标跟踪算法，例如KCF(High-speed tracking with kernelized correlation filters)算法及KCF算法改进算法，其中，KCF算法改进算法即使用目标检测技术(此处可以使用本实施例中背景建模的前景提取技术，也可以用其他检测技术代替)在当前帧全局进行检测得到目标框，与KCF算法在局部进行检测的待选目标框一起和上一帧目标框进行比较，取其中特征响应最强(即待选目标框与上一帧目标框图像匹配对最高)的作为跟踪目标，对目标进行跟踪，即可获取待处理图像中的目标跟踪序列，本申请是实施例中，当某个跟踪目标跟踪结束，或者达到预设数量(例如1000帧)的跟踪帧数后，即完成对该目标的跟踪。

在获取待处理图像中的目标跟踪序列之后，即对每个目标跟踪序列进行属性分析之后，获取属性分析结果，该属性分析结果可以包括每个目标跟踪序列的属性信息，该目标跟踪序列的属性信息可以根据实际需要进行提取，例如，目标跟踪序列的属性信息可以包括目标跟踪序列的颜色属性信息，目标跟踪序列的物体类别属性跟踪信息或目标跟踪序列的目标轨迹方向属性信息等。

当属性分析结果中包括每个目标跟踪序列的颜色属性信息时，图2F示出了步骤S312的具体流程图。如图2F所示，步骤S312包括：

S411，根据预设的像素值与颜色的映射关系，确定每个目标跟踪序列中每个前景图像的像素点对应的颜色；

S412，根据每个前景图像的像素点对应的颜色，统计各颜色在每个前景图像中对应的像素点个数；

S413，根据各颜色在每个前景图像中对应的像素点个数，确定每个目标跟踪序列的颜色属性信息。

该预设的像素值与颜色的映射关系可以是RGB(Red，Green，Blue)颜色模型、HSV(Hue，Saturation，Value)颜色模型、YUV颜色模型或CMYK(Cyan，Magenta，Yellow，Black)颜色模型等。由于HSV是一种比较直观的颜色模型，所以在许多图像处理领域中应用比较广泛，因此，预设的像素值与颜色的映射关系可以采用HSV颜色模型。在根据预设的像素值与颜色的映射关系，确定每个目标跟踪序列中每个前景图像的像素点对应的颜色之后，可以根据每个前景图像的像素点对应的颜色，统计各颜色在每个前景图像中对应的像素点个数。例如，对前景图像A中，确定红色像素点30个，黑色像素点40个。

进一步的，图2G示出了步骤S413的具体流程图。如图2G所示，S413可以包括：

S511，对每个目标跟踪序列，若目标颜色在目标前景图像中对应的像素点的个数达到目标前景图像中总像素点个数的第一预设比例，则确定该目标前景图像具有所述目标颜色的颜色属性；

S512，若目标跟踪序列中第二预设比例的前景图像具有目标颜色的颜色属性，则确定该目标跟踪序列具有目标颜色的颜色属性。

其中，第一预设比例和第二预设比例可以根据实际需要进行设置，例如第一预设比例为30％，第二预设比例为90％。此时，假设对于某个目标跟踪序列，其目标前景图像中，包括100个像素点，其中红色像素点30个，黑色像素点50个，白色像素点10个，其他颜色像素点10个，则红色像素点占目标前景图中总像素点个数比例为：30/100＝30％，黑色像素点占目标前景图中总像素点个数比例为：50/100＝50％，白色像素点占目标前景图中总像素点比例为：10/100＝10％，由于，红色像素点和黑色像素点占目标前景图中总像素点比例大于第一预设比例30％，则确定红色和黑色为目标前景图的属性颜色。在确定该目标跟踪序列中所有前景图的属性颜色之后，若目标跟踪序列中90％的前景图中具有红色属性，则确定该目标跟踪序列具有该红色属性。

当属性分析结果中包括每个目标跟踪序列中每个前景图像的物体类别属性信息时，图2F示出了步骤S312的具体流程图。如图2F所示，步骤S312具体可以包括：

S414，利用预设的物体分类神经网络模型，对每个目标跟踪序列中每个前景图像进行物体类别分类，得到每个目标跟踪序列的物体类别属性信息。

该物体分类神经网络模型可以是现有的物体分类神经网络模型，也可以是通过预设数量的前景图及对应的前景图中物体类别信息，训练构建的物体分类神经网络得到，该物体分类神经网络模型，目前该技术已比较成熟，此处不再详细描述。

利用预设的物体分类神经网络模型，对每个目标跟踪序列中每个前景图像可以得到每个前景图像中的物体分类属性信息，例如人(进一步还可以是男人或女人，大人或小孩等详细分类)，大巴车，小轿车或非机动车等。物体分类属性信息对应的分类具体可以根据实际需要进行设置，例如，人可以分成男人或女人，也可以分成大人或小孩，还可以同时具有该两种分类，即男人和大人，此处不做具体限定。

需要说明的是，上面仅举例描述了属性分析结果中可能包括的几种目标跟踪序列的属性信息，如目标跟踪序列的颜色属性信息和目标跟踪序列的物体类别属性信息，可以理解的是，该属性分析结果中还可以包括其他类型的目标跟踪序列的属性信息，具体可以根据实际需要进行设置，例如，该属性分析结果中还包括每个目标跟踪序列中的目标方向轨迹属性信息，对每个目标跟踪序列进行属性分析，以获取各目标跟踪序列的属性分析结果的步骤还可以包括：根据每个目标跟踪序列中各前景图中目标的位置信息，可以确定目标的轨迹方向角，例如，目标是由南运动到北。

本申请实施例中，图2H示出了在得到属性分析结果之后步骤S214的具体流程图。如图2H所示，将所述属性分析结果保存到预设的结构化的目标属性数据结构中，得到各目标跟踪序列的结构化图像数据，该过程具体可以包括：

S611，为待处理图像中的每个目标跟踪序列分配标识信息；

S612，根据待处理图像中每个目标跟踪序列的标识信息、每个目标跟踪序列的属性信息和每个目标跟踪序列中每个前景图像，得到每个目标跟踪序列的数据；

S613，将每个目标跟踪序列的数据分别保存到预设的结构化的目标属性数据结构中，得到每个目标跟踪序列的结构化图像数据。

具体的，对于待处理图像中的每个目标跟踪序列，可以按照预设规则分配标识信息，例如按照数字编号或字母编号分配标识信息，例如目标跟踪序列的身份标识号(IDentity，ID)，具体如目标跟踪序列1或目标跟踪序列A，其中1或A即为目标跟踪序列的ID。又例如，目标跟踪序列的身份标识号还可以是根据目标跟踪序列对应的时间。

其中，将每个目标跟踪序列的数据分别保存到预设的结构化的目标属性数据结构中，得到每个目标跟踪序列的结构化图像数据可以包括调用预设结构化数据存储接口将每个目标跟踪序列的数据分别保存到预设的结构化的目标属性数据结构中。该目标属性数据结构一个示例具体如下表1所示：

表1

需要说明的是，将每个目标跟踪序列的数据分别保存到预设的结构化的目标属性数据结构中，得到的每个目标跟踪序列的结构化图像数据中还可以包括上述每个目标跟踪序列对应的背景图像，另外，目标跟踪序列中各前景帧中包括个前景帧的时间信息。

在上述得到每个目标跟踪序列的结构化图像数据之后，即可将每个目标跟踪序列的结构化图像数据存储在视频数据库中。这样对于新的需要处理的视频，就可以按照上述操作步骤实现视频的结构化存储，在视频数据库中可以根据筛选条件筛选相应视频内容。

因此，本申请实施例中，在获取目标筛选条件后，即可根据目标筛选条件在视频数据库中确定筛选出的目标跟踪序列，进一步的，图2I示出了步骤S123的具体流程图。如图2I所示，根据目标筛选条件在视频数据库中确定筛选出的目标跟踪序列的步骤可以包括：

S621，获取目标筛选条件中的关键词；

S622，在视频数据库中确定具有与关键词相同属性信息的目标跟踪序列，得到筛选出的目标跟踪序列。

即筛选出的目标跟踪序列为视频数据库中具有与目标筛选条件中的关键词相同属性信息的目标跟踪序列。

例如，假设目标筛选条件中包括“红色”和“男人”的关键词，筛选时间范围为2018.3.1～2018.3.2，则根据该“红色”和“男人”的关键词在视频数据库中查找具有2018.3.1～2018.3.2时间段，具有“红色”和“男人”属性信息的目标跟踪序列，即得到筛选出的目标跟踪序列。

(2)从视频数据库中获取筛选出的目标跟踪序列的结构化图像数据，得到符合所述目标筛选条件的结构化图像数据；

在得到筛选出的目标跟踪序列之后，即可获取筛选出的目标跟踪序列的结构化图像数据，得到符合所述目标筛选条件的结构化图像数据。

S103、对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。

由于视频数据库中还包括与每个目标跟踪序列对应的多个背景图像，因此多个背景图像中每个背景图像可以对应每个目标跟踪序列中预设帧数的前景图像；此时，对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要具体可以包括：

(1)获取目标筛选条件中的目标合成密度。

该目标合成密度即表示在生成的视频摘要中每帧图像中目标的个数，例如，目标合成密度为3，则生成的视频摘要中每帧图像中包括3个目标。

(2)新建与目标合成密度对应的N个合成队列，N为正整数。

其中，N即等于该目标合成密度，例如目标合成密度为3，则N＝3，新建3个合成队列。

(3)将筛选出的目标跟踪序列中的目标跟踪序列平均分配到N个合成队列。

假设待处理视频中的目标跟踪序列包括30个目标跟踪序列，则按照目标合成密度为3来分配，即每个合成队列分配有10个目标跟踪序列。

(4)将N个合成队列中对应的目标跟踪序列的前景图像依次贴合到对应的背景图像上，以生成视频摘要。

具体的，在将N个合成队列中对应的目标跟踪序列的前景图像，贴合在所述多个背景图像上时，每个合成队列中的每隔m个前景图像，对应多个背景图像中的一个背景图进行贴合，该m即为一个背景图像对应的前景图像的数量，例如1000，即标识，每个合成队列中的每隔1000个前景图像每次合成时的背景都是该一个背景图像，超过1000个后，切换背景图像。对于视频摘要的每一个合成图像，具体合成方法可以如下：N个合成队列的第一个前景图均贴合到对应的背景图像上合成结果视频的第一帧，N个合成队列新的第一个前景图贴合到对应的背景图像上合成结果视频的第二帧，以此类推，在第m+1个合成图像的合成时，便得到了最终的视频摘要的所有合成图像，根据视频摘要的所有合成图像，即可生成视频摘要。

本申请实施例中，由于对视频进行结构化存储，在用户重新选择筛选条件后，无需重新分析原始视频，可直接根据新的筛选条件读取视频数据库中结构化图像数据快速合成相应视频摘要。因此本申请实施例中方法还可以包括：获取生成视频摘要的新的筛选条件；根据新的筛选条件在视频数据库中确定新的筛选出的目标跟踪序列；从视频数据库中获取新的筛选出的目标跟踪序列的结构化图像数据，得到新的结构化图像数据；对新的结构化图像数据进行视频合成，生成新的视频摘要。具体的，该生成新的视频摘要的方式可以参考上述实施例中描述的方式，此处不再赘述。

本申请实施例通过获取用于生成视频摘要的目标筛选条件；根据目标筛选条件在视频数据库中查找结构化图像数据，得到符合所述目标筛选条件的结构化图像数据；对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。本申请实施例中由于视频数据库中保存视频图像的结构化图像数据，在用户检索相关视频时，可从结构化图像数据中快速筛选相关视频信息，生成视频摘要，一方面，极大的方便了用户对视频目标内容的定位，并极大的拓展了视频摘要的应用场景，另一方面，加快了视频摘要的生成过程，提高了服务器设备的运行效率。

下面结合一具体应用场景对本申请实施例中视频摘要生成方法进行描述。

请参阅图4，图4为本申请实施例提供的视频摘要生成方法的另一流程示意图，由服务器设备执行，该方法流程可以包括：

201、服务器设备获取用于生成视频摘要的目标筛选条件。

在一些实施例中，在用户需要在预设的视频数据库中进行视频内容筛选时，可以在预设的筛选选项中选择的筛选条件以得到目标筛选条件。

如图5所示为本申请实施例中一个具体场景示例图，该示例中，筛选选项中包括颜色选项501、目标合成密度选项502和目标类型选项503，其中颜色选项选择的“不限制”(即不限制目标颜色)，目标合成密度选项选择的“低”档位(表示在生成的视频摘要中每帧图像中目标的个数为3个)，目标类型选线中选择的“人”。该筛选选项选择的内容即构成目标筛选条件。

202、服务器设备根据目标筛选条件在视频数据库中确定筛选出的目标跟踪序列。

服务器设备根据该目标筛选条件在视频数据库中查找具有“不限制颜色”、“人”属性信息的目标跟踪序列，即得到筛选出的目标跟踪序列，假设筛选出的目标跟踪序列有30个。

203、服务器设备从视频数据库中获取筛选出的目标跟踪序列的结构化图像数据，以得到符合目标筛选条件的结构化图像数据。

在得到筛选出的目标跟踪序列之后，服务器设备即可获取筛选出的目标跟踪序列的结构化图像数据，得到结构化图像数据，所述结构化图像数据为结构化存储的图像数据。

204、服务器设备对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。

由于图5中目标筛选条件中为“低”档位目标合成密度，即表示在生成的视频摘要中每帧图像中目标的个数为3个，此时，服务器设备对结构化图像数据进行视频合成，生成视频摘要具体包括，新建与目标合成密度对应的3个合成队列，按照目标合成密度为3来平均分配，即每个合成队列分配有30/3＝10个目标跟踪序列。假设每个背景图像对应1000个前景图像，3个合成队列的第一个前景图均贴合到对应的背景图像上合成结果视频的第一帧，对于视频摘要的每一个合成图像，具体合成方法可以如下：3个合成队列新的第一个前景图贴合到对应的背景图像上合成结果视频的第二帧，以此类推，在第1001个合成图像的合成时，换下一个背景图像进行贴合，便得到了最终的视频摘要的所有合成图像，根据视频摘要的所有合成图像，即可生成视频摘要，如图5中生成的视频摘要的每帧图像中即包括3个目标人物，每帧图像中均标记每个目标对应的时间信息。

需要说明的是，如图5所示，本申请实施例中可以在显示视频摘要的界面中显示原始视频，也可以不显示原始视频，具体可以根据实际需要进行设置。

本申请实施例服务器设备通过获取用于生成视频摘要的目标筛选条件；服务器设备根据目标筛选条件在视频数据库中确定筛选出的目标跟踪序列，该视频数据库中保存有以目标跟踪序列为单位的结构化图像数据；服务器设备从视频数据库中获取筛选出的目标跟踪序列的结构化图像数据，得到符合所述目标筛选条件的结构化图像数据；服务器设备对结构化图像数据进行视频合成，生成视频摘要。本申请实施例中由于以视频数据库中以目标跟踪序列为单位的保存视频图像的结构化图像数据，在用户检索相关视频时，服务器设备可从结构化图像数据中快速筛选相关视频信息，生成视频摘要，极大的方便了用户对视频目标内容的定位，也极大的拓展了视频摘要的应用场景。

为便于更好的实施本申请实施例提供的视频摘要生成方法，本申请实施例还提供一种基于上述视频摘要生成方法的装置。其中名词的含义与上述视频摘要生成方法中相同，具体实现细节可以参考方法实施例中的说明。

请参阅图6A，图6A为本申请实施例提供的视频摘要生成装置的结构示意图，其中该视频摘要生成装置可以包括第一获取单元601、查找单元602和生成单元603，具体如下：

第一获取单元601，用于获取用于生成视频摘要的目标筛选条件；

查找单元602，用于根据目标筛选条件在视频数据库中查找结构化图像数据，得到结构化图像数据，所述结构化图像数据为结构化存储的图像数据；

生成单元603，用于对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。

在一些实施例中，图6B为本申请实施例中查找单元602的结构示意图，如图6B所示，该查找单元602包括确定子单元6021和获取子单元6022，具体如下：

确定子单元6021，用于根据目标筛选条件在视频数据库中确定筛选出的目标跟踪序列，该视频数据库中保存有以目标跟踪序列为单位的结构化图像数据；

获取子单元6022，用于从视频数据库中获取所述筛选出的目标跟踪序列的结构化图像数据，得到符合所述目标筛选条件的结构化图像数据。

在一些实施例中，该装置还包括第二获取单元604、属性分析单元605和存储单元606，具体如下：

第二获取单元604，用于获取待处理视频；

属性分析单元605，用于对待处理视频进行属性分析，以从待处理视频中确定目标跟踪序列，并获取待处理视频中各目标跟踪序列的结构化图像数据；

存储单元606，用于将待处理视频中各目标跟踪序列的结构化图像数据存储在所述视频数据库中。

在一些实施例中，图6C为本申请实施例中属性分析单元605的结构示意图，如图6C所示，该属性分析单元605包括获取子单元6051、前景提取子单元6052、属性分析子单元6053，具体如下：

获取子单元6051，用于获取待处理视频中的待处理图像；

前景提取子单元6052，用于对待处理图像进行前景提取，得到待处理图像中每帧图像的前景图像；

属性分析子单元6053，用于利用待处理图像的前景图像进行属性分析，以获取待处理图像中各目标跟踪序列的属性分析结果；

存储单元606，还用于将属性分析结果保存到预设的结构化的目标属性数据结构中，得到各目标跟踪序列的结构化图像数据。

在一些实施例中，该属性分析子单元6053具体用于：

对待处理图像的前景图像进行目标跟踪，以获取待处理图像中的目标跟踪序列；

对每个目标跟踪序列进行属性分析，以获取各目标跟踪序列的属性分析结果，所述属性分析结果中包括每个目标跟踪序列的属性信息。

在一些实施例中，该属性分析结果中包括每个目标跟踪序列的颜色属性信息，该属性分析子单元6053具体用于：

根据预设的像素值与颜色的映射关系，确定每个目标跟踪序列中每个前景图像的像素点对应的颜色；

根据每个前景图像的像素点对应的颜色，统计各颜色在每个前景图像中对应的像素点个数；

根据各颜色在每个前景图像中对应的像素点个数，确定每个目标跟踪序列的颜色属性信息。

在一些实施例中，该属性分析子单元6053具体用于：

对每个目标跟踪序列，若目标颜色在目标前景图像中对应的像素点的个数达到所述目标前景图像中总像素点个数的第一预设比例，则确定该目标前景图像具有目标颜色的颜色属性；

若目标跟踪序列中第二预设比例的前景图像具有所述目标颜色的颜色属性，则确定该目标跟踪序列具有目标颜色的颜色属性。

在一些实施例中，该属性分析结果中包括每个目标跟踪序列中每个前景图像的物体类别属性信息，所述属性分析子单元6053具体用于：

利用预设的物体分类神经网络模型，对每个目标跟踪序列中每个前景图像进行物体类别分类，得到每个目标跟踪序列的物体类别属性信息。

在一些实施例中，该前景提取子单元6052具体用于：

将待处理图像中每帧图像转换为单通道灰度图；

提取待处理图像中每帧图像中预设类型的局部特征图；

根据每帧图像的单通道灰度图及每帧图像中的局部特征图，确定待处理图像中每帧图像的前景图像。

在一些实施例中，该前景提取子单元6052具体用于：

将每帧图像的单通道灰度图及每帧图像中的局部特征图，合成每帧图像的有效图像；

利用每帧图像的有效图像与预设的混合高斯模型进行匹配，得到待处理图像中每帧图像的前景图像。

在一些实施例中，该存储单元606具体用于：

为待处理图像中的每个目标跟踪序列分配标识信息；

根据待处理图像中每个目标跟踪序列的标识信息、每个目标跟踪序列的属性信息和每个目标跟踪序列中每个前景图像，得到每个目标跟踪序列的数据；

将每个目标跟踪序列的数据分别保存到预设的结构化的目标属性数据结构中，得到待处理图像中每个目标跟踪序列的结构化图像数据。

在一些实施例中，该获取子单元6051具体用于：

对待处理视频进行关键帧检测，得到待处理视频中的关键帧；

将关键帧作为所述待处理图像。

在一些实施例中，该确定子单元6021具体用于：

获取目标筛选条件中的关键词；

在视频数据库中确定具有与关键词相同属性信息的目标跟踪序列，得到筛选出的目标跟踪序列。

在一些实施例中，该视频数据库中还包括与每个目标跟踪序列对应的多个背景图像，该多个背景图像中每个背景图像对应每个目标跟踪序列中预设帧数的前景图像；该生成单元603具体用于：

获取目标筛选条件中的目标合成密度；

新建与目标合成密度对应的N个合成队列，N为正整数；

将筛选出的目标跟踪序列中的目标跟踪序列平均分配到N个合成队列；

将N个合成队列中对应的目标跟踪序列的前景图像依次贴合到对应的背景图像上，以生成视频摘要。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

本申请实施例第一获取单元601通过获取用于生成视频摘要的目标筛选条件；确定单元602根据目标筛选条件在视频数据库中查找结构化图像数据，得到结构化图像数据，所述结构化图像数据为结构化存储的图像数据；生成单元603对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。本申请实施例中由于视频数据库中保存有视频图像的结构化图像数据，在用户检索相关视频时，可从结构化图像数据中快速筛选相关视频信息，生成视频摘要，极大的方便了用户对视频目标内容的定位，也极大的拓展了视频摘要的应用场景。

本申请实施例还提供一种计算设备，该计算设备可以是服务器设备，如图7所示，其示出了本申请实施例所涉及的服务器设备的结构示意图，具体来讲：

该服务器设备可以包括一个或者一个以上处理核心的处理器701、一个或一个以上计算机可读存储介质的存储器702、电源703和输入单元704等部件。本领域技术人员可以理解，图7中示出的服务器设备结构并不构成对服务器设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器701是该服务器设备的控制中心，利用各种接口和线路连接整个服务器设备的各个部分，通过运行或执行存储在存储器702内的软件程序和/或模块，以及调用存储在存储器702内的数据，执行服务器设备的各种功能和处理数据，从而对服务器设备进行整体监控。在一些实施例中，处理器701可包括一个或多个处理核心；处理器701可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作存储介质、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器701中。

存储器702可用于存储软件程序以及模块，处理器701通过运行存储在存储器702的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器702可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作存储介质、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据服务器设备的使用所创建的数据等。此外，存储器702可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器702还可以包括存储器控制器，以提供处理器701对存储器702的访问。

服务器设备还包括给各个部件供电的电源703，电源703可以通过电源管理存储介质与处理器701逻辑相连，从而通过电源管理存储介质实现管理充电、放电、以及功耗管理等功能。电源703还可以包括一个或一个以上的直流或交流电源、再充电存储介质、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该服务器设备还可包括输入单元704，该输入单元704可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，服务器设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，服务器设备中的处理器701会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器702中，并由处理器701来运行存储在存储器702中的应用程序，从而实现各种功能，如下：

获取用于生成视频摘要的目标筛选条件；根据目标筛选条件在视频数据库中查找结构化图像数据，得到符合所述目标筛选条件的结构化图像数据，所述结构化图像数据为结构化存储的图像数据；对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种视频摘要生成方法中的步骤。例如，该指令可以执行如下步骤：

获取用于生成视频摘要的目标筛选条件；根据目标筛选条件在视频数据库中查找结构化图像数据，得到结构化图像数据，所述结构化图像数据为结构化存储的图像数据；对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任一种视频摘要生成方法中的步骤，因此，可以实现本申请实施例所提供的任一种视频摘要生成方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种视频摘要生成方法、装置和存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种视频摘要生成方法，由服务器设备执行，所述方法包括：

获取用于生成视频摘要的目标筛选条件；

根据所述目标筛选条件在视频数据库中查找结构化图像数据，得到符合所述目标筛选条件的结构化图像数据，所述结构化图像数据为结构化存储的图像数据；

对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。
根据权利要求1所述的视频摘要生成方法，其中，所述根据所述目标筛选条件在视频数据库中查找结构化图像数据，得到符合所述目标筛选条件的结构化图像数据，包括：

根据所述目标筛选条件在视频数据库中确定筛选出的目标跟踪序列，所述视频数据库中保存有以目标跟踪序列为单位的结构化图像数据；

从所述视频数据库中获取所述筛选出的目标跟踪序列对应的结构化图像数据，以得到符合所述目标筛选条件的结构化图像数据。
根据权利要求2所述的视频摘要生成方法，其中，在所述获取用于生成视频摘要的目标筛选条件之前，所述方法还包括：

获取待处理视频；

对所述待处理视频进行属性分析，以从所述待处理视频中确定目标跟踪序列，并获取所述待处理视频中各目标跟踪序列的结构化图像数据；

将所述各目标跟踪序列的结构化图像数据存储在所述视频数据库中。
根据权利要求3所述的视频摘要生成方法，其中，所述对所述待处理视频进行属性分析，以从所述待处理视频中确定目标跟踪序列，并获取所述待处理视频中各目标跟踪序列的结构化图像数据，包括：

获取所述待处理视频中的待处理图像；

对所述待处理图像进行前景提取，得到所述待处理图像中每帧图像的前景图像；

利用所述待处理图像的前景图像进行属性分析，以获取所述待处理图像中各目标跟踪序列的属性分析结果；

将所述属性分析结果保存到预设的结构化的目标属性数据结构中，得到所述各目标跟踪序列的结构化图像数据。
根据权利要求4所述的视频摘要生成方法，其中，所述利用所述待处理图像的前景图像进行属性分析，以获取所述待处理图像中各目标跟踪序列的属性分析结果，包括：

对所述待处理图像的前景图像进行目标跟踪，以获取所述待处理图像中的目标跟踪序列；

对每个目标跟踪序列进行属性分析，以获取所述属性分析结果，所述属性分析结果中包括所述目标跟踪序列的属性信息。
根据权利要求5所述的视频摘要生成方法，其中，所述属性分析结果中包括每个目标跟踪序列的颜色属性信息，所述对每个目标跟踪序列进行属性分析，以获取所述属性分析结果，包括：

根据预设的像素值与颜色的映射关系，确定每个目标跟踪序列中每个前景图像的像素点对应的颜色；

根据所述每个前景图像的像素点对应的颜色，统计各颜色在每个前景图像中对应的像素点个数；

根据各颜色在每个前景图像中对应的像素点个数，确定每个目标跟踪序列的颜色属性信息。
根据权利要求6所述的视频摘要生成方法，其中，所述根据各颜色在每个前景图像中对应的像素点个数，确定每个目标跟踪序列的颜色属性信息，包括：

对每个目标跟踪序列，

若目标颜色在目标前景图像中对应的像素点的个数达到所述目标前景图像中总像素点个数的第一预设比例，则确定该目标前景图像具有所述目标颜色的颜色属性；

若目标跟踪序列中第二预设比例的前景图像具有所述目标颜色的颜色属性，则确定该目标跟踪序列具有所述目标颜色的颜色属性。
根据权利要求5所述的视频摘要生成方法，其中，所述属性分析结果中包括每个目标跟踪序列中每个前景图像的物体类别属性信息，所述对每个目标跟踪序列进行属性分析，以获取所述属性分析结果，包括：

利用预设的物体分类神经网络模型，对每个目标跟踪序列中每个前景图像进行物体类别分类，得到每个目标跟踪序列的物体类别属性信息。
根据权利要求5所述的视频摘要生成方法，其中，所述属性分析结果中包括每个目标跟踪序列中每个前景图像的目标方向轨迹属性信息，所述对每个目标跟踪序列进行属性分析，以获取所述属性分析结果，包括：

根据每个目标跟踪序列中各前景图像中目标的位置信息，确定目标的轨迹方向角。
根据权利要求5所述的方法，其中，所述将所述属性分析结果保存到预设的结构化的目标属性数据结构中，得到所述各目标跟踪序列的结构化图像数据，包括：

为所述待处理图像中的每个目标跟踪序列分配标识信息；

根据所述待处理图像中每个目标跟踪序列的标识信息、每个目标跟踪序列的属性信息和所述每个目标跟踪序列中每个前景图像，得到每个目标跟踪序列的数据；

将每个目标跟踪序列的数据分别保存到预设的结构化的目标属性数据结构中，得到待处理图像中的所述各目标跟踪序列的结构化图像数据。
根据权利要求4所述的视频摘要生成方法，其中，所述对所述待处理图像进行前景提取，得到所述待处理图像中每帧图像的前景图像，包括：

将所述待处理图像中每帧图像转换为单通道灰度图；

提取所述待处理图像中每帧图像中预设类型的局部特征图；

根据所述每帧图像的单通道灰度图及每帧图像中的局部特征图，确定所述待处理图像中每帧图像的前景图像。
根据权利要求11所述的视频摘要生成方法，其中，所述根据所述每帧图像的单通道灰度图及每帧图像中的局部特征图，确定所述待处理图像中每帧图像的前景图像，包括：

将每帧图像的单通道灰度图及每帧图像中的局部特征图，合成每帧图像的有效图像；

利用每帧图像的有效图像与预设的混合高斯模型进行匹配，得到所述待处理图像中每帧图像的前景图像。
根据权利要求4所述的视频摘要生成方法，其中，所述获取所述待处理视频中的待处理图像，包括：

对所述待处理视频进行关键帧检测，得到所述待处理视频中的关键帧；

将所述关键帧作为所述待处理图像。
根据权利要求2所述的视频摘要生成方法，其中，所述目标跟踪序列的数据包括所述目标跟踪序列的属性信息；

其中，所述根据所述目标筛选条件在视频数据库中确定筛选出的目标跟踪序列，包括：

获取所述目标筛选条件中的关键词；

在所述视频数据库中确定具有与所述关键词相同属性信息的目标跟踪序列，得到所述筛选出的目标跟踪序列。
根据权利要求2所述的视频摘要生成方法，其中，所述视频数据库中还包括与每个目标跟踪序列对应的多个背景图像，所述多个背景图像中每个背景图像对应每个目标跟踪序列中预设帧数的前景图像；所述对所述所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要，包括：

获取所述目标筛选条件中的目标合成密度；

新建与所述目标合成密度对应的N个合成队列，N为正整数；

将所述筛选出的目标跟踪序列中的目标跟踪序列平均分配到所述N个合成队列；

将所述N个合成队列中对应的目标跟踪序列的前景图像依次贴合到对应的背景图像上，以生成视频摘要。
一种视频摘要生成装置，其中，所述装置包括：

第一获取单元，用于获取用于生成视频摘要的目标筛选条件；

查找单元，用于根据所述目标筛选条件在视频数据库中查找结构化图像数据，得到符合所述目标筛选条件的结构化图像数据，所述结构化图像数据为结构化存储的图像数据；

生成单元，用于对所述符合所述目标筛选条件的结构化图像数据进行视频合成，生成视频摘要。
一种计算设备，包括处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置执行权利要求1-15任一项所述的视频摘要生成方法。
一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至15任一项所述视频摘要生成方法。