WO2024221941A1

WO2024221941A1 - 一种视频生成方法、装置、设备及存储介质

Info

Publication number: WO2024221941A1
Application number: PCT/CN2023/136857
Authority: WO
Inventors: 唐艾妮; 张天奇; 张琪智; 周慧敏; 郑涵奇; 钟浩华; 张浩然; 李�根
Original assignee: Beijing Zitiao Network Technology Co Ltd
Current assignee: Beijing Zitiao Network Technology Co Ltd
Priority date: 2023-04-23
Filing date: 2023-12-06
Publication date: 2024-10-31
Anticipated expiration: 2025-10-23
Also published as: CN118842959A

Abstract

本公开提供了一种视频生成方法、装置、设备及存储介质，所述方法包括：获取用于描述视频效果要求的第一文本信息，以及获取至少一个多媒体素材；基于第一文本信息和至少一个多媒体素材，生成目标视频；目标视频中呈现有至少一个多媒体素材，目标视频的视频效果符合第一文本信息所描述的视频效果要求，目标视频用于呈现至少一个视频片段的组合，至少一个视频片段分别是基于至少一个多媒体素材中的各个影像素材形成的，各个影像素材包括视频素材和/或图像素材。可见，本公开实施例基于获取到第一文本信息和多媒体素材，能够生成符合第一文本信息描述的视频效果要求的目标视频，丰富了视频生成方式，从而提升了用户体验。

Description

一种视频生成方法、装置、设备及存储介质

本申请要求于2023年4月23日递交的、发明名称为“一种视频生成方法、装置、设备及存储介质”、申请号为202310446304.X的中国发明专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本公开涉及数据处理领域，尤其涉及一种视频生成方法、装置、设备及存储介质。

背景技术

随着视频处理技术的不断发展，用户对视频生成方式的要求越来越多样化。因此，如何丰富视频生成方式，以满足用户多样化的视频生成方式要求，提升用户体验，是目前亟需解决的技术问题。

发明内容

为了解决上述技术问题，本公开提供了一种视频生成方法、装置、设备及存储介质，能够丰富视频生成方式，提升用户体验。

第一方面，本公开提供了一种视频生成方法，所述方法包括：

获取第一文本信息；其中，所述第一文本信息用于描述视频效果要求；

获取至少一个多媒体素材；

基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频；其中，所述目标视频中呈现有所述至少一个多媒体素材，所述目标视频的视频效果符合所述第一文本信息所描述的视频效果要求，所述目标视频用于呈现至少一个视频片段的组合，所述至少一个视频片段分别是基于所述至少一个多媒体素材中的各个影像素材形成的，所述各个影像素材包括视频素材和/或图像素材。

一种可选的实施方式中，所述基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频，包括：

基于所述第一文本信息和所述至少一个多媒体素材，生成视频编辑草稿；其中，所述视频编辑草稿包括所述至少一个多媒体素材和编辑信息，所述编辑信息用于指示针对所述至少一个多媒体素材的编辑操作，所述编辑操作至少用于将所述至少一个多媒体素材中的各个影像素材分别编辑成所述至少一个视频片段，所述编辑操作对应的视频编辑效果和/或所述至少一个多媒体素材，符合所述第一文本信息所描述的视频效果要求；

根据所述视频编辑草稿生成目标视频。

一种可选的实施方式中，所述基于所述第一文本信息和所述至少一个多媒体素材，生成视频编辑草稿，包括：

基于所述第一文本信息和所述至少一个多媒体素材，确定至少一个视频编辑模板；其中，所述至少一个视频编辑模板的编辑效果符合所述第一文本信息描述的视频效果要求；

将所述至少一个视频编辑模板中的目标视频编辑模板所指示的编辑操作应用于所述至少一个多媒体素材上，生成视频编辑草稿。

一种可选的实施方式中，所述基于所述第一文本信息和所述至少一个多媒体素材，确定至少一个视频编辑模板，包括：

分别提取所述第一文本信息和所述至少一个多媒体素材的特征标签；

基于所述第一文本信息和所述至少一个多媒体素材的特征标签与可用的视频编辑模板进行匹配得到至少一个视频编辑模板，所述至少一个视频编辑模板中包括与所述第一文本信息的特征标签相匹配的第一视频编辑模板和与所述至少一个多媒体素材的特征标签相匹配的第二视频编辑模板。

一种可选的实施方式中，所述获取至少一个多媒体素材，包括：

基于对所述第一文本信息的分析结果，从用户素材集合中匹配出至少一个多媒体素材中的第一多媒体素材；

和/或，基于对所述第一文本信息的分析结果，生成至少一个多媒体素材中的第二多媒体素材；其中，所述至少一个多媒体素材符合所述第一文本信息描述的视频效果要求。

一种可选的实施方式中，所述获取第一文本信息之前，还包括：

响应于针对至少一个多媒体素材的导入操作，显示文本输入框；

相应的，所述获取第一文本信息，包括：

基于所述文本输入框，接收第一文本信息。

一种可选的实施方式中，所述基于所述文本输入框，接收第一文本信息之前，还包括：

显示至少一个视频标签；其中，所述视频标签用于表征视频效果；

相应的，所述基于所述文本输入框，接收第一文本信息，包括：

基于将所述至少一个视频标签中的目标视频标签添加至所述文本输入框的操作，获取第一文本信息。

一种可选的实施方式中，所述基于所述第一文本信息和所述至少一个多媒体素材，确定至少一个视频编辑模板之后，还包括：

在所述至少一个视频编辑模板中选取第三视频编辑模板并呈现在视频编辑效果的预览页面上，以便所述预览页面用于预览所述至少一个多媒体素材导入所述第三视频编辑模板所得到的视频效果，所述预览页面上设置有更新推荐控件；

响应于针对所述更新推荐控件的触发操作，在所述至少一个视频编辑模板中选取第四视频编辑模板，并利用所述第四视频编辑模板替换所述预览页面上呈现的第三视频编辑模板，以便所述预览页面用于预览所述至少一个多媒体素材导入所述第四视频编辑模板所得到的视频效果。

在预览页面上显示所述至少一个视频编辑模板中的第五视频编辑模板；

响应于在所述预览页面上针对所述第一文本信息的文本调整操作，得到调整后文本信息；

基于所述调整后文本信息和所述至少一个多媒体素材，确定第二视频编辑模板集合；

利用所述第二视频编辑模板集合中的第六视频编辑模板替换所述预览页面上显示的所述第五视频编辑模板。

一种可选的实施方式中，所述基于所述调整后文本信息和所述至少一个多媒体素材，确定第二视频编辑模板集合之前，还包括：

接收针对所述至少一个多媒体素材的素材调整操作，得到调整后多媒体素材；

相应的，所述基于所述调整后文本信息和所述至少一个多媒体素材，确定第二视频编辑模板集合，包括：

基于所述调整后文本信息和所述调整后多媒体素材，确定第二视频编辑模板集合。

第二方面，本公开提供了一种视频生成装置，所述装置包括：

第一获取模块，用于获取第一文本信息；其中，所述第一文本信息用于描述视频效果要求；

第二获取模块，用于获取至少一个多媒体素材；

生成模块，用于基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频；其中，所述目标视频中呈现有所述至少一个多媒体素材，所述目标视频的视频效果符合所述第一文本信息所描述的视频效果要求，所述目标视频用于呈现至少一个视频片段的组合，所述至少一个视频片段分别是基于所述至少一个多媒体素材中的各个影像素材形成的，所述各个影像素材包括视频素材和/或图像素材。

第三方面，本公开提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现上述的方法。

第四方面，本公开提供了一种视频生成设备，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现上述的方法。

第五方面，本公开提供了一种计算机程序产品，所述计算机程序产品包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现上述的方法。

本公开实施例提供的技术方案与现有技术相比至少具有如下优点：

本公开实施例提供了一种视频生成方法，具体的，获取用于描述视频效果要求的第一文本信息，以及获取至少一个多媒体素材；然后，基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频；其中，所述目标视频中呈现有所述至少一个多媒体素材，所述目标视频的视频效果符合所述第一文本信息所描述的视频效果要求，所述目标视频用于呈现至少一个视频片段的组合，所述至少一个视频片段分别是基于所述至少一个多媒体素材中的各个影像素材形成的，所述各个影像素材包括视频素材和/或图像素材。可见，本公开实施例基于获取到第一文本信息和多媒体素材，能够生成符合第一文本信息描述的视频效果要求的目标视频，丰富了视频生成方式，从而提升了用户体验。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的一种视频生成方法的流程图；

图2为本公开实施例提供的一种素材选择页面的示意图；

图3为本公开实施例提供的另一种素材选择页面的示意图；

图4为本公开实施例提供的另一种视频生成方法的流程图；

图5为本公开实施例提供的另一种视频生成方法的流程图；

图6为本公开实施例提供的一种预览页面的示意图；

图7为本公开实施例提供的一种视频生成装置的结构示意图；

图8为本公开实施例提供的一种视频生成设备的结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

随着视频处理技术的不断发展，用户对视频生成方式的要求越来越多样化。为此，本公开实施例提供了一种视频生成方法，通过对描述视频效果要求的文本信息的分析，能够生成符合该视频效果要求的目标视频，丰富了视频生成方式，从而提升了用户体验。

具体的，本公开实施例提供的视频生成方法中，获取用于描述视频效果要求的第一文本信息，以及获取至少一个多媒体素材；然后，基于第一文本信息以及该至少一个多媒体素材，生成目标视频。其中，目标视频中呈现有该至少一个多媒体素材，目标视频的视频效果符合第一文本信息描述的视频效果要求。另外，目标视频用于呈现至少一个视频片段的组合，该至少一个视频片段分别是基于获取到的至少一个多媒体素材中的影像素材形成的，影像素材可以包括视频素材和/或图像素材。可见，本公开实施例基于获取到第一文本信息和多媒体素材，能够生成符合第一文本信息描述的视频效果要求的目标视频，丰富了视频生成方式，从而提升了用户体验。

基于此，本公开实施例提供了一种视频生成方法，参考图1，为本公开实施例提供的一种视频生成方法的流程图，该方法包括：

S101：获取第一文本信息。

其中，所述第一文本信息用于描述视频效果要求。

本公开实施例中，第一文本信息可以是用户输入的文本信息，具体的，文本信息输入的方式不做限定，例如可以是通过语音输入的方式输入第一文本信息，也可以是基于键盘输入的方式输入第一文本信息，还可以是通过导入文本信息的方式输入第一文本信息等。

第一文本信息为能够描述视频效果要求的文本信息，可选的，第一文本信息描述的视频效果要求可以是对视频风格类型的要求，如第一文本信息可以为“漫画风格”。第一文本信息描述的视频效果要求还可以是对视频展示内容的要求，如第一文本信息可以为“温暖夏日，温情午后”。本公开实施例对于第一文本信息描述的视频效果要求不做具体限定。

S102：获取至少一个多媒体素材。

本公开实施例在生成目标视频之前，还需要获取多媒体素材。其中，多媒体素材可以包括图片、视频、音频等。

一种可选的实施方式中，可以通过用户导入的方式获取多媒体素材，如图2所示，为本公开实施例提供的一种素材选择页面的示意图，素材选择页面上展示有用户素材集合中的各个多媒体素材，在接收到针对至少一个多媒体素材的导入操作时，获取导入的至少一个多媒体素材。另外，在接收到针对至少一个多媒体素材的导入操作时，还可以触发显示文本输入框，如图2所示，在导入多媒体素材201之后，在素材选择页面上显示文本输入框202。在文本输入框202内可以输入第一文本信息，从而实现第一文本信息的获取。

另外，在素材选择页面上显示文本输入框的同时，还可以显示至少一个视频标签，如图3所示的文本输入框301下方显示有多个视频标签，如视频标签“漫画风”等。通过从显示的视频标签中选定目标视频标签，触发将目标视频标签添加至文本输入框301内，得到第一文本信息。其中，添加至文本输入框301内的目标视频标签可以包括一个或多个显示在素材选择页面上的视频标签。

具体的，第一文本信息可以仅包括目标视频标签、也可以仅包括用户输入的文本信息，还可以包括目标视频标签和用户输入的文本信息。

另一种可选的实施方式中，还可以基于对第一文本信息的分析，获取至少一个多媒体素材。可选的，可以基于对第一文本信息的分析结果，从用户素材集合中匹配出至少一个多媒体素材。具体的，通过自然语言分析算法对第一文本信息进行语义分析，并基于分析结果从用户素材集合中匹配出至少一个多媒体素材，后续用于生成目标视频。

另外，还可以基于对第一文本信息的分析结果，生成至少一个多媒体素材，具体的，通过自然语言分析算法对第一文本信息进行语义分析，并基于分析结果生成图片、视频片段、音频等多媒体素材，后续用于生成目标视频。

本公开实施例中，基于第一文本信息的分析结果，从用户素材集合中匹配出的多媒体素材，以及生成的多媒体素材，均符合第一文本信息描述的视频效果要求。

S103：基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频。

其中，所述目标视频中呈现有所述至少一个多媒体素材，所述目标视频的视频效果符合所述第一文本信息所描述的视频效果要求，所述目标视频用于呈现至少一个视频片段的组合，所述至少一个视频片段分别是基于所述至少一个多媒体素材中的各个影像素材形成的，所述影像素材包括视频素材和/或图像素材。

本公开实施例中，在获取到第一文本信息和至少一个多媒体素材之后，利用第一文本信息和该至少一个多媒体素材，生成目标视频。具体的视频生成方式在后续实施例中具体展开介绍，在此不再赘述。

本公开实施例提供的视频生成方法中，获取用于描述视频效果要求的第一文本信息，以及获取至少一个多媒体素材；然后，基于第一文本信息以及该至少一个多媒体素材，生成目标视频。其中，目标视频中呈现有该至少一个多媒体素材，目标视频的视频效果符合第一文本信息描述的视频效果要求。另外，目标视频用于呈现至少一个视频片段的组合，该至少一个视频片段分别是基于获取到的至少一个多媒体素材中的影像素材形成的，影像素材可以包括视频素材和/或图像素材。可见，本公开实施例基于获取到第一文本信息和多媒体素材，能够生成符合第一文本信息描述的视频效果要求的目标视频，丰富了视频生成方式，从而提升了用户体验。

在上述实施例的基础上，本公开实施例还提供了一种视频生成方法，参考图4，为本公开实施例提供的另一种视频生成方法的流程图，该视频生成方法具体包括：

S401：获取第一文本信息；其中，所述第一文本信息用于描述视频效果要求。

S402：获取至少一个多媒体素材。

本公开实施例中，获取第一文本信息以及至少一个多媒体素材的方式可参照上述实施例进行理解，在此不再赘述。

S403：基于所述第一文本信息和所述至少一个多媒体素材，生成视频编辑草稿。

其中，所述视频编辑草稿包括所述至少一个多媒体素材和编辑信息，所述编辑信息用于指示针对所述至少一个多媒体素材的编辑操作，所述编辑操作至少用于将所述至少一个多媒体素材中的各个影像素材分别编辑成所述至少一个视频片段，所述编辑操作对应的视频编辑效果和/或所述至少一个多媒体素材，符合所述第一文本信息所描述的视频效果要求。

本公开实施例中，在获取到第一文本信息和至少一个多媒体素材之后，基于对第一文本信息的分析，或者对第一文本信息和该至少一个多媒体素材的综合分析，生成视频编辑草稿。

其中，视频编辑草稿包括获取到至少一个多媒体素材和编辑信息，编辑信息用于指示针对该至少一个多媒体素材的编辑操作，编辑操作至少用于将该至少一个多媒体素材中的各个影像素材编辑成一个或多个视频片段，一个视频片段中可以包括一个影像素材或多个影像素材的组合。编辑信息所指的编辑操作对应的视频编辑效果，符合第一文本信息所描述的视频效果要求，视频编辑草稿中的多媒体素材也符合第一文本信息所描述的视频效果要求。

一种可选的实施方式中，视频编辑草稿包括的编辑信息可以用于指示基于对第一文本信息的分析确定的编辑操作，例如第一文本信息为“温暖夏日，温情午后”，则可以通过对第一文本信息的分析，确定编辑信息用于指示的编辑操作包括在一段或多段视频片段中添加A滤镜等。

另一种可选的实施方式中，视频编辑草稿包括的编辑信息可以用于指示基于对用户导入的多媒体素材的分析确定的编辑操作。例如，用户导入的多媒体素材包括夏日度假图片、视频片段等，则可以通过用户导入的多媒体素材的分析，确定编辑信息用于指示的编辑操作包括在一段或多段视频片段中添加B滤镜等。

综合上述两种实施方式，视频编辑草稿包括的编辑信息可以用于指示的编辑操作，可以包括基于对所述第一文本信息和用户导入的多媒体素材进行分析确定的编辑操作，具体方式参照上述两种实施方式的描述，在此不再赘述。

又一种可选的实施方式中，视频编辑草稿包括的编辑信息可以用于指示的编辑操作，包括目标视频编辑模板所指示的编辑操作，其中，目标视频编辑模板所指示的编辑操作用于对获取到的多媒体素材进行编辑。目标视频编辑模板可以是用户选定的视频编辑模板，也可以是基于对第一文本信息的分析确定的视频编辑模板，对于目标视频编辑模板相关的内容在后续实施例中进行详细描述。

S404：根据所述视频编辑草稿生成目标视频。

本公开实施例中，在基于获取到的第一文本信息和多媒体素材生成视频编辑草稿之后，可以对视频编辑草稿进行进一步的编辑操作，例如对视频编辑草稿中的全部或部分编辑信息进行调整等。

一种可选的实施方式中，在预览页面上展示视频编辑草稿，响应于针对视频编辑操作的导出操作，基于视频编辑草稿生成目标视频。其中，导出的目标视频的视频效果符合第一文本信息描述的视频效果要求。

本公开实施例提供的视频生成方法中，在获取到描述视频效果要求的第一文本信息以及多媒体素材之后，基于第一文本信息和多媒体素材生成视频编辑草稿。进而，根据视频编辑草稿生成符合第一文本信息描述的视频效果要求的目标视频。可见，本公开实施例基于第一文本信息和多媒体素材生成视频编辑操作，进而基于视频编辑草稿生成符合第一文本信息描述的视频效果要求的目标视频，丰富了视频生成方式，从而提升了用户体验。

基于上述实施例，本公开实施例还提供了一种视频生成方法，参考图5，为本公开实施例提供的另一种视频生成方法的流程图，其中，该视频生成方法包括：

S501：获取第一文本信息；其中，所述第一文本信息用于描述视频效果要求；

S502：获取至少一个多媒体素材。

本公开实施例中，获取第一文本信息以及至少一个多媒体素材的方式依然可参照上述实施例进行理解，在此不再赘述。

S503：基于所述第一文本信息和所述至少一个多媒体素材，确定至少一个视频编辑模板。

其中，所述至少一个视频编辑模板的编辑效果符合所述第一文本信息描述的视频效果要求。

一种可选的实施方式中，在获取到第一文本信息和多媒体素材之后，分别提取第一文本信息和多媒体素材的特征标签，然后，基于所述第一文本信息和所述至少一个多媒体素材的特征标签与可用的视频编辑模板进行匹配得到至少一个视频编辑模板，所述至少一个视频编辑模板中包括与所述第一文本信息的特征标签相匹配的第一视频编辑模板和与所述至少一个多媒体素材的特征标签相匹配的第二视频编辑模板。

一种可选的实施方式中，针对第一文本信息和多媒体素材分别对应的特征标签，与模板库中可用的视频编辑模板进行匹配，获取匹配成功的至少一个视频编辑模板。其中，匹配成功的视频编辑模板的编辑效果符合第一文本信息描述的视频效果要求。

进一步的，在获取到第一文本信息的特征标签相匹配的视频编辑模板，以及多媒体素材的特征标签相匹配的视频编辑模板之后，对二者分别对应的视频编辑模板进行混排，经过混排后的视频编辑模板可以展示在预览页面上。

如图6所示，为本公开实施例提供的一种预览页面的示意图，其中，预览页面的下方区域601内展示有预设个数的视频编辑模板，该预设个数的视频编辑模板为基于获取到的第一文本信息和至少一个多媒体素材确定。用户可以通过作用在该下方区域601内的横滑操作，触发在预览页面上显示更多的视频编辑模板，例如通过向左横滑操作触发从预览页面的右侧拉出显示更多的视频编辑模板。其中，拉出显示的视频编辑模板也为基于获取到的第一文本信息和至少一个多媒体素材确定。

一种可选的实施方式中，在获取到的至少一个视频编辑模板中选取第三视频编辑模板并呈现在视频编辑效果的预览页面上，以便预览页面用于预览获取到的至少一个多媒体素材导入第三视频编辑模板得到的视频效果，预览页面上设置有更新推荐控件；其中，第三视频编辑模板可以为显示在预览页面上的任意一个被选定的视频编辑模板。

响应于针对所述更新推荐控件的触发操作，在所述至少一个视频编辑模板中选取第四视频编辑模板，并利用所述第四视频编辑模板替换所述预览页面上呈现的第三视频编辑模板，以便所述预览页面用于预览所述至少一个多媒体素材导入所述第四视频编辑模板所得到的视频效果。其中，用于替换第三视频编辑模板的第四视频编辑模板可以属于基于第一文本信息和获取到的至少一个多媒体素材，确定的至少一个视频编辑模板。

一种可选的实施方式中，如果预览页面上展示的视频编辑模板不能够满足当前用户对视频编辑模板的使用需求，那么，当前用户可以通过针对预览页面上设置的“换一批”控件602的触发操作，触发对预览页面上展示的视频编辑模板的更新展示。

具体的，将第一视频编辑模板集合中的第一视频编辑模板显示在预览页面上。其中，第一视频编辑模板集合由基于第一文本信息和至少一个多媒体素材确定的至少一个视频编辑模板构成。在预览页面上显示第一视频编辑模板集合中的预设个数的视频编辑模板，如图6所示的预览页面的下方区域601内展示有预设个数的视频编辑模板，其中包括第一视频编辑模板，第一视频编辑模板可以为显示在预览页面上的任意一个视频编辑模板。响应于针对预览页面上的更新推荐控件(如图6所示的“换一批”控件602)的触发操作，利用第一视频编辑模板集合中的第二视频编辑模板替换预览页面上显示的第一视频编辑模板。也就是说，在响应于针对预览页面上的更新推荐控件的触发操作，利用第一视频编辑模板集合中的预设个数视频编辑模板替换预览页面上正在显示的视频编辑模板，实现视频编辑模板的更新，以便用户能够基于预览页面上更新显示后的视频编辑模板生成目标视频。

S504：将所述至少一个视频编辑模板中的目标视频编辑模板所指示的编辑操作应用于所述至少一个多媒体素材上，生成视频编辑草稿。

本公开实施例中，响应于针对预览页面上显示的至少一个视频编辑模板中的目标视频编辑模板的选定操作，将目标视频编辑模板所指示的编辑操作应用于获取到的多媒体素材上，生成视频编辑操作。

实际应用中，用户还可以触发针对视频编辑模板的切换操作，具体的，在预览页面上的预览窗口603内展示有应用任一视频编辑模板(如视频编辑模板A)的视频编辑草稿的预览效果，用户可以通过针对其他视频编辑模板(如视频编辑模板B)的选定操作，触发在预览窗口603内展示应用视频编辑模板B的视频编辑草稿的预览效果。

另一种可选的实施方式中，在预览页面上，用户还可以根据视频编辑草稿的预览效果，针对第一文本信息进行调整，以便能够生成符合用户的视频效果要求的视频编辑草稿。

具体的，在预览页面上显示基于初始第一文本信息和多媒体素材确定的视频编辑模板，在接收到针对初始第一文本信息的文本调整操作后，得到调整后文本信息，然后，基于调整后文本信息和多媒体素材，重新确定符合调整后文本信息描述的视频效果要求的视频编辑模板。用户可以基于重新确定的视频编辑模板，生成符合调整后文本信息描述的视频效果要求的视频编辑草稿。

一种可选的实施方式中，在预览页面上显示所述至少一个视频编辑模板中的第五视频编辑模板；其中，第五视频编辑模板为基于第一文本信息和多媒体素材确定的任意一个视频编辑模板。响应于在预览页面上针对第一文本信息的文本调整操作，得到调整后文本信息；然后，基于调整后文本信息和多媒体素材，重新确定第二视频编辑模板集合；并利用第二视频编辑模板集合中的第六视频编辑模板替换预览页面上显示的第五视频编辑模板。其中，第六视频编辑模板为基于调整后文本信息和多媒体素材重新确定的任意一个视频编辑模板。

在上述内容的基础上，在预览页面上，用户还可以根据视频编辑草稿的预览效果，不仅能够对第一文本信息进行调整，还可以针对多媒体素材进行调整，以便能够生成符合用户的视频效果要求的视频编辑草稿。

一种可选的实施方式中，接收针对初始多媒体素材的素材调整操作，得到调整后多媒体素材；其中，调整后多媒体素材可以包括初始多媒体素材中的全部或部分多媒体素材，素材调整操作可以包括针对初始多媒体素材的素材增加、删除、替换等操作。基于调整后文本信息和调整后多媒体素材，确定第二视频编辑模板集合。其中，第二视频编辑模板集合中的视频编辑模板是基于第一文本信息(或调整后文本信息)和调整后多媒体素材重新确定的。

S505：根据所述视频编辑草稿生成目标视频。

本公开实施例中，在生成视频编辑草稿之后，通过针对视频编辑草稿触发导出操作，能够生成目标视频。另外，生成的目标视频可以保存至本地或云端，或者，也可以针对目标视频触发发布操作等。

本公开实施例提供的视频生成方法中，基于描述视频效果要求的文本信息和多媒体素材，确定符合该视频效果要求的视频编辑模板，进而基于视频编辑模板生成目标视频，丰富了视频生成方式，从而提升了用户体验。

基于上述方法实施例，本公开还提供了一种视频生成装置，参考图7，为本公开实施例提供的一种视频生成装置的结构示意图，所述装置包括：

第一获取模块701，用于获取第一文本信息；其中，所述第一文本信息用于描述视频效果要求；

第二获取模块702，用于获取至少一个多媒体素材；

生成模块703，用于基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频；其中，所述目标视频中呈现有所述至少一个多媒体素材，所述目标视频的视频效果符合所述第一文本信息所描述的视频效果要求，所述目标视频用于呈现至少一个视频片段的组合，所述至少一个视频片段分别是基于所述至少一个多媒体素材中的各个影像素材形成的，所述各个影像素材包括视频素材和/或图像素材。

一种可选的实施方式中，所述生成模块，包括：

第一生成子模块，用于基于所述第一文本信息和所述至少一个多媒体素材，生成视频编辑草稿；其中，所述视频编辑草稿包括所述至少一个多媒体素材和编辑信息，所述编辑信息用于指示针对所述至少一个多媒体素材的编辑操作，所述编辑操作至少用于将所述至少一个多媒体素材中的各个影像素材分别编辑成所述至少一个视频片段，所述编辑操作对应的视频编辑效果和/或所述至少一个多媒体素材，符合所述第一文本信息所描述的视频效果要求；

第二生成子模块，用于根据所述视频编辑草稿生成目标视频。

一种可选的实施方式中，所述第二生成子模块，包括：

第一确定子模块，用于基于所述第一文本信息和所述至少一个多媒体素材，确定至少一个视频编辑模板；其中，所述至少一个视频编辑模板的编辑效果符合所述第一文本信息描述的视频效果要求；

第三生成子模块，用于将所述至少一个视频编辑模板中的目标视频编辑模板所指示的编辑操作应用于所述至少一个多媒体素材上，生成视频编辑草稿。

一种可选的实施方式中，所述第一确定子模块，包括：

提取子模块，用于分别提取所述第一文本信息和所述至少一个多媒体素材的特征标签；

第一匹配子模块，用于基于所述第一文本信息和所述至少一个多媒体素材的特征标签与可用的视频编辑模板进行匹配得到至少一个视频编辑模板，所述至少一个视频编辑模板中包括与所述第一文本信息的特征标签相匹配的第一视频编辑模板和与所述至少一个多媒体素材的特征标签相匹配的第二视频编辑模板。

一种可选的实施方式中，所述第二获取模块，包括：

第二匹配子模块，用于基于对所述第一文本信息的分析结果，从用户素材集合中匹配出至少一个多媒体素材中的第一多媒体素材；

和/或，

第四生成子模块，用于基于对所述第一文本信息的分析结果，生成至少一个多媒体素材中的第二多媒体素材；其中，所述至少一个多媒体素材符合所述第一文本信息描述的视频效果要求。

一种可选的实施方式中，所述装置还包括：

第一显示模块，用于响应于针对至少一个多媒体素材的导入操作，显示文本输入框；

相应的，所述第一获取模块，具体用于：

基于所述文本输入框，接收第一文本信息。

一种可选的实施方式中，所述装置还包括：

第二显示模块，用于显示至少一个视频标签；其中，所述视频标签用于表征视频效果；

相应的，所述第一获取模块，具体用于：

一种可选的实施方式中，所述装置还包括：

第三显示模块，用于在所述至少一个视频编辑模板中选取第三视频编辑模板并呈现在视频编辑效果的预览页面上，以便所述预览页面用于预览所述至少一个多媒体素材导入所述第三视频编辑模板所得到的视频效果，所述预览页面上设置有更新推荐控件；

第一替换模块，用于响应于针对所述更新推荐控件的触发操作，在所述至少一个视频编辑模板中选取第四视频编辑模板，并利用所述第四视频编辑模板替换所述预览页面上呈现的第三视频编辑模板，以便所述预览页面用于预览所述至少一个多媒体素材导入所述第四视频编辑模板所得到的视频效果。

一种可选的实施方式中，所述装置还包括：

第四显示模块，用于在预览页面上显示所述至少一个视频编辑模板中的第五视频编辑模板；

第一调整模块，用于响应于在所述预览页面上针对所述第一文本信息的文本调整操作，得到调整后文本信息；

第一确定模块，基于所述调整后文本信息和所述至少一个多媒体素材，确定第二视频编辑模板集合；

第二替换模块，用于利用所述第二视频编辑模板集合中的第六视频编辑模板替换所述预览页面上显示的所述第五视频编辑模板。

一种可选的实施方式中，所述装置还包括：

第二调整模块，用于接收针对所述至少一个多媒体素材的素材调整操作，得到调整后多媒体素材；

相应的，所述基第一确定模块，具体用于：

本公开实施例提供的视频生成装置，获取用于描述视频效果要求的第一文本信息，以及获取至少一个多媒体素材；然后，基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频；其中，所述目标视频中呈现有所述至少一个多媒体素材，所述目标视频的视频效果符合所述第一文本信息所描述的视频效果要求，所述目标视频用于呈现至少一个视频片段的组合，所述至少一个视频片段分别是基于所述至少一个多媒体素材中的各个影像素材形成的，所述各个影像素材包括视频素材和/或图像素材。可见，本公开实施例基于获取到第一文本信息和多媒体素材，能够生成符合第一文本信息描述的视频效果要求的目标视频，丰富了视频生成方式，从而提升了用户体验。

除了上述方法和装置以外，本公开实施例还提供了一种计算机可读存储介质，计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现本公开实施例所述的视频生成方法。

本公开实施例还提供了一种计算机程序产品，所述计算机程序产品包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现本公开实施例所述的视频生成方法。

另外，本公开实施例还提供了一种视频生成设备，参见图8所示，可以包括：

处理器801、存储器802、输入装置803和输出装置804。视频生成设备中的处理器801的数量可以一个或多个，图8中以一个处理器为例。在本公开的一些实施例中，处理器801、存储器802、输入装置803和输出装置804可通过总线或其它方式连接，其中，图8中以通过总线连接为例。

存储器802可用于存储软件程序以及模块，处理器801通过运行存储在存储器802的软件程序以及模块，从而执行视频生成设备的各种功能应用以及数据处理。存储器802可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外，存储器802可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置803可用于接收输入的数字或字符信息，以及产生与视频生成设备的用户设置以及功能控制有关的信号输入。

具体在本实施例中，处理器801会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器802中，并由处理器801来运行存储在存储器802中的应用程序，从而实现上述视频生成设备的各种功能。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种视频生成方法，其特征在于，所述方法包括：

获取第一文本信息；其中，所述第一文本信息用于描述视频效果要求；

获取至少一个多媒体素材；

基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频；其中，所述目标视频中呈现有所述至少一个多媒体素材，所述目标视频的视频效果符合所述第一文本信息所描述的视频效果要求，所述目标视频用于呈现至少一个视频片段的组合，所述至少一个视频片段分别是基于所述至少一个多媒体素材中的各个影像素材形成的，所述各个影像素材包括视频素材和/或图像素材。
根据权利要求1所述的方法，其特征在于，所述基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频，包括：

基于所述第一文本信息和所述至少一个多媒体素材，生成视频编辑草稿；其中，所述视频编辑草稿包括所述至少一个多媒体素材和编辑信息，所述编辑信息用于指示针对所述至少一个多媒体素材的编辑操作，所述编辑操作至少用于将所述至少一个多媒体素材中的各个影像素材分别编辑成所述至少一个视频片段；所述编辑操作对应的视频编辑效果和/或所述至少一个多媒体素材，符合所述第一文本信息所描述的视频效果要求；

根据所述视频编辑草稿生成目标视频。
根据权利要求1所述的方法，其特征在于，所述基于所述第一文本信息和所述至少一个多媒体素材，生成视频编辑草稿，包括：

基于所述第一文本信息和所述至少一个多媒体素材，确定至少一个视频编辑模板；其中，所述至少一个视频编辑模板的编辑效果符合所述第一文本信息描述的视频效果要求；

将所述至少一个视频编辑模板中的目标视频编辑模板所指示的编辑操作应用于所述至少一个多媒体素材上，生成视频编辑草稿。
根据权利要求3所述的方法，其特征在于，所述基于所述第一文本信息和所述至少一个多媒体素材，确定至少一个视频编辑模板，包括：

分别提取所述第一文本信息和所述至少一个多媒体素材的特征标签；

基于所述第一文本信息和所述至少一个多媒体素材的特征标签与可用的视频编辑模板进行匹配得到至少一个视频编辑模板，所述至少一个视频编辑模板中包括与所述第一文本信息的特征标签相匹配的第一视频编辑模板和与所述至少一个多媒体素材的特征标签相匹配的第二视频编辑模板。
根据权利要求1所述的方法，其特征在于，所述获取至少一个多媒体素材，包括：

基于对所述第一文本信息的分析结果，从用户素材集合中匹配出至少一个多媒体素材中的第一多媒体素材；

和/或，

基于对所述第一文本信息的分析结果，生成至少一个多媒体素材中的第二多媒体素材；其中，所述至少一个多媒体素材符合所述第一文本信息描述的视频效果要求。
根据权利要求1所述的方法，其特征在于，所述获取第一文本信息之前，还包括：

响应于针对至少一个多媒体素材的导入操作，显示文本输入框；

相应的，所述获取第一文本信息，包括：

基于所述文本输入框，接收第一文本信息。
根据权利要求6所述的方法，其特征在于，所述基于所述文本输入框，接收第一文本信息之前，还包括：

显示至少一个视频标签；其中，所述视频标签用于表征视频效果；

相应的，所述基于所述文本输入框，接收第一文本信息，包括：

基于将所述至少一个视频标签中的目标视频标签添加至所述文本输入框的操作，获取第一文本信息。
根据权利要求3所述的方法，其特征在于，所述基于所述第一文本信息和所述至少一个多媒体素材，确定至少一个视频编辑模板之后，还包括：

在所述至少一个视频编辑模板中选取第三视频编辑模板并呈现在视频编辑效果的预览页面上，以便所述预览页面用于预览所述至少一个多媒体素材导入所述第三视频编辑模板所得到的视频效果，所述预览页面上设置有更新推荐控件；

响应于针对所述更新推荐控件的触发操作，在所述至少一个视频编辑模板中选取第四视频编辑模板，并利用所述第四视频编辑模板替换所述预览页面上呈现的第三视频编辑模板，以便所述预览页面用于预览所述至少一个多媒体素材导入所述第四视频编辑模板所得到的视频效果。
根据权利要求3所述的方法，其特征在于，所述基于所述第一文本信息和所述至少一个多媒体素材，确定至少一个视频编辑模板之后，还包括：

在预览页面上显示所述至少一个视频编辑模板中的第五视频编辑模板；

响应于在所述预览页面上针对所述第一文本信息的文本调整操作，得到调整后文本信息；

基于所述调整后文本信息和所述至少一个多媒体素材，确定第二视频编辑模板集合；

利用所述第二视频编辑模板集合中的第六视频编辑模板替换所述预览页面上显示的所述第五视频编辑模板。
根据权利要求9所述的方法，其特征在于，所述基于所述调整后文本信息和所述至少一个多媒体素材，确定第二视频编辑模板集合之前，还包括：

接收针对所述至少一个多媒体素材的素材调整操作，得到调整后多媒体素材；

相应的，所述基于所述调整后文本信息和所述至少一个多媒体素材，确定第二视频编辑模板集合，包括：

基于所述调整后文本信息和所述调整后多媒体素材，确定第二视频编辑模板集合。
一种视频生成装置，其特征在于，所述装置包括：

第一获取模块，用于获取第一文本信息；其中，所述第一文本信息用于描述视频效果要求；

第二获取模块，用于获取至少一个多媒体素材；

生成模块，用于基于所述第一文本信息和所述至少一个多媒体素材，生成目标视频；其中，所述目标视频中呈现有所述至少一个多媒体素材，所述目标视频的视频效果符合所述第一文本信息所描述的视频效果要求，所述目标视频用于呈现至少一个视频片段的组合，所述至少一个视频片段分别是基于所述至少一个多媒体素材中的各个影像素材形成的，所述各个影像素材包括视频素材和/或图像素材。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现如权利要求1-10任一项所述的方法。
一种视频处理设备，其特征在于，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-10任一项所述的方法。