WO2023040743A1

WO2023040743A1 - 一种视频处理方法、装置、设备及存储介质

Info

Publication number: WO2023040743A1
Application number: PCT/CN2022/117803
Authority: WO
Inventors: 汪弈天; 何沃洲; 陈明杰; 于培华
Original assignee: Beijing Zitiao Network Technology Co Ltd
Current assignee: Beijing Zitiao Network Technology Co Ltd
Priority date: 2021-09-15
Filing date: 2022-09-08
Publication date: 2023-03-23
Anticipated expiration: 2024-03-15
Also published as: JP2024521502A; US20240114216A1; EP4340372A1; JP7822405B2; US12192594B2; CN115811632B; CN115811632A; EP4340372A4; US20250097546A1

Abstract

本公开提供了一种视频处理方法、装置、设备及存储介质，方法包括：按照第一脚本结构，展示视频剪辑的素材编辑区域；其中，素材编辑区域被划分为多个子区域，一个子区域与第一脚本结构中的一个脚本节点相对应，第一脚本结构指示目标视频的内容段落结构，一个脚本节点指示目标视频的一个内容段落；在多个子区域中的目标子区域中，按照时间轴轨道展示目标多媒体素材；按照素材编辑区域中展示的多媒体素材，生成目标视频；其中，在目标视频的目标内容段落中填充有目标多媒体素材。可见，本公开实施例能够基于包含有与脚本节点相对应的多个子区域的素材编辑区域，实现对视频的剪辑，丰富了视频处理的方式，进一步满足了人们多样化的视频剪辑需求。

Description

一种视频处理方法、装置、设备及存储介质

相关申请的交叉引用

本申请要求于2021年09月15日提交的，申请号为202111081785.6、发明名称为“一种视频处理方法、装置、设备及存储介质”的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本公开涉及计算机技术领域，尤其涉及一种视频处理方法、装置、设备及存储介质。

背景技术

随着计算机技术的发展，视频在工作和生活中的应用场景越来越广泛，人们对视频的剪辑需求也越来越多样化。

因此，如何满足人们对视频多样化的剪辑需求，是目前亟需解决的技术问题。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本公开实施例提供了一种视频处理方法、装置、设备及存储介质。

第一方面，本公开提供了一种视频处理方法，所述方法包括：

按照第一脚本结构，展示视频剪辑的素材编辑区域；其中，所述素材编辑区域被划分为多个子区域，一个所述子区域与所述第一脚本结构中的一个脚本节点相对应，所述第一脚本结构用于指示目标视频的内容段落结构，一个所述脚本节点用于指示所述目标视频的一个内容段落；

在所述多个子区域中的目标子区域中，按照时间轴轨道展示目标多媒体素材；其中，所述目标多媒体素材为针对目标脚本节点选取的多媒体素材，所述目标脚本节点为所述第一脚本结构中与所述目标子区域对应的脚本节点；

按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频；其中，在所述目标视频的目标内容段落中填充有所述目标多媒体素材，所述目标内容段落与所述目标脚本节点相对应。

一种可选的实施方式中，所述素材编辑区域中的所述多个子区域的界面布局方式为纵向对齐排列。

一种可选的实施方式中，所述按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频之前，还包括：

响应于针对所述第一脚本结构中的第一脚本节点的目标文本内容的调整操作，在所述素材编辑区域中确定所述第一脚本节点对应的多媒体素材，以及确定所述多媒体素材中与所述目标文本内容对应的多媒体片段；

根据所述调整操作，对所述多媒体素材中的所述多媒体片段进行剪辑。

响应于在所述第一脚本结构中的第二脚本节点的目标文本位置增加文本内容的操作，在所述素材编辑区域中确定与所述第二脚本节点对应的多媒体素材，以及确定所述多媒体素材中与所述目标文本位置对应的时间轴位置；

根据所述增加文本内容的操作，在所述多媒体素材中的所述时间轴位置添加与所述文本内容对应的多媒体片段。

响应于针对所述素材编辑区域中的第一多媒体素材的目标多媒体片段的剪辑操作，确定所述第一多媒体素材对应的脚本节点，并确定所述脚本节点中与所述目标多媒体片段对应的文本内容；

根据所述剪辑操作，对所述脚本节点中的所述文本内容进行调整。

响应于针对所述第一脚本结构中的第二脚本节点和第三脚本节点之间的顺序调整操作，在所述素材剪辑区域中确定所述第二脚本节点和所述第三脚本节点分别对应的子区域；

根据所述顺序调整操作，对所述素材剪辑区域中与所述第二脚本节点和所述第三脚本节点分别对应的子区域中的多媒体素材进行顺序调整。

一种可选的实施方式中，所述目标多媒体素材具有备选多媒体素材，所述按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频之前，还包括：

响应于针对所述目标子区域中的所述目标多媒体素材与所述备选多媒体素材的切换操作，将所述目标子区域中展示的目标多媒体素材切换为所述备选多媒体素材。

第二方面，本公开还提供了一种视频处理装置，所述装置包括：

第一展示模块，用于按照第一脚本结构，展示视频剪辑的素材编辑区域；其中，所述素材编辑区域被划分为多个子区域，一个所述子区域与所述第一脚本结构中的一个脚本节点相对应，所述第一脚本结构用于指示目标视频的内容段落结构，一个所述脚本节点用于指示所述目标视频的一个内容段落；

第二展示模块，用于在所述多个子区域中的目标子区域中，按照时间轴轨道展示目标多媒体素材；其中，所述目标多媒体素材为针对目标脚本节点选取的多媒体素材，所述目标脚本节点为所述第一脚本结构中与所述目标子区域对应的脚本节点；

生成模块，用于按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频；其中，在所述目标视频的目标内容段落中填充有所述目标多媒体素材，所述目标内容段落与所述目标脚本节点相对应。

第三方面，本公开提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现上述的方法。

第四方面，本公开提供了一种设备，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现上述的方法。

第五方面，本公开提供了一种计算机程序产品，所述计算机程序产品包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现上述的方法。

本公开实施例提供的技术方案与现有技术相比至少具有如下优点：

本公开实施例提供了一种视频处理方法，按照第一脚本结构展示视频剪辑的素材编辑区域，使得素材编辑区域中的子区域与第一脚本结构中的脚本节点相对应。另外，在素材编辑区域的目标子区域中，按照时间轴轨道展示为该目标子区域对应的目标脚本节点选取的多媒体素材，进而，按照素材编辑区域中展示的多媒体素材，生成目标视频。本公开实施例能够基于包含有与脚本节点相对应的多个子区域的素材编辑区域，实现对视频的剪辑，丰富了视频处理的方式，进一步满足了人们多样化的视频剪辑需求。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的一种视频处理方法的流程示意图；

图2为本公开实施例提供的一种脚本节点、内容段落、子区域的关系示意图；

图3a为本公开实施例提供的一种素材编辑区域的对齐方式示意图；

图3b为本公开实施例提供的另一种素材编辑区域的对齐方式示意图；

图4a为本公开实施例提供的一种素材编辑区域和第一脚本结构的示意图；

图4b为本公开实施例提供的另一种素材编辑区域和第一脚本结构的示意图；

图4c为本公开实施例提供的又一种素材编辑区域和第一脚本结构的示意图；

图5为本公开实施例提供的一种目标脚本节点、目标子区域、目标内容段落以及目标多媒体素材的关系示意图；

图6a为本公开实施例提供的一种目标多媒体素材的展示示意图；

图6b为本公开实施例提供的另一种目标多媒体素材的展示示意图；

图7为本公开实施例提供的一种生成目标视频的示意图；

图8为本公开实施例提供的一种目标多媒体素材与备选多媒体素材进行切换的示意图；

图9为本公开实施例提供的一种视频处理装置的结构示意图；

图10为本公开实施例提供的一种视频处理设备的结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

为了满足用户对视频剪辑的多样化需求，丰富视频处理的方式，本公开实施例提出了一种视频处理方法，首先，按照第一脚本结构，展示视频剪辑的素材编辑区域；其中，素材编辑区域被划分为多个子区域，一个子区域与第一脚本结构中的一个脚本节点相对应，第一脚本结构指示目标视频的内容段落结构，一个脚本节点指示目标视频的一个内容段落；然后，在多个子区域中的目标子区域中，按照时间轴轨道展示目标多媒体素材；其中，所述目标多媒体素材为针对目标脚本节点选取的多媒体素材，所述目标脚本节点为所述第一脚本结构中与所述目标子区域对应的脚本节点；进而，按照素材编辑区域中展示的多媒体素材，生成目标视频；其中，在目标视频的目标内容段落中填充有目标多媒体素材，所述目标内容段落与所述目标脚本节点相对应。

可见，本公开实施例按照第一脚本结构展示视频剪辑的素材编辑区域，使得素材编辑区域中的子区域与第一脚本结构中的脚本节点相对应。另外，在素材编辑区域的目标子区域中，按照时间轴轨道展示为该目标子区域对应的目标脚本节点选取的多媒体素材，进而，按照素材编辑区域中展示的多媒体素材，生成目标视频。本公开实施例能够基于包含有与脚本节点相对应的多个子区域的素材编辑区域，实现对视频的剪辑，丰富了视频处理的方式，进一步满足了人们多样化的视频剪辑需求。

基于此，本公开实施例提供了一种视频处理方法，参考图1，为本公开实施例提供的一种视频处理方法的流程示意图，该方法可以由视频处理装置执行，其中该装置可以采用软件和/或硬件实现，一般可集成在电子设备中。

如图1所示，该方法可以包括：

步骤101，按照第一脚本结构，展示视频剪辑的素材编辑区域。

其中，素材编辑区域被划分为多个子区域，一个子区域与第一脚本结构中的一个脚本节点相对应，第一脚本结构用于指示目标视频的内容段落结构，一个脚本节点用于指示目标视频的一个内容段落。

脚本为进行影视创作过程中的底稿，通常脚本中包括多个画面的描述内容，以指导拍摄者进行拍摄生成对应的影视作品。例如：脚本中包括a画面的相关描述内容，用于指示第一个镜头的拍摄，还包括b画面的相关描述内容，用于指示第二个镜头的拍摄等等，在进行影视创作时，拍摄者可以根据a画面的描述内容拍摄获得包含A视频片段的第一个镜头，根据b画面的描述内容拍摄获得包含B视频片段的第二个镜头，进而将第二个镜头拼接在第一个镜头之后，获得该脚本对应的影视作品。

本实施例中，第一脚本结构可以指上述脚本的结构，如描述内容段落结构等，可以理解的是，上述例子中脚本包括的第一个镜头和第二个镜头分别对应的描述内容与第一脚本结构中的脚本节点相对应，例如，第一个镜头的描述内容对应于第一脚本结构中的第一脚本节点，第二个镜头的描述内容对应于第一脚本结构中的第二脚本节点。

本实施例中，在确定第一脚本结构之后，按照第一脚本结构展示视频剪辑的素材编辑区域，并且可以在该素材编辑区域展示待剪辑的多媒体素材。具体的，可以按照第一脚本结构中的脚本节点，对该素材编辑区域进行划分，得到与每个脚本节点分别对应的子区域。其中，每个子区域与第一脚本结构中的一个脚本节点相对应。

为了更形象的对本公开实施例中的子区域与脚本节点之间关系等进行理解，可以结合图2所示的内容进行说明。其中，图2中的第一脚本结构包括Q个脚本节点，其中Q为正整数，基于包含Q个脚本节点的第一脚本结构，素材编辑区域可以被划分为Q个子区域，每个脚本节点对应的素材编辑区域中的一个子区域。

需要说明的是，该素材编辑区域中的多个子区域的界面布局方式有多种，可以根据需求进行选择，本实施例不做限制。例如，如图3a所示的纵向对齐排列，即不同行在竖向对齐排列。图3a中，各个子区域为左侧对齐，或者，各个子区域也可以右侧对齐。另外，如图3b所示的横向对齐排列，即不同列在横向对齐排列，图3b中，各个子区域为向上对齐，或者，各个子区域也可以向下对齐。

需要说明的是，一种可选的实施方式中，第一脚本结构中的脚本节点可以包括：脚本中的脚本批注和/或脚本段落，即脚本节点与脚本中的脚本批注和/或脚本段落具有对应关系。其中，脚本批注用于概括的表示脚本节点对应的多媒体素材内容，脚本段落包括脚本节点对应的详细文本内容。一种可选的实施方式中，脚本段落中包括的详细文本内容可以为通过对视频进行语音识别后获取到的文字信息。

具体的，按照第一脚本结构展示视频剪辑的素材编辑区域示例说明如下：

示例一：第一脚本结构中的脚本节点包括脚本批注，如图4a所示，假设第一脚本结构中包括第一脚本批注和第二脚本批注，其中，第一脚本批注为“//开场白”，第二脚本批注为“//环境介绍”。按照该第一脚本结构展示的素材编辑区域中，素材编辑区域的第一子区域与“//开场白”横向对应，素材编辑区域的第二子区域与“//环境介绍”横向对应。

示例二：第一脚本结构中的脚本节点包括脚本段落，如图4b所示，假设第一脚本结构中包括第一脚本段落和第二脚本段落，其中，第一脚本段落为通过语音识别获得的开场白文字，第二脚本段落为通过语音识别获得的环境介绍文字，在按照第一脚本结构展示的素材编辑区域中，素材编辑区域的第一子区域与开场白文字脚本段落横向对应，素材编辑区域的第二子区域与环境介绍文字脚本段落横向对应。

示例三：第一脚本结构中的脚本节点包括脚本批注和脚本段落，如图4c所示，假设第一脚本结构中包括第一脚本节点和第二脚本节点，其中，第一脚本节点包括第一脚本批注和第一脚本段落，第一脚本批注为“//开场白”，第一脚本段落为语音识别获得的开场白文字，第二脚本节点包括第二脚本批注和第二脚本段落，第二脚本批注为“//环境介绍”，第二脚本段落为语音识别获得的环境介绍文字，按照该第一脚本结构展示的素材编辑区域中的第一子区域与第一脚本结构中的开场白文字脚本段落和第一脚本批注均横向对应，素材编辑区域中的第二子区域与第一脚本结构中的环境介绍文字脚本段落和第二脚本批注均横向对应。

在按照第一脚本结构展示素材编辑区域之后，继续执行下述步骤102。

步骤102，在多个子区域中的目标子区域中，按照时间轴轨道展示目标多媒体素材。

其中，目标多媒体素材为针对目标脚本节点选取的多媒体素材，目标脚本节点为第一脚本结构中与目标子区域对应的脚本节点。

在本实施例中，目标子区域可以为素材编辑区域中的多个子区域中的任一个子区域，该目标子区域在第一脚本结构中存在对应的目标脚本节点，并且能够基于该目标脚本节点选取对应的目标多媒体素材。

一种可选的实施方式中，在获取到用户导入的目标多媒体素材之后，可以通过对该目标多媒体素材进行语音识别，并将语音识别结果与第一脚本结构中的各个脚本节点进行文本匹配，以确定与该目标多媒体素材对应的目标脚本节点，然后，在该目标脚本节点对应的目标子区域中，按照时间轴轨道对该目标多媒体素材进行展示。本公开实施例中的目标多媒体素材可以为拍摄获得的整段视频，也可以为拍摄获得的整段视频中的一个片段，本实施例不做限制。

为了便于理解，参考图5，根据目标脚本节点选取目标多媒体素材，该目标节点还与目标子区域对应，进而能够确定该目标子区域中展示的目标多媒体素材。

一种可选的实施方式中，如图6a所示，假设素材编辑区域中的第一子区域为目标子区域，首先确定第一脚本结构中第一子区域对应的目标脚本节点为“//开场白”，然后根据目标脚本节点选取多媒体素材，作为目标多媒体素材，进而将目标多媒体素材展示在第一子区域中。

其中，根据目标脚本节点选取多媒体素材的方法可以包括，通过对待选的多媒体素材进行图像识别和/或语音识别等，确定与“//开场白”脚本节点匹配度最高的多媒体素材，作为目标多媒体素材，在第一子区域中展示目标多媒体素材。

另一种可选的实施方式中，如图6b所示，假设素材编辑区域中的第一子区域为目标子区域，多媒体素材包括开场白视频素材，对开场白素材进行语音识别，获取对应的开场白文字，将该开场白文字作为第一脚本结构中的目标脚本节点，根据该开场白文字在多媒体素材中选取匹配度最高的目标多媒体素材，例如：选取开场白视频素材作为目标多媒体素材，进而在第一子区域中按照时间轴轨道展示开场白视频素材。

步骤103，按照素材编辑区域中展示的多媒体素材，生成目标视频。

其中，在目标视频的目标内容段落中填充有目标多媒体素材，目标内容段落与目标脚本节点相对应。

在本实施例中，在各个子区域中展示有多媒体素材之后，能够按照素材编辑区域中展示的多媒体素材生成目标视频。

为了便于理解，参见图5，目标视频包括Q段内容段落，其中Q为正整数，每个内容段落与第一脚本结构中的一个脚本节点具有对应关系，每个内容段落中可以填充有该内容段落对应的脚本节点选取的多媒体素材，该多媒体素材包括但不限于：视频、音频中的任一种或多种。

本实施例中，第一脚本结构用于指示该目标视频的内容段落结构，具体的，第一脚本结构中的一个脚本节点用于指示目标视频的一个内容段落，即脚本节点对应的内容段落符合该脚本节点的需求，因而能够根据第一脚本结构中的脚本节点对内容段落进行调整，从而生成符合第一脚本结构的目标视频。

继续以图5为例，第一脚本结构中包括Q个脚本节点，其中Q为正整数，并且每个脚本节点存在对应的内容段落，根据目标脚本节点能够确定目标子区域、目标内容段落以及目标多媒体素材三者间的对应关系，进而，对各个内容段落填充对应的目标多媒体素材，并将各个内容段落按照第一脚本结构进行拼接，从而获得对应的目标视频。

一种可选的实施方式中，如图7所示，素材编辑区域的第一子区域展示开场白视频素材，该开场白视频素材包括n帧，素材编辑区域的第二子区域展示环境介绍素材，该环境介绍视频素材包括m帧，其中n、m为正整数，根据第一脚本结构，确定第一子区域对应目标视频的第一内容段落，第二子区域对应目标视频的第二内容段落，从而使用n帧开场白视频素材填充第一内容段落，使用m帧环境介绍视频素材填充第二内容段落，进而生成目标视频。

综上，本公开实施例的视频处理方法，按照第一脚本结构展示视频剪辑的素材编辑区域，使得素材编辑区域中的子区域与第一脚本结构中的脚本节点相对应。另外，在素材编辑区域的目标子区域中，按照时间轴轨道展示为该目标子区域对应的目标脚本节点选取的多媒体素材，进而，按照素材编辑区域中展示的多媒体素材，生成目标视频。本公开实施例能够基于包含有与脚本节点相对应的多个子区域的素材编辑区域，实现对视频的剪辑，丰富了视频处理的方式，进一步满足了人们多样化的视频剪辑需求。

通常，一个视频作品是由多个子视频剪辑生成的，在进行剪辑的过程中，需要按照子视频对应的时间轴对子视频进行剪辑，并按照总视频对应的时间轴对子视频进行拼接。但是，该种基于时间轴的剪辑方法在进行语言内容相关的剪辑处理时操作复杂，需要反复对比子视频时间轴中各个画面帧的内容，因而该种技术方案无法实现对视频进行快速、便捷的剪辑操作，因而可以基于上述实施例实现对视频的剪辑操作，具体的，在所述按照素材编辑区域中展示的多媒体素材，生成目标视频之前，可以根据需求添加对应的操作步骤，示例说明如下：

一种可选的实施方式中，由于多媒体素材中出现口误等情况，要剪辑掉多媒体素材中对应的片段，则在上述实施例的步骤103前需要添加的步骤包括：

首先，响应于针对第一脚本结构中的第一脚本节点的目标文本内容的调整操作，在素材编辑区域中确定第一脚本节点对应的多媒体素材，以及确定多媒体素材中与目标文本内容对应的多媒体片段。

本示例中，第一脚本结构中的第一脚本节点存在对应的多媒体素材，并且该第一脚本节点为多媒体素材对应的文本内容，该文本内容的获取方式包括：根据语音识别技术识别获取文字信息、人工配置的字幕等。用户可以根据需求对第一脚本节点中的目标文本内容进行调整，响应于该调整，在素材编辑区域中确定该第一脚本节点对应的多媒体素材，并且为了确定需要进行调整的内容，还需要确定该多媒体素材中与目标文本内容对应的多媒体片段。

进一步的，根据该调整操作，对多媒体素材中的多媒体片段进行剪辑。其中，该剪辑包括但不限于：删减、移位等。

举例说明，目标文本内容为“早上中午好”，多媒体素材为打招呼视频，目标文本内容与多媒体素材的对应关系为：“早”对应打招呼视频的第1帧，“上”对应打招呼视频的第2帧，“中”对应打招呼视频的第3帧，“午”对应打招呼视频的第4帧，“好”对应打招呼视频的第5帧，本例中，“早上”为口误，目标视频中需要删除对应的片段，因而可以对目标文本内容进行操作，删除掉“早上中午好”中的“早上”，对应的打招呼视频中的第1帧和第2帧也会被删除。

另一个示例中，目标文本内容分可以与多媒体素材通过时间戳建立对应关系，时间戳能够将文本内容和多媒体素材的时间轴建立联系，具体的，假设文本内容为“早上中午好”，目标文本内容为“早上”，多媒体素材为打招呼视频，文本内容和多媒体素材的对应关系为：“早上”对应多媒体素材的第0秒到第1.5秒，“中午”对应多媒体素材的第1.5秒到第3秒，“好”对应多媒体素材的第3秒到第4秒，对目标文本内容进行操作，删除掉“早上中午好”中的“早上”，对应打招呼视频的第0秒到第1.5秒也会被删除。

本实施方式中，通过对第一脚本结构进行操作，避免了将需要处理的文本在多媒体素材的时间轴上通过人工进行定位的麻烦操作，提高了视频处理的效率和准确性。

另一种可选的实施方式中，需要在目标视频中增加多媒体片段，则在上述实施例的步骤103前需要添加的步骤包括：

首先，响应于在第一脚本结构中的第二脚本节点的目标文本位置增加文本内容的操作，在素材编辑区域中确定与第二脚本节点对应的多媒体素材，以及确定多媒体素材中与目标文本位置对应的时间轴位置。

本示例中，第一脚本结构中的第二脚本节点存在对应的多媒体素材，并且该第二脚本节点为多媒体素材对应的文本内容，该文本内容的获取方式有多种，包括：根据语音识别技术识别获取的文字信息、人工配置的字幕等。用户可以根据需求在第二脚本节点的目标文本位置增加文本内容，响应于该调整，在素材编辑区域中确定该第二脚本节点对应的多媒体素材，并且为了确定需要添加多媒体片段的位置，还需要确定该多媒体素材中与目标文本位置对应的时间轴位置。

进一步的，根据增加文本内容的操作，在多媒体素材中的时间轴位置添加与文本内容对应的多媒体片段。

一种可选的实施方式中，可以将时间轴位置前的多媒体素材确定为前部多媒体素材，将时间轴位置后的多媒体素材确定为后部多媒体素材，则该添加操作可以为在前部多媒体素材后连接多媒体片段，在多媒体片段后连接后部多媒体素材。通过对第一脚本结构进行操作，避免了将需要添加的文本在多媒体素材的时间轴上通过人工进行定位的麻烦操作，提高了视频处理的效率和准确性。

举例说明，第二脚本节点为“大家好”，多媒体素材为打招呼视频，目标文本内容与多媒体素材的对应关系为：“大”对应打招呼视频的第1帧，“家”对应打招呼视频的第2帧，“好”对应打招呼视频的第3帧，本例中，需要在“家”和“好”中间添加“中午”，响应于在第二脚本节点中添加“中午”的操作，获取“中午”对应的视频片段包括中午视频的第1帧和中午视频的第2帧，因而在打招呼视频的第2帧之后连接中午视频的第1帧和第2帧，在中午视频的第2帧之后连接打招呼视频的第3帧。

另一种可选的实施方式中，对多媒体素材进行剪辑操作，该多媒体素材对应的脚本节点也会发生对应的变化，该种应用场景中，在上述实施例的步骤103前需要添加的步骤包括：

首先，响应于针对素材编辑区域中的第一多媒体素材的目标多媒体片段的剪辑操作，确定第一多媒体素材对应的脚本节点，并确定脚本节点中与目标多媒体片段对应的文本内容。进一步的，根据剪辑操作，对脚本节点中的文本内容进行调整。

本示例中，若用户在素材编辑区域对第一多媒体素材中的目标多媒体片段进行剪辑操作，响应于该操作，需要对第一脚本结构进行相应的操作，因而需要确定该第一多媒体素材对应的脚本节点，并确定脚本节点中与目标多媒体片段对应的文本内容。进而根据对第一多媒体素材的剪辑操作对脚本节点中的文本内容进行相应调整。

举例说明，第一多媒体素材为打招呼视频，脚本节点中的文本内容与打招呼视频对应关系为：“早”对应打招呼视频的第1帧，“上”对应打招呼视频的第2帧，“中”对应打招呼视频的第3帧，“午”对应打招呼视频的第4帧，“好”对应打招呼视频的第5帧，本例中，删除打招呼视频的第3帧和第4帧，根据对打招呼视频的第3帧和第4帧的删除操作，相应的在脚本节点的文本内容中删除“中”和“午”，处理之后的脚本节点为“早上好”。从而统一了多媒体素材和对应的脚本节点的变化情况，保持了多媒体素材和脚本节点的一致性。

另一种可选的实施方式中，能够基于第一脚本结构调整多媒体素材的顺序，则在上述实施例的步骤103前需要添加的步骤包括：

首先，响应于针对第一脚本结构中的第二脚本节点和第三脚本节点之间的顺序调整操作，在素材剪辑区域中确定第二脚本节点和第三脚本节点分别对应的子区域。进一步的，根据所述顺序调整操作，对所述素材剪辑区域中与所述第二脚本节点和所述第三脚本节点分别对应的子区域中的多媒体素材进行顺序调整。

用户需要对多媒体素材进行顺序调整时，可以对第一脚本结构中的第二脚本节点和第三脚本节点进行调整，并且第二脚本节点存在对应的第二子区域，第三脚本节点也存在对应的第三子区域，响应于该调整，在素材编辑区域中确定第二子区域和第三子区域，根据用户对脚本结构的调整对第二子区域和第三子区域进行调整。本示例中，通过调整第一脚本结构能够调整多媒体素材的顺序，提高了视频处理的效率，同时也省去了为了确定多媒体素材的内容人工查看多媒体素材的步骤，使视频处理更加直观。

举例说明，本例中，第一脚本结构中的第二脚本节点为“//开场白”，第三脚本节点为“//环境介绍视频”，并且“//开场白”位于“//环境介绍视频”之后，对应的素材剪辑区域中开场白素材位于环境介绍素材之后。用户需要将开场白视频移动到环境介绍视频之前，可以将第一脚本结构中“//开场白”移动到“//环境介绍视频”之前，响应于用户的该操作，素材编辑区域的开场白素材移动到环境介绍素材之前。

另一种可选的实施方式中，在进行拍摄时为了提高生成的目标视频的质量，相似类型的视频会拍摄多条，因而目标多媒体素材具有备选多媒体素材，进而从备选多媒体素材中选取出效果最佳的一条，则在上述实施例的步骤103前需要添加的步骤包括：

响应于针对所述目标子区域中的所述目标多媒体素材与所述备选多媒体素材的切换操作，将目标子区域中展示的目标多媒体素材切换为备选多媒体素材。

本例中，备选多媒体素材可以是用户设置的，也可以是通过图像识别、语音识别技术与目标多媒体素材进行相似度对比获取的，用户可以将目标多媒体素材切换为备选多媒体素材，响应于该切换操作，将素材编辑区域中展示的目标多媒体素材切换为备选多媒体素材。需要说明的是，第一脚本结构中与目标子区域对应的目标脚本节点可以根据备选多媒体素材调整为该备选多媒体素材对应的文字信息。通过备选操作能够方便快捷的从多个多媒体素材中选取最符合用户需求的，提高了视频处理的效率。

举例说明，本例中，如图8所示，目标子区域为第一子区域，第一子区域中的目标多媒体素材为目标开场白素材，备选多媒体素材为第一备选开场白素材和第二备选开场白素材，在素材备选区域中还包括备选展示控件，该备选展示控件响应于用户的触控操作会在第一子区域展示备选多媒体素材，本示例中用户触控备选展示控件，并点选第二备选开场白素材与目标多媒体素材进行切换，进而在第一子区域中展示第二备选开场白素材。

综上，本公开实施例的视频处理方法，基于第一脚本结构建立的子区域、内容段落以及多媒体素材之间的对应关系，能够直观而便捷地对目标视频和/或第一脚本结构进行调整，同时降低了对以语言内容或剧情为核心的视频进行剪辑处理的复杂程度，提高了视频处理效率。

基于上述方法实施例，本公开还提供了一种视频处理装置，参考图9，为本公开实施例提供的一种视频处理装置的结构示意图，所述装置包括：

第一展示模块901，用于按照第一脚本结构，展示视频剪辑的素材编辑区域；其中，所述素材编辑区域被划分为多个子区域，一个所述子区域与所述第一脚本结构中的一个脚本节点相对应，所述第一脚本结构用于指示目标视频的内容段落结构，一个所述脚本节点用于指示所述目标视频的一个内容段落；

第二展示模块902，用于在所述多个子区域中的目标子区域中，按照时间轴轨道展示目标多媒体素材；其中，所述目标多媒体素材为针对目标脚本节点选取的多媒体素材，所述目标脚本节点为所述第一脚本结构中与所述目标子区域对应的脚本节点；

生成模块903，用于按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频；其中，在所述目标视频的目标内容段落中填充有所述目标多媒体素材，所述目标内容段落与所述目标脚本节点相对应。

一种可选的实施方式中，所述装置还包括：

第一确定模块，用于响应于针对所述第一脚本结构中的第一脚本节点的目标文本内容的调整操作，在所述素材编辑区域中确定所述第一脚本节点对应的多媒体素材，以及确定所述多媒体素材中与所述目标文本内容对应的多媒体片段；

剪辑模块，用于根据所述调整操作，对所述多媒体素材中的所述多媒体片段进行剪辑。

一种可选的实施方式中，所述装置还包括：

第二确定模块，用于响应于在所述第一脚本结构中的第二脚本节点的目标文本位置增加文本内容的操作，在所述素材编辑区域中确定与所述第二脚本节点对应的多媒体素材，以及确定所述多媒体素材中与所述目标文本位置对应的时间轴位置；

添加模块，用于根据所述增加文本内容的操作，在所述多媒体素材中的所述时间轴位置添加与所述文本内容对应的多媒体片段。

一种可选的实施方式中，所述装置还包括：

第三确定模块，用于响应于针对所述素材编辑区域中的第一多媒体素材的目标多媒体片段的剪辑操作，确定所述第一多媒体素材对应的脚本节点，并确定所述脚本节点中与所述目标多媒体片段对应的文本内容；

第一调整模块，用于根据所述剪辑操作，对所述脚本节点中的所述文本内容进行调整。

一种可选的实施方式中，所述装置还包括：

第四确定模块，用于响应于针对所述第一脚本结构中的第二脚本节点和第三脚本节点之间的顺序调整操作，在所述素材剪辑区域中确定所述第二脚本节点和所述第三脚本节点分别对应的子区域；

第二调整模块，用于根据所述顺序调整操作，对所述素材剪辑区域中与所述第二脚本节点和所述第三脚本节点分别对应的子区域中的多媒体素材进行顺序调整。

一种可选的实施方式中，所述目标多媒体素材具有备选多媒体素材，所述装置还包括：

切换模块，用于响应于针对所述目标子区域中的所述目标多媒体素材与所述备选多媒体素材的切换操作，将所述目标子区域中展示的目标多媒体素材切换为所述备选多媒体素材。

本公开实施例提供的视频处理装置中，按照第一脚本结构展示视频剪辑的素材编辑区域，使得素材编辑区域中的子区域与第一脚本结构中的脚本节点相对应。另外，在素材编辑区域的目标子区域中，按照时间轴轨道展示为该目标子区域对应的目标脚本节点选取的多媒体素材，进而，按照素材编辑区域中展示的多媒体素材，生成目标视频。本公开实施例能够基于包含有与脚本节点相对应的多个子区域的素材编辑区域，实现对视频的剪辑，丰富了视频处理的方式，进一步满足了人们多样化的视频剪辑需求。

除了上述方法和装置以外，本公开实施例还提供了一种计算机可读存储介质，计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现本公开实施例所述的视频处理方法。

本公开实施例还提供了一种计算机程序产品，所述计算机程序产品包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现本公开实施例所述的视频处理方法。

另外，本公开实施例还提供了一种视频处理设备，参见图10所示，可以包括：

处理器1001、存储器1002、输入装置1003和输出装置1004。视频处理设备中的处理器1001的数量可以一个或多个，图10中以一个处理器为例。在本公开的一些实施例中，处理器1001、存储器1002、输入装置1003和输出装置1004可通过总线或其它方式连接，其中，图10中以通过总线连接为例。

存储器1002可用于存储软件程序以及模块，处理器1001通过运行存储在存储器1002 的软件程序以及模块，从而执行视频处理设备的各种功能应用以及数据处理。存储器1002可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外，存储器1002可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置1003可用于接收输入的数字或字符信息，以及产生与视频处理设备的用户设置以及功能控制有关的信号输入。

具体在本实施例中，处理器1001会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器1002中，并由处理器1001来运行存储在存储器1002中的应用程序，从而实现上述视频处理设备的各种功能。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种视频处理方法，其特征在于，所述方法包括：

按照第一脚本结构，展示视频剪辑的素材编辑区域；其中，所述素材编辑区域被划分为多个子区域，一个所述子区域与所述第一脚本结构中的一个脚本节点相对应，所述第一脚本结构用于指示目标视频的内容段落结构，一个所述脚本节点用于指示所述目标视频的一个内容段落；

在所述多个子区域中的目标子区域中，按照时间轴轨道展示目标多媒体素材；其中，所述目标多媒体素材为针对目标脚本节点选取的多媒体素材，所述目标脚本节点为所述第一脚本结构中与所述目标子区域对应的脚本节点；

按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频；其中，在所述目标视频的目标内容段落中填充有所述目标多媒体素材，所述目标内容段落与所述目标脚本节点相对应。
根据权利要求1所述的方法，其特征在于，所述素材编辑区域中的所述多个子区域的界面布局方式为纵向对齐排列。
根据权利要求1所述的方法，其特征在于，所述按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频之前，还包括：

响应于针对所述第一脚本结构中的第一脚本节点的目标文本内容的调整操作，在所述素材编辑区域中确定所述第一脚本节点对应的多媒体素材，以及确定所述多媒体素材中与所述目标文本内容对应的多媒体片段；

根据所述调整操作，对所述多媒体素材中的所述多媒体片段进行剪辑。
根据权利要求1所述的方法，其特征在于，所述按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频之前，还包括：

响应于在所述第一脚本结构中的第二脚本节点的目标文本位置增加文本内容的操作，在所述素材编辑区域中确定与所述第二脚本节点对应的多媒体素材，以及确定所述多媒体素材中与所述目标文本位置对应的时间轴位置；

根据所述增加文本内容的操作，在所述多媒体素材中的所述时间轴位置添加与所述文本内容对应的多媒体片段。
根据权利要求1所述的方法，其特征在于，所述按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频之前，还包括：

响应于针对所述素材编辑区域中的第一多媒体素材的目标多媒体片段的剪辑操作，确定所述第一多媒体素材对应的脚本节点，并确定所述脚本节点中与所述目标多媒体片段对应的文本内容；

根据所述剪辑操作，对所述脚本节点中的所述文本内容进行调整。
根据权利要求1所述的方法，其特征在于，所述按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频之前，还包括：

响应于针对所述第一脚本结构中的第二脚本节点和第三脚本节点之间的顺序调整操作，在所述素材剪辑区域中确定所述第二脚本节点和所述第三脚本节点分别对应的子区域；

根据所述顺序调整操作，对所述素材剪辑区域中与所述第二脚本节点和所述第三脚本节点分别对应的子区域中的多媒体素材进行顺序调整。
根据权利要求1所述的方法，其特征在于，所述目标多媒体素材具有备选多媒体素材，所述按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频之前，还包括：

响应于针对所述目标子区域中的所述目标多媒体素材与所述备选多媒体素材的切换操作，将所述目标子区域中展示的目标多媒体素材切换为所述备选多媒体素材。
一种视频处理装置，其特征在于，所述装置包括：

第一展示模块，用于按照第一脚本结构，展示视频剪辑的素材编辑区域；其中，所述素材编辑区域被划分为多个子区域，一个所述子区域与所述第一脚本结构中的一个脚本节点相对应，所述第一脚本结构用于指示目标视频的内容段落结构，一个所述脚本节点用于指示所述目标视频的一个内容段落；

第二展示模块，用于在所述多个子区域中的目标子区域中，按照时间轴轨道展示目标多媒体素材；其中，所述目标多媒体素材为针对目标脚本节点选取的多媒体素材，所述目标脚本节点为所述第一脚本结构中与所述目标子区域对应的脚本节点；

生成模块，用于按照所述素材编辑区域中展示的多媒体素材，生成所述目标视频；其中，在所述目标视频的目标内容段落中填充有所述目标多媒体素材，所述目标内容段落与所述目标脚本节点相对应。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现如权利要求1-7任一项所述的方法。
一种设备，其特征在于，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-7任一项所述的方法。
一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现如权利要求1-7任一项所述的方法。