WO2020020241A1

WO2020020241A1 - 视频处理方法和装置

Info

Publication number: WO2020020241A1
Application number: PCT/CN2019/097527
Authority: WO
Inventors: 王君富
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Priority date: 2018-07-27
Filing date: 2019-07-24
Publication date: 2020-01-30
Anticipated expiration: 2021-01-27
Also published as: US11445272B2; EP3826312A1; CN110769279A; US20210314675A1; CN110769279B; EP3826312A4

Abstract

本公开提出一种视频处理方法和装置，涉及多媒体技术领域。本公开的一种视频处理方法包括：对视频的台词进行语义分析，获取凝练台词；基于预定图像处理策略确定视频中各帧图像的权重；按照预定视频缩短比例，根据各帧图像的权重从高到低的顺序抽取图像帧，获取缩短版视频图像；根据缩短版视频图像和凝练台词获取缩短视频。通过这样的方法，能够生成符合视频主题内容的凝练台词，并提取出视频中重要的帧，自动生成缩短视频供用户观看，使用户能够高效的获取视频的有效信息，提高用户体验。

Description

视频处理方法和装置

相关申请的交叉引用

本申请是以CN申请号为201810843764.5，申请日为2018年7月27日的申请为基础，并主张其优先权，该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本公开涉及多媒体技术领域，特别是一种视频处理方法和装置。

背景技术

随着人们的生活节奏不断加快，大家越来越希望能够在有限的碎片化时间中获取更多的信息，信息获取的途径有文字、图像、视频等。目前，视频是我们快速获取信息的重要来源，与此同时我们对视频的播放形式、观看方式的要求越来越高。

为提高在视频观看过程中的信息获取效率，播放器提供了两种方案：

(1)快进方案。在视频播放器中，用户可以通过左右滑动屏幕、或在键盘上点击左右键来实现快进和快退效果，还可以直接拖动进度条实现快进和快退的效果。

(2)倍速方案。用户可以在视频播放器的显示界面选择播放速度，实现快速播放的效果。

发明内容

根据本公开的一些实施例，提出一种视频处理方法，包括：对视频的台词进行语义分析，获取凝练台词；基于预定图像处理策略确定视频中各帧图像的权重；按照预定视频缩短比例，根据各帧图像的权重从高到低的顺序抽取图像帧，获取缩短版视频图像；根据缩短版视频图像和凝练台词获取缩短视频。

在一些实施例中，获取缩短视频包括：确定缩短版视频图像中各帧图像在原视频时间轴中的位置；确定凝练台词中各句台词对应的原台词在原视频时间轴中的位置；根据时间轴将视频图像的播放进度和凝练台词的播放进度契合，生成缩短视频。

在一些实施例中，预定图像处理策略包括：根据视频的类型标签确定权重分配策略；以及根据权重分配策略执行以下操作中的一种或多种：根据权重分配策略增加特写镜头图像帧的权重；根据权重分配策略增加面部情绪丰富的图像帧的权重；或，根据权重分配策略增加广角镜头图像帧的权重。

在一些实施例中，视频处理方法还包括：根据已观看视频的用户对视频的播放行为调整各帧图像的权重；根据调整权重后的图像帧生成缩短版视频图像，以便更新缩短视频。

在一些实施例中，视频处理方法还包括：针对单个用户：获取用户对同一类型标签的视频的播放行为，根据用户的播放行为更新用户对同一类型标签的视频的权重分配策略；根据更新后的权重分配策略调整同一类型标签的视频中各个图像帧的权重；根据调整权重后的图像帧生成用户个性化缩短版视频图像，以便生成用户个性化缩短视频。

在一些实施例中，视频处理方法还包括：针对同一类用户对同一个视频和/或同一类型标签的视频的播放行为更新针对这一类用户的权重分配策略；根据更新后的权重分配策略调整同一类型标签的视频中各个图像帧的权重；根据调整权重后的图像帧生成用户类型个性化缩短版视频图像，以便生成用户类型个性化缩短视频。

在一些实施例中，视频处理方法还包括：通过采集用户的播放行为确定用户的观看偏好；根据用户的观看偏好确定用户的相似程度；将相似程度超过预定阈值的用户确定为同一类用户。

在一些实施例中，视频处理方法还包括：通过基于条目的协同过滤算法和/或机器学习算法调整各个图像帧的权重，根据调整权重后的图像帧生成缩短版视频图像，以便更新缩短视频。

根据本公开的另一些实施例，提出一种视频处理装置，包括：台词处理单元，被配置为对视频的台词进行语义分析，获取凝练台词；权重确定单元，被配置基于预定图像处理策略确定视频中各帧图像的权重；图像缩短单元，被配置为按照预定视频缩短比例，根据各帧图像的权重从高到低的顺序抽取图像帧，获取缩短版视频图像；缩短视频获取单元，被配置为根据缩短版视频图像和凝练台词获取缩短视频。

在一些实施例中，缩短视频获取单元，被配置为：确定缩短版视频图像中各帧图像在原视频时间轴中的位置；确定凝练台词中各句台词对应的原台词在原视频时间轴中的位置；根据时间轴将视频图像的播放进度和凝练台词的播放进度契合，生成缩短视频。

在一些实施例中，预定图像处理策略包括：根据视频的类型标签确定权重分配策略；以及根据权重分配策略执行以下操作中的一种或多种：

根据权重分配策略增加特写镜头图像帧的权重；根据权重分配策略增加面部情绪丰富的图像帧的权重；或，根据权重分配策略增加广角镜头图像帧的权重。

在一些实施例中，权重确定单元还被配置为：根据已观看视频的用户对视频的播放行为调整各帧图像的权重；图像缩短单元还被配置为根据调整权重后的图像帧生成缩短版视频图像，以便缩短视频获取单元更新缩短视频。

在一些实施例中，视频处理装置还包括：用户行为获取单元，被配置为针对单个用户，获取用户对同一类型标签的视频的播放行为，根据用户的播放行为更新用户对同一类型标签的视频的权重分配策略；权重确定单元还被配置为：根据更新后的权重分配策略调整同一类型标签的视频中各个图像帧的权重；图像缩短单元还被配置为根据调整权重后的图像帧生成用户个性化缩短版视频图像，以便缩短视频获取单元生成用户个性化缩短视频。

在一些实施例中，视频处理装置还包括：策略调整单元，被配置为针对同一类用户对同一个视频和/或同一类型标签的视频的播放行为更新针对这一类用户的权重分配策略；权重确定单元还被配置为：根据更新后的权重分配策略调整同一类型标签的视频中各个图像帧的权重；图像缩短单元还被配置为根据调整权重后的图像帧生成用户类型个性化缩短版视频图像，以便缩短视频获取单元生成用户类型个性化缩短视频。

在一些实施例中，视频处理装置还包括：用户类型确定单元，被配置为：通过采集用户的播放行为确定用户的观看偏好；根据用户的观看偏好确定用户的相似程度；将相似程度超过预定阈值的用户确定为同一类用户。

在一些实施例中，视频处理装置还包括：缩短视频优化单元，被配置为通过基于条目的协同过滤算法和/或机器学习算法调整各个图像帧的权重，根据调整权重后的图像帧生成缩短版视频图像，以便更新缩短视频。

根据本公开的又一些实施例，提出一种视频处理装置，包括：存储器；以及耦接至存储器的处理器，处理器被配置为基于存储在存储器的指令执行上文中任意一种视频处理方法。

根据本公开的再一些实施例，提出一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时实现上文中任意一种视频处理方法的步骤。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本公开的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1为本公开的图像处理方法的一些实施例的流程图。

图2为本公开的图像处理方法中音频、图像匹配的一些实施例的流程图。

图3A为本公开的图像处理方法中图像帧权重调整的一些实施例的流程图。

图3B为本公开的图像处理方法中图像帧权重调整的另一些实施例的流程图。

图3C为本公开的图像处理方法中图像帧权重调整的又一些实施例的流程图。

图4为本公开的图像处理方法的又一些实施例的流程图。

图5为本公开的图像处理装置的一些实施例的示意图。

图6为本公开的图像处理装置的另一些实施例的示意图。

图7为本公开的图像处理装置的又一些实施例的示意图。

具体实施方式

下面通过附图和实施例，对本公开的技术方案做进一步的详细描述。

发明人发现：相关技术中的快进方案需要人不断的干预，不断的向前或向后滑动，以满足观看效果，但是遗漏内容以后还需要再重新回来观看。这样就导致用户不能专心的观看视频内容，获取的故事情节也是不连续的，用户体验很差，还容易遗漏关键内容。这样用户花费了时间却没能有效的达到快速观看的效果。

倍速播放方案中，通常最大倍速为2倍速，2倍速以下的播放依然会消耗用户大量的时间，比如一节40分钟的电视剧，即使1.5倍速还需要27分钟；如果2倍速播放视频的时候，那么对用户听力和理解能力都有较高的要求，而且用户必须一直处于一个高度集中、精神紧张的状态，这样就失去了观看视频的乐趣。

本公开的图像处理方法的一些实施例的流程图如图1所示。

在步骤101中，对视频的台词进行语义分析，获取凝练台词。在一些实施例中，可以获取当前视频的全部台词，对台词进行NLU(Natural Language Understanding，自然语言理解)，凝练总结视频的叙事结构、故事情节等。通过句法分析、信息抽取、语言组织，形成新台词，且新台词包含了完整的叙事情节。在一些实施例中，可以根据需要控制凝练台词的长度，如使得凝练台词长度在原台词长度的四分之一左右。

在步骤102中，基于预定图像处理策略确定视频中各帧图像的权重。在一些实施例中，可以对视频的每一帧画面进行分析，比如：标注某个镜头是广角或特写镜头，以及标注在这些镜头中包含了哪些人物和角色，并且识别出他们的面部情绪的喜怒哀乐。将视频内容按帧的维度进行图像分拆，接着对图像做标注，比如：广角镜头、特写镜头，喜怒哀乐等人物表情，以及视频中出现的主配角和路人甲。在一些实施例中，可以根据视频的标签、台词以及画面设置对不同视频帧设置不同的权重。

在步骤103中，按照预定视频缩短比例，根据各帧图像的权重从高到低的顺序抽取图像帧，获取缩短版视频图像。

在步骤104中，根据缩短版视频图像和凝练台词获取缩短视频，如将图像、音频合并，控制双方同步播放，形成缩短视频。

通过这样的方法，能够生成符合视频主题内容的凝练台词，并提取出视频中重要的帧，自动生成缩短视频供用户观看，例如，将一集40分钟的电视剧缩短为10分钟，一部2个小时的电影缩短为30分钟，缩短视频中保留视频主要表达的内容，大大提高了人们观看的效率和信息获取效率，提高用户体验。

在一些实施例中，为保证视频的音频、视频同步播放，本公开的图像处理方法中音频、图像匹配的一些实施例的流程图如图2所示。

在步骤201中，确定缩短版视频图像中各帧图像对应原视频时间轴中的时间点。

在步骤202中，确定凝练台词中各句台词对应的原台词在原视频时间轴中的位置。在一些实施例中，由于台词经过凝练处理，因此获取每句台词对应原视频时间轴的时间段。

在步骤203中，根据时间轴将视频图像的播放进度和凝练台词的播放进度契合，生成缩短视频。

在一些实施例中，若图像帧在时间轴中的时间点落在某句台词对应的时间段范围内，则将该台词与该图像帧同步播放。

在一些实施例中，若图像帧在时间轴中的时间点不落在凝练台词中任何一句台词对应的时间段范围内，则可以通过降低音频播放速度，或增加停顿、插入背景音等方式使其他图像帧与对应的台词同步播放。

在一些实施例中，若台词对应的时间段不存在选出的图像帧，则可以从台词对应的时间段内根据图像帧权重选择适宜数量的图像帧播放。

通过这样的方法，能够尽可能保证台词与图像进度的同步，便于用户对视频的理解，提高缩短视频的质量，提升用户体验。

在一些实施例中，在获取凝练台词的过程中，可以采用word2vector建模，联系上下文理解每个词语的语义，将相同语义台词进行重新抽取总结；对于语义的表示，使用监督学习方法，因为对于场景的理解，非监督学习无法做到，比如台词：“谁的梦想是环游世界？”和“环游世界是谁的梦想？”，对于非监督学习来说，这两句台词是一样的，事实上是不一样的；对于上下文的顺序要考虑到时间序列问题，RNN(Recurrent Neural Network，循环神经网络)模型里的LSTM(Long Short-Term Memory，长短期记忆网络)是利用过去一段时间内某事件时间的特征来预测未来一段时间内该事件的特征。在一些实施例中，对于台词文本分布的不均匀性会导致出现语义倾斜问题，在word2vector模型上融合TF_IDF(Term Frequency–Inverse Document Frequency，词频-逆文本频率指数)思想，进行语义平滑处理，并且在有必要的情况下进行降维处理。

通过这样的方法，能够实现对语义的正确理解和适当凝练，从而保证凝练台词相对于原台词保留较多的重要信息的信息量，保证凝练台词对原台词表达的正确性，提高用户体验。

在一些实施例中，对于不同地域、风格和/或类型的视频可以设置不同的图像权重设置策略。如，可以对视频进行分类，比如按地区可分为华语、港片、欧美、日韩等；按类型可分为喜剧、悲剧、爱情、动作、枪战、惊悚、悬疑等，按照风格分可以包括甜美、荒野、值得一看、人工智能、机器人等。不同的地域、风格和/或类型的视频可以设置过滤不同的内容，例如：爱情片更注重故事情节，从而有针对性的提高故事情节、人物特写镜头的权重；枪战片更注重打斗场面，从而有针对性的提高打斗场景的权重；悬疑片对场景和音效要求比较高，从而有针对性的提高变化较慢的场景的权重等。在一些实施例中，视频分类信息在录入视频数据的时候手动添加，可以直接读取视频；标签可以在用户在观看视频的时候可根据视频内容和自己的感受选择，如果没有合适的可自行添加。然后使用K-means(K-均值)聚类算法，将用户的标签分类，选择离中心点最近的标签作为此视频的标签，并按照预定频率更新，从而提高时效性。在一些实施例中，可以通过图像识别系统(如开源模型TensorFlow(张量流))对视频图像进行训练，最后把训练结果结合视频的分类和标签，识别出相应的剧情片段。

通过这样的方法，能够根据不同视频的特点调整图像权重设置策略，从而使得缩短视频更加符合对应地域、风格和/或类型的视频的特征，提高缩短视频对原视频的信息保留量，突出重点信息，提升用户体验。

在一些实施例中，当视频初始上架时，可以通过上文中的方法生成缩短视频，进而根据用户观看行为调整，形成更加符合用户需求的缩短视频。本公开的图像处理方法中图像帧权重调整的一些实施例的流程图如图3A所示。

在步骤311中，根据已观看视频的用户对视频的播放行为调整各帧图像的权重。在一些实施例中，将用户的视频行为记录下来，如，用户在视频播放到什么位置进行快进；在什么位置进行快速播放；在什么位置进行内容回看；在什么位置进行停留，以及停留时长。在一些实施例中，用户行为采集可以通过捕捉鼠标点击事件和记录视频时间轴滚动的位置情况实现。对于快进的图像帧，可以认为该部分视频信息量不重要，降低其权重；对于回看的图像帧，增加其权重；对于停留时长较长(但在预定范围内，以防由于用户离开暂停视频导致影响图像帧重要性判断)，增加图像帧权重(可以设置当停留时长在预定时间范围内时，停留时间越长则权重越大)等。

在步骤312中，根据调整权重后的图像帧生成缩短版视频图像，以便更新缩短视频。

通过这样的方法，能够针对用户对同一视频的观看行为进行特征采集，通过用户播放行为分析，得到来自用户的图像帧重要情况反馈，从而实现对于视频自身的个性化图像帧权重分析，提高图像帧提取的准确度，进一步优化缩短视频对用户需求的满足情况。

在一些实施例中，由于不同用户具有不同的视频观看习惯，其重视的环节会有区别，因此可以根据用户本身的播放习惯调整为该用户个人提供的缩短视频。本公开的图像处理方法中图像帧权重调整的另一些实施例的流程图如图3B所示。

在步骤321中，针对单个用户，获取用户对同一类型标签的视频的播放行为，根据用户的播放行为更新用户对同一类型标签的视频的权重分配策略。例如两个视频都是电视剧、都是穿越剧、都是宫廷剧，那么这两个视频的相似度就很高，可以归为同一类型标签的视频。又例如，对于同一电视剧，虽然每一集是不同的视频，但其具有一定的连贯性和相似度，可以根据用户对观看过的几集的播放行为调整对未观看视频的缩短视频。

在一些实施例中，可以针对用户对相同类型的视频的播放行为，如更喜欢观看特写镜头、打斗场景等，则该类场景图像帧的权重应升高；若用户对某些图像帧出现快进、跳过等操作，那么这些图像帧归属的图像帧类型的图像帧权重应降低。

在步骤322中，根据更新后的权重分配策略调整同一类型标签的视频中各个图像帧的权重。

在步骤323中，根据调整权重后的图像帧生成用户类型个性化缩短版视频图像,生成用户类型个性化缩短视频。

通过这样的方法，可以对同一用户个人的喜好进行分析，生成用户个性化的权重分配策略，从而实现用户自适应的图像缩短操作，保证视频对每个用户的吸引力，进一步提升用户体验。

本公开的图像处理方法中图像帧权重调整的又一些实施例的流程图如图3C所示。

在步骤331中，针对同一类用户对同一个视频和/或同一类型标签的视频的播放行为更新针对这一类用户的权重分配策略。在一些实施例中，通过采集不同用户的播放行为确定用户的观看偏好，根据用户的观看偏好确定不同用户的相似程度，进而将相似程度超过预定阈值的用户确定为同一类用户。

在步骤332中，根据更新后的权重分配策略调整同一类型标签的视频中各个图像帧的权重。

在步骤333中，根据调整权重后的图像帧生成用户类型个性化缩短版视频图像，以便生成用户类型个性化缩短视频。

由于部分用户的行为会有一定的相似度，因此可以用同一类型的用户播放行为生成针对该类用户的个性化缩短视频，从而降低由于单个用户的播放行为有限造成的基础数据量不足、偶然性影响大的问题，提升缩短视频对用户的个性化适应能力。

本公开的图像处理方法的又一些实施例的流程图如图4所示。

在步骤401中，在冷启动阶段，对视频的台词进行语义分析，获取凝练台词。在一些实施例中，可以根据目标视频的长度控制凝练台词的长度。

在步骤402中，基于预定图像处理策略确定视频中各帧图像的权重。在一些实施例中，可以根据权重分配策略增加特写镜头图像帧的权重；根据权重分配策略增加面部情绪丰富的图像帧的权重；根据权重分配策略增加广角镜头图像帧的权重。在一些实施例中，权重调整量可以根据视频的标签对应的权重分配策略确定。

在步骤403中，按照预定视频缩短比例，根据各帧图像的权重从高到低的顺序抽取图像帧，获取缩短版视频图像。

在步骤404中，根据所述缩短版视频图像和所述凝练台词获取缩短视频。

在步骤411中，随着用户的使用获取用户的播放行为。

在步骤412中，通过基于用户的协同过滤算法调整各个图像帧的权重。通过采集的用户行为数据可以发现用户对某个视频的观看偏好，并对这些偏好进行度量和打分。根据不同用户对相同视频的态度和偏好程度计算用户之间的关系，对有相同喜好的用户进行相同风格的视频剪辑整合。

在步骤413中，重新对图像帧进行权重分配，继而执行步骤430。在一些实施例中，可以采用图3A和/或3B相关的实施例中的方式实现基于用户播放行为对权重分配的调整。

在步骤421中，通过基于条目的协同过滤算法调整各个图像帧的权重。通过计算不同用户对不同视频的评分获得视频间的关系。基于视频间的关系对同类的新剧和新片就可以依据相同的方案进行剪辑和整合。在一些实施例中，可以采用图3A或3C所示实施例中的方式实现基于同一类型视频不同用户播放行为的对权重分配的调整。

在步骤422中，通过机器学习算法确定对各个图像帧的权重的调整情况。通过机器学习的方法不断去调整权重参数，能够不断的完善视频质量。

在一些实施例中，步骤421和步骤422可以互换执行顺序。

继而执行步骤430。

在步骤430中，根据冷启动过程中对图像帧权重的配置情况，结合步骤413、步骤422的权重调整结果更新图像帧权重。完成权重更新后，执行步骤403，从而更新获取的缩短版视频图像，重新生成缩短视频。

通过这样的方法，根据不同的视频类型、不同的视频风格，结合人们的喜好，对视频进行快速过滤和处理，只留下关键的内容和主要故事情节，从而提高人们的观看视频效率，节省观看时间，使人们在单位时间内获取更多的信息。

本公开的图像处理装置的一些实施例的示意图如图5所示。图像处理装置包括台词处理单元51、权重确定单元52、图像缩短单元52和缩短视频获取单元54。

台词处理单元51能够对视频的台词进行语义分析，获取凝练台词。在一些实施例中，可以获取当前视频的全部台词，对台词进行NLU语义理解，凝练总结视频的叙事结构、故事情节等。权重确定单元52能够基于预定图像处理策略确定视频中各帧图像的权重。图像缩短单元53能够按照预定视频缩短比例，根据各帧图像的权重从高到低的顺序抽取图像帧，获取缩短版视频图像。缩短视频获取单元54能够根据缩短版视频图像和凝练台词获取缩短视频，如将图像、音频合并，控制双方同步播放，从而形成缩短视频。

这样的视频处理装置能够生成符合视频主题内容的凝练台词，并提取出视频中重要的帧，自动生成缩短视频供用户观看，使用户能够高效的获取视频的有效信息，提高用户体验。

在一些实施例中，缩短视频获取单元54能够确定缩短版视频图像中各帧图像在原视频时间轴中的位置，确定凝练台词中各句台词对应的原台词在原视频时间轴中的位置，根据时间轴将视频图像的播放进度和凝练台词的播放进度契合，生成缩短视频，从而能够尽可能保证台词与图像进度的同步，便于用户对视频的理解，提高缩短视频的质量，提升用户体验。

在一些实施例中，权重确定单元52还能够根据已观看视频的用户对视频的播放行为调整各帧图像的权重；图像缩短单元53还能够根据调整权重后的图像帧生成缩短版视频图像，以便缩短视频获取单元更新缩短视频。

这样的装置能够针对用户对同一视频的观看行为进行特征采集，通过用户播放行为分析，得到来自用户的图像帧重要情况反馈，从而实现对于视频自身的个性化图像帧权重分析，提高图像帧提取的准确度，进一步优化缩短视频对用户需求的满足情况。

在一些实施例中，视频处理装置还可以包括用户行为获取单元55，能够获取用户对同一类型标签的视频的播放行为，根据用户的播放行为更新用户对同一类型标签的视频的权重分配策略。权重确定单元52还能够根据更新后的权重分配策略，调整同一类型标签的视频中各个图像帧的权重；图像缩短单元53还能够根据调整权重后的图像帧生成用户个性化缩短版视频图像，以便缩短视频获取单元生成用户个性化缩短视频。

这样的装置能够对同一用户个人的喜好进行分析，生成用户个性化的权重分配策略，从而实现用户自适应的图像缩短操作，保证视频对每个用户的吸引力，进一步提升用户体验。

在一些实施例中，视频处理装置还可以包括策略调整单元56，能够针对同一类用户对同一个视频和/或同一类型标签的视频的播放行为更新针对这一类用户的权重分配策略；权重确定单元52还能够根据更新后的权重分配策略调整同一类型标签的视频中各个图像帧的权重；图像缩短单元53还能够根据调整权重后的图像帧生成用户类型个性化缩短版视频图像，以便缩短视频获取单元生成用户类型个性化缩短视频。在一些实施例中，视频处理装置还可以包括用户类型确定单元57，能够通过采集不同用户的播放行为确定用户的观看偏好，根据用户的观看偏好确定不同用户的相似程度，将相似程度超过预定阈值的用户确定为同一类用户，从而便于策略调整单元更新针对这一类用户的权重分配策略。

这样的装置能够用同一类型的用户播放行为生成针对该类用户的个性化缩短视频，从而降低由于单个用户的播放行为有限造成的基础数据量不足、偶然性影响大的问题，提升缩短视频对用户的个性化适应能力。

在一些实施例中，视频处理装置还可以包括缩短视频优化单元58，能够通过基于条目的协同过滤算法，以及通过机器学习算法调整各个图像帧的权重，根据调整权重后的图像帧生成缩短版视频图像，以便更新缩短视频，从而实现对缩短视频的不断优化，实现缩短视频针对每个用户的自适应调整和演进。

本公开视频处理装置的一些实施例的结构示意图如图6所示。视频处理装置包括存储器601和处理器602。其中：存储器601可以是磁盘、闪存或其它任何非易失性存储介质。存储器用于存储上文中视频处理方法的对应实施例中的指令。处理器602耦接至存储器601，可以作为一个或多个集成电路来实施，例如微处理器或微控制器。该处理器602用于执行存储器中存储的指令，能够使用户高效的获取视频的有效信息，提高用户体验。

在一些实施例中，还可以如图7所示，视频处理装置700包括存储器701和处理器702。处理器702通过BUS总线703耦合至存储器701。该视频处理装置700还可以通过存储接口704连接至外部存储装置705以便调用外部数据，还可以通过网络接口706连接至网络或者另外一台计算机系统(未标出)。此处不再进行详细介绍。

在该实施例中，通过存储器存储数据指令，再通过处理器处理上述指令，能够使用户高效的获取视频的有效信息，提高用户体验。

在另一些实施例中，一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时实现视频处理方法对应实施例中的方法的步骤。本领域内的技术人员应明白，本公开的实施例可提供为方法、装置、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

至此，已经详细描述了本公开。为了避免遮蔽本公开的构思，没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述，完全可以明白如何实施这里公开的技术方案。

可能以许多方式来实现本公开的方法以及装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

最后应当说明的是：以上实施例仅用以说明本公开的技术方案而非对其限制；尽管参照较佳实施例对本公开进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本公开的具体实施方式进行修改或者对部分技术特征进行等同替换；而不脱离本公开技术方案的精神，其均应涵盖在本公开请求保护的技术方案范围当中。

Claims

一种视频处理方法，包括：

对视频的台词进行语义分析，获取凝练台词；

基于预定图像处理策略确定视频中各帧图像的权重；

按照预定视频缩短比例，根据各帧图像的权重从高到低的顺序抽取图像帧，获取缩短版视频图像；

根据所述缩短版视频图像和所述凝练台词获取缩短视频。
根据权利要求1所述的视频处理方法，其中，所述获取缩短视频包括：

确定所述缩短版视频图像中各帧图像在原视频时间轴中的位置；

确定所述凝练台词中各句台词对应的原台词在原视频时间轴中的位置；

根据时间轴将所述视频图像的播放进度和所述凝练台词的播放进度契合，生成所述缩短视频。
根据权利要求1所述的视频处理方法，其中，所述预定图像处理策略包括：

根据视频的类型标签确定权重分配策略；

以及根据所述权重分配策略执行以下操作中的一种或多种：

根据所述权重分配策略增加特写镜头图像帧的权重；

根据所述权重分配策略增加面部情绪丰富的图像帧的权重；或

根据所述权重分配策略增加广角镜头图像帧的权重。
根据权利要求1所述的视频处理方法，还包括：

根据已观看视频的用户对视频的播放行为调整各帧图像的权重；

根据调整权重后的图像帧生成缩短版视频图像，以便更新缩短视频。
根据权利要求1所述的视频处理方法，还包括：针对单个用户：

获取用户对同一类型标签的视频的播放行为，根据用户的播放行为更新用户对同一类型标签的视频的权重分配策略；

根据更新后的所述权重分配策略调整同一类型标签的视频中各个图像帧的权重；

根据调整权重后的图像帧生成用户个性化缩短版视频图像，以便生成用户个性化缩短视频。
根据权利要求1所述的视频处理方法，还包括：

针对同一类用户对同一个视频或同一类型标签中至少一种的视频的播放行为更新针对这一类用户的权重分配策略；

根据更新后的所述权重分配策略调整同一类型标签的视频中各个图像帧的权重；

根据调整权重后的图像帧生成用户类型个性化缩短版视频图像，以便生成用户类型个性化缩短视频。
根据权利要求6所述的视频处理方法，还包括：

通过采集用户的播放行为确定用户的观看偏好；

根据用户的观看偏好确定用户的相似程度；

将相似程度超过预定阈值的用户确定为同一类用户。
根据权利要求1～7任意一项所述的视频处理方法，还包括：

通过基于条目的协同过滤算法，以及通过机器学习算法调整各个图像帧的权重，根据调整权重后的图像帧生成缩短版视频图像，以便更新缩短视频。
一种视频处理装置，包括：

台词处理单元，被配置为对视频的台词进行语义分析，获取凝练台词；

权重确定单元，被配置基于预定图像处理策略确定视频中各帧图像的权重；

图像缩短单元，被配置为按照预定视频缩短比例，根据各帧图像的权重从高到低的顺序抽取图像帧，获取缩短版视频图像；

缩短视频获取单元，被配置为根据所述缩短版视频图像和所述凝练台词获取缩短视频。
根据权利要求9所述的视频处理装置，其中，所述缩短视频获取单元，被配置为：

确定所述缩短版视频图像中各帧图像在原视频时间轴中的位置；

确定所述凝练台词中各句台词对应的原台词在原视频时间轴中的位置；

根据时间轴将所述视频图像的播放进度和所述凝练台词的播放进度契合，生成所述缩短视频。
根据权利要求9所述的视频处理装置，其中，所述预定图像处理策略包括：

根据视频的类型标签确定权重分配策略；

以及根据所述权重分配策略执行以下操作中的一种或多种：

根据所述权重分配策略增加特写镜头图像帧的权重；

根据所述权重分配策略增加面部情绪丰富的图像帧的权重；或

根据所述权重分配策略增加广角镜头图像帧的权重。
根据权利要求9所述的视频处理装置，其中，所述权重确定单元还被配置为：根据已观看视频的用户对视频的播放行为调整各帧图像的权重；

所述图像缩短单元还被配置为根据调整权重后的图像帧生成缩短版视频图像，以便所述缩短视频获取单元更新缩短视频。
根据权利要求9所述的视频处理装置，还包括：

用户行为获取单元，被配置为针对单个用户，获取用户对同一类型标签的视频的播放行为，根据用户的播放行为更新用户对同一类型标签的视频的权重分配策略；

所述权重确定单元还被配置为：根据更新后的所述权重分配策略调整同一类型标签的视频中各个图像帧的权重；

所述图像缩短单元还被配置为根据调整权重后的图像帧生成用户个性化缩短版视频图像，以便所述缩短视频获取单元生成用户个性化缩短视频。
根据权利要求9所述的视频处理装置，还包括：

策略调整单元，被配置为针对同一类用户对同一个视频或同一类型标签中至少一种的视频的播放行为更新针对这一类用户的权重分配策略；

所述权重确定单元还被配置为：根据更新后的所述权重分配策略调整同一类型标签的视频中各个图像帧的权重；

所述图像缩短单元还被配置为根据调整权重后的图像帧生成用户类型个性化缩短版视频图像，以便所述缩短视频获取单元生成用户类型个性化缩短视频。
根据权利要求14所述的视频处理装置，还包括：用户类型确定单元，被配置为：

通过采集用户的播放行为确定用户的观看偏好；

根据用户的观看偏好确定用户的相似程度；

将相似程度超过预定阈值的用户确定为同一类用户。
根据权利要求9～15任意一项所述的视频处理装置，还包括：

缩短视频优化单元，被配置为通过基于条目的协同过滤算法，以及通过机器学习算法调整各个图像帧的权重，根据调整权重后的图像帧生成缩短版视频图像，以便更新缩短视频。
一种视频处理装置，包括：

存储器；以及

耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至8任一项所述的方法。
一种计算机可读存储介质，其上存储有计算机程序指令，该指令被处理器执行时实现权利要求1至8任意一项所述的方法的步骤。