TW201735654A

TW201735654A - 多媒體資源的品質評估方法和裝置

Info

Publication number: TW201735654A
Application number: TW106107501A
Authority: TW
Inventors: 魏博; 齊志兵; 王遠圖; 馬廣續; 劉宇平; 尹玉宗; 姚鍵; 潘柏宇; 王冀
Original assignee: 合一網絡技術(北京)有限公司
Priority date: 2016-03-18
Filing date: 2017-03-08
Publication date: 2017-10-01
Also published as: WO2017156994A1; EP3346396A1; TWI629899B; US10762122B2; CN105843876A; CN105843876B; US20200192930A1; EP3346396A4

Abstract

一種多媒體資源的品質評估方法和裝置，該多媒體資源的品質評估方法包括：根據用於刻畫多媒體資源的使用者行為的指標資料，確定多媒體資源的累積分佈向量；根據累積分佈向量，確定多媒體資源的上邊界向量和下邊界向量；以及根據累積分佈向量、上邊界向量和下邊界向量，確定多媒體資源的品質分數。本發明能夠更準確地刻畫多媒體資源的品質並且具有很強的可操作性，另外，在利用本發明實施例的多媒體資源的品質評估方法來評估了多媒體資源的品質之後，可以吸收線上結果的回饋來進行多媒體資源的動態優化排序和推薦，可以給出最終的多媒體資源的排序和推薦結果。

Description

多媒體資源的品質評估方法和裝置

本發明涉及網際網路技術領域，尤其涉及一種多媒體資源的品質評估方法和裝置。

現有的多媒體資源的品質計算和品質評估主要是以多媒體資源自身的原生屬性(機器屬性)作為考核指標。例如，通過音訊和視訊的訊號品質、失真程度等靜態屬性來判斷多媒體資源的整體品質。或者，在該品質評估方法的基礎上加入一些例如幀率、清晰度等的面向使用者的屬性，來進一步判斷多媒體資源的整體品質。還有一些品質評估方法是通過考察多媒體資源的網路特性來判斷多媒體資源的整體品質。例如，通過計算流媒體在網路上傳輸的資料包的特性和解碼過程來判斷多媒體資源的整體品質。

也就是說，現有技術中的品質評估方法是將多媒體資源的原生屬性(動態和靜態)作為品質評估的主要指標。然而，由於僅基於多媒體資源的原生屬性來評估多媒體資源的品質在很多情況下並不能滿足使用者的需求，因此多媒體資源的優劣是無法僅通過網路傳輸、解析度等原生屬性來刻畫的。

有鑑於此，本發明要解決的技術問題是，提供一種多媒體資源的品質評估方法和裝置，以更準確地刻畫多媒體資源的品質。

為了解決上述技術問題，在第一方面，本發明提供了一種多媒體資源的品質評估方法，包括：

根據用於刻畫所述多媒體資源的使用者行為的指標資料，確定所述多媒體資源的累積分佈向量；根據所述累積分佈向量，確定所述多媒體資源的上邊界向量和下邊界向量；以及根據所述累積分佈向量、所述上邊界向量和所述下邊界向量，確定所述多媒體資源的品質分數。

結合第一方面，在第一種可能的實現方式中，所述根據用於刻畫所述多媒體資源的使用者行為的指標資料，確定所述多媒體資源的累積分佈向量，包括：將一類使用者行為的指標資料劃分為多個組；統計每個組所包括的該類使用者行為的指標資料的個數；以及將每個組對應的個數構成的向量確定為所述多媒體資源的該類使用者行為的累積分佈向量。

結合第一方面的第一種可能的實現方式，在第二種可能的實現方式中，所述將一類使用者行為的指標資料劃分為多個組，包括：獲取該類使用者行為的指標資料的最大值和最小值；將確定為分割區間，其中，為組的個數；以及將區間劃分為個組。

結合第一方面或第一方面的第一種可能的實現方式或第一方面的第二種可能的實現方式，在第三種可能的實施方式中，所述根據所述累積分佈向量、所述上邊界向量和所述下邊界向量，確定所述多媒體資源的品質分數，包括：利用下式1計算所述品質分數，式1

其中，表示所述品質分數，表示所述累積分佈向量到所述上邊界向量的距離，表示所述上邊界向量到所述下邊界向量的距離。

在第二方面，本發明提供了一種多媒體資源的品質評估裝置，包括：第一確定單元，用於根據用於刻畫所述多媒體資源的使用者行為的指標資料，確定所述多媒體資源的累積分佈向量；第二確定單元，與所述第一確定單元連接，用於根據所述累積分佈向量，確定所述多媒體資源的上邊界向量和下邊界向量；以及第三確定單元，與所述第一確定單元和所述第二確定單元連接，用於根據所述累積分佈向量、所述上邊界向量和所述下邊界向量，確定所述多媒體資源的品質分數。

結合第二方面，在第一種可能的實現方式中，所述第一確定單元包括：劃分子單元，用於將一類使用者行為的指標資料劃分為多個組；統計子單元，與所述劃分子單元連接，用於統計每個組所包括的該類使用者行為的指標資料的個數；以及確定子單元，與所述統計子單元連接，用於將每個組對應的個數構成的向量確定為所述多媒體資源的該類使用者行為的累積分佈向量。

結合第二方面的第一種可能的實現方式，在第二種可能的實現方式中，所述劃分子單元包括：獲取模組，用於獲取該類使用者行為的指標資料的最大值和最小值；確定模組，與所述獲取模組連接，用於將確定為分割區間，其中，為組的個數；以及劃分模組，與所述確定模組連接，用於將區間劃分為個組。

結合第二方面或第二方面的第一種可能的實現方式或第二方面的第二種可能的實現方式，在第三種可能的實施方式中，所述第三確定單元具體用於利用下式1計算所述品質分數，

本發明實施例的多媒體資源的品質評估方法和裝置，能夠更準確地刻畫多媒體資源的品質並且具有很強的可操作性，另外，在利用本發明實施例的多媒體資源的品質評估方法評估了多媒體資源的品質之後，可以吸收線上結果的回饋來進行多媒體資源的動態優化排序和推薦，可以給出最終的多媒體資源的排序和推薦結果。

根據下面參考附圖對示例性實施例的詳細說明，本發明的其它特徵及方面將變得清楚。

以下將參考附圖詳細說明本發明的各種示例性實施例、特徵和方面。附圖中相同的附圖標記表示功能相同或相似的元件。儘管在附圖中示出了實施例的各種方面，但是除非特別指出，不必按比例繪製附圖。

在這裡專用的詞“示例性”意為“用作例子、實施例或說明性”。這裡作為“示例性”所說明的任何實施例不必解釋為優於或好於其它實施例。

另外，為了更好的說明本發明，在下文的具體實施方式中給出了眾多的具體細節。本領域技術人員應當理解，沒有某些具體細節，本發明同樣可以實施。在一些實例中，對於本領域技術人員熟知的方法、手段、元件和電路未作詳細描述，以便於凸顯本發明的主旨。＜實施例1＞

圖1示出根據本發明實施例一的多媒體資源的品質評估方法的流程圖。如圖1所示，該品質評估方法主要可以包括：

步驟S100、根據用於刻畫多媒體資源的使用者行為的指標資料，確定多媒體資源的累積分佈向量。

使用者可以使用終端設備來播放多媒體資源。其中，該終端設備例如可以是手機、移動網際網路設備(英文：Mobile Internet Device，簡稱：MID)、個人數位助理(英文：Personal Digital Assistant，簡稱：PDA)、筆記本、桌上型電腦、智慧電視等。該多媒體資源例如可以是視訊、音訊、圖片等。

需要說明的是，本發明的多媒體資源不僅限於上述三種示例，本領域技術人員應能夠瞭解，本發明的重點並不在於多媒體資源，任何其它形式的多媒體資源也可以適用于本發明。也就是說，本發明並不限制多媒體資源的具體形式。

可以使用指標資料來刻畫諸如視訊、音訊等的多媒體資源的使用者行為，並且，多媒體資源的使用者行為可以包括多種類別，例如頂踩、評論、推薦(轉發)、收藏、播放、下載等。

其中，頂踩是指使用者基於自身對被播放的多媒體資源的支援或者反對態度，對被播放的多媒體資源作出“頂”或者“踩”的操作。頂踩通常包括被播放的多媒體資源的標識(vid)、頂踩操作、操作人(使用者)的相關資訊、操作時間和IP(例如，使用者的手機或者電腦等)等。

評論是指使用者基於自身對被播放的多媒體資源的內容和形式的理解，在相應位置處作出的評論描述。評論通常包括被播放的多媒體資源的標識(vid)、評論的具體內容、操作人(使用者)的相關資訊、操作時間和IP等。

收藏是指使用者基於自身對被播放的多媒體資源的內容和形式的理解所進行的收錄操作，以便於未來能夠更方便地找回該多媒體資源。收藏通常包括被播放的多媒體資源的標識(vid)、操作人(使用者)的相關資訊、操作時間和IP等。

推薦(轉發)是指使用者基於自身對被播放的多媒體資源的內容和形式的理解所進行的站外的推送操作。推薦通常包括被播放的多媒體資源的標識(vid)、操作人(使用者)的相關資訊、操作時間和IP、推薦平臺等。

播放是指使用者對於多媒體資源的觀看行為。播放通常包括被播放的多媒體資源的標識(vid)、操作人(使用者)的相關資訊、操作時間和IP、播放時間長度等。

下載是指使用者基於自身對被播放的多媒體資源的內容和形式的理解所進行的下載到本地的操作。下載通常包括被播放的多媒體資源的標識(vid)、操作人(使用者)的相關資訊、操作時間和IP、下載進度等。

實際上，使用者行為的構建過程是一個從問題領域到行為領域的映射過程：，其中，表示問題領域，表示使用者行為集合。

每個業務部門可以根據自身的後臺資料和頁面功能，選擇最優的使用者行為來進行考核。從實際效果來看，推薦使用能夠真實反映使用者需求意圖的使用者行為，從而使得多媒體資源的品質評估(計算)更精準。

具體地，可以使用指標資料來衡量每一類使用者行為中的每一個使用者行為，並且，每一類使用者行為的指標資料的詳細說明如下。

假設一個IP針對一個多媒體資源只能操作一次頂或者踩，則可以使用使用者對多媒體資源所進行的頂踩操作的發生點作為指標資料來衡量頂踩類的使用者行為。如果以多媒體資源播放完成進度來計算，則可以記錄每次發生頂或者踩的多媒體資源的播放完成進度。理論上，希望使用者沒有踩的行為並且儘早發生頂的行為(太早發生頂的行為也是不合理的)。

可以使用使用者對多媒體資源所進行的評論操作的發生點以及評論情感作為指標資料來衡量評論類的使用者行為。如果以多媒體資源播放完成進度來計算，則可以記錄每次發生評論的多媒體資源的播放完成進度。同時，可以對使用者評論的正負情感儘量量化。理論上，希望使用者沒有負向情感評論並且儘早發生評論行為(太早發生評論行為也是不合理的)。

假設一個IP針對一個多媒體資源只能收藏一次，則可以使用使用者對多媒體資源所進行的收藏操作的發生點作為指標資料來衡量收藏類的使用者行為。如果以多媒體資源播放完成進度來計算，則可以記錄每次發生收藏行為的多媒體資源的播放完成進度。理論上，希望使用者有收藏行為並且儘早發生收藏行為(太早發生收藏行為也是不合理的)。

可以使用使用者對多媒體資源所進行的推薦操作的發生點以及被推薦的多媒體資源的導回流量比率作為指標資料來衡量推薦類的使用者行為。其中，導回流量比率=導回次數/露出次數，導回次數是指被推薦的多媒體資源二次被打開的次數，露出次數是指被推薦的多媒體資源的被推薦次數。如果以多媒體資源播放完成進度來計算，則可以記錄每次發生推薦的多媒體資源的播放完成進度。同時，可以通過爬取外站的相關資料來計算導回流量比率。理論上，希望使用者有推薦行為並且儘早發生推薦行為(太早發生推薦行為也是不合理的)而且導回流量比率越高越好。

可以使用多媒體資源的播放完成比和使用者拖動進度條(快退、快進)的次數作為指標資料來衡量播放類的使用者行為。希望使用者的播放完成比越高越好並且沒有快進拖動而是有多次合理的快退拖動。

可以使用使用者對多媒體資源所進行的下載操作的發生點以及下載完成進度作為指標資料來衡量下載類的使用者行為。如果以多媒體資源播放完成進度來計算，則可以記錄每次發生下載行為的多媒體資源的播放完成進度。下載完成進度可以衡量使用者下載多媒體資源的決心和網路狀況。理論上，希望使用者有下載行為並且儘早發生下載行為(太早發生下載行為也是不合理的)而且希望是100%完整下載。

需要說明的是，本發明實施例僅例示了幾類使用者行為及其指標資料，本領域技術人員應能夠理解，本發明的使用者行為的種類還可以為其它類別，並且在實際操作中不是必須提取上述各種指標資料，而是可以根據自身業務需求以及是否對系統造成過大的負擔等來提取適量的指標資料。

實際上，指標資料的構建過程是一個從使用者行為到指標資料的映射過程：，其中，表示使用者行為集合，表示指標資料集合。並且，累積分佈向量的構建過程是一個從指標空間到向量空間的映射過程：，其中，表示指標資料集合，表示維向量空間。

步驟S120、根據累積分佈向量，確定多媒體資源的上邊界向量和下邊界向量。

具體地，在確定了使用者行為的指標資料上的累積分佈向量之後，可以定義該指標資料的最優表現和最差表現，即上邊界和下邊界。例如，使用者對多媒體資源所進行的合理的頂踩操作的發生點最多的計數為多少、被推薦的多媒體資源的導回流量比率最高的最大計數是多少、最多有多少使用者完整觀看了多媒體資源。其中，多媒體資源在指標資料上的上邊界和下邊界可以均使用向量來表示，即，上邊界向量和下邊界向量。

步驟S140、根據累積分佈向量、上邊界向量和下邊界向量，確定多媒體資源的品質分數。

可以根據累積分佈向量來確定多媒體資源的品質分數。理論上，一個累積分佈向量離下邊界向量越遠並且離上邊界向量越近，則說明使用者行為的表現越好，進而說明多媒體資源的品質越高。例如，可以使用距離占比來定義多媒體資源的品質分數。

即，在一種可能的實現方式中，根據累積分佈向量、上邊界向量和下邊界向量，確定多媒體資源的品質分數，可以包括：利用下式1計算品質分數，

式1，

其中，表示品質分數，表示累積分佈向量到上邊界向量的距離，表示上邊界向量到下邊界向量的距離。

根據上述式1可知，累積分佈向量到上邊界向量的距離越小，品質分數越大。可以使用餘弦相似度或者多維歐式距離等方法來計算向量之間的距離，並且餘弦相似度和歐式距離可以保證品質分數的取值範圍為。

其中，餘弦相似度是將向量根據座標值繪製到向量空間中，求得兩個向量之間的夾角並計算夾角對應的餘弦值，該餘弦值可以用於表徵這兩個向量的相似性。夾角越小，餘弦值越接近於1，這兩個向量的方向更加吻合，這兩個向量就越相似。歐式距離是一個通常採用的距離定義，是在m維空間中兩個點之間的真實距離。例如，假設二維空間中存在點和點，則點和點之間的歐式距離為。

在計算向量之間的距離上，餘弦相似度和歐式距離都有廣泛的應用，這兩種方法均易於理解且便於操作。餘弦相似度是一個良好的輸出歸一化結果的方法，而歐式距離是輸出全域取值的方法。實際操作中，根據實際需要任意選取其中一種方法即可。

實際上，多媒體資源的品質分數的構建是一個從累積分佈向量到區間的映射過程：，其中，表示維向量空間，表示品質分數的取值範圍。

本發明實施例的多媒體資源的品質評估方法，是基於使用者體驗和忠實於使用者的，即通過多媒體資源的使用者行為來刻畫多媒體資源的品質，這使得本發明能夠更準確地刻畫多媒體資源的品質。

並且，本發明實施例的品質評估方法具有很強的可操作性，原因在於，對於網際網路應用，大量的多媒體資源是線上公開的，使用者可以通過每日的點擊和觀看行為來消費這些多媒體資源，而企業後臺可以使用日誌系統來記錄這些使用者行為，因此，系統的服務過程就是多媒體資源的品質評估的資料準備過程，因而獲取多媒體資源的使用者行為是簡單易行的。與之相比較，傳統的基於多媒體資源的原生屬性的品質評估方法需要專門的工作人員和系統來完成相關指標的採集和度量。

另外，由於以一段時間為考察區間，使用者行為會呈現一定的動態特性，因此使用者行為通常具有累積特性。因而，在利用本發明實施例的品質評估方法評估了多媒體資源的品質之後，可以吸收線上結果的回饋來進行多媒體資源的動態優化排序和推薦，可以給出最終的多媒體資源的排序和推薦結果。如果使用者在多媒體資源的排序和推薦結果上的行為不夠理想，則在未來的反覆運算中，這些多媒體資源的排序和推薦結果中的多媒體資源的品質分數會降低，從而把原先多媒體資源的排序和推薦結果中靠前的多媒體資源自動排在後面。＜實施例2＞

由於使用者行為可以包括多種類別，因此多媒體資源的品質評估既可以僅利用一類使用者行為的指標資料來進行品質評估，也可以利用諸如統計學的方法來根據多類使用者行為的指標資料來進行品質評估。

例如，可以先分別計算每一類使用者行為的品質分數，再對所有類別的使用者行為的品質分數進行平均，以確定多媒體資源的品質分數。

本領域普通技術人員可以理解，平均只是一種實現方式，也可以採用其它實現方式，例如加權求和等，仍可實現本發明的基本目的。

圖2示出根據本發明實施例二的多媒體資源的品質評估方法的流程圖。如圖2所示，該品質評估方法主要可以包括：

步驟S201、將一類使用者行為的指標資料劃分為多個組。

例如，可以採用非重疊分組方法來將一類使用者行為的指標資料劃分為多個組，又如，可以採用重疊分組方法來將一類使用者行為的指標資料劃分為多個組。

在一種可能的實現方式中，將一類使用者行為的指標資料劃分為多個組，包括：

獲取該類使用者行為的指標資料的最大值和最小值；

將確定為分割區間，其中，為組的個數；以及

將區間劃分為個組。

例如，假設採用非常有效並且常用的刻畫資料分佈特點的非重疊分組方法來將一類使用者行為的指標資料劃分為多個組，則分組的過程如下：假設給定一組實數域上的資料，則可以先獲得資料的最大值和最小值；然後將區間(也稱之為極差或全距)平均劃分為個分組，對應的分割區間為(也稱之為組距)，則個分組對應個分組區間，例如：和為頭部和尾部的兩個分組區間。

又如，假設採用觀察資料整體變化的重疊分組方法來將一類使用者行為的指標資料劃分為多個組，則分組的過程如下：假設給定一組實數域上的資料，則可以先獲得資料的最大值和最小值，則區間能夠包含全體資料；然後將區間平均劃分為個重疊分組區間，例如：和為最大和最小的兩個分組區間。

步驟S203、統計每個組所包括的該類使用者行為的指標資料的個數。

在將一類使用者行為的指標資料劃分為多個組之後，可以分別對落在每一個區間的指標資料進行個數統計。

步驟S205、將每個組對應的個數構成的向量確定為多媒體資源的該類使用者行為的累積分佈向量。

如果使用作圖的方法來畫出長條圖，其中，軸表示分組區間並且軸表示頻度計數，則可以直接根據頻度分佈長條圖來快速地確定出使用者行為的累積分佈向量。

步驟S207、根據累積分佈向量，確定多媒體資源的上邊界向量和下邊界向量。

步驟S209、根據累積分佈向量、上邊界向量和下邊界向量，確定多媒體資源的品質分數。

步驟S207和步驟S209的說明可以參見上述實施例1中的步驟S120和步驟S140中的相關描述。

並且本發明實施例的品質評估方法具有很強的可操作性，原因在於，對於網際網路應用，大量的多媒體資源是線上公開的，使用者可以通過每日的點擊和觀看行為來消費這些多媒體資源，而企業後臺可以使用日誌系統來記錄這些使用者行為，因此，系統的服務過程就是多媒體資源的品質評估的資料準備過程，因而獲取多媒體資源的使用者行為是簡單易行的。與之相比較，傳統的基於多媒體資源的原生屬性的品質評估方法需要專門的工作人員和系統來完成相關指標的採集和度量。

另外，在利用本發明實施例的品質評估方法來評估了多媒體資源的品質之後，可以吸收線上結果的回饋來進行多媒體資源的動態優化排序和推薦，可以給出最終的多媒體資源的排序和推薦結果。如果使用者在多媒體資源的排序和推薦結果上的行為不夠理想，則在未來的反覆運算中，這些多媒體資源的排序和推薦結果中的多媒體資源的品質分數會降低，從而把原先多媒體資源的排序和推薦結果中靠前的多媒體資源自動排在後面。＜實施例3＞

圖3a示出根據本發明實施例三的多媒體資源的品質評估方法的流程圖。在本發明實施例中，將以播放類使用者行為的指標資料即多媒體資源的播放完成比(例如，視訊觀看完成比)來例示本發明的多媒體資源的品質評估方法。

步驟S301、使用某視訊網站的視訊播放日誌作為基本的資料來源。原始的視訊播放日誌是一個至少包含以下四元組的資料表格：該四元組為，其中，表示被觀看的視訊集合；表示每次視訊觀看的累積時間長度，通常以秒計；表示被觀看的視訊的總時間長度；表示發生此次觀看行為的時間戳記。

原始的視訊播放日誌的每一行記錄均存儲了使用者在該時間戳記下的點擊視訊的觀看行為。可以通過界定不同的時間戳記，獲取一天、一個小時、甚至任何時刻的使用者觀看行為資料。表1是一個視訊觀看日誌資料的示例片段。表1 視訊觀看日誌資料的示例片段

通過匯總使用者觀看時間長度的視訊播放日誌資訊，可以對上述四元組進行預處理。舉例而言，可以通過界定欄位，選取特定時間段的視訊播放資料，例如，可以從視訊播放日誌資訊中選取欄位為“20160105”的視訊播放資料。也可以使用來計算每一次觀看欄位為“1”的視訊的播放完成比(也稱之為視訊觀看完成比)，以生成欄位為“1”的視訊的播放完成比欄位。還可以對視訊的播放完成比資料進行資料清理，例如，應該捨棄的資料。

步驟S302、根據視訊播放日誌獲取視訊的指標資料即播放完成比。其中，視訊的播放完成比是指視訊的播放時間長度與視訊的總時間長度的比值，即。

通過對上述表1的視訊觀看日誌資料進行預處理，可以生成包含被觀看的視訊集合、被觀看的視訊的播放完成比和發生此次觀看行為的時間戳記的資訊，以記錄使用者在視訊上的觀看完成情況。其中，使用上述表1中的視訊觀看日誌資料可以得到下述表2所示的被觀看的視訊的播放完成比。需要說明的是，為關注問題本身而在表2中省去了發生此次觀看行為的時間戳記。

表2 視訊的播放完成比示例

步驟S303、將播放類的使用者行為的指標資料播放完成比劃分為多個組並確定指標資料播放完成比的累積分佈向量。

具體地，可以採用上述實施例2中描述的非重疊分組方法來將播放完成比劃分為多個組，也可以採用上述實施例2中描述的重疊分組方法來將播放完成比劃分為多個組。並且可以使用頻度分佈長條圖來顯示播放完成比的頻度分佈，其中，頻度分佈長條圖是通過長方形的高代表對應組的頻數與組距的比值(由於組距是一個常數，因此為了便於畫圖和看圖而直接使用長方形的高來表示頻數)，並且頻度分佈長條圖能夠清楚地顯示各組頻數的分佈情況並且易於顯示各組之間的頻數的差別。

頻度分佈長條圖的橫軸為播放完成比的的全域區間。可以根據實際情況來確定分組的組距。其中，根據統計學的知識可知，合適的組距可以反映抽樣資料的分佈特性，組距太小會造成分組的組數太多，組距太大會造成分組的組數太少，這些都會掩蓋播放完成比的分佈特性。另外，組距太小所導致的分組的組數太多，使得後續根據播放完成比所確定的累積分佈向量即播放完成比累積分佈向量的維度過高，這對海量資料分析時造成了計算負擔。因此，在本實施例中，將組距確定為。

如果採用非重疊分組方法來將播放完成比劃分為多個組，則可以按照組距來將播放完成比的的全域區間劃分為10個組，這樣可以形成諸如、、…、的10個等距非重疊抽樣區間(分組)，由此可以得到圖3b所示的播放完成比頻度分佈長條圖。

如果採用重疊分組方法來將播放完成比劃分為多個組，則可以按照組距來將播放完成比的的全域區間劃分為10個組，這樣可以形成諸如、、…、的10個等距重疊抽樣區間(分組)，由此可以得到圖3c所示的播放完成比頻度分佈長條圖。

當然，在本實施例中，優選使用重疊分組方法(即，累積分佈計數)來將播放完成比劃分為多個組並確定播放完成比累積分佈向量。使用播放完成比為、、、、…、的抽樣區間。由於視訊播放的涵蓋特性，因此播放完成比為的計數一定包括播放完成比為的計數。

假設一個視訊在特定時間段內的播放完成比資料集是，對播放完成比資料集進行組距為的重疊分組統計，其中，(100可以被整除)，可以得到包含單點分組在內的個分組資料。如果用表示播放完成比的計數區間，則分組、、…、所對應的計數所構成的向量為該視訊的播放完成比累積分佈向量。

需要說明的是，每一個分組的臨界點映射為實際視訊播放的進度點，使用者的播放完成比可以刻畫視訊播放的進度。單點分組可以理解為該視訊被點擊的次數，即視訊只要被點擊就會形成一次頻度計數，可以採用視訊播放日誌資料中的該視訊被記錄的條數。顯然，如果，則播放完成的次數一定不會多於播放完成的次數，區間的頻度一定不會多於區間的頻度，例如，看完視訊的的次數一定不會多於看完視訊的的次數。因此，播放完成比累積分佈向量的內部資料是一個非遞增數列。

根據播放完成比累積分佈向量的定義，可以得到如圖3c所示的播放完成比頻度分佈長條圖。並且，根據圖3c可知，與該播放完成比頻度分佈長條圖相對應的播放完成比累積分佈向量。

步驟S304、根據播放完成比累積分佈向量，確定播放完成比的上邊界向量和下邊界向量。

每一個視訊都希望能夠被完整的播放，即有多少人點擊打開視訊也應該有多少人最終完成觀看。結合播放完成比累積分佈向量，上邊界向量的每一個元素都應該和完成的頻度相同，因此，可以根據播放完成比累積分佈向量定義播放完成比的上邊界向量、即一個視訊的播放完成情況的可能最優表現。即，假設一個視訊的播放完成比累積分佈向量，則該視訊的播放完成比的上邊界向量並且。

類似地，可以考察一個視訊的播放完成情況的可能最差表現，即每一次點擊打開視訊都沒有實際的觀看行為。結合播放完成比累積分佈向量，除了的對應點擊次數以外，其它抽樣區間的累積頻度均為0，因此，可以根據播放完成比累積分佈向量定義播放完成比的下邊界向量。即，假設一個視訊的播放完成比累積分佈向量，則該視訊的播放完成比的下邊界向量並且。繼續使用之前的例子，的取值為10，由此可以得到播放完成比的上邊界向量和下邊界向量分別為：和。

步驟S305、在確定出播放完成比累積分佈向量、播放完成比的上邊界向量和下邊界向量之後，可以計算播放完成比累積分佈向量到播放完成比的上邊界向量的距離以及播放完成比的上邊界向量到播放完成比的下邊界向量的距離。

由於的取值為10，因此使用11維歐式距離來分別計算上述兩個距離。其中，11維歐式距離的具體定義如下：

假設和為兩個向量，則向量和向量之間的距離為，其中，，為向量在第個位置的取值，為向量在第個位置的取值。

利用上述距離定義可以計算出播放完成比累積分佈向量和播放完成比的上邊界向量之間的距離為24.759並且播放完成比的上邊界向量和播放完成比的下邊界向量之間的距離為44.272。

步驟S306、在計算出播放完成比累積分佈向量到播放完成比的上邊界向量的距離以及播放完成比的上邊界向量到播放完成比的下邊界向量的距離之後，利用下述式2來計算視訊的品質分數：

式2

即，視訊的品質分數。

例如，可以對某視訊網站的海量視訊進行品質分數的計算，由此可以得到下述表3所示的該視訊網站的視訊品質分數統計表。表3 某視訊網站的視訊的品質分數統計

根據上述表3可以看出，在實際資料中，第三四分位數已經達到最大值，這意味著至少有25%的視訊品質分數為1，這是由於視訊播放的長尾效應造成的，即有大量視訊只有一次或兩次播放行為且均實現了完整播放。

通過去除視訊播放的長尾效應，可以得到圖3d所示的視訊的品質分數分佈長條圖。並且，得到這些視訊的品質分數之後，既可以引入新類別的使用者行為進行多次計算，也可以引入視訊的新的指標資料來進行計算，從而為後續的視訊搜索和視訊推薦做準備。

並且本發明實施例的品質評估方法具有很強的可操作性，原因在於，對於網際網路應用，大量的多媒體資源是線上公開的，使用者可以通過每日的點閱和觀看行為來消費這些多媒體資源，而企業後臺可以使用日誌系統來記錄這些使用者行為，因此，系統的服務過程就是多媒體資源的品質評估的資料準備過程，因而獲取多媒體資源的使用者行為是簡單易行的。與之相比較，傳統的基於多媒體資源的原生屬性的品質評估方法需要專門的工作人員和系統來完成相關指標的採集和度量。

另外，在利用本發明實施例的品質評估方法來評估了多媒體資源的品質之後，可以吸收線上結果的回饋來進行多媒體資源的動態優化排序和推薦，可以給出最終的多媒體資源的排序和推薦結果。如果使用者在多媒體資源的排序和推薦結果上的行為不夠理想，則在未來的反覆運算中，這些多媒體資源的排序和推薦結果中的多媒體資源的品質分數會降低，從而把原先多媒體資源的排序和推薦結果中靠前的多媒體資源自動排在後面。＜實施例4＞

圖4示出根據本發明實施例四的多媒體資源的品質評估裝置的結構框圖。本實施例提供的品質評估裝置400用於實現圖1所示的品質評估方法。如圖4所示，該品質評估裝置400主要可以包括：

第一確定單元410，用於根據用於刻畫多媒體資源的使用者行為的指標資料，確定多媒體資源的累積分佈向量。

每個業務部門可以根據自身的後臺資料和頁面功能，選擇最優的使用者行為來進行考核。從實際效果來看，推薦使用能夠真實反映使用者需求意圖的使用者行為，從而使得多媒體資源的品質評估(計算)更精准。

需要說明的是，本發明實施例中的僅例示了幾類使用者行為及其指標資料，本領域技術人員應能夠理解，本發明的使用者行為的種類還可以為其它類別，並且在實際操作中不是必須提取上述各種指標資料，而是可以根據自身業務需求以及是否對系統造成過大的負擔等來提取適量的指標資料。

第二確定單元430，與第一確定單元410連接，用於根據累積分佈向量，確定多媒體資源的上邊界向量和下邊界向量。

具體地，在第一確定單元410確定了使用者行為的指標資料上的累積分佈向量之後，第二確定單元430可以定義該指標資料的最優表現和最差表現，即上邊界和下邊界。例如，使用者對多媒體資源所進行的合理的頂踩操作的發生點最多的計數為多少、被推薦的多媒體資源的導回流量比率最高的最大計數是多少、最多有多少使用者完整觀看了多媒體資源。其中，多媒體資源在指標資料上的上邊界和下邊界均使用向量來表示，即，上邊界向量和下邊界向量。

第三確定單元450，與第一確定單元410和第二確定單元430連接，用於根據累積分佈向量、上邊界向量和下邊界向量，確定多媒體資源的品質分數。

第三確定單元450可以根據第一確定單元410確定出的累積分佈向量和第二確定單元430確定出的上邊界向量和下邊界向量來確定多媒體資源的品質分數。理論上，一個累積分佈向量離下邊界向量越遠並且離上邊界向量越近，則說明使用者行為的表現越好，進而說明多媒體資源的品質越高。例如，可以使用距離占比來定義多媒體資源的品質分數。

即，在一種可能的實現方式中，第三確定單元450具體用於利用下式1計算品質分數，

式1，

其中，餘弦相似度是將向量根據座標值繪製到向量空間中，求得兩個向量之間的夾角並計算夾角對應的餘弦值，該餘弦值就可以用於表徵這兩個向量的相似性。夾角越小，餘弦值越接近於1，這兩個向量的方向更加吻合，這兩個向量就越相似。歐式距離是一個通常採用的距離定義，是在m維空間中兩個點之間的真實距離。例如，假設二維空間中存在點和點，則點和點之間的歐式距離為。

本發明實施例的多媒體資源的品質評估裝置，是基於使用者體驗和忠實於使用者的，即通過多媒體資源的使用者行為來刻畫多媒體資源的品質，這使得本發明能夠更準確地刻畫多媒體資源的品質。

並且，本發明實施例的品質評估裝置具有很強的可操作性，原因在於，對於網際網路應用，大量的多媒體資源是線上公開的，使用者可以通過每日的點擊和觀看行為來消費這些多媒體資源，而企業後臺可以使用日誌系統來記錄這些使用者行為，因此，系統的服務過程就是多媒體資源的品質評估的資料準備過程，因而獲取多媒體資源的使用者行為是簡單易行的。與之相比較，傳統的基於多媒體資源的原生屬性的品質評估裝置需要專門的工作人員和系統來完成相關指標的採集和度量。

另外，由於以一段時間為考察區間，使用者行為會呈現一定的動態特性，因此使用者行為通常具有累積特性。因而，在利用本發明實施例的品質評估裝置來評估了多媒體資源的品質之後，可以吸收線上結果的回饋來進行多媒體資源的動態優化排序和推薦，可以給出最終的多媒體資源的排序和推薦結果。如果使用者在多媒體資源的排序和推薦結果上的行為不夠理想，則在未來的反覆運算中，這些多媒體資源的排序和推薦結果中的多媒體資源的品質分數會降低，從而把原先多媒體資源的排序和推薦結果中靠前的多媒體資源自動排在後面。＜實施例5＞

圖5示出根據本發明實施例五的多媒體資源的品質評估裝置的結構框圖。本實施例提供的品質評估裝置500用於實現圖2所示的品質評估方法。如圖5所示，該品質評估裝置500主要可以包括：

劃分子單元510，用於將一類使用者行為的指標資料劃分為多個組。

例如，劃分子單元510可以採用非重疊分組方法來將一類使用者行為的指標資料劃分為多個組，又如，劃分子單元510可以採用重疊分組方法來將一類使用者行為的指標資料劃分為多個組。

在一種可能的實現方式中，劃分子單元510可以包括：

獲取模組511，用於獲取該類使用者行為的指標資料的最大值和最小值；

確定模組513，與獲取模組511連接，用於將確定為分割區間，其中，為組的個數；以及

劃分模組515，與確定模組513連接，用於將區間劃分為個組。

例如，假設劃分子單元510採用非常有效並且常用的刻畫資料分佈特點的非重疊分組方法來將一類使用者行為的指標資料劃分為多個組，則分組的過程如下：假設給定一組實數域上的資料，則獲取模組511可以先獲得資料的最大值和最小值；然後劃分模組515將區間(也稱之為極差或全距)平均劃分為個分組，對應的分割區間為(也稱之為組距)，則個分組對應個分組區間，例如：和為頭部和尾部的兩個分組區間。

又如，假設劃分子單元510採用觀察資料整體變化的重疊分組方法來將一類使用者行為的指標資料劃分為多個組，則分組的過程如下：假設給定一組實數域上的資料，則獲取模組511可以先獲得資料的最大值和最小值，則區間能夠包含全體資料；然後劃分模組515將區間平均劃分為個重疊分組區間，例如：和為最大和最小的兩個分組區間。

統計子單元530，與劃分子單元510連接，用於統計每個組所包括的該類使用者行為的指標資料的個數。

在劃分子單元510將一類使用者行為的指標資料劃分為多個組之後，統計子單元530可以分別對落在每一個區間的指標資料進行個數統計。

確定子單元550，與統計子單元530連接，用於將每個組對應的個數構成的向量確定為多媒體資源的該類使用者行為的累積分佈向量。

第二確定單元570，與確定子單元550連接，用於根據累積分佈向量，確定多媒體資源的上邊界向量和下邊界向量。

第三確定單元590，與確定子單元550和第二確定單元570連接，用於根據累積分佈向量、上邊界向量和下邊界向量，確定多媒體資源的品質分數。

第二確定單元570和第三確定單元590的說明可以參見上述實施例4中的第二確定單元430和第三確定單元450中的相關描述。

並且本發明實施例的品質評估裝置具有很強的可操作性，原因在於，對於網際網路應用，大量的多媒體資源是線上公開的，使用者可以通過每日的點擊和觀看行為來消費這些多媒體資源，而企業後臺可以使用日誌系統來記錄這些使用者行為，因此，系統的服務過程就是多媒體資源的品質評估的資料準備過程，因而獲取多媒體資源的使用者行為是簡單易行的。與之相比較，傳統的基於多媒體資源的原生屬性的品質評估裝置需要專門的工作人員和系統來完成相關指標的採集和度量。

另外，在利用本發明實施例的品質評估裝置來評估了多媒體資源的品質之後，可以吸收線上結果的回饋來進行多媒體資源的動態優化排序和推薦，可以給出最終的多媒體資源的排序和推薦結果。如果使用者在多媒體資源的排序和推薦結果上的行為不夠理想，則在未來的反覆運算中，這些多媒體資源的排序和推薦結果中的多媒體資源的品質分數會降低，從而把原先多媒體資源的排序和推薦結果中靠前的多媒體資源自動排在後面。＜實施例6＞

圖6示出根據本發明實施例六的多媒體資源的品質評估裝置的結構框圖。在本發明實施例中，將以播放類使用者行為的指標資料即多媒體資源的播放完成比(例如，視訊觀看完成比)來例示本發明的多媒體資源的品質評估裝置。本實施例提供的品質評估裝置600用於實現圖3a所示的品質評估方法。如圖6所示，該品質評估裝置600主要可以包括：

使用單元610，用於使用某視訊網站的視訊播放日誌作為基本的資料來源。原始的視訊播放日誌是一個至少包含以下四元組的資料表格：該四元組為，其中，表示被觀看的視訊集合；表示每次視訊觀看的累積時間長度，通常以秒計；表示被觀看的視訊的總時間長度；表示發生此次觀看行為的時間戳記。

原始的視訊播放日誌的每一行記錄均存儲了使用者在該時間戳記下的點擊視訊的觀看行為。可以通過界定不同的時間戳記，獲取一天、一個小時、甚至任何時刻的使用者觀看行為資料。一個視訊觀看日誌資料的示例片段可以參見上述實施例三中的表1。

獲取單元620，與使用單元610連接，用於根據視訊播放日誌獲取視訊的指標資料即播放完成比。其中，視訊的播放完成比是指視訊的播放時間長度與視訊的總時間長度的比值，即。具體說明可以參見上述實施例三中的步驟S302的相關描述。

第一確定單元630，與獲取單元620連接，用於將播放類的使用者行為的指標資料播放完成比劃分為多個組並確定指標資料播放完成比的累積分佈向量。

具體地，第一確定單元630可以採用上述實施例2中描述的非重疊分組方法來將播放完成比劃分為多個組，第一確定單元630也可以採用上述實施例2中描述的重疊分組方法來將播放完成比劃分為多個組。並且可以使用頻度分佈長條圖來顯示播放完成比的頻度分佈，其中，頻度分佈長條圖是通過長方形的高代表對應組的頻數與組距的比值(由於組距是一個常數，因此為了便於畫圖和看圖而直接使用長方形的高來表示頻數)，並且頻度分佈長條圖能夠清楚地顯示各組頻數的分佈情況並且易於顯示各組之間的頻數的差別。具體說明可以參見上述實施例三中的步驟S303的相關描述。

第二確定單元640，與第一確定單元630連接，用於根據播放完成比累積分佈向量，確定播放完成比的上邊界向量和下邊界向量。

具體說明可以參見上述實施例三中的步驟S304的相關描述。

第一計算單元650，與第一確定單元630和第二確定單元640連接，在第一確定單元630確定出播放完成比累積分佈向量、第二確定單元640確定出播放完成比的上邊界向量和下邊界向量之後，可以計算播放完成比累積分佈向量到播放完成比的上邊界向量的距離以及播放完成比的上邊界向量到播放完成比的下邊界向量的距離。

具體說明可以參見上述實施例三中的步驟S305的相關描述。

第二計算單元660，與第一計算單元650連接，用於在第一計算單元650計算出播放完成比累積分佈向量到播放完成比的上邊界向量的距離以及播放完成比的上邊界向量到播放完成比的下邊界向量的距離之後，利用下述式2來計算視訊的品質分數：

式2

具體說明可以參見上述實施例三中的步驟S306的相關描述。

另外，在利用本發明實施例的品質評估裝置來評估了多媒體資源的品質之後，可以吸收線上結果的回饋來進行多媒體資源的動態優化排序和推薦，可以給出最終的多媒體資源的排序和推薦結果。如果使用者在多媒體資源的排序和推薦結果上的行為不夠理想，則在未來的反覆運算中，這些多媒體資源的排序和推薦結果中的多媒體資源的品質分數會降低，從而把原先多媒體資源的排序和推薦結果中靠前的多媒體資源自動排在後面。

以上所述，僅為本發明的具體實施方式，但本發明的保護範圍並不局限於此，任何熟悉本技術領域的技術人員在本發明揭露的技術範圍內，可輕易想到變化或替換，都應涵蓋在本發明的保護範圍之內。因此，本發明的保護範圍應以所述權利要求的保護範圍為准。

S100‧‧‧步驟
S120‧‧‧步驟
S140‧‧‧步驟
S201‧‧‧步驟
S203‧‧‧步驟
S205‧‧‧步驟
S207‧‧‧步驟
S209‧‧‧步驟
S301‧‧‧步驟
S302‧‧‧步驟
S303‧‧‧步驟
S304‧‧‧步驟
S305‧‧‧步驟
S306‧‧‧步驟
400‧‧‧多媒體資源的品質評估裝置
410‧‧‧第一確定單元
420‧‧‧第二確定單元
430‧‧‧第三確定單元
500‧‧‧多媒體資源的品質評估裝置
510‧‧‧劃分子單元
530‧‧‧統計子單元
550‧‧‧確定子單元
570‧‧‧第二確定單元
590‧‧‧第三確定單元
600‧‧‧多媒體資源的品質評估裝置
610‧‧‧使用單元
620‧‧‧獲取單元
630‧‧‧第一確定單元
640‧‧‧第二確定單元
650‧‧‧第一計算單元
660‧‧‧第二計算單元

包含在說明書中並且構成說明書的一部分的附圖與說明書一起示出了本發明的示例性實施例、特徵和方面，並且用於解釋本發明的原理。圖1示出根據本發明實施例一的多媒體資源的品質評估方法的流程圖；圖2示出根據本發明實施例二的多媒體資源的品質評估方法的流程圖；圖3a示出根據本發明實施例三的多媒體資源的品質評估方法的流程圖；圖3b示出播放完成比頻度分佈長條圖；圖3c示出播放完成比頻度分佈長條圖；圖3d示出視訊的品質分數分佈長條圖；圖4示出根據本發明實施例四的多媒體資源的品質評估裝置的結構框圖；圖5示出根據本發明實施例五的多媒體資源的品質評估裝置的結構框圖；以及圖6示出根據本發明實施例六的多媒體資源的品質評估裝置的結構框圖。

S100‧‧‧步驟

S120‧‧‧步驟

S140‧‧‧步驟

Claims

一種多媒體資源的品質評估方法，其中，包括：根據用於刻畫所述多媒體資源的使用者行為的指標資料，確定所述多媒體資源的累積分佈向量；根據所述累積分佈向量，確定所述多媒體資源的上邊界向量和下邊界向量；以及根據所述累積分佈向量、所述上邊界向量和所述下邊界向量，確定所述多媒體資源的品質分數。
如請求項1所述的品質評估方法，其中，所述根據用於刻畫所述多媒體資源的使用者行為的指標資料，確定所述多媒體資源的累積分佈向量，包括：將一類使用者行為的指標資料劃分為多個組；統計每個組所包括的該類使用者行為的指標資料的個數；以及將每個組對應的個數構成的向量確定為所述多媒體資源的該類使用者行為的累積分佈向量。
如請求項2所述的品質評估方法，其中，所述將一類使用者行為的指標資料劃分為多個組，包括：獲取該類使用者行為的指標資料的最大值和最小值；將確定為分割區間，其中，為組的個數；以及將區間劃分為個組。
如請求項1至3其中任一項所述的品質評估方法，其中，所述根據所述累積分佈向量、所述上邊界向量和所述下邊界向量，確定所述多媒體資源的品質分數，包括：利用下式1計算所述品質分數，式1，其中，表示所述品質分數，表示所述累積分佈向量到所述上邊界向量的距離，表示所述上邊界向量到所述下邊界向量的距離。
一種多媒體資源的品質評估裝置，其中，包括：第一確定單元，用於根據用於刻畫所述多媒體資源的使用者行為的指標資料，確定所述多媒體資源的累積分佈向量；第二確定單元，與所述第一確定單元連接，用於根據所述累積分佈向量，確定所述多媒體資源的上邊界向量和下邊界向量；以及第三確定單元，與所述第一確定單元和所述第二確定單元連接，用於根據所述累積分佈向量、所述上邊界向量和所述下邊界向量，確定所述多媒體資源的品質分數。
如請求項5所述的品質評估裝置，其中，所述第一確定單元包括：劃分子單元，用於將一類使用者行為的指標資料劃分為多個組；統計子單元，與所述劃分子單元連接，用於統計每個組所包括的該類使用者行為的指標資料的個數；以及確定子單元，與所述統計子單元連接，用於將每個組對應的個數構成的向量確定為所述多媒體資源的該類使用者行為的累積分佈向量。
如請求項6所述的品質評估裝置，其中，所述劃分子單元包括：獲取模組，用於獲取該類使用者行為的指標資料的最大值和最小值；確定模組，與所述獲取模組連接，用於將確定為分割區間，其中，為組的個數；以及劃分模組，與所述確定模組連接，用於將區間劃分為個組。
如請求項5至7其中任一項所述的品質評估裝置，其中，所述第三確定單元具體用於利用下式1計算所述品質分數，式1，其中，表示所述品質分數，表示所述累積分佈向量到所述上邊界向量的距離，表示所述上邊界向量到所述下邊界向量的距離。