[發明專利]視頻資源流行度預測方法在審
| 申請號: | 201710409198.2 | 申請日: | 2017-06-02 |
| 公開(公告)號: | CN107222787A | 公開(公告)日: | 2017-09-29 |
| 發明(設計)人: | 王子磊;朱策 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | H04N21/466 | 分類號: | H04N21/466;H04N21/45;G06F17/30 |
| 代理公司: | 北京凱特來知識產權代理有限公司11260 | 代理人: | 鄭立明,鄭哲 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 資源 流行 預測 方法 | ||
1.一種視頻資源流行度預測方法,其特征在于,包括:
統計一定區域內群體用戶的收視數據,獲得群體用戶的收視類型數據和交互行為數據,并利用收視類型數據來計算所統計數據的資源流行度;
利用耦合用戶行為的文檔主題生成模型LDA,遍歷收視類型數據和交互行為數據分別生成對應狄利克雷分布,通過鏈式法則推導每個行為模式的全概率并求取其狄利克雷分布的期望,得到行為模式矩陣;
結合神經網絡模型,將所統計數據的資源流行度與行為模式矩陣作為神經網絡輸入,經過訓練生成預測模型,根據訓練的預測模型來預測未來的視頻資源流行度。
2.根據權利要求1所述的一種視頻資源流行度預測方法,其特征在于,所述統計一定區域內群體用戶的收視數據,獲得群體用戶的收視類型數據和交互行為數據包括:
統計一個地區所有群體用戶的觀看日志,通過劃分時間段和節目類型,得到群體用戶一定天數內不同時間段的收視類型數據和交互行為的數據;
其中,劃分時間段是指對一天的時間進行劃分,若將一天劃分為24個時間段,則每一時間段即為一個小時;
交互行為是指用戶在點播業務中的播放狀態,共有10種:節目收藏、首次啟動播放、再次啟動播放、快進狀態、快退狀態、暫停狀態、定位播放、播放失敗、退出播放與記憶播放。
3.根據權利要求1所述的一種視頻資源流行度預測方法,其特征在于,所述利用收視類型數據來計算所統計數據的資源流行度包括:
將收視類型數據用集合C={ci|i=1,2,…,K}表示,集合C中的元素ci按收視類型編號,ci表示i類收視類型,其被用戶訪問的時間在總收視時長中的占比為pi,則pi是ci在集合C中的流行度,且P={pi|i=1,2,…,K}是集合C的資源流行度集合;其中,K為收視類型的總數量。
4.根據權利要求1所述的一種視頻資源流行度預測方法,其特征在于,所述利用耦合用戶行為的文檔主題生成模型LDA,遍歷收視類型數據和交互行為數據分別生成對應狄利克雷分布,通過鏈式法則推導每個行為模式的全概率并求取其狄利克雷分布的期望,得到行為模式矩陣包括:
假設收視類型數據中有K種收視類型Vw部節目,交互行為數據中有L種行為類型Vl個交互行為;
對某一收視類型的節目中出現某一類型的交互行為,則稱為行為模式;第m個文檔中用戶的行為模式多項式分布是一個K×L維矩陣,行為模式分布中第z個位置表示的行為模式即為用戶對收視類型zmn1的節目采取第zmn2種交互行為;其中,
zmn2=(zmnmod K)
利用耦合用戶行為的LDA模型,遍歷收視類型數據和交互行為數據分別生成對應狄利克雷分布,其過程如下:
令:則對于每一條收視數據n,n∈{1,...,Nm};其中,Nm為第m個文檔中收視數據數量,為第k種收視類型的節目多項式分布,為第l種行為類型的交互行為多項式分布,α為行為模式多項式分布的Dirichlet先驗參數,β為節目多項式分布的Dirichlet先驗參數,γ為交互行為多項式分布的Dirichlet先驗參數;
計算狄利克雷分布Θ,Φ,Ψ:
其中,分別表示參與計算的行為模式、節目類型、行為類型的數量;分別為節目、交互行為和行為模式集合;表示第m個文檔中行為模式的集合,Φ為節目分布多項式中所有節目發生概率的狄利克雷分布,Ψ為交互行為多項式分布中所有交互行為發生概率的狄利克雷分布,Θ為行為模式多項式分布中所有行為模式發生概率的狄利克雷分布;
基于狄利克雷分布Θ,Φ,Ψ,并通過鏈式法則推導每個行為模式的全概率:
其中,分別為節目、交互行為和行為模式集合,這三個集合內部元素wmn、tmn、zmn分別表示第m個文檔中第n收視數據的節目、第m個文檔中第n收視數據的交互行為、第m個文檔中第n收視數據的行為模式;表示行為模式集合中去除zmn后的集合;
最終基于狄利克雷分布Θ,Φ,Ψ以及每個行為模式的全概率求解狄利克雷分布的期望,推導得到如下公式:
其中,代表用戶對第k種收視類型中第Vw部節目的觀看次數,代表分配在第l種行為類型的第Vl交互行為的次數,代表在第m個文檔中第i個行為模式的發生次數;θmi、分別為單個行為模式、節目、交互行為的發生概率。
5.根據權利要求1所述的一種視頻資源流行度預測方法,其特征在于,所述結合神經網絡模型,將所統計數據的資源流行度與行為模式矩陣作為神經網絡輸入,經過訓練生成預測模型,根據訓練的預測模型來預測未來的視頻資源流行度包括:
利用BP神經網絡實現對行為模式矩陣和統計數據的資源流行度的非線性映射,輸入層和輸出層神經元個數與輸入輸出參數有關,輸入的行為模式矩陣節目的收視類型有K種,輸出為未來的視頻資源流行度,則輸入層和輸出層節點個數分別為K和1,隱含層節點數設為S個;
將統計數據的資源流行度,以及行為模式矩陣中不同收視類型的節目的行為向量讀入,再將讀入數據劃分為訓練數據和測試數據;
開始初始化BP神經網絡,訓練方法采用最速下降法,批量方式訓練行為模式數據,然后采用批量訓練的方式將樣本輸入BP神經網絡,計算每個樣本的誤差;最后判斷是否收斂,若不收斂,根據最速下降法調整權值,直至收斂,從而獲得預測模型;
將劃定的測試數據輸入BP神經網絡,利用預測模型來預測未來的視頻資源流行度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710409198.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種地磅終端操作室
- 下一篇:一種用于陶瓷生產線的干燥裝置





