[發明專利]一種基于自回歸模型的在線連載內容流行度預測方法有效
| 申請號: | 201410161457.0 | 申請日: | 2014-04-21 |
| 公開(公告)號: | CN103914743B | 公開(公告)日: | 2017-01-25 |
| 發明(設計)人: | 常標;祝恒書;譚昶;陳恩紅;劉淇;熊輝 | 申請(專利權)人: | 中國科學技術大學先進技術研究院 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06F17/30 |
| 代理公司: | 合肥天明專利事務所34115 | 代理人: | 張祥騫,奚華保 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 回歸 模型 在線 連載 內容 流行 預測 方法 | ||
1.一種基于自回歸模型的在線連載內容流行度預測方法,其特征在于,包括以下步驟:?
11)訓練數據的獲取,爬取在線連載內容的整體播放量趨勢,解析整體播放量趨勢頁面的HTML源代碼,解析每集播放量趨勢頁面的HTML源代碼;?
12)流行度預測,利用自回歸模型預測新連載內容的流行度。?
2.根據權利要求1所述的一種基于自回歸模型的在線連載內容流行度預測方法,其特征在于,所述的流行度預測利用樸素自回歸模型進行新連載內容流行度的預測,樸素自回歸模型公式如下:?
其中w=(ω0,ω1,...,ωr)T,r為模型的秩。?
3.根據權利要求2所述的一種基于自回歸模型的在線連載內容流行度預測方法,其特征在于,所述的樸素自回歸模型中模型參數的學習包括以下步驟:?
31)定義共享參數,給定連載內容集合S和它們的流行度記錄?
E=(E1·E2,...,E|S|},則其中為連載內容n第i集的流行度記錄;?
32)利用最小化平均相對平方誤差來學習共享參數,其公式如下:?
其中為流行度真實值。?
4.根據權利要求2所述的一種基于自回歸模型的在線連載內容流行度預測方法,其特征在于,所述的樸素自回歸模型中模型參數的學習的方法如下:?
定義私有參數,加入懲罰項,其公式如下:?
其中||w||2=wTw=ω02+ω12+...+ωr2,λ為超參。?
5.根據權利要求1所述的一種基于自回歸模型的在線連載內容流行度預測方法,其特征在于,所述的流行度預測利用轉移模型進行新連載內容流行度?的預測,包括以下步驟:?
51)定義變量,定義連載內容為n,第i集在第j個相對時間間隔的流行度為Vij,來自追劇者的瀏覽量為aij,來自新增者的瀏覽量為bij,?
第i集第j個相對時間間隔的追劇者在第k個相對時間間隔觀看第i+1集的概率為pijk其中k>=j,?
第i集第j個相對時間間隔的追劇者在第k(k>=j)個相對時間間隔觀看第i+1集的概率為qijk,其中k>=j,?
當i=0時,則?
52)轉移模型的公式如下:?
其中?
對于任意的i、j、k,則?
pijk=pi,j+1,k+1
qijk=qi,j+1,k+1;?
53)求解bij,去除新增者隨著新集的上映在流失數,bij隨著i的增加而有減少的趨勢,故?
bij=b0j?exp-αi
其中α是衰減因子,b0j為在第j個相對時間間隔時連載內容的初始關注度。?
54)根據α和b0j修改轉移模型的公式,如下:?
其中b0=(b01,...,b0j),p=(p111,p112,...pi-1,jj)。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學先進技術研究院,未經中國科學技術大學先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410161457.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:保健鴿肉腸
- 下一篇:一種利用共振式饋電結構的寬帶天線
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





