[發明專利]一種基于自回歸模型的在線連載內容流行度預測方法有效
| 申請號: | 201410161457.0 | 申請日: | 2014-04-21 |
| 公開(公告)號: | CN103914743B | 公開(公告)日: | 2017-01-25 |
| 發明(設計)人: | 常標;祝恒書;譚昶;陳恩紅;劉淇;熊輝 | 申請(專利權)人: | 中國科學技術大學先進技術研究院 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06F17/30 |
| 代理公司: | 合肥天明專利事務所34115 | 代理人: | 張祥騫,奚華保 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 回歸 模型 在線 連載 內容 流行 預測 方法 | ||
技術領域
本發明涉及在線連載內容流行度預測技術領域,具體來說是一種基于自回歸模型的在線連載內容流行度預測方法。
背景技術
隨著現代因特網的發展,在線分享內容成為了人們日常生活娛樂的重要部分。作為在線內容的一個重要組成形式,在線連載內容指的是那些包含很多集并持續定期更新的內容,如電視連續劇、綜藝娛樂節目、動畫片、連載小說等。越來越多的網絡服務提供商或網站(如優酷、愛奇藝、騰訊視頻、起點中文網、紅袖添香等)直接向用戶提供在線連載內容,并和其他來源(如電視臺)保持在線同步。例如,優酷作為國內最大的視頻網站,提供了許多地區或國家的電視劇、動畫片、娛樂節目,并會同步或推遲一段時間更新。圖1是根據優酷內部收錄的電視劇信息繪制的上映第一周每集平均播放量趨勢圖,從圖1可以明顯看到電視劇播放量有著明顯的增長趨勢。
沿著這樣的思路,一個很重要的需求是如何預測連載內容的流行度,它可以擴展更多的應用,如流行內容推薦、用戶行為分析與理解、在線流量管理(緩存流行的內容,提升訪問速度)等。
谷歌公布了一項重要研究成果——電影票房預測模型。該模型能夠提前一個月預測電影上映首周的票房收入,準確度高達94%。谷歌的票房預測模型是大數據分析技術在電影行業的一個重要應用。隨著互聯網的發展,人們越來越習慣于在網上搜索電影信息。據谷歌統計,從2011到2012年,電影相關的搜索量增長了56%。谷歌發現,電影相關的搜索量與票房收入之間存在很強的關聯。實現提前一個月預測的關鍵在于:谷歌采用了一項新的指標——電影預告片的搜索量。谷歌發現,預告片的搜索量比起電影的直接搜索量而言,可以更好的預測首周票房表現。這一點不難理解,因為在電影放映前一個月的時候,人們往往更多地搜索預告片。然而僅使用預告片的搜索量仍然不夠,因此谷歌的模型最終采用了三類指標:(1)電影預告片的搜索量;(2)同系列電影前幾部的票房表現;(3)檔期的季節性特征。其中每類指標又包含了多項類內指標。在獲取到每部電影的這些指標后,谷歌構建了一個線性回歸模型(linear?regression?model)模型,來建立這些指標和票房收入的關系。線性模型雖然簡單,但已經達到了很高的準確度(94%)。簡單且效果好,是我們在實際應用中一直追求的。
和電影、傳統的用戶產生內容不同,在線連載內容具有自己的特性:即流行度序列依賴性、上映時間依賴性以及不同步的上映頻率。例如,對于電視劇,相鄰集的劇情很關聯,這樣就有可能使它們的觀眾大部分一樣,相鄰集的播放量也會有相關性,而且在周末或假期上映的集的播放量一般比在工作日上映的集的播放量要多,同時電視劇又是隔一段時間(如一天、一周)更新幾集。這樣連載內容流行度的預測問題就成為了一個多序列預測問題。
時間序列預測問題有很多經典的模型。例如自回歸模型(英語:Autoregressive?model,簡稱AR模型),是統計上一種處理時間序列的方法,用同一變量例如x的之前各值,亦即x1至xt-1來預測本期xt的表現,并假設它們具有線性關系。因為這是從回歸分析中的線性回歸發展而來,只是不用x預測y,而是用x預測x(自己),所以叫做自回歸。自回歸模型被廣泛運用在經濟學、信息學、自然現象的預測上。向量自回歸模型(英語:Vector?Autoregression?model,簡稱VAR模型)是一種常用的計量經濟模型,由計量經濟學家和宏觀經濟學家克里斯托弗·西姆斯(英語:Christopher?Sims)提出。它擴充了只能使用一個變量的自回歸模型(簡稱:AR模型),使容納大于1個變量,因此經常用在多變量時間序列模型的分析上。VAR模型描述在同一樣本期間內的n個變量(內生變量)可以作為它們過去值的線性函數。自回歸滑動平均模型(英語:Autoregressive?moving?average?model,簡稱:ARMA模型),是研究時間序列的重要方法,由自回歸模型(簡稱AR模型)與滑動平均模型(簡稱MA模型)為基礎“混合”構成。在市場研究中常用于長期追蹤資料的研究,如:Panel研究中,用于消費行為模式變遷研究;在零售研究中,用于具有季節變動特征的銷售量、市場規模的預測等。ARIMA模型(英語:Autoregressive?Integrated?Moving?Average?model),差分整合移動平均自回歸模型,又稱整合移動平均自回歸模型(移動也可稱作滑動),時間序列預測分析方法之一。ARIMA(p,d,q)中,AR是自回歸,p為自回歸項數;MA為滑動平均,q為滑動平均項數,d為使之成為平穩序列所做的差分次數(階數)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學先進技術研究院,未經中國科學技術大學先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410161457.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:保健鴿肉腸
- 下一篇:一種利用共振式饋電結構的寬帶天線
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





