[發明專利]一種基于網絡數據的電視劇點播量預測方法有效
| 申請號: | 201410255632.2 | 申請日: | 2014-06-11 |
| 公開(公告)號: | CN104035994B | 公開(公告)日: | 2017-04-12 |
| 發明(設計)人: | 胡琴敏;徐曉楓;陳國梁;杜澤宇;羅念;鐘哲凡 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙)31215 | 代理人: | 徐筱梅,張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網絡 數據 電視劇 點播 預測 方法 | ||
1.一種基于網絡數據的電視劇點播量預測方法,其特征在于以網絡爬蟲抓取電視劇首播前后與電視劇名相關的微博數量和搜索次數以及與電視劇相關數據,將抓取的數據運用相關性分析和單變量線性回歸計算后建立初始特征集,然后對初始特征集采用逐步回歸法得到X特征集和Xb特征集,將X特征集和Xb特征集采用多元線性回歸法得到預測集均點播量,然后按預測值的大小進行電視劇的排名預測,具體預測按下述步驟進行:?
(一)、數據的抓取
a、通過網絡爬蟲抓取已經結束熱播的若干部電視劇以及與電視劇對應的基本數據;
b、獲取微博排行榜中娛樂領域排名前100的用戶,然后根據關注關系,擴展用戶數,并補全電視劇演員和各大衛視的官方微博,并抓取這批用戶的微博數據;
(二)、統計樣本
a、分析娛樂領域用戶的數據,統計可能與電視劇相關因素為A微博數據樣本;
b、統計若干部電視劇首播前一個月內每周的電視劇名相關總微博數和首播后15天中每天的微博數為B微博數據樣本;
c、統計百度指數中電視劇首播前一個月內每周電視劇名被搜索的次數和首播后15天中每天搜索次數為搜索數據樣本;?
(三)、初始特征集的建立
a、使用SPSS分析工具對統計樣本中a步驟的相關因素與電視劇集均點播量分別進行皮爾遜相關系數和斯皮爾曼相關系數的計算,在置信度為5%條件下,只要滿足其中一個相關性即為顯著相關因素;?
b、使用SPSS分析工具分別對電視劇首播前一個月內每周的微博數量和首播后15天中每天的微博數量與電視劇首播前一個月內每周被搜索的次數與首播后15天中每天被搜索的次數進行單變量線性回歸計算,得到每個變量對電視劇集均點播量的R2值,將每個時間點微博與搜索數據中較大的R2值作為特征因素,其中因變量為電視劇集均點播量,自變量為每個時間點的單變量;?
c、將上述a步驟中的顯著相關因素與b步驟中較大的R2值組成初始特征集;
(四)、X和Xb特征集的建立
運用SPSS分析工具對初始特征集進行逐步回歸計算得到X特征集,從X特征集中抽取電視劇首播前就能獲取的特征得到Xb特征集;
(五)、電視劇的排名預測
運用SPSS分析工具對X特征集和Xb特征集進行多元回歸計算得到兩個預測模型,并對預測模型加入了偏執項和是否建立特定微博帳號,如果有建立特定微博帳號,則在SPSS分析工具計算的結果上加上有無特定微博帳號電視劇集均的差值;由?Xb特征集經加入偏執項的多元回歸計算得到能在電視劇首播前預測集均點播量的預測模型???????????????????????????????????????????????;由X特征集經加入偏執項的多元回歸計算得到能在電視劇首播后預測集均點播量的預測模型,然后根據預測值的大小進行電視劇的排名預測;所述預測模型為電視劇首播后進行逐步修正的預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410255632.2/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





