[發明專利]一種電影票房的映前預測方法在審
| 申請號: | 202110591509.8 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113379448A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 孫利軍 | 申請(專利權)人: | 西安影視數據評估中心有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F16/242;G06F16/2458;G06F16/953 |
| 代理公司: | 蘇州中合知識產權代理事務所(普通合伙) 32266 | 代理人: | 阮梅 |
| 地址: | 710000 陜西省西安*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電影票房 預測 方法 | ||
本發明公開一種電影票房的映前預測方法,包括如下步驟:獲取目標電影相關的基本結構化信息和社交平臺輿情數據;對電影的基本結構化信息進行預處理,生成電影的結構化訓練數據;利用自然語言處理技術對社交平臺輿情數據進行處理,獲得電影的輿情語料訓練數據;利用社交網絡分析技術對基本結構化信息中的演職員列表進行處理建立社交網絡,并基于社交網絡確定電影中各演職員的社交網絡重要度;基于電影的結構化訓練數據、輿情語料訓練數據和各演職員的社交網絡重要度數據,利用GBM算法構建回歸預測模型;利用回歸預測模型對目標電影進行預測,獲得目標電影的總票房數據。本發明達到提高電影的總票房預測準確度。
技術領域
本發明涉及計算機技術領域,尤其涉及一種電影票房的映前預測方法。
背景技術
電影作為一種特殊的商業產品,出品方在其上映之前就展開了密集的宣傳工作,在其上映后同樣需要根據具體情況進行口碑營銷,院線也會根據電影的市場表現調整排片計劃,因此,在上映前對電影的票房進行精準預測具有較強的現實意義。由于電影項目涉及制作團隊的商業和藝術水平、大眾心理、趨勢熱點等因素,是一項復雜的系統工程,一直以來缺乏在上映前對電影票房預測的有效方法。
目前業內的普遍做法的是基于首映票房或首周票房對上映后的電影總票房數據進行預測,由于首映票房或首周票房占總票房的比例較高,且上映后的電影日票房波動趨勢具有相似的趨勢性和周期性,預測難度較映前預測大為下降。但是考慮到對上映中電影總票房預測具有一定滯后性,因此此類預測結果無法及時指導營銷和排片計劃的調整方向。
著名機器學習競賽平臺Kaggle在2019年舉行了電影票房預測挑戰賽,訓練與測試數據來自TMDB電影數據庫,最終1395支隊伍提交了有效模型與測試結果。從賽后各隊伍公開的建模流程來看,大部分參賽隊伍都使用了基于xgboost、gbm以及隨機森林等算法的集成模型,而電影制作的預算成本則是最重要的特征因素。雖然競賽中涌現了很多技術亮點,拓展了數據科學家針對票房預測這一課題的思路,但是在電影行業特別是在中國大陸,精確的預算成本一手數據是難以獲取的,而由于預算成本特征對模型性能至關重要,反而限制了相關技術的落地應用。
對于電影票房的映前預測,一種主流做法是基于目標電影的同類型其他電影的市場表現、同期電影市場熱度、點映口碑、預售熱度等因素,由行業專家憑借經驗給出大致的票房區間,這種做法更依賴于專家的個人經驗和主觀判斷。
發明內容
為了解決上述技術問題,本發明提出一種電影票房的映前預測方法。
為了達到上述目的,本發明的技術方案如下:
一種電影票房的映前預測方法,包括如下步驟:
獲取目標電影相關的基本結構化信息和社交平臺輿情數據;
對電影的基本結構化信息進行預處理,生成電影的結構化訓練數據;
利用自然語言處理技術對社交平臺輿情數據進行處理,獲得電影的輿情語料訓練數據;
利用社交網絡分析技術對基本結構化信息中的演職員列表進行處理建立社交網絡,并基于社交網絡確定電影中各演職員的社交網絡重要度;
基于電影的結構化訓練數據、輿情語料訓練數據和各演職員的社交網絡重要度數據,利用GBM算法構建回歸預測模型;
利用回歸預測模型對目標電影進行預測,獲得目標電影的總票房數據。
優選地,還包括如下步驟:通過網絡爬蟲和人工標注的方式獲取目標電影相關的基本結構化信息和社交平臺輿情數據。
優選地,所述基本結構化信息包括類型、制片國家、語言、時長、上映日期、演職員列表、制片公司列表、IMDB號、影片官方網站、影片預告片列表和電影的票房數據等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安影視數據評估中心有限公司,未經西安影視數據評估中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110591509.8/2.html,轉載請聲明來源鉆瓜專利網。





