[發明專利]一種電影評價預測方法及其系統在審
| 申請號: | 201510224327.1 | 申請日: | 2015-05-05 |
| 公開(公告)號: | CN104834969A | 公開(公告)日: | 2015-08-12 |
| 發明(設計)人: | 耿新;侯鵬 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06F19/00 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電影 評價 預測 方法 及其 系統 | ||
技術領域
本發明涉及模式識別和機器學習,特別涉及一種電影評價預測方法及其系統。
背景技術
電影評價預測是根據一部未上映電影的基本數據信息,如演員、導演、發行公司、預算等,估計出該電影上映后公眾對其的電影評分分布。電影產業是一個全球性的、規模達百億美元成熟產業。全球每年都會上映成千上萬部電影,而成功的電影卻寥寥無幾。對于電影投資者和發行者,日益增長的拍攝成本和日趨激烈的競爭環境使得電影的投資風險大大增加;對于觀眾,鋪天蓋地的廣告和營銷手段使得挑選一部真正喜歡和值得看的電影變得越來越困難。因此,在電影上映前期,甚至是在籌劃階段,就能可靠地預測公眾對該電影的看法變得非常重要。它既能幫助投資者理性地做出投資,也能幫助觀眾挑選真正喜歡和值得看的電影。
發明內容
發明目的:針對現有技術中存在的問題,本發明提出一種電影評價預測方法,極大地提高了優化速度和預測精度。本發明還提出了一種電影評價預測系統。
技術方案:本發明提出一種電影評價預測方法,包括如下步驟:
1)獲取用于訓練的電影數據集,通過序列前向選擇方法選擇特征;
2)對步驟1)中得到的所有電影數據集的特征進行去噪、預處理;
3)從步驟2)中得到的所有電影特征中提取特征向量;
4)收集每部電影對應的評分信息,將所有評分做歸一化處理得到評分分布向量;
5)基于步驟3)中得到的電影特征向量和步驟4)中得到的評分分布向量,訓練最大間隔評分分布模型;
6)對步驟5)得到的評分分布模型進行變形優化,得到最終用于映前電影觀眾評分分布預測的參數模型;
7)提取未上映待進行評分分布預測的電影數據的特征向量,并使用步驟6)中得到的評分分布預測參數模型計算得到一個向量,最后對該向量進行歸一化,即得該電影上映后觀眾評分分布的預測結果。
所述步驟1)特征選擇方法為序列前向選擇方法,選擇的特征包括上映時間、導演、演員、編劇、配樂、電影類型、發行公司、時長、語言、上映國家、預算。
所述步驟2)對電影數據進行去噪和預處理的具體方法為:設定閾值θ,當特征取值的出現次數大于θ時,該特征值有效;小于θ時,該特征值被合并為特征值other。
所述步驟3)提取特征向量的具體方法為:對于離散型數據,將特征的每個取值拆分為一維單獨的特征;對于連續型數據,計算出數據集中該特征取值的最大值和最小值,并將所有取值同時減去最小值,再除以最大值。
所述步驟4)對電影的所有評分按評分等級將評分人數做歸一化處理得到評分分布向量,即用該電影評分為某一等級的人數除以對該電影評分的總人數。
所述步驟5)用sigmoid函數表示每個評分等級,其表示形式為:
同時,利用最大間隔方法構建目標函數,取目標函數的最小值構建評分分布模型,其目標函數表示為:
J=∑ijlij(wj,bj)+λh(W,b)???(2)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510224327.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種提供傳輸線路的方法和裝置
- 下一篇:一種基于蟻群分類算法的漁場預報方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





