[發(fā)明專利]一種電影評價預(yù)測方法及其系統(tǒng)在審
| 申請?zhí)枺?/td> | 201510224327.1 | 申請日: | 2015-05-05 |
| 公開(公告)號: | CN104834969A | 公開(公告)日: | 2015-08-12 |
| 發(fā)明(設(shè)計)人: | 耿新;侯鵬 | 申請(專利權(quán))人: | 東南大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06F19/00 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 電影 評價 預(yù)測 方法 及其 系統(tǒng) | ||
1.一種電影評價預(yù)測方法,其特征在于,包括如下步驟:
1)獲取用于訓(xùn)練的電影數(shù)據(jù)集,并通過序列前向選擇方法選擇特征;
2)對步驟1)中選擇后得到的電影特征進(jìn)行去噪、預(yù)處理;
3)從步驟2)中處理過后得到的電影特征中提取特征向量;
4)收集每部電影對應(yīng)的評分信息,將所有評分做歸一化處理得到評分分布向量;
5)基于步驟3)中得到的電影特征向量和步驟4)中得到的評分分布向量,訓(xùn)練最大間隔評分分布模型;
6)對步驟5)得到的評分分布模型進(jìn)行變形優(yōu)化,得到最終用于映前電影觀眾評分分布預(yù)測的參數(shù)模型;
7)提取未上映待進(jìn)行評分分布預(yù)測的電影數(shù)據(jù)的特征向量,并使用步驟6)中得到的評分分布預(yù)測參數(shù)模型計算得到一個向量,最后對該向量進(jìn)行歸一化,即得該電影上映后觀眾評分分布的預(yù)測結(jié)果。
2.如權(quán)利要求1所述的電影評價預(yù)測系統(tǒng),其特征在于,所述步驟1)選擇的特征包括上映時間、導(dǎo)演、演員、編劇、配樂、電影類型、發(fā)行公司、時長、語言、上映國家、預(yù)算。
3.如權(quán)利要求1所述的電影評價預(yù)測系統(tǒng),其特征在于,所述步驟2)對電影數(shù)據(jù)進(jìn)行去噪和預(yù)處理的具體方法為:設(shè)定閾值θ,當(dāng)特征取值的出現(xiàn)次數(shù)大于θ時,該特征值有效;小于θ時,該特征值被合并為特征值other。
4.如權(quán)利要求1所述的電影評價預(yù)測系統(tǒng),其特征在于,所述步驟3)提取特征向量的具體方法為:對于離散型數(shù)據(jù),將特征的每個取值拆分為一維單獨(dú)的特征;對于連續(xù)型數(shù)據(jù),計算出數(shù)據(jù)集中該特征取值的最大值和最小值,并將所有取值同時減去最小值,再除以最大值。
5.如權(quán)利要求1所述的電影評價預(yù)測系統(tǒng),其特征在于,所述步驟4)對電影的所有評分按評分等級將評分人數(shù)做歸一化處理得到評分分布向量,即用該電影評分為某一等級的人數(shù)除以對該電影評分的總?cè)藬?shù)。
6.如權(quán)利要求1所述的電影評價預(yù)測系統(tǒng),其特征在于,所述步驟5)的評分分布模型用sigmoid函數(shù)表示每個評分等級,其表示形式為:
同時,利用最大間隔方法構(gòu)建目標(biāo)函數(shù),通過取目標(biāo)函數(shù)的最小值來優(yōu)化求解評分分布模型,其目標(biāo)函數(shù)表示為:
J=∑ijlij(wj,bj)+λh(W,b)???????(2)
公式(1)(2)中,x表示電影,i表示第i個電影樣本,j表示第j個評分等級,W和b為待優(yōu)化參數(shù),wj和bj分別為W和b第j列,d為真實評分,λ為人工設(shè)定的參數(shù),
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學(xué),未經(jīng)東南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510224327.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機(jī)輔助管理
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





