[發(fā)明專利]一種基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010051421.2 | 申請(qǐng)日: | 2020-01-17 |
| 公開(kāi)(公告)號(hào): | CN111274493B | 公開(kāi)(公告)日: | 2020-09-08 |
| 發(fā)明(設(shè)計(jì))人: | 邵杰;王曉晨;肖廷松;徐行 | 申請(qǐng)(專利權(quán))人: | 電子科技大學(xué);宜賓電子科技大學(xué)研究院 |
| 主分類號(hào): | G06F16/9536 | 分類號(hào): | G06F16/9536;G06K9/62;G06F17/16 |
| 代理公司: | 成都正華專利代理事務(wù)所(普通合伙) 51229 | 代理人: | 李蕊 |
| 地址: | 611731 四川省成*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 評(píng)論 評(píng)分 預(yù)測(cè) 方法 | ||
本發(fā)明提供了一種基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法,屬于推薦系統(tǒng)領(lǐng)域。對(duì)用戶歷史消費(fèi)記錄進(jìn)行數(shù)據(jù)預(yù)處理;根據(jù)用戶?物品評(píng)分矩陣和相似度公式計(jì)算得到不同用戶之間的相似度,使用相似度最高的相似用戶撰寫(xiě)的相關(guān)評(píng)論對(duì)用戶評(píng)論進(jìn)行補(bǔ)充;接著提取評(píng)論特征;最后進(jìn)行評(píng)論特征融合處理。本發(fā)明可以基于用戶歷史消費(fèi)記錄篩選出相似用戶撰寫(xiě)的相關(guān)評(píng)論,對(duì)用戶評(píng)論進(jìn)行補(bǔ)充,為每位用戶都構(gòu)建一個(gè)用戶評(píng)論補(bǔ)充文檔,可以緩解用戶評(píng)論的數(shù)據(jù)稀疏問(wèn)題,豐富用戶畫(huà)像,提升評(píng)分預(yù)測(cè)的準(zhǔn)確性,進(jìn)而提高用戶對(duì)推薦系統(tǒng)的滿意度。此外,用戶評(píng)論補(bǔ)充文檔是由相似用戶撰寫(xiě)的相關(guān)評(píng)論構(gòu)成的,與用戶自己撰寫(xiě)的評(píng)論存在一定的差異性,可以提高推薦的多樣性。
技術(shù)領(lǐng)域
本發(fā)明屬于推薦系統(tǒng)領(lǐng)域,尤其涉及一種基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法。
背景技術(shù)
在如今互聯(lián)網(wǎng)信息過(guò)載的情況下,無(wú)明確需求的信息消費(fèi)者想方便地找到感興趣的內(nèi)容,信息生產(chǎn)者則想將自己的內(nèi)容推送給合適的目標(biāo)用戶,推薦系統(tǒng)應(yīng)運(yùn)而生。評(píng)分預(yù)測(cè)是推薦系統(tǒng)中的一類經(jīng)典模型,系統(tǒng)對(duì)用戶所有沒(méi)消費(fèi)過(guò)的物品進(jìn)行評(píng)分預(yù)測(cè),然后將預(yù)測(cè)分?jǐn)?shù)最高的N個(gè)物品推薦給用戶。評(píng)分預(yù)測(cè)問(wèn)題中目前采用最廣泛的方法是協(xié)同過(guò)濾算法,協(xié)同過(guò)濾算法通過(guò)利用用戶行為數(shù)據(jù)來(lái)挖掘出用戶的興趣,并為其推薦可能感興趣的物品,經(jīng)典工作包括矩陣分解算法(MF)及其擴(kuò)展工作概率矩陣分解算法(PMF)等(Koren,Y.,Bell,R.M.,Volinsky,C.:Matrix factorization techniques for mendersystems.IEEE Computer 42(8),30–37(2009).和Salakhutdinov,R.,Mnih,A.:Probabilistic matrix factorization.In:NIPS.pp.1257–1264(2007).),上述工作只利用用戶歷史評(píng)分?jǐn)?shù)據(jù),將用戶和物品都映射到高維空間中用向量進(jìn)行表示,然后計(jì)算點(diǎn)積得到預(yù)測(cè)結(jié)果。
雖然協(xié)同過(guò)濾算法性能很好,但是它無(wú)法為消費(fèi)記錄少的用戶提供良好的個(gè)性化推薦服務(wù)。也就是說(shuō),協(xié)同過(guò)濾算法存在的數(shù)據(jù)稀疏問(wèn)題比較嚴(yán)重。數(shù)據(jù)稀疏問(wèn)題是因?yàn)楝F(xiàn)在待處理的推薦系統(tǒng)規(guī)模越來(lái)越大,用戶和商品數(shù)目動(dòng)輒上億,兩個(gè)用戶之間選擇的重疊非常少,例如淘寶網(wǎng)的數(shù)據(jù)稀疏度在百萬(wàn)分之一以下。數(shù)據(jù)稀疏問(wèn)題直接影響到推薦系統(tǒng)的推薦質(zhì)量,因此受到了學(xué)術(shù)界和工業(yè)界的高度關(guān)注。目前提出的解決數(shù)據(jù)稀疏問(wèn)題的方式主要包括:
簡(jiǎn)單填值:簡(jiǎn)單填值法就是用一個(gè)固定的數(shù)值填充系統(tǒng)中所有的未評(píng)分的物品,從而解決稀疏性問(wèn)題的一種方法,常用所有評(píng)分的平均值進(jìn)行填充。
聚類:該方法根據(jù)用戶興趣之間的差異,利用某種聚類算法將系統(tǒng)中的所有用戶劃分為不同的群體;系統(tǒng)把用戶所在群體的中心值作為用戶對(duì)未評(píng)物品的評(píng)分預(yù)測(cè)值,進(jìn)行用戶-物品評(píng)分矩陣的填充。主要的聚類方法有k-means聚類和遺傳聚類等。
降維:用戶-物品評(píng)分矩陣出現(xiàn)數(shù)據(jù)稀疏的情況是由物品的高維數(shù)據(jù)引起的,因此可以考慮采取一定措施降低物品數(shù)據(jù)的維度,進(jìn)而達(dá)到約減數(shù)據(jù)的目的。目前常見(jiàn)的降維技術(shù)主要有簡(jiǎn)單降維方法、矩陣分解和主成分分析(PCA)三類。
融合:協(xié)同過(guò)濾算法利用的信息只是用戶評(píng)分?jǐn)?shù)據(jù),基于內(nèi)容的過(guò)濾可以利用用戶和物品的固有屬性和描述信息,因此將這兩種方式融合在一起可以增加可利用的數(shù)據(jù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué);宜賓電子科技大學(xué)研究院,未經(jīng)電子科技大學(xué);宜賓電子科技大學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010051421.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 全球評(píng)論板系統(tǒng)及其實(shí)現(xiàn)方法
- 一種評(píng)論推薦方法和系統(tǒng)
- 評(píng)論內(nèi)容的提供方法、裝置和終端設(shè)備
- 評(píng)論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于人工智能構(gòu)建評(píng)論圖譜的方法和裝置
- 一種電子商務(wù)產(chǎn)品評(píng)論質(zhì)量鑒別系統(tǒng)
- 音頻文件的評(píng)論方法及裝置
- 評(píng)論的展示方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 在線評(píng)論篩選裝置
- 用于生成評(píng)論的方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 供應(yīng)商評(píng)分系統(tǒng)及方法
- 用戶評(píng)分實(shí)現(xiàn)方法、用戶評(píng)分客戶端和電子設(shè)備
- 一種評(píng)分信息處理方法及裝置
- 一種評(píng)分統(tǒng)一方法、裝置及存儲(chǔ)介質(zhì)
- 基于風(fēng)險(xiǎn)的資產(chǎn)評(píng)分方法和系統(tǒng)
- 一種交易評(píng)價(jià)的方法、裝置及終端
- 評(píng)分方法、裝置及移動(dòng)終端、服務(wù)器、存儲(chǔ)介質(zhì)
- 檢驗(yàn)節(jié)目評(píng)分有效性的方法及設(shè)備
- 疼痛評(píng)分尺
- 便攜式MEWS評(píng)分參照盤(pán)





