[發(fā)明專利]一種基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010051421.2 | 申請(qǐng)日: | 2020-01-17 |
| 公開(公告)號(hào): | CN111274493B | 公開(公告)日: | 2020-09-08 |
| 發(fā)明(設(shè)計(jì))人: | 邵杰;王曉晨;肖廷松;徐行 | 申請(qǐng)(專利權(quán))人: | 電子科技大學(xué);宜賓電子科技大學(xué)研究院 |
| 主分類號(hào): | G06F16/9536 | 分類號(hào): | G06F16/9536;G06K9/62;G06F17/16 |
| 代理公司: | 成都正華專利代理事務(wù)所(普通合伙) 51229 | 代理人: | 李蕊 |
| 地址: | 611731 四川省成*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 評(píng)論 評(píng)分 預(yù)測(cè) 方法 | ||
1.一種基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法,其特征在于,包括以下步驟:
S1、對(duì)每條用戶歷史消費(fèi)記錄進(jìn)行數(shù)據(jù)預(yù)處理;
S2、針對(duì)每位用戶u消費(fèi)過(guò)的每個(gè)物品i,根據(jù)用戶-物品評(píng)分矩陣和相似度公式計(jì)算得到不同用戶之間的相似度,選擇出消費(fèi)過(guò)物品i的所有用戶中與用戶u相似度最高的相似用戶撰寫的對(duì)物品i的評(píng)論,并把該評(píng)論添加至用戶u的評(píng)論補(bǔ)充文檔中;
S3、分別提取用戶u的評(píng)論補(bǔ)充文檔、物品i的評(píng)論文檔以及用戶u的評(píng)論文檔的評(píng)論特征;
S4、將提取的評(píng)論特征進(jìn)行連接,并將連接后的向量輸入至多層感知器中進(jìn)行評(píng)論特征融合處理,并根據(jù)融合結(jié)果得到最終的評(píng)分預(yù)測(cè)結(jié)果,從而完成基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)。
2.根據(jù)權(quán)利要求1所述的基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法,其特征在于,所述步驟S1包括以下步驟:
S101、刪除每條用戶歷史消費(fèi)記錄的評(píng)論中的停止詞、數(shù)字、標(biāo)點(diǎn)符號(hào)以及出現(xiàn)頻率高于0.5的高頻單詞,其中,停止詞為使用頻率高的字或詞,包括冠詞、介詞、副詞或連詞;
S102、根據(jù)經(jīng)刪除操作后的每條用戶歷史消費(fèi)記錄的評(píng)論,計(jì)算得到數(shù)據(jù)中包含的所有單詞的TF-IDF分?jǐn)?shù),并選擇TF-IDF分?jǐn)?shù)最高的2萬(wàn)個(gè)單詞構(gòu)建詞典,其中,TF-IDF表示詞頻-逆向文件頻率;
S103、刪除評(píng)論中所述詞典以外的所有單詞;
S104、對(duì)英文單詞/中文字?jǐn)?shù)長(zhǎng)度超過(guò)300的評(píng)論做截?cái)嗖僮鳎?duì)英文單詞/中文字?jǐn)?shù)長(zhǎng)度不滿300的評(píng)價(jià)補(bǔ)0并延長(zhǎng)長(zhǎng)度至300,從而完成對(duì)用戶歷史消費(fèi)記錄中評(píng)論的數(shù)據(jù)預(yù)處理。
3.根據(jù)權(quán)利要求1所述的基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法,其特征在于,所述步驟S2包括以下步驟:
S201、從經(jīng)預(yù)處理后的用戶歷史消費(fèi)記錄中篩選出包含有物品i但不包括用戶u的所有用戶消費(fèi)記錄;
S202、將對(duì)物品i評(píng)分與用戶u之間差異不超過(guò)1的用戶作為用戶u的候選相似用戶;
S203、利用用戶-物品評(píng)分矩陣和相似度公式計(jì)算得到用戶u的候選相似用戶中的所有用戶與用戶u的相似度;
S204、將與用戶u相似度最高的相似用戶對(duì)物品i的評(píng)論作為用戶u的補(bǔ)充評(píng)論,并把所述補(bǔ)充評(píng)論添加至用戶u的評(píng)論補(bǔ)充文檔中;
S205、判斷用戶u的每條歷史消費(fèi)記錄是否都進(jìn)行了評(píng)論補(bǔ)充,若是,則進(jìn)入步驟S3,否則,返回步驟S201。
4.根據(jù)權(quán)利要求3所述的基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法,其特征在于,所述步驟S203中所有用戶與用戶u的相似度rx,y的表達(dá)式如下:
其中,Ix和Iy為用戶x和用戶y消費(fèi)過(guò)的物品集合,xi和yi為用戶x和用戶y對(duì)物品i的評(píng)分,和為用戶x和用戶y的平均分。
5.根據(jù)權(quán)利要求1所述的基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法,其特征在于,所述步驟S3包括以下步驟:
S301、分別對(duì)用戶u的評(píng)論補(bǔ)充文檔、物品i的評(píng)論文檔以及用戶u的評(píng)論文檔中每個(gè)單詞進(jìn)行詞嵌入處理,分別得到用戶u評(píng)論補(bǔ)充文檔的詞嵌入矩陣、物品i評(píng)論文檔的詞嵌入矩陣以及用戶u評(píng)論文檔的詞嵌入矩陣;
S302、利用卷積神經(jīng)網(wǎng)絡(luò)提取上述各所述詞嵌入矩陣中的評(píng)論特征。
6.根據(jù)權(quán)利要求5所述的基于多源用戶評(píng)論的評(píng)分預(yù)測(cè)方法,其特征在于,所述步驟S301包括以下步驟:
S3011、分別將用戶u評(píng)論補(bǔ)充文檔、物品i評(píng)論文檔以及用戶u評(píng)論文檔中的每個(gè)單詞映射至多維空間中,并用相應(yīng)的詞嵌入向量表示;
S3012、根據(jù)各單詞在上述各文檔中的位置,將所述詞嵌入向量表示進(jìn)行連接,分別得到用戶u評(píng)論補(bǔ)充文檔的詞嵌入矩陣、物品i評(píng)論文檔的詞嵌入矩陣以及用戶u評(píng)論文檔的詞嵌入矩陣,所述詞嵌入矩陣的表達(dá)式如下:
D=(e1,e2,...,el)
其中,D為詞嵌入矩陣,l為評(píng)論文檔的長(zhǎng)度,ei為文檔中第i個(gè)單詞對(duì)應(yīng)的詞嵌入向量,i=1,2,...,l。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué);宜賓電子科技大學(xué)研究院,未經(jīng)電子科技大學(xué);宜賓電子科技大學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010051421.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 全球評(píng)論板系統(tǒng)及其實(shí)現(xiàn)方法
- 一種評(píng)論推薦方法和系統(tǒng)
- 評(píng)論內(nèi)容的提供方法、裝置和終端設(shè)備
- 評(píng)論信息確定方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于人工智能構(gòu)建評(píng)論圖譜的方法和裝置
- 一種電子商務(wù)產(chǎn)品評(píng)論質(zhì)量鑒別系統(tǒng)
- 音頻文件的評(píng)論方法及裝置
- 評(píng)論的展示方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 在線評(píng)論篩選裝置
- 用于生成評(píng)論的方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 供應(yīng)商評(píng)分系統(tǒng)及方法
- 用戶評(píng)分實(shí)現(xiàn)方法、用戶評(píng)分客戶端和電子設(shè)備
- 一種評(píng)分信息處理方法及裝置
- 一種評(píng)分統(tǒng)一方法、裝置及存儲(chǔ)介質(zhì)
- 基于風(fēng)險(xiǎn)的資產(chǎn)評(píng)分方法和系統(tǒng)
- 一種交易評(píng)價(jià)的方法、裝置及終端
- 評(píng)分方法、裝置及移動(dòng)終端、服務(wù)器、存儲(chǔ)介質(zhì)
- 檢驗(yàn)節(jié)目評(píng)分有效性的方法及設(shè)備
- 疼痛評(píng)分尺
- 便攜式MEWS評(píng)分參照盤





