[發明專利]一種基于用戶評分與評論的推薦方法在審
| 申請號: | 201910341581.8 | 申請日: | 2019-04-26 |
| 公開(公告)號: | CN110110230A | 公開(公告)日: | 2019-08-09 |
| 發明(設計)人: | 趙躍龍;張豫 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F17/27;G06Q30/02 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 物品特征 用戶評論 預處理 評論數據 評論 詞頻 預處理技術 列表生成 描述信息 數據缺失 大數據 冷啟動 相似度 元數據 預測 準確率 填充 引入 改進 幫助 | ||
1.一種基于用戶評分與評論的推薦方法,其特征在于,包括以下步驟:
步驟1、評論數據預處理:包括物品評論聚合、缺失評論填充、重復數據刪除和數據格式轉換;
步驟2、物品特征提取:利用Word2Vec模型從預處理后的評論數據中提取物品特征;
步驟3、改進物品特征:利用用戶評論中包含的詞頻、評分、評論時間和評論幫助度信息對物品特征進行改進;
步驟4、計算物品相似度:基于改進后的物品特征利用余弦相似度計算物品之間的相似度;
步驟5、預測物品評分:根據物品之間的相似度計算用戶對物品的評分,得到用戶對物品的預測評分;
步驟6、生成推薦列表:根據用戶對物品的預測評分生成初始的推薦列表,然后過濾用戶已評分物品,生成最終的推薦列表。
2.根據權利要求1所述的一種基于用戶評分與評論的推薦方法,其特征在于:在步驟1中,所述評論數據預處理是指利用大數據預處理技術對原始的用戶評論文本進行數據清洗轉換,包括:
物品評論聚合:根據物品的唯一標識將描述同一物品的所有用戶評論進行聚合,得到同一物品的評論集合;
缺失評論填充:對于沒有獲得用戶評論的物品,從物品的元數據中提取物品的描述信息作為一條用戶評論數據,來填充物品的缺失評論數據;
重復數據刪除:對同一物品評論集合中的所有用戶評論,利用編輯距離計算它們之間的相似度,對于相似度高的用戶評論,視為重復評論進行刪除;
數據格式轉換:對每條用戶評論文本,進行標點符號過濾,單詞大小寫轉換,分詞,詞干提取和去除停用詞處理。
3.根據權利要求1所述的一種基于用戶評分與評論的推薦方法,其特征在于:在步驟2中,所述物品特征提取是指利用Word2Vec模型從預處理后的物品評論文本中提取物品特征,具體過程如下:
步驟2.1、詞向量轉換:利用Word2Vec模型將同一物品集合中的所有用戶評論的詞匯轉換為低維的詞向量;
步驟2.2、評論特征向量轉換:將相應評論中所有詞對應的詞向量進行累加,然后除以該條評論中包含的詞匯數量,得到評論的特征向量;
步驟2.3、物品特征向量轉換:得到評論的特征向量后,對物品評論集合中所有評論對應的評論特征向量進行累加,然后除以物品評論集合中包含的評論數量得到物品的特征向量。
4.根據權利要求1所述的一種基于用戶評分與評論的推薦方法,其特征在于:在步驟3中,所述改進物品特征是指利用用戶評論中包含的詞頻、評分、評論時間和評論幫助度信息對物品特征進行改進,具體過程如下:
步驟3.1、引入詞頻改進物品特征:利用TF-IDF算法計算用戶評論中單詞的詞頻,根據詞頻權重對物品特征進行改進;
步驟3.2、引入評分改進物品特征:對評分高的用戶評論賦予高權重,評分低的用戶評論賦予低權重,根據評分權重對物品特征進行改進;
步驟3.3、引入評論時間改進物品特征:對距離當前時間近的用戶評論賦予高權重,距離當前時間遠的用戶評論賦予低權重,根據評論時間權重對物品特征進行改進;
步驟3.4、引入評論幫助度改進物品特征:對評論幫助度高的用戶評論賦予高權重,距離當前時間遠的用戶評論賦予低權重,根據評論時間權重對物品特征進行改進。
5.根據權利要求1所述的一種基于用戶評分與評論的推薦方法,其特征在于:在步驟4中,所述計算物品相似度是指利用余弦相似度度量方法比較兩兩物品的特征向量,得到物品之間的相似度。
6.根據權利要求1所述的一種基于用戶評分與評論的推薦方法,其特征在于:在步驟5中,所述預測物品評分是指根據物品之間的相似度計算用戶對物品的評分,得到用戶對物品的預測評分,具體過程如下:
步驟5.1、根據物品之間的相似度由高至低進行排序,得到與目標物品最相似的前k個物品;
步驟5.2、根據用戶對這前k個物品的評分,預測用戶對目標物品的評分。
7.根據權利要求1所述的一種基于用戶評分與評論的推薦方法,其特征在于:在步驟6中,所述生成推薦列表是指根據用戶對物品的預測評分生成初始的推薦列表,然后過濾用戶已評分物品,生成最終的推薦列表,具體過程如下:
步驟6.1、初始推薦列表生成:根據用戶對物品的預測評分由高至低進行排序,得到初始推薦列表;
步驟6.2、物品過濾和排序:過濾初始推薦列表中用戶已經給過評分的物品,重新進行排序;
步驟6.3、最終推薦列表生成:讀取步驟6.2中的物品排序列表,選取前N個物品生成推薦列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910341581.8/1.html,轉載請聲明來源鉆瓜專利網。





