[發(fā)明專利]一種基于用戶評論的推薦方法在審
| 申請?zhí)枺?/td> | 202010870226.2 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN112052401A | 公開(公告)日: | 2020-12-08 |
| 發(fā)明(設計)人: | 倪曉軍;陳斌 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F40/211;G06F40/216;G06F40/284 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 徐激波 |
| 地址: | 210046 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 評論 推薦 方法 | ||
本發(fā)明公開了一種基于用戶評論的推薦方法,包括對評論數(shù)據(jù)進行預處理、利用LDA主題概率模型對物品的評論數(shù)據(jù)集進行主題概率分布的計算、根據(jù)用戶的評分、評論的時間對物品特征進行改進、利用余弦相似度對改進后的物品特征進行計算得到物品之間的相似度、根據(jù)計算得到的物品相似度,通過用戶已評分的物品,對未評分物品進行評分預測、根據(jù)用戶對物品的預測評分生成初始的推薦列表,過濾用戶已評分物品,生成最終的推薦列表;本發(fā)明提供的推薦方法緩解了傳統(tǒng)的協(xié)同過濾推薦算法面臨數(shù)據(jù)稀疏性和冷啟動問題,可以更準確地反映用戶偏好的物品特征,評論的信息量豐富,可用性高。
技術領域
本發(fā)明涉及推薦系統(tǒng)技術領域,主要涉及一種基于用戶評論的推薦方法。
背景技術
隨著信息技術和互聯(lián)網的發(fā)展,信息過載問題日益嚴重,推薦系統(tǒng)的出現(xiàn)是解決這類問題的有效手段,通過用戶的已有的歷史記錄自動從海量數(shù)據(jù)中發(fā)現(xiàn)滿足用戶需求的信息并進行推薦,提高了人們對信息獲取的效率。
協(xié)同過濾算法是推薦算法中最為重要并且得到廣泛應用的算法之一,但傳統(tǒng)的算法在用戶量以及物品量過大的情況下,會出現(xiàn)矩陣稀疏問題,這直接影響著算法計算的精確度以及運行效率。近年來隨著文本處理技術的提升,越來越多的研究者們通過從用戶評論入手,來獲得用戶和物品的特征,從而提高算法的準確度。本方法主要通過用戶的評論信息,針對傳統(tǒng)協(xié)同過濾算法的稀疏性和冷啟動問題做出了改進。
發(fā)明內容
發(fā)明目的:為了克服現(xiàn)有技術中存在的不足,本發(fā)明提供一種基于用戶評論的推薦方法,緩解傳統(tǒng)的協(xié)同過濾推薦算法面臨數(shù)據(jù)稀疏性和冷啟動問題,通過用戶評論集,利用LDA主題概率模型對物品的評論集進行主題概率分布的計算,再對每條評論加入用戶評分以及評論時間權重,來提高物品特征計算的準確性,將得到的物品關于主題分布的概率作為物品的特征,通過計算物品之間關于特征向量的余弦相似度來獲得物品間的相似程度,從而根據(jù)物品相似度,通過用戶的歷史評分數(shù)據(jù)來對未評分物品進行評分預測。
技術方案:為實現(xiàn)上述目的,本發(fā)明采用的技術方案為:
一種基于用戶評論的推薦方法,包括以下步驟:
步驟S1、對評論數(shù)據(jù)進行預處理,獲取評論數(shù)據(jù)集;包括將所有單詞轉換為小寫;去除非字母字符,對語句進行分詞、斷句并進行詞形還原;去除停用詞;過濾無用的空評論;統(tǒng)計詞頻并進行向量轉換;對于未獲得用戶評論的物品,將物品描述信息作為該物品的用戶評論進行預處理;
步驟S2、利用LDA主題概率模型對物品的評論數(shù)據(jù)集進行主題概率分布的計算,并將得到的物品關于主題分布的概率作為物品的特征;
步驟S3、根據(jù)用戶的評分、評論的時間對物品特征進行改進;
步驟S4、利用余弦相似度對改進后的物品特征進行計算得到物品之間的相似度;
步驟S5、根據(jù)計算得到的物品相似度,通過用戶已評分的物品,對未評分物品進行評分預測;
步驟S6、根據(jù)用戶對物品的預測評分生成初始的推薦列表,過濾用戶已評分物品,生成最終的推薦列表。
進一步地,所述步驟S2中利用LDA主題概率模型對物品的評論數(shù)據(jù)集進行主題概率分布的計算具體步驟如下:
步驟S2.1、根據(jù)評論數(shù)據(jù)集構建LDA主題模型,根據(jù)物品的所有評論數(shù)據(jù)計算該物品在模型下的主題概率分布,得到關于主題分布的概率向量,把所述概率向量作為該物品的特征向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010870226.2/2.html,轉載請聲明來源鉆瓜專利網。





