[發明專利]一種基于用戶評論的推薦方法在審
| 申請號: | 202010870226.2 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN112052401A | 公開(公告)日: | 2020-12-08 |
| 發明(設計)人: | 倪曉軍;陳斌 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F40/211;G06F40/216;G06F40/284 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 徐激波 |
| 地址: | 210046 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 評論 推薦 方法 | ||
1.一種基于用戶評論的推薦方法,其特征在于,包括以下步驟:
步驟S1、對評論數據進行預處理,獲取評論數據集;包括將所有單詞轉換為小寫;去除非字母字符,對語句進行分詞、斷句并進行詞形還原;去除停用詞;過濾無用的空評論;統計詞頻并進行向量轉換;對于未獲得用戶評論的物品,將物品描述信息作為該物品的用戶評論進行預處理;
步驟S2、利用LDA主題概率模型對物品的評論數據集進行主題概率分布的計算,并將得到的物品關于主題分布的概率作為物品的特征;
步驟S3、根據用戶的評分、評論的時間對物品特征進行改進;
步驟S4、利用余弦相似度對改進后的物品特征進行計算得到物品之間的相似度;
步驟S5、根據計算得到的物品相似度,通過用戶已評分的物品,對未評分物品進行評分預測;
步驟S6、根據用戶對物品的預測評分生成初始的推薦列表,過濾用戶已評分物品,生成最終的推薦列表。
2.根據權利要求1所述的一種基于用戶評論的推薦方法,其特征在于,所述步驟S2中利用LDA主題概率模型對物品的評論數據集進行主題概率分布的計算具體步驟如下:
步驟S2.1、根據評論數據集構建LDA主題模型,根據物品的所有評論數據計算該物品在模型下的主題概率分布,得到關于主題分布的概率向量,把所述概率向量作為該物品的特征向量;
其中,評論集是M個評論的集合,表示為D={d1,d2,…,dM};每一條評論是N個詞的序列,用d={w1,w2,…,wn}表示,wn是序列的第n個詞;設定K個主題,主題模型為θ={θ1,θ2,…,θk};
步驟S2.2、根據Gibbs抽樣算法可以得θ={θ1,θ2,…,θk}到評論m中主題k的概率θm,k如下:
其中表示文檔m出現主題k的次數,αk是主題k的Dirichlet先驗分布,θm,k是文檔m中主題k的概率;
步驟S2.3、計算每個物品在主題上的概率分布,獲得矩陣Y如下:
其中,N代表物品的個數,Y的每一項均由步驟S2.2計算得出,由評論集得到的關于K個主題的概率分布,作為物品關于評論集的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010870226.2/1.html,轉載請聲明來源鉆瓜專利網。





