[發明專利]一種基于觀點增強的主題協同過濾推薦方法在審
| 申請號: | 201810036537.1 | 申請日: | 2018-01-15 |
| 公開(公告)號: | CN108228867A | 公開(公告)日: | 2018-06-29 |
| 發明(設計)人: | 彭敏;施洪亮;胡剛 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/06 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 協同過濾 矩陣 評論文本 平均絕對誤差 詞義 集成屬性 模型計算 情感極性 商品推薦 屬性詞匯 算法計算 主題模型 情感詞 構建 鄰近 表現 分析 | ||
1.一種基于觀點增強的主題協同過濾推薦方法,其特征在于,包括以下步驟:
步驟1:基于LDA主題模型提取評論文本屬性面;
步驟2:根據LDA提取到的屬性詞,利用word2vec模型計算屬性詞之間的關系,將相似的屬性詞歸為一類;
步驟3:通過屬性面觀點增強分析得到評論文本的情感極性;
步驟4:根據情感詞極性和屬性詞構建打分矩陣,根據打分方式通過協同過濾算法計算用戶之間的相似性;
步驟5:對任意用戶u,從步驟4中的相似度矩陣選擇與其最相似的k個鄰居,將相似度最高的商品推薦給用戶u。
2.根據權利要求1所述的基于觀點增強的主題協同過濾推薦方法,其特征在于:步驟1中,利用LDA算法進行短文本的主題挖掘,挖掘一個商品的各屬性詞。
3.根據權利要求1所述的基于觀點增強的主題協同過濾推薦方法,其特征在于:步驟2中,word2vec模型將每個屬性詞映射到一個低維稠密的實數向量空間,在空間上,語義相似的詞能夠匯聚成一起形成一個屬性面。
4.根據權利要求1所述的基于觀點增強的主題協同過濾推薦方法,其特征在于:步驟3中,評論文本的情感極性表達了用戶對商品的情感傾向,分為積極、消極和中性三種;采用觀點增強的方法來計算每個評論文本的情感傾向;同時,結合每個評論文本的用戶總體星數評分與情感傾向進行判斷,對不一致情況下的評論文本進行剔除;其中,將評論文本一顆或兩顆星定義為消極,得分為-1;評論是三顆星的定義為中性,得分為0;評論是四顆或五顆星則定義為積極,得分為1。
5.根據權利要求1所述的基于觀點增強的主題協同過濾推薦方法,其特征在于:步驟4中,根據主題-詞匯分布以及情感極性打分,得到用戶i對商品j的fk屬性面的偏好度為:
其中,為主題詞wn在屬性面fk分布中的概率值,屬性面fk由主題fn根據word2vec模型匯集而成;Sij為用戶i對商品j評論的情感打分;N表示評論文本中總的用戶數;
結合關注度的影響,得到用戶i對商品j的fk屬性面的綜合評分:
Pijk=θikFijk (2)
其中,LDA主題模型中所得到的文檔-主題分布矩陣θik用于表達用戶i對第k個屬性面的關注度;
結合公式(2)提供的用戶i對商品j的fk屬性面的綜合評分,對于用戶u和用戶v,定義它們對商品j的屬性面情感評分分別為Pujk和Pvjk,進而通過協同過濾算法得到用戶u和用戶v在評論文本屬性面上的相似度:
其中,Iu和Iv分別表示商品評論集合,kuj和kvj分別表示用戶u和用戶v對商品j的屬性面的評論文本集合;根據屬性面相似度評分,對用戶u的n個鄰近用戶計算商品c的評分:
其中,buc表示基準的平均推薦評分,ruj表示用戶u對商品j的評分,baj表示用戶u的相似用戶對商品j的平均評分;a表示用戶u相似用戶中的其中一個,總共n個。
6.根據權利要求1-5任意一項所述的基于觀點增強的主題協同過濾推薦方法,其特征在于:步驟5中,通過計算不同主題數k下的MAE值并確定最優的主題數;
其中,{p1,p2,...,pn}表示通過推薦算法得到的用戶評論文本集合,pi表示集合中的一個值;{q1,q2,...,qn}表示實際的用戶評分集合,qj表示此集合中的一個值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810036537.1/1.html,轉載請聲明來源鉆瓜專利網。





