[發明專利]一種基于觀點增強的主題協同過濾推薦方法在審
| 申請號: | 201810036537.1 | 申請日: | 2018-01-15 |
| 公開(公告)號: | CN108228867A | 公開(公告)日: | 2018-06-29 |
| 發明(設計)人: | 彭敏;施洪亮;胡剛 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/06 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 協同過濾 矩陣 評論文本 平均絕對誤差 詞義 集成屬性 模型計算 情感極性 商品推薦 屬性詞匯 算法計算 主題模型 情感詞 構建 鄰近 表現 分析 | ||
本發明公開了一種基于觀點增強的主題協同過濾推薦方法,首先基于LDA主題模型提取評論文本屬性詞;然后根據LDA提取到的屬性詞,利用word2vec模型計算屬性詞之間的關系,將相似的屬性詞歸為一類;將詞義相同的屬性詞匯集成屬性面;通過屬性面觀點增強分析得到評論文本的情感極性;接著根據情感詞極性和屬性詞構建打分矩陣,根據打分方式通過協同過濾算法計算用戶之間的相似性;最后根據k鄰近方法將矩陣中打分比較高的商品推薦給其它用戶。實驗結果表明,本發明在屬性詞提取的F值上以及推薦的平均絕對誤差值上均表現優異。
技術領域
本發明屬于信息技術領域,涉及一種信息推薦方法,具體涉及結合了協同過濾算法和基于內容推薦兩方面優勢的一種新的基于評論文本個性化推薦方法。
背景技術
互聯網共享信息平臺的發展使得世界各地的人能夠通過網絡將自己的情感或觀點與他人分享。然而,信息的爆炸式增長使得用戶很難獲得與自己密切相關的信息。推薦系統通過利用用戶和商品之間的潛在關聯,能夠給用戶提供最需要的信息,從而較好地解決了該問題。推薦系統不同于數據庫、搜索引擎這些出現較早的信息系統工具或技術,它是一個相對教新的領域。推薦系統算法主要有兩大類:基于內容的推薦算法和基于協同過濾的推薦算法。
網絡共享平臺上存在著很多帶有觀點性色彩的內容,這些內容往往能夠影響用戶的判斷和選擇。例如,對于一些購物網站平臺,商品的評論文本能夠對用戶的選擇和購買產生一定的影響。基于內容的推薦算法能夠利用文本挖掘方法提取出這些有價值的信息,從而將其推薦給特定的用戶。例如,Q.Mei提出的TSM模型通過整合文檔中主題詞和情感詞之間的關系來進行情感預測。這種推薦算法關鍵在于用戶模型和內容特征描述。提取推薦對象內容特征,目前比較成熟的方法限于主題挖掘這一類,對于信息大量涌現和多媒體數據,特征提取技術有待提高,因此基于內容的推薦散發很少用在多媒體信息推薦方面。
而協同過濾算法主要分為基于用戶的協同過濾算法和基于商品的協同過濾算法,分別利用商品或用戶的特征來計算相似度,廣泛地應用于一些復雜地非結構化對象的推薦。例如瀏覽和購買行為信息,得到推薦物品結果名單。雖然協同過濾算法有很好的推薦效果,能夠被廣泛地應用于多個領域,但是其存在數據稀疏性問題,導致用戶對商品的偏好分布過于分散,嚴重影響了用戶或商品的相似度計算,這也是本發明要解決的問題。
發明內容
本發明的目的在于通過提高商品推薦效果的粒度和精確性,將用戶與商品的關系轉變到用戶與商品屬性面的關系層面上使得用戶在商品屬性面上的評分矩陣擁有較強的魯棒性,以克服用戶對商品的偏好分布過于分散、推薦效果不佳問題。本發明通過LDA主題模型屬性詞提取以及評論文本的觀點相似性計算來構建推薦模型,能夠有效地判斷用戶對特定屬性面的偏好程度。
本發明所采用的技術方案是:一種基于觀點增強的主題協同過濾推薦方法,其特征在于,包括以下步驟:
步驟1:基于LDA主題模型提取評論文本屬性詞;
步驟2:根據LDA提取到的屬性詞,利用word2vec模型計算屬性詞之間的關系,將相似的屬性詞歸為一類;將詞義相同的屬性詞匯集成屬性面;
步驟3:通過屬性面觀點增強分析得到評論文本的情感極性;
步驟4:根據情感詞極性和屬性詞構建打分矩陣,根據打分方式通過協同過濾算法計算用戶之間的相似性;
步驟5:對任意用戶u,從步驟4中的相似度矩陣選擇與其最相似的k個鄰居,將相似度最高的商品推薦給用戶u。
相對于現有技術,本發明的有益效果是將用戶與商品的關系轉變到用戶與商品屬性面的關系層面上,使得用戶在商品的屬性面的評分矩陣具有非常好的魯棒性,因而,能夠給用戶提供精確的個性化推薦。
附圖說明
圖1為本發明實施例的方法整體模型圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810036537.1/2.html,轉載請聲明來源鉆瓜專利網。





