[發(fā)明專利]一種融合評論文本與時序效應的協同過濾推薦方法和裝置有效
| 申請?zhí)枺?/td> | 202010099934.0 | 申請日: | 2020-02-18 |
| 公開(公告)號: | CN111339439B | 公開(公告)日: | 2023-05-09 |
| 發(fā)明(設計)人: | 程夢琪;謝勝利;楊曉星 | 申請(專利權)人: | 廣東工業(yè)大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06Q30/0601 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 沈闖 |
| 地址: | 510060 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 評論 文本 時序 效應 協同 過濾 推薦 方法 裝置 | ||
本申請公開了一種融合評論文本與時序效應的協同過濾推薦方法和裝置,通過獲取的目標數據中的評論文本計算情感值,進而計算物品在預置主題上的評分,在基于各評論文本的評論時間對評分進行篩選后,計算物品相似度;根據物品相似度對物品進行聚類,計算物品的虛擬評分,并將虛擬評分填充到目標數據中的用戶?物品評分矩陣R,得到用戶?物品評分矩陣R';基于戶?物品評分矩陣R'計算目標用戶未評論過的物品的預測評分;對預測評分進行降序排序,將排在前預置數量位的物品推薦給所述目標用戶,解決了現有的協同過濾推薦算法受到數據稀疏性和動態(tài)性的限制,以及只依靠于評分分數進行推薦,使得推薦準確率不高的技術問題。
技術領域
本申請涉及個性化推薦技術領域,尤其涉及一種融合評論文本與時序效應的協同過濾推薦方法和裝置。
背景技術
隨著信息技術的興起和信息時代的發(fā)展,獲取信息的障礙已經從信息資源匱乏變成了信息資源過載和有效信息獲取成本過高。為了幫助人們方便的獲取到想要的資源信息,現有的推薦系統能夠根據用戶的歷史記錄從海量的互聯網數據中搜索出匹配用戶興趣的信息內容。然而想要準確地為用戶進行推薦,需要以下幾個前提:一是用戶清楚知道自己想要什么內容,二是推薦系統清楚知道內容的屬性性質。但是用戶不總是準確了解自己的需求,以及層出不窮、種類繁多的內容導致用戶難以對目標內容有清晰的認識。
協同過濾是推薦系統中最重要的推薦方法之一,該方法使用他人的評分分數或文本信息為用戶提供預測或者推薦的個性化服務。協同過濾的思想基于一種假設是如果兩用戶在過去對同樣的項目具有相似的評分,那么這兩個用戶在未來對相同項目也應該具有相似的偏好;另一種假設是用戶對類似項目應該具有相似的評價或評分。
協同過濾通常可以大致分為兩大類:基于內存的協同過濾和基于模型的協同過濾。基于內存的協同過濾方法又可以分為基于用戶的協同過濾和基于項目的協同過濾。基于用戶的協同過濾需要將用戶對項目的評分轉換為基于用戶的評分向量,每個用戶對項目的評分抽取為一個評分向量,然后采用余弦相似度、皮爾遜相關系數或杰拉德系數等相似度度量方法計算用戶評分向量的相似度,從所有評價過目標項目的用戶中選取跟目標用戶的評分向量最相似的若干個用戶作為鄰居,并根據鄰居相似度,來對鄰居評分加權,從而預測目標用戶對目標項目的可能評分;基于項目的協同過濾需要將用戶對項目的評分矩陣轉換為基于項目的評分向量,每個項目被所有用戶賦予的評分被抽取為一個評分向量,然后計算項目間的相似度,推薦算法找出與目標項目最相似的鄰居項目,利用鄰居項目和目標項目的相似度以及用戶對鄰居項目的評分進行加權累加來預測用戶對項目的評分。
而基于模型的協同過濾方法將推薦問題建模為數據挖掘和機器學習中的模型,通過用戶和項目的評分矩陣訓練模型中的參數,然后根據已知參數的模型直接計算用戶的預測評分,常見的用于協同過濾推薦算法的模型有貝葉斯網絡、神經網絡、奇異值分解和矩陣分解等。
協同過濾推薦算法雖然具有簡單、通用性強的優(yōu)勢,但是也存在著一些缺陷。要保證較好的推薦效果的前提條件是推薦系統中必須具有足夠的評分數據,由于數據稀疏性和動態(tài)性的問題,使得推薦效果受到限制;另外,由于用戶除了給予評分外,也會使用評論文本的方式傳遞個人評論,不同用戶即使給予相同的分數,仍然也會有不同的原因,因此,只依靠于評分分數進行推薦存在推薦準確率不高的問題。
發(fā)明內容
本申請?zhí)峁┝艘环N融合評論文本與時序效應的協同過濾推薦方法和裝置,用于解決現有的協同過濾推薦算法受到數據稀疏性和動態(tài)性的限制,以及只依靠于評分分數進行推薦,使得推薦準確率不高的技術問題。
有鑒于此,本申請第一方面提供了一種融合評論文本與時序效應的協同過濾推薦方法,包括:
獲取目標數據,所述目標數據包括用戶集合、物品集合、用戶-物品評分矩陣R和評論文本集合,所述用戶集合中的用戶包括目標用戶和非目標用戶;
基于所述評論文本集合得到的物品特征集合計算情感值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東工業(yè)大學,未經廣東工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010099934.0/2.html,轉載請聲明來源鉆瓜專利網。





