[發明專利]基于相似性傳播與流行度降維的混合推薦方法有效
| 申請號: | 201410452338.0 | 申請日: | 2014-09-05 |
| 公開(公告)號: | CN104182543B | 公開(公告)日: | 2017-06-06 |
| 發明(設計)人: | 趙海燕;郭娣 | 申請(專利權)人: | 上海理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海申匯專利代理有限公司31001 | 代理人: | 吳寶根 |
| 地址: | 200093 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 相似性 傳播 流行 度降維 混合 推薦 方法 | ||
技術領域
本發明涉及一種數據挖掘的個性化推薦技術,特別涉及一種基于相似性傳播與流行度降維的混合推薦方法。
背景技術
在個性化推薦算法的研究中,社會化標簽作為一種重要的顯示評分技術,不僅可以描述資源而且可以表征用戶的偏好,因此結合社會化標簽的推薦正成為互聯網推薦引擎中的研究熱點。然而大多數推薦算法的研究都面臨著數據稀疏性的問題。目前解決稀疏性問題的研究方法主要分為采用各種技術對矩陣進行填充和數據降維兩大類。
在對矩陣進行填充方面,最簡單的矩陣填充方法是將用戶未評分項目設為一個固定的缺省值,可以是用戶對其他項目的平均評分值或其他用戶對該項目的平均評分值,但該方法對用戶的推薦質量有待提高。另一種矩陣填充方法是采用預測填充方法,如采用BP神經網絡對項目進行預測,但網絡模型的學習速度較慢,算法效率較低,而且對用戶的推薦質量有待提高;采用樸素貝葉斯方法估算項目所屬的分類,利用此類中其他項目的評分來預測未評分項目的評分,從而減小數據稀疏性。另外有一些研究利用相似性傳播的方法,假定用戶的品味具有傳遞性,并利用此傳遞性對矩陣進行填充,這些方法對用戶的推薦質量有明顯的提升。但是,目前基于相似性傳播來填充矩陣的方法只考慮了兩維空間:用戶和資源。將Tag這一維空間考慮進來解決數據稀疏性問題更有意義。
在數據降維方面,采用奇異值分解技術可以減少向量空間的維數。有些研究將主成分分析(PCA)用在推薦中,利用主成分分析對評分數據預處理,原始評分數據被投射到最相關的主特征向量上。還可以采用聚類的方法,利用用戶間相似性對用戶聚類,將離目標用戶最近的一個類的所有用戶作為其鄰居,從而對數據進行降維度。這些方法的優點是能有效提高推薦系統的預測準確率,不足之處是算法的復雜度比較高。
發明內容
本發明是針對推薦算法中數據存在稀疏性的問題,提出了一種基于相似性傳播與流行度降維的混合推薦方法,提供了對個性化推薦過程中數據稀疏性問題的一種解決方法,該方法對推薦結果精度高,具有準確性高、可靠性高的優點。
本發明的技術方案為:一種基于相似性傳播與流行度降維的混合推薦方法,具體包括如下步驟:
1)數據建模:利用原始用戶、資源及Tag的三元數據構建二元數據模型,即構建稀疏矩陣UT矩陣、UR矩陣及RT矩陣,
其中:U={u1,u2,...,um}表示m個用戶集合,R={r1,r2,...,rn}表示n個資源集合,T={t1,t2,...,tp}表示p個Tag集合;
2)相似性計算:通過步驟1)所得二元數據模型,采用pearson相關系數計算用戶之間、資源之間及Tag之間的相似性值,計算相似矩陣UU矩陣、RR矩陣及TT矩陣;
3)相似性傳播:利用步驟2)所得相似矩陣對步驟1)稀疏矩陣進行迭代以傳播和擴展它們的相似鄰居,每迭代一次,需要對稀疏矩陣進行一次標準化,從而填充為0的元素;
4)流行度降維:通過改進PageRank算法,利用資源、用戶和Tag三者之間的互增強關系進行迭代,得到最終Tag的流行度值,刪除流行度低于閾值的Tag,從而對矩陣降維;
5)混合推薦:使用平衡因子α,綜合基于內容的推薦和協同過濾推薦算法,為用戶生成推薦。
所述步驟1)三元數據是關于用戶、資源及Tag之間關系的數據,每條記錄為一個三元關系,形式為:用戶ID,資源ID,Tag1,Tag2,...,Tagq,其中q≤p,表示用戶對一個資源標注了一組標簽,稀疏矩陣UT矩陣、UR矩陣及RT矩陣如下表示:
uti,j表示用戶ui使用Tag tj標注的資源數;
rti,j表示資源ri被Tag tj標注的用戶數。
所述步驟2)中相似矩陣UU矩陣、RR矩陣及TT矩陣計算:
用戶間的相似矩陣UU的元素uui,j表示用戶ui與用戶uj的相似性,該相似性分別通過UR矩陣和UT矩陣來計算,然后取兩個相似性的均值,公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海理工大學,未經上海理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410452338.0/2.html,轉載請聲明來源鉆瓜專利網。





