[發明專利]基于相似性傳播與流行度降維的混合推薦方法有效
| 申請號: | 201410452338.0 | 申請日: | 2014-09-05 |
| 公開(公告)號: | CN104182543B | 公開(公告)日: | 2017-06-06 |
| 發明(設計)人: | 趙海燕;郭娣 | 申請(專利權)人: | 上海理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海申匯專利代理有限公司31001 | 代理人: | 吳寶根 |
| 地址: | 200093 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 相似性 傳播 流行 度降維 混合 推薦 方法 | ||
1.一種基于相似性傳播與流行度降維的混合推薦方法,其特征在于,具體包括如下步驟:
1)數據建模:利用原始用戶、資源及Tag的三元數據構建二元數據模型,即構建稀疏矩陣UT矩陣、UR矩陣及RT矩陣,
其中:U={u1,u2,…,um}表示m個用戶集合,R={r1,r2,…,rn}表示n個資源集合,T={t1,t2,…,tp}表示p個Tag集合;
2)相似性計算:通過步驟1)所得二元數據模型,采用Pearson相關系數計算用戶之間、資源之間及Tag之間的相似性值,計算相似矩陣UU矩陣、RR矩陣及TT矩陣;
3)相似性傳播:利用步驟2)所得相似矩陣對步驟1)稀疏矩陣進行迭代以傳播和擴展它們的相似鄰居,每迭代一次,需要對稀疏矩陣進行一次標準化,從而填充為0的元素;
4)流行度降維:通過改進PageRank算法,利用資源、用戶和Tag三者之間的互增強關系進行迭代,得到最終Tag的流行度值,刪除流行度低于閾值的Tag,從而對矩陣降維;
5)混合推薦:使用平衡因子α,綜合基于內容的推薦和協同過濾推薦算法,為用戶生成推薦。
2.根據權利要求1所述基于相似性傳播與流行度降維的混合推薦方法,其特征在于,所述步驟1)三元數據是關于用戶、資源及Tag之間關系的數據,每條記錄為一個三元關系,形式為:用戶ID,資源ID,Tag1,Tag2,…,Tagq,其中q≤p,表示用戶對一個資源標注了一組標簽,稀疏矩陣UT矩陣、UR矩陣及RT矩陣如下表示:
uti,j表示用戶ui使用Tag tj標注的資源數;
rti,j表示資源ri被Tag tj標注的用戶數。
3.根據權利要求1所述基于相似性傳播與流行度降維的混合推薦方法,其特征在于,所述步驟2)中相似矩陣UU矩陣、RR矩陣及TT矩陣計算:
用戶間的相似矩陣UU的元素uui,j表示用戶ui與用戶uj的相似性,該相似性分別通過UR矩陣和UT矩陣來計算,然后取兩個相似性的均值,公式為:
其中,simui,uj(UR)是根據矩陣UR得到的用戶ui和用戶uj的相似性,simui,uj(UT)是根據UT矩陣得到的用戶ui和用戶uj的相似性;
資源間相似性矩陣RR的元素rri,j表示資源ri與rj的相似性,該相似性分別通過UR矩陣和RT矩陣來計算,然后取兩個相似性的均值,公式為:
其中,是根據矩陣UR得到的資源ri和資源rj的相似性, 是根據RT矩陣得到的資源ri和資源rj的相似性;
Tag間相似性矩陣TT的元素tti,j表示Tag ti與tj相似性,該相似性分別通過UT矩陣和RT矩陣來計算,然后取兩個相似性的均值,公式為:
其中,表示利用矩陣UT得到的Tag ti與tj相似性,表示利用矩陣RT得到的Tag ti與tj相似性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海理工大學,未經上海理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410452338.0/1.html,轉載請聲明來源鉆瓜專利網。





