[發明專利]基于相似性傳遞的協同過濾方法及系統有效
| 申請號: | 201310221379.4 | 申請日: | 2013-06-05 |
| 公開(公告)號: | CN103309967B | 公開(公告)日: | 2016-10-26 |
| 發明(設計)人: | 謝峰;陳震;許宏峰;曹軍威 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩 |
| 地址: | 100084 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 相似性 傳遞 協同 過濾 方法 系統 | ||
1.一種基于相似性傳遞的協同過濾方法,其特征在于,該方法包含以下步驟:
1)遍歷所有用戶的歷史行為數據,獲得描述所有用戶對物品過往喜好的關系向量;
2)應用關系向量,并設定閾值,根據閾值臨界原則計算各個用戶間的相似性并得到大小為用戶數×用戶數的初始相似性矩陣;
3)根據初始相似性矩陣中不為零的相似性值,利用相似性傳遞計算方法計算前述矩陣中相似性值為零的目標用戶與其他用戶間相似性,最終得到更密集的相似性矩陣;
4)根據與目標用戶相似程度最高的其他用戶對目標用戶未選擇物品的喜好程度得到當前用戶對未選擇物品的喜好程度的估計值;
5)對每個用戶的預測結果進行篩選,產生對每個用戶的推薦物品。
2.根據權利要求1所述基于相似性傳遞的協同過濾方法,其特征在于,所述步驟1)中所有用戶對物品過往喜好的關系向量為用戶對物品的購買、瀏覽、點擊、下載、預定、收藏數據的關系向量。
3.根據權利要求1所述基于相似性傳遞的協同過濾方法,其特征在于,所述步驟2)中根據閾值臨界原則計算各個用戶間的相似性的方法為:用戶與用戶之間共同喜歡的物品數目小于該閾值,不直接計算他們之間的相似性;用戶與用戶之間共同喜歡的物品數目大于或等于該閾值,直接利用用戶喜好向量間夾角余弦計算他們之間的相似性。
4.根據權利要求3所述基于相似性傳遞的協同過濾方法,其特征在于所述閾值為6。
5.根據權利要求1所述基于相似性傳遞的協同過濾方法,其特征在于,所述步驟3)中相似性傳遞的計算方法為:兩用戶之間共同喜歡的物品數目小于設定閾值,但這兩用戶同時與其他一些用戶之間共同喜歡的物品數目大于或等于設定閾值,那么這兩用戶是可以直接和其他一些用戶-橋梁用戶計算相似性。
6.根據權利要求1所述基于相似性傳遞的協同過濾方法,其特征在于,所述步驟4)中得到估計值的方法為對目標用戶未選擇的物品,在已建立的相似性矩陣中選取與目標用戶相似度大的用戶群,在該用戶群中挑選出選擇過的物品組成該用戶群的集合,將該用戶群與目標用戶間的相似程度作為目標用戶對該物品的喜好程度的估計值的方法。
7.根據權利要求6所述基于相似性傳遞的協同過濾方法,其特征在于,所述的目標用戶相似度大的用戶群中的用戶個數對預測精度和響應速度有影響。
8.根據權利要求7所述基于相似性傳遞的協同過濾方法,其特征在于,所述的影響為:選取的用戶個數多,計算慢但準確度高;選取的用戶個數少,計算快但準確性低。
9.一種基于相似性傳遞的協同過濾系統,其特征在于,該系統包含以下模塊:
數據關系向量模塊,用于遍歷所有用戶的歷史行為數據,獲得描述所有用戶對物品過往喜好的關系向量;
閾值判定模塊,用于應用關系向量,并設定閾值,根據閾值臨界原則計算各個用戶間的相似性并得到大小為用戶數×用戶數的初始相似性矩陣;
相似性傳遞計算模塊,用于根據初始相似性矩陣中不為零的相似性值,利用相似性傳遞計算方法計算前述矩陣中相似性值為零的目標用戶與其他用戶間相似性,最終得到更密集的相似性矩陣;
喜好程度估值模塊,用于根據與目標用戶相似程度最高的其他用戶對目標用戶未選擇物品的喜好程度得到當前用戶對未選擇物品的喜好程度的估計值;
預測篩選模塊,用于對每個用戶的預測結果進行篩選,產生對每個用戶的推薦物品。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310221379.4/1.html,轉載請聲明來源鉆瓜專利網。





