[發明專利]一種基于項目的混合顯性隱性反饋的協同過濾推薦的方法有效
| 申請號: | 201310738030.8 | 申請日: | 2013-12-27 |
| 公開(公告)號: | CN103745100B | 公開(公告)日: | 2017-01-04 |
| 發明(設計)人: | 尹建偉;張宗禹;李瑩;鄧水光;吳朝暉;吳建 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 杭州天勤知識產權代理有限公司33224 | 代理人: | 胡紅娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 項目 混合 顯性 隱性 反饋 協同 過濾 推薦 方法 | ||
技術領域
本發明涉及個性化推薦技術領域,具體涉及一種基于項目的混合顯性隱性反饋的協同過濾推薦算法。
背景技術
推薦系統是為解決信息過載問題而提出的一種智能代理系統,能從大量信息中向用戶自動推薦出符合其興趣偏好或需求的資源。隨著互聯網的普及和飛速發展,推薦系統已經被廣泛應用于各種領域,尤其在電子商務領域,推薦系統得到了越來越多的研究和應用。目前,幾乎所有的大型電子商務網站都不同程度的使用了各種形式的推薦系統,比如Amazon、eBay和當當網上書店等,在現有使用的推薦系統中,協同過濾技術獲得了較大的成功。
協同過濾算法主要有基于用戶的協同過濾算法和基于項目的協同過濾算法,這兩種算法的輸入都是用戶對項目的評分矩陣,用戶對項目的評分可以顯式獲得,例如:通過用戶對項目進行評分操作;也可以隱式獲得,例如:通過用戶對項目的捜索、瀏覽、購買等行為構造評分函數計算得到。矩陣的每一行形成的向量表示該行對應用戶的對各個項目的評分向量。
基于用戶的協同過濾算法的基本原理是利用用戶對項目評分的相似性來互相推薦用戶可能感興趣的項目。例如:對當前用戶U,推薦系統通過其評分記錄及特定相似度函數,計算出與其評分行為最相近的k個用戶作為用戶U的最近鄰居集,統計用戶U的近鄰用戶評分過而用戶U未評分的項目生成候選推薦集,然后計算用戶U對候選推薦集中每個項目i的預測評分,取其中預測評分最高的N個項目作為用戶U的Top-N推薦集。
基于項目的協同過濾算法則比較項目之間的相似性,根據當前用戶已評分的項目集合推薦未評分的項目。由于項目之間的相似性比用戶相似性穩定,因此可以離線進行計算存儲并定期更新,所以基于項目的協同過濾算法相對于基于用戶的協同過濾算法,推薦精度高,實時性好,對基于項目的協同過濾算法進行優化,能夠使推薦準確度更高、效果更佳、更符合客戶需求。
基于項目的協同推薦的基本處理流程,分為線下相似度計算和線上推薦兩個部分。線下相似度計算流程用于計算并保存項目間的相似度包括以下步驟:步驟1:獲取每一用戶對每個項目的評分矩陣;步驟2:計算各個項目間相似度,相似度函數可采用余弦相似度、皮爾森相似度(Pearson)等;步驟3:存儲各個不同項目間相似度。
在預先計算存儲了各個不同項目間相似度的基礎上,線上推薦流程如下:步驟1:獲取待推薦的用戶標識(ID),即目標用戶標識(ID);步驟2:獲取目標用戶ID對應的目標用戶已經評分的項目集合;步驟3:根據預先存儲的項目相似度數據,獲取與目標用戶已經評分的項目集合中各項目相似度高的項目,形成該目標用戶的待推薦項目集;步驟4:根據項目間相似度,進一步計算目標用戶對待推薦項目集中每個項目的預測評分,例如:根據如下公式計算預測評分,其中,PU,i表示目標用戶U對項目i的預測評分,sim(i,j)表示項目i和項目j之間的相似度,RU,j表示用戶u對項目j的實際評分;步驟5:根據預測評分結果取評分最高的前N項作為對目標用戶的推薦結果。
在基于項目的協同過濾算法流程中,項目間的相似度對最終的推薦結果有著至關重要的影響。在傳統的基于項目的協同過濾推薦算法中,基于顯性評分進行預測評分的項目間的相似度有余弦相似度,Pearson相似度,修正余弦相似度三種傳統計算方式,人們通常選擇其中最常用的Pearson相似度和修正余弦相似度中的一種作為標準進行計算,但是卻忽略了他們不同的側重點完全可以共同為最終的相似度做出貢獻。同時,基于顯性評分的相似度計算和基于隱形反饋的相似度計算通常作為兩種不同的推薦方式使用,其實二者相似度計算中的要素是相互互補、相輔相成的,可以融合成一種更加合理的相似度。
發明內容
本發明提供了一種基于項目的混合顯性隱性反饋的協同過濾推薦算法,該算法在原有的基于項目的協同過濾推薦算法的基礎上,對項目間相似度計算進行優化,可以有效地提高預測推薦的準確度。
一種基于項目的混合顯性隱性反饋的協同過濾推薦算法,包括以下步驟:
(1)服務器通過跟蹤用戶的訪問,獲得用戶對各個項目的興趣信息,并根據設定的評分原則,利用所獲得的興趣信息建立各用戶對所有項目的評分矩陣;
(2)根據所述評分矩陣計算每個用戶的平均評分、每個項目的評分用戶數、每個項目的平均得分;
(3)根據所述評分矩陣計算共同評價用戶數矩陣,所述共同評價用戶數矩陣用于記錄對任意兩個項目都有評分的共同用戶數;
(4)計算任意兩個項目之間的Pearson相似度和修正余弦相似度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310738030.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:生理特征的測量
- 下一篇:一種電子式電能表可靠性分析方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





