[發明專利]一種基于三支決策用戶聚類的協同過濾電影推薦方法有效
| 申請號: | 202110238299.4 | 申請日: | 2021-03-04 |
| 公開(公告)號: | CN113032687B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 胡軍;康凱 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F16/9535;G06F18/23213 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 陳棟梁 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 決策 用戶 協同 過濾 電影 推薦 方法 | ||
本發明請求保護一種基于三支決策用戶聚類的協同過濾電影推薦方法,通過將用戶劃分為核心用戶和邊界用戶兩類,在核心用戶集合上采用常規的聚類規則得到初始聚類結果的核心域,隨后對邊界用戶采用三支決策劃分規劃分到初始聚類結果的核心域或邊界域,從而實現了一種針對推薦系統中稀疏數據的用戶軟聚類算法。該算法在聚類時根據用戶的潛在分布和實際評分數量將信息不充足的用戶劃分出來,避免了在核心用戶聚類時造成干擾。從而提升了推薦預測精度,與采用單一聚類規則的方法相比聚類精度得以提高,而且不需要對用戶進行重復多次的聚類。
技術領域
本發明屬于推薦領域,尤其涉及電影推薦技術。
背景技術
協同過濾推薦系統(collaborative?filtering?recommender?systems)是人們從互聯網獲取信息的重要渠道,傳統協同過濾推薦系統由于其原理簡單、容易實現且推薦效果良好在不同領域都取得了很好的推薦效果,例如電子商務、在線音樂和電影等。然而搜索近鄰時需要遍歷整個用戶空間,導致算法效率隨著數據規模增長而下降,不能滿足可擴展性要求。文獻[1]中首先提出了基于用戶聚類的協同過濾算法(user-based?clustering?CF,UCCF),通過將聚類技術應用到用戶近鄰搜索環節可以有效緩解可擴展性問題,但代價是預測評分的精度有所下降。
在基于聚類的協同過濾算法提出之后,陸續有學者對聚類算法在推薦系統中的應用進行了拓展。其主要目標是在保持聚類推薦算法的可擴展性優勢的同時提高推薦精度,采取的方法分別有數據填充、改進相似度計算方法和改進聚類結果等。文獻[2]從數據稀疏性角度提出了基于用戶聚類和物品聚類的聯合推薦算法,該算法首先根據用戶聚類結果對評分矩陣中的空白項進行填充,然后在填充后的評分矩陣上使用基于物品聚類的協同過濾算法進行預測推薦,實驗證明該算法與不填充評分矩陣的協同過濾算法相比,預測評分精度得到了提高。文獻[3]提出了一種使用加權平均的相似度計算方法,該方法在用戶聚類后將更新用戶到距離用戶最近的簇中用戶的相似度,最后使用更新后的相似度進行預測推薦,實驗證明在選取合適的更新權重時,預測精度高于僅使用皮爾遜相關系數的協同過濾推薦算法。文獻[4]認為多次聚類比單次聚類相比能得到多個不同的聚類簇,選擇和目標用戶最相似的簇作為近鄰搜索空間能提高近鄰質量,實驗結果表明該算法可以提高推薦精度和在線推薦效率,但離線的聚類環節會消耗更多時間。文獻[5]將模糊聚類與協同過濾結合,對目標用戶在所屬的所有簇中分別進行預測評分,將聚合后的評分作為最終的預測評分,并在MovieLens數據集驗證表明優于使用K-Means聚類的協同過濾推薦算法。
然而,我們發現現有的研究方法中都采用了單一的聚類方法,即對所有樣本采用一種規則一次性完成聚類,沒有考慮信息不充足的樣本和離散樣本會對聚類結果產生干擾。
現有研究[1,4,5]表明聚類環節對協同過濾算法的用戶近鄰搜索結果有較大影響,因此通過改善聚類效果進而實現最終的提高推薦精度目標是一種可行的方案。
推薦系統中的用戶物品評分數據的稀疏度很高,傳統的樣本劃分規則往往針對稠密乃至完整的樣本;同時聚類算法本身就會受到距離聚類中心較遠的離散點干擾,同時有些用戶的評分數據過少、信息不充足,直接在原始數據上進行聚類得到的分類結果往往也不夠準確。為了解決現有推薦系統聚類環節的方案缺點,本文在聚類時引入三支決策思想[6],綜合考慮了用戶評分數量和用戶總體的分布特征,提出了可操作的劃分規則將用戶分為核心用戶(cores)和邊界用戶(fringes);隨后對核心用戶進行使用K-means聚類;在邊界用戶集合上使用三支決策(three-way?decisions)劃分規則分配到已有簇的核心域或邊界域,將并允許部分用戶同時屬于多個簇的邊界域。從而使得推薦系統在近鄰搜索環節的鄰居質量得到提高,不再額外的丟失潛在鄰居,進而提供推薦的預測評分精度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110238299.4/2.html,轉載請聲明來源鉆瓜專利網。





