[發明專利]基于奇異值分解算法的聚類協同過濾推薦系統有效
| 申請號: | 201310016381.8 | 申請日: | 2013-01-16 |
| 公開(公告)號: | CN103093376B | 公開(公告)日: | 2020-02-14 |
| 發明(設計)人: | 李小勇;巴麒龍 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06Q30/06;G06K9/62 |
| 代理公司: | 11372 北京聿宏知識產權代理有限公司 | 代理人: | 吳大建 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 奇異 分解 算法 協同 過濾 推薦 系統 | ||
本發明提出一種基于奇異值分解算法的聚類協同過濾推薦技術,通過利用本發明中提出的用戶屬性特征值將用戶先分類,降低用戶?商品評分矩陣的維度;然后將在圖像處理與自然語言處理中常用的奇異值分解(SVD)算法加以改進,并利用到推薦系統當中去。將用戶所在聚類中的評分矩陣分解后聚合,從而填充矩陣中未評分項的預測得分,并且利用該填充矩陣計算同一聚類中用戶間的相似度,最后利用在推薦系統中應用廣泛的基于用戶協同過濾技術計算最終商品的預測評分,并做出最終的推薦。該發明可以提高系統推薦效率,解決推薦系統數據稀疏性等問題,同時可以提高系統的推薦準確率。
技術領域
本發明屬于電子商務推薦系統領域,具體涉及集成多種技術,如數據挖掘技術、機器學習技術、自然語言處理技術等,實現將聚類與奇異值分解(SVD)技術結合的一種推薦方法。
背景技術
近年來,隨著互聯網技術的迅猛發展,電子商務已經成為一種新的時尚,在近些年形成飛速增長的趨勢。電子商務,它是IT技術與商務行為結合所產生的一種新的商務交易過程,是21世紀市場經濟商務運行的主要模式,通過電子商務平臺,人們可以享受足不出戶選購商品的快捷與方便。隨著電子商務平臺交易規模的擴大,人們通過瀏覽器無法在短時間內快速的瀏覽所有的商品,并且也缺少現實交易中售貨員對顧客進行的一些產品介紹,因此人們面臨了電子商務時代特有的“信息超載”問題。
針對于“信息超載”問題,推薦系統在20世紀90年代應運而生,如Google的新聞推薦、Email過濾等等。目前幾乎所有的電子商務系統,都將推薦技術作為網上銷售的必然組成部分,如Amazon,Netflix,豆瓣,淘寶等等。推薦系統的主要作用有:(1)誘導新客戶,也就是向一個潛在的新客戶推薦產品,將瀏覽者變成購買者;(2)鼓勵老客戶,也就是在客戶已買的東西的基礎上推薦更多產品,提高網絡的交叉銷售能力;(3)提升顧客對網站的忠誠度。準確率,可擴展性,實時性是評價一個推薦系統好壞與否的重要因素。然而隨著人們越來越熱衷于網上購物,目前的推薦系統面臨著“信息超載”的問題,由于系統中的數據量過于龐大,導致目前的一些推薦技術不能實時快速有效的做出推薦;與此同時,一個一直困擾著推薦系統的問題就是局部數據稀疏性問題,盡管一個系統中的數據量極大,但是對于每個單一用戶,其瀏覽與購買的商品所占系統中總的商品數的比例實在太小,這就導致計算用戶相似度的問題上無法做到準確有效,這樣大大的影響了推薦的結果。因此如何解決上述兩個問題成為了推薦系統亟待解決的主要問題。
本專利采用基于奇異值分解算法的聚類協同過濾推薦技術,通過將用戶先分類,降低用戶-商品評分矩陣的維度,然后利用奇異值分解(SVD)算法,在用戶所在聚類中將評分矩陣分解后聚合,從而填充矩陣中的未評分項的預測得分,最后通過協同過濾技術做出最終的推薦。該技術可以提高系統推薦效率,解決推薦系統數據稀疏性等問題并且可以提高系統的推薦準確率。
發明內容
本發明提出通過利用聚類算法與奇異值分解(SVD)算法相結合的技術來改善推薦系統的推薦效率與準確率。導致傳統推薦系統推薦效率較低的主要原因是由于推薦系統中存在的用戶數與商品數量過多,而傳統的推薦系統必須通過計算每兩個用戶或商品之間的相似性,來找出與指定用戶或者商品相似度最高的k個最近鄰來做出推薦,由于計算量過于龐大,而且不是每一次的計算都是必要的,因此導致推薦效率降低;導致傳統推薦系統推薦準確率較低的主要原因是由于盡管一個系統中的數據量很龐大,但是對于每個單一用戶,其瀏覽與購買的商品所占系統中總的商品數的比例實在太小,這種局部數據稀疏性就導致計算用戶相似度的問題上無法做到準確有效,這樣大大的影響了推薦的準確率。本發明通過聚類算法解決推薦效率問題,而利用SVD算法解決局部數據稀疏性問題,從而改善推薦結果。
本發明技術方案分為如下幾個基本的執行步驟:
步驟一:利用用戶特征值,包括性別、年齡、職業,將系統中已有用戶分到n個聚類中去,并且計算出每個聚類的聚類中心值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310016381.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:實名掛號就診系統
- 下一篇:單兵式遠距離光電取證裝置





