[發明專利]基于隨機森林修正的大數據下改進協同過濾推薦方法有效
| 申請號: | 201810808002.1 | 申請日: | 2018-07-22 |
| 公開(公告)號: | CN108920709B | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 劉靜;劉嘉豪 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06N3/00 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 程曉霞;王品華 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 隨機 森林 修正 數據 改進 協同 過濾 推薦 方法 | ||
本發明公開了一種基于隨機森林修正的大數據下改進協同過濾推薦方法,解決了在大數據下尚不能有效融入用戶活躍度、熱門物品、不同用戶打分習慣導致的較低的推薦準確性和多樣性的技術問題。過程包括:數據錄入及參數設定;建立當前用戶特征向量集合;構建隨機森林分類模型;計算用戶間相似度并尋找用戶k個最近鄰居;計算改進協同過濾法預測評分;得到初步推薦列表;用隨機森林分類模型對初步推薦列表分類;結合兩種方法進行修正得到當前用戶最終推薦列表;對每個用戶推薦,完成全體用戶推薦。本發明將傳統協同過濾法改進并結合隨機森林分類進行修正,最終獲得更為準確多樣的推薦結果,用于網上購物商場等電子商務領域。
技術領域
本發明屬于數據挖掘技術領域,主要涉及電子商務中個性化推薦,具體是一種基于隨機森林修正的大數據下改進協同過濾推薦方法,例如:商品推薦、音樂電影產品推薦等領域,可用于網上商城等電子商務領域。
背景技術
21世紀以來,人類進入“大數據”時代,各種電子商務網站迅速發展,網絡購物成為越來越多人購買商品的第一選擇。而面對海量的、越來越多種類的商品,推薦系統的研究與發展能夠很高效的挖掘用戶的喜好,進行潛在購買的推薦,解決信息過載的問題。同時,根據中國物聯網信息中心發布的《第41次中國互聯網發展狀況統計報告》顯示,截止2017年12月,我國網民規模達7.72億,1-11月,電子商務平臺收入2188億元,同比增長高達43.4%。由此可見,電子商務所帶來的經濟利益將越來越客觀。因此,在大數據下的高準確度推薦系統對于電子商務有著巨大的意義。
個性化推薦技術是人們在面對海量數據獲取有用信息時一種十分常用且高效的技術,其在電子商務領域中有著非常廣泛的應用,基于不同的被推薦的對象,例如對商品推薦、電影推薦,甚至房屋推薦都是以個性化推薦技術為基礎的。它可以發現用戶的潛在興趣及愛好,針對性的推薦物品,在學術和商業上都具有十分重要的意義。個性化推薦技術實質上是通過已有的用戶行為,挖掘用戶興趣愛好,并將其可能喜歡的物品推薦給用戶的一個過程。
協同過濾技術是最古老、研究最多的推薦算法,是一個利用集體智慧的典型算法。基于此,各種各樣的協同過濾算法被應用到個性化推薦領域并且也取得了越來越滿意的效果。在目前已有的研究中,協同過濾算法主要分為基于用戶的協同過濾算法和基于物品的協同過濾算法,這兩種算法從不同的角度對待問題,但其原理基本相同。這種方法自動化程度比較高,而且純粹的協同過濾方法不需要對用戶或者物品進行建模,不會利用和要求任何和物品相關的知識,因此這一算法被廣泛應用在電影、音樂等不易提取物品特征向量的領域。但同時它也存在很多缺點:如,數據稀疏推薦精確度會受到很大影響,用戶活躍度、熱門物品對推薦質量存在負面影響,造成精確度不高多樣性不強等,特別是在大數據的情況下,數據的稀疏度會極大地放大這些缺陷。
發明內容
本發明的目的在于克服上述缺陷,提出一種準確度更高、多樣性更強的基于隨機森林修正的大數據下改進協同過濾推薦方法。
本發明是一種基于隨機森林修正的大數據下改進協同過濾推薦方法,其特征在于,包括有如下步驟:
步驟1數據錄入及參數設定:根據電子商務網站的記錄,提取用戶對每個物品的評分,設定用戶為ua,其中a為當前待推薦用戶標記,協同過濾參數近鄰數k,k為常數,取值區間為[2,20],提取用戶評分信息,評分信息標記為ratings;
步驟2建立當前用戶特征向量集合:根據評分信息標記ratings,得到當前用戶ua的特征向量集合Ti={(xi,yi)},i∈N+,特征向量yi∈{0,1}是類標簽;是用戶m對物品i的評分,i為用戶評分過的物品標記,N+為物品總數量,m為用戶總數量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810808002.1/2.html,轉載請聲明來源鉆瓜專利網。





