[發明專利]一種基于集成學習的個性化推薦方法有效
| 申請號: | 202110629501.6 | 申請日: | 2021-06-07 |
| 公開(公告)號: | CN113326433B | 公開(公告)日: | 2023-10-10 |
| 發明(設計)人: | 段勇;楊堃 | 申請(專利權)人: | 沈陽工業大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F18/243;G06F18/25;G06F18/27;G06F18/2415;G06N20/10;G06N20/20 |
| 代理公司: | 沈陽智龍專利事務所(普通合伙) 21115 | 代理人: | 宋鐵軍 |
| 地址: | 110870 遼寧省沈陽*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 集成 學習 個性化 推薦 方法 | ||
1.一種基于集成學習的個性化推薦方法,其特征在于,所述方法包括:
步驟1:分析個性化推薦數據的維度屬性,將個性化推薦數據分為“用戶-物品-評分”數據;將相關聯的“用戶-物品-評分”維度進行數據關聯;
步驟2:處理完成后分析“用戶-物品-評分”每個維度屬性的數據類型,并將其數據類型轉化為集成學習所要求的數據類型;
步驟3:根據“用戶-物品-評分”維度屬性中“評分”屬性,進行特征屬性生成;
步驟4:將所得到的所有數據進行標準化處理,計算方式如下:
其中,vv表示數據的原始數值,v′表示標準化處理后的數值,min表示vv所在列的最小值,max表示vv所在列的最大值;
步驟5:設原始空間中“用戶-物品-評分”數據集A有m個樣本點x1,x2,...,xm,樣本點xi是一個l維向量,i取值為從1到m的整數,這m個樣本按照列構成的矩陣為X;利用流行學習局部保留投影算法對該數據集A進行降維處理,降維后的數據集B為由樣本點y1,y2,...,ym構成,樣本點yi是一個n維向量,這m個樣本按照列構成的矩陣為Y,其中l>n;
步驟6:將降維后的數據集B按照8:2的比例劃分為訓練集Train和測試集Test,其中訓練集Train對應的數據矩陣為Y′;
步驟7:采用集成學習梯度提升決策樹方法建立個性化推薦模型;
步驟8:采用貝葉斯方法優化梯度提升決策樹模型參數;
步驟9:選擇經過貝葉斯優化得到的最優超參組合重新訓練梯度提升決策樹個性化推薦模型;
步驟10:根據最終得到的個性化推薦模型在測試集上的預測結果進行Top N推薦以及效果驗證。
2.根據權利要求1所述的一種基于集成學習的個性化推薦方法,其特征在于:在步驟3中,通過統計各個用戶對物品評分次數,公式如下:
b代表“用戶-物品-評分”數據集A中的第b個用戶,數據集A中共有d個用戶,R(b)為用戶b針對各個物品的評分,CountRating指“每個用戶評論物品次數總和”。
3.根據權利要求1所述的一種基于集成學習的個性化推薦方法,其特征在于:所述步驟5中,具體包括以下步驟:
步驟5.1:構建圖,計算“用戶-物品-評分”數據集A中樣本xi與樣本xj之外的所有的樣本的歐氏距離,公式如下:
其中,ε為人工設定的閾值,取樣本的均值,m為數據集中樣本的總個數,如果歐氏距離小于值ε則認為兩個樣本很接近,則在圖的節點i和節點j之建立一邊;
步驟5.2:確定權重,如果節點i和節點j相連,那么它們之間的邊的權重通過核熱函數計算公式如下:
ωij表示節點i個節點j之間的權重,xi和xj為“用戶-物品-評分”數據集A中的樣本,t是人為設置的大于0的實數;
步驟5.3:計算投影矩陣,計算投影矩陣的公式如下:
XLXTa=λXDXTa (5)
假設公式中的解為a0,a1,...,al-1,且它們對應的特征值λ從小到大排序,投影變換矩陣為C=(a0,a1,...,al-1),則降維后的樣本點yi=CTxi;
其中,X為步驟5提到的矩陣X,鄰接矩陣W由步驟二中的權重ωij構成;對角矩陣D的主對角線是步驟一中構建的圖的每個頂點帶權重的度,其中節點i的帶權重的度為與該節點相關的所有邊的權重之和,即鄰接矩陣W的每一行元素之和;普拉斯矩陣L則定義為L=D-W。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于沈陽工業大學,未經沈陽工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110629501.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:可自適應關斷上橋臂的同步調壓器系統及控制方法
- 下一篇:一種夾具式鋼筋錨固板





