[發明專利]基于譜聚類的低秩矩陣填充TOP-N推薦方法有效
| 申請號: | 201810713297.4 | 申請日: | 2018-07-03 |
| 公開(公告)號: | CN108920647B | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 吳宣夠;周慶梅;鄭嘯;樊旭 | 申請(專利權)人: | 安徽工業大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06K9/62 |
| 代理公司: | 南京九致知識產權代理事務所(普通合伙) 32307 | 代理人: | 嚴巧巧 |
| 地址: | 243032 安徽省馬*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 譜聚類 矩陣 填充 top 推薦 方法 | ||
1.一種基于譜聚類的低秩矩陣填充TOP-N推薦方法,其特征在于,包括以下步驟:
(1)建立訓練數據庫:包括用戶行為數據庫,即M個用戶對N個項目的評分信息;項目屬性數據庫,即N個項目所屬的|C|個類別信息,C={C1,C2,C3,…Ck},k為指定所屬類別下標;
(2)根據訓練數據庫信息生成評分信息的待恢復矩陣和項目類別信息矩陣;
(3)提取用戶評分信息的待恢復矩陣和項目類別信息矩陣之間的相關性,建立用戶評分矢量,并進行歸一化處理;
(4)根據歸一化評分矢量基于圖論的譜聚類算法對用戶進行相似用戶劃分,得到用戶分類集合;
(5)根據用戶分類集合得到用戶項目子矩陣,對用戶項目子矩陣進行填充預測,生成用戶-項目評分矩陣;
(6)對用戶-項目評分矩陣降序排序,選取前N個最高評分對應的項目生成TOP-N推薦列表;
定義步驟(2)中所述項目類別信息矩陣為IN×|C|,所述的評分信息的待恢復矩陣為PM×N,則:
Ijk∈IN×|C|(1-1)
其中,Ijk∈[0,1](1≤j≤N,1≤k≤|C|),當Ijk值為1時表示指定項目vj包含Ck類別信號,Ijk值為0時表示指定項目vj不包含Ck類別信號;
Pij∈PM×N(1-2)
其中,Pij(1≤i≤M,1≤j≤N)表示目標用戶ui對指定項目vj的偏好;
定義步驟3)中用戶評分矢量為則:
在評分矢量的基礎上進一步進行歸一化,得到歸一化后的評分矢量
其中,1≤k≤|C|,1≤i≤M,1≤j≤N;為用戶ui對所有屬于Ck類項目的評分總和,為用戶ui對Ck類項目的評分占該用戶對所有項目評分總和的評分比,且為[0,1]的實數;
所述步驟4)中基于圖論的譜聚類算法對用戶進行相似用戶劃分,將用戶看成無向權值連接圖G中的頂點V,各條邊上的權值集合E為用戶-類別評分矩陣中各用戶行之間的距離,具體步驟如下:
(1.1)根據式(1-4)中歸一化評分矢量將原始用戶項目矩陣映射成M×|C|維的用戶-類別評分矩陣;
(1.2)根據修正的余弦相似度公式計算用戶之間的相似性,得到一個M×M維的相似度矩陣,記為eij;
其中,1≤i≤M,1≤j≤M,且i≠j;l為項目類別信息下標,且1≤l≤|C|,C*是兩個用戶ui和uj之間共同進行評分過的類集合;表示用戶ui對其已評級類的平均評分,表示用戶uj對其已評級類的平均評分;μi[l]表示用戶ui對所屬于Cl類別信息的歸一化評分矢量的模,μj[l]表示用戶uj對所屬于Cl類別信息的歸一化評分矢量的模;
(1.3)計算度矩陣D和拉普拉斯矩陣L,
L=D-E (1-7)
其中,n為連接圖G中的頂點個數,1≤n≤M;
歸一化后得歸一化的拉普拉斯矩陣Lsym:
(1.4)通過Lsym的前K個最小特征值所對應的特征向量v1,υ2,…,υK,構造矩陣V;
V=[v1,υ2,…,υK]∈Rn×K (1-9)
(1.5)將V中每一行看作K維空間中的一個向量,并使用K-means算法進行譜聚類,得到K個用戶分類集合:U1,U2,...,UK,進而得到K個用戶項目子矩陣M1,M2,...,MK。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽工業大學,未經安徽工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810713297.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種股票篩選方法及裝置
- 下一篇:一種基于音樂-圖像語義關系的跨模態匹配方法





