[發明專利]基于半離散矩陣分解的物品推薦方法有效
| 申請號: | 202010344347.3 | 申請日: | 2020-04-27 |
| 公開(公告)號: | CN111552852B | 公開(公告)日: | 2021-09-28 |
| 發明(設計)人: | 鄔俊;羅芳媛;張雨佳 | 申請(專利權)人: | 北京交通大學 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906;G06F16/9536;G06Q30/06 |
| 代理公司: | 北京市商泰律師事務所 11255 | 代理人: | 黃曉軍 |
| 地址: | 100044 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 離散 矩陣 分解 物品 推薦 方法 | ||
1.一種基于半離散矩陣分解的物品推薦方法,其特征在于,包括:
構建用戶-物品評分矩陣R,用于記錄用戶對物品的評分行為;
根據用戶-物品評分矩陣R訓練矩陣分解模型,獲得用戶的實值特征矩陣P和物品的實值特征矩陣Q;
根據用戶的實值特征矩陣P對用戶執行聚類分析,獲得用戶的錨點特征矩陣E,根據物品的實值特征矩陣Q對物品執行聚類分析,獲得物品的錨點特征矩陣F;
根據R、P、Q、E、F訓練半離散矩陣分解模型,獲得用戶的二值編碼矩陣B和物品的二值編碼矩陣D;
根據用戶的二值編碼矩陣B和物品的二值編碼矩陣D還原評分矩陣
根據R將中已觀測評分位置的預估值置0,根據評分矩陣將預測分值最高的前設定數量個物品推薦給相應用戶;
所述的構建“用戶-物品”評分矩陣R,用于記錄用戶對物品的評分行為,包括:
構建“用戶-物品”評分矩陣R∈[0,1]m×n,用于記錄用戶對物品的評分行為,其中m、n分別表示用戶、物品的數量,并對“用戶-物品”評分矩陣R中的評分數據進行歸一化處理,所述物品包括產品或者服務;
所述的根據“用戶-物品”評分矩陣R訓練矩陣分解模型,獲得用戶的實值特征矩陣P和物品的實值特征矩陣Q,包括:
根據“用戶-物品”評分矩陣R訓練矩陣分解模型,獲得用戶的實值特征矩陣和物品的實值特征矩陣P的第u列表示用戶u的特征向量,Q的第i列表示物品i的特征向量,其中f為特征空間維數;
所述的根據用戶的實值特征矩陣P對用戶執行聚類分析,獲得用戶的錨點特征矩陣E,根據物品的實值特征矩陣Q對物品執行聚類分析,獲得物品的錨點特征矩陣F,包括:
根據用戶的實值特征矩陣P對用戶執行聚類分析,獲得用戶的錨點特征矩陣根據物品的實值特征矩陣Q對物品執行聚類分析,獲得物品的錨點特征矩陣E的第u列表示用戶u所在群組的簇中心,F的第i列表示物品i所在群組的簇中心,所述簇中心為錨點特征;
所述的根據R、P、Q、E、F訓練半離散矩陣分解模型,獲得用戶的二值編碼矩陣B和物品的二值編碼矩陣D,包括:
所述半離散矩陣分解模型的目標函數定義如下:
其中表示損失項,和分別為“點級”和“組級”平滑項,用于異構空間下的特征表示對齊,用于保持原向量空間中“用戶-用戶”、“物品-物品”之間幾何結構;
損失項定義如下:
s.t.B∈{±1}f×m,D∈{±1}f×n
其中Ω是由已觀測評分對應的(u,i)索引組成的集合;
“點級”平滑項定義為:用于控制同一個用戶、物品的二值編碼與其對應的實值特征之間的差異,據此實現異構空間下的表示對齊;
“組級”平滑項定義為:用于控制用戶、物品的二值編碼與其對應的錨點特征之間的差異,據此保持原向量空間中數據點間的拓撲結構,即原空間中處于同一群組的用戶或物品應該具有相似的二值編碼;
正則項定義為:用于控制編碼平衡,以期最大化編碼的信息熵;
合并整理各項后,半離散矩陣分解模型的最終目標函數表示如下:
其中,α1,α2,β1,β2,γ>0為超參數,1m,1n表示m,n維全1向量;
所述半離散矩陣分解模型的訓練過程包括如下步驟:
S41:模型初始化;將P和Q進行二值量化,作為半離散矩陣分解模型的目標變量的初始值:B=sgn(P)和D=sgn(Q);
S42:進入迭代訓練過程,固定D,更新B;當固定D時,半離散矩陣分解模型的目標函數等價于如下優化問題:
其中Ωu表示已觀測評分對應的(u,i)索引對中u所構成的集合;
采用離散坐標下降算法對bu進行逐位更新;設其中buk表示bu的第k位,表示除buk以外其余二值編碼所組成的向量;類似的,具體buk的更新規則如下:
當a≠0時,K(a,b)=a,否則K(a,b)=b;如果不對buk進行更新;
S43:固定B,更新D;當固定B時,半離散矩陣分解模型的目標函數等價于如下優化問題:
其中Ωi表示已觀測評分對應的(u,i)索引對中i所構成的集合;采用離散坐標下降算法對di進行逐位更新;具體dik的更新規則如下:
同樣,如果更新dik,否則,不對dik進行更新;
S44:重復S42到S43,直到滿足迭代停止條件,模型收斂,輸出所述半離散矩陣分解模型的參數B和D。
2.根據權利要求1所述的方法,其特征在于,所述的迭代停止條件包括:目標函數值小于預設定閾值,或B和D的每一位都不再發生變化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京交通大學,未經北京交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010344347.3/1.html,轉載請聲明來源鉆瓜專利網。





