[發明專利]一種基于變分自動編碼器的混合推薦方法有效
| 申請號: | 201810253803.6 | 申請日: | 2018-03-26 |
| 公開(公告)號: | CN108647226B | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 張寅;林建實 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/06;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 傅朝棟;張法高 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自動 編碼器 混合 推薦 方法 | ||
1.一種基于變分自動編碼器的混合推薦方法,其特征在于包括以下步驟:
(1)根據具體的應用配置環境,處理日志數據,得到用戶和物品的交互關系信息,包括隱式反饋和顯式反饋兩類;針對不同信息類型進行特征處理:對于隱式反饋數據,有交互行為的標記為1,否則標記為0;對于顯示反饋數據,記錄其具體的評分值,然后將特征值進行歸一化處理;
(2)分別收集用戶和物品的多視圖信息,包括用戶畫像信息和物品內容信息;
(3)收集用戶除已有歷史行為的物品之外的不喜愛偏好的推薦反饋信息,生成負樣本,再利用負采樣使得整體正負樣本數相同;
(4)構建基于變分自動編碼器混合推薦方法的模型,采用交替迭代的方式進行變量的梯度更新,對模型進行訓練,保存最終的模型參數;對于已有歷史交互行為的物品和用戶,保留對應的隱向量編碼;
(5)在預測階段,對于已經有隱向量編碼的用戶和物品,直接作為模型中廣義矩陣分解模塊的輸入,計算得到該用戶對特定物品的偏好值;而對于缺失隱向量編碼的用戶和物品,則首先通過訓練好的模型計算出對應的隱向量編碼,再計算其偏好值;
(6)對于特定某用戶,計算其對候選物品集合中物品的偏好值,對偏好值進行排序,得到該用戶的推薦物品列表;
在方法執行過程中,定期整理日志并重復(1)~(4)計算模型,更新用戶和物品的隱向量編碼。
2.根據權利要求1所述的基于變分自動編碼器的混合推薦方法,其特征在于所述步驟(3)包括:針對每一個用戶,根據已有的交互行為將物品劃分成為正樣本和負樣本,而對于沒有交互記錄的物品,通過抽樣的方式來篩選出一部分的負樣本。
3.根據權利要求1所述的基于變分自動編碼器的混合推薦方法,其特征在于所述的步驟(4)中的基于變分自動編碼器混合推薦方法的模型一共由三個模塊組成,包括用戶一側的變分自動編碼器,物品一側的變分自動編碼器和廣義矩陣分解模塊,變分自動編碼器分為解碼器和編碼器;在接收了前述步驟(2)、(3)、(4)得到的用戶和物品特征值以及對應的正負樣本偏好值之后,進行模型的訓練。
4.根據權利要求1所述的基于變分自動編碼器的混合推薦方法,其特征在于所述的步驟(4)中變量的梯度更新公式如下:
其中,Φu,Φv,Θu,Θv和Ψ分別是用戶自動編碼器的編碼器參數、物品自動編碼器的編碼器參數、用戶自動編碼器的解碼器參數、物品自動編碼器的解碼器參數和廣義矩陣分解模塊的參數,θ和Φ分別是編碼器模塊參數和解碼器模塊參數,ηu,ηv,ηΨ分別是用戶一側自動編碼器、物品一側自動編碼器和廣義矩陣分解模塊參數更新的速率,Zu,Zv分別是由用戶一側的自動編碼器和物品一側的自動編碼器生成的隱向量編碼,XB,UB分別是隨機梯度下降批大小為B的用戶多視圖特征和用戶的評分特征,YB,VB分別是批大小為B的物品多視圖特征和物品的評分特征,U和V分別是用戶和物品的評分特征,fpooling(U),fpooling(V)分別是用戶和物品的評分特征經過池化操作后的輸出;表示批處理大小為B的參數梯度;表示全局的參數梯度。
5.根據權利要求1所述的基于變分自動編碼器的混合推薦方法,其特征在于所述步驟(5)包括以下步驟:
1)保存步驟(4)實施后獲得的模型訓練參數Φu,Φv,Θu,Θv和Ψ,用于開展預測;
2)對于已有交互行為的用戶和物品,直接讀取保存的隱向量編碼;對于未知的用戶和物品,通過編碼器部分進行隱向量編碼的計算;
3)對于用戶的編碼器部分,用戶i的隱向量編碼計算公式如下:
其中,g(·)是每一層的激活函數,ui,xi分別是用戶i的評分特征和多視圖特征,和分別是用戶i經由變分自動編碼器生成的均值向量、方差向量和隱向量編碼,是計算用戶的隱向量編碼時第k個隱藏層的輸出結果向量,Wk(en),Vk(en)是計算用戶的隱向量編碼時第k個隱藏層對應的權重向量,分別用于處理隱藏層的輸出、多視圖特征輸入,是計算用戶的隱向量編碼時對應第k個隱藏層偏置項,k取2,3...,L,L是隱藏層的個數,而WL(μ),VL(μ)是計算用戶的隱向量編碼時針對均值向量輸出的權重項,是計算用戶的隱向量編碼時針對均值向量輸出的偏置項,WL(σ),VL(σ)是計算用戶的隱向量編碼時針對方差向量輸出的權重項,是計算用戶的隱向量編碼時針對方差向量輸出的偏置項;ε是符合均值為0且方差為1的正態分布所抽樣的數值;
4)對于物品的編碼器部分,物品i的隱向量編碼計算公式如下:
其中,g(·)是每一層的激活函數,vi,yi分別是物品i的評分特征和多視圖特征,和分別是物品i經由變分自動編碼器生成的均值向量、方差向量和隱向量編碼,是計算物品的隱向量編碼時第k個隱藏層的輸出結果向量,是計算物品的隱向量編碼時第k個隱藏層對應的權重向量,分別用于處理隱藏層的輸出、多視圖特征輸入,是計算物品的隱向量編碼時對應第k個隱藏層偏置項,k取2,3...,L,L是隱藏層的個數,而是計算物品的隱向量編碼時針對均值向量輸出的權重項,是計算物品的隱向量編碼時針對均值向量輸出的偏置項,是計算物品的隱向量編碼時針對方差向量輸出的權重項,是計算物品的隱向量編碼時針對方差向量輸出的權重項偏置項;ε是符合均值為0且方差為1的正態分布所抽樣的數值;
5)計算用戶對物品的評分偏好值,公式如下:
R=fΨ(Zu,Zv)
其中Zu為用戶的隱向量編碼,Zv為物品的隱向量編碼,fΨ(·)是以Ψ為參數的神經網絡架構所擬合的函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810253803.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電商黑灰產輿情自動挖掘方法和系統
- 下一篇:一種推薦方法及裝置





