[發明專利]一種基于堆疊自編碼器的跨域推薦方法有效
| 申請號: | 202011009508.X | 申請日: | 2020-09-23 |
| 公開(公告)號: | CN112149734B | 公開(公告)日: | 2022-04-05 |
| 發明(設計)人: | 曲立平;任建南 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06F16/9535;G06F16/958 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 堆疊 編碼器 推薦 方法 | ||
1.一種基于堆疊自編碼器的跨域推薦方法,其特征在于,包括以下步驟:
步驟1:獲取源數據域的用戶-項目-評分數據和目標域的用戶-項目-評分數據,包括源數據域的用戶-項目-評分數據集Rs、目標域的用戶-項目-評分數據集Rt、源數據域的項目集和目標域的項目集;所述的源數據域和目標數據域有公共的用戶集M;
步驟2:將向量輸入到訓練好的基于用戶的跨域堆疊自編碼器模型中,得到預測向量
其中,是源數據域中用戶u對項目i的評分,i=1,2,...,Ns,Ns為源數據域的項目集中項目數量;是目標域中用戶u對項目j的評分,j=1,2,...,Nt,Nt為目標域的項目集中項目數量;u∈M;W1、W2和W3為權重矩陣;p1、p2和p3為偏置項;f1和f3為Sigmoid激活函數,f2為Identity激活函數;
步驟3:將向量輸入到訓練好的基于項目的跨域堆疊自編碼器模型中,得到預測向量
其中,m為用戶集M中用戶的數量;W4、W5和W6為權重矩陣;p4、p5和p6為偏置項;
步驟4:分別計算基于用戶的跨域堆疊自編碼器模型與基于項目的跨域堆疊自編碼器模型的RMSE值和選擇對應RMSE值較大的預測向量作為最終預測向量;
步驟5:根據最終預測向量得到用戶集M中每個用戶對目標域中所有項目的評分,取前n個評分最高的項目向用戶進行推薦。
2.根據權利要求1所述的一種基于堆疊自編碼器的跨域推薦方法,其特征在于:所述的步驟2中基于用戶的跨域堆疊自編碼器模型的訓練方法具體為:
步驟2.1:取部分輸入的向量構造訓練集;
步驟2.2:將訓練集中向量和向量橫向連接作為堆疊自編碼器的輸入層,通過三層自編碼器的運算得到輸出結果
步驟2.3:計算損失函數Luser;
其中,μ為正則化參數:
步驟2.4:將損失函數Luser和預先設置好的學習率λ作為輸入代入到Adam算法中,Adam算法通過迭代不斷地更新W1、W2、W3、p1、p2和p3,直到Luser趨于預先設定的固定值δ,得到最優參數;
步驟2.5:將訓練得到的最優參數W1、W2、W3、p1、p2和p3輸入到基于用戶的跨域堆疊自編碼器模型中,完成基于用戶的跨域堆疊自編碼器模型的訓練。
3.根據權利要求1或2所述的一種基于堆疊自編碼器的跨域推薦方法,其特征在于:所述的步驟3中基于項目的跨域堆疊自編碼器模型的訓練方法具體為:
步驟3.1:取部分輸入的向量構造訓練集;
步驟3.2:將訓練集中向量作為堆疊自編碼器的輸入層,通過三層自編碼器的運算得到輸出結果
步驟3.3:計算損失函數Litem;
其中,為正則化參數;
步驟3.4:將損失函數Litem和預先設置好的學習率λ作為輸入代入到Adam算法中,Adam算法通過迭代不斷地更新W4、W5、W6、p4、p5和p6,直到Litem趨于預先設定的固定值δ,得到最優參數;
步驟3.5:將訓練得到的最優參數W4、W5、W6、p4、p5和p6輸入到基于項目的跨域堆疊自編碼器模型中,完成基于項目的跨域堆疊自編碼器模型的訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011009508.X/1.html,轉載請聲明來源鉆瓜專利網。





