[發明專利]一種基于生成對抗網絡的對級排序項目推薦方法有效
| 申請號: | 201910571454.7 | 申請日: | 2019-06-28 |
| 公開(公告)號: | CN110442781B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 張晨燕;劉東華;袁龍飛;陳博 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06F40/289;G06F40/30;G06N3/0464 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 生成 對抗 網絡 排序 項目 推薦 方法 | ||
1.一種基于生成對抗網絡的對級排序項目推薦方法,其特征在于,包括以下步驟:
步驟1:采集訓練數據,對用戶給出的隱式反饋以及項目評論信息進行過濾,并對過濾后的評論信息進行預處理;
步驟2:利用GloVe詞向量模型將項目評論信息轉換為詞向量矩陣,利用卷積神經網絡學習評論信息的潛在上下文特征作為項目的評論特征;通過嵌入層將用戶給出的隱式反饋轉化為用戶交互特征和項目交互特征;
步驟3:在對抗的訓練過程中對參數進行優化;
利用生成對抗網絡中的生成器根據預測評分從未觀察到的項目中個性化的選擇負樣本,和觀察到的正樣本組成偏序關系對,通過判別器來判斷生成的偏序關系是否正確,并根據判斷的結果指導生成器更新參數;二者進行迭代的對抗訓練,直到最終生成器的推薦結果收斂;
其中,融合項目的交互特征和評論特征,通過線性的內積計算用戶對項目的預測評分;
在生成對抗的過程中,生成器計算預測評分,通過Softmax函數將預測評分轉化為生成樣本的分布,根據該分布為用戶個性化的選擇負樣本,和從真實樣本中采樣得到的正樣本組成偏序關系;
判別器通過預測評分來判斷上面生成的偏序關系是否正確,用戶是否更喜歡正樣本;判別器希望更新參數使得正負樣本之間的區分盡可能的大,因此,采用如下的方式對判別器的參數φ進行更新:
其中,U表示用戶的集合,i+,i-分別表示正、負樣本,ptrue,Gθ分別表示真實樣本和生成樣本的分布,D為判別器,D(u,i+,i-)判斷偏序關系i+,i-是否正確,用戶u是否更喜歡正樣本;
對生成器參數的更新首先要求生成器生成一批負樣本和真實樣本組成偏序關系,判別器對生成的偏序關系進行判別,判別的結果logD(u,i+,i-)作為回報指導生成器的更新;
其中,I表示項目的集合,θ表示生成器的參數,通過最小化目標函數來對生成器參數θ進行更新;
每輪的迭代中,固定生成器,對判別器的參數進行更新,目標是使判別器在當前條件下能夠給出正確的評判結果;之后,固定判別器,訓練生成器使其根據目前判別器的判別結果不斷更新自己的參數,使生成的負樣本更加難以區分;二者進行上述的迭代訓練,直到最終生成器的推薦結果收斂;
步驟4:輸出收斂的推薦結果。
2.根據權利要求1所述的基于生成對抗網絡的對級排序項目推薦方法,其特征在于:步驟1中,首先對隱式反饋和評論信息進行過濾得到所有用戶ID和項目ID真實存在的交互數據;然后對過濾后的評論信息進行預處理,僅保留實詞,將所有用戶對同一項目的評論進行連接操作,并將所有項目的評論補齊到統一長度。
3.根據權利要求1所述的基于生成對抗網絡的對級排序項目推薦方法,其特征在于:步驟2中,對于項目評論信息,通過GolVe詞向量模型映射得到每個詞的詞向量,得到項目評論信息對應的詞向量矩陣,通過共享權重對該矩陣進行卷積,然后經池化、全連接得到一個指定維度的向量作為項目的評論特征進行輸出;
對于用戶給出的隱式反饋,在嵌入層通過潛在特征矩陣將稀疏的用戶或項目的one-hot編碼映射得到低維的潛在因子向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910571454.7/1.html,轉載請聲明來源鉆瓜專利網。





