[發明專利]一種序列推薦模型的訓練方法和對象推薦方法有效
| 申請號: | 202310396941.0 | 申請日: | 2023-04-14 |
| 公開(公告)號: | CN116151353B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 王翔;楊正一;何向南 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/048;G06N3/0442;G06N3/045;G06F16/9535;G06F16/735;G06Q30/0601 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 郭夢雅 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 序列 推薦 模型 訓練 方法 對象 | ||
1.一種序列推薦模型的訓練方法,其特征在于,所述序列推薦模型用于基于用戶的購買或瀏覽行為序列,對用戶的下一次操作進行預測和推薦,所述序列推薦模型包括經驗學習模塊和魯棒學習模塊,所述經驗學習模塊基于經驗風險最小化訓練得到,用于衡量經驗風險情況;魯棒學習模塊用于衡量訓練樣本學習情況的風險函數和用于估計序列推薦模型在實際應用時數據情況的經驗分布,所述訓練方法包括:
獲取訓練樣本數據集,其中,所述訓練樣本數據集包括至少一個訓練樣本,所述訓練樣本包括在第一時間段內生成的針對樣本用戶的歷史樣本操作序列和樣本標簽,所述樣本標簽表征所述樣本用戶在所述歷史樣本操作序列之后的下一個實際操作;
將所述歷史樣本操作序列輸入所述經驗學習模塊,輸出第一預測結果,并根據所述第一預測結果和所述樣本標簽確定第一損失值;
將所述歷史樣本操作序列輸入所述魯棒學習模塊,輸出第二預測結果,并根據所述第二預測結果、所述樣本標簽、預設的魯棒半徑和與所述歷史樣本操作序列對應的經驗分布確定第二損失值,其中,所述經驗分布表征所述歷史樣本操作序列中每個歷史操作出現的頻率;
根據所述第一損失值和所述第二損失值確定總損失值;
根據所述總損失值調整所述經驗學習模塊的網絡參數以及所述魯棒學習模塊的網絡參數,直至所述總損失值滿足迭代條件;
將所述總損失值滿足所述迭代條件時得到的模型作為序列推薦模型;
所述根據所述第一預測結果和所述樣本標簽確定第一損失值包括:
將所述第一預測結果和所述樣本標簽輸入預設的經驗風險最小化損失函數,得到所述第一損失值;
所述訓練樣本數據集中包括M個訓練樣本,其中,M≥2;
所述根據所述樣本第二預測結果、所述樣本標簽、預設的魯棒半徑和與所述歷史樣本操作序列對應的經驗分布確定第二損失值包括:
針對第i個訓練樣本,根據與第i個歷史樣本操作序列對應的第i個第二預測結果和第i個樣本標簽確定第i個風險值,最終得到M個風險值,i為正整數;
根據所述經驗分布結合所述魯棒半徑,泛化得到測試分布,其中,所述測試分布包括測試樣本數據,所述測試樣本數據包括在所述魯棒半徑范圍內的所有訓練樣本;
根據所述測試樣本數據確定期望值;
在所述經驗分布和所述測試分布之間的差異性滿足預設距離度量的情況下,根據所述M個風險值和所述期望值確定所述第二損失值。
2.根據權利要求1所述的訓練方法,其特征在于,所述根據與第i歷史樣本操作序列對應的第i個第二預測結果和第i個樣本標簽確定第i個風險值包括:
利用均方誤差確定所述第i個第二預測結果與所述第i個樣本標簽之間的誤差,得到所述第i個風險值。
3.根據權利要求1所述的訓練方法,其特征在于,所述根據所述M個風險值和所述期望值確定所述第二損失值包括:
將所述期望值分別與所述M個風險值相乘,得到損失值候選集;
確定所述損失值候選集中滿足預設條件的損失值為所述第二損失值。
4.根據權利要求3所述的訓練方法,其特征在于,所述預設條件包括:所述損失值候選集中數值最大的損失值。
5.根據權利要求1~4任一項所述的訓練方法,其特征在于,所述預設距離度量采用相對熵表示。
6.根據權利要求1所述的訓練方法,其特征在于,所述經驗風險最小化損失函數包括以下至少之一:平方損失函數、二分類交叉熵損失函數、BPR損失函數。
7.根據權利要求1所述的訓練方法,其特征在于,所述根據所述第一損失值和所述第二損失值確定總損失值包括:
將所述第二損失值與預設權重值相乘后,與所述第一損失值相加,得到所述總損失值。
8.一種對象推薦方法,其特征在于,包括:
獲取目標用戶在預設時間段內生成的歷史目標操作序列,其中,所述歷史目標操作序列包括針對待推薦對象進行的操作信息;以及
將所述歷史目標操作序列輸入至由權利要求1~7中任一項所述的訓練方法訓練得到的序列推薦模型中,輸出與所述目標用戶對應的推薦對象。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310396941.0/1.html,轉載請聲明來源鉆瓜專利網。





