[發明專利]推薦模型訓練方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202110713029.4 | 申請日: | 2021-06-25 |
| 公開(公告)號: | CN113434761A | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 司世景 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06K9/62;G06N3/02 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 初春 |
| 地址: | 518031 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 推薦 模型 訓練 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種推薦模型訓練方法,其特征在于,所述訓練方法包括:
解析訓練樣本中用戶敏感屬性對物品推薦模型的訓練干擾,得到基于互信息衡量的訓練偏見懲罰項;
依據所述訓練偏見懲罰項與物品推薦模型訓練所使用的初始損失函數,對所述物品推薦模型進行參數優化,用以得到訓練完成的物品推薦模型;
其中所述訓練偏見懲罰項用于在模型訓練過程中弱化用戶敏感屬性特征的推薦偏見影響,所述物品推薦模型包括基于神經協同過濾框架構建的推薦網絡。
2.如權利要求1所述的推薦模型訓練方法,其特征在于,所述解析訓練樣本中用戶敏感屬性對物品推薦模型的訓練干擾,得到基于互信息衡量的訓練偏見懲罰項,包括:
在將訓練樣本輸入到物品推薦模型進行預測時,確定訓練樣本中用戶敏感屬性與用戶嵌入隱向量之間的依賴程度,得到在用戶嵌入隱向量維度下基于互信息衡量的訓練偏見懲罰項;和/或,
確定訓練樣本中用戶敏感屬性與用戶對物品預測得分之間的依賴程度,得到在用戶對物品預測得分維度下基于互信息衡量的訓練偏見懲罰項。
3.如權利要求2所述的推薦模型訓練方法,其特征在于,所述確定訓練樣本中用戶敏感屬性與用戶嵌入隱向量之間的依賴程度,包括:
基于與物品推薦模型中嵌入層輸出連接的敏感屬性分類網絡,采用預設的互信息量計算函數計算訓練樣本中用戶敏感屬性與用戶嵌入隱向量之間的相互依賴程度;
其中,所述敏感屬性分類網絡用于表征用戶嵌入隱向量固定時用戶敏感屬性分布的條件概率函數。
4.如權利要求2所述的推薦模型訓練方法,其特征在于,所述確定訓練樣本中用戶敏感屬性與用戶對物品預測得分之間的依賴程度,包括:
確定訓練樣本輸入到物品推薦模型所輸出的訓練樣本在用戶敏感屬性下各屬性取值的預測得分平均值與方差;
依據訓練樣本在用戶敏感屬性下各屬性取值的預測得分平均值與方差,構建用戶敏感屬性的屬性取值固定時用戶對物品預測得分的條件概率函數;
基于所述用戶對物品預測得分的條件概率函數,采用預設的互信息量計算函數計算訓練樣本中用戶敏感屬性與用戶對物品預測得分之間的依賴程度。
5.如權利要求1所述的推薦模型訓練方法,其特征在于,所述依據所述訓練偏見懲罰項與物品推薦模型訓練所使用的初始損失函數,對所述物品推薦模型進行參數優化,包括:
基于物品推薦模型訓練所使用的初始損失函數,通過將訓練樣本輸入到物品推薦模型進行預測,得到物品推薦模型的初始損失值;
依據所述初始損失值與所述基于互信息衡量的訓練偏見懲罰項,對所述物品推薦模型進行參數優化,用以得到訓練完成的物品推薦模型。
6.如權利要求5所述的推薦模型訓練方法,其特征在于,所述通過將訓練樣本輸入到物品推薦模型進行預測,得到物品推薦模型的初始損失值,包括:
將獲取的訓練樣本輸入到物品推薦模型得到初始預測值,并基于訓練樣本關聯的預設標簽值與所述初始預測值確定物品推薦模型的初始損失值;
其中,所述訓練樣本描述了用戶與物品的交互隱特征。
7.如權利要求5所述的推薦模型訓練方法,其特征在于,所述依據所述初始損失值與所述基于互信息衡量的訓練偏見懲罰項,對物品推薦模型進行參數優化,包括:
將所述基于互信息衡量的訓練偏見懲罰項的取值加入到所述初始損失值中,得到新的損失值;
依據新的損失值進行反向傳播,引導物品推薦模型向弱化用戶敏感屬性特征的推薦偏見影響的方向來優化物品推薦模型中的可訓練參數,完成推薦模型的訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110713029.4/1.html,轉載請聲明來源鉆瓜專利網。





