[發明專利]推薦模型訓練方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202110713029.4 | 申請日: | 2021-06-25 |
| 公開(公告)號: | CN113434761A | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 司世景 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06K9/62;G06N3/02 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 初春 |
| 地址: | 518031 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 推薦 模型 訓練 方法 裝置 計算機 設備 存儲 介質 | ||
本發明涉及一種推薦模型訓練方法、裝置、計算機設備和存儲介質。所述方法包括:解析訓練樣本中用戶敏感屬性對物品推薦模型的訓練干擾,得到基于互信息衡量的訓練偏見懲罰項;依據訓練偏見懲罰項與物品推薦模型訓練所使用的初始損失函數,對物品推薦模型進行參數優化,用以得到訓練完成的物品推薦模型;其中,訓練偏見懲罰項用于在模型訓練過程中弱化用戶敏感屬性特征的推薦偏見影響,所述物品推薦模型包括基于神經協同過濾框架構建的推薦網絡。上述方法可以利用互信息對推薦模型訓練過程中產生的偏見進行糾偏,針對訓練數據中的特定屬性偏見信息進行糾正,為不同身份的用戶提供公平的推薦結果,提高推薦模型精度與魯棒性,提高推薦有效性。
技術領域
本發明涉及推薦系統技術領域,特別是涉及一種推薦模型訓練方法、裝置、計算機設備和存儲介質。
背景技術
由于能夠為每個用戶提供個性化建議,推薦技術已經成為緩解信息過載有效方案;如今,推薦技術已廣泛應用于電子商務、社交網絡、視頻分享平臺及生活類應用等領域。然而,相關推薦技術仍面臨的許多偏見問題很難處理,比如用戶行為受到物品曝光機制和自我選擇的雙重影響,訓練數據中的物品分布不均衡等因素,可能會降低推薦有效性,導致推薦結果不盡人意。
發明內容
基于此,有必要針對在進行推薦模型訓練時,推薦技術仍面臨許多偏見問題很難處理,造成推薦有效性降低以及推薦結果不盡人意,提供一種推薦模型訓練方法、裝置、計算機設備和存儲介質。
一種推薦模型訓練方法,所述訓練方法包括:解析訓練樣本中用戶敏感屬性對物品推薦模型的訓練干擾,得到基于互信息衡量的訓練偏見懲罰項;依據所述訓練偏見懲罰項與物品推薦模型訓練所使用的初始損失函數,對所述物品推薦模型進行參數優化,用以得到訓練完成的物品推薦模型;其中,所述訓練偏見懲罰項用于在模型訓練過程中弱化用戶敏感屬性特征的推薦偏見影響,所述物品推薦模型包括基于神經協同過濾框架構建的推薦網絡。
在其中一個實施例中,解析訓練樣本中用戶敏感屬性對物品推薦模型的訓練干擾,得到基于互信息衡量的訓練偏見懲罰項的步驟包括:在將訓練樣本輸入到物品推薦模型進行預測時,確定訓練樣本中用戶敏感屬性與用戶嵌入隱向量之間的依賴程度,得到在用戶嵌入隱向量維度下基于互信息衡量的訓練偏見懲罰項;和/或,確定訓練樣本中用戶敏感屬性與用戶對物品預測得分之間的依賴程度,得到在用戶對物品預測得分維度下基于互信息衡量的訓練偏見懲罰項。
在其中一個實施例中,確定訓練樣本中用戶敏感屬性與用戶嵌入隱向量之間的依賴程度的步驟包括:基于與物品推薦模型中嵌入層輸出連接的敏感屬性分類網絡,采用預設的互信息量計算函數計算訓練樣本中用戶敏感屬性與用戶嵌入隱向量之間的相互依賴程度;其中,所述敏感屬性分類網絡用于表征用戶嵌入隱向量固定時用戶敏感屬性分布的條件概率函數。
在其中一個實施例中,確定訓練樣本中用戶敏感屬性與用戶對物品預測得分之間的依賴程度的步驟包括:確定訓練樣本輸入到物品推薦模型所輸出的訓練樣本在用戶敏感屬性下各屬性取值的預測得分平均值與方差;依據訓練樣本在用戶敏感屬性下各屬性取值的預測得分平均值與方差,構建用戶敏感屬性的屬性取值固定時用戶對物品預測得分的條件概率函數;基于所述用戶對物品預測得分的條件概率函數,采用預設的互信息量計算函數計算訓練樣本中用戶敏感屬性與用戶對物品預測得分之間的依賴程度。
在其中一個實施例中,預設的計算互信息量計算函數用如下公式表示:
其中,Iv CLUB表示基于變分對數比的互信息量上界,即通過Iv CLUB表示x與y 之間的相互依賴程度,qθ(y|x)表示對x固定時y的分布的條件概率密度函數的近似;在x表示用戶嵌入隱向量時,y表示用戶敏感屬性;在x表示用戶敏感屬性時,y表示用戶對物品預測得分。
在其中一個實施例中,所述用戶敏感屬性包括以下至少一個維度的內容:性別、地理位置、膚色、職業以及收入水平。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110713029.4/2.html,轉載請聲明來源鉆瓜專利網。





