[發明專利]一種行為預測模型訓練方法、裝置、設備及存儲介質在審
| 申請號: | 202011629448.1 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112669078A | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 尚斌;付睿;沈翔宇 | 申請(專利權)人: | 上海眾源網絡有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06N3/08 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 呂俊秀 |
| 地址: | 200030 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 行為 預測 模型 訓練 方法 裝置 設備 存儲 介質 | ||
1.一種行為預測模型訓練方法,其特征在于,所述方法包括:
獲取當前周期的訓練數據,所述訓練數據中包括樣本用戶的樣本用戶特征、樣本視頻的樣本視頻特征及所述樣本用戶在所述當前周期內對所述樣本視頻的真實行為特征;
將所述樣本用戶特征及所述樣本視頻特征輸入至行為預測模型,計算所述樣本用戶對所述樣本視頻的預測行為特征,所述行為預測模型為對所述當前周期之前的至少一個周期的歷史訓練數據進行訓練得到的;
根據所述預測行為特征與所述真實行為特征之間的損失值,調整所述行為預測模型的模型參數,以使所述預測行為特征與所述真實行為特征之間的損失值滿足預設條件,得到新的行為預測模型。
2.根據權利要求1所述的方法,其特征在于,所述根據所述預測行為特征與所述真實行為特征之間的損失值,調整所述行為預測模型的模型參數,得到新的行為預測模型,包括:
建立所述預測行為特征與所述真實行為特征之間的損失函數,根據所述損失函數,計算出預測梯度信息;
獲取預先存儲的所述行為預測模型的歷史梯度信息,根據所述歷史梯度信息及所述預測梯度信息,計算當前梯度信息;
利用所述當前梯度信息,對所述行為預測模型進行反向傳播,調整所述行為預測模型的模型參數,以使所述預測行為特征與所述真實行為特征之間的損失值滿足預設條件,得到新的行為預測模型,并將所述當前梯度信息存儲為所述新的行為預測模型的歷史梯度信息。
3.根據權利要求2所述的方法,其特征在于,所述將所述樣本用戶特征及所述樣本視頻特征輸入至行為預測模型,計算所述樣本用戶對所述樣本視頻的預測行為特征,包括:
將所述訓練數據分為多組,其中,每組包括第一預設數量個訓練數據;
從所述多組訓練數據中選擇一組,作為目標訓練數據;
將所述目標訓練數據中的樣本用戶特征及樣本視頻特征輸入至行為預測模型,計算所述目標訓練數據中樣本用戶對樣本視頻的目標預測行為特征;
所述建立所述預測行為特征與所述真實行為特征之間的損失函數,根據所述損失函數,計算出預測梯度信息,包括:
建立所述目標預測行為特征與所述目標訓練數據中真實行為特征之間的損失函數,根據所述目標損失函數,計算出預測梯度信息;
在所述將所述當前梯度信息存儲為所述新的行為預測模型的歷史梯度信息之后,所述方法還包括:
從所述多組訓練數據中選擇新的一組,作為新的目標訓練數據,返回所述將所述目標訓練數據中的樣本用戶特征及樣本視頻特征輸入至行為預測模型,計算所述目標訓練數據中樣本用戶對樣本視頻的目標預測行為特征的步驟。
4.根據權利要求1所述的方法,其特征在于,所述方法還包括:
獲取到目標用戶的目標用戶特征及候選視頻的候選視頻特征之后,將所述目標用戶特征及所述候選視頻特征輸入至最新的行為預測模型中,計算所述目標用戶對所述候選視頻的目標行為特征;
根據所述目標行為特征,從所述候選視頻中選擇目標視頻,向所述目標用戶推薦所述目標視頻。
5.根據權利要求4所述的方法,其特征在于,所述目標行為特征包括所述目標用戶對每個候選視頻的點擊概率,所述根據所述目標行為特征,從所述候選視頻中選擇目標視頻,向所述目標用戶推薦所述目標視頻,包括:
根據所述目標用戶對每個候選視頻的點擊概率,從所述候選視頻中選擇點擊概率最大的第二預設數量個視頻作為目標視頻,向所述目標用戶推薦所述目標視頻。
6.一種行為預測模型訓練裝置,其特征在于,所述裝置包括:
數據獲取模塊,用于獲取當前周期的訓練數據,所述訓練數據中包括樣本用戶的樣本用戶特征、樣本視頻的樣本視頻特征及所述樣本用戶在所述當前周期內對所述樣本視頻的真實行為特征;
模型計算模塊,用于將所述樣本用戶特征及所述樣本視頻特征輸入至行為預測模型,計算所述樣本用戶對所述樣本視頻的預測行為特征,所述行為預測模型為對所述當前周期之前的至少一個周期的歷史訓練數據進行訓練得到的;
參數調整模塊,用于根據所述預測行為特征與所述真實行為特征之間的損失值,調整所述行為預測模型的模型參數,以使所述預測行為特征與所述真實行為特征之間的損失值滿足預設條件,得到新的行為預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海眾源網絡有限公司,未經上海眾源網絡有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011629448.1/1.html,轉載請聲明來源鉆瓜專利網。





