[發明專利]內容推薦模型的訓練方法、裝置、服務器及存儲介質有效
| 申請號: | 202210061526.5 | 申請日: | 2022-01-19 |
| 公開(公告)號: | CN114417156B | 公開(公告)日: | 2022-09-30 |
| 發明(設計)人: | 趙致辰 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/06 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 周清華 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 內容 推薦 模型 訓練 方法 裝置 服務器 存儲 介質 | ||
1.一種內容推薦模型的訓練方法,其特征在于,包括:
在采用樣本推薦信息集合對內容推薦模型進行訓練過程中,若當前樣本為第一樣本賬戶的正樣本,則在所述樣本推薦信息集合中采樣出第一負樣本,以及第二負樣本;所述正樣本為第一樣本賬戶交互過的樣本推薦信息;所述第一負樣本為第二樣本賬戶交互過的樣本推薦信息;所述第二負樣本由所述樣本推薦信息集合隨機采樣得到;所述第一樣本賬戶為樣本賬戶中的任意賬戶,所述第二樣本賬戶為所述樣本賬戶中除第一樣本賬戶的任意賬戶;
分別將所述正樣本、所述第一負樣本和所述第二負樣本輸入至所述內容推薦模型,得到所述第一樣本賬戶的預測推薦順序;
基于所述預測推薦順序與所述第一樣本賬戶的期望推薦順序之間的差異,對所述內容推薦模型進行訓練;所述期望推薦順序為所述正樣本的推薦順序先于所述第一負樣本和所述第二負樣本的推薦順序。
2.根據權利要求1所述的方法,其特征在于,所述在所述樣本推薦信息集合中采樣出第一負樣本,包括:
從第一負樣本集合中采樣得到所述第一負樣本;所述第一負樣本集合由樣本推薦信息集合中,所述第二樣本賬戶交互過的樣本推薦信息組成。
3.根據權利要求2所述的方法,其特征在于,所述在所述樣本推薦信息集合中采樣出第一負樣本,以及第二負樣本,包括:
從所述第一負樣本集合中采樣得到所述第一負樣本,以及從所述樣本推薦信息集合中采樣得到所述第二負樣本;所述第一負樣本的數量與所述第二負樣本的數量之間的比例滿足預設的比例關系。
4.根據權利要求2所述的方法,其特征在于,所述從第一負樣本集合中采樣得到所述第一負樣本,包括:
獲取所述第一負樣本集合包含的各樣本推薦信息對應的出現頻率;所述出現頻率用于表征所述第二樣本賬戶對所述第一負樣本集合中各樣本推薦信息的交互次數;
根據所述出現頻率,確定所述第一負樣本集合中各樣本推薦信息的采樣權重,按照所述采樣權重從所述第一負樣本集合中采樣得到所述第一負樣本。
5.根據權利要求4所述的方法,其特征在于,所述根據所述出現頻率,確定所述第一負樣本集合中各樣本推薦信息的采樣權重,包括:
若當前樣本推薦信息為所述第一負樣本集合中,出現頻率大于預設的第一出現頻率,并且小于預設的第二出現頻率的樣本推薦信息,則將當前樣本推薦信息的采樣權重設置為大于其他樣本推薦信息的采樣權重;其中,所述其他樣本推薦信息為所述第一負樣本集合中,出現頻率小于或等于所述第一出現頻率,或者出現頻率大于或等于所述第二出現頻率的樣本推薦信息;所述第一出現頻率小于所述第二出現頻率。
6.根據權利要求2所述的方法,其特征在于,所述對所述內容推薦模型進行訓練之后,還包括:
將所述正樣本,添加至所述第一負樣本集合中。
7.根據權利要求1所述的方法,其特征在于,所述分別將所述正樣本、所述第一負樣本和所述第二負樣本輸入至所述內容推薦模型,得到所述第一樣本賬戶的預測推薦順序,包括:
分別將所述正樣本、所述第一負樣本和所述第二負樣本輸入至所述內容推薦模型,通過所述內容推薦模型得到所述正樣本、所述第一負樣本和所述第二負樣本分別對應的向所述第一樣本賬戶進行推薦的預測推薦概率;
按照所述預測推薦概率的大小關系,對所述正樣本、所述第一負樣本和所述第二負樣本進行排序,得到所述預測推薦順序。
8.根據權利要求1所述的方法,其特征在于,還包括:
在采用樣本推薦信息集合對內容推薦模型進行訓練過程中,若當前樣本為第一樣本賬戶的負樣本,則將所述負樣本針對所述第一樣本賬戶的期望推薦概率設置為零;所述負樣本為第一樣本賬戶沒有交互過的樣本推薦信息;
將所述負樣本輸入至所述內容推薦模型,得到針對于所述負樣本向所述第一樣本賬戶進行推薦的預測推薦概率;
基于所述負樣本向所述第一樣本賬戶進行推薦的預測推薦概率,與所述負樣本針對所述第一樣本賬戶的期望推薦概率之間的差異,對所述內容推薦模型進行訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210061526.5/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





