[發明專利]一種模型訓練方法、裝置、設備及存儲介質在審
| 申請號: | 202010141137.4 | 申請日: | 2020-03-03 |
| 公開(公告)號: | CN111507471A | 公開(公告)日: | 2020-08-07 |
| 發明(設計)人: | 成梭宇 | 申請(專利權)人: | 上海喜馬拉雅科技有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06Q10/04;G06F16/9035;G06F17/18 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 胡彬 |
| 地址: | 201203 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種模型訓練方法、裝置、設備及存儲介質。其中,該方法包括:按照用戶行為順序從數據庫獲取M條樣本數據,根據樣本數據中至少兩個用戶行為的標簽確定得到M條樣本數據的至少兩個行為損失函數,進而根據M條樣本數據的至少兩個行為損失函數確定損失函數,并根據損失函數訓練預測模型,這樣不僅可以從多個維度進行模型預測,也可以考慮到用戶多種行為之間的先后關系,從而提高預測模型預測的準確率。
技術領域
本發明實施例涉及信息處理技術,尤其涉及一種模型訓練方法、裝置、設備及存儲介質。
背景技術
在信息推薦領域,通常需要通過訓練模型以實現向用戶推薦各類信息。但是,目前常用的方式是單獨使用用戶的某種特定行為來訓練模型,例如,使用展示和點擊數據單獨訓練預測用戶點擊率的模型,或者使用展示和播放數據單獨訓練用戶播放率的模型,這種方式只采用單一的用戶行為進行模型訓練與決策,基于模型向用戶推薦各類信息的準確度不高。
發明內容
本發明提供一種模型訓練方法、裝置、設備及存儲介質,能夠從多個維度進行模型預測,也可以考慮到用戶多種行為之間的先后關系,從而提高預測模型預測的準確率。
第一方面,本發明實施例提供了一種模型訓練方法,該方法包括:
按照用戶行為順序從數據庫獲取M條樣本數據,樣本數據包括用戶標識、信息標識、至少兩個用戶行為的標簽,其中,M為大于等于1的整數;
根據至少兩個用戶行為的標簽確定M條樣本數據的至少兩個行為損失函數其中,k表示第k條樣本數據,1≤k≤M,n表示用戶行為數,n為大于1 的整數;
根據M條樣本數據的至少兩個行為損失函數確定損失函數L;
根據損失函數L訓練預測模型。
第二方面,本發明實施例還提供了一種模型訓練裝置,該裝置包括:
獲取模塊,用于按照用戶行為順序從數據庫獲取M條樣本數據,樣本數據包括用戶標識、信息標識、至少兩個用戶行為的標簽,其中,M為大于等于1 的整數;
確定模塊,用于根據至少兩個用戶行為的標簽確定M條樣本數據的至少兩個行為損失函數其中,k表示第k條樣本數據,1≤k≤M,n表示用戶行為數,n為大于1的整數;
確定模塊,還用于根據M條樣本數據的至少兩個行為損失函數確定損失函數L;
訓練模塊,用于根據損失函數L訓練預測模型。
第三方面,本發明實施例還提供了一種設備,該設備包括:
存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,當處理器執行計算機程序時,實現如本發明第一方面提供的模型訓練方法。
本發明實施例提供了一種模型訓練方法、裝置、設備及存儲介質,具體為按照用戶行為順序從數據庫獲取M條樣本數據,根據樣本數據中至少兩個用戶行為的標簽確定得到M條樣本數據的至少兩個行為損失函數,進而根據M條樣本數據的至少兩個行為損失函數確定損失函數,并根據損失函數訓練預測模型,這樣不僅可以從多個維度進行模型預測,也可以考慮到用戶多種行為之間的先后關系,從而提高預測模型預測的準確率。
附圖說明
圖1是本發明實施例中的模型訓練方法流程圖;
圖2是本發明實施例中的預測模型結構示意圖;
圖3是本發明實施例中的模型訓練裝置結構示意圖;
圖4是本發明實施例中的設備結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海喜馬拉雅科技有限公司,未經上海喜馬拉雅科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010141137.4/2.html,轉載請聲明來源鉆瓜專利網。





