[發明專利]行為預測模型的訓練方法及裝置有效
| 申請號: | 202011626281.3 | 申請日: | 2020-08-14 |
| 公開(公告)號: | CN112581191B | 公開(公告)日: | 2022-07-19 |
| 發明(設計)人: | 莊晨熠;張志強;劉子奇;周俊;譚譯澤;魏建平;劉致寧;吳鄭偉;顧進杰;漆遠;張冠男 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06K9/62;G06N3/04;G06N3/08;G06V10/764;G06V10/762;G06V10/80;G06V10/82 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 陳婧玥;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行為 預測 模型 訓練 方法 裝置 | ||
本說明書實施例提供一種行為預測模型的訓練方法,包括:針對目標對象,獲取基于多個種子用戶形成的多個正樣本,其中任意的第一正樣本包括,與第一種子用戶對應的第一用戶特征和正例標簽,此標簽指示對應用戶是被確定為對目標對象做出特定行為的用戶;基于多個種子用戶各自的用戶特征,采用無監督的離群點檢測算法,確定第一種子用戶的離群分數,作為針對行為預測任務的第一訓練權重;利用包括上述多個正樣本以及預先獲取的多個負樣本,對第一行為預測模型進行第一訓練,具體包括:將第一用戶特征輸入第一行為預測模型中,結合得到的行為預測結果和上述正例標簽,確定行為預測損失,并利用第一訓練權重對其進行加權處理,以訓練第一行為預測模型。
本申請是分案申請,其基于在2020年8月14日提出的發明名稱為“行為預測模型的訓練方法及裝置”,申請號為:202010819192.4的專利申請而提出。
技術領域
本說明書實施例涉及計算機技術領域,尤其涉及一種行為預測模型的訓練方法及裝置。
背景技術
當前,服務平臺通常會向用戶進行產品或內容等業務對象的推薦或推送,例如,推薦一些網絡課程、服裝商品、廣告圖片等。隨著業務對象數量的累積增長,以及不斷涌現新的業務對象,為了提高用戶體驗,需要及時、準確地向用戶推薦符合其需求和偏好的業務對象,相應地,服務平臺可以利用機器學習模型預測用戶行為,具體預測某用戶是否會對某業務對象做出特定行為,從而根據預測結果確定是否向該某用戶推薦該某業務對象,例如,通過預測某用戶是否會對某篇文章進行瀏覽,確定是否向該用戶推送該篇文章,又例如,通過預測某用戶是否會購買某商品,確定是否向該用戶推薦該商品。
顯然,希望上述針對用戶行為的預測能夠盡可能的及時、準確。然而,目前預測用戶行為的方式較為單一,預測的速度和準確度也十分有限。因此,需要一種方案,可以有效提高用戶行為預測的及時性和準確性。
發明內容
采用本說明書描述的行為預測模型的訓練方法及裝置,可以同時有效提高行為預測模型的訓練速度和模型性能,從而提高用戶行為預測的及時性和準確性。
根據第一方面,提供一種行為預測模型的訓練方法,包括:確定針對目標對象的多個樣本用戶,其中任一的第一樣本用戶對應第一樣本硬標簽,該第一樣本硬標簽指示該第一樣本用戶是否對所述目標對象做出特定行為;基于預先確定的嵌入向量集,確定對應于所述第一樣本用戶的樣本用戶特征向量,并且,確定對應于所述目標對象的目標對象特征向量;其中,所述嵌入向量集是利用訓練后的圖神經網絡對構建的二部圖進行圖嵌入處理而確定;所述二部圖包括對應于多個用戶的多個用戶節點,對應于多個對象的多個對象節點,以及用戶節點向對象節點做出所述特定行為而形成的連接邊,所述嵌入向量集中包括所述多個用戶的多個用戶特征向量和所述多個對象的多個對象特征向量;將所述樣本用戶特征向量輸入第一行為預測模型中,得到行為預測結果;基于所述行為預測結果和所述第一樣本硬標簽,確定第一損失項;基于所述樣本用戶特征向量和所述目標對象特征向量,確定所述第一樣本用戶對該目標對象做出該特定行為的特定行為概率,作為第一樣本軟標簽;基于所述行為預測結果和所述第一樣本軟標簽,確定第二損失項;利用所述第一損失項和第二損失項,訓練所述第一行為預測模型。
根據第二方面,提供一種行為預測模型的訓練方法,包括:針對目標對象,獲取基于多個種子用戶形成的多個正樣本,其中任意的第一正樣本包括,與第一種子用戶對應的第一用戶特征和正例標簽,該正例標簽指示出,對應用戶是被確定為對所述目標對象做出特定行為的用戶;基于所述多個種子用戶各自的用戶特征,采用無監督的離群點檢測算法,確定所述第一種子用戶的離群分數,作為針對行為預測任務的第一訓練權重;利用針對所述行為預測任務的訓練樣本集,對第一行為預測模型進行第一訓練,所述訓練樣本集包括所述多個正樣本以及預先獲取的多個負樣本;所述第一訓練具體包括:將所述第一用戶特征輸入第一行為預測模型中,得到對應的行為預測結果;基于所述行為預測結果和所述正例標簽,確定行為預測損失,并利用所述第一訓練權重對該行為預測損失進行加權處理,得到加權損失;利用所述加權損失,訓練所述第一行為預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011626281.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于汽車座椅用皮革的表面處理方法
- 下一篇:催化劑的制備系統及其控制方法





