[發明專利]模型獲取方法、用戶處理方法、裝置及電子設備在審
| 申請號: | 202110201867.3 | 申請日: | 2021-02-23 |
| 公開(公告)號: | CN113159101A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 熊濤;江曼;洪星蕓 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 任亞娟 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 獲取 方法 用戶 處理 裝置 電子設備 | ||
本發明實施例提供了一種模型獲取方法、用戶處理方法、裝置及電子設備,該方法中,將訓練數據輸入預設的待訓練模型,訓練數據包括樣本用戶對應的多種子訓練數據,不同子訓練數據對應不同的主題,基于待訓練模型中包括的第一自注意力層,根據各個子訓練數據的特征表示確定各個子訓練數據對應的主題權重,根據各個子訓練數據的特征表示以及對應的主題權重,獲取訓練數據的特征表示,根據訓練數據的特征表示對待訓練模型進行訓練,以獲取用戶處理模型。這樣,無需拆分訓練多個子模型,通過主題權重融合多個主題下的子訓練數據進行訓練,即可實現基于多個主題的數據獲取最終所需的用戶處理模型,一定程度上可以簡化訓練過程,減少模型維護成本。
技術領域
本發明屬于網絡技術領域,特別是涉及一種模型獲取方法、用戶處理方法、裝置及電子設備。
背景技術
目前,經常需要獲取模型,以對用戶進行各種各樣的處理。例如,獲取信用評估模型以對用戶進行信用評估,獲取下單率預測模型以對用戶進行下單率預測,等等。在獲取模型時往往需要使用訓練數據進行訓練,但是訓練數據中可能會包括對樣本用戶的覆蓋度不同的多個主題的數據。因此,如何使用多個主題的數據獲取模型,成為人們廣泛關注的問題。
現有技術中,往往是使用不同主題的數據分別獲取對應的子模型,然后,基于這多個子模型獲取最終的模型。這種方式中,訓練過程較為繁瑣,且由于拆分訓練了多個子模型,會導致后續需要同時維護多個模型,維護成本較高。
發明內容
本發明提供一種模型獲取方法、用戶處理方法、裝置及電子設備,以便解決訓練過程較為繁瑣,維護成本較高的問題。
第一方面,本發明提供一種模型獲取方法,所述方法包括:
將訓練數據輸入待訓練模型;所述訓練數據包括樣本用戶對應的多種子訓練數據,不同子訓練數據對應不同的主題;
基于所述待訓練模型中包括的第一自注意力層,根據各個所述子訓練數據的特征表示,確定各個所述子訓練數據對應的主題權重;
根據各個所述子訓練數據的特征表示以及對應的主題權重,獲取所述訓練數據的特征表示;
根據所述訓練數據的特征表示對所述待訓練模型進行訓練,以獲取用戶處理模型。
第二方面,本發明提供一種用戶處理方法,所述方法包括:
將待預測用戶的用戶相關數據輸入預訓練的用戶處理模型;所述用戶相關數據包括所述待預測用戶對應的多種子相關數據,不同子相關數據對應不同的主題;
獲取所述用戶處理模型輸出,以得到所述待預測用戶的目標信息;
其中,所述用戶處理模型是基于上述權利要求1至8任一所述的模型獲取方法生成的。
第三方面,本發明提供一種模型獲取裝置,所述裝置包括:
輸入模塊,用于將訓練數據輸入待訓練模型;所述訓練數據包括樣本用戶對應的多種子訓練數據,不同子訓練數據對應不同的主題;
第一確定模塊,用于基于所述待訓練模型中包括的第一自注意力層,根據各個所述子訓練數據的特征表示,確定各個所述子訓練數據對應的主題權重;
第一獲取模塊,用于根據各個所述子訓練數據的特征表示以及對應的主題權重,獲取所述訓練數據的特征表示;
訓練模塊,用于根據所述訓練數據的特征表示對所述待訓練模型進行訓練,以獲取用戶處理模型。
第四方面,本發明提供一種用戶處理裝置,所述裝置包括:
輸入模塊,用于將待預測用戶的用戶相關數據輸入預訓練的用戶處理模型;所述用戶相關數據包括所述待預測用戶對應的多種子相關數據,不同子相關數據對應不同的主題;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110201867.3/2.html,轉載請聲明來源鉆瓜專利網。





