[發明專利]建模方法、裝置及電子設備在審
| 申請號: | 202011247798.1 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112308170A | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 楊鵬 | 申請(專利權)人: | 維沃移動通信有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 喬珊珊 |
| 地址: | 523863 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 建模 方法 裝置 電子設備 | ||
本申請公開了建模方法、裝置及電子設備,屬于通信技術領域,其中,所述方法包括:按照生成時間先后順序,將樣本數據劃分至N個集合;從生成時間最短的樣本數據所在的目標集合中,確定第一開發樣本;根據所述第一開發樣本,訓練得到第一模型;將第一集合中滿足第一預設條件的異常樣本與所述第一開發樣本合并,得到第二開發樣本;根據所述第二開發樣本,訓練得到第二模型;比較所述第一模型和所述第二模型,將其中之一確定為目標模型;根據所述目標模型,得到最終模型。本申請公開的建模方法,能夠提升所建目標模型的穩定性。
技術領域
本申請實施例涉及數據處理技術領域,尤其涉及一種建模方法、裝置及電子設備。
背景技術
在反欺詐和異常檢測的場景中,經常會使用有監督學習算法建立預測模型。在通常構造訓練樣本的過程中會存在如下兩個問題:問題一,訓練樣本構造過程中經常會選擇不同時間段的數據,但部分業務場景用戶特征會隨時間季節發生變化,致使不同時期的訓練樣本數據分布存在很大差異;問題二,構造的訓練樣本中異常樣本與正常樣本不均衡。
以未成年用戶游戲消費投訴為例,通過歷史消費訂單數據及未成年投訴數據建立有監督算法模型時,將歷史未成年消費投訴用戶訂單標記為異常樣本,非投訴訂單數據標記為正常樣本,未成年不同時間點或季節消費特征不同,不同時間段構造的訓練樣本數據分布不同。現有技術中僅使用近期的訓練樣本數據建模,由于異常樣本量較小、異常樣本與正常樣本不均衡等問題,致使導致所建模型穩定性差。
發明內容
本申請實施例的目的是提供一種建模方法,能夠解決現有的建模方案中存在的所建模型穩定性差的問題。
為了解決上述技術問題,本申請是這樣實現的:
第一方面,本申請實施例提供了一種建模方法,其中,所述方法包括:按照生成時間先后順序,將樣本數據劃分至N個集合;從生成時間最短的樣本數據所在的目標集合中,確定第一開發樣本;根據所述第一開發樣本,訓練得到第一模型;將第一集合中滿足第一預設條件的異常樣本與所述第一開發樣本合并,得到第二開發樣本;其中,所述第一集合為所述N個集合中,除所述目標集合以外的其他一個集合;根據所述第二開發樣本,訓練得到第二模型;比較所述第一模型和所述第二模型,將其中之一確定為目標模型;根據所述目標模型,得到最終模型。
第二方面,本申請實施例提供了一種建模裝置,其中,所述裝置包括:分割模塊,用于按照生成時間先后順序,將樣本數據劃分至N個集合;確定模塊,用于從生成時間最短的樣本數據所在的目標集合中,確定第一開發樣本;第一訓練模塊,用于根據所述第一開發樣本,訓練得到第一模型;合并模塊,用于將第一集合中滿足第一預設條件的異常樣本與所述第一開發樣本合并,得到第二開發樣本;其中,所述第一集合為所述N個集合中,除所述目標集合以外的其他一個集合;第二訓練模塊,用于根據所述第二開發樣本,訓練得到第二模型;比較模塊,用于比較所述第一模型和所述第二模型,將其中之一確定為目標模型;模型確定模塊,用于根據所述目標模型,得到最終模型。
第三方面,本申請實施例提供了一種電子設備,該電子設備包括處理器、存儲器及存儲在所述存儲器上并可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執行時實現如第一方面所述的方法的步驟。
第四方面,本申請實施例提供了一種可讀存儲介質,所述可讀存儲介質上存儲程序或指令,所述程序或指令被處理器執行時實現如第一方面所述的方法的步驟。
第五方面,本申請實施例提供了一種芯片,所述芯片包括處理器和通信接口,所述通信接口和所述處理器耦合,所述處理器用于運行程序或指令,實現如第一方面所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于維沃移動通信有限公司,未經維沃移動通信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011247798.1/2.html,轉載請聲明來源鉆瓜專利網。





