[發明專利]隨機森林模型訓練的方法及模型訓練控制系統有效
申請號: | 201710147698.3 | 申請日: | 2017-03-13 |
公開(公告)號: | CN107632995B | 公開(公告)日: | 2018-09-11 |
發明(設計)人: | 金戈;徐亮;肖京 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
主分類號: | G06F17/30 | 分類號: | G06F17/30 |
代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 隨機 森林 模型 訓練 方法 控制系統 | ||
本發明涉及一種隨機森林模型訓練的方法及模型訓練控制系統,所述隨機森林模型訓練的方法包括:模型訓練控制系統分析模型訓練的條件是否已滿足;若模型訓練的條件已滿足,則確定是否需要對隨機森林模型進行重構性訓練;若需要對所述隨機森林模型進行重構性訓練,則利用樣本數據對所述隨機森林模型進行重構性訓練;若不需要對所述隨機森林模型進行重構性訓練,則利用樣本數據對所述隨機森林模型進行修正性訓練。本發明能夠減少隨機森林模型訓練的次數,減輕系統負擔并提高系統效能。
技術領域
本發明涉及機器學習技術領域,尤其涉及一種隨機森林模型訓練的方法及模型訓練控制系統。
背景技術
在機器學習中,隨機森林是利用多棵樹對樣本數據進行訓練并預測的一種分類器,是一個包含多個決策樹的分類器,決策樹是通過一系列規則對數據進行分類的過程。目前越來越多的提供在線業務(例如,遠程投保、遠程理賠、在線理財等業務)的企業在業務系統中采用隨機森林對用戶進行分類標簽識別,進而根據識別結果對用戶進行精準的業務推薦和辦理。
然而,當有新的數據可供做樣本數據進行迭代訓練以提升模型識別的精確性時,現有的技術方案是同時使用舊的樣本數據及新的樣本數據重新對隨機森林模型進行重構性訓練,重構性訓練指的是需要改變隨機森林模型中決策樹結構的訓練。這種訓練方案通常是一旦有新的樣本數據就執行一次重構性訓練,訓練次數多,特別是在線業務的數據變動頻繁的情況下,訓練過于頻繁,系統負擔過重,影響在線業務系統的效能及在線業務的有效開展。
發明內容
本發明的目的在于提供一種隨機森林模型訓練的方法及模型訓練控制系統,旨在減少隨機森林模型訓練的次數,減輕系統負擔并提高系統效能。
為實現上述目的,本發明提供一種隨機森林模型訓練的方法,所述隨機森林模型訓練的方法包括:
S1,模型訓練控制系統分析模型訓練的條件是否已滿足;
S2,若模型訓練的條件已滿足,則確定是否需要對隨機森林模型進行重構性訓練;
S3,若需要對所述隨機森林模型進行重構性訓練,則利用樣本數據對所述隨機森林模型進行重構性訓練;
S4,若不需要對所述隨機森林模型進行重構性訓練,則利用樣本數據對所述隨機森林模型進行修正性訓練。
優選地,所述重構性訓練包括所述隨機森林模型的變量的確定性訓練和變量系數的確定性訓練,所述修正性訓練包括所述隨機森林模型的變量系數的確定性訓練。
優選地,所述步驟S1包括:
獲取業務系統中前一次模型訓練結束的時刻至當前時刻的時間段內新增的用戶業務數據的第一數量,若所述第一數量大于第一預設閾值,則模型訓練的條件已滿足;或者
實時或定時檢測是否接收到模型訓練指令,若接收到模型訓練指令,則模型訓練的條件已滿足。
優選地,所述步驟S2包括:
獲取業務系統中前一次重構性訓練結束的時刻至當前時刻的時間段內新增的用戶業務數據的第二數量,若所述第二數量大于第二預設閾值,則確定需要對所述隨機森林模型進行重構性訓練;或者
向預定的終端發送是否需要對所述隨機森林模型進行重構性訓練的詢問請求,若接收到所述終端基于所述詢問請求反饋的確認指令,則確定需要對所述隨機森林模型進行重構性訓練。
優選地,所述步驟S4包括:
S41,根據預定的隨機森林模型的變量與變量系數取值范圍的映射關系,確定各個所述變量對應的變量系數取值范圍;
S42,對各個所述變量在對應的變量系數取值范圍中進行變量系數取值,根據取值后的變量系數對所述隨機森林模型進行修正性訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710147698.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于壓縮輸入數據的數據存儲裝置
- 下一篇:用于移動圖像捕獲和處理的系統和方法