[發明專利]基于神經網絡和樹模型的人員甄選方法、裝置及設備有效
| 申請號: | 202110778099.8 | 申請日: | 2021-07-09 |
| 公開(公告)號: | CN113240213B | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 羅蘭;張巧麗;張浩然 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/10;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 李翔宇 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經網絡 模型 人員 甄選 方法 裝置 設備 | ||
1.一種基于神經網絡和樹模型的人員甄選方法,其特征在于,包括:
獲取初始歷史用戶數據集,將所述初始歷史用戶數據集進行數據預處理、核心字段因子提取及字段因子維度劃分,得到與初始歷史用戶數據集中每一條初始歷史用戶數據對應的維度劃分數據子集,并根據初始歷史用戶數據集獲取與每一維度劃分數據子集分別對應的輸出結果取值集合,包括:將所述初始歷史用戶數據集進行缺失值補全及異常數據的預處理,得到初次處理歷史用戶數據集;將所述初次處理歷史用戶數據集依次進行因子顯著性檢驗和共線性檢驗,得到與所述初次處理歷史用戶數據集對應的篩選后字段因子集合;其中,所述初始歷史用戶數據集中包括多條初始歷史用戶數據,各條初始歷史用戶數據中包括字段信息的維度及個數均相同;
以各條初始歷史用戶數據對應的維度劃分數據子集及與每一維度劃分數據子集分別對應的輸出結果取值集合為第一訓練集對待訓練梯度提升決策樹模型進行訓練,得到梯度提升決策樹模型;
選取各條初始歷史用戶數據對應的維度劃分數據子集中作為輸入數據的維度劃分數據子集,并輸入至所述梯度提升決策樹模型進行運算,得到與各條初始歷史用戶數據對應的多維度輸出結果;
以各條初始歷史用戶數據對應的多維度輸出結果為第二訓練集對待訓練卷積神經網絡進行訓練,得到卷積神經網絡;
以各條初始歷史用戶數據對應的維度劃分數據子集為第三訓練集對待訓練第一LightGBM模型進行訓練,得到用于根據用戶的維度劃分數據子集預測第一輸出結果的第一LightGBM模型;
以各條初始歷史用戶數據對應的維度劃分數據子集為第四訓練集對待訓練第二LightGBM模型進行訓練,得到用于根據用戶的維度劃分數據子集預測第二輸出結果的第二LightGBM模型;其中,所述第二輸出結果與所述第一輸出結果不相同;以及
若接收到用戶端上傳的待分析用戶數據集,獲取所述待分析用戶數據集中每一待分析用戶數據對應的當前維度劃分數據子集,將每一待分析用戶數據對應各當前維度劃分數據子集轉化為對應的輸入向量集,并將輸入向量集分別輸入至所述梯度提升決策樹模型、所述卷積神經網絡、所述第一LightGBM模型、所述第二LightGBM模型進行運算,得到與所述待分析用戶數據集中每一待分析用戶數據分別對應的綜合預測結果集;其中,每一待分析用戶數據分別對應的綜合預測結果集包括所述梯度提升決策樹模型輸出的第一預測結果,所述卷積神經網絡輸出的第二預測結果,所述第一LightGBM模型輸出的第三預測結果和所述第二LightGBM模型輸出的第四預測結果;
所述將所述初次處理歷史用戶數據集依次進行因子顯著性檢驗和共線性檢驗,得到與所述初次處理歷史用戶數據集對應的篩選后字段因子集合,包括:將所述初次處理歷史用戶數據集所包括字段組成的字段因子集合進行因子顯著性檢驗,得到所述字段因子集合中各個字段因子分別對應的信息量值;將所述字段因子集合中字段因子的信息量值低于預設信息量閾值的字段因子刪除,得到初次篩選后字段因子集合;將所述初次篩選后字段因子集合中的近似字段因子作為同類字段因子進行去重,得到篩選后字段因子集合;其中,所述初次篩選后字段因子集合中若存在有字段因子之間的皮爾遜相關系數超出預設相關系數閾值,對應的字段因子作為近似字段因子。
2.根據權利要求1所述的基于神經網絡和樹模型的人員甄選方法,其特征在于,所述獲取初始歷史用戶數據集,將所述初始歷史用戶數據集進行數據預處理、核心字段因子提取及字段因子維度劃分,得到與初始歷史用戶數據集中每一條初始歷史用戶數據對應的維度劃分數據子集,并根據初始歷史用戶數據集獲取與每一維度劃分數據子集分別對應的輸出結果取值集合,還包括:
將所述初次處理歷史用戶數據集中與所述篩選后字段因子集合相同的字段信息及字段取值保留,將所述初次處理歷史用戶數據集中與所述篩選后字段因子集合不相同的字段信息及字段取值刪除,得到二次處理歷史用戶數據集;
將所述篩選后字段因子集合根據預先設置的字段信息分組策略進行字段因子分組,得到字段因子分組結果;其中,所述字段因子分組結果包括多個子分組結果;
將所述二次處理歷史用戶數據集中每一個二次處理歷史用戶數據根據所述字段因子分組結果對應進行字段因子劃分,得到與每一個二次處理歷史用戶數據對應的維度劃分數據子集;其中,每一個二次處理歷史用戶數據包括的維度劃分數據子集的總個數與所述字段因子分組結果中包括的子分組結果的總個數相等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110778099.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:掃描圖像重建方法、檢查設備及計算機可讀存儲介質
- 下一篇:顯示面板及顯示裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





