[發明專利]數據指標篩選方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202110037835.4 | 申請日: | 2021-01-12 |
| 公開(公告)號: | CN112818028B | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 牛犇;張莉;陳弘;吳志成 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06N3/02;G06N3/08 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 楊毅玲;劉麗華 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 指標 篩選 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種數據指標篩選方法,其特征在于,所述方法包括:
確定每個數據指標下的多個用戶數據的數據分布,并根據所述數據分布對對應數據指標下的多個用戶數據進行標準化處理;
根據標準化處理得到的標準數據生成每個用戶的標準數據向量,并對每個用戶的標準數據向量進行特征提取,得到多個指標特征數據;
計算所述多個指標特征數據的相關性指標,根據所述相關性指標從所述多個指標特征數據中篩選出多個第一關鍵指標特征數據;
采用最小絕對收縮和選擇算子基于所述多個第一關鍵指標特征數據提取出多個第二關鍵指標特征數據及每個第二關鍵指標特征數據的指標權重;
根據每個第二關鍵指標特征數據的指標權重,使用蒙特卡洛模擬法多次模擬訓練用戶等級預測模型,并根據模擬訓練對應的預測結果從所述多個第二關鍵指標特征數據中篩選出多個目標關鍵指標特征數據,包括:根據所述指標權重對所述多個第二關鍵指標特征數據進行倒序排序,得到關鍵指標特征數據序列;第一次從第一個第二關鍵指標特征數據開始,從所述關鍵指標特征數據序列中選取第一預設比例的第二關鍵指標特征數據,作為第一訓練數據;基于所述第一訓練數據訓練第一用戶等級預測模型,并計算所述第一用戶等級預測模型的第一預測準確度;第二次從第一個第二關鍵指標特征數據開始,從所述關鍵指標特征數據序列中選取第二預設比例的第二關鍵指標特征數據,作為第二訓練數據;基于所述第二訓練數據訓練第二用戶等級預測模型,并計算所述第二用戶等級預測模型的第二預測準確度;判斷所述第二預測準確度是否大于所述第一預測準確度;當所述第二預測準確度大于所述第一預測準確度時,第三次從第一個第二關鍵指標特征數據開始,從所述關鍵指標特征數據序列中選取第三預設比例的第三關鍵指標特征數據,作為第三訓練數據;基于所述第三訓練數據訓練第三用戶等級預測模型,并獲取所述第三用戶等級預測模型的第三預測準確度;判斷所述第三預測準確度是否大于所述第二預測準確度;當所述第三預測準確度大于所述第二預測準確度時,確定選取的第二預設比例的第二關鍵指標特征數據為多個目標關鍵指標特征數據。
2.如權利要求1所述的數據指標篩選方法,其特征在于,所述計算所述多個指標特征數據的相關性指標,根據所述相關性指標從所述多個指標特征數據中篩選出多個第一關鍵指標特征數據包括:
計算所述多個指標特征數據的群體穩定性指標值和信息價值;
根據所述群體穩定性指標值和所述信息價值從所述多個指標特征數據中篩選出多個第一關鍵指標特征數據。
3.如權利要求2所述的數據指標篩選方法,其特征在于,所述根據所述群體穩定性指標值和所述信息價值從所述多個指標特征數據中篩選出多個第一關鍵指標特征數據包括:
獲取所述多個指標特征數據中小于預設群體穩定性指標閾值的群體穩定性指標值對應的第一候選指標特征數據;
對所述第一候選指標特征數據的信息價值進行排序;
獲取排序在前預設數量的信息價值對應的第二候選指標特征數據;
確定所述第二候選指標特征數據為所述多個第一關鍵指標特征數據。
4.如權利要求3所述的數據指標篩選方法,其特征在于,所述根據所述數據分布對對應數據指標下的用戶數據進行標準化處理包括:
當第一數據指標下的第一用戶數據的數據分布為離散型數據分布時,對所述第一用戶數據進行函數擬合得到擬合函數,使用所述擬合函數擬合出缺失數據,將所述缺失數據填充至所述第一用戶數據的對應位置處,得到所述第一數據指標下的多個標準數據;
當第二數據指標下的第二用戶數據的數據分布為連續型數據分布時,使用預設冪函數對所述第二用戶數據進行冪運算,得到所述第二數據指標下的多個標準數據。
5.如權利要求4所述的數據指標篩選方法,其特征在于,所述對每個用戶的標準數據向量進行特征提取,得到多個指標特征數據包括:
為每個用戶的標準數據向量隨機初始化一個初始高維特征向量;
以多個標準數據向量為訓練數據,以對應的高維特征向量為訓練目標,迭代訓練神經網絡模型;
獲取訓練完成的神經網絡模型中的多個指標特征數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110037835.4/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





