[發明專利]一種數據處理方法及裝置、存儲介質在審
| 申請號: | 201910754310.5 | 申請日: | 2019-08-15 |
| 公開(公告)號: | CN112395273A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 黃剛 | 申請(專利權)人: | 中移(蘇州)軟件技術有限公司;中國移動通信集團有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/2458;G06K9/62 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 王姍姍;張穎玲 |
| 地址: | 215163 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 存儲 介質 | ||
1.一種數據處理方法,其特征在于,所述方法包括:
當根據預設樣本數據獲取到樣本特征數據時,利用預設特征選擇算法,構建所述樣本特征數據的決策樹,得到至少兩棵決策樹,所述至少兩棵決策樹包括所述樣本特征數據對應的初始特征集合和所述初始特征集合中每個特征在所述至少兩棵決策樹中每棵決策樹的構建信息;
根據至少兩個所述構建信息中每個所述構建信息的不確定性指數和分裂次數,計算所述每個特征的全局重要度,從而得到所述初始特征集合對應的全局重要度集合;
根據所述全局重要度集合,從所述初始特征集合中選擇滿足重要度條件的目標特征集合;
當獲取到待處理數據時,根據所述目標特征集合對所述待處理數據進行特征數據的轉換處理,以根據轉換處理后的待處理數據進行預測處理。
2.根據權利要求1所述的方法,其特征在于,所述利用預設特征選擇算法,構建所述樣本特征數據的決策樹,得到至少兩棵決策樹之前,所述方法還包括:
確定基學習器;
相應地,所述利用預設特征選擇算法,構建所述樣本特征數據的決策樹,得到至少兩棵決策樹,包括:
根據所述預設特征選擇算法,利用所述基學習器對所述樣本特征數據進行迭代構建決策樹,得到所述至少兩棵決策樹。
3.根據權利要求1所述的方法,其特征在于,所述根據至少兩個所述構建信息中每個所述構建信息的不確定性指數和分裂次數,計算所述每個特征的全局重要度,包括:
根據至少兩個所述構建信息中每個所述構建信息的所述不確定性指數,計算所述每個特征在所述至少兩棵決策樹的不確定性指數均值;
根據至少兩個所述構建信息中每個所述構建信息的所述分裂次數,計算所述每個特征在所述至少兩棵決策樹的分裂次數總和;
根據所述不確定性指數均值和所述分裂次數總和,得到所述每個特征的所述全局重要度。
4.根據權利要求1所述的方法,其特征在于,所述根據至少兩個所述構建信息中每個所述構建信息的不確定性指數和分裂次數,計算所述每個特征的全局重要度之前,所述方法還包括:
獲取所述每個特征在所述至少兩棵決策樹的每棵決策樹中的至少兩個分支;
計算所述至少兩個分支中每個分支對應的子不確定性指數;
根據至少兩個所述子不確定性指數,計算每個所述構建信息的所述不確定性指數,從而得到至少兩個所述構建信息中的所述不確定性指數。
5.根據權利要求1所述的方法,其特征在于,所述根據所述全局重要度集合,從所述初始特征集合中選擇滿足重要度條件的目標特征集合,包括:
基于所述全局重要度集合對所述初始特征集合中的特征進行排序,得到排序后的初始特征集合,所述排序后的初始特征集合包括n個特征,n為大于等于1的正整數;
當所述排序后的初始特征集合為依據全局重要度的倒序排列時,從所述排序后的初始特征集合中選擇第1個特征,并確定所述第1個特征的預測準確率P1;
從所述排序后的初始特征集合中選擇第2個特征,并確定所述第2個特征的預測準確率P2;
根據所述重要度條件,從所述排序后的初始特征集合中選擇第k個特征,并確定所述第k個特征的預測準確率Pk,直到預設數量c個Pk-c+1至Pk依次降低時,停止選擇特征,并將已選擇出的k-c+1個特征作為所述目標特征集合,其中,k為大于等于3且小于等于n的正整數,c為大于等于3且小于等于k的正整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中移(蘇州)軟件技術有限公司;中國移動通信集團有限公司,未經中移(蘇州)軟件技術有限公司;中國移動通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910754310.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:燃燒試驗臺架
- 下一篇:一種血糖測量探頭和血糖測量裝置和方法





