[發明專利]優化梯度提升特征選擇在審
| 申請號: | 202011460925.6 | 申請日: | 2020-12-11 |
| 公開(公告)號: | CN113554178A | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | J.多恩休 | 申請(專利權)人: | SAP歐洲公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06K9/62 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 邵亞麗 |
| 地址: | 德國瓦*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 優化 梯度 提升 特征 選擇 | ||
1.一種方法,包括:
由一個或多個處理器生成用于劃分特征空間的第一決策樹,所述第一決策樹使用第一特征集,所述第一特征集是可用特征集的第一子集;
由所述一個或多個處理器生成第二決策樹,所述第二決策樹對所述第一決策樹進行改進以改善所述特征空間的劃分,所述第二決策樹使用所述第一特征集的零個或更多個特征和不包括在所述第一特征集中的第二特征集,所述第二特征集是所述可用特征集的第二子集;
在數據庫中存儲將所述第一決策樹與所述第一特征集相關聯的第一數據;
在所述數據庫中存儲將所述第二決策樹與所述第二特征集相關聯的第二數據;
從所述可用特征集中刪除所述第二特征集的特征;以及
基于將所述第二決策樹與包括已刪除特征的所述第二特征集相關聯的所述第二數據,生成第三決策樹,所述第三決策樹對所述第一決策樹進行改進以改善所述特征空間的劃分,所述第三決策樹未使用所述已刪除特征。
2.根據權利要求1所述的方法,還包括:
由所述一個或多個處理器生成第四決策樹,所述第四決策樹對所述第一決策樹和所述第二決策樹進行改進以改善所述特征空間的劃分,所述第四決策樹使用所述第一特征集的零個或更多個特征、所述第二特征集的零個或更多個特征、以及不包括在所述第一特征集或所述第二特征集中的第三特征集,所述第三特征集是所述可用特征集的第三子集;
在所述數據庫中存儲將所述第四決策樹與所述第三特征集相關聯的第三數據;以及
基于將所述第四決策樹與不包括已刪除特征的所述第三特征集相關聯的所述第三數據,使用所述第二數據確定所述已刪除特征在所述第二特征集中。
3.根據權利要求1所述的方法,還包括:
確定包括所述第一決策樹和所述第二決策樹的第一模型與包括所述第一決策樹和所述第三決策樹的第二模型之間的質量差;以及
基于所述質量差和預定閾值,使用所述第一模型劃分所述特征空間。
4.根據權利要求3所述的方法,還包括:
基于驗證數據集確定所述第一模型的第一質量;
基于所述驗證數據集確定所述第二模型的第二質量;并且其中
所述質量差的確定基于所述第一質量和所述第二質量。
5.根據權利要求3所述的方法,其中,確定所述第一模型和所述第二模型之間的質量差包括:
通過確定用于所述第一決策樹的第一誤差度量和用于所述第二決策樹的第二誤差度量,確定所述第一模型的質量;
在所述數據庫中存儲所述第一誤差度量;以及
通過訪問存儲的用于所述第一決策樹的所述第一誤差度量并確定用于所述第三決策樹的第三誤差度量,確定所述第二模型的質量。
6.根據權利要求1所述的方法,還包括:
確定包括所述第一決策樹和所述第二決策樹的第一模型與包括所述第一決策樹和所述第三決策樹的第二模型之間的質量差;以及
基于所述質量差和預定閾值,從所述可用特征集中刪除第二特征。
7.根據權利要求1所述的方法,還包括:
基于驗證數據集確定所述第一決策樹的第一質量;
基于所述驗證數據集,結合所述第二決策樹確定所述第一決策樹的第二質量;
在所述數據庫中存儲將所述第一質量與所述第一決策樹相關聯的第三數據;以及
在所述數據庫中存儲將所述第二質量與所述第二決策樹相關聯的第四數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于SAP歐洲公司,未經SAP歐洲公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011460925.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:半導體元件的制造方法
- 下一篇:一種用于生物育種的DNA反應試劑盒





