[發明專利]基于Stacking和翻轉隨機降采樣分類方法、系統、介質及設備在審
| 申請號: | 201810132427.5 | 申請日: | 2018-02-08 |
| 公開(公告)號: | CN108416369A | 公開(公告)日: | 2018-08-17 |
| 發明(設計)人: | 蔣昌俊;閆春鋼;劉關俊;丁志軍;張亞英;張裕威;欒文靜 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 王華英 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 組件分類 測試樣本 分類 集成分類器 原始訓練集 訓練子集 降采樣 翻轉 分布特征 分類結果 數據分類 特征組成 不均衡 分類器 區分度 輸出 表現 | ||
1.一種基于Stacking和翻轉隨機降采樣分類方法,其特征在于,包括:
獲取原始訓練集,將所述原始訓練集劃分為數目大于等于兩個的不同的訓練子集;
為每一所述訓練子集建立數目大于等于兩個的不同的組件分類器;
將每個所述組件分類器的輸出作為特征進行訓練,生成集成分類器;
獲取測試樣本,根據每一所述組件分類器依次分類測試樣本得組件分類結果,以所述組件分類結果為特征組成一新測試樣本,以所述集成分類器分類所述新測試樣本得最終分類結果。
2.根據權利要求1所述的方法,其特征在于,所述獲取原始訓練集,所述將所述原始訓練集劃分為數目大于等于兩個的不同的訓練子集具體包括:
接收所述原始訓練集D;
將所述原始訓練集D分為多數類樣本集合A和少數類樣本集合B;
初始化已抽樣次數i及降采樣次數k;
判斷所述已抽樣次數i是否小于所述降采樣次數k;
若是,則不放回地循環抽取所述多數類樣本集合A中的多數類樣本,其中每次抽取所述多數類樣本的個數n為n=ceil(|B|2/|A|);
以n個所述多數類樣本與所有的少數類樣本構成一訓練子集Di;
若否,則結束劃分所述原始訓練集。
3.根據權利要求2所述的方法,其特征在于,所述為每一所述訓練子集建立數目大于等于兩個的不同的組件分類器具體包括:
初始化有序集合C;
判斷是否已獲取k個所述訓練子集Di;
若是,則訓練每一所述訓練子集Di得到m個不同的所述組件分類器,循環訓練k個所述訓練子集Di;
若否,則結束所述組件分類器訓練;
將所述組件分類器依次放入所述有序集合C中,其中所述有序集合C的樣本數目|C|=c,c=m×k;
獲取校驗集V;
根據每一所述組件分類器對所述校驗集V中的校驗樣本進行分類得校驗分類結果;
將所述校驗分類結果作為特征生成新數據集D′。
4.根據權利要求3所述的方法,其特征在于,所述將每個所述組件分類器的輸出作為特征進行訓練,生成集成分類器具體包括:
獲取所述組件分類器和所述新數據集D′;
以m種驗證算法分別對所述新數據集D′進行m次十折交叉驗證;
記錄m種所述算法在十折交叉驗證中得到m的AUC值;
比較m個AUC值得最大AUC值,得最大AUC值算法;
設定所述最大AUC值算法對應的所述組件分類器為所述集成分類器。
5.根據權利要求1所述的方法,其特征在于,所述獲取測試樣本,根據每一所述組件分類器依次分類測試樣本得組件分類結果,以所述組件分類結果為特征組成一新測試樣本,以所述集成分類器分類所述新測試樣本得最終分類結果具體包括:
獲得測試樣本x、包含所有所述組件分類器的集合C和所述集成分類器;
以所述集合C中的每一所述組件分類器依次對所述測試樣本x進行分類得所述組件分類結果;
將所有所述組件分類結果依次作為特征組成樣本集T;
根據所述集成分類器對所述樣本集T分類得所述最終分類結果;
輸出所述最終分類結果。
6.一種基于Stacking和翻轉隨機降采樣分類系統,其特征在于,包括:數據處理模塊、組件分類器訓練模塊、集成分類器訓練模塊和判斷模塊;
所述數據處理模塊,用于獲取原始訓練集,將所述原始訓練集劃分為數目大于等于兩個的不同的訓練子集;
所述組件分類器訓練模塊,用于為每一所述訓練子集建立數目大于等于兩個的不同的組件分類器;
所述集成分類器訓練模塊,用于將每個所述組件分類器的輸出作為特征進行訓練,生成集成分類器;
所述判斷模塊,用于獲取測試樣本,根據每一所述組件分類器依次分類測試樣本得組件分類結果,以所述組件分類結果為特征組成一新測試樣本,以所述集成分類器分類所述新測試樣本得最終分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810132427.5/1.html,轉載請聲明來源鉆瓜專利網。





