[發明專利]一種基于幾何結構集成的不平衡數據分類系統在審
| 申請號: | 201811238369.0 | 申請日: | 2018-10-23 |
| 公開(公告)號: | CN109492096A | 公開(公告)日: | 2019-03-19 |
| 發明(設計)人: | 王喆;李冬冬;朱宗海;杜文莉 | 申請(專利權)人: | 華東理工大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200237 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 決策區域 弱分類器 向量形式 樣本集合 數據分類系統 幾何結構 測試模塊 集成策略 輸入模塊 訓練模塊 原理設計 超平面 有效地 采集 分工 支撐 轉化 | ||
1.一種基于幾何結構集成的不平衡數據分類系統,其特征在于,
1)輸入模塊,根據不平衡問題的具體描述,將采集到的樣本轉化得到向量形式的樣本集合,其中,所述向量形式的樣本集合包括少數類樣本和多數類樣本;
2)訓練模塊,用于將向量形式的樣本集合進行訓練得到系統的少數類決策區域;
3)測試模塊,輸入待判別的樣本,判斷待判別的樣本是否在所述系統的少數類決策區域中,得到待判別樣本所屬的類別。
2.根據權利要求1所述的基于幾何結構集成的不平衡數據分類系統,其特征在于:
所述訓練模塊包括:訓練子集劃分模塊,弱分類器組訓練模塊,決策區域集成模塊,其中,
1)訓練子集劃分模塊,利用所述的向量形式的樣本集合和輸入參數P,劃分得到P個訓練子集;
2)弱分類器組訓練模塊,利用訓練子集中的訓練樣本,得到當前訓練子集中弱分類器組和弱分類器組中每個弱分類器對應的少數類決策區域;3)決策區域集成模塊,對于所述P個訓練子集中,取每個訓練子集的弱分類器組中每個弱分類器對應的少數類決策區域的交集,得到每個訓練子集的少數類決策區域集合,將P個訓練子集的少數類決策區域集合合并得到系統的少數類決策區域。
3.根據權利要求2所述的基于幾何結構集成的不平衡數據分類系統,其特征在于,訓練子集劃分模塊的處理過程為:
利用輸入參數P,將所述向量形式的樣本集合中多數類樣本隨機劃分為P個子集,將P個多數樣本子集分別和原始樣本集合中少數類樣本合并,形成P個訓練子集。
4.根據權利要求2所述的基于幾何結構集成的不平衡數據分類系統,其特征在于,弱分類器組訓練模塊的訓練過程為:
1)訓練集樣本初始化:對于P個訓練子集,其中第i個訓練子集的弱分類器組訓練集Fi,Fi初始值為整個訓練子集;
2)弱分類器訓練:計算訓練集Fi中所有少數類樣本的中心點,將距離少數類樣本中心點最遠的那個多數類樣本點作為一個超圓的質心,然后將距離所述質心最近的一個少數類樣本點作為切點,得到一個包含多數類樣本超圓,計算質心與切點的歐式距離作為超圓的半徑,過切點做超圓的切線得到超圓的支撐超平面;將超圓內部的多數類樣本,投影到質心向切點的方向向量上,將投影距離最大的點作為閾值點,然后將該超平面繼續往質心方向平移,直到移動至閾值點;所述移動后的支撐超平面即為弱分類器的分類邊界,分類邊界表達式為:
{x|wTx+θ≤0,x∈S}
其中,S是所形成的超圓的支撐超平面,w是支撐超平面的法向量,θ是支撐超平面的閾值,使閾值點經過支撐超平面,x是在超圓中的多數類樣本;
利用所得到的分類邊界,在訓練當前弱分類器過程中,將正確識別的少數類樣本刪除,然后超圓質心在剩余的少數類中,將距離所述超圓的質心最近的一個少數類樣本點作為切點,再做支撐超平面,并將正確識別的少數類樣本繼續刪除,所述過程直到所有少數類樣本被去除為止,利用所有支撐超片面,得到該弱分類器輸出的少數類決策區域為:
其中,H為該弱分類器對應的分類邊界數量,下標k表示該弱分類器中分類邊界的序號,MinDomainj為該弱分類器輸出的少數類決策區域,上標j表示這個第i個訓練子集中第j個弱分類器;利用輸入的參數R和訓練樣本的不平衡率(IR),如果MinDomainj外的多數類樣本的數量大于IR乘以R,則記該弱分類器對應的少數類決策區域MinDomainj,否則拋棄該弱分類器對應的少數類決策區域;
3)新訓練集生成:刪除訓練集Fi中,MinDomainj外的多數類樣本,記為Fi’,如果訓練集Fi’中還有多數類樣本,更新訓練集,置Fi=Fi’,重復步驟2)和步驟3),;
4)直到訓練集Fi中只有少數類樣本,得到當前訓練子集中全部弱分類器和弱分類器組中每個弱分類器對應的少數類決策區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東理工大學,未經華東理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811238369.0/1.html,轉載請聲明來源鉆瓜專利網。





