[發明專利]一種基于粗糙集和群智能的特征選擇方法在審
| 申請號: | 201810589510.5 | 申請日: | 2018-06-08 |
| 公開(公告)號: | CN108875895A | 公開(公告)日: | 2018-11-23 |
| 發明(設計)人: | 胡玉榮;余晨陽;余建國;胡斌;李祥琴;李冉;田雯;陸焱 | 申請(專利權)人: | 荊楚理工學院 |
| 主分類號: | G06N3/00 | 分類號: | G06N3/00;G06N99/00;G06F17/30 |
| 代理公司: | 武漢智元知識產權代理事務所(普通合伙) 42234 | 代理人: | 張炳楠;謝蓉 |
| 地址: | 448000 *** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 最優特征子集 特征選擇 粗糙集 個人信用 評分指標 數據處理與分析 商業數據 特征子集 智能 初始化 大數據 互信息 可行解 迭代 去除 噪聲 收斂 種群 篩選 輸出 全局 銀行 分析 | ||
1.一種基于粗糙集和群智能的特征選擇方法,其特征在于,所述方法包括如下步驟:
步驟1:設置方法的參數;
步驟2:利用粗糙集和互信息知識,計算出特征核;
以及任選以下步驟中的一步或多步:
步驟3:初始化種群;
步驟4:計算可行解的適應值、個體極值Pbest和全局極值Gbest;
步驟5:進行迭代;
步驟6:輸出最優特征子集REDU。
2.根據權利要求1所述的特征選擇方法,其特征在于,步驟1中,所述參數包括:種群大小M,最大迭代數MCN,跳躍閾值JUMP,三個參數Cw、Cp和Cg,分類能力重要因子α和特征子集長度重要因子β。
3.根據權利要求1或2所述的特征選擇方法,其特征在于,步驟2中,所述特征核記為CORE;
優選地,所述步驟2可以包括:首先令然后對每一個a∈C,若I(C-{a};D)<I(C;D),則CORE=CORE∪{a};
優選地,如果I(CORE;D)=I(C;D),則REDU=CORE,進行步驟6;否則,進行步驟3。
4.根據權利要求1-3任一項所述的特征選擇方法,其特征在于,所述步驟3包括以下具體步驟:
步驟3.1 解的表達;特征選擇問題可用一個二進制位串來表示一個解;設數據集的條件特征個數為N,則可用N位二進制位串表示,取“1”的位表示選擇該特征,取“0”則表示不選;
步驟3.2 根據公式(1)計算特征q(q∈C-CORE)的重要性;
SGF(q)=I(CORE∪q;D)-I(CORE;D) (1)
步驟3.3 根據公式(2)計算特征q在特征集中出現的概率P(q);
其中,所有特征出現概率的最小值為SGFmin,最大值為SGFmax;
步驟3.4 初始化種群,產生M個可行解;第i個可行解Xi=(xi1,xi2,...,xiN)中的第j位可根據公式(3)進行計算xij:
其中,i∈{1,2,...,M},j∈{1,2,...,N},q為第i個可行解的第j位所對應的特征,rand()產生[0,1]之間的隨機函數。
5.根據權利要求1-4任一項所述的特征選擇方法,其特征在于,所述步驟4優選根據公式(4)計算可行解Xi所對應特征子集R的適應值、個體極值Pbest和全局極值Gbest;
其中,|R|表示特征子集R的基數,|C|表示條件特征集C的基數;I(R;D)表示特征子集R和決策特征集D之間的互信息,I(C;D)表示條件特征集C和決策特征集D之間的互信息;如果I(R;D)=I(C;D),則表明特征子集R和條件特征集C具有相同的分類能力;參數α表示特征子集R的分類能力重要性,參數β表示特征子集R的基數重要性,且α,β∈[0,1],α+β=1;參數α和β是對特征子集R的分類能力和基數之間的一個權衡;
適應值計算完畢,所有可行解按照適應值由大到小進行排序,取前50%作為雇傭蜂,其余為跟隨蜂;每個可行解的適應值即為Pbest,種群的最大適應值即為Gbest。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于荊楚理工學院,未經荊楚理工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810589510.5/1.html,轉載請聲明來源鉆瓜專利網。





