[發明專利]一種基于二進制蟻群算法的特征選擇方法及系統在審
| 申請號: | 201611246351.6 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN106599936A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 葉志偉;王明威;王春枝;徐煒;侯玉倩;楊娟;張旭;劉偉 | 申請(專利權)人: | 湖北工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/00;G06N3/12 |
| 代理公司: | 北京高沃律師事務所11569 | 代理人: | 王加貴 |
| 地址: | 430000 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 二進制 算法 特征 選擇 方法 系統 | ||
技術領域
本發明涉及模式識別技術領域,特別是涉及一種基于二進制蟻群算法的特征選擇方法及系統。
背景技術
特征選擇又名特征子集選擇,是指從原始特征中選擇出一些最有效特征以降低數據集維度的過程,是提高學習算法性能的一個重要手段,也是模式識別中關鍵的數據預處理步驟。
從本質上說特征選擇就是一個搜索最優特征子集的過程,即對離散的集合進行優化的過程。蟻群算法特別適合于在離散空間的多個解中尋求最優解。因此可以將蟻群算法應用到特征選擇中。
二進制蟻群算法(BACO,binary ant colony optimization)是一種以原始蟻群算法為基礎的群體智能算法。常被用來求解連續優化問題。然而二進制蟻群算法一開始的解是隨機生成的,沒有可以利用的能見度信息,導致二進制蟻群算法的收斂速度較慢,特征選擇的效率受到限制。
發明內容
本發明的目的是提供一種基于二進制蟻群算法的特征選擇方法及系統,在利用二進制蟻群算法進行特征選擇前提供合適的能見度信息,提高二進制蟻群算法的收斂速度,提高特征選擇的效率。
為實現上述目的,本發明提供了如下方案:
一種基于二進制蟻群算法的特征選擇方法,包括:
獲取需要進行特征選擇的訓練樣本集;
對所述訓練樣本集進行特征抽取,得到樣本特征集;
利用二進制遺傳算法對所述樣本特征集進行分類并尋求最大遺傳適應度,得到最優解;所述遺傳適應度為使所述二進制遺傳算法的結果接近目標結果的程度;
根據所述最優解設置二進制蟻群算法的能見度信息,對所述二進制蟻群算法的蟻群進行初始化;
利用包含所述能見度信息的二進制蟻群算法對所述樣本特征集進行特征選擇。
可選的,所述利用二進制遺傳算法對所述樣本特征集進行分類并尋求最大遺傳適應度,得到最優解,具體包括:
針對所述樣本訓練集對所述二進制遺傳算法的參數進行初始化,生成遺傳種群;其中所述遺傳個體的長度設置為所述樣本特征集所包含的特征數量;所述遺傳個體為構成遺傳種群的單位;
對所述遺傳種群進行解碼,得到第一特征子集;
利用所述第一特征子集對所述訓練樣本集進行分類,得到第一分類結果;
計算所述第一分類結果的第一分類準確率;
根據所述第一分類準確率求解對應的遺傳個體的遺傳適應度;
經過多次遺傳操作,求解所述遺傳適應度的最大值,得到最大遺傳適應度;所述最優解即為所述最大遺傳適應度的遺傳個體。
可選的,所述根據所述最優解設置二進制蟻群算法的能見度信息,對所述二進制蟻群算法的蟻群進行初始化,具體包括:
獲取所述最優解的二進制數值;
將所述二進制數值中的1替換為第一預設數字,將所述二進制數值中的0替換為第二預設數字,得到二進制蟻群算法的能見度信息;
根據所述能見度信息對所述二進制蟻群算法的參數進行初始化,生成蟻群,所述蟻群為多個螞蟻個體構成的集合。
可選的,所述利用包含所述能見度信息的二進制蟻群算法對所述樣本特征集進行特征選擇,具體包括:
在所述蟻群中搜索候選解,得到候選解集合;
對所述候選解集合進行解碼,得到第二特征子集;
利用所述第二特征子集對所述訓練樣本集進行分類,得到第二分類結果;
計算所述第二分類結果的第二分類準確率;
根據所述第二分類準確率求解對應的螞蟻個體的螞蟻適應度;
經過多次運算確定最優螞蟻個體;所述最優螞蟻個體為所述螞蟻適應度最大的螞蟻個體;
解碼出所述最優螞蟻個體對應的最優特征子集。
本發明還公開了一種基于二進制蟻群算法的特征選擇系統,包括:
樣本獲取模塊,用于獲取需要進行特征選擇的訓練樣本集;
特征抽取模塊,用于對所述訓練樣本集進行特征抽取,得到樣本特征集;
遺傳尋優模塊,用于利用二進制遺傳算法對所述樣本特征集進行分類并尋求最大遺傳適應度,得到最優解;所述遺傳適應度為使所述二進制遺傳算法的結果接近目標結果的程度;
能見度生成模塊,用于根據所述最優解設置二進制蟻群算法的能見度信息,對所述二進制蟻群算法的蟻群進行初始化;
蟻群選擇模塊,用于利用包含所述能見度信息的二進制蟻群算法對所述樣本特征集進行特征選擇。
可選的,所述遺傳尋優模塊,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北工業大學,未經湖北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611246351.6/2.html,轉載請聲明來源鉆瓜專利網。





