[發明專利]一種基于差分進化優化近鄰成分分析的特征選擇方法在審
| 申請號: | 201810233510.1 | 申請日: | 2018-03-06 |
| 公開(公告)號: | CN108446735A | 公開(公告)日: | 2018-08-24 |
| 發明(設計)人: | 童楚東;俞海珍;朱瑩 | 申請(專利權)人: | 寧波大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 315211 浙江省寧波*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 成分分析 目標函數 算法 差分進化算法 全局最優 特征權重 特征選擇 優化 進化 規則化參數 分類特征 角度優化 權重系數 傳統的 非局部 規劃化 最優化 向量 保證 | ||
1.一種基于差分進化優化近鄰成分分析的特征選擇方法,其特征在于,包括以下步驟:
步驟(1):收集應用對象不同類別y1,y2,…,yC所對應的樣本數據集X1,X2,…,XC,其中,C表示類別總數,第c類數據集包含m個特征的Nc個樣本數據,c=1,2,…,C;
步驟(2):將數據集X1,X2,…,XC組成一個矩陣X∈RN×m,并對X按列實施標準化處理得到X=[x1,x2,…,xN]T∈RN×m從而消除各特征的量綱的影響,其中N=N1+N1+…+NC,xi∈Rm×1表示第i個樣本數據,上標號T表示矩陣或向量的轉置;
步驟(3):設置差分進化算法的參數,包括種群數nP=6m、縮放因子Z=0.6、最大迭代次數Imax≥2000、以及交叉概率p=0.1;
步驟(4):利任意初始化m×nP維的矩陣W=[w1,w2,…,wnP]后,置迭代次數iter=0與k=1;
步驟(5):取矩陣W中第k個列向量作為種群wk∈Rm×1后,根據公式dij=wk|xi-xj|計算矩陣中任意兩樣本點xi與xj之間的距離dij,其中|xi-xj|表示將向量xi-xj中的元素都取絕對值,下標號i,j=1,2,…,N;
步驟(6):根據如下所示公式計算xi選擇xj作為其參考數據點的概率pij:
步驟(7):根據公式fk=∑i∑jzijpij計算第k個種群wk對應的近鄰成分分析目標函數fk,其中zij為二進制數且只在xi與xj屬于同一種類時取值1;
步驟(8):判斷是否滿足條件k<N?若是,置k=k+1后返回步驟(5);若否,得到目標函數向量F=[f1,f2,…,fN]后找出F中最大值fbest所對應的種群wbest,并執行下一步驟(9);
步驟(9):根據如下所示公式為每個種群產生一個對應的變異向量vk:
vk=wk+Z(wbest-wk)+Z(wa-wb) (2)
上式中,下標號a與b為從區間[1,nP]中隨機產生的2個互不相同的整數;
步驟(10):按照如下所示公式對變異向量vk進行修正,即:
上式中,vk,n表示向量vk中的第n個元素,n=1,2,…,m;
步驟(11):根據如下所示公式產生嘗試向量uk∈Rm×1,即:
其中,uk,n與wk,n分別為uk與wk中第n個元素,向量rand∈Rm×1中各元素都是0到1之間均勻分布的任意隨機小數,randn則為隨機向量rand中的第n個元素;
步驟(12):依據如下所示公式更新種群wk,即:
上式中,h(uk)表示將uk作為種群wk的替換值后計算得到的目標函數值;
步驟(13):重復步驟(9)~(12)直至所有種群都更新完畢以得到新矩陣W,并置iter=iter+1;
步驟(14):判斷是否滿足條件iter>Imax?若否,返回步驟(5)繼續執行;若是,則輸出最大目標函數fbest所對應的種群wbest,即為各個特征的相應權重系數;
步驟(15):根據wbest∈Rm×1中各個元素的具體數值大小,將接近于0的元素所對應的特征剔除,那么剩余的特征即為特征選擇后的結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波大學,未經寧波大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810233510.1/1.html,轉載請聲明來源鉆瓜專利網。





