[發明專利]基于RealifF的特征選擇方法在審
| 申請號: | 202011356846.0 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112488180A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 王紅濱;劉宜陶;何鳴;王勇;王念濱;周連科;崔琎 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 哈爾濱市松花江專利商標事務所 23109 | 代理人: | 劉強 |
| 地址: | 150001 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 realiff 特征 選擇 方法 | ||
1.基于RealifF的特征選擇方法,其特征在于包括以下步驟:
步驟一:獲取原始特征集;
步驟二:將原始特征集中方差小于方差閾值的特征刪除,得到特征集M;
步驟三:根據特征集M構建距離相關性矩陣;
步驟四:將距離相關性矩陣中小于距離相關性矩陣閾值的特征進行融合,并將融合后的特征與距離相關性矩陣中不小于距離相關性矩陣閾值的特征組成特征集N;
步驟五:將特征集N中每個特征所對應的權重重置為0,即W(i)=0,i=0,1,2,...n;
步驟六:在特征集N中隨機選擇一個樣本O,然后找出與樣本O同類的K個近鄰Qj,j=1,2,...,k,再找出與樣本O不同類的K個近鄰Vj(c),c=1,2,...C,j=1,2,...k,其中C為類別數;
步驟七:利用Qj和Vj(c)對特征重置后的特征集N中特征的權重進行迭代更新,得到更新后的特征權重W(i),更新公式為:
其中,d(i,O,Qj)代表O和Qj關于特征i的距離,P(c)表示第c類目標的概率,l為迭代次數,5<l<10;
步驟八:當特征重置后的特征集N中特征的權重全部更新后,將更新后的權重按降序排列;
步驟九:選取排列前70%的權重所對應的特征構成特征子集。
2.根據權利要求1所述的基于RealifF的特征選擇方法,其特征在于所述方差表示為:
其中,Hlnlm是lm樣本第ln個特征值,并且lm=1,2,3...Lm,Ln表示特征集的樣本數,Lm表示一個樣本中的特征數。
3.根據權利要求1所述的基于RealifF的特征選擇方法,其特征在于所述步驟四中將距離相關性矩陣中小于閾值的特征進行融合通過欠完備自編碼器完成。
4.根據權利要求1所述的基于RealifF的特征選擇方法,其特征在于所述步驟四中將距離相關性矩陣中小于閾值的特征進行融合通過基于多任務的自編碼器完成,所述基于多任務的自編碼器包括主任務及輔助任務,
所述主任務對距離相關性矩陣中小于閾值的特征進行編碼,得到隱層特征,然后對隱層特征進行解碼后輸出,得到主任務損失,
所述輔助任務對隱層特征進行分類,然后將分類結果輸出,得到輔助任務損失,
然后將主任務損失和輔助任務損失相加后并結合反向傳播算法對基于多任務的自編碼器進行調整得到最優自編碼器,最后將距離相關性矩陣中小于閾值的特征輸入最優自編碼器得到融合特征。
5.根據權利要求4所述的基于RealifF的特征選擇方法,其特征在于所述主任務通過稀疏自編碼器完成。
6.根據權利要求5所述的基于RealifF的特征選擇方法,其特征在于所述稀疏自編碼器中KL散度的懲罰項表示為:
其中,ρ表示期望的平均激活值,示第i個神經元節點的平均激活程度,j表示第j個神經元,p表示神經元總數。
7.根據權利要求1所述的基于RealifF的特征選擇方法,其特征在于所述距離相關性矩陣表示為:
8.根據權利要求4所述的基于RealifF的特征選擇方法,其特征在于所述輔助任務利用殘差網絡完成。
9.根據權利要求4所述的基于RealifF的特征選擇方法,其特征在于所述主任務損失和輔助任務損失相加表示為:
loss=loss1+loss2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011356846.0/1.html,轉載請聲明來源鉆瓜專利網。





