[發明專利]基于信息增益的特征選擇方法、裝置及存儲介質在審
| 申請號: | 201811514752.4 | 申請日: | 2018-12-12 |
| 公開(公告)號: | CN109614794A | 公開(公告)日: | 2019-04-12 |
| 發明(設計)人: | 魏金俠;龍春;萬巍;趙靜;楊帆 | 申請(專利權)人: | 中國科學院計算機網絡信息中心 |
| 主分類號: | G06F21/55 | 分類號: | G06F21/55;G06K9/62 |
| 代理公司: | 北京知舟專利事務所(普通合伙) 11550 | 代理人: | 郭韞 |
| 地址: | 100083 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息增益 存儲介質 特征選擇 測評 網絡安全領域 計算復雜度 支持向量機 目標特征 排序結果 特征處理 預設條件 排序 | ||
本發明實施例公開了一種基于信息增益的特征選擇方法、裝置及存儲介質,涉及網絡安全領域。本發明的方法包括:計算初始特征集中的信息增益值;按照信息增益值由大到小的順序對所述各特征進行排序;根據所述排序結果,利用支持向量機SVM分類器依次獲得特征測評值;基于各特征測評值,在所述初始特征集中選擇滿足預設條件的至少一個特征作為目標特征。本發明能夠降低特征處理的計算復雜度。
技術領域
本發明涉及網絡安全領域,尤其涉及一種基于信息增益的特征選擇方法、裝置及存儲介質。
背景技術
隨著移動終端的使用普及,對移動終端進行高效迅速的網絡安全分析及潛在風險隱患分析,成為目前亟待實現的技術手段。目前,在入侵檢測系統中通過對移動數據進行特征提取及分析,以實現對移動終端的網絡安全及潛在風險隱患進行分析。然而,目前進行網絡安全分析所考慮的移動數據的特征量大,計算分析的復雜度高。
發明內容
本發明的實施例提供一種基于信息增益的特征選擇方法、裝置及存儲介質,能夠降低特征處理的計算復雜度。
為達到上述目的,本發明的實施例采用如下技術方案:
第一方面,本發明的實施例提供一種基于信息增益的特征選擇方法,包括:
計算初始特征集中的信息增益值;
按照信息增益值由大到小的順序對所述各特征進行排序;
根據所述排序結果,利用支持向量機SVM分類器依次獲得特征測評值;
基于各特征測評值,在所述初始特征集中選擇滿足預設條件的至少一個特征作為目標特征。
結合第一方面,在第一方面的第一種可能的實現方式中,所述根據所述排序結果,利用SVM分類器依次獲得特征測評值之前,還包括:
基于樣本數據集中的特征測評值和已選取的目標特征之間的信息相關性,構建所述SVM分類器。
結合第一方面,在第一方面的第二種可能的實現方式中,所述基于各特征測評值,在所述初始特征集中選擇滿足預設條件的至少一個特征作為目標特征,包括:
在所述初始特征集中,選擇特征測評值最大的一個特征作為所述目標特征;或,
在所述初始特征集中,選擇特征測評值最大的多個特征作為所述目標特征;或,
在所述初始特征集中,選擇特征測評值大于或等于預設閾值的特征作為所述目標特征。
結合第一方面的第二種可能的實現方式,在第一方面的第三種可能的實現方式中,在所述初始特征集中,選擇特征測評值最大的多個特征作為所述目標特征,包括:
在所述初始特征集中,選擇特征測評值最大的3個特征或6個特征,作為所述目標特征。
結合第一方面,在第一方面的第四種可能的實現方式中,所述特征測評值為檢測率與誤報率之間的比值;
所述方法還包括:
基于所述目標特征,對當前網絡進行入侵檢測分析。
第二方面,本發明的實施例提供一種基于信息增益的特征選擇裝置,包括:
計算模塊,用于計算初始特征集中的信息增益值;
排序模塊,用于按照信息增益值由大到小的順序對所述各特征進行排序;
測評模塊,用于根據所述排序結果,利用支持向量機SVM分類器依次獲得特征測評值;
選擇模塊,用于基于各特征測評值,在所述初始特征集中選擇滿足預設條件的至少一個特征作為目標特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算機網絡信息中心,未經中國科學院計算機網絡信息中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811514752.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:白名單文件的生成、加載方法及裝置
- 下一篇:一種網絡安全系統





