[發(fā)明專利]針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110785175.8 | 申請日: | 2021-07-12 |
| 公開(公告)號: | CN113553581A | 公開(公告)日: | 2021-10-26 |
| 發(fā)明(設計)人: | 郭欣;楊洋;史建琦;黃滟鴻;佘慶;李欽;付能 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06F21/55 | 分類號: | G06F21/55;G06K9/62;G06T3/40 |
| 代理公司: | 北京辰權知識產(chǎn)權代理有限公司 11619 | 代理人: | 谷波 |
| 地址: | 200062 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 平衡 數(shù)據(jù) 入侵 檢測 系統(tǒng) | ||
本發(fā)明公開了一種針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),包括獲取模塊,代碼讀取模塊,分類模塊,上采樣模塊,以及入侵檢測模塊,上述系統(tǒng),在數(shù)據(jù)集構建中,通過對數(shù)據(jù)進行重采樣,消除部分類別的不平衡,另外在入侵檢測模型上進一步削減不平衡數(shù)據(jù)分類的難度,可以有效解決入侵檢測系統(tǒng)中針對不平衡數(shù)據(jù)檢測的問題,并能進一步提高保障系統(tǒng)安全的能力,做到高效智能。
技術領域
本發(fā)明主要涉及計算機技術領域,尤其涉及針對非平衡數(shù)據(jù)的入侵檢測系 統(tǒng)。
背景技術
數(shù)據(jù)不平衡是指由于數(shù)據(jù)分布的差異性,導致不同類別間的數(shù)據(jù)量存在很 大的不同。在實際應用中,對于數(shù)據(jù)不平衡的問題廣泛存在,特別是在金融欺 詐、疾病診斷等領域。數(shù)據(jù)不平衡的顯著特征是某一類數(shù)據(jù)十分容易獲得,而 部分類別的數(shù)據(jù)由于獲取的難度導致樣本十分稀少。
一般的入侵檢測系統(tǒng)需要收集大量的行為數(shù)據(jù),模式專家進行統(tǒng)計分析發(fā) 現(xiàn)行為特征,加入標簽比對庫,或者利用數(shù)據(jù)挖掘和機器學習算法,首先對特 征進行抽象、提取,使用算法模型訓練并檢測以判斷安全性。但是上述構建方 式,十分依賴于所獲取的數(shù)據(jù)樣本,對于分布不平衡的數(shù)據(jù),如果不進行額外 的處理,對于結果的預測將導致大的偏差。
發(fā)明內(nèi)容
為解決以上問題,本發(fā)明提出了針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),針對入 侵檢測中存在的部分數(shù)據(jù)分布不平衡的現(xiàn)象,在數(shù)據(jù)集構建中,通過對數(shù)據(jù)進 行重采樣,消除部分類別的不平衡,另外在入侵檢測模型上進一步削減不平衡 數(shù)據(jù)分類的難度,可以有效解決入侵檢測系統(tǒng)中針對不平衡數(shù)據(jù)檢測的問題, 并能進一步提高保障系統(tǒng)安全的能力,做到高效智能。
具體的,本發(fā)明提出了一種針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),包括:
獲取模塊,用于獲取數(shù)據(jù)樣本;
分類模塊,用于對所述數(shù)據(jù)樣本進行分類處理,得到少數(shù)類樣本集和多數(shù) 類樣本集;
上采樣模塊,用于使用預設采樣算法對所述少數(shù)類樣本集進行上采樣,將 上采樣得到的新數(shù)據(jù)樣本加入所述數(shù)據(jù)樣本中,構成待檢測數(shù)據(jù);
入侵檢測模塊,用于將所述待檢測數(shù)據(jù)輸入預先訓練好的入侵檢測模型中 進行檢測,以判斷安全性。
優(yōu)選的,如上所述的針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),還包括:
模型訓練模塊,用于預先對入侵檢測模型進行訓練,得到訓練好的入侵檢 測模型,所述入侵檢測模型的訓練采用Focal Loss損失函數(shù)。
優(yōu)選的,如上所述的針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),所述獲取模塊包括 原始數(shù)據(jù)獲取單元和數(shù)據(jù)預處理單元。
優(yōu)選的,如上所述的針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),所述原始數(shù)據(jù)獲取 單元獲取原始數(shù)據(jù);所述數(shù)據(jù)預處理單元去除所述原始數(shù)據(jù)中的無效數(shù)據(jù)和重 復數(shù)據(jù),得到數(shù)據(jù)樣本。
優(yōu)選的,如上所述的針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),所述分類模塊包括 特征統(tǒng)計單元和樣本分類單元。
優(yōu)選的,如上所述的針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),所述特征統(tǒng)計單元 對所述數(shù)據(jù)樣本進行特征統(tǒng)計,得到相應的數(shù)據(jù)特征;所述樣本分類單元對所 述數(shù)據(jù)特征進行分類處理,得到數(shù)值屬性、序列屬性和類別屬性;根據(jù)所述類 別屬性將所有數(shù)據(jù)樣本分為少數(shù)類樣本集和多數(shù)類樣本集。
優(yōu)選的,如上所述的針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),所述預設采樣算法 為SMOTE采樣算法。
優(yōu)選的,如上所述的針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),所述上采樣模塊包 括近鄰樣本獲取單元和線性插值單元。
優(yōu)選的,如上所述的針對非平衡數(shù)據(jù)的入侵檢測系統(tǒng),所述近鄰樣本獲取 單元對少數(shù)類樣本集中每一個樣本,以歐氏距離為標準計算每一個樣本到少數(shù) 類樣本集中所有樣本的距離,根據(jù)所述距離得到其k近鄰樣本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經(jīng)華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110785175.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





