[發明專利]一種PE惡意軟件檢測模型的后門對抗樣本生成方法有效
| 申請號: | 202110594259.3 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113254930B | 公開(公告)日: | 2022-08-05 |
| 發明(設計)人: | 羅森林;韓飛;潘麗敏;張笈 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 pe 惡意 軟件 檢測 模型 后門 對抗 樣本 生成 方法 | ||
本發明涉及一種基于R?DBSCAN的PE惡意軟件檢測模型的后門對抗樣本生成方法,屬于計算機惡意軟件檢測領域。主要為了解決惡意軟件檢測模型在黑盒情形下攻擊難度高的問題。本發明首先從公開數據集中獲取PE樣本并訓練代理訓練模型,采用SHAP值減維數據集;采用R?DBSCAN方法對樣本聚類,取每一聚類的中心節點作為采樣點構建新的數據集;訓練神經網絡模型;分別輸入惡意以及良性樣本文件,依據神經網絡內部神經元權值變化情況記錄對分類結果影響較大的神經元;嵌入任意長度字符串至空PE文件,依據神經元權值變化情況取對其影響較大的字符串并記錄該神經元;將觸發器以嵌入原始惡意PE文件,修改標簽達到對神經網絡的對抗訓練。
技術領域
本發明涉及一種PE惡意軟件檢測模型的后門對抗樣本生成方法,屬于計算機惡意軟件檢測領域。
背景技術
針對惡意軟件的檢測技術一直以來都有著較為快速的發展,但是惡意軟件每年新增數量依然非常可觀。隨著深度學習的發展,基于深度學習的PE惡意軟件檢測方法變得多樣。靜態分析PE文件,提取文件16進制數據特征,使用深度學習方法學習特征,這類方法目前已經能夠以較高的準確率達到對惡意軟件的檢測。但是這類惡意軟件檢測模型在開發過程中忽略了檢測系統本身的安全性以及數據的可靠性,如果惡意軟件檢測模型在訓練過程中遭遇攻擊者插入后門,在正常輸入的情形下檢測模型會保證正常輸出,但是在帶有后門觸發的情形下,檢測模型會輸出錯誤的分類結果,那么最終在實際應用中這種檢測模型就會帶來極大的安全威脅,一旦這種帶有后門觸發的惡意軟件無法被檢測模型檢測到,這種惡意軟件帶來的攻擊威脅是不可估量的。如果能夠通過生成所有可能的后門觸發并將其嵌入正常輸入中形成對抗樣本,使用對抗樣本對模型進行對抗訓練,就可以保證模型針對對抗樣本攻擊的魯棒性。
目前針對PE惡意軟件的對抗樣本產生方法存在泛化能力差、計算開銷大等特點,對抗樣本的構造一般針對某一特定檢測模型設計,這限制了對抗樣本在其他檢測模型上的泛化能力。黑盒對抗樣本的構造需要對檢測模型做出大量的query操作以明確對抗樣本對于模型的欺騙效果,實際中大量的query費時費力,這降低了對抗樣本生成方法的實用性。
發明內容
本發明的目的是針對現實生活中為提高惡意軟件檢測系統魯棒性而采用的對抗樣本設計方法存在泛化能力差、易過擬合、計算開銷大等特點,提出一種基于R-DBSCAN的PE惡意軟件檢測模型的后門對抗樣本生成方法。
本發明的設計原理為:首先從公開數據集中獲取PE惡意軟件樣本以及PE良性軟件樣本,并訓練代理訓練模型,計算模型SHAP值,對數據集進行減維;對于獲取到的樣本,采用R-DBSCAN方法對樣本進行聚類,取每一聚類的中心節點作為采樣點構建新的數據集;使用獲取到的訓練集訓練神經網絡模型;分別輸入惡意樣本文件以及良性樣本文件,觀察神經網絡內部神經元權值變化情況,取對分類結果較高的神經元并進行記錄;構造PE文件,嵌入任意長度字符串,變動字符串內容后輸入神經網絡模型,觀察神經網絡內部神經元權值變化情況,取對神經元權值影響較大的字符串,同時記錄這些敏感神經元;將觸發器以動態混淆機制嵌入原始惡意PE文件,修改標簽達到對神經網絡的進行對抗訓練。
本發明的技術方案是通過如下步驟實現的:
步驟1,利用SHAP對原始數據集進行維度刪減。
步驟2,利用R-DBSCAN對刪減維度后的原始數據集進行聚類。
步驟2.1,設定樣本間距離閾值以及聚類半徑。
步驟2.2,輸入減維數據集,以第一個樣本為聚類中心節點,輸入第二個樣本,計算該樣本與第一個樣本之間的距離;若樣本與聚類中心節點距離在以聚類中心節點為圓心,以聚類半徑為半徑的圓域內部,則該樣本歸入該部分聚類;若樣本與聚類中心節點距離在以聚類中心節點為圓心,以聚類半徑為半徑的圓域外部,則該樣本成為新的聚類中心節點。
步驟2.3,輸入剩余樣本,遍歷所有與聚類中心節點的距離以確定是否歸入某聚類或是成為新的聚類中心節點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110594259.3/2.html,轉載請聲明來源鉆瓜專利網。





