[發明專利]一種基于弱耦合SGAN的惡意軟件家族分類器生成方法、裝置及可讀存儲介質在審
| 申請號: | 202010595658.7 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111914254A | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | 汪姝瑋;汪秋云;姜政偉;劉建 | 申請(專利權)人: | 中國科學院信息工程研究所 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56;G06K9/62;G06N3/04 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100093 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 耦合 sgan 惡意 軟件 家族 分類 生成 方法 裝置 可讀 存儲 介質 | ||
1.一種基于弱耦合SGAN的惡意軟件家族分類器生成方法,其特征在于,包括以下步驟:
利用改進的惡意軟件圖像縮放算法將惡意軟件轉化為圖像特征;
利用產生的圖像特征和有家族標簽的惡意軟件,采用神經網絡訓練原始的惡意軟件家族分類器;
采用弱耦合的半監督生成對抗網絡模型,利用無家族標簽的惡意軟件,對惡意軟件家族分類器、半監督生成對抗網絡中的研判器和生成器進行訓練,得到最終的惡意軟件家族分類器。
2.根據權利要求1所述的方法,其特征在于,所述改進的惡意軟件圖像縮放算法包括:基于局部均值算法,將采樣點的范圍從最近的若干個點提升至整個滑動窗口內的點,再通過調整滑動窗口大小和滑動方式,擴展采樣窗口的大小,使其適合惡意樣本圖像。
3.根據權利要求1所述的方法,其特征在于,所述的利用產生的圖像特征和有家族標簽的惡意軟件,采用神經網絡訓練原始的惡意軟件家族分類器,包括:
將圖像特征和家族標簽作為訓練集和測試集,輸入基于VGG模型的1D-CNN神經網絡結構進行訓練;
根據訓練結果生成初始的特征訓練模型F(x)和原始的惡意軟件家族分類器C。
4.根據權利要求3所述的方法,其特征在于,所述的采用弱耦合的半監督生成對抗網絡模型,利用無家族標簽的惡意軟件,對惡意軟件家族分類器、半監督生成對抗網絡中的研判器和生成器進行訓練,包括:
根據初始的特征訓練模型F(x)和原始的惡意軟件家族分類器C對生成器G和研判器D進行初始化;
將圖像特征作為真實樣本集輸入,將生成器G生成的惡意軟件特征向量作為虛假樣本集輸入,對研判器D和特征訓練模型F(x)進行訓練;
根據最新的特征訓練模型F(x)以及研判器(D)對所有樣本的判斷結果,對生成器G進行訓練;
對F(x)、D、G進行反復訓練,直到其驗證結果達到規定閾值;
根據F(x),使用圖像特征和家族標簽作為訓練集和測試集輸入,對惡意軟件分類器C進行訓練,得到最終的惡意軟件家族分類器。
5.根據權利要求4所述的方法,其特征在于,所述研判器D的神經網絡結構包含兩部分,其中之一是與分類器C強耦合的網絡結構,另一是與分類器C弱耦合的網絡結構;采用以下公式對研判器D和特征訓練模型F(x)進行訓練:
Lunsupervised=-[Ex~real ln PD(F(x))+Ez~N(0,1) ln(1-PD[F(G(z))])]
L=Lsupervised+Lunsupervised
其中,L表示所有樣本的分類結果的期望,Lunsupervised表示無分類標簽樣本的分類結果的期望,Lsupervised表示有分類標簽樣本的分類結果的期望,Ex~real表示真實樣本經過共享特征提取器和研判器D的判定結果概率分布的期望,Ez~N(0,1)表示生成的惡意軟件特征向量判定結果的期望;PD表示使用研判器D的條件下,經過共享特征提取模塊神經網絡層后,研判器D對于生成的惡意軟件特征向量判定結果的概率分布;G(z)代表生成器G生成的惡意軟件特征向量,z表示用于生成惡意軟件特征向量所需要的參數。
6.根據權利要求5所述的方法,其特征在于,采用以下公式對生成器G進行訓練:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院信息工程研究所,未經中國科學院信息工程研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010595658.7/1.html,轉載請聲明來源鉆瓜專利網。





