[發(fā)明專利]基于多生成器AugGAN的對抗動態(tài)惡意API序列生成方法有效
| 申請?zhí)枺?/td> | 202011411208.4 | 申請日: | 2020-12-04 |
| 公開(公告)號: | CN112565261B | 公開(公告)日: | 2021-11-23 |
| 發(fā)明(設(shè)計)人: | 楊強;楊濤;郝唯杰;阮偉;王文海 | 申請(專利權(quán))人: | 浙江大學 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 鄭海峰 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 生成器 auggan 對抗 動態(tài) 惡意 api 序列 生成 方法 | ||
本發(fā)明提出了一種基于多生成器AugGAN的對抗動態(tài)惡意API序列生成方法。本發(fā)明在生成器和判別器中間插入一個黑箱檢測器對樣本打標簽進行無監(jiān)督學習;利用多個生成器從對應(yīng)的無干擾API數(shù)據(jù)庫中挑選無干擾API;挑選的無干擾API隨機插入惡意API序列生成對抗動態(tài)惡意API樣本;對抗樣本和良性樣本輸入黑箱檢測器進行分類并打上標簽;將對抗樣本、良性樣本及其對應(yīng)的標簽輸入判別器進行訓(xùn)練,返回梯度信息;生成器和判別器根據(jù)返回的梯度信息更新自身參數(shù);生成器和判別器的不斷博弈斷提升生成能力和判別能力,最終達到納什均衡狀態(tài);系統(tǒng)平衡以后,生成的對抗動態(tài)惡意API序列能繞過黑箱檢測器的檢測。
技術(shù)領(lǐng)域
本發(fā)明涉及對抗API序列生成方法,尤其是涉及一種基于多生成器AugGAN的對抗動態(tài)惡意API序列生成方法。
背景技術(shù)
隨著新一代信息技術(shù)與工作、生活、學習的不斷深入融合發(fā)展,互聯(lián)網(wǎng)正全方位滲透至人類社會活動的方方面面,已經(jīng)成為世界各國人民不可或缺的一部分。據(jù)國際電信組織不完全統(tǒng)計,到2016年,全世界互聯(lián)網(wǎng)用戶達35億人,已占世界總?cè)丝诘囊话?。預(yù)計到2020年,互聯(lián)網(wǎng)終端設(shè)備將達到120億臺。隨著全球網(wǎng)絡(luò)威脅不斷出現(xiàn)新的變化和特點,尤其一些新型網(wǎng)絡(luò)攻擊層出不窮,并呈現(xiàn)出全球蔓延態(tài)勢,全球網(wǎng)絡(luò)安全形勢依舊嚴峻,網(wǎng)絡(luò)空間安全防護工作仍然任重而道遠。
隨著人工智能的不斷發(fā)展,機器學習算法在網(wǎng)絡(luò)安全領(lǐng)域取得巨大進步。然而,機器學習算法在為我們帶來巨大便利的同時,也暴露出許多安全問題。事實上,通過在機器學習模型推理階段中對輸入數(shù)據(jù)做輕微修改,就能夠在短時間內(nèi)讓模型得出錯誤的結(jié)果。這些被輕微修改后的數(shù)據(jù)稱為對抗樣本。這種針對算法模型的攻擊方法能夠較為輕易地找到讓模型做出錯誤判斷的對抗樣本。通常情況下,對抗樣本表現(xiàn)為通過在數(shù)據(jù)中故意添加輕微的改動,所得到的輸入樣本對模型形成干擾,來迫使模型會以高置信度來輸出一個錯誤的結(jié)果。就分類算法而言,在人類無法用肉眼識別的前提下,對抗樣本能夠增大模型的預(yù)測誤差,使原本正確分類的樣本遷移到判定區(qū)域的另一側(cè),從而被劃分到另一種類別中。
針對如今惡意文件更新如此快速的情況,若只使用原有的數(shù)據(jù)集進行攻擊檢測機器學習模型的訓(xùn)練,可能會導(dǎo)致模型對于一些惡意文件的變體無法檢測,從而增大模型的漏檢率,而且許多機器學習算法非常容易受到蓄意攻擊,即基于機器學習的惡意文件檢測模型很容易被一些對抗技術(shù)所繞過。因此,研究對抗樣本生成方法有助于提高機器學習檢測模型抗混淆、抗擾動能力。
生成式對抗網(wǎng)絡(luò)技術(shù)(GAN)應(yīng)用于信息安全領(lǐng)域的研究卻少之又少,分析其原因,重點在于生成對抗樣本的過程中,相較圖像等常見樣本,惡意軟件、惡意網(wǎng)絡(luò)流樣本擁有其顯著的特殊性。對于圖像樣本來說,對抗生成的樣本與原始樣本相比,只要不破壞樣本的視覺特性,滿足視覺上不可分辨即可。對于對抗動態(tài)惡意API序列樣本來說,對抗樣本與原始樣本相比,需要滿足具有相同的可執(zhí)行性和惡意性。在惡意動態(tài)API序列樣本中,每一個API都有其特定含義,隨意增加或者減少一些敏感位置的API可能會導(dǎo)致該網(wǎng)絡(luò)流樣本不可用,如導(dǎo)致非法字段產(chǎn)生、校驗字段失效以及攻擊性損壞等。因此,生成惡意文件、網(wǎng)絡(luò)流對抗樣本的條件更為嚴苛。因此在進行API動態(tài)序列生成時,如何保證生成的對抗樣本具有惡意攻擊性與可執(zhí)行性,是生成對抗網(wǎng)絡(luò)技術(shù)在網(wǎng)絡(luò)安全領(lǐng)域急迫研究解決的關(guān)鍵問題。
發(fā)明內(nèi)容
本發(fā)明的目的是解決在信息安全領(lǐng)域生成的對抗樣本如何保證欺騙性、惡意性和可執(zhí)行性的問題。針對生成式對抗網(wǎng)絡(luò)技術(shù)(GAN)應(yīng)用于信息安全領(lǐng)域研究的不足提出了完善的分析方法:本發(fā)明提出的基于多生成器Augmentation Generative AdversarialNetwork(AugGAN)的對抗動態(tài)惡意API序列生成方法對GAN應(yīng)用于信息安全領(lǐng)域以及如何提升機器學習檢測模型抗混淆、抗擾動能力具有指導(dǎo)意義。
本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):
一種基于多生成器AugGAN的對抗動態(tài)惡意API序列生成方法,包括以下步驟:
(1)獲取惡意API序列樣本和良性API序列樣本,并按照順序編號;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學,未經(jīng)浙江大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011411208.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





