[發(fā)明專(zhuān)利]一種基于幾何向量的對(duì)抗樣本生成方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010084341.7 | 申請(qǐng)日: | 2020-02-10 |
| 公開(kāi)(公告)號(hào): | CN111340066B | 公開(kāi)(公告)日: | 2022-05-31 |
| 發(fā)明(設(shè)計(jì))人: | 劉啟和;王媛媛;周世杰;譚浩 | 申請(qǐng)(專(zhuān)利權(quán))人: | 電子科技大學(xué) |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 成都九鼎天元知識(shí)產(chǎn)權(quán)代理有限公司 51214 | 代理人: | 夏琴 |
| 地址: | 611731 四川*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 幾何 向量 對(duì)抗 樣本 生成 方法 | ||
1.一種基于幾何向量的對(duì)抗樣本生成方法,其特征在于,包括如下步驟:
步驟1,對(duì)合法域名數(shù)據(jù)集和DGA域名數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理;
步驟2,在數(shù)據(jù)預(yù)處理后進(jìn)行模型預(yù)訓(xùn)練:初始化ATN網(wǎng)絡(luò)的生成網(wǎng)絡(luò)和目標(biāo)網(wǎng)絡(luò),使生成網(wǎng)絡(luò)在合法域名數(shù)據(jù)集上預(yù)訓(xùn)練,目標(biāo)網(wǎng)絡(luò)在合法域名數(shù)據(jù)集和DGA域名數(shù)據(jù)集上預(yù)訓(xùn)練;
步驟3,重復(fù)步驟(a)-(f),直到收斂,得到DGA域名對(duì)抗樣本:
(a)將合法域名輸入ATN網(wǎng)絡(luò)生成合法域名對(duì)抗樣本,并得到擾動(dòng)損失;
(b)將合法域名和以及合法域名對(duì)抗樣本輸入噪聲擾動(dòng)方向函數(shù)得到噪聲;
(c)將噪聲和DGA域名輸入擾動(dòng)網(wǎng)絡(luò)得到DGA域名對(duì)抗樣本;所述擾動(dòng)網(wǎng)絡(luò)為基于幾何向量的擾動(dòng)網(wǎng)絡(luò);步驟(c)的計(jì)算公式如下:
M′=R(M,Z)=|2X′-M+Z|%|V|
其中,M′表示DGA域名對(duì)抗樣本,M表示DGA域名,R表示擾動(dòng)網(wǎng)絡(luò),Z表示噪聲,|V|表示域名數(shù)據(jù)字符字典V的大小;
(d)將DGA域名對(duì)抗樣本輸入目標(biāo)網(wǎng)絡(luò),得到目標(biāo)網(wǎng)絡(luò)損失;
(e)利用擾動(dòng)損失和目標(biāo)網(wǎng)絡(luò)損失得到目標(biāo)損失函數(shù);
(f)通過(guò)最小化目標(biāo)損失函數(shù)更新ATN網(wǎng)絡(luò)。
2.根據(jù)權(quán)利要求1所述的基于幾何向量的對(duì)抗樣本生成方法,其特征在于,步驟1的方法為:
步驟1.1,對(duì)合法域名數(shù)據(jù)集和DGA域名數(shù)據(jù)集中的域名數(shù)據(jù)建立字符字典,并通過(guò)one-hot編碼,得到編碼后的合法域名數(shù)據(jù)向量和DGA域名數(shù)據(jù)向量;
步驟1.2,對(duì)合法域名數(shù)據(jù)集和DGA域名數(shù)據(jù)集中的域名數(shù)據(jù)以數(shù)據(jù)長(zhǎng)度最長(zhǎng)為準(zhǔn),對(duì)不足長(zhǎng)度的域名數(shù)據(jù)進(jìn)行數(shù)字0填充。
3.根據(jù)權(quán)利要求1所述的基于幾何向量的對(duì)抗樣本生成方法,其特征在于,步驟2中,生成網(wǎng)絡(luò)使用極大似然估計(jì)在合法域名數(shù)據(jù)集上預(yù)訓(xùn)練。
4.根據(jù)權(quán)利要求1所述的基于幾何向量的對(duì)抗樣本生成方法,其特征在于,步驟2中,目標(biāo)網(wǎng)絡(luò)使用最小化交叉熵在合法域名數(shù)據(jù)集和DGA域名數(shù)據(jù)集上預(yù)訓(xùn)練。
5.根據(jù)權(quán)利要求1所述的基于幾何向量的對(duì)抗樣本生成方法,其特征在于,步驟(a)中所述擾動(dòng)損失為ATN網(wǎng)絡(luò)生成合法域名對(duì)抗樣本的損失,即目標(biāo)網(wǎng)絡(luò)對(duì)產(chǎn)生的合法域名對(duì)抗樣本的加權(quán)平均,其計(jì)算公式如下:
其中,LG表示擾動(dòng)損失,GD,θ表示ATN網(wǎng)絡(luò),θ為ATN網(wǎng)絡(luò)的參數(shù)向量,X表示合法域名,Γ表示合法域名數(shù)據(jù)集,D表示目標(biāo)網(wǎng)絡(luò)。
6.根據(jù)權(quán)利要求1所述的基于幾何向量的對(duì)抗樣本生成方法,其特征在于,步驟(b)中所述噪聲擾動(dòng)方向函數(shù)的計(jì)算公式如下:
Z(X,GD,θ(X))=X-GD,θ(X)=X-X′
其中,Z為噪聲,X表示合法域名,X′表示合法域名對(duì)抗樣本,GD,θ表示ATN網(wǎng)絡(luò),θ為ATN網(wǎng)絡(luò)的參數(shù)向量。
7.根據(jù)權(quán)利要求1所述的基于幾何向量的對(duì)抗樣本生成方法,其特征在于,步驟(d)中所述目標(biāo)網(wǎng)絡(luò)損失為判斷輸入DGA域名數(shù)據(jù)生成的DGA域名對(duì)抗樣本的概率,其計(jì)算公式如下:
其中,LD表示目標(biāo)網(wǎng)絡(luò)損失,M表示DGA域名,T表示DGA域名數(shù)據(jù)集,R表示擾動(dòng)網(wǎng)絡(luò),X表示合法域名,Z表示噪聲,D表示目標(biāo)網(wǎng)絡(luò)。
8.根據(jù)權(quán)利要求1所述的基于幾何向量的對(duì)抗樣本生成方法,其特征在于,步驟(e)中所述目標(biāo)損失函數(shù)的計(jì)算公式如下:
其中,L表示目標(biāo)損失函數(shù),LG表示擾動(dòng)損失,LD表示目標(biāo)網(wǎng)絡(luò)損失,GD,θ表示ATN網(wǎng)絡(luò),θ為ATN網(wǎng)絡(luò)的參數(shù)向量,X表示合法域名,M表示DGA域名,R表示擾動(dòng)網(wǎng)絡(luò),Z表示噪聲;β為權(quán)重系數(shù),以平衡擾動(dòng)損失和目標(biāo)網(wǎng)絡(luò)損失,β∈(0,1)。
9.根據(jù)權(quán)利要求1所述的基于幾何向量的對(duì)抗樣本生成方法,其特征在于,步驟(f)中通過(guò)最小化目標(biāo)損失函數(shù)更新ATN網(wǎng)絡(luò)的參數(shù)向量,其計(jì)算公式如下:
其中,θ表示ATN網(wǎng)絡(luò)的參數(shù)向量,L表示目標(biāo)損失函數(shù),α為學(xué)習(xí)率。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010084341.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 移動(dòng)向量解碼方法和移動(dòng)向量解碼裝置
- 一種用于支持向量機(jī)的在線(xiàn)向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動(dòng)估計(jì)的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 近鄰向量的召回方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類(lèi)別向量的方法和裝置
- 農(nóng)業(yè)信息對(duì)抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源線(xiàn)性規(guī)劃最優(yōu)分配方法
- 基于聚類(lèi)數(shù)據(jù)挖掘的對(duì)抗行為搜索算法
- 面向多種對(duì)抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對(duì)抗強(qiáng)度的對(duì)抗訓(xùn)練方法
- 對(duì)抗攻擊模型的訓(xùn)練方法及裝置
- 對(duì)抗樣本的生成方法和裝置
- 多樣本對(duì)抗擾動(dòng)生成方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備
- 一種無(wú)人集群協(xié)同博弈對(duì)抗的控制方法及系統(tǒng)





