[發(fā)明專利]基于語(yǔ)義分析和雙向編碼表征的惡意軟件檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202310588930.2 | 申請(qǐng)日: | 2023-05-24 |
| 公開(kāi)(公告)號(hào): | CN116432184A | 公開(kāi)(公告)日: | 2023-07-14 |
| 發(fā)明(設(shè)計(jì))人: | 趙運(yùn)弢;馮永新;劉峻名 | 申請(qǐng)(專利權(quán))人: | 沈陽(yáng)理工大學(xué) |
| 主分類號(hào): | G06F21/56 | 分類號(hào): | G06F21/56;G06F40/30;G06F16/35;G06F18/214;G06F18/2415;G06N3/0442;G06N3/045;G06N3/0464;G06N3/084 |
| 代理公司: | 沈陽(yáng)東大知識(shí)產(chǎn)權(quán)代理有限公司 21109 | 代理人: | 李在川 |
| 地址: | 110159 遼*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語(yǔ)義 分析 雙向 編碼 表征 惡意 軟件 檢測(cè) 方法 | ||
1.基于語(yǔ)義分析和雙向編碼表征的惡意軟件檢測(cè)方法,其特征在于,具體包括以下步驟:
步驟1:獲取惡意軟件數(shù)據(jù)集,以CSV文件形式保存,并提取出數(shù)據(jù)集中的API函數(shù)調(diào)用序列;
步驟2:采用BERT模型對(duì)步驟1獲取得到的API函數(shù)調(diào)用序列進(jìn)行詞向量化,以此生成詞嵌入類型的特征;
步驟3:構(gòu)建ConvLSTM神經(jīng)網(wǎng)絡(luò)架構(gòu);
步驟4:訓(xùn)練優(yōu)化ConvLSTM神經(jīng)網(wǎng)絡(luò)架構(gòu);
步驟5:對(duì)步驟4優(yōu)化后的ConvLSTM神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行評(píng)估,測(cè)試惡意軟件檢測(cè)的效率和準(zhǔn)確性;
選擇三個(gè)用于分類問(wèn)題的評(píng)價(jià)指標(biāo)來(lái)評(píng)價(jià)ConvLSTM神經(jīng)網(wǎng)絡(luò)架構(gòu),具體為準(zhǔn)確性、F1得分和損失值;
步驟6:搭建惡意軟件API調(diào)用序列檢測(cè)系統(tǒng),可視化檢測(cè)結(jié)果;具體使用Python中用于構(gòu)建可視化界面的相關(guān)庫(kù),搭建一個(gè)可視化系統(tǒng)平臺(tái)。
2.根據(jù)權(quán)利要求1所述的基于語(yǔ)義分析和雙向編碼表征的惡意軟件檢測(cè)方法,其特征在于,步驟1具體為:
首先下載惡意軟件數(shù)據(jù)集,該數(shù)據(jù)集中包含多個(gè)惡意軟件的基本信息,每個(gè)基本信息包含以下特征:sha256哈希值、標(biāo)簽、標(biāo)頭信息、導(dǎo)入函數(shù)庫(kù)、導(dǎo)出函數(shù)庫(kù)、節(jié)信息、字符串信息、滑動(dòng)窗口熵計(jì)算、鏈接器版本、提交大小、系統(tǒng)版本和子系統(tǒng)版本;其中導(dǎo)入函數(shù)庫(kù)里包含了惡意軟件API函數(shù);
獲取完數(shù)據(jù)集后,針對(duì)每個(gè)惡意軟件的基本信息,使用Python第三方庫(kù)將每個(gè)惡意軟件的API函數(shù)從導(dǎo)入函數(shù)庫(kù)中分別提取出來(lái),同時(shí)保留API函數(shù)在導(dǎo)入函數(shù)庫(kù)中的順序,得到由API函數(shù)組成的序列,即一個(gè)惡意軟件對(duì)應(yīng)一條API函數(shù)調(diào)用序列,最后將惡意軟件的家族名和它對(duì)應(yīng)的API函數(shù)調(diào)用序列兩個(gè)字段保存至CSV文件中。
3.根據(jù)權(quán)利要求1所述的基于語(yǔ)義分析和雙向編碼表征的惡意軟件檢測(cè)方法,其特征在于,步驟2所述BERT模型由多個(gè)Transformer層組成,基于雙向編碼表征的BERT模型會(huì)將每個(gè)惡意樣本的API函數(shù)調(diào)用序列視為具有上下文語(yǔ)義的文本語(yǔ)句進(jìn)行處理;步驟2具體為:
步驟2.1:首先對(duì)CSV文件中的惡意軟件API調(diào)用序列進(jìn)行Unicode標(biāo)準(zhǔn)化,然后對(duì)API調(diào)用序列進(jìn)行tokenize操作,將序列分成單個(gè)字符或者一些組合字符,接著采用分詞算法對(duì)tokenize后的文本進(jìn)行分詞;
步驟2.2:構(gòu)建BERT模型的輸入序列;對(duì)惡意軟件API調(diào)用序列添加一些特殊標(biāo)記,這些標(biāo)記包括[CLS]和[SEP],其中[CLS]標(biāo)記表示該序列的開(kāi)始,[SEP]標(biāo)記則用于分隔不同的句子或段落;然后將添加完標(biāo)記的序列轉(zhuǎn)換成768維嵌入向量,并對(duì)每個(gè)嵌入向量添加位置編碼,表示每個(gè)API函數(shù)在調(diào)用序列中的位置接著使用特殊的[MASK]標(biāo)記去隨機(jī)替換添加完位置編碼的嵌入向量中某個(gè)具體API函數(shù)對(duì)應(yīng)的向量值;最后,將所有的嵌入向量組成多個(gè)批次,送入到Transformer模型中進(jìn)一步處理;
步驟2.3:對(duì)步驟2.2得到的所有嵌入向量添加多頭注意力機(jī)制。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于沈陽(yáng)理工大學(xué),未經(jīng)沈陽(yáng)理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310588930.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤(pán)或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 雙向無(wú)線電能監(jiān)控系統(tǒng)
- 雙向無(wú)線電能監(jiān)控系統(tǒng)
- 電動(dòng)車電機(jī)自動(dòng)變速器雙向驅(qū)動(dòng)盤(pán)
- 電動(dòng)車電機(jī)自動(dòng)變速器雙向驅(qū)動(dòng)盤(pán)
- 一種沖床離合制動(dòng)器機(jī)構(gòu)
- 一種沖床離合制動(dòng)器機(jī)構(gòu)
- 雙向多步DeBruijn圖的自環(huán)雙向邊識(shí)別與去除方法
- 雙向調(diào)節(jié)機(jī)構(gòu)
- 基于HVDC網(wǎng)絡(luò)與AC環(huán)網(wǎng)的分布式發(fā)電系統(tǒng)
- 一種矩形板回彈曲率的建模方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





