[發(fā)明專利]基于深度神經(jīng)網(wǎng)絡(luò)的WebShell檢測方法及其系統(tǒng)有效
| 申請?zhí)枺?/td> | 201710705914.1 | 申請日: | 2017-08-17 |
| 公開(公告)號: | CN107516041B | 公開(公告)日: | 2020-04-03 |
| 發(fā)明(設(shè)計)人: | 張濤;齊龍晨;寧戈 | 申請(專利權(quán))人: | 北京安普諾信息技術(shù)有限公司 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56;G06F11/36;G06F8/41;G06N3/04 |
| 代理公司: | 北京萬象新悅知識產(chǎn)權(quán)代理有限公司 11360 | 代理人: | 黃鳳茹 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 神經(jīng)網(wǎng)絡(luò) webshell 檢測 方法 及其 系統(tǒng) | ||
1.一種基于深度神經(jīng)網(wǎng)絡(luò)的WebShell檢測方法,基于抽象語法樹的遞歸循環(huán)神經(jīng)網(wǎng)絡(luò),針對腳本語言自動獲取腳本的詞法、語法信息,利用抽象語法樹的層次化結(jié)構(gòu)特征完成特征抽取和WebShell檢測,包括預處理過程、樣本生成過程和檢測過程;具體包括如下步驟:
A.腳本文件預處理過程:
輸入為腳本源代碼,預處理包括詞法分析、語法分析、簡化,輸出為抽象語法樹T=(V,E),其中V是T中葉子節(jié)點的集合,E是T中邊的集合;
B.樣本生成過程:
輸入包括簡化后的抽象語法樹和抽象語法樹的葉子節(jié)點;包括:對抽象語法樹進行壓縮處理和向量化抽象語法樹,向量化抽象語法樹包括樹節(jié)點和葉子節(jié)點的向量化表示;
C.采用深度神經(jīng)網(wǎng)絡(luò)進行WebShell檢測:針對抽象語法樹的樹形結(jié)構(gòu),深度神經(jīng)網(wǎng)絡(luò)采用遞歸循環(huán)神經(jīng)網(wǎng)絡(luò);包括如下過程:
C1.針對樹形結(jié)構(gòu)定義一種神經(jīng)網(wǎng)絡(luò)層為遞歸長短期記憶層,所述遞歸長短期記憶層利用樹的遞歸特性,由樹的根節(jié)點及子樹集合的向量表示,通過非線性運算產(chǎn)生樹的向量表示;
C2.樹形結(jié)構(gòu)中根節(jié)點的向量化表示方法采用與步驟B中樹節(jié)點的向量化表示相同的方法;樹形結(jié)構(gòu)中子樹集合的向量表示通過將子樹依次輸入遞歸長短期記憶層計算生成;
C3.利用遞歸長短期記憶層,設(shè)計一個遞歸循環(huán)神經(jīng)網(wǎng)絡(luò)RRNN作為檢測模塊;
RRNN的輸入包括:k個向量化的m階多叉樹,代表抽象語法樹的中間節(jié)點;定長的向量,表示抽象語法樹的葉子節(jié)點;RRNN的運算過程包括:
C31.RRNN底端包括k個共享權(quán)重的遞歸長短期記憶層,對應(yīng)處理k個m叉樹,通過運算輸出k×d維的特征,記為FeatureR=[f1,f2,…,fk]T,fk為第k個d維特征向量;
C32.RRNN池化層同時使用最大值、最小值、均值三種下采樣函數(shù)對FeatureR按列進行下采樣操作,池化層輸出三個d維向量,記為Featurep=[fmax,fmin,fmean]T,其中,fmax為池化層使用最大值采樣函數(shù)輸出的d維向量,fmin為池化層使用最小值采樣函數(shù)輸出的d維向量,fmean為池化層使用均值采樣函數(shù)輸出的d維向量;
C33.RRNN拼接層將Featurep及葉子特征對應(yīng)的向量fs拼接成一個向量,得到拼接后的特征向量FeatureA=fmax&fmin&fmean&fs,&表示拼接符;
C34.RRNN全連接層利用特征向量FeatureA進行WebShell判定。
2.如權(quán)利要求1所述WebShell檢測方法,其特征是,步驟腳本文件預處理過程具體為:
A1.將程序代碼進行詞法分析,生成詞法單元流;
A2.對詞法單元流進行語法分析,構(gòu)造抽象語法樹;
A3.對進行語法分析后的詞法單元流進行過濾,去掉語義無關(guān)信息,以達到簡化抽象語法樹的目的。
3.如權(quán)利要求2所述WebShell檢測方法,其特征是,步驟A3簡化抽象語法樹包括如下步驟:
A31.刪掉抽象語法樹的所有葉子節(jié)點,同時為不損失葉子節(jié)點特征,樣本生成時采用簡單的特征工程方法對葉子節(jié)點進行向量化處理;
A32.抽象語法樹的中間節(jié)點只保留聲明、表達式和標量節(jié)點類型,忽略輔助類型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京安普諾信息技術(shù)有限公司,未經(jīng)北京安普諾信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710705914.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學習神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





