[發(fā)明專利]一種基于貝葉斯網(wǎng)的惡意文檔檢測(cè)方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201810546778.0 | 申請(qǐng)日: | 2018-05-31 |
| 公開(公告)號(hào): | CN108959922B | 公開(公告)日: | 2021-11-02 |
| 發(fā)明(設(shè)計(jì))人: | 文偉平;李經(jīng)緯 | 申請(qǐng)(專利權(quán))人: | 北京大學(xué) |
| 主分類號(hào): | G06F21/56 | 分類號(hào): | G06F21/56;G06F21/53 |
| 代理公司: | 北京萬(wàn)象新悅知識(shí)產(chǎn)權(quán)代理有限公司 11360 | 代理人: | 黃鳳茹 |
| 地址: | 100871*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 貝葉斯網(wǎng) 惡意 文檔 檢測(cè) 方法 裝置 | ||
本發(fā)明公布了一種基于貝葉斯網(wǎng)的惡意文檔檢測(cè)方法及系統(tǒng),通過將文檔抽象為特征矩陣表示;采用貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)表示各種特征與是否為惡意文檔間的因果概率關(guān)系;利用貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)對(duì)文檔的特征矩陣進(jìn)行后驗(yàn)概率計(jì)算;從而有效判斷該文檔是否為惡意文檔。包括:確定模型基礎(chǔ)特征指標(biāo)、構(gòu)建貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)、根據(jù)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)計(jì)算文檔為惡意文檔和正常文檔的后驗(yàn)概率。采用本發(fā)明技術(shù)方案,通過基于貝葉斯網(wǎng)采用靜態(tài)特征和動(dòng)態(tài)特征結(jié)合分析的方式檢測(cè)各種格式文檔,并有效提高檢測(cè)準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)安全技術(shù)領(lǐng)域,尤其涉及一種基于貝葉斯網(wǎng)的惡意文檔檢測(cè)方法及裝置。
背景技術(shù)
隨著網(wǎng)絡(luò)信息化程度的進(jìn)一步提高,近年來(lái)高級(jí)持續(xù)性攻擊APT(AdvancedPersistent Threat)事件增多,給國(guó)家和企業(yè)安全和發(fā)展造成了嚴(yán)重威脅,同時(shí)也造成不可估量的經(jīng)濟(jì)損失。而APT攻擊中往往使用惡意文檔進(jìn)行單點(diǎn)突破,惡意文檔特指在網(wǎng)絡(luò)攻擊中特別是在APT攻擊中利用的文檔類漏洞利用工具植入惡意程序。惡意文檔根據(jù)文檔格式的不同,解析程序漏洞的不同變種有很多,絕大多數(shù)都會(huì)利用shellcode作為載體來(lái)進(jìn)行攻擊。
目前對(duì)于已知惡意文檔的檢測(cè)方法主要基于特征碼匹配,其基本思想是提取惡意文檔中能唯一標(biāo)識(shí)該惡意文檔的二進(jìn)制字符串作為特征碼,并將此特征碼添加到惡意文檔特征庫(kù)中,在惡意文檔檢測(cè)時(shí),先提取待檢測(cè)文檔的特征字符串構(gòu)成的特征碼,然后通過對(duì)待檢測(cè)文檔在特征庫(kù)中進(jìn)行特征碼匹配,來(lái)判斷該文檔是否為惡意文檔。這種方法能快速、準(zhǔn)確檢測(cè)已知惡意文檔,但是對(duì)未知惡意文檔無(wú)法識(shí)別。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供一種基于貝葉斯網(wǎng)的惡意文檔檢測(cè)方法及裝置,可檢測(cè)各種格式文檔,并基于貝葉斯網(wǎng)采用靜態(tài)特征和動(dòng)態(tài)特征結(jié)合分析的方式有效提高檢測(cè)準(zhǔn)確率。
本發(fā)明提供的技術(shù)方案是:一種基于貝葉斯網(wǎng)的惡意文檔檢測(cè)方法和裝置。其中,基于貝葉斯網(wǎng)的惡意文檔檢測(cè)方法通過將文檔抽象為特征矩陣表示,最大程度保留文檔能用于進(jìn)行惡意檢測(cè)的相關(guān)信息,剔除無(wú)用冗余信息,并通過貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)表示各種特征與是否為惡意文檔間的因果概率關(guān)系,進(jìn)一步利用貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),對(duì)文檔的特征矩陣進(jìn)行后驗(yàn)概率計(jì)算,從而有效判斷該文檔是否為惡意文檔;主要包括:確定模型基礎(chǔ)特征指標(biāo)階段、構(gòu)建貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)階段、根據(jù)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)計(jì)算文檔為惡意文檔和為正常文檔的后驗(yàn)概率階段;其中:
確定模型基礎(chǔ)特征指標(biāo)階段執(zhí)行如下步驟:
步驟1,確定惡意文檔的靜態(tài)特征,即分析惡意文檔的可執(zhí)行代碼中經(jīng)常出現(xiàn)的特殊字符串、特殊函數(shù)、特殊關(guān)鍵字等潛在惡意特征;
步驟2,確定惡意文檔的動(dòng)態(tài)特征,動(dòng)態(tài)特征為文檔執(zhí)行過程中的行為特點(diǎn),包括但不限于觸發(fā)的相關(guān)網(wǎng)絡(luò)行為、觸發(fā)的相關(guān)文件行為、觸發(fā)的相關(guān)內(nèi)存行為、觸發(fā)的相關(guān)線程行為、觸發(fā)的相關(guān)進(jìn)程行為、觸發(fā)的相關(guān)注冊(cè)表行為、觸發(fā)的相關(guān)系統(tǒng)行為等;
構(gòu)建貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)階段具體執(zhí)行如下步驟:
步驟3,根據(jù)步驟1和步驟2中得到的惡意文檔靜態(tài)和動(dòng)態(tài)特征構(gòu)造貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),所述貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的節(jié)點(diǎn)由文檔的動(dòng)態(tài)特征和靜態(tài)特征組成;
步驟4,收集正常文檔和惡意文檔數(shù)據(jù)對(duì)貝葉斯網(wǎng)絡(luò)進(jìn)行參數(shù)學(xué)習(xí),獲得各個(gè)特征節(jié)點(diǎn)的條件概率,將貝葉網(wǎng)絡(luò)結(jié)構(gòu)與各特征節(jié)點(diǎn)的條件概率組合成為惡意文檔檢測(cè)貝葉斯網(wǎng)絡(luò)模型;
根據(jù)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)計(jì)算文檔為惡意文檔和為正常文檔的后驗(yàn)概率階段具體執(zhí)行如下步驟:
步驟5,獲取文檔中可執(zhí)行代碼的方式為對(duì)文檔代碼進(jìn)行逐字節(jié)查找,以獲取文檔中的可執(zhí)行代碼;
步驟6,根據(jù)步驟1提取的文檔靜態(tài)特征,及步驟5中獲取的可執(zhí)行代碼,分析文檔中可執(zhí)行代碼的方式統(tǒng)計(jì)靜態(tài)特征相關(guān)信息,將文檔表示成靜態(tài)特征矩陣;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué),未經(jīng)北京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810546778.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程
- 基于擴(kuò)展的馬爾克夫貝葉斯網(wǎng)的軟件可靠性評(píng)估方法
- 傳輸網(wǎng)故障診斷方法及裝置
- 一種基于MapReduce的大規(guī)模貝葉斯網(wǎng)并行推理方法
- 一種可重構(gòu)系統(tǒng)貝葉斯網(wǎng)構(gòu)建方法
- 一種基于模糊H網(wǎng)與貝葉斯方法的液壓泵故障診斷系統(tǒng)
- 基于含隱變量貝葉斯網(wǎng)的虛擬機(jī)性能下降評(píng)估方法
- 一種評(píng)價(jià)智能電能表運(yùn)行狀態(tài)的方法和系統(tǒng)
- 一種基于非平穩(wěn)動(dòng)態(tài)貝葉斯網(wǎng)的人腦效應(yīng)連接網(wǎng)絡(luò)構(gòu)建方法
- 一種基于粒子群優(yōu)化算法的增量貝葉斯網(wǎng)學(xué)習(xí)方法
- 一種基于貝葉斯網(wǎng)絡(luò)遷移的虛擬機(jī)服務(wù)質(zhì)量動(dòng)態(tài)預(yù)測(cè)方法
- 惡意特征數(shù)據(jù)庫(kù)的建立方法、惡意對(duì)象檢測(cè)方法及其裝置
- 用于檢測(cè)惡意鏈接的方法及系統(tǒng)
- 惡意信息識(shí)別方法、惡意信息識(shí)別裝置及系統(tǒng)
- 主動(dòng)式移動(dòng)終端惡意軟件網(wǎng)絡(luò)流量數(shù)據(jù)集獲取方法及系統(tǒng)
- 一種大數(shù)據(jù)告警平臺(tái)系統(tǒng)及其方法
- 一種追溯惡意進(jìn)程的方法、裝置及存儲(chǔ)介質(zhì)
- 一種相似惡意軟件推薦方法、裝置、介質(zhì)和設(shè)備
- 軟件惡意行為檢測(cè)方法及系統(tǒng)
- 惡意樣本增強(qiáng)方法、惡意程序檢測(cè)方法及對(duì)應(yīng)裝置
- 惡意語(yǔ)音樣本的確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫生成方法、裝置及設(shè)備





