[發(fā)明專利]基于統(tǒng)計(jì)學(xué)習(xí)的惡意代碼多模型交叉檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810815327.2 | 申請(qǐng)日: | 2018-07-24 |
| 公開(kāi)(公告)號(hào): | CN109033836B | 公開(kāi)(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計(jì))人: | 王志;余沛然;孫心怡;魏然;邱克帆 | 申請(qǐng)(專利權(quán))人: | 南開(kāi)大學(xué) |
| 主分類號(hào): | G06F21/56 | 分類號(hào): | G06F21/56 |
| 代理公司: | 天津耀達(dá)律師事務(wù)所 12223 | 代理人: | 侯力 |
| 地址: | 300071*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 統(tǒng)計(jì) 學(xué)習(xí) 惡意代碼 模型 交叉 檢測(cè) 方法 | ||
1.基于ConformalPrediction算法的統(tǒng)計(jì)學(xué)習(xí)預(yù)測(cè)方法,其特征在于,該方法以多種機(jī)器學(xué)習(xí)模型為底層,選用統(tǒng)計(jì)學(xué)習(xí)算法,計(jì)算一個(gè)待測(cè)樣本x的顯著度p-value,步驟如下:
第1步、計(jì)算顯著度p-value
第1.1、輸入:已知集合D包含n個(gè)惡意代碼樣本:D={z1,…,zn-1},zi∈Z,其中惡意代碼樣本可重復(fù)但無(wú)順序,多為已被分類或聚類算法處理后的具有某種相似性的惡意代碼樣本的集合;
①惡意代碼樣本z,待檢測(cè)的未知代碼樣本,預(yù)測(cè)該代碼樣本與已知惡意代碼樣本集合的p-value;
②不一致性度量函數(shù)A:Z(*)×Z→R,該函數(shù)的輸入為一個(gè)已知惡意代碼樣本集合和一個(gè)未知代碼樣本,返回值為一個(gè)實(shí)數(shù),該實(shí)數(shù)可反映出輸入代碼樣本與輸入惡意代碼樣本集合的相似程度;
③顯著水平ε,數(shù)值ε可由用戶指定,反映用戶可接受的最大出錯(cuò)概率;
第1.2、輸出:
惡意代碼樣本z的p-value值pn;同時(shí),若pn大于顯著水平ε,則輸出True,否則輸出False;
第2步、惡意代碼變異的檢測(cè)
使用基于時(shí)間窗平均p-values的APV算法來(lái)檢測(cè)惡意代碼的變異過(guò)程;根據(jù)時(shí)間軸上的先后順序?qū)阂獯a樣本切割成不同的時(shí)間窗大小;每個(gè)時(shí)間窗的APV值是基于之前所有時(shí)間窗的樣本集合作為已知樣本集合,依次計(jì)算當(dāng)前時(shí)間窗每個(gè)樣本的p-value值,然后求該時(shí)間窗的樣本的APV值;每個(gè)不一致度量函數(shù)都會(huì)在時(shí)間窗內(nèi)得到一個(gè)APV值;
時(shí)間窗的APV值隨時(shí)間的變化趨勢(shì)反應(yīng)了惡意數(shù)據(jù)在統(tǒng)計(jì)規(guī)律上隨時(shí)間的變化;如果某個(gè)檢測(cè)模型的APV值隨時(shí)間逐漸降低,說(shuō)明新的惡意代碼樣本的統(tǒng)計(jì)規(guī)律在該檢測(cè)模型的觀測(cè)角度,逐漸與已知的惡意代碼樣本統(tǒng)計(jì)規(guī)律產(chǎn)生差異,檢測(cè)模型正在遭受惡意代碼變異過(guò)程的影響,但并不一定出現(xiàn)檢測(cè)模型的退化;惡意代碼變異過(guò)程是一種量變過(guò)程,當(dāng)惡意代碼的得分超過(guò)檢測(cè)模型在訓(xùn)練過(guò)程確定的最佳閾值,產(chǎn)生質(zhì)變,檢測(cè)模型出現(xiàn)退化現(xiàn)象;如果某個(gè)檢測(cè)模型在新的時(shí)間窗內(nèi),APV值沒(méi)有出現(xiàn)下降,說(shuō)明當(dāng)前時(shí)間窗惡意數(shù)據(jù)的分布規(guī)律在該檢測(cè)模型的觀測(cè)角度,沒(méi)有出現(xiàn)惡意代碼變異過(guò)程;
第3步、多模型共同防御
通過(guò)多模型從不同角度對(duì)惡意代碼樣本的分布規(guī)律進(jìn)行建模,每個(gè)機(jī)器學(xué)習(xí)模型都會(huì)對(duì)該樣本給出一個(gè)得分;由于這些得分不具有可比性,所以使用ConformalPrediction算法,將這些得分轉(zhuǎn)換成可進(jìn)行比較的統(tǒng)計(jì)量p-value;
統(tǒng)計(jì)量p-value是得分高于或等于被檢測(cè)惡意代碼樣本得分的樣本數(shù)量與總數(shù)的比值;一個(gè)樣本的p-value越大表示該樣本在已知的惡意代碼樣本集合中越顯著;對(duì)于同一個(gè)樣本,每個(gè)機(jī)器學(xué)習(xí)模型都生成一個(gè)p-value值;由于惡意代碼的變異,可能導(dǎo)致平臺(tái)上的部分機(jī)器學(xué)習(xí)模型無(wú)效;通過(guò)統(tǒng)計(jì)量p-value所表示的顯著度,將選取顯著度最高的模型預(yù)測(cè)結(jié)果,作為多模型共同防御的最終預(yù)測(cè)結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南開(kāi)大學(xué),未經(jīng)南開(kāi)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810815327.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 統(tǒng)計(jì)系統(tǒng)、統(tǒng)計(jì)裝置和統(tǒng)計(jì)方法
- 人數(shù)統(tǒng)計(jì)方法和人數(shù)統(tǒng)計(jì)系統(tǒng)
- 統(tǒng)計(jì)物體數(shù)量的統(tǒng)計(jì)系統(tǒng)
- 網(wǎng)絡(luò)處理器的統(tǒng)計(jì)計(jì)數(shù)方法
- 統(tǒng)計(jì)信息上報(bào)方法及裝置
- 稿件統(tǒng)計(jì)方法和稿件統(tǒng)計(jì)系統(tǒng)
- 數(shù)據(jù)統(tǒng)計(jì)方法及裝置
- 獲取數(shù)據(jù)的統(tǒng)計(jì)狀態(tài)的方法及裝置
- 信息統(tǒng)計(jì)方法和信息統(tǒng)計(jì)裝置
- 電量統(tǒng)計(jì)系統(tǒng)及電量統(tǒng)計(jì)方法
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 檢測(cè)惡意代碼樣本的網(wǎng)絡(luò)行為的方法及系統(tǒng)
- 一種惡意代碼樣本自動(dòng)處理的方法及裝置
- 惡意代碼處理方法、裝置及系統(tǒng)
- 惡意代碼誤報(bào)的追蹤方法、裝置及系統(tǒng)
- 惡意代碼降噪大數(shù)據(jù)檢測(cè)系統(tǒng)
- 惡意代碼庫(kù)建立方法和系統(tǒng)
- 一種受生物基因啟發(fā)的惡意代碼檢測(cè)方法
- 惡意代碼可視化及變種檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 惡意代碼可視化及變種檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 工業(yè)惡意代碼標(biāo)記方法、設(shè)備、存儲(chǔ)介質(zhì)及裝置





