日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于文件指令頻度的計算機惡意程序分類系統及分類方法有效

專利信息
申請號: 200910040996.8 申請日: 2009-07-10
公開(公告)號: CN101604363A 公開(公告)日: 2009-12-16
發明(設計)人: 葉艷芳;萬里;韓智雪;陳勇 申請(專利權)人: 珠海金山軟件股份有限公司
主分類號: G06F21/00 分類號: G06F21/00;G06F17/30
代理公司: 廣州新諾專利商標事務所有限公司 代理人: 楊煥軍
地址: 519015廣東省珠海市*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 文件 指令 頻度 計算機 惡意程序 分類 系統 方法
【權利要求書】:

1.一種基于文件指令頻度的計算機惡意程序分類系統,

其特征在于,包括

指令頻度特征提取模塊,其首先解析惡意程序代碼的所有指令,并通 過計算每個指令在惡意程序樣本中所出現的頻率TF與逆向樣本頻率 IDF,對惡意程序樣本集中出現的指令進行加權,從而構造指令頻度 向量來表征惡意程序樣本,并存儲于惡意程序特征庫中;其中,

指令頻率TF是某一個給定的指令在該樣本中出現的頻率,對于 第j個樣本中的指令ti,其指令頻率值為TFi,j,其TFi,j值定義如下:

TFi,j=ni,jΣknk,j]]>——公式(1)

其中,ni,j是該指令ti在樣本j中出現的次數,而分母則是在樣本j 中所有指令出現的次數之和;

逆向樣本頻率IDF是一個指令普遍重要性的度量,一個指令ti的 IDF值定義如下:

IDFi=log|D||{d:tid}|]]>——公式(2)

其中,|D|表示惡意程序樣本庫中的樣本總數,|{d:ti∈d}|表示包 含指令ti的惡意程序樣本個數;

對惡意程序樣本集中出現的指令進行加權,采用公式(1)指令頻 率TFi,j與公式(2)逆向樣本頻率IDFi的乘積來對樣本j中的第i個 指令ti進行加權得到TFIDFi,j,即:

TFIDFi,j=TFi,j*IDFi——公式(3)

其中,IDFi,代表第i個指令ti的逆向樣本頻率;

惡意程序特征庫,其用于存儲以指令頻度向量來表征的所有惡意程序 樣本;

樣本差異度度量模塊,其采用Cosine余弦度量方法,通過計算兩個 樣本指令頻度向量之間夾角來衡量樣本之間的差異度;其中,

兩個樣本xi和xj的Cosine距離Sij定義如下:

Sij=xiTxj|xi||xj|]]>——公式(4)

其中,分子表示兩個樣本特征向量的內積,分母表示兩個樣本特征向 量長度的乘積;

惡意程序樣本家族劃分模塊,其將惡意程序特征庫中所有N個惡意程 序樣本從分成N個家族開始,逐次分成N-1個家族、N-2個家族,依 次類推,直至最后將所有N個惡意程序樣本分成一個家族或者直到分 成預先設定好的家族數;具體做法如下:

設需要對第K-1層劃分家族,則以上一層產生的K個家族為基礎, 根據公式(4)的距離度量方法選擇最相似的兩個家族合并成一個新 家族,并重新計算合并后新家族的中心點,然后利用下述K-means的 全局優化迭代算法進行迭代,直至所有家族的中心點不再變化,最終 將所有惡意程序樣本劃分為合理的K-1個家族;K-means的全局優 化迭代算法如下:

I)按照該K-1層初始的K-1個中心點,將非中心點的樣本點根 據公式(4)的Cosine距離度量方法計算該樣本點與這K-1個中心點 的距離,將每個非中心點的樣本點重新歸類到與其最近的家族;

II)根據I)劃分的結果更新所有家族的中心:家族i的中心點 為ci,其中i=1…k-1,其中其中vt代表家族i的 第t個樣本,ni表示該家族i的樣本個數,表示樣本vt與同 家族所有樣本的距離和;

III)檢查即求的值,若值為0,則本次迭代與上一次 迭代所有家族的中心點未發生變化,迭代終止;否則,轉步驟I)~ 步驟II),其中ci,c′i分別為家族i更新前后的中心點; 聚類質量評估模塊,其對惡意程序樣本家族劃分模塊每層分家族的結 果采用FS指標值進行有效性度量,并選擇最小的FS指標值,將其對 應的劃分結果作為最終結果;其中,

FS=Σi=1cΣk=1nukim(||xk-vi||2-||vi-v||2)]]>——公式(5)

其中,n表示惡意程序樣本庫的樣本個數,c表示分成的類數,vi表示第i家族的中心點,家族的中心點是指距離本家族中所有樣本的 距離之和最小的樣本點,是惡意程序樣本庫中全體樣本的中心點, 即距離全局所有樣本的距離之和最小的樣本點;||xk-vi||表示第i家 族中的樣本點xk與該家族中心點vi的距離,表示第i家族的中 心點到全局中心點的距離,是樣本隸屬度矩陣:若樣本xk屬于第 i家族,則矩陣中該xk值為1;否則,值為0。

2.一種使用權利要求1所述基于文件指令頻度的計算機惡意程序分 類系統進行分類的方法,其特征在于,包括如下過程

第一、指令頻度特征提取步驟,指令頻度特征提取模塊首先解析惡意 程序代碼的所有指令,并統計每個指令在惡意程序樣本中所出現的頻 度,采用指令在惡意程序樣本中出現的頻率TF與逆向樣本頻率IDF 對惡意程序樣本集中出現的指令進行加權,從而構造指令頻度向量來 表征惡意程序樣本;其中,

指令頻率TF是某一個給定的指令在該樣本中出現的頻率,對于 第j個樣本中的指令ti,其指令頻率值為TFi,j,其TFi,j值定義如下:

TFi,j=ni,jΣknk,j]]>——公式(1)

其中,ni,j是該指令ti在樣本j中出現的次數,而分母則是在樣本j 中所有指令出現的次數之和;

逆向樣本頻率IDF是一個指令普遍重要性的度量,一個指令ti的 IDF值定義如下:

IDFi=log|D||{d:tid}|]]>——公式(2)

其中,|D|表示惡意程序樣本庫中的樣本總數,|{d:ti∈d}|表示包 含指令ti的惡意程序樣本個數;

對惡意程序樣本集中出現的指令進行加權,采用公式(1)指令頻 率TFi,j與公式(2)逆向樣本頻率IDFi的乘積來對樣本j中的第i個 指令ti進行加權得到TFIDFi,j,即:

TFIDFi,j=TFi,j*IDFi——公式(3)

其中,IDFi,代表i第個指令ti的逆向樣本頻率;

第二,惡意程序特征庫生成步驟,將指令頻度特征提取步驟中得到以 指令頻度向量來表征的所有惡意程序樣本存儲于惡意程序特征庫中;

第三、樣本差異度度量步驟,

樣本差異度度量模塊采用Cosine余弦度量方法,通過計算兩個樣本 指令頻度向量之間夾角來衡量樣本之間的差異度;其中,

兩個樣本xi和xj的Cosine距離Sij定義如下:

Sij=xiTxj|xi||xj|]]>——公式(4)

其中,分子表示兩個樣本特征向量的內積,分母表示兩個樣本特征向 量長度的乘積;

第四、惡意程序樣本家族劃分步驟,惡意程序樣本家族劃分模塊將惡 意程序特征庫中所有N個惡意程序樣本從分成N個家族開始,逐次分 成N-1個家族、N-2個家族,依次類推,直至最后將所有N個惡意程 序樣本分成一個家族或者直到分成預先設定好的家族數;具體做法如 下:

設需要對第K-1層劃分家族,則以上一層產生的K個家族為基礎, 根據公式(4)的距離度量方法選擇最相似的兩個家族合并成一個新 家族,并重新計算合并后新家族的中心點,然后利用下述K-means的 全局優化迭代算法進行迭代,直至所有家族的中心點不再變化,最終 將所有惡意程序樣本劃分為合理的K-1個家族;K-means的全局優 化迭代算法如下:

I)按照該K-1層初始的K-1個中心點,將非中心點的樣本點根 據公式(4)的Cosine距離度量方法計算該樣本點與這K-1個中心點 的距離,將每個非中心點的樣本點重新歸類到與其最近的家族;

II)根據I)劃分的結果更新所有家族的中心:家族i的中心點 為ci,其中i=1…k-1,其中其中vt代表家族 i的第t個樣本,ni表示該家族i的樣本個數,表示樣本vt與 同家族所有樣本的距離和;

III)檢查即求的值,若值為0,則本次迭代與上一次 迭代所有家族的中心點未發生變化,迭代終止;否則,轉步驟I)~ 步驟II),其中ci,c′i分別為家族i更新前后的中心點;

第五,聚類質量評估步驟,聚類質量評估模塊對惡意程序樣本家族劃 分步驟每層分家族的結果采用FS指標值進行有效性度量;選擇所有 FS指標值中最小值,該最小FS指標值所對應的分家族結果即為最后 的分家族結果;其中,

FS=Σi=1cΣk=1nukim(||xk-vi||2-||vi-v||2)]]>——公式(5)

其中,n表示惡意程序樣本庫的樣本個數,c表示分成的類數,vi表 示第i家族的中心點,家族的中心點是指距離本家族中所有樣本的距 離之和最小的樣本點,是惡意程序樣本庫中全體樣本的中心點,即 距離全局所有樣本的距離之和最小的樣本點;||xk-vi||表示第i家族 中的樣本點xk與該家族中心點vX的距離,表示第i家族的中心 點到全局中心點的距離,是樣本隸屬度矩陣:若樣本xk屬于第i 家族,則矩陣中該xk值為1;否則,值為0。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海金山軟件股份有限公司,未經珠海金山軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200910040996.8/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美髙清性xxxxhdvid| 国产一区网址| 欧美日韩九区| 日本一区二区三区免费播放| 狠狠色依依成人婷婷九月| 国产麻豆91欧美一区二区| 国产视频二区在线观看| 欧美日韩高清一区二区| 国产一区在线精品| 丰满少妇高潮惨叫久久久| 欧美一区二区三区日本| 日韩亚洲国产精品| 午夜电影理伦片2023在线观看| 久久狠狠高潮亚洲精品| 国产精品久久久久久久龚玥菲| 日韩一区二区精品| 亚洲精品国产精品国自产网站按摩| 91免费国产视频| 久久99亚洲精品久久99| 午夜免费av电影| 精品久久久久久中文字幕| 99久久久国产精品免费无卡顿| 手机看片国产一区| 91精品国产91热久久久做人人| 久久99视频免费| 国产黄色一区二区三区| 美女张开腿黄网站免费| 日本午夜精品一区二区三区| 99精品久久99久久久久| 香蕉av一区二区| 精品在线观看一区二区| 国产精品伦一区二区三区在线观看| 久久久久久亚洲精品中文字幕| 欧美freesex极品少妇| 国产二区不卡| 狠狠操很很干| 国产一区日韩一区| 91婷婷精品国产综合久久| 日本大码bbw肉感高潮| 国产v亚洲v日韩v欧美v片| 欧美精品一区二区久久| 国产精品理人伦一区二区三区| 国产精品无码永久免费888| 狠狠色丁香久久婷婷综| 亚洲欧洲日本在线观看| 一区不卡av| 99久久久国产精品免费调教网站| 69精品久久| 久久青草欧美一区二区三区| 日本高清h色视频在线观看| 99精品偷拍视频一区二区三区| 久久午夜鲁丝片午夜精品| 欧美日韩国产专区| 欧美人妖一区二区三区| 欧美二区在线视频| 97人人澡人人爽91综合色| 久久国产精品网站| 69xx国产| 国产一区免费在线观看| 国产精品日产欧美久久久久| 亚洲乱亚洲乱妇50p| 亚洲精品主播| 5g影院天天爽入口入口| 在线亚洲精品| 高清国产一区二区三区| 欧美精品一区二区久久| 97视频精品一二区ai换脸| 男人的天堂一区二区| 久久国产精品久久久久久电车| 欧美日韩亚洲另类| 91高清一区| 色综合久久88| 午夜黄色网址| 国产精品久久久麻豆| 国产精品18久久久久白浆| 91亚洲精品国偷拍| 国产精品久久久久久av免费看| 国产免费一区二区三区四区五区 | 日韩av中文字幕在线免费观看| 欧美亚洲精品suv一区| 99久久www免费| 91久久精品在线|