[發明專利]確定計算機惡意程序樣本家族數的系統和方法有效
| 申請號: | 200910040998.7 | 申請日: | 2009-07-10 |
| 公開(公告)號: | CN101604365A | 公開(公告)日: | 2009-12-16 |
| 發明(設計)人: | 葉艷芳;陳勇;王幼玉;萬里 | 申請(專利權)人: | 珠海金山軟件股份有限公司 |
| 主分類號: | G06F21/00 | 分類號: | G06F21/00;G06F17/30 |
| 代理公司: | 廣州新諾專利商標事務所有限公司 | 代理人: | 楊煥軍 |
| 地址: | 519015廣東省珠海市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 計算機 惡意程序 樣本 家族 系統 方法 | ||
1.確定計算機惡意程序樣本家族數的系統,
其特征在于,包括:
惡意程序樣本特征提取模塊,其提取惡意程序樣本的特征并通過下述惡意程序樣本距離計算模塊計算每兩個惡意程序樣本間的距離,得到距離矩陣D;
惡意程序樣本距離計算模塊,其對不同的惡意程序樣本特征采用不同的計算公式,計算惡意程序樣本間的距離;
家族間距離計算模塊,其計算兩個家族之間的距離,計算公式為:
在公式(3)中,DKL表示家族K與家族L間的距離,d(Xi,Yj)表示分別位于家族K與家族L的兩個惡意程序Xi和Yj特征之間的距離,Xi和Yj分別表示第L族中的第i個樣本和第K族中的第j個樣本,CK表示家族K,NK表示家族K中惡意程序樣本的個數,CL表示家族L,NL表示家族L中惡意程序樣本的個數;
惡意程序樣本聚類模塊,逐層對惡意程序樣本進行聚類,并根據下述VNFS計算模塊計算每層聚類結果的聚類有效性指標VNFS;
VNFS計算模塊,其計算每層分家族結果的VNFS,計算公式為:
在公式(4)中,c代表家族數,ni是家族i包含的樣本數,xik是家族i的第k個樣本,是家族i的中心點,vi表示與該家族中所有樣本點距離和最小的樣本點,vi的計算公式為:
公式(5);
在公式(5)中,xik表示家族i中的第k個樣本,xij表示家族i中的第j個樣本,(xik-xij)表示樣本xik與樣本xij的距離,nci表示家族i中的樣本總數;
是整個數據集的全局中心點,表示與全局所有樣本點距離和最小的樣本點,的計算公式為:
公式(6);
在公式(6)中,xk表示全局的第k個樣本,xj表示全局的第j個樣本,n表示全局樣本的總數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海金山軟件股份有限公司,未經珠海金山軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910040998.7/1.html,轉載請聲明來源鉆瓜專利網。





