[發明專利]樣本分析方法、裝置及存儲介質有效
| 申請號: | 201210210433.0 | 申請日: | 2012-06-25 |
| 公開(公告)號: | CN102831149A | 公開(公告)日: | 2012-12-19 |
| 發明(設計)人: | 張曉康 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/06 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 胡海國 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 分析 方法 裝置 存儲 介質 | ||
1.一種樣本分析方法,其特征在于,包括以下步驟:
接收上傳的樣本,對所述樣本進行過濾處理;
對過濾處理后的樣本進行歸類處理;
對歸類處理后的樣本按照對應的類別進行分析。
2.根據權利要求1所述的方法,其特征在于,所述對樣本進行過濾處理的步驟包括:
過濾掉所述樣本組成的樣本集中不符合預定分析條件的樣本;所述不符合預定分析條件的樣本包括已損壞的程序文件、系統不支持的文件格式或者體積過大的文件。
3.根據權利要求2所述的方法,其特征在于,所述過濾掉所述樣本組成的樣本集中不符合預定分析條件的樣本的步驟之后還包括:
使用反惡意引擎對所述樣本進行掃描,?過濾掉其中被所述反惡意引擎識別的樣本。
4.根據權利要求1、2或3所述的方法,其特征在于,所述對過濾處理后的樣本進行歸類處理的步驟包括:
對過濾處理后的樣本進行內容掃描,為每一樣本生成一類別特征碼;
根據所述類別特征碼查找預置的數據庫,判斷所述數據庫中是否存在與所述類別特征碼相同或相似的類別特征碼;
若是,則將所述樣本的標識號記錄到該類別特征碼對應的類別中;否則
在所述數據庫中創建一對應所述類別特征碼的類別,并以所述類別特征碼為索引,將所述樣本的標識號記錄到該類別特征碼對應的類別中。
5.根據權利要求4所述的方法,其特征在于,所述對歸類處理后的樣本按照對應的類別進行分析的步驟包括:
對歸類處理后的每一類別樣本集,判斷該類別樣本集中是否有樣本分析過,若是,則結束對該類別的樣本分析流程;否則
從該類別樣本中隨機挑選預定數量的樣本進行分析。
6.一種樣本分析裝置,其特征在于,包括:
過濾模塊,用于接收上傳的樣本,對所述樣本進行過濾處理;
聚類模塊,用于對過濾處理后的樣本進行歸類處理;
分析模塊,用于對歸類處理后的樣本按照對應的類別進行分析。
7.根據權利要求6所述的裝置,其特征在于,所述過濾模塊包括:
過濾單元,用于過濾掉所述樣本組成的樣本集中不符合預定分析條件的樣本;所述不符合預定分析條件的樣本包括已損壞的程序文件、系統不支持的文件格式或者體積過大的文件。
8.根據權利要求7所述的裝置,其特征在于,所述過濾模塊還包括:
反惡意引擎單元,用于使用反惡意引擎對所述樣本進行掃描,?過濾掉其中被所述反惡意引擎識別的樣本。
9.根據權利要求6、7或8所述的裝置,其特征在于,所述聚類模塊包括:
特征碼生成單元,用于對過濾處理后的樣本進行內容掃描,為每一樣本生成一類別特征碼;
判斷單元,用于根據所述類別特征碼查找預置的數據庫,判斷所述數據庫中是否存在與所述類別特征碼相同或相似的類別特征碼;
分類單元,用于當所述數據庫中存在所述類別特征碼時,將所述樣本的標識號記錄到該類別特征碼對應的類別中;否則,在所述數據庫中創建一對應所述類別特征碼的類別,并以所述類別特征碼為索引,將所述樣本的標識號記錄到該類別特征碼對應的類別中。
10.根據權利要求9所述的裝置,其特征在于,所述分析模塊還用于對歸類處理后的每一類別樣本集,判斷該類別樣本集中是否有樣本分析過,若是,則不對該類別的樣本進行分析;否則從該類別樣本中隨機挑選預定數量的樣本進行分析。
11.一種計算機可讀取的存儲介質,在其上存儲了使計算機能夠運行的程序,在程序裝入計算機的存儲器內后,接收上傳的樣本,對所述樣本進行過濾處理;對過濾處理后的樣本進行歸類處理;對歸類處理后的樣本按照對應的類別進行分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210210433.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:地面操作高處鉆孔裝置的電控裝置
- 下一篇:一種軸承拆卸器





