[發明專利]基于語義分割的惡意軟件基因快速檢測方法和裝置有效
| 申請號: | 201811342373.1 | 申請日: | 2018-11-12 |
| 公開(公告)號: | CN109492396B | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 涂小毅;范淵 | 申請(專利權)人: | 杭州安恒信息技術股份有限公司 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56;G06K9/62 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 王文紅 |
| 地址: | 310052 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 分割 惡意 軟件 基因 快速 檢測 方法 裝置 | ||
本發明提供了一種基于語義分割的惡意軟件基因快速檢測方法及裝置,由基因庫訓練后的語義分割模型可極大提高實時樣本的匹配檢測效率,被訓練后的語義分割模型不需要攜帶基因庫的特性甚至可嵌入離線實時安全產品中;自動抽象特征提取特性及后續成熟的優化技術可提高惡意變形的基因識別正確率。
技術領域
本發明涉及信息安全技術領域,具體而言,涉及一種基于語義分割的惡意軟件基因快速檢測方法和裝置。
背景技術
惡意軟件基因提取及識別技術大概于2008年左右被提出,前期主要將使用的特定個人習慣的代碼片段提取為基因用于識別惡意軟件開發者或APT組織,后續逐漸擴大加入惡意軟件家族基因用于識別其變種迭代和新家族判斷。
目前,常規的惡意軟件基因匹配技術有兩大問題:
1.基因庫的規模隨惡意軟件數量的增加而呈指數級增長,帶來常規檢索和匹配方式效率低下,甚至無法落地應用;
2.龐大的基因庫無法嵌入安全產品或離線部署;
3.常規模糊匹配技術或人工經驗形成的預處理技術,對惡意變形的基因識別正確率較差。
發明內容
針對上述現有技術中存在的問題,本發明提供了一種基于語義分割的惡意軟件基因快速檢測方法和裝置。
第一方面,本發明實施例提供了一種基于語義分割的惡意軟件基因快速檢測方法,所述方法包括:
將待檢測樣本進行反匯編成待檢測反匯編代碼;
將待檢測反匯編代碼轉化成待檢測圖片;
將所述待檢測圖片輸入語義分割模型,輸出解析圖片;
根據所述解析圖片,得到檢測結果。
進一步的,所述語義分割模型訓練方法包括:
獲取基礎樣本,并對所述基礎樣本進行反匯編成樣本反匯編代碼;
將樣本反匯編代碼轉化成樣本圖片,并且將所述樣本圖片整理成數據集;
利用上所述數據集訓練原有語義分割模型形成語義分割模型。
進一步的,將樣本反匯編代碼轉化成樣本圖片,并且將所述樣本圖片整理成數據集,包括:
將所述數據集按7:2:1的比例分為訓練集、驗證集和交叉測試集。
進一步的,利用上所述數據集訓練原有語義分割模型形成語義分割模型,包括:
利用訓練集、驗證集和交叉測試集來訓練測試原有語義分割模型。
進一步的,將所述待檢測圖片輸入語義分割模型,輸出解析圖片之后,所述方法還包括:
根據待檢測反匯編代碼和預設標識數組優化解析圖片;
第二方面,本發明實施例還提供了一種基于語義分割的惡意軟件基因快速檢測裝置,所述裝置包括:
反匯編模塊,用于將待檢測樣本進行反匯編成待檢測反匯編代碼;
轉化模塊,用于將待檢測反匯編代碼轉化成待檢測圖片;
解析模塊,用于將所述待檢測圖片輸入語義分割模型,輸出解析圖片;
檢測模塊,用于根據所述解析圖片,得到檢測結果。
進一步的,所述裝置還包括訓練模塊;
所述訓練模塊用于:
獲取基礎樣本,并對所述基礎樣本進行反匯編成樣本反匯編代碼;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州安恒信息技術股份有限公司,未經杭州安恒信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811342373.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種檢測惡意程序的方法、裝置及存儲介質
- 下一篇:一種計算機信息安全系統





