[發明專利]一種基于圖論的代碼復用識別方法及系統在審

申請號：	201711489518.6	申請日：	2017-12-29
公開（公告）號：	CN109472145A	公開（公告）日：	2019-03-15
發明（設計）人：	李登峰;李柏松;王小豐	申請（專利權）人：	北京安天網絡安全技術有限公司
主分類號：	G06F21/56	分類號：	G06F21/56
代理公司：	暫無信息	代理人：	暫無信息
地址：	100195 北京市海淀區***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	待檢測樣本代碼復用函數調用樣本圖形特征數據抽象語法樹惡意代碼圖形特征中間表示圖論匹配數據庫調用關系平臺無關語言獲取同源性解析追溯繪制攻擊語言轉化分析
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種基于圖論的代碼復用識別方法及系統，其中，所述方法包括：解析待檢測樣本和已知惡意樣本形成抽象語法樹；將形成的抽象語法樹轉化為與平臺無關的中間表示語言；根據所述中間表示語言獲取所有函數的調用關系，繪制函數調用流圖；利用圖算法處理已知惡意樣本相關的函數調用流圖形成圖形特征數據庫；利用圖算法處理待檢測樣本的函數調用流圖形成圖形特征數據；利用待檢測樣本的圖形特征數據匹配所述圖形特征數據庫，確定待檢測樣本與已知惡意樣本的代碼復用程度。本發明通過分析代碼相似性來判斷惡意代碼的同源性，不僅可以用來匹配惡意代碼家族，而且可以追溯攻擊者。

技術領域

本發明涉及信息安全技術領域，尤其涉及一種基于圖論的代碼復用識別方法及系統。

背景技術

由于惡意攻擊者一般不會一次次的重復寫同一個模塊，所以可以通過代碼的相似性來判斷惡意代碼同源性，用來匹配家族，追溯攻擊者。

目前的代碼復用識別依賴于字符串提取和最長公共子序列算法，速度較慢且擁有較高的錯誤率，并且無法根據已有特征來形成新的特征，只能單調地進行模式匹配。

發明內容

針對上述技術問題，本發明通過圖算法對待檢測樣本和已知惡意樣本進行處理形成圖形特征數據，最終根據圖形的特征進行代碼復用的判別，進而判斷惡意代碼的同源性并最終追溯攻擊者。

本發明采用如下方法來實現：一種基于圖論的代碼復用識別方法，包括：

解析待檢測樣本和已知惡意樣本形成抽象語法樹；

將形成的抽象語法樹轉化為與平臺無關的中間表示語言；

根據所述中間表示語言獲取所有函數的調用關系，繪制函數調用流圖；

利用圖算法處理已知惡意樣本相關的函數調用流圖形成圖形特征數據庫；

利用圖算法處理待檢測樣本的函數調用流圖形成圖形特征數據；

利用待檢測樣本的圖形特征數據匹配所述圖形特征數據庫，確定待檢測樣本與已知惡意樣本的代碼復用程度。

進一步地，所述利用待檢測樣本的圖形特征數據匹配所述圖形特征數據庫，確定待檢測樣本與已知惡意樣本的代碼復用程度，具體包括：

若待檢測樣本的圖形特征數據與圖形特征數據庫中的某一已知惡意樣本的相似度超過預設閾值，則判定待檢測樣本與該已知惡意樣本存在代碼復用。

更進一步地，所述預設閾值為大于等于35%。

進一步地，還包括：利用開源代碼和歷史代碼作為訓練數據來提高圖形特征數據庫的識別準確率。

本發明采用如下系統來實現：一種基于圖論的代碼復用識別系統，包括：

抽象語法樹生成模塊，用于解析待檢測樣本和已知惡意樣本形成抽象語法樹；

中間表示語言生成模塊，用于將形成的抽象語法樹轉化為與平臺無關的中間表示語言；

函數調用流圖繪制模塊，用于根據所述中間表示語言獲取所有函數的調用關系，繪制函數調用流圖；

圖形特征數據庫生成模塊，用于利用圖算法處理已知惡意樣本相關的函數調用流圖形成圖形特征數據庫；

圖形特征數據生成模塊，用于利用圖算法處理待檢測樣本的函數調用流圖形成圖形特征數據；

復用判定模塊，用于利用待檢測樣本的圖形特征數據匹配所述圖形特征數據庫，確定待檢測樣本與已知惡意樣本的代碼復用程度。

進一步地，所述復用判定模塊，具體用于：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京安天網絡安全技術有限公司，未經北京安天網絡安全技術有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201711489518.6/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種防御病毒對文件進行操作的方法、裝置和存儲介質
下一篇：基于AHP-ANN的配電自動化主站信息交換安全評估方法

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理
G06F21-00 防止未授權行為的保護計算機或計算機系統的安全裝置
G06F21-02 .通過保護計算機的特定內部部件
G06F21-04 .通過保護特定的外圍設備，如鍵盤或顯示器
G06F21-06 .通過感知越權操作或外圍侵擾
G06F21-20 .通過限制訪問計算機系統或計算機網絡中的節點
G06F21-22 .通過限制訪問或處理程序或過程

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】