[發明專利]基于圖匹配網絡的二進制代碼相似性檢測方法及系統有效
| 申請號: | 202110722400.3 | 申請日: | 2021-06-29 |
| 公開(公告)號: | CN113254934B | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 劉玉玲;張云 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56;G06F8/75;G06N3/04;G06N3/08 |
| 代理公司: | 湖南兆弘專利事務所(普通合伙) 43008 | 代理人: | 譚武藝 |
| 地址: | 410082 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 匹配 網絡 二進制 代碼 相似性 檢測 方法 系統 | ||
1.一種基于圖匹配網絡的二進制代碼相似性檢測方法,其特征在于,包括:
1)獲取待測程序對;
2)針對待測程序對中的待測程序進行反匯編,并獲取過程間控制流圖ICFG及其指令;
3)分別針對待測程序的過程間控制流圖ICFG獲取其中基本塊的初始特征嵌入;
4)通過圖匹配神經網絡得到待測程序對的過程間控制流圖ICFG的最終嵌入
5)在向量空間中計算待測程序對的過程間控制流圖ICFG的最終嵌入
步驟3)包括:
3.1)對過程間控制流圖ICFG中基本塊的指令進行規范化;
3.2)將指令中的操作碼和相應的規范化后的操作數進行連接,形成單詞;
3.3)計算每個指令形成的單詞的權重;
3.4)在過程間控制流圖ICFG中進行隨機游走,形成一系列的指令序列;
3.5)將一個指令序列作為句子、所有的指令序列作為文章,構建用于基本塊初始特征嵌入的訓練集;
3.6)采用預設的詞向量模型,通過使平均對數概率最大化獲得指令級的嵌入,其中平均對數概率的函數表達式為:
,
上式中,
,
上式中,
3.7)基于單詞的權重、得到的指令級嵌入計算基本塊的初始特征嵌入,且計算函數表達式如下式所示:
,
上式中,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110722400.3/1.html,轉載請聲明來源鉆瓜專利網。





