[發明專利]移動應用程序的特征提取方法在審
| 申請號: | 201910103820.6 | 申請日: | 2019-02-01 |
| 公開(公告)號: | CN109829305A | 公開(公告)日: | 2019-05-31 |
| 發明(設計)人: | 李向陽;薛爽爽;李安然;張蘭 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56;G06K9/62 |
| 代理公司: | 北京凱特來知識產權代理有限公司 11260 | 代理人: | 鄭立明;付久春 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 移動應用程序 函數調用圖 函數節點 特征信息 編碼向量 特征提取 盜版檢測 功能分類 家族分類 特征表示 提取工具 提取特征 行為差異 行為特征 應用版本 應用檢測 遍歷 刻畫 衡量 檢測 應用 | ||
1.一種移動應用程序的特征提取方法,其特征在于,包括:
步驟1,提取函數調用圖:利用提取工具提取所檢測的移動應用程序的函數調用圖;
步驟2,對函數調用圖編碼:對所述函數調用圖的各函數節點進行邊遍歷邊編碼形成各函數節點的編碼向量;
步驟3,提取特征信息:根據編碼得到的函數調用圖的各函數節點的編碼向量提取所述移動應用程序的特征信息。
2.根據權利要求1所述的移動應用程序的特征提取方法,其特征在于,所述方法中,提取所檢測的移動應用程序的函數調用圖所用的提取工具采用:Soot和FlowDroid。
3.根據權利要求1所述的移動應用程序的特征提取方法,其特征在于,所述方法的步驟2中,對所述函數調用圖的各函數節點進行邊遍歷邊編碼形成各函數節點的編碼向量為:
從所述函數調用圖的函數根節點對該函數調用圖的全部函數節點進行深度或廣度遍歷,生成各函數節點對應的編碼向量。
4.根據權利要求3所述的移動應用程序的特征提取方法,其特征在于,所述遍歷過程中,當一個函數節點擁有多個后繼函數節點時,對該函數節點的多個后繼函數節點先排序后,再按所排順序進行遍歷,對多個后繼函數節點的排序方式包括:
步驟21,多個后繼函數節點中,每個后繼函數節點對應一個用戶自定義函數或一個系統函數,若后繼函數節點對應的是一個用戶自定義函數,則獲取該用戶自定義函數調用的系統函數簽名及系統函數的調用個數;若后繼函數節點對應的是一個系統函數,則獲取該后繼函數節點中調用的系統函數簽名及對應系統函數的調用個數,并設該后繼函數節點對應的用戶自定義函數名稱為當前函數節點;
步驟22,根據每個用戶自定義函數調用的系統函數簽名及其調用個數為每個用戶自定義函數計算出一個排序值,并按照每個用戶自定義函數的排序值從大到小排列對全部的用戶自定義函數排序,即完成對多個后繼函數節點的排序。
5.根據權利要求4所述的移動應用程序的特征提取方法,其特征在于,所述步驟22中,根據每個用戶自定義函數調用的系統函數簽名及其調用個數為每個用戶自定義函數計算出一個排序值的步驟如下:
步驟221,建立調用的所有系統函數的索引值:根據待排序的用戶自定義函數調用的系統函數簽名,獲取該待排序的用戶自定義函數調用的所有系統函數,并按照字母序從小到大排序所有的系統函數,使所調用的每個系統函數都具有一個唯一的索引值;
步驟222,確定每個系統函數對該待排序的用戶自定義函數的貢獻值:確定該待排序的用戶自定義函數所調用的每個系統函數對該用戶自定義函數的貢獻值,該貢獻值等于:每個系統函數的索引值×(該系統函數被該待排序的用戶自定義函數調用的個數/調用個數的最大值);
步驟223,所述待排序的用戶自定義函數的排序值等于其調用的所有系統函數的貢獻值之和。
6.根據權利要求5所述的移動應用程序的特征提取方法,其特征在于,所述方法中,生成各函數節點對應的編碼向量包括:
遍歷一個函數節點時,將該函數節點所代表的應用程序的一個行為信息編碼成一個子向量,將該子向量與已經遍歷得到的其他子向量按遍歷順序順次拼接成一個編碼向量;
當一個函數節點遍歷完成后得到的總編碼向量,即為該函數節點的編碼向量。
7.根據權利要求6所述的移動應用程序的特征提取方法,其特征在于,所述方法中,遍歷一個函數節點時,將該函數節點所代表的應用程序的一個行為信息編碼成一個子向量,將該子向量與已經遍歷得到的其他子向量拼接成新的編碼向量為:
步驟231,獲取所遍歷函數節點對應的用戶自定義函數所調用的系統函數的集合;
步驟232,對所調用的系統函數按其所在的系統包進行分組,使每個分組的系統函數所在的系統包均相同;
步驟233,每個分組內的系統函數按字母序從小到大拼接成一個字符串,各分組之間按照系統包名的字母序從小到大排序;
步驟234,對每組的系統函數組成的字符串進行哈希編碼,并將所有分組經哈希編碼得到的值拼接得到該用戶自定義函數的編碼向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910103820.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種病毒檢測方法及裝置
- 下一篇:一種優化特征提取的惡意軟件分類方法





