[發明專利]終端應用的檢測方法和裝置在審
| 申請號: | 201711196245.6 | 申請日: | 2017-11-25 |
| 公開(公告)號: | CN107798243A | 公開(公告)日: | 2018-03-13 |
| 發明(設計)人: | 郭志民;牛霜霞;呂卓;張鵬;陳崧;魏寒冰;王艷敏;肖寒 | 申請(專利權)人: | 國網河南省電力公司電力科學研究院;國家電網公司 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56;G06N3/04;G06N3/08 |
| 代理公司: | 蘇州知途知識產權代理事務所(普通合伙)32299 | 代理人: | 張錦波 |
| 地址: | 450000 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 終端 應用 檢測 方法 裝置 | ||
技術領域
本發明涉及應用程序技術領域,具體而言,涉及一種終端應用的檢測方法和裝置。
背景技術
隨著智能手機的不斷推廣,人們對智能手機的依賴逐步攀升,智能手機的安全也越來越受到重視。如果智能手機安裝了惡意應用,容易致使用戶信息被竊取。由于操作系統的不同,安卓系統的智能手機更容易受到惡意應用的攻擊。APK是安卓應用的安裝包,可以通過靜態分析技術提取出安卓應用的靜態特征,安卓惡意應用與正常應用的區分在于特征的不同,因此,可以通過靜態分析應用的特征實現安卓惡意應用檢測。靜態分析的方法包括很多種,例如基于特征樹的靜態分析方法,旨在找到一種新型API表征方法。該方法可以應用在不同層面上,最終達到惡意檢測的目的。采用一些機器學習方法也可以用來實現安卓惡意應用檢測。這些機器學習方法可以避免手動制作和更新惡意應用檢測規則,對于安卓惡意應用層出不窮的現狀有著很重要的意義。
深度學習是機器學習中一個新的研究領域,起源于對人工神經網絡的研究,通過組合低層次特征,形成抽象的高層特征表示,更好的發現數據的特點,得到更有用的數據表示,從而完成后續的工作。深度學習在語音識別、圖像處理、自然語言處理等方面都已經有了很多的應用。目前,DBN等深度學習算法也在安卓惡意應用檢測方面得到了應用,卷積神經網絡作為深度學習算法的一種,但針對大規模的惡意應用檢測卷積過程消耗時間過長、檢測效率低。
針對現有技術中針對利用深度學習方法對惡意應用檢測耗時長,效率低的問題,目前尚未提出有效的解決方案。
發明內容
本發明的主要目的在于提供一種終端應用的檢測方法和裝置,以解決現有技術中針對惡意應用檢測耗時長,效率低的問題。
為了實現上述目的,根據本發明實施例的一個方面,提供了一種終端應用的檢測方法,包括:獲取終端應用的樣本訓練集,所述樣本訓練集包括正常終端應用和惡意終端應用;利用自編碼對所述樣本訓練集進行預處理,得到預處理后的樣本訓練集;將所述預處理后的樣本訓練集輸入到預先建立的初始卷積神經網絡模型中,訓練得到卷積神經網絡;利用訓練得到的卷積神經網絡對待測終端應用進行檢測,以確定所述待測終端應用是否為惡意應用。
可選地,利用自編碼對所述樣本訓練集進行預處理,得到預處理后的樣本訓練集包括:
對所述樣本訓練集中的終端應用文件進行分析,提取每個終端應用的特征;
利用提取的特征生成每個終端應用的特征向量,得到特征向量集,其中,每個特征向量用于表示對應的終端應用;
利用自編碼對所述特征向量集進行降維處理,得到預處理后的樣本訓練集,并確定自編碼網絡的層數以及各層節點數量。
可選地,對所述樣本訓練集中的終端應用文件進行分析,提取每個終端應用的特征包括:
采用靜態分析方法對各個終端應用樣本的apk文件進行分析,利用分析工具提取樣本的11個類型的特征,包括Permissions、Filtered Intents、Restricted API calls、Component Names、Code Related Features、Certificate Information、Payload Information、Payload Information、Strings contained in the source code of app、Used Permissions、Hardware Features、Suspicious API Calls,每個類型的特征包括多個子特征;
利用提取的特征生成每個終端應用的特征向量包括:將每個終端應用樣本具有的特征組成特征集合,并添加樣本的分類標簽,處理成對應的特征向量。
可選地,利用自編碼對所述特征向量集進行降維處理包括:
確定所有終端應用樣本中包含的最大樣本特征數,并對于特征數小于所述最大樣本特征數的樣本進行補零處理;
構造基于自編碼的5層自編碼網絡,依次包括1個輸入層,3個隱含層和1個分類層;
設置自編碼網絡的輸入層節點數與所述最大樣本特征數相同,并設置第一個隱含層節點數、第二個隱含層節點數、第三個隱含層的節點數以及分類層的節點數,其中,第一個隱含層的輸出最為第二個隱含層的輸入,第二個隱含層的輸出作為第三個隱含層的輸入,將第三個隱含層的輸出作為分類層的輸入,將無標簽的特征向量作為輸入層,有標簽的特征向量的標簽作為分類層的輸出;
利用反向傳播算法對自編碼網絡進行調整,優化網絡結構參數,最終將輸入層與3個隱含層組成特征降維模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網河南省電力公司電力科學研究院;國家電網公司,未經國網河南省電力公司電力科學研究院;國家電網公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711196245.6/2.html,轉載請聲明來源鉆瓜專利網。





