[發明專利]一種基于詞法分析的混淆加密腳本識別方法有效
| 申請號: | 201710140949.5 | 申請日: | 2017-03-10 |
| 公開(公告)號: | CN108573148B | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 聶眉寧;應凌云;蘇璞睿 | 申請(專利權)人: | 中國科學院軟件研究所 |
| 主分類號: | G06F21/56 | 分類號: | G06F21/56 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 詞法 分析 混淆 加密 腳本 識別 方法 | ||
1.一種基于詞法分析的混淆加密腳本識別方法,其步驟包括:
1)在檢測之前,以現有的人類語言單詞集合為基礎,結合網絡上隨機采集的非惡意的大數據腳本文件進行訓練,生成適用于腳本語言的單詞詞典;
2)在檢測之前,對網絡上隨機采集的非惡意的另一批大數據腳本文件進行詞法覆蓋率檢測,確定非惡意腳本文件的詞法覆蓋率的最低閾值,同時統計這批腳本文件的注釋量與代碼量的比例,確定非惡意腳本文件的注釋比例的最高閾值;
3)在實際檢測中,對待測樣本進行詞法分析與注釋量分析,通過評估其詞法覆蓋率是否低于所述最低閾值或注釋比例是否高于所述最高閾值,判定其是否為經過混淆加密的惡意腳本;
其中,步驟2)和步驟3)中詞法覆蓋率的計算方法為:分析樣本文件中的每個單詞,計算在腳本詞典中的單詞數量與不在腳本詞典中的單詞數量的比值,即詞法覆蓋率;
其中,步驟2)中的詞法覆蓋率閾值的確定方法為:在閾值訓練階段,針對訓練集中的所有樣本計算詞法覆蓋率,并選擇其中的最小值作為閾值;
其中,步驟2)和步驟3)中的注釋比例的計算方法為:分析樣本文件中的每個單詞,計算用于注釋的單詞數量與用于代碼的單詞數量的比值,即注釋比例;
其中,步驟2)中的注釋比例閾值的確定方法為:在閾值訓練階段,針對訓練集中的所有樣本計算注釋比例,并選擇其中的最大值作為閾值;
其中,步驟3)包括以下步驟:
3.1)輸入詞典訓練階段形成的腳本詞典、閾值訓練階段形成的詞法覆蓋率閾值與注釋代碼比閾值,并準備待檢測的腳本樣本集;
3.2)選擇一個待檢測的腳本樣本文件,統計其中有多少單詞在腳本詞典中,有多少單詞不在腳本詞典中,并計算這兩種單詞的數量比值,作為該樣本的詞法覆蓋率;
3.3)對于步驟3.2)中計算出的詞法覆蓋率,如果低于詞法覆蓋率閾值,則判定該樣本為經過混淆加密的惡意腳本文件,并將檢測結果報告給用戶;
3.4)對于步驟3.2)中計算出的詞法覆蓋率,如果高于詞法覆蓋率閾值,則統計該樣本中有多少單詞用于注釋,有多少單詞用于代碼,并計算這兩種單詞的數量比值,作為該樣本的注釋代碼比;
3.5)對于步驟3.4)中計算出的注釋代碼比,如果高于注釋代碼閾值,則判定該樣本為經過混淆加密的惡意腳本文件,并將檢測結果報告給用戶;
3.6)如果步驟3.2)中計算出的詞法覆蓋率高于詞法覆蓋率閾值,且步驟3.4)中計算出的注釋代碼比低于注釋代碼比閾值,則判定該樣本為明文腳本,以插件的形式調用線程的惡意腳本檢測方法對其進行檢測,并向用戶報告檢測結果。
2.如權利要求1所述的方法,其特征在于,對于非混淆加密的明文腳本,運用現有的靜態檢測方法進一步檢測其是否為惡意腳本。
3.如權利要求1所述的方法,其特征在于,步驟1)中現有的人類語言單詞集合是包括牛津詞典在內的多種包含有意義單詞的詞典集合;步驟1)和步驟2)中的大數據腳本文件通過爬蟲從門戶網站抓取。
4.如權利要求1所述的方法,其特征在于,步驟1)中的訓練方法為:將出現在超過閾值個腳本文件中的、不在詞典中的單詞加入到詞典。
5.如權利要求1所述的方法,其特征在于,步驟3)中對代碼變形式混淆加密的檢測方法為:計算樣本的詞法覆蓋率,并將其與詞法覆蓋率的閾值相比較,如果樣本的詞法覆蓋率低于閾值,則說明該樣本中包含大量無意義單詞,即并非直接出自人類程序員之手,所以判定該樣本經過混淆加密。
6.如權利要求1所述的方法,其特征在于,步驟3)中對特征掩蓋類混淆加密的檢測方法為:計算樣本的注釋比例,并將其與注釋比例的閾值相比較,如果樣本的注釋代碼比高于閾值,則說明該樣本中包含大量注釋,即試圖利用大量單詞與字符串淹沒特征代碼,所以判定該樣本經過混淆加密。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院軟件研究所,未經中國科學院軟件研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710140949.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種惡意樣本的篩選裝置及方法
- 下一篇:一種樣本檢測方法及裝置





