[發明專利]一種基于類自然語言特征的算法生成域名檢測方法有效
| 申請號: | 201710243526.6 | 申請日: | 2017-04-14 |
| 公開(公告)號: | CN107046586B | 公開(公告)日: | 2019-07-23 |
| 發明(設計)人: | 陳興蜀;朱毅;江天宇;曾雪梅;陳敬涵 | 申請(專利權)人: | 四川大學 |
| 主分類號: | H04L29/12 | 分類號: | H04L29/12;H04L29/06 |
| 代理公司: | 成都信博專利代理有限責任公司 51200 | 代理人: | 張輝 |
| 地址: | 610065 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然語言 特征 算法 生成 域名 檢測 方法 | ||
1.一種基于類自然語言特征的算法生成域名檢測方法,其特征在于,包括以下步驟:
步驟1:選取域名語料庫,并針對域名語料庫使用特征提取模塊進行特征提取;
步驟2:針對域名語料庫進行參數學習,得到各項特征的系統參數,獲得基于語料庫的檢測模型;
步驟3:通過數據包嗅探模塊獲取DNS服務器的請求域名信息;
步驟4:根據請求域名信息使用特征提取模塊進行特征提取;
步驟5:在真實環境中根據檢測模型對域名進行檢測;
所述特征提取模塊計算過程為:
1)對域名按字符“.”進行分級,確定域名級數dLevel,對每級域名進行統計;
2)計算每級域名的長度Length,即每級域名的字符個數;
3)計算每級域名中數字占比NumRatio,即每級域名中數字字符所占的比例;
4)計算每級域名的字符混淆度,域名中所含字符集為A={a1,a2,...,an},為字符ai出現的頻次,則每級域名的字符混淆度H(domain):
5)計算每級域名的2-Gram至n-Gram馬爾科夫轉移概率,設域名為B=b1b2...bn,N-Gram(k)表示相差k距離的兩字符組成的序列其先驗概率為PN-Gram(k),則域名k階馬爾科夫轉移概率Markov(domain):
6)得到特征向量。
2.如權利要求1所述的一種基于類自然語言特征的算法生成域名檢測方法,其特征在于,所述域名語料庫選擇Alexa TOP一百萬域名及PadCrypt、QADARS、LOCKY域名生成算法生成域名。
3.如權利要求1所述的一種基于類自然語言特征的算法生成域名檢測方法,其特征在于,所述檢測模型采用支持向量機模型。
4.如權利要求1所述的一種基于類自然語言特征的算法生成域名檢測方法,其特征在于,所述真實檢測環境采用Spark平臺。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710243526.6/1.html,轉載請聲明來源鉆瓜專利網。





