[發明專利]一種域名流量特征提取方法、裝置、設備及可讀存儲介質有效
| 申請號: | 201910344874.1 | 申請日: | 2019-04-26 |
| 公開(公告)號: | CN111866196B | 公開(公告)日: | 2023-05-16 |
| 發明(設計)人: | 閆凡;陳揚;趙振洋;古亮 | 申請(專利權)人: | 深信服科技股份有限公司 |
| 主分類號: | H04L61/4511 | 分類號: | H04L61/4511;G06N3/0464;G06N3/08;G06N3/044;H04L67/02 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518055 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 域名 流量 特征 提取 方法 裝置 設備 可讀 存儲 介質 | ||
1.一種域名流量特征提取方法,其特征在于,包括:
獲取域名訪問流量,得到待處理流量數據;
統計預設時間內所述待處理流量數據中各域名單位時間訪問次數,得到各域名對應的訪問次數序列;
對所述訪問次數序列進行歸一化處理,得到輸入序列;
將所述待輸入序列輸入至域名流量特征提取模型中進行深層次流量特征提取,得到流量特征輸出序列;其中,所述域名流量特征提取模型為經過域名流量特征提取預訓練的序列到序列模型;
其中,所述域名流量特征提取方法,還包括:
結合流量的統計特征與所述流量特征輸出序列,將得到的結果作為域名的特征信息。
2.如權利要求1所述的域名流量特征提取方法,其特征在于,所述域名流量特征提取模型包括:卷積神經網絡以及遞歸神經網絡;
則相應地,將所述輸入序列輸入至域名流量特征提取模型中進行深層次流量特征提取具體為:
根據所述輸入序列構建域名流量變化波形圖;
將所述域名流量變化波形圖輸入至卷積神經網絡進行圖形結構特征提取,得到第一輸出序列;
將所述輸入序列輸入至所述遞歸神經網絡進行序列結構特征提取,得到第二輸出序列;
將所述第一輸出序列以及所述第二輸出序列進行特征整合,得到流量特征輸出序列。
3.如權利要求1所述的域名流量特征提取方法,其特征在于,所述獲取域名訪問流量,包括:
收集各主機訪問待分析域名時的時間戳、DNS記錄以及HTTP記錄,生成訪問記錄,并將所述訪問記錄作為所述待處理流量數據。
4.如權利要求1所述的域名流量特征提取方法,其特征在于,所述獲取域名訪問流量,包括:
收集域名訪問流量,得到原始數據;
對所述原始數據根據預設數據篩選規則進行數據過濾,得到預設類別的待處理流量數據。
5.如權利要求4所述的域名流量特征提取方法,其特征在于,對所述原始數據根據預設數據篩選規則進行數據過濾,包括:
確定目標主機的特征信息,得到目標主機特征;
將所述目標主機特征作為篩選條件對所述原始數據進行篩選,并將篩選得到的與所述目標主機特征匹配的數據作為所述待處理流量數據。
6.如權利要求4所述的域名流量特征提取方法,其特征在于,對所述原始數據根據預設數據篩選規則進行數據過濾,包括:
確定目標域名的特征信息,得到目標域名特征;
將所述目標域名特征作為篩選條件對所述原始數據進行篩選,并將篩選得到的與所述目標域名特征匹配的數據作為所述待處理流量數據。
7.如權利要求4所述的域名流量特征提取方法,其特征在于,對所述原始數據根據預設數據篩選規則進行數據過濾,包括:
確定目標記錄字段的特征信息,得到目標字段特征;
將所述目標字段特征作為篩選條件對所述原始數據進行篩選,并將篩選得到的與所述目標字段特征匹配的數據作為所述待處理流量數據。
8.如權利要求1所述的域名流量特征提取方法,其特征在于,對所述訪問次數序列進行歸一化處理,包括:
對所述訪問次數序列中各數值取對數并保留預設位數的有效數字、進行min-max標準化處理、進行標準差標準化處理。
9.如權利要求1所述的域名流量特征提取方法,其特征在于,還包括:
計算與各特征信息間的距離,得到與各域名的特征距離;
將小于閾值的所述特征距離對應的域名劃分為第一類別,將不小于閾值的所述特征距離對應的域名劃分為第二類別;
根據各類別的特征信息確定類別標簽,得到各域名類別劃分結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深信服科技股份有限公司,未經深信服科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910344874.1/1.html,轉載請聲明來源鉆瓜專利網。





