[發明專利]一種DNS日志分析方法及裝置有效
| 申請號: | 201510920374.X | 申請日: | 2015-12-11 |
| 公開(公告)號: | CN105574539B | 公開(公告)日: | 2018-09-21 |
| 發明(設計)人: | 劉千仞;周光濤;孫莉 | 申請(專利權)人: | 中國聯合網絡通信集團有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/30 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 dns 日志 分析 方法 裝置 | ||
本發明實施例提供一種DNS日志分析方法及裝置,以至少解決現有技術中無法在DNS日志分析過程中簡單有效的確定合理的K值的問題。方法包括:獲取DNS日志并對所述DNS日志進行預處理,獲得預處理后的日志文本,所述預處理后的日志文本中包含至少一條文本信息,每條文本信息包含該文本信息對應的第一信息;從所述預處理后的日志文本中提取所述每條文本信息包含的所述第一信息,構建所述第一信息的特征向量矩陣;根據所述第一信息的特征向量矩陣,確定對所述每條文本信息包含的所述第一信息進行K?means聚類時對應的K值;根據所述K值對所述每條文本信息包含的所述第一信息進行K?means聚類,獲得聚類結果。本發明適用于互聯網技術領域。
技術領域
本發明涉及互聯網技術領域,尤其涉及一種域名系統(英文:domain namesystem,簡稱:DNS)日志分析方法及裝置。
背景技術
DNS作為互聯網的第一入口,為Internet上的主機分配域名地址和網絡協議(英文:internet protocol,簡稱:IP)地址,任何體系結構的互聯網都離不開DNS。因此,基于DNS的相關研究日益受到重視。互聯網公司和運營商紛紛針對DNS開展深入研究,目前,基于大數據平臺的DNS分析工作成為研究的一個重點方向。
其中,蘊含著豐富信息的DNS訪問日志具有很高的挖掘價值,傳統的DNS日志分析流程如下:首先通過日志工具獲取DNS訪問日志并保存,其次對日志文件進行處理,提取有用數據,最后針對數據進行分析,得出結論。其中,對日志文件進行處理的方式有很多種,其中一種很有效的方法是聚類算法,聚類算法將一系列文檔聚成多個簇,其目標是要求簇內的文檔之間盡可能相似,而簇間的文檔之間盡可能不相似。K-means是一種重要的聚類算法。K-means聚類算法速度快,結果直觀易于理解,但是初始化的簇中心的分布對K-means的聚類結果影響很大。與此同時簇的個數K往往是算法的輸入參數,而K的合理取值往往很難推測,目前有一些K值確定算法,但是運算較為復雜,需要多次聚類來確定合理的K值,或者需要先驗知識,并且應用在DNS日志文件上面效果并不明顯。
因此,如何在DNS日志分析過程中簡單有效的確定合理的K值,從而更好的提升聚類效果,成為目前亟待解決的問題。
發明內容
本發明的實施例提供一種DNS日志分析方法及裝置,以至少解決現有技術中無法在DNS日志分析過程中簡單有效的確定合理的K值的問題。
為達到上述目的,本發明的實施例采用如下技術方案:
第一方面,提供一種域名系統DNS日志分析方法,所述方法包括:
獲取DNS日志并對所述DNS日志進行預處理,獲得預處理后的日志文本,所述預處理后的日志文本中包含至少一條文本信息,每條文本信息包含該文本信息對應的第一信息;
從所述預處理后的日志文本中提取所述每條文本信息包含的所述第一信息,構建所述第一信息的特征向量矩陣;
根據所述第一信息的特征向量矩陣,確定對所述每條文本信息包含的所述第一信息進行K-means聚類時對應的K值;
根據所述K值對所述每條文本信息包含的所述第一信息進行K-means聚類,獲得聚類結果。
基于本發明實施例提供的DNS日志分析方法,由于在提取第一信息之后,可以構建該第一信息的特征向量矩陣,進而根據該特征向量矩陣確定對第一信息進行K-means聚類時對應的K值,因此運算簡單有效,從而可以更好的提升聚類效果。
第二方面,提供一種域名系統DNS日志分析裝置,所述DNS日志分析裝置包括:獲取單元、構建單元、確定單元和聚類單元;
所述獲取單元,用于獲取DNS日志并對所述DNS日志進行預處理,獲得預處理后的日志文本,所述預處理后的日志文本中包含至少一條文本信息,每條文本信息包含該文本信息對應的第一信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國聯合網絡通信集團有限公司,未經中國聯合網絡通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510920374.X/2.html,轉載請聲明來源鉆瓜專利網。





