[發明專利]基于完美哈希的日志解析方法及裝置有效
| 申請號: | 201810050447.8 | 申請日: | 2018-01-18 |
| 公開(公告)號: | CN108228875B | 公開(公告)日: | 2021-12-14 |
| 發明(設計)人: | 王天鳳;王凱峰;王俏 | 申請(專利權)人: | 奇安信科技集團股份有限公司 |
| 主分類號: | G06F16/13 | 分類號: | G06F16/13;G06F16/18;G06F16/14 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩;李相雨 |
| 地址: | 100088 北京市西城區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 完美 日志 解析 方法 裝置 | ||
1.一種基于完美哈希的日志解析方法,其特征在于,包括:
獲取待解析日志,并根據預設規則對所述待解析日志進行信息提取,獲取所述待解析日志包含的至少一個待解析關鍵字及各待解析關鍵字對應的值;
根據預先構建的完美哈希函數計算每一待解析關鍵字對應的第一哈希值;其中,所述第一哈希值為所述待解析關鍵字對應的待解析關鍵字類型;
根據各第一哈希值獲得對應的待解析關鍵字類型,并將所述待解析關鍵字對應的值存儲到待解析關鍵字類型對應的結構中,以解析獲得結構化數據;其中,每一個待解析關鍵字類型對應唯一一個結構;
其中,所述獲取待解析日志,并根據預設規則對所述待解析日志進行信息提取,包括:
若所述待解析日志的格式為鍵值對格式,則遍歷所述待解析日志,并根據預定義的鍵值對格式進行信息提取。
2.根據權利要求1所述的方法,其特征在于,所述方法,還包括:
預先獲取多個關鍵字及每一關鍵字對應的第二哈希值,根據所述多個關鍵字和所述第二哈希值構建所述完美哈希函數,所述第二哈希值為對應關鍵字的關鍵字類型。
3.根據權利要求2所述的方法,其特征在于,所述第二哈希值為枚舉型數值。
4.一種基于完美哈希的日志解析裝置,其特征在于,包括:
信息提取模塊,用于獲取待解析日志,并根據預設規則對所述待解析日志進行信息提取,獲取所述待解析日志包含的至少一個待解析關鍵字及各待解析關鍵字對應的值;
計算模塊,用于根據預先構建的完美哈希函數計算每一待解析關鍵字對應的第一哈希值;其中,所述第一哈希值為所述待解析關鍵字對應的待解析關鍵字類型;
解析模塊,用于根據各第一哈希值獲得對應的待解析關鍵字類型,并將所述待解析關鍵字對應的值存儲到待解析關鍵字類型對應的結構中,以解析獲得結構化數據;其中,每一個待解析關鍵字類型對應唯一一個結構;
具體用于:
若所述待解析日志的格式為鍵值對格式,則遍歷所述待解析日志,并根據預定義的鍵值對格式進行信息提取。
5.根據權利要求4所述的裝置,其特征在于,所述裝置,還包括:
構建模塊,用于預先獲取多個關鍵字及每一關鍵字對應的第二哈希值,根據所述多個關鍵字和所述第二哈希值構建所述完美哈希函數,所述第二哈希值為對應關鍵字的關鍵字類型。
6.根據權利要求5所述的裝置,其特征在于,所述第二哈希值為枚舉型數值。
7.一種電子設備,其特征在于,包括:處理器、存儲器和總線,其中,
所述處理器和所述存儲器通過所述總線完成相互間的通信;
所述存儲器存儲有可被所述處理器執行的程序指令,所述處理器調用所述程序指令能夠執行如權利要求1-3任一項所述的方法。
8.一種非暫態計算機可讀存儲介質,其特征在于,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令使所述計算機執行如權利要求1-3任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于奇安信科技集團股份有限公司,未經奇安信科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810050447.8/1.html,轉載請聲明來源鉆瓜專利網。





