[發明專利]日志模板提取方法及裝置在審
| 申請號: | 201911401898.2 | 申請日: | 2019-12-30 |
| 公開(公告)號: | CN113128213A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 雅爾·埃瑞恩;艾坦·波利尼可;諾阿姆·佩雷斯;王琛 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/30;G06F16/17;G06F16/35;G06F40/186 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 顏晶 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 日志 模板 提取 方法 裝置 | ||
1.一種日志模板提取方法,其特征在于,所述方法包括:
將日志的多行日志記錄中每行日志記錄中的指定字符刪除,得到預處理后的每行日志記錄;
基于預處理后的每行日志記錄,確定至少一個第一日志記錄組,不同所述第一日志記錄組包括所述日志中的不同行日志記錄;
分別提取所述至少一個第一日志記錄組中每個所述第一日志記錄組中的日志模板,并基于提取的日志模板確定所述日志的日志模板。
2.根據權利要求1所述的方法,其特征在于,所述將日志的多行日志記錄中每行日志記錄中的指定字符刪除,得到預處理后的每行日志記錄,包括:
獲取所述日志中每行日志記錄的至少一個詞條,將所述每行日志記錄的每個詞條中的所述指定字符刪除,得到所述預處理后的每行日志記錄;
或者,將所述多行日志記錄中每行日志記錄中的指定字符刪除,得到簡化后的每行日志記錄,獲取所述多行日志的簡化后的每行日志記錄的至少一個詞條,得到所述預處理后的每行日志記錄。
3.根據權利要求1或2所述的方法,其特征在于,所述指定字符為數字和/或標點符號。
4.根據權利要求1至3任一所述的方法,其特征在于,所述基于預處理后的每行日志記錄,確定至少一個第一日志記錄組,包括:
將所述預處理后的每行日志記錄的第一指定位置的連續的m個非空詞條拼接得到第一字符簽名,m為正整數;
基于所述預處理后的每行日志記錄對應的第一字符簽名的第一哈希碼,確定所述每行日志記錄的第一數字簽名;
基于所述每行日志記錄的第一數字簽名,對所述日志中的多行日志記錄進行分組,得到所述至少一個第一日志記錄組,每個所述第一日志記錄組包括的所有日志記錄所對應的第一數字簽名相同。
5.根據權利要求4所述的方法,其特征在于,所述基于所述每行日志記錄的第一數字簽名,對所述日志中的多行日志記錄進行分組,得到所述至少一個第一日志記錄組,包括:
將所述預處理后的每行日志記錄的第二指定位置的連續的n個非空詞條拼接得到第二字符簽名,且所述第一指定位置與所述第二指定位置不同,所述n為正整數;
基于所述每行日志記錄的第一數字簽名,對所述日志中的多行日志記錄進行分組,得到至少一個第二日志記錄組;每個所述第二日志記錄組包括的所有日志記錄所對應的第一數字簽名相同;
基于所述每行日志記錄的第二數字簽名,對所述至少一個第二日志記錄組中每個第二日志記錄組進行分組,得到所述至少一個第一日志記錄組;每個所述第一日志記錄組包括的所有日志記錄所對應的第二數字簽名相同。
6.根據權利要求4或5所述的方法,其特征在于,
所述m個非空詞條為所述每行日志記錄的前m個非空詞條。
7.根據權利要求4至6任一所述的方法,其特征在于,所述基于所述預處理后的每行日志記錄對應的第一字符簽名的第一哈希碼,確定所述每行日志記錄的第一數字簽名,包括:
將所述預處理后的每行日志記錄對應的第一字符簽名的第一哈希碼,確定為所述每行日志記錄的第一數字簽名;
或者,對所述預處理后的每行日志記錄的第一哈希碼進行簡化處理,得到所述預處理后的每行日志記錄的第一簡化哈希碼,將所述預處理后的每行日志記錄的第一簡化哈希碼,確定為所述每行日志記錄的第一數字簽名。
8.根據權利要求7所述的方法,其特征在于,所述簡化處理包括取余處理或取模處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911401898.2/1.html,轉載請聲明來源鉆瓜專利網。





