[發明專利]日志分類方法及裝置在審
| 申請號: | 202110593945.9 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113282751A | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 雷航;洪楷;劉偉;王月瑤;陳乃華 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/38 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 日志 分類 方法 裝置 | ||
1.一種日志分類方法,其特征在于,包括:
獲取軟件運行過程中產生的至少一條日志;
獲取所述至少一條日志中每條日志的特征信息,所述每條日志的特征信息中包含相應日志的結構特征;
根據所述至少一條日志中每條日志的特征信息對所述至少一條日志進行聚類,得到至少一個日志集,任一日志集中各條日志的結構相似。
2.根據權利要求1所述的方法,其特征在于,所述獲取所述至少一條日志中每條日志的特征信息,包括:
獲取所述至少一條日志中每條日志的至少一個特征字段,所述至少一個特征字段包括至少一個基礎特征字段和至少一個結構特征字段;所述至少一個結構特征字段包括以下至少一項:相應日志的長度字段、相應日志中長度最大的字段的總長度字段、或者相應日志是否包含數字的指示字段;
獲取所述至少一條日志中每條日志的至少一個特征字段中每個特征字段的特征向量;
對應所述至少一條日志中的每條日志,融合所述日志的至少一個特征字段中各個特征字段的特征向量,得到所述日志的特征信息。
3.根據權利要求2所述的方法,其特征在于,所述獲取所述至少一條日志中每條日志的至少一個特征字段,包括:
獲取所述至少一條日志中每條日志的所述至少一個基礎特征字段;
獲取所述至少一條日志中每條日志的所述至少一個結構特征字段。
4.根據權利要求3所述的方法,其特征在于,所述至少一個基礎特征字段中的每個基礎特征字段是所述日志的字段或者至少一個類型標簽,所述類型標簽用于指示相應日志中目標類型的字段的類型,所述獲取所述至少一條日志中每條日志的至少一個基礎特征字段,包括:
對應所述至少一條日志中的每條日志,識別所述日志中每個字段的類型,所述每個字段的類型是至少一個目標類型或者非目標類型;
將所述日志中類型為目標類型的字段對應的類型標簽,作為所述日志的基礎特征字段;將所述日志中類型為非目標類型的字段,作為所述日志的基礎特征字段。
5.根據權利要求3所述的方法,其特征在于,所述獲取所述至少一條日志中每條日志的至少一個結構特征字段,包括以下至少一項:
對應所述至少一條日志中的每條日志,獲取所述日志的長度,將所述日志的長度作為所述日志的結構特征字段;或者
對應所述至少一條日志中的每條日志,識別所述日志中長度最大的字段,以及獲取所述長度最大的字段的長度,將所述長度最大的字段的長度作為所述日志的結構特征字段;或者,
對應所述至少一條日志中的每條日志,識別所述日志中是否包含數字字段,以及將識別結果作為所述日志的結構特征字段。
6.根據權利要求2所述的方法,其特征在于,所述至少一個特征字段還包括:至少一個來源特征字段,所述來源特征字段用于指示所述軟件中產生相應日志的功能模塊,或者生成所述日志的函數;
所述至少一個日志集的任一日志集中各個日志具備相同的來源特征。
7.根據權利要求1所述的方法,其特征在于,所述根據所述至少一條日志中各條日志的特征信息對所述至少一條日志進行聚類,得到至少一個日志集,包括:
執行聚類操作,包括:
遍歷所述至少一條日志;
針對遍歷到的日志,根據所述日志與已有的至少一個類簇中每個類簇的相似度,確定所述日志所屬的類簇,并獲取更新后的至少一個類簇,其中,所述已有的至少一個類簇根據所述已經完成遍歷的日志得到,所述相似度是根據所述日志的特征信息與其中任一類簇的中心特征得到,所述日志的特征信息是所述日志的基礎特征字段及其權重,和結構特征字段及其權重加權求和得到,其中,所述結構特征字段對應的最小的權重大于所述基礎特征字段對應的最大的權重;
重復執行所述聚類操作,直到遍歷完成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110593945.9/1.html,轉載請聲明來源鉆瓜專利網。





