[發明專利]一種基于決策樹的日志匹配方法和裝置有效
| 申請號: | 201811436240.0 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN110019987B | 公開(公告)日: | 2023-05-09 |
| 發明(設計)人: | 許溢天;朱旭光;龐磊 | 申請(專利權)人: | 創新先進技術有限公司 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901 |
| 代理公司: | 北京晉德允升知識產權代理有限公司 11623 | 代理人: | 王戈 |
| 地址: | 開曼群島大開曼島喬治鎮醫院路*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 決策樹 日志 匹配 方法 裝置 | ||
本發明提供一種基于決策樹的日志匹配方法和裝置,該方法包括:構建決策樹;其中,所述決策樹的每層包括:屬性節點以及與所述屬性節點相對應的規則節點;定位至與日志數據相對應的所述屬性節點,以得到該層的與所述屬性節點相對應的規則節點;如果該層的所述規則節點為子樹,則根據所述子樹的下一層的屬性節點繼續定位;如果該層的所述規則節點為葉節點,則確定所述規則節點的規則與所述日志數據相匹配。本發明提供的基于決策樹的日志匹配方法和裝置,其計算性能相比于現有技術方案提高了1000倍,可以極大地提升運行效率。
技術領域
本發明涉及信息技術領域,尤其涉及一種基于決策樹的日志匹配方法和裝置。
背景技術
在一份日志中,可能會對應非常多的業務場景,每個業務場景是日志的字段的枚舉的組合,因此,每條日志都會對所有業務場景進行循環匹配,然后得到這條日志屬于的業務場景的集合,以進行下一步計算。例如某日志進入系統,則會與各個規則進行循環匹配,最終得到匹配這條日志的規則。當業務規則達到上萬級別時,則每條日志會循環上萬次進行匹配,浪費大量計算資源。其計算時間復雜度正比于業務規則的數量,例如有M個業務規則,計算一條日志的時間復雜度為o(M)。
發明內容
本發明的一個目的是提供一種基于決策樹的日志匹配方法和裝置,以解決現有的日志匹配方法浪費大量計算資源的問題。
根據本發明的第一方面,提供一種基于決策樹的日志匹配方法,包括:
構建決策樹;其中,所述決策樹的每層包括:屬性節點以及與所述屬性節點相對應的規則節點;
定位至與日志數據相對應的所述屬性節點,以得到該層的與所述屬性節點相對應的規則節點;
如果該層的所述規則節點為子樹,則根據所述子樹的下一層的屬性節點繼續定位;
如果該層的所述規則節點為葉節點,則確定所述規則節點的規則與所述日志數據相匹配。
進一步,本發明所述的方法,所述構建決策樹的步驟包括:
以所述日志數據分類確定所述屬性節點;
遍歷所有所述屬性節點,以與所述屬性節點相對應的全部規則作為規則節點;
以權重最大的屬性作為所述屬性節點中的根節點;
如果所述規則節點包括一個規則,則確定所述規則節點為葉節點;
如果所述規則節點包括至少兩個規則,則確定所述規則節點為子樹;
選取除上層外的權重最大的屬性作為所述子樹的下一層的所述屬性節點。
進一步,本發明所述的方法,所述構建決策樹的步驟還包括:
當所述決策樹的深度大于等于屬性的數量時,確定該層的所述規則節點為葉節點。
進一步,本發明所述的方法,所述決策樹的每層還包括空節點;
所述構建決策樹的步驟還包括:
將無法與屬性節點相對應的規則作為與所述空節點對應的規則節點。
進一步,本發明所述的方法,所述權重為規則節點的下一層的分支的數量。
進一步,本發明所述的方法,還包括:
對與所述日志數據相匹配的規則進行合并去重。
根據本發明的第二方面,提供一種基于決策樹的日志匹配裝置,包括:
決策樹模塊,用于構建決策樹;其中,所述決策樹的每層包括:屬性節點以及與所述屬性節點相對應的規則節點;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創新先進技術有限公司,未經創新先進技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811436240.0/2.html,轉載請聲明來源鉆瓜專利網。





