[發明專利]一種數據處理方法及裝置在審
| 申請號: | 202111298767.3 | 申請日: | 2021-11-04 |
| 公開(公告)號: | CN114020967A | 公開(公告)日: | 2022-02-08 |
| 發明(設計)人: | 劉艷蘭 | 申請(專利權)人: | 北京天融信網絡安全技術有限公司;北京天融信科技有限公司;北京天融信軟件有限公司 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/903 |
| 代理公司: | 北京金信知識產權代理有限公司 11225 | 代理人: | 喻嶸 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 | ||
1.一種數據處理方法,其特征在于,包括:
獲得多條用于檢測數據的檢測規則,每條檢測規則為包括整形數字、字符串型中文詞語、字符串型英文單詞、字符串型符號中的一種或多種形成的數據集合;
構建字典樹結構;
將所述多條檢測規則中的每一條均進行分割;
將分割后的每條檢測規則分別布設在所述字典樹結構的不同分支上形成數據過濾器,每個所述分支上的各個節點上布設的數據為同一條所述檢測規則內的數字或至少一個詞段;
獲得待測數據;
將所述待測數據輸入至所述數據過濾器,基于所述數據過濾器對所述待測數據進行過濾,以至少用于確定出目標數據。
2.根據權利要求1所述的方法,其特征在于,所述將所述多條檢測規則中的每條檢測規則進行分割,包括:
對每條所述檢測規則基于整形數字、字符串型中文詞語、字符串型英文單詞中的一種或多種為分割條件進行分割,以得到用于組成所述檢測規則的數字和/或詞段,所述整形數字包括一個整形數字,或多個整形數字組成的數組。
3.根據權利要求2所述的方法,其特征在于,每條所述檢測規則的分割條件相同,或至少一條所述檢測規則的分割條件不同。
4.根據權利要求1所述的方法,其特征在于,所述將分割后的每條檢測規則分別布設在所述字典樹結構的不同分支上形成數據過濾器,包括:
將分割得到的用于形成每條所述檢測規則的數字和/或詞段按序依次布設在對應的分支的不同節點上。
5.根據權利要求1所述的方法,其特征在于,所述將所述待測數據輸入至所述數據過濾器,基于所述數據過濾器對所述待測數據進行過濾,以用于確定出目標數據,包括:
將所述待測數據根據目標分割條件進行分割,所述目標分割條件至少與一條所述檢測規則使用的分割條件匹配;
將分割后的所述待測數據輸入至所述數據過濾器,基于所述數據過濾器對所述待測數據進行過濾,以用于確定出目標數據。
6.根據權利要求5所述的方法,其特征在于,所述將分割后的所述待測數據輸入至所述數據過濾器,基于所述數據過濾器對所述待測數據進行過濾,以用于確定出目標數據,包括:
確定分割后的所述待測數據中目標序列位置的數據與對應同一分割條件的檢測規則的目標序列位置的數據是否相同,所述目標序列位置包括首位置、末位置中的一種或多種;
若相同,則繼續比對所述分割后的待測數據的其余位置數據與所述分支的其他節點的數據是否一致;
若一致,則確定所述待測數據為所述目標數據。
7.根據權利要求6所述的方法,其特征在于,還包括:
確定所述待測數據分割后形成的數字和/或詞段的數量;
確定所述對應同一分割條件的檢測規則所在分支的節點數量;
比對所述數字和/或詞段的數量與所述節點的數量是否一致,若一致,則繼續比對所述分割后的待測數據的其余位置數據與所述分支的其他節點的數據是否一致。
8.根據權利要求7所述的方法,其特征在于,所述比對所述分割后的待測數據的其余位置數據與所述分支的其他節點的數據是否一致,包括:
基于預置的優先級比對策略比對所述分割后的待測數據的其余位置數據與所述分支的其他節點的數據是否一致,所述優先級比對策略包括優先比對數字和/或數據量小的詞段。
9.根據權利要求5所述的方法,其特征在于,還包括:
將所述分支上的多個節點中數據量滿足閾值的詞段進行類型轉換,形成數字代碼;
至少對所述分割后的待測數據中,與對應的檢測規則中進行數據類型轉換的節點位置匹配的數據進行數據類型轉換處理;
比對進行數據類型轉換的數據,若一致,則繼續比對所述分割后的待測數據的其余位置數據與所述分支的其他節點的數據是否一致。
10.一種數據處理裝置,其特征在于,包括:
第一獲得模塊,用于獲得多條用于檢測數據的檢測規則,每條檢測規則為包括整形數字、字符串型中文詞語、字符串型英文單詞、字符串型符號中的一種或多種形成的數據集合;
構建模塊,用于構建字典樹結構;
第一分割模塊,用于將所述多條檢測規則中的每一條均進行分割;
處理模塊,用于將分割后的每條檢測規則分別布設在所述字典樹結構的不同分支上形成數據過濾器,每個所述分支上的各個節點上布設的數據為同一條所述檢測規則內的數字或至少一個詞段;
第二獲得模塊,用于獲得待測數據;
輸入模塊,用于將所述待測數據輸入至所述數據過濾器,基于所述數據過濾器對所述待測數據進行過濾,以用于確定出目標數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京天融信網絡安全技術有限公司;北京天融信科技有限公司;北京天融信軟件有限公司,未經北京天融信網絡安全技術有限公司;北京天融信科技有限公司;北京天融信軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111298767.3/1.html,轉載請聲明來源鉆瓜專利網。





