[發明專利]審計規則推薦方法及裝置在審
| 申請號: | 201811561671.X | 申請日: | 2018-12-20 |
| 公開(公告)號: | CN109726272A | 公開(公告)日: | 2019-05-07 |
| 發明(設計)人: | 肖峰 | 申請(專利權)人: | 杭州數夢工場科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06F17/27 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 310024 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 審計規則 配置裝置 日志信息 配置的 字符串匹配規則 關鍵詞配置 關鍵詞推薦 人工配置 合理性 遺漏 配置 | ||
本公開提供一種審計規則推薦方法及裝置,所述方法包括:獲取日志信息;從所述日志信息中確定至少一個用于配置指定審計規則的關鍵詞,所述指定審計規則包括字符串匹配規則;將各個所述關鍵詞推薦給審計規則配置裝置,以使所述審計規則配置裝置根據所述關鍵詞配置所述指定審計規則。因此,本公開降低了審計規則配置的難度,還提高了審計規則配置的合理性,也避免了人工配置審計規則時可能造成的遺漏。
技術領域
本公開涉及計算機通信技術領域,尤其涉及一種審計規則推薦方法及裝置。
背景技術
在企業信息系統或者互聯網服務系統中,日志系統是一個非常重要的功能組成部分,它可以記錄系統產生的所有行為,并按照某種規范表達出來。
現有技術中,對于采集到的日志,進行范式化處理后,可能存入指定存儲區域中。并且,為了識別異常的日志,還可以再創建一些審計規則,比如:正則表達式、字符串匹配、閾值比較等方式,對指定存儲區域中的數據進行匹配,如果日志匹配,則會上報審計事件,如果審計事件滿足一定的告警條件,則發送郵件或短信告警。
但是,審計規則通常需要對業務非常熟悉的人員才能進行合理的配置,配置難度大,配置審計規則的時候可能會遺漏一些審計規則,不能捕獲系統中的異常日志,從而隱藏一些系統風險。
發明內容
為克服相關技術中存在的問題,本公開提供了信息查詢方法及裝置。
根據本公開實施例的第一方面,提供一種審計規則推薦方法,所述方法包括:
獲取日志信息;
從所述日志信息中確定至少一個用于配置指定審計規則的關鍵詞,所述指定審計規則包括字符串匹配規則;
將各個所述關鍵詞推薦給審計規則配置裝置,以使所述審計規則配置裝置根據所述關鍵詞配置所述指定審計規則。
可選地,所述從所述日志信息中確定至少一個用于配置指定審計規則的關鍵詞,包括:
使用詞頻-逆文檔頻率TF-IDF算法從所述日志信息中確定所述關鍵詞。
可選地,所述使用詞頻-逆文檔頻率TF-IDF算法從所述日志信息中確定所述關鍵詞,包括:
對所述日志信息進行分詞,得到至少一個用于確定所述關鍵詞的候選詞;
計算各個所述候選詞的TF-IDF;
根據各個所述候選詞的TF-IDF確定所述關鍵詞。
可選地,所述計算各個所述候選詞的TF-IDF,包括:
根據所述候選詞在所述日志信息中的出現次數和所述日志信息的總詞數,計算所述候選詞的詞頻TF;
根據設定語料庫的文檔總數和所述設定語料庫中包括所述候選詞在的文檔數,計算所述候選詞的逆文檔頻率IDF;
根據所述候選詞的TF和所述候選詞的IDF,計算所述候選詞的TF-IDF。
可選地,所述根據各個所述候選詞的TF-IDF確定所述關鍵詞,包括:
按照TF-IDF值的大小對各個所述候選詞的TF-IDF進行排序;
從TF-IDF值最大的所述候選詞開始,依次選取指定數量個所述候選詞,并將選出的所述候選詞確定為所述關鍵詞。
可選地,所述根據各個所述候選詞的TF-IDF確定所述關鍵詞,包括:
比較所述候選詞的TF-IDF是否大于指定TF-IDF閾值;
若是,則將所述候選詞確定為所述關鍵詞;
若否,則將所述候選詞不確定為所述關鍵詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州數夢工場科技有限公司,未經杭州數夢工場科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811561671.X/2.html,轉載請聲明來源鉆瓜專利網。





