[發明專利]一種威脅情報生成的方法及系統有效
| 申請號: | 201710606939.6 | 申請日: | 2017-07-24 |
| 公開(公告)號: | CN107391684B | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 梁玉;趙振洋;古亮;蔣振超 | 申請(專利權)人: | 深信服科技股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/284 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518055 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 威脅 情報 生成 方法 系統 | ||
1.一種威脅情報生成的方法,其特征在于,所述方法包括:
按預設周期獲取源文章,并對所述源文章進行預處理生成文本源文章;其中,所述預設周期根據所述源文章的平均更新頻率和質量進行設定;
對所述文本源文章進行主題分析,篩選出與安全主題相關的所述文本源文章;
在與安全主題相關的所述文本源文章中篩選出與IoC相關的安全語句,并對所述安全語句進行詞法分析及術語識別,獲得識別結果;
根據所述識別結果構建依賴圖,并在所述依賴圖上尋找最短路徑,生成依賴關系;
通過基于機器學習的相關算法判斷所述依賴關系是否為IoC關系;
若所述依賴關系為所述IoC關系,則將所述安全語句定義為IoC條目;
若所述安全語句為所述IoC條目,則對所述安全語句進行標準化處理,生成標準的IoC數據。
2.根據權利要求1所述方法,其特征在于,所述按預設周期獲取源文章,并對所述源文章進行預處理生成文本源文章包括:
利用網絡爬蟲按預設周期獲取所述源文章;
通過自然語言處理技術及圖像處理技術對所述源文章進行預處理,生成所述文本源文章。
3.根據權利要求2所述方法,其特征在于,對所述文本源文章進行主題分析,篩選出與安全主題相關的所述文本源文章包括:
通過所述自然語言處理技術中文檔主題相關模型及算法對所述文本源文章進行主題分析,篩選出與安全主題相關的所述文本源文章。
4.根據權利要求1所述方法,其特征在于,所述生成標準的IoC數據包括:
生成OpenIoC標準的所述IoC數據。
5.一種威脅情報生成的系統,其特征在于,所述系統包括:
預處理模塊,用于按預設周期獲取源文章,并對所述源文章進行預處理生成文本源文章;其中,所述預設周期根據所述源文章的平均更新頻率和質量進行設定;
文章篩選模塊,用于對所述文本源文章進行主題分析,篩選出與安全主題相關的所述文本源文章;
語句篩選模塊,用于在與安全主題相關的所述文本源文章中篩選出與IoC相關的安全語句,并判斷所述安全語句是否為IoC條目;
標準化模塊,用于當所述安全語句為所述IoC條目時,對所述安全語句進行標準化處理,生成標準的IoC數據;
其中,所述語句篩選模塊包括:
識別單元,用于在與安全主題相關的所述文本源文章中篩選出與IoC相關的所述安全語句,并對所述安全語句進行詞法分析及術語識別,獲得識別結果;
依賴構建單元,用于根據所述識別結果構建依賴圖,并在所述依賴圖上尋找最短路徑,生成依賴關系;
依賴判斷單元,用于通過基于機器學習的相關算法判斷所述依賴關系是否為IoC關系;
定義單元,用于當所述依賴關系為所述IoC關系時,將所述安全語句定義為IoC條目。
6.根據權利要求5所述系統,其特征在于,所述預處理模塊包括:
獲取單元,用于利用網絡爬蟲按預設周期獲取所述源文章;
文本轉化單元,用于通過自然語言處理技術及圖像處理技術對所述源文章進行預處理,生成所述文本源文章。
7.根據權利要求6所述系統,其特征在于,所述文章篩選模塊具體為通過所述自然語言處理技術中文檔主題相關模型及算法對所述文本源文章進行主題分析,篩選出與安全主題相關的所述文本源文章的模塊。
8.根據權利要求5所述系統,其特征在于,所述標準化模塊包括:
標準生成單元,用于生成OpenIoC標準的所述IoC數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深信服科技股份有限公司,未經深信服科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710606939.6/1.html,轉載請聲明來源鉆瓜專利網。





