[發明專利]一種威脅情報生成的方法及系統有效
| 申請號: | 201710606939.6 | 申請日: | 2017-07-24 |
| 公開(公告)號: | CN107391684B | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 梁玉;趙振洋;古亮;蔣振超 | 申請(專利權)人: | 深信服科技股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/284 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518055 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 威脅 情報 生成 方法 系統 | ||
本申請公開了一種威脅情報生成的方法,所述方法包括:按預設周期獲取源文章,并對所述源文章進行預處理生成文本源文章;對所述文本源文章進行主題分析,篩選出與安全主題相關的所述文本源文章;在與安全主題相關的所述文本源文章中篩選出與IoC相關的安全語句,并判斷所述安全語句是否為IoC條目;若所述安全語句為所述IoC條目,則對所述安全語句進行標準化處理,生成標準的IoC數據;該方法自動化地提取并生成結構化的威脅情報,節省了人工分析、整理信息的步驟,威脅情報的整理更加有序、快速,對安全研究、提升安全能力具有很大的價值;本申請還公開了一種威脅情報生成的系統,具有以上有益效果。
技術領域
本發明涉及網絡安全領域,特別涉及一種威脅情報生成的方法及系統。
背景技術
在科技迅猛發展的今天,保證網絡的安全已經成為互聯網技術發展的前提,許多具有安全研究人員、安全廠商都會通過互聯網媒體發布技術研究文章、安全報告等向同行、科研人員分享技術細節。在這些安全研究人員、安全廠商發布的文章中存在一些在安全技術方面具有極高價值的信息,這些信息有利于相關技術人員在網絡安全方面實現重大的突破。
由于這些技術研究文章、安全報告通常是以非結構化的數據存在,因此目前對于這些技術研究文章、安全報告中有價值信息的提取主要依靠具有安全領域背景的專家去閱讀、分析,最后人工提煉、總結出安全設備或軟件可處理的威脅情報。缺乏自動化地分析方法、工具來更全面、快速的從這些互聯網開放數據中提取威脅情報。
因此,如何自動化地提取并生成結構化的威脅情報,是本領域技術人員目前需要解決的技術問題。
發明內容
本申請的目的是提供一種威脅情報生成的方法及系統,能夠自動化地提取并生成結構化的威脅情報。
為解決上述技術問題,本申請提供一種威脅情報生成的方法及系統,該方法包括:
按預設周期獲取源文章,并對所述源文章進行預處理生成文本源文章;
對所述文本源文章進行主題分析,篩選出與安全主題相關的所述文本源文章;
在與安全主題相關的所述文本源文章中篩選出與IoC相關的安全語句,并判斷所述安全語句是否為IoC條目;
若所述安全語句為所述IoC條目,則對所述安全語句進行標準化處理,生成標準的IoC數據。
可選的,所述按預設周期獲取源文章,并對所述源文章進行預處理生成文本源文章包括:
利用網絡爬蟲按預設周期獲取所述源文章;
通過自然語言處理技術及圖像處理技術對所述源文章進行預處理,生成所述文本源文章。
可選的,對所述文本源文章進行主題分析,篩選出與安全主題相關的所述文本源文章包括:
通過所述自然語言處理技術中文檔主題相關模型及算法對所述文本源文章進行主題分析,篩選出與安全主題相關的所述文本源文章。
可選的,所述在與安全主題相關的所述文本源文章中篩選出與IoC相關的安全語句,并判斷所述安全語句是否為IoC條目包括:
在與安全主題相關的所述文本源文章中篩選出與IoC相關的所述安全語句,并對所述安全語句進行詞法分析及術語識別,獲得識別結果;
根據所述識別結果構建依賴圖,并在所述依賴圖上尋找最短路徑,生成依賴關系;
通過基于機器學習的相關算法判斷所述依賴關系是否為IoC關系;
若所述依賴關系為所述IoC關系,則將所述安全語句定義為IoC條目。
可選的,所述生成標準的IoC數據包括:
生成OpenIoC標準的所述IoC數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深信服科技股份有限公司,未經深信服科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710606939.6/2.html,轉載請聲明來源鉆瓜專利網。





