[發明專利]一種基于模板獲取漏洞信息的方法在審
| 申請號: | 201711176206.X | 申請日: | 2017-11-22 |
| 公開(公告)號: | CN107958156A | 公開(公告)日: | 2018-04-24 |
| 發明(設計)人: | 孔美琪;季統凱 | 申請(專利權)人: | 國云科技股份有限公司 |
| 主分類號: | G06F21/57 | 分類號: | G06F21/57;G06F17/30 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙)11350 | 代理人: | 湯東鳳 |
| 地址: | 523808 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模板 獲取 漏洞 信息 方法 | ||
技術領域
本發明涉及云計算安全技術領域,特別是一種基于模板獲取漏洞信息的方法。
背景技術
隨著互聯網深入千家萬戶,信息安全日益重要。當需要了解漏洞信息時,簡練、精準的獲取漏洞信息就顯得異常重要,而傳統的獲取方法會帶來以下問題:
一是耗時且繁瑣,需要逐個訪問漏洞網站,找到對應的漏洞模塊,再逐個了解漏洞詳情,非常耗時,而且操作麻煩;
二是不夠精準,訪問漏洞網站時會有各種其他的信息,需要在大量信息中搜索到需要的漏洞信息;
三是不夠靈活,無法根據需要來獲取漏洞信息。
為了便捷地獲取漏洞信息,確保獲取漏洞信息的精準性,提高獲取的靈活性,需要一種更便捷靈活的漏洞獲取方法。
發明內容
本發明解決的技術問題在于提出一種基于模板獲取漏洞信息的方法,可以更便捷、靈活地獲取漏洞信息,確保漏洞信息的精準性,解決了傳統校驗方法耗時長、操作繁瑣、無法根據需要獲取特定漏洞信息等問題。
本發明解決上述技術問題的技術方案是:
所述的方法是按照漏洞網站的網頁結構定義數據格式模板,根據模板將從漏洞網站爬取的頁面信息進行抽取;從而獲得漏洞信息。
所述的方法具體包括如下步驟:
步驟1:配置獲取漏洞的網址;
步驟2:定義數據格式模板;
步驟3:根據網址爬取頁面信息;
步驟4:根據模板抽取特定漏洞信息;
步驟5:按照指定的結構把數據存儲到指定的數據庫。
所述的獲取漏洞的網址是能正常連通,并且能獲取到漏洞信息的網址。
所述根據網址爬取頁面信息是通過爬蟲程序爬取漏洞信息網址獲取到的整個頁面內容。
所述的根據模板抽取特定漏洞信息是按照模板定義的規則匹配出需要的漏洞信息。
本發明通過自定義模板,搜索匹配時能直接按照模板定義的規則匹配出需要的信息;無需通過人工逐一訪問漏洞網站,篩選、排除大量其他信息后才能獲取到想要的漏洞信息,節省70%的時間。本發明也可以解決傳統漏洞收集工具在增加、刪除和修改所需信息時需要改動代碼,重新編譯發布的問題,只需修改模板定義即可。
附圖說明
下面結合附圖對本發明進一步說明:
圖1為本發明的方法流程圖。
具體實施方式
如圖1所示,本發明實施的步驟流程如下:
1、配置獲取漏洞的網址,在配置文件中配置如下:
#獲取漏洞信息的網址
vul.url=${url_cnnvd}
2、定義數據格式模板,模板定義如下:
#漏洞標題
vul.title=//div[@class=//"list_list//"]/ul/li
#漏洞鏈接
vul.link=//div[@class=//"fl//"]/a
#漏洞ID
vul.id=//div[@class=//"fl//"]/p/a/text()
#漏洞級別
vul.level=//div[@class=//"fr//"]/img/@title
#漏洞更新時間
vul.updateTime=//div[@class=/"fr/"]/text()
3、根據網址爬取頁面信息,代碼如下:
4、根據模板抽取特定漏洞信息,代碼如下:
5、保存到數據庫,代碼如下:
整個流程結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國云科技股份有限公司,未經國云科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711176206.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種系統初始化方法和裝置
- 下一篇:一種用于計算機的開機保護裝置
- 同類專利
- 專利分類





