[發明專利]一種針對社交網絡中漏洞利用知識庫的構建方法有效
| 申請號: | 202110301718.4 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN113076543B | 公開(公告)日: | 2022-02-08 |
| 發明(設計)人: | 黃誠;杜予同;梁根培 | 申請(專利權)人: | 四川大學 |
| 主分類號: | G06F21/57 | 分類號: | G06F21/57;G06F40/295;G06V10/774;G06N3/04;G06F16/951;G06F16/33;G06Q50/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610065 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 社交 網絡 漏洞 利用 知識庫 構建 方法 | ||
本發明涉及網絡安全領域,為一種針對社交網絡中漏洞利用知識庫的構建方法,包括:收集社交網絡中新出現和近三年的漏洞利用相關文本語料;對原始文本語料進行數據預處理,訓練Word2vec詞嵌入模型;判別文本語料是否提供漏洞利用代碼;提取提供漏洞利用代碼的文本語料中的實體信息;匯總實體信息構建漏洞利用知識庫。本發明以漏洞利用代碼為知識庫的核心,為相關從業人員對于漏洞的研究提供一個攻擊者的視角,并深入至源代碼層面;以社交網絡為主要信息來源,結合多種現有網絡安全知識庫,保證知識庫中數據的廣覆蓋面和高時效性。
技術領域
本發明屬于網絡安全領域,具體設計一種針對社交網絡中漏洞利用知識庫的構建方法。
背景技術
隨著計算機系統中的軟件漏洞不斷涌現,用戶正面臨著越來越嚴重的安全威脅。近年來,軟件漏洞數量呈現總體上升趨勢,越來越多的漏洞利用代碼出現在互聯網上,公開的漏洞利用代碼已成為網絡攻擊鏈的一部分。目前,社交網絡平臺已經成為漏洞利用代碼信息的重要來源。此外,已經存在一些針對網絡安全領域的知識庫。例如,CVE是一個漏洞數據庫,其中所有漏洞都被授予統一的編號。因此持續監控社交網絡,及時提取漏洞利用知識,整合來自各種知識庫的漏洞利用相關信息,將有助于網絡安全領域從業人員及時、全面地獲取并研究網絡空間中出現的軟件漏洞威脅。
漏洞利用知識庫的構建過程包括領域本體構建和知識構建兩部分,在本體構建方面,網絡安全領域已經存在了很多已有的本體,例如,Zareen Syed提出了一個網絡安全本體,本體中包含106個實體類型以及633條領域公理。這些已有的本體都可以成為我們構建漏洞利用領域本體的參考對象。在知識構建方面,一部分是整合現有的知識庫中的結構化數據,另一部分是從非結構化文本中提取實體。自動化提取網絡安全領域中非結構化文本的實體,是當下的研究熱點問題之一。
目前,深度學習、自然語言處理、網絡爬蟲技術已經廣泛應用于網絡安全領域。由于社交網絡語料規模巨大,且漏洞利用領域相關的語料只占據全部語料中的極小一部分,因此通過人工篩選相關語料并提取實體的方法顯然無法滿足實用性要求。對此,可以運用深度學習技術對發布于社交網絡中的漏洞利用相關實體進行自動化提取并結合現有知識庫的信息構建漏洞利用知識庫。
本發明基于上述思路,提出一種針對社交網絡中漏洞利用知識庫的構建方法,以提取社交網絡中提供的漏洞利用代碼信息為核心,結合與其相關的產品、供應商、攻擊模式、漏洞類型、緩解策略實體,構成漏洞利用知識庫。
發明內容
有鑒于此,本發明提供了一種針對社交網絡中漏洞利用知識庫的構建方法,旨在實時收集出現在社交網絡中的漏洞利用知識,構建漏洞利用知識庫,幫助網絡安全領域從業人員及時、全面地獲取并研究網絡空間中出現軟件漏洞威脅。
一種針對社交網絡中漏洞利用知識庫的構建方法,所述方法包括:
步驟1:收集社交網絡中新出現和近三年的漏洞利用相關文本語料;
步驟2:對原始文本語料進行數據預處理,訓練Word2vec詞嵌入模型;
步驟3:判別文本語料是否提供漏洞利用代碼;
步驟4:提取提供漏洞利用代碼的文本語料中的實體信息;
步驟5:匯總實體信息構建漏洞利用知識庫。
優選的,所述漏洞利用相關文本語料采集流程包括:
設立包括“EXP”、“POC”、“CVE”、“vulnerability”、“exploit”的關鍵字集合用于從社交網絡海量信息中篩選漏洞利用相關文本語料;
每日定時利用網絡爬蟲和開發者API采集社交網絡中新發布的漏洞利用相關文本數據,用于迭代更新漏洞利用知識庫,并采集近三年的漏洞利用相關文本數據用于后續的模型訓練過程;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110301718.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于多源注意力網絡的說話人識別方法及系統
- 下一篇:一種急診用心肺復蘇器





