[發明專利]一種應用在網絡安全領域的實體鏈接方法有效
| 申請號: | 202110344549.2 | 申請日: | 2021-03-29 |
| 公開(公告)號: | CN112989832B | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 陸以勤;謝樹祿;覃健誠;李智鵬;陳帥豪;洪煒妍;陳嘉睿 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/30;G06F16/33;G06N3/0442;G06N3/045;G06N3/08 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 雷芬芬 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用 網絡安全 領域 實體 鏈接 方法 | ||
本發明公開一種網絡安全領域的實體鏈接實現方法,包括利用實體查詢引用表生成安全候選實體;對實體提及對應的待鏈接安全文本進行分詞,并得到第一聯合嵌入向量;對安全候選實體對應的來的安全文本進行分詞,并得到第二聯合嵌入向量;依次將第一聯合嵌入向量、第二聯合嵌入向量輸入到BiLstm模型、CNN模型中,分別得到安全文本的第一特征信息和第二特征信息;在特征信息中均引入神經網絡的Attention機制,增強相應的安全文本特征;對增強后的安全文本向量進行余弦相似度計算,將得分最高的候選實體鏈接到實體提及中去,從而實現網絡安全領域的實體鏈接。本發明有效的提升了網絡安全領域的實體鏈接系統性能。
技術領域
本發明涉及自然語言處理領域,尤其涉及一種應用在網絡安全領域的實體鏈接方法。
背景技術
現代計算機技術的飛速發展,導致了互聯網上的安全數據也呈現出爆炸性增長的趨勢。在網絡技術快速發展的同時,對網絡進行攻擊的安全突發事件數量和網絡安全漏洞也日益增多。
為了能有效的確保網絡空間的安全,現如今的網絡安全專家們在眾多的關鍵位置都部署了網絡空間安全監測系統,用來檢測各種網絡安全威脅。這些龐大的監測系統具有大量的安全數據,分析這些安全數據對網絡安全風險防控具有重要的意義。
然而現今的安全數據分析多采用人工去進行分析或采用單一匹配方法進行分析。采用自然語言處理的實體鏈接技術對安全數據進行分析將極大的提高安全數據分析的能力,能夠有效的為網絡安全監測人才對網絡安全態勢做出精準判斷提供科學輔助,從而提高網絡空間的安全性。現階段網絡安全領域的實體鏈接技術研究還相對較少,因此研究網絡安全領域的實體鏈接技術變得尤為迫切。
發明內容
本發明的實施例提供了一種應用在網絡安全領域的實體鏈接方法,有效的改善網絡安全領域的實體鏈接性能。
一種應用在網絡安全領域的實體鏈接方法,包括:
步驟一:構建網絡安全領域的候選實體查詢引用表,并利用實體查詢引用表生成安全候選實體;
步驟二:利用分詞工具對實體提及對應的待鏈接安全文本進行分詞,將分詞后的待鏈接安全文本輸入已訓練好的Word2vec模型,Word2vec模型輸出待鏈接安全文本的第一字向量和第一詞向量,同時生成對應的第一位置向量,將第一字向量、第一詞向量和第一位置向量相加得到第一聯合嵌入向量;
步驟三:利用分詞工具對安全候選實體對應的來自安全知識庫里的安全文本進行分詞,將分詞后的安全文本輸入已訓練好的Word2vec模型,Word2vec模型輸出安全文本的第二字向量和第二詞向量,同時生成對應的第二位置向量,將第二字向量、第二詞向量和第二位置向量相加得到第二聯合嵌入向量;
步驟四:依次將第一聯合嵌入向量、第二聯合嵌入向量輸入到BiLstm模型中,獲取包含第一上下文語義信息的第一安全文本向量、包含第二上下文語義信息的第二安全文本向量;將第一安全文本向量、第二安全文本向量分別輸入到CNN模型中,分別得到安全文本的第一特征信息和第二特征信息;
步驟五:在第一特征信息和第二特征信息中均引入神經網絡的Attention機制,增強相應的安全文本特征;
步驟六:對實體提及對應的增強后得到的安全文本向量和候選實體對應的增強后得到的安全文本向量進行余弦相似度計算,并對各個計算結果的得分進行降序排列,將得分最高的候選實體鏈接到實體提及中去。
優選地,Word2vec模型的訓練包括:獲取網絡安全文本,并進行清洗;利用分詞工具對安全文本進行分詞,將分詞后的安全文本的輸入Word2vec模型進行預訓練。
優選地,對網絡安全文本進行清洗包括格式轉化、繁簡轉化和大小寫轉化。
優選地,步驟二和步驟三的位置向量的計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110344549.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種卡膜固定及輸送平臺
- 下一篇:一種全天候批處理技術方法





