[發(fā)明專利]一種網(wǎng)絡安全實體重疊關系的識別方法、裝置及設備有效
| 申請?zhí)枺?/td> | 202110649418.5 | 申請日: | 2021-06-10 |
| 公開(公告)號: | CN113342974B | 公開(公告)日: | 2022-02-08 |
| 發(fā)明(設計)人: | 楊珂;玄佳興;李達;王合建;陳帥;薛文昊;蘇展;王俊生;薛真;杜玥霞 | 申請(專利權)人: | 國網(wǎng)電子商務有限公司;國網(wǎng)區(qū)塊鏈科技(北京)有限公司;國網(wǎng)雄安金融科技集團有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/295;G06N3/04 |
| 代理公司: | 北京集佳知識產(chǎn)權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100053 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網(wǎng)絡安全 實體 重疊 關系 識別 方法 裝置 設備 | ||
本申請實施例公開了一種網(wǎng)絡安全實體重疊關系的識別方法、裝置及設備,通過獲取待識別文本數(shù)據(jù),并將待識別文本數(shù)據(jù)輸入至目標聯(lián)合提取模型中,可以得到目標聯(lián)合提取模型輸出的待識別文本數(shù)據(jù)中的網(wǎng)絡安全實體詞匯以及網(wǎng)絡安全實體詞匯之間的實體關系,進而確定待識別文本數(shù)據(jù)中包括的目標網(wǎng)絡安全實體以及網(wǎng)絡安全實體詞匯之間的實體關系。目標聯(lián)合提取模型可以實現(xiàn)網(wǎng)絡安全實體識別和關系抽取過程中的參數(shù)和結構共享,增強了網(wǎng)絡安全實體識別和實體關系抽取之間的相關性。減少了實體識別的誤差的傳遞,提高對網(wǎng)絡安全實體識別和實體關系抽取的準確程度,實現(xiàn)網(wǎng)絡安全實體之間重疊關系的提取。
技術領域
本申請涉及網(wǎng)絡安全技術領域,具體涉及一種網(wǎng)絡安全實體重疊關系的識別方法、裝置及設備。
背景技術
在現(xiàn)有的網(wǎng)絡環(huán)境中,存在著眾多的威脅網(wǎng)絡安全的因素。準確地從網(wǎng)絡信息中發(fā)現(xiàn)網(wǎng)絡安全實體及其關系可以有效地分析出當前安全問題的現(xiàn)狀和未來的安全問題的發(fā)展趨勢,并且可以據(jù)此做出相應的安全決策。
在網(wǎng)絡文本中,具有部分與網(wǎng)絡安全威脅相關的詞匯和詞組,此類詞匯和詞組稱為網(wǎng)絡安全實體。通過對相關的文本進行網(wǎng)絡安全實體識別,可以獲取文本中包含的網(wǎng)絡安全實體。另外,網(wǎng)絡安全實體之間還可能存在著特定關系。通過確定文本中網(wǎng)絡安全實體以及實體之間的實體關系,可以獲取文本中與網(wǎng)絡安全相關的信息,實現(xiàn)文本中的網(wǎng)絡安全信息提取。
目前,對網(wǎng)絡信息文本中的網(wǎng)絡安全實體識別和實體之間的實體關系抽取的準確率不高,并且不能完整地抽取網(wǎng)絡信息文本中的網(wǎng)絡安全實體之間的“一對多”重疊關系,導致不能從網(wǎng)絡信息中及時、準確地獲得網(wǎng)絡安全威脅信息,制約網(wǎng)絡安全態(tài)勢分析和預警能力。
發(fā)明內(nèi)容
有鑒于此,本申請實施例提供一種網(wǎng)絡安全實體重疊關系的識別方法、裝置及設備,能夠?qū)崿F(xiàn)準確地識別文本中的網(wǎng)絡安全實體以及實體之間的實體關系,從而及時地發(fā)現(xiàn)網(wǎng)絡安全威脅進而進行安全管理。
為解決上述問題,本申請實施例提供的技術方案如下:
第一方面,本申請?zhí)峁┮环N網(wǎng)絡安全實體重疊關系的識別方法,所述方法包括:
獲取待識別文本數(shù)據(jù);
將所述待識別文本數(shù)據(jù)輸入至目標聯(lián)合提取模型中,得到所述目標聯(lián)合提取模型輸出的所述待識別文本數(shù)據(jù)中的網(wǎng)絡安全實體詞匯以及網(wǎng)絡安全實體詞匯之間的實體關系;其中,所述目標聯(lián)合提取模型用于利用對所述待識別文本數(shù)據(jù)進行編碼處理得到的待識別詞匯對應的隱向量,和對所述待識別文本數(shù)據(jù)進行實體識別得到的所述待識別詞匯對應的網(wǎng)絡安全實體標簽向量,確定所述待識別詞匯對應的網(wǎng)絡安全實體,以及所述待識別詞匯對應的網(wǎng)絡安全實體之間的實體關系;
根據(jù)所述網(wǎng)絡安全實體詞匯確定所述待識別文本數(shù)據(jù)中包括的目標網(wǎng)絡安全實體;根據(jù)所述網(wǎng)絡安全實體詞匯之間的實體關系,確定所述目標網(wǎng)絡安全實體之間的實體關系。
在一種可能的實現(xiàn)方式中,所述目標聯(lián)合提取模型具體用于:
獲取待識別文本數(shù)據(jù),對所述待識別文本數(shù)據(jù)進行特征提取,得到所述待識別文本數(shù)據(jù)中的待識別詞匯的詞匯向量;
對所述待識別詞匯的詞匯向量進行編碼處理,得到所述待識別文本數(shù)據(jù)中各個待識別詞匯對應的隱向量;根據(jù)所述待識別詞匯對應的隱向量,確定所述待識別詞匯對應的網(wǎng)絡安全實體標簽向量;
根據(jù)所述待識別詞匯對應的網(wǎng)絡安全實體標簽向量,選取待識別詞匯作為目標實體詞匯;
將所述目標實體詞匯對應的隱向量和所述目標實體詞匯對應的網(wǎng)絡安全實體標簽向量作為所述目標實體詞匯對應的輸入向量;利用所述目標實體詞匯對應的輸入向量,計算所述目標實體詞匯之間具有目標關系的得分;所述目標關系為預設實體關系中的每一個;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網(wǎng)電子商務有限公司;國網(wǎng)區(qū)塊鏈科技(北京)有限公司;國網(wǎng)雄安金融科技集團有限公司,未經(jīng)國網(wǎng)電子商務有限公司;國網(wǎng)區(qū)塊鏈科技(北京)有限公司;國網(wǎng)雄安金融科技集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110649418.5/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 一種計算機網(wǎng)絡的網(wǎng)絡安全系統(tǒng)及其控制方法
- 集群模式下實現(xiàn)網(wǎng)絡安全設備高可用性的方法
- 一種網(wǎng)絡安全監(jiān)控的方法、裝置、存儲介質(zhì)及服務器
- 一種基于人工智能的網(wǎng)絡安全態(tài)勢預測系統(tǒng)
- 一種網(wǎng)絡安全處理方法和裝置
- 網(wǎng)絡安全態(tài)勢感知系統(tǒng)及方法
- 一種計算機網(wǎng)絡安全態(tài)勢感知系統(tǒng)及方法
- 一種散熱性能良好的網(wǎng)絡安全柜
- 基于人工智能的網(wǎng)絡安全態(tài)勢感知系統(tǒng)及方法
- 網(wǎng)絡安全監(jiān)測系統(tǒng)及方法





