[發(fā)明專利]基于遷移學習的網(wǎng)絡安全命名實體和關系聯(lián)合抽取方法及裝置在審
| 申請?zhí)枺?/td> | 202111151177.8 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113919351A | 公開(公告)日: | 2022-01-11 |
| 發(fā)明(設計)人: | 黃克振;連一峰;張海霞;彭媛媛;劉倩 | 申請(專利權(quán))人: | 中國科學院軟件研究所 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 北京君尚知識產(chǎn)權(quán)代理有限公司 11200 | 代理人: | 湯驍罡 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 遷移 學習 網(wǎng)絡安全 命名 實體 關系 聯(lián)合 抽取 方法 裝置 | ||
1.一種基于遷移學習的網(wǎng)絡安全命名實體和關系聯(lián)合抽取方法,其步驟包括:
1)對網(wǎng)絡安全威脅情報進行網(wǎng)絡安全命名實體及關系聯(lián)合標注,構(gòu)建網(wǎng)絡安全威脅情報語料庫;
2)基于自然語言語料庫預訓練深度神經(jīng)網(wǎng)絡,得到提取詞語特征表示向量的預訓練深度神經(jīng)網(wǎng)絡;
3)將預訓練深度神經(jīng)網(wǎng)絡與一分類器組合,構(gòu)建初始聯(lián)合抽取模型;
4)基于網(wǎng)絡安全威脅情報語料庫,使用遷移學習方法對初始聯(lián)合抽取模型進行訓練,獲取訓練好的聯(lián)合抽取模型;
5)將目標數(shù)據(jù)輸入訓練好聯(lián)合抽取模型,得到網(wǎng)絡安全命名實體和關系聯(lián)合抽取結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,通過以下步驟構(gòu)建網(wǎng)絡安全威脅情報語料庫:
1)從網(wǎng)絡安全威脅情報博客或論壇中采集網(wǎng)絡安全威脅情報,其中網(wǎng)絡安全威脅情報包括:結(jié)構(gòu)化網(wǎng)絡安全威脅情報和非結(jié)構(gòu)化網(wǎng)絡安全威脅情報;
2)對結(jié)構(gòu)化網(wǎng)絡安全威脅情報,利用情報自身的結(jié)構(gòu)規(guī)則標注網(wǎng)絡安全命名實體及關系,得到結(jié)構(gòu)化網(wǎng)絡安全威脅情報標注結(jié)果;
3)利用標注工具,對部分非結(jié)構(gòu)化網(wǎng)絡安全威脅情報手工標注網(wǎng)絡安全命名實體及關系,并基于總結(jié)的標注規(guī)則,自動標注剩余的非結(jié)構(gòu)化網(wǎng)絡安全威脅情報;
4)結(jié)合手工標注結(jié)果與規(guī)則標注結(jié)果,得到非結(jié)構(gòu)化網(wǎng)絡安全威脅情報標注結(jié)果
5)根據(jù)結(jié)構(gòu)化網(wǎng)絡安全威脅情報標注結(jié)果與非結(jié)構(gòu)化網(wǎng)絡安全威脅情報標注結(jié)果,構(gòu)建網(wǎng)絡安全威脅情報語料庫。
3.如權(quán)利要求2所述的方法,其特征在于,標注規(guī)則包括:正則表達式或標注詞典。
4.如權(quán)利要求1所述的方法,其特征在于,通過以下步驟得到預訓練深度神經(jīng)網(wǎng)絡:
1)利用自然語言組織規(guī)律,對自然語言語料庫中的自然語言語料進行分詞,得到初始詞典;
2)對自然語言中部分的分詞進行掩蓋;
3)將掩蓋后的自然語言語料輸入深度神經(jīng)網(wǎng)絡,通過預測掩蓋分詞,以得到預訓練深度神經(jīng)網(wǎng)絡。
5.如權(quán)利要求4所述的方法,其特征在于,所述自然語言組織規(guī)律包括:詞語的詞性、詞語間的依賴關系、詞語的位置和/或詞語間的標點符號。
6.如權(quán)利要求4所述的方法,其特征在于,使用遷移學習方法對初始聯(lián)合抽取模型進行訓練之前,利用詞分片技術、初始詞典及自然語言組織規(guī)律,對網(wǎng)絡安全威脅情報語料庫中網(wǎng)絡安全威脅情報進行分詞。
7.如權(quán)利要求1所述的方法,其特征在于,分類器的構(gòu)建方法包括:使用條件隨機場算法。
8.如權(quán)利要求1所述的方法,其特征在于,利用網(wǎng)絡安全命名實體和關系聯(lián)合抽取結(jié)果,構(gòu)建網(wǎng)絡安全威脅知識圖譜,并基于網(wǎng)絡安全威脅知識圖譜,進行網(wǎng)絡安全威脅的應急響應及防御。
9.一種存儲介質(zhì),所述存儲介質(zhì)中存儲有計算機程序,其中,所述計算機程序被設置為運行時執(zhí)行權(quán)利要求1-8中任一所述方法。
10.一種電子裝置,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器被設置為運行所述計算機程序以執(zhí)行如權(quán)利要求1-8中任一所述方法。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院軟件研究所,未經(jīng)中國科學院軟件研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111151177.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種計算機網(wǎng)絡的網(wǎng)絡安全系統(tǒng)及其控制方法
- 集群模式下實現(xiàn)網(wǎng)絡安全設備高可用性的方法
- 一種網(wǎng)絡安全監(jiān)控的方法、裝置、存儲介質(zhì)及服務器
- 一種基于人工智能的網(wǎng)絡安全態(tài)勢預測系統(tǒng)
- 一種網(wǎng)絡安全處理方法和裝置
- 網(wǎng)絡安全態(tài)勢感知系統(tǒng)及方法
- 一種計算機網(wǎng)絡安全態(tài)勢感知系統(tǒng)及方法
- 一種散熱性能良好的網(wǎng)絡安全柜
- 基于人工智能的網(wǎng)絡安全態(tài)勢感知系統(tǒng)及方法
- 網(wǎng)絡安全監(jiān)測系統(tǒng)及方法





