[發(fā)明專(zhuān)利]網(wǎng)絡(luò)安全語(yǔ)料庫(kù)構(gòu)建模型的訓(xùn)練方法、應(yīng)用方法及裝置有效

申請(qǐng)?zhí)枺?/td>	202110412385.2	申請(qǐng)日：	2021-04-16
公開(kāi)（公告）號(hào)：	CN112818126B	公開(kāi)（公告）日：	2021-08-17
發(fā)明（設(shè)計(jì)）人：	周子楠	申請(qǐng)（專(zhuān)利權(quán)）人：	北京智源人工智能研究院
主分類(lèi)號(hào)：	G06F16/35	分類(lèi)號(hào)：	G06F16/35;G06F16/36;G06F40/295;G06N3/04
代理公司：	北京辰權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 11619	代理人：	尹倩倩
地址：	100083 北京市海淀區(qū)***	國(guó)省代碼：	北京;11
權(quán)利要求書(shū)：	查看更多	說(shuō)明書(shū)：	查看更多
摘要：
搜索關(guān)鍵詞：	網(wǎng)絡(luò)安全語(yǔ)料庫(kù) 構(gòu)建模型訓(xùn)練方法應(yīng)用裝置
鉆瓜網(wǎng) 技術(shù)展會(huì) 專(zhuān)利詞庫(kù) 專(zhuān)利權(quán)人專(zhuān)利榜在售專(zhuān)利公布日期熱門(mén)專(zhuān)利

【權(quán)利要求書(shū)】：

1.一種網(wǎng)絡(luò)安全語(yǔ)料庫(kù)構(gòu)建模型的訓(xùn)練方法，其特征在于，包括：

獲取訓(xùn)練集，所述訓(xùn)練集包括標(biāo)注了實(shí)體類(lèi)別和戰(zhàn)術(shù)類(lèi)別的威脅情報(bào)；

搭建網(wǎng)絡(luò)安全語(yǔ)料庫(kù)的構(gòu)建模型的結(jié)構(gòu)，所述構(gòu)建模型包括采用多任務(wù)深度神經(jīng)網(wǎng)絡(luò)和雙注意力機(jī)制的戰(zhàn)術(shù)分類(lèi)模塊；

根據(jù)所述訓(xùn)練集包括的所述威脅情報(bào)，訓(xùn)練所述構(gòu)建模型；

其中，所述搭建網(wǎng)絡(luò)安全語(yǔ)料庫(kù)的構(gòu)建模型的結(jié)構(gòu)，包括：

將詞性標(biāo)記層、實(shí)體-關(guān)系提取層、知識(shí)圖譜檢索層及實(shí)體類(lèi)別輸出層依次連接，得到實(shí)體分類(lèi)模塊；

將同義詞庫(kù)檢索層、關(guān)鍵詞檢索層及鏈?zhǔn)椒诸?lèi)模型均與戰(zhàn)術(shù)類(lèi)別輸出層連接，得到所述戰(zhàn)術(shù)分類(lèi)模塊；所述鏈?zhǔn)椒诸?lèi)模型包括所述多任務(wù)深度神經(jīng)網(wǎng)絡(luò)和所述雙注意力機(jī)制；

將所述實(shí)體分類(lèi)模塊和所述戰(zhàn)術(shù)分類(lèi)模塊均與損失層連接；

所述根據(jù)所述訓(xùn)練集包括的所述威脅情報(bào)，訓(xùn)練所述構(gòu)建模型，包括：

從所述訓(xùn)練集中獲取預(yù)設(shè)數(shù)量的威脅情報(bào)；將獲取的所述威脅情報(bào)分別輸入所述實(shí)體分類(lèi)模塊和所述戰(zhàn)術(shù)分類(lèi)模塊中；通過(guò)所述實(shí)體分類(lèi)模塊識(shí)別所述威脅情報(bào)包括的實(shí)體對(duì)應(yīng)的實(shí)體類(lèi)別；通過(guò)所述戰(zhàn)術(shù)分類(lèi)模塊識(shí)別所述威脅情報(bào)采用的戰(zhàn)術(shù)對(duì)應(yīng)的戰(zhàn)術(shù)類(lèi)別；根據(jù)識(shí)別出的所述實(shí)體類(lèi)別及所述戰(zhàn)術(shù)類(lèi)別，通過(guò)所述損失層計(jì)算當(dāng)前訓(xùn)練周期對(duì)應(yīng)的損失值。

2.根據(jù)權(quán)利要求1所述的訓(xùn)練方法，其特征在于，所述通過(guò)所述實(shí)體分類(lèi)模塊識(shí)別所述威脅情報(bào)包括的實(shí)體對(duì)應(yīng)的實(shí)體類(lèi)別，包括：

通過(guò)所述詞性標(biāo)記層標(biāo)記所述威脅情報(bào)中每個(gè)詞的詞性；

從所述威脅情報(bào)中剔除詞性為預(yù)設(shè)修飾詞性的詞；

通過(guò)所述實(shí)體-關(guān)系提取層提取剔除操作后的所述威脅情報(bào)中包括的實(shí)體信息；

通過(guò)所述知識(shí)圖譜檢索層確定所述實(shí)體信息對(duì)應(yīng)的實(shí)體類(lèi)別；

通過(guò)所述實(shí)體類(lèi)別輸出層輸出所述實(shí)體信息對(duì)應(yīng)的所述實(shí)體類(lèi)別。

3.根據(jù)權(quán)利要求2所述的訓(xùn)練方法，其特征在于，所述通過(guò)所述知識(shí)圖譜檢索層確定所述實(shí)體信息對(duì)應(yīng)的實(shí)體類(lèi)別，包括：

根據(jù)所述實(shí)體信息，通過(guò)所述知識(shí)圖譜檢索層查詢(xún)預(yù)設(shè)知識(shí)圖譜中是否包含所述實(shí)體信息對(duì)應(yīng)的實(shí)體類(lèi)別；

如果是，則從所述預(yù)設(shè)知識(shí)圖譜中獲取所述實(shí)體信息對(duì)應(yīng)的實(shí)體類(lèi)別；

如果否，則根據(jù)剔除操作后的所述威脅情報(bào)，生成所述威脅情報(bào)對(duì)應(yīng)的詞向量；通過(guò)所述知識(shí)圖譜檢索層查詢(xún)預(yù)設(shè)向量檢索庫(kù)中是否包含與所述詞向量之間的相似度大于預(yù)設(shè)閾值的詞向量；如果是，則將所述相似度大于預(yù)設(shè)閾值的詞向量對(duì)應(yīng)的實(shí)體類(lèi)別確定為所述實(shí)體信息對(duì)應(yīng)的實(shí)體類(lèi)別；如果否，則將所述實(shí)體信息對(duì)應(yīng)的實(shí)體類(lèi)別設(shè)置為預(yù)設(shè)實(shí)體類(lèi)別。

4.根據(jù)權(quán)利要求1所述的訓(xùn)練方法，其特征在于，所述通過(guò)所述戰(zhàn)術(shù)分類(lèi)模塊識(shí)別所述威脅情報(bào)采用的戰(zhàn)術(shù)對(duì)應(yīng)的戰(zhàn)術(shù)類(lèi)別，包括：

從所述威脅情報(bào)中提取動(dòng)詞短語(yǔ)；根據(jù)所述動(dòng)詞短語(yǔ)和預(yù)設(shè)同義詞庫(kù)，通過(guò)所述同義詞庫(kù)檢索層獲取所述威脅情報(bào)對(duì)應(yīng)的第一戰(zhàn)術(shù)分類(lèi)結(jié)果；

根據(jù)所述威脅情報(bào)和預(yù)設(shè)戰(zhàn)術(shù)關(guān)鍵詞庫(kù)，通過(guò)所述關(guān)鍵詞檢索層獲取所述威脅情報(bào)對(duì)應(yīng)的第二戰(zhàn)術(shù)分類(lèi)結(jié)果；

通過(guò)所述鏈?zhǔn)椒诸?lèi)模型獲取所述威脅情報(bào)對(duì)應(yīng)的第三戰(zhàn)術(shù)分類(lèi)結(jié)果；

根據(jù)所述第一戰(zhàn)術(shù)分類(lèi)結(jié)果、所述第二戰(zhàn)術(shù)分類(lèi)結(jié)果和所述第三戰(zhàn)術(shù)分類(lèi)結(jié)果，通過(guò)所述戰(zhàn)術(shù)類(lèi)別輸出層確定所述威脅情報(bào)采用的戰(zhàn)術(shù)對(duì)應(yīng)的戰(zhàn)術(shù)類(lèi)別。

5.根據(jù)權(quán)利要求4所述的訓(xùn)練方法，其特征在于，所述通過(guò)所述鏈?zhǔn)椒诸?lèi)模型獲取所述威脅情報(bào)對(duì)應(yīng)的第三戰(zhàn)術(shù)分類(lèi)結(jié)果，包括

將所述威脅情報(bào)中標(biāo)注了實(shí)體類(lèi)別的詞用第一預(yù)設(shè)字符與其他詞分隔開(kāi)，以及將標(biāo)注了戰(zhàn)術(shù)類(lèi)別的詞用第二預(yù)設(shè)字符與其他詞分隔開(kāi)；

通過(guò)所述鏈?zhǔn)椒诸?lèi)模型包括的所述多任務(wù)深度神經(jīng)網(wǎng)絡(luò)對(duì)所述威脅情報(bào)進(jìn)行編碼，得到對(duì)應(yīng)的詞向量矩陣；

通過(guò)所述鏈?zhǔn)椒诸?lèi)模型包括的所述雙注意力機(jī)制確定所述詞向量矩陣中每個(gè)詞向量對(duì)應(yīng)的注意力權(quán)重；

根據(jù)所述每個(gè)詞向量及所述每個(gè)詞向量對(duì)應(yīng)的注意力權(quán)重，通過(guò)所述多任務(wù)深度神經(jīng)網(wǎng)絡(luò)包括的文本對(duì)分類(lèi)器計(jì)算所述威脅情報(bào)包括的戰(zhàn)術(shù)屬于各個(gè)戰(zhàn)術(shù)類(lèi)別的概率；

將概率最大的戰(zhàn)術(shù)類(lèi)別確定為所述威脅情報(bào)對(duì)應(yīng)的第三戰(zhàn)術(shù)分類(lèi)結(jié)果。

下載完整專(zhuān)利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶(hù)下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京智源人工智能研究院，未經(jīng)北京智源人工智能研究院許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110412385.2/1.html，轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。

同類(lèi)專(zhuān)利

專(zhuān)利分類(lèi)

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶(hù)下載升級(jí)VIP會(huì)員，免費(fèi)下載

滑坡模型實(shí)驗(yàn)?zāi)Ｐ图?/a>

專(zhuān)利文獻(xiàn)下載

說(shuō)明：

1、專(zhuān)利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利說(shuō)明書(shū)；

2、支持發(fā)明專(zhuān)利、實(shí)用新型專(zhuān)利、外觀(guān)設(shè)計(jì)專(zhuān)利（升級(jí)中）；

3、專(zhuān)利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專(zhuān)利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】