[發(fā)明專(zhuān)利]基于RoBERTa的網(wǎng)絡(luò)日志安全檢測(cè)方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202211178487.3 | 申請(qǐng)日: | 2022-09-26 |
| 公開(kāi)(公告)號(hào): | CN115587007A | 公開(kāi)(公告)日: | 2023-01-10 |
| 發(fā)明(設(shè)計(jì))人: | 宋厚營(yíng);張銘倫;尹雷;陳浩;臧磊;王瑞;劉景雯;陳境宇;李琦;趙厚凱 | 申請(qǐng)(專(zhuān)利權(quán))人: | 國(guó)網(wǎng)江蘇省電力有限公司連云港供電分公司 |
| 主分類(lèi)號(hào): | G06F11/30 | 分類(lèi)號(hào): | G06F11/30;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 南京理工大學(xué)專(zhuān)利中心 32203 | 代理人: | 段宇軒 |
| 地址: | 222000 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 roberta 網(wǎng)絡(luò)日志 安全 檢測(cè) 方法 系統(tǒng) | ||
1.一種基于RoBERTa的網(wǎng)絡(luò)日志安全檢測(cè)方法,其特征在于,包括步驟:
獲取所有網(wǎng)絡(luò)設(shè)備的帶標(biāo)簽網(wǎng)絡(luò)日志數(shù)據(jù)集;
對(duì)帶標(biāo)簽網(wǎng)絡(luò)日志數(shù)據(jù)預(yù)處理;
構(gòu)建RoBERTa模型并通過(guò)帶標(biāo)簽網(wǎng)絡(luò)日志數(shù)據(jù)集對(duì)其訓(xùn)練,所述RoBERTa模型采用雙向Transformer網(wǎng)絡(luò)結(jié)構(gòu)作為編碼器,采用Softmax分類(lèi)器獲取日志存在風(fēng)險(xiǎn)的概率;
通過(guò)dropout函數(shù)篩選最優(yōu)模型;
將帶標(biāo)簽網(wǎng)絡(luò)日志數(shù)據(jù)輸入至最優(yōu)的RoBERTa模型獲取該日志存在風(fēng)險(xiǎn)的概率。
2.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)日志安全檢測(cè)方法,其特征在于,所述RoBERTa模型將輸入的日志數(shù)據(jù)轉(zhuǎn)化為768維的高維向量。
3.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)日志安全檢測(cè)方法,其特征在于,所述RoBERTa模型的BiLSTM包括前向LSTM和后向LSTM。
4.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)日志安全檢測(cè)方法,其特征在于,所述Transformer塊包括多個(gè)子層,每個(gè)子層包括多頭自注意力機(jī)制和全連接前饋網(wǎng)絡(luò),每?jī)蓚€(gè)子層之間增加了殘差連接模塊和歸一化模塊。
5.根據(jù)權(quán)利要求4所述的網(wǎng)絡(luò)日志安全檢測(cè)方法,其特征在于,所述多頭自注意力機(jī)制對(duì)每個(gè)字符的Query向量、Key向量和Value向量執(zhí)行多組線(xiàn)性轉(zhuǎn)換,分別進(jìn)行自注意力計(jì)算,然后將所有計(jì)算結(jié)果進(jìn)行拼接。
6.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)日志安全檢測(cè)方法,其特征在于,所述Query向量、Key向量和Value向量長(zhǎng)度均為64。
7.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)日志安全檢測(cè)方法,其特征在于,所述多頭自注意力機(jī)制采用縮放因子進(jìn)行修正。
8.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)日志安全檢測(cè)方法,其特征在于,所述RoBERTa模型對(duì)輸入的日志文本數(shù)據(jù)添加[CLS][SEP]字符,并經(jīng)日志文本數(shù)據(jù)劃分為單個(gè)字符,然后將單個(gè)字符存儲(chǔ)為詞匯表,每個(gè)字符對(duì)應(yīng)一個(gè)唯一標(biāo)識(shí)符。
9.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)日志安全檢測(cè)方法,其特征在于,所述日志文本數(shù)據(jù)添加[CLS][SEP]字符具體為:每個(gè)日志文本數(shù)據(jù)的第1個(gè)向量是[CLS]標(biāo)志,用于下游的網(wǎng)絡(luò)日志分類(lèi)任務(wù),句尾向量是[SEP]標(biāo)志,用作不同日志的分隔符,RoBERTa模型輸入的日志文本數(shù)據(jù)僅使用一個(gè)句向量。
10.一種基于RoBERTa的網(wǎng)絡(luò)日志安全檢測(cè)系統(tǒng),其特征在于,包括數(shù)據(jù)采集模塊、日志分詞模塊、網(wǎng)絡(luò)日志安全檢測(cè)模塊、訓(xùn)練模塊和數(shù)據(jù)庫(kù),所述數(shù)據(jù)采集模塊用于采集網(wǎng)絡(luò)環(huán)境中的設(shè)備信息及其日志文件,并將采集數(shù)據(jù)保存到數(shù)據(jù)庫(kù);所述日志分詞模塊用于對(duì)數(shù)據(jù)預(yù)處理;所述網(wǎng)絡(luò)日志安全檢測(cè)模塊基于RoBERTa模型,所述RoBERTa模型采用雙向Transformer網(wǎng)絡(luò)結(jié)構(gòu)作為編碼器,采用Softmax分類(lèi)器獲取日志存在風(fēng)險(xiǎn)的概率;所述訓(xùn)練模塊用于訓(xùn)練更新網(wǎng)絡(luò)日志安全檢測(cè)模塊,通過(guò)dropout函數(shù)篩選最優(yōu)模型;所述數(shù)據(jù)庫(kù)用于保存日志數(shù)據(jù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于國(guó)網(wǎng)江蘇省電力有限公司連云港供電分公司,未經(jīng)國(guó)網(wǎng)江蘇省電力有限公司連云港供電分公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211178487.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 一種基于RoBERTa和啟發(fā)式算法的實(shí)體鏈接方法
- 基于RoBERTa-BiGRU-LAN模型的中文命名實(shí)體識(shí)別方法及裝置
- 法律領(lǐng)域文本分析識(shí)別方法、系統(tǒng)、存儲(chǔ)介質(zhì)及終端
- 一種熱點(diǎn)提取方法、存儲(chǔ)介質(zhì)及服務(wù)器
- 一種事件抽取方法、存儲(chǔ)介質(zhì)及服務(wù)器
- 一種使用語(yǔ)義標(biāo)注的中文地址RoBERTa-BiLSTM-CRF耦合解析方法
- 一種財(cái)經(jīng)快訊的關(guān)鍵詞提取方法和系統(tǒng)
- 一種基于Transformer的代碼編程語(yǔ)言分類(lèi)方法
- 一種基于預(yù)訓(xùn)練模型的安全事件實(shí)體識(shí)別方法
- 文本重點(diǎn)詞抽取方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種支持網(wǎng)絡(luò)日志的電子郵件系統(tǒng)設(shè)計(jì)方法
- 網(wǎng)絡(luò)日志數(shù)據(jù)收發(fā)測(cè)試方法及系統(tǒng)
- 網(wǎng)絡(luò)日志數(shù)據(jù)生成方法及系統(tǒng)
- 信息分享方法及系統(tǒng)、瀏覽器、信息分享服務(wù)器
- 一種網(wǎng)絡(luò)日志處理方法和裝置
- 一種網(wǎng)絡(luò)日志壓縮方法和裝置
- 一種離線(xiàn)惡意軟件日志的識(shí)別方法和裝置
- 一種篩選網(wǎng)絡(luò)日志的方法及系統(tǒng)
- 一種基于網(wǎng)絡(luò)日志的異常用戶(hù)檢測(cè)方法及系統(tǒng)
- 日志倒排索引的創(chuàng)建方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)





