[發(fā)明專利]一種基于遷移學(xué)習(xí)的電力終端異常數(shù)據(jù)生成方法有效
| 申請?zhí)枺?/td> | 202010650550.3 | 申請日: | 2020-07-08 |
| 公開(公告)號: | CN111865947B | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計)人: | 徐文淵;厲彥杰;姜棟瀟;周宏偉;蘇闊;李成鋼;張力;郭琪;裴文洋;劉超;徐峰;冀曉宇 | 申請(專利權(quán))人: | 浙江大學(xué);國網(wǎng)吉林省電力有限公司電力科學(xué)研究院;國網(wǎng)吉林省電力有限公司;吉林省電力科學(xué)研究院有限公司;國家電網(wǎng)有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L29/08;G06K9/62;G06N3/04;G06N3/08;G06Q50/06 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 鄭海峰 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 遷移 學(xué)習(xí) 電力 終端 異常 數(shù)據(jù) 生成 方法 | ||
1.一種基于遷移學(xué)習(xí)的電力終端異常數(shù)據(jù)生成方法,其特征在于,包括以下步驟:
步驟1:采集電力終端的正常報文樣本、以及相同協(xié)議的非電力終端的正常報文樣本和攻擊報文樣本;對報文樣本進(jìn)行預(yù)處理,得到預(yù)處理后的訓(xùn)練樣本集;所述預(yù)處理后的訓(xùn)練樣本集中每一條報文樣本均包括TCP協(xié)議內(nèi)容和工控協(xié)議內(nèi)容;
步驟2:根據(jù)每一條報文樣本的TCP協(xié)議內(nèi)容和工控協(xié)議內(nèi)容構(gòu)造鍵值對,每一個鍵值對由一個輸入值和輸出值構(gòu)成,根據(jù)嵌入向量表得到每一條報文樣本的嵌入向量表示;所述的步驟2具體為:
步驟2.1:根據(jù)每一條報文樣本的TCP協(xié)議內(nèi)容和工控協(xié)議內(nèi)容構(gòu)造L個鍵值對,每一個鍵值對由一個輸入值和輸出值構(gòu)成,所述的輸入值和輸出值包括源IP地址、目的IP地址、源端口號、目的端口號、字節(jié)數(shù)、包數(shù)、連接持續(xù)時間;
步驟2.2:將預(yù)處理后的訓(xùn)練樣本集中每一條報文樣本對應(yīng)的鍵值對作為word2vec模型的訓(xùn)練樣本進(jìn)行訓(xùn)練,得到每一個鍵值的嵌入向量,構(gòu)成嵌入向量表;
步驟2.3:根據(jù)嵌入向量表得到每一條報文樣本的嵌入向量表示Xi={xi1,xi2,…,xiN},xij∈Rk,N表示每一條報文樣本包含N個鍵值,k為xij的維度;
步驟3:構(gòu)建由編碼器、第一解碼器和第二解碼器組成的多解碼器Seq2Seq神經(jīng)網(wǎng)絡(luò),將每一條報文樣本的嵌入向量表示Xi作為編碼器的輸入,獲得編碼后的特征向量Zi∈Rh,h表示特征向量Zi的維度;再將特征向量Zi分別作為兩個解碼器的輸入;
步驟4:對步驟3構(gòu)建的多解碼器Seq2Seq神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練;所述的步驟4具體為:
步驟4.1:訓(xùn)練編碼器:
采用生成式對抗網(wǎng)絡(luò)對編碼器進(jìn)行訓(xùn)練,所述的生成式對抗網(wǎng)絡(luò)由待訓(xùn)練的編碼器和一個分類器構(gòu)成;所述分類器的輸入是不同設(shè)備的報文樣本對應(yīng)的特征向量Zi,分類器的輸出為設(shè)備的分類結(jié)果,訓(xùn)練目標(biāo)為最大化分類器的分類損失;步驟4.2:訓(xùn)練解碼器:
首先對第一解碼器進(jìn)行訓(xùn)練:將預(yù)處理后的訓(xùn)練樣本集中電力終端的正常報文樣本作為第一訓(xùn)練樣本,將第一訓(xùn)練樣本的嵌入向量作為編碼器的輸入,將編碼器的輸出作為第一解碼器的輸入進(jìn)行訓(xùn)練,得到訓(xùn)練好的第一解碼器;
再對第二解碼器進(jìn)行訓(xùn)練:將預(yù)處理后的訓(xùn)練樣本集中非電力終端的正常報文樣本和攻擊報文樣本作為第二訓(xùn)練樣本,將第二訓(xùn)練樣本的嵌入向量作為編碼器的輸入,將編碼器的輸出作為第二解碼器的輸入進(jìn)行訓(xùn)練,得到訓(xùn)練好的第二解碼器;
步驟5:將報文樣本的嵌入向量表示Xi作為訓(xùn)練好的多解碼器Seq2Seq神經(jīng)網(wǎng)絡(luò)的輸入,若報文樣本來自于電力終端,則第一解碼器開啟,第二解碼器關(guān)閉,由第一解碼器輸出預(yù)測報文向量;若報文樣本來自于非電力終端,則第二解碼器開啟,第一解碼器關(guān)閉,由第二解碼器輸出預(yù)測報文向量;最后通過步驟2所述的嵌入向量表將所述的預(yù)測報文向量轉(zhuǎn)化為預(yù)測報文,完成電力終端異常數(shù)據(jù)的生成。
2.根據(jù)權(quán)利要求1所述的一種基于遷移學(xué)習(xí)的電力終端異常數(shù)據(jù)生成方法,其特征在于,所述的步驟1具體為:
步驟1.1:采集電力終端的歷史流量數(shù)據(jù)作為報文樣本,包括P個正常報文樣本和N個來自相同協(xié)議的攻擊報文樣本;
步驟1.2:對報文樣本進(jìn)行預(yù)處理,首先提取每一條報文中的TCP協(xié)議內(nèi)容和工控協(xié)議內(nèi)容,采用分箱法對協(xié)議內(nèi)容進(jìn)行去噪處理,通過臨近值的均值替代噪聲值,構(gòu)成原始訓(xùn)練樣本集D;
步驟1.3:判斷正常報文樣本和攻擊報文樣本的數(shù)量,若N<P/10,則通過過采樣處理,隨機(jī)復(fù)制攻擊報文樣本來增加攻擊報文樣本的數(shù)量,否則不進(jìn)行處理,得到完成預(yù)處理后的訓(xùn)練樣本集D′,訓(xùn)練樣本集D′中的樣本數(shù)量為
3.根據(jù)權(quán)利要求1所述的一種基于遷移學(xué)習(xí)的電力終端異常數(shù)據(jù)生成方法,其特征在于,所述的工控協(xié)議內(nèi)容數(shù)據(jù)為IEC 60870-5-104協(xié)議內(nèi)容。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué);國網(wǎng)吉林省電力有限公司電力科學(xué)研究院;國網(wǎng)吉林省電力有限公司;吉林省電力科學(xué)研究院有限公司;國家電網(wǎng)有限公司,未經(jīng)浙江大學(xué);國網(wǎng)吉林省電力有限公司電力科學(xué)研究院;國網(wǎng)吉林省電力有限公司;吉林省電力科學(xué)研究院有限公司;國家電網(wǎng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010650550.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 電力控制器、電力生成系統(tǒng)以及電力控制器的控制方法
- 電力供給裝置、電力接收裝置和包括電力接收裝置的車輛以及用于電力供給系統(tǒng)的控制方法
- 電力接收裝置、電力傳送裝置及其控制方法
- 一種智能電力客服系統(tǒng)的構(gòu)建方法及系統(tǒng)
- 無線電力傳輸系統(tǒng)、無線電力發(fā)送裝置和無線電力接收裝置
- 一種電力監(jiān)控平臺數(shù)據(jù)信息映射匹配方法及系統(tǒng)
- 用于電力分配的系統(tǒng)和方法
- 電力傳輸裝置、電力接收裝置和電力傳輸裝置的控制方法
- 一種電力傳輸線圈無線傳輸電力的無線電力傳輸系統(tǒng)
- 一種電力運(yùn)行數(shù)據(jù)監(jiān)控系統(tǒng)





