[發明專利]基于深度學習和數據聚類的伴隨式誘餌生成方法及裝置有效
| 申請號: | 202011068789.6 | 申請日: | 2020-10-09 |
| 公開(公告)號: | CN111931874B | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 任俊博 | 申請(專利權)人: | 北京元支點信息安全技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08;H04L29/06 |
| 代理公司: | 北京睿博行遠知識產權代理有限公司 11297 | 代理人: | 龔家驊 |
| 地址: | 100010 北京市東*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 數據 伴隨 誘餌 生成 方法 裝置 | ||
1.基于深度學習和數據聚類的伴隨式誘餌生成方法,其特征在于,所述方法執行以下步驟:
步驟1:獲取用戶數據,使用預建立的數據分類模型對用戶數據進行分類,為分類后的每個類別的用戶數據添加標簽;
步驟2:建立對抗網絡生成模型,同時基于對抗網絡生成模型的模型結構,建立適配的循環神經網絡;所述對抗網絡生成模型為數據轉換模型,將常規數據轉換為誘餌數據;所述循環神經網絡,基于現有的常規數據和誘餌數據進行訓練,同時,將對抗網絡生成模型中輸入的常規數據和對抗網絡生成模型轉換后的誘餌數據作為輸入,得到輸出后,通過誤差函數判斷誘餌生成的準確率,以誤差函數的判斷結果,生成參數調整參數,反向作用于對抗網絡生成模型,以調整對抗網絡生成模型的參數;
步驟3:對抗網絡生成模型在循環神經網絡的驅動下,基于添加標簽后的用戶數據,進行特征融合分析,生成誘餌;
所述特征融合分析包括以下步驟:將兩個添加標簽后的用戶數據輸入特征融合分析模型中,得到兩個輸出變量,將兩個輸出變量取均值,完成特征融合分析;所述特征融合模型使用如下公式表示:;其中,、、和為設定的常量,其取值根據循環神經網絡反饋的參數調整數據而改變,其取值范圍均為:1~12;和為添加標簽后的用戶數據;和為對應的兩個輸出變量;為變換后的中間變量;為變換后的中間變量。
2.如權利要求1所述的方法,其特征在于,所述步驟1中獲取的用戶數據至少包括:用戶行為數據、應用使用數據、網絡環境數據、登錄憑據數據、文件數據和流量數據;所述步驟1中使用預建立的數據分類模型對用戶數據進行分類包括以下步驟:建立數據分類樹,所述數據分類樹為多叉樹,包含至少兩層,且所述數據分類樹中各個節點對應各自的分類類型;根據所述數據分類樹中各個節點存儲的訓練語料,訓練各個父節點各自對應的分類模型,所述訓練語料預先經過類型標注并存儲在對應的節點中,所述父節點對應至少一個子節點,所述分類模型用于將語料劃分到對應的子節點;通過所述數據分類樹中各個節點的所述分類模型對所述用戶數據進行逐級分類。
3.如權利要求2所述的方法,其特征在于,所述步驟2中對抗網絡生成模型為數據轉換模型,將常規數據轉換為誘餌數據包括以下步驟:利用主成分分析法對所述常規數據進行特征篩選,得到中間數據;對所述中間數據進行聚類分析以及監督學習,得到多個子集,其中,每個子集包括多個實例;在各個所述子集內針對惡意攻擊命令進行關聯規則提取;將提取出的關聯規則作為攻擊特征存儲至特征標注集中。
4.如權利要求3所述的方法,其特征在于,對所述中間數據進行聚類分析以及監督學習,得到多個子集,包括以下步驟:依據所述中間數據,對所述中間數據進行中心點聚類;所述中間數據包括:時間戳、包頭、包長和源IP地址;依據所述中間數據的惡意攻擊命令,對所述中間數據進行短文本聚類;基于所述中心點聚類對應的權重和所述短文本聚類對應的權重,將所述中間數據劃分為多個子集。
5.如權利要求3所述的方法,其特征在于,所述循環神經網絡包括:
編譯神經網絡,其中所述編譯神經網絡是循環神經網絡的輸入層,所述編譯神經網絡被配置成,在所述編譯神經網絡處理的每個輸入數據項以及在多個時間步中的每個時間步處:接收通過從所述輸入數據項讀取而捕獲的子特征;接收前一時間步的解譯器神經網絡的解譯器隱藏特征量,以及處理所述子特征、所述解譯器隱藏特征量、以及來自所述前一時間步的所述編譯神經網絡的編譯隱藏特征量,以生成該時間步的編譯隱藏特征量;
解譯器神經網絡,其中所述解譯器神經網絡是卷積神經網絡;所述解譯器神經網絡被配置成,對于多個時間步中的每個時間步:接收該時間步的解譯器輸入,以及處理前一時間步的解譯器隱藏特征量和該解譯器輸入,以生成該時間步的解譯器隱藏特征量;
以及子系統,其中,所述子系統被配置成,對于所述時間步中的每個時間步:使用前一時間步的解譯器隱藏特征量,從所述輸入數據項讀取所述子特征;提供所述子特征作為所述編譯神經網絡的輸入;在該時間步處,從所述編譯隱藏特征量生成所述解譯器神經網絡的解譯器輸入;提供該解譯器輸入作為該時間步的所述解譯器神經網絡的輸入;從該時間步的解譯器隱藏特征量生成該時間步的神經網絡輸出更新;以及將該時間步的所述神經網絡輸出更新與當前神經網絡輸出相結合,以生成更新的神經網絡輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京元支點信息安全技術有限公司,未經北京元支點信息安全技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011068789.6/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





