[發明專利]一種基于異構分層聯邦學習的異常檢測方法有效
| 申請號: | 202210286072.1 | 申請日: | 2022-03-22 |
| 公開(公告)號: | CN114710330B | 公開(公告)日: | 2023-01-24 |
| 發明(設計)人: | 徐景;王樂意;劉玲亞 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;H04L41/142;H04L41/147;H04L41/16 |
| 代理公司: | 上海旭誠知識產權代理有限公司 31220 | 代理人: | 鄭立 |
| 地址: | 200062 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分層 聯邦 學習 異常 檢測 方法 | ||
本發明公開了一種基于異構分層聯邦學習的異常檢測方法,涉及聯邦學習領域和異常檢測領域。構建異構分層聯邦學習架構;簇間基于縱向聯邦學習異步更新全局模型;簇內基于橫向聯邦學習同步更新局部模型。本發明可提高模型識別性能和分類精度,減少通信開銷,提升模型訓練速度,并確保數據隱私性,具有更高的安全性,可部署于終端數量大且類型多樣的異構物聯網。
技術領域
本發明涉及聯邦學習領域和異常檢測領域,尤其涉及一種基于異構分層聯邦學習的異常檢測方法。
背景技術
隨著NB-IoT、eMTC和LoRa等物聯網技術持續增強物聯網的廣域覆蓋、低功耗 接入與海量終端接入能力,推動邊緣網絡終端在物聯網中大量部署,物聯網絡日益復 雜,其面臨的網絡安全問題也日趨嚴峻。大規模物聯網絡往往由多個異構網絡(如移 動通信網、互聯網和物聯網等)組成,涉及海量異構終端接入和數據交互,網絡環境 復雜。同時,網絡中存在大量用戶、產業或工業敏感信息,極易遭受信息泄露、信息 竊取、數據篡改等惡意攻擊,面臨極大的安全隱患。因此,須建立適用于大規模異構 物聯網絡的異常檢測模型,以確保網絡安全運行。
物聯網終端設備資源受限,無法承載海量數據的存儲、計算等任務,因此物聯網異常檢測模型須基于分布式架構。目前,傳統的分布式機器學習框架,從終端設備中 采集數據,上傳至云中心進行存儲,并由云中心統一建模,但是仍面臨著數據孤島及 傳輸安全問題。這是因為移動網、互聯網和物聯網等多網共存,異構網絡之間由于數 據隱私、行業壁壘等因素存在數據無法共享的問題;即便一定程度上允許數據共享, 數據在復雜網絡環境中傳輸時也極易遭受攻擊,導致數據丟失或被惡意篡改。因此, 基于云中心構建統一的異常檢測模型在異構物聯網環境下應用時受到極大限制。
另一種可行方案是基于聯邦學習實現網絡異常檢測。以聯邦學習作為一種分布式機器學習框架,允許多個實體(參與者)在中央服務器的協調下協作訓練得到全局模 型,進而基于全局模型對網絡異常進行識別或分類。由于參與者的原始數據存儲于本 地,僅需在中央協調器指導下交換或轉移模型參數,從而實現多個參與者在不共享隱 私數據的情況下進行一個全局模型的協作訓練;且每個參與者僅需處理本地數據,降 低了單個實體的計算負載。文獻“Communication-Efficient Learning of Deep Networks fromDecentralized Data”(基于分散數據的通信高效深度網絡學習,ICML 2017)提出 的分布式聯邦學習框架,適用于物聯網樣本重疊少,而樣本特征重疊(同構)的數據 分布特點,即原始數據分布于網絡各實體,但不同實體擁有的樣本所反映的對象屬性 或特征一致。特別地,文獻“FDML:A Collaborative Machine Learning Framework for DistributedFeatures”(面向分布式特征的協作機器學習框架,KDD 2019)考慮了網絡 實體擁有異構樣本特征的情形,提出分布式特征機器學習框架,利用多特征融合提升 模型準確度。同時,該訓練架構允許網絡實體異步更新,尤其適合在軟、硬件能力異 構的物聯網終端設備上部署。上述兩類典型的聯邦學習框架分別對應了聯邦學習的兩 種類型,即橫向聯邦學習和縱向聯邦學習。
文獻“Communication-Efficient Learning of Deep Networks fromDecentralized Data” (基于分散數據的通信高效深度網絡學習,ICML 2017)本質上為橫向聯邦學習,適 用于樣本不重疊但特征一致的多實體聯合建模。然而,異構物聯網內的各異構網絡有 各自數據特點,具體而言,邊緣網絡數據包通過各種物聯網協議聚合至邊緣網關,邊 緣網關可獲取大部分應用層數據內容;而互聯網數據包主要呈現目標和源的IP地址、 網絡端口、傳輸時間、到達時間等網絡層面的數據內容;在移動通信網側,則對傳輸 時延、基站地址、網關地址等數據包傳輸相關特征會有突出體現等。由于物聯網顯著 的數據異構特性,即,實體擁有的數據特征不一致,因此無法采用橫向聯邦學習建模。 若各異構網絡基于本地持有的數據單獨建立異常檢測模型,其本地模型的識別性能很 難達到預期效果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210286072.1/2.html,轉載請聲明來源鉆瓜專利網。





