[發(fā)明專利]基于聯邦學習和神經架構搜索的云邊協同訓練方法及系統在審
| 申請?zhí)枺?/td> | 202310037397.0 | 申請日: | 2023-01-10 |
| 公開(公告)號: | CN116070714A | 公開(公告)日: | 2023-05-05 |
| 發(fā)明(設計)人: | 王曉飛;張子桐;仇超;劉志成;趙云鳳 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06N3/049;G06N3/08;G06N3/0464 |
| 代理公司: | 深圳眾邦專利代理有限公司 44545 | 代理人: | 丁曹凱 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 聯邦 學習 神經 架構 搜索 協同 訓練 方法 系統 | ||
1.一種基于聯邦學習和神經架構搜索的云邊協同訓練方法,其特征在于,包括如下步驟:
S1,基于P個殘差網絡構建包含若干個網絡的搜索空間,且P≥2;
S2,收集圖像數據構建樣本集,將所述樣本集劃分為訓練集和驗證集;
S3,采用基于策略梯度的強化學習方法利用訓練集對搜索空間中的網絡進行訓練得到優(yōu)化網絡,根據驗證集精度和模型大小設定獎勵函數,選取獎勵函數最高的網絡作為最優(yōu)子模型;
S4,中心服務器在最優(yōu)子模型的每一層網絡的后方均添加分支分類網絡作為出口,并添加輸入層和輸出層形成包括若干個分支模型的退出點模型;
S5,將步驟S4中退出點模型的分支模型分配給邊緣設備進行訓練得到退出點本地模型,中心服務器利用聯邦學習方法對訓練后的退出點本地模型進行聚合,并以最小化總損失函數和最大化驗證精度為目標對中心服務器中的退出點模型進行更新。
2.根據權利要求1所述的基于聯邦學習和神經架構搜索的云邊協同訓練方法,其特征在于,所述步驟S1包括如下步驟:
S1.1,選取P個殘差網絡,對每個殘差網絡分別進行裁剪按照網絡層將裁剪后的殘差塊對應存儲在每層的殘差塊池中;
S1.2,分別從每個殘差塊池中隨機選擇一個殘差塊組成對應的網絡層;
S1.3,對步驟S1.2得到的網絡層進行連接形成包含個網絡的搜索空間,其中,N表示殘差塊池中候選殘差塊的數目,L表示殘差塊池的數目。
3.根據權利要求1所述的基于聯邦學習和神經架構搜索的云邊協同訓練方法,其特征在于,所述步驟S3包括如下步驟:
S3.1,基于長短期記憶網絡建立控制器;
S3.2,利用控制器從步驟S1建立的搜索空間中隨機選取網絡,采用策略梯度的強化學習方法基于訓練集數據對選取出的網絡進行訓練得到優(yōu)化網絡;
S3.3,利用驗證集數據對優(yōu)化網絡進行測試,基于驗證精度和模型大小計算獎勵函數,選取獎勵函數最大的網絡作為最優(yōu)子模型。
4.根據權利要求3所述的基于聯邦學習和神經架構搜索的云邊協同訓練方法,其特征在于,所述獎勵函數的計算公式為:
式中,Acc(h,ε)表示共享參數為ε的優(yōu)化網絡h在驗證集上的驗證精度,P表示基線網絡的參數,ph表示優(yōu)化網絡h的參數量,R(h,ε)表示共享參數為ε的優(yōu)化網絡h的獎勵函數,β為正整數。
5.根據權利要求1所述的基于聯邦學習和神經架構搜索的云邊協同訓練方法,其特征在于,所述步驟S5包括如下步驟:
S5.1,設置聚合總輪次T,初始化聚合輪數t=1;
S5.2,將步驟S4中退出點模型的分支模型隨機分配給所有邊緣設備,邊緣設備利用本地數據對分支模型進行訓練得到退出點本地子模型;
S5.3,所有邊緣設備分別將各自的退出點本地模型的模型參數發(fā)送給中心服務器,中心服務器利用聯邦學習方法對所有模型參數進行聚合得到退出點更新模型Mt;
S5.4,將驗證集數據輸入退出點更新模型Mt,判斷t<T,若是,執(zhí)行t=t+1,返回步驟S5.2,否則,執(zhí)行步驟S5.5;
S5.5,以模型總損失最小化和模型準確度最大化為目標選取最優(yōu)退出點更新模型對中心服務器中的退出點模型進行更新。
6.根據權利要求5所述的基于聯邦學習和神經架構搜索的云邊協同訓練方法,其特征在于,所述模型總損失的計算公式為:
式中,λi表示第i個出口的權重,表示第i個出口處分支模型輸出值的準確性,ωi表示從輸入層到第i個出口的參數,L表示搜索空間的層數。
7.根據權利要求6所述的基于聯邦學習和神經架構搜索的云邊協同訓練方法,其特征在于,所述第i個出口處分支模型輸出值的準確性的計算公式為:
式中,zi表示第i個出口處分支模型的輸出值,V表示圖像數據中的類別總數,zj表示第j個出口處分支模型的輸出值。
8.一種基于聯邦學習和神經架構搜索的云邊協同訓練系統,包括邊緣設備和中心服務器,其特征在于,所述中心服務器上設有:
搜索空間建立模塊:用于基于P個殘差網絡構建包括若干個網絡的搜索空間,且P≥2;
樣本收集模塊:用于收集圖像樣本并構建訓練集和驗證集,并將訓練集和驗證集發(fā)送給子模型建立模塊和退出點模型優(yōu)化模塊;
子模型建立模塊:用于利用訓練集基于略梯度的強化學習方法對搜索空間建立模塊的搜索空間中的網絡進行訓練,根據獎勵函數選取訓練后的網絡作為最優(yōu)子模型,并將最優(yōu)子模型發(fā)送給退出點模型建立模塊,所述獎勵函數基于驗證集精度和模型大小設定;
退出點模型建立模塊:用于接收最優(yōu)子模型,在最優(yōu)子模型的最前方和最后方分別添加輸入層和輸出層,并在最優(yōu)子模型的每一層網絡的后方均添加分支分類網絡作為出口,形成包括若干個分支模型的退出點模型,將分支模型發(fā)送給邊緣設備;
退出點模型優(yōu)化模塊:用于接收每個邊緣設備所發(fā)送的退出點本地模型的模型參數,利用聯邦學習方法對退出點本地模型的模型參數進行聚合,以最小化總損失函數和最大化驗證精度為目標獲取最優(yōu)退出點模型;
所述每個邊緣設備上均設有:
本地模型訓練模塊:用于接收分支模型,并基于本地數據進行訓練生成退出點本地模型,并將退出點本地模型的模型參數發(fā)送給中心服務器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310037397.0/1.html,轉載請聲明來源鉆瓜專利網。





