[發(fā)明專利]一種基于全局模型優(yōu)化的聯(lián)邦學(xué)習(xí)方法、裝置和電子設(shè)備在審
| 申請?zhí)枺?/td> | 202210541875.7 | 申請日: | 2022-05-17 |
| 公開(公告)號: | CN114818510A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 沈力;張琳;丁亮;陶大程 | 申請(專利權(quán))人: | 京東科技信息技術(shù)有限公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06N3/08;G06F111/08;G06F119/10 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 董娜 |
| 地址: | 100176 北京市大興區(qū)北京經(jīng)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 全局 模型 優(yōu)化 聯(lián)邦 學(xué)習(xí)方法 裝置 電子設(shè)備 | ||
1.一種基于全局模型優(yōu)化的聯(lián)邦學(xué)習(xí)方法,其特征在于,應(yīng)用于聯(lián)邦學(xué)習(xí)系統(tǒng),所述聯(lián)邦學(xué)習(xí)系統(tǒng)包括服務(wù)器和多個客戶端,所述服務(wù)器設(shè)置有全局模型,所述客戶端設(shè)置有局部模型;
所述方法應(yīng)用于服務(wù)器,包括:
隨機(jī)選取至少一個客戶端作為目標(biāo)客戶端,并將初始全局參量發(fā)送至所述目標(biāo)客戶端,其中,所述初始全局參量包括:全局模型參數(shù)ω、生成器參數(shù)θ和服務(wù)器狀態(tài)c;
接收所述目標(biāo)客戶端發(fā)送的局部參量,其中,所述局部參量為所述目標(biāo)客戶端根據(jù)所述初始全局參量對所述局部模型進(jìn)行訓(xùn)練生成;
根據(jù)所述局部參量對所述全局模型中的所述全局模型參數(shù)ω和所述服務(wù)器狀態(tài)c進(jìn)行更新;
根據(jù)所述生成器參數(shù)θ生成偽數(shù)據(jù),根據(jù)所述偽數(shù)據(jù)和所述局部參量對所述全局模型中的所述全局模型參數(shù)ω和所述生成器參數(shù)θ進(jìn)行更新,并輸出更新后的全局模型參數(shù)ω。
2.根據(jù)權(quán)利要求1所述的基于全局模型優(yōu)化的聯(lián)邦學(xué)習(xí)方法,其特征在于,所述局部參量包括局部模型參數(shù)ωk、客戶端狀態(tài)的差值Δck和客戶端數(shù)據(jù)集在各個類別上的數(shù)量nk;
所述根據(jù)所述局部參量對所述全局模型中的所述全局模型參數(shù)ω和所述服務(wù)器狀態(tài)c進(jìn)行更新,包括:
根據(jù)所述局部模型參數(shù)ωk、所述客戶端狀態(tài)的差值Δck和所述客戶端數(shù)據(jù)集在各個類別上的數(shù)量nk,更新所述全局模型參數(shù)ω和所述服務(wù)器狀態(tài)c。
3.根據(jù)權(quán)利要求2所述的基于全局模型優(yōu)化的聯(lián)邦學(xué)習(xí)方法,其特征在于,
所述根據(jù)所述生成器參數(shù)θ生成偽數(shù)據(jù),根據(jù)所述偽數(shù)據(jù)和所述局部參量對所述全局模型中的所述全局模型參數(shù)ω和所述生成器參數(shù)θ進(jìn)行更新,并輸出更新后的全局模型參數(shù)ω,包括:
根據(jù)所述生成器參數(shù)θ生成偽數(shù)據(jù),利用所述偽數(shù)據(jù)、所述局部模型參數(shù)ωk和所述客戶端數(shù)據(jù)集在各個類別上的數(shù)量nk對所述全局模型進(jìn)行訓(xùn)練并更新所述全局模型參數(shù)ω和所述生成器參數(shù)θ,并輸出更新后的全局模型參數(shù)ω。
4.根據(jù)權(quán)利要求3所述的基于全局模型優(yōu)化的聯(lián)邦學(xué)習(xí)方法,其特征在于,
所述根據(jù)所述生成器參數(shù)θ生成偽數(shù)據(jù),利用所述偽數(shù)據(jù)、所述局部模型參數(shù)ωk和所述客戶端數(shù)據(jù)集在各個類別上的數(shù)量nk對所述全局模型進(jìn)行訓(xùn)練并更新所述全局模型參數(shù)ω和所述生成器參數(shù)θ,并輸出更新后的全局模型參數(shù)ω,包括:
根據(jù)所述客戶端數(shù)據(jù)集在各個類別上的數(shù)量nk,計(jì)算采樣概率pt(y);
采樣隨機(jī)噪聲數(shù)據(jù)z,其中,所述隨機(jī)噪聲數(shù)據(jù)z符合高斯分布;
采樣隨機(jī)類別標(biāo)簽y,其中,所述隨機(jī)類別標(biāo)簽y服從所述采樣概率pt(y)的概率分布;
根據(jù)所述客戶端數(shù)據(jù)集在各個類別上的數(shù)量nk計(jì)算集成權(quán)重
根據(jù)所述隨機(jī)噪聲數(shù)據(jù)z、所述隨機(jī)類別標(biāo)簽y和所述生成器參數(shù)θ,生成初始第一偽數(shù)據(jù),并根據(jù)所述采樣概率pt(y)篩選所述初始第一偽數(shù)據(jù),得到第一偽數(shù)據(jù)G(z,y;θ);
根據(jù)所述第一偽數(shù)據(jù)G(z,y;θ)、所述全局模型參數(shù)ω和所述局部模型參數(shù)ωk提取所述局部模型的知識,并使用所述集成權(quán)重加權(quán),計(jì)算第一損失,反向傳播更新所述生成器參數(shù)θ;
根據(jù)所述隨機(jī)噪聲數(shù)據(jù)z、所述隨機(jī)類別標(biāo)簽y和所述生成器參數(shù)θ,生成初始第二偽數(shù)據(jù),并根據(jù)所述采樣概率pt(y)篩選所述初始第二偽數(shù)據(jù),得到第二偽數(shù)據(jù)G2(z,y;θ);
根據(jù)所述第二偽數(shù)據(jù)G2(z,y;θ)、所述全局模型參數(shù)ω和所述局部模型參數(shù)ωk提取所述局部模型的知識,并使用所述集成權(quán)重加權(quán),計(jì)算第二損失,反向傳播更新所述全局模型參數(shù)ω;
輸出更新后的全局模型參數(shù)ω。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于京東科技信息技術(shù)有限公司,未經(jīng)京東科技信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210541875.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于靈活柵格光網(wǎng)絡(luò)全局優(yōu)化的系統(tǒng)架構(gòu)及其全局優(yōu)化方法
- 一種基于多數(shù)據(jù)庫類型的SQL執(zhí)行方法和裝置
- 用于移動AdHoc網(wǎng)絡(luò)的路由入侵檢測系統(tǒng)
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 全局資源分配方法和裝置
- 一種通信方法及裝置
- 一種高效分布式全局鎖協(xié)調(diào)方法
- 一種帶上下文信息編碼的語義分割卷積神經(jīng)網(wǎng)絡(luò)
- 一種批量腳本的全局參數(shù)替換方法及裝置
- 一種基于全局變量的家居參數(shù)化模型建模系統(tǒng)及方法





