[發(fā)明專利]基于合作博弈和知識蒸餾的個性化聯(lián)邦學習方法在審
| 申請?zhí)枺?/td> | 202211297705.5 | 申請日: | 2022-10-22 |
| 公開(公告)號: | CN115577804A | 公開(公告)日: | 2023-01-06 |
| 發(fā)明(設(shè)計)人: | 孫艷華;史亞會;李萌;楊睿哲;司鵬搏 | 申請(專利權(quán))人: | 北京工業(yè)大學 |
| 主分類號: | G06N20/20 | 分類號: | G06N20/20;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天達知識產(chǎn)權(quán)代理有限公司 11203 | 代理人: | 王兆波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 合作 博弈 知識 蒸餾 個性化 聯(lián)邦 學習方法 | ||
本發(fā)明公開了基于合作博弈和知識蒸餾的個性化聯(lián)邦學習方法,基于聯(lián)邦學習中嵌入合作博弈和知識蒸餾思想,提出了pFedCg算法,使參與訓(xùn)練的用戶都能得到一個更優(yōu)的個性化模型;采用公共數(shù)據(jù)集和隱私數(shù)據(jù)集提高了客戶端泛化能力,并將合作博弈論中的SV引入PFL,來評估FL中每個客戶對其他客戶端的個性化學習過程的累計貢獻值,以此確定每個客戶端的局部軟預(yù)測的聚合系數(shù),最后利用KD將聚合的個性化軟預(yù)測的知識遷移到本地模型,并在本地的隱私數(shù)據(jù)集上進行個性化訓(xùn)練,提高個性化精度,使每個客戶端獲得更優(yōu)的個性化模型。解決在FL中客戶端數(shù)據(jù)異構(gòu)時收斂速度慢,模型異構(gòu)時無法訓(xùn)練的問題,并提高訓(xùn)練精度。
技術(shù)領(lǐng)域
本發(fā)明屬于聯(lián)邦學習領(lǐng)域,將合作博弈和知識蒸餾的思想與聯(lián)邦學習相結(jié)合,用于聯(lián)邦學習的個性化中。通過對將博弈后的客戶端進行聚合得到個性化軟預(yù)測,并采用知識蒸餾將個性化軟預(yù)測的知識遷移到本地,進而更新迭代本地模型,使每個客戶端都能在數(shù)據(jù)和模型均異構(gòu)的情況下得到一個更優(yōu)的個性化模型。
背景技術(shù)
聯(lián)邦學習(Federated Learning,F(xiàn)L)實際上是一種去中心化、保護數(shù)據(jù)隱私的分布式機器學習技術(shù)[1],由中心服務(wù)器調(diào)控,多個客戶端相互協(xié)作訓(xùn)練共同得到一個共享模型,并且不需要直接訪問客戶端的私有數(shù)據(jù),即每個客戶端的數(shù)據(jù)始終保存在本地,從而減輕了通信成本并且避免了傳統(tǒng)的機器學習中存在的隱私泄露風險。
然而FL的有效實現(xiàn)很大程度上依賴于客戶端之間相似的數(shù)據(jù)分布以及大小和結(jié)構(gòu)完全相同的模型架構(gòu),而在絕大多數(shù)實際場景中客戶端的數(shù)據(jù)分布往往存在明顯的異質(zhì)性[2],即非獨立同分布(Non-Identical and Independently Distributed,Non-IID),這導(dǎo)致FL訓(xùn)練的共享模型不能滿足每一個客戶端的需求,有的客戶端甚至無法獲得一個比僅采用本地數(shù)據(jù)訓(xùn)練更優(yōu)的模型。另外,在醫(yī)療保健、人工智能、金融等領(lǐng)域,每個客戶端需獨立設(shè)計模型來滿足自身的需求,這些挑戰(zhàn)使聯(lián)邦學習的應(yīng)用和發(fā)展充滿了局限性。
為了應(yīng)對上述挑戰(zhàn),一些研究人員開始關(guān)注個性化聯(lián)邦學習(PersonalizedFederated Learning,PFL)。為了解決FL中客戶端隱私數(shù)據(jù)Non-IID的挑戰(zhàn),Smith等人[3]提出了MOCHA算法,采用Multi-task learning,將每個客戶端看作一個任務(wù),使其學習單獨的模型來實現(xiàn)個性化。Arivazhagan等人[4]提出了一種聯(lián)邦遷移學習方法FedPer,將本地模型視為“基礎(chǔ)層+個性化層”,基礎(chǔ)層負責共享,而個性化層進行本地訓(xùn)練。Hanzely等人[5]則混合本地模型和全局模型,采用正則函數(shù)在兩種模型之間找到一個折衷,提出了L2SGD算法,提高本地精度。Fallah等人[6]提出了Per-FedAvg算法,利用Meta Learning找到一個初始的共享模型,使客戶端能只進行一步或者幾步梯度下降便能快速適應(yīng)本地數(shù)據(jù)集。Dinh等人[7]采用Moreau Envelope將共享模型進行本地微調(diào),提出了pFedMe算法。Ghosh等人[8]提出了IFCA算法,在每次全局迭代中確定聚類簇,并在簇內(nèi)進行個性化訓(xùn)練來提高客戶端的個性化精度。Mansour等人[9]提出將客戶端集群以及數(shù)據(jù)插值和模型插值等方法作用于PFL來實現(xiàn)個性化,提出了HyperCluster算法。Wu等人[10]提出了pFedSV算法,在客戶端隱私數(shù)據(jù)集上用Shapley Value衡量聯(lián)盟收益并進行分配。然而,上述方法都僅針對于客戶端數(shù)據(jù)Non-IID問題,且需要將客戶端的模型參數(shù)在服務(wù)器端進行聚合,因此要求模型的結(jié)構(gòu)和大小相同。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學,未經(jīng)北京工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211297705.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種助眠安神香精及其制備方法
- 下一篇:一種貼附保壓裝置
- 博弈數(shù)據(jù)分析方法及裝置
- 一種在即時通訊工具中實現(xiàn)博弈活動的方法
- 面向多智能體同步博弈的建模方法及動作預(yù)測系統(tǒng)
- 一種多主體博弈的增量配電網(wǎng)源網(wǎng)荷協(xié)同規(guī)劃方法
- 一種基于三方演化博弈的配電網(wǎng)決策方法、裝置和設(shè)備
- 對抗環(huán)境下多無人機協(xié)同目標分配方法及系統(tǒng)
- 目標均衡博弈的處理方法和裝置
- 一種業(yè)務(wù)執(zhí)行方法、裝置及其相關(guān)設(shè)備
- 用于云原生應(yīng)用資源調(diào)度的博弈優(yōu)化方法及其系統(tǒng)
- 一種機器博弈輔助決策方法及系統(tǒng)





