[發(fā)明專利]一種面向計算資源異構(gòu)的聯(lián)邦學(xué)習(xí)訓(xùn)練加速方法有效
| 申請?zhí)枺?/td> | 202110556962.5 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113191504B | 公開(公告)日: | 2022-06-28 |
| 發(fā)明(設(shè)計)人: | 何耶肖;李歡;章小寧;吳昊;范晨昱 | 申請(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京正華智誠專利代理事務(wù)所(普通合伙) 11870 | 代理人: | 李林合 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 計算 資源 聯(lián)邦 學(xué)習(xí) 訓(xùn)練 加速 方法 | ||
1.一種面向計算資源異構(gòu)的聯(lián)邦學(xué)習(xí)訓(xùn)練加速方法,其特征在于,包括以下步驟:
S1、初始化本地迭代次數(shù)、連續(xù)額外梯度計算次數(shù)、連續(xù)額外梯度計算次數(shù)閾值以及迭代總次數(shù),并從服務(wù)器下載初始的全局模型參數(shù);
S2、將本地迭代次數(shù)加1,判斷本地迭代次數(shù)是否滿足迭代總次數(shù),若滿足則結(jié)束訓(xùn)練,否則進入步驟S3;
S3、將從服務(wù)器下載的最新的全局模型參數(shù)另存為本地模型參數(shù),并結(jié)合本地數(shù)據(jù)集,利用BP算法進行梯度更新,得到梯度更新參數(shù),并將該梯度更新參數(shù)上傳到服務(wù)器;
S4、判斷連續(xù)額外梯度計算次數(shù)是否滿足連續(xù)額外梯度計算次數(shù)閾值,若滿足則進入步驟S10,否則進入步驟S5;
S5、利用步驟S3得到的梯度更新參數(shù)更新本地模型參數(shù),得到更新后的本地模型參數(shù),并結(jié)合本地數(shù)據(jù)集,利用BP算法進行額外一輪的梯度更新,得到額外梯度更新參數(shù);
S6、接收服務(wù)器下發(fā)的允許下載最新全局模型參數(shù)信號,并判斷額外梯度計算是否完成,若完成則進入步驟S7,否則進入步驟S9;
S7、從服務(wù)器下載最新的全局模型參數(shù)并復(fù)制得到全局模型參數(shù)副本,并利用步驟S5得到的額外梯度更新參數(shù)更新全局模型參數(shù)副本,并將連續(xù)額外梯度計算次數(shù)加1;
S8、根據(jù)最新的全局模型參數(shù)與更新后的全局模型參數(shù)副本對應(yīng)的損失函數(shù)值,重新確定最新的全局模型參數(shù),返回步驟S2;
S9、立即停止額外梯度計算,從服務(wù)器下載最新的全局模型參數(shù),并初始化連續(xù)額外梯度計算次數(shù),返回步驟S2;
S10、初始化連續(xù)額外梯度計算次數(shù),并接收服務(wù)器下發(fā)的允許下載最新的全局模型參數(shù)信號,下載最新的全局模型參數(shù),返回步驟S2。
2.根據(jù)權(quán)利要求1所述的一種面向計算資源異構(gòu)的聯(lián)邦學(xué)習(xí)訓(xùn)練加速方法,其特征在于,所述梯度更新參數(shù)計算公式為:
其中,為梯度更新參數(shù),為對目標(biāo)函數(shù)中的參數(shù)求導(dǎo),為本地模型參數(shù),z為本地數(shù)據(jù)集的數(shù)據(jù)樣本,Q為目標(biāo)函數(shù)。
3.據(jù)權(quán)利要求1所述的一種面向計算資源異構(gòu)的聯(lián)邦學(xué)習(xí)訓(xùn)練加速方法,其特征在于,所述額外梯度更新參數(shù)計算公式為:
其中,為額外梯度更新參數(shù),為對目標(biāo)函數(shù)中的參數(shù)求導(dǎo),為更新后的本地模型參數(shù),z為本地數(shù)據(jù)集的數(shù)據(jù)樣本,Q為目標(biāo)函數(shù)。
4.根據(jù)權(quán)利要求1所述的一種面向計算資源異構(gòu)的聯(lián)邦學(xué)習(xí)訓(xùn)練加速方法,其特征在于,所述步驟S5中利用梯度更新參數(shù)更新本地模型參數(shù)的更新公式為:
其中,為梯度更新參數(shù),η為訓(xùn)練步長,為本地模型參數(shù),為更新后的本地模型參數(shù)。
5.根據(jù)權(quán)利要求4所述的一種面向計算資源異構(gòu)的聯(lián)邦學(xué)習(xí)訓(xùn)練加速方法,其特征在于,所述步驟S7中利用額外梯度更新參數(shù)更新全局模型參數(shù)副本的更新公式為:
其中,為額外梯度更新參數(shù),ws′為全局模型參數(shù)副本,ws*為更新后的全局模型參數(shù)副本。
6.根據(jù)權(quán)利要求2所述的一種面向計算資源異構(gòu)的聯(lián)邦學(xué)習(xí)訓(xùn)練加速方法,其特征在于,所述步驟S8具體為:
判斷最新的全局模型參數(shù)ws與更新后的全局模型參數(shù)副本ws*分別對應(yīng)的損失函數(shù)值loss(ws)與loss(ws*)大小,若最新的全局模型參數(shù)ws的損失函數(shù)值loss(ws)小于更新后的全局模型副本ws*損失函數(shù)值loss(ws*),則舍棄更新后的全局模型副本ws*,否則將更新后的全局模型副本ws*作為最新的全局模型參數(shù)ws,并返回步驟S2。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110556962.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種QFN封裝的引腳結(jié)構(gòu)
- 下一篇:一種更新方法及裝置
- 一種Agent聯(lián)邦快速設(shè)計流程建模方法
- 基于聯(lián)邦模式的動態(tài)產(chǎn)品協(xié)同開發(fā)平臺及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動態(tài)部署分配方法
- 聯(lián)邦學(xué)習(xí)方法、系統(tǒng)、終端設(shè)備及存儲介質(zhì)
- 一種混合聯(lián)邦學(xué)習(xí)方法及架構(gòu)
- 聯(lián)邦學(xué)習(xí)的沙盒機制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設(shè)備及存儲介質(zhì)
- 一種應(yīng)用于異構(gòu)計算設(shè)備的聯(lián)邦學(xué)習(xí)系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置





