[發(fā)明專(zhuān)利]一種基于AllReduce分布式訓(xùn)練梯度壓縮加速方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011504384.2 | 申請(qǐng)日: | 2020-12-17 |
| 公開(kāi)(公告)號(hào): | CN112529163A | 公開(kāi)(公告)日: | 2021-03-19 |
| 發(fā)明(設(shè)計(jì))人: | 謝遠(yuǎn)東;梁家恩 | 申請(qǐng)(專(zhuān)利權(quán))人: | 云知聲智能科技股份有限公司;廈門(mén)云知芯智能科技有限公司 |
| 主分類(lèi)號(hào): | G06N3/04 | 分類(lèi)號(hào): | G06N3/04;G06N3/08 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100096 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 allreduce 分布式 訓(xùn)練 梯度 壓縮 加速 方法 | ||
1.一種基于AllReduce分布式訓(xùn)練梯度壓縮加速方法,其特征在于,包括:
采用AllReduce分布式深度梯度壓縮訓(xùn)練架構(gòu),所述AllReduce分布式深度梯度壓縮訓(xùn)練架構(gòu)中,不存在參數(shù)服務(wù)器,工作機(jī)之間形成環(huán)形閉環(huán)傳遞路徑,GPU之間傳遞壓縮后梯度;以及
將節(jié)點(diǎn)內(nèi)壓縮模塊中將梯度從FP32轉(zhuǎn)成FP16;并
使用誤差反饋隨機(jī)梯度下降算法壓縮梯度。
2.根據(jù)權(quán)利要求1所述的基于AllReduce分布式訓(xùn)練梯度壓縮加速方法,其特征在于,所述誤差反饋隨機(jī)梯度下降算法包括:
針對(duì)每一次訓(xùn)練進(jìn)行解壓縮得到值pt。
3.根據(jù)權(quán)利要求2所述的基于AllReduce分布式訓(xùn)練梯度壓縮加速方法,其特征在于,所述誤差反饋隨機(jī)梯度下降算法還包括:
使用梯度壓縮算法對(duì)值pt進(jìn)行梯度壓縮。
4.根據(jù)權(quán)利要求3所述的基于AllReduce分布式訓(xùn)練梯度壓縮加速方法,其特征在于,
值pt為pt=ηgt+et,其中,gt為隨機(jī)梯度下降值,et為偏差值。
5.根據(jù)權(quán)利要求4所述的基于AllReduce分布式訓(xùn)練梯度壓縮加速方法,其特征在于,
et初始值為0。
6.根據(jù)權(quán)利要求5所述的基于AllReduce分布式訓(xùn)練梯度壓縮加速方法,其特征在于,
所述梯度壓縮實(shí)施為:采用topk算法,取梯度前k個(gè)值pt進(jìn)行數(shù)據(jù)整合。
7.根據(jù)權(quán)利要求5所述的基于AllReduce分布式訓(xùn)練梯度壓縮加速方法,其特征在于,所述誤差反饋隨機(jī)梯度下降算法還包括:
更新參數(shù):xt+1=xt-Δt,et+1=pt-Δt。
8.一種存儲(chǔ)介質(zhì),其特征在于,
所述存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在所述程序運(yùn)行時(shí)控制所述存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行如權(quán)利要求1-7任一項(xiàng)所述的基于AllReduce分布式訓(xùn)練梯度壓縮加速方法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于云知聲智能科技股份有限公司;廈門(mén)云知芯智能科技有限公司,未經(jīng)云知聲智能科技股份有限公司;廈門(mén)云知芯智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011504384.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 基于RDMA與消息傳遞的可靠數(shù)據(jù)分析方法
- 一種基于神經(jīng)網(wǎng)絡(luò)的參數(shù)更新方法、分布式訓(xùn)練平臺(tái)系統(tǒng)
- 分布式訓(xùn)練方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種面向分布式機(jī)器學(xué)習(xí)的稀疏通信模型的實(shí)現(xiàn)方法
- 一種基于AllReduce分布式訓(xùn)練梯度壓縮加速方法
- 一種基于流水線環(huán)形參數(shù)通信的分布式深度學(xué)習(xí)方法
- 一種針對(duì)大規(guī)模系統(tǒng)深度學(xué)習(xí)數(shù)據(jù)并行的分級(jí)通信優(yōu)化方法
- modelica模型計(jì)算方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種分布式深度學(xué)習(xí)訓(xùn)練場(chǎng)景下壓縮感知的梯度同步方法
- 用于Dragonfly拓?fù)涞腁llreduce方法
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)





