[發(fā)明專利]一種多個(gè)GPU并行的DNN模型訓(xùn)練方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710564223.4 | 申請(qǐng)日: | 2017-07-12 |
| 公開(公告)號(hào): | CN109255439B | 公開(公告)日: | 2021-04-02 |
| 發(fā)明(設(shè)計(jì))人: | 龔軼凡;靳江明;蘇磊 | 申請(qǐng)(專利權(quán))人: | 北京圖森智途科技有限公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 101300 北京市順*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 gpu 并行 dnn 模型 訓(xùn)練 方法 裝置 | ||
1.一種多個(gè)圖形處理單元并行的深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法,其特征在于,包括:
多個(gè)圖形處理單元GPU中的一個(gè)GPU在對(duì)分配到的數(shù)據(jù)子集進(jìn)行DNN模型訓(xùn)練時(shí),在前向傳播處理過程中,接收前向歸一化BN輸入數(shù)據(jù)子集;確定全局前向BN輸入數(shù)據(jù)均值集合;根據(jù)所述全局前向BN輸入數(shù)據(jù)均值集合,對(duì)所述前向BN輸入數(shù)據(jù)子集進(jìn)行前向BN處理,得到前向BN輸出數(shù)據(jù)子集;所述全局前向BN輸入數(shù)據(jù)均值集合包括:全局前向BN輸入數(shù)據(jù)的均值和平方均值;
在后向傳播處理過程中,接收后向BN輸入數(shù)據(jù)子集,所述后向BN輸入數(shù)據(jù)子集是所述前向BN輸出數(shù)據(jù)子集的梯度集合;確定全局后向BN輸入數(shù)據(jù)均值集合;根據(jù)所述全局后向BN輸入數(shù)據(jù)均值集合、所述后向BN輸入數(shù)據(jù)子集和所述全局前向BN輸入數(shù)據(jù)均值集合,對(duì)所述前向BN輸入數(shù)據(jù)子集進(jìn)行后向BN處理,得到所述前向BN輸入數(shù)據(jù)子集中每個(gè)數(shù)據(jù)的梯度,所述全局后向BN輸入數(shù)據(jù)均值集合包括:全局后向BN輸入數(shù)據(jù)均值和全局前向BN梯度校正數(shù)據(jù)均值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定全局前向BN輸入數(shù)據(jù)均值集合,包括:
在所述GPU為多個(gè)GPU中的主GPU的情況下,所述主GPU根據(jù)所述前向BN輸入數(shù)據(jù)子集確定所述GPU的前向BN輸入數(shù)據(jù)子集均值集合,所述前向BN輸入數(shù)據(jù)子集均值集合包括:所述前向BN輸入數(shù)據(jù)子集的均值和平方均值;
接收來自其它各從GPU的前向BN輸入數(shù)據(jù)子集均值集合;
根據(jù)所述主GPU的前向BN輸入數(shù)據(jù)子集均值集合和其它各從GPU的前向BN輸入數(shù)據(jù)子集均值集合,確定全局前向BN輸入數(shù)據(jù)均值集合;
將所述全局前向BN輸入數(shù)據(jù)均值集合發(fā)送給其它各從GPU。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,確定前向BN輸入數(shù)據(jù)子集均值集合,包括:
根據(jù)公式確定所述前向BN輸入數(shù)據(jù)子集的均值,其中,Bi={xi,j}(j=1,2,...mi),Bi為所述GPU為第i個(gè)GPU時(shí)的前向BN輸入數(shù)據(jù)子集,xi,j為所述前向BN輸入數(shù)據(jù)子集中的數(shù)據(jù),mi為所述前向BN輸入數(shù)據(jù)子集中的數(shù)據(jù)的數(shù)量,μi為所述GPU為第i個(gè)GPU時(shí)的前向BN輸入數(shù)據(jù)子集的均值;
根據(jù)公式確定所述前向BN輸入數(shù)據(jù)子集的平方均值,其中,νi為所述GPU為第i個(gè)GPU時(shí)的前向BN輸入數(shù)據(jù)子集的平方均值。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,確定全局前向BN輸入數(shù)據(jù)均值集合,包括:
根據(jù)公式確定所述全局前向BN輸入數(shù)據(jù)的均值,其中,n為所述多個(gè)GPU的數(shù)量,μi為第i個(gè)GPU的前向BN輸入數(shù)據(jù)子集的均值,mi為第i個(gè)GPU的前向BN輸入數(shù)據(jù)子集中的數(shù)據(jù)的數(shù)量,μ為所述全局前向BN輸入數(shù)據(jù)的均值;
根據(jù)公式確定所述全局前向BN輸入數(shù)據(jù)的平方均值,其中,νi為第i個(gè)GPU的前向BN輸入數(shù)據(jù)子集的平方均值,ν為所述全局前向BN輸入數(shù)據(jù)的平方均值。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,對(duì)所述前向BN輸入數(shù)據(jù)子集進(jìn)行前向BN處理,包括:
根據(jù)所述全局前向BN輸入數(shù)據(jù)的均值和平方均值,對(duì)所述前向BN輸入數(shù)據(jù)子集中的每個(gè)數(shù)據(jù)進(jìn)行前向BN操作,得到前向BN后數(shù)據(jù)子集;
對(duì)所述前向BN后數(shù)據(jù)子集中每個(gè)數(shù)據(jù)進(jìn)行偏移操作,得到所述前向BN輸出數(shù)據(jù)子集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京圖森智途科技有限公司,未經(jīng)北京圖森智途科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710564223.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲(chǔ)介質(zhì)及設(shè)備
- 簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議設(shè)備的數(shù)據(jù)并行采集歸并方法及系統(tǒng)
- 減少EMI的并行數(shù)據(jù)傳輸方法
- 一種多媒體數(shù)據(jù)并行處理系統(tǒng)及方法
- 一種高速并行OQPSK解調(diào)時(shí)鐘的恢復(fù)系統(tǒng)
- 一種海量地震數(shù)據(jù)并行抽道集方法
- 3G協(xié)議的turbo碼并行譯碼方法及裝置
- 并行擴(kuò)展輸入輸出的教學(xué)裝置
- 數(shù)據(jù)的并行處理
- 并行式插件機(jī)
- 一種SPI總線與并行總線的橋接方法、設(shè)備、系統(tǒng)及介質(zhì)
- 經(jīng)由輸出分布來學(xué)習(xí)學(xué)生DNN
- 深度神經(jīng)網(wǎng)絡(luò)DNN模型的壓縮方法、裝置、設(shè)備及介質(zhì)
- 用于深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的有效數(shù)據(jù)編碼
- 固態(tài)圖像捕獲裝置、信息處理裝置、信息處理系統(tǒng)、信息處理方法和程序
- 固態(tài)成像系統(tǒng)、固態(tài)成像裝置、信息處理裝置、圖像處理方法、信息處理方法和程序
- 用于對(duì)圖像執(zhí)行人工智能編碼和人工智能解碼的方法和設(shè)備
- 一種海洋通信系統(tǒng)聯(lián)合信道分類、估計(jì)和檢測(cè)方法
- DNN程序文檔自動(dòng)生成方法
- 一種物聯(lián)網(wǎng)場(chǎng)景下的DNN劃分方法及裝置
- 一種用于ReID的神經(jīng)網(wǎng)絡(luò)構(gòu)造方法及其訓(xùn)練方法





