[發(fā)明專利]數(shù)據(jù)訓(xùn)練方法及裝置、存儲(chǔ)介質(zhì)、電子裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201711488171.3 | 申請(qǐng)日: | 2017-12-29 |
| 公開(kāi)(公告)號(hào): | CN109993299A | 公開(kāi)(公告)日: | 2019-07-09 |
| 發(fā)明(設(shè)計(jì))人: | 韓炳濤 | 申請(qǐng)(專利權(quán))人: | 中興通訊股份有限公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06N3/04 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 江舟;董文倩 |
| 地址: | 518057 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 存儲(chǔ)介質(zhì) 電子裝置 集群資源 數(shù)據(jù)訓(xùn)練 樣本數(shù)據(jù) 訓(xùn)練樣本數(shù)據(jù) 并行訓(xùn)練 訓(xùn)練模型 可用 | ||
1.一種數(shù)據(jù)訓(xùn)練方法,其特征在于,包括:
確定樣本數(shù)據(jù)和可用的集群資源;
將總訓(xùn)練模型拆分為多個(gè)子模型;
使用所述集群資源在所述多個(gè)子模型上并行訓(xùn)練所述樣本數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將總訓(xùn)練模型拆分為多個(gè)子模型包括以下至少之一:
將所述總訓(xùn)練模型拆分為多個(gè)第一子模型,其中,所述多個(gè)第一子模型并行連接;
將所述總訓(xùn)練模型拆分為多個(gè)第二子模型,其中,所述多個(gè)第二子模型串行連接。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述總訓(xùn)練模型拆分為多個(gè)第一子模型:
根據(jù)算子的類型將所述總訓(xùn)練模型拆分為多個(gè)第一子模型,其中,所述總訓(xùn)練模型由一個(gè)或多個(gè)所述算子組成。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)算子的類型將所述總訓(xùn)練模型拆分為多個(gè)第一子模型包括:
獲取所述算子的類型,其中,所述算子的類型包括:稠密算子;
將所述稠密算子拆分為N個(gè)輸入為(B/N)×I的子稠密算子,其中,B為第一批維度,所述第一批維度的大小與指示的批尺寸的大小相同,I為所述稠密算子的輸入向量的維度,N為大于1的整數(shù),其中,所述第一子模型包括:所述子稠密算子。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)算子的類型將所述總訓(xùn)練模型拆分為多個(gè)第一子模型包括:
獲取所述算子的類型,其中,所述算子的類型包括:稠密算子;
將所述稠密算子拆分為N個(gè)計(jì)算參數(shù)為I×(O/N)的子稠密算子,其中,所述子稠密算子與所述稠密算子的輸入張量相同,O為所述稠密算子的輸出向量的維度,I為所述稠密算子的輸入向量的維度,N為大于1的整數(shù),其中,所述第一子模型包括:所述子稠密算子。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)算子的類型將所述總訓(xùn)練模型拆分為多個(gè)第一子模型包括:
獲取所述算子的類型,其中,所述算子的類型包括:卷積算子;
將所述卷積算子拆分為N個(gè)子卷積算子,其中,所述子卷積算子的輸入張量為所述卷積算子的輸入張量相同;
其中,所述第一子模型包括:所述子卷積算子。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述總訓(xùn)練模型拆分為多個(gè)第二子模型包括:
解析所述總訓(xùn)練模型得到多個(gè)算子,其中,所述總訓(xùn)練模型包括Concat算子和Split算子,串行相鄰的Concat算子和Split算子組成第一Concat-Split算子對(duì);
在所述第一Concat-Split算子對(duì)中,在所述Concat算子的輸入張量與所述Split算子的輸出張量相同時(shí),在所述總訓(xùn)練模型中刪除所述第一Concat-Split算子對(duì)中的Concat算子和Split算子后,將所述總訓(xùn)練模型拆分為多個(gè)第二子模型。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定樣本數(shù)據(jù)和可用的集群資源包括:
接收訓(xùn)練作業(yè),從所述訓(xùn)練作業(yè)中獲取對(duì)應(yīng)的樣本數(shù)據(jù);確定集群當(dāng)前空閑的第一處理器,以及接收指定的第二處理器信息,根據(jù)所述第二處理器信息在所述第一處理器中確定可用的處理器資源,其中,所述集群資源包括所述處理器資源。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,使用所述集群資源在所述多個(gè)子模型上并行訓(xùn)練所述樣本數(shù)據(jù)包括:
將所述樣本數(shù)據(jù)劃分為M個(gè)分片后,并行輸入到所述集群資源的M*K個(gè)子模型上進(jìn)行訓(xùn)練,其中,K為配置一個(gè)子模型所需要的最小集群資源,M為大于0的整數(shù),K為大于0的整數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中興通訊股份有限公司,未經(jīng)中興通訊股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711488171.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于接合與分離存儲(chǔ)介質(zhì)的裝置
- 存儲(chǔ)介質(zhì)陣列控制器、控制方法、設(shè)備、和存儲(chǔ)介質(zhì)驅(qū)動(dòng)器
- 存儲(chǔ)介質(zhì)處理方法、系統(tǒng)及數(shù)據(jù)讀寫(xiě)操作方法、系統(tǒng)
- 存儲(chǔ)裝置、存儲(chǔ)介質(zhì)以及存儲(chǔ)介質(zhì)的制造方法
- 數(shù)據(jù)存儲(chǔ)
- 存儲(chǔ)介質(zhì)之間的數(shù)據(jù)遷移
- 一種基于存儲(chǔ)系統(tǒng)的控制方法及裝置
- 自助設(shè)備及自助設(shè)備的介質(zhì)存儲(chǔ)裝置
- 融合存儲(chǔ)系統(tǒng)中的數(shù)據(jù)遷移方法和裝置
- 一種數(shù)據(jù)存儲(chǔ)方法、裝置及電子設(shè)備
- 一種訓(xùn)練數(shù)據(jù)的模型訓(xùn)練方法及裝置
- 模型訓(xùn)練系統(tǒng)、方法和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)訓(xùn)練方法、裝置及服務(wù)器
- 在數(shù)據(jù)隱私保護(hù)下執(zhí)行機(jī)器學(xué)習(xí)的方法和系統(tǒng)
- 獲取訓(xùn)練數(shù)據(jù)的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 虛擬維修訓(xùn)練平臺(tái)開(kāi)發(fā)系統(tǒng)
- 分類模型的訓(xùn)練方法、數(shù)據(jù)風(fēng)險(xiǎn)類別的檢測(cè)方法及裝置
- 一種訓(xùn)練數(shù)據(jù)的糾錯(cuò)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于音視頻的魯棒情感建模系統(tǒng)





