[發(fā)明專利]深度學(xué)習(xí)計(jì)算方法、裝置、芯片及介質(zhì)有效
| 申請?zhí)枺?/td> | 202110710157.3 | 申請日: | 2021-06-25 |
| 公開(公告)號: | CN113326137B | 公開(公告)日: | 2022-07-12 |
| 發(fā)明(設(shè)計(jì))人: | 方智毅;丁圣閣;賈明橋;程偉;王皓;陶芝偉 | 申請(專利權(quán))人: | 上海燧原科技有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06N20/00 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 初春 |
| 地址: | 201306 上海市浦東新區(qū)中國(上海*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 深度 學(xué)習(xí) 計(jì)算方法 裝置 芯片 介質(zhì) | ||
本發(fā)明實(shí)施例公開了一種深度學(xué)習(xí)計(jì)算方法、裝置、芯片及介質(zhì)。該方法包括:獲取初始計(jì)算圖;根據(jù)所述初始計(jì)算圖生成重構(gòu)計(jì)算圖;其中,所述重構(gòu)計(jì)算圖中包括多個(gè)計(jì)算節(jié)點(diǎn)組,不同的計(jì)算節(jié)點(diǎn)組對應(yīng)的執(zhí)行設(shè)備為所述芯片內(nèi)不同的計(jì)算集群;通過所述芯片內(nèi)的多個(gè)計(jì)算集群處理所述重構(gòu)計(jì)算圖。上述技術(shù)方案實(shí)現(xiàn)了芯片內(nèi)的分布式計(jì)算,充分利用了芯片內(nèi)各計(jì)算集群的計(jì)算性能和存儲性能,提高了芯片對初始計(jì)算圖的處理效率。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種深度學(xué)習(xí)計(jì)算方法、裝置、芯片及介質(zhì)。
背景技術(shù)
隨著深度學(xué)習(xí)的發(fā)展,深度學(xué)習(xí)模型可以在多個(gè)計(jì)算設(shè)備上進(jìn)行訓(xùn)練或推理,實(shí)現(xiàn)了計(jì)算設(shè)備間的分布式深度學(xué)習(xí)計(jì)算。
目前,現(xiàn)有的ASIC(Application Specific Integrated Circuit,專用集成電路)芯片和計(jì)算框架(如TensorFlow或pytorch)不支持芯片內(nèi)分布式深度學(xué)習(xí)計(jì)算,包括訓(xùn)練和推理,無法充分發(fā)揮芯片的計(jì)算性能。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種深度學(xué)習(xí)計(jì)算方法、裝置、芯片及介質(zhì),以實(shí)現(xiàn)芯片內(nèi)分布式深度學(xué)習(xí)計(jì)算,充分利用芯片的計(jì)算性能和存儲性能。
第一方面,本發(fā)明實(shí)施例提供了一種深度學(xué)習(xí)計(jì)算方法,應(yīng)用于芯片中,包括:
獲取初始計(jì)算圖;
根據(jù)所述初始計(jì)算圖生成重構(gòu)計(jì)算圖;其中,所述重構(gòu)計(jì)算圖中包括多個(gè)計(jì)算節(jié)點(diǎn)組,不同的計(jì)算節(jié)點(diǎn)組對應(yīng)的執(zhí)行設(shè)備為所述芯片內(nèi)不同的計(jì)算集群;
通過所述芯片內(nèi)的多個(gè)計(jì)算集群處理所述重構(gòu)計(jì)算圖。
第二方面,本發(fā)明實(shí)施例還提供了一種深度學(xué)習(xí)計(jì)算裝置,應(yīng)用于芯片中,包括:
初始計(jì)算圖獲取模塊,用于獲取初始計(jì)算圖;
重構(gòu)計(jì)算圖生成模塊,用于根據(jù)所述初始計(jì)算圖生成重構(gòu)計(jì)算圖;其中,所述重構(gòu)計(jì)算圖中包括多個(gè)計(jì)算節(jié)點(diǎn)組,不同的計(jì)算節(jié)點(diǎn)組對應(yīng)的執(zhí)行設(shè)備為所述芯片內(nèi)不同的計(jì)算集群;
重構(gòu)計(jì)算圖處理模塊,用于通過所述芯片內(nèi)的多個(gè)計(jì)算集群處理所述重構(gòu)計(jì)算圖。
第三方面,本發(fā)明實(shí)施例還提供了一種芯片,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如本發(fā)明任意實(shí)施例中所述的深度學(xué)習(xí)計(jì)算方法。
第四方面,本發(fā)明實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本發(fā)明任意實(shí)施例中所述的深度學(xué)習(xí)計(jì)算方法。
本發(fā)明實(shí)施例提供的技術(shù)方案,在芯片獲取到初始計(jì)算圖時(shí),對所述初始計(jì)算圖進(jìn)行重構(gòu),使重構(gòu)計(jì)算圖中不同的計(jì)算節(jié)點(diǎn)組的執(zhí)行設(shè)備分別為芯片內(nèi)不同的計(jì)算集群,進(jìn)而通過芯片內(nèi)的多個(gè)計(jì)算集群處理所述重構(gòu)計(jì)算圖,以此實(shí)現(xiàn)了芯片內(nèi)的分布式計(jì)算,充分利用了芯片內(nèi)各計(jì)算集群的計(jì)算性能和存儲性能,提高了芯片對初始計(jì)算圖的處理效率。
附圖說明
圖1是本發(fā)明實(shí)施例一中的一種深度學(xué)習(xí)計(jì)算方法的流程圖;
圖2是本發(fā)明實(shí)施例二中的一種深度學(xué)習(xí)計(jì)算方法的流程圖;
圖3是本發(fā)明實(shí)施例二中的一種與數(shù)據(jù)輸入節(jié)點(diǎn)對應(yīng)的輸入子圖結(jié)構(gòu)的重構(gòu)示意圖;
圖4是本發(fā)明實(shí)施例二中的一種與數(shù)據(jù)輸入節(jié)點(diǎn)對應(yīng)的輸入子圖結(jié)構(gòu)的重構(gòu)示意圖;
圖5是本發(fā)明實(shí)施例三中的一種深度學(xué)習(xí)計(jì)算方法的流程圖;
圖6是本發(fā)明實(shí)施例三中的一種初始計(jì)算圖的示意圖;
圖7是本發(fā)明實(shí)施例三中的一種重構(gòu)計(jì)算圖的示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海燧原科技有限公司,未經(jīng)上海燧原科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110710157.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 電網(wǎng)理論線損的計(jì)算方法和系統(tǒng)
- 一種基于XML的小衛(wèi)星遙測參數(shù)衍生計(jì)算方法
- 一種基于多尺度耦合的并行進(jìn)程合并方法及系統(tǒng)
- 一種注采井網(wǎng)流場速度的快速計(jì)算方法
- 一種自適應(yīng)實(shí)時(shí)火星系統(tǒng)星歷計(jì)算方法
- 基于分類模型的合同費(fèi)用計(jì)算方法、裝置及計(jì)算機(jī)設(shè)備
- 一種超越函數(shù)計(jì)算方法及裝置
- 計(jì)算方法決定系統(tǒng)、計(jì)算方法決定方法、記錄介質(zhì)
- 一種混合湍流計(jì)算方法
- 一種基于芯片檢測的HRD評分計(jì)算方法





