[發明專利]一種計算深度學習模型運行資源的最優化方法在審
| 申請號: | 202011387551.X | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112380019A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 張校;方徐偉;張帥;徐小龍;謝巍盛 | 申請(專利權)人: | 天翼電子商務有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 102200 北京市昌平*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 計算 深度 學習 模型 運行 資源 優化 方法 | ||
1.一種計算深度學習模型運行資源的最優化方法,其特征在于,包括以下步驟:
S1.獲取計算平臺的各項資源,如CPU/GPU,內存/顯存的參數,如計算能力、帶寬、內存/顯存和成本(π1,β1,M1,C1),…,(πi,βi,Mi,Ci),…,(πn,βn,Mn,Cn),并計算各項計算資源的計算強度
i為第i項計算資源,0<i≤n:
S2.獲取模型在計算平臺上運行的約束條件,如神經網絡迭代一次的時間T;
S3.獲取深度學習模型的計算量F和訪存量M,計算模型的計算強度I,I=F/M;
S4.以成本函數Cost(x)和資源利用率函數Util(x)為目標函數,列出模型運行的約束條件;
目標函數:
其中,ti,mi,為模型在計算平臺第i項資源下的使用時間和所占用的內存/顯存和神經網絡運行批樣本數,0<i≤n;
約束條件:
其中,ti,pi,Ii,為模型在計算平臺第i項資源下的模型計算能力和模型計算強度,運行批樣本數,而βi,πi,為計算平臺第i項資源下的帶寬、計算能力上限以及最大計算強度,T為神經網絡迭代一次的時間,0<i≤n;
S5.利用Pareto優化算法對步驟S4中的多目標優化問題進行求解,能夠在滿足約束條件下,在解空間中尋找一組最優解來滿足多目標函數,因此通過該算法的計算能夠得到模型運行的成本的最低值Cmin以及利用率的最高值Umax以及在該資源下網絡最佳批樣本數NbatchSize_best。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天翼電子商務有限公司,未經天翼電子商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011387551.X/1.html,轉載請聲明來源鉆瓜專利網。





