[發明專利]處理計算任務的方法、設備和計算機程序產品在審
| 申請號: | 201810359117.7 | 申請日: | 2018-04-20 |
| 公開(公告)號: | CN110389824A | 公開(公告)日: | 2019-10-29 |
| 發明(設計)人: | 趙軍平;彭麟;應治;王鯤 | 申請(專利權)人: | 伊姆西IP控股有限責任公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06N3/02 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 王茂華;李崢宇 |
| 地址: | 美國馬*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算資源 計算機程序產品 神經網絡模型 參數數據 配置信息獲取 關聯 負載平衡 配置信息 任務設備 響應 | ||
1.一種用于處理計算任務的方法,包括:
獲取多個計算資源的狀態信息;
響應于接收到基于神經網絡模型的計算任務,確定與所述神經網絡模型相關聯的多個層的配置信息;
基于所述配置信息獲取與所述多個層中的至少一部分層相關聯的參數數據;以及
基于所述狀態信息和所述參數數據,從所述多個計算資源中選擇一組計算資源以用于處理所述計算任務。
2.根據權利要求1所述的方法,其中基于所述狀態信息選擇一組計算資源包括:針對所述至少一部分層中的第一層,
基于所述參數數據,確定與所述第一層相關聯的參數的第一數量;以及
基于所述狀態信息,從所述多個計算資源中選擇與所述第一數量相匹配的第一計算資源以用于處理與所述第一層相關聯的所述參數。
3.根據權利要求2所述的方法,其中基于所述狀態信息選擇一組計算資源包括:
基于所述參數數據,確定與所述至少一部分層相關聯的參數的相應數量;
基于所述相應數量將所述至少一部分層進行排序;以及
基于所述排序選擇所述第一層。
4.根據權利要求2所述的方法,進一步包括:
確定用于處理與所述第一層相關聯的參數所需的第一資源分配;以及
基于所述第一資源分配,更新所述狀態信息。
5.根據權利要求3所述的方法,進一步包括:針對所述至少一部分層中的第二層,
基于所述參數數據,確定與所述第二層相關聯的參數的第二數量;以及
基于更新的所述狀態信息,從所述多個計算資源中選擇與所述第二數量相匹配的第二計算資源以用于處理與所述第二層相關聯的所述參數。
6.根據權利要求5所述的方法,進一步包括:
確定用于處理所述至少一部分層所需的計算資源的數量;以及
響應于確定被選擇的計算資源的數量達到所述數量,從已被選擇的計算資源中選擇用于處理與所述至少一部分層中的第三層相關聯的參數的計算資源。
7.根據權利要求1所述的方法,其中確定所述多個計算資源的狀態信息包括:
監視所述多個計算資源的資源信息;以及
基于所述資源信息確定所述多個計算資源的狀態信息。
8.根據權利要求7所述的方法,其中所述多個計算資源的資源信息包括以下多個指標中的至少任一指標:
所述多個計算資源的處理能力信息、存儲器資源信息以及帶寬資源信息。
9.根據權利要求8所述的方法,其中基于所述資源信息確定所述多個計算資源的狀態信息進一步包括:針對所述多個計算資源中的給定計算資源,
基于所述計算任務確定針對所述給定計算資源的所述多個指標中的相應指標的重要性;以及
基于所述相應指標的重要性以及所述相應指標,確定針對所述給定計算資源的狀態信息。
10.根據權利要求1所述的方法,其中所述多個計算資源是多個圖形處理單元。
11.一種用于處理計算任務的設備,包括:
至少一個處理器;
易失性存儲器;以及
與所述至少一個處理器耦合的存儲器,所述存儲器具有存儲于其中的指令,所述指令在被所述至少一個處理器執行時使得所述設備執行動作,所述動作包括:
獲取多個計算資源的狀態信息;
響應于接收到基于神經網絡模型的計算任務,確定與所述神經網絡模型相關聯的多個層的配置信息;
基于所述配置信息獲取與所述多個層中的至少一部分層相關聯的參數數據;以及
基于所述狀態信息和所述參數數據,從所述多個計算資源中選擇一組計算資源以用于處理所述計算任務。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于伊姆西IP控股有限責任公司,未經伊姆西IP控股有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810359117.7/1.html,轉載請聲明來源鉆瓜專利網。





