[發明專利]基于DCU的資源調度方法、裝置和計算機設備在審
| 申請號: | 202011381447.X | 申請日: | 2020-12-01 |
| 公開(公告)號: | CN112612600A | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 王建敏;原帥;呂灼恒;南亞;蘇垚;余彬;于潔;郭珂 | 申請(專利權)人: | 曙光信息產業(北京)有限公司;曙光信息產業股份有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 賈旭 |
| 地址: | 100193 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 dcu 資源 調度 方法 裝置 計算機 設備 | ||
1.一種基于DCU的資源調度方法,其特征在于,包括:
接收多個深度學習應用作業任務,所述作業任務包括資源需求信息和作業任務類型;
獲取深度學習加速器DCU開發環境下的可用資源使用狀態信息;
根據所述資源需求信息、所述作業任務類型和所述可用資源使用狀態信息,確定所述作業任務的執行順序和執行節點;
按照所述執行順序,將所述作業任務調度至對應的執行節點,以使所述執行節點執行相應類型的作業任務。
2.如權利要求1所述的方法,其特征在于,根據所述資源需求信息、所述作業任務類型和所述可用資源使用狀態信息,確定所述作業任務的執行順序和執行節點,包括:
所述作業任務還包括用戶作業優先級,所述作業任務類型具有相應的調度類型優先級;
根據所述用戶作業優先級、所述資源需求信息、所述調度類型優先級確定所述作業任務對應的實際作業優先級;
根據所述實際作業優先級確定所述作業任務的執行順序;以及
確定與所述作業任務類型相同的執行節點。
3.如權利要求1所述的方法,其特征在于,在所述執行節點執行所述作業任務時,還包括:
創建與所述作業任務對應的資源信息,并將所述資源信息記錄至資源記錄表。
4.如權利要求1所述的方法,其特征在于,還包括:
在所述執行節點執行所述作業任務過程中,接收取消所述作業任務的取消命令;
根據所述取消命令確定所述作業任務的資源使用信息;
根據所述資源使用信息更新資源記錄表。
5.如權利要求1所述的方法,其特征在于,還包括:
判斷所述作業任務是否執行完成;
如果執行完成,則將所述作業任務保存至歷史任務表中。
6.如權利要求1所述的方法,其特征在于,所述深度學習應用包括Caffe、TensorFlow、Pytorth、Keras中的一種或多種。
7.如權利要求1所述的方法,其特征在于,所述資源需求信息包括CPU數量、內存大小、DCU數量中的一種或多種。
8.一種基于DCU的資源調度裝置,其特征在于,包括:
接收模塊,用于接收多個深度學習應用作業任務,所述作業任務包括資源需求信息和作業任務類型;
獲取模塊,用于獲取深度學習加速器DCU開發環境下的可用資源使用狀態信息;
確定模塊,用于根據所述資源需求信息、所述作業任務類型和所述可用資源使用狀態信息,確定所述作業任務的執行順序和執行節點;
調度模塊,用于按照所述執行順序,將所述作業任務調度至對應的執行節點,以使所述執行節點執行相應類型的作業任務。
9.一種計算機設備,其特征在于,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時,實現如權利要求1-7任一所述的基于DCU的資源調度方法。
10.一種非臨時性計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1-7任一所述的基于DCU的資源調度方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于曙光信息產業(北京)有限公司;曙光信息產業股份有限公司,未經曙光信息產業(北京)有限公司;曙光信息產業股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011381447.X/1.html,轉載請聲明來源鉆瓜專利網。





