[發明專利]集群資源調度方法及裝置、電子設備和存儲介質在審
| 申請號: | 202110664041.0 | 申請日: | 2021-06-15 |
| 公開(公告)號: | CN113377540A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 孫鵬;梁若凡;顏深根 | 申請(專利權)人: | 上海商湯科技開發有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06F9/54 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;董文俊 |
| 地址: | 201306 上海市浦東新區自*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 集群 資源 調度 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例公開了一種集群資源調度方法及裝置、電子設備和存儲介質,其中,該方法包括:在第一運行環境中,獲取對圖形處理器GPU集群中GPU的資源調度請求;根據請求參數執行任務調度策略將深度學習任務添加到任務隊列中,以及執行預設資源分配策略從圖形處理器GPU集群中確定出至少一個目標GPU;將深度學習任務調度至至少一個目標GPU上進行處理;調整任務調度策略和預設資源分配策略,將調整后的任務調度策略和預設資源分配策略部署在第二運行環境中。本申請實施例有利于降低資源調度算法的開發成本。
技術領域
本申請涉及分布式系統技術領域,具體涉及一種集群資源調度方法及裝置、電子設備和存儲介質。
背景技術
隨著人工智能的發展,深度學習成為研究人員的關注重點,在目標識別、目標檢測任務上有著廣泛的應用。深度學習算法的實現離不開有效的訓練,為了滿足其訓練對算力的要求,大規模的GPU(graphics processing unit,圖形處理器)集群成為了深度學習算法研發工作的支撐。談及集群就無可避免會涉及到資源管理和任務調度,目前集群中的任務調度多依賴于任務調度算法,而任務調度算法在開發完成后,需要在集群中進行測試,以驗證其有效性和可靠性,但就深度學習訓練周期長、計算密度大的特點而言,目前的任務調度算法的開發部署流程較為費時費力,這就使得開發成本居高不下。
發明內容
本申請實施例提供了一種集群資源調度方法及裝置、電子設備和存儲介質。通過在第一運行環境中進行任務調度策略和資源分配策略的開發,有利于降低資源調度算法的開發成本。
第一方面,本申請實施例提供一種集群資源調度方法,該方法包括:
在第一運行環境中,獲取對圖形處理器GPU集群中GPU的資源調度請求;所述資源調度請求中包括請求參數;
根據所述請求參數執行任務調度策略將所述資源調度請求對應的深度學習任務添加到任務隊列中,以及執行預設資源分配策略從所述圖形處理器GPU集群中確定出至少一個目標GPU;
將所述深度學習任務調度至所述至少一個目標GPU上進行處理;
調整所述任務調度策略和所述預設資源分配策略,將調整后的所述任務調度策略和所述預設資源分配策略部署在第二運行環境中。
結合第一方面,在一種可能的實施方式中,所述請求參數包括所述深度學習任務的任務類型,所述根據所述請求參數執行任務調度策略將所述資源調度請求對應的深度學習任務添加到任務隊列中,包括:
根據所述深度學習任務的任務類型從所述圖形處理器GPU集群的至少一個任務分區中確定出所述深度學習任務待請求的目標任務分區;
執行所述目標任務分區對應的所述任務調度策略將所述深度學習任務添加到所述目標任務分區的任務隊列中。
結合第一方面,在一種可能的實施方式中,所述請求參數還包括歷史深度學習任務的平均完成時長和平均等待時長,所述執行預設資源分配策略從所述圖形處理器GPU集群中確定出至少一個目標GPU,包括:
根據所述平均完成時長和所述平均等待時長計算出所述深度學習任務待請求的GPU資源量;
根據所述待請求的GPU資源量執行第一預設資源分配策略或第二預設資源分配策略,以從所述目標任務分區中確定出所述至少一個目標GPU;所述第一預設資源分配策略用于查找到所述目標任務分區中的空閑GPU資源,則將所述空閑GPU資源確定為目標GPU,所述第二預設資源分配策略用于查找到所述目標任務分區中滿足計算條件的空閑GPU資源,則將所述滿足計算條件的空閑GPU資源確定為目標GPU。
結合第一方面,在一種可能的實施方式中,在根據所述深度學習任務的任務類型從所述圖形處理器GPU集群的至少一個任務分區中確定出所述深度學習任務待請求的目標任務分區之前,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海商湯科技開發有限公司,未經上海商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110664041.0/2.html,轉載請聲明來源鉆瓜專利網。





