[發明專利]一種集群GPU資源調度系統在審
| 申請號: | 202110233043.4 | 申請日: | 2021-02-23 |
| 公開(公告)號: | CN113076191A | 公開(公告)日: | 2021-07-06 |
| 發明(設計)人: | 李健 | 申請(專利權)人: | 北京藍耘科技股份有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 集群 gpu 資源 調度 系統 | ||
1.一種集群GPU資源調度系統,包括GPU主節點以及若干個GPU子節點,其特征在于,所述GPU主節點包括;
任務接收模塊,用于接收用戶輸入的任務;
任務劃分模塊,用于將任務接收模塊接收到的所述任務劃分為若干個子任務;
資源監視模塊,用于實時監視所有GPU子節點的空閑率,將所述空閑率滿足要求的所述GPU子節點作為可用GPU子節點,并測量所述可用GPU子節點與所述GPU主節點之間的路徑長度和通信速率,使所述路徑長度以及所述通信速率滿足要求的所有所述可用GPU子節點形成GPU調度子集合;以及
資源調度模塊,用于將若干個子任務分配到所述GPU調度子集合中的若干個所述可用GPU子節點上,以供所述可用GPU子節點執行所述子任務。
2.根據權利要求1所述的集群GPU資源調度系統,其特征在于,所述GPU主節點還包括集群初始化模塊,用于對所述GPU主節點以及所述GPU子節點進行初始化。
3.根據權利要求1所述的集群GPU資源調度系統,其特征在于,所述資源調度模塊還用于評估各所述子任務的優先級以及所述GPU調度子集合中各所述可用GPU子節點的計算能力,并根據所述優先級為各所述子任務指定對應計算能力的所述可用GPU子節點。
4.根據權利要求3所述的集群GPU資源調度系統,其特征在于,所述GPU子節點包括:
子任務接收模塊,用于接收所述資源調度模塊分配的所述子任務;
子任務執行模塊,用于對所述子任務接收模塊接收的所述子任務進一步細分,為所述GPU子節點的每個流處理器分配子任務細塊,并行執行各所述子任務細塊;
結果返回模塊,用于將所述GPU子節點的子任務計算結果返回給所述GPU主節點;
信息發送模塊,用于向所述資源調度模塊發送所述GPU子節點的ID號和計算能力。
5.根據權利要求4所述的集群GPU資源調度系統,其特征在于,所述GPU主節點還包括:
結果處理模塊,用于接收處理各所述GPU子節點返回的所述子任務計算結果;
資源回收模塊,用于根據所述結果處理模塊返回的任務執行結果,回收已完成所述子任務的GPU子節點。
6.根據權利要求1所述的集群GPU資源調度系統,其特征在于,所述資源監視模塊包括:
空閑率監視模塊,用于實時監視所有所述GPU子節點的空閑率;
路徑測量模塊,用于測量所述可用GPU子節點與所述GPU主節點之間的路徑長度;
速率測量模塊,用于測量所述可用GPU子節點與所述GPU主節點之間的通信速率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京藍耘科技股份有限公司,未經北京藍耘科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110233043.4/1.html,轉載請聲明來源鉆瓜專利網。





