[發明專利]基于容器的資源調度方法、裝置及容器集群管理裝置有效
| 申請號: | 202010014982.5 | 申請日: | 2020-01-07 |
| 公開(公告)號: | CN113157428B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 車漾;張凱;徐曉舟 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06F9/455 |
| 代理公司: | 北京鼎佳達知識產權代理事務所(普通合伙) 11348 | 代理人: | 唐博;劉鐵生 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 容器 資源 調度 方法 裝置 集群 管理 | ||
本發明實施例提供一種基于容器的資源調度方法、裝置及容器集群管理裝置,該方法包括:接收資源申請信息,所述資源申請信息用于請求分配用于運行第一應用的資源;基于所述資源申請信息調用資源管理組件;通過所述資源管理組件控制所述第一應用的資源使用量小于或等于所述第一應用可使用的資源上限值。本發明實施例用于解決多個應用容器共享資源時超出資源使用上限導致無法正常運行的問題。
技術領域
本發明涉及計算機技術領域,尤其涉及一種基于容器的資源調度方法、裝置及容器集群管理裝置。
背景技術
目前主流的容器集群都支持圖形處理器(Graphics Processing Unit,GPU)調度,但是由于部分GPU不支持顯存級別的限制和隔離,所以容器集群調度器對于GPU的調度模式都是以GPU為單位調度的獨享模式。雖然以GPU為單位調度可以保證應用的高可用性,但很多場景中單個容器對GPU的顯存使用量并不大,單個容器無需單獨占用整個GPU,因此容器集群對容器共享GPU的需求非常強烈。
當前有的方案支持在調度時刻根據應用申請的顯存將多個容器調度到同一個GPU上,但由于各個應用實際使用的顯存可能會大于申請的顯存,因此當容器集群管理系統將多個容器調度到同一個GPU運行時,調度到同一GPU的容器要使用的顯存的總量可以能會大于GPU的顯存總量,導致內存溢出(OutOfMemory)而無法正常運行。
發明內容
有鑒于此,本發明實施例提供一種基于容器的資源調度方法、裝置及容器集群管理裝置,用于解決多個應用容器共享資源時超出資源使用上限導致無法正常運行的問題。
為了實現上述目的,本發明實施例提供技術方案如下:
第一方面,本發明實施例提供一種基于容器的資源調度方法,包括:
接收資源申請信息,所述資源申請信息用于請求分配用于運行第一應用的資源;
基于所述資源申請信息調用資源管理組件;
通過所述資源管理組件控制所述第一應用的資源使用量小于或等于所述第一應用可使用的資源上限值。
作為本發明實施例一種可選的實施方式,所述通過所述資源管理組件控制所述第一應用的資源使用量小于或等于所述第一應用可使用的資源上限值,包括:
通過所述資源管理組件獲取所述第一應用依賴的深度學習框架;
根據所述深度學習框架,確定所述第一應用的資源控制方式;
基于所述資源控制方式,控制所述第一應用的資源使用量小于或等于所述第一應用可使用的資源上限值。
作為本發明實施例一種可選的實施方式,所述基于所述資源控制方式,控制所述第一應用的資源使用量小于或等于所述第一應用可使用的資源上限值,包括:
在所述資源控制方式的環境變量中引入可分配用于運行所述第一應用的資源總量和所述第一應用可使用的資源上限值;
根據所述資源控制方式控制所述第一應用的資源使用量與所述資源總量的比值小于或等于所述第一應用可使用的資源上限值與所述資源總量的比值。
作為本發明實施例一種可選的實施方式,所述方法還包括:
根據所述資源申請信息中攜帶的資源申請量,配置所述第一應用可使用的資源上限值。
作為本發明實施例一種可選的實施方式,所述資源申請信息用于請求分配用于運行第一應用的第一處理器的資源;
其中,所述第一處理器用于部署所述第一應用對應的第一應用容器和至少一個第二應用對應的第二應用容器。
作為本發明實施例一種可選的實施方式,在基于所述資源申請信息調用資源管理組件之前,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010014982.5/2.html,轉載請聲明來源鉆瓜專利網。





