[發明專利]機器學習平臺的GPU資源的管理方法及裝置在審
| 申請號: | 202010533979.4 | 申請日: | 2020-06-12 |
| 公開(公告)號: | CN111736992A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 丁平;楊春明;郭鑄;王欣;梁磊;許超;李小平;張海鵬;畢斕馨;陳園園;谷方方 | 申請(專利權)人: | 中國銀行股份有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 王天堯;湯在彥 |
| 地址: | 100818 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器 學習 平臺 gpu 資源 管理 方法 裝置 | ||
1.一種機器學習平臺的GPU資源的管理方法,其特征在于,包括:
獲取機器學習平臺中運行的滿足篩選要求的應用程序對應的用戶;
對每一用戶,查詢機器學習平臺中該用戶對應的容器中GPU資源的使用情況;
在確定該用戶對應的容器中GPU資源未被使用時,暫停該用戶對應的容器中的GPU資源。
2.如權利要求1所述的機器學習平臺的GPU資源的管理方法,其特征在于,對每一用戶,查詢機器學習平臺中該用戶對應的容器中GPU資源的使用情況,包括:
對每一用戶,在第一設定時長內,每隔第二設定時長判斷第三設定時長內該用戶對應的容器中是否存在GPU資源,若第一設定時長內首次查詢到存在GPU資源時,確定該用戶對應的容器中GPU資源被使用,跳出判斷;若第一設定時長內均不存在GPU資源,確定該用戶對應的容器中GPU資源未被使用。
3.如權利要求1所述的機器學習平臺的GPU資源的管理方法,其特征在于,還包括:
針對所有用戶,并行執行以下步驟:
查詢機器學習平臺中用戶對應的容器中GPU資源的使用情況;
在確定用戶對應的容器中GPU資源未被使用時,暫停用戶對應的容器中的GPU資源。
4.如權利要求1所述的機器學習平臺的GPU資源的管理方法,其特征在于,還包括:
若用戶對應的容器中的GPU資源暫停,殺掉該用戶對應的容器。
5.一種機器學習平臺的GPU資源的管理裝置,其特征在于,包括:
用戶獲取模塊,用于獲取機器學習平臺中運行的滿足篩選要求的應用程序對應的用戶;
查詢模塊,用于對每一用戶,查詢機器學習平臺中該用戶對應的容器中GPU資源的使用情況;
處理模塊,用于在確定該用戶對應的容器中GPU資源未被使用時,暫停該用戶對應的容器中的GPU資源。
6.如權利要求5所述的機器學習平臺的GPU資源的管理裝置,其特征在于,查詢模塊具體用于:
對每一用戶,在第一設定時長內,每隔第二設定時長判斷第三設定時長內該用戶對應的容器中是否存在GPU資源,若第一設定時長內首次查詢到存在GPU資源時,確定該用戶對應的容器中GPU資源被使用,跳出判斷;若第一設定時長內均不存在GPU資源,確定該用戶對應的容器中GPU資源未被使用。
7.如權利要求5所述的機器學習平臺的GPU資源的管理裝置,其特征在于,還包括并行執行模塊,用于:
針對所有用戶,并行執行以下步驟:
查詢機器學習平臺中用戶對應的容器中GPU資源的使用情況;
在確定用戶對應的容器中GPU資源未被使用時,暫停用戶對應的容器中的GPU資源。
8.如權利要求5所述的機器學習平臺的GPU資源的管理裝置,其特征在于,還包括容器查殺模塊,用于:
若用戶對應的容器中的GPU資源暫停,殺掉該用戶對應的容器。
9.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至4任一項所述方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有執行權利要求1至4任一項所述方法的計算機程序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀行股份有限公司,未經中國銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010533979.4/1.html,轉載請聲明來源鉆瓜專利網。





