[發(fā)明專利]一種云主機中GPU監(jiān)控方法、裝置、宿主機和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202211450683.1 | 申請日: | 2022-11-18 |
| 公開(公告)號: | CN115733731A | 公開(公告)日: | 2023-03-03 |
| 發(fā)明(設計)人: | 張連法;蘇海明 | 申請(專利權(quán))人: | 濟南浪潮數(shù)據(jù)技術(shù)有限公司 |
| 主分類號: | H04L41/0631 | 分類號: | H04L41/0631;H04L43/50;G08B21/18;G08B7/06 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 崔俊紅 |
| 地址: | 250000 山東省濟南市自由貿(mào)易試驗區(qū)*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 主機 gpu 監(jiān)控 方法 裝置 宿主 存儲 介質(zhì) | ||
1.一種云主機中GPU監(jiān)控方法,其特征在于,應用于云平臺的宿主機,包括:
通過調(diào)度采集工具、數(shù)據(jù)采集腳本和QGA,獲得云主機中GPU的監(jiān)控數(shù)據(jù);所述調(diào)度采集工具和所述數(shù)據(jù)采集腳本預先安裝于所述宿主機中,所述QGA預先安裝于云主機中;
判斷監(jiān)控數(shù)據(jù)是否超過預設告警閾值;
若所述監(jiān)控數(shù)據(jù)超過所述預設告警閾值,則控制告警設備發(fā)出告警信息。
2.如權(quán)利要求1所述的云主機中GPU監(jiān)控方法,其特征在于,所述通過調(diào)度采集工具、數(shù)據(jù)采集腳本和QGA,獲得云主機中GPU的監(jiān)控數(shù)據(jù)包括:
通過所述調(diào)度采集工具調(diào)用所述數(shù)據(jù)采集腳本;
通過所述數(shù)據(jù)采集腳本利用所述QGA獲得所述監(jiān)控數(shù)據(jù)。
3.如權(quán)利要求2所述的云主機中GPU監(jiān)控方法,其特征在于,通過所述數(shù)據(jù)采集腳本利用所述QGA獲得所述監(jiān)控數(shù)據(jù)包括:
通過所述數(shù)據(jù)采集腳本檢測所述GPU的類型;
通過所述數(shù)據(jù)采集腳本利用所述QGA調(diào)用與所述GPU的類型對應的命令;
通過所述數(shù)據(jù)采集腳本根據(jù)所述命令獲得所述監(jiān)控數(shù)據(jù)。
4.如權(quán)利要求3所述的云主機中GPU監(jiān)控方法,其特征在于,還包括:
通過所述數(shù)據(jù)采集腳本解析所述監(jiān)控數(shù)據(jù);
通過所述數(shù)據(jù)采集腳本將解析后監(jiān)控數(shù)據(jù)組裝成目標數(shù)據(jù)庫所需的標準格式的監(jiān)控數(shù)據(jù);
通過所述數(shù)據(jù)采集腳本將所述標準格式的監(jiān)控數(shù)據(jù)、與所述GPU對應的所述云主機的標識信息存儲至所述目標數(shù)據(jù)庫。
5.如權(quán)利要求2所述的云主機中GPU監(jiān)控方法,其特征在于,通過所述調(diào)度采集工具調(diào)用數(shù)據(jù)采集腳本包括:
通過所述調(diào)度采集工具按照預設周期調(diào)用所述數(shù)據(jù)采集腳本。
6.如權(quán)利要求2所述的云主機中GPU監(jiān)控方法,其特征在于,通過所述調(diào)度采集工具調(diào)用數(shù)據(jù)采集腳本包括:
通過所述調(diào)度采集工具根據(jù)所述云主機的數(shù)量、所述數(shù)據(jù)采集腳本的數(shù)據(jù)采集容量確定所述數(shù)據(jù)采集腳本的調(diào)用數(shù)量;
通過所述調(diào)度采集工具調(diào)用所述調(diào)用數(shù)量的所述數(shù)據(jù)采集腳本。
7.如權(quán)利要求1所述的云主機中GPU監(jiān)控方法,其特征在于,還包括:
對每種所述監(jiān)控數(shù)據(jù)對應創(chuàng)建告警任務;
將所述告警任務平均分配至各個告警實例,以便所述告警實例對所述監(jiān)控數(shù)據(jù)進行判斷。
8.一種云主機中GPU監(jiān)控裝置,其特征在于,包括:
獲得模塊,用于通過調(diào)度采集工具、數(shù)據(jù)采集腳本和QGA,獲得云主機中GPU的監(jiān)控數(shù)據(jù);所述調(diào)度采集工具和所述數(shù)據(jù)采集腳本預先安裝于所述宿主機中,所述QGA預先安裝于云主機中;
判斷模塊,用于判斷監(jiān)控數(shù)據(jù)是否超過預設告警閾值;
告警模塊,用于若所述監(jiān)控數(shù)據(jù)超過所述預設告警閾值,則控制告警設備發(fā)出告警信息。
9.一種宿主機,其特征在于,包括:
存儲器,用于存儲計算機程序;
處理器,用于執(zhí)行所述計算機程序時實現(xiàn)如權(quán)利要求1至7任一項所述云主機中GPU監(jiān)控方法的步驟。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7任一項所述云主機中GPU監(jiān)控方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于濟南浪潮數(shù)據(jù)技術(shù)有限公司,未經(jīng)濟南浪潮數(shù)據(jù)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211450683.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





