[發明專利]GPU性能的監控方法、監控裝置和電子設備在審
| 申請號: | 202310403108.4 | 申請日: | 2023-04-14 |
| 公開(公告)號: | CN116560941A | 公開(公告)日: | 2023-08-08 |
| 發明(設計)人: | 張書博 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F11/30 | 分類號: | G06F11/30 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 霍文娟 |
| 地址: | 215000 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | gpu 性能 監控 方法 裝置 電子設備 | ||
1.一種GPU性能的監控方法,其特征在于,包括:
通過目標腳本判斷GPU是否開啟MIG模式,其中,所述目標腳本為所述GPU所在的節點中至少用于獲取并輸出所述GPU中多個MIG小組的性能參數的腳本,所述MIG模式是用于將所述GPU劃分為多個所述MIG小組的模式;
在所述GPU開啟所述MIG模式的情況下,通過所述目標腳本獲取所述GPU中各所述MIG小組的標識符和索引值,根據每個所述MIG小組的標識符和索引值至少獲取每個所述MIG小組對應的一組第一性能參數,并至少將所述第一性能參數存儲至目標存儲單元,其中,所述第一性能參數表示每個所述MIG小組的計算核心的性能且至少包括顯存參數和dram_active參數。
2.根據權利要求1所述的監控方法,其特征在于,通過目標腳本判斷GPU是否開啟MIG模式之前,還包括:
執行所述目標腳本中的NVIDIA?SMI指令,在成功執行所述NVIDIA?SMI指令的情況下,執行判斷所述GPU是否開啟MIG模式的步驟;
在執行所述NVIDIA?SMI指令失敗的情況下,退出所述目標腳本。
3.根據權利要求1所述的監控方法,其特征在于,通過所述目標腳本獲取所述GPU中各所述MIG小組的標識符和索引值,包括:
通過所述目標腳本中的NVIDIA?SMI?L指令獲取所述GPU中各所述MIG小組的標識符和索引值。
4.根據權利要求3所述的監控方法,其特征在于,在獲取所述GPU中各所述MIG小組的標識符和索引值之后,還包括:
將所述GPU的多個所述MIG小組的標識符和索引值生成至目標群組,判斷所述目標群組的群組代號與定向文件中的初始群組的群組代號是否相同,其中,所述目標群組包括多個目標組,每個所述目標組包括一個所述MIG小組的標識符和索引值,所述目標群組和所述初始群組都具有唯一的群組代號,所述定向文件存儲于所述GPU所在的節點中,所述初始群組生成于所述GPU上一次開啟所述MIG模式之后;
在所述目標群組的群組代號與所述初始群組的群組代號相同的情況下,判斷所述目標群組中每個所述MIG小組的存儲空間大小與所述初始群組中每個初始MIG小組的存儲空間大小是否相同,在所述目標群組中所有的所述MIG小組的存儲空間大小與所述初始群組中所有的所述初始MIG小組的存儲空間大小相同的情況下,將所述初始群組的群組代號作為所述目標群組的群組代號,在所述目標群組中所有的所述MIG小組的存儲空間大小與所述初始群組中所有的所述初始MIG小組的存儲空間大小不同的情況下,刪除所述初始群組的群組代號,將所述目標群組的群組代號存儲至所述定向文件中;
在所述目標群組的群組代號與所述初始群組的群組代號不同的情況下,將所述目標群組的群組代號存儲至所述定向文件中。
5.根據權利要求1所述的監控方法,其特征在于,根據每個所述MIG小組的標識符和索引值至少獲取每個所述MIG小組對應的一組第一性能參數,包括:
通過所述目標腳本的dcgmi?dmon?g命令,按照定向文件中的目標群組代號對應的目標群組中的每個所述MIG小組的標識符和索引值,獲取每個所述MIG小組對應的一組第一性能參數,其中,所述定向文件存儲于所述GPU所在的節點中且包括所述目標群組的群組代號,所述目標群組包括多個目標組,每個所述目標組包括一個所述MIG小組的標識符和索引值;
通過所述目標腳本的dcgmi?dmon命令,獲取所述GPU的第二性能參數,其中,所述第二性能參數表示所述GPU的性能且至少包括所述GPU的顯存。
6.根據權利要求1所述的監控方法,其特征在于,至少將所述第一性能參數存儲至目標存儲單元,包括:
所述GPU所在的節點中還包括telegraf組件,所述telegraf組件用于在預定周期內執行所述目標腳本,獲取所述目標腳本輸出的所述第一性能參數和第二性能參數,并將所述第一性能參數和所述第二性能參數存儲至所述目標存儲單元,其中,所述第二性能參數用于表示所述GPU的性能且至少包括所述GPU的顯存。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310403108.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:磨筒組件和無氧破壁設備
- 下一篇:一種包含驅鳥刺的絕緣子防護裝置





