[發明專利]一種GPU故障診斷系統、診斷方法、設備及可讀存儲介質在審
| 申請號: | 202111007288.1 | 申請日: | 2021-08-30 |
| 公開(公告)號: | CN113777476A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 張健;陳彬;劉海洲 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G01R31/30 | 分類號: | G01R31/30 |
| 代理公司: | 濟南誠智商標專利事務所有限公司 37105 | 代理人: | 李修杰 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 gpu 故障診斷 系統 診斷 方法 設備 可讀 存儲 介質 | ||
1.一種GPU故障診斷系統,其特征是,包括:
一鍵日志收集模塊:用于實現一鍵收集系統帶內日志、GPU故障日志及GPU運行狀態指標文件;
故障日志巡檢模塊:對GPU日志進行巡檢,輸出故障信息并給出處理建議;
GPU實時狀態檢測模塊:用于一鍵檢測GPU實時運行狀態,自動發現故障并給出處理建議;
GPU壓力測試模塊:用于GPU疑難故障的診斷;
GPU驅動一鍵更換模塊:用于GPU驅動版本的一鍵更換;
日志模塊:用于日志的輸出及保存;
GPU驅動模塊,用于保障GPU的運行。
2.如權利要求1所述一種GPU故障診斷系統,其特征是,還包括輔助引導模塊,為一鍵日志收集模塊、故障日志巡檢模塊、GPU實時狀態檢測模塊或GPU壓力測試模塊定制引導菜單及說明,并根據檢測到的故障給出處理建議。
3.如權利要求1所述一種GPU故障診斷系統,其特征是,所述故障日志巡檢模塊接收故障診斷策略,并對GPU日志進行巡檢,輸出故障信息并給出處理建議。
4.如權利要求1所述一種GPU故障診斷系統,其特征是,所述GPU壓力測試模塊集成多種GPU壓測工具并實現一鍵調用。
5.如權利要求1所述一種GPU故障診斷系統,其特征是,所述GPU驅動一鍵更換模塊可接收多個版本的驅動包,用于實現GPU驅動版本的一鍵更換,完成對多種型號GPU的適配及快速診斷。
6.采用權利要求1所述一種GPU故障診斷系統的診斷方法,其特征是,包括:
步驟一、判斷GPU的驅動是否適配,如果不適配則利用GPU驅動一鍵更換模塊更換驅動,如果適配則進入步驟二;
步驟二、根據需要進行功能選擇;
步驟三、保存結果、保存日志并且輸出診斷及維修建議。
7.如權利要求6所述的診斷方法,其特征是,所述步驟二中的功能選擇包括選擇一鍵日志收集模塊、故障日志巡檢模塊、GPU實時狀態檢測模塊或GPU壓力測試模塊。
8.如權利要求7所述的診斷方法,其特征是,當選擇一鍵日志收集模塊時,則執行一鍵收集系統日志的步驟;
當選擇故障日志巡檢模塊時,則執行對GPU日志進行巡檢,輸出故障信息并給出處理建議的步驟;
當選擇GPU實時狀態檢測模塊時,則執行一鍵檢測GPU實時運行狀態,自動發現故障并給出處理建議的步驟;
當選擇GPU壓力測試模塊時,則執行GPU疑難故障的診斷的步驟。
9.一種設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求6-8任意一項所述采用所述一種GPU故障診斷系統的診斷方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求6-8任意一項所述采用所述一種GPU故障診斷系統的診斷方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111007288.1/1.html,轉載請聲明來源鉆瓜專利網。





