[發明專利]一種檢測分析GPU速率狀態的方法、裝置及計算機可讀介質有效
| 申請號: | 202010890085.0 | 申請日: | 2020-08-28 |
| 公開(公告)號: | CN112069006B | 公開(公告)日: | 2022-12-27 |
| 發明(設計)人: | 孔祥源 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F11/22 | 分類號: | G06F11/22 |
| 代理公司: | 北京眾達德權知識產權代理有限公司 11570 | 代理人: | 張曉冬 |
| 地址: | 215000 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 檢測 分析 gpu 速率 狀態 方法 裝置 計算機 可讀 介質 | ||
本發明公開了一種檢測分析GPU速率狀態的方法、裝置及計算機可讀介質,屬于檢測分析GPU速率狀態的技術領域。該方法包括:讀取GPU的GPUPCIE設備總線號,并建立GPU序列號與GPU PCIE設備總線號之間的映射關系;基于所述映射關系依次提取當前GPU進行速率切換測試;在GPU進行速率切換測試時,根據當前GPU速率狀態對其進行速率切換測試,并將每次速率切換測試的結果記錄在GPU最終結果文本文件和GPU速率切換文本文件;發生故障時,根據PCIE設備總線號查找并分析對應的GPU最終結果文本文件或GPU速率切換文本文件。
技術領域
本發明涉及檢測分析GPU速率狀態的技術領域,具體為一種檢測分析GPU速率狀態的方法、裝置及計算機可讀介質。
背景技術
人工智能是計算機學科的一個分支,近三十年來它獲得了迅速的發展,在很多學科領域都獲得了廣泛應用,并取得了豐碩的成果,人工智能已逐步成為一個獨立的分支,無論在理論和實踐上都已自成一個系統。而人工智能技術需要通過AI服務器作為載體來實現。 AI服務器主要指的是采用異構形式的服務器,目前廣泛使用的是CPU+GPU的異構形式。隨著技術的發展,AI計算等對服務器的性能以及穩定性提出了更高的要求。如何設計穩定性及可靠性更高的服務器成為了一項技術挑戰。在AI服務器的研發與設計過程中,一般會使用多項測試來保證服務器的穩定性。其中對GPU進行速率切換測試成為一種有效的測試GPU穩定性的一種測試手段,該測試對GPU分別進行Gen1,Gen2,Gen3三種速率模式下的切換測試,檢測GPU是否能在長期的測試過程中的穩定性。然而在對GPU進行速率切換測試時,容易出現一些小概率性速率切換測試失敗的情況,此時需要研發人員實時的了解分析GPU運行狀態,對問題進行分析定位。
在現有分析方法中,在運行速率切換測試過程中,一般使用研發人員手動的獲取當前系統的中某個GPU的PCIE設備總線號(BUS NUMBER),然后通過lspci指令獲取某個GPU的某個特定時刻速率狀態。
一個系統中,可能包含若干個GPU,且每個整機系統中的GPU PCIE設備總線號可能存在差異。在這種情況下,研發測試人員需要對系統中的所有GPU的PCIE設備總線號逐個確定,然后進行逐個GPU速率狀態確定,測試效率比較低。
現有技術中,當GPU進行速率切換測試過程中,研發人員手動通過lspci指令,只能掌握在GPU在某一個時刻速率狀態信息,并不能實時的對整個測試過程中的GPU速率狀態信息進行抓取,也無法分析GPU速率切換的時間間隔,所以也無法在GPU速率切換出現異常失敗時,實時的獲取GPU速率切換測試的異常點。由于GPU速率切換測試是小概率的事件,這極大的增加了分析定位問題的困難。
發明內容
本發明的目的在于提供一種檢測分析GPU速率狀態的方法、裝置及計算機可讀介質,為研發人員進行問題定位提供了關鍵信息,提高了分析定位問題的效率的檢測分析GPU速率狀態的方法,以解決上述背景技術中提出的問題。
為實現上述目的,本發明提供如下技術方案:一種檢測分析GPU速率狀態的方法,包括:
讀取GPU的GPU PCIE設備總線號,并建立GPU序列號與GPU PCIE設備總線號之間的映射關系;
基于所述映射關系依次提取當前GPU進行速率切換測試;
在GPU進行速率切換測試時,根據當前GPU速率狀態對其進行速率切換測試,并將每次速率切換測試的結果記錄在GPU最終結果文本文件和GPU速率切換文本文件;
發生故障時,根據PCIE設備總線號查找并分析對應的GPU最終結果文本文件或GPU速率切換文本文件。
進一步的,在GPU進行速率切換測試時,根據當前GPU速率狀態對其進行速率切換測試,并將每次速率切換測試的結果記錄在GPU最終結果文本文件和GPU速率切換文本文件的步驟,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010890085.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:真空系統
- 下一篇:一種骨科臨床用自動取釘裝置及方法





