[發明專利]一種基于降頻控制的GPU供電保護結構及方法在審
| 申請號: | 202110525661.6 | 申請日: | 2021-05-14 |
| 公開(公告)號: | CN113204469A | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 段春煥 | 申請(專利權)人: | 山東英信計算機技術有限公司 |
| 主分類號: | G06F11/30 | 分類號: | G06F11/30;G06F1/3206;G06F1/324;G06F1/3296 |
| 代理公司: | 濟南舜源專利事務所有限公司 37205 | 代理人: | 徐胭脂 |
| 地址: | 250101 山東省濟南市高新區*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 控制 gpu 供電 保護 結構 方法 | ||
本發明提供一種基于降頻控制的GPU供電保護結構及方法,包括:一種基于降頻控制的GPU供電保護結構,其特征在于,包括:電流采樣模塊、電壓采樣模塊以及降頻模塊;所述電流采樣模塊包括:精密電阻、電流采樣芯片和BMC;所述電壓采樣模塊包括比較器U1、第一分壓電阻和第二分壓電阻;所述降頻模塊包括CPLD和GPU。本發明通過對GPU的輸入電流和輸入電壓進行監控,觸發GPU降頻動作,降低GPU的工作電流,提升GPU工作電壓,實現GPU的穩定運行,避免因GPU工作電壓低于正常工作電壓范圍導致GPU發生異常狀況。
技術領域
本發明屬于服務器技術領域,具體涉及一種基于降頻控制的GPU供電保護結構及方法。
背景技術
當前GPU服務器廣泛應用于深度學習、人工智能以及其他高性能領域,在滿足了客戶高計算力的需求的同時,對GPU的穩定性可靠性提出高要求。因此在故障發生時的保護機制引起更多關注與研究。
AI GPU服務器當前有配置8卡或16卡,對掌握GPU的運行情況提出更高的要求,但當前整機對GPU的監控主要依賴于芯片原廠提供的加載在驅動中的工具,比如NVIDIA的nvidia-smi監控工具;該工具更多的是監控GPU是否在位、溫度、功耗等運行狀態信息監控,發生異常后在日志中體現出來;這僅是對GPU的監控,是故障發生后查看日志輔助問題分析,但沒有在異常發生時實施保護;
GPU的降頻機制在異常發生時起到保護GPU的作用,包含軟件降頻以及硬件降頻,軟件降頻通過Vbios實現,硬件降頻是GPU芯片內部有降頻線路,比如過溫會觸發GPU降頻保護機制;除了溫度超出最大操作溫度,還有GPU工作電壓低于正常工作電壓時導致GPU工作異常,也是需要重點關注的問題;所以本專利針對該技術點進行闡述;
傳統方法利用服務器整機主板端給GPU供電,會監控電壓并設置欠壓過流保護點,同時GPU內部會監控電壓,但均是在電壓異常時發生斷電或者GPU掉卡,發生宕機均是客戶無法接受的故障;短時間的電壓電流異常不能進行有效保護,不能滿足穩定性的要求。
發明內容
針對現有技術的上述不足,本發明提供一種基于降頻控制的GPU供電保護結構及方法,以解決上述技術問題。
第一方面,本發明提供一種基于降頻控制的GPU供電保護結構,包括:電流采樣模塊、電壓采樣模塊以及降頻模塊;所述電流采樣模塊包括:精密電阻、電流采樣芯片和BMC;所述電壓采樣模塊包括比較器U1、第一分壓電阻和第二分壓電阻;所述降頻模塊包括CPLD和GPU。
進一步的,
所述GPU與CPLD連接;
所述GPU的輸入端與精密電阻連接,所述精密電阻的兩端與電流采樣芯片并聯,所述電流采樣芯片與BMC連接,所述BMC與CPLD連接;
所述GPU的輸入端與所述第一分壓電阻連接,所述第一分壓電阻的另一端與第二分壓電阻連接,所述第二分壓電阻的另一端接地;
所述比較器的一個輸入管腳接入到第一分壓電阻與第二分壓電阻之間;所述比較器的輸出端與CPLD連接。
第二方面,本發明提供一種基于降頻控制的GPU供電保護方法,包括:
在所述電流采樣模塊、電壓采樣模塊對GPU的輸入電流和輸入電壓進行監控,并分別設定最大工作電流閾值和最小工作電壓閾值;
在所述降頻模塊,當GPU輸入電流超出設定的閾值時,則觸發GPU降頻;
進一步的,通過所述電流采樣模塊,所述方法還包括:
GPU的輸入工作電壓并流經精密電阻;
電流采樣芯片獲取精密電阻兩端的壓差,并將所述壓差傳遞至BMC中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東英信計算機技術有限公司,未經山東英信計算機技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110525661.6/2.html,轉載請聲明來源鉆瓜專利網。





