[發(fā)明專利]一種服務(wù)器內(nèi)GPU的降功耗電路及服務(wù)器有效
| 申請(qǐng)?zhí)枺?/td> | 202010300844.3 | 申請(qǐng)日: | 2020-04-16 |
| 公開(公告)號(hào): | CN111475009B | 公開(公告)日: | 2022-03-22 |
| 發(fā)明(設(shè)計(jì))人: | 王鵬;程世超;孫瓏玲;劉聞?dòng)?/a>;葉明洋 | 申請(qǐng)(專利權(quán))人: | 蘇州浪潮智能科技有限公司 |
| 主分類號(hào): | G06F1/3206 | 分類號(hào): | G06F1/3206;G06F1/3234;G06F1/324;G06F9/50 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 侯珊 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 服務(wù)器 gpu 功耗 電路 | ||
本發(fā)明公開了一種服務(wù)器內(nèi)GPU的降功耗電路,包括降頻控制芯片。降頻控制芯片在接收到PSU生成的過功率告警信號(hào)后,生成降頻控制信號(hào)至各GPU的PWRBRK引腳,以開啟各GPU的降頻操作。可見,本申請(qǐng)直接采用底層硬件線路實(shí)現(xiàn),無需操作系統(tǒng)介入,響應(yīng)速度較快,使得GPU的整個(gè)降頻操作可在5ms內(nèi)完成,PSU在此較短時(shí)間內(nèi)不會(huì)觸發(fā)過功率保護(hù),從而避免了服務(wù)器異常掉電造成用戶的業(yè)務(wù)數(shù)據(jù)丟失的情況發(fā)生。本發(fā)明還公開了一種服務(wù)器,與上述降功耗電路具有相同的有益效果。
技術(shù)領(lǐng)域
本發(fā)明涉及服務(wù)器領(lǐng)域,特別是涉及一種服務(wù)器內(nèi)GPU的降功耗電路及服務(wù)器。
背景技術(shù)
隨著大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的應(yīng)用,數(shù)據(jù)在近幾年呈指數(shù)型增長,導(dǎo)致僅由CPU作為數(shù)據(jù)處理核心的傳統(tǒng)服務(wù)器無法滿足數(shù)據(jù)處理需求,搭載GPU(Graphics ProcessingUnit,圖形處理器)的服務(wù)器應(yīng)運(yùn)而生。目前,隨著GPU的計(jì)算能力不斷提升,其功耗也隨之升高,再加上服務(wù)器內(nèi)CPU、內(nèi)存、硬盤等硬件的存在,服務(wù)器的整機(jī)功耗將會(huì)超過為服務(wù)器供電的PSU(Power Supply Unit,供電模塊)所能支持的上限。
現(xiàn)有技術(shù)中,服務(wù)器通常采用Power capping(功率封頂)方法限制服務(wù)器的整機(jī)功耗,以使服務(wù)器的整機(jī)功耗小于PSU所能支持的上限。具體地,Power capping方法為:提前為服務(wù)器設(shè)置一個(gè)總功耗閾值,在服務(wù)器運(yùn)行的過程中,監(jiān)控服務(wù)器的整機(jī)功耗是否超過所設(shè)的總功耗閾值,若是,則啟動(dòng)降功耗策略,即通過PCIE(peripheral componentinterconnectexpress,外圍元件快速互聯(lián))總線向服務(wù)器內(nèi)GPU下發(fā)降頻指令,以使GPU在接收到降頻指令后對(duì)自身運(yùn)行頻率進(jìn)行限制。但是,Power capping方法在操作系統(tǒng)層面完成,存在較長時(shí)間的延時(shí)(大約在50ms左右),在此段時(shí)間內(nèi),PSU很有可能已經(jīng)因超功率輸出觸發(fā)過功率保護(hù)(PSU超功率輸出一段時(shí)間后會(huì)觸發(fā)過功率保護(hù)),這將會(huì)導(dǎo)致服務(wù)器異常掉電,從而造成用戶的業(yè)務(wù)數(shù)據(jù)丟失。
因此,如何提供一種解決上述技術(shù)問題的方案是本領(lǐng)域的技術(shù)人員目前需要解決的問題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種服務(wù)器內(nèi)GPU的降功耗電路及服務(wù)器,直接采用底層硬件線路實(shí)現(xiàn),無需操作系統(tǒng)介入,響應(yīng)速度較快,使得GPU的整個(gè)降頻操作可在5ms內(nèi)完成,PSU在此較短時(shí)間內(nèi)不會(huì)觸發(fā)過功率保護(hù),從而避免了服務(wù)器異常掉電造成用戶的業(yè)務(wù)數(shù)據(jù)丟失的情況發(fā)生。
為解決上述技術(shù)問題,本發(fā)明提供了一種服務(wù)器內(nèi)GPU的降功耗電路,包括:
分別與服務(wù)器內(nèi)的PSU和所述服務(wù)器內(nèi)各GPU的PWRBRK引腳連接的降頻控制芯片,用于在接收到所述PSU生成的過功率告警信號(hào)后,生成降頻控制信號(hào)至各所述GPU的PWRBRK引腳,以開啟各所述GPU的降頻操作。
優(yōu)選地,所述降功耗電路還包括:
分別與所述降頻控制芯片的輸出端和各所述GPU的PWRBRK引腳連接的開關(guān)芯片;
與所述開關(guān)芯片的通道控制端子連接的控制電路,用于根據(jù)所述服務(wù)器的整機(jī)功耗與所述PSU的額定功率的對(duì)比關(guān)系,從各所述GPU中確定需降頻處理的目標(biāo)GPU,并控制所述開關(guān)芯片將所述降頻控制芯片和所述目標(biāo)GPU之間的傳輸通道打開,以使所述降頻控制信號(hào)輸出至所述目標(biāo)GPU的PWRBRK引腳,開啟所述目標(biāo)GPU的降頻操作。
優(yōu)選地,所述控制電路包括:
與所述開關(guān)芯片的通道控制端子連接的I/O擴(kuò)展芯片;
與所述I/O擴(kuò)展芯片連接的控制器,用于根據(jù)所述服務(wù)器的整機(jī)功耗與所述PSU的額定功率的對(duì)比關(guān)系,從各所述GPU中確定需降頻處理的目標(biāo)GPU,并通過所述I/O擴(kuò)展芯片控制所述開關(guān)芯片將所述降頻控制芯片和所述目標(biāo)GPU之間的傳輸通道打開,以使所述降頻控制信號(hào)輸出至所述目標(biāo)GPU的PWRBRK引腳。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010300844.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F1-00 不包括在G06F 3/00至G06F 13/00和G06F 21/00各組的數(shù)據(jù)處理設(shè)備的零部件
G06F1-02 .數(shù)字函數(shù)發(fā)生器的
G06F1-04 .產(chǎn)生時(shí)鐘信號(hào)的或分配時(shí)鐘信號(hào)的,或者直接從這個(gè)設(shè)備中得出信號(hào)的
G06F1-16 .結(jié)構(gòu)部件或配置
G06F1-22 .限制或控制引線/門比例的裝置
G06F1-24 .復(fù)位裝置
- 一種基于UDP分布式小文件存儲(chǔ)系統(tǒng)及其數(shù)據(jù)處理方法
- 一種新型云計(jì)算管理系統(tǒng)
- 一種云計(jì)算管理裝置
- 一種節(jié)能數(shù)據(jù)服務(wù)器架構(gòu)系統(tǒng)
- 一種基于云計(jì)算的客戶信息管理裝置
- 一種基于即時(shí)通訊技術(shù)的通訊系統(tǒng)
- 服務(wù)器系統(tǒng)及分配服務(wù)器的方法
- 一種MMORPG游戲服務(wù)器端
- 一種訪問請(qǐng)求的處理方法、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于Spark技術(shù)的大數(shù)據(jù)脫敏管理系統(tǒng)
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲(chǔ)介質(zhì)及設(shè)備
- 一種基于功耗池的集群功耗分配方法
- 遠(yuǎn)端射頻單元及其功耗限制方法、以及基站控制器
- 一種基站功耗的監(jiān)測(cè)方法及裝置
- 一種整機(jī)柜功耗限制方法及裝置
- 功耗處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種整機(jī)箱功耗的分配方法、系統(tǒng)、裝置及可讀存儲(chǔ)介質(zhì)
- 一種基于LSTM的機(jī)房功耗預(yù)警方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)
- 功耗調(diào)節(jié)方法、裝置、存儲(chǔ)介質(zhì)、服務(wù)器和終端
- 一種數(shù)據(jù)中心的功耗控制方法、系統(tǒng)及相關(guān)組件
- 一種延遲掉電省功耗方法和裝置





