[發(fā)明專利]一種通訊自動恢復方法和裝置在審
| 申請?zhí)枺?/td> | 201811339485.1 | 申請日: | 2018-11-12 |
| 公開(公告)號: | CN109491867A | 公開(公告)日: | 2019-03-19 |
| 發(fā)明(設計)人: | 公衍賓 | 申請(專利權)人: | 鄭州云海信息技術有限公司 |
| 主分類號: | G06F11/30 | 分類號: | G06F11/30;G06F9/445 |
| 代理公司: | 北京集佳知識產(chǎn)權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 450018 河南省鄭州市*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 管理單元 基板管理控制器 整機 實時運行狀態(tài) 方法和裝置 服務器節(jié)點 自動恢復 通訊 服務器機柜 管理控制器 調速 功耗監(jiān)控 機柜風扇 控制基板 實時獲取 通訊狀態(tài) 散熱 重啟 發(fā)送 監(jiān)控 監(jiān)測 申請 恢復 | ||
本申請公開了一種通訊自動恢復方法和裝置,在該方法中,在整機柜管理單元監(jiān)測到整機柜管理單元與基板管理控制器之間的通訊狀態(tài)處于故障后,能夠控制基板管理控制器進行重啟,從而恢復該基板管理控制器與中板、整機柜管理單元之間的通訊。如此,整機柜管理單元能夠實時獲取到基板管理控制器發(fā)送來的服務器節(jié)點的實時運行狀態(tài),避免了RMC因獲取不到服務器節(jié)點的實時運行狀態(tài),有可能導致整個機柜風扇散熱調速異常、功耗監(jiān)控異常等等產(chǎn)生的系統(tǒng)性風險,從而使服務器機柜監(jiān)控和運行變得更加穩(wěn)定。
技術領域
本申請涉及計算機技術領域,尤其涉及一種通訊自動恢復方法和裝置。
背景技術
隨著云計算、大數(shù)據(jù)等新型技術的發(fā)展,對柜式服務器的需求越來越多,隨之而來,對整機柜服務器散熱穩(wěn)定性需求越來越高。
為了滿足這些需求,整機柜上集成的結點越來越密集,結點類型(包括計算結點、存儲結點和GPUBOX結點等等)越來越多,用戶對整機柜管理單元(簡稱RMC)與服務器節(jié)點之間的通訊穩(wěn)定性要求越來越高。這是因為,當其間的通訊出現(xiàn)故障后,將導致RMC無法正常獲取基板管理控制器(Baseboard Management Controler,簡稱BMC)監(jiān)控并發(fā)送給RMC的結點實時運行信息,由于整機柜的風扇散熱調速,功耗,以及電源模塊(PSU)等等都是由RMC通過獲取各個結點的實時溫度,電壓,功耗等等信息進行調節(jié),如果通訊出現(xiàn)故障,則會導致整個機柜運行出現(xiàn)風險及不穩(wěn)定性的可能。
發(fā)明內容
有鑒于此,本申請?zhí)峁┝艘环N通訊自動恢復方法和裝置,以實現(xiàn)在RMC與BMC之間的通訊出現(xiàn)故障后,能夠自動恢復通訊,從而保證整機柜運行的穩(wěn)定性。
為了達到上述發(fā)明目的,本申請采用了如下技術方案:
一種通訊自動恢復方法,包括:
接收中板上報的整機柜管理單元與基板管理控制器之間的通訊狀態(tài);
判斷所述通訊狀態(tài)是否處于故障狀態(tài);
當所述通訊狀態(tài)處于故障狀態(tài)時,判斷持續(xù)處于所述故障狀態(tài)的時間是否超過第一預設時長,如果是,控制所述基板管理控制器進行重啟,從而恢復所述基板管理控制器與所述中板、所述整機柜管理單元之間的通訊。
可選地,所述控制所述基板管理控制器進行重啟,具體包括:
控制所述基板管理控制器重新初始化自身的智能平臺管理總線的服務驅動及進程。
可選地,所述控制所述基板管理控制器進行重啟,具體包括:
向所述中板發(fā)送所述基板管理控制器的重啟指令,以使所述中板根據(jù)所述重啟指令控制所述基板管理控制器進行重啟,從而恢復所述基板管理控制器與所述中板、所述整機柜管理單元之間的通訊。
可選地,所述通訊狀態(tài)為智能平臺管理總線的通訊狀態(tài)。
可選地,所述中板根據(jù)所述重啟指令控制所述基板管理控制器進行重啟,具體包括:
所述中板根據(jù)所述重啟指令通過操作所述基板管理控制器的通用輸入輸出管腳來控制所述基板管理控制器進行重啟。
一種通訊自動恢復裝置,包括:
接收單元,用于接收中板上報的整機柜管理單元與基板管理控制器之間的通訊狀態(tài);
第一判斷單元,用于判斷所述通訊狀態(tài)是否處于故障狀態(tài);
第二判斷單元,用于當所述通訊狀態(tài)處于故障狀態(tài)時,判斷持續(xù)處于所述故障狀態(tài)的時間是否超過第一預設時長,
控制單元,用于當持續(xù)處于故障狀態(tài)的時間超過第一預設時長時,控制所述基板管理控制器進行重啟,從而恢復所述基板管理控制器與所述中板、所述整機柜管理單元之間的通訊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州云海信息技術有限公司,未經(jīng)鄭州云海信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811339485.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 實時公交信息Web發(fā)布系統(tǒng)
- 一種電網(wǎng)運行狀態(tài)實時診斷方法及系統(tǒng)
- 一種仿真模擬方法及供配電仿真模擬系統(tǒng)
- 一種混流泵在線綜合監(jiān)測方法及裝置
- 一種基于實時數(shù)據(jù)反饋的能源供應控制系統(tǒng)及方法
- 終端電動機的數(shù)據(jù)采集分析方法以及實時分析系統(tǒng)
- 一種真空泵的預測維護系統(tǒng)及方法及真空泵自動采購系統(tǒng)
- 一種基于物聯(lián)網(wǎng)的模具實時運行監(jiān)測系統(tǒng)及其工作方法
- 一種嵌入式軟件實時運行狀態(tài)監(jiān)控方法
- 一種用于船舶實時監(jiān)測系統(tǒng)的嵌入式計算方法





