[發(fā)明專(zhuān)利]一種基于RMC管理的自動(dòng)BMC故障解決方法在審
| 申請(qǐng)?zhí)枺?/td> | 201510074261.2 | 申請(qǐng)日: | 2015-02-12 |
| 公開(kāi)(公告)號(hào): | CN104598329A | 公開(kāi)(公告)日: | 2015-05-06 |
| 發(fā)明(設(shè)計(jì))人: | 穆德學(xué) | 申請(qǐng)(專(zhuān)利權(quán))人: | 浪潮電子信息產(chǎn)業(yè)股份有限公司 |
| 主分類(lèi)號(hào): | G06F11/07 | 分類(lèi)號(hào): | G06F11/07 |
| 代理公司: | 濟(jì)南信達(dá)專(zhuān)利事務(wù)所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250101 山東*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 rmc 管理 自動(dòng) bmc 故障 解決方法 | ||
技術(shù)領(lǐng)域
本發(fā)明公開(kāi)一種BMC故障解決方法,屬于計(jì)算機(jī)性能管理領(lǐng)域,具體地說(shuō)是一種基于RMC管理的自動(dòng)BMC故障解決方法。
背景技術(shù)
管理主板RMC,是大型服務(wù)器Smart?Rack的管理中心,負(fù)責(zé)系統(tǒng)內(nèi)節(jié)點(diǎn)管理、電源管理、風(fēng)扇管理。管理系統(tǒng)由RMC,其實(shí)現(xiàn)系統(tǒng)的監(jiān)控、管理、告警;節(jié)點(diǎn)中板,其實(shí)現(xiàn)所有節(jié)點(diǎn)的帶外監(jiān)控、二級(jí)管理、告警上報(bào)、風(fēng)扇監(jiān)控;節(jié)點(diǎn)BMC,其集成在各個(gè)節(jié)點(diǎn)上,負(fù)責(zé)子系統(tǒng)級(jí)的狀態(tài)實(shí)時(shí)監(jiān)控、故障診斷、功耗檢測(cè)等;以及管理網(wǎng)絡(luò)等組成。其中BMC負(fù)責(zé)節(jié)點(diǎn)資產(chǎn)管理、實(shí)時(shí)監(jiān)控,故障診斷。鑒于BMC在各節(jié)點(diǎn)的作用,如果BMC出現(xiàn)故障,服務(wù)器產(chǎn)品基本要求即可持續(xù)運(yùn)行就會(huì)受到影響,而當(dāng)BMC出現(xiàn)故障時(shí),需要通過(guò)手動(dòng)進(jìn)行一些措施及時(shí)進(jìn)行故障排除和恢復(fù),以保障服務(wù)器的持續(xù)運(yùn)行,但這樣消耗時(shí)間及人力,并且服務(wù)器單顆粒BIOS、BMC設(shè)計(jì)在BIOS、BMC升級(jí)維護(hù)時(shí),也存在需要停止服務(wù)然后才能升級(jí)的問(wèn)題。而本發(fā)明提供一種基于RMC管理的自動(dòng)BMC故障解決方法,通過(guò)RMC實(shí)現(xiàn)系統(tǒng)自動(dòng)判斷BMC故障情況及排除故障恢復(fù)的方法,無(wú)需手動(dòng),有效的滿足了服務(wù)器需及時(shí)進(jìn)行BMC故障判斷、排除和恢復(fù)的需求。
其中,BMC:Baseboard?Management?Controller,基板管理控制器,是一個(gè)專(zhuān)門(mén)的服務(wù)處理機(jī),它利用傳感器來(lái)監(jiān)控一臺(tái)計(jì)算機(jī),網(wǎng)絡(luò)服務(wù)器,或者是其他硬件驅(qū)動(dòng)設(shè)備的狀態(tài),并且通過(guò)獨(dú)立的連接線路和系統(tǒng)管理員進(jìn)行通信。BMC的傳感器用來(lái)測(cè)量?jī)?nèi)部物理變量,例如:溫度,濕度,電源電壓,風(fēng)扇速度,通信參數(shù)和操作系統(tǒng)函數(shù),如果這些變量中任何一個(gè)超出了指定限制的范圍之外,他就會(huì)通知管理員,管理員就會(huì)利用遠(yuǎn)程控制來(lái)采取正確的措施。監(jiān)控設(shè)備可以動(dòng)力循環(huán)或者當(dāng)必要的時(shí)候重新啟動(dòng),這樣,單一的管理員就可以同時(shí)遠(yuǎn)程控制無(wú)數(shù)個(gè)服務(wù)器和其他設(shè)備,節(jié)省了網(wǎng)絡(luò)的總體成本,并且可以確保可靠性。功能:本地和遠(yuǎn)程診斷、控制臺(tái)支持,配置管理,硬件管理和故障排除。
發(fā)明內(nèi)容
本發(fā)明針對(duì)BMC出現(xiàn)故障時(shí),需要通過(guò)手動(dòng)進(jìn)行一些措施及時(shí)進(jìn)行故障排除和恢復(fù),以保障服務(wù)器的持續(xù)運(yùn)行,但這樣消耗時(shí)間及人力,并且服務(wù)器單顆粒BIOS、BMC設(shè)計(jì)在BIOS、BMC升級(jí)維護(hù)時(shí),也存在需要停止服務(wù)然后才能升級(jí)的問(wèn)題,提供一種基于RMC管理的自動(dòng)BMC故障解決方法,適用于RACK類(lèi)服務(wù)器,通過(guò)RMC實(shí)現(xiàn)系統(tǒng)自動(dòng)判斷BMC故障情況及排除故障恢復(fù)的方法,無(wú)需手動(dòng),有效的滿足了服務(wù)器需及時(shí)進(jìn)行BMC故障判斷、排除和恢復(fù)的需求。
本發(fā)明提出的具體方案是:
一種基于RMC管理的自動(dòng)BMC故障解決方法,適用于RACK類(lèi)服務(wù)器,其具體步驟為:
①服務(wù)器系統(tǒng)中包括RMC,IPMB,節(jié)點(diǎn)中板,BMC;RMC對(duì)BMC運(yùn)行狀態(tài)進(jìn)行監(jiān)測(cè),BMC運(yùn)行正常,則保持監(jiān)測(cè)狀態(tài),若監(jiān)測(cè)到BMC故障時(shí),再次認(rèn)證BMC狀態(tài)是否為發(fā)生故障,若確認(rèn)BMC發(fā)生故障,則RMC主動(dòng)完成BMC重啟動(dòng)作,否則保持監(jiān)測(cè)狀態(tài);
②若確認(rèn)BMC發(fā)生故障,RMC主動(dòng)完成BMC重啟后,RMC監(jiān)測(cè)到BMC運(yùn)行正常則繼續(xù)保持監(jiān)測(cè)狀態(tài);若RMC主動(dòng)完成BMC重啟后BMC故障依然存在,則通知系統(tǒng)告知用戶BMC故障并提示通過(guò)硬件重啟的方式進(jìn)行解決。
所述的服務(wù)器系統(tǒng)采用了二級(jí)管理的方式,RMC為第一級(jí)管理,節(jié)點(diǎn)中板為第二級(jí)管理。
所述的RMC通過(guò)I2C總線與節(jié)點(diǎn)中板通信,對(duì)節(jié)點(diǎn)中板的監(jiān)測(cè)、控制;節(jié)點(diǎn)中板通過(guò)I2C/IPMB與各節(jié)點(diǎn)的BMC及二級(jí)電源板、供電轉(zhuǎn)接板、風(fēng)扇控制板互聯(lián)。RMC通過(guò)I2C與節(jié)點(diǎn)中板通信,通過(guò)對(duì)節(jié)點(diǎn)中板的監(jiān)測(cè)、控制實(shí)現(xiàn)整個(gè)系統(tǒng)的監(jiān)控、管理。節(jié)點(diǎn)中板通過(guò)I2C/IPMB與各節(jié)點(diǎn)的BMC及二級(jí)電源板、供電轉(zhuǎn)接板、風(fēng)扇控制板互聯(lián),實(shí)現(xiàn)對(duì)整個(gè)系統(tǒng)的帶外的實(shí)時(shí)監(jiān)控、管理功能。
所述的RMC主要管理包括基于IPMB規(guī)范的節(jié)點(diǎn)帶外情況,基于PMBUS協(xié)議的AC/DC電源情況、基于I2C的風(fēng)扇轉(zhuǎn)速調(diào)節(jié)和風(fēng)量補(bǔ)償調(diào)節(jié)的情況。
所述的BMC通過(guò)多路I2C總線與各節(jié)點(diǎn)內(nèi)部的被監(jiān)控芯片、部件相連。
本發(fā)明的有益之處是:本發(fā)明提供一種基于RMC管理的自動(dòng)BMC故障解決方法,適用于RACK類(lèi)服務(wù)器,通過(guò)RMC實(shí)現(xiàn)系統(tǒng)自動(dòng)判斷BMC故障和排除恢復(fù)的方法,更合理和有效的解決了BMC故障技術(shù)問(wèn)題,有效的滿足了服務(wù)器需及時(shí)進(jìn)行BMC故障判斷、排除和恢復(fù)的需求,提高現(xiàn)有RACK類(lèi)服務(wù)器的安全。
附圖說(shuō)明
圖1本發(fā)明的流程示意圖。
具體實(shí)施方式
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于浪潮電子信息產(chǎn)業(yè)股份有限公司;,未經(jīng)浪潮電子信息產(chǎn)業(yè)股份有限公司;許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510074261.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 基于選擇存儲(chǔ)單元與基準(zhǔn)單元的電阻差讀出數(shù)據(jù)的存儲(chǔ)器
- 一種主要基于expect工具的RMC軟件的自動(dòng)化測(cè)試的方法
- 一種高端容錯(cuò)服務(wù)器的電源故障記錄方法
- 一種智能機(jī)柜RMC和MP批量刷新方法
- 一種刷新電源供給單元固件的方法、裝置及系統(tǒng)
- 一種實(shí)時(shí)監(jiān)測(cè)RACK機(jī)柜電源的方法
- 一種Rack機(jī)柜批量RMC自動(dòng)配置整機(jī)部件布局的方法及系統(tǒng)
- 一種針對(duì)RACK 3.0機(jī)柜的整機(jī)監(jiān)控管理方法、系統(tǒng)及設(shè)備
- 一種雙芯片RMC
- 增強(qiáng)Rack機(jī)柜RMC固件升級(jí)穩(wěn)定性的方法及系統(tǒng)
- 一種城市智能管理系統(tǒng)
- 一種用于裝飾材料的電子商務(wù)供應(yīng)鏈管理系統(tǒng)
- 一種旅游智能管理系統(tǒng)
- 一種塑編企業(yè)專(zhuān)用管理系統(tǒng)
- 適用于教育系統(tǒng)學(xué)生移動(dòng)終端的分級(jí)管控平臺(tái)
- 一種用于高校的信息管理系統(tǒng)
- 一種用于醫(yī)院的信息管理系統(tǒng)
- 一種智能樓宇管理系統(tǒng)及其平臺(tái)管理、招租管理操作方法
- 一種教育培訓(xùn)運(yùn)營(yíng)支撐系統(tǒng)
- 一種基于多系統(tǒng)集成的倉(cāng)儲(chǔ)物流管理系統(tǒng)





