[發(fā)明專利]基于BMC的Kubernetes集群物理節(jié)點(diǎn)的故障處理方法和系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202111539751.7 | 申請(qǐng)日: | 2021-12-15 |
| 公開(kāi)(公告)號(hào): | CN114218004A | 公開(kāi)(公告)日: | 2022-03-22 |
| 發(fā)明(設(shè)計(jì))人: | 潘遠(yuǎn)航;徐俊杰;顏開(kāi);郭峰;陳齊彥 | 申請(qǐng)(專利權(quán))人: | 上海道客網(wǎng)絡(luò)科技有限公司 |
| 主分類號(hào): | G06F11/07 | 分類號(hào): | G06F11/07;G06F11/30 |
| 代理公司: | 北京五洲洋和知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11387 | 代理人: | 劉素霞;劉春成 |
| 地址: | 200433 上海市*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 bmc kubernetes 集群 物理 節(jié)點(diǎn) 故障 處理 方法 系統(tǒng) | ||
1.一種基于BMC的Kubernetes集群物理節(jié)點(diǎn)的故障處理方法,其特征在于,包括:
從物理節(jié)點(diǎn)上設(shè)置的BMC中獲取所述物理節(jié)點(diǎn)的第一狀態(tài)信息;其中,所述第一狀態(tài)信息表征所述物理節(jié)點(diǎn)的硬件運(yùn)行狀態(tài)和操作系統(tǒng)運(yùn)行狀態(tài);
根據(jù)所述第一狀態(tài)信息,基于預(yù)設(shè)的自定義控制策略,對(duì)存在風(fēng)險(xiǎn)或者故障的所述物理節(jié)點(diǎn)進(jìn)行處理。
2.根據(jù)權(quán)利要求1所述的基于BMC的Kubernetes集群物理節(jié)點(diǎn)的故障處理方法,其特征在于,所述從物理節(jié)點(diǎn)上設(shè)置的BMC中獲取所述物理節(jié)點(diǎn)的第一狀態(tài)信息,具體為:
對(duì)所述物理節(jié)點(diǎn)上設(shè)置的BMC進(jìn)行注冊(cè),建立基于監(jiān)控協(xié)議的通訊連接,以按照預(yù)設(shè)監(jiān)控周期訪問(wèn)所述物理節(jié)點(diǎn)上的已注冊(cè)的BMC,獲取所述物理節(jié)點(diǎn)的第一狀態(tài)信息。
3.根據(jù)權(quán)利要求1所述的基于BMC的Kubernetes集群物理節(jié)點(diǎn)的故障處理方法,其特征在于,根據(jù)所述第一狀態(tài)信息,基于預(yù)設(shè)的自定義控制策略,對(duì)存在風(fēng)險(xiǎn)或者故障的所述物理節(jié)點(diǎn)進(jìn)行處理,包括:
根據(jù)所述第一狀態(tài)信息,判定所述物理節(jié)點(diǎn)存在風(fēng)險(xiǎn)或者故障的類型;
根據(jù)所述風(fēng)險(xiǎn)或者故障的類型,基于預(yù)設(shè)的所述自定義控制策略,對(duì)所述物理節(jié)點(diǎn)進(jìn)行處理。
4.根據(jù)權(quán)利要求3所述的基于BMC的Kubernetes集群物理節(jié)點(diǎn)的故障處理方法,其特征在于,所述根據(jù)所述第一狀態(tài)信息,判定所述物理節(jié)點(diǎn)存在風(fēng)險(xiǎn)或者故障的類型,包括:
在預(yù)設(shè)周期內(nèi)未收到部署在所述物理節(jié)點(diǎn)上的Kubelet組件上報(bào)的所述物理節(jié)點(diǎn)的第二狀態(tài)信息時(shí),根據(jù)所述第一狀態(tài)信息表征的所述物理節(jié)點(diǎn)的硬件運(yùn)行狀態(tài)和操作系統(tǒng)運(yùn)行狀態(tài),判定所述物理節(jié)點(diǎn)存在宕機(jī)故障;其中,所述第二狀態(tài)信息表征所述物理節(jié)點(diǎn)上的節(jié)點(diǎn)運(yùn)行狀態(tài)和容器運(yùn)行狀態(tài)。
5.根據(jù)權(quán)利要求4所述的基于BMC的Kubernetes集群物理節(jié)點(diǎn)的故障處理方法,其特征在于,在所述根據(jù)所述第一狀態(tài)信息表征的所述物理節(jié)點(diǎn)的硬件運(yùn)行狀態(tài)和操作系統(tǒng)運(yùn)行狀態(tài),判定所述物理節(jié)點(diǎn)存在宕機(jī)故障之后,還包括:
從所述物理節(jié)點(diǎn)上設(shè)置的BMC中獲取所述物理節(jié)點(diǎn)的運(yùn)行日志信息;
對(duì)所述物理節(jié)點(diǎn)的運(yùn)行日志信息進(jìn)行分析,以確定所述物理節(jié)點(diǎn)發(fā)生宕機(jī)故障的原因;
根據(jù)所述物理節(jié)點(diǎn)發(fā)生宕機(jī)故障的原因,指示所述物理節(jié)點(diǎn)上設(shè)置的BMC對(duì)所述物理節(jié)點(diǎn)進(jìn)行重啟操作。
6.根據(jù)權(quán)利要求3所述的基于BMC的Kubernetes集群物理節(jié)點(diǎn)的故障處理方法,其特征在于,所述根據(jù)所述第一狀態(tài)信息,判定所述物理節(jié)點(diǎn)存在風(fēng)險(xiǎn)或者故障的類型,包括:
對(duì)所述第一狀態(tài)信息進(jìn)行分析,以評(píng)估部署在所述物理節(jié)點(diǎn)上的應(yīng)用因所述物理節(jié)點(diǎn)存在風(fēng)險(xiǎn)或者故障所受到的影響;
根據(jù)部署在所述物理節(jié)點(diǎn)上的應(yīng)用所受到的影響,劃分所述物理節(jié)點(diǎn)存在風(fēng)險(xiǎn)或者故障的類型。
7.根據(jù)權(quán)利要求3或6所述的基于BMC的Kubernetes集群物理節(jié)點(diǎn)的故障處理方法,其特征在于,所述根據(jù)所述風(fēng)險(xiǎn)或者故障的類型,基于預(yù)設(shè)的所述自定義控制策略,對(duì)所述物理節(jié)點(diǎn)進(jìn)行處理,具體為:
對(duì)存在風(fēng)險(xiǎn)的所述物理節(jié)點(diǎn)標(biāo)注風(fēng)險(xiǎn)標(biāo)簽;其中,所述風(fēng)險(xiǎn)標(biāo)簽包括多個(gè)等級(jí),所述風(fēng)險(xiǎn)標(biāo)簽的等級(jí)與所述風(fēng)險(xiǎn)的類型相關(guān);或者,
對(duì)存在故障的所述物理節(jié)點(diǎn)標(biāo)注故障標(biāo)簽;其中,所述故障標(biāo)簽包括多個(gè)類別,所述故障標(biāo)簽的類別與所述故障的類型相關(guān)。
8.一種基于BMC的Kubernetes集群物理節(jié)點(diǎn)的故障處理系統(tǒng),其特征在于,包括:
信息獲取單元,配置為從物理節(jié)點(diǎn)上設(shè)置的BMC中獲取所述物理節(jié)點(diǎn)的第一狀態(tài)信息;其中,所述第一狀態(tài)信息表征所述物理節(jié)點(diǎn)的硬件運(yùn)行狀態(tài)和操作系統(tǒng)運(yùn)行狀態(tài);
策略執(zhí)行單元,配置為根據(jù)所述第一狀態(tài)信息,基于預(yù)設(shè)的自定義控制策略,對(duì)存在風(fēng)險(xiǎn)或者故障的所述物理節(jié)點(diǎn)進(jìn)行處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海道客網(wǎng)絡(luò)科技有限公司,未經(jīng)上海道客網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111539751.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 多主板服務(wù)器主基板管理控制器仲裁方法及系統(tǒng)
- 一種基于邏輯控制的BIOS和BMC備份方法
- 一種單臺(tái)、批量服務(wù)器BMC的遠(yuǎn)程刷新方法及系統(tǒng)
- 一種系統(tǒng)管理方法和裝置
- 一種BMC固件更新方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種BMC參數(shù)配置方法、裝置、設(shè)備、介質(zhì)
- 一種服務(wù)器BMC刷新方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)
- 一種BMC啟動(dòng)方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種主板的雙BMC管理系統(tǒng)
- 一種BMC固件升級(jí)方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種基于Kubernetes的IMS系統(tǒng)
- 一種部署Kubernetes集群的方法、裝置和存儲(chǔ)介質(zhì)
- 部署Kubernetes集群的方法及裝置
- 一種Dubbo服務(wù)與Kubernetes系統(tǒng)集成的方法
- 一種基于OpenStack的Kubernetes集群搭建部署方法、架構(gòu)及存儲(chǔ)介質(zhì)
- 基于Kubernetes集群的服務(wù)訪問(wèn)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種Kubernetes容器云平臺(tái)應(yīng)用導(dǎo)入方法、系統(tǒng)
- 基于物理網(wǎng)卡的kubernetes網(wǎng)絡(luò)實(shí)現(xiàn)方法、系統(tǒng)、設(shè)備及介質(zhì)
- 多Kubernetes集群管理方法、裝置和可讀介質(zhì)
- Kubernetes上部署Kubernetes虛擬機(jī)集群的方法與系統(tǒng)
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時(shí)維持有效性
- 與集群調(diào)度系統(tǒng)進(jìn)行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺(tái)多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點(diǎn)和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)介質(zhì)
- 混合云場(chǎng)景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓?fù)涓路椒ā⑾到y(tǒng)、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)





