[發(fā)明專利]一種kubernetes節(jié)點(diǎn)自愈方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011363102.1 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112328372A | 公開(公告)日: | 2021-02-05 |
| 發(fā)明(設(shè)計(jì))人: | 王紹楠 | 申請(專利權(quán))人: | 新華智云科技有限公司 |
| 主分類號: | G06F9/455 | 分類號: | G06F9/455 |
| 代理公司: | 杭州裕陽聯(lián)合專利代理有限公司 33289 | 代理人: | 田金霞 |
| 地址: | 310012 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 kubernetes 節(jié)點(diǎn) 自愈 方法 系統(tǒng) | ||
本發(fā)明公開了一種kubernetes節(jié)點(diǎn)自愈方法和系統(tǒng),所述方法包括:建立控制平面中的節(jié)點(diǎn)自愈控制器,建立數(shù)據(jù)平面內(nèi)的監(jiān)控代理,所述監(jiān)控代理和節(jié)點(diǎn)自愈控制器通訊連接;監(jiān)控代理識別故障節(jié)點(diǎn)ID并分析節(jié)點(diǎn)故障原因,建立故障數(shù)據(jù);所述監(jiān)控代理將所述故障節(jié)點(diǎn)ID和故障數(shù)據(jù)上傳至節(jié)點(diǎn)自愈控制器;根據(jù)故障數(shù)據(jù)建立新節(jié)點(diǎn),根據(jù)故障原因?qū)⒐收瞎?jié)點(diǎn)的業(yè)務(wù)POD調(diào)度到新節(jié)點(diǎn)或正常節(jié)點(diǎn);對于由業(yè)務(wù)POD故障引起的節(jié)點(diǎn)故障,將業(yè)務(wù)故障POD調(diào)度到所述新建立的節(jié)點(diǎn);對于由非業(yè)務(wù)故障POD引起的節(jié)點(diǎn)故障,將故障節(jié)點(diǎn)刪除,讓故障節(jié)點(diǎn)上的業(yè)務(wù)POD調(diào)度到正常的節(jié)點(diǎn)。通過對兩類故障節(jié)點(diǎn)原因的識別和不同的處理方式,可有效地避免正常業(yè)務(wù)POD受到業(yè)務(wù)故障POD的影響。
技術(shù)領(lǐng)域
本發(fā)明涉及一種計(jì)算機(jī)領(lǐng)域,特別涉及一種kubernetes節(jié)點(diǎn)自愈方法和系統(tǒng)。
背景技術(shù)
Kubernetes簡稱k8s,是容器化微服務(wù)的重要工具,現(xiàn)有技術(shù)中采用namespace和cgroup技術(shù)對多個容器的資源進(jìn)行隔離和限制,然而容器中采用cgroup技術(shù)并沒有完全隔離所有的資源,比如在某些容器中使用大量的buffer IO(緩沖輸入輸出)或者inode(索引節(jié)點(diǎn))時(shí),容易導(dǎo)致容器宿主機(jī)的其他容器無法正常運(yùn)行,可能會導(dǎo)致宿主機(jī)出現(xiàn)故障或崩潰。目前對于該問題的處理方式主要是通過刪除故障節(jié)點(diǎn)或恢復(fù)故障節(jié)點(diǎn)的方式,但該處理方法時(shí)間較長,并且在節(jié)點(diǎn)業(yè)務(wù)轉(zhuǎn)移的過程中將故障業(yè)務(wù)遷移到正常節(jié)點(diǎn),影響正常節(jié)點(diǎn)的業(yè)務(wù)容器,容易發(fā)生故障蔓延的現(xiàn)象。
發(fā)明內(nèi)容
本發(fā)明其中一個發(fā)明目的在于提供一種kubernetes節(jié)點(diǎn)自愈方法和系統(tǒng),所述方法和系統(tǒng)通過建立新的節(jié)點(diǎn),將部分故障POD調(diào)度到新節(jié)點(diǎn)上,可保障正常運(yùn)行的節(jié)點(diǎn)不受影響,可提高系統(tǒng)的魯棒性。
本發(fā)明另一個發(fā)明目的在于提供一種kubernetes節(jié)點(diǎn)自愈方法和系統(tǒng),所述方法和系統(tǒng)在系統(tǒng)的數(shù)據(jù)平面建立監(jiān)控代理,用于定時(shí)監(jiān)控系統(tǒng)的控制平面中的節(jié)點(diǎn)自愈控制器,由于監(jiān)控代理和節(jié)點(diǎn)自愈控制器分別位于不同平面,因此對故障節(jié)點(diǎn)故障原因的上傳和節(jié)點(diǎn)自身的自愈相互之間無影響,提高故障節(jié)點(diǎn)的處理效率和質(zhì)量。
本發(fā)明另一個發(fā)明目的在于提供一種kubernetes節(jié)點(diǎn)自愈方法和系統(tǒng),所述的節(jié)點(diǎn)自愈控制器對故障節(jié)點(diǎn)建立故障處理隊(duì)列,通過監(jiān)控代理獲取每一故障節(jié)點(diǎn)的故障原因,分別對不同故障原因的節(jié)點(diǎn)進(jìn)行區(qū)分化處理,區(qū)分化處理包括刪除節(jié)點(diǎn)、恢復(fù)節(jié)點(diǎn)和遷移故障節(jié)點(diǎn)POD,因此在提高故障節(jié)點(diǎn)處理效率的基礎(chǔ)上提高節(jié)點(diǎn)處理的質(zhì)量。
本發(fā)明另一個發(fā)明目的在于提供一種kubernetes節(jié)點(diǎn)自愈方法和系統(tǒng),所述的節(jié)點(diǎn)自愈控制器通過k8s master將故障節(jié)點(diǎn)的原因分類為由業(yè)務(wù)POD故障引起和由非業(yè)務(wù)故障POD引起。對于由業(yè)務(wù)POD故障引起的節(jié)點(diǎn)故障,將業(yè)務(wù)故障POD驅(qū)逐到新建立的節(jié)點(diǎn)上,對于由非業(yè)務(wù)故障POD引起的節(jié)點(diǎn)故障,刪除非業(yè)務(wù)故障POD,通過對兩類故障節(jié)點(diǎn)原因的識別和不同的處理方式,可有效地避免正常POD受到業(yè)務(wù)故障POD的影響。
為了實(shí)現(xiàn)至少一個上述發(fā)明目的,本發(fā)明進(jìn)一步提供一種kubernetes節(jié)點(diǎn)自愈方法,包括:
建立控制平面中的節(jié)點(diǎn)自愈控制器,建立數(shù)據(jù)平面內(nèi)的監(jiān)控代理,所述監(jiān)控代理和節(jié)點(diǎn)自愈控制器通訊連接;
監(jiān)控代理識別故障節(jié)點(diǎn)ID并分析節(jié)點(diǎn)故障原因,建立故障數(shù)據(jù);
所述監(jiān)控代理將所述故障節(jié)點(diǎn)ID和故障數(shù)據(jù)上傳至節(jié)點(diǎn)自愈控制器;
節(jié)點(diǎn)自愈控制器根據(jù)故障數(shù)據(jù)建立新節(jié)點(diǎn),根據(jù)故障原因?qū)⒐收瞎?jié)點(diǎn)的業(yè)務(wù)POD調(diào)度到新節(jié)點(diǎn)或正常節(jié)點(diǎn)。
根據(jù)本發(fā)明其中一個較佳實(shí)施例,所述監(jiān)控代理分析故障數(shù)據(jù),其中所述監(jiān)控代理根據(jù)故障原因?qū)⑺龉收蠑?shù)據(jù)分類為業(yè)務(wù)POD故障和非業(yè)務(wù)POD故障,所述節(jié)點(diǎn)自愈控制器通過k8s master控制所述故障節(jié)點(diǎn)自愈。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于新華智云科技有限公司,未經(jīng)新華智云科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011363102.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于Kubernetes的IMS系統(tǒng)
- 一種部署Kubernetes集群的方法、裝置和存儲介質(zhì)
- 部署Kubernetes集群的方法及裝置
- 一種Dubbo服務(wù)與Kubernetes系統(tǒng)集成的方法
- 一種基于OpenStack的Kubernetes集群搭建部署方法、架構(gòu)及存儲介質(zhì)
- 基于Kubernetes集群的服務(wù)訪問方法、裝置、設(shè)備及存儲介質(zhì)
- 一種Kubernetes容器云平臺應(yīng)用導(dǎo)入方法、系統(tǒng)
- 基于物理網(wǎng)卡的kubernetes網(wǎng)絡(luò)實(shí)現(xiàn)方法、系統(tǒng)、設(shè)備及介質(zhì)
- 多Kubernetes集群管理方法、裝置和可讀介質(zhì)
- Kubernetes上部署Kubernetes虛擬機(jī)集群的方法與系統(tǒng)
- 節(jié)點(diǎn)查詢方法、節(jié)點(diǎn)、移動通訊系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品
- 一種根據(jù)節(jié)點(diǎn)集合構(gòu)造節(jié)點(diǎn)關(guān)系樹的方法、裝置及系統(tǒng)
- 一種DHT網(wǎng)絡(luò)負(fù)載均衡裝置及虛節(jié)點(diǎn)劃分的方法
- 一種無線傳感網(wǎng)地理位置路由空洞處理方法
- 節(jié)點(diǎn)鎖定部件、節(jié)點(diǎn)滑軌、節(jié)點(diǎn)和機(jī)箱
- 一種待推薦節(jié)點(diǎn)線路的確定方法及裝置
- 流控方法、目標(biāo)節(jié)點(diǎn)、節(jié)點(diǎn)及施主節(jié)點(diǎn)
- 節(jié)點(diǎn)布局確定方法以及裝置
- 一種具有分布式柔度的全柔順微位移放大機(jī)構(gòu)
- 節(jié)點(diǎn)掛載方法、裝置、網(wǎng)絡(luò)節(jié)點(diǎn)及存儲介質(zhì)





