[發(fā)明專利]Kubernetes故障排除系統(tǒng)、方法、設備及介質(zhì)有效
| 申請?zhí)枺?/td> | 201811382314.7 | 申請日: | 2018-11-20 |
| 公開(公告)號: | CN109558260B | 公開(公告)日: | 2022-06-07 |
| 發(fā)明(設計)人: | 馬殿軍 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿(mào)易有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07;G06F11/14;G06F9/455 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;羅朗 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | kubernetes 故障 排除 系統(tǒng) 方法 設備 介質(zhì) | ||
本發(fā)明公開了一種基于Kubernetes的容器故障排除系統(tǒng)、方法、設備及介質(zhì),其中基于Kubernetes的容器故障排除系統(tǒng)包括驅(qū)逐組件、管理控制模塊、調(diào)度模塊、服務接口模塊和若干節(jié)點,若干所述節(jié)點中包括第一節(jié)點,第一節(jié)點上運行有第一容器和第一管理容器進程。本發(fā)明通過驅(qū)逐組件驅(qū)逐無法正常運行的容器以一定概率被調(diào)度到其他節(jié)點上,以被重新調(diào)度,避免無法正常運行的容器在同一個節(jié)點上反復重啟也不能運行的問題,因為基于Kubernetes中每個節(jié)點被選擇的概率相同,所以重新調(diào)度的策略在一定概率上保證重新生成的第二容器被調(diào)度到其他節(jié)點上,集群中節(jié)點數(shù)量越多,第二容器被調(diào)度到其他節(jié)點的概率越大。
技術領域
本發(fā)明涉及計算機技術,尤其涉及一種基于Kubernetes(由谷歌開發(fā)的開源的容器集群編排和管理系統(tǒng))的容器故障排除系統(tǒng)、方法、設備及介質(zhì)。
背景技術
Kubernetes是一種容器集群編排和管理的分布式系統(tǒng),它將容器調(diào)度并運行在分布式系統(tǒng)的多個節(jié)點上。當容器由于異常問題導致無法正常運行時,Kubernetes會反復重啟容器,直到容器可以正常運行為止,但如果是由于物理機自身的問題,比如網(wǎng)絡故障、硬盤故障等導致容器無法運行,即使Kubernetes在同一個節(jié)點上反復重啟容器。由于容器運行所依賴的外部環(huán)境并沒有改變,容器也不會啟動成功,由此會影響Kubernetes的性能。
發(fā)明內(nèi)容
本發(fā)明要解決的技術問題是為了克服現(xiàn)有技術中基于Kubernetes由于物理機自身的問題使得容器不能正常運行的缺陷,提供一種基于Kubernetes的容器故障排除系統(tǒng)、方法、設備及介質(zhì)。
本發(fā)明是通過下述技術方案來解決上述技術問題:
一種基于Kubernetes的容器故障排除系統(tǒng),所述基于Kubernetes的容器故障排除系統(tǒng)包括驅(qū)逐組件、管理控制模塊、調(diào)度模塊、服務接口模塊和若干節(jié)點,若干所述節(jié)點中包括第一節(jié)點,所述第一節(jié)點上運行有第一容器和第一管理容器進程;
當所述第一容器運行失敗時,所述第一管理容器進程用于對應生成運行失敗信息,并發(fā)送所述運行失敗信息至所述服務接口模塊,所述服務接口模塊用于接收所述運行失敗信息,所述驅(qū)逐組件用于讀取所述服務接口模塊并得到所述運行失敗信息,還用于生成驅(qū)逐請求以及發(fā)送所述驅(qū)逐請求至所述服務接口模塊,所述服務接口模塊用于接收所述驅(qū)逐請求,所述第一管理容器進程用于監(jiān)聽所述服務接口模塊并得到所述驅(qū)逐請求以及刪除所述第一容器,并生成刪除狀態(tài)信息,以及發(fā)送所述刪除狀態(tài)信息至所述服務接口模塊,所述管理控制模塊用于監(jiān)聽所述服務接口模塊并得到所述刪除狀態(tài)信息,還用于復制所述第一容器得到第二容器,并將所述第二容器發(fā)送至所述服務接口模塊,所述調(diào)度模塊用于監(jiān)聽所述服務接口模塊得到所述第二容器,并將所述第二容器與若干所述節(jié)點中的任意一個綁定,綁定的節(jié)點為第二節(jié)點,所述第二節(jié)點上對應運行有第二管理容器進程,所述調(diào)度模塊還用于生成綁定狀態(tài)以及發(fā)送所述綁定狀態(tài)至所述服務接口模塊,所述服務接口模塊用于接收所述綁定狀態(tài),所述第二管理容器進程用于監(jiān)聽所述服務接口模塊得到所述綁定狀態(tài),并運行所述第二容器。
較佳地,所述驅(qū)逐組件用于定期讀取所述服務接口模塊,并判斷是否得到所述運行失敗信息,若是,則生成所述驅(qū)逐請求。
較佳地,所述管理控制模塊還用于設置所述第二容器的屬性為綁定至若干所述節(jié)點中除所述第一節(jié)點之外的其他任意一個節(jié)點;所述調(diào)度模塊還用于根據(jù)所述屬性將所述第二容器與若干所述節(jié)點中除第一節(jié)點之外的其他任意一個節(jié)點綁定。
較佳地,所述第一容器包括運行狀態(tài),所述運行狀態(tài)包括調(diào)度字段、初始化字段和就緒字段,所述調(diào)度字段用于標記對應的所述第一容器的調(diào)度是否成功,所述第一容器還包括初始化容器和常規(guī)容器,所述初始化字段用于標記所述初始化容器是否運行成功,所述就緒字段用于標記所述常規(guī)容器是否運行成功;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術有限公司;北京京東世紀貿(mào)易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811382314.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于Kubernetes的IMS系統(tǒng)
- 一種部署Kubernetes集群的方法、裝置和存儲介質(zhì)
- 部署Kubernetes集群的方法及裝置
- 一種Dubbo服務與Kubernetes系統(tǒng)集成的方法
- 一種基于OpenStack的Kubernetes集群搭建部署方法、架構及存儲介質(zhì)
- 基于Kubernetes集群的服務訪問方法、裝置、設備及存儲介質(zhì)
- 一種Kubernetes容器云平臺應用導入方法、系統(tǒng)
- 基于物理網(wǎng)卡的kubernetes網(wǎng)絡實現(xiàn)方法、系統(tǒng)、設備及介質(zhì)
- 多Kubernetes集群管理方法、裝置和可讀介質(zhì)
- Kubernetes上部署Kubernetes虛擬機集群的方法與系統(tǒng)





