[發(fā)明專利]一種高可用集群檢測方法、系統(tǒng)及受控終端有效
| 申請?zhí)枺?/td> | 201911281240.2 | 申請日: | 2019-12-13 |
| 公開(公告)號: | CN110912780B | 公開(公告)日: | 2021-08-27 |
| 發(fā)明(設(shè)計)人: | 過育紅;朱正東;仇大玉;張銀濱 | 申請(專利權(quán))人: | 華云數(shù)據(jù)控股集團(tuán)有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L12/721;H04L12/931;H04L12/947;H04L29/08 |
| 代理公司: | 蘇州友佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32351 | 代理人: | 儲振 |
| 地址: | 214000 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 可用 集群 檢測 方法 系統(tǒng) 受控 終端 | ||
本發(fā)明提供了一種高可用集群檢測方法,以及基于該方法的一種高可用集群檢測系統(tǒng)及受控終端,該高可用集群檢測方法,對配置keepalived的主節(jié)點(diǎn)與從節(jié)點(diǎn)基于VRRP協(xié)議進(jìn)行心跳檢測,在主節(jié)點(diǎn)及從節(jié)點(diǎn)與第二交換機(jī)之間建立進(jìn)行健康檢查的第一通道,在主節(jié)點(diǎn)及從節(jié)點(diǎn)與第三交換機(jī)之間建立進(jìn)行健康檢查的第二通道,僅在第一通道與第二通道同時觸發(fā)重新選定主節(jié)點(diǎn)策略時,將從節(jié)點(diǎn)選舉為新的主節(jié)點(diǎn)。通過本申請所揭示的一種高可用集群檢測方法、高可用集群檢測系統(tǒng),顯著地改善了現(xiàn)有的主從節(jié)點(diǎn)之間的keepalived心跳檢測機(jī)制,避免了因主節(jié)點(diǎn)由于業(yè)務(wù)繁忙或者檢測超時等非實質(zhì)性宕機(jī)所引發(fā)的主從切換現(xiàn)象,確保了高可用集群的可靠性與服務(wù)的高可用性。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及一種高可用集群檢測方法、系統(tǒng)及受控終端。
背景技術(shù)
隨著互聯(lián)網(wǎng)的快速發(fā)展,用戶的業(yè)務(wù)量的不斷增加,對業(yè)務(wù)的可靠性和性能要求越來越高。為滿足用戶的需求,在實際的應(yīng)用環(huán)境中往往會采用HA(High Availability)集群來實現(xiàn)業(yè)務(wù)的處理。在高可用集群中,需要各節(jié)點(diǎn)之間協(xié)同一致來保證集群對業(yè)務(wù)處理的有效性。如果集群中某個節(jié)點(diǎn)出現(xiàn)問題,就會影響到整個集群的工作性能,因此需要集群具有能夠快速對問題節(jié)點(diǎn)進(jìn)行處理的功能,從而保證集群的可靠性和對業(yè)務(wù)處理的有效性。
在高可用集群中通常包含一個主節(jié)點(diǎn)(Master)和多個從節(jié)點(diǎn)(Backup),主節(jié)點(diǎn)與多個從節(jié)點(diǎn)之間通常基于Keepalived及Haproxy的組合,以確保集群的高可用性能。Keepalived是以VRRP協(xié)議(虛擬路由冗余協(xié)議)為基礎(chǔ)實現(xiàn)的。主節(jié)點(diǎn)與各從節(jié)點(diǎn)之間通過心跳機(jī)制維持狀態(tài)。當(dāng)從節(jié)點(diǎn)無法接收到主節(jié)點(diǎn)發(fā)送的VRRP控制報文時,則認(rèn)為主節(jié)點(diǎn)已經(jīng)宕機(jī)。在此場景中則根據(jù)VRRP協(xié)議的優(yōu)先級從多個從節(jié)點(diǎn)中選舉出一個從節(jié)點(diǎn)并作為新的主節(jié)點(diǎn)。新的主節(jié)點(diǎn)啟動資源管理模塊以接管原來的主節(jié)點(diǎn)上運(yùn)行的資源、服務(wù)或者進(jìn)程。
目前,對主從節(jié)點(diǎn)之間進(jìn)行心跳檢測的現(xiàn)有技術(shù)中,檢測不到主節(jié)點(diǎn)的心跳的原因并非是主節(jié)點(diǎn)已經(jīng)宕機(jī),也存在主節(jié)點(diǎn)因主節(jié)點(diǎn)繁忙或者檢測超時等諸多原因。如果一旦檢測不到主節(jié)點(diǎn)的心跳就盲目的切換主節(jié)點(diǎn),則會導(dǎo)致出現(xiàn)腦裂現(xiàn)象。腦裂(split-brain)是指在一個高可用(High Availability,HA)系統(tǒng)中,當(dāng)聯(lián)系著的兩個節(jié)點(diǎn)斷開聯(lián)系時,本來為一個整體的系統(tǒng),分裂為兩個獨(dú)立節(jié)點(diǎn),這時兩個節(jié)點(diǎn)開始爭搶共享資源,從而導(dǎo)致系統(tǒng)混亂、數(shù)據(jù)損壞的現(xiàn)象。
同時,公開號為CN109286525A的中國發(fā)明專利公開了一種基于MQTT通訊和主備之間心跳的雙機(jī)備份方法。但是上述基于MQTT協(xié)議的心跳檢測的現(xiàn)有技術(shù)存在以下缺陷:(1)MQTT協(xié)議沒有齊備的SDK,不同的異構(gòu)終端,需要有對應(yīng)的與MQTT服務(wù)器通信的軟件SDK包;(2)MQTT協(xié)議不支持負(fù)載均衡,無法有效防止高并發(fā)和惡意攻擊;(3)不支持用戶管理接口、不支持點(diǎn)對點(diǎn)通信、不支持群通信和群管理、不支持離線消息;(4)由于需要配置MQTT服務(wù)器,因此不僅增加了集群在拓?fù)溥壿嬌系膹?fù)雜性,增加了集群搭建成本,也增加了后期對集群維護(hù)的難度。
有鑒于此,有必要對現(xiàn)有技術(shù)中的對高可用集群的檢測方法等諸多方面予以改進(jìn),以解決上述問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于揭示一種高可用集群檢測方法、系統(tǒng)及受控終端,用以解決現(xiàn)有技術(shù)所存在的缺陷,尤其是為了解決基于傳統(tǒng)的keepalived心跳檢測機(jī)制中由于主節(jié)點(diǎn)因業(yè)務(wù)繁忙或者檢測超時等非實質(zhì)性宕機(jī)所引發(fā)的主從切換現(xiàn)象,解決由此所導(dǎo)致的整個集群中發(fā)生腦裂的技術(shù)問題,確保高可用集群的可靠性與服務(wù)的高可用性。
為實現(xiàn)上述一個發(fā)明目的,本申請首先提供了一種高可用集群檢測方法,
對配置keepalived的主節(jié)點(diǎn)與從節(jié)點(diǎn)基于VRRP協(xié)議進(jìn)行心跳檢測,
在主節(jié)點(diǎn)及從節(jié)點(diǎn)與第二交換機(jī)之間建立進(jìn)行健康檢查的第一通道,在主節(jié)點(diǎn)及從節(jié)點(diǎn)與第三交換機(jī)之間建立進(jìn)行健康檢查的第二通道,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華云數(shù)據(jù)控股集團(tuán)有限公司,未經(jīng)華云數(shù)據(jù)控股集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911281240.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時維持有效性
- 與集群調(diào)度系統(tǒng)進(jìn)行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點(diǎn)和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計算機(jī)介質(zhì)
- 混合云場景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓?fù)涓路椒ā⑾到y(tǒng)、設(shè)備及計算機(jī)存儲介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲介質(zhì)





