[發(fā)明專利]一種基于高可用檢測節(jié)點的分布式系統(tǒng)節(jié)點故障檢測方法有效
【權(quán)利要求書】:
1.一種基于高可用檢測節(jié)點的分布式系統(tǒng)節(jié)點故障檢測方法,其特征在于,包括:
1)在系統(tǒng)中設(shè)置兩個以上檢測節(jié)點,其中一個為主檢測節(jié)點,其余節(jié)點為備檢測節(jié)點,用于對其他所有節(jié)點的故障檢測;多個檢測節(jié)點之間使用心跳報文進(jìn)行主檢測節(jié)點選舉和故障切換,同時心跳報文也會到達(dá)系統(tǒng)每個節(jié)點,通知每個節(jié)點當(dāng)前具體執(zhí)行檢測工作的主檢測節(jié)點的IP地址,具體為:每個檢測節(jié)點周期性的發(fā)出UDP廣播作為心跳報文,報文中包括檢測節(jié)點的節(jié)點名、IP地址、是否為主節(jié)點的信息;非檢測節(jié)點收到心跳報文 后也會執(zhí)行檢測節(jié) 點同樣的邏輯,即當(dāng)主檢測節(jié)點發(fā)生故障后,確定IP地址最小的檢測節(jié)點為主檢測節(jié)點,并獲知主檢測節(jié)點的IP地址;當(dāng)主檢測節(jié)點發(fā)生故障后,備檢測節(jié)點通過心跳報文重新確定IP地址最小的為主檢測節(jié)點,完成故障后的主檢測點切換;
2)客戶端向主檢測節(jié)點發(fā)出請求,由主檢測節(jié)點對待檢測的目標(biāo)節(jié)點進(jìn)行故障檢測;
3)主檢測節(jié)點將不同客戶端對同一個待檢測的目標(biāo)節(jié)點的檢測請求進(jìn)行合并;
4)主檢測節(jié)點接收到請求后開始周期性的對待檢測的目標(biāo)節(jié)點進(jìn)行檢測,檢測結(jié)果緩存在主檢測節(jié)點的內(nèi)存中,當(dāng)其他任意客戶端需要對同一目標(biāo)節(jié)點進(jìn)行檢測時,立刻從緩存直接返回目標(biāo)節(jié)點的實時狀態(tài)。
2.根據(jù)權(quán)利要求1所述的一種基于高可用檢測節(jié)點的分布式系統(tǒng)節(jié)點故障檢測方法,其特征在于,所述主檢測節(jié)點能夠向所有節(jié)點廣播被檢測節(jié)點的健康狀態(tài)。
3.根據(jù)權(quán)利要求1所述的一種基于高可用檢測節(jié)點的分布式系統(tǒng)節(jié)點故障檢測方法,其特征在于,所述步驟2)客戶端向主檢測節(jié)點發(fā)出請求,由主檢測節(jié)點對待檢測的目標(biāo)節(jié)點進(jìn)行故障檢測具體為:由某個節(jié)點的客戶端程序通過TCP或UDP向主檢測節(jié)點發(fā)送請求報文,報文中包括希望被檢測的目標(biāo)節(jié)點的IP地址和超時時間這兩個參數(shù),由主檢測節(jié)點向目標(biāo)節(jié)點直接發(fā)出ICMP報文,在超時時間內(nèi)得到響應(yīng)則回復(fù)客戶端該目標(biāo)節(jié)點在線,否則回復(fù)該目標(biāo)節(jié)點故障。
4.根據(jù)權(quán)利要求1所述的一種基于高可用檢測節(jié)點的分布式系統(tǒng)節(jié)點故障檢測方法,其特征在于,所述步驟3)主檢測節(jié)點將不同客戶端對同一個待檢測的目標(biāo)節(jié)點的檢測請求進(jìn)行合并具體為:
主檢測節(jié)點為每個客戶端單獨保存了目標(biāo)IP地址和超時時間參數(shù),實現(xiàn)了對不同目標(biāo)節(jié)點使用不同檢測超時時間的功能,主檢測節(jié)點在超時時間內(nèi)以均勻間隔連續(xù)發(fā)出3次ICMP報文進(jìn)行檢測,當(dāng)收到第一次回復(fù)后判定節(jié)點狀態(tài)為在線,當(dāng)多個客戶端對同一目標(biāo)節(jié)點提出檢測請求時,對其IP地址和超時時間進(jìn) 行合并處理,取最短的超時時間,并且只發(fā)出一份ICMP檢測報文。
5.根據(jù)權(quán)利要求1所述的一種基于高可用檢測節(jié)點的分布式系統(tǒng)節(jié)點故障檢測方法,其特征在于,所述步驟4)主檢測節(jié)點接收到請求后開始周期性的對目標(biāo)節(jié)點進(jìn)行檢測具體為:當(dāng)主檢測節(jié)點第一次收到對某個目標(biāo)節(jié)點的檢測請求后就以一定的周期對目標(biāo)節(jié)點發(fā)送ICMP報文進(jìn)行故障檢測,此周期可配置,當(dāng)超過一定的時間間隔沒有任何節(jié)點再請求檢測這個目標(biāo)節(jié)點,則停止周期性ICMP報文的發(fā)送,時間間隔可配置。
6.根據(jù)權(quán)利要求2所述的一種基于高可用檢測節(jié)點的分布式系統(tǒng)節(jié)點故障檢測方法,所述主檢測節(jié)點能夠向所有節(jié)點廣播被檢測節(jié)點的健康狀態(tài)具體為:主檢測節(jié)點不僅僅將檢測結(jié)果返回給客戶端,還能夠根據(jù)需求將所有被檢測節(jié)點的健康狀態(tài)以廣播發(fā)送到全系統(tǒng)的所有節(jié)點,在每個節(jié)點上設(shè)立檢測代理,由代理接收廣播后存入本地共享內(nèi)存,當(dāng)本地客戶端發(fā)出請求時,首先查詢本地共享內(nèi)存是否已經(jīng)存在結(jié)果,如果存在則直接獲取。
7.根據(jù)權(quán)利要求1所述的一種基于高可用檢測節(jié)點的分布式系統(tǒng)節(jié)點故障檢測方法,主檢測節(jié)點將已檢測過的節(jié)點的狀態(tài)信息存放在本機共享內(nèi)存,在發(fā)送心跳報文的同時也將共享內(nèi)存的信息通過組播發(fā)給其他檢測節(jié)點。
8.根據(jù)權(quán)利要求1所述的一種基于高可用檢測節(jié)點的分布式系統(tǒng)節(jié)點故障檢測方法,主檢測節(jié)點對待檢測的目標(biāo)節(jié)點進(jìn)行故障檢測時,由待檢測的目標(biāo)節(jié)點的系統(tǒng)內(nèi)核回復(fù)檢測報文。
下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國電南瑞科技股份有限公司;國家電網(wǎng)公司華北分部;國家電網(wǎng)公司;南瑞集團有限公司;國電南瑞南京控制系統(tǒng)有限公司,未經(jīng)國電南瑞科技股份有限公司;國家電網(wǎng)公司華北分部;國家電網(wǎng)公司;南瑞集團有限公司;國電南瑞南京控制系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810219687.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。