[發明專利]一種基于高可用檢測節點的分布式系統節點故障檢測方法有效
| 申請號: | 201810219687.6 | 申請日: | 2018-03-16 |
| 公開(公告)號: | CN108600040B | 公開(公告)日: | 2022-03-15 |
| 發明(設計)人: | 高原;張勇;顧文杰;寧劍;陳鵬;王毅;郭駿;張學勇;何源 | 申請(專利權)人: | 國電南瑞科技股份有限公司;國家電網公司華北分部;國家電網公司;南瑞集團有限公司;國電南瑞南京控制系統有限公司 |
| 主分類號: | H04L43/10 | 分類號: | H04L43/10;H04L41/12;H04L41/0668;H04L41/0677 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林;張倩倩 |
| 地址: | 210003 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 可用 檢測 節點 分布式 系統 故障 方法 | ||
本發明公開了一種基于高可用檢測節點的分布式系統節點故障檢測方法,包括1)在系統中設置兩個以上檢測節點,用于對其他所有節點的故障檢測;多個檢測節點之間使用心跳報文進行主檢測節點選舉和故障切換,同時心跳報文也會到達系統每個節點;2)客戶端向主檢測節點發出請求,由主檢測檢點對待檢測的節點進行故障檢測;3)主檢測節點將不同客戶端對同一個待檢測的目標節點的檢測請求進行合并;4)主檢測節點接收到請求后開始周期性的對目標節點進行檢測,檢測結果緩存在主檢測節點的內存中,能夠合并檢測相同的目標節點,本發明能夠避免用戶層程序卡頓對檢測結果的誤判,并且減少了報文數量,提高了檢測效率。
技術領域
本發明涉及一種基于高可用檢測節點的分布式系統節點故障檢測方法,屬于網絡通信技術領域。
背景技術
分布式系統是由多個節點構成,如果某些節點發生故障后不進行處理,如流量分攤、主備切換等處理動作,則會影響整個系統的功能。因此如何快速準確的判斷節點故障是非常重要的。
心跳方案是目前較為流行的節點故障檢測方法,但是它有一項重大缺陷,就是心跳發送和接收程序是運行在操作系統之上的用戶層級中,一旦CPU等資源不足,心跳程序會發生卡頓,會造成誤判。
另外操作系統的ping命令是一種常用的節點檢測手段,但是如果簡單的讓每個節點ping其他所有節點獲取狀態,則系統形成一個網狀的檢測拓撲結構,報文數量與節點數量成指數級相關,大量的ping報文可能會造成網絡癱瘓。
發明內容
針對現有技術存在的問題,本發明提供一種基于高可用檢測節點的分布式系統節點故障檢測方法,能夠避免用戶層程序卡頓對檢測結果的誤判,并且減少了報文數量,提高了檢測效率。
本發明所要解決的技術問題是通過以下技術方案實現的:
本發明是一種基于高可用檢測節點的分布式系統節點故障檢測方法,方法采用具備多個冗余備份的檢測節點對目標節點發送ICMP(Internet Control Message Protocol,控制報文協議)報文進行故障檢測,能夠將多個客戶端對同一個節點的檢測請求進行合并,能夠利用檢測節點本地緩存和全局共享內存對檢測請求應答進行加速。
一種基于高可用檢測節點的分布式系統節點故障檢測方法,包括:
1)在系統中設置兩個以上檢測節點(檢測節點可以由任意節點擔任)其中一個為主檢測節點,其余節點為備檢測節點,用于對其他所有節點的故障檢測;多個檢測節點之間周期性的發出UDP廣播作為心跳報文,報文中包括檢測節點的節點名、IP地址、是否主節點等信息。每個檢測節點在收到其他檢測節點的心跳后,選舉出IP地址數值最小的節點為主檢測節點。非檢測節點收到心跳后也會執行同樣的邏輯確定主檢測節點,并獲知主檢測節點的IP地址用于通信。當主檢測節點故障后,其他檢測節點通過心跳報文重新確定IP地址最小的為主檢測節點,完成故障切換。同時主檢測節點周期性的將檢測結果通過組播發送到其他檢測節點,使得故障切換后新的主檢測節點能夠獲取上一時刻系統節點的狀態,能夠立刻響應客戶端的查詢請求,實現無縫切換。
2)客戶端(即每個節點的客戶端程序)調用接口,接口內通過TCP或UDP向主檢測節點發送請求報文,報文中包括希望被檢測的目標節點的IP和超時時間這兩個參數。由主檢測節點向目標節點直接發出ICMP報文,在超時時間內得到響應則回復客戶端該目標節點在線,否則回復該目標節點故障,并且主檢測檢點對待檢測的節點進行故障檢測時,由被檢測點的系統內核回復檢測報文,這樣避免了用戶層程序卡頓對判斷造成影響,并且檢測網絡的拓撲是以檢測節點為中心的星型結構,代替了傳統的每個節點對等的網狀結構。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國電南瑞科技股份有限公司;國家電網公司華北分部;國家電網公司;南瑞集團有限公司;國電南瑞南京控制系統有限公司,未經國電南瑞科技股份有限公司;國家電網公司華北分部;國家電網公司;南瑞集團有限公司;國電南瑞南京控制系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810219687.6/2.html,轉載請聲明來源鉆瓜專利網。





