[發明專利]設備故障恢復的方法和裝置有效
| 申請號: | 201710719076.3 | 申請日: | 2017-08-21 |
| 公開(公告)號: | CN109428740B | 公開(公告)日: | 2020-09-08 |
| 發明(設計)人: | 洪濤;鄭偉;朱乃盤 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04L12/26 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 羅振安 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 設備 故障 恢復 方法 裝置 | ||
本申請提供了一種設備故障恢復的方法和裝置,屬于計算機技術領域。該方法包括:第一備設備接收主設備周期性發送的心跳檢測消息,當連續N個周期未接收到所述主設備發送的心跳檢測消息時,所述第一備設備向其它備設備發送第一故障詢問消息,其中,N為預設數值,所述第一故障詢問消息用于詢問是否連續N個周期未接收到所述主設備發送的心跳檢測消息,所述其它備設備為與所述主設備屬于同一設備組的備設備中除所述第一備設備之外的備設備,當接收到所述其它備設備中有數目符合預設條件的備設備發送的第一故障確認消息時,所述第一備設備發起主設備重選。通過本申請,可以提高確定主設備故障的準確率。
技術領域
本申請涉及計算機技術領域,特別涉及一種設備故障恢復的方法和裝置。
背景技術
在云環境中,包括多個業務處理系統,每個業務處理系統由多個設備組成,設備可以是虛擬機或物理機等。為了避免業務處理系統中一個設備出現故障后,整個業務處理系統不能正常運行,一般是為設備(后續可以稱為主設備)創建至少一個備設備,主設備和至少一個備設備分別部署在不同的實體設備上,當某個業務處理系統中的主設備出現故障時,從備設備中重新選取主設備,這樣該業務處理系統可以正常運行。
現有技術中,對應每個設備都設置有故障檢測代理,故障檢測代理與控制設備周期性進行心跳檢測,控制設備每隔預設時長向每個設備的故障檢測代理發送心跳檢測消息,故障檢測代理接收到心跳檢測消息后,會向控制設備發送心跳回復信息。
當故障檢測代理檢測到對應的設備出現故障時,向控制設備發送設備故障消息,如果故障消息是主設備對應的故障檢測代理發送的,則控制設備可以確定主設備出現故障。或者,如果控制設備在向主設備對應的故障檢測代理發送心跳檢測消息后的預設時長之內,未接收到主設備的故障檢測代理發送的心跳回復消息,則確定主設備出現故障。
控制設備確定主設備出現故障后,可以從主設備對應的備設備中選取一個備設備作為主設備,并通知該備設備變為主設備,并且控制設備通知業務引導設備進行主設備更新。
在實現本申請的過程中,發明人發現現有技術至少存在以下問題:
如果是故障檢測代理本身出現故障,控制設備由于接收不到故障檢測代理發送的心跳回復消息,也會確認主設備故障,從而對主設備的故障檢測不準確。
發明內容
為了解決現有技術的問題,本發明實施例提供了一種設備故障恢復的方法和裝置。所述技術方案如下:
第一方面,提供了一種設備故障恢復的方法,該方法包括:
第一備設備接收主設備周期性發送的心跳檢測消息,當連續N個周期未接收到主設備發送的心跳檢測消息時,第一備設備向其它備設備發送第一故障詢問消息,第一故障詢問消息用于詢問是否連續N個周期未接收到主設備發送的心跳檢測消息,當接收到其它備設備中有數目符合預設條件的備設備發送的第一故障確認消息時,第一備設備發起主設備重選。
其中,第一備設備為業務處理系統中一個主設備對應的多個備設備中的任一備設備,其它備設備為與主設備屬于同一設備組的備設備中除第一備設備之外的備設備。心跳檢測消息的發送周期可以由技術人員預設,并且存儲至主設備中。第一故障詢問消息用于詢問是否連續N個周期未接收到主設備發送的心跳檢測消息,可以由技術人員預設,預設條件可以由技術人員預設,并且存儲至各備設備中,如超過一半等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710719076.3/2.html,轉載請聲明來源鉆瓜專利網。





