[發明專利]分布式系統的故障處理方法、裝置及電子設備在審
| 申請號: | 201911119217.3 | 申請日: | 2019-11-15 |
| 公開(公告)號: | CN111026572A | 公開(公告)日: | 2020-04-17 |
| 發明(設計)人: | 魏子昂 | 申請(專利權)人: | 北京金山云網絡技術有限公司;北京金山云科技有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07 |
| 代理公司: | 北京博遵律師事務所 11761 | 代理人: | 馬佑平 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分布式 系統 故障 處理 方法 裝置 電子設備 | ||
本發明涉及分布式系統的故障處理方法、裝置及電子設備。該方法包括:接收分布式系統中的目標服務器發送的故障信息;根據故障信息確定目標服務器的故障類型;根據故障類型生成相應的維修任務并發送至維修業務終端;獲取維修業務終端反饋的維修任務的執行進度;以及向目標服務器發送探活請求,以獲取目標服務器的存活狀態;如果存活狀態為可登錄狀態,則向目標服務器發送初始化配置指令,以將目標服務器恢復工作狀態;如果存活狀態為非可登錄狀態并且執行進度為完成狀態,則從分布式系統刪除目標服務器。
技術領域
本發明涉及分布式系統領域,更具體地,涉及一種分布式系統的故障處理方法、一種分布式系統的故障處理裝置、一種電子設備、一種分布式系統的故障處理系統以及一種計算機可讀存儲介質。
背景技術
分布式存儲系統,是將數據分散存儲在多臺獨立的設備上。傳統的網絡存儲系統采用集中的存儲服務器存放所有數據,存儲服務器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。分布式網絡存儲系統采用可擴展的系統結構,利用多臺存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易于擴展。
對于大規模分布式存儲而言機器的故障頻率較高,需要人工判斷故障,然后人工發單去維修,處理周期長無法監控與跟蹤,自動化程度低。另外人工發現的時候往往機器已經無法登陸,不利于及時發現和處理故障。
因此,有必要提出一種新的分布式系統的故障處理方案。
發明內容
本發明的一個目的是提供一種分布式系統的故障處理的新技術方案。
根據本發明的第一方面,提供了一種分布式系統的故障處理方法,應用于控制服務器,包括:
接收所述分布式系統中的目標服務器發送的故障信息;
根據所述故障信息確定所述目標服務器的故障類型;
根據所述故障類型生成相應的維修任務并發送至維修業務終端;
獲取所述維修業務終端反饋的所述維修任務的執行進度;以及
向所述目標服務器發送探活請求,以獲取所述目標服務器的存活狀態;
如果所述存活狀態為可登錄狀態,則向所述目標服務器發送初始化配置指令,以將所述目標服務器恢復工作狀態;
如果所述存活狀態為非可登錄狀態并且所述執行進度為完成狀態,則從所述分布式系統刪除所述目標服務器。
可選地,如果所述存活狀態為非可登錄狀態并且所述執行進度為完成狀態,還包括:
停止對所述目標服務器進行狀態監測。
可選地,所述故障類型包括系統盤故障、主機總線適配器故障、內存故障中的任意一種或者任意多種的組合。
根據本發明的第二方面,提供了一種分布式系統的故障處理方法,應用于所述分布式系統中的每個服務器,包括:
獲取自身的故障信息;
將所述故障信息發送至控制服務器,以使所述控制服務器確定故障類型;
響應于所述控制服務器發送的探活請求,反饋自身的存活狀態;
當自身的存活狀態為可登錄狀態時,接收所述控制服務器發送的所述初始化配置指令;
響應于所述初始化配置指令,初始化自身的配置參數,以恢復為工作狀態。
可選地,所述獲取自身的故障信息,包括:
根據自身的系統日志和/或PCI總線信息獲取所述故障信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山云網絡技術有限公司;北京金山云科技有限公司,未經北京金山云網絡技術有限公司;北京金山云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911119217.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種旋挖鉆機動力頭
- 下一篇:一種微生物燃料電池及其制備方法與應用





