[發(fā)明專利]Linux集群故障自動(dòng)恢復(fù)方法和Linux集群故障自動(dòng)恢復(fù)系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201210031209.5 | 申請(qǐng)日: | 2012-02-13 |
| 公開(公告)號(hào): | CN102957563A | 公開(公告)日: | 2013-03-06 |
| 發(fā)明(設(shè)計(jì))人: | 單聯(lián)瑜;叢龍水;董濤;李戰(zhàn)強(qiáng);孫世為;邢占軍;孫友凱;段淼;劉玉梅;徐香明;趙軍民;付巧娟;吳敏;車曉萍;劉芳;盧晉平;董倩;尚新民;侯樹杰;郭見樂 | 申請(qǐng)(專利權(quán))人: | 中國石油化工股份有限公司;中國石油化工股份有限公司勝利油田分公司物探研究院 |
| 主分類號(hào): | H04L12/24 | 分類號(hào): | H04L12/24 |
| 代理公司: | 濟(jì)南日新專利代理事務(wù)所 37224 | 代理人: | 謝省法 |
| 地址: | 100728 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | linux 集群 故障 自動(dòng) 恢復(fù) 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及大規(guī)模集群資源管理系統(tǒng)的優(yōu)化與應(yīng)用,特別是涉及到Linux集群故障自動(dòng)恢復(fù)方法。
背景技術(shù)
隨著計(jì)算需求的發(fā)展,微機(jī)集群的規(guī)模也在不斷地?cái)U(kuò)大,如何高效地完成對(duì)大規(guī)模集群的管理,成為亟待解決的一個(gè)難題。國內(nèi)外的計(jì)算機(jī)廠家均投入了大量研發(fā)力量開發(fā)集群相關(guān)產(chǎn)品,從免費(fèi)軟件到收費(fèi)軟件,功能各有不同,主要功能集中于系統(tǒng)管理和監(jiān)視,但缺少智能的、自動(dòng)化的工具,所以集群的可管理性和可用性均收到極大的影響。在現(xiàn)有的模式下,管理人員需要通過自身的經(jīng)驗(yàn)進(jìn)行故障點(diǎn)的查找和判斷,往往耗時(shí)較長,且不容易迅速處理問題,將故障節(jié)點(diǎn)重新投入使用。為此我們發(fā)明了一種新的Linux集群故障自動(dòng)恢復(fù)方法,解決了以上技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種能夠自動(dòng)、快速、高效地完成集群節(jié)點(diǎn)系統(tǒng)的故障自動(dòng)恢復(fù)的Linux集群故障自動(dòng)恢復(fù)方法。????
本發(fā)明的目的可通過如下技術(shù)措施來實(shí)現(xiàn):Linux集群故障自動(dòng)恢復(fù)方法,該Linux集群故障自動(dòng)恢復(fù)方法包執(zhí)行數(shù)據(jù)信息采集并判斷是否出現(xiàn)故障;當(dāng)判斷出現(xiàn)故障時(shí),重新啟動(dòng)節(jié)點(diǎn);當(dāng)重新啟動(dòng)該節(jié)點(diǎn)后,再次執(zhí)行該數(shù)據(jù)信息采集并判斷出現(xiàn)故障時(shí),執(zhí)行故障節(jié)點(diǎn)的維護(hù)集成;在執(zhí)行該故障節(jié)點(diǎn)的維護(hù)集成后,再次執(zhí)行該數(shù)據(jù)信息采集并判斷出現(xiàn)故障時(shí),執(zhí)行故障節(jié)點(diǎn)的安裝集成;以及在執(zhí)行該故障節(jié)點(diǎn)的安裝集成后,再次執(zhí)行該數(shù)據(jù)信息采集并判斷出現(xiàn)故障時(shí),進(jìn)行人工處理。
本發(fā)明的目的還可通過如下技術(shù)措施來實(shí)現(xiàn):
該數(shù)據(jù)信息采集包括動(dòng)態(tài)數(shù)據(jù)采集、靜態(tài)信息采集、系統(tǒng)服務(wù)狀態(tài)數(shù)據(jù)采集和應(yīng)用信息數(shù)據(jù)采集。
該動(dòng)態(tài)數(shù)據(jù)采集和靜態(tài)信息采集通過讀取系統(tǒng)的/proc文件系統(tǒng)獲取系統(tǒng)信息。
該系統(tǒng)服務(wù)狀態(tài)數(shù)據(jù)采集是檢測整個(gè)集群的DNS、NIS、NTP等主從服務(wù)器的服務(wù)狀態(tài),并把其狀態(tài)寫到數(shù)據(jù)庫中。
該應(yīng)用信息數(shù)據(jù)采集是根據(jù)生產(chǎn)應(yīng)用的實(shí)際情況,先羅列出實(shí)際應(yīng)用中的各種需要,然后根據(jù)需要手工錄入各個(gè)應(yīng)用服務(wù)器及應(yīng)用服務(wù)的節(jié)點(diǎn)名,并保存到數(shù)據(jù)庫中,然后根據(jù)各個(gè)應(yīng)用服務(wù)器的節(jié)點(diǎn)名檢測該服務(wù)器的應(yīng)用服務(wù)狀態(tài),并把其狀態(tài)寫到該數(shù)據(jù)庫中。
該Linux集群故障自動(dòng)恢復(fù)方法根據(jù)該數(shù)據(jù)信息采集的更新時(shí)間,設(shè)定該更新間隔的最大時(shí)間間隔,當(dāng)該數(shù)據(jù)信息采集的刷新時(shí)間超過了該最大時(shí)間間隔時(shí),判斷出現(xiàn)故障。
該Linux集群故障自動(dòng)恢復(fù)方法還包括在重新啟動(dòng)節(jié)點(diǎn)的步驟后,標(biāo)志節(jié)點(diǎn)已進(jìn)行重新啟動(dòng)的標(biāo)志位,并在再次執(zhí)行該數(shù)據(jù)信息采集并判斷未出現(xiàn)故障時(shí),清除節(jié)點(diǎn)已進(jìn)行重新啟動(dòng)的標(biāo)志位。
該Linux集群故障自動(dòng)恢復(fù)方法還包括在執(zhí)行故障節(jié)點(diǎn)的維護(hù)集成的步驟后,標(biāo)志節(jié)點(diǎn)維護(hù)集成的標(biāo)志位,并在再次執(zhí)行該數(shù)據(jù)信息采集并判斷未出現(xiàn)故障時(shí),清除節(jié)點(diǎn)維護(hù)集成的標(biāo)志位。
該Linux集群故障自動(dòng)恢復(fù)方法還包括在執(zhí)行故障節(jié)點(diǎn)的安裝集成的步驟后,標(biāo)志節(jié)點(diǎn)安裝集成的標(biāo)志位,并在再次執(zhí)行該數(shù)據(jù)信息采集并判斷未出現(xiàn)故障時(shí),清除節(jié)點(diǎn)安裝集成的標(biāo)志位。
該執(zhí)行故障節(jié)點(diǎn)的維護(hù)集成的步驟包括將該節(jié)點(diǎn)在服務(wù)器端設(shè)置成維護(hù)狀態(tài),重新啟動(dòng)該節(jié)點(diǎn),該節(jié)點(diǎn)在啟動(dòng)過程中,從網(wǎng)絡(luò)讀取啟動(dòng)映像,進(jìn)入該節(jié)點(diǎn)的維護(hù)狀態(tài),將該節(jié)點(diǎn)系統(tǒng)的配置還原到最初配置狀態(tài)。
該執(zhí)行故障節(jié)點(diǎn)的安裝集成的步驟包括將該節(jié)點(diǎn)在服務(wù)器端設(shè)置成安裝集成狀態(tài),重新啟動(dòng)該節(jié)點(diǎn),該節(jié)點(diǎn)在啟動(dòng)過程中,從網(wǎng)絡(luò)讀取啟動(dòng)映像,進(jìn)入節(jié)點(diǎn)的網(wǎng)絡(luò)安裝集成,從網(wǎng)絡(luò)讀取安裝包,進(jìn)行系統(tǒng)的安裝配置,將該節(jié)點(diǎn)系統(tǒng)重新進(jìn)行安裝。
本發(fā)明的目的也可通過如下技術(shù)措施來實(shí)現(xiàn):Linux集群故障自動(dòng)恢復(fù)系統(tǒng),其特征在于,該Linux集群故障自動(dòng)恢復(fù)系統(tǒng)包括數(shù)據(jù)信息采集及判斷模塊、重新啟動(dòng)節(jié)點(diǎn)模塊、維護(hù)集成模塊和安裝集成模塊,該數(shù)據(jù)信息采集及判斷模塊用于執(zhí)行數(shù)據(jù)信息采集并判斷是否出現(xiàn)故障,該重新啟動(dòng)節(jié)點(diǎn)模塊用于重新啟動(dòng)節(jié)點(diǎn),該維護(hù)集成模塊用于執(zhí)行故障節(jié)點(diǎn)的維護(hù)集成,該安裝集成模塊用于執(zhí)行故障節(jié)點(diǎn)的安裝集成。
本發(fā)明的目的還可通過如下技術(shù)措施來實(shí)現(xiàn):
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國石油化工股份有限公司;中國石油化工股份有限公司勝利油田分公司物探研究院,未經(jīng)中國石油化工股份有限公司;中國石油化工股份有限公司勝利油田分公司物探研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210031209.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- LINUX內(nèi)核動(dòng)態(tài)加載方法
- 一種Linux嵌入式系統(tǒng)的安全啟動(dòng)方法
- 一種加快嵌入式Linux系統(tǒng)啟動(dòng)的方法
- Linux文件系統(tǒng)的多點(diǎn)備份和實(shí)時(shí)保護(hù)方法
- 基于硬件的Linux軟件開發(fā)系統(tǒng)及其構(gòu)建方法
- 將VxWorks任務(wù)移植到Linux的方法及裝置
- 一種Linux內(nèi)核接管socket鏈接的方法和裝置
- 一種Linux系統(tǒng)的備份和還原方法
- 一種基于Linux系統(tǒng)盤的寫過濾系統(tǒng)和方法
- 一種基于Linux系統(tǒng)盤的熱插拔方法和系統(tǒng)
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時(shí)維持有效性
- 與集群調(diào)度系統(tǒng)進(jìn)行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺(tái)多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點(diǎn)和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)介質(zhì)
- 混合云場景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓?fù)涓路椒ā⑾到y(tǒng)、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 故障檢測裝置、故障檢測方法以及故障檢測程序
- 故障預(yù)測裝置、故障預(yù)測方法及故障預(yù)測程序
- 故障分析裝置、故障分析系統(tǒng)及故障分析方法
- 故障檢測方法、故障檢測裝置和故障檢測系統(tǒng)
- 故障檢測裝置、故障檢測方法及計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)
- 故障檢測裝置、故障檢測方法和計(jì)算機(jī)能讀取的存儲(chǔ)介質(zhì)
- 故障檢測裝置、故障檢測系統(tǒng)、故障檢測方法
- 故障處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 故障排除方法、故障排除裝置及故障排除系統(tǒng)
- 故障檢測電路、故障檢測系統(tǒng)及故障檢測方法





