[發(fā)明專利]一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201711078480.3 | 申請(qǐng)日: | 2017-11-06 |
| 公開(kāi)(公告)號(hào): | CN107612787B | 公開(kāi)(公告)日: | 2021-01-12 |
| 發(fā)明(設(shè)計(jì))人: | 姜偉;郭長(zhǎng)波;宋治海;郇宏達(dá) | 申請(qǐng)(專利權(quán))人: | 南京易捷思達(dá)軟件科技有限公司 |
| 主分類號(hào): | H04L12/26 | 分類號(hào): | H04L12/26;H04L29/08 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 戴朝榮 |
| 地址: | 210012 江蘇省南京*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 openstack 開(kāi)源云 平臺(tái) 主機(jī) 故障 檢測(cè) 方法 | ||
1.一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法,其特征在于:
將Agent運(yùn)行在控制節(jié)點(diǎn)群上,通過(guò)pacemaker實(shí)現(xiàn)active/standby模式,使用crm進(jìn)行管理,同一時(shí)刻只有一個(gè)Agent程序運(yùn)行,并通過(guò)各個(gè)網(wǎng)絡(luò)監(jiān)控各計(jì)算節(jié)點(diǎn);
所述云主機(jī)故障檢測(cè)方法包括如下步驟:獲取需要檢測(cè)的計(jì)算節(jié)點(diǎn),并獲取所述計(jì)算節(jié)點(diǎn)的配置信息;
根據(jù)所述配置信息,通過(guò)Agent獲取相對(duì)應(yīng)所述計(jì)算節(jié)點(diǎn)的狀態(tài)信息,并將所述狀態(tài)信息進(jìn)行匯總;
將本次檢測(cè)過(guò)程匯總的狀態(tài)信息與上一次檢測(cè)過(guò)程中匯總的狀態(tài)信息進(jìn)行對(duì)比,并更新檢測(cè)結(jié)果;
判斷更新后的檢測(cè)結(jié)果中異常節(jié)點(diǎn)的數(shù)目是否超過(guò)容錯(cuò)范圍值,如果是,則由人工進(jìn)行排查處理,如果否,則由Agent根據(jù)動(dòng)作矩陣執(zhí)行遷移或者疏散所述異常節(jié)點(diǎn)上的云主機(jī),并且對(duì)于疏散云主機(jī)的操作是云主機(jī)在共享存儲(chǔ)的環(huán)境下創(chuàng)建的。
2.根據(jù)權(quán)利要求1所述的一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法,其特征在于:所述配置信息包括計(jì)算節(jié)點(diǎn)的IPMI地址、認(rèn)證信息、管理網(wǎng)地址和存儲(chǔ)網(wǎng)地址。
3.根據(jù)權(quán)利要求1所述的一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法,其特征在于:通過(guò)Agent獲取相對(duì)應(yīng)所述計(jì)算節(jié)點(diǎn)的狀態(tài)信息包括如下步驟:
檢查所述計(jì)算節(jié)點(diǎn)是否為存儲(chǔ)節(jié)點(diǎn);
獲取所述計(jì)算節(jié)點(diǎn)所在的可用域;
通過(guò)IPMI命令查詢并判斷所述計(jì)算節(jié)點(diǎn)的電源狀態(tài),如果所述計(jì)算節(jié)點(diǎn)的電源為關(guān)閉狀態(tài),則直接返回檢測(cè)信息;如果所述計(jì)算節(jié)點(diǎn)的電源為正常工作狀態(tài),則通過(guò)管理網(wǎng)和存儲(chǔ)網(wǎng)IP,進(jìn)行ping操作,查詢管理網(wǎng)、存儲(chǔ)網(wǎng)的狀態(tài),正常則記為Ok,不正常則為Failed;
檢測(cè)所述計(jì)算節(jié)點(diǎn)的生產(chǎn)網(wǎng)狀態(tài),Agent通過(guò)安全外殼協(xié)議SSH,登錄到對(duì)應(yīng)的所述計(jì)算節(jié)點(diǎn)上,找到所述計(jì)算節(jié)點(diǎn)用于生產(chǎn)網(wǎng)的網(wǎng)卡,判斷所述網(wǎng)卡運(yùn)行是否正常,如果是,則記為Ok;如果否,則記為Failed;如果網(wǎng)卡無(wú)法訪問(wèn),則記為Unknowno
根據(jù)權(quán)利要求1所述的一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法,其特征在于:將本次檢測(cè)過(guò)程匯總的狀態(tài)信息與上一次檢測(cè)過(guò)程中匯總的狀態(tài)信息進(jìn)行對(duì)比,并更新檢測(cè)結(jié)果的步驟包括如下步驟:
將本次檢測(cè)過(guò)程匯總的狀態(tài)信息與上一次檢測(cè)過(guò)程中匯總的狀態(tài)信息進(jìn)行對(duì)比,判斷對(duì)比結(jié)果是否一致;
如果是,則視為有效檢測(cè);如果否,則不對(duì)本次的檢測(cè)結(jié)果采取操作;
更新檢測(cè)結(jié)果。
4.根據(jù)權(quán)利要求1所述的一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法,其特征在于:由Agent根據(jù)動(dòng)作矩陣執(zhí)行遷移或者疏散所述異常節(jié)點(diǎn)上的云主機(jī)的步驟包括如下步驟:
執(zhí)行遷移動(dòng)作步驟:Agent找出所述異常節(jié)點(diǎn)上所有的待遷移云主機(jī),根據(jù)nova的調(diào)度策略,Agent選擇合適的遷移目標(biāo)節(jié)點(diǎn),執(zhí)行遷移動(dòng)作,將所述待遷移云主機(jī)遷移到所述遷移目標(biāo)節(jié)點(diǎn)上運(yùn)行;
執(zhí)行疏散動(dòng)作步驟:Agent通過(guò)IPMI對(duì)所述異常節(jié)點(diǎn)執(zhí)行關(guān)機(jī)操作,并找出所述異常節(jié)點(diǎn)上待疏散云主機(jī),且Agent選擇合適的疏散目標(biāo)節(jié)點(diǎn),執(zhí)行疏散動(dòng)作,將所述待疏散云主機(jī)遷移到所述疏散目標(biāo)節(jié)點(diǎn)上運(yùn)行。
5.根據(jù)權(quán)利要求1所述的一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法,其特征在于:如果Agent服務(wù)運(yùn)行正常,且日志信息顯示正常,則Agent正在持續(xù)不斷地檢測(cè)相對(duì)應(yīng)的所述節(jié)點(diǎn)的情況。
6.根據(jù)權(quán)利要求1所述的一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法,其特征在于:當(dāng)計(jì)算節(jié)點(diǎn)處于維護(hù)模式時(shí),Agent不用檢測(cè)所述計(jì)算節(jié)點(diǎn);當(dāng)計(jì)算節(jié)點(diǎn)從維護(hù)模式恢復(fù)至正常模式時(shí),Agent重新檢測(cè)所述計(jì)算節(jié)點(diǎn)。
7.根據(jù)權(quán)利要求1所述的一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法,其特征在于:通過(guò)設(shè)置Agent的Ping操作發(fā)包間隔和數(shù)量、SSH操作的超時(shí)時(shí)間、及檢測(cè)觸發(fā)間隔來(lái)調(diào)節(jié)Agent的靈敏度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京易捷思達(dá)軟件科技有限公司,未經(jīng)南京易捷思達(dá)軟件科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711078480.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種測(cè)試路由器的方法及系統(tǒng)
- 下一篇:球體陀螺
- 基于全OPENFLOW物理交換機(jī)網(wǎng)絡(luò)的Openstack網(wǎng)絡(luò)系統(tǒng)及實(shí)現(xiàn)方法
- 一種快速布置OpenStack虛擬桌面的方法及裝置
- 一種OpenStack多節(jié)點(diǎn)自動(dòng)化安裝方法及系統(tǒng)
- openstack組件容器化的構(gòu)建方法
- 一種部署OpenStack的方法及系統(tǒng)
- 一種容災(zāi)管理方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備質(zhì)
- 一種OpenStack的高可用部署方法及裝置
- 接口測(cè)試方法、裝置及服務(wù)器
- 一種OpenStack單租戶實(shí)現(xiàn)企業(yè)多用戶資源管理的方法
- OpenStack云平臺(tái)升級(jí)方法及裝置
- 無(wú)線HDMI傳輸器
- 基于麥克納姆輪的無(wú)線視頻監(jiān)控移動(dòng)機(jī)器人系統(tǒng)
- 一種基于云券+移動(dòng)云商城平臺(tái)開(kāi)發(fā)系統(tǒng)
- 一種基于Openstack開(kāi)源云平臺(tái)的云主機(jī)故障檢測(cè)方法
- 基于IOT技術(shù)的遠(yuǎn)程多端種植系統(tǒng)
- 基于開(kāi)源生態(tài)系統(tǒng)的物聯(lián)網(wǎng)綜合實(shí)驗(yàn)及應(yīng)用開(kāi)發(fā)平臺(tái)
- 一種云拍抄表終端系統(tǒng)
- 基于開(kāi)源架構(gòu)云環(huán)境的內(nèi)存快照的創(chuàng)建方法及裝置
- 一種基于規(guī)則變異的自動(dòng)駕駛激光雷達(dá)數(shù)據(jù)擴(kuò)增方法
- 一種云服務(wù)系統(tǒng)及其任務(wù)執(zhí)行方法和裝置及服務(wù)器





