[發(fā)明專利]計算節(jié)點IO懸掛異常自動檢測方法及裝置在審
| 申請?zhí)枺?/td> | 202110477121.5 | 申請日: | 2021-04-29 |
| 公開(公告)號: | CN113032106A | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設(shè)計)人: | 張志雄;魏亮;楊曉峰;許振峰 | 申請(專利權(quán))人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F9/455 | 分類號: | G06F9/455 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 任默聞;王濤 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 計算 節(jié)點 io 懸掛 異常 自動檢測 方法 裝置 | ||
本發(fā)明公開了一種計算節(jié)點IO懸掛異常自動檢測方法及裝置,涉及云計算技術(shù)領(lǐng)域,其中該方法包括:實時采集計算節(jié)點上所有虛擬機的IO狀態(tài),所述IO狀態(tài)包括返回狀態(tài)和懸掛狀態(tài);每間隔固定時間,統(tǒng)計處于懸掛狀態(tài)的IO數(shù)量及IO總數(shù)量,確定處于懸掛狀態(tài)的IO數(shù)量與IO總數(shù)量的比值;根據(jù)所述比值與預(yù)設(shè)閾值的大小關(guān)系,確定計算節(jié)點IO是否處于異常狀態(tài)。本發(fā)明可以及時發(fā)現(xiàn)計算節(jié)點IO異常,進而及時對異常計算節(jié)點采取有效處理措施,提升響應(yīng)速度,加快故障恢復(fù)速度。
技術(shù)領(lǐng)域
本發(fā)明涉及云計算技術(shù)領(lǐng)域,尤其涉及一種計算節(jié)點IO懸掛異常自動檢測方法及裝置。
背景技術(shù)
本部分旨在為權(quán)利要求書中陳述的本發(fā)明實施例提供背景或上下文。此處的描述不因為包括在本部分中就承認(rèn)是現(xiàn)有技術(shù)。
近些年隨著云計算技術(shù)的飛速發(fā)展其應(yīng)用越來越廣泛,一般云平臺使用分布式存儲作為存儲資源供應(yīng)虛擬機,由于分布式存儲只能針對集群內(nèi)自身故障進行檢測,在計算資源與存儲連通中斷的情況下,分布式存儲集群無法通過自身判斷出異常計算節(jié)點,導(dǎo)致異常計算節(jié)點上的虛擬機IO長時間處于懸掛狀態(tài),IO懸掛狀態(tài)的虛擬機心跳正常但已經(jīng)無法正常對外提供服務(wù)。
目前針對計算節(jié)點IO懸掛等場景,一般云廠商沒有很好的處理機制,基本上是靠告警發(fā)現(xiàn),人工運維down掉計算節(jié)點,將上面的虛擬機疏散以此恢復(fù)環(huán)境,此種處理方式有響應(yīng)速度慢、故障恢復(fù)難且效率低等眾多問題。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種計算節(jié)點IO懸掛異常自動檢測方法,用以及時發(fā)現(xiàn)計算節(jié)點IO異常,進而及時對異常計算節(jié)點采取有效處理措施,提升響應(yīng)速度,加快故障恢復(fù)速度,該方法包括:
實時采集計算節(jié)點上所有虛擬機的IO狀態(tài),所述IO狀態(tài)包括返回狀態(tài)和懸掛狀態(tài);
每間隔固定時間,統(tǒng)計處于懸掛狀態(tài)的IO數(shù)量及IO總數(shù)量,確定處于懸掛狀態(tài)的IO數(shù)量與IO總數(shù)量的比值;
根據(jù)所述比值與預(yù)設(shè)閾值的大小關(guān)系,確定計算節(jié)點IO是否處于異常狀態(tài)。
本發(fā)明實施例還提供一種計算節(jié)點IO懸掛異常自動檢測裝置,用以及時發(fā)現(xiàn)計算節(jié)點IO異常,進而及時對異常計算節(jié)點采取有效處理措施,提升響應(yīng)速度,加快故障恢復(fù)速度,該裝置包括:
采集模塊,用于實時采集計算節(jié)點上所有虛擬機的IO狀態(tài),所述IO狀態(tài)包括返回狀態(tài)和懸掛狀態(tài);
統(tǒng)計模塊,用于每間隔固定時間,統(tǒng)計處于懸掛狀態(tài)的IO數(shù)量及IO總數(shù)量,確定處于懸掛狀態(tài)的IO數(shù)量與IO總數(shù)量的比值;
確定模塊,用于根據(jù)所述比值與預(yù)設(shè)閾值的大小關(guān)系,確定計算節(jié)點IO是否處于異常狀態(tài)。
本發(fā)明實施例還提供一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述計算節(jié)點IO懸掛異常自動檢測方法。
本發(fā)明實施例還提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有執(zhí)行上述計算節(jié)點IO懸掛異常自動檢測方法的計算機程序。
本發(fā)明實施例中,通過實時采集計算節(jié)點上虛擬機的IO狀態(tài),可以及時了解每一個IO是否懸掛,并在間隔固定時間后,統(tǒng)計處于懸掛狀態(tài)的IO數(shù)量與該計算節(jié)點IO總數(shù)量,通過懸掛狀態(tài)的IO數(shù)量與IO總數(shù)量的比值與預(yù)設(shè)閾值的大小關(guān)系確定計算節(jié)點是否處于大量IO懸掛的異常狀態(tài),實現(xiàn)了云平臺針對計算節(jié)點IO懸掛場景的自動檢測與及時發(fā)現(xiàn)。這樣一來,就可以及時對異常狀態(tài)的計算節(jié)點進行有效處理,提升了響應(yīng)速度,相對于人工運維的方式,可以大大提高了故障恢復(fù)效率。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國工商銀行股份有限公司,未經(jīng)中國工商銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110477121.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 節(jié)點查詢方法、節(jié)點、移動通訊系統(tǒng)和計算機程序產(chǎn)品
- 一種根據(jù)節(jié)點集合構(gòu)造節(jié)點關(guān)系樹的方法、裝置及系統(tǒng)
- 一種DHT網(wǎng)絡(luò)負(fù)載均衡裝置及虛節(jié)點劃分的方法
- 一種無線傳感網(wǎng)地理位置路由空洞處理方法
- 節(jié)點鎖定部件、節(jié)點滑軌、節(jié)點和機箱
- 一種待推薦節(jié)點線路的確定方法及裝置
- 流控方法、目標(biāo)節(jié)點、節(jié)點及施主節(jié)點
- 節(jié)點布局確定方法以及裝置
- 一種具有分布式柔度的全柔順微位移放大機構(gòu)
- 節(jié)點掛載方法、裝置、網(wǎng)絡(luò)節(jié)點及存儲介質(zhì)





