[發(fā)明專利]一種異常任務(wù)處理方法、系統(tǒng)、設(shè)備以及介質(zhì)有效
| 申請?zhí)枺?/td> | 202011269963.3 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112463441B | 公開(公告)日: | 2022-08-12 |
| 發(fā)明(設(shè)計(jì))人: | 張大帥 | 申請(專利權(quán))人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F11/14 | 分類號: | G06F11/14;G06F9/4401 |
| 代理公司: | 北京連和連知識產(chǎn)權(quán)代理有限公司 11278 | 代理人: | 楊帆;宋薇薇 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 異常 任務(wù) 處理 方法 系統(tǒng) 設(shè)備 以及 介質(zhì) | ||
本發(fā)明公開了一種異常任務(wù)處理方法,包括以下步驟:響應(yīng)于檢測到異常狀態(tài)的任務(wù),確定所述異常狀態(tài)的任務(wù)已執(zhí)行的百分比;獲取所述異常狀態(tài)的任務(wù)對應(yīng)的配置文件;根據(jù)所述配置文件讀取到所述已執(zhí)行的百分比對應(yīng)的多個(gè)清理指令;利用所述多個(gè)清理指令進(jìn)行環(huán)境初始化以重新執(zhí)行所述異常狀態(tài)的任務(wù)。本發(fā)明還公開了一種系統(tǒng)、計(jì)算機(jī)設(shè)備以及可讀存儲介質(zhì)。本發(fā)明提供的方案在任務(wù)重新加載之前,先通過維護(hù)的任務(wù)配置文件中讀取到該任務(wù)異常時(shí)進(jìn)度對應(yīng)的清理指令,通過執(zhí)行這些指令進(jìn)行初始化,然后重新執(zhí)行任務(wù),防止出現(xiàn)指令重復(fù)執(zhí)行等引入未知異常。
技術(shù)領(lǐng)域
本發(fā)明涉及任務(wù)處理領(lǐng)域,具體涉及一種異常任務(wù)處理方法、系統(tǒng)、設(shè)備以及存儲介質(zhì)。
背景技術(shù)
分布式存儲集群系統(tǒng)一般包含多臺存儲服務(wù)器(Server),這些服務(wù)器組成一個(gè)集群統(tǒng)一對外提供服務(wù),文中也將服務(wù)器用“節(jié)點(diǎn)”表示,分布式集群一般都有其界面管理系統(tǒng),包含客戶端(Client)和服務(wù)端(Server),管理員可通過登錄管理系統(tǒng)界面對集群進(jìn)行設(shè)置操作,由于某些操作比較耗時(shí),比如創(chuàng)建存儲池、節(jié)點(diǎn)擴(kuò)容等操作需要異步執(zhí)行,故一般放到任務(wù)中異步進(jìn)行,管理界面上可以查詢?nèi)蝿?wù)進(jìn)度。故管理系統(tǒng)需要對任務(wù)進(jìn)行調(diào)度,傳統(tǒng)的任務(wù)的調(diào)度過程:管理員通過管理界面下發(fā)創(chuàng)建操作(這里用節(jié)點(diǎn)擴(kuò)容舉例)請求,界面通過https請求將設(shè)置消息下發(fā)到管理系統(tǒng)服務(wù)端,服務(wù)端首先將任務(wù)記錄到數(shù)據(jù)庫中(可以通過任務(wù)id唯一標(biāo)識),然后將具體的執(zhí)行步驟提交給任務(wù)執(zhí)行模塊(Task_Exec),由它去執(zhí)行實(shí)際任務(wù)。傳統(tǒng)任務(wù)管理在管理節(jié)點(diǎn)server端服務(wù)出現(xiàn)異常時(shí),正在執(zhí)行的任務(wù)由于服務(wù)異常而被終止,并且在服務(wù)恢復(fù)正常后無法自動重新拉起,需要管理員在管理平臺重新發(fā)起任務(wù)。故可靠性和可維護(hù)性需要優(yōu)化和完善。
發(fā)明內(nèi)容
有鑒于此,為了克服上述問題的至少一個(gè)方面,本發(fā)明實(shí)施例提出一種異常任務(wù)處理方法,包括以下步驟:
響應(yīng)于檢測到異常狀態(tài)的任務(wù),確定所述異常狀態(tài)的任務(wù)已執(zhí)行的百分比;
獲取所述異常狀態(tài)的任務(wù)對應(yīng)的配置文件;
根據(jù)所述配置文件讀取到所述已執(zhí)行的百分比對應(yīng)的多個(gè)清理指令;
利用所述多個(gè)清理指令進(jìn)行環(huán)境初始化以重新執(zhí)行所述異常狀態(tài)的任務(wù)。
在一些實(shí)施例中,方法進(jìn)一步包括:預(yù)先將任務(wù)執(zhí)行百分比對應(yīng)的操作指令與清理指令寫入所述配置文件;
確定所述異常任務(wù)已執(zhí)行的百分比包括:獲取所述異常任務(wù)最后一次執(zhí)行的操作指令,根據(jù)所述最后一次執(zhí)行的操作指令在所述配置文件中確定對應(yīng)的所述已執(zhí)行的百分比。
在一些實(shí)施例中,響應(yīng)于檢測到異常狀態(tài)的任務(wù),確定所述異常狀態(tài)的任務(wù)已執(zhí)行的百分比,進(jìn)一步包括:
每隔第一預(yù)設(shè)時(shí)間段更新并記錄每一個(gè)任務(wù)的心跳檢測時(shí)間;
每隔第二預(yù)設(shè)時(shí)間段查詢所述每一個(gè)任務(wù)當(dāng)前記錄的心跳檢測時(shí)間;
獲取當(dāng)前時(shí)間,并根據(jù)所述當(dāng)前時(shí)間、所述當(dāng)前記錄的心跳檢測時(shí)間以及所述第二預(yù)設(shè)時(shí)間段判斷任務(wù)是否異常。
在一些實(shí)施例中,根據(jù)所述當(dāng)前時(shí)間、所述當(dāng)前記錄的心跳檢測時(shí)間以及所述第二預(yù)設(shè)時(shí)間段判斷任務(wù)是否異常,進(jìn)一步包括:
判斷查詢到的所述當(dāng)前記錄的心跳檢測時(shí)間與當(dāng)前時(shí)間的差值是否大于所述第二預(yù)設(shè)時(shí)間段;
響應(yīng)于所述當(dāng)前記錄的心跳檢測時(shí)間與當(dāng)前時(shí)間的差值大于所述第二預(yù)設(shè)時(shí)間段,將對應(yīng)的任務(wù)標(biāo)記為準(zhǔn)異常狀態(tài)。
在一些實(shí)施例中,還包括:
響應(yīng)于檢測到準(zhǔn)異常狀態(tài)的任務(wù)的所述當(dāng)前記錄的心跳檢測時(shí)間與當(dāng)前時(shí)間的差值再次大于所述第二預(yù)設(shè)時(shí)間段,將所述準(zhǔn)異常狀態(tài)的任務(wù)標(biāo)記為異常狀態(tài)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州浪潮智能科技有限公司,未經(jīng)蘇州浪潮智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011269963.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測;錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過測試作故障硬件的檢測或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過處理作錯(cuò)誤檢測、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過軟件的測試或調(diào)試防止錯(cuò)誤
- 任務(wù)協(xié)作裝置及方法
- 用于量化任務(wù)價(jià)值的任務(wù)管理方法及裝置
- 用于運(yùn)行任務(wù)的系統(tǒng)、方法和裝置
- 一種分布式任務(wù)調(diào)度系統(tǒng)及方法
- 任務(wù)信息處理方法
- 一種同步任務(wù)異步執(zhí)行的方法和調(diào)度系統(tǒng)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種自動分配和推送的任務(wù)管理平臺及方法
- 程序執(zhí)行控制的裝置及方法、終端和存儲介質(zhì)
- 基于會話的任務(wù)待辦方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)





