[發(fā)明專利]計(jì)算系統(tǒng)中延期的服務(wù)器恢復(fù)方法和設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202110693615.7 | 申請(qǐng)日: | 2016-12-29 |
| 公開(kāi)(公告)號(hào): | CN113391944A | 公開(kāi)(公告)日: | 2021-09-14 |
| 發(fā)明(設(shè)計(jì))人: | N·艾倫;G·賈格蒂亞尼 | 申請(qǐng)(專利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類號(hào): | G06F11/07 | 分類號(hào): | G06F11/07;G06F11/14;G06F11/30;G06F9/455 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 董莘 |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 計(jì)算 系統(tǒng) 延期 服務(wù)器 恢復(fù) 方法 設(shè)備 | ||
1.一種由計(jì)算系統(tǒng)中的計(jì)算設(shè)備執(zhí)行的方法,所述計(jì)算系統(tǒng)具有由計(jì)算機(jī)網(wǎng)絡(luò)互連的多個(gè)主機(jī),所述方法包括:
從所述計(jì)算系統(tǒng)中的一個(gè)主機(jī)接收故障的通知,所述主機(jī)當(dāng)前正在執(zhí)行一個(gè)或多個(gè)計(jì)算任務(wù)以用于為用戶提供計(jì)算服務(wù);
響應(yīng)于接收到所述通知,確定接收到的所述通知中的所述故障的恢復(fù)在所述主機(jī)上是否是可延期的,其中當(dāng)盡管存在接收到的所述通知中的所述故障但所述主機(jī)仍能夠通過(guò)執(zhí)行由所述主機(jī)當(dāng)前正在執(zhí)行的所述一個(gè)或多個(gè)計(jì)算任務(wù)而繼續(xù)向所述用戶提供所述計(jì)算服務(wù)時(shí),所述故障的恢復(fù)是可延期的;以及
響應(yīng)于確定接收到的所述通知中的所述故障是可延期的,
設(shè)置時(shí)間延遲,以便隨后對(duì)所述主機(jī)執(zhí)行恢復(fù)操作;以及
禁止向所述主機(jī)分配其他計(jì)算任務(wù)。
2.根據(jù)權(quán)利要求1所述的方法,還包括響應(yīng)于確定接收到的所述通知中的所述故障是可延期的,向所述主機(jī)傳送指令,以永久地存儲(chǔ)與當(dāng)前由所述主機(jī)執(zhí)行的所述一個(gè)或多個(gè)計(jì)算任務(wù)有關(guān)的狀態(tài)信息。
3.根據(jù)權(quán)利要求1所述的方法,還包括響應(yīng)于確定接收到的所述通知中的所述故障不是可延期的,向所述主機(jī)傳送指令,以用于立即對(duì)所述主機(jī)執(zhí)行恢復(fù)操作。
4.根據(jù)權(quán)利要求1所述的方法,還包括在設(shè)置所述時(shí)間延遲之后,通知用戶未決的恢復(fù)操作和所設(shè)置的所述時(shí)間延遲,從所述用戶接收輸入,并且當(dāng)所設(shè)置的所述時(shí)間延遲未期滿時(shí),基于接收到的所述輸入而發(fā)起所述主機(jī)的立即恢復(fù)。
5.根據(jù)權(quán)利要求1所述的方法,還包括:
確定以便隨后對(duì)所述主機(jī)執(zhí)行未決的恢復(fù)操作的所設(shè)置的所述時(shí)間延遲是否期滿;以及
響應(yīng)于確定所設(shè)置的所述時(shí)間延遲期滿,向所述主機(jī)傳送指令,以用于對(duì)所述主機(jī)執(zhí)行所述未決的恢復(fù)操作。
6.根據(jù)權(quán)利要求1所述的方法,還包括:
監(jiān)測(cè)所述主機(jī)當(dāng)前正在執(zhí)行的所述一個(gè)或多個(gè)計(jì)算任務(wù)的數(shù)目;以及
響應(yīng)于確定所述主機(jī)當(dāng)前未執(zhí)行任何計(jì)算任務(wù),即使所設(shè)置的所述時(shí)間延遲未期滿,也傳送用于對(duì)所述主機(jī)執(zhí)行未決的恢復(fù)操作的指令。
7.根據(jù)權(quán)利要求1所述的方法,還包括:
響應(yīng)于確定接收到的所述通知中的所述故障是可延期的,
確定具有未決的恢復(fù)操作的主機(jī)的總數(shù)目是否超過(guò)閾值;以及
響應(yīng)于具有未決的恢復(fù)操作的主機(jī)的所述總數(shù)目不超過(guò)所述閾值,
設(shè)置所述時(shí)間延遲,以便隨后對(duì)所述主機(jī)執(zhí)行恢復(fù)所述未決的恢復(fù)操作;以及
禁止向所述主機(jī)分配其他計(jì)算任務(wù)。
8.根據(jù)權(quán)利要求1所述的方法,還包括:
響應(yīng)于確定接收到的所述通知中的所述故障是可延期的,
確定具有未決的恢復(fù)操作的主機(jī)的總數(shù)目是否超過(guò)閾值;以及
響應(yīng)于具有未決的恢復(fù)操作的主機(jī)的所述總數(shù)目超過(guò)所述閾值,向所述主機(jī)傳送指令以用于立即對(duì)所述主機(jī)執(zhí)行恢復(fù)操作。
9.根據(jù)權(quán)利要求7或8所述的方法,還包括:
通過(guò)以下來(lái)確定所述閾值:
基于用戶輸入,利用靜態(tài)值設(shè)置所述閾值,或者
基于所述計(jì)算系統(tǒng)的容量或使用率中的一項(xiàng)或多項(xiàng),動(dòng)態(tài)地計(jì)算所述閾值。
10.根據(jù)權(quán)利要求1所述的方法,其中:
所述故障的所述通知是第一故障的第一通知;
所述方法還包括:
從所述計(jì)算系統(tǒng)中的所述主機(jī)接收第二故障的第二通知、意外的停機(jī)時(shí)間事件的通知或者計(jì)劃的維護(hù)事件;
確定所述第一故障的恢復(fù)與所述第二故障的恢復(fù)、所述意外的停機(jī)時(shí)間事件或者所述計(jì)劃的維護(hù)事件是否是可組合的;以及
響應(yīng)于確定所述第一故障的恢復(fù)與所述第二故障的恢復(fù)、所述意外的停機(jī)時(shí)間事件或者所述計(jì)劃的維護(hù)事件是可組合的,連同所述第二故障的恢復(fù)、所述意外的停機(jī)時(shí)間事件或者所述計(jì)劃的維護(hù)事件一起執(zhí)行所述第一故障的恢復(fù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110693615.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 一種基于UDP分布式小文件存儲(chǔ)系統(tǒng)及其數(shù)據(jù)處理方法
- 一種新型云計(jì)算管理系統(tǒng)
- 一種云計(jì)算管理裝置
- 一種節(jié)能數(shù)據(jù)服務(wù)器架構(gòu)系統(tǒng)
- 一種基于云計(jì)算的客戶信息管理裝置
- 一種基于即時(shí)通訊技術(shù)的通訊系統(tǒng)
- 服務(wù)器系統(tǒng)及分配服務(wù)器的方法
- 一種MMORPG游戲服務(wù)器端
- 一種訪問(wèn)請(qǐng)求的處理方法、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于Spark技術(shù)的大數(shù)據(jù)脫敏管理系統(tǒng)





