[發(fā)明專利]計(jì)算系統(tǒng)中延期的服務(wù)器恢復(fù)方法和設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202110693615.7 | 申請(qǐng)日: | 2016-12-29 |
| 公開(kāi)(公告)號(hào): | CN113391944A | 公開(kāi)(公告)日: | 2021-09-14 |
| 發(fā)明(設(shè)計(jì))人: | N·艾倫;G·賈格蒂亞尼 | 申請(qǐng)(專利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類號(hào): | G06F11/07 | 分類號(hào): | G06F11/07;G06F11/14;G06F11/30;G06F9/455 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 董莘 |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 計(jì)算 系統(tǒng) 延期 服務(wù)器 恢復(fù) 方法 設(shè)備 | ||
本公開(kāi)的實(shí)施例涉及計(jì)算系統(tǒng)中延期的服務(wù)器恢復(fù)方法和設(shè)備。在本文中公開(kāi)了用于延期的服務(wù)器恢復(fù)的各種技術(shù)。在一個(gè)實(shí)施例中,一種方法包括從計(jì)算系統(tǒng)中的主機(jī)接收故障的通知。主機(jī)正針對(duì)一個(gè)或多個(gè)用戶執(zhí)行一個(gè)或多個(gè)計(jì)算任務(wù)。該方法可以包括然后確定接收到的通知中的故障的恢復(fù)在主機(jī)上是否是可延期的。響應(yīng)于確定接收到的通知中的故障是可延期的,該方法包括設(shè)置時(shí)間延遲,以在更晚的時(shí)間對(duì)主機(jī)執(zhí)行未決的恢復(fù)操作,并且禁止計(jì)算任務(wù)到主機(jī)的附加分配。
本申請(qǐng)是國(guó)際申請(qǐng)日為2016年12月29日、于2018年6月12日進(jìn)入中國(guó)國(guó)家階段、中國(guó)國(guó)家申請(qǐng)?zhí)?01680072913.1、發(fā)明名稱為“計(jì)算系統(tǒng)中延期的服務(wù)器恢復(fù)方法和設(shè)備”的發(fā)明專利申請(qǐng)的分案申請(qǐng)。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算系統(tǒng),更具體地涉及計(jì)算系統(tǒng)中延期的服務(wù)器恢復(fù)。
背景技術(shù)
提供云計(jì)算服務(wù)的數(shù)據(jù)中心通常包括路由器、交換機(jī)、橋接器和其他物理網(wǎng)絡(luò)設(shè)備,其經(jīng)由有線或無(wú)線網(wǎng)絡(luò)鏈接將大量的服務(wù)器、網(wǎng)絡(luò)存儲(chǔ)設(shè)備和其他類型的物理計(jì)算設(shè)備互連。單獨(dú)的服務(wù)器可以托管云計(jì)算客戶端可訪問(wèn)的一個(gè)或多個(gè)虛擬機(jī)或者其他類型的虛擬化部件。虛擬機(jī)可以根據(jù)由物理網(wǎng)絡(luò)設(shè)備支持的一個(gè)或多個(gè)網(wǎng)絡(luò)協(xié)議經(jīng)由虛擬網(wǎng)絡(luò)來(lái)交換消息(諸如電子郵件)。
發(fā)明內(nèi)容
提供本發(fā)明內(nèi)容以便以簡(jiǎn)化的形式介紹將在以下具體實(shí)施方式中進(jìn)一步描述的一些概念。本發(fā)明內(nèi)容不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在用于限制所要求保護(hù)的主題的范圍。
在云計(jì)算中,虛擬機(jī)可用性通常指基于請(qǐng)求來(lái)創(chuàng)建新虛擬機(jī)的能力或者特定服務(wù)器上現(xiàn)有虛擬機(jī)的不中斷的可訪問(wèn)性。然而,服務(wù)器停機(jī)事件(諸如重新啟動(dòng)、電力周期、系統(tǒng)升級(jí)等)可能導(dǎo)致系統(tǒng)停機(jī)時(shí)間,并且降低虛擬機(jī)可用性。例如,用戶可能常常經(jīng)歷在服務(wù)器重新啟動(dòng)期間五到甚至三十分鐘的停機(jī)時(shí)間。另外,在重新啟動(dòng)的服務(wù)器上托管的虛擬機(jī)中的狀態(tài)信息(例如,計(jì)算結(jié)果、高速緩存臨時(shí)數(shù)據(jù)等)還可能在重新啟動(dòng)期間丟失,這導(dǎo)致數(shù)據(jù)或者工作成果的丟失。
所公開(kāi)的技術(shù)的若干實(shí)施例涉及通過(guò)延期某些種類的服務(wù)器故障、錯(cuò)誤或者問(wèn)題來(lái)提高虛擬機(jī)可用性,并且改進(jìn)虛擬機(jī)停機(jī)時(shí)間的可預(yù)測(cè)性。在某些實(shí)施例中,控制器(例如,數(shù)據(jù)中心管理器)可以使用例如傳感器、代理或者其他適合的機(jī)構(gòu)在立即恢復(fù)之前監(jiān)測(cè)并且檢測(cè)硬件和/或軟件故障、錯(cuò)誤或者問(wèn)題。控制器可以然后確定單獨(dú)的硬件/軟件故障、錯(cuò)誤或者問(wèn)題是否要求立即恢復(fù)或者恢復(fù)可以被延期到更晚的日期/時(shí)間。可延期的硬件故障的示例可以是關(guān)于服務(wù)服務(wù)器的電源分配單元(PDU)或者架頂(TOR)路由器的控制層問(wèn)題(例如,不響應(yīng)于遠(yuǎn)程控制指令)。這樣的控制層問(wèn)題通常地不阻止PDU或者TOR路由器繼續(xù)運(yùn)行,而是可能影響加電/斷電或者執(zhí)行其他操作的以后的嘗試。可延期的軟件故障的示例可以包括操作系統(tǒng)或者設(shè)備驅(qū)動(dòng)中的漏洞,其顯示為防止創(chuàng)建和/或刪除虛擬機(jī)的“使用中的文件”問(wèn)題。服務(wù)器重新啟動(dòng)可以通常減輕或者校正這樣的問(wèn)題。然而,服務(wù)器重新啟動(dòng)還將影響不受漏洞影響但是在相同服務(wù)器上托管的其他虛擬機(jī)。所檢測(cè)的可延期的故障可以被存儲(chǔ)在服務(wù)器上的永久計(jì)算機(jī)可讀存儲(chǔ)器中,或者存在于另一存儲(chǔ)位置并且與特定服務(wù)器相關(guān)聯(lián)。
響應(yīng)于確定檢測(cè)故障的恢復(fù)可以被延期,控制器可以將對(duì)應(yīng)于檢測(cè)到的故障的特定服務(wù)器指定為對(duì)于托管附加的虛擬機(jī)不可用。在將服務(wù)器指定為不可用時(shí),控制器還可以執(zhí)行操作中的一個(gè)或多個(gè)操作,為所指定的服務(wù)器的最終恢復(fù)做準(zhǔn)備。例如,在一個(gè)實(shí)施例中,控制器可以設(shè)置所指定的服務(wù)器可以執(zhí)行重新啟動(dòng)、電力周期、硬件替換或者其他類型的恢復(fù)操作的時(shí)間延遲。控制器還可以繼續(xù)監(jiān)測(cè)正由指定的服務(wù)器執(zhí)行的若干虛擬機(jī)或者其他任務(wù)。響應(yīng)于檢測(cè)到服務(wù)器不再托管虛擬機(jī)或者其他任務(wù),控制器可以指示服務(wù)器執(zhí)行事先安排的(多個(gè))恢復(fù)操作而不管所設(shè)置的時(shí)間延遲。在另外的實(shí)施例中,控制器還可以指示所指定的服務(wù)器存留當(dāng)前在服務(wù)器上托管的所有虛擬機(jī)的狀態(tài)信息。狀態(tài)信息可以存留在服務(wù)器自身上、在網(wǎng)絡(luò)存儲(chǔ)設(shè)備上、在控制器上或者在其他適合的存儲(chǔ)位置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110693615.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F11-00 錯(cuò)誤檢測(cè);錯(cuò)誤校正;監(jiān)控
G06F11-07 .響應(yīng)錯(cuò)誤的產(chǎn)生,例如,容錯(cuò)
G06F11-22 .在準(zhǔn)備運(yùn)算或者在空閑時(shí)間期間內(nèi),通過(guò)測(cè)試作故障硬件的檢測(cè)或定位
G06F11-28 .借助于檢驗(yàn)標(biāo)準(zhǔn)程序或通過(guò)處理作錯(cuò)誤檢測(cè)、錯(cuò)誤校正或監(jiān)控
G06F11-30 .監(jiān)控
G06F11-36 .通過(guò)軟件的測(cè)試或調(diào)試防止錯(cuò)誤
- 一種基于UDP分布式小文件存儲(chǔ)系統(tǒng)及其數(shù)據(jù)處理方法
- 一種新型云計(jì)算管理系統(tǒng)
- 一種云計(jì)算管理裝置
- 一種節(jié)能數(shù)據(jù)服務(wù)器架構(gòu)系統(tǒng)
- 一種基于云計(jì)算的客戶信息管理裝置
- 一種基于即時(shí)通訊技術(shù)的通訊系統(tǒng)
- 服務(wù)器系統(tǒng)及分配服務(wù)器的方法
- 一種MMORPG游戲服務(wù)器端
- 一種訪問(wèn)請(qǐng)求的處理方法、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于Spark技術(shù)的大數(shù)據(jù)脫敏管理系統(tǒng)





