[發(fā)明專利]在分布式集群中的可擴(kuò)展故障恢復(fù)通信有效
| 申請(qǐng)?zhí)枺?/td> | 201580043261.4 | 申請(qǐng)日: | 2015-08-09 |
| 公開(公告)號(hào): | CN106663030B | 公開(公告)日: | 2020-09-18 |
| 發(fā)明(設(shè)計(jì))人: | A·庫(kù)瑪;A·德阿馬托;D·A·迪昂;G·尼沙諾維;L·S·科波魯;N·馬利瓦基 | 申請(qǐng)(專利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類號(hào): | G06F9/48 | 分類號(hào): | G06F9/48;G06F9/50 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 王茂華;楊立 |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分布式 集群 中的 擴(kuò)展 故障 恢復(fù) 通信 | ||
1.一種在包括至少一個(gè)處理器的計(jì)算機(jī)系統(tǒng)處的用于在節(jié)點(diǎn)集群中的計(jì)算節(jié)點(diǎn)之間傳遞工作負(fù)載更新的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括:
所述計(jì)算機(jī)系統(tǒng)標(biāo)識(shí)來(lái)自所述節(jié)點(diǎn)集群的、已被分配用于托管工作負(fù)載配置的工作節(jié)點(diǎn),所述工作負(fù)載配置包括被分配給所述工作節(jié)點(diǎn)的處理分配;
所述計(jì)算機(jī)系統(tǒng)從所述工作節(jié)點(diǎn)接收包括針對(duì)所述工作節(jié)點(diǎn)的健康狀態(tài)以及至少版本標(biāo)識(shí)符,所述版本標(biāo)識(shí)符標(biāo)識(shí)當(dāng)前被分配給所述工作節(jié)點(diǎn)的所述工作負(fù)載配置;
所述計(jì)算機(jī)系統(tǒng)確定在數(shù)據(jù)分組中接收到的所述版本標(biāo)識(shí)符不同于先前接收到的數(shù)據(jù)分組的版本標(biāo)識(shí)符;
所述計(jì)算機(jī)系統(tǒng)至少基于接收到的所述版本標(biāo)識(shí)符來(lái)評(píng)估所述工作節(jié)點(diǎn)的、當(dāng)前被分配的工作負(fù)載配置,以確定是否要對(duì)當(dāng)前被分配給所述工作節(jié)點(diǎn)的所述工作負(fù)載配置做出處理分配變更;
所述計(jì)算機(jī)系統(tǒng)確定要對(duì)當(dāng)前被分配給所述工作節(jié)點(diǎn)的所述工作負(fù)載配置做出處理分配變更;
所述計(jì)算機(jī)系統(tǒng)確定處理分配變更的集合以發(fā)送到所述工作節(jié)點(diǎn);
所述計(jì)算機(jī)系統(tǒng)選擇確定的所述處理分配變更的集合中的子集以發(fā)送到所述工作節(jié)點(diǎn);
所述計(jì)算機(jī)系統(tǒng)生成所選擇的處理分配變更的所述子集以分配分組的形式發(fā)送到所述工作節(jié)點(diǎn)的指示,所述分配分組與所選擇的所述子集基于帶寬限制來(lái)組合以避免超過(guò)用于傳送所述分配分組的協(xié)議的預(yù)定的最大傳輸單元;以及
所述計(jì)算機(jī)系統(tǒng)向所述工作節(jié)點(diǎn)發(fā)送所述分配分組,包括所述工作節(jié)點(diǎn)更新所述版本標(biāo)識(shí)符的指示,導(dǎo)致當(dāng)前被分配給所述工作節(jié)點(diǎn)的所述處理分配和所述版本標(biāo)識(shí)符兩者在所述工作節(jié)點(diǎn)處被更新。
2.根據(jù)權(quán)利要求1所述的方法,其中所生成的所述分配分組經(jīng)由容錯(cuò)通信協(xié)議被發(fā)送到所述工作節(jié)點(diǎn)。
3.根據(jù)權(quán)利要求2所述的方法,其中所述容錯(cuò)通信協(xié)議指定由所述計(jì)算系統(tǒng)每時(shí)間段發(fā)送或接收的數(shù)據(jù)分組的數(shù)目的上限。
4.根據(jù)權(quán)利要求1所述的方法,其中所述處理分配變更包括以下各項(xiàng)中的至少一項(xiàng):將工作負(fù)載添加到所述工作節(jié)點(diǎn)、從所述工作節(jié)點(diǎn)移除工作負(fù)載、或改變所述工作節(jié)點(diǎn)上的一個(gè)或多個(gè)工作負(fù)載。
5.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括:
確定所述帶寬限制應(yīng)用于工作負(fù)載變更的所述指示。
6.根據(jù)權(quán)利要求1所述的方法,其中評(píng)估所述工作節(jié)點(diǎn)的當(dāng)前工作負(fù)載配置以確定是否要在所述工作節(jié)點(diǎn)上做出工作負(fù)載變更包括:將所述工作節(jié)點(diǎn)的、當(dāng)前被分配的所述工作負(fù)載配置與主節(jié)點(diǎn)關(guān)于哪些工作負(fù)載要由所述工作節(jié)點(diǎn)處理的指示進(jìn)行比較。
7.根據(jù)權(quán)利要求6所述的方法,其中對(duì)所述工作節(jié)點(diǎn)所生成的工作負(fù)載變更的所述指示包括:在所述工作節(jié)點(diǎn)的、當(dāng)前被分配的所述工作負(fù)載配置的指示與所述主節(jié)點(diǎn)關(guān)于哪些工作負(fù)載要由所述工作節(jié)點(diǎn)處理的指示之間的差量。
8.根據(jù)權(quán)利要求1所述的方法,其中帶寬限制針對(duì)被用于與所述計(jì)算系統(tǒng)或所述工作節(jié)點(diǎn)通信的每個(gè)協(xié)議被指定。
9.根據(jù)權(quán)利要求1所述的方法,其中所生成的工作負(fù)載變更的所述指示作為狀態(tài)查詢消息的一部分被發(fā)送到所述工作節(jié)點(diǎn)。
10.根據(jù)權(quán)利要求9所述的方法,其中所述狀態(tài)查詢消息以指定的間隔被發(fā)送到所述工作節(jié)點(diǎn),所述指定的間隔對(duì)應(yīng)于由所述工作節(jié)點(diǎn)正在處理的所述工作負(fù)載的優(yōu)先級(jí)。
11.根據(jù)權(quán)利要求10所述的方法,其中所述狀態(tài)查詢消息被發(fā)送到所述工作節(jié)點(diǎn)的所述指定間隔根據(jù)為所述工作負(fù)載指定的所述優(yōu)先級(jí)而動(dòng)態(tài)地改變。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580043261.4/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時(shí)維持有效性
- 與集群調(diào)度系統(tǒng)進(jìn)行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺(tái)多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點(diǎn)和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計(jì)算機(jī)介質(zhì)
- 混合云場(chǎng)景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓?fù)涓路椒ā⑾到y(tǒng)、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)





