[發(fā)明專利]一種基于代理技術(shù)的網(wǎng)格計(jì)算容錯(cuò)系統(tǒng)及方法有效
| 申請(qǐng)?zhí)枺?/td> | 200910087661.1 | 申請(qǐng)日: | 2009-06-30 |
| 公開(公告)號(hào): | CN101594254A | 公開(公告)日: | 2009-12-02 |
| 發(fā)明(設(shè)計(jì))人: | 廖馨;趙雯;孔文秦;王悅 | 申請(qǐng)(專利權(quán))人: | 中國(guó)運(yùn)載火箭技術(shù)研究院 |
| 主分類號(hào): | H04L12/24 | 分類號(hào): | H04L12/24;H04L12/26;H04L1/22;H04L29/06 |
| 代理公司: | 中國(guó)航天科技專利中心 | 代理人: | 安 麗 |
| 地址: | 100076北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 代理 技術(shù) 網(wǎng)格 計(jì)算 容錯(cuò) 系統(tǒng) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種網(wǎng)格計(jì)算的容錯(cuò)機(jī)制,屬于計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)領(lǐng)域。
背景技術(shù)
網(wǎng)格技術(shù)是近年來(lái)的一項(xiàng)技術(shù)熱點(diǎn),它的目的是實(shí)現(xiàn)資源共享,協(xié)同工作,通過高速網(wǎng)絡(luò)將各種分布的自治的資源聯(lián)合在一起,提供高性能的計(jì)算服務(wù)。網(wǎng)格環(huán)境中的資源具有共享性、非獨(dú)占性、動(dòng)態(tài)性、異構(gòu)性等特性。在網(wǎng)絡(luò)平臺(tái)上存在著各種計(jì)算機(jī)、應(yīng)用程序、數(shù)據(jù)和服務(wù),這些元素本身不可能保證在運(yùn)行中永遠(yuǎn)百分之百正確,并且它們之間的交互也可能會(huì)出現(xiàn)錯(cuò)誤。此外,由于計(jì)算機(jī)故障、網(wǎng)絡(luò)故障、計(jì)算資源被網(wǎng)格計(jì)算外用戶搶占、使用或終止等情況,都有可能會(huì)導(dǎo)致網(wǎng)格節(jié)點(diǎn)不可用。因此,網(wǎng)格環(huán)境中的容錯(cuò)機(jī)制十分必要。
網(wǎng)格容錯(cuò)機(jī)制本身應(yīng)準(zhǔn)確識(shí)別網(wǎng)格計(jì)算中的各類錯(cuò)誤,并能夠采取相應(yīng)的有效措施,并且容錯(cuò)機(jī)制應(yīng)對(duì)整個(gè)網(wǎng)格計(jì)算系統(tǒng)的性能影響盡可能小,網(wǎng)絡(luò)傳輸數(shù)據(jù)和耗費(fèi)的資源盡可能少。
目前,網(wǎng)格環(huán)境中的容錯(cuò)機(jī)制研究通常采用靜態(tài)或動(dòng)態(tài)心跳機(jī)制檢查計(jì)算節(jié)點(diǎn)的可用性,采用設(shè)置備份節(jié)點(diǎn)的方式進(jìn)行冗余設(shè)計(jì)。心跳機(jī)制只能診斷節(jié)點(diǎn)的不可用錯(cuò)誤,對(duì)于作業(yè)的不響應(yīng)錯(cuò)誤等不適用。備份節(jié)點(diǎn)的系統(tǒng)資源開銷較大,恢復(fù)機(jī)制復(fù)雜。在網(wǎng)格環(huán)境下,對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行備份基本是不可行的。華中科技大學(xué)學(xué)報(bào),2006年第34卷中《具有容錯(cuò)機(jī)制的網(wǎng)格監(jiān)控系統(tǒng)》在被監(jiān)控節(jié)點(diǎn)數(shù)據(jù)上設(shè)置采集代理,實(shí)現(xiàn)對(duì)不同平臺(tái)系統(tǒng)性能狀態(tài)的數(shù)據(jù)采集,通過冗余的層次化節(jié)點(diǎn)架構(gòu),減少單點(diǎn)故障造成的影響。但該文中采用的備份策略對(duì)節(jié)點(diǎn)數(shù)有較高要求,也沒有考慮到網(wǎng)格作業(yè)的運(yùn)行需求。計(jì)算機(jī)應(yīng)用研究,2008年第25卷中《網(wǎng)格動(dòng)態(tài)容錯(cuò)服務(wù)架構(gòu)研究》針對(duì)資源崩潰和資源的可用性達(dá)不到最低的QoS標(biāo)準(zhǔn)兩種情況,建立了包括網(wǎng)格錯(cuò)誤檢測(cè)與網(wǎng)格錯(cuò)誤管理的動(dòng)態(tài)容錯(cuò)服務(wù)架構(gòu)。但該文中沒有考慮到網(wǎng)格系統(tǒng)主節(jié)點(diǎn)故障的可能性,也沒有對(duì)具體的錯(cuò)誤處理技術(shù)和流程進(jìn)行說(shuō)明。
發(fā)明內(nèi)容
本發(fā)明的技術(shù)解決問題是:克服現(xiàn)有技術(shù)的不足,提供一種基于代理技術(shù)的網(wǎng)格計(jì)算容錯(cuò)系統(tǒng)及方法,本系統(tǒng)及方法能夠處理網(wǎng)格主節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)的失效錯(cuò)誤,并能針對(duì)計(jì)算節(jié)點(diǎn)的過載情況對(duì)計(jì)算作業(yè)進(jìn)行重新分配和遷移。
本發(fā)明的技術(shù)解決方案是:一種基于代理技術(shù)的網(wǎng)格計(jì)算容錯(cuò)系統(tǒng),包括一個(gè)主節(jié)點(diǎn)、一個(gè)備份節(jié)點(diǎn)和多個(gè)計(jì)算節(jié)點(diǎn);主節(jié)點(diǎn)上設(shè)置主控代理容器、主控代理和主監(jiān)控代理;備份節(jié)點(diǎn)上設(shè)置備份代理容器和備份監(jiān)控代理;每個(gè)計(jì)算節(jié)點(diǎn)上設(shè)置節(jié)點(diǎn)代理容器、監(jiān)控代理和作業(yè)代理;
主控代理,按預(yù)定心跳周期檢查主節(jié)點(diǎn)上是否存在未分發(fā)的工作,為未分發(fā)的工作選擇計(jì)算節(jié)點(diǎn),并將該工作的作業(yè)信息和選擇的計(jì)算節(jié)點(diǎn)地址發(fā)送給主控代理容器;主控代理接收到主監(jiān)控代理的計(jì)算節(jié)點(diǎn)失效信息時(shí),查詢?cè)摴?jié)點(diǎn)上分配的作業(yè)信息,并將作業(yè)狀態(tài)改為“未分發(fā)”;按預(yù)定備份周期檢查是否存在備份節(jié)點(diǎn),當(dāng)存在備份節(jié)點(diǎn)時(shí),則向主控代理容器發(fā)送備份請(qǐng)求;
主控代理容器,接收主控代理的作業(yè)信息和計(jì)算節(jié)點(diǎn)地址,創(chuàng)建作業(yè)代理,并將其遷移到計(jì)算節(jié)點(diǎn)上;接收主控代理的備份請(qǐng)求,備份主控代理,并將其序列化處理成為字節(jié)流,傳輸至備份代理容器;
主監(jiān)控代理,根據(jù)接收的節(jié)點(diǎn)監(jiān)控代理發(fā)出的心跳信號(hào)和狀態(tài)信息,向節(jié)點(diǎn)監(jiān)控代理發(fā)送心跳確認(rèn)消息,或者將計(jì)算節(jié)點(diǎn)的失效消息發(fā)送給主控代理;當(dāng)接收到主控代理發(fā)送的計(jì)算節(jié)點(diǎn)狀態(tài)查詢請(qǐng)求時(shí),發(fā)送所有空閑的計(jì)算節(jié)點(diǎn)狀態(tài);根據(jù)作業(yè)代理發(fā)送的遷移查詢請(qǐng)求,設(shè)置遷移目標(biāo)節(jié)點(diǎn),并向作業(yè)代理發(fā)回遷移條件滿足消息和遷移目標(biāo)節(jié)點(diǎn)地址;
節(jié)點(diǎn)代理容器,根據(jù)接收的作業(yè)代理發(fā)送的遷移請(qǐng)求,將滿足遷移條件的代理掛起,向作業(yè)代理發(fā)送掛起消息,掛起成功后將所述的滿足遷移條件的代理遷移到所述的遷移目標(biāo)節(jié)點(diǎn)上;接收遷移的字節(jié)流,對(duì)該字節(jié)流處理后向節(jié)點(diǎn)代理容器發(fā)送開始或重啟該作業(yè)代理消息;
作業(yè)代理,根據(jù)接收到的節(jié)點(diǎn)代理容器發(fā)送的不同消息,對(duì)計(jì)算節(jié)點(diǎn)上當(dāng)前作業(yè)進(jìn)行處理,分析作業(yè)代理的運(yùn)行情況,將當(dāng)前的負(fù)載水平和作業(yè)運(yùn)行情況發(fā)送給節(jié)點(diǎn)監(jiān)控代理;根據(jù)主監(jiān)控代理發(fā)送的遷移條件滿足消息和遷移目標(biāo)節(jié)點(diǎn)地址,向節(jié)點(diǎn)代理容器發(fā)送遷移請(qǐng)求;
節(jié)點(diǎn)監(jiān)控代理,將接收的作業(yè)代理發(fā)送的負(fù)載水平和作業(yè)運(yùn)行情況與心跳信號(hào)一起合并為心跳信號(hào)和狀態(tài)信息發(fā)送給主監(jiān)控代理;根據(jù)接收的主監(jiān)控代理發(fā)送的心跳確認(rèn)消息,對(duì)主節(jié)點(diǎn)是否失效進(jìn)行判斷,根據(jù)判斷結(jié)果,向備份監(jiān)控代理發(fā)出主節(jié)點(diǎn)錯(cuò)誤消息或主節(jié)點(diǎn)確認(rèn)消息;根據(jù)接收的備份監(jiān)控代理發(fā)送的主節(jié)點(diǎn)地址更改消息,更改自身保存的主節(jié)點(diǎn)和備份節(jié)點(diǎn)的地址;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)運(yùn)載火箭技術(shù)研究院,未經(jīng)中國(guó)運(yùn)載火箭技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910087661.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 防止技術(shù)開啟的鎖具新技術(shù)
- 技術(shù)評(píng)價(jià)裝置、技術(shù)評(píng)價(jià)程序、技術(shù)評(píng)價(jià)方法
- 防止技術(shù)開啟的鎖具新技術(shù)
- 視聽模擬技術(shù)(VAS技術(shù))
- 用于技術(shù)縮放的MRAM集成技術(shù)
- 用于監(jiān)測(cè)技術(shù)設(shè)備的方法和用戶接口、以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 用于監(jiān)測(cè)技術(shù)設(shè)備的技術(shù)
- 技術(shù)偵查方法及技術(shù)偵查系統(tǒng)
- 使用投影技術(shù)增強(qiáng)睡眠技術(shù)
- 基于技術(shù)庫(kù)的技術(shù)推薦方法
- 通過監(jiān)視和分發(fā)網(wǎng)格活動(dòng)促進(jìn)整個(gè)網(wǎng)格環(huán)境管理
- 網(wǎng)格
- 點(diǎn)云網(wǎng)格簡(jiǎn)化系統(tǒng)及方法
- 網(wǎng)格
- CT穿刺引導(dǎo)定位膜
- CT穿刺引導(dǎo)定位膜
- 虛擬現(xiàn)實(shí)三維水體渲染中水體網(wǎng)格的處理方法
- 一種環(huán)境監(jiān)管網(wǎng)格化系統(tǒng)、方法及電子設(shè)備
- 用于海洋結(jié)構(gòu)物與水面網(wǎng)格重疊部分的重建方法
- 一種道具吸附的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





