[發(fā)明專利]對互連失效在群集范圍內的一致性檢測有效
| 申請?zhí)枺?/td> | 201380014134.2 | 申請日: | 2013-02-28 |
| 公開(公告)號: | CN104221004A | 公開(公告)日: | 2014-12-17 |
| 發(fā)明(設計)人: | A·卡特卡爾;O·P·阿加瓦爾;B·薩克爾 | 申請(專利權)人: | 賽門鐵克公司 |
| 主分類號: | G06F15/173 | 分類號: | G06F15/173 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 趙蓉民 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 互連 失效 群集 范圍內 一致性 檢測 | ||
技術領域
本公開總體上涉及對計算機群集的管理,更具體地講,涉及對鏈路失效的群集范圍的一致性檢測。
背景技術
高可用性群集(也稱為HA群集或失效備援群集)是支持以最少的停機時間運行服務器應用程序的計算機(節(jié)點)組。在各個系統(tǒng)組件失效時,高可用性群集使用成組的冗余計算資源來提供連續(xù)服務。更具體地講,高可用性群集通過提供多個服務器、多個網絡連接、冗余數據存儲等來消除單點失效。在不存在群集的情況下,如果運行特定應用程序的服務器失效,則在服務器恢復之前應用程序將不可用。在高可用性群集中,檢測服務器的失效(或由此檢測所使用的特定計算資源諸如網絡適配器、存儲設備等的失效)。于是自動地采取措施以使正在失效的服務器上運行的應用程序保持可用。這可以采用重啟服務器和應用程序、使用不同的網絡資源(例如,網絡適配器),或者在另一個計算系統(tǒng)(即,群集的另一個節(jié)點)上自動地重啟應用程序的形式。該過程稱為“失效備援”。高可用性群集通常用于關鍵服務器應用程序,諸如企業(yè)數據庫、重要的業(yè)務應用程序、電子商務網站等。即便此類應用程序僅出現(xiàn)短期的停工,代價也可能極為高昂,尤其在特定行業(yè)例如銀行業(yè)和電信行業(yè)中。
在計算機存儲中,邏輯卷管理是在大容量存儲設備上分配空間的靈活方法。特別是,卷管理器可將底層物理分區(qū)連接、條帶化到一起或以其他方式組合,以形成更大的虛擬分區(qū)。管理員然后可在不會潛在地中斷系統(tǒng)使用的情況下重設邏輯卷的大小或將其移動。群集卷管理器將邏輯卷管理跨群集的多個節(jié)點擴展,使得每個節(jié)點識別相同的邏輯卷布局,以及所有節(jié)點的所有卷資源的相同狀態(tài)。在進行群集卷管理的情況下,來自群集中任何節(jié)點的對磁盤或卷配置所作出的任何更改都將被群集的所有節(jié)點識別。為了支持群集級的卷管理,在新節(jié)點加入群集并且在現(xiàn)有節(jié)點離開群集時對群集進行重新配置。
群集使用節(jié)點之間的互連(鏈路)進行數據和管理通信。如果鏈路失效,則需要采取糾正措施。從失效備援和其他群集活動恢復的效率和及時性取決于群集能夠檢測和處理鏈路失效的速度。獨立的節(jié)點可使用操作系統(tǒng)服務來檢測其鏈路中的任一個是否失效。在兩個節(jié)點沒有使用任何交換機而直接連接(使用交叉電纜)的情況下,鏈路掉線通知被兩個節(jié)點接收到,使得它們可以并行地對該事件做出反應。然而,在兩個以上的節(jié)點使用交換機耦接的情況下,僅有本地節(jié)點會實時獲悉鏈路失效。因此,由于在群集中存在網絡拓撲結構,所以通常僅有單個節(jié)點或節(jié)點的本地化子組會立即獲悉鏈路失效。傳統(tǒng)上,其他節(jié)點隨后通過群集范圍內的心跳機制獲悉連接失效,其中該心跳機制用于監(jiān)測群集中每個節(jié)點的狀態(tài)。與獨立的節(jié)點獲悉本地鏈路失效所花費的時間相比,心跳機制相對較慢。對群集的適當管理可能取決于群集的每個節(jié)點在采取糾正措施之前知悉鏈路失效。到每個節(jié)點通過心跳機制獲悉失效為止的時間間隔使掉線的連接所必需的任何群集重新配置或失效備援活動延遲,并在群集的管理方面,諸如在隔離仲裁決策的執(zhí)行方面,引起額外的問題。此外,在節(jié)點或群集在不同時間獲悉鏈路失效的情況下,可能發(fā)生錯誤的不期望的恢復活動。
這些問題需要得到解決。
發(fā)明內容
鏈路失效的通知傳播到群集中多個節(jié)點中的每一個。群集特定節(jié)點的特定鏈路的失效,例如通過特定節(jié)點的操作系統(tǒng),被檢測到。特定鏈路失效的通知傳播到群集的所述多個節(jié)點,使得所述節(jié)點并行地處理鏈路掉線事件。執(zhí)行對鏈路失效通知的傳播,使得群集的節(jié)點在由相應心跳的超時獲悉鏈路掉線事件之前就接收到該通知。在一些實施例中,因為也許存在鏈路立即恢復上線的情況,所以鏈路失效的通知僅在等待特定的寬限期之后傳播。
在一個實施例中,通過廣播消息來傳播鏈路失效的通知,該消息向群集的節(jié)點通知特定鏈路的失效。單獨的鏈路被維持,該單獨的鏈路連接至群集的每個節(jié)點并專用于廣播鏈路掉線事件通知消息。該單獨的鏈路可用于向群集的節(jié)點廣播消息。單獨的鏈路可以但不必采用私有鏈路的形式,該私有鏈路不會暴露給群集的用戶。在一個實施例中,確保在對鏈路掉線事件進行處理之前廣播消息已被群集的節(jié)點接收到。這點可例如通過等待從群集的每個節(jié)點接收到確定收到廣播消息的確認而實現(xiàn)。在一個實施例中,如果在給定時間周期內沒有從每個節(jié)點接收到確定收到廣播消息的確認,則重新傳輸廣播消息。
在另一個實施例中,通過將鏈路失效的通知傳輸到所有節(jié)點均可訪問的集中式計算設備來將該通知傳播到群集的節(jié)點。群集的節(jié)點能夠以特定的頻率輪詢集中式計算設備是否有鏈路失效的通知,并通過輪詢獲悉特定鏈路的失效。在一個實施例中,替代輪詢(或除了輪詢之外),集中式計算設備將特定鏈路失效的通知傳輸至群集的節(jié)點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于賽門鐵克公司,未經賽門鐵克公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380014134.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種城市污泥在去除砷中的應用
- 下一篇:一種γ-碘化亞銅的制備方法





