[發(fā)明專利]集群式數(shù)據(jù)處理系統(tǒng)中的存儲裝置管理有效
| 申請?zhí)枺?/td> | 201180053200.8 | 申請日: | 2011-10-24 |
| 公開(公告)號: | CN103189847A | 公開(公告)日: | 2013-07-03 |
| 發(fā)明(設計)人: | G·梅維尼;J·帕弗米;D·尼瓦里茨;J·J·羅薩萊斯 | 申請(專利權)人: | 國際商業(yè)機器公司 |
| 主分類號: | G06F11/14 | 分類號: | G06F11/14;G06F11/20 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 酆迅 |
| 地址: | 美國紐*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 集群 數(shù)據(jù)處理系統(tǒng) 中的 存儲 裝置 管理 | ||
1.一種用于操作數(shù)據(jù)處理系統(tǒng)的方法,所述數(shù)據(jù)處理系統(tǒng)具有處理器、耦合到所述處理器的存儲器、支持到具有共享存儲貯存庫的外部網(wǎng)絡的連接的至少一個輸入/輸出(I/O)適配器、以及形成具有共享數(shù)據(jù)庫的虛擬I/0服務器(VIOS)集群的多個VIOS,其中每個VIOS是集群感知的,所述方法包括:
在第一服務器的第一VIOS上激活第一監(jiān)視線程以跟蹤活動分區(qū)移動性(LPM)事件的狀況;
通過使用所述第一監(jiān)視線程在所述共享數(shù)據(jù)庫內(nèi)記錄關于所述LPM事件的信息;
響應于所述第一VIOS遭受故障條件而標識繼續(xù)在源服務器上工作的一個或者多個工作中的監(jiān)視線程,其中所述故障條件造成所述第一監(jiān)視線程對LPM事件監(jiān)視的丟失;
確定所述一個或者多個工作中的監(jiān)視線程是否為單個、最后的監(jiān)視線程;以及
響應于在所述第一服務器上的第一VIOS處于故障狀態(tài)而經(jīng)由所述最后的監(jiān)視線程在所述共享數(shù)據(jù)庫內(nèi)執(zhí)行清理和更新操作,其中響應于接收到在所述第一服務器上存在處于所述故障狀態(tài)的一個或者多個節(jié)點的指示來執(zhí)行所述清理和更新。
2.根據(jù)權利要求1所述的方法,其中所述激活第一監(jiān)視線程還包括:
檢測LPM事件的發(fā)起;以及
響應于檢測到所述LPM事件的所述發(fā)起,創(chuàng)建以下各項中的一項或者多項:(a)在所述集群感知數(shù)據(jù)處理系統(tǒng)內(nèi)的所述第一服務器上的所述第一VIOS上的所述第一監(jiān)視線程;(b)在所述第一服務器上的其它VIOS上的第一組監(jiān)視線程;以及(c)在第二目標服務器上的VIOS上的第二組監(jiān)視線程。
3.根據(jù)權利要求1或者2所述的方法,其中所述記錄還包括:
使用所述監(jiān)視線程將關于所述LPM事件的信息記錄到移動性表中,
其中所記錄的信息包括關于以下各項中的一項或者多項的信息:(a)客戶端;(b)所述服務器;以及(c)參與所述LPM事件的對應VIOS的狀況;
確定所述LPM事件何時被終止;以及
響應于所述LPM事件被終止而經(jīng)由所述第一監(jiān)視線程提供以下各項中的一項或者多項:(a)對存儲資源的相關聯(lián)更新;(b)在所述數(shù)據(jù)庫的移動性表中去除對應條目;以及(c)其它維護操作。
4.根據(jù)任一前述權利要求所述的方法,還包括:
檢測與所述LPM對應的虛擬化的客戶端分區(qū)相關聯(lián)的特定VIOS何時已經(jīng)遭受故障條件;
響應于檢測到所述特定VIOS已經(jīng)遭受所述故障條件并且對應的監(jiān)視線程不再存在,而向在所述集群感知DPS內(nèi)的相同服務器上的其它VIOS提供所述VIOS的所述故障狀態(tài)的通知;以及
使得所述其它VI0S中的一個或者多個VIOS能夠在所述數(shù)據(jù)庫中適當?shù)馗翷PM事件狀況。
5.根據(jù)任一前述權利要求所述的方法,還包括:
發(fā)起由其它監(jiān)視線程經(jīng)由所述其它監(jiān)視線程與管理程序的通信而對所述LPM事件的狀態(tài)的不斷檢查;
確定所述LPM事件是否為以下各項之一:(a)終止;(b)完成;以及(c)處于故障狀態(tài);
響應于所述LPM事件結(jié)束而向所述其它監(jiān)視線程提供:(a)指示所述LPM事件結(jié)束的信息;以及(b)關于當前監(jiān)視所述LPM事件的所述組的其它監(jiān)視線程的計數(shù)的信息;
響應于所述組的其它監(jiān)視線程為單個、最后的監(jiān)視線程,而經(jīng)由所述最后監(jiān)視線程發(fā)起對所述數(shù)據(jù)庫的查詢以確定在適當?shù)姆掌魃鲜欠翊嬖谔幱诠收蠣顟B(tài)的節(jié)點;以及
響應于在所述適當?shù)姆掌魃系墓?jié)點處于故障狀態(tài),而經(jīng)由所述最后的監(jiān)視線程在對應移動性表上執(zhí)行包括以下操作中的一個或者多個操作的更新操作:(a)為了將所述數(shù)據(jù)庫保持為一致且當前的而需要的操作;(b)從所述對應移動性表去除對應行/條目;以及(c)其它維護操作。
6.根據(jù)權利要求5所述的方法,還包括:
響應于所述LPM事件已經(jīng)作為故障條件的結(jié)果而結(jié)束,返回至對應遷移過程的特定階段以便恢復和完成所述移動性操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業(yè)機器公司,未經(jīng)國際商業(yè)機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201180053200.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種可拆卸風力發(fā)電機組葉片及其裝拆方法
- 下一篇:模式切換
- 一種集群調(diào)度呼叫業(yè)務中主叫終端信息顯示方法
- 更新網(wǎng)絡流量管理設備同時維持有效性
- 與集群調(diào)度系統(tǒng)進行通信的方法、群集接入網(wǎng)關及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺多集群構建方法、介質(zhì)、設備
- 一種容災系統(tǒng)、容災處理方法、監(jiān)控節(jié)點和備份集群
- 一種ETCD集群恢復方法、系統(tǒng)、設備及計算機介質(zhì)
- 混合云場景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓撲更新方法、系統(tǒng)、設備及計算機存儲介質(zhì)
- 集群切換方法、集群切換裝置、電子設備及可讀存儲介質(zhì)
- 在數(shù)據(jù)處理系統(tǒng)中基于所需電池壽命的計算機電源管理
- 在網(wǎng)絡數(shù)據(jù)處理系統(tǒng)中安裝軟件的方法和系統(tǒng)
- 遠程數(shù)據(jù)處理系統(tǒng)的配置
- 多個子據(jù)處理系統(tǒng)之間在線切換的方法
- 跨境多幣種數(shù)據(jù)處理系統(tǒng)和方法
- 用于批量和實時數(shù)據(jù)處理的設備、系統(tǒng)和方法
- 動態(tài)地調(diào)整品牌和平臺界面元素
- 基于銀行卡交易的數(shù)據(jù)處理方法以及數(shù)據(jù)處理系統(tǒng)
- 數(shù)據(jù)處理方法、裝置和設備
- 用于批量和實時數(shù)據(jù)處理的設備、系統(tǒng)和方法





