[發(fā)明專利]一種無冗余保護(hù)集群實現(xiàn)前端業(yè)務(wù)連續(xù)性方法在審
| 申請?zhí)枺?/td> | 201810079291.6 | 申請日: | 2018-01-26 |
| 公開(公告)號: | CN108153606A | 公開(公告)日: | 2018-06-12 |
| 發(fā)明(設(shè)計)人: | 蘇顯新;萬磊;王怡清;冷波 | 申請(專利權(quán))人: | 上海儲迅信息技術(shù)有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07;H04L29/08 |
| 代理公司: | 上海驍象知識產(chǎn)權(quán)代理有限公司 31315 | 代理人: | 趙俊寅 |
| 地址: | 201206 上海市浦東新區(qū)中國(上*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 集群 集群管理程序 前端業(yè)務(wù) 心跳信息 冗余保護(hù) 正常通訊 分布式存儲 節(jié)點宕機 重新設(shè)置 檢測原 檢測 拓?fù)?/a> 移出 副本 判定 重復(fù) | ||
本發(fā)明公開了一種無冗余保護(hù)集群實現(xiàn)前端業(yè)務(wù)連續(xù)性方法,包括如下步驟:S1、集群管理程序通過心跳信息檢測原集群中各節(jié)點是否能正常通訊;S2、設(shè)定時間(Δt,可設(shè)置)之內(nèi)若集群管理程序檢測到有節(jié)點無心跳信息,則判定該節(jié)點宕機,將該節(jié)點記為A;S3、集群管理程序重新設(shè)置集群拓?fù)洌袮節(jié)點從集群中移出;S4、集群管理程序通過心跳信息檢測新集群中各節(jié)點是否能正常通訊;S5、重復(fù)S1?S4。本發(fā)明提供的方法解決了無副本模式保護(hù)的分布式存儲集群的前端業(yè)務(wù)連續(xù)性的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及分布式存儲領(lǐng)域,尤其涉及在無副本模式下如何保證前端業(yè)務(wù)連續(xù)的方法。
背景技術(shù)
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)存儲量呈爆炸式增長,傳統(tǒng)的控制器架構(gòu)存儲已經(jīng)不堪重負(fù),軟件定義存儲(SDS,Software Defined Storage)也應(yīng)運而生。SDS在通用的服務(wù)器上安裝分布式存儲集群管理軟件,將集群中服務(wù)器的本地硬盤組織成一個大規(guī)模,具有容錯性的虛擬化存儲資源池,對上層應(yīng)用提供標(biāo)準(zhǔn)的訪問接口,如NAS、IPSAN、對象接口等等。
通常來講,分布式存儲對集群中的各種資源尤其是存儲介質(zhì)會提供各種容錯保護(hù)機制,常見的集群數(shù)據(jù)保護(hù)措施有副本和糾刪碼兩種。副本就是根據(jù)一定的算法將數(shù)據(jù)在磁盤中寫多份,幾副本就寫幾份;糾刪碼(Erasure Coding)是一種編碼傳輸技術(shù),它把數(shù)據(jù)分成多個部分,然后通過一定的數(shù)學(xué)方法計算出數(shù)據(jù)的冗余編碼,然后把原始數(shù)據(jù)和冗余編碼都保存下來。例如,一個數(shù)據(jù)片段可以把它拆分為N份,然后計算出M個校驗碼片段,N+M份數(shù)據(jù)分別存放在不同的地方,可支持M個數(shù)據(jù)片段損壞,然后通過數(shù)學(xué)方法計算出原始數(shù)據(jù)。不管是副本還是糾刪碼,都能容忍一定數(shù)量的硬盤和節(jié)點損壞而保證前端業(yè)務(wù)不中斷。
對于沒有副本和糾刪碼配置,只采用底層RAID算法保護(hù)的分布式集群,磁盤損壞可以通過RAID算法保護(hù)數(shù)據(jù),但在節(jié)點宕機的情況下,前端業(yè)務(wù)必然中斷。
發(fā)明內(nèi)容
有鑒于現(xiàn)有技術(shù)的上述缺陷,本發(fā)明所要解決的技術(shù)問題是提供一種無冗余保護(hù)集群實現(xiàn)前端業(yè)務(wù)連續(xù)性方法,其能夠在無副本或糾刪碼保護(hù)的分布式集群內(nèi)中節(jié)點宕機的情況下,保護(hù)前端業(yè)務(wù)不中斷,待宕機節(jié)點重新恢復(fù)之后又可自動加入集群。
為實現(xiàn)上述目的,本發(fā)明提供了一種無冗余保護(hù)集群實現(xiàn)前端業(yè)務(wù)連續(xù)性方法,包括如下步驟:
S1、集群管理程序通過心跳信息檢測原集群中各節(jié)點是否能正常通訊;
S2、設(shè)定時間(Δt,可設(shè)置)之內(nèi)若集群管理程序檢測到有節(jié)點無心跳信息,則判定該節(jié)點宕機,將該節(jié)點記為A;
S3、集群管理程序重新設(shè)置集群拓?fù)洌袮節(jié)點從集群中移出;
S4、集群管理程序通過心跳信息檢測新集群中各節(jié)點是否能正常通訊;
S5、重復(fù)S1-S4。
優(yōu)選地,還包括如下步驟:S6、集群管理程序通過心跳信息檢測原集群中各節(jié)點,包括已被S3所移出的節(jié)點A是否能正常通訊;如果有不同于A節(jié)點的其它節(jié)點無心跳信息,將該節(jié)點記為B,同時把B節(jié)點從新集群中移出;如果A節(jié)點心跳信息復(fù)活,則再次把A節(jié)點加入新集群。
優(yōu)選地,還包括如下步驟:S7、所有涉及到集群內(nèi)節(jié)點的移出和加入操作之后,都需要根據(jù)新集群的總節(jié)點數(shù),磁盤數(shù)以及用戶路徑,重新設(shè)置HASH映射算法,將后續(xù)上層應(yīng)用下發(fā)的數(shù)據(jù)重映射至新集群中健康節(jié)點的具體磁盤中,保證數(shù)據(jù)在健康節(jié)點上落盤。
本發(fā)明的有益效果是:本發(fā)明提供的方法解決了無冗余保護(hù)的分布式存儲集群的前端業(yè)務(wù)連續(xù)性的問題。
附圖說明
圖1是本發(fā)明實施例中的集群自動收縮和擴容的主程序流程圖。
具體實施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海儲迅信息技術(shù)有限公司,未經(jīng)上海儲迅信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810079291.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時維持有效性
- 與集群調(diào)度系統(tǒng)進(jìn)行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計算機介質(zhì)
- 混合云場景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓?fù)涓路椒ā⑾到y(tǒng)、設(shè)備及計算機存儲介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲介質(zhì)
- 精工生產(chǎn)制造過程精細(xì)化管理方法
- 不依賴于管理程序平臺的數(shù)據(jù)中心管理的方法和裝置
- 提供用于HA集群的管理程序的基于應(yīng)用的監(jiān)控及恢復(fù)
- 執(zhí)行多個管理程序的系統(tǒng)和方法
- 基于集群技術(shù)的繼電保護(hù)定值整定計算方法
- 輔助計算機系統(tǒng)中多個管理程序的聯(lián)合操作的系統(tǒng)和方法
- 一種無冗余保護(hù)集群實現(xiàn)前端業(yè)務(wù)連續(xù)性方法
- 一種抓取動態(tài)頁面的方法、系統(tǒng)、設(shè)備及介質(zhì)
- 一種實現(xiàn)應(yīng)用程序運行的方法、裝置、系統(tǒng)及相關(guān)設(shè)備
- 一種多集群補丁更新方法、系統(tǒng)、服務(wù)器和存儲介質(zhì)





