[發(fā)明專(zhuān)利]一種基于網(wǎng)絡(luò)的雙機(jī)環(huán)境下節(jié)點(diǎn)自動(dòng)切換的方法在審
| 申請(qǐng)?zhí)枺?/td> | 201610000774.3 | 申請(qǐng)日: | 2016-01-04 |
| 公開(kāi)(公告)號(hào): | CN105634813A | 公開(kāi)(公告)日: | 2016-06-01 |
| 發(fā)明(設(shè)計(jì))人: | 宋辰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 浪潮電子信息產(chǎn)業(yè)股份有限公司 |
| 主分類(lèi)號(hào): | H04L12/24 | 分類(lèi)號(hào): | H04L12/24 |
| 代理公司: | 濟(jì)南信達(dá)專(zhuān)利事務(wù)所有限公司 37100 | 代理人: | 杜鵑花 |
| 地址: | 250101 山東*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 網(wǎng)絡(luò) 雙機(jī) 環(huán)境 節(jié)點(diǎn) 自動(dòng) 切換 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種節(jié)點(diǎn)自動(dòng)切換的方法,具體地說(shuō)是一種基于網(wǎng)絡(luò)的雙機(jī)環(huán)境下節(jié)點(diǎn)自動(dòng)切換的方法。
背景技術(shù)
當(dāng)下HPC高性能計(jì)算領(lǐng)域,數(shù)據(jù)量的飛速增長(zhǎng)和計(jì)算作業(yè)對(duì)I/O帶寬的要求日益增加,NFS文件系統(tǒng)已經(jīng)不能滿足網(wǎng)絡(luò)文件系統(tǒng)的需求。Lustre作為一款開(kāi)源的并行文件系統(tǒng),其強(qiáng)大的擴(kuò)展性能已經(jīng)廣泛應(yīng)用于高性能計(jì)算集群環(huán)境中。
但隨著Lustre文件系統(tǒng)對(duì)容量和帶寬能夠滿足計(jì)算I/O帶寬需求的同時(shí),Lustre服務(wù)器的壓力也逐漸增大,尤其是元數(shù)據(jù)服務(wù)器(MDS)。作為存儲(chǔ)Lustre元數(shù)據(jù)的節(jié)點(diǎn),壓力越大,故障率也越高。高可用性對(duì)于集群的重要性不言而喻,不但維護(hù)集群硬件架構(gòu)的穩(wěn)定,減少故障的發(fā)生,而且能確保文件系統(tǒng)的穩(wěn)定。一旦集群文件系統(tǒng)發(fā)生故障,對(duì)于集群是災(zāi)難性的,帶來(lái)生產(chǎn)環(huán)境的中斷甚至數(shù)據(jù)的丟失,風(fēng)險(xiǎn)不言而喻。
發(fā)明內(nèi)容
本發(fā)明的技術(shù)任務(wù)是提供一種基于網(wǎng)絡(luò)的雙機(jī)環(huán)境下節(jié)點(diǎn)自動(dòng)切換的方法,來(lái)解決如何避免單點(diǎn)元數(shù)據(jù)服務(wù)器宕機(jī)導(dǎo)致整個(gè)Lustre文件系統(tǒng)的不可用的問(wèn)題。
本發(fā)明的技術(shù)任務(wù)是按以下方式實(shí)現(xiàn)的,
一種基于網(wǎng)絡(luò)的雙機(jī)環(huán)境下節(jié)點(diǎn)自動(dòng)切換的方法,所涉及到的硬件包括存儲(chǔ)服務(wù)器、InfiniBand交換機(jī)、以太網(wǎng)交換機(jī)、管理節(jié)點(diǎn)、備用管理節(jié)點(diǎn)、登陸節(jié)點(diǎn)、mds節(jié)點(diǎn)和oss節(jié)點(diǎn),管理節(jié)點(diǎn)、備用管理節(jié)點(diǎn)、登陸節(jié)點(diǎn)均通過(guò)以太網(wǎng)交換機(jī)聯(lián)機(jī)到mdt節(jié)點(diǎn)和ost節(jié)點(diǎn),存儲(chǔ)服務(wù)器通過(guò)以太網(wǎng)交換機(jī)分別連接到管理節(jié)點(diǎn)、備用管理節(jié)點(diǎn)、登陸節(jié)點(diǎn)、mdt節(jié)點(diǎn)和ost節(jié)點(diǎn);所述方法包括如下步驟:
(1)、在所有mds節(jié)點(diǎn)和oss節(jié)點(diǎn)部署heartbeat服務(wù);
(2)、根據(jù)集群實(shí)際環(huán)境修改ha.cf文件代碼;
(3)、開(kāi)啟heartbeat服務(wù),查看是否所有IO節(jié)點(diǎn)均運(yùn)行了該服務(wù);
(4)、不卸載Lustre分區(qū),手動(dòng)將MDS節(jié)點(diǎn)的以太網(wǎng)口down掉,觀察切換過(guò)程;
(5)、確認(rèn)剩余恢復(fù)時(shí)間,待time_remaining計(jì)時(shí)完畢后,確認(rèn)Lustre分區(qū)仍舊正常。
mds節(jié)點(diǎn)包括MDS01節(jié)點(diǎn)和MDS02節(jié)點(diǎn),MDS01節(jié)點(diǎn)為mdt主節(jié)點(diǎn),MDS02節(jié)點(diǎn)為mdt備用節(jié)點(diǎn)。
oss節(jié)點(diǎn)包括OSS01節(jié)點(diǎn)、OSS02節(jié)點(diǎn)、OSS03節(jié)點(diǎn)和OSS04節(jié)點(diǎn);OSS01節(jié)點(diǎn)、OSS02節(jié)點(diǎn)、OSS03節(jié)點(diǎn)和OSS04節(jié)點(diǎn)均為ost掛載節(jié)點(diǎn)。
OSS01節(jié)點(diǎn)掛載ost00和ost01;OSS02節(jié)點(diǎn)掛載ost02和ost03;OSS03節(jié)點(diǎn)掛載ost04和ost05;OSS04節(jié)點(diǎn)掛載ost06,ost07。
本發(fā)明的一種基于網(wǎng)絡(luò)的雙機(jī)環(huán)境下節(jié)點(diǎn)自動(dòng)切換的方法具有以下優(yōu)點(diǎn):
1、通過(guò)該方法實(shí)時(shí)監(jiān)控網(wǎng)絡(luò)心跳,雙機(jī)環(huán)境下當(dāng)主節(jié)點(diǎn)由于故障失效時(shí),心跳機(jī)制自動(dòng)將主節(jié)點(diǎn)故障信號(hào)告知備用節(jié)點(diǎn),備用節(jié)點(diǎn)自動(dòng)接管主節(jié)點(diǎn)的服務(wù)或存儲(chǔ)空間的掛載。通過(guò)編寫(xiě)腳本并部署到如Lustre文件系統(tǒng)中的MDS節(jié)點(diǎn)以及OSS節(jié)點(diǎn),將這兩種節(jié)點(diǎn)的服務(wù)冗余化,實(shí)現(xiàn)mdt的不間斷工作,保證Lustre文件系統(tǒng)的正常工作;
2、該部署方式基于腳本部署,通過(guò)安裝相關(guān)服務(wù)在指定目錄下,定時(shí)檢測(cè)網(wǎng)絡(luò)環(huán)境,而自身僅占用少量系統(tǒng)資源。且通過(guò)對(duì)腳本的修改,可應(yīng)用于多種不同HA環(huán)境,多種集群環(huán)境;
3、該應(yīng)用部署后,不影響存儲(chǔ)及文件系統(tǒng)性能,占用存儲(chǔ)服務(wù)器資源小,在MDS活動(dòng)節(jié)點(diǎn)切換后,mdt自動(dòng)恢復(fù)可用性,無(wú)需手動(dòng)操作;當(dāng)OSS單點(diǎn)失效后,互為冗余的另一OSS自動(dòng)接管失效的ost,自動(dòng)掛載,并檢查可用性。待檢查完成,恢復(fù)原ost的讀寫(xiě)。
附圖說(shuō)明
下面結(jié)合附圖對(duì)本發(fā)明進(jìn)一步說(shuō)明。
附圖1為一種基于網(wǎng)絡(luò)的雙機(jī)環(huán)境下節(jié)點(diǎn)自動(dòng)切換的方法的硬件結(jié)構(gòu)框圖。
具體實(shí)施方式
參照說(shuō)明書(shū)附圖和具體實(shí)施例對(duì)本發(fā)明的一種基于網(wǎng)絡(luò)的雙機(jī)環(huán)境下節(jié)點(diǎn)自動(dòng)切換的方法作以下詳細(xì)地說(shuō)明。
實(shí)施例1:
本發(fā)明的一種基于網(wǎng)絡(luò)的雙機(jī)環(huán)境下節(jié)點(diǎn)自動(dòng)切換的方法,所涉及到的硬件包括存儲(chǔ)服務(wù)器、InfiniBand交換機(jī)、以太網(wǎng)交換機(jī)、管理節(jié)點(diǎn)、備用管理節(jié)點(diǎn)、登陸節(jié)點(diǎn)、mds節(jié)點(diǎn)和oss節(jié)點(diǎn),管理節(jié)點(diǎn)、備用管理節(jié)點(diǎn)、登陸節(jié)點(diǎn)均通過(guò)以太網(wǎng)交換機(jī)聯(lián)機(jī)到mdt節(jié)點(diǎn)和ost節(jié)點(diǎn),存儲(chǔ)服務(wù)器通過(guò)以太網(wǎng)交換機(jī)分別連接到管理節(jié)點(diǎn)、備用管理節(jié)點(diǎn)、登陸節(jié)點(diǎn)、mdt節(jié)點(diǎn)和ost節(jié)點(diǎn);所述方法包括如下步驟:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于浪潮電子信息產(chǎn)業(yè)股份有限公司,未經(jīng)浪潮電子信息產(chǎn)業(yè)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610000774.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 一種雙機(jī)備份的實(shí)現(xiàn)方法
- 基于代理進(jìn)程的雙機(jī)應(yīng)用系統(tǒng)的監(jiān)控方法
- 一種智能網(wǎng)業(yè)務(wù)控制設(shè)備容災(zāi)系統(tǒng)
- 實(shí)現(xiàn)一號(hào)雙機(jī)短信業(yè)務(wù)功能的系統(tǒng)及其方法
- 多級(jí)雙機(jī)系統(tǒng)及其倒換方法
- 一種基于內(nèi)存換頁(yè)同步的雙機(jī)熱備方法
- 云平臺(tái)雙機(jī)容災(zāi)系統(tǒng)的自動(dòng)部署方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種雙機(jī)熱備系統(tǒng)中的主備切換方法
- 基于雙目視覺(jué)的雙臂機(jī)器人協(xié)調(diào)控制方法
- 一種基于雙機(jī)械臂的船體外板曲面成形無(wú)碰撞運(yùn)動(dòng)規(guī)劃方法
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)終端和環(huán)境檢測(cè)系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計(jì)裝置和環(huán)境估計(jì)方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車(chē)輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動(dòng)力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)儀(環(huán)境貓)





