[發明專利]一種長距infiniband鏈路檢測切換修復的方法有效
| 申請號: | 201710606374.1 | 申請日: | 2017-07-24 |
| 公開(公告)號: | CN107547260B | 公開(公告)日: | 2020-12-22 |
| 發明(設計)人: | 王浩;李建輝;熊中哲;魏興華;臧冰凌;李春;陳棟;張文件;羅春 | 申請(專利權)人: | 杭州沃趣科技股份有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24 |
| 代理公司: | 浙江杭知橋律師事務所 33256 | 代理人: | 王梨華;陳麗霞 |
| 地址: | 310052 浙江省杭州市濱江區長河街道濱*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 infiniband 檢測 切換 修復 方法 | ||
本發明涉及數據庫技術領域,公開了一種長距infiniband鏈路檢測切換修復的方法,包括以下步驟:(1)環境搭建:將第一機房和第二機房內的計算節點、存儲節點、所有類型的IB交換機接入同一個網絡內,使兩者網絡連通并能夠相互通信;(2)獲取延遲:在第一機房或第二機房的服務器內啟動鏈路檢測切換修復程序;(3)修復延遲:根據步驟(2)獲取到的實時鏈路延遲信息,如果檢測到異常狀態或延遲時間超過警戒閥值則進行鏈路切換,并對有問題的鏈路網絡進行報警。本發明在能夠獲取長距infiniband鏈路的實時狀態;長距infiniband設備出現問題能夠主動推送通知,出現問題能夠進行自動切換和修復;提供了一個整體視角來展示集群拓撲,實時整體網絡流量,實時整體網絡延遲。
技術領域
本發明涉及數據庫技術領域,特別是涉及一種長距infiniband鏈路檢測切換修復的方法。
背景技術
在長距infiniband的使用過程中,如何獲取到長距infiniband的當前狀態,并能夠對故障發生時嘗試進行修復,減少故障的影響時間。
雙活系統中業務系統跨兩個獨立的機房,中間通過長距infiniband連接,因此做長距鏈路檢測切換修復需要包括三個步驟:
1.檢查各個機房內的infiniband的連接狀態;
2.檢查跨機房的長距infiniband的連接狀態;
3.如果跨機房的長距infiniband鏈路出現問題進行切換修復。
現有產品只包含單個IB交換機的管理,沒有形成一個統一的平臺管理,如果整體集群包括數量很多的infiniband交換機,導致問題如下:
1.無法觀察到整體集群拓撲和全局信息;
2.對某臺交換機的操作需要進入到單個頁面一個一個操作;
3.沒有形成一個統一的鏈路切換修復的流程。
發明內容
本發明針對現有技術中的缺點,提供了一種長距infiniband鏈路檢測切換修復的方法。
為了解決上述技術問題,本發明通過下述技術方案得以解決。
一種長距infiniband鏈路檢測切換修復的方法,包括如下步驟:
(1)環境搭建:將第一機房內的計算節點、存儲節點、所有類型的IB交換機接入同一個網絡內;對第二機房進行相同的設置,使兩者網絡連通并能夠相互通信;
(2)獲取延遲:在第一機房或第二機房的服務器內啟動鏈路檢測切換修復程序,采用Linux操作系統本身自帶的PING工具測試該機房內部的網絡通信狀態、跨機房的網絡通信狀態;通過檢測狀態信息的工具獲取第一機房和第二機房各個節點上的IB端口鏈路的延遲,和第一機房IB交換機的IB端口與第二機房IB交換機IB端口之間的延遲;
(3)修復延遲:根據步驟(2)獲取到的實時鏈路延遲信息,如果檢測到異常狀態或延遲時間超過警戒閥值則進行鏈路切換,鏈路切換通過切換工具完成對IB端口的啟動和關閉,并對有問題的鏈路網絡進行報警,異常處理完成后完成鏈路切換。
作為優選,采用snmp來獲取infiniband交換機的基本信息,基本信息包括ib端口狀態/基本信息、交換機基本信息、ib端口連接線纜長度/類型。
作為優選,IB交換機包括普通IB交換機和長距IB交換機。
作為優選,步驟(3)中,鏈路切換判斷過程為,在一分鐘時間內,網絡延遲超過1ms,則判斷為需要進行切換。
本發明由于采用了以上技術方案,具有顯著的技術效果:
1.在能夠獲取長距infiniband鏈路的實時狀態;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州沃趣科技股份有限公司,未經杭州沃趣科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710606374.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種飛行器的自主定位方法和系統
- 下一篇:一種無人機全自動單人照拍攝方法





