[發明專利]一種存儲鏈路的故障檢測方法、裝置、設備及存儲介質在審
| 申請號: | 202010746811.1 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111858122A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 韓廷卯 | 申請(專利權)人: | 北京浪潮數據技術有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 侯珊 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 存儲 故障 檢測 方法 裝置 設備 介質 | ||
本發明公開了一種存儲鏈路的故障檢測方法,包括:獲取存儲鏈路的鏈路物理狀態;存儲鏈路為存儲主系統通過目標控制器訪問目標硬盤的鏈路;判斷鏈路物理狀態是否為離線狀態;若是,則判定存儲鏈路為故障鏈路,并觸發鏈路切換操作;若否,則基于鏈路層和應用層判斷存儲鏈路是否為故障鏈路;若是,則判定存儲鏈路為故障鏈路,并觸發鏈路切換操作;若否,則結束流程。可以看出,本申請分別從物理層、鏈路層和應用層這三個層面來檢測鏈路是否為故障鏈路,可提高故障檢測的準確度,減低因鏈路故障帶來的性能損耗及數據丟失風險;本發明還公開了一種存儲鏈路的故障檢測裝置、設備及存儲介質,同樣能實現上述技術效果。
技術領域
本發明涉及存儲技術領域,更具體地說,涉及一種存儲鏈路的故障檢測方法、裝置、設備及存儲介質。
背景技術
目前,存儲設備對可靠性的要求很高,因此,日常對存儲設備的運維管理至關重要。現在越來越多的智能管理手段被用于存儲設備,如檢測存儲設備的運行狀態、隔離故障等,避免產生更嚴重的影響,不但減少了人力成本,還提高了準確性與及時性。而對于雙控冗余設計的存儲設備,存儲主系統對后端硬盤的訪問是均勻分布在兩個控制器上的,但是對于某一顆硬盤的訪問,一般是通過固定選擇的一條鏈路進行通信的。如果存在鏈路不穩定的情況,這時如果還在原鏈路上執行IO(Input Output,輸入輸出)操作,則會降低IO操作性能,并產生數據丟失風險。因此,如何準確的檢測出存儲主系統與后端硬盤之間的故障鏈路,是本領域技術人員需要解決的問題。
發明內容
本發明的目的在于提供一種存儲鏈路的故障檢測方法、裝置、設備及存儲介質,以準確的檢測出存儲主系統與后端硬盤之間的故障鏈路。
為實現上述目的,本發明提供一種存儲鏈路的故障檢測方法,包括:
獲取存儲鏈路的鏈路物理狀態;其中,所述存儲鏈路為存儲主系統通過目標控制器訪問目標硬盤的鏈路;
判斷所述鏈路物理狀態是否為離線狀態;
若是,則判定所述存儲鏈路為故障鏈路,并觸發鏈路切換操作;若否,則基于鏈路層和應用層判斷所述存儲鏈路是否為故障鏈路;若是,則判定所述存儲鏈路為故障鏈路,并觸發鏈路切換操作;若否,則結束流程。
其中,所述基于鏈路層和應用層判斷所述存儲鏈路是否為故障鏈路,包括:
判斷與所述存儲鏈路對應的CRC錯誤計數是否超過預定閾值;
若是,則判定所述存儲鏈路為故障鏈路,并觸發鏈路切換操作;
若否,則判斷與所述存儲鏈路對應的硬盤登陸狀態是否為登陸失敗;若硬盤登陸狀態為登陸失敗,則判定所述存儲鏈路為故障鏈路,并觸發鏈路切換操作;否則,結束流程。
其中,所述獲取存儲鏈路的鏈路物理狀態,包括:
以預定時長為周期獲取所述存儲鏈路的鏈路物理狀態。
其中,所述觸發鏈路切換操作包括:
將所述存儲鏈路切換為:通過除所述目標控制器之外的其他控制器訪問所述目標硬盤的鏈路。
其中,判定所述存儲鏈路為故障鏈路之后,還包括:
生成所述存儲鏈路為故障鏈路的告警信息。
其中,所述生成所述存儲鏈路為故障鏈路的告警信息,包括:
確定所述存儲鏈路的故障原因信息;
利用所述故障原因信息生成與所述存儲鏈路對應的故障告警信息。
為實現上述目的,本發明進一步提供一種存儲鏈路的故障檢測裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京浪潮數據技術有限公司,未經北京浪潮數據技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010746811.1/2.html,轉載請聲明來源鉆瓜專利網。





