[發(fā)明專利]一種故障檢測方法和裝置有效
申請?zhí)枺?/td> | 201310362422.9 | 申請日: | 2013-08-19 |
公開(公告)號: | CN103457792B | 公開(公告)日: | 2017-02-08 |
發(fā)明(設計)人: | 田舒榕;程岳 | 申請(專利權)人: | 大唐移動通信設備有限公司 |
主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L12/24 |
代理公司: | 北京路浩知識產權代理有限公司11002 | 代理人: | 王瑩 |
地址: | 100083*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 故障 檢測 方法 裝置 | ||
技術領域
本發(fā)明涉及通信技術領域,尤其是一種故障檢測方法和裝置。
背景技術
RNC(Radio?Network?Control,無線網絡控制)設備是由多板卡上各種應用軟件協同工作的設備,隨著現網3G用戶的不斷增多,RNC設備的負荷日漸增大,RNC設備故障問題呈現多樣性,定義RNC設備的某一節(jié)點硬件故障或者軟件子系統(tǒng)故障這類影響RNC正常工作的故障為顯性故障,這類故障有成熟的定位方法和處理策略。與之對應的隱性故障定義為外圍板運行無異常告警,軟件運行無明顯異常,但設備功能實質已處于不正常工作狀態(tài)。現網中已經出現多起隱性故障問題而導致KPI(Key?Performance?Indicator,關鍵業(yè)績指標)指標大幅下降,對RNC產品造成較大負面影響。
而在現網RNC實際運行中,經常發(fā)生這些部署在不同節(jié)點單元上的資源之間關聯關系是正確的,但某個節(jié)點單元已工作不正常而導致業(yè)務異常。目前本地資源中外圍板類資源目前主要依靠心跳監(jiān)測方式由全局處理板監(jiān)測外圍板的運行狀態(tài),如果連續(xù)心跳監(jiān)測周期內沒有接收到心跳消息,就認為外圍板出現故障,對于這類顯性故障目前RNC設備會觸發(fā)相應故障流程進行業(yè)務恢復,不會引起KPI指標大幅下降現象。而對于外圍板狀態(tài)處于正常、心跳堅守正常時,其上承載的業(yè)務已經無法正常運行,即對于業(yè)務應用而言實際上已經處于故障狀態(tài)的隱性故障,由于目前RNC設備缺少相關檢測、處理流程,一旦部分本地資源發(fā)生隱性故障,基于本地資源的負荷分擔分配原則,分配到正常本地資源的業(yè)務成功、而分配到隱性故障資源的業(yè)務失敗,使得本地資源隱性故障不能及時發(fā)現,直到累計到KPI指標惡化后才能引發(fā)關注,而此時已經產生較大負面影響。
發(fā)明內容
本發(fā)明實施例提供了一種故障檢測方法和裝置,使控制板能夠及時發(fā)現外圍板的隱性故障,并能夠判定隱性故障是否由于控制板與外圍板的連通性故障造成。
為了達到以上目的,本發(fā)明實施例提供了一種故障檢測方法,應用于機框式設備,所述機框式設備包括至少一塊控制板和至少一塊外圍板,所述方法包括:
當外圍板檢測到本地資源失敗時,所述外圍板更新自身記錄的所述本地資源失敗的次數;
當更新后的所述本地資源失敗的次數超過第一門限值時,所述外圍板確定所述本地資源故障;
所述外圍板判斷所述本地資源為獨立資源或非獨立資源;
若為獨立資源,所述外圍板向控制板發(fā)送故障報告消息,以通告所述控制板所述獨立資源故障,由所述控制板向管理系統(tǒng)進行告警,并對所述獨立資源進行復位操作;
若為非獨立資源,所述外圍板向控制板發(fā)送連通性檢測請求,以通告所述控制板所述非獨立資源故障,由所述控制板對所述控制板與所述外圍板之間的連通性進行檢測。
本發(fā)明實施例還提供一種故障檢測方法,應用于機框式設備,所述機框式設備包括至少一塊主控板和至少一塊外圍板,所述方法包括:
當控制板接收到外圍板發(fā)送的用于通告所述外圍板獨立資源故障的故障報告消息時,所述控制板向管理系統(tǒng)進行告警,并對所述獨立資源進行復位操作;其中,所述故障報告消息是所述外圍板在所述獨立資源失敗的次數超過第一門限值時向所述控制板發(fā)送的;
當所述控制板接收到業(yè)務發(fā)送用于通告所述外圍板非獨立資源故障的連通性檢測請求時,所述控制板對所述控制板與所述外圍板之間的連通性進行檢測;其中,所述連通性檢測請求是所述外圍板在所述非獨立資源失敗的次數超過所述第一門限值時向所述控制板發(fā)送的。
本發(fā)明實施例還提供一種外圍板,應用于機框式設備,所述機框式設備包括至少一塊主控板和至少一塊外圍板,所述外圍板包括:
故障檢測模塊,用于當檢測到本地資源失敗時,更新所述外圍板記錄的所述本地資源失敗的次數,并當更新后的所述本地資源失敗的次數超過第一門限值時,確定所述本地資源故障;
判斷模塊,用于判斷所述本地資源為獨立資源或非獨立資源;
第一發(fā)送模塊,用于當所述判斷模塊的判斷結果為獨立資源時,向控制板發(fā)送故障報告消息,以通告所述控制板所述獨立資源故障,由所述控制板向管理系統(tǒng)進行告警,并對所述獨立資源進行復位操作;
第二發(fā)送模塊,用于當所述判斷模塊的判斷結果為非獨立資源時,向控制板發(fā)送連通性檢測請求,以通告所述控制板所述非獨立資源故障,由所述控制板對所述控制板與所述外圍板之間的連通性進行檢測。
本發(fā)明實施例還提供一種主控板,所述機框式設備包括至少一塊主控板和至少一塊外圍板,其特征在于,所述主控板包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大唐移動通信設備有限公司,未經大唐移動通信設備有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310362422.9/2.html,轉載請聲明來源鉆瓜專利網。