[發(fā)明專利]一種基于存儲設(shè)備模型的故障根因發(fā)現(xiàn)方法在審
| 申請?zhí)枺?/td> | 202210017636.1 | 申請日: | 2022-01-07 |
| 公開(公告)號: | CN114385399A | 公開(公告)日: | 2022-04-22 |
| 發(fā)明(設(shè)計)人: | 韓江雪 | 申請(專利權(quán))人: | 北京直真科技股份有限公司 |
| 主分類號: | G06F11/07 | 分類號: | G06F11/07;G06F11/32 |
| 代理公司: | 北京海虹嘉誠知識產(chǎn)權(quán)代理有限公司 11129 | 代理人: | 吳小燦 |
| 地址: | 100102 北京市朝陽區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 存儲 設(shè)備 模型 故障 發(fā)現(xiàn) 方法 | ||
1.一種基于存儲設(shè)備模型的故障根因發(fā)現(xiàn)方法,其特征在于,利用連通圖,告警根因分析圖,和根因推導(dǎo)圖,按照以下公式進(jìn)行范數(shù)計算:
其中d為范數(shù),s為連通圖中頻繁集項的數(shù)量,pyi表示告警根因分析圖中前一個故障導(dǎo)致后一個故障的概率值,pi代表根因推導(dǎo)圖中與pyi表示的相連故障節(jié)點(diǎn)相同的節(jié)點(diǎn)間前一個異常指標(biāo)引起產(chǎn)生另一個異常指標(biāo)的概率值;
選取范數(shù)值最小的k個告警根因分析圖,k為大于1的正整數(shù),從根因推導(dǎo)圖中確定與所述告警根因分析圖中節(jié)點(diǎn)名稱相同的圖結(jié)構(gòu),計算k個不同圖結(jié)構(gòu)在歷史數(shù)據(jù)中出現(xiàn)的概率情況,選取概率最高的圖結(jié)構(gòu)作為告警根因分析圖的最終結(jié)果,并獲得此次報警的最終根因。
2.根據(jù)權(quán)利要求1所述的基于存儲設(shè)備模型的故障根因發(fā)現(xiàn)方法,其特征在于,所述k=2。
3.根據(jù)權(quán)利要求1所述的基于存儲設(shè)備模型的故障根因發(fā)現(xiàn)方法,其特征在于,所述根因推導(dǎo)圖的實(shí)現(xiàn)包括以下步驟:
步驟A,收集歷史數(shù)據(jù),包括系統(tǒng)日志、性能數(shù)據(jù)和系統(tǒng)告警信息;
步驟B,對收集到的歷史數(shù)據(jù)進(jìn)行預(yù)處理;
步驟C,對預(yù)處理后的歷史數(shù)據(jù)進(jìn)行抽象;
步驟D,利用抽象后的歷史數(shù)據(jù)根據(jù)FP-Growth關(guān)聯(lián)分析算法獲取根因推導(dǎo)圖的節(jié)點(diǎn),并構(gòu)建起根因推導(dǎo)圖的FP-Tree圖結(jié)構(gòu);
步驟E,計算頻繁集項兩兩之間,由前一項引起后一項的概率,根據(jù)概率值大小,得到根因推導(dǎo)圖中兩節(jié)點(diǎn)之間的連接方向,直至得到完整的根因推導(dǎo)圖。
4.根據(jù)權(quán)利要求3所述的基于存儲設(shè)備模型的故障根因發(fā)現(xiàn)方法,其特征在于,所述步驟A中的性能數(shù)據(jù)包括基于CMDB存儲設(shè)備模型獲取的磁盤信息,磁盤域信息,存儲池信息,以及主機(jī)組信息;所述系統(tǒng)告警信息包括基于CMDB存儲設(shè)備模型獲取的CPU告警、內(nèi)存告警、PCIE/IO設(shè)備告警和電源告警;所述系統(tǒng)日志包括基于CMDB的存儲設(shè)備模型獲得的客戶端id、客戶端ip、協(xié)議id和文件系統(tǒng)id;所述磁盤信息包括磁盤id、磁盤占用率和磁盤健康狀態(tài);所述磁盤域信息包括磁盤域id、磁盤域占用率、熱備盤容量和磁盤域健康狀態(tài);所述存儲池信息包括存儲池id、存儲池占用率和主存類型;所述主機(jī)組信息包含主機(jī)組id、主機(jī)容量利用率;所述CPU告警包括CPU配置告警、CPU穩(wěn)壓器告警、CPU核心溫度超限告警、CPU初始化告警;所述內(nèi)存告警包括內(nèi)存配置錯誤告警和內(nèi)存溫度超限告警;所述PCIEI/O設(shè)備告警包括BIOS系統(tǒng)報告的PCIe錯誤告警和I/O通道檢查錯誤告警;所述電源告警包括電源設(shè)備電壓超限告警。
5.根據(jù)權(quán)利要求3所述的基于存儲設(shè)備模型的故障根因發(fā)現(xiàn)方法,其特征在于,所述步驟B中包括缺失值處理、異常值處理、和離散數(shù)據(jù)編碼。
6.根據(jù)權(quán)利要求3所述的基于存儲設(shè)備模型的故障根因發(fā)現(xiàn)方法,其特征在于,所述步驟C中包括提取歷史數(shù)據(jù)中發(fā)生告警五分鐘內(nèi)的所有上述數(shù)據(jù),根據(jù)告警的拓?fù)浣Y(jié)構(gòu)位置,將抽取的數(shù)據(jù)抽象為故障ID和故障拓?fù)湮恢胕d的組合,其屬性為故障告警時間,其中,故障拓?fù)湮恢胕d由主機(jī)組id,存儲池id,磁盤域id和磁盤id組成,如故障出現(xiàn)位置出現(xiàn)在磁盤域,則故障拓?fù)湮恢胕d由機(jī)組id,存儲池id和磁盤域id,剩余空位由0補(bǔ)齊,主機(jī)組故障告警的故障拓?fù)湮恢胕d由主機(jī)組id組成,其余位置由0補(bǔ)齊。
7.根據(jù)權(quán)利要求3所述的基于存儲設(shè)備模型的故障根因發(fā)現(xiàn)方法,其特征在于,所述步驟D中包括使用FP-Growth關(guān)聯(lián)分析算法獲取5分鐘時間段內(nèi)出現(xiàn)的頻繁集項作為根因分析圖的節(jié)點(diǎn),當(dāng)出現(xiàn)服務(wù)器多個拓?fù)浣Y(jié)構(gòu)位置均出現(xiàn)告警時,根據(jù)位置數(shù)量生成相應(yīng)數(shù)量的FP-Tree圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京直真科技股份有限公司,未經(jīng)北京直真科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210017636.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗設(shè)備、驗證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





