[發明專利]基于因果語義關系傳遞的圖卷積網絡根因識別方法在審
| 申請號: | 202011264456.0 | 申請日: | 2020-11-12 |
| 公開(公告)號: | CN112507720A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 高炅;楊煜乾;楊樹森 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/216;G06F40/289;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 閔岳峰 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 因果 語義 關系 傳遞 圖卷 網絡 識別 方法 | ||
1.基于因果語義關系傳遞的圖卷積網絡根因識別方法,其特征在于,該方法在知識圖譜嵌入模型的啟發下,基于因果語義關系傳遞的圖卷積網絡根因識別方法假設根因識別問題中的切片樣本內告警和根因告警存在因果關系,并且因果關聯網絡同構,即:因果關系向量r、樣本序列在因果關系空間表示xseq以及序列的根因告警在因果關系空間表示構成三元組滿足關系結合概率統計知識、基于均值聚合器的GraphSAGE圖卷積網絡模型以及語義關系傳遞模塊搭建基于因果語義關系傳遞的圖卷積網絡根因識別方法。
2.根據權利要求1所述的基于因果語義關系傳遞的圖卷積網絡根因識別方法,其特征在于,具體包括以下步驟:
1)數據特征選取及預處理:
選取告警細節屬性作為輸入數據在時間順序下進行語義分析,基于GloVe模型提取告警細節的詞向量表示;
2)全局因果關聯先驗鄰接矩陣生成:
將訓練集作為先驗信息,計算兩個告警xi,xj在同一樣本中出現時告警xi為根因告警的頻率,生成全局因果關聯先驗鄰接矩陣;
3)因果關聯鄰接矩陣生成:
采取的因果關聯鄰接矩陣生成方法考慮語義和概率兩個部分,使用全連接神經網絡和激活函數進一步提取告警在關系層面的特征,結合范數獲取語義鄰接矩陣;將全局因果關聯先驗鄰接矩陣作為概率鄰接矩陣和權重矩陣,聯合語義鄰接矩陣生成因果關聯鄰接矩陣;
4)序列特征表示和告警特征表示學習:
由于單個切片樣本內告警存在時序關系,因此首先使用雙向LSTM網絡即BiLSTM學習告警的時序特征表示;此外,考慮告警之間存在的因果圖結構,將步驟3)中生成的因果關聯鄰接矩陣作為告警因果關聯的網絡拓撲結構,選取深層均值聚合器的GraphSAGE圖卷積網絡模型分別學習各個告警的特征表示;
5)因果語義關系傳遞模塊:
將樣本序列和樣本中各告警的特征表示投影到低維因果關系空間,在假設因果關系r、樣本序列在因果關系空間表示xpool以及序列的根因告警在因果關系空間表示構成三元組滿足關系的前提下,運用BiLSTM模型、概率加權策略以及拼接策略得到最終的因果關系向量表達式,預測序列中各個告警為根因告警的概率,完成根因告警的識別。
3.根據權利要求2所述的基于因果語義關系傳遞的圖卷積網絡根因識別方法,其特征在于,步驟1)的具體操作為:告警數據中的告警細節屬性對應時段內包含專家知識的故障或異常的語言描述,語義信息含有告警之間關系的隱式信息;選取告警細節屬性作為輸入數據在時間順序下進行語義分析,將告警細節作為詞表示模型中的分詞,切片樣本內告警細節組成的序列集合構成詞表示模型的語料庫,基于GloVe模型提取告警細節的詞向量表示。
4.根據權利要求2所述的基于因果語義關系傳遞的圖卷積網絡根因識別方法,其特征在于,步驟2)的具體操作為:基于訓練集先驗信息,采用確定概率的頻率方法,獲取告警之間的因果頻率,生成全局因果關聯先驗鄰接矩陣。
5.根據權利要求2所述的基于因果語義關系傳遞的圖卷積網絡根因識別方法,其特征在于,步驟3)的具體操作為:因果關聯鄰接矩陣作為圖卷積網絡的輸入數據之一,為模型提供圖中節點之間的鄰接信息;因果鄰接矩陣生成考慮語義和概率兩個部分,語義部分結合全連接層和激活函數學習告警的加權詞向量表示,獲取向量之間的2-范數,表示告警之間的相似關系,近似語義因果關聯關系,生成語義鄰接矩陣;概率部分則采用步驟2)中的全局因果關聯先驗鄰接矩陣,作為因果關聯鄰接矩陣的權重矩陣;因果關聯鄰接矩陣則由語義鄰接矩陣和概率鄰接矩陣聯合生成。
6.根據權利要求2所述的基于因果語義關系傳遞的圖卷積網絡根因識別方法,其特征在于,步驟5)的具體操作為:知識圖譜嵌入模型的啟發下,假設根因識別問題中的切片樣本內告警和根因告警存在因果關系,并且因果關聯網絡同構,即:因果關系向量r、樣本序列在因果關系空間表示xseq以及序列的根因告警在因果關系空間表示構成三元組滿足關系
首先,為獲取序列和根因告警的特征表示,將步驟4)中生成的因果關聯鄰接矩陣作為告警因果關聯的網絡拓撲結構,選取深層均值聚合器的GraphSAGE圖卷積網絡模型進行學習;為統一特征表示向量所屬空間,樣本序列特征表示向量和樣本中各個告警的特征表示向量分別通過全連接層和激活層投影到低維因果關系空間;之后考慮不同三元組因果關系表示的特殊性,因果關系與序列相關,根據樣本序列在因果關系空間表示xseq、樣本序列表示及根因概率向量P,運用BiLSTM模型、概率加權策略以及拼接策略得到最終的因果關系向量表達式:
其中,為切片序列的矩陣表示,為切片序列中第i個告警的向量表示;P=[P1…Pl]為告警的根因概率向量,Pi表示訓練集統計的告警i在切片樣本中為根因告警的頻率;l為告警切片中的告警數量,[;]為concatenate操作,·為Hadamard乘法;
最終采用2-范數對比序列根因告警預測值xseq+r與根因告警在因果關系空間表示作為當前方法的輸出,預測序列中各個告警為根因告警的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011264456.0/1.html,轉載請聲明來源鉆瓜專利網。





