[發明專利]基于雙向加權圖模型的電力調度自動化系統故障溯源方法在審
| 申請號: | 202110542073.3 | 申請日: | 2021-05-18 |
| 公開(公告)號: | CN113128076A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 薛冰;高欣;任昺;賈欣;傅世元;張光耀;黃子健;黃旭 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F30/20 | 分類號: | G06F30/20;G06Q10/04;G06Q10/06;G06Q50/06;G06F111/08;G06F119/12 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 雙向 加權 模型 電力 調度 自動化 系統故障 溯源 方法 | ||
1.一種基于雙向加權圖模型的電力調度自動化系統故障溯源方法,其特征在于,所述方法步驟包括:
(1)采集電力調度自動化系統中所有服務器組件CPU、內存、磁盤、網絡、進程的資源占用數據,組件資源占用數據包括組件CPU特征、組件內存特征、組件磁盤特征、組件網絡特征和組件進程特征下的運行數據,組件CPU特征包括等待時間、IO使用率、用戶使用時間;組件內存特征包括使用率、碰撞率;組件磁盤特征包括IO讀取計數、IO寫入計數、IO讀取位數、IO寫入位數;組件網絡特征包括最大文件描述符延遲時間、發送的IO字節、發送的IO包;組件進程特征包括IO讀取計數、IO寫入計數、IO讀取字節、IO寫入字節、已用文件描述符、內存使用率、CPU使用率,將上述特征下采集的運行數據組成的多個時間序列作為溯源方法的輸入,對每個特征的時間序列采用k-means算法獲得聚類中心,將其作為離散化后時間序列區間劃分的端點,每個區間的均值作為連續特征的離散化結果,所有特征時間序列按照以上離散化方法轉化為包含告警段的N個特征時間序列{S1,S2,...,SN},所有時間序列擁有相同的時間點集合{t1,t2,...,to},o表示時間點總個數,在每個相同時間點,所有時間序列均有取值,N表示組件的特征個數,剔除該N個特征時間序列中包含的告警時間段,獲得無告警段特征時間序列{S1',S'2,...,S'N};
(2)計算組件信息熵和組件間傳遞熵,建立有無告警段的信息相關矩陣,通過其變化率衡量告警前后的差異程度,采用歸一化技術獲得信息差異矩陣,具體為:計算組件包含告警段的離散化后的特征時間序列{S1,S2,...,SN}中每個時間序列的自信息熵{H1(S1),H2(S2),...,HN(SN)},其中Hi(Si)為時間序列Si的自信息熵,i=1,2,...,N:
其中,x表示該特征時間序列Si中的某個時間點的特征值,αx表示該特征時間序列Si中x的所有可能取值,p(x)表示時間序列Si中特征值取值為x的概率:
其中qi(x)表示時間序列Si的所有時間點中特征值取值為x的時間點個數,計算除與自身特征時間序列外,兩兩特征時間序列間的傳遞熵{T1→2,T1→3,...,T1→N,T2→1,T2→3,...,T2→N,...,TN→N-1},任意兩個時間序列的互信息被定義為兩個變量共享的信息量的度量,互信息熵I(Si;Sj)用來衡量時間序列Si和Sj的共享信息量:
其中,Si表示第i個特征時間序列,Sj表示第j個特征時間序列,x和y分別表示特征時間序列Si和Sj中的某個時間點的特征值,αx和αy表示特征時間序列Si和Sj中x和y的所有可能取值,p(x,y)為聯合分布概率,p(x|y)為條件概率:
其中,qi,j(x,y)表示特征時間序列Si的特征值取值為x并且特征時間序列Sj的特征值取值為y同時出現的時間點個數,q表示時間序列的長度,p(y)表示時間序列Si中特征值取值為y的概率,在互信息熵的基礎上進一步擴展為傳遞熵,在傳遞熵的計算中除Si本身的信息外,Sj還提供了額外的信息來預測Si(t+1),設定傳遞熵Tj→i為特征時間序列Sj到Si的交互信息的度量:
其中,it表示特征時間序列Si在時間t時的特征值,it(k)表示it+1前的k個最近的特征時間序列Si的特征值,jt表示特征時間序列Sj在時間t時的特征值,jt(l)表示jt+1前的l個最近的特征時間序列Sj的特征值,傳遞熵具有方向性,因此Ti→j可以通過交換公式(6)中的變量獲得,計算有告警段時間序列的自信息和互信息來建立因果關系矩陣A:
重復步驟(2)中計算有告警段時間序列的自信息和互信息來建立因果關系矩陣A的過程,計算無告警段時間序列{S'1,S'2,...,S'N}因果關系矩陣B,建立信息差異矩陣分別對信息差異矩陣C的對角線和非對角線信息變化率進行歸一化處理,得出最終的信息差異矩陣;
(3)提取信息變化較高的特征及特征間交互信息,構建雙向加權圖模型,結合節點自身信息和出入度信息變化擬合故障源頭程度指標進行排序,依據排序結果追溯故障源頭,具體為:設定閾值Θ∈(0,1),cm,n(mN,nN,cm,n∈(0,1))表示信息差異矩陣C中第m行n列的值,遍歷矩陣C并標記cm,n>Θ所在的行和列,保留所有標記過的行和列的值并將其他元素置零,得到信息差異矩陣C′,C′矩陣對角線值表示節點內部的自信息差異值,具體為告警前后特征自信息熵的變化率,C′矩陣非對角線值表示節點與節點間的互信息差異值,具體為告警前后特征間傳遞熵的變化率,將提取出的故障特征間的鏈接按照因果關系建立信息雙向加權圖模型,該模型包含兩個信息,節點自身的權值表示Si自身故障程度,節點與節點間的雙向鏈接的權值表示Si影響Sj以及Sj影響Si的故障因果關聯程度,綜合考慮節點自信息和節點作為故障源頭時出度權值變化大、入度權值變化小的特點,根據節點自身信息變化并結合節點出度權值、入度權值信息變化擬合故障程度指標FS_degree,計算每個節點是故障源頭的程度:
其中,Vi表示信息雙向加權圖模型中的單個節點,表示單個節點Vi的時間序列的自信息熵,ODCVi表示信息雙向加權圖模型中的單個節點Vi的出度變化率,其表征從單個節點Vi指向其余相鄰節點的有向邊權值變化的平均值;表示信息雙向加權圖模型中的單個節點Vi的入度變化率,其表征從其余相鄰節點指向單個節點Vi的有向邊權值的變化的平均值,和的具體定義如下:
其中,PONs of Vi表示與Vi相鄰的有連接節點中有向邊的方向是從Vi指出的節點集合,Vj表示與Vi相鄰節點中屬于PONs of Vi的單個節點,PTNs of Vi表示與Vi相鄰的有連接節點中有向邊的方向是指向Vi的節點集合,Vf表示與Vi相鄰節點中屬于PTNs of Vi集合的單個節點,NUM(PONs of Vi)表示與Vi相鄰的有連接節點中有向邊的方向是從Vi指出的節點的總數目,NUM(PTNs of Vi)表示與Vi相鄰的有連接節點中有向邊的方向是指向Vi的節點的總數目,表示單個節點Vi的時間序列和單個節點Vj的時間序列間的傳遞熵,表示單個節點Vf的時間序列和單個節點Vi的時間序列間的傳遞熵,遍歷信息雙向加權圖模型的所有節點,采用FS_degree指標計算每個節點是故障源頭的程度,從大到小進行排序得到故障源頭程度排序表,排序表中節點排名越靠前表示該節點是故障源頭節點的程度越大,設定參數K表示期望溯源到的故障源頭節點的目標個數,參數K一般取值為20到50,依據目標個數,將排序表中前K個節點判定為故障源頭節點,得出最終溯源結果。
2.根據權利要求1所述的方法,其特征在于,采集電力調度自動化系統中所有服務器組件CPU、內存、磁盤、網絡、進程的資源占用數據,組件資源占用數據包括組件CPU特征、組件內存特征、組件磁盤特征、組件網絡特征和組件進程特征下的運行數據,組件CPU特征包括等待時間、IO使用率、用戶使用時間;組件內存特征包括使用率、碰撞率;組件磁盤特征包括IO讀取計數、IO寫入計數、IO讀取位數、IO寫入位數;組件網絡特征包括最大文件描述符延遲時間、發送的IO字節、發送的IO包;組件進程特征包括IO讀取計數、IO寫入計數、IO讀取字節、IO寫入字節、已用文件描述符、內存使用率、CPU使用率,將上述特征下采集的運行數據組成的多個時間序列作為溯源方法的輸入,對每個特征的時間序列采用k-means算法獲得聚類中心,將其作為離散化后時間序列區間劃分的端點,每個區間的均值作為連續特征的離散化結果,所有特征時間序列按照以上離散化方法轉化為包含告警段的N個特征時間序列{S1,S2,...,SN},所有時間序列擁有相同的時間點集合{t1,t2,...,to},o表示時間點總個數,在每個相同時間點,所有時間序列均有取值,N表示組件的特征個數,剔除該N個特征時間序列中包含的告警時間段,獲得無告警段特征時間序列{S'1,S'2,...,S'N},具體說明如下:采集電力調度自動化系統中所有服務器的CPU、內存、磁盤、網絡、進程的資源占用數據,每個服務器下的資源占用情況包括IO讀寫情況、使用率、碰撞率、等待時間,將這些特征的時間序列作為溯源方法的輸入,假定某個特征的值分布在[a,b]區間,去除所有特征值中的重復值,得出總數目為num,設定聚類的質心個數k為質心和樣本點的誤差平方和為SSE,SSE和k的關系圖是一個手肘的形狀,選擇手肘位置的k值作為最佳聚類數目,
其中,Ci是第i個簇,poi為Ci中的樣本點,mi是Ci的質心,根據k-means算法得出k個質心為{m1,m2,...,mk}(m1<m2<...<mk),將該特征的值劃分為k+1個區間[a,m1],[m1,m2],…,[mk-1,mk],[mk,b],對每個區間內的特征值取平均,作為該區間段的離散化結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110542073.3/1.html,轉載請聲明來源鉆瓜專利網。





