[發明專利]面向變電站核心工控業務的流量基線模型構造方法有效
| 申請號: | 202110678519.5 | 申請日: | 2021-06-18 |
| 公開(公告)號: | CN113408202B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 朱宏宇;田建偉;田崢;孫卓;孫毅臻;高雅婷;岳鋼;向行;楊志邦 | 申請(專利權)人: | 國網湖南省電力有限公司;國網湖南省電力有限公司信息通信分公司;國家電網有限公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06K9/62;G06N3/04;G06N3/08;H02J3/00;H02J13/00;G06F17/16;G06F17/18;G06Q50/06 |
| 代理公司: | 長沙永星專利商標事務所(普通合伙) 43001 | 代理人: | 周詠;米中業 |
| 地址: | 410004 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 變電站 核心 業務 流量 基線 模型 構造 方法 | ||
1.一種面向變電站核心工控業務的流量基線模型構造方法,包括如下步驟:
S1.解析變電站的數據流,獲得業務基本特征,并根據獲取的業務基本特征計算得到表示業務流交互的高階特征;
S2.進行同類業務的聚類;
S3.根據獲取的基本特征和高階特征,生成最終的原始輸入特征矩陣;
S4.構造基于卷積神經網絡自編碼器,并學習步驟S3得到的原始輸入特征矩陣的關聯關系,從而得到高維中間層特征;具體為采用如下步驟構建自編碼器:
自編碼器的輸入為2*N維原始特征矩陣x,其中N為業務流單向特征維度;自編碼器為基于雙層卷積神經網絡的自編碼器;編碼器與解碼器的結構鏡像對稱;編碼器中第一卷積層函數為f1(·),第二層卷積層函數為f2(·),編碼器輸出為業務中間層特征向量h,編碼器建立起中間層特征向量與輸入特征矩陣間映射關系為h=f2(f1(x));解碼器同樣為兩層卷積神經網路,其中第一層解碼器用以解碼第二層碼編碼器結果,其解碼函數為g2(·),第二層解碼器用以解調第一層編碼器結果,其解碼函數為g1(·),最終解碼輸出結果為解碼器建立輸出特征矩陣與中間層特征向量間映射關系為最終利用中間層特征向量h表示原始特征向量關聯關系;
通過最小化平均絕對誤差作為損失函數用以訓練自編碼器網絡:
式中x為原始數據流特征矩陣;為自編碼器重構特征矩陣;m為特征矩陣維度;xi為特征矩陣中第i維特征值;為自編碼器重構特征矩陣中第i維特征值;
將原始特征矩陣作為輸入特征矩陣按批次迭代訓練自編碼器,通過目標函數判斷網絡是否學習到原始特征分布:當目標函數值各批次訓練結果符合設定要求時,說明自編碼器能夠擬合各業務原始特征分布,最終中間層向量h表示原始特征關聯關系;
S5.對步驟S4得到的高維中間層特征進行降維,并計算得到表示業務交互流程的低維關鍵特征;具體為變電站內核心工控業務通過自編碼器后得到高維中間層特征h,通過主成分分析法將高維特征映射到低維全新正交特征上,消除高維度特征內冗余數據,得到業務關鍵特征;
經業務分類后得到變電站共有n類核心業務,中間層特征h具有m維,對于同一核心工控業務,其特征分布相同,通過抽樣計算同一業務的各維中間層特征均值,以此得到m*n維不同業務的中間層特征矩陣
對中間層特征矩陣X進行零均值化處理得到矩陣X',并計算X'的協方差矩陣C,可知矩陣C為對稱矩陣,如下所示:
C=X'×(X')T
式中為中間層特征矩陣行均值;N為特征矩陣列數;sum()為特征矩陣按行求和;
分別計算業務協方差矩陣C的特征值和對應的特征向量;對業務特征值進行降序,根據特征值影響因子設置閾值δ,將大于δ的特征值對應的特征向量生成轉移矩陣P,對自編碼器中間層特征h與轉移矩陣P做點積操作得到降維后關鍵特征K,其中h維度為1*m,P維度為m*v,K維度為1*v,v為大于特征閾值δ的個數;K=h×P;
S6.針對每一維度,計算若干周期內的正態分布參數;具體為利用中心極限定理將未知先驗概率的同業務特征分布轉換為正態分布;具體參數計算為:
a.相同業務滿足同一概率分布,得到周期采樣數據的關鍵特征;假設業務集合為S={S1,S2,...,Sn},周期內的各業務Si∈S關鍵特征為:
Keyi=(ki1,ki2,...,kiv)T
式中Keyi為第i類業務的關鍵特征向量;kij為第i類業務關鍵特征向量中第j維向量取值;
b.計算L個周期內相同業務的關鍵特征均值,業務Si在L個周期內特征向量為:
Vil=(Keyi1,Keyi2,...,Keyil)
式中Keyij為第i類業務第j個周期內的關鍵特征向量,j=1,2,...,l;
求第i類業務關鍵特征向量Vi在L周期內各維度均值向量其中各元素滿足正態分布:
式中Vil為業務Si在L個周期內特征向量;
c.利用最大似然估計得到業務Si在L周期內的各維度關鍵特征的正態分布參數,假設經過W次L周期采樣后,業務Si中關鍵特征j得到的正態分布參數為各參數計算方法為:
式中w為周期重復采樣的次數;為第i類業務第j維特征在第n次周期采樣后的均值;
d.得到業務Si關鍵特征中各維度參數
S7.構造各業務內多維關鍵特征聯合高斯分布函數,最終得到業務基線模型;具體為獲得關鍵特征各維分布參數后,通過聯合高斯分布實現維度整合,得到業務的數據基線模型;聯合高斯分布關鍵在于計算各維度間相關系數,相關系數計算公式為
式中COV()為關鍵特征中第l類業務中第i維與第j維特征均值的相關系數;
根據各維度間相關系數得到協方差矩陣∑,最終業務基線模型為聯合高斯分布概率模型,表示方式為:
同樣利用最大似然估計計算協方差矩陣∑,計算公式如下,其中v為關鍵特征維度:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網湖南省電力有限公司;國網湖南省電力有限公司信息通信分公司;國家電網有限公司,未經國網湖南省電力有限公司;國網湖南省電力有限公司信息通信分公司;國家電網有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110678519.5/1.html,轉載請聲明來源鉆瓜專利網。





