[發明專利]一種基于數據挖掘的電網設備運行狀態智能校驗方法有效
| 申請號: | 201610137249.6 | 申請日: | 2016-03-10 |
| 公開(公告)號: | CN105787809B | 公開(公告)日: | 2019-11-15 |
| 發明(設計)人: | 舒征宇;劉慶國;胡為民;余振華;張偉奇;陳珣;向昆 | 申請(專利權)人: | 國家電網公司;國網湖北省電力公司宜昌供電公司 |
| 主分類號: | G06Q50/06 | 分類號: | G06Q50/06;G06Q10/06 |
| 代理公司: | 42103 宜昌市三峽專利事務所 | 代理人: | 成鋼<國際申請>=<國際公布>=<進入國 |
| 地址: | 100017*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 挖掘 電網 設備 運行 狀態 智能 校驗 方法 | ||
1.一種基于數據挖掘的電網設備運行狀態智能校驗方法,其特征在于,依次包括以下步驟:
采用聚類分析的方法,辨識電網設備的實時運行狀態;
采用數據挖掘的方法分析電網調度操作指令票,得出電網關聯設備運行狀態之間的關聯規則;
根據電網設備運行狀態的關聯規則和實時的電網設備運行狀態,自動校驗電網設備運行狀態是否合理;
所述采用聚類分析的方法,辨識電網設備的實時運行狀態,包括以下步驟:
步驟一:建立不同設備運行狀態變位信息文本,根據電網企業生產實際情況劃分不同類型的運行狀態,當電網設備運行狀態轉換時發送至調度監控平臺的信息是典型的觸發式告警信息,即當有設備狀態改變時發出對應信息;根據電網設備狀態轉換時調度監控平臺實際接收的告警信息,建立不同設備在不同運行狀態下的典型告警信息模板,并記作K(t,z,c),其中t為設備類型、z為設備狀態轉換的標的運行狀態,c為對應的告警信息模板,即t設備轉換到z狀態時發出的信息;
步驟二:根據互現系數M(X,Y)初步提取文本關鍵詞匯,由于電網設備運行狀態的告警信息是由電網設備發出的標準化調度術語,信息文本中對同一事物的描述方式都相對固定,因此可以采用基于統計的分詞方法對文本進行分詞處理和統計;按照式(1)統計兩個漢字的互現信息系數:
其中M(X,Y)為漢字X和Y的互現信息系數,P(X,Y)為X、Y相鄰出現在文本中的幾率,P(X)、P(Y)分別為漢字X、Y在文本中出現的幾率,相鄰的兩個字同時出現的次數越多,其可信度越高,由漢字X、Y組成的詞組也越有可能成為關鍵詞,將互現系數M(X,Y)>0的詞條計入文本特征項集合;然后去除平凡詞,最終形成典型信息文本的特征項集合:θ={δ1,δ2,δ3…δn},其中δi(i=1,2,…,n)為篩選后得到的關鍵詞,
步驟三:采用TF-IDF特異性計算公式計算關鍵詞的權重,其公式如下式(2)所示:
其中,f(δi,d)為詞條δi在文檔中出現頻率,N為所有文檔的個數,ni為含有詞條δi的文檔個數,由TF-IDF公式計算得到的權重系數表征了詞條的特異性,若wi越大則表明詞條δi的特異性越高,在不同文檔中出現的比率越低,但在單個文檔中出現的頻次越高,那么詞條δi用于表征文檔d的可信度越高;
步驟四:建立不同設備運行狀態轉換時所發出文本信息的空間特征向量,通過步驟三可以計算得到不同詞條在文檔中的權重,經過歸一化處理后的權重為:
因此任意文檔可以表征為一個二維向量,其形式如下式(4)所示:
{[δ1,W1],[δ2,W2],…[δn,Wn]} (4)
如果將不同的詞條看作一個坐標軸,那么該二維向量則可以看作是該空間中的一個向量;
由以上步驟則可以建立電網中每個設備在不同狀態下的空間特征向量記做式(5):
ψ(i,t)={[δ1,W1],[δ2,W2],…[δn,Wn]} (5)
ψ(i,t)為設備i轉換到狀態t時電網監控平臺收到文本的空間特征向量,i為設備名稱,t為設備轉換的標的狀態,δi(i=1,2,…n)為關鍵詞,Wi(i=1,2,…n)為關鍵詞對應權重;
步驟五:根據關鍵詞匯庫建立實時文本信息的空間特征向量,采集調度監控系統實時信息,建立不同設備的信息狀態文本列向量,列向量維度為m,根據接收時間將收到的設備運行狀態信息加入列向量,即一個列向量對應一個具體電網設備,每個列向量只保留最新的m條電網狀態信息文本;通過處理可以將全電網最近時段的設備運行狀態表示為m×n的矩陣,其形式如下式(6)所示:
其中Q為近段時間內調度監控信息平臺接收到的所有信息報文集合,m為列向量維數,令m=20,即保留設備最近的20條狀態信息文本,n為電網中設備的總數,Ci為對應設備i最近收到20條狀態信息文本集合,cij為對應設備的運行狀態信息報文;
步驟六:采用夾角余弦公式對比實時信息文本和典型文本,初步辨識設備運行狀態,采用式(1)~(4)對Ci進行處理可以建立設備i最近時段的空間特征向量,記做ω(i)={[δ1,W1],[δ2,W2],…[δn,Wn]},采用夾角余玄公式計算計算ω(i)與ψ(i,t)的相似度,其計算公式如下式(7)所示:
其中為告警信息文檔ω(i)、ψ(i,t)在空間{δ1,δ2,…δn}中的特征向量:[W1,W2…Wn]和[Wt,1,Wt,2…Wt,n],由此可以計算得出設備在不同運行狀態的相似度,在此基礎上逐個刪除Ci中的狀態信息報文cij,再次計算刪除后文本集合與典型文本的相似度,若相似度增加則繼續篩選刪除,若減小則刪除其他報文,如此反復直至相似度達到最高;可以計算得出電網設備i與不同運行狀態相比較的相似度,確定相似度最大的狀態為電網設備的運行狀態。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網公司;國網湖北省電力公司宜昌供電公司,未經國家電網公司;國網湖北省電力公司宜昌供電公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610137249.6/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





