[發明專利]基于模糊聚類和RS-KNN模型用于電網運行狀態的判別方法及系統在審
| 申請號: | 201910236266.9 | 申請日: | 2019-03-27 |
| 公開(公告)號: | CN110223193A | 公開(公告)日: | 2019-09-10 |
| 發明(設計)人: | 婁建樓;時丹丹;孟勃;曲朝陽;王蕾;郭曉利 | 申請(專利權)人: | 東北電力大學 |
| 主分類號: | G06Q50/06 | 分類號: | G06Q50/06;G06K9/62 |
| 代理公司: | 西安合創非凡知識產權代理事務所(普通合伙) 61248 | 代理人: | 楊蕾 |
| 地址: | 132012 *** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電網運行狀態 特征變量 訓練集 模糊聚類 亞健康 模糊聚類算法 健康狀態 輸入變量 數據量綱 電網 歸一化 健康 聚類 標簽 輸出 分類 | ||
1.基于模糊聚類和RS-KNN模型用于電網運行狀態的判別方法,其特征在于:包括如下步驟:
Step 1:選擇用于電網運行狀態判別的特征變量;
Step 2:劃分電網運行狀態類型
使用模糊聚類算法,將電網運行的健康狀態按照健康程度分為四種類型,分別為健康、亞健康、一般病態和嚴重病態。在聚類前,為了消除數據量綱的影響,需要采用歸一化方法對電網的特征變量數據進行處理。
Step 3:構造訓練集
將步驟1中得到的特征變量,作為訓練集的輸入變量,將步驟2中得到的已經分類電網運行狀態所對應的數據作為訓練集,訓練集輸出結果是對應的電網運行狀態,健康、亞健康、一般病態和嚴重病態這四種電網運行狀態所對應的標簽分別設定為1、2、3和4
Step 4:訓練 RS-KNN模型
首先使用隨機子空間方法在原訓練樣本的特征空間中隨機抽樣,構造新的訓練集。然后,利用新的樣本訓練集來訓練基分類器KNN。最后,通過多數投票規則融合多個KNN基分類器,輸出的結果是電網運行狀態的分類結果。
2.如權利要求1所述的基于模糊聚類和RS-KNN模型用于電網運行狀態的判別方法,其特征在于:所述步驟Step1具體包括如下步驟:
S11:使用使數據集中的電網運行正常樣本和故障樣本相對平衡;
S12:隨機森林-遞歸特征消除用于選取重要變量;
S12.1訓練集是利用初始變量集構建的,包含多個訓練樣本,其輸入為:
訓練集的輸出為:
其中,為訓練樣本總數,是指第個變量,是指第個輸入樣本,則是代表第個輸入樣本的第個變量。變量的內容如圖2-1。是指電網運行狀態判別的標簽,其中,1用于表示電網正常狀態,而–1表示電網故障狀態。
S12.2利用隨機森林得到10個初始變量集中各變量的重要度,并且記錄當變量個數為初始變量集時的分類正確率。
S12.3每次刪除一個最不重要的變量,使用刪除變量后的變量集重新構造一個新的訓練集,并重新測試訓練集的分類正確率。
S12.4重復12.3直到只剩下一個重要性最大的變量,所有的變量都被搜索結束。
在步驟S12后,初始變量集即10個變量的重要度排序被得到,也可以得到不同變量所對應訓練集的分類正確率。獲得最高分類正確率時,所用的輸入變量就是重要變量。
3.如權利要求2所述的基于模糊聚類和RS-KNN模型用于電網運行狀態的判別方法,其特征在于:所述步驟S11具體包括如下步驟:
Step1:在故障樣本集中,為故障樣本集中的每個樣本找到距離該樣本最近的個樣本,度量標準采用歐式距離。
Step2:隨機在每個電網故障樣本的個最近鄰樣本中抽取樣本數為,為采樣倍率,由正常樣本數與故障樣本數的比值確定。
Step3:基于式(1),構建新的故障樣本,是與之間的隨機線性插值,其中是隨機選擇的最近鄰樣本,是故障樣本。
(1)
上式中代表一個隨機數,其取值范圍在[0,1]區間。
Step4:把生成的電網故障樣本與原始數據集組合,獲得兩個類別數量比較平衡的數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北電力大學,未經東北電力大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910236266.9/1.html,轉載請聲明來源鉆瓜專利網。





