[發明專利]一種基于改進隨機森林算法的電壓缺失數據辨識方法在審
| 申請號: | 202110397003.3 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113468796A | 公開(公告)日: | 2021-10-01 |
| 發明(設計)人: | 李紹堅;韋明超;羅淑芳;莫江婷;甘靜;夏斌;王益成;周覓路;韋社敏;魯林軍;陳柏昌;黃偉;陶海峰 | 申請(專利權)人: | 廣西電網有限責任公司南寧供電局 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06K9/62;G06Q10/04;G06Q50/06;G06F111/08 |
| 代理公司: | 廣州市專注魚專利代理有限公司 44456 | 代理人: | 柴燕 |
| 地址: | 530029 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 隨機 森林 算法 電壓 缺失 數據 辨識 方法 | ||
1.一種基于改進隨機森林算法的電壓缺失數據辨識方法,其特征在于,所述方法步驟包括:
S1:獲取電網歷史數據,選擇缺失數據所有對應的關聯屬性,進行不同的屬性劃分;
S2:通過屬性綜合加權計算得到學習樣本集合;
S3:對學習樣本進行重復抽樣,得到若干個相似樣本集合;
S4:將所述相似樣本集合作為輸入,訓練隨機森林回歸模型;
S5:通過減少決策樹間的關聯性和提高決策樹的精度,提高隨機森林回歸預測精度;
S6:將所有決策樹的最終預測均值作為填補結果,評估填補結果,填補結果在容忍范圍則填補完成。
2.根據權利要求1所述的基于改進隨機森林算法的電壓缺失數據辨識方法,其特征在于,所述屬性綜合加權計算包括以下步驟:
S21:對所述關聯屬性進行各屬性間的互相關系數計算,互相關系數大于給定閥值的屬性存入互相關集合HG;
S22:將所述互相關集合HG進行屬性誤差期望計算,屬性誤差期望大于強相關閥值,存入強相關屬性集合QX;
S23:所述強相關屬性集合QX中的各屬性采用熵權法確立其屬性間的權重,得到權重向量,據強相關系數得到的屬性綜合加權值SX按照從大到小排序,設置選擇閥值,選擇大于選擇閥值的樣本作為學習樣本集合。
3.根據權利要求2所述的基于改進隨機森林算法的電壓缺失數據辨識方法,其特征在于,所述關聯屬性的各屬性間的互相關系數計算公式如下,
當皮爾遜系系數用于總體時,如式(1)所示:
其中,X,Y為兩個不同屬性的隨機變量,σX,σY分別是X,Y的標準差,cov(X,Y)為協方差,如式(2)所示:
其中,n表示樣本的數量;
當皮爾遜系系數用于樣本時,如式(3)所示:
其中,xi,yi為變量X,Y對應i的觀測點值,分別為對應X,Y的樣本均值;
通過皮爾遜系數計算各屬性間的互相關系數,選擇互相關系數大于給定閥值的屬性存入互相關集合HG。
4.根據權利要求2所述的基于改進隨機森林算法的電壓缺失數據辨識方法,其特征在于,所述互相關集合HG的屬性誤差期望計算公式如下,
其中,Cov(Xk,Yk)為Xk,Yk的協方差;Var[Xk]為Xk的方差;Var[Yk]為Yk的方差;
若EXPError(Xk,Yk)>β(β為強相關閥值),則為強相關屬性,存入到強相關屬性集合QX中。
5.根據權利要求2所述的基于改進隨機森林算法的電壓缺失數據辨識方法,其特征在于,所述強相關屬性集合QX中的各屬性采用熵權法確立其屬性間的權重,得到權重向量如下:
W=[w1,w2,...,wm] (5)
其中,m:強關聯屬性的個數;
據強相關系數得到的屬性綜合加權值SX:
SX=W1S1+W2S1+...+WmSm (6)
根據各歷史斷面數據的屬性綜合加權結果按照從大到小排序,設置選擇閾值,選擇閥值較大的樣本作為學習樣本集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西電網有限責任公司南寧供電局,未經廣西電網有限責任公司南寧供電局許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110397003.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鼻梁條自動上料裝置
- 下一篇:監測鉆機在鉆探過程中地層變化的裝置及方法





