[發(fā)明專利]一種風(fēng)電場數(shù)據(jù)清洗方法及裝置在審
| 申請?zhí)枺?/td> | 201910737434.2 | 申請日: | 2019-08-09 |
| 公開(公告)號: | CN110674120A | 公開(公告)日: | 2020-01-10 |
| 發(fā)明(設(shè)計)人: | 陳保衛(wèi);李庚達;胡陽;段震清;奚蕓華;潘晨陽;王昕;梁凌;李雄威;劉淼 | 申請(專利權(quán))人: | 國電新能源技術(shù)研究院有限公司;華北電力大學(xué) |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/28;G06K9/62;G06Q50/06 |
| 代理公司: | 11352 北京大成律師事務(wù)所 | 代理人: | 陳福 |
| 地址: | 102209 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 異常數(shù)據(jù) 剔除 聚類分析 運行數(shù)據(jù) 堆積 有效數(shù)據(jù)量 噪聲魯棒性 風(fēng)力發(fā)電 工業(yè)應(yīng)用 聚類算法 可執(zhí)行性 評價標準 時域空間 數(shù)據(jù)分布 數(shù)據(jù)清洗 性能評價 有效識別 有效數(shù)據(jù) 運行特性 兩階段 聚類 流形 自動化 優(yōu)化 保證 | ||
本發(fā)明提供了一種數(shù)據(jù)清洗方法及裝置,結(jié)合風(fēng)力發(fā)電過程運行特性,針對運行數(shù)據(jù)中存在的異常數(shù)據(jù),通過基于噪聲魯棒性聚類的運行數(shù)據(jù)第一次聚類分析、基于數(shù)據(jù)分布流形的第二次聚類分析等兩階段聚類算法,能夠在時域空間有效識別和剔除異常數(shù)據(jù),具有較高的可執(zhí)行性。同時提供了對異常數(shù)據(jù)剔除效果的性能評價,通過合理的評價標準優(yōu)化了剔除堆積型異常數(shù)據(jù)的方案,保證剩余有效數(shù)據(jù)占比及有效數(shù)據(jù)量,能夠合理提高堆積型異常數(shù)據(jù)識別精度和執(zhí)行效率,有利于異常數(shù)據(jù)識別的自動化實現(xiàn)和工業(yè)應(yīng)用。
技術(shù)領(lǐng)域
本發(fā)明涉及一種數(shù)據(jù)清洗方法及裝置,特別涉及一種風(fēng)電場數(shù)據(jù)清洗方法及裝置。
背景技術(shù)
隨著規(guī)模化風(fēng)電的快速發(fā)展,同時,受電源結(jié)構(gòu)單一、電力系統(tǒng)有限的調(diào)節(jié)能力、外送通道容量不足等問題制約,棄風(fēng)限電現(xiàn)象在中國普遍存在。尤其在中國“三北”地區(qū),風(fēng)電年利用小時數(shù)長期在低位徘徊。目前,風(fēng)電消納已成為阻礙中國風(fēng)電產(chǎn)業(yè)健康發(fā)展的瓶頸問題,亟需解決。
因長時間限功率運行,大多數(shù)風(fēng)電場SCADA系統(tǒng)的記錄數(shù)據(jù)存在較多的堆積型異常數(shù)據(jù),即大量非最大風(fēng)能利用狀態(tài)的限功率運行數(shù)據(jù)。此外,因風(fēng)機運行性能劣化或故障等同樣會產(chǎn)生大量非最大出力性能的運行數(shù)據(jù)。這些異常數(shù)據(jù)對后續(xù)的風(fēng)功率曲線建模、理論功率計算、風(fēng)機運行性能評價、運行狀態(tài)監(jiān)測及故障診斷等均有較大影響。然而,堆積型異常數(shù)據(jù)與有效數(shù)據(jù)通常混合存在,大大增加了異常數(shù)據(jù)識別、清洗的難度。因而,引起了學(xué)界和工業(yè)界的廣泛關(guān)注。考慮到風(fēng)力發(fā)電過程中大量存在的不確定性以及運行數(shù)據(jù)的復(fù)雜非線性,采用聚類方法進行異常數(shù)據(jù)清洗是一種可行的解決方案。然而,單一的聚類方法難以得到良好的識別效果;此外,目前大多數(shù)據(jù)清洗方法僅在時域空間進行數(shù)據(jù)清洗,缺乏合理評價清洗效果的時域指標,使得清洗過程難以高效率優(yōu)化。
發(fā)明內(nèi)容
為了能夠按需優(yōu)化堆積型異常數(shù)據(jù)的清洗效果,本發(fā)明提出一種風(fēng)電場數(shù)據(jù)清洗方法及裝置,通過時域空間聚類識別、概率空間評價、剔除性能優(yōu)化等步驟改進異常數(shù)據(jù)的清洗效果。
本發(fā)明提供一種風(fēng)電場數(shù)據(jù)清洗方法,包括以下步驟:
獲取風(fēng)電場運行數(shù)據(jù);
通過聚類分析方法對運行數(shù)據(jù)進行第一次聚類分析,將運行數(shù)據(jù)劃分為若干組第一數(shù)據(jù)類Ci={C1,C2,...,Ci,...,Cm}(i=1,2,...,m);
通過聚類分析方法對每一組第一數(shù)據(jù)類Ci進行第二次聚類分析,獲得若干組第二數(shù)據(jù)類Cij={Ci1,Ci2,...,Cij,...,Cin}(i=1,2,...,m;j=1,2,...,n);
通過聯(lián)合概率分布空間的數(shù)據(jù)分布特性評價及優(yōu)化兩次聚類后的數(shù)據(jù)清洗結(jié)果。
所述風(fēng)電場數(shù)據(jù)清洗方法,其中,所述第一次聚類分析采用對噪聲數(shù)據(jù)具有較強適應(yīng)能力的聚類算法。
優(yōu)選的,所述第一次聚類分析選取歐式距離作為相似性測度,采用K-medoids聚類算法。
所述風(fēng)電場數(shù)據(jù)清洗方法,其中,第一次聚類分析將運行數(shù)據(jù)分組數(shù)量不少于3組且不大于5組。
所述風(fēng)電場數(shù)據(jù)清洗方法,其中,第一次聚類分析后根據(jù)風(fēng)電場的特性對第一數(shù)據(jù)類中的異常數(shù)據(jù)進行剔除。
優(yōu)選的,異常數(shù)據(jù)剔除的數(shù)據(jù)量應(yīng)為剔除前數(shù)據(jù)總量的25%以內(nèi)。
優(yōu)選的,第一次聚類分析后剔除異常數(shù)據(jù)所根據(jù)風(fēng)電場的特性包括風(fēng)電場風(fēng)機設(shè)計參數(shù)或風(fēng)電場風(fēng)功率特性。
所述風(fēng)電場數(shù)據(jù)清洗方法,其中,第二次聚類分析采用具有非凸聚類能力的聚類算法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國電新能源技術(shù)研究院有限公司;華北電力大學(xué),未經(jīng)國電新能源技術(shù)研究院有限公司;華北電力大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910737434.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種面向基礎(chǔ)地理信息異常數(shù)據(jù)的挖掘方法
- 一種微電阻率掃描成像測井數(shù)據(jù)異常校正方法及裝置
- 一種Flash播放器異常日志管理方法及系統(tǒng)
- 一種異常數(shù)據(jù)指標分析的方法及裝置
- 數(shù)據(jù)回收方法、裝置、存儲介質(zhì)及電子設(shè)備
- 一種網(wǎng)絡(luò)流量數(shù)據(jù)分析方法及系統(tǒng)
- 異常數(shù)據(jù)的分析方法及異常數(shù)據(jù)分析平臺
- 一種基于電子圍網(wǎng)的異常數(shù)據(jù)優(yōu)化方法、裝置及電子設(shè)備
- 一種異常導(dǎo)入數(shù)據(jù)的處理方法、裝置及設(shè)備
- 管網(wǎng)檢測數(shù)據(jù)異常判斷方法及系統(tǒng)





