[發明專利]一種基于最大相關最小冗余判據的用戶用電特征選擇方法在審
| 申請號: | 202010573150.7 | 申請日: | 2020-06-22 |
| 公開(公告)號: | CN111860600A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 許洪強;趙晉泉;夏雪;蘇大威 | 申請(專利權)人: | 國家電網有限公司;河海大學;國網江蘇省電力有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q10/04;G06Q10/06;G06Q50/06 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 張惠玲 |
| 地址: | 100031 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 最大 相關 最小 冗余 判據 用戶 用電 特征 選擇 方法 | ||
本發明公開了一種基于最大相關最小冗余判據的電力用戶用電特征選擇方法,包括以下步驟:將智能量測終端采集的用戶用電數據進行預處理,包括缺失數據與失真數據的填補與剔除;給出聚類類別數k值的選取方法,通過構造聚合回報指標,兼具集聚度與分離度,得到最優k值并完成聚類;給出綜合考慮特征的有效性與精簡性的特征選取方法,采用最大相關最小冗余準則為判據,通過遍歷法求解得到最優特征集。相比現有技術,本發明的方法可為優選出兼顧有效性與精簡性的最優特征集,面對大數據環境下用電數據快速增長的情況,所選取的優質用電特征集,不僅能大大減少分析時所需計算的數據,降低計算量,同時能有效地提高分析性能。
技術領域
本發明涉及電力用戶用電特性研究領域,具體涉及一種基于最大相關最小冗余判據的電力用戶用電特征選擇方法,適用于已投用智能量測終端的電網。
背景技術
近年來,新能源高比例接入電力系統,由于風、光的資源特性,新能源出力存在隨機性和波動性,因此增加了系統調節的負擔。負荷資源調度是應對新能源波動性的重要手段,挖掘用戶的用電特性是評估負荷可調控性的基礎。此外,電力市場運行機制的精細化發展也依賴于對負荷信息的掌控。目前用戶用電特性研究中缺乏對用電特征選取的研究,而選取優質的特征集,一方面可以快速有效地實現樣本分類,另一方面可以降低用電行為分析的計算復雜度,對于用戶用電行為分析、用電量預測、需求響應策略制定等具有參考意義。
與此同時,電網的智能化與自動化發展在不斷推進,用電智能化是其中的關鍵環節。在智能用電領域,智能量測終端的大量投用,使得用戶數據得以實時采集,為深度了解用戶用電信息提供了有力支撐。挖掘這些數據中的相似性與關聯性有助于電網公司掌握用戶用電習慣與行為特性,從而針對用戶用電特點,為用戶制定個性化服務。在各類用戶中,居民用戶用電具有個體小但總量大的特點。根據長尾效應可知集聚大量居民用戶可以具備規?;恼{控潛力。因此研究居民用戶用電行為特性對評估整體負荷可調動性具有重要意義。
目前,基于數據驅動的居民用戶用電行為分析的研究主要有兩類:一類是針對電力用戶負荷模型構建以及需求響應技術的研究;另一類是通過數據挖掘的手段開展用戶用電模式分類、異常行為的辨識與應對措施等的研究。文獻一《基于差量特征提取與模糊聚類的非侵入式負荷監測方法》(電力系統自動化,2017,第41卷第4期第86頁)采用差量特征提取方法提取特征值,基于模糊聚類算法完成電器負荷數量與種類的識別,能夠有效識別低功率電器,滿足精細化智能用電的需求。但該方法著眼于電器級負荷類別的識別,沒有涉及對用戶整體用電情況的研究。文獻二《分時電價下用戶響應行為的模型與算法》(電網技術,2013,第 37卷第10期第2973頁)提出了一種電力用戶需求響應行為的模型與算法,通過尋求用戶每天峰、平、谷時段電價比率及總負荷量與用戶用電安排的映射關系,描述需求響應機制中用戶的用電規律,未涉及對居民用電模式的分類分析。文獻三《基于云計算的居民用電行為分析模型研究》(電網技術,2013,第37卷第6期第1542頁)基于云計算平臺和并行k-means 聚類算法,以峰時耗電率、負荷率等時間序列為特征量,實現居民用戶分類,但未對特征的選取做出具體分析。文獻四《基于云計算和改進K-means算法的海量用電數據分析方法》(計算機應用,2018,第38卷第1期第159頁)通過最大權值積法確定聚類中心,提高了聚類的準確率,基于MapReduce模型實現算法并行化,提高了聚類的效率,聚類所選的特征量依然通過經驗確定,采用的是文獻三中的特征量。
目前關于用電特征的選取的研究較少,特征的選取多為經驗所得,所選特征的有效性與精簡性并未得到系統的驗證,因此本發明提出了一種綜合計及特征自身有效性與特征間冗余性的特征選取方法,首先采用簇內集聚度、類間離散度、樣本集密度為參考指標,分析k值的選取以及初始聚類中心的選擇,對傳統k-means算法做出改進,繼而結合聚類結果,統計全體特征集,最后基于最大相關最小冗余判據(maximal relevance and minimalredundancy, mRMR)采用遍歷法提取兼顧精簡性與有效性的優質特征集。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網有限公司;河海大學;國網江蘇省電力有限公司,未經國家電網有限公司;河海大學;國網江蘇省電力有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010573150.7/2.html,轉載請聲明來源鉆瓜專利網。





