[發明專利]一種基于Kd樹與Canopy優化Bisecting K-means的負荷聚類方法在審
| 申請號: | 202010543636.6 | 申請日: | 2020-06-15 |
| 公開(公告)號: | CN111783850A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 黃明磊;周子豪;凌華明;廖志戈;裴星宇;黃曉英;李建標;鄧麗芬;郭斯曉;張璇;沈欣煒;孫宏斌 | 申請(專利權)人: | 廣東電網有限責任公司;廣東電網有限責任公司珠海供電局 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/06 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 戴濤 |
| 地址: | 510000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 kd canopy 優化 bisecting means 負荷 方法 | ||
本發明提供一種基于Kd樹與Canopy優化Bisecting K?means的負荷聚類方法,包括以下步驟:S1.采集指定時間段內各個用戶的用電負荷數據,并對用電負荷數據進行預處理得到負荷數據集X;S2.將負荷數據集X輸入Canopy算法中,得到聚類個數K,同時,建立負荷數據集X的Kd樹;S3.將步驟S2中得到聚類個數K作為參數輸入Bisecting K?means算法,再將負荷數據集X輸入Bisecting K?means算法進行聚類分析,Kd樹對Bisecting K?means算法進行加速計算;S4.得到聚類結果。本發明能夠對高維度的數據集進行快速運算,且聚類結果穩定準確,運算成本低。
技術領域
本發明涉及數據處理技術領域,更具體地,涉及一種基于Kd樹與Canopy優化Bisecting K-means的負荷聚類方法。
背景技術
隨著電力系統的不斷發展與大量智能電表的安裝,電力系統積累了海量的用電數據。與此同時,當今電網中的供需不平衡問題也越發嚴峻,用戶側資源越來越受到重視。用戶用電負荷分析是供電企業了解用戶用電負荷模式所必不可少的課題,而用戶負荷數據聚類是其中最重要的一環。良好有效的用戶負荷數據聚類分析有利于供電企業總結出不同的用戶類別,從而提供針對性的個性化服務。
目前在電力負荷數據聚類方面,已經有許多學者進行了探索。一部分研究使用了基于層次聚類等算法,此類算法可自動確定聚類數,在小樣本集上能取得較好的效果,但是此類方法大多計算量冗雜,不適用于海量高緯度的負荷曲線數據。另一部分研究采用了K-means等基于劃分的聚類方法,此類算法相對能更好的處理大數據集,但是需要預先給定聚類數等參數,且運算結果不穩定,有一定局限性。雖然已經有學者使用輪廓系數,手肘法等方法來獲得K-means所需的聚類數。但這些方法涉及多種評價指標,基于不同指標常給出不同的聚類數目。中國專利公開號CN106530132A,公開時間2017年3月22日,該申請公開了一種電力負荷聚類的方法及裝置,采集電力負荷數據;將所述電力負荷數據進行Canopy聚類,生成若干Canopy類和Canopy中心;將所述Canopy中心作為K值,利用K-Means聚類算法,生成電力負荷聚類結果,但是再該申請中對海量數據進行指標的交叉驗證費時費力,而且現實負荷數據伴隨有維度高,分布稀疏,缺損值多,異常值多等問題,因此其聚類的結果也不夠理想。
發明內容
本發明的目的在于克服對于用戶用電負荷數據進行聚類過程中交叉驗證費時費力,且現實負荷數據伴隨有維度高,分布稀疏,缺損值多,異常值多,導致聚類結果不理想的缺點,提供一種基于Kd樹與Canopy優化Bisecting K-means的負荷聚類方法。本發明不需要人為設定聚類個數K,而是根據具體數據集分布由Canopy算法給出,更加科學準確,且利用了Kd樹加速計算高維數據距離運算,能夠對高維度的數據集進行快速運算,且聚類結果穩定準確,運算成本低。
為解決上述技術問題,本發明采用的技術方案是:一種基于Kd樹與Canopy優化Bisecting K-means的負荷聚類方法,包括以下步驟:
S1.采集指定時間段內各個用戶的用電負荷數據,并對用電負荷數據進行預處理得到負荷數據集X;
S2.將負荷數據集X輸入Canopy算法中,得到聚類個數K,同時,建立負荷數據集X的Kd樹;
S3.將步驟S2中得到聚類個數K作為參數Bisecting K-means算法的參數,再將負荷數據集X輸入Bisecting K-means算法進行聚類分析,Kd樹對BisectingK-means算法進行加速計算;
S4.得到聚類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電網有限責任公司;廣東電網有限責任公司珠海供電局,未經廣東電網有限責任公司;廣東電網有限責任公司珠海供電局許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010543636.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:大數據健康預測系統
- 下一篇:一種中央空調控制系統





