[發明專利]一種基于Kd樹與Canopy優化Bisecting K-means的負荷聚類方法在審
| 申請號: | 202010543636.6 | 申請日: | 2020-06-15 |
| 公開(公告)號: | CN111783850A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 黃明磊;周子豪;凌華明;廖志戈;裴星宇;黃曉英;李建標;鄧麗芬;郭斯曉;張璇;沈欣煒;孫宏斌 | 申請(專利權)人: | 廣東電網有限責任公司;廣東電網有限責任公司珠海供電局 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/06 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 戴濤 |
| 地址: | 510000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 kd canopy 優化 bisecting means 負荷 方法 | ||
1.一種基于Kd樹與Canopy優化Bisecting K-means的負荷聚類方法,其特征在于:包括以下步驟:
S1.采集指定時間段內各個用戶的用電負荷數據,并對用電負荷數據進行預處理得到負荷數據集X;
S2.將負荷數據集X輸入Canopy算法中,得到聚類個數K,同時,建立負荷數據集X的Kd樹;
S3.將步驟S2中得到聚類個數K作為參數輸入Bisecting K-means算法,再將負荷數據集X輸入Bisecting K-means算法進行聚類分析,Kd樹對Bisecting K-means算法進行加速計算;
S4.得到聚類結果。
2.根據權利要求1所述的一種基于Kd樹與Canopy優化Bisecting K-means的負荷聚類方法,其特征在于:所述步驟S1中,對用電負荷數據進行缺損值填充,異常值替換,降維和歸一化的預處理之后得到負荷數據集X。
3.根據權利要求2所述的一種基于Kd樹與Canopy優化Bisecting K-means的負荷聚類方法,其特征在于:所述步驟S2中,Canopy算法包括以下步驟:
S211.復制負荷數據集X得到數據集Xcopy,根據先驗知識或交叉驗證調整初始距離閾值T1、T2,且T1≥T2;
S212.從數據集Xcopy中隨機選擇一個樣本x1作為第一個Canopy的聚簇質心c1,質心集記為C,c1∈C,并將c1從數據集Xcopy中刪除。
S213.從數據集Xcopy中隨機選擇一個樣本xi,計算其到質心集中所有質心的距離dij,dij代表第i個樣本到第j個質心的距離,考察其中最小的距離如果則給xi一個弱標記,表示xi屬于cj,并將xi加入其中;如果則給xi一個強標記,表示xi屬于該cj,且和質心非常接近,因此將xi從Xcopy中刪除;如果則xi形成一個新的聚簇質心cnew,加入質心集C,并將xi從Xcopy中刪除;
S214.重復步驟S213直到數據集Xcopy為空,得到聚簇質心數量即聚類個數K。
4.根據權利要求3所述的一種基于Kd樹與Canopy優化Bisecting K-means的負荷聚類方法,其特征在于:所述步驟S2中,Kd樹的建立使用遞歸的KdConstruct(X,h=0,H=d)函數,包括以下步驟:
S221.輸入負荷數據集X,Kd樹的當前深度h和截止深度H,其中H=d,d為數據集的維度;
S222.計算負荷數據集X中每一維數據的方差值,將維度序號按方差大小來排序,形成Split List,取Split List中第h維的中點值作為分割點MidPoint,將負荷數據中的數據X分為兩個集合和根節點Root包含整個樣本集X。
S223.建立根節點Root的左右子節點,Lchild為左子節點,包含樣本集Xleft,Rchild為右子節點,包含樣本集Xright,Lchild=KdConstruct(Xleft,h+1,H),Rchild=KdConstruct(Xright,h+1,H),遞歸地調用直到子節點為葉子節點,或h=H;
S224.返回根節點Root。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東電網有限責任公司;廣東電網有限責任公司珠海供電局,未經廣東電網有限責任公司;廣東電網有限責任公司珠海供電局許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010543636.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:大數據健康預測系統
- 下一篇:一種中央空調控制系統





