[發(fā)明專利]一種基于PCA降維和K-Means聚類的低壓臺區(qū)用戶接入點識別方法在審
| 申請?zhí)枺?/td> | 201911091514.1 | 申請日: | 2019-11-10 |
| 公開(公告)號: | CN111126429A | 公開(公告)日: | 2020-05-08 |
| 發(fā)明(設計)人: | 王偉峰;嚴華江;胡瑛俊;葉方彬;姜瑩;姜馳;戴磊華 | 申請(專利權)人: | 國網(wǎng)浙江省電力有限公司;國網(wǎng)浙江省電力有限公司電力科學研究院;浙江華云信息科技有限公司;國家電網(wǎng)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;H02J13/00 |
| 代理公司: | 浙江翔隆專利事務所(普通合伙) 33206 | 代理人: | 王曉燕 |
| 地址: | 310007 *** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 pca 維和 means 壓臺 用戶 接入 識別 方法 | ||
1.一種基于PCA降維和K-Means聚類的低壓臺區(qū)用戶接入點識別方法,其特征在于包括以下步驟:
1)獲取臺區(qū)用戶負荷數(shù)據(jù);
2)對獲取的臺區(qū)用戶負荷數(shù)據(jù)進行標準化處理;
3)對標準化處理的數(shù)據(jù)進行主成分分析法PCA降維處理,經(jīng)主成分分析法PCA降維處理的數(shù)據(jù)在保持各維數(shù)據(jù)維度內方差最大的前提下,通過尋找新的向量基,將原有高維數(shù)據(jù)投影在低維空間,剔除方差較小的噪聲,保留信息量最大的主成分;變換后的特征值大的維度即代表原有數(shù)據(jù)中方差較大的維數(shù),取變換后最能反映原始數(shù)據(jù)方差特征的前五維數(shù)據(jù),作為下一步聚類分析的輸入數(shù)據(jù);
4)聚類分析,對PCA降維后的數(shù)據(jù)采用K-Means方法進行聚類分析;最后得到各相下用戶的接入點拓撲分析結果,并與系統(tǒng)中現(xiàn)有拓撲檔案進行比對;
5)對所分析臺區(qū)進行現(xiàn)場排查,驗證分析結果的準確性。
2.根據(jù)權利要求1所述的一種基于PCA降維和K-Means聚類的低壓臺區(qū)用戶接入點識別方法,其特征在于:在步驟1),從采集系統(tǒng)中選定待分析臺區(qū),提取待分析臺區(qū)下所有用戶的96點日負荷數(shù)據(jù),根據(jù)采集率進行數(shù)據(jù)清洗,選取日負荷滿96點日期的數(shù)據(jù)進行分析,由于日負荷在24小時內具有較大的波動性,而96點數(shù)據(jù)在模型中分析時應具有相同地位,對分析結果起到同等作用,因此需要對數(shù)據(jù)進行特征縮放,在步驟2)中采用z-score標準化方法,反映各數(shù)據(jù)在原始數(shù)據(jù)分布中的地位,同時以標準差為單位實現(xiàn)不同維度間數(shù)據(jù)的等距比較,z-score標準化公式如下:
其中,mean(x)表示用戶該維度下特征的均值,std(x)表示該維度下用戶特征的方差。
3.根據(jù)權利要求2所述的一種基于PCA降維和K-Means聚類的低壓臺區(qū)用戶接入點識別方法,其特征在于:在步驟3)中主成分分析法PCA降維處理包括以下步驟:
31)構建原始特征值矩陣[x1,x2,x3...xn],其中n代表個樣本的維數(shù),xi是第i維上各樣本的特征值列向量;
32)計算各維樣本均值ψ和差值向量di:
di=xi-ψ
33)構建協(xié)方差矩陣:
式中,A=[d1,d2...dn];
34)奇異值分解(Singular Value Decomposition,SVD)求得AAT的特征值,并按照單調遞減的順序排列λ1≥λ2≥...≥λp,與其對應的特征向量分別為:μ1,μ2,...μp(p≤n);
35)根據(jù)降維目標維度選取前p個特征向量組成線性變換矩陣:
W=[μ1,μ2...μp]
36)將原始差值特征投影到p維子空間:
PCp=WTdi(i=1,2,...n)
式中,PCp為所求的p維主成分降維特征。
4.根據(jù)權利要求3所述的一種基于PCA降維和K-Means聚類的低壓臺區(qū)用戶接入點識別方法,其特征在于:在步驟4)中,K-Means算法先根據(jù)預設聚類數(shù)隨機初始化聚類中心,對所有樣本按照其距離各中心的遠近進行歸類,計算各類內樣本到中心的誤差和,并將類內樣本均值作為新的聚類中心,不斷迭代,直到類內誤差和達到最小值范圍內,完成聚類分析;其中誤差準則函數(shù)如下:
其中,k表示預設聚類數(shù)量,i代表聚類樣本序號,Ci代表第i類樣本集,xi表示第i類樣本的均值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網(wǎng)浙江省電力有限公司;國網(wǎng)浙江省電力有限公司電力科學研究院;浙江華云信息科技有限公司;國家電網(wǎng)有限公司,未經(jīng)國網(wǎng)浙江省電力有限公司;國網(wǎng)浙江省電力有限公司電力科學研究院;浙江華云信息科技有限公司;國家電網(wǎng)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911091514.1/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





