[發(fā)明專利]一種基于用電特征與離群點檢測的專變行業(yè)錯戶識別方法在審
| 申請?zhí)枺?/td> | 202010539733.8 | 申請日: | 2020-06-12 |
| 公開(公告)號: | CN111861785A | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計)人: | 姚力;陸春光;徐韜;章江銘;倪琳娜;陳嘉;林英鶴;王建波 | 申請(專利權(quán))人: | 國網(wǎng)浙江省電力有限公司電力科學(xué)研究院;國網(wǎng)浙江省電力有限公司臺州供電公司;浙江華云信息科技有限公司 |
| 主分類號: | G06Q50/06 | 分類號: | G06Q50/06;G06K9/62 |
| 代理公司: | 浙江翔隆專利事務(wù)所(普通合伙) 33206 | 代理人: | 王曉燕 |
| 地址: | 310014 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用電 特征 離群 檢測 行業(yè) 識別 方法 | ||
本發(fā)明公開了一種基于用電特征與離群點檢測的專變行業(yè)錯戶識別方法,涉及電力運維領(lǐng)域。目前,不能有效地辨識專變行業(yè)信息錯誤的用戶。本發(fā)明采集了區(qū)域范圍內(nèi)某一行業(yè)的專變用戶一年365天的日用電量數(shù)據(jù),并對其日用電量進(jìn)行歸一化;接著將365維的日用電數(shù)據(jù)輸入PCA降維算法,根據(jù)主成分特征值大小排序,并選取保留表征用電特征的特征值較大的主成分向量作為降維后的特征數(shù)據(jù);然后計算專變用戶降維后的特征數(shù)據(jù)在新的特征空間中的LOF系數(shù),并采用肘部法確定LOF系數(shù)閾值;最后選取LOF系數(shù)大于閾值的專變用戶作為待排查的行業(yè)分類錯誤嫌疑用戶。本技術(shù)方案能快速、準(zhǔn)確地根據(jù)不同行業(yè)的典型用電信息,完成對一個行業(yè)中檔案歸類錯誤的專變用戶的辨識。
技術(shù)領(lǐng)域
本發(fā)明涉及電力運維領(lǐng)域,尤其涉及一種基于用電特征與離群點檢測的專變行業(yè)錯戶識別方法。
背景技術(shù)
不同行業(yè)電力用戶的用電特征不盡相同,如果不對行業(yè)加以區(qū)分,僅僅是整體分析電力用戶的負(fù)荷特性,很難準(zhǔn)確把握各用戶的用電特征,精確度不高,為最終實現(xiàn)用電結(jié)構(gòu)的優(yōu)化與用電行為的高效管理,有必要從各行業(yè)著手,分析各行業(yè)負(fù)荷特點及用電習(xí)慣。
傳統(tǒng)的專變行業(yè)分類方法通常根據(jù)行業(yè)的業(yè)務(wù)范圍對專變類型進(jìn)行劃分,例如以《國民經(jīng)濟(jì)行業(yè)用電分類》作為詳細(xì)準(zhǔn)確的專變電力用戶負(fù)荷分類目錄參考。在用電信息管理系統(tǒng)中,專變用戶的行業(yè)檔案信息一般也是根據(jù)用戶所對應(yīng)的企業(yè)的業(yè)務(wù)決定的。但是由于部分地區(qū)、行業(yè)的企業(yè)業(yè)務(wù)變更較快,當(dāng)發(fā)生變更時,營銷管理系統(tǒng)中的檔案信息往往無法及時更新,導(dǎo)致對專變的用能管理無法很好開展。
現(xiàn)有的基于專變電力用戶負(fù)荷特征分類的研究本質(zhì)上是數(shù)據(jù)挖掘中聚類方法的體現(xiàn),將具有相同或相似的用電特征的用戶歸為一類,最終實現(xiàn)同一類用戶用電特征相似,不同類別用戶用電特征有較大差異。這種分類通常是在專變電力用戶的行業(yè)信息基礎(chǔ)上開展的,而沒有對行業(yè)信息的真?zhèn)芜M(jìn)行辨識,也就是說,傳統(tǒng)的專變行業(yè)分類方法和負(fù)荷特征挖掘方法均不能有效地辨識專變行業(yè)信息錯誤的用戶。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題和提出的技術(shù)任務(wù)是對現(xiàn)有技術(shù)方案進(jìn)行完善與改進(jìn),提供一種基于用電特征與離群點檢測的專變行業(yè)錯戶識別方法,以達(dá)到有效辨識專變行業(yè)信息錯誤的用戶目的。為此,本發(fā)明采取以下技術(shù)方案。
一種基于用電特征與離群點檢測的專變行業(yè)錯戶識別方法,其特征在于包括步驟:
1)采集區(qū)域范圍內(nèi)某一行業(yè)的專變用戶一年365天的日用電量數(shù)據(jù),并對其日用電量進(jìn)行歸一化;
2)將365天的日用電數(shù)據(jù)輸入PCA降維算法,根據(jù)主成分特征值大小排序,并選取保留保留表征用電特征的特征值較大的主成分向量作為降維后的特征數(shù)據(jù);
3)計算專變用戶降維后的特征數(shù)據(jù)在新的特征空間中的LOF系數(shù);
4)采用肘部法確定LOF系數(shù)閾值;
5)選取LOF系數(shù)大于閾值的專變用戶作為待排查的行業(yè)分類錯誤嫌疑用戶。
本技術(shù)方案采用了PCA降維算法和LOF離群點檢測算法,首先采集了區(qū)域范圍內(nèi)一個行業(yè)的專變用戶一年365天的日用電量數(shù)據(jù),并進(jìn)行歸一化處理,由于維數(shù)過高,分析結(jié)果可能會受到其中重復(fù)和無用信息的干擾,故采用主成分分析法(Principal ComponentAnalysis,PCA)對原有高維數(shù)據(jù)進(jìn)行降維分析,取保留表征用電特征的特征值較大的主成分作為局部異常因子算法(Local Outlier Factor,LOF)的輸入;根據(jù)LOF算法計算所得局部密度系數(shù),并采用肘部法則可以確定潛在的行業(yè)檔案歸類錯誤的專變用戶。從而實現(xiàn)快速、準(zhǔn)確地根據(jù)不同行業(yè)的典型用電信息,完成對一個行業(yè)中檔案歸類錯誤的專變用戶的辨識。
作為優(yōu)選技術(shù)手段:在步驟1)中,根據(jù)用電信息采集系統(tǒng)中的專變行業(yè)分類信息,將區(qū)域內(nèi)某一行業(yè)的專變一年365天的日用電數(shù)據(jù)作為輸入,并對其日用電量進(jìn)行歸一化,其歸一化公式為歸一化處理公式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國網(wǎng)浙江省電力有限公司電力科學(xué)研究院;國網(wǎng)浙江省電力有限公司臺州供電公司;浙江華云信息科技有限公司,未經(jīng)國網(wǎng)浙江省電力有限公司電力科學(xué)研究院;國網(wǎng)浙江省電力有限公司臺州供電公司;浙江華云信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010539733.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q50-00 專門適用于特定經(jīng)營部門的系統(tǒng)或方法,例如公用事業(yè)或旅游
G06Q50-02 .農(nóng)業(yè);漁業(yè);礦業(yè)
G06Q50-04 .制造業(yè)
G06Q50-06 .電力、天然氣或水供應(yīng)
G06Q50-08 .建筑
G06Q50-10 .服務(wù)
- 一種識別離群交通數(shù)據(jù)的方法
- 一種大規(guī)模數(shù)據(jù)中離群數(shù)據(jù)的分析方法
- 一種基于角度的高維數(shù)據(jù)離群檢測方法
- 離群點檢測方法和裝置
- 一種去趨勢分析差分隱私保護(hù)的直方圖數(shù)據(jù)發(fā)布方法
- 異常數(shù)據(jù)檢測方法及裝置
- 將未經(jīng)監(jiān)督參數(shù)學(xué)習(xí)用于離群值檢測以識別生產(chǎn)用生物體
- 動力系統(tǒng)運行異常點檢測方法
- 基于離群參數(shù)的設(shè)備故障預(yù)警方法、裝置、設(shè)備及介質(zhì)
- 眼動數(shù)據(jù)的離群處理方法及裝置、計算機(jī)設(shè)備、存儲介質(zhì)





