[發明專利]一種三階段多視角特征融合的竊電分類預測方法有效
| 申請號: | 201710036718.X | 申請日: | 2017-01-18 |
| 公開(公告)號: | CN106909933B | 公開(公告)日: | 2018-05-18 |
| 發明(設計)人: | 歐陽志友;岳東;薛禹勝;竇春霞 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G01R22/06;G06Q50/06 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 劉傳玉 |
| 地址: | 210046 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 階段 視角 特征 融合 分類 預測 方法 | ||
1.一種三階段多視角特征融合的竊電分類預測方法,其特征在于,包括如下步驟:
步驟1),對待分析的客戶用電數據,將其作為測試集,并對日用電量、當日電表讀數、前一日電表讀數中的缺失數據分別用“-1”和“0”進行填充,形成兩份預處理數據;
步驟2),對每份預處理數據:
步驟2.1),從時間窗口統計、異常突變值統計和時間序列分析這三個視角中選擇至少兩個視角來提取特征,每個視角提取的特征值的集合作為一個單獨的特征簇,然后把提取到的單獨的特征簇合并為一個特征簇,并把該各個單獨的特征簇以及合并后的特征簇形成的集合作為該預處理數據的特征簇集合;
步驟2.2),對特征簇集合中的每一個特征簇,采用至少一種二分類的分類算法使用該特征簇分別對預設的客戶用電數據的訓練集、測試集中的每一個客戶進行竊電概率預測;
步驟3),對于訓練集和測試集中的每一個客戶,將其在兩份預處理數據中預測得到的各個預測竊電概率組成其預測竊電概率集合;
步驟4),將訓練集和測試集中所有客戶的預測竊電概率集合作為特征、分別用樹分類模型和線性分類模型對測試集進行預測,將得到的兩個預測概率值取平均,得到待分析的客戶用電數據中各個客戶的最終預測竊電概率;
步驟5),將待分析的客戶用電數據中各個客戶的最終預測竊電概率分別和預設的竊電概率閾值進行比較,將最終預測竊電概率大于預設的竊電概率閾值的客戶劃分為竊電客戶,將最終預測竊電概率小于等于預設的竊電概率閾值的客戶劃分為正常客戶。
2.如權利要求1所述的一種三階段多視角特征融合的竊電分類預測方法,其特征在于,所述步驟2.1)中選擇三個視角來提取特征時的詳細步驟為:
步驟2.1.1),對每個客戶按每個月的用電量進行統計,并將其作為時間窗特征簇,所述用電量統計包括用電量的最大值、最小值、均值和根方差;
步驟2.1.2),統計日用電量、當日電表讀數和前一日電表讀數的數值突變情況,并將其作為突變特征簇,所述數值突變情況包括小于前一日電表讀數的電表讀數、日用電量缺失、當日電表讀數缺失、前一日電表讀數缺失和日用電量為負數的電表讀數;
步驟2.1.3),對每個客戶按時間順序,將日用電量轉化為時間序列,分別提取時間序列的峰值個數、波谷個數、均值、分位數、季節性趨勢、周期性趨勢時間序列特征,作為時序特征簇;
步驟2.1.4),將時間窗特征簇、突變特征簇和時序特征簇合并為一個特征簇;
步驟2.1.5),把時間窗特征簇、突變特征簇、時序特征簇和合并后的特征簇形成的集合作為預處理數據的特征簇集合。
3.如權利要求2所述的一種三階段多視角特征融合的竊電分類預測方法,其特征在于,所述步驟2.2)的詳細步驟為:
對特征簇集合中的每一個特征簇,采用至少一種二分類的分類算法使用該特征簇分別對預設的客戶用電數據的訓練集、測試集中的每一個客戶進行竊電概率預測;
步驟2.2.1),將訓練集的數據按客戶隨機抽樣分成N份訓練數據;
步驟2.2.2),對于每份訓練數據:
將其作為子驗證集、其余N-1份訓練數據的合集作為子訓練集,依次使用特征簇集合中的每一個特征簇、采用至少一種二分類的分類算法預測該子驗證集和測試集中客戶的竊電概率;
步驟2.2.3),將步驟2.2.2)中所有訓練數據的預測結果進行合并,得到訓練集中各個客戶的竊電概率的預測值;
步驟2.2.4),對步驟2.2.2)中各份訓練數據對應的測試集中的每一份客戶的竊電概率求平均值,得到測試集中的各個客戶的竊電概率的預測值。
4.如權利要求3所述的一種三階段多視角特征融合的竊電分類預測方法,其特征在于,步驟2.2)中采用的二分類的分類算法包含XGBoost、LightGBM、Keras、Nerual Network、Logistic Regression和Gradient Boost Decision Tree。
5.如權利要求3所述的一種三階段多視角特征融合的竊電分類預測方法,其特征在于,步驟4)中所述的樹分類模型為XGBoost、LightGBM、Keras、Nerual Network、GradientBoosting Decision Tree中的一種。
6.如權利要求3所述的一種三階段多視角特征融合的竊電分類預測方法,其特征在于,步驟4)中所述的線性分類模型為booster設定為gblinear的XGBoost、LogisticRegression、Linear Regression中的一種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710036718.X/1.html,轉載請聲明來源鉆瓜專利網。





