[發明專利]一種用戶竊電行為檢測方法、系統、終端及介質在審
| 申請號: | 202110364692.8 | 申請日: | 2021-04-06 |
| 公開(公告)號: | CN113095391A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 張希鵬;齊拯;劉杰;汪詩怡;趙璇;周毅;金麒;羅津;張衡 | 申請(專利權)人: | 國網上海市電力公司市北供電公司;上海交通大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/06;G06N20/00;G06F16/903 |
| 代理公司: | 上海恒慧知識產權代理事務所(特殊普通合伙) 31317 | 代理人: | 劉翠;徐紅銀 |
| 地址: | 200070 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 行為 檢測 方法 系統 終端 介質 | ||
本發明提供了一種用戶竊電行為檢測方法及系統,獲取平電量、谷電量及總電量用電量數據,篩選出極端異常數據并刪除,在時間維度上進行內部插值補全缺失數據;構建用戶用電量特征向量;構建有監督的極致梯度提升決策樹,從訓練集中學習用電量特征向量的分布,并進行參數調優和性能檢驗,得到極致梯度提升決策樹分類模型;通過分類模型中每個判斷節點對用戶用電量特征向量中的特征進行判斷,根據特征在判斷節點中所占比例,得到每個特征的重要性,并反饋至用戶用電量特征向量進行優化,完成對用戶竊電行為的檢測。同時提供了一種終端及系統。本發明為供電力企業有針對性地上門進行查處提供了依據,大大減少了電力企業的工作量,提高了工作效率。
技術領域
本發明涉及竊電行為分析檢測技術領域,具體地,涉及一種基于用戶用電特征向量和極致梯度提升決策樹的用戶竊電行為檢測方法、系統、終端及介質。
背景技術
如今,每戶家庭大多裝有獨立電表,記錄每日用電量。居民總用電量分為平時用電量及谷時用電量,其中谷時用電量單價較低。但有部分用戶為了減少電費,采用更換元件、私接外線、進出線短接等方式對電表進行改造,造成國家財產損失的同時也形成了極大的安全隱患,影響用電秩序。電力企業需要盡早、準確地識別竊電行為,但表內改造較為隱蔽,如果僅靠具有電氣相關專業知識的工作人員對電表逐一檢查,將耗費巨大人力。近年來,更加專業化、具有防拆設計的電表逐漸推廣,功能更加豐富的智能電表也被應用于反竊電,但要對智能電表記錄的大量用電量數據進行分析,進而檢測竊電行為,需要采用反竊電算法對異常用戶進行辨識。足夠高的算法準確性可以允許工作人員有針對性地對模型識別的異常用戶進行檢查,減少電力企業為反竊電所耗費的人力物力。
由于用戶入網時間不同,用戶用電序列的起止時間存在一定區別;由于電路故障、系統偶發性故障、誤操作等原因,用戶每日用電序列可能存在單日或多日的數據空缺,或是存在例如單日用電量達十萬度以上的極端異常數據,絕大多數機器學習方法難以適應此類存在缺陷的數據。
梯度提升樹模型是一種集成多個樹型分類器模型的算法,可以形成一個性能較強的分類器。極致梯度提升決策樹算法對梯度提升樹模型進行了一定的工程優化,適合作為分類算法,增加了正則項用于控制模型的復雜度,減少過擬合,提升了模型的泛化能力。同時,基于樹的機器學習模型存在較為明確的判斷條件,可以在模型訓練完成后,根據指標在樹的分裂點中對性能的改進量,計算不同指標的重要性。但是,如果將梯度提升樹模型直接應用于竊電行為檢測中,則存在如下問題:
真實情況下用戶用電量數據存在缺陷,且長度不一致,無法直接套用模型,需要構建合理有效的用戶用電量特征向量作為用戶畫像;用電量本身存在季節性,夏季和冬季用電量較大,其本質原因在于夏季和冬季氣溫偏離舒適氣溫,從數據本身難以精確反映與每日氣溫的關系,需要納入當日氣溫作為外部信息,擴充數據信息量;異常用戶占比極低,存在嚴重的數據不均衡問題,在數據處理\機器學習模型的選擇和性能的驗證上都需要額外處理。
經過檢索發現:
授權公告號為CN109919520B,授權公告日為2020年2月11日的中國發明專利《竊電行為檢測方法及裝置》,應用于用電數據監測設備,所述設備中存儲有至少一個用戶賬號對應的檢測分類器模型,其中所述檢測分類器模型是基于該用戶賬號的歷史用電數據所對應的用電特征參數集合訓練得到的。所述方法通過使用對應用戶賬號的檢測分類器模型對該用戶賬號的用電數據進行竊電行為檢測的方式,確保了竊電行為檢測的精度及效率,無需增加智能電網的運營成本,其中檢測分類器模型的訓練過程因采用用電數據的用電特征參數進行訓練,可確保分類器模型的訓練時間足夠短,同時也降低了分類器模型的復雜度,確保所述分類器模型可以很快地實現竊電行為檢測功能。但是該方法仍然存在如下問題:
需要采用同一用電類型在當日不同采樣時間點對應的用電量,用于得到樣本用電事件序列集合,對電表的智能化有一定要求,采樣粒度較高,對數據質量要求較高。判斷用電事件的閾值需要預設,存在一定的模糊性,且可能隨地區、時間、季節等情況發生變化。采用的機器學習模型難以提供不同特征的重要性,不適合根據地區等差異進行選擇性優化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網上海市電力公司市北供電公司;上海交通大學,未經國網上海市電力公司市北供電公司;上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110364692.8/2.html,轉載請聲明來源鉆瓜專利網。





