[發明專利]基于Lasso算法的異常數據檢測方法及裝置在審
| 申請號: | 202010859396.0 | 申請日: | 2020-08-24 |
| 公開(公告)號: | CN111737249A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 胡若云;張宏達;李國良;柴成亮;林森;姚力;許靈杰;徐永進;林少娃;呂幾凡;王慶娟 | 申請(專利權)人: | 國網浙江省電力有限公司;國網浙江省電力有限公司營銷服務中心 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F17/18;G06Q10/04;G06Q50/06 |
| 代理公司: | 杭州華鼎知識產權代理事務所(普通合伙) 33217 | 代理人: | 魏亮 |
| 地址: | 310007*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 lasso 算法 異常 數據 檢測 方法 裝置 | ||
1.基于Lasso算法的異常數據檢測方法,其特征在于,該方法包括:
從電力大數據采集和應用系統中獲取待檢測數據集和訓練樣本集,所述待檢測數據集是由不同日期產生的實際用電數據組成的時序數據序列,所述訓練樣本集是待檢測數據集之前產生的歷史用電數據組成的時序數據序列;
以訓練樣本的數據生成日期為變量,以數據生成日期的日歷特征和當前訓練樣本之前的歷史用電數據數值特征為變量特征,基于Lasso算法對模型進行訓練優化,得到用電數據預測模型;
以所述待檢測數據集中每個實際用電數據的生成日期作為輸入,通過所述用電數據預測模型獲取各實際用電數據對應的預測用電數據;
對所述待檢測數據集中的每個實際用電數據,基于相應的預測用電數據進行異常檢測。
2.根據權利要求1所述的基于Lasso算法的異常數據檢測方法,其特征在于,所述日歷特征包括:月份、星期、季度、是否月初第一天、是否月末最后一天、是否季度第一天、是否季度最后一天、是否周末、假期類型。
3.根據權利要求1所述的基于Lasso算法的異常數據檢測方法,其特征在于,所述歷史用電數據數值特征包括:當前日期往前平移5天的數值、當前日期往前平移6個天的數值、當前日期往前平移7天的數值、當前日期往前平移8天的數值、去年同期月日均數值、上個月日均數值、當前日期所對應假期類型的平均數值。
4.根據權利要求2或3所述的基于Lasso算法的異常數據檢測方法,其特征在于,對訓練樣本集進行學習訓練前,對所述訓練樣本集進行數據清洗,包括:
利用S-H-ESD算法識別所述訓練樣本集中的異常數據;
通過均值插補法對識別的異常數據進行數據修復。
5.根據權利要求4所述的基于Lasso算法的異常數據檢測方法,其特征在于,利用S-H-ESD 算法識別所述訓練樣本集中的異常數據,包括:
S01、采用STL算法將所述訓練樣本集中的時序數據分解為趨勢分量、周期分量和余項分量,將所述余項分量作為第一余項分量;
S02、基于所述訓練樣本集中時序數據的中位數和所述周期分量計算得到第二余項分量,計算公式為:
S03、計算所述第二余項分量的數據序列與中位數偏離的最遠殘差,作為檢驗統計量;
S04、計算當前樣本的臨界值;
S05、比較所述檢驗統計量和所述臨界值;
S06、若所述檢驗統計量大于所述臨界值,則標記當前樣本數據為異常數據,
S07、迭代執行步驟S01-步驟S06,對所述訓練樣本集中每個數據進行檢測。
6.根據權利要求4所述的基于Lasso算法的異常數據檢測方法,其特征在于,所述均值插補法為采用異常數據相鄰的前2個與后2個非異常數據的均值進行數據修復:
其中,為修復后的數據,為j日期逐日往前推移時出現的第一個及第二個非異常數據,為j日期逐日往后推移時出現的第一個及第二個非異常數據。
7.根據權利要求4所述的基于Lasso算法的異常數據檢測方法,其特征在于,對所述待檢測數據集中的每個實際用電數據,基于相應的預測用電數據進行異常檢測,包括:
基于所述預測用電數據,得到實際用電數據與所述預測用電數據的數值之差;
當數值之差的絕對值大于預設閾值時,判斷所述實際用電數據為異常數據;否則,判斷所述實際用電數據為正常數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網浙江省電力有限公司;國網浙江省電力有限公司營銷服務中心,未經國網浙江省電力有限公司;國網浙江省電力有限公司營銷服務中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010859396.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于區塊鏈的業務處理方法、裝置、設備及存儲介質
- 下一篇:天然礦泉水處理系統





