[發明專利]一種基于貝葉斯算法的住戶用電數據清洗方法在審
| 申請號: | 201910039302.2 | 申請日: | 2019-01-16 |
| 公開(公告)號: | CN109815222A | 公開(公告)日: | 2019-05-28 |
| 發明(設計)人: | 陳小強 | 申請(專利權)人: | 江蘇圣通電力新能源科技有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06Q50/06 |
| 代理公司: | 南京正聯知識產權代理有限公司 32243 | 代理人: | 李寰 |
| 地址: | 212400 江蘇省鎮*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 清洗 用電數據 算法 貝葉斯 住戶 數據清洗 錯誤類型 結果驗證 排序算法 數據采集 數據替換 重復數據 不一致 檢測 重復 非法 制定 | ||
1.一種基于貝葉斯算法的住戶用電數據清洗方法,其特征在于,具體包括以下步驟:
1)從住戶用電數據庫中采集住戶用電數據,將采集到的住戶用電數據放入待清洗庫中;
2)對待清洗數據庫中的住戶用電數據進行數據分析,確定住戶用電數據的屬性信息;
3)定義清洗規則,根據住戶用電數據不同的錯誤類型制定不同的清洗規則;
4)根據清洗規則對住戶用電數據進行初次清洗;
5)采用貝葉斯算法對初次清洗后的住戶用電數據進行深度清洗;
6)驗證清洗結果,判斷是否滿足清洗要求,如果是,則進行步驟7,否則重復步驟2)至步驟5);
7)用清洗后的住戶用電數據替換原住戶用電數據。
2.根據權利要求1所述的基于貝葉斯算法的住戶用電數據清洗方法,其特征在于,所述步驟3)中清洗規則包括非法值、空值、不一致數據以及相似重復數據的檢測和處理。
3.根據權利要求2所述的基于貝葉斯算法的住戶用電數據清洗方法,其特征在于,所述非法值的處理方法是采取預設值、空值替換非法值或刪除非法值。
4.根據權利要求2所述的基于貝葉斯算法的住戶用電數據清洗方法,其特征在于,所述空值的處理方法是采取平均值填充法、中位數填充法、運用KNN或神經網絡相關算法填充空值。
5.根據權利要求2所述的基于貝葉斯算法的住戶用電數據清洗方法,其特征在于,所述不一致數據的處理方法是采取元數據實現住戶用電數據的一致性。
6.根據權利要求2所述的基于貝葉斯算法的住戶用電數據清洗方法,其特征在于,所述相似重復數據的清洗規則采用近鄰排序算法SNM。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇圣通電力新能源科技有限公司,未經江蘇圣通電力新能源科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910039302.2/1.html,轉載請聲明來源鉆瓜專利網。





