[發明專利]一種用電信息數據質量分析系統有效
| 申請號: | 201610091425.7 | 申請日: | 2016-02-18 |
| 公開(公告)號: | CN105786996A | 公開(公告)日: | 2016-07-20 |
| 發明(設計)人: | 潘森;朱力鵬;胡斌;周愛華;楊佩;裘洪彬;喬俊峰 | 申請(專利權)人: | 國網智能電網研究院;國家電網公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/06 |
| 代理公司: | 北京安博達知識產權代理有限公司 11271 | 代理人: | 徐國文 |
| 地址: | 102211 北京市昌平區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用電 信息 數據 質量 分析 系統 | ||
1.一種用電信息數據質量分析系統,其特征在于,所述系統包括數據準備模塊、 數據集成模塊和數據分析模塊;
所述數據準備模塊用于采集并存儲用電信息數據;
所述數據集成模塊基于所述數據準備模塊中的所述用電信息數據,建立用于查詢及 計算的數據表;
所述數據分析模塊根據所述數據集成模塊中的所述數據表,計算所述用電信息數據 的指標集,得到所述用電信息數據的有效率。
2.如權利要求1所述的系統,其特征在于,所述數據準備模塊包括數據采集單元、 數據交換單元及數據存儲單元;
所述數據采集單元用于采集用電信息數據,并將所述用電信息數據存儲為關系數據 庫形式;
所述數據交換單元用數據交換工具將關系數據庫形式的所述用電信息數據導入到 數據存儲單元;
所述數據存儲單元為分布式存儲系統,且所述數據存儲單元以文本的形式存儲所述 用電信息數據。
3.如權利要求1或2所述的系統,其特征在于,所述用電信息數據包括用電數據 及輔助數據;
所述用電數據包括用電客戶信息、電能表信息、計量點信息、實時采集信息及歷史 用電量信息,其中,所述實時采集信息包括用電負荷、電壓及電流;
所述輔助數據包括分類標準數據及編碼標準數據。
4.如權利要求1所述的系統,其特征在于,所述數據集成模塊基于所述數據準備 模塊中的所述用電信息數據根據Hive建表語句建立Hive數據表、及根據關聯關系建立 Hive數據總表。
5.如權利要求4所述的系統,其特征在于,所述Hive數據表包括用電客戶Hive 數據表、電能表Hive數據表、計量點Hive數據表、用電負荷Hive數據表、用電電壓 Hive數據表、用電電流Hive數據表及歷史用電量Hive數據表。
6.如權利要求4所述的系統,其特征在于,所述Hive數據總表包括以用電客戶信 息為基礎的數據總表、以計量點信息為基礎的數據總表及基于HBase的Hive總表;
所述以用電客戶信息為基礎的數據總表包括電能表信息及計量點信息,且所述以用 電客戶信息為基礎的數據總表存儲至HBase數據表中;
所述以計量點信息為基礎的數據總表包括實時采集信息以及歷史用電量信息,且所 述以計量點信息為基礎的數據總表存儲至HBase數據表中,其中,所述實時采集信息 包括用電負荷、電壓及電流數據;
所述基于HBase的Hive大表通過Hive建立。
7.如權利要求1所述的系統,其特征在于,計算所述指標集中包括分別計算一致 性指標、完整性指標、準確度指標及有效性指標;
所述用電信息數據的一致性指標及完整性指標均用基于查詢統計的質量分析方法 求得;
所述用電信息數據的準確度指標及有效性指標均用基于數據挖掘的質量分析方法 求得。
8.如權利要求7所述的系統,其特征在于,所述用電信息數據的一致性指標及完 整性指標均用基于查詢統計的質量分析方法求得包括:
計算所述一致性指標包括構建SQL語句,查詢相關聯的數據表,得到查詢結果并 用公式1計算得到所述用電信息數據的一致率數據;其中,公式1為:一致數據記錄數 /總記錄數*100%;
計算所述完整性指標包括構建SQL語句,查詢已建立的Hive數據總表,通過統計 所述Hive數據總表中自動填充為null的記錄數,通過公式2計算得到所述用電信息數 據的完整率,其中,公式2為:(1-null記錄數/總記錄數據)*100%。
9.如權利要求7所述的系統,其特征在于,所述用電信息數據的準確度指標及有 效性指標均用基于數據挖掘的質量分析方法求得包括:
計算所述準確度指標及所述有效性指標中的指標項為針對用電信息采集中用電客 戶的負荷曲線數據、電壓曲線數據以及電流曲線數據而設置的指標項,所述基于數據挖 掘的質量分析方法是通過對要驗證的所述用電信息數據進行聚類,獲得所述用電信息數 據的準確度指標及有效性指標。
10.如權利要求9所述的系統,其特征在于,對要驗證的所述用電信息數據進行聚 類,獲得所述用電信息數據的準確度指標及有效性指標包括:
計算所述準確度指標包括:用并行化的Kmeans算法對用電客戶的曲線數據的曲線 特征進行聚類,從聚類結果中獲取曲線變化特征異常的類族,用公式3來計算曲線數據 的準確率;其中,公式3為:(1-變化特征異常的記錄數/總記錄數)*100%;
計算所述有效性指標包括:用并行化的Kmeans算法對數據取值范圍特征進行聚類, 從聚類結果中獲取異常值分布情況,用公式4計算得到所述用電信息數據的有效率;其 中,公式4為:(1-異常值記錄數/總記錄數)*100%。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網智能電網研究院;國家電網公司,未經國網智能電網研究院;國家電網公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610091425.7/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





