[發明專利]一種低壓臺區戶變關系識別方法和系統在審
| 申請號: | 201811038149.3 | 申請日: | 2018-09-06 |
| 公開(公告)號: | CN109344144A | 公開(公告)日: | 2019-02-15 |
| 發明(設計)人: | 葛得輝;黃昌寶;李云峰;鄭英剛 | 申請(專利權)人: | 葛得輝;中能瑞通(北京)科技有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/332 |
| 代理公司: | 北京知呱呱知識產權代理有限公司 11577 | 代理人: | 武媛;呂學文 |
| 地址: | 100053 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電壓數據 低壓臺區 地址數據 關系識別 源數據 清洗 用戶信息采集 檔案數據 電力企業 電流數據 工作難度 數據清洗 數據校驗 臺區識別 有效解決 線損 分析 | ||
1.一種低壓臺區戶變關系識別方法,其特征在于,包括:
從用戶信息采集系統中獲取至少包括檔案數據、電壓數據和電流數據中的一項或多項的源數據;
對所述源數據進行數據清洗,得到清洗后數據;
從所述清洗后數據中獲取能夠表征戶變關系的用電地址數據和電壓數據,并根據所述用電地址數據和所述電壓數據進行臺區識別,得到相應的識別結果;
對得到各識別結果進行數據校驗。
2.根據權利要求1所述的方法,其特征在于,
所述檔案數據至少包括以下一項:
表計或用戶的臺區編號、用電地址;或者,
所述電壓數據為最近更新時間的每天96點電壓曲線數據;或者,
所述電流數據為最新更新時間的每天96點電流曲線數據。
3.根據權利要求1所述的方法,其特征在于,所述對所述源數據進行數據清洗具體包括:
對所述源數據的缺失值進行缺失值補全;或者,
若所述電壓數據或所述電流數據產生異常,則對所述源數據進行異常值處理;或者,
若所述源數據中有重復數據,則對所述源數據進行數據去重的處理。
4.根據權利要求3所述的方法,其特征在于,所述對所述源數據的缺失值進行缺失值補全具體包括:
若缺失值為所述源數據的重要數據,則對該缺失值進行補全;或者,
對于所述源數據中的運行數據通過相鄰值和/或臨近天同時刻的數值進行補全;或者,
若所述源數據對應的缺失數據為一天的全部缺失數據,則對該缺失數據不進行補全;或者,
若所述源數據對應的缺失數據為檔案信息缺失數據,則通過人工核對的方式進行補全。
5.根據權利要求1所述的方法,其特征在于,所述根據所述用電地址數據和所述電壓數據進行臺區識別分析具體包括:
根據所述用電地址數據進行相應的用電地址識別;
根據所述電壓數據進行臺區識別。
6.根據權利要求5所述的方法,其特征在于,所述根據所述用電地址數據進行相應的用電地址識別具體包括:
選取所述檔案數據中的用電地址;
對所述用電地址對應的文本進行文本分詞處理,得到相應的各切分詞語;
基于各切分詞語,構建相應的詞向量空間;
統計文本詞頻,選取詞作為特征項,權重用詞頻表示,通過TF-IDF算法來計算權重值,TF為詞頻,IDF為一個詞在各文本中出現的頻率;
將各文本轉化成相應的向量形式,并通過分類器對各向量形式的各文本進行分類。
7.根據權利要求6所述的方法,其特征在于,
所述對所述用電地址對應的文本進行文本分詞處理,得到相應的各切分詞語具體包括:
若所述用電地址對應的文本為收錄到詞典的詞語,則基于詞典的詞語進行分類,按照正向匹配法進行文本分詞處理,得到相應的各切分詞語;
若所述用電地址對應的文本為未被詞典收錄的詞語,則基于預設的的統計語言模型進行文本分詞處理,得到相應的各切分詞語;或者,
所述分類器采用K-近鄰算法進行分類,所述K-近鄰算法是指給定當前測試文本,系統在訓練集中查找離該測試文本最近的K個文本,并根據所述K個文本的類別判斷當前測試文本的類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于葛得輝;中能瑞通(北京)科技有限公司,未經葛得輝;中能瑞通(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811038149.3/1.html,轉載請聲明來源鉆瓜專利網。





