[發明專利]一種基于供電服務信息的數據挖掘方法在審
| 申請號: | 202211421811.X | 申請日: | 2022-11-14 |
| 公開(公告)號: | CN115907012A | 公開(公告)日: | 2023-04-04 |
| 發明(設計)人: | 彭昕;陸子秋;閆筱 | 申請(專利權)人: | 國網上海市電力公司 |
| 主分類號: | G06N5/025 | 分類號: | G06N5/025;G06N3/045;G06N3/0442;G06F18/241;G06F18/22;G06F18/2321;G06Q50/06;G06F16/35;G06F40/205;G06F16/29 |
| 代理公司: | 上海三和萬國知識產權代理事務所(普通合伙) 31230 | 代理人: | 蔡海淳 |
| 地址: | 200122 上海市浦東新區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 供電 服務 信息 數據 挖掘 方法 | ||
一種基于供電服務信息的數據挖掘方法,屬供電服務信息挖掘領域。數據挖掘包含供電數據提取模塊、供電數據處理模塊和供電數據特征識別模塊;首先,供電數據提取模塊基于電網的供電服務信息提取出電網歷史故障處理工單中的故障搶修地址、故障類型、用戶所屬臺區等關鍵信息;其次,考慮故障搶修地址的非標準化特點,在供電數據處理模塊建立基于BERT?BIGRU?CRF的地址解析模型對故障地址進行地址拆分和要素標注;在此基礎上,供電數據特征識別模塊對出現故障的高頻地址和故障類型進行聚類分析和可視化表征。本發明的優點在于通過挖掘歷史供電服務信息,尋找出供電服務中的薄弱環節,提高供電服務質量。
技術領域
本發明屬于供電服務信息管理領域,尤其涉及一種基于供電服務信息的數據挖掘方法。
背景技術
供電服務數據應用于多個方面,在電網運行和設備檢測或監測方面的應用包括:實時監控、對電網運行進行診斷優化和預測,為檢修策略制定提供指導和服務等。在電力企業營銷數據方面:可以幫助電力企業提升運營效率和改善客戶體驗,通過客戶關系優化、主動營銷以及定制服務來改善客戶體驗。
由于電網智能化水平的提高,供電服務數據中包含用戶的地址、臺區、故障時間、故障類型、搶修結果等多重高維信息。
針對信息采集系統采集到的海量用戶用電和故障搶修數據,應用統計學理論、神經網絡等機器學習算法,可以挖掘電網發生故障的高頻區域和高頻故障類型,通過有效的數據存儲和可視化技術,分析供電網絡薄弱環節,為電網提高供電質量提供數據支撐。
對故障地址的準確解析,是對供電服務數據中的故障信息進行挖掘的關鍵,解析識別地址中地址元素及其所屬類型離不開地址分詞。
現有的地址分詞技術主要有:基于規則和地址模型特征的地址分詞,但由于地址用詞的自由性,該方法分詞效果不好;基于決策樹的城市地址集分詞,該方法統計城市地址集的分布特征,構建決策樹進行地址元素提??;這些分詞算法沒有考慮地址元素之間的約束關系,沒有充分利用地址上下文信息,分詞后無法解決地址中存在的約束關系錯亂,以及從非標準地址提取標準地址等問題。
機器學習技術的發展給地址解析問題提供了新的解決方法,基于機器學習的條件隨機場(conditional?random?field,CRF)、雙向門遞歸單元(bidirectional?gatedrecurrent?unit,BIGRU)、雙向長短時記憶網絡(bidirectional?long?short-termmemory,BILSTM)等被用于對地址元素進行識別,但這些方法有的沒有可考慮地址元素的所屬類型,解析的地址單元大多局限在省、市、縣、鄉四個等級,沒有提取規模更小的地址要素,缺乏對地址文本細節信息的深入挖掘與分析,無法滿足電網供電服務所需的精細化地址解析。
如何利用已有的供電服務信息,來挖掘電網發生故障的高頻區域和高頻故障類型,通過有效的數據存儲和可視化技術,分析供電網絡薄弱環節,為電網提高供電質量提供數據支撐,是實際供電管理工作中急待解決的實際問題。
發明內容
本發明所要解決的技術問題是提供一種基于供電服務信息的數據挖掘方法。其首先基于電網的供電服務信息,提取出電網歷史故障處理工單中的故障搶修地址、故障類型、用戶所屬臺區等關鍵信息;其次,建立基于BERT-BIGRU-CRF的地址解析模型對故障地址進行地址拆分和要素標注;在此基礎上,對出現故障的高頻地址和故障類型進行聚類分析和可視化表征;通過挖掘歷史供電服務信息,尋找出供電服務中的薄弱環節,提高供電服務質量。
本發明的技術方案是:提供一種基于供電服務信息的數據挖掘方法,其特征在于:
數據挖掘單元的構成,至少包含供電數據提取模塊、供電數據處理模塊和供電數據特征識別模塊;
數據挖掘至少包括下列步驟:
1)供電數據提取模塊提取歷史故障搶修工單中包括故障地址、故障類型、用戶抄表段在內的信息,構成信息挖掘數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網上海市電力公司,未經國網上海市電力公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211421811.X/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





