[發(fā)明專利]一種基于供電服務(wù)信息的數(shù)據(jù)挖掘方法在審
| 申請?zhí)枺?/td> | 202211421811.X | 申請日: | 2022-11-14 |
| 公開(公告)號: | CN115907012A | 公開(公告)日: | 2023-04-04 |
| 發(fā)明(設(shè)計)人: | 彭昕;陸子秋;閆筱 | 申請(專利權(quán))人: | 國網(wǎng)上海市電力公司 |
| 主分類號: | G06N5/025 | 分類號: | G06N5/025;G06N3/045;G06N3/0442;G06F18/241;G06F18/22;G06F18/2321;G06Q50/06;G06F16/35;G06F40/205;G06F16/29 |
| 代理公司: | 上海三和萬國知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 31230 | 代理人: | 蔡海淳 |
| 地址: | 200122 上海市浦東新區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 供電 服務(wù) 信息 數(shù)據(jù) 挖掘 方法 | ||
1.一種基于供電服務(wù)信息的數(shù)據(jù)挖掘方法,其特征在于:
數(shù)據(jù)挖掘至少包含供電數(shù)據(jù)提取模塊、供電數(shù)據(jù)處理模塊和供電數(shù)據(jù)特征識別模塊;
數(shù)據(jù)挖掘至少包括下列步驟:
1)供電數(shù)據(jù)提取模塊提取歷史故障搶修工單中包括故障地址、故障類型、用戶抄表段在內(nèi)的信息,構(gòu)成信息挖掘數(shù)據(jù)集;
2)根據(jù)故障類型,將信息挖掘數(shù)據(jù)集中的用戶誤報信息進(jìn)行篩選,排除非電力故障數(shù)據(jù)對信息挖掘工作的干擾,形成關(guān)鍵信息數(shù)據(jù)集;
3)供電數(shù)據(jù)處理模塊提取關(guān)鍵信息數(shù)據(jù)集中的故障地址,建立基于BERT-BIGRU-CRF的地址解析模型;
4)將故障地址作為輸入序列輸入BERT層進(jìn)行預(yù)訓(xùn)練,獲得地址字詞上下文相關(guān)的信息,將地址離散信息轉(zhuǎn)變?yōu)樵~向量表示;
5)將BERT層獲取的地址詞向量輸入BIGRU層進(jìn)行特征提取,隨機(jī)初始化該網(wǎng)絡(luò)的參數(shù),然后對地址信息進(jìn)行序列特征提取;
6)將入BIGRU層訓(xùn)練后的特征向量輸入CRF層,對特征向量進(jìn)行條件約束,獲得輸出的地址標(biāo)簽序列;
7)供電數(shù)據(jù)特征識別模塊建立地址要素相似度聚類模型,對標(biāo)注后的地址信息進(jìn)行相似度計算,聚類出發(fā)生故障的高頻小區(qū);
8)利用關(guān)鍵信息數(shù)據(jù)集對故障高頻小區(qū)發(fā)生故障的主要類型和故障頻次進(jìn)行統(tǒng)計,建立熱力圖生成單元,對高頻故障地址和故障頻次進(jìn)行可視化展示;
9)通過挖掘歷史供電服務(wù)信息,尋找出供電服務(wù)中的薄弱環(huán)節(jié),提高供電服務(wù)質(zhì)量。
2.根據(jù)權(quán)利要求1所述的基于供電服務(wù)信息的數(shù)據(jù)挖掘方法,其特征在于,步驟3)中基于BERT-BIGRU-CRF的地址解析的具體過程為:
41)輸入故障地址數(shù)據(jù)同通過BERT編碼器得到地址數(shù)據(jù)的向量表示A;
42)地址向量A輸入到具有2個相反方向的GRU構(gòu)成的BIGRU網(wǎng)絡(luò),提取地址字符間潛在的語義關(guān)聯(lián)特征;
43)CRF模塊綜合輸出的上下文特征向量,進(jìn)行全局歸一化處理,計算地址解析結(jié)果每一個字符的類別概率值,并以概率最大為指標(biāo)對地址進(jìn)行標(biāo)注。
3.根據(jù)權(quán)利要求1所述的基于供電服務(wù)信息的數(shù)據(jù)挖掘方法,其特征在于,步驟3)中建立的基于BERT-BIGRU-CRF的地址解析模型,其輸出地址單元均由一個或多個單字組成,所述地址單元通過如下符號表示:
Province:省級行政單元,包括省、直轄市、自治區(qū)
City:地級行政單元,包括地級市、自治州等;
County:縣級行政單元,包括市轄區(qū)、縣級市、縣等;
Town:鄉(xiāng)級行政單元,包括鎮(zhèn)、街道、鄉(xiāng)等;
Community:村級行政單元,包括社區(qū)、行政村、自然村等;
Group:村級行政區(qū)域的下級單元,包括生產(chǎn)隊、居委會等;
Street:有正式名稱的道路,包括高速公路、隧道、街、巷等;
Substreet:有正式名稱的支路,包括弄、坊等;
RoadNum:道路上的建筑物編號;
BuildNum:社區(qū)里的樓棟編號;
UnitNum:社區(qū)樓棟的單元編號;
FloorNum:樓棟單元的樓層編號;
RoomNum:樓棟單元里的房間編號;
POI:興趣點,指的是任何非地理意義的有意義區(qū)域。
4.根據(jù)權(quán)利要求1所述的基于供電服務(wù)信息的數(shù)據(jù)挖掘方法,其特征在于,步驟5)中利用BIGRU層對地址向量進(jìn)行特征提取,經(jīng)過以下步驟將靜態(tài)地址向量序列轉(zhuǎn)換為可以體現(xiàn)上下文關(guān)系的動態(tài)地址向量序列:
51)按照正向順序?qū)⒆窒蛄啃蛄兴腿肭跋騁RU層,將輸出的隱藏狀態(tài)作為每個單字的前向GRU編碼;同時,按照反向順序?qū)⒆窒蛄啃蛄兴腿牒笙騁RU層,將輸出的隱藏狀態(tài)作為每個單字的后向GRU編碼;
52)將每個單字的前向GRU編碼和后向GRU編碼拼接在一起,獲取每個單字的雙向GRU編碼;
53)將每個單字的雙向GRU編碼按序排列,得到輸入文本的動態(tài)字向量序列。
5.根據(jù)權(quán)利要求1所述的基于供電服務(wù)信息的數(shù)據(jù)挖掘方法,其特征在于,步驟7)中的地址要素相似度聚類模型的具體內(nèi)容為:
71)輸入兩個解析后的地址要素字符串s=[P1,P2…,Pm]和t=[P1,P2…,Pm];
72)計算兩個地址中相似層級地址要素的相似度數(shù)值:
式中Wi表示地址一級矩陣,表示地址要素二級矩陣,表示地址要素之間計算的字符相似度;
73)計算兩個地址語義信息的余弦相似度:
式中vi和wi為s和t通過BERT模型獲得的地址語義矩陣;
74)對地址語義信息的余弦相似度與地址要素字符距離加權(quán)相似度進(jìn)行相加,并歸一化,得出最終的地址相似度值:
75)設(shè)定地址相似度閾值,對地址相似度大于閾值的地址序列劃分為同一類。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國網(wǎng)上海市電力公司,未經(jīng)國網(wǎng)上海市電力公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211421811.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 服務(wù)票據(jù)發(fā)行系統(tǒng)及服務(wù)票據(jù)發(fā)行服務(wù)
- 出租服務(wù)服務(wù)器和出租服務(wù)系統(tǒng)
- 服務(wù)開放方法及系統(tǒng)、服務(wù)開放服務(wù)器
- 基于服務(wù)券服務(wù)的在線企業(yè)服務(wù)平臺
- 退稅服務(wù)系統(tǒng)、退稅服務(wù)平臺及其服務(wù)方法
- 服務(wù)亭(服務(wù)驛站)
- 公共服務(wù)自助服務(wù)機(jī)
- 服務(wù)提供服務(wù)器、服務(wù)提供系統(tǒng)以及服務(wù)提供方法
- 服務(wù)提供服務(wù)器、服務(wù)提供系統(tǒng)以及服務(wù)提供方法
- 服務(wù)提供服務(wù)器、服務(wù)提供系統(tǒng)以及服務(wù)提供方法
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





