[發明專利]基于大數據的配電網故障預測方法及系統在審
| 申請號: | 201811254900.3 | 申請日: | 2018-10-26 |
| 公開(公告)號: | CN109460004A | 公開(公告)日: | 2019-03-12 |
| 發明(設計)人: | 王鈺;梁剛;李海科;馬占軍;田圳;任肖久;梁偉;戚艷;陳文福;韓晨曦;楊要中;趙玲玲;郭豐瑞;王梓維;梁程;潘海泉;王琳;張超雄;田中亮;蔚鑫棟;黨旭鑫;徐坤;虎挺昊 | 申請(專利權)人: | 國網天津市電力公司;國家電網有限公司 |
| 主分類號: | G05B23/02 | 分類號: | G05B23/02 |
| 代理公司: | 天津盛理知識產權代理有限公司 12209 | 代理人: | 王來佳 |
| 地址: | 300010*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 配電網故障 配電網 大數據 隨機森林 分類樹 運維 預測 故障預測模型 原始數據處理 供電可靠性 配電網線路 電網安全 故障預測 故障預警 數據變換 數據集成 數據清洗 算法生成 線路故障 樣本數據 影響因素 原始數據 故障率 關聯性 投票法 算術 算法 改進 分析 發布 決策 維護 | ||
1.一種基于大數據的配電網故障預測方法,其特征在于,包括如下步驟:
S1、獲取原始數據,上述原始數據包括設備數據、天氣因素和外力因素;其中:上述設備數據包括設備類型、設備運行時間和設備位置;上述天氣因素包括氣溫數據、降水量和風速;上述外力因素包括故障記錄內容、故障類型和時間;
S2、利用Tableau軟件對原始數據處理進而得到可以分析的樣本數據,上述處理包括數據清洗、數據變換和數據集成;
S3、分析配電網故障影響因素關聯性;具體為利用Apriori算法對樣本數據進行挖掘分析,得到影響線路運行因素的故障特征值;其中:
針對于設備因素,故障特征值包括設備年限和設備類型;
針對于天氣因素,故障特征值包括降水量、天氣類型和風速;
針對于外力因素,故障特征值包括故障類型和月份;
S4、基于改進的隨機森林算法的故障預測模型的搭建;改進的隨機森林算法生成多個分類樹,上述分類樹通過投票法或算術平均值決策的方式進行組合。
2.根據權利要求1所述的基于大數據的配電網故障預測方法,其特征在于:上述訓練樣本數據集的隨機抽樣采用Bagging方法。
3.根據權利要求2所述的基于大數據的配電網故障預測方法,其特征在于:上述S4具體為:
S4.1、訓練樣本數據集的隨機抽樣;
S4.2、特征子空間的隨機抽樣;采用Breiman提出的方法,在構建分類樹的每個節點處從特征空間隨機抽取同等數量的特征變量進行訓練;
S4.3、選擇C4.5決策樹算法作為隨機森林內分類樹的構建方法;
S4.4隨機森林實現過程,
隨機森林中的每一棵分類樹為二叉樹,生成遵循自頂向下的遞歸分裂原則,即從根節點開始依次對訓練集進行劃分;在二叉樹中,根節點包含全部訓練數據,按照節點純度最小原則,分裂為左節點和右節點,它們分別包含訓練數據的一個子集,按照同樣的規則節點繼續分裂,直到滿足分支停止規則而停止生長,若節點n上的分類數據全部來自于同一類別,則此節點的純度I(n)=0,
純度度量方法是Gini準則,即假設P(Xj)是節點n上屬于Xj類樣本個數占訓練,
具體實現過程如下:
A、原始訓練集為N,應用bootstrap法有放回地隨機抽取k個新的自助樣本集,并由此構建k棵分類樹,每次未被抽到的樣本組成了k個袋外數據;
B、設有mall個變量,則在每一棵樹的每個節點處隨機抽取mtry個變量(mtry n mall),然后在mtry中選擇一個最具有分類能力的變量,變量分類的閾值通過檢查每一個分類點確定;
C、每棵樹最大限度地生長,不做任何修剪;
D、將生成的多棵分類樹組成隨機森林,用隨機森林分類器對新的數據進行判別與分類,分類結果按樹分類器的投票多少而定;
S4.5系統模型的構建與預測。
4.一種基于權利要求3所述的基于大數據的配電網故障預測方法的系統,其特征在于:包括:
原始數據獲取模塊,上述原始數據包括設備數據、天氣因素和外力因素;其中:上述設備數據包括設備類型、設備運行時間和設備位置;上述天氣因素包括氣溫數據、降水量和風速;上述外力因素包括故障記錄內容、故障類型和時間;
原始數據處理模塊,利用Tableau軟件對原始數據處理進而得到可以分析的樣本數據,上述處理包括數據清洗、數據變換和數據集成;
分析模塊,分析配電網故障影響因素關聯性;具體為利用Apriori算法對樣本數據進行挖掘分析,得到影響線路運行因素的故障特征值;其中:
針對于設備因素,故障特征值包括設備年限和設備類型;
針對于天氣因素,故障特征值包括降水量、天氣類型和風速;
針對于外力因素,故障特征值包括故障類型和月份;
模型搭建模塊,基于改進的隨機森林算法的故障預測模型的搭建;改進的隨機森林算法生成多個分類樹,上述分類樹通過投票法或算術平均值決策的方式進行組合。
5.一種實現權利要求1-3任一項所述基于大數據的配電網故障預測方法的計算機程序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網天津市電力公司;國家電網有限公司,未經國網天津市電力公司;國家電網有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811254900.3/1.html,轉載請聲明來源鉆瓜專利網。





