[發明專利]一種基于xgBoost模型和Hadoop架構的竊電識別分析方法及終端在審
| 申請號: | 201910768081.2 | 申請日: | 2019-08-20 |
| 公開(公告)號: | CN110458725A | 公開(公告)日: | 2019-11-15 |
| 發明(設計)人: | 王雪晶;蘇運東;孫浩淞;上官霞;蔡榮彥;吳駿;倪文書;陳銳;陳爽 | 申請(專利權)人: | 國網福建省電力有限公司;國網福建省電力有限公司信息通信分公司 |
| 主分類號: | G06Q50/06 | 分類號: | G06Q50/06;G06N20/20 |
| 代理公司: | 35100 福州元創專利商標代理有限公司 | 代理人: | 陳明鑫;蔡學俊<國際申請>=<國際公布> |
| 地址: | 350003福建*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用電數據 判定 竊電行為 多核 竊電 算法 數據處理效率 數據分析模塊 分布式存儲 分布式計算 并行優化 工作效率 模型識別 判定結果 數據存儲 精準度 清洗 存儲 架構 分析 終端 轉換 優化 改進 | ||
1.一種基于xgBoost模型和Hadoop架構的竊電識別分析方法,其特征在于,包括如下步驟:
S1、獲取待判定用電數據,并將待判定用電數據輸入至已訓練完成的xgBoost模型;
S2、通過已訓練完成的xgBoost模型識別待判定用電數據,得到竊電行為判定結果。
2.根據權利要求1所述的一種基于xgBoost模型和Hadoop架構的竊電識別分析方法,其特征在于,所述已訓練完成的xgBoost模型的訓練過程具體如下:
初始化xgBoost模型,得到待訓練xgBoost模型;
獲取訓練集,通過訓練集訓練待訓練xgBoost模型,得到已訓練的xgBoost模型,所述訓練集包括80%的訓練樣本數據;
獲取測試集,通過測試集測試所述已訓練的xgBoost模型,判斷所述已訓練的xgBoost模型的竊電行為判定結果的準確率是否達到預設準確值,若是,則得到已訓練完成的xgBoost模型,否則使用訓練集繼續訓練直到得到已訓練完成的xgBoost模型,所述測試集包括20%的訓練樣本數據。
3.根據權利要求2所述的一種基于xgBoost模型和Hadoop架構的竊電識別分析方法,其特征在于,所述初始化xgBoost模型,得到待訓練xgBoost模型的具體過程如下:
初始化xgBoost模型,得到目標函數公式一:
xgBoost是可加性的算法模型,其中,Obj代表整體目標函數,t為樹模型序號,n為樣本數,l為損失函數,i為樣本序號,yi為第i個樣本真實目標值,為預測值,ft為t次迭代的目標函數,Ω(ft)為正則項,包含正則L1、L2,constant為常數項;
利用泰勒公式對目標函數公式一進行展開,得到目標函數公式二:
其中,為損失函數的一階導,為損失函數的二階導;
簡化目標函數公式二,代入正則項得到目標函數公式三:
其中,N指代葉子節點個數,γ和λ為分別控制CART樹的個數、葉子節點的分數值,其中γ=L1、λ=L2,j表示葉子節點對應的輸入實例集合的序號;
對給定的N,該目標函數公式三為一個關于Wj的二次函數,由此將Wj的最優解代入到目標函數公式三,得到目標函數公式四:
根據CART葉子節點,對節點進行分割,得到目標函數公式五:
目標函Obj*指的是所有數據落到當前樹的得分情況,每次對樹進行一次分支,都要使目標函數的得分減小,這樣的樹的分支才認為是有效的,才會采納這樣的分支;對樹的每次加分支,都會是當前的分為左右兩部分,即二分樹;因此L和R分別代表對樹進行分割后的左、右兩個分支。
4.根據權利要求2所述的一種基于xgBoost模型和Hadoop架構的竊電識別分析方法,其特征在于,所述訓練樣本數據包括日用電量、線損率和用戶基本信息;
所述日用電量包括不同期間日用電量均值、不同期間日用電量均值的離散系數以及樣本期間的日用電量的最大值與最小值;
所述線損率包括不同期間線損率均值、不同期間線損率均值的離散系數和樣本期間的線損率的最大值與最小值;
所述用戶基本信息包括用戶編號、用戶標識、運行容量、用戶分類、用電地址、用電類別、行業分類、供電分類、供電單位編號、用戶名稱以及異常事件類數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網福建省電力有限公司;國網福建省電力有限公司信息通信分公司,未經國網福建省電力有限公司;國網福建省電力有限公司信息通信分公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910768081.2/1.html,轉載請聲明來源鉆瓜專利網。





