[發明專利]一種基于孤立森林算法的電力數據診斷的治理方法在審
| 申請號: | 202110506063.4 | 申請日: | 2021-05-10 |
| 公開(公告)號: | CN113284004A | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 李保平;謝超;王輝;尉建興 | 申請(專利權)人: | 廣州匯通國信科技有限公司 |
| 主分類號: | G06Q50/06 | 分類號: | G06Q50/06;G06K9/62 |
| 代理公司: | 廣州越華專利代理事務所(普通合伙) 44523 | 代理人: | 楊艷珊 |
| 地址: | 510000 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 孤立 森林 算法 電力 數據 診斷 治理 方法 | ||
1.一種基于孤立森林算法的電力數據診斷的治理方法,其特征在于,包括以下步驟:
采集數據:利用SCADA采集風力發電機組的運行數據;
數據預處理:對采集的數據進行預處理,形成標準數據集;
孤立森林算法分析:利用孤立森林算法對數據集進行分析,將異常數據孤立出來,并上報給控制系統;
專家知識判別,使用融合專家經驗信息的判別系統對上報的異常數據進行智能分析,從而判斷運行狀態是否異常,并將判斷結果發送給值班人員。
2.根據權利要求1所述的治理方法,其特征在于,所述數據預處理包括:清洗關鍵特征字段;對空缺值進行人工補充,不能補充的進行剔除;對于異常值進行人工修改,不能修改的進行剔除;根據特征計算公式計算形成要提煉的特征,將特征進行標準化處理,形成標準數據集。
3.根據權利要求1所述的治理方法,其特征在于:所述孤立森林算法分析包括孤立樹訓練、整合全部孤立樹結果和將異常數據孤立出來上報給控制系統。
4.根據權利要求3所述的治理方法,其特征在于,所述孤立樹訓練具體包括:
S11、從數據集中的隨機選擇Ψ個數據作為子樣本放入一棵孤立樹的根節點;
S12、隨機指定一個維度,在當前節點數據范圍內,隨機產生一個切割點p,且切割點p產生于當前節點數據中指定維度的最大值與最小值之間;
S13、此切割點p的選取生成了一個超平面,將當前節點數據空間切分為2個子空間:把當前所選維度下小于 p 的點放在當前節點的左分支,把大于等于 p 的點放在當前節點的右分支;
S14、在節點的左分支和右分支節點遞歸步驟S12和S13,不斷構造新的葉子節點,直到葉子節點上只有一個數據無法再繼續切割或孤立樹已經生長到了所設定的高度。
5.根據權利要求4所述的治理方法,其特征在于,所述整合全部孤立樹結果具體包括:
S21、由于切割過程是完全隨機的,所以需要用 ensemble 的方法來使結果收斂,即反復從頭開始切,然后計算每次切分結果的平均值。
S22、獲得t個孤立樹后,單棵孤立樹的訓練就結束了,接下來就可以用生成的孤立樹來評估測試數據了,即計算異常分數s,對于每個樣本x,需要對其綜合計算每棵樹的結果,通過下面的公式計算異常得分:
h(x)為x在每棵樹的高度,c(Ψ) 為給定樣本數Ψ時路徑長度的平均值,用來對樣本x的路徑長度h(x)進行標準化處理;
S23、異常數據判斷:
如果異常得分接近 1,那么一定是異常數據;
如果異常得分遠小于 0.5,那么一定不是異常數據;
如果異常得分所有點的得分都在 0.5 左右,那么樣本中很可能不存在異常數據。
6.根據權利要求1所述的治理方法,其特征在于,所述專家知識判別具體包括:
S31、收集歷史運行異常數據,根據特征計算公式計算形成要提煉的特征,將特征進行標準化處理,然后將歷史運行異常數據、標準化處理后的數據特征和異常數據判斷結果相結合構建專家知識庫;
S32、將通過孤立森林算法分析出的異常數據的標準化處理特征在專家知識庫中進行搜索,集合全部搜索結果;
S33,將通過孤立森林算法分析出的異常數據與步驟S32中的搜索結果進行逐個比對,查找到相同或相近的搜索結果;
S34、將比對查找到的搜索結果作為判斷結果發送給值班人員。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州匯通國信科技有限公司,未經廣州匯通國信科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110506063.4/1.html,轉載請聲明來源鉆瓜專利網。





