[發明專利]一種發電廠故障數據診斷項目中的隨機森林分類方法在審
| 申請號: | 202011300566.8 | 申請日: | 2020-11-19 |
| 公開(公告)號: | CN112364929A | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 蔣一波;馮緣 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/06 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 發電廠 故障 數據 診斷 項目 中的 隨機 森林 分類 方法 | ||
一種發電廠故障數據診斷項目中的隨機森林分類方法,包括以下步驟:(1)構建成一級隨機森林模型P1;(2)對原始樣本集Y進行處理,篩選并去除每項樣本中對應類別為漏報、誤報的項,余下的樣本集作為新的樣本集Z,同時對測試集進行相同數據處理操作;(3)將Z作為原始樣本集,重復步驟(1)中所有操作,得到二級隨機森林模型P2,最終模型由P1、P2組合;(4)利用測試集對二層隨機森林模型進行測試,評估模型性能并進行調試;(5)用隨機森林分類器對新的數據進行判別與分類,分類結果按樹分類器的投票多少而定,并將分類結果儲存到數據庫中。本發明對于存在大量誤報、漏報的故障數據進行分層分類,分類性能好;避免過擬合。
技術領域
本發明涉及一種發電廠故障數據診斷項目中的隨機森林分類方法。
背景技術
隨著電網的發展和社會的進步,電力系統的規模也隨之越來越大,結構越來越復雜,這就使得對電網的運行提出了更高的要求,加強對電網故障的診斷處理顯得尤為重要。一般當電網發生故障時,監控設備會及時產生報警信息并上傳,例如開關跳閘、自動保護裝置動作、欠電壓、過電流、設備過負荷等這些信息。特別是當一些結構、規模巨大的電力系統出現故障時,一時間系統會產生大量的報警信息,而這些信息中包括大量的由保護或斷路器誤動、拒動,信道傳輸干擾錯誤,保護動作時間偏差等因素造成的不確定性的知識和數據。
目前國內外提出了許多電力系統故障診斷的技術和方法主要有專家系統、人工神經網絡、優化算法技術、petri網絡、模糊集理論、粗糙集理論等,以上智能技術在應用于故障診斷時各有不同優點,但同時也暴露出許多的問題,例如專家系統的維護難度高,容錯性差;人工神經網絡缺乏對自身行為的解釋能力,同時需要大量訓練樣本等。目前已有的發電廠故障數據診斷分類方法存在問題,無法同時保證準確率與效率,而在現實發電廠故障數據診斷系統的使用中,對診斷速度與準確率的要求都較高。
發明內容
為了克服現有技術的不足,本發明提供一種發電廠故障數據診斷項目中的分層隨機森林分類方法,在決策樹的基礎上采用集成學習的思想,并在隨機森林算法的基礎上采用分層模型。通過一級隨機森林對故障數據中大概率存在的誤報、漏報,再由二級隨機森林對故障進行分類。其中每層通過隨機選擇樣本和隨機選擇特征進行訓練生成隨機森林。
本發明解決其技術問題所采用的技術方案是:
一種發電廠故障數據診斷項目中的隨機森林分類方法,從發電廠故障數據診斷系統中提取數據,對數據進行預處理,得到原始樣本集;所述的方法包括以下步驟:
(1)建立隨機森林模型,過程如下:
(1.1)設Y為原始樣本集,其中總共有x個樣例,則每輪從原始樣本集Y中通過Bootstraping(有放回抽樣)的方式抽取x個樣例,得到一個大小為x的訓練集Yi,在原始樣本集的抽取過程中,可能有被重復抽取的樣例,也可能有一次都沒有被抽到的樣例,共進行a輪抽取,則每輪抽取的訓練集分別為Y1,Y2,…,Ya,理論上被抽取到的樣本占原始樣本集的2/3,未被包含的數據被稱為袋外數據。
(1.2)建立決策樹,包括以下步驟:
(1.2.1)設每個樣本有N個特征,指定一個數n=|log2N|,滿足條件nN,在每個內部節點,從N個特征中隨機選取出n個特征組成新的特征集Fi。從特征集Fi中選擇一個最優屬性對節點進行分裂;
(1.2.2)每個節點都按照步驟(1.2.1)來分裂,直到不能夠再分裂為止。利用CART方法使每棵樹最大限度地生長,不進行剪枝;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011300566.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





