[發明專利]一種基于決策樹的電網故障信息分類方法在審
| 申請號: | 202010635378.4 | 申請日: | 2020-07-03 |
| 公開(公告)號: | CN111860624A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 李忠良;丁東坡;榮家鵬;范不井;劉穎;謝文娟;宋曉;謝冬冬 | 申請(專利權)人: | 國網河南省電力公司焦作供電公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/06 |
| 代理公司: | 鄭州圖釘專利代理事務所(特殊普通合伙) 41164 | 代理人: | 趙贊贊 |
| 地址: | 454150 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 決策樹 電網 故障 信息 分類 方法 | ||
1.一種基于決策樹的電網故障信息分類方法,其特征在于,包括如下步驟:
A.采集所需要的各個電網設備參數,作為數據集,并將數據集放在根節點上;
B.根據數據集內各個電網設備參數,找到所有有可能的故障信息類別作為特征屬性,并將其分別看作一個一個的節點分支;
C.遍歷每一種特征屬性的所有分割方式,分別找到這些特征屬性最好的分割點,然后選擇出最優的特征屬性及該特征屬性的最優分割方式,得到子節點N1、N2、……、Nm。
D.對得到的子節點分別繼續執行遍歷當前特征屬性的每一種分割方式和遍歷所有特征屬性的分割方式的操作,直到子節點的記錄數小于給定閾值同時迭代次數達到給定閾值時,停止決策樹的構建。
E.對構建好的決策樹進行剪枝操作,直到每個子節點中數據都屬于同一類為止,得到更精確的電網故障信息類別。
2.根據權利要求1所述的基于決策樹的電網故障信息分類方法,其特征在于,在所述步驟B中,找到數據集內的所有特征屬性,并將其分別看作一個一個的節點分支具體為:
B1.根據不同類型的電網設備,當電網設備的參數是離散值,且不需要生成二叉決策樹時,此時一個特征屬性就是一個節點分支;
B2.根據不同類型的電網設備,當電網設備的參數是離散值,且需要生成二叉決策樹時,此時使用特征屬性劃分的子集進行測試,按照屬于此子集和不屬于此子集,分成兩個節點分支;
B3.根據不同類型的電網設備,當電網設備的參數是連續值時,根據具體要求確定一個分裂點,按照大于此分裂點和小于此分裂點形成兩個節點分支。
3.根據權利要求1所述的基于決策樹的電網故障信息分類方法,其特征在于,在所述步驟C中,分別找到這些特征屬性最好的分割點,具體為:對所有特征屬性的每一種分割方式進行分割后的結果集的純度進行比較,選擇結果集純度高的分割方式作為特征屬性最好的分割點進行分割操作。
4.根據權利要求3所述的基于決策樹的電網故障信息分類方法,其特征在于:所述結果集的純度能通過熵值進行計算,計算出各個特征屬性的量化純度值之后,使用信息增益度來選擇出當前數據集的分割特征屬性,如果信息增益度的值越大,表示在該特征屬性上會損失的純度越大,那么該特征屬性就應該在決策樹的上層;
所述信息增益度的計算公式為:
Gain=D=H(D)-H(D|A)
式中,Gain表示A為特征屬性時對數據集D的信息增益,H(D)為數據集D的經驗熵,H(D|A)為特征A在給定條件下D的經驗條件熵。
5.根據權利要求1所述的基于決策樹的電網故障信息分類方法,其特征在于:在所述步驟D中,給定閾值由熵系數最小的那個節點決定。
6.根據權利要求1所述的基于決策樹的電網故障信息分類方法,其特征在于,所述步驟E中,對構建好的決策樹進行剪枝操作具體為:
E1.對于構建好的決策樹T0,計算所有內部非葉子節點的剪枝系數;
E2.查找最小剪枝系數的節點,對其子節點進行刪除操作,進行剪枝得到決策樹,如果存在多個最小剪枝系數的節點,選擇包含數據項最多的節點進行剪枝操作;
E3.重復步驟E1和E2,直到產生的剪枝決策樹Tk只有一個節點,最終得到T0、T1、T2、……、Tk;
E4.用驗證集選擇最優子樹,得到的最優子樹即為更精確的電網故障信息類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網河南省電力公司焦作供電公司,未經國網河南省電力公司焦作供電公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010635378.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種板材沖壓機
- 下一篇:測溫數據預測方法及裝置





