[發明專利]一種電網原始輸入特征冗余數據剔除方法及系統在審
| 申請號: | 202011151906.5 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112488871A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 孫志媛;胡斌江;劉默斯;張杰;李明珀;郭琦;張翌暉;朱益華 | 申請(專利權)人: | 廣西電網有限責任公司電力科學研究院;南方電網科學研究院有限責任公司 |
| 主分類號: | G06Q50/06 | 分類號: | G06Q50/06;G06N3/08 |
| 代理公司: | 北京國帆知識產權代理事務所(普通合伙) 11334 | 代理人: | 李增朝;徐愛萍 |
| 地址: | 530015 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電網 原始 輸入 特征 冗余 數據 剔除 方法 系統 | ||
本發明公開了一種電網原始輸入特征冗余數據剔除方法及系統,所述方法包括:獲取電網原始輸入特征數據集;對所述電網原始輸入特征數據集中的每一個特征量進行離散化處理,并形成電網輸入特征離散數據集;基于卡方測試法計算所述電網輸入特征離散數據集所對應的特征關聯因子集;對所述特征關聯因子集中的每一個關聯因子進行閾值判斷,并基于判斷結果剔除所述電網原始輸入特征數據集中的冗余特征量。在本發明實施例中,利用輸入特征間的相關度可有效剔除其中的冗余特征,使得最終數據的穩定性較高。
技術領域
本發明涉及電力技術領域,尤其涉及一種電網原始輸入特征冗余數據剔除方法及系統。
背景技術
近年來,深度學習作為當前常見的人工智能方法之一,在特征提取、分類判別等方面取得跨越式發展,其對電網這類非線性系統具有非常強的擬合能力。由于電網原始輸入特征的冗余度很高,若不加處理將會影響機器學習的訓練效果,然而現階段對電網原始輸入特征的選擇主要依靠人工來完成,這種方法受個人電網專業知識的限制,即不同的技術人員所選擇的電網原始輸入特征存在較大的差異性,導致無法有效地剔除冗余特征。
發明內容
本發明的目的在于克服現有技術的不足,本發明提供了一種電網原始輸入特征冗余數據剔除方法及系統,排除人工選擇方式,利用輸入特征間的相關度可有效剔除其中的冗余特征,使得最終數據的穩定性較高。
為了解決上述問題,本發明提出了一種電網原始輸入特征冗余數據剔除方法,所述方法包括:
獲取電網原始輸入特征數據集;
對所述電網原始輸入特征數據集中的每一個特征量進行離散化處理,并形成電網輸入特征離散數據集;
基于卡方測試法計算所述電網輸入特征離散數據集所對應的特征關聯因子集;
對所述特征關聯因子集中的每一個關聯因子進行閾值判斷,并基于判斷結果剔除所述電網原始輸入特征數據集中的冗余特征量。
可選的,所述電網原始輸入特征數據集包括故障前的穩態特征數據以及故障后的暫態特征數據。
可選的,所述基于卡方測試法計算所述電網輸入特征離散數據集所對應的特征關聯因子集包括:
基于卡方測試法計算出所述電網輸入特征離散數據集中的每兩個離散特征量之間的檢驗統計量,并形成所述特征關聯因子集。
可選的,所述對所述特征關聯因子集中的每一個關聯因子進行閾值判斷,并基于判斷結果剔除所述電網原始輸入特征數據集中的冗余特征量包括:
獲取所述特征關聯因子集中的第i個關聯因子,并判斷第i個關聯因子是否大于預設閾值;
若判斷第i個關聯因子大于所述預設閾值,則將第i個關聯因子所對應的離散特征量進行剔除處理;
判斷iN是否成立;
若iN成立,則返回獲取所述特征關聯因子集中的第i+1個關聯因子;
若iN不成立,則完成對所述電網原始輸入特征數據集中的冗余特征量剔除處理。
可選的,在判斷第i個關聯因子是否大于預設閾值之后,還包括:
若判斷第i個關聯因子小于等于所述預設閾值,則將第i個關聯因子所對應的兩個離散特征量加入到電網輸入特征訓練集中,繼續判斷iN是否成立。
另外,本發明實施例還提供了一種電網原始輸入特征冗余數據剔除系統,所述系統包括:
獲取模塊,用于獲取電網原始輸入特征數據集;
處理模塊,用于對所述電網原始輸入特征數據集中的每一個特征量進行離散化處理,并形成電網輸入特征離散數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西電網有限責任公司電力科學研究院;南方電網科學研究院有限責任公司,未經廣西電網有限責任公司電力科學研究院;南方電網科學研究院有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011151906.5/2.html,轉載請聲明來源鉆瓜專利網。





