[發明專利]基于生成對抗網絡對局部放電數據進行樣本擴展的方法在審
| 申請號: | 202010064775.0 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111275108A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 劉廣輝;崔國棟;張文斌;王建軍;宋輝;張釗棋;盛戈皞;王磊;張冬冬;李長紅;韓浩;王洋 | 申請(專利權)人: | 國網山東省電力公司棗莊供電公司;上海交通大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q50/06 |
| 代理公司: | 上海東信專利商標事務所(普通合伙) 31228 | 代理人: | 楊丹莉;李丹 |
| 地址: | 277000 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 生成 對抗 網絡 局部 放電 數據 進行 樣本 擴展 方法 | ||
本發明公開了一種基于生成對抗網絡對局部放電數據進行樣本擴展的方法,其包括:(1)采集局部放電數據;(2)對局部放電數據進行預處理,以得到真實樣本數據;(3)構建生成對抗網絡并采用生成對抗網絡對局部放電數據進行樣本擴展,生成對抗網絡包括生成器、判別器和生成樣本存儲器;(4)采用生成樣本存儲器中的生成樣本數據對真實樣本數據進行擴展。此外,本發明還公開了一種對局部放電缺陷進行診斷的方法。另外,本發明還公開了一種基于生成對抗網絡對局部放電數據進行樣本擴展的系統。該方法可以綜合考慮數據集的整體分布,分析數據的分布情況,通過生成對抗網絡可以對局部放電數據中少量樣本進行數據增強,降低樣本不平衡。
技術領域
本發明涉及一種數據處理方法及系統,尤其涉及一種電力設備數據的處理方法及系統。
背景技術
大數據平臺積累了大量多源異構的局部放電檢測數據,但由于設備結構等問題,導致其中某些缺陷所引起的局部放電數據遠少于其他類型缺陷所引起的局部放電數據,由此造成了類別不平衡。而類別不平衡的現象會導致采用傳統的機器學習算法進行模式識別時,模式識別效果不夠理想,識別正確性更依賴于樣本量多的樣本。
為了提高系統的診斷性能,更好得對設備發生局部放電缺陷進行分析,消除類別不平衡情況變得十分有必要。
而針對類別不平衡情況,現有技術所采用的方法包括兩種,其一為利用數據方法降低不平衡情況,其主要通過過采樣技術改變數據集的分布,而另一種則是利用算法改進診斷結果,其主要是針對不同樣本量的樣本類別使用不同的權重進行。但是上述方法在應用時都存在一定的局限性,例如采用過采樣方法對樣本進行合成,需要一定的專家知識,操作復雜,且無法考慮數據集的整體分布,而采用利用算法改進診斷結果,在工程實際應用中對于代價因子矩陣的確定是極難的。
基于此,期望獲得一種對局部放電數據進行樣本擴展的方法,通過該方法可以較好地進行數據增強,降低樣本不平衡的情況。
發明內容
本發明的目的之一是提供一種基于生成對抗網絡對局部放電數據進行樣本擴展的方法,該方法可以綜合考慮數據集的整體分布,分析數據的分布情況,通過生成對抗網絡可以對局部放電數據中少量樣本進行數據增強,降低樣本不平衡,提升數據集的平衡分布,為后續系統診斷與分析提供良好的數據基礎。
根據上述發明目的,本發明提出一種基于生成對抗網絡對局部放電數據進行樣本擴展的方法,其包括:
(1)采集局部放電數據;
(2)對局部放電數據進行預處理,以得到真實樣本數據;
(3)構建生成對抗網絡并采用生成對抗網絡對局部放電數據進行樣本擴展,生成對抗網絡包括生成器、判別器和生成樣本存儲器;其中樣本擴展步驟包括:
(3a)將隨機噪聲輸入生成器,以使生成器輸出生成樣本數據,將生成樣本數據存儲在生成樣本存儲器中;
(3b)將真實樣本數據和生成樣本存儲器中的數據輸入判別器;
(3c)判別器基于真實樣本數據與生成樣本數據的之間的距離,輸出樣本數據是真實樣本數據還是生成樣本數據的判斷結果;
(3d)將帶有判斷結果標簽的樣本數據輸入給判別器和生成樣本存儲器;
循環反復進行上述步驟(3b)-(3d),直至生成器的損失函數的值與判別器的損失函數的值二者之和小于等于一預設的閾值;
(4)采用生成樣本存儲器中的生成樣本數據對真實樣本數據進行擴展。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網山東省電力公司棗莊供電公司;上海交通大學,未經國網山東省電力公司棗莊供電公司;上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010064775.0/2.html,轉載請聲明來源鉆瓜專利網。





