[發明專利]一種基于樣本全局再平衡的智能電表故障分類方法在審
| 申請號: | 202210348671.1 | 申請日: | 2022-04-01 |
| 公開(公告)號: | CN114781495A | 公開(公告)日: | 2022-07-22 |
| 發明(設計)人: | 賈欣;高欣;薛冰;黃子健;傅世元;孟之航;黃旭;張光耀 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G01R35/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 樣本 全局 平衡 智能 電表 故障 分類 方法 | ||
1.一種基于樣本全局再平衡的智能電表故障分類方法,其特征在于,包括如下步驟:
(1)將智能電表不同類別下的故障歷史數據作為輸入數據集,劃分得到多個二類數據集,具體為:
將智能電表實際故障數據集輸入,該數據集中的樣本共包含工作時長、到貨批次號、供電單位編號、電能表類別、故障識別月份、安裝月份、省份、設備規格、通訊方式、設備標識9種特征變量;其故障類別標簽共包含外觀故障、計量故障、存儲單元故障、處理單元故障、顯示單元故障、控制單元故障、電源單元故障、通訊單元故障、時鐘單元故障、其它故障、軟件故障11類;遍歷故障數據集中的每一類樣本,將該類別下所有樣本作為少數類樣本集,其余類別所有樣本為多數類樣本集,將原數據集轉化為11個二類數據集;對于其中每個二類數據集,均可將數據集描述為:
X=[Xmin,Xmaj]
其中,X為二類數據集,定義x為該數據集中的任一樣本,即x∈X;Xmin為少數類樣本集,定義xmin為該數據集中的任一樣本,即xmin∈Xmin;Xmaj為多數類樣本集,定義xmaj為該數據集中的任一樣本,即xmaj∈Xmaj;
(2)針對每個二類數據集,構建VAE與GAN的融合模型,分別將每個樣本作為模型的輸入,將其隱編碼劃分為重要特征編碼和次要特征編碼,具體為:
基于步驟(1)中得到的不平衡二分類數據集X=[Xmin,Xmaj],搭建VAE/GAN模型并訓練:
VAE通過編碼器學習樣本x的隱變量后驗分布q(z|x),通過解碼器學習樣本x的分布p(x|z),其過程如下:
z~Enc(x)=q(z|x)
其中,Enc為編碼器,Dec為解碼器,z為樣本x經過VAE編碼器得到的隱編碼,為VAE生成的重構樣本;
將VAE的解碼器與GAN的生成器進行融合得到VAE與GAN的融合模型,其優化目標為:
其中,α1,α2為超參數,Lprior為q(z|x)與N(0,I)的分布差異帶來的先驗損失,N(0,I)是均值為0方差為1的正態分布,DKL()為KL散度;Llikelihood為采樣q(z|x)得到p(x|z)的似然損失,LGAN是GAN的對抗損失;zmin為xmin的隱編碼,zmaj為xmaj的隱編碼;E[]為期望計算函數,Dis為判別器;
基于上述優化目標,對于給定樣本x能夠得到包含其特征的m維隱編碼z;其特征在于,在訓練過程中將VAE模型對樣本x的隱編碼劃分為重要特征編碼zKF和次要特征編碼zSF兩部分;重要特征編碼與樣本的某些重要屬性相對應,是它們的高層特征表示,是決定樣本類別的關鍵特征,次要特征編碼為樣本的個性化屬性,通常不具一般性,它的變化不會導致樣本類別的變化;即:劃分z的前m1維為zKF,后m2維為zSF,且m=m1+m2,樣本xmin的隱編碼zmin的劃分如下式所示:
zmin=[zmin,KF,zmin,SF]
=Enc(xmin)
其中,zmin,KF為xmin的重要特征編碼,zmin,SF為xmin的次要特征編碼;
(3)通過隱編碼重構技術得到其變異隱編碼,經解碼器還原、互信息約束與判別器對抗,生成多個考慮輸入樣本重要特征的可靠相似變異樣本,具體為:
基于步驟(2)得到的樣本隱編碼及其重要特征編碼和次要特征編碼,保持重要特征編碼不變,隨機替換次要特征編碼即可生成與給定樣本特征相同的相似樣本;
1)變異隱編碼與變異樣本的解碼器還原過程計算如下:
其中,為得到的變異隱編碼,為由得到的變異樣本;采樣自其先驗正態分布N(0,I);
為了使重要特征編碼與樣本的某些重要屬性相對應,需在步驟(2)優化目標的基礎上引入少數類樣本與其重要特征編碼的互信息最大化約束,即可通過互信息推理模型Q對樣本的重要特征編碼進行反向推斷,互信息的優化目標LInforence如下:
其中,β1為超參數,z″min,KF為變異樣本的重要特征隱編碼,模型Q由編碼器Enc代替;z′min,KF為重構樣本反向推理得到的重要特征編碼,即z″min,KF為變異樣本反向推理得到的重要特征編碼,即
2)為了生成可靠的變異樣本,修改步驟(2)中的GAN的優化目標LGAN為如下兩部分:
其中,LGen為生成器的優化目標,LDis為判別器的優化目標;γ1、γ2、γ3、γ4為超參數;
3)對于數據集中的每個少數類樣本xmin,應用上述過程得到其變異隱編碼;遍歷完成后,將所得變異樣本與原始少數類樣本合并,得到新的少數類樣本集采樣至數目與多數類樣本一致,得到平衡數據集
(4)設計作用于兩類樣本隱編碼之間的特征斥力技術進行有監督的特征表示學習,具體為:
基于步驟(3)中得到的平衡數據集任取訓練周期中的一個批次樣本的Zmaj,KF和Zmin,KF,其中,Zmaj,KF為該訓練批次中所有多數類樣本的重要特征隱編碼組成的特征集合,Zmin,KF為該訓練批次中所有少數類樣本的重要特征隱編碼組成的特征集合;特征斥力Lfeature_force的計算如下:
dloss=Nearest_Neighbor_distance(Zmin,KF,Zmaj,KF,n)
其中,Nearest_Neighbor_distance()為距離損失計算函數,其功能為:尋找zmin,KF在Zmaj,KF中的n個最近鄰,n的取值為20,zmin,KF∈Zmin,KF,并返回所有Zmin,KF得到的平均距離集合dloss;Lfeature_class是類別特征斥力損失,定義重要特征編碼第一維表示樣本的類別信息,ρ為超參數,是少數類樣本的特征斥力標簽,-ρ是多數類樣本的特征斥力標簽;μ1和μ2是超參數;
(5)通過混合編碼技術疊加樣本各維度重構誤差作為重要特征編碼的補充,據此判定待測樣本在每個二類數據集下的分類結果,通過硬投票得到其故障類別,具體為:
基于步驟(1)至(4)循環訓練模型,可得到可靠的平衡數據集組合樣本的重要特征編碼和每一維的重構誤差e作為新的樣本特征,用于樣本類別的判別;對于輸入樣本x,其構造特征表示為F=[zKF,e],e的計算如下:
將F及其對應類別標簽輸入隨機森林分類器訓練,即可得到單個不平衡二分類器;重復上述過程可得到11個隨機森林分類器RFj,j是隨機森林分類器的下標,j∈[1,11];對于待測樣本xtest,其預測標簽的計算如下:
取值為j時,表示xtest的預測故障類別為第j類故障。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210348671.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種羽毛球穩定性檢測設備
- 下一篇:陣列基板及其制作方法





