[發明專利]一種基于合成少數類過采樣和深度學習的故障預測方法在審
| 申請號: | 201811619342.6 | 申請日: | 2018-12-28 |
| 公開(公告)號: | CN109871862A | 公開(公告)日: | 2019-06-11 |
| 發明(設計)人: | 房紅征;任帥;楊浩;熊毅;隋景峰;余家豪;羅凱;樊煥貞;王菲 | 申請(專利權)人: | 北京航天測控技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京理工大學專利中心 11120 | 代理人: | 郭德忠;李愛英 |
| 地址: | 100041 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 類簇 故障預測 過采樣 噪聲 隨機數 聚類 刪除 合成 均衡 模型訓練 輸出樣本 特征數據 樣本類別 最大化 倍增 采集 學習 背后 融合 挖掘 | ||
本發明提供一種基于合成少數類過采樣和深度學習的故障預測方法,首先用K?Means方法對樣本集中的少數類樣本進行聚類,并刪除聚類后的噪聲類簇,而后在每一個類簇中利用KNN方法將類簇分為噪聲類樣本、故障類樣本以及風險類樣本,并刪除其中的噪聲類樣本,最后在每一個類簇中輸入一個隨機數并根據隨機數與類簇中故障類樣本以及風險類樣本的比例關系選擇某個樣本作為輸出樣本,實現SMOTE方法過采樣,然后再通過倍增操作增加了少數類樣本的數量,使得最終得到的融合樣本中的樣本類別更均衡,也就使得采集的特征數據均衡,從而便于開展模型訓練,最大化的挖掘出數據背后的規律,實現較好的故障預測效果。
技術領域
本發明屬于故障預測與檢測領域,尤其涉及一種基于合成少數類過采樣和深度學習的故障預測方法。
背景技術
飛行器、軌道交通裝備等復雜裝備長期運行在各種環境中,受復雜環境、工作狀態及載荷等多因素影響,其功能和性能可能會發生異常變化,而這些異常變化通常可以通過故障預測方法反映出來。但是在實際應用中,得到的原始數據對象往往是非均衡的,即某個類別的樣本數目要遠多于其他類,因此當機電設備(如熱控功能系統等的泵、電機等)正常數據與故障數據不均衡時,應用傳統的數據驅動的方法就難以有效進行預測。
在不均衡數據中,一般將數目比較多的類稱為多數類,而對應數目較少的類則稱為少數類。傳統的分類器在處理非均衡數據時,通常訓練得到的分類器對于多數類具有偏向性,即對多數類的預測正確率較高,而對少數類的正確率則很相對偏低。目前對于非均衡數據集的處理方法通常可以分為兩類:一種是基于數據層面的方法,即通過改變數據集的分布,使得非平衡數據集變成均衡的數據集。另一種是基于方法層面的方法,它通過改變少數類中誤分類樣本的權重,從而獲得更好的分類效果。
目前基于方法層面的方法,主要包括代價敏感(Cost-Sensitive)學習、集成學習、單類學習和面向單個正類的學習等方法。基于數據層面的方法,一般采用隨機過采樣或隨機欠采樣方式對數據集進行再采樣處理,旨在通過改變非均衡數據集的分布以提高后續分類模型的分類性能,主要包括SMOTE(Synthetic Minority Oversampling Technique,合成少數類過采樣技術)等。SMOTE方法的本質是在少數類樣本與某個近鄰同類樣本的連線上進行再采樣,以此彌補隨機過采樣方法的不足。但由于少數類樣本在合成新樣本的過程中將近鄰均視為同類,忽略了少數類樣本周圍多數類樣本的分布特點。因此SMOTE在選擇近鄰時存在一定的盲目性,而且該方法無法克服非均衡數據集的數據分布問題,容易導致分布邊緣化。
此外,針對飛行器、軌道交通裝備等領域的機電設備(如熱控功能系統的泵、電機等),數據主要來源于工業傳感器數據,主要特點是特征參數維度高,按一定的采樣率采集數據,如果要充分利用傳感器采集的類型數據,需要既考慮數據之間的時序聯系,也要考慮當前時間點的特征之間的聯系。
發明內容
為解決上述問題,本發明提供一種基于合成少數類過采樣和深度學習的故障預測方法,通過倍增少數類樣本的方式,使得最終得到的融合樣本中的樣本類別更均衡,便于開展模型訓練,最大化的挖掘出數據背后的規律,實現較好的故障預測效果。
一種基于合成少數類過采樣和深度學習的故障預測方法,包括以下步驟:
S1:獲取故障原始數據,統計故障原始數據中各故障樣本類別的樣本數目,若樣本數目大于預設閾值,則該故障樣本類別為多數類,若不大于,則該故障樣本類別為少數類;
S2:采用K-Means方法對少數類中的樣本進行聚類,得到類簇,其中類簇的數量用R表示;
S3:采用離差平方和法,分別獲取步驟S2中各類簇與所述多數類的距離,將距離最小者對應的類簇作為噪聲類簇,并將噪聲類簇從步驟S2中的類簇中刪除,剩余R-1個類簇;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航天測控技術有限公司,未經北京航天測控技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811619342.6/2.html,轉載請聲明來源鉆瓜專利網。





