[發明專利]一種基于合成少數類過采樣和深度學習的故障預測方法在審
| 申請號: | 201811619342.6 | 申請日: | 2018-12-28 |
| 公開(公告)號: | CN109871862A | 公開(公告)日: | 2019-06-11 |
| 發明(設計)人: | 房紅征;任帥;楊浩;熊毅;隋景峰;余家豪;羅凱;樊煥貞;王菲 | 申請(專利權)人: | 北京航天測控技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京理工大學專利中心 11120 | 代理人: | 郭德忠;李愛英 |
| 地址: | 100041 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 類簇 故障預測 過采樣 噪聲 隨機數 聚類 刪除 合成 均衡 模型訓練 輸出樣本 特征數據 樣本類別 最大化 倍增 采集 學習 背后 融合 挖掘 | ||
1.一種基于合成少數類過采樣和深度學習的故障預測方法,其特征在于,包括以下步驟:
S1:獲取故障原始數據,統計故障原始數據中各故障樣本類別的樣本數目,若樣本數目大于預設閾值,則該故障樣本類別為多數類,若不大于,則該故障樣本類別為少數類;
S2:采用K-Means方法對少數類中的樣本進行聚類,得到類簇,其中類簇的數量用R表示;
S3:采用離差平方和法,分別獲取步驟S2中各類簇與所述多數類的距離,將距離最小者對應的類簇作為噪聲類簇,并將噪聲類簇從步驟S2中的類簇中刪除,剩余R-1個類簇;
S4:采用KNN法,將步驟S3中剩余的每一個類簇中的樣本劃分為噪聲類樣本、故障類樣本以及風險類樣本,然后將各類簇中的噪聲類樣本刪除,得到R-1個更新類簇;
S5:依次對各更新類簇分別執行風險故障選擇操作,得到各更新類簇的輸出樣本,其中,所述風險故障選擇操作具體為:
設定一個隨機數α∈[0,1],并將更新類簇中故障類樣本的數量表示為s,風險類樣本的數量表示為d,且令
若則選擇風險類樣本作為輸出樣本,否則選擇故障類樣本作為輸出樣本;
S6:依次將步驟S5中各更新類簇的輸出樣本中的每一個樣本作為中心樣本,然后基于中心樣本執行倍增操作,得到各中心樣本的倍增樣本,則各輸出樣本中各樣本對應的倍增樣本的集合為倍增樣本集合,其中,所述倍增操作的具體步驟為:
在中心樣本的K個最近鄰樣本點中隨機選擇N個近鄰樣本,其中N至少為2;
所述N個近鄰樣本分別與中心樣本進行隨機的線性插值,得到的N個更新樣本為所述倍增樣本;
S7:將各個倍增樣本集合、步驟S4中所述的剩余類簇以及步驟S1中所述的多數類進行樣本融合,得到融合樣本;
S8:將融合樣本按照設定比例分為訓練樣本和測試樣本,然后采用訓練樣本訓練CNN與LSTM的組合分類器,再采用訓練好的CNN與LSTM的組合分類器對測試樣本進行故障預測。
2.如權利要求1所述的一種基于合成少數類過采樣和深度學習的故障預測方法,其特征在于,步驟S2所述的采用K-Means方法對少數類中的樣本進行聚類,得到R個類簇,具體為:
S201:假設少數類樣本集合P為{x(1),…x(i)…,x(m)},其中,x(i)表示第i個樣本,i=1,2,…,m,m表示少數類樣本集合P中樣本的數量;
S202:從少數類樣本集合P中隨機選取R個樣本作為聚類質心,然后根據R個聚類質心進行聚類操作,得到R個類簇,其中,所述聚類操作具體為:分別獲取未被選作聚類質心的剩余樣本與各聚類質心的歐式距離,對于每一個剩余樣本,將與其歐式距離最短的聚類質心作為自身所在類簇的聚類中心,則得到R個類簇;
S203:分別對每個類簇執行質心更新操作,得到R個更新質心,其中,所述質心更新操作具體為:
將類簇中各樣本與當前的聚類質心的歐式距離進行求和,所得和值再除以該類簇中所有樣本的個數,得到該類簇的更新質心;
S204:判斷更新質心與更新之前的聚類質心是否相同:
若相同,則將R個更新質心作為最終的聚類質心,并根據最終的聚類質心進行聚類操作,得到最終的R個類簇;
若不相同,則將R個更新質心代替步驟S202中的聚類質心,然后重復步驟S202~S204,直到當前的更新質心與上一次質心更新操作得到的更新質心相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航天測控技術有限公司,未經北京航天測控技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811619342.6/1.html,轉載請聲明來源鉆瓜專利網。





