[發明專利]基于長短時記憶神經網絡的列控車載設備故障診斷方法有效
| 申請號: | 201810252504.0 | 申請日: | 2018-03-26 |
| 公開(公告)號: | CN108536123B | 公開(公告)日: | 2019-08-30 |
| 發明(設計)人: | 蔡伯根;上官偉;楊嘉明;石錫堯;王劍 | 申請(專利權)人: | 北京交通大學 |
| 主分類號: | G05B23/02 | 分類號: | G05B23/02;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市商泰律師事務所 11255 | 代理人: | 黃曉軍 |
| 地址: | 100044 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 列控車載設備 多層網絡系統 故障診斷 故障診斷模型 結合神經網絡 車載設備 故障樣本 記憶網絡 構建 級聯 列車運行信息 文本數據挖掘 訓練樣本數據 人工經驗 日志文件 原始樣本 診斷結果 智能分類 貝葉斯 語料庫 正則化 算法 優化 網絡 診斷 | ||
1.一種長短時記憶網絡結合神經網絡的列控車載設備的故障診斷方法,其特征在于,包括:
利用車載設備的日志文件通過文本數據挖掘處理構建車載設備運行信息語料庫,利用車載設備運行信息語料庫構建原始樣本數據;
構造LSTM網絡和BP網絡級聯的多層網絡系統,采用貝葉斯正則化算法從權值優化和結構調整兩方面對所述多層網絡系統進行優化;
利用訓練樣本數據來對優化后的所述多層網絡系統進行訓練,利用訓練好的多層網絡系統構成列控車載設備的故障診斷模型,利用所述列控車載設備的故障診斷模型對列控車載設備的未知故障樣本進行診斷,得到未知故障樣本的診斷結果。
2.根據權利要求1所述的方法,其特征在于,所述的利用車載設備的日志文件通過文本數據挖掘處理構建車載設備運行信息語料庫,包括:
采集車載設備的日志文件為原始數據,對原始數據進行數據清理,該數據清理過程包括收集原始數據中的AE-log文件、統一原始數據模式、提取原始數據中的關鍵信息,并將關鍵信息存入數據庫中,利用數據清理后的原始數據構建車載設備運行信息語料庫,所述車載設備運行信息語料庫包括車載設備的日志文件、正常運行信息以及故障信息;
對車載設備運行信息語料庫中的文件進行分詞、統計詞頻、去停用詞、標注詞性處理,采用Skip-gram模型實現車載設備運行信息語料的向量表達,以詞向量的形式表達語義信息。
3.根據權利要求2所述的方法,其特征在于,所述的采用Skip-gram模型實現車載設備運行信息語料的向量表達,以詞向量的形式表達語義信息,包括:
掃描車載設備運行信息語料庫,統計車載設備運行信息語料庫中每個詞出現的次數,根據各個詞的詞頻建立Huffman樹,每個詞都對應一個二進制的編碼,該編碼表示根節點到該詞的路徑;
以詞向量的形式表達每個詞對應的二進制的編碼,初始化詞向量與Huffman非葉子節點,詞向量的維度大小為給定的參數K,每個維度的值隨機初始化為0或1,非葉子節點每個維度初始化為0。目標為預測詞的二進制編碼概率最大;
對Skip-gram模型進行訓練:Skip-gram模型逐句讀取車載設備運行信息語料庫中的詞,利用梯度下降法計算出詞的梯度,根據詞的梯度更新詞向量和非葉子節點處向量的詞,當遍歷完車載設備運行信息語料庫中的所有詞后,訓練終止,得到最終的每個詞的詞向量結果,以詞向量的形式表達語義信息。
4.根據權利要求3所述的方法,其特征在于,所述的利用車載設備運行信息語料庫構建原始樣本數據,包括:
利用向量表達后的車載設備運行信息語料庫構建原始樣本數據,將原始樣本數據隨機劃分為3部分,其中70%為訓練樣本數據,用于調整網絡結構參數,減小誤差;15%為驗證樣本數據,用來驗證網絡的泛化能力,并且在網絡泛化能力不再提高時終止網絡的訓練;其余15%作為測試樣本數據,作用是檢驗網絡的性能。
5.根據權利要求4所述的方法,其特征在于,所述的構造LSTM網絡和BP網絡級聯的多層網絡系統,采用貝葉斯正則化算法從權值優化和結構調整兩方面對所述多層網絡系統進行優化,包括:
構造LSTM網絡和BP網絡級聯的三層網絡系統,該三層網絡系統包括:輸入層、隱藏層和輸出層,輸入層、隱藏層中包括LSTM網絡,輸出層中包括BP網絡;
采用貝葉斯正則化算法從權值優化和結構調整兩方面對所述三層網絡系統進行優化,優化后的所述三層網絡系統的目標誤差函數被調整為:
E=k1ED+k2EW
式中:
其中,wi為網絡權值,ε是以εp為元素的向量,Wk表示第k次迭代的網絡權值向量,J為Jacabi矩陣,參數μ的作用是控制步長;
比例系數k1,k2通過貝葉斯方法確定,具體公式如下:
式中:γ為神經網絡的有效參數個數,γ=N-2k2tr(H)-1;N為神經網絡參數總數;H為E的Hessian矩陣,tr(H)表示矩陣H的跡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京交通大學,未經北京交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810252504.0/1.html,轉載請聲明來源鉆瓜專利網。





