[發明專利]一種基于深度學習的單一有害氣體紅外圖像分類識別方法有效
| 申請號: | 201710903647.9 | 申請日: | 2017-09-29 |
| 公開(公告)號: | CN107545281B | 公開(公告)日: | 2020-09-18 |
| 發明(設計)人: | 王效靈;林云;楊佐丞;宋艷玲;張偉;余長宏 | 申請(專利權)人: | 浙江工商大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 杭州奧創知識產權代理有限公司 33272 | 代理人: | 王佳健 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 單一 有害 氣體 紅外 圖像 分類 識別 方法 | ||
1.一種基于深度學習的單一有害氣體分類識別方法,其特征在于該方法包括以下步驟:
步驟(1).實驗室完成配氣,對不同濃度的有害氣體在設定波長的紅外光譜下拍攝大量紅外圖像并對圖像加注標簽;
步驟(2).對上述紅外圖像進行預處理,包括14bit原始圖像轉化為uint8型計算機可顯示數據和將原尺寸大小的圖像轉變為128*128的圖像,作為輸入數據供卷積神經網絡訓練;
步驟(3).將訓練集數據輸入卷積神經網絡中,訓練網絡參數,獲得每幅圖像的特征向量;
步驟(4).計算得到的特征向量與標簽向量的交叉熵,得到損失值,并與閥值作比較,大于閥值重復步驟(3),小于等于閥值則保存當前網絡參數;
步驟(5).利用紅外相機拍攝未知濃度的該氣體紅外圖像,對該圖像進行步驟(2)的預處理,輸入步驟(4)保存的卷積神經網絡中完成對該氣體濃度的識別;
所述步驟(2)對原始圖像數據做預處理:利用線性轉換將14bit原始圖像轉化為機器可顯示的uint8型數據;
X(i,j)=(X(i,j)-min(X))/(max(X)-min(X))*255
上式中X表示單個14bit原始圖像樣本,X(i,j)表示14bit圖像X中第i行第j列像素值,max(X),min(X)分別表示該圖像樣本中像素的最大值和最小值,轉換過后,X的像素為float型數據,然后再把float型轉化為uint8型數據;
所述步驟(4),利用大量帶標簽的不同濃度單一氣體紅外圖像訓練卷積神經網絡,卷積神經網絡由卷積層,池化層,全連層以及最后的分類器組成;
卷積神經網絡結構為:
第一層為卷積層C1:32個5*5的卷積濾波器,步長為1;
第二層為池化層S1:32個池化器,步長為2;
第三層為卷積層C2:64個5*5的卷積濾波器,步長為1;
第四層為池化層S2:64個池化器,步長為2;
第五層為全連層F1:1000個神經元;
最后是一個softmax分類器;
卷積層計算:
上式中dij為輸入圖像經過該卷積濾波器后第i行和第j列的像素值,xij為輸入圖像數據中第i行第j列的像素,w為卷積濾波器;
由于步長為1,以輸入圖像的每一個元素為中心進行一次卷積運算,邊緣處和角落處缺少像素的地方補0;
C1層有32個5*5的卷積濾波器,C1層的輸出為32幅128*128的圖像;
在S1層,對C1層輸出的32幅128*128的圖像做max-pooling處理,輸出為32幅64*64的圖像;
C2層,輸入為32幅64*64的圖像,輸出為64幅64*64的圖像;
S2層,輸入為64幅64*64的圖像,輸出為64幅32*32的圖像;
在F1層中,將S2層的輸出展開成64*32*32的特征向量,輸入含有1000個神經元的F1層,輸出長為1000的特征向量;
將輸出的特征向量輸入最后的softmax分類器,得出所需的特征向量
計算當前網絡參數下的交叉熵損失值:
其中n為輸入樣本個數,為第i個樣本的標簽,J為交叉熵損失值,當損失值小于等于閥值時保存當前網絡參數,否則利用梯度下降法更新網絡參數;
所述步驟(5),利用卷積神經網絡做氣體紅外圖像濃度的分類識別器;
對未知濃度的氣體紅外圖像進行步驟(2)的圖像預處理,代表第i個待識別樣本,為輸入數據,然后將作為輸入,輸入卷積神經網絡,輸出完成對待識別樣本的濃度分類識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工商大學,未經浙江工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710903647.9/1.html,轉載請聲明來源鉆瓜專利網。





