[發明專利]基于CNN的分片多尺度特征融合的圖像分類方法有效
| 申請號: | 201911150614.7 | 申請日: | 2019-11-21 |
| 公開(公告)號: | CN111079795B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 薛濤;洪洋 | 申請(專利權)人: | 西安工程大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464 |
| 代理公司: | 西安弘理專利事務所 61214 | 代理人: | 曾慶喜 |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 cnn 分片 尺度 特征 融合 圖像 分類 方法 | ||
1.基于CNN的分片多尺度特征融合的圖像分類方法,其特征在于,具體包括以下幾個步驟:
步驟1:下載公共圖像分類訓練集或使用自主標注圖像訓練樣本標簽的訓練集;
步驟2:對步驟1準備好的圖像訓練集進行預處理,進一步擴充圖像訓練樣本集,增加訓練樣本的多樣性,得到完整圖像訓練集;
步驟3:使用多尺度特征融合的圖像特征提取方法構建特征提取的卷積模塊,卷積模塊對步驟2完整圖像訓練集中的圖像進行特征轉換和特征提取,獲取表示該圖像樣本的圖像特征向量;
步驟4:使用步驟3得到的圖像特征向量作為輸入,構建softmax分類器;
步驟5:將步驟3擴充訓練樣本集中的圖像均分為多個樣本包,采用SGD隨機梯度下降法和反向傳播算法訓練網絡優化損失函數,逐層調整損失函數的權值,直到損失函數不再收斂,結束網絡訓練,得到神經網絡模型;
步驟6:將步驟5得到訓練完成的神經網絡模型應用到沒有標注的圖像樣本,將未標注的原始圖像輸入步驟3構建的特征提取的卷積模塊,經前向傳播獲得圖像特征向量,再通過softmax分類器得到圖像分類結果,達到圖像識別的目的。
2.根據權利要求1所述的基于CNN的分片多尺度特征融合的圖像分類方法,其特征在于,步驟2對圖像訓練集中圖像進行預處理的方式如下:
①水平翻轉:對原始圖像樣本進行鏡面翻折;
②旋轉:將原始圖像樣本進行順時針或逆時針的旋轉,選取90或180度的旋轉角度保證圖像樣本的的尺度大小;
③縮放:對原始圖像樣本進行放大或縮小;
④裁剪:從原始圖像樣本中隨機選取一部分,然后將選取的部分放大到原圖像大小;
⑤添加噪聲:在部分原始圖像樣本中添加噪聲數據來消除高頻特征;
對經過上述①-⑤步驟處理后的圖像訓練集中的圖片進行隨機選取疊加,添加到原始圖像訓練樣本集中,得到完整圖像訓練集。
3.根據權利要求2所述的基于CNN的分片多尺度特征融合的圖像分類方法,其特征在于,步驟3中構建特征提取的卷積模塊具體為:
根據步驟2得到的完整圖像訓練集,首先將其編碼轉換為輸入張量,然后構建特征提取的卷積模塊對輸入圖像進行特征轉換和提取,最后獲得提取的特征向量作為下一步驟的分類器的輸入;其特征轉換的特征表達為:
C=G×g?????(2)
fji(xi)≠fki(xi)且j≠k????(3)
其中F(x)、x、xi及C分別代表特征輸出、特征輸入、輸入分片和分片數。使用參數G表示轉換中的異構數,也就是特征子轉換函數的種類數,G控制著整個轉換模塊的復雜度與表達力的平衡。多個分片可以歸為一組,參數g=C/G,其中g就代表每組子轉換函數的個數;除此之外,式(3)和式(4)分別表示組間子轉換函數異構互不相同和組內子轉換函數同構相同;最后加上特征輸入x,其特征轉換的特征表達為:
。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安工程大學,未經西安工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911150614.7/1.html,轉載請聲明來源鉆瓜專利網。





