[發(fā)明專利]一種帶有并行卷積塊的多層特征融合細粒度圖像分類方法有效
| 申請?zhí)枺?/td> | 202011000605.2 | 申請日: | 2020-09-22 |
| 公開(公告)號: | CN112183602B | 公開(公告)日: | 2022-08-26 |
| 發(fā)明(設計)人: | 何凱;馮旭;馬希濤;趙巖 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 帶有 并行 卷積 多層 特征 融合 細粒度 圖像 分類 方法 | ||
1.一種帶有并行卷積塊的多層特征融合細粒度圖像分類方法,其特征在于,所述方法包括:
對訓練集進行隨機裁剪、水平翻轉增強,使用權重遷移學習防止過擬合;
在ResNet34模型的最后一個層級上通過并行卷積塊代替原有卷積塊,增強網(wǎng)絡的顯著性特征提取能力;
使用改進后的ResNet34模型作為特征提取器,將最后一層級的三個輸出結果進行雙線性矩陣乘法后送入全連接層和softmax進行分類訓練,對訓練集上每個batch_size得到的損失函數(shù)進行回傳,使用隨機梯度下降作為網(wǎng)絡優(yōu)化器來更新網(wǎng)絡參數(shù);
其中,所述并行卷積塊用于對中間層的判別性特征進行提取,具體為:
對輸入的特征矩陣使用不同大小的卷積核,增強輸出矩陣的特征表達能力;
將步長為2,1×1大小卷積核的殘差結構改為3×3大小卷積核,防止部分特征信息的丟失;
將原始3×3大小的卷積核改為1×3和3×1卷積核的串聯(lián)模式,減少計算量;
將激活函數(shù)ReLU改為LeakyReLU,可以有效防止梯度消失;
其中,所述將最后一層級的三個輸出結果進行雙線性矩陣乘法后送入全連接層具體為:
對并行卷積塊得到三個輸出特征矩陣,兩兩雙線性操作得到三個特征融合的結果,將三個結果求和,送入全連接層中;
其中,所述對并行卷積塊得到三個輸出特征矩陣,兩兩雙線性操作得到三個特征融合的結果具體為:
三個特征矩陣為X,Y和Z,矩陣的維度是(B,C,H,W),其中,B代表batch size,C代表通道數(shù),H×W表示特征圖的大小;
將X,Y的維度分別重置為(B,C,H×W)和(B,H×W,C),對X和Y進行雙線性特征融合后的結果的維度為(B,C×C);對X,Y和Z均進行上述操作,將得到的三個結果相加送入全連接層。
2.根據(jù)權利要求1所述的一種帶有并行卷積塊的多層特征融合細粒度圖像分類方法,其特征在于,所述方法還包括:
保存最終的訓練模型為.pth文件,該文件中保存了網(wǎng)絡層的訓練參數(shù)信息,并在測試集上進行測試,得到最終的準確率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經(jīng)天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011000605.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





