[發明專利]基于編解碼結構的DeepLabv3plus-IRCNet圖像語義分割算法在審
| 申請號: | 202010212874.9 | 申請日: | 2020-03-24 |
| 公開(公告)號: | CN111401379A | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 王海榮;劉文 | 申請(專利權)人: | 北方民族大學 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/46;G06N3/04;G06T7/60;G06N3/08 |
| 代理公司: | 西安研創天下知識產權代理事務所(普通合伙) 61239 | 代理人: | 郭璐 |
| 地址: | 750021 寧夏回族*** | 國省代碼: | 寧夏;64 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 解碼 結構 deeplabv3plus ircnet 圖像 語義 分割 算法 | ||
1.基于編解碼結構的DeepLabv3plus-IRCNet圖像語義分割算法,基于DeepLabv3plus網絡結構,在DeepLabv3plus的基礎上加入了倒置殘差模塊和特征圖切分模塊,其特征在于,包括以下步驟:
S1:輸入預處理后的圖片;
S2:在編碼階段,采用由普通卷積層和多個倒置殘差模塊串聯組成的深度卷積神經網絡來提取特征;
S3:將提取到的特征輸入到空洞空間金字塔池化模塊中,然后用1x1卷積得到目標特征圖的輸出張量;
S4:在解碼階段,采用雙線性插值法進行上采樣,將編碼器中所提取的特征恢復到輸入圖片尺寸的大小,輸出最終的圖像語義分割圖。
2.根據權利要求1所述的基于編解碼結構的DeepLabv3plus-IRCNet圖像語義分割算法,其特征在于:步驟S2中所述的倒置殘差模塊中使用深度可分離卷積代替普通卷積,在下采樣過程中用深度可分離卷積中的步長大小降低圖片的分辨率,當特征圖的分辨率下降到輸入圖片的1/16大小時,在最后一個倒置殘差模塊中引入空洞率為2的空洞卷積,同時引入特征圖切分模塊提取特征。
3.根據權利要求2所述的基于編解碼結構的DeepLabv3plus-IRCNet圖像語義分割算法,其特征在于:所述倒置殘差模塊與通常的殘差模塊是相反的,是先經過1*1的卷積核把特征圖的通道數進行“擴張”,最后再經過1*1的卷積核對通道數進行“壓縮”。
4.根據權利要求2所述的基于編解碼結構的DeepLabv3plus-IRCNet圖像語義分割算法,其特征在于:所述空洞卷積的一維數學表達形式為公式其中,x[i]表示一個一維輸入信號,y[i]表示一個輸出信號,w[k]表示一個長度為K、空洞率為r的卷積核。
5.根據權利要求2所述的基于編解碼結構的DeepLabv3plus-IRCNet圖像語義分割算法,其特征在于:所述的特征圖切分模塊提取特征的具體操作步驟為:
S21:將1/16分辨率下的特征圖在空間維度(w,h)上進行切分,w、h分別為特征圖的寬度、高度,設n為切分比率,每個特征圖被切分為n*n個切分模塊,并且n≥1;
S22:將所述每個切分模塊分別上采樣到切分前的尺寸大小;
S23:對每個恢復到切分前的尺寸大小的特征圖采用特征提取網絡進行特征提取;
S24:然后將每個輸出特征圖進行對應位置拼接,將拼接后的特征圖與解碼階段上采樣到相同尺寸的特征圖進行融合。
6.根據權利要求5所述的基于編解碼結構的DeepLabv3plus-IRCNet圖像語義分割算法,其特征在于:步驟S24中所述的特征提取網絡提取特征的具體步驟為:
S241:對放大后的每個特征圖都采用1*1大小的卷積核進行降維,將通道數都降為原來的1/2,降低模型參數量,得到兩個分支;
S242:在其中一個分支中,串聯2次大小為3*3的空洞卷積,且2次空洞卷積的空洞率分別設置為2和4,然后依次對特征圖進行特征提取;
S243:將兩個分支所提取的特征在通道維度上進行拼接,對拼接后的特征圖做一次全局池化操作,再與拼接后特征進行點乘操作,提取出最后的特征,輸出特征圖。
7.根據權利要求1所述的基于編解碼結構的DeepLabv3plus-IRCNet圖像語義分割算法,其特征在于:步驟S3中所述ASPP模塊采用DeepLabv3plus中空洞率為{6,12,18}的空洞卷積序列。
8.根據權利要求1所述的基于編解碼結構的DeepLabv3plus-IRCNet圖像語義分割算法,其特征在于:步驟S4的具體操作步驟為:
S41:采用雙線性插值進行對編碼階段輸出的目標特征上采樣2倍;
S42:與所述特征切分模塊的輸出特征進行融合;
S43:將融合后的特征再進行2次3x3的深度可分離卷積,重新定義特征;
S44:最后再采用雙線性插值進行上采樣,將編碼器輸出的特征恢復原始大小;
S45:輸出與輸入尺寸大小相同的圖像語義分割圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北方民族大學,未經北方民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010212874.9/1.html,轉載請聲明來源鉆瓜專利網。





