[發明專利]基于卷積網絡的圖像分割方法在審
| 申請號: | 202010436462.3 | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN111612008A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 陳虹;連博博 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62;G06N3/04 |
| 代理公司: | 蘇州市中南偉業知識產權代理事務所(普通合伙) 32257 | 代理人: | 郭磊 |
| 地址: | 215000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 網絡 圖像 分割 方法 | ||
1.一種基于卷積網絡的圖像分割方法,其特征在于,包括:
步驟1:數據預處理
使用Cityscapes圖像數據集,在訓練中只使用其中的11個類別,通過計算得到,該11個類別的像素占比已經超過總像素個數的90%以上,分別為路(Road)、人行道(Sidewalk)、建筑(Building)、植被(Vegetation)、天空(Sky)、地形(Terrain)、人(Person)、轎車(Car)、自行車(Bicycle)、桿(Pole)、巴士(Bus);同時對訓練集圖像進行左右翻折擴增數據集,獲得5950張圖片,之后縮放圖像大小為512×1024用于網絡的訓練;
步驟2:卷積網絡模型的設計
所述卷積網絡稱為LBNet網絡,主要基于ENet網絡進行改進;
步驟3:模型訓練與驗證
步驟3.1、將步驟1中預處理后的數據分為訓練集、驗證集和測試集,并將訓練集作為卷積網絡的輸入,訓練網絡模型參數;
步驟3.2、LBNet網絡的驗證度量指標使用像素分割精度MPA(Mean Pixel Accuracy)和平均交并比MIoU(Mean Intersection over Union),分別定義為:
其中k+1為分割的總類別數,xij表示類i像素被預測為類j像素的總數目;
步驟3.3、將訓練好的網絡模型在準備好的測試集上進行模型的驗證,并分別統計像素分割精度MPA和平均交并比MIou;
步驟4:模型優化與改進處理
根據步驟3中在測試集上的度量結果,不斷調整模型的超參數,實現對步驟2建立的卷積網絡模型進行參數優化;
步驟5:模型使用
根據步驟4得到的最終優化好的模型進行測試使用。
2.如權利要求1所述的基于卷積網絡的圖像分割方法,其特征在于,具體改進策略如下:
步驟2.1、對于中間層中的殘差塊,ENet使用加法的融合策略Fi=Sum(Xi,Yi)將特征圖進行融合,該發明中的卷積網絡將上采樣階段的殘差塊結構,全部改為最大值融合策略,即:Fi=Max(Xi,Yi);
步驟2.2、為了減少采樣過程中的圖像細節丟失問題,網絡結構共使用三次下采樣操作,同時在上采樣階段使用反卷積層替換ENet網絡解碼過程中的所有上采樣層,并使用跳躍連接結構,將下采樣階段與上采樣過程中同分辨率大小的特征圖進行融合;
步驟2.3、對ENet網絡結構中存在的一些合并層(Concat),在其后面加一層卷積層,設定卷積核的大小為(1×1),卷積核的數目為合并層的特征圖通道數,其目的是對合并后的特征圖進行線性組合,更好的提取圖像特征;
步驟2.4、為了增加感受野,在下采樣過程的卷積模塊中多次使用擴張卷積,擴張率分別為2、4、8、16,同時加入金字塔結構的融合策略,分別將擴張率為2和4的卷積模塊的輸出進行融合,得到的結果再與擴張率為8的卷積模塊融合,最后與擴張率為16的卷積模塊融合;
步驟2.5、修改ENet網絡中使用的卷積模塊,由兩路卷積分別捕捉不同尺度感受野信息,并使用殘差結構進行融合,進一步提高網絡的分割精度。
3.如權利要求1所述的基于卷積網絡的圖像分割方法,其特征在于,訓練參數設定如下:初始學習率設置成0.001,總共迭代次數為75000次,學習率衰減規則為:分別在迭代次數是18750、37500和56250時降低學習率為當前學習率的0.1,權重衰減率為0.0002,使用Softmax損失函數,并且通過Adam優化器優化損失函數,參數為:β1=0.9,β2=0.99,其他參數默認。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010436462.3/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





