[發明專利]一種基于下采樣的特征融合遙感圖像語義分割方法有效
| 申請號: | 202010051995.X | 申請日: | 2020-01-17 |
| 公開(公告)號: | CN111259905B | 公開(公告)日: | 2022-05-31 |
| 發明(設計)人: | 郭艷艷;李帥 | 申請(專利權)人: | 山西大學 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V10/774;G06V10/764;G06V10/80;G06V20/13;G06K9/62 |
| 代理公司: | 太原申立德知識產權代理事務所(特殊普通合伙) 14115 | 代理人: | 郭海燕 |
| 地址: | 030006*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 采樣 特征 融合 遙感 圖像 語義 分割 方法 | ||
本發明公開了一種基于下采樣的特征融合遙感圖像語義分割方法,包括以下步驟:將用來訓練的高分辨率的遙感圖像和其對應的標簽圖分別按照相同的方式切割成小圖像作為原始輸入圖像,模型結構分為下采樣模塊,高級語義特征提取模塊,特征融合模塊以及分類器模塊組成,所述下采樣模塊對輸入的原始圖像提取高分辨率的低級語義特征后,將它們分成兩條支路,一路進入高級語義特征提取模塊提取高級語義特征,與另一路下采樣模塊直接提取的低級語義特征一起進入特征融合模塊進行特征融合,最后,通過分類器模塊對融合后的特征圖進行分類,通過隨機梯度下降的方式更新模型參數。本發明在減少參數運算的同時,提高了分割準確率。
技術領域
本發明涉及遙感圖像語義分割技術領域,尤其涉及一種基于下采樣的特征融合遙感圖像語義分割方法。
背景技術
圖像的語義分割是對輸入圖像進行逐像素的類別分類,實現目標和場景的像素級分割。近年來,深度學習的方法在遙感圖像語義分割方面已經取得了不錯的進展。MFPN(Multi-Feature Pyramid Network)是一種用于遙感圖像道路的多特征提取的金字塔網絡,該網絡給出了加權平衡損失函數,解決了道路稀疏導致的分類不平衡問題;FCN(FullyConvolutional Networks)以端到端、像素到像素的方法進行訓練,這種框架的優勢在于能夠借助一個跳躍架構,利用經過訓練的網絡所產生的原始語義信息進行圖像分割;Segnet采用反池化的方法進行上采樣,使得網絡的參數遠少于FCN;U-net具有對稱的編解碼網絡結構,通過編碼部分到解碼部分的快捷連接,恢復位置信息;Deeplabv1和Deeplabv2使用空洞卷積提高感受野,在不增加參數數量的情況下,提高了訓練準確率;Refinenet使用遠程殘差連接的網絡結構,能夠有效的將下采樣中缺失的信息融合進來,從而產生高分辨率的預測圖像。在遙感圖像語義分割方面,還有其他一些分割效果不錯的網絡,比如PSPNet、Deeplabv3plus。目前大部分的方法存在參數多、運算量大及分割效率低等問題,并且隨著神經網絡層數的增加,會出現“網絡退化”現象。
發明內容
針對現有技術存在參數多、運算量大及分割效率低等問題,本發明的目的在于提供一種基于下采樣的特征融合遙感圖像語義分割方法,能夠提高遙感圖像的分割精度,同時降低網絡的復雜程度且節省訓練耗時。
為實現上述目的,本發明提供了如下技術方案:一種基于下采樣的特征融合遙感圖像語義分割方法,包括以下步驟:
(1)將彩色遙感圖像分成訓練圖像集和測試圖像集兩部分,將訓練圖像集中的遙感圖像和其對應的標簽圖以相同的方式切割成256×256像素的小圖像,即訓練小圖像和訓練小標簽圖像;
(2)對訓練小圖像和訓練小標簽圖像分別進行如下操作,且操作后的圖像形成一個新的數據集:
a、將訓練小圖像和訓練小標簽圖像分別旋轉90度、180度和270度;
b、將訓練小圖像和訓練小標簽圖像分別做鏡像操作;
c、將訓練小圖像做模糊操作;
d、將訓練小圖像做亮度、對比度、飽和度的色彩調整;
e、將訓練小圖像做添加噪聲操作;
(3)搭建語義分割模型:語義分割模型由下采樣模塊、高級語義特征提取模塊、特征融合模塊和分類器模塊組成,分別搭建下采樣模塊、高級語義特征提取模塊、特征融合模塊和分類器模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西大學,未經山西大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010051995.X/2.html,轉載請聲明來源鉆瓜專利網。





