[發明專利]一種基于深度學習的高分辨率遙感影像語義分割方法在審
| 申請號: | 202110271050.3 | 申請日: | 2021-03-11 |
| 公開(公告)號: | CN112991354A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 王植;鄒俊 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06T7/10 | 分類號: | G06T7/10;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 沈陽東大知識產權代理有限公司 21109 | 代理人: | 梁焱 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 高分辨率 遙感 影像 語義 分割 方法 | ||
1.一種基于深度學習的高分辨率遙感影像語義分割方法,其特征在于:包括下述步驟:
步驟1:獲取遙感影像初始數據集,并對遙感影像初始數據集中每張遙感圖像中的像素點進行地物類別標記,得到遙感影像數據集;
步驟2:對遙感影像數據集進行預處理;所述預處理包括歸一化處理、裁剪處理、數據擴增處理;
步驟3:將預處理后的遙感影像數據集按照一定的比例劃分為訓練數據集、驗證數據集;
步驟4:構建基于深度學習的遙感影像語義分割模型包括數據預訓練模塊、特征編碼層、通道特征重校正模塊、特征解碼層、多級特征提取模塊、第一特征融合層、分類模塊;所述通道特征重校正模塊包括多個通道特征重校正層,所述多級特征提取模塊包括多個多級特征提取層,所述特征編碼層的第j編碼層級與特征解碼層的第J-j解碼層級的跳躍連接間設置一個通道特征重校正層,所述特征解碼層的每一解碼層級之后都連接有一個多級特征提取層,每個所述多級特征提取層的輸出、所述數據預訓練模塊的輸出均連接到所述第一特征融合層,所述第一特征融合層與所述分類模塊連接;其中,j∈{1,2,...,J-1},J為特征編碼層的層級總數;
步驟5:利用訓練數據集對所述基于深度學習的遙感影像語義分割模型進行訓練,得到最優語義分割模型;
步驟6:采集待語義分割的遙感影像,對待語義分割的遙感影像進行歸一化處理、按行和列進行固定步長滑動裁剪處理,將預處理后的待語義分割的遙感影像輸入所述最優語義分割模型中,將輸出的特征圖按照位置關系進行拼接。
2.根據權利要求1所述的基于深度學習的高分辨率遙感影像語義分割方法,其特征在于,所述步驟2包括下述步驟:
步驟2.1:對所述遙感影像數據集中的每張遙感圖像采用Min-Max標準化方法進行歸一化處理,具體的,對于原始遙感圖像中所有像素點的灰度值組成的序列{x1,x2,...,xi,...,xn},歸一化處理后的灰度值序列為{x1',x2',...,xi',...,xn'},
其中,xi為原始遙感圖像中第i個像素點的灰度值,xi'為原始遙感圖像中第i個像素點的歸一化處理后的灰度值,i∈{1,2,...,n},n為原始遙感圖像中的像素點總數;
步驟2.2:對歸一化處理后的遙感圖像采用隨機滑動窗口的方法進行批量裁剪;
步驟2.3:對裁剪得到的圖像采用OpenCV進行數據擴增,所述數據擴增的方法為隨機選擇旋轉90°、隨機旋轉180°、隨機旋轉270°、伽馬變換中的一種或多種。
3.根據權利要求1所述的基于深度學習的高分辨率遙感影像語義分割方法,其特征在于,所述數據預訓練模塊包括四個并行的網絡層、第二特征融合層;
第一個網絡層包括依次連接的1×1卷積層、批歸一化層、線性整流函數層、3×3卷積層、批歸一化層、線性整流函數層、3×3卷積層、批歸一化層、線性整流函數層;
第二個網絡層包括依次連接的1×1卷積層、批歸一化層、線性整流函數層、3×3卷積層、批歸一化層、線性整流函數層;
第三個網絡層包括依次連接的3×3最大池化層、1×1卷積層、批歸一化層、線性整流函數層;
第四個網絡層包括1×1卷積層、批歸一化層、線性整流函數層;
原始輸入圖像輸入每個網絡層,每個網絡層的輸出連接第二特征融合層的輸入。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110271050.3/1.html,轉載請聲明來源鉆瓜專利網。





