[發明專利]一種基于VIT的高分辨率遙感影像分類方法在審
| 申請號: | 202210439705.8 | 申請日: | 2022-04-25 |
| 公開(公告)號: | CN114723979A | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 劉康;邢青濤;朱濟帥;李海霞;鄧美環 | 申請(專利權)人: | 海南長光衛星信息技術有限公司 |
| 主分類號: | G06V10/762 | 分類號: | G06V10/762;G06V10/764;G06V10/774;G06V10/80;G06K9/62;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 571152 海南省海*** | 國省代碼: | 海南;46 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 vit 高分辨率 遙感 影像 分類 方法 | ||
1.一種基于VIT的高分辨率遙感影像分類方法,其特征在于,包括以下步驟:
步驟一、高分辨率遙感影像數據預處理;
步驟二、制作地物分類訓練樣本集;
步驟三、構建基于VIT的特征提取模型;
步驟四、構建基于VIT的Unet語義分割模型;
步驟五、訓練所述步驟四中的語義分割模型;
步驟六、使用所述步驟五中的語義分割模型對遙感影像分類。
2.根據權利要求1所述的基于VIT的高分辨率遙感影像分類方法,其特征在于,所述步驟一中的高分辨率遙感影像數據預處理,經過全色和多光譜影像融合、輻射校正、大氣校正、幾何校正步驟,獲得一個四波段的高分辨率遙感影像。
3.根據權利要求1所述的基于VIT的高分辨率遙感影像分類方法,其特征在于,所述步驟二中的制作地物分類訓練樣本集,使用矢量進行影像標注;建立與遙感影像相同大小的矢量,并將該矢量全要素分割,分為水體、植被、裸土、不透水面四個類型;使用shpfile文件對分成的類型進行標注,然后將shpfile根據類型字段不同,轉換為柵格數據,其中水體標注為1、植被標注為2、裸土標注為3、不透水面標注為4;與傳統的語義分割方法不同,這一步不再對影像切片。
4.根據權利要求1-3任一所述的基于VIT的高分辨率遙感影像分類方法,其特征在于,所述步驟三中的構建基于VIT的特征提取模型,建立端對端的網絡模型,然后使用VIT的特征提取部分提取特征,具體步驟為:
定義遙感影像數據為H×W×B大小,先將遙感影像切成一個個patch,從左上角開始選取邊長為P大小的塊,分成N個塊,每一patch大小為P×P×B,整景影像變為N*(P×P×B);訓練時,將h×w個patch作為一個張量x進行訓練,h和w代表每個訓練張量中patch的數量,下面以訓練一個張量x為例:
a)降維:先將x的每個patch展平,再通過Linear層降到dim維,維度變為1×(h×w)×dim;
b)位置編碼(Pos_embedding):為了學習patch之間的聯系以及更高層的特征,使用位置編碼的方法,將x的位置進行編碼,建立一個用于訓練的張量,大小為1×(h×w+1)×dim;
c)添加分類Class_token:新建一個Class_token用于存儲類型,初始化Class_token為1×1×dim,將Class_token與x進行并聯,新的x變為1×(h×w+1)×dim維,然后將這個結果與位置編碼相加,后面再接上Dropout層;
d)使用常規的Transformer結構進行特征提取,然后依次經過Pool層、Layer Norm層,并通過Linear層重新轉為二維數據,作為輸出特征U4。
5.根據權利要求4所述的基于VIT的高分辨率遙感影像分類方法,其特征在于,所述步驟四中的構建基于VIT的Unet語義分割模型,使用上述U4輸入到Unet網絡中,Unet網絡設置U形深度為4層;將U4經過兩個二維卷積,再通過下采樣,得到U3,將U3采用同樣的操作依次得到U2、U1;U1經過1×1的卷積得到S1,然后是上采樣階段,將S1使用反卷積上采樣得到S2,同理,通過S2依次得到S3、S4;最后將對應的U層和S層連接,形成Unet網絡。
6.根據權利要求5所述的基于VIT的高分辨率遙感影像分類方法,其特征在于,所述步驟五中的訓練所述步驟四的語義分割模型,在遙感影像中,地物類型分布往往不均勻,植被、不透水面類型的面積大,裸土、水體的面積小,所以使用Focal loss損失作為損失函數,以防止樣本不均衡的問題;使用SGD的方法調節參數,使用余弦退火的方法調整learningrate。
7.根據權利要求6所述的基于VIT的高分辨率遙感影像分類方法,其特征在于,所述步驟六中的使用所述步驟五的語義分割模型對遙感影像分類,將待分類的影像切成一個個patch,然后將每一個patch作為VIT的patch輸入到語義分割模型中分類,經過膨脹、腐蝕等后處理操作,添加坐標信息,生成tiff文件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海南長光衛星信息技術有限公司,未經海南長光衛星信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210439705.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種燃燒器助燃裝置
- 下一篇:一種生成交通場景的方法及裝置





