[發(fā)明專利]一種基于稠密邊界塊和注意力機制的建筑物分割方法在審
| 申請?zhí)枺?/td> | 202010782544.3 | 申請日: | 2020-08-06 |
| 公開(公告)號: | CN112084859A | 公開(公告)日: | 2020-12-15 |
| 發(fā)明(設(shè)計)人: | 劉盛;葉煥然;徐婧婷;陳冠州;高飛;陳勝勇 | 申請(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06K9/62;G06N3/04 |
| 代理公司: | 杭州君度專利代理事務(wù)所(特殊普通合伙) 33240 | 代理人: | 楊天嬌 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 稠密 邊界 注意力 機制 建筑物 分割 方法 | ||
1.一種基于稠密邊界塊和注意力機制的建筑物分割方法,用于針對遙感圖像進行建筑物分割,其特征在于,所述基于稠密邊界塊和注意力機制的建筑物分割方法,包括:
步驟S1、獲取已標記建筑物的遙感圖像生成訓(xùn)練集;
步驟S2、構(gòu)建損失函數(shù),利用所述訓(xùn)練集優(yōu)化圖像分割模型;
步驟S3、利用優(yōu)化后的圖像分割模型處理待分割的遙感圖像,輸出標記建筑物后的建筑物圖,完成建筑物分割;
其中,所述圖像分割模型包括依次連接的編碼器、跳過連接單元、解碼器,所述編碼器采用ResNet網(wǎng)絡(luò)提取遙感圖像的特征,所述ResNet網(wǎng)絡(luò)包括N個卷積層和一個Global Pool層,N個卷積層命名為Res-0至Res-(N-1),在卷積層Res-0至Res-(N-1)中,前一個卷積層的輸出作為后一個卷積層的輸入,Res-(N-1)的輸出作為GlobalPool層的輸入;
所述跳過連接單元包括N個稠密邊界塊,N個稠密邊界塊命名為DBB-0至DBB-(N-1),N個稠密邊界塊與N個卷積層依據(jù)命名編號一對一連接,命名編號相同的卷積層的輸出作為稠密邊界塊的輸入,并且在稠密邊界塊DBB-0至DBB-(N-1)中,前一個稠密邊界塊的輸出同時作為后一個稠密邊界塊的輸入;
所述解碼器包括N個通道注意力塊,N個通道注意力塊命名為CAB-0至CAB-(N-1),N個通道注意力塊與N個稠密邊界塊依據(jù)命名編號一對一連接,命名編號相同的稠密邊界塊的輸出作為通道注意力塊的輸入,并且在通道注意力塊CAB-(N-1)至CAB-0中,前一個通道注意力塊的輸出同時作為后一個通道注意力塊的輸入,其中所述Global Pool層的輸出作為通道注意力塊CAB-(N-1)的輸入,通道注意力塊CAB-0的輸出即為標記建筑物后的建筑物圖。
2.如權(quán)利要求1所述的基于稠密邊界塊和注意力機制的建筑物分割方法,其特征在于,所述稠密邊界塊包括稠密塊和邊界塊;
所述稠密塊接收卷積層輸出的特征,先經(jīng)過第一卷積處理層和第二卷積處理層,第二卷積處理層的輸出與原始卷積層輸出的特征進行一次拼接,一次拼接后的特征經(jīng)過第三卷積處理層和第四卷積處理層,第四卷積處理層的輸出、第二卷積處理層的輸出、以及原始卷積層輸出的特征進行二次拼接,二次拼接后的特征作為所述稠密塊的輸出;
所述邊界塊接收稠密塊輸出的特征,經(jīng)過1*1的卷積層、ReLu激活函數(shù),隨后經(jīng)過Deconv2d反卷積層、ReLu激活函數(shù)、BatchNorm層,輸出的特征與前一個稠密邊界塊的輸出進行疊加融合,將疊加融合后的特征再次經(jīng)過1*1的卷積層后作為該稠密邊界塊的輸出。
3.如權(quán)利要求2所述的基于稠密邊界塊和注意力機制的建筑物分割方法,其特征在于,所述第一卷積處理層和第三卷積處理層為歸一化、ReLu激活函數(shù)和1x1的卷積,第二卷積處理層和第四卷積處理層為歸一化、ReLu激活函數(shù)和3x3的卷積。
4.如權(quán)利要求1所述的基于稠密邊界塊和注意力機制的建筑物分割方法,其特征在于,所述通道注意力塊接收稠密邊界塊輸出的特征以及前一通道注意力塊輸出的特征,以稠密邊界塊輸出的特征為低級特征,以前一通道注意力塊輸出的特征為高級特征;
將高級特征和低級特征混合,利用全局池化層將混合后的特征的尺寸降為1,后經(jīng)過1*1的卷積層、ReLu激活函數(shù)、Batch Norm、*1的卷積層后得到特征圖,將特征圖經(jīng)過一個Sigmoid激活函數(shù)后產(chǎn)生一個對應(yīng)各個通道的得分圖,將得分圖與所述低級特征進行乘法操作后與原有輸入的高級特征融合,融合后的特征作為該通道注意力塊的輸出。
5.如權(quán)利要求1所述的基于稠密邊界塊和注意力機制的建筑物分割方法,其特征在于,所述N個通道注意力塊中,按照數(shù)據(jù)傳遞方向,每個通道注意力塊前還連接有一個反卷積層。
6.如權(quán)利要求1所述的基于稠密邊界塊和注意力機制的建筑物分割方法,其特征在于,所述步驟S2利用所述訓(xùn)練集優(yōu)化圖像分割模型,包括:
基于所述訓(xùn)練集,采用隨機梯度下降法優(yōu)化圖像分割模型。
7.如權(quán)利要求1所述的基于稠密邊界塊和注意力機制的建筑物分割方法,其特征在于,所述構(gòu)建損失函數(shù),包括:
L=(1-W)×H-W×logIOU
式中,L為所構(gòu)建的損失函數(shù),W為權(quán)重系數(shù),H為二進制交叉損失函數(shù),IOU為平均IOU,指兩個區(qū)域的重疊區(qū)域在兩個區(qū)域中所占比例;
其中,二進制交叉損失函數(shù)H的公式如下:
其中,n為遙感圖像的數(shù)量,yi是基本事實,是實際預(yù)測結(jié)果;
平均IOU的計算公式如下:
其中,mean IOU為平均IOU,TP表示正確的正樣本的數(shù)量,F(xiàn)P表示正確的負樣本的數(shù)量,F(xiàn)N表示錯誤的負樣本的數(shù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010782544.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





