[發(fā)明專利]一種基于全卷積神經(jīng)網(wǎng)絡(luò)的大尺度遙感圖像樓房分類方法有效
| 申請?zhí)枺?/td> | 201811006869.1 | 申請日: | 2018-08-29 |
| 公開(公告)號: | CN109117894B | 公開(公告)日: | 2022-05-27 |
| 發(fā)明(設(shè)計)人: | 閆敬文;袁振國;陳宏達(dá);彭鴻 | 申請(專利權(quán))人: | 汕頭大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 周增元;曹江 |
| 地址: | 515000 *** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 卷積 神經(jīng)網(wǎng)絡(luò) 尺度 遙感 圖像 樓房 分類 方法 | ||
本發(fā)明公開了一種基于全卷積神經(jīng)網(wǎng)絡(luò)的大尺度遙感圖像樓房分類方法。首先,通過在計算網(wǎng)絡(luò)模型的每層池化層前,融合上一層池化前的特征改善池化造成的圖像信息丟失問題;其次,考慮大尺度遙感圖像樓房分類的不平衡問題,改進(jìn)常規(guī)的交叉熵?fù)p失函數(shù),提出基于FocalLoss損失函數(shù)的加權(quán)損失函數(shù)WFL(Weighted FocalLoss)。本發(fā)明公開的一種基于全卷積神經(jīng)網(wǎng)絡(luò)的大尺度遙感圖像樓房分類方法能夠高效準(zhǔn)確的生成與原始圖像具有同樣尺寸大小的二值分類映射圖,在大尺度遙感圖像樓房分類領(lǐng)域具有重要的實際應(yīng)用意義,可以為城鎮(zhèn)規(guī)劃、演變提供可靠的技術(shù)支持。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理和深度學(xué)習(xí)領(lǐng)域,尤其涉及一種基于全卷積神經(jīng)網(wǎng)絡(luò)的大尺度遙感圖像樓房分類方法。
背景技術(shù)
隨著衛(wèi)星遙感圖像和航空遙感圖片分辨率的不斷提高,人們可以從遙感圖像中獲得更多的有用的數(shù)據(jù)和信息。 伴隨著“數(shù)字地球”概念的提出,越來越多的民用場合需要用到遙感圖像,包括資源調(diào)查,自然災(zāi)害觀測、大氣氣象預(yù)報等。由于不同場合遙感圖像的應(yīng)用對遙感圖像處理提出了不同的要求,所以圖像處理中重要的環(huán)節(jié)——圖像分類也就顯得尤為重要,經(jīng)過多年的努力,形成了許多經(jīng)典的分類方法和算法。
近年來,深度學(xué)習(xí)在圖像處理、自然語言理解和語音識別等領(lǐng)域取得了突破性進(jìn)展,已經(jīng)成為了人工智能的一個熱潮。深度學(xué)習(xí)旨在建立一個模型來模擬人類大腦的神經(jīng)連接結(jié)構(gòu),在處理圖像、聲音、文本等信號的時候,通過多個變換階段分層對數(shù)據(jù)特征進(jìn)行描述,從而給出數(shù)據(jù)的解釋。在深度學(xué)習(xí)中,底層特征的不同組合能夠形成更加抽象的高層特征、屬性或者是其他分類,再進(jìn)一步給出不同層的數(shù)據(jù)特征表示。將深度學(xué)習(xí)應(yīng)用到遙感圖像的房屋檢測中,能夠更好地處理大尺度遙感圖像,并對遙感圖像的豐富信息特征進(jìn)行學(xué)習(xí),從而使得樓房定位更加精確。將深度學(xué)習(xí)與遙感技術(shù)相結(jié)合,具有非常現(xiàn)實的意義,能夠為地理信息系統(tǒng)等應(yīng)用帶來更好的應(yīng)用體驗。
發(fā)明內(nèi)容
本發(fā)明實施例所要解決的技術(shù)問題在于,提供一種基于全卷積神經(jīng)網(wǎng)絡(luò)的大尺度遙感圖像樓房分類方法。可高效準(zhǔn)確的生成與原始圖像具有同樣尺寸大小的二值分類映射圖。
為了解決上述技術(shù)問題,本發(fā)明實施例提供了一種基于全卷積神經(jīng)網(wǎng)絡(luò)的大尺度遙感圖像樓房分類方法,包括以下步驟:
S1:將輸入數(shù)據(jù)為圖像和標(biāo)簽,將所述圖像依次經(jīng)過至少三個跳躍基本單元,
S2:將上述輸出結(jié)果交替輸入三個融合層、兩個上采樣層得到預(yù)測映射;
S3:將所述預(yù)測映射與所述標(biāo)簽計算基于Focal Loss損失函數(shù)的加權(quán)損失函數(shù);
S4:通過反向傳播修正網(wǎng)絡(luò)權(quán)重,迭代訓(xùn)練,直到訓(xùn)練結(jié)束;
S5:輸入數(shù)據(jù)為圖像經(jīng)過上述步驟依次處理,將原始圖像切割成適用于網(wǎng)絡(luò)的小圖像塊,將預(yù)測的小圖像塊映射拼接,得到原始大尺度遙感圖像的樓房分布預(yù)測。
進(jìn)一步地,所述跳躍基本單元利用步長為2的多卷積核,將池化層前的輸入數(shù)據(jù)進(jìn)行空間上的降維以及深度上的升維,并將計算得到的特征與池化層和卷積層計算后的輸出特征融合作為跳躍基本單元的輸出。
更進(jìn)一步地,所述基于Focal Loss損失函數(shù)的加權(quán)損失函數(shù)公式為:
其中,m為圖像中背景的像素總數(shù),n為圖像中房屋的像素總數(shù),且。:當(dāng)時,加權(quán)損失函數(shù)退化為加權(quán)交叉熵?fù)p失;當(dāng)時,加權(quán)損失函數(shù)能夠降低正確分類的那些像素對損失的貢獻(xiàn)。
實施本發(fā)明實施例,具有如下有益效果:本發(fā)明能夠高效準(zhǔn)確的生成與原始圖像具有同樣尺寸大小的二值分類映射圖,在大尺度遙感圖像樓房分類領(lǐng)域具有重要的實際應(yīng)用意義,可以為城鎮(zhèn)規(guī)劃、演變提供可靠的技術(shù)支持。
附圖說明
圖1為工作流程圖;
圖2為跳躍融合基本單元;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于汕頭大學(xué),未經(jīng)汕頭大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811006869.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





