[發(fā)明專利]一種基于多頭自注意力模塊的遙感圖像分類系統(tǒng)及方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110609315.6 | 申請(qǐng)日: | 2021-06-01 |
| 公開(kāi)(公告)號(hào): | CN113344070A | 公開(kāi)(公告)日: | 2021-09-03 |
| 發(fā)明(設(shè)計(jì))人: | 業(yè)巧林;范習(xí)健;李彥甫;母園 | 申請(qǐng)(專利權(quán))人: | 南京林業(yè)大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京思拓知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32288 | 代理人: | 苗建 |
| 地址: | 210037 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多頭 注意力 模塊 遙感 圖像 分類 系統(tǒng) 方法 | ||
本發(fā)明公開(kāi)了一種基于多頭自注意力模塊的遙感圖像分類系統(tǒng)及方法,分類模型的框架網(wǎng)絡(luò)主干采用的是RestNet50卷積神經(jīng)網(wǎng)絡(luò),分類模型將RestNet50卷積神經(jīng)網(wǎng)絡(luò)最后三個(gè)瓶頸層模塊替換為多頭自注意力模塊;模型包括:縮放點(diǎn)積注意力模塊,用于將輸入分類模型的檢測(cè)圖像參數(shù)進(jìn)行運(yùn)縮放點(diǎn)積注意力處理;多頭自注意力模塊,用于感知檢測(cè)圖像中可識(shí)別度最高的區(qū)域;第一歸一化及殘差連接模塊、第二歸一化及殘差連接模塊,用于保持檢測(cè)圖像參數(shù)在輸入分類模型后與輸入分類模型前維度上的一致,降低在分類模型網(wǎng)絡(luò)中發(fā)生梯度消失的可能;全連接模塊,用于對(duì)檢測(cè)圖像進(jìn)行特征提取。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識(shí)別技術(shù)領(lǐng)域,具體為一種基于多頭自注意力模塊的遙感圖像分類系統(tǒng)及方法。
背景技術(shù)
在實(shí)際生產(chǎn)生活中,遙感圖像被應(yīng)用于諸多領(lǐng)域,其中,在城市規(guī)劃、森林狀態(tài)評(píng)估、生態(tài)環(huán)境監(jiān)測(cè)等方面,遙感圖像都起著至關(guān)重要的作用;這些應(yīng)用的主要目的是通過(guò)對(duì)采集到的遙感圖像特征進(jìn)行提取和分析,準(zhǔn)確判斷出圖像中所包含的主要目標(biāo)類別,如建筑、森林或濕地等。目前,實(shí)現(xiàn)遙感圖像分類的主要手段主要是利用計(jì)算機(jī)技術(shù)模擬生物對(duì)視覺(jué)的感知能力,對(duì)遙感圖像中每個(gè)像素根據(jù)特征的異同,如光譜亮度、空間結(jié)構(gòu)特征等,按照某種流程或規(guī)則對(duì)屬性進(jìn)行自動(dòng)判別和分類,以實(shí)現(xiàn)提取圖像中包含的地物信息的目標(biāo)。在對(duì)遙感圖像分類早期的研究當(dāng)中,研究者主要選擇手工提取圖像特征的方法分類遙感圖像,但伴隨圖像采集技術(shù)的不斷發(fā)展,獲取遙感圖像的方法逐漸具有采集速度快、采集信息量巨大等特點(diǎn),且由于人工提取出的圖像特征所包含的信息量小、有效性低等特點(diǎn),傳統(tǒng)的手工特征提取方法難以滿足遙感圖像廣泛應(yīng)用的需求;隨著研究的不斷深入,研究者開(kāi)始嘗試融合不同的人工提取方法提取出的圖像特征,其中,常用的圖像特征提取方法有HOG、ORB、SIFT等;在結(jié)合不同人工提取的圖像特征的過(guò)程中,需要不停地調(diào)整每種提取方法提取到的圖像特征的權(quán)值參數(shù)大小,以得到更優(yōu)的效果。雖然給定的權(quán)值參數(shù)大小在某些遙感圖像分類上取得較高的精度,但在規(guī)模很大的數(shù)據(jù)集中使用該方法時(shí)十分困難。因此,為解決傳統(tǒng)的圖像分類方法在特征提取分析中存在的速度慢和精度低的問(wèn)題,模糊聚類分類法和機(jī)器學(xué)習(xí)等方法被綜合應(yīng)用到對(duì)圖像特征提取和分析方法中。
近年來(lái),深度學(xué)習(xí)技術(shù)被廣泛應(yīng)用在計(jì)算機(jī)視覺(jué)領(lǐng)域,其中,深度卷積神經(jīng)網(wǎng)絡(luò)CNN使得圖像分類效率和準(zhǔn)確度具有顯著的提高。不同于傳統(tǒng)的分類方法,CNN具有局部感知和權(quán)值共享的特點(diǎn)。局部感知即CNN每層中的每個(gè)神經(jīng)元只需要從當(dāng)前層輸入圖像中提取局部的像素特征,在網(wǎng)絡(luò)的深層中將這些局部信息合并,從而得到圖像的所有特征。目前,基于CNN的圖像識(shí)別分類算法在計(jì)算機(jī)視覺(jué)領(lǐng)域中取得了重大突破。
為了在已有分類方法基礎(chǔ)上提高遙感圖像的分類效率和精度,本發(fā)明提出了一種基于多頭自注意力模塊的遙感圖像分類系統(tǒng)及方法;鑒于已有的卷積神經(jīng)網(wǎng)絡(luò)在遙感圖像分類的精度較高,本系統(tǒng)框架選擇使用ResNet50作為主干網(wǎng)絡(luò),并將ResNet50最后三個(gè)瓶頸層的中間層替換為多頭自注意力模塊,本發(fā)明與目前已有的遙感圖像分類系統(tǒng)相比,在精度上有明顯提高,并且減少了框架的參數(shù),提高了分類的速度。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于多頭自注意力模塊的遙感圖像分類系統(tǒng)及方法,以解決上述背景技術(shù)中提出的問(wèn)題。
為了解決上述技術(shù)問(wèn)題,本發(fā)明提供如下技術(shù)方案:一種基于多頭自注意力模塊的遙感圖像分類方法,其特征在于,分類方法的工作流程如下:
S100:上傳檢測(cè)圖像,對(duì)檢測(cè)圖像的圖像參數(shù)進(jìn)行提取并進(jìn)行縮放點(diǎn)積注意力處理;得到第一處理結(jié)果;
S200:將步驟S100得到的諸多個(gè)第一處理結(jié)果進(jìn)行連接處理,得到連接處理結(jié)果;
S300:將連接處理結(jié)果進(jìn)行一次歸一化處理和殘差連接,得到第二處理結(jié)果;
S400:將第二處理結(jié)果進(jìn)行特征信息提取;
S500:將步驟S400得到的結(jié)果進(jìn)行第二次歸一化處理和殘差連接得到最終的圖像分類結(jié)果;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京林業(yè)大學(xué),未經(jīng)南京林業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110609315.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于粒子濾波視覺(jué)注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置





