[發(fā)明專利]一種高效的遙感圖像自監(jiān)督學(xué)習(xí)訓(xùn)練方法在審
| 申請?zhí)枺?/td> | 202210558764.7 | 申請日: | 2022-05-20 |
| 公開(公告)號: | CN115170898A | 公開(公告)日: | 2022-10-11 |
| 發(fā)明(設(shè)計(jì))人: | 楊文;張瑞祥;郭浩文;余淮 | 申請(專利權(quán))人: | 武漢大學(xué) |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/82;G06V20/13;G06N3/08;G06V20/10 |
| 代理公司: | 武漢科皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 | 代理人: | 王琪 |
| 地址: | 430072 湖北省武*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 高效 遙感 圖像 監(jiān)督 學(xué)習(xí) 訓(xùn)練 方法 | ||
本發(fā)明公開了一種自監(jiān)督學(xué)習(xí)訓(xùn)練加速方法,通過提取網(wǎng)絡(luò)損失的梯度歸一化值來實(shí)現(xiàn)對樣本難度的評估,之后基于樣本的難度評分在訓(xùn)練時(shí)采樣難度合適的數(shù)據(jù)進(jìn)行訓(xùn)練,有限的計(jì)算資源下加快網(wǎng)絡(luò)的收斂,實(shí)現(xiàn)更高效地自監(jiān)督學(xué)習(xí)。相對于通用的自監(jiān)督學(xué)習(xí)訓(xùn)練方法,在同樣的計(jì)算設(shè)備下,本發(fā)明公開的方法能夠節(jié)省約50%的訓(xùn)練時(shí)間,本發(fā)明可以有效地應(yīng)用到基于深度學(xué)習(xí)的自監(jiān)督學(xué)習(xí)任務(wù)中去,有效地加快收斂,節(jié)約計(jì)算資源。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)視覺領(lǐng)域,特別涉及一種高效地遙感圖像自監(jiān)督學(xué)習(xí)訓(xùn)練方法。
背景技術(shù)
目前,我國有多顆遙感衛(wèi)星體系在軌運(yùn)行,每日產(chǎn)生的遙感影像數(shù)據(jù)多達(dá)數(shù)百TB。大量的數(shù)據(jù)給遙感圖像解譯任務(wù)提供了厚實(shí)的基礎(chǔ),但是由于遙感圖像標(biāo)注費(fèi)時(shí)費(fèi)力,利用標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)成本高昂,這一現(xiàn)象促進(jìn)了遙感圖像自監(jiān)督學(xué)習(xí)的發(fā)展。遙感圖像自監(jiān)督學(xué)習(xí)旨在利用無標(biāo)注的遙感數(shù)據(jù)學(xué)習(xí)更好的遙感圖像特征表征,能夠遷移到下游的目標(biāo)檢測、場景分類、地物分類等圖像解譯任務(wù)中去并獲得更好的性能。
挖掘圖像固有的空間或語義關(guān)聯(lián)屬性,這種特性讓自監(jiān)督學(xué)習(xí)可以從海量的遙感數(shù)據(jù)中吸收到通用的表征,但因?yàn)闃?biāo)簽信息的缺失,自監(jiān)督訓(xùn)練需要的迭代次數(shù)一般遠(yuǎn)多于全監(jiān)督訓(xùn)練。按照一般遙感圖像自監(jiān)督學(xué)習(xí)的訓(xùn)練流程,在百萬級的數(shù)據(jù)集上迭代訓(xùn)練200代(epoch)大約需要Tesla V100運(yùn)行1600(卡·時(shí))。龐大的計(jì)算資源需求不僅為中小型研究機(jī)構(gòu)的入場設(shè)置了壁壘,也使自監(jiān)督模型和方法難以迭代和調(diào)優(yōu)。因此,需要對遙感圖像自監(jiān)督的訓(xùn)練策略進(jìn)行一定的優(yōu)化,更加有效地利用計(jì)算資源,設(shè)計(jì)一種高效的遙感圖像自監(jiān)督學(xué)習(xí)訓(xùn)練方法。
發(fā)明內(nèi)容
經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn),遙感圖像自監(jiān)督學(xué)習(xí)是十分消耗計(jì)算資源的,網(wǎng)絡(luò)平等地處理每一張訓(xùn)練樣本不夠高效,因此我們從訓(xùn)練樣本的難度入手,優(yōu)化自監(jiān)督學(xué)習(xí)的訓(xùn)練過程。在遙感圖像中,感興趣的目標(biāo)往往呈現(xiàn)聚集式分布,部分區(qū)域例如城市,其對應(yīng)的遙感圖像存在大量的感興趣目標(biāo),屬于較難挖掘的數(shù)據(jù)。而在山地、田地、海面這些區(qū)域,圖像中包含的感興趣目標(biāo)較少且外觀單一,樣本相對簡單。目前的算法平等地對待所有訓(xùn)練數(shù)據(jù),這導(dǎo)致了訓(xùn)練效率較低。在網(wǎng)絡(luò)訓(xùn)練前期,網(wǎng)絡(luò)無法掌握過于困難的數(shù)據(jù),而這些數(shù)據(jù)產(chǎn)生的梯度又會(huì)接近噪聲,使網(wǎng)絡(luò)不穩(wěn)定甚至發(fā)生梯度爆炸;在網(wǎng)絡(luò)訓(xùn)練后期,較為簡單的數(shù)據(jù)又對其幫助不大,過小的梯度也會(huì)稀釋其他樣本的訓(xùn)練效果。因此,在適當(dāng)?shù)挠?xùn)練階段為不同類型的樣本賦予適當(dāng)?shù)牟蓸訖?quán)重,可以有助于提升網(wǎng)絡(luò)的訓(xùn)練效率。
然而,在遙感圖像自監(jiān)督學(xué)習(xí)中,僅使用網(wǎng)絡(luò)產(chǎn)生的損失大小來度量訓(xùn)練樣本的難易程度是較為片面的。一方面,網(wǎng)絡(luò)產(chǎn)生的損失只能反映當(dāng)前時(shí)刻模型對其表征能力的強(qiáng)弱,并不能體現(xiàn)數(shù)據(jù)本身的語義豐富程度或訓(xùn)練價(jià)值。另一方面,自監(jiān)督學(xué)習(xí)使用了強(qiáng)度很高的數(shù)據(jù)增強(qiáng)策略,網(wǎng)絡(luò)產(chǎn)生的損失就不能直接地代表圖像本身的難易程度,而會(huì)受到數(shù)據(jù)增強(qiáng)的干擾。
為解決上述技術(shù)問題,本發(fā)明通過提取網(wǎng)絡(luò)損失的梯度歸一化(GradientNormalization,GradNorm)來實(shí)現(xiàn)對樣本難度的評估,并根據(jù)樣本的難度設(shè)計(jì)了一種優(yōu)化的訓(xùn)練策略,可以實(shí)現(xiàn)更加高效地自監(jiān)督學(xué)習(xí)訓(xùn)練。本發(fā)明所采用的技術(shù)方案是:一種高效的遙感圖像自監(jiān)督學(xué)習(xí)訓(xùn)練方法,具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學(xué),未經(jīng)武漢大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210558764.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種沼渣沼液的處理工藝及裝置
- 下一篇:一種烘焙紙及其生產(chǎn)工藝
- 一種基于SOA架構(gòu)的多星異構(gòu)遙感數(shù)據(jù)集成方法
- 一種遙感數(shù)據(jù)處理系統(tǒng)
- 一種遙感數(shù)據(jù)遠(yuǎn)程云處理系統(tǒng)及方法
- 一種帶報(bào)警提示的RFID遙感鎖
- 一種遙感圖像匹配方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種遙感圖像匹配方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種遙感圖像糾正匹配方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種遙感監(jiān)測自然災(zāi)害數(shù)據(jù)處理方法及系統(tǒng)
- 遙感傳感器輻射定標(biāo)方法、裝置和電子設(shè)備
- 一種熱紅外遙感圖像重建方法和裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法





