[發(fā)明專利]一種任意尺度的高分辨率圖像小目標(biāo)檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010023020.6 | 申請(qǐng)日: | 2020-01-09 |
| 公開(公告)號(hào): | CN111222474B | 公開(公告)日: | 2022-11-04 |
| 發(fā)明(設(shè)計(jì))人: | 李建清;吳錦濤;王宏 | 申請(qǐng)(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號(hào): | G06V20/13 | 分類號(hào): | G06V20/13;G06V10/80;G06V10/82;G06V10/762;G06V10/764;G06V10/774;G06T7/73 |
| 代理公司: | 深圳國聯(lián)專利代理事務(wù)所(特殊普通合伙) 44465 | 代理人: | 王天興 |
| 地址: | 610054 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 任意 尺度 高分辨率 圖像 目標(biāo) 檢測(cè) 方法 | ||
一種任意尺度的高分辨率圖像小目標(biāo)檢測(cè)方法,包括以下步驟:獲取標(biāo)注清洗的目標(biāo)數(shù)據(jù)集,劃分訓(xùn)練集和測(cè)試集;對(duì)數(shù)據(jù)集通過優(yōu)化聚類算法計(jì)算預(yù)設(shè)錨框;設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò),通過特征提取得到特征圖,在預(yù)測(cè)網(wǎng)絡(luò)上添加補(bǔ)丁使上采樣得到的特征圖和特征提取層對(duì)應(yīng)特征圖維度保持一致,在不同尺度特征圖上做多尺度檢測(cè);利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練,待性能評(píng)價(jià)指標(biāo)收斂后得到具有小目標(biāo)檢測(cè)能力的神經(jīng)網(wǎng)絡(luò)模型;對(duì)測(cè)試數(shù)據(jù)集進(jìn)行檢測(cè),得到目標(biāo)類別和位置坐標(biāo)。本發(fā)明適用任意尺寸的圖像輸入網(wǎng)絡(luò),避免縮小到固定尺寸輸入網(wǎng)絡(luò)后特征圖上小目標(biāo)特征的丟失,或裁剪圖像導(dǎo)致邊緣目標(biāo)上下文信息丟失,有助于高分辨率圖像小目標(biāo)的檢測(cè),適用性廣。
技術(shù)領(lǐng)域
本發(fā)明屬于深度學(xué)習(xí)圖像處理和遙感高分辨率圖像小目標(biāo)檢測(cè)技術(shù)領(lǐng)域,特別涉及到一種任意尺度的高分辨率圖像小目標(biāo)檢測(cè)方法。
背景技術(shù)
隨著衛(wèi)星遙感技術(shù)及計(jì)算機(jī)視覺技術(shù)的發(fā)展和應(yīng)用,光學(xué)遙感圖像中的目標(biāo)檢測(cè)在民用和軍事方面有著重要意義。在民用上,高精度目標(biāo)檢測(cè)有助于輔助交通管理和規(guī)劃;在軍事上,高精度的目標(biāo)檢測(cè)有助于準(zhǔn)確的情報(bào)偵察,精確鎖定敵對(duì)目標(biāo)入侵和危害,維護(hù)國家安全。而分辨率高、目標(biāo)小是遙感圖像目標(biāo)檢測(cè)的難點(diǎn)和最突出的問題之一。
傳統(tǒng)的遙感圖像目標(biāo)檢測(cè)基于圖像處理,即先進(jìn)行紋理分割、紋理特征提取,然后使用模板匹配等方法對(duì)目標(biāo)進(jìn)行判斷,不僅對(duì)特征的抽象和泛化能力弱,而且工程復(fù)雜度高。深度卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用大大提高了目標(biāo)檢測(cè)精度,但是無論是以YOLO為代表的one-stage檢測(cè)算法,還是以R-CNN為代表的two-stage檢測(cè)算法,都需要對(duì)高分辨率的遙感圖像進(jìn)行裁剪或者進(jìn)行插值計(jì)算放縮到較小的圖像尺寸,裁剪導(dǎo)致特征提取后裁剪塊邊緣目標(biāo)上下文信息丟失,而對(duì)圖像進(jìn)行插值計(jì)算放縮到較小的固定尺寸,原始圖像中小目標(biāo)尺寸更小,通過深層的特征提取網(wǎng)絡(luò)所得到的特征圖,小目標(biāo)特征丟失,會(huì)造成小目標(biāo)的漏檢。以YOLO為例,如果輸入圖像原始大小為1355×1526,圖像中小目標(biāo)尺寸為32×32,輸入網(wǎng)絡(luò)需要對(duì)圖片進(jìn)行插值縮小到416×416的固定大小,小目標(biāo)尺寸縮小到10~16之間,小目標(biāo)通過特征提取網(wǎng)絡(luò)在特征圖上目標(biāo)特征消失,最終造成小目標(biāo)的漏檢。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于提供一種任意尺度的高分辨率圖像小目標(biāo)檢測(cè)方法,該檢測(cè)方法克服了現(xiàn)有深度學(xué)習(xí)網(wǎng)絡(luò)固定輸入圖像尺寸,大尺寸圖像需要縮放到固定尺寸輸入網(wǎng)絡(luò),造成小目標(biāo)漏檢的不足,提高了大尺寸圖像情況下小目標(biāo)識(shí)別的準(zhǔn)確性。
為了解決上述技術(shù)問題,本發(fā)明通過以下方式來實(shí)現(xiàn):
一種任意尺度的高分辨率圖像小目標(biāo)檢測(cè)方法,具體包括以下步驟:
S1、獲取目標(biāo)數(shù)據(jù)集,對(duì)目標(biāo)數(shù)據(jù)集進(jìn)行標(biāo)注清洗,并劃分訓(xùn)練集和測(cè)試集;
S2、對(duì)步驟S1中的目標(biāo)數(shù)據(jù)集通過優(yōu)化的kmeans聚類算法計(jì)算預(yù)設(shè)錨框Anchors;
S3、設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò),通過特征提取網(wǎng)絡(luò)得到特征圖,并在預(yù)測(cè)網(wǎng)絡(luò)上通過添加補(bǔ)丁的方式使上采樣得到的特征圖和特征提取層所對(duì)應(yīng)特征圖維度保持一致,進(jìn)行特征融合,在原圖的和大小的特征圖上做多尺度檢測(cè);
S4、將步驟S1中得到的訓(xùn)練集和對(duì)應(yīng)的樣本標(biāo)簽作為輸入數(shù)據(jù),利用步驟S3中得到的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,待性能評(píng)價(jià)指標(biāo)達(dá)到收斂后得到具有小目標(biāo)檢測(cè)能力的神經(jīng)網(wǎng)絡(luò)模型;
S5、根據(jù)步驟S4得到的神經(jīng)網(wǎng)絡(luò)模型,對(duì)測(cè)試數(shù)據(jù)集進(jìn)行檢測(cè),得到檢測(cè)結(jié)果。
進(jìn)一步地,所述步驟S1具體包含以下子步驟:
S11、選取數(shù)據(jù)集中包含汽車的圖片作為目標(biāo)數(shù)據(jù)集,對(duì)目標(biāo)數(shù)據(jù)集進(jìn)行標(biāo)注清洗,構(gòu)成實(shí)驗(yàn)中所用的數(shù)據(jù)集和樣本標(biāo)簽;
S12、對(duì)步驟S11中得到的數(shù)據(jù)集和樣本標(biāo)簽進(jìn)行旋轉(zhuǎn)、翻轉(zhuǎn)、加噪聲等操作,實(shí)現(xiàn)數(shù)據(jù)擴(kuò)展和數(shù)據(jù)增強(qiáng),不對(duì)圖片進(jìn)行尺寸變換;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010023020.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





