[發(fā)明專利]基于多尺度特征和擴(kuò)張型逆殘差全連接的目標(biāo)檢測方法有效
| 申請?zhí)枺?/td> | 202110022941.5 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112733848B | 公開(公告)日: | 2022-11-04 |
| 發(fā)明(設(shè)計(jì))人: | 丁鵬;戚志剛;晏謝飛;惠新成;朱剛;蔣保富;劉韻 | 申請(專利權(quán))人: | 中國電子科技集團(tuán)公司第二十八研究所 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 江蘇圣典律師事務(wù)所 32237 | 代理人: | 胡建華 |
| 地址: | 210000 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 尺度 特征 擴(kuò)張型 逆殘差全 連接 目標(biāo) 檢測 方法 | ||
本發(fā)明公開了一種基于多尺度特征和擴(kuò)張型逆殘差全連接的目標(biāo)檢測方法。首先,本發(fā)明提出一種基于多尺度特征的主體網(wǎng)絡(luò)改進(jìn)方法,該方法組合了深度卷積層的深層次特征和淺層次特征并設(shè)計(jì)了一種平衡兩者之間比例的方式;其次,提出一種擴(kuò)張型逆殘差全連接模塊,該模塊采用“逆殘差”+“擴(kuò)張”的方式進(jìn)行特征提取和輸出,可以在很大程度上提升“逆殘差”全連接模塊效率,屬于圖像處理和人工智能技術(shù)領(lǐng)域。本發(fā)明無論速度上還是精度上都有很好的性能,極具應(yīng)用價(jià)值。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像處理和人工智能技術(shù)領(lǐng)域,特別涉及一種基于多尺度特征和擴(kuò)張型逆殘差全連接的目標(biāo)檢測方法。
背景技術(shù)
經(jīng)典的基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法Faster R-CNN是一種非常優(yōu)秀的目標(biāo)檢測算法,但是也存在一些不足,主要體現(xiàn)在:1、目標(biāo)檢測速度較慢尤其是使用全卷積深度卷積神經(jīng)網(wǎng)絡(luò)時(shí)速度非常慢;2、小尺度目標(biāo)檢測的精度不高。為了改善Faster R-CNN的性能,國內(nèi)外很多優(yōu)秀的學(xué)者嘗試采用多尺度特征層如Hyper-Net,F(xiàn)PN等方法提升Faster R-CNN檢測的精度,但是這些方法都有沒提到如何更好的平衡不同層次特征之間的比例,對不同大小目標(biāo)尺度適應(yīng)性不夠,且Hyper-Net雖結(jié)合了不同層次的特征但實(shí)際上還是利用一個輸出特征層進(jìn)行目標(biāo)檢測。此外,另一種經(jīng)典的基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法R-FCN采用位置敏感的候選區(qū)域采樣方法選擇輸出特征層中位置信息較強(qiáng)的通道進(jìn)行目標(biāo)細(xì)分類和定位,但是它忽視很多有利于分類的信息,而申請?zhí)枮?02010102354.2的專利申請公開了一種結(jié)合定位信息和分類信息的方法,雖在提出逆殘差全連接的基礎(chǔ)上很好的利用了位置敏感的候選區(qū)域采樣方法進(jìn)行綜合檢測定位和分類兩個方面,但設(shè)計(jì)的逆殘差模型過于緊湊,忽視了信息擴(kuò)張的作用,無法更好的發(fā)揮逆殘差全連接模型的作用,雖然在也有全連接層置于逆殘差全連接之后,但是其更主要的是用于融合PSROI-Pooling層和ROI-Pooling層輸出后經(jīng)過處理的特征。
發(fā)明內(nèi)容
發(fā)明目的:本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)的不足,提供一種基于多尺度特征和擴(kuò)張型逆殘差全連接的目標(biāo)檢測方法。
為了解決上述技術(shù)問題,本發(fā)明公開了一種基于多尺度特征和擴(kuò)張型逆殘差全連接的目標(biāo)檢測方法,步驟如下:
步驟1,微調(diào)全卷積神經(jīng)網(wǎng)絡(luò),構(gòu)建主體網(wǎng)絡(luò),所述主體網(wǎng)絡(luò)對輸入圖像進(jìn)行處理后獲得輸入圖像的多尺度特征;所述多尺度特征包括淺層特征和深層特征;
步驟2,基于所述主體網(wǎng)絡(luò)構(gòu)建多尺度特征結(jié)合模塊,所述多尺度特征結(jié)合模塊能夠?qū)斎雸D像的深層特征降維和多尺度特征合并,所述深層特征降維后獲得輸入圖像的第一輸出特征;
步驟3,構(gòu)建多尺度特征比例平衡模塊,所述多尺度特征比例平衡模塊能夠平衡多尺度特征之間的比例;將步驟2中多尺度特征合并后的特征輸入多尺度特征比例平衡模塊,獲得輸入圖像的第二輸出特征;
步驟4,結(jié)合輸入圖像的第一輸出特征和第二輸出特征對輸入圖像進(jìn)行不同尺度目標(biāo)的預(yù)檢測以區(qū)分目標(biāo)、背景以及初步的目標(biāo)定位;
步驟5,對輸入圖像的第一輸出特征和第二輸出特征分別進(jìn)行特征池化,獲得輸入圖像的第一池化特征和第二池化特征,將第一池化特征和第二池化特征進(jìn)行拼接獲得第三池化特征;
步驟6,構(gòu)建擴(kuò)張型逆殘差全連接模塊,所述擴(kuò)張型逆殘差全連接模塊能夠根據(jù)不同尺度目標(biāo)的預(yù)檢測結(jié)果和第三池化特征對輸入圖像進(jìn)行目標(biāo)細(xì)定位和分類;
步驟7,設(shè)定損失函數(shù)進(jìn)行反向傳播訓(xùn)練,利用訓(xùn)練后的模型進(jìn)行目標(biāo)檢測。所述設(shè)定損失函數(shù)的方法具體參見申請?zhí)枮?02010102354.2的專利申請中公開的設(shè)定損失函數(shù)的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國電子科技集團(tuán)公司第二十八研究所,未經(jīng)中國電子科技集團(tuán)公司第二十八研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110022941.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





