[發(fā)明專利]基于多尺度特征圖重構(gòu)和知識蒸餾的目標檢測方法與系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010324557.6 | 申請日: | 2020-04-23 |
| 公開(公告)號: | CN111626330B | 公開(公告)日: | 2022-07-26 |
| 發(fā)明(設(shè)計)人: | 劉天亮;平安;戴修斌;鄒玉龍 | 申請(專利權(quán))人: | 南京郵電大學 |
| 主分類號: | G06V10/75 | 分類號: | G06V10/75;G06V10/774;G06V10/764;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京蘇高專利商標事務(wù)所(普通合伙) 32204 | 代理人: | 孟紅梅 |
| 地址: | 210033 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 尺度 特征 圖重構(gòu) 知識 蒸餾 目標 檢測 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于多尺度特征圖重構(gòu)和知識蒸餾的目標檢測方法與系統(tǒng),該方法首先利用骨干網(wǎng)絡(luò)Darknet?53提取特征,深層特征通過上采樣和淺層特征張量拼接生成多尺度特征圖;然后采用特征重標定策略來自動獲取特征圖中每個通道的權(quán)重,依照權(quán)重提升有用的特征并抑制無用特征,再用殘差模塊融合頂層特征的語義信息和底層特征的細節(jié)信息;再將骨干網(wǎng)絡(luò)中批量歸一化層的γ系數(shù)引入到剪枝目標函數(shù)中進行訓練,根據(jù)修剪閾值將低于閾值的γ系數(shù)所在通道從模型中去除;最后將訓練好的YOLOv3基準模型作為教師網(wǎng)絡(luò),剪枝后的模型作為學生網(wǎng)絡(luò)進行知識蒸餾。本發(fā)明改善了在大范圍內(nèi)不同大小物體檢測的精度問題,同時降低了模型的計算量,提高了模型檢測速度。
技術(shù)領(lǐng)域
本發(fā)明提供一種基于多尺度特征圖重構(gòu)和知識蒸餾的目標檢測方法與系統(tǒng),屬于計算機視覺的目標檢測技術(shù)領(lǐng)域。
背景技術(shù)
圖像目標識別是一項涉及計算機視覺、模式識別及人工智能等多領(lǐng)域的研究課題,隨著硬件技術(shù)的快速發(fā)展,基于深度學習平臺的嵌入式智能設(shè)備日漸成熟,越來越多的檢測算法嵌入到智能設(shè)備上,但是傳統(tǒng)的檢測方法對于一定范圍內(nèi)不同大小的目標檢測精度相差較大,不能精準地識別目標,達不到日常需求,并且傳統(tǒng)檢測算法模型參數(shù)過多,所需算力較大,不能很好地在嵌入式設(shè)備上運行,所以要提出一種既能夠使得檢測算法滿足多尺度目標檢測精度,且能夠在保證精度的情況下更快地運行在嵌入式設(shè)備上的技術(shù),是一個很有挑戰(zhàn)性的工作。
傳統(tǒng)的目標識別算法大多使用特征金字塔來學習多尺度特征,以獲得更好的檢測精度,然而,目前的特征金字塔設(shè)計仍然不足以將語義信息整合到不同的尺度上,骨干網(wǎng)絡(luò)將提取的特征分為高級特征和低級特征,高層特征具有更強的語義信息,但是分辨率小,對細節(jié)的感知能力較差。對于小目標的檢測效果較差,低層特征分辨率更大,包含更多位置、細節(jié)信息,但是由于經(jīng)過的卷積層少,其語義信息少,噪聲更多,選擇更好的融合方法,可以提高多尺度目標的檢測精度。而選擇好的壓縮算法,可以使檢測模型的參數(shù)量大幅度減小,提高檢測速度。
針對多尺度目標檢測的分析中,文獻[Wei Liu,Dragomir Anguelov,DumitruErhan,Christian Szegedy,Scott Reed,Cheng-Yang Fu,and Alexander C Berg.Ssd:Single shot multibox detector.In ECCV,2016]提出的SSD,是生成卷積金字塔特征表示以進行對象檢測的首次嘗試之一。它可以生成多尺度的特征圖以預(yù)測各種大小的對象。但是,由于淺層特征圖包含的語義信息不足,這種自下而上的途徑在小實例上的準確性較低。為了解決卷積金字 塔的問題[Tsung-Yi Lin,Piotr Doll′ar, Ross Girshick,KaimingHe,Bharath Hariharan,and Serge Belongie.Feature pyramid networks for objectdetection.In CVPR,2017]提出了著名的特征金字塔,依次在骨干模型的特征層次結(jié)構(gòu)中將兩個相鄰的層與自頂向下的路徑和橫向連接相結(jié)合。低分辨率,語義上強的特征被上采樣,并與高分辨率,語義上弱的特征相結(jié)合,以構(gòu)建在所有層次上共享豐富語義的特征金字塔,但是它仍有很大的改進空間,例如,[Shu Liu,Lu Qi,Haifang Qin,Jianping Shi,andJiaya Jia.Path aggregation network for instance segmentation.In CVPR,2018]通過手動設(shè)計融合結(jié)構(gòu),加強特征融合使得檢測準確度提高了很多,但是這些算法沒有結(jié)合YOLOv3和實際場景進行優(yōu)化,并且在特征圖重構(gòu)上還有很多進步空間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學,未經(jīng)南京郵電大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010324557.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





