[發(fā)明專利]一種基于YOLO的輕量級的目標檢測方法有效
| 申請?zhí)枺?/td> | 202011164112.2 | 申請日: | 2020-10-27 |
| 公開(公告)號: | CN112257794B | 公開(公告)日: | 2022-10-28 |
| 發(fā)明(設計)人: | 李晨;許虞俊;杜文娟 | 申請(專利權(quán))人: | 東南大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 彭雄 |
| 地址: | 211189 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 yolo 輕量級 目標 檢測 方法 | ||
本發(fā)明公開了一種基于YOLO的輕量級的目標檢測方法,由一種重復堆疊的通道無縮放卷積模塊組成,且模塊內(nèi)通過重復的通道無縮放卷積塊與普通的1x1卷積以及3x3卷積的組合極大地縮小了模型的尺寸,同時通過ECA結(jié)構(gòu)重新分配通道的權(quán)重,增強各通道面對不同類別的目標自適應學習能力。網(wǎng)絡基于YOLO系列框架輸出三種不同尺度的特征圖,分別負責預測不同尺度的物體,使得模型在極低的參數(shù)量下實現(xiàn)較高精度的檢測效果,本發(fā)明參數(shù)復雜度低,精度高。
技術(shù)領域
本發(fā)明涉及計算機視覺目標檢測領域,尤其是輕量級多尺度目標檢測方法。
背景技術(shù)
目標檢測一直是計算機視覺領域一個相當重要的研究領域,隨著深度學習技術(shù)的發(fā)展,目標檢測算法也從基于手工特征的傳統(tǒng)算法轉(zhuǎn)向了基于深度卷積神經(jīng)網(wǎng)絡的檢測技術(shù)。隨著對檢測精度要求的逐漸提高,檢測任務難度也越來越大,越來越多的復雜大型網(wǎng)絡被設計出來,例如SSD,R-CNN,Mask-R-CNN。而網(wǎng)絡的參數(shù)數(shù)量動輒100M以上,例如像FasterR-CNN模型參數(shù)數(shù)量達到了132M,AmoebaNet的模型參數(shù)數(shù)量更是達到了209M。雖然更大的網(wǎng)絡模型,更深的網(wǎng)絡深度意味著網(wǎng)絡可以提取到更多的深層特征來提升網(wǎng)絡的精度,但是也引入了巨大的參數(shù)量與計算量,在一些內(nèi)存受限的應用場景中就無法進行部署,因此輕量級的目標檢測網(wǎng)絡一直都是工業(yè)界十分關(guān)注的研究領域。
在許多移動場景中部署目標檢測網(wǎng)絡,不僅要考慮模型的計算復雜度與模型的參數(shù)數(shù)量,也同樣要考慮模型的檢測精度。其中比較通用的做法例如網(wǎng)絡剪枝,網(wǎng)絡參數(shù)量化,都是在已經(jīng)設計好的網(wǎng)絡模型上做優(yōu)化。
為了更加適用于移動場景,需要為了移動場景專門定制的輕量化網(wǎng)絡,解決移動場景下的內(nèi)存受限,計算力受限的問題,才能夠使得輕量級目標檢測網(wǎng)能很好的部署到移動場景中。
發(fā)明內(nèi)容
發(fā)明目的:為了克服現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種基于YOLO的輕量級的目標檢測方法,能夠有效的降低網(wǎng)絡的參數(shù)數(shù)量,同時提高算法的檢測精度。
技術(shù)方案:為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為:
一種基于YOLO的輕量級的目標檢測方法,包括特征提取模塊、多尺度感受野融合模塊以及目標檢測模塊;所述的特征提取模塊主要由1x1卷積,3x3卷積,以及通道無縮放卷積塊NEP組成,通過堆疊這些模塊得到有較大感受野的輕量級主干網(wǎng)絡,用于特征提取;將提取到的語義特征在不同尺度上抽取三個分支,送入多尺度感受野模塊,進行多尺度融合,最后使用融合后得到的三種不同尺度的特征圖分別預測不同大小的物體;并采用Distance-IoU Loss來計算損失函數(shù),提升檢測框的回歸精度,得到最終的目標檢測網(wǎng)絡,具體包括以下步驟:
步驟1,采集檢測圖片,形成訓練集。
步驟2,特征提取:將訓練集輸入到特征提取模塊中提取語義特征,將提取到的語義特征在不同尺度上抽取三個分支,送入多尺度感受野融合模塊。特征提取模塊包括依次連接的第一1x1卷積、第一3x3卷積以及通道無縮放卷積塊NEP。所述通道無縮放卷積塊NEP包括依次連接的第一層網(wǎng)絡、第二層網(wǎng)絡、注意力模塊ECA、第三層網(wǎng)絡,第一層網(wǎng)絡為第一Ghost模塊,第二層網(wǎng)絡為3x3的深度可分離卷積塊,第三層網(wǎng)絡為第二Ghost模塊,所述第一Ghost模塊、第二Ghost模塊均包括依次連接的第二1x1卷積和第二3x3的深度可分離卷積,所述第一Ghost模塊、第二Ghost模塊替代常用的1x1卷積塊。
使用GhostNet網(wǎng)絡結(jié)構(gòu)中的Ghost模塊作為網(wǎng)絡卷積的基礎模塊,該模塊通過1x1卷積與3x3的深度可分離卷積的組合來實現(xiàn)常規(guī)1x1卷積的功能。本發(fā)明通過引入這種3x3的深度可分離卷積來保證網(wǎng)絡在通道融合的過程中也能不斷的擴大感受野,以減少輕量級網(wǎng)絡因為深度過淺而導致的特征提取不充分問題。因為使用Ghost模塊來替代常用的1x1卷積塊,而該模塊中3x3的深度可分離卷積,可進一步提升輕量級網(wǎng)絡的感受野,并能有效提高網(wǎng)絡的特征提取性能。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學,未經(jīng)東南大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011164112.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于FPGA的Tiny-yolo卷積神經(jīng)網(wǎng)絡硬件加速方法及系統(tǒng)
- 一種基于YOLO的Compress-YOLO模型壓縮方法
- 一種面向計算資源局限平臺部署的實時目標檢測的方法
- 一種用于星上對艦船目標檢測的Tiny-YOLO網(wǎng)絡的優(yōu)化方法
- 一種基于改進YOLO v3模型的行人檢測方法
- 一種基于改進YOLO v4算法的目標檢測方法
- 一種YOLO脈沖神經(jīng)網(wǎng)絡的優(yōu)化方法
- 圖像識別方法、裝置、計算機可讀存儲介質(zhì)及處理器
- 一種船只檢測方法和裝置
- YOLO神經(jīng)網(wǎng)絡的訓練方法、行人檢測方法和相關(guān)設備
- 高速高帶寬AHB總線到低速低帶寬AHB總線的雙向轉(zhuǎn)換橋
- 可拆裝換鉤頭的1輕量級的鋁制手柄及十四枚鋼鉤針組合
- 一種輕量級節(jié)點的數(shù)據(jù)傳輸方法、裝置、設備和介質(zhì)
- 一種輕量級節(jié)點的數(shù)據(jù)傳輸方法、裝置、設備和介質(zhì)
- 輕量級請求的并發(fā)處理方法及相關(guān)設備
- 一種輕量級深度卷積神經(jīng)網(wǎng)絡的FPGA實現(xiàn)方法
- 一種小區(qū)選擇方法、輕量級終端及網(wǎng)絡設備
- 授權(quán)簽名生成方法、節(jié)點管理方法、裝置、設備和介質(zhì)
- 輕量級桌面機械臂底座及輕量級桌面機械臂
- 輕量級機械臂束線結(jié)構(gòu)、輕量級機械臂及機器人





