[發(fā)明專利]基于非對稱卷積的具有粒度級多尺度特性的車輛檢測方法有效
| 申請?zhí)枺?/td> | 202010042002.2 | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111242127B | 公開(公告)日: | 2023-02-24 |
| 發(fā)明(設(shè)計(jì))人: | 楊振坤;馬向華;狄逸群;茅豐;于志強(qiáng) | 申請(專利權(quán))人: | 上海應(yīng)用技術(shù)大學(xué) |
| 主分類號: | G06V30/146 | 分類號: | G06V30/146;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 上海漢聲知識產(chǎn)權(quán)代理有限公司 31236 | 代理人: | 黃超宇;胡晶 |
| 地址: | 200235 上海*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 對稱 卷積 具有 粒度 尺度 特性 車輛 檢測 方法 | ||
本發(fā)明公開了基于非對稱卷積的具有粒度級多尺度特性的車輛檢測方法,包括以下步驟:步驟S1:通過視頻流獲取若干包含車輛的圖片,制作車輛目標(biāo)檢測數(shù)據(jù)集,包括訓(xùn)練集和測試集;步驟S2:設(shè)計(jì)非對稱卷積AC單元;步驟S3:將非對稱卷積AC單元嵌入Res2Net模塊構(gòu)建具有粒度級多尺度特性的非對稱卷積ACB模塊;步驟S4:將ACB模塊嵌入輕量化模型ShuffleNetV2中構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)的車輛目標(biāo)分類網(wǎng)絡(luò)ACBNet;步驟S5:利用所制作的車輛目標(biāo)訓(xùn)練集訓(xùn)練車輛目標(biāo)分類網(wǎng)絡(luò)ACBNet;步驟S6:將測試集圖片放入分類網(wǎng)絡(luò)ACBNet進(jìn)行分類,之后再經(jīng)過殘差預(yù)測模塊處理獲得所預(yù)測圖像或視頻中車輛的類別和位置信息并框出車輛目標(biāo)。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學(xué)習(xí)中的視頻檢測技術(shù)領(lǐng)域,特別涉及基于非對稱卷積的具有粒度級多尺度特性的車輛檢測方法。
背景技術(shù)
近年來,隨著市場需求的增長以及人工智能的不斷發(fā)展,自動(dòng)駕駛逐步成為了各大學(xué)者研究的熱點(diǎn)問題之一。車輛目標(biāo)檢測作為自動(dòng)駕駛中的一個(gè)重要步驟,也是大家研究的主要問題之一。在智能交通監(jiān)控視頻中,目標(biāo)檢測技術(shù)也得到了廣泛的應(yīng)用。車輛檢測技術(shù)是利用計(jì)算機(jī)視覺技術(shù)判斷靜態(tài)圖像或動(dòng)態(tài)視頻中是否存在車輛并定位車輛的位置信息。在現(xiàn)實(shí)生活的交通場景中,車輛目標(biāo)檢測受到多種因素的干擾,如:光照、遮擋等。如何快速地、準(zhǔn)確地對復(fù)雜交通場景下的車輛進(jìn)行檢測、識別已經(jīng)成為一個(gè)值得深入研究的課題。基于深度學(xué)習(xí)特征提取的車輛檢測方法學(xué)到的特征具有很強(qiáng)層次表達(dá)能力,可以更好的解決一些視覺問題。然而現(xiàn)有的基于深度學(xué)習(xí)的車輛檢測方法魯棒性以及解決多尺度問題表現(xiàn)欠佳。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)中的不足,本發(fā)明提供基于非對稱卷積的具有粒度級多尺度特性的車輛檢測方法,用以解決現(xiàn)有技術(shù)中實(shí)時(shí)性和魯棒性低、多尺度問題檢測性能相對較差的問題。
為了達(dá)到上述發(fā)明目的,解決其技術(shù)問題所采用的技術(shù)方案如下:
基于非對稱卷積的具有粒度級多尺度特性的車輛檢測方法,包括以下步驟:
步驟S1:通過視頻流獲取若干包含車輛的圖片,制作車輛目標(biāo)檢測數(shù)據(jù)集,包括訓(xùn)練集和測試集;
步驟S2:設(shè)計(jì)非對稱卷積AC單元;
步驟S3:將步驟S2設(shè)計(jì)的非對稱卷積AC單元嵌入Res2Net模塊構(gòu)建具有粒度級別多尺度特性的非對稱卷積ACB模塊;
步驟S4:將步驟S3設(shè)計(jì)的ACB模塊嵌入輕量化模型ShuffleNetV2中構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)的車輛目標(biāo)分類網(wǎng)絡(luò)ACBNet;
步驟S5:利用所制作的車輛目標(biāo)訓(xùn)練集訓(xùn)練車輛目標(biāo)分類網(wǎng)絡(luò)ACBNet;
步驟S6:將測試集圖片放入步驟S5訓(xùn)練好的分類網(wǎng)絡(luò)ACBNet進(jìn)行分類,之后再經(jīng)過具有通道和空間注意力的殘差預(yù)測模塊處理獲得所預(yù)測圖像或視頻中車輛的類別和位置信息并框出車輛目標(biāo)。
進(jìn)一步的,步驟S2具體為:一個(gè)AC單元由卷積核為1×3和1×3、1×3、3×1三個(gè)平行分支組成,對于AC單元中的一個(gè)分支,表示卷積層的輸入,使用F=[g1,g1,...,gc]表示學(xué)習(xí)的卷積核集,其中g(shù)c表示對應(yīng)的第c個(gè)卷積核的參數(shù),表示卷積層的輸出,H、W、C分別表示輸出特征圖的高度、寬度、通道數(shù),對于該層的第c個(gè)濾波器,對應(yīng)的輸出特征圖通道為:
其中,*表示卷積,U=[V1,V2,...,VC],I=[Y1,Y2,...,YD]和表示gc的單個(gè)通道的二維空間核,Vc表示U的第c個(gè)輸出特征圖通道,Ys表示I的第s個(gè)輸入特征圖通道;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海應(yīng)用技術(shù)大學(xué),未經(jīng)上海應(yīng)用技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010042002.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





