[發(fā)明專利]一種基于多尺度輕量化主干網(wǎng)絡(luò)的特征提取方法在審
| 申請(qǐng)?zhí)枺?/td> | 202310492350.3 | 申請(qǐng)日: | 2023-05-05 |
| 公開(公告)號(hào): | CN116563558A | 公開(公告)日: | 2023-08-08 |
| 發(fā)明(設(shè)計(jì))人: | 沈志熙;李俊北;張洪田;吳玥;金其堅(jiān) | 申請(qǐng)(專利權(quán))人: | 重慶大學(xué) |
| 主分類號(hào): | G06V10/40 | 分類號(hào): | G06V10/40;G06V10/774;G06V10/82;G06V10/80;G06V10/77;G06V20/10;G06N3/0464;G06N3/08 |
| 代理公司: | 重慶晟軒知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 50238 | 代理人: | 王海鳳 |
| 地址: | 400044 *** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 尺度 量化 主干 網(wǎng)絡(luò) 特征 提取 方法 | ||
本發(fā)明涉及一種基于多尺度輕量化主干網(wǎng)絡(luò)的特征提取方法,包括如下步驟:獲取圖片,并對(duì)圖片進(jìn)行預(yù)處理,經(jīng)過(guò)預(yù)處理后的一張圖片為一個(gè)訓(xùn)練樣本;構(gòu)建MSL_backbone模型,將訓(xùn)練樣本輸入MSL_backbone對(duì)其進(jìn)行訓(xùn)練,待最優(yōu)收斂后保存模型參數(shù)得最優(yōu)MSL_backbone;調(diào)用最優(yōu)MSL_backbone,輸入待測(cè)數(shù)據(jù)得到結(jié)果并通過(guò)提取網(wǎng)絡(luò)的最后一個(gè)特征圖輸出。本發(fā)明方法提升了對(duì)多尺度特征的提取能力,與原先方法模型相比有著0.35%的精度提升。
技術(shù)領(lǐng)域
本發(fā)明涉及道路場(chǎng)景目標(biāo)檢測(cè)技術(shù)領(lǐng)域,特別涉及一種基于多尺度輕量化主干特征提取網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法。
背景技術(shù)
道路場(chǎng)景目標(biāo)檢測(cè)是指在道路場(chǎng)景中,通過(guò)計(jì)算機(jī)視覺(jué)技術(shù),識(shí)別并提取出各種交通標(biāo)志、交通工具、行人等目標(biāo)。該技術(shù)被廣泛應(yīng)用于智能交通、自動(dòng)駕駛等領(lǐng)域。在進(jìn)行道路場(chǎng)景目標(biāo)檢測(cè)時(shí),需要對(duì)圖像進(jìn)行背景分析,即從圖像中分離出背景和前景信息,以便更準(zhǔn)確地對(duì)前景目標(biāo)進(jìn)行識(shí)別。
傳統(tǒng)的目標(biāo)檢測(cè)方法應(yīng)用于道路場(chǎng)景中,因其存在魯棒性差,計(jì)算量大,實(shí)時(shí)性不高等問(wèn)題沒(méi)有被人們所使用。雖然目前流行的幾種目標(biāo)檢測(cè)方法應(yīng)用于道路場(chǎng)景中會(huì)得到比較不錯(cuò)的精度,但是對(duì)檢測(cè)結(jié)果仔細(xì)分析研究發(fā)現(xiàn),小尺度目標(biāo)檢測(cè)效果差,導(dǎo)致整體的檢測(cè)精度沒(méi)有辦法繼續(xù)提高。
另外在道路場(chǎng)景中存在著目標(biāo)的尺度大小以及種類不一致的問(wèn)題,例如汽車的尺度比較大而行人,自行車的尺度比較小。而且除了目標(biāo)本身具有的尺度不同之外,當(dāng)目標(biāo)距離攝像頭的距離不一樣也會(huì)導(dǎo)致這個(gè)目標(biāo)的尺度發(fā)生變化。所以在同一道路場(chǎng)景下,同一類目標(biāo)距離攝像頭的遠(yuǎn)近不一樣,也會(huì)導(dǎo)致其尺度不一樣同時(shí)特征也有較大的差異。這種尺度不一致的問(wèn)題對(duì)目標(biāo)檢測(cè)方法的性能有著更高的挑戰(zhàn)。而且通過(guò)觀察攝像頭采集的圖片可以發(fā)現(xiàn),在同一場(chǎng)景中,車輛類別的目標(biāo)出現(xiàn)的頻率很高,反觀行人和其他類別的目標(biāo)出現(xiàn)的頻率要低很多。這種道路場(chǎng)景中目標(biāo)類別數(shù)量不均衡的問(wèn)題,也會(huì)影響到目標(biāo)檢測(cè)方法的精度。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)存在的上述問(wèn)題,本發(fā)明的要解決的技術(shù)問(wèn)題是:提升方法模型對(duì)多尺度特征的提取能力。
為解決上述技術(shù)問(wèn)題,本發(fā)明采用如下技術(shù)方案:一種基于多尺度輕量化主干網(wǎng)絡(luò)的特征提取方法,包括如下步驟:
S1:獲取圖片,并對(duì)圖片進(jìn)行預(yù)處理,經(jīng)過(guò)預(yù)處理后的一張圖片為一個(gè)訓(xùn)練樣本;
S2:構(gòu)建MSL_backbone模型,所述MSL_backbone采用YOLOv5的主干特征提取網(wǎng)絡(luò)作為基礎(chǔ)模型,將基于通道重組的輕量化逆瓶頸殘差模塊shuffle_res2net_s與YOLOv5主干特征提取網(wǎng)絡(luò)中CSP_BottleNeck里的殘差結(jié)構(gòu)進(jìn)行替換;
S3:將訓(xùn)練樣本輸入MSL_backbone模型對(duì)其進(jìn)行訓(xùn)練,待最優(yōu)收斂后保存模型參數(shù)得最優(yōu)MSL_backbone;
S4:調(diào)用最優(yōu)MSL_backbone,輸入待測(cè)數(shù)據(jù)得到結(jié)果并通過(guò)提取網(wǎng)絡(luò)的最后一個(gè)特征圖輸出。
作為優(yōu)選,S1中預(yù)處理是指:將圖片resize截取為32×32,然后再進(jìn)行隨機(jī)翻轉(zhuǎn)得到多張圖片,再對(duì)多張圖片進(jìn)行Tensor轉(zhuǎn)換,將灰度范圍從0-255變換到0-1,最后圖片進(jìn)行標(biāo)準(zhǔn)化(Normalize)操作。
作為優(yōu)選,所述S2中基于通道重組的輕量化逆瓶頸殘差模塊包括:
所述shuffle_res2net_s的輸入特征圖為X∈RC×H×W,X表示輸入特征圖,C為輸入通道,H為特征圖高度,W為特征圖寬度;
經(jīng)過(guò)卷積核大小為1×1的卷積進(jìn)行通道上的升維改變,通道維度變成C′=C×W/64×S,得到特征圖為X′∈RC′×H×W,其中,X′表示經(jīng)過(guò)卷積操作后得出的特征圖,C′表示改變后的通道維度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶大學(xué),未經(jīng)重慶大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310492350.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。





