[發(fā)明專利]一種基于輕量化網(wǎng)絡(luò)的目標(biāo)檢測方法在審
| 申請?zhí)枺?/td> | 202010401071.8 | 申請日: | 2020-05-13 |
| 公開(公告)號: | CN111666980A | 公開(公告)日: | 2020-09-15 |
| 發(fā)明(設(shè)計(jì))人: | 高戈;李瑩;尚瀟雯;李明;陳怡;杜能 | 申請(專利權(quán))人: | 武漢大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 武漢科皓知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 | 代理人: | 王琪 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 量化 網(wǎng)絡(luò) 目標(biāo) 檢測 方法 | ||
本申請?zhí)峁┮环N基于輕量化網(wǎng)絡(luò)的目標(biāo)檢測方法,首先獲取待檢測圖像,并根據(jù)卷積神經(jīng)網(wǎng)絡(luò)得到目標(biāo)處理值,所述目標(biāo)處理值包括所述待檢測圖像的分辨率、所述卷積神經(jīng)網(wǎng)絡(luò)的深度以及寬度;根據(jù)所述目標(biāo)處理值,進(jìn)行復(fù)合優(yōu)化處理,得到所述卷積神經(jīng)網(wǎng)絡(luò)的最大精確度(ACC)和浮點(diǎn)運(yùn)算速率(FLOPS);將所述最大精確度(ACC)和浮點(diǎn)預(yù)設(shè)運(yùn)算速率(FLOPS)進(jìn)行優(yōu)化處理,得到目標(biāo)優(yōu)化值,所述目標(biāo)優(yōu)化值用于衡量所述卷積神經(jīng)網(wǎng)絡(luò)中的基礎(chǔ)網(wǎng)絡(luò)的檢測效率;最后利用優(yōu)化后的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)待檢測圖像的目標(biāo)檢測。本發(fā)明的有益效果:平衡卷積神經(jīng)網(wǎng)絡(luò)中的網(wǎng)絡(luò)深度、網(wǎng)絡(luò)寬度和網(wǎng)絡(luò)分辨率,使得本案的目標(biāo)提取方法輸出的圖片分辨率高且效率高。
技術(shù)領(lǐng)域
本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及無人駕駛、輔助駕駛等計(jì)算機(jī)視覺領(lǐng)域中有效的目標(biāo)檢測方法,特別是涉及一種基于輕量化神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法。
背景技術(shù)
物體檢測是指利用計(jì)算機(jī)技術(shù)檢測與識別出圖像或視頻中感興趣目標(biāo)(如車輛、行人、障礙物等)的類別與位置信息,是計(jì)算機(jī)視覺領(lǐng)域中重要研究領(lǐng)域之一。隨著深度學(xué)習(xí)技術(shù)的不斷完善與發(fā)展,基于深度學(xué)習(xí)的物體檢測技術(shù)已經(jīng)在諸多現(xiàn)實(shí)領(lǐng)域中具有廣泛的應(yīng)用場景,例如:無人駕駛、輔助駕駛、人臉識別、無人安防、人機(jī)交互、行為識別等相關(guān)領(lǐng)域中。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN,有時(shí)也稱為ConvNet)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks),是深度學(xué)習(xí) (deep learning)的代表算法之一。作為深度學(xué)習(xí)技術(shù)中的重要研究方向之一,深度卷積神經(jīng)網(wǎng)絡(luò)在物體檢測任務(wù)上已經(jīng)取得了顯著成果,能夠在圖像數(shù)據(jù)中實(shí)現(xiàn)對感興趣目標(biāo)的實(shí)時(shí)檢測與識別。
目前現(xiàn)有的技術(shù)就是改變卷積神經(jīng)網(wǎng)絡(luò)的參數(shù),目前通用的幾種方法是放大卷積神經(jīng)網(wǎng)絡(luò)的深度、寬度以及分辨率,在現(xiàn)有技術(shù)的放大卷積網(wǎng)絡(luò)的方法,常用手段就是單獨(dú)放大這三個(gè)維度中的一個(gè),盡管任意放大兩個(gè)或者三個(gè)維度也是可能的,但是任意縮放需要繁瑣的人工調(diào)參,同時(shí)可能產(chǎn)生的是一個(gè)次優(yōu)的精度和效率,使得最后輸出圖像的精度和識別效率并沒有達(dá)到理想的值,例如導(dǎo)致目標(biāo)識別率降低;與此同時(shí),由于識別網(wǎng)絡(luò)框架的限制,反而會造成目標(biāo)檢測的識別效率降低的問題。例如,現(xiàn)有技術(shù)的技術(shù)采取了模型縮放的方法提高目標(biāo)檢測的精度:如縮放CNN神經(jīng)網(wǎng)絡(luò)以適應(yīng)不同的資源約束;再或者ResNet[4]通過調(diào)整網(wǎng)絡(luò)深度(層)來縮小(例如ResNet-18)或增大(例如ResNet-200);再或者WideResNet[5]、 MobileNets[6]通過網(wǎng)絡(luò)寬度(頻道)來縮放CNN來提高識別圖像的識別率。
下面就對三個(gè)維度單獨(dú)縮放進(jìn)行解釋現(xiàn)有技術(shù)中存在的技術(shù)的缺陷:
(1)加深深度(d):加深神經(jīng)網(wǎng)絡(luò)深度是許多ConvNets最常用的方法。最根本的原因是:更深層的ConvNet可以獲取輸入圖像中更多的的特征信息,并在新的輸入圖像中更好地進(jìn)行分類概括。請參見圖1,然而,隨著深度的提升,其網(wǎng)絡(luò)對應(yīng)的梯度消失,且更深層的網(wǎng)絡(luò)也更難訓(xùn)練。盡管目前技術(shù)通過采用較深網(wǎng)絡(luò)來緩解了其訓(xùn)練困難的問題:例如,ResNet-1000(ResNet網(wǎng)絡(luò)第1000層)和ResNet-101相比,具有更深的深度,但是檢測精度相似。圖1顯示了不同深度系數(shù)d縮放網(wǎng)絡(luò)基礎(chǔ)模型的經(jīng)驗(yàn)研究,進(jìn)一步表明了較深的網(wǎng)絡(luò)的精度的增長速度遞減。
(2)增加寬度(w):縮放網(wǎng)絡(luò)寬度通常適用用于小型模型,更寬廣的的網(wǎng)絡(luò)往往能夠獲得更多其輸入圖像的特征信息等特性,并且寬度更大的網(wǎng)絡(luò)更容易訓(xùn)練。然而,較寬但較淺的網(wǎng)絡(luò)往往難以捕獲更高層次的特征。圖2的結(jié)果表明,當(dāng)網(wǎng)絡(luò)變得更寬且w更大時(shí),其檢測精度達(dá)到一定時(shí),無法提升至最優(yōu),導(dǎo)致其可調(diào)優(yōu)精度有限。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學(xué),未經(jīng)武漢大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010401071.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





