[發(fā)明專利]一種基于YOLO的Compress-YOLO模型壓縮方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910062805.1 | 申請(qǐng)日: | 2019-01-23 |
| 公開(kāi)(公告)號(hào): | CN109816097B | 公開(kāi)(公告)日: | 2022-12-09 |
| 發(fā)明(設(shè)計(jì))人: | 顏云輝;王森;宋克臣;趙凱歌 | 申請(qǐng)(專利權(quán))人: | 東北大學(xué) |
| 主分類號(hào): | G06N3/04 | 分類號(hào): | G06N3/04;G06N3/08 |
| 代理公司: | 沈陽(yáng)東大知識(shí)產(chǎn)權(quán)代理有限公司 21109 | 代理人: | 李在川 |
| 地址: | 110819 遼寧*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 yolo compress 模型 壓縮 方法 | ||
本發(fā)明提供了一種基于YOLO的Compress?YOLO模型壓縮方法,包括設(shè)計(jì)Compress?YOLO神經(jīng)網(wǎng)絡(luò)特征提取部分、使用GoogLeNet的特征提取部分對(duì)輸入圖像進(jìn)行特征提取、使用Compress?YOLO模型中的兩層全卷積層取代YOLO中的兩層全連接層、使用一層卷積層對(duì)bounding box進(jìn)行回歸、通過(guò)reshape層對(duì)輸出維度進(jìn)行調(diào)整,使得輸出維度和YOLO的輸出維度相同以及選擇PASCAL VOC 2012數(shù)據(jù)集對(duì)設(shè)計(jì)的Compress?YOLO神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練;針對(duì)訓(xùn)練中出現(xiàn)的過(guò)擬合現(xiàn)象,采用Batch Normaliztion層和Scale層組合的方法。本發(fā)明提供的基于YOLO的Compress?YOLO模型壓縮方法,可以在盡量保證模型性能的同時(shí)可以將深度學(xué)習(xí)部署到嵌入式設(shè)備上,且更加密集、計(jì)算量更小,提高了網(wǎng)絡(luò)的性能。
技術(shù)領(lǐng)域
本發(fā)明涉及神經(jīng)網(wǎng)絡(luò)模型壓縮技術(shù)領(lǐng)域,尤其涉及一種基于YOLO的Compress-YOLO的模型壓縮方法。
背景技術(shù)
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)具有識(shí)別種類多,準(zhǔn)確率高,魯棒性好等優(yōu)點(diǎn)。在同樣的識(shí)別場(chǎng)景下,使用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)識(shí)別可以有效抵抗顏色、紋理、光照等干擾條件。因此,基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的目標(biāo)識(shí)別方法更多的應(yīng)用于對(duì)多種目標(biāo)的識(shí)別過(guò)程中。
雖然深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)有著諸多的優(yōu)點(diǎn),但其計(jì)算量非常大,因此對(duì)硬件的要求非常高,這也極大的限制了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在性能有限的硬件上的部署,因此對(duì)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行壓縮是解決該問(wèn)題的有效途徑。
現(xiàn)有的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型壓縮方法更多的集中于對(duì)網(wǎng)絡(luò)進(jìn)行剪枝,但該方法在非特制硬件上的加速效果十分有限。
綜上,需要設(shè)計(jì)一個(gè)更加緊湊的模型,使得在保證深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)準(zhǔn)確率的基礎(chǔ)上對(duì)YOLO進(jìn)行壓縮,使得Compress-YOLO可以在計(jì)算性能有限的嵌入式設(shè)備上運(yùn)行。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)的不足,本發(fā)明提供為了一種基于YOLO的Compress-YOLO模型壓縮方法,包括:
步驟1、設(shè)計(jì)Compress-YOLO神經(jīng)網(wǎng)絡(luò)特征提取部分,YOLO(YouOnlyLookOnce深度學(xué)習(xí)模型)的輸入尺寸固定為448×448,當(dāng)識(shí)別種類為A種,每個(gè)網(wǎng)格預(yù)測(cè)兩個(gè)種類時(shí),輸出維度為B;
1.1安裝和配置Caffe框架(深度學(xué)習(xí)框架),添加Caffe路徑到系統(tǒng)環(huán)境。
1.2對(duì)Caffe框架的數(shù)據(jù)層進(jìn)行修改,添加YOLO-Data層(數(shù)據(jù)層),在該層中添加side成員,將輸入的圖片劃分為7×7的網(wǎng)格。
1.3將輸入圖片尺寸調(diào)整到448×448大小,獲得列表、標(biāo)簽數(shù)據(jù),并將圖片數(shù)據(jù)轉(zhuǎn)化為L(zhǎng)MDB格式,輸出維度即為B。
步驟2、使用GoogLeNet(深度學(xué)習(xí)結(jié)構(gòu))的特征提取部分對(duì)輸入圖像進(jìn)行特征提取,使用GoogLeNet將提取出特征的第一個(gè)卷積層到inception(5b)(GoogleNet網(wǎng)絡(luò)結(jié)構(gòu)中的一個(gè)網(wǎng)絡(luò)層)部分取代原始YOLO中的12組3×3和1×1的卷積層,每組包括一個(gè)3×3和一個(gè)1×1的卷積層;
步驟3、成對(duì)使用卷積神經(jīng)網(wǎng)絡(luò)中補(bǔ)充使用的實(shí)用化層:Batch Normalization層和Scale層,并添加池化層。
步驟4、使用Compress-YOLO模型中的兩層全卷積層取代YOLO中的兩層全連接層,一層預(yù)測(cè)目標(biāo)的種類,一層預(yù)測(cè)boundingbox(目標(biāo)邊框)的坐標(biāo);
步驟5、使用一層卷積層對(duì)boundingbox進(jìn)行回歸;
步驟6、通過(guò)reshape層(深度學(xué)習(xí)框架Caffe中的reshape層)使得輸出維度和YOLO的輸出維度B相同;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學(xué),未經(jīng)東北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910062805.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于FPGA的Tiny-yolo卷積神經(jīng)網(wǎng)絡(luò)硬件加速方法及系統(tǒng)
- 一種基于YOLO的Compress-YOLO模型壓縮方法
- 一種面向計(jì)算資源局限平臺(tái)部署的實(shí)時(shí)目標(biāo)檢測(cè)的方法
- 一種用于星上對(duì)艦船目標(biāo)檢測(cè)的Tiny-YOLO網(wǎng)絡(luò)的優(yōu)化方法
- 一種基于改進(jìn)YOLO v3模型的行人檢測(cè)方法
- 一種基于改進(jìn)YOLO v4算法的目標(biāo)檢測(cè)方法
- 一種YOLO脈沖神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法
- 圖像識(shí)別方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及處理器
- 一種船只檢測(cè)方法和裝置
- YOLO神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、行人檢測(cè)方法和相關(guān)設(shè)備
- 核殼式無(wú)機(jī)聚合物復(fù)合材料及其制造方法
- 一種基于Linux系統(tǒng)下的自動(dòng)部署Oracle rac環(huán)境的方法
- 處理倒排索引的可搜索對(duì)稱加密系統(tǒng)和方法
- COMPRESS指令譯碼方法、數(shù)據(jù)處理方法、譯碼器及數(shù)據(jù)處理裝置
- 一種基于YOLO的Compress-YOLO模型壓縮方法
- 一種將IPv6應(yīng)用于IEEE802.15.4標(biāo)準(zhǔn)物聯(lián)網(wǎng)的方法
- 一種基于格的高效緊湊加密方法
- 一種深度Transformer級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)模型壓縮算法
- 水箱排水系統(tǒng)及降溫系統(tǒng)
- 一種基于差分隱私的模式保護(hù)動(dòng)態(tài)可搜索加密方法





