[發明專利]一種基于深度學習的目標檢測YOLOv3的模型優化算法在審
| 申請號: | 202010568883.1 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN112001477A | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 李宋順;周俊瑋;杜振華;華宇浩;王建宇;湯徐星;何新 | 申請(專利權)人: | 南京理工大學;江蘇慧宇誠智能裝備研究院有限公司;南京榮新智能科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京勁創知識產權代理事務所(普通合伙) 11589 | 代理人: | 張鐵蘭 |
| 地址: | 210000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 目標 檢測 yolov3 模型 優化 算法 | ||
本發明公開了一種基于深度學習的目標檢測YOLOv3的模型優化算法,包括:采用K?means++聚類算法重新設置合適商品數據集的Anchor box;對目標檢測YOLOv3的模型進行一般訓練和稀疏化訓練;將YOLOv3稀疏化后的最終模型作為基準,疊加使用通道剪枝和層剪枝進行雙重剪枝,修剪不重要的特征通道和層;對剪枝后的模型進行微調,根據mAP曲線圖取較好效果的值,對得到的值再次進行評估。本發明提供的基于深度學習的目標檢測YOLOv3的模型優化算法,通過K?means++改善算法的聚類效果;采用層剪枝和通道剪枝相結合的雙重剪枝來進行網絡剪枝,以提高算法的性能。
技術領域
本發明涉及目標檢測算法技術領域,特別是涉及一種基于深度學習的目標檢測YOLOv3的模型優化算法。
背景技術
傳統的目標檢測算法可以分為區域選擇、特征提取和分類器分類三步,通過人工選擇圖像特征進行特征提取,特征單一且魯棒性較差。卷積神經網絡的出現改變了這種現狀,它能夠不依賴于人工提取特征,在圖像分類領域有重大突破之后一直蓬勃發展,目前基于深度學習的目標檢測算法已經成為目標檢測研究的主流。
近年來,基于回歸的YOLO、SSD等深度學習目標檢測算法的誕生迅速占領了目標檢測研究“市場”,它們降低了模型計算量的同時保持較高的精度。基于回歸的YOLO深度學習目標檢測算法的優點是在保持較高識別精度基礎上,維持較低的參數量和計算量,以保持其快速性。其中,YOLOv3執行目標檢測任務,兼備快速性和準確性,但在實際應用中的卷積神經網絡系列模型的部署受限,原因有三:
第一,模型過大,CNN強大的表示能力來自其數百萬個可訓練的參數。這些參數以及網絡結構信息需要在推理期間存儲在磁盤上并加載到內存中,例如,存儲經過COCO數據集訓練的YOLOv3模型會消耗200MB以上的空間,這對設備來說是很大的資源負擔,尤其是嵌入式等移動設備;
第二,占用運行時內存過多,在前向推理中,CNN的激活層可能比存儲模型參數占用更多內存空間,不同于GPU,計算能力低的CPU設備負擔過重;
第三,計算量過大,卷積操作在高分辨率圖像上的計算量很大,大型的CNN可能需要幾分鐘才能在移動設備上處理單個圖像,因此,在實際應用中采用它會因為設備受到很大局限,針對以上面臨的問題,可以從縮小模型尺寸,減少運行時內存占用和在不影響準確性的情況下減少計算量出發尋找解決方案。
發明內容
本發明的目的是提供一種基于深度學習的目標檢測YOLOv3的模型優化算法,設計了一種精簡卷積神經網絡結構的改進算法,以提高算法的性能。
為實現上述目的,本發明提供了如下方案:
一種基于深度學習的目標檢測YOLOv3的模型優化算法,該算法包括以下步驟:
S1,采用K-means++聚類算法重新設置合適商品數據集的Anchor box;
S2,進行一般訓練:設定YOLOv3的Darknet-53網絡結構,載入數據集圖片、標簽和權重參數,進行前向推理,利用loss值反向求導更新權重參數,迭代一定次數,結束訓練,挑選最終模型;
S3,進行稀疏化訓練:對YOLOv3進行200個epoch的稀疏訓練,其中使用懲罰因子值為0.001,稀疏訓練的其余超參數與正常訓練相同;
S4,將YOLOv3稀疏化后的最終模型作為基準,疊加使用通道剪枝和層剪枝進行雙重剪枝,修剪不重要的特征通道和層;
S5,對剪枝后的模型進行微調,根據mAP曲線圖取較好效果的值,對得到的值再次進行評估,如果滿足優化要求,則結束優化過程,如果不滿足,則需重復步驟S1-S4進一步優化,直到滿足要求。
可選的,所述步驟S1中,采用K-means++聚類算法重新設置合適商品數據集的Anchor box,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學;江蘇慧宇誠智能裝備研究院有限公司;南京榮新智能科技有限公司,未經南京理工大學;江蘇慧宇誠智能裝備研究院有限公司;南京榮新智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010568883.1/2.html,轉載請聲明來源鉆瓜專利網。





