[發明專利]一種改進的YOLOv3候選框加權融合選取策略在審
| 申請號: | 202010550745.0 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111695638A | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 張紅;李建華;徐志剛;曹潔;任偉 | 申請(專利權)人: | 蘭州理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京勁創知識產權代理事務所(普通合伙) 11589 | 代理人: | 張鐵蘭 |
| 地址: | 730050 甘肅*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 改進 yolov3 候選 加權 融合 選取 策略 | ||
本發明公開了一種改進的YOLOv3候選框加權融合選取策略,屬于智能優化算法技術領域。本發明中算法五和算法六對比NMS改進算法,多個類別的單一查準率提高了0.9%~14.1%,多類別平均查準率提高了3.1%~6.5%。這兩種算法性能相當,并且對比傳統的算法均有明顯的優勢。本發明提出的算法五和算法六的曲線幾乎能重疊。本發明提出的候選框融合算法在查準率與查全率之間的博弈關系中,能在保證查全率的前提下將查準率大幅提升。本發明提出的候選框融合算法在單一類別平均檢測精確度AP值、多類別平均檢測精度mAP值、P?R曲線的綜合性能上完全超越了NMS改進算法,能更準確的完成目標檢測任務。
技術領域
本發明屬于智能優化算法技術領域,具體涉及一種改進的YOLOv3候選框加權融合選取策略。
背景技術
目標檢測是計算機視覺領域的熱門研究方向,廣泛應用于工業檢測、智能導航、視頻監控等諸多領域。隨著機器學習方法的研究,尤其是深度學習的興起,以Faster-RCNN、YOLO、SSD為首的一系列深度卷積神經網絡,在目標檢測方向上取得了較好的研究成果。相比于傳統的目標檢測方法,這些方法在檢測精度和速度上均有顯著提升。
目前,檢測焦點主要集中于神經網絡的結構改進,對于目標檢測算法的后處理階段缺乏合理的改進方法。由于現有性能最好的目標檢測算法往往是由幾十上百層的神經網絡結構組成,在算法結構上的改進需要很長的時間才能得到實驗結果。如果有一個整體的模塊能提升算法性能,并且不需要重新訓練網絡參數,那么這將大幅提升實驗效率,也將被廣泛應用。為此本發明將在神經網絡的后處理階段提出候選框融合算法以替代傳統的非極大值抑制算法。
基于神經網絡的目標檢測算法,在經過神經網絡處理后的圖像會生成成百上千個候選框以及對應的類別置信度,傳統的非極大值抑制算法是依據候選框之間的重疊度選擇出局部極大值候選框,抑制非極大值候選框,最后得到目標定位框。該算法對于密集目標的圖像容易將目標框誤判為非極大值候選框進行刪除。并且,只能處理神經網絡檢測出的已有候選框,當神經網絡檢測的候選框都不準確時,傳統的算法無法調整極大值候選框的位置。針對以上問題,本發明提出了候選框融合算法,旨在選擇相對最優候選框的同時通過冗余框的復用和融合將其調整為一個絕對最優的候選框,用以解決神經網絡檢測效果不佳的問題。
發明內容
本發明的目的在于提供一種用以解決神經網絡檢測效果不佳的改進的YOLOv3候選框加權融合選取策略。
一種改進的YOLOv3候選框加權融合選取策略,包括如下步驟:
1)將候選框按類別分組,取每個類別中局部極大值候選框記作Bk=[x1,y1,x2,y2]及其置信度記作s,其中[x1,y1]和[x2,y2]分別表示候選框的左上角及右下角坐標;
2)取與極大值候選框重疊度大于預定閾值Nt的n個冗余框集合記作C={C1,C2,..,Ci,..,Cn}及其相對應的類別置信度集合記作S={s1,s2,..,si,..,sn},計算出每個候選框的融合權值;
3)將YOLOv3模型與傳統NMS算法結合,通過在COCO數據集上訓練,預置初始學習率和衰減系數,采用Adam使神經網絡達到收斂,通過將訓練數據集圖像旋轉或增強對比度兩種方式擴充訓練集數量;
4)將各個算法單獨與YOLOv3模型結合運行,通過在COCO驗證集上調整參數尋找到使其檢測精度參數值。
進一步地,所述C1=[x1,y1,x2,y2]。
進一步地,所述初始學習率和衰減系數分別為0.001和0.0005。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘭州理工大學,未經蘭州理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010550745.0/2.html,轉載請聲明來源鉆瓜專利網。





