[發明專利]一種基于YOLOv4的輕量級機場場面監視方法在審
| 申請號: | 202211087915.1 | 申請日: | 2022-09-05 |
| 公開(公告)號: | CN115457465A | 公開(公告)日: | 2022-12-09 |
| 發明(設計)人: | 李言章;張建偉;鐘磊;李泓遐;李瑩;胡小琴 | 申請(專利權)人: | 新疆海納同創智能科技有限公司 |
| 主分類號: | G06V20/52 | 分類號: | G06V20/52;G06V20/40;G06V10/40;G06V10/82;G06V10/80;G06V10/762;G06N3/04;G06N3/08;H04N7/18 |
| 代理公司: | 常州市江海陽光知識產權代理有限公司 32214 | 代理人: | 陳曉君 |
| 地址: | 834000 新疆維吾爾自治區克*** | 國省代碼: | 新疆;65 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 yolov4 輕量級 機場 場面 監視 方法 | ||
1.一種基于YOLOv4的輕量級機場場面監視方法,其特征在于包括以下步驟:
步驟①:采集機場場面監控攝像頭拍攝的監控視頻,并對監控視頻按關鍵幀截取的方式,將每一幀保存為圖片,然后利用開源軟件LabelImg對保存的圖片進行標注,標注包括了目標位置信息和類別信息,其中類別信息包括三類:airplane、man、car,從而構建機場場面數據集;
步驟②:采用YOLOv4算法作為基礎的目標檢測模型,之后使用以下3個改進模塊來構建IEN-YOLO檢測模型:(1)使用輕量級EfficientNet網絡作為骨干特征提取網絡,并在骨干網絡中使用ECA注意力機制替換SE注意力機制;(2)在YOLOv4算法中加入2倍的反卷積上采樣和加權特征融合結構;(3)在YOLOv4算法中加入一層高分辨率檢測層;在YOLOv4算法基礎上加入以上三個不同改進模塊之后得到IEN-YOLO檢測模型,實現對機場場面上的飛機即airplane、人員即man和車輛即car的檢測識別;
步驟③:利用構建好的機場場面數據集并以數據集中標注框的IoU為聚類指標來計算出IEN-YOLO檢測模型需要預先設計的anchor框參數;
步驟④:利用構建好的機場場面數據集并結合小目標數據增強策略來對IEN-YOLO檢測模型進行訓練,通過訓練得到最優的權值參數,之后用最優的權值參數來構建最終的IEN-YOLO機場場面檢測模型;
步驟⑤:利用構建好的IEN-YOLO機場場面檢測模型來檢測識別輸入的機場場面監控圖像中的所有目標,包括了各個目標的位置信息和類別分數信息,最后使用Soft-NMS算法對得到檢測框進行重疊問題處理,從而得到最終的檢測識別結果。
2.根據權利要求1所述的一種基于YOLOv4的輕量級機場場面監視方法,其特征在于:在步驟②中使用輕量級的EfficientNet網絡替換YOLOv4模型原有的CSPDarknet53骨干網絡,EfficientNet網絡包括了8個模塊,第一個模塊為3x3的卷積模塊,其余7個模塊為MBConv模塊,每個MBConv模塊基本組成單位為:深度可分離卷積層、Switch激活函數、SE注意力機制和殘差連接。
3.根據權利要求2所述的一種基于YOLOv4的輕量級機場場面監視方法,其特征在于:在步驟②中使用更加輕量且對小目標檢測效果更好的ECA注意力替換原始EfficientNet網絡中的SE注意力機制,從而得到改進的EfficientNet網絡;ECA注意力機制使用了大小為K的1D自適應卷積操作和不降維的特征提取操作來提高特征提取能力并降低模型的計算量;ECA注意力機制首先將輸入特征F進行全局平均池化Avgpool,然后使用卷積核大小為K的1D卷積操作Convk得到注意力權重,然后將注意力權重與輸入特征F相乘得到新特征F’,ECA注意力機制表達式如下:
F′=F*Sigmoid(Convk(Avgpool(F)))
式中F′為最終輸出的特征,F為輸入特征,Convk代表大小為K的1D卷積操作,Avgpool表示平均池化操作。
4.根據權利要求3所述的一種基于YOLOv4的輕量級機場場面監視方法,其特征在于:在步驟②中,在原始YOLOv4模型的基礎上加入2倍的反卷積上采樣和加權特征融合模塊來強化網絡的特征提取能力;加權特征融合模塊通過在特征融合過程中引入一個可學習的權重值w,之后將權重值w與待融合特征L進行相乘得到調整后的特征L’,從而來動態調整不同特征的重要性,表達式如下:
L’=w*L
式中L’表示經過權重調整之后的特征,w表示引入的權重值,L表示待融合特征。
5.根據權利要求4所述的一種基于YOLOv4的輕量級機場場面監視方法,其特征在于:在步驟②中,在原始YOLOv4模型的基礎上加入了一層高分辨率檢測層來提高模型對機場場面上小目標的檢測能力,對于使用608x320輸入分辨率的模型,在原始YOLOv4算法的基礎上增加一層152x80分辨率的檢測特征層,最后總計使用4個檢測特征層進行檢測,包括了分辨率為152x80、76x40、38x20、19x10的4個檢測層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新疆海納同創智能科技有限公司,未經新疆海納同創智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211087915.1/1.html,轉載請聲明來源鉆瓜專利網。





