[發明專利]一種基于YOLO網絡壓縮算法的安全帽識別智能監控系統有效
| 申請號: | 202110661602.1 | 申請日: | 2021-06-15 |
| 公開(公告)號: | CN113449611B | 公開(公告)日: | 2023-07-07 |
| 發明(設計)人: | 曾偉;汪韋怡;黃祥 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V20/52;G06V10/774;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 電子科技大學專利中心 51203 | 代理人: | 周劉英 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 yolo 網絡 壓縮 算法 安全帽 識別 智能 監控 系統 | ||
本發明公開了一種基于YOLO網絡壓縮算法的安全帽識別智能監控系統,屬于計算機視覺和數字圖像處理技術領域,本發明提供的監控系統包括獲取訓練數據的數據處理模塊、設置及網絡結構及訓練網絡參數的特征提取與預測模塊、對所設置的網絡模型的全連接層進行壓縮處理的網絡壓縮模塊和結果檢測模塊,本發明采用YOLO網絡,降低背景誤檢率低,同時可以直接優化性能檢測,提高準確率;以及直接對錨框進行回歸和分類,加快了運行速度,實現了實時處理視頻,以及可以學到物體更泛化的特征表示,更能適應新的領域,泛化能力高,可高度可推廣。本發明能用于對施工區域工作人員是否佩戴安全帽的智能監控。
技術領域
本發明屬于計算機視覺和數字圖像處理技術領域,具體涉及一種基于目標檢測網絡YOLO(You?Only?Look?Once)進行網絡壓縮實現對施工區域工作人員是否佩戴安全帽的監控系統。
背景技術
目標檢測是計算機視覺和數字圖像處理經久不衰的一個研究方向,廣泛應用于機器人導航、智能視頻監控、工業檢測、航空航天等諸多領域。由于計算機收到這些RGB像素矩陣,不會直接得到目標(如行人、車輛等)的抽象概念,更不能定位其位置,再加上目標形態千差萬別,目標和背景重合等問題,使得目標檢測難上加難。此外,由于視頻中的目標具有不同姿態且經常出現遮擋、其運動具有不規則性,同時考慮到監控視頻的景深、分辨率、天氣、光照等條件和場景的多樣性,而且目標檢測算法的結果將直接影響后續的跟蹤、動作識別和行為描述的效果。因此,通過計算機視覺提高物體檢測的準確性和減少對人力資本的消耗,具有重要的現實意義,目標檢測也就成為了近年來理論和應用的研究熱點,它是視頻智能監控系統的核心部分,對后續的各種識別任務起著至關重要的作用。
自從深度神經網絡算法首次在ImageNet數據集上大放異彩后,目標檢測算法得到了較為快速的發展,通過利用多層計算模型來學習抽象的數據表示,能夠發現大數據中的復雜結構。其中目標檢測網絡YOLO中的YOLOv1是一種基于深度神經網絡的對象識別和定位算法,它采用一個CNN網絡來實現檢測,是一種單管道策略,其訓練與預測都是端到端(end-to-end),所以YOLOv1算法比較簡潔且速度快。此外,由于Yolo是對整張圖片做卷積,所以其在檢測目標有更大的視野,它不容易對背景誤判且泛化能力強,在做遷移時,模型魯棒性高。但當大規模數據訓練獲得的深度網絡模型大且計算量也大,這就需要優良的硬件的計算資源和內存條件,然而在實際的實時系統應用中這往往很難實現。
發明內容
本發明的發明目的在于:針對上述存在的問題,提供一種基于YOLO網絡壓縮算法的安全帽識別智能監控系統,實現對施工人員安全帽是否佩戴的動態監控,為施工現場的安全提供保障。
為實現上述發明目的,本發明提供的基于YOLO網絡壓縮算法的安全帽識別智能監控系統,包括:
數據處理模塊,用于獲取訓練數據集,即通過對輸入圖像進行多種數據預處理,得到訓練數據集,數據處理模塊可以增加網絡的訓練樣本,從而增加目標,以提升系統的性能;
特征提取和預測模塊:用于設置對圖像進行特征提取和目標識別的網絡模型,所述網絡模型為基于YOLO網絡的網絡模型;
網絡壓縮模塊:用于對特征提取和預測模塊中的網絡模型的全連接層進行壓縮處理,并觸發特征提取和預測模塊從數據處理模塊讀取訓練數據對壓縮處理后的網絡模型進行模型參數學習訓練,以及保存訓練好的網絡模型;
結果檢測模塊:將待識別圖像輸入到特征提取和預測模塊中訓練好的網絡模型,基于特征提取和預測模塊返回的前向傳播輸出,得到目標對象的預測錨框的位置和類別;并采用非極大值抑制處理對得到的預測錨框進行去冗余處理,得到當前待識別圖像的識別結果并輸出顯示。
進一步的,網絡模型的特征提取網絡為YOLO網絡的前20個卷積層結構,特征提取網絡之后順次連接4個卷積層和2個全連接層構成目標識別支路,最后一層全連接層采用了一層Dropout,且最后一層全連接層采用線性激活函數,網絡模型中其它層涉及的激活函數均采用Leaky?Relu激活函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110661602.1/2.html,轉載請聲明來源鉆瓜專利網。





