[發明專利]基于改進YOLOV5模型的工地安全帽佩戴檢測方法在審
| 申請號: | 202210977122.0 | 申請日: | 2022-08-15 |
| 公開(公告)號: | CN115512387A | 公開(公告)日: | 2022-12-23 |
| 發明(設計)人: | 鄭狄;李晶;姚濤;閆連山;蒲桂東 | 申請(專利權)人: | 艾迪恩(山東)科技有限公司;西南交通大學煙臺新一代信息技術研究院 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/774;G06V10/80;G06V10/762;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 煙臺雙聯專利事務所(普通合伙) 37225 | 代理人: | 矯智蘭 |
| 地址: | 264000 山東省煙*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 改進 yolov5 模型 工地 安全帽 佩戴 檢測 方法 | ||
1.基于改進YOLOV5模型的工地安全帽佩戴檢測方法,其特征在于:
步驟1、收集并劃分數據集:
收集開源數據集SHWD、SHD及其他網絡圖片,制作所需數據集,將數據集劃分為訓練集、驗證集和測試集;
步驟2、對YOLOV5目標檢測模型進行改進:
通過在原始的YOLOV5目標檢測模型基礎上優化網路結構,得到改進后的YOLOV5模型;所述改進后的YOLOV5模型采用K-Means++聚類算法實時計算錨框,加速模型收斂;采用SwinTranformer Block作為Backbone高層語義提取網絡,增強模型上下文特征提取能力;添加小目標檢測層,降低網絡最小感受野;特征融合部分融入SPPF特征融合金字塔,通過多層次的空間箱從不同的角度進行特征提取再聚合,提升算法對物體變形的魯棒性;采用Bottleneck Transformer優化特征融合部分的卷積層,增強網絡特征融合能力;采用Shuffle Attention作為注意力機制更新特征矩陣,增強小目標特征表達能力;
步驟3、利用改進后的YOLOV5模型進行訓練:
將所述步驟1數據集中的訓練集送入改進后的YOLOV5模型進行訓練,并保存訓練過程中改進后的YOLOV5模型在驗證集上檢測準確率最高的權重參數,并將權重文件命名為best.pt;
步驟4、利用改進后的YOLOV5模型進行檢測:
加載步驟3所述權重文件best.pt至改進后的YOLOV5模型中,并將測試集圖像輸入改進后的YOLOV5模型,得到該模型在測試集上的檢測結果,檢測到的結果分為兩部分,包含施工場景下佩戴的安全帽與未佩戴安全帽的頭部。
2.根據權利要求1所述的基于改進YOLOV5模型的工地安全帽佩戴檢測方法,其特征在于,對于步驟1中的數據集為圖片及文本文件格式的錨框坐標,數據集類別分為安全帽和頭部兩類。
3.根據權利要求2所述的基于改進YOLOV5模型的工地安全帽佩戴檢測方法,其特征在于:
步驟2中,所述的添加小目標檢測層,是在原始的YOLOV5目標檢測模型的三個尺度輸出的基礎上添加降低感受野的檢測尺度,使改進后的YOLOV5模型在四種尺度上預測檢測目標的邊界框;在改進后的YOLOV5模型的檢測頭中,每個尺度都輸出一個三維預測張量;預測張量中的編碼信息包含:預測框的位置信息、待檢測目標的置信度、預測框中包含的目標類別;所述預測框中包含的目標類別分為佩戴的安全帽及未佩戴安全帽的頭部;
在改進后的YOLOV5模型的檢測部分中,對于尺度大小為N×N的特征圖,改進后的YOLOV5模型產生的預測張量大小為N×N×[4*(1+4+2)],其中第一個4代表改進后的YOLOV5模型有四個預測頭,對應四個尺度的張量,1代表置信度的預測,第二個4代表預測框位置信息,2代表目標類別為兩個類。
4.根據權利要求3所述的基于改進YOLOV5模型的工地安全帽佩戴檢測方法,其特征在于:
步驟2所述的Swin Transformer Block是基于滑動窗口機制新視覺網絡,其通過移位窗口將自注意力的計算限制在非重疊的局部窗口內,同時考慮跨窗口連接,通過相鄰窗口合并擴大窗口感受野,利用移位窗口劃分方法,Swin變換塊被計算為:
(1)
(2)
(3)
(4)
其中代表塊的W-MSA模塊的輸入特征,和、和分別表示塊的(S)W-MSA模塊和MLP模塊的輸出特征;W-MSA和SW-MSA分別表示使用規則和移位窗口劃分配置的基于窗口的多頭部自注意;LN表示LayerNorm層。
5.根據權利要求4所述的基于改進YOLOV5模型的工地安全帽佩戴檢測方法,其特征在于:步驟2所述的Bottleneck Transformer屬于Hybrid network,其將CNN與Transformer結合起來處理對輸入圖像尺寸要求較高的視覺任務。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于艾迪恩(山東)科技有限公司;西南交通大學煙臺新一代信息技術研究院,未經艾迪恩(山東)科技有限公司;西南交通大學煙臺新一代信息技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210977122.0/1.html,轉載請聲明來源鉆瓜專利網。





