[發明專利]基于改進yolov5的紅綠燈檢測方法、系統、設備及介質在審
| 申請號: | 202310451669.1 | 申請日: | 2023-04-25 |
| 公開(公告)號: | CN116630934A | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 李康順;李婷婷;李丹丹;鄭俊鋒;張昱 | 申請(專利權)人: | 東莞城市學院 |
| 主分類號: | G06V20/58 | 分類號: | G06V20/58;G06V10/764;G06V10/56;G06V10/774 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 523000 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 改進 yolov5 紅綠燈 檢測 方法 系統 設備 介質 | ||
1.基于改進yolov5的紅綠燈檢測方法,其特征在于,包括下述步驟:
獲取紅綠燈圖片數據并進行預處理,構建紅綠燈圖片檢測數據集;
構建改進的yolov5模型訓練所述紅綠燈圖片檢測數據集,得到訓練好的改進的yolov5模型;所述改進的yolov5模型是用Inception-ResNet?v2網絡替換掉原始yolov5的骨干網絡;所述改進后yolov5模型的骨干網絡包括Stem模塊、Inception-resnet-A模塊、Reduction-A模塊、Inception-resnet-B模塊、Reduction-B模塊以及進入Inception-resnet-C模塊,所述Stem模塊用于對進入Inception模塊前的數據進行預處理,所述Inception-resnet-A模塊用于對輸入的結果先進行6次卷積處理,再將處理結果進行堆疊;所述Reduction-A模塊用于對來自上一層的輸入進行4次卷積處理以及最大值池化處理;所述Inception-resnet-B模塊用于對來自上一層的輸入進行4次卷積處理,再將處理結果進行堆疊,所述Reduction-B模塊用于對來自上一層的輸入進行7次卷積處理以及最大值池化處理,所述Inception-resnet-C模塊用于對來自上一層的輸入進行5次卷積處理,再將處理結果進行堆疊;
將待檢測的紅綠燈圖片輸入至所述訓練好的改進的yolov5模型進行檢測,輸出檢測結果。
2.根據權利要求1所述的基于改進yolov5的紅綠燈檢測方法,其特征在于,在預處理的過程中,對所述紅綠燈圖片數據進行標注,獲得目標的類別標簽信息,整理制作成紅綠燈圖片檢測數據集。
3.根據權利要求1所述的基于改進yolov5的紅綠燈檢測方法,其特征在于,所述構建改進的yolov5模型訓練所述紅綠燈圖片檢測數據集,得到訓練好的改進的yolov5模型,具體為:
將yolov5模型原來的Input修改為299x299x3;
將Input的數據通過Stem模塊進行處理,具體處理過程為:先將Input數據進行三次卷積核為3x3的二維卷積,然后再進行最大池化,最大池化后再進行兩次卷積處理,然后再進行四次分支處理,最后將這四個分支進行堆疊,輸入的圖像尺寸由原來的299x299x3變為35x35x256;
在通過Stem模塊處理后,進入Inception-resnet-A模塊進行處理,具體處理過程為:Inception-resnet-A模塊的結構分為4個分支,分別為未經處理直接輸出、經過一次1x1的32通道的卷積處理、經過一次1x1的32通道的卷積處理和一次3x3的32通道的卷積處理、經過一次1x1的32通道的卷積處理與一次3x3的48通道和一次3x3的64通道卷積處理這四個分支,將后三個分支的處理結果堆疊后進行一次卷積,然后再與第一個分支的結果相加,最后得出處理結果;
進入Reduction-A模塊處理,所述Reduction-A模塊分為最大池化操作、1次卷積核為3x3的卷積處理和3次卷積處理這3個分支,將這3個分支處理后的結果按維數1進行拼接,拼接后數據就由原來的35x35x256變為17x17x896;
進入Inception-resnet-B模塊處理,所述Inception-resnet-B模塊分為未經處理直接輸出,經過一次1x1的192通道的卷積處理,經過一次1x1的128通道的卷積處理、一次1x7的160通道的卷積處理和一次7x1的192通道的卷積處理這3個分支;將第2個分支和第3個分支的處理結果堆疊后進行一次卷積,再與第一個分支的處理結果相加;
進入Reduction-B模塊處理,所述Reduction-B模塊分為最大池化操作,一次1x1的通道數為256的卷積操作和一次3x3的通道數為384的卷積操作,一次1x1的通道數為256的卷積操作和一次3x3的通道數為288的卷積操作,一次1x1的通道數為256的卷積操作、一次3x3的通道數為288的卷積操作以及一次3x3的通道數為320的卷積操作這4個分支,將這個分支得到的處理結果按維數1進行拼接,拼接后數據就由原來的17x17x896變為8x8x1792;
進入Inception-resnet-C模塊處理,所述Inception-resnet-C模塊分為未經處理直接輸出,經過一次1x1的192通道的卷積處理,經過一次1x1的192通道的卷積處理、一次1x3的224通道的卷積處理和一次3x1的256通道的卷積處理這3個分支,將第2個分支和第3個分支的處理結果堆疊后進行一次卷積,再與第一個分支的處理結果相加;
在經過上述操作后,進行二維平均池化操作,設置kernel_size參數的值為8,處理后輸出數據為1792。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東莞城市學院,未經東莞城市學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310451669.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種煤流入爐計量與在線監測系統
- 下一篇:一種估算草地植被高度的遙感方法





