[發明專利]目標檢測方法、裝置、存儲介質及終端有效
| 申請號: | 202110310610.1 | 申請日: | 2021-03-24 |
| 公開(公告)號: | CN112699859B | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 黃仝宇;胡斌杰 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/62;G06N3/04 |
| 代理公司: | 廣州國鵬知識產權代理事務所(普通合伙) 44511 | 代理人: | 葛紅 |
| 地址: | 510641 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 檢測 方法 裝置 存儲 介質 終端 | ||
1.一種目標檢測方法,其特征在于,包括:
獲取駕駛場景下攝像機所拍攝的圖像;
將所述圖像輸入至已訓練好的目標檢測網絡,通過所述目標檢測網絡對所述圖像進行判斷和預測,得到目標分類和位置信息;
其中,所述目標檢測網絡采用輕量化的YOLOv5s網絡結構作為基礎框架,在YOLOv5s主干網絡的跨階段局部網絡中嵌入瓶頸注意力機制模塊,以及在YOLOv5s主干網絡的指定卷積層中采用深度可分離卷積運算;
在所述瓶頸注意力機制模塊中,特征映射圖,分別經過瓶頸注意力機制模塊的通道注意力機制和空間注意力機制兩個單獨的分支網絡結構進行處理后得到特征映射圖和,兩者融合后得到特征映射圖為,并通過逐點相乘抑制不重要的特征,突出重點特征之后,再與輸入的特征映射圖相加,得到所提煉的特征映射圖;
所述目標檢測網絡在YOLOv5s主干網絡的BottleneckCSP1_x層之中嵌入瓶頸注意力機制模塊,形成由CBH模塊與瓶頸注意力機制模塊組成的重復單元,得到基于瓶頸注意力機制模塊的跨階段局部網絡;
所述目標檢測網絡將YOLOv5s主干網絡中的第四個CBH模塊替換為MBH模塊,所述CBH模塊由卷積運算、歸一化處理以及激活函數組成,所述MBH模塊由基于深度可分離卷積運算的倒置殘差模塊、歸一化處理以及激活函數組成。
2.如權利要求1所述的目標檢測方法,其特征在于,所述基于深度可分離卷積運算的倒置殘差模塊包括第一單點卷積層、深度卷積層、第二單點卷積層和融合層,其中所述第一單點卷積層和深度卷積層采用BatchNorm操作和非線性ReLU6激活函數,所述第二單點卷積層采用BatchNorm操作而不采用非線性ReLU6激活函數;
所述第一單點卷積層用于將第一低維度特征表示擴展到第一高維度特征表示,所述深度卷積層用于基于深度可分離卷積運算對所述第一高維度特征表示進行特征提取,得到第二高維度特征表示;所述第二單點卷積層用于將第二高維度特征表示進行壓縮,得到第二低維度特征表示;所述融合層用于采用跳層連接操作將輸入的第一低維度特征表示和經過第一單點卷積層、深度卷積層與第二單點卷積層處理后的第二低維度特征表示進行融合,生成新的特征映射圖。
3.如權利要求1至2任一項所述的目標檢測方法,其特征在于,所述目標檢測網絡通過預設的損失函數訓練得到;
所述損失函數由分類損失函數、邊框回歸損失函數和置信度損失函數組成。
4.如權利要求1至2任一項所述的目標檢測方法,其特征在于,所述目標檢測網絡通過預設的損失函數訓練得到;
所述損失函數由梯度均衡機制損失函數、排斥力損失函數和置信度損失函數組成。
5.一種目標檢測裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取駕駛場景下攝像機所拍攝的圖像;
檢測模塊,用于將所述圖像輸入至已訓練好的目標檢測網絡,通過所述目標檢測網絡對所述圖像進行判斷和預測,得到目標分類和位置信息;
其中,所述目標檢測網絡采用輕量化的YOLOv5s網絡結構作為基礎框架,在YOLOv5s主干網絡的跨階段局部網絡中嵌入瓶頸注意力機制模塊,以及在YOLOv5s主干網絡的指定卷積層中采用深度可分離卷積運算;
在所述瓶頸注意力機制模塊中,特征映射圖,分別經過瓶頸注意力機制模塊的通道注意力機制和空間注意力機制兩個單獨的分支網絡結構進行處理后得到特征映射圖和,兩者融合后得到特征映射圖為,并通過逐點相乘抑制不重要的特征,突出重點特征之后,再與輸入的特征映射圖相加,得到所提煉的特征映射圖;
所述目標檢測網絡在YOLOv5s主干網絡的BottleneckCSP1_x層之中嵌入瓶頸注意力機制模塊,形成由CBH模塊與瓶頸注意力機制模塊組成的重復單元,得到基于瓶頸注意力機制模塊的跨階段局部網絡;
所述目標檢測網絡將YOLOv5s主干網絡中的第四個CBH模塊替換為MBH模塊,所述CBH模塊由卷積運算、歸一化處理以及激活函數組成,所述MBH模塊由基于深度可分離卷積運算的倒置殘差模塊、歸一化處理以及激活函數組成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110310610.1/1.html,轉載請聲明來源鉆瓜專利網。





