[發明專利]目標檢測方法、裝置、存儲介質及終端有效
| 申請號: | 202110310610.1 | 申請日: | 2021-03-24 |
| 公開(公告)號: | CN112699859B | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 黃仝宇;胡斌杰 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/62;G06N3/04 |
| 代理公司: | 廣州國鵬知識產權代理事務所(普通合伙) 44511 | 代理人: | 葛紅 |
| 地址: | 510641 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 檢測 方法 裝置 存儲 介質 終端 | ||
本發明公開了一種目標檢測方法,包括:獲取駕駛場景下攝像機所拍攝的圖像;將所述圖像輸入至已訓練好的目標檢測網絡,通過所述目標檢測網絡對所述圖像進行判斷和預測,得到目標分類和位置信息;其中,所述目標檢測網絡采用輕量化的YOLOv5s網絡結構作為基礎框架,在YOLOv5s主干網絡的跨階段局部網絡中嵌入瓶頸注意力機制模塊,以及在YOLOv5s主干網絡的指定卷積層中采用深度可分離卷積運算。本發明有效地提高了對駕駛場景圖像的目標檢測精度和速度,且符合駕駛場景下前端輕量化的應用需求。
技術領域
本發明涉及信息技術領域,尤其涉及一種目標檢測方法、裝置、存儲介質及終端。
背景技術
隨著人工智能技術的快速發展,涌現一大批基于深度學習的目標檢測算法,并被廣泛應用于輔助駕駛、視頻監控、機器人視覺、工業檢測等領域的目標檢測任務中。視覺感知是輔助駕駛中道路環境感知的重要組成部分,可自動對攝像機所拍攝圖像進行分析,主動預測車輛周圍存在的潛在危險狀況,如行人是否不按交通規則橫穿馬路、前方車輛是否突然剎車等。
現有技術在針對駕駛場景下攝像機所拍攝圖像進行目標檢測時,以YOLOv3算法為基礎框架,通過嵌入SENet結構以增強特征映射圖的感受野,使網絡學習到的特征信息更全面。然而此方法存在以下缺點:
(1)SENet只是在通道維度上對特征進行了篩選加權,無法較好獲取的位置關系信息,檢測精度欠佳。
(2)YOLOv3算法存在召回率不足,定位不夠準確的缺點。與YOLOv1、YOLOv2等之前的版本相比,YOLOv3的精度有所提升,但是檢測速度有所下降。
(3)對部分遮擋目標的檢測精度較低,難以達到交通道路場景的應用需求。
(4)針對駕駛場景下的目標檢測正負樣本不均衡問題,模型會過多關注易分樣本,導致模型性能較低。
發明內容
本發明實施例提供了一種目標檢測方法、裝置、存儲介質及終端,以解決現技術在對駕駛場景下攝像機所拍攝圖像進行目標檢測時存在的檢測精度、檢測速度不高的問題。
一種目標檢測方法,包括:
獲取駕駛場景下攝像機所拍攝的圖像;
將所述圖像輸入至已訓練好的目標檢測網絡,通過所述目標檢測網絡對所述圖像進行判斷和預測,得到目標分類和位置信息;
其中,所述目標檢測網絡采用輕量化的YOLOv5s網絡結構作為基礎框架,在YOLOv5s主干網絡的跨階段局部網絡中嵌入瓶頸注意力機制模塊,以及在YOLOv5s主干網絡的指定卷積層中采用深度可分離卷積運算。
可選地,所述目標檢測網絡在YOLOv5s主干網絡的BottleneckCSP1_x層之中嵌入瓶頸注意力機制模塊,得到基于瓶頸注意力機制模塊的跨階段局部網絡。
可選地,所述目標檢測網絡將YOLOv5s主干網絡中的指定CBH模塊替換為MBH模塊,所述CBH模塊由卷積運算、歸一化處理以及激活函數組成,所述MBH模塊由基于深度可分離卷積運算的倒置殘差模塊、歸一化處理以及激活函數組成。
可選地,所述基于深度可分離卷積運算的倒置殘差模塊包括第一單點卷積層、深度卷積層、第二單點卷積層和融合層,其中所述第一單點卷積層和深度卷積層采用BatchNorm操作和非線性ReLU6激活函數,所述第二單點卷積層采用BatchNorm操作而不采用非線性ReLU6激活函數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110310610.1/2.html,轉載請聲明來源鉆瓜專利網。





