[發明專利]基于改進YOLO V5的無人機航拍圖像目標檢測方法有效
| 申請號: | 202111155472.0 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113807464B | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 程向紅;曹毅;胡彥鐘;張文卓;錢榮輝 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06V10/764;G06V10/774 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 許小莉 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 改進 yolo v5 無人機 航拍 圖像 目標 檢測 方法 | ||
本發明公開一種基于改進YOLO V5的無人機航拍圖像目標檢測方法,屬于深度學習和目標檢測領域。該方法首先利用無人機航拍圖像構建相關數據集,然后在YOLO V5主干網絡部分利用卷積層替換Focus模塊中的切片層,接著利用Neck部分對圖像特征進一步處理,然后針對無人機高空航拍視角帶來的目標雜散分布且目標占像素比過小問題,在網絡預測層部分優化剔除76×76×255的大檢測頭,并同時調整錨框,最后通過泛化交并比、平均精度以及推理速度評價目標檢測性能。該方法在提高識別準確率和特征提取性能的基礎之上,能夠實現對無人機航拍圖像目標的快速、準確檢測。
技術領域
本發明涉及一種基于改進YOLO V5的無人機航拍圖像目標檢測方法,屬于深度學習和目標檢測技術領域。
背景技術
無人機影像的智能化感知不僅可以高效地提取地物信息,還能拓展無人機的場景理解能力,為無人機自主探測和飛行提供技術支持。目標檢測是提升無人機影像智能感知的關鍵技術之一,但無人機航拍圖像一般存在背景復雜、目標分布密集、尺度小、同一類別目標的角度差異大等特征。傳統的“基于手動特征提取+分類器”的目標檢測算法己無法滿足復雜環境和多尺度下的檢測精度要求。隨著深度學習在解決圖像處理上表現出的高效實用性,利用深度學習實現航拍圖像深度變化特征的提取可有效避免傳統方法的缺陷。
當前,隨著深度神經網絡的發展,目標檢測領域的研究基本上分為兩個方向,一個是基于候選區域的雙階段目標檢測算法,如Faster-RCNN;另外一個是基于回歸計算的單階段目標檢測方法,如YOLO V5。基于候選區域的雙階段的目標檢測算法雖然精度很高,但是檢測效率不高。而單階段目標檢測方法如2020年提出的YOLO V5,其在VOC 2007/2012數據集上可達到推理時間0.007秒。與Faster-RCNN相比,YOLO V5的推理速度提高了3倍,且具有更高的精度。
針對無人機航拍特殊環境,基于YOLO V5的目標檢測方法面臨如下兩個難題。第一,無人機高空俯拍目標屬于小目標,其占像素比例小,檢測難度大;第二,無人機載荷小,電源供能有限,需通過提高網絡推理速度,來提高其單次飛行作業效率。因此,在提高原有精度的前提下,改進YOLO V5主干網絡架構,輕量化其網絡模型,并提高其推理速度,對于YOLO V5應用到無人機航拍圖像目標檢測領域具有重要意義。
發明內容
本發明的目的是針對YOLO V5應用到無人機航拍圖像目標檢測中存在的因檢測目標聚集為小目標,導致檢測難度大,和主干網絡復雜,導致實時性不夠的問題,提出一種基于改進YOLO V5的無人機航拍目標檢測方法,其可在提高原有YOLO V5精度的前提下,改進YOLO V5主干網絡架構,輕量化其網絡模型,提高其推理速度,實現快速、準確的無人機航拍目標檢測。
上述的目的通過以下技術方案實現:
一種基于改進YOLO V5的無人機航拍目標檢測方法,該方法包括如下步驟:
(1)利用無人機航拍圖像構建數據集:對無人機航拍圖像進行分類和標注后,得到帶有類別標簽的圖像數據集,將帶有類別標簽的圖像數據集劃分為訓練集和測試集,其中80%作為訓練集,20%作為測試集;
(2)對步驟(1)得到的帶有類別標簽的圖像數據集,進行預處理操作得到特征圖,并將預處理后的特征圖輸入到改進的YOLO V5網絡獲取不同尺度的無人機航拍圖像特征圖;改進的YOLO V5網絡是指在主干網絡部分利用卷積層替換Focus模塊中的切片層,并依次分別串聯卷積層模塊、跨階段局部網絡、空間金字塔池化模塊;
(3)對步驟(2)得到的不同尺度的無人機航拍圖像特征圖,將其輸入到改進的YOLOV5網絡中的Neck部分,Neck部分對不同尺度的無人機航拍圖像特征圖進行上采樣和特征融合后獲得不同尺度的張量數據;
(4)對步驟(3)得到的不同尺度的張量數據,將其輸入到改進的YOLO V5網絡中的預測層部分,在預測層部分優化剔除大檢測頭與自適應調整錨框,最終計算得到無人機航拍目標的檢測框;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111155472.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種眼影盒注塑模具及其制造方法
- 下一篇:一種帶茶葉復火烘焙功能的電茶爐





