[發明專利]一種基于改進YOLOv5的丁香魚捕撈作業識別方法在審
| 申請號: | 202210292914.4 | 申請日: | 2022-03-24 |
| 公開(公告)號: | CN115063734A | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 張勝茂;張佳澤;唐峰華;楊勝龍;張衡;樊偉;劉洋;朱文斌 | 申請(專利權)人: | 中國水產科學研究院東海水產研究所 |
| 主分類號: | G06V20/52 | 分類號: | G06V20/52;G06V20/40;G06V10/776;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 上海泰能知識產權代理事務所(普通合伙) 31233 | 代理人: | 宋纓 |
| 地址: | 200090 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 yolov5 丁香 捕撈 作業 識別 方法 | ||
1.一種基于改進YOLOv5的丁香魚捕撈作業識別方法,其特征在于,包括以下步驟:
(1)獲取丁香魚捕撈作業的監控視頻數據;
(2)將所述監控視頻數據轉換為圖像數據;
(3)將所述圖像數據輸入至訓練好的識別模型中,得到丁香魚捕撈作業狀態;所述識別模型為引入注意力機制模塊的YOLOv5網絡。
2.根據權利要求1所述的基于改進YOLOv5的丁香魚捕撈作業識別方法,其特征在于,所述步驟(2)與步驟(3)之間,還包括對所述圖像數據進行壓縮處理的步驟。
3.根據權利要求1所述的基于改進YOLOv5的丁香魚捕撈作業識別方法,其特征在于,所述識別模型包括:輸入層,用于對所述圖像數據進行Mosaic數據增強、自適應圖片縮放以及K-means算法計算錨點坐標;主干網絡層,用于通過切片操作增加通道數量,并提取出特征信息;Neck層,用于使不同的特征信息之間進行相互融合,并將相互融合后的特征信息引入SENet注意力機制模塊進行處理;輸出層,用于輸出預測結果。
4.根據權利要求3所述的基于改進YOLOv5的丁香魚捕撈作業識別方法,其特征在于,所述SENet注意力機制模塊包括:壓縮單元,用于利用一個平均池化層將輸入的H×W×C的特征信息壓縮為1×1×C的形式;激勵單元,用于使用全連接層對壓縮單元壓縮后的特征信息進行非線性變換;還原單元,用于將激勵單元的輸出與輸入的H×W×C的特征信息的二維矩陣相乘還原通道維數。
5.根據權利要求4所述的基于改進YOLOv5的丁香魚捕撈作業識別方法,其特征在于,所述SENet注意力機制模塊的表達式為:其中,Mc(F)為特征圖輸出,σ()為Sigmoid函數,W1和W0分別為輸入共享權重,和為利用平均池化和最大池化在空間上生成的特征映射。
6.根據權利要求1所述的基于改進YOLOv5的丁香魚捕撈作業識別方法,其特征在于,所述識別模型在訓練時包括以下步驟:
獲取丁香魚捕撈作業的全部視頻數據;
將視頻數據轉換為圖像數據并進行標注,并生成xml文件;
將生成的xml文件轉化為txt文本形式,其中包含標注的類別和對應位置坐標;
從所述圖像數據中選出訓練數據,并輸入至所述識別模型進行訓練;
從所述圖像數據中選出驗證數據,對訓練后的所述識別模型進行驗證,當驗證結果符合要求時表示所述識別模型為訓練好的識別模型。
7.根據權利要求6所述的基于改進YOLOv5的丁香魚捕撈作業識別方法,其特征在于,所述標注包含四類數據,分別代表人、漁網、漁筐和加工船。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國水產科學研究院東海水產研究所,未經中國水產科學研究院東海水產研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210292914.4/1.html,轉載請聲明來源鉆瓜專利網。





