[發明專利]一種基于注意力YOLOv5模型的自動水果識別方法在審
| 申請號: | 202210138123.6 | 申請日: | 2022-02-15 |
| 公開(公告)號: | CN114494710A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 邵葉秦;曹秋陽;李登亮;宋錦偉;高瞻;施佺 | 申請(專利權)人: | 南通大學 |
| 主分類號: | G06V10/40 | 分類號: | G06V10/40;G06V10/762;G06V10/82;G06K9/62;G06T3/40;G06N3/04;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 許海洲 |
| 地址: | 226019 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 yolov5 模型 自動 水果 識別 方法 | ||
1.一種基于注意力YOLOv5模型的自動水果識別方法,其特征在于,包括以下步驟:
步驟1、將數據集的原始圖像進行預處理;
步驟2、輸入主干網絡提取特征,并使用SENet注意力模塊得到一個與通道對應的一維向量作為評價分數;
步驟3、將評價分數通過乘法操作作用到feature map的對應通道上,得到用于水果識別的有效特征;
步驟4、經過特征金字塔和路徑聚合網絡結構將特征融合;
步驟5、對圖像特征進行預測,使用CIOU考慮目標框與預測框的高寬比和中心點之間的關系,提升預測精度,根據大、中、小目標分別輸出識別結果。
2.根據權利要求1所述的基于注意力YOLOv5模型的自動水果識別方法,其特征在于,所述步驟1中使用Mosaic數據增強的方式進行圖像拼接。
3.根據權利要求2所述的基于注意力YOLOv5模型的自動水果識別方法,其特征在于,所述步驟1中對數據集的尺寸歸一化處理,對原始圖像進行自適應填充最少的灰度值,具體包括以下步驟:
步驟1.1、設置圖像縮放比例;令原始圖像為A×B,縮放至a×a,其中A為原始圖像的寬,B為原始圖像的高,a為縮放后圖像的寬,縮放后圖像寬和高相等,將縮放后圖像的寬高除以原始圖像相應寬高,得到2個系數,取其小的系數;
步驟1.2、設置縮放后的尺寸;將原始圖片寬高乘以最小的系數,則寬為C,高為D;
步驟1.3、設置灰邊的填充值;先將C減去D,并采用取余的方式得需要填充的像素值(C-D)%E=F,其中E=2n,n是網絡經過的下采樣次數,兩端各個像素;在測試過程中采用灰色填充,訓練過程使用原始的resize操作以提高物體的檢測、計算速度。
4.根據權利要求1所述的基于注意力YOLOv5模型的自動水果識別方法,其特征在于,所述主干網絡是CSPDarknet-53,能增強卷積網絡的學習能力,降低內存消耗。
5.根據權利要求1所述的基于注意力YOLOv5模型的自動水果識別方法,其特征在于,步驟2所述SENet注意力模塊操作過程包括以下步驟:
步驟2.1、使用全局平均池化作為Squeeze操作;
步驟2.2、使用兩個全連接層得到通道間的相關性,同時減少參數與計算量;
步驟2.3、通過Sigmoid歸一化權重;
步驟2.4、通過Scale操作將歸一化后的權重作用在原始通道的特征上。
6.根據權利要求1所述的基于注意力YOLOv5模型的自動水果識別方法,其特征在于,所述步驟5中CIOU將真實框與預測框之間的距離、重疊率、邊框尺度以及懲罰因子均考慮進去,使得目標邊框回歸更加穩定;
CIOU公式:
其中,ρ2(b,bgt)即預測框與真實框中心點之間的歐式距離d,c表示同時包含真實框與預測框最小閉包矩形框的對角線距離。
懲罰項αv中α的公式如下所示:
懲罰項αv中v的公式如下所示:
其中,wgt表示真實框的寬,hgt表示真實框的高,w表示預測框的寬,h表示預測框的高;
CIOU在回歸時loss的計算公式如下所示:
目標框與預測框重合時,CIOU值不相同;c值相同時,通過目標框與預測框中心點的歐式距離與對角線的比值d,度量兩者位置關系,使損失函數收斂。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通大學,未經南通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210138123.6/1.html,轉載請聲明來源鉆瓜專利網。





