[發明專利]一種基于改進YOLOv5網絡的果實識別方法在審
| 申請號: | 202211344388.8 | 申請日: | 2022-10-31 |
| 公開(公告)號: | CN115641577A | 公開(公告)日: | 2023-01-24 |
| 發明(設計)人: | 曹子昂;侯文慧;王玉偉;楊坤靈;梅芳芳;盛雅君 | 申請(專利權)人: | 安徽農業大學 |
| 主分類號: | G06V20/68 | 分類號: | G06V20/68;G06V10/50;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 深圳市廣諾專利代理事務所(普通合伙) 44611 | 代理人: | 李亞萍 |
| 地址: | 230031 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 yolov5 網絡 果實 識別 方法 | ||
1.一種基于改進YOLOv5網絡的果實識別方法,其特征在于:具體包括以下步驟:
步驟S1:利用basler工業相機在果園白天和晚上中采集不同果實數量,不同枝葉遮擋的果實圖像,以便增加數據的多樣性;
步驟S2:利用Python腳本對采集的數據進行數據增強,提高檢測網絡模型的魯棒性,對訓練圖像進行數據增強,同時基于Pytorch框架使用數字圖像直方圖均衡化技術對數據集進行圖像增強,以此提升圖片對比度;
步驟S3:利用Labeling對數據集進行標注并生成xml和txt標簽,利用Python腳本將數據集分為驗證集(val)、測試集(text)、訓練集(train);
步驟S4:將YOLOv5網絡中GIoU損失函數更改為Alpha-IoU損失函數;
步驟S5:在YOLOv5網絡中融入CBAM注意力機制;
步驟S6:調整YOLOv5相關文件中的參數,圖像輸入尺寸為640像素×640像素,batch-size大小為4,最大迭代次數285,初始學習率為0.01,余弦退火超參數為0.2,權重衰減系數為0.0005,修改數據路徑;
步驟S7:運行train文件訓練果實數據集,在訓練完成后停止訓練并獲取網絡訓練的權重;
步驟S8:在detect文件中,將yolov5s.pt預訓練權重換成訓練完成后得到的最佳訓練權重best.pt,將另采集的數據集圖片傳入網絡中,查看檢測效果。
2.根據權利要求1所述的一種基于改進YOLOv5網絡的果實識別方法,其特征在于:所述步驟S2中,所使用數字圖像直方圖均衡化技術具體可表示為:
其中:rk表示第k個灰度級(k=1,2,3,4......L-1),L最大為256;nk表示圖像中灰度級為rk的像素個數;N表示果實圖像中像素的全部個數;P(rk)為圖像中第k個灰度級占總像素數的比例;
輸出新圖像灰度級的概率密度sk表示為:
其中:sk表示輸出新圖像灰度級的概率密度是輸入原始圖像灰度級概率密度的累積,k表示輸出新圖像的灰度等級。
3.根據權利要求1所述的一種基于改進YOLOv5網絡的果實識別方法,其特征在于:所述步驟S4中,YOLOv5網絡輸出端采用CIoU損失函數表示為:
當γ、β框重合時,有:
|γ∪β|=|γ∩β|;
當γ、β框無重疊部分時,有:
IoU=0;
其中:γ為預測框,β為目標框,而g為包圍γ、β的最小包圍,IoU表示IoU損失函數。
4.根據權利要求1所述的一種基于改進YOLOv5網絡的果實識別方法,其特征在于:所述步驟S4中,YOLOv5網絡引入Alpha-IoU損失函數表示為:
Lα-IoU=1-IoUα;
其中:B為預測框,Bgt代表真實框;C代表能包圍預測框和真實框的最小框;b和bgt分別代表了預測框和真實框的中心點;c代表兩個框的最小包圍框的對角線距離;β為權重函數,而υ用來度量長度的相似比;α表示指數,通過調節超參數α可以滿足不同水平物體檢測邊框的回歸精度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽農業大學,未經安徽農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211344388.8/1.html,轉載請聲明來源鉆瓜專利網。





