[發明專利]一種基于改進型yolov5網絡的垃圾檢測與識別方法在審
| 申請號: | 202110481897.4 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113158956A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 程自帥;林志赟;范鈺捷;王博;韓志敏;鐘深友 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08;G06F16/951 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 楊舟濤 |
| 地址: | 310018*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進型 yolov5 網絡 垃圾 檢測 識別 方法 | ||
1.一種基于改進型yolov5網絡的垃圾檢測與識別方法,其特征在于,包括如下步驟:
S1:收集并標注包含多種類別的垃圾圖像,經數據統計分析并擴充數據集之后進行數據增強,建立一個包含多種類別的垃圾檢測數據集。
S2:選定yolov5網絡作為基準網絡,改進檢測頭結構,增加了小尺寸目標檢測頭分支,并在骨干網絡引入了注意力機制,使得網絡更關注于具有垃圾的區域,減少漏檢率,同時將網絡中的標準bottleneck結構替換為基于ghost的bottleneck結構,在通道維度大于512維的網絡層中使用深度可分離卷積,降低了網絡的參數量,構建出改進型yolov5網絡作為多種類垃圾檢測網絡,將數據集預處理到標準尺寸并經GPU訓練后,得到多種類垃圾檢測推理模型。
S3:將預處理到標準尺寸的需要檢測與識別的垃圾圖片輸入至訓練好的多種類垃圾檢測推理模型,檢測得到圖像內所有垃圾的種類與位置。
2.根據權利要求1所述的一種基于改進型yolov5網絡的垃圾檢測與識別方法,其特征在于,所述步驟S1中:
步驟S11:確定所需要的全部垃圾類別,通過編寫爬蟲腳本收集網上相應類別的公開垃圾圖片數據集;利用labImg工具對收集的數據集進行標注,標注信息存儲為xml格式,標注信息主要包括圖片內垃圾的位置坐標信息、垃圾尺寸長寬信息、垃圾種類信息;
步驟S12:標注完成后利用python分別編寫垃圾數目統計腳本、標注信息修改腳本、標注位置信息統計腳本進行數據分析;針對圖片數據量不足600的垃圾種類,在不同的光照、環境、拍攝角度下進行人工拍攝垃圾圖片并進行標注后擴充進數據集;
步驟S13:對擴充后的數據集利用像素內容變換、空間幾何變換的目標檢測通用數據增強手段對整個數據集進行補充擴容。
3.根據權利要求1所述的一種基于改進型yolov5網絡的垃圾檢測與識別方法,其特征在于,所述步驟S2中:所述小尺寸目標檢測頭分支用于檢測小目標物體,包括牙簽、蛋殼等。
4.根據權利要求1所述的一種基于改進型yolov5網絡的垃圾檢測與識別方法,其特征在于,所述步驟S2中:
步驟S21:選定基礎網絡yolov5,該基礎網絡主要由骨干網絡及檢測頭網絡PaNet組成,將原本的PaNet增加160*160像素尺寸檢測頭改進為四檢測頭結構,骨干網絡中的160*160像素尺寸的特征圖層引出一條分支、將檢測頭PaNet網絡最高維度的80*80像素尺寸的特征圖進行上采樣操作同樣引出一條160*160像素尺寸分支,兩條分支進行合并操作后輸入至bottleneck結構整合特征圖并送入1*1像素尺寸的卷積核進行輸出;在骨干網絡中最后一層引入注意力機制并維持網絡維度不變;將網絡中的標準bottleneck結構替換為基于ghost的bottleneck結構;將網絡中通道維度大于512維的普通卷積模塊替換為深度可分離卷積模塊;將修改后的各結構和模塊按照原yolov5網絡形式順序堆疊,即可得到改進型yolov5網絡;
步驟S22:將步驟S1中得到的垃圾檢測數據集進行預處理,將所有的標注文件由xml格式轉換為txt格式并對坐標進行歸一化,完成后的txt文本包含目標類別、左上角坐標、右下角坐標,同時統一縮放為640*640像素尺寸,并將80%數據作為訓練集,20%數據作為驗證集,即可完成圖片輸入前的所有預處理;
步驟S23:在GPU服務器上搭建訓練模型所用的虛擬環境,完成后將訓練集輸入至改進型yolov5網絡進行目標檢測模型訓練,訓練完成后即可得到用于多種垃圾同時檢測識別的推理模型。
5.根據權利要求1所述的一種基于改進型yolov5網絡的垃圾檢測與識別方法,其特征在于,所述步驟S3中:將待檢測圖片或視頻流輸入至步驟S2訓練完成后得到的推理模型,即可在輸出文件或者輸出視頻流中得到所有垃圾的類別并框出坐標位置,實現多種垃圾的同時識別與檢測定位。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110481897.4/1.html,轉載請聲明來源鉆瓜專利網。





