[發明專利]一種基于深度卷積神經網絡的雙翅目昆蟲識別方法在審
| 申請號: | 202010471036.3 | 申請日: | 2020-05-28 |
| 公開(公告)號: | CN111652247A | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 陳彥彤;王俊生;張獻中 | 申請(專利權)人: | 大連海事大學 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06N3/04;G06K9/62;G06T7/70 |
| 代理公司: | 大連東方專利代理有限責任公司 21212 | 代理人: | 姜玉蓉;李洪福 |
| 地址: | 116026 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 卷積 神經網絡 雙翅目 昆蟲 識別 方法 | ||
1.一種基于深度卷積神經網絡的雙翅目昆蟲識別方法,其特征在于,包括以下步驟:
S1:采集雙翅目昆蟲圖像,制作雙翅目昆蟲圖像的數據集;
S2:對所述數據集進行數據增強,將增強后的所述數據集按照比例為8:1:1,且每種雙翅目昆蟲圖像數量均等的方式進行分類,分為訓練集、驗證集和測試集,通過labelImg圖像標注工具對所述數據集中的雙翅目昆蟲進行標注生成XML格式的標注圖像;
所述數據集進行數據增強包括:對所述數據集圖像進行90°旋轉,所述數據集圖像縮放20%并進行局部模糊處理;
S3:構建改進的RetinaNet目標檢測模型;
S4:設置訓練參數,通過所述數據集訓練所述RetinaNet目標檢測模型;
S5:基于訓練完成的目標檢測模型,對所述雙翅目昆蟲的測試集圖像進行分類和定位。
2.根據權利要求1所述的一種基于深度卷積神經網絡的雙翅目昆蟲識別方法,其特征在于,
所述步驟S1中,采集的雙翅目昆蟲圖像為實驗室標本圖像,通過相機將每種雙翅目昆蟲標本在垂直和水平方向上,每間隔45°拍攝一幅,每種雙翅目昆蟲圖像數量均等。
3.根據權利要求1所述的一種基于深度卷積神經網絡的雙翅目昆蟲識別方法,其特征在于,
所述步驟S3包括以下步驟:
S31:ResNeXt網絡作為特征提取網絡;
S32:在所述特征提取網絡中加入改進的卷積塊注意力模塊;
S33:改進特征金字塔網絡FPN,小型全卷積網絡FCN作為分類子網和回歸子網;
S34:采用Focal Loss函數作為分類損失函數,KL損失函數作為邊框回歸損失函數。
4.根據權利要求3所述的一種基于深度卷積神經網絡的雙翅目昆蟲識別方法,其特征在于,
所述改進的通道注意力模塊具體首先輸入特征圖F∈RC×H×W,分別通過average-pooling,max-pooling和mixed-pooling聚合特征圖的空間信息,得到三個通道注意力向量,進入由一個隱藏層和多層感知機MLP構成的共享網絡,生成三個維數為C×1×1的注意力向量,即得到的三個通道注意力向量,同時為了減少參數量,將隱藏層激活大小設置為RC/r×1×1,激活函數為ReLU,其中r表示縮小率;到輸出層增加到C以獲得和特征圖通道數目相同的特征向量,將三種特征向量對應位置求和,最后通過sigmoid函數生成一個維數為C×1×1的通道注意力圖MC(F),MC(F)表達式如下:
其中,W0和W1為MLP的權重,Δ為sigmoid函數,為對特征圖F平均池化,為對特征圖F最大池化,為對特征圖F混合池化。
5.根據權利要求4所述的一種基于深度卷積神經網絡的雙翅目昆蟲識別方法,其特征在于,
將所述的通道注意力圖MC(F)與所述特征圖F逐元素相乘,得到帶有通道注意力圖的優化特征圖F',然后進行average-pooling,max-pooling和mixed-pooling,產生三個維數相同的特征圖,連接一起后通過7×7的卷積核進行卷積操作,最后通過sigmoid函數產生二維的空間注意力圖MS(F'),MS(F')表達式如下:
其中,f7×7為卷積核為7×7的卷積操作,為對特征圖F'平均池化,為對特征圖F'最大池化,為對特征圖F'混合池化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連海事大學,未經大連海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010471036.3/1.html,轉載請聲明來源鉆瓜專利網。





