[發明專利]一種基于深度學習的自動識別昆蟲方法在審
| 申請號: | 202210270197.5 | 申請日: | 2022-03-18 |
| 公開(公告)號: | CN114708454A | 公開(公告)日: | 2022-07-05 |
| 發明(設計)人: | 潘曉光;王小華;焦璐璐;宋曉晨;李娟 | 申請(專利權)人: | 山西三友和智慧信息技術股份有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 深圳科潤知識產權代理事務所(普通合伙) 44724 | 代理人: | 李小妮 |
| 地址: | 030000 山西省太*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 自動識別 昆蟲 方法 | ||
本發明屬于機器學習技術領域,具體涉及一種基于深度學習的自動識別昆蟲方法,包括如下步驟,數據采集:采集真實虎甲蟲圖像數據集,并對其類別進行標注,完成模型訓練所需數據集的構建;數據預處理:由于原始數據集的顏色強度分布不均勻,每個圖像的突出部分在尺寸上都有非常大的變化且包含背景噪聲導致識別準確率不高,通過預處理對原始數據集進行相應的處理,預處理包括歸一化、數據切割,統一數據尺度,并且擴增數據集,保證模型訓練效果;構建:采用深度學習和機器學習相關技術搭建融合分類模型,將經過預處理的圖像數據集輸入,完成參數模型的搭建;模型保存:當模型的損失函數不再降低之后,保存模型。
技術領域
本發明屬于機器學習技術領域,具體涉及一種基于深度學習的自動識別昆蟲方法。
背景技術
地球上有數百萬種物種,其中120萬種已經被正式描述為。一些物種已被鑒定和描述使用分子技術,而形態學和形態計量學已被用于鑒定其他物種。然而,分子技術的應用需要大量的專業知識,成本高,時間長,而基于形態學的鑒定對隱蔽和不豐富的類群的鑒定提出了挑戰。形態學識別的困難主要是由于有許多視覺上相似的類別來識別類間的相似性。因此,傳統的物種鑒定需要每個物種的詳細專家知識。此外,物種鑒定需要耗費大量時間。由于專家知識的缺乏、物種識別的成本高、耗時長等問題,人工智能在圖像分類中的應用顯得尤為重要。
現有技術存在的問題或者缺陷:卷積神經網絡(CNN)圖像分類的快速改進顯示了顯著的性能。這些模型能夠識別肉眼可見和不可見的特征來對物體進行分類。然而這些模型需要大量的訓練數據從每堂課學習的特性,被組織成一個特征向量,一個任意長度的向量,收集所有的屬性用于描述對象在分析提高模型更好的性能。因此,超特異分類,如昆蟲種類分類,在形態上具有屬間相似性,需要極其大量的圖像數據才能獲得較高的驗證精度。因此,利用深度學習和機器學習相結合構建分類構建提取特征來識別類間相似性巨大的昆蟲物種是一種不可阻擋的趨勢。
發明內容
基于此,本發明提供了一種基于深度學習的自動識別昆蟲方法,由研究人員通過手機截圖、單反相機捕捉和來自網站/博客的圖像獲相關的昆蟲數據集,并將獲取所得的粗糙數據集進行整理,并邀請相關的專家進行數據標注。完成數據收集后,對數據進行預處理,預處理包括分割,圖像縮放、歸一化等。將預處理后的數據輸入搭建好的深度學習和機器學習的融合分類模型種進行網絡模型的訓練,待到模型損失函數不再下降,保存模型,完成模型構建。
本申請公開的一種基于深度學習的自動識別昆蟲方法,包括如下步驟,
S1、數據采集:采集真實虎甲蟲圖像數據集,并對其類別進行標注,完成模型訓練所需數據集的構建;
S2、數據預處理:由于原始數據集的顏色強度分布不均勻,每個圖像的突出部分在尺寸上都有非常大的變化且包含背景噪聲導致識別準確率不高,通過預處理對原始數據集進行相應的處理,預處理包括歸一化、數據切割,統一數據尺度,并且擴增數據集,保證模型訓練效果;
S3、構建:采用深度學習和機器學習相關技術搭建融合分類模型,將經過預處理的圖像數據集輸入,完成參數模型的搭建;
S4、模型保存:當模型的損失函數不再降低之后,保存模型。
進一步的,所述步驟S1中,該數據集包括野外調查期間拍攝的圖像,來自野生動物和自然攝影師使用不同類型的相機和不同的圖像質量,虎甲蟲出版物和網站,其中圖像是通過不同的來源進行收集:手機截圖、單反相機捕捉和網站/博客,該原始圖像數據集中本數據集由6種陸生虎甲蟲和3種樹棲虎甲蟲的圖像組成,且物種間存在顯著的形態差異,可以通過視覺效果來區分各個部落,在同一屬的物種中也可以看到鞘翅模式的微小變化便于專家進行數據標注。
進一步的,所述步驟S2中:包括數據歸一化:對每條數據進行Min-Max歸一化;
數據分割:將獲取到的數據按照7:3進行分割,分為訓練集和測試集,將訓練集用于網絡模型的輸入,并且擴增數據集,增強網絡識別能力;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西三友和智慧信息技術股份有限公司,未經山西三友和智慧信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210270197.5/2.html,轉載請聲明來源鉆瓜專利網。





