[發(fā)明專利]一種基于去噪學習的鳥類細粒度識別方法在審
| 申請?zhí)枺?/td> | 202211438076.3 | 申請日: | 2022-11-17 |
| 公開(公告)號: | CN115761243A | 公開(公告)日: | 2023-03-07 |
| 發(fā)明(設計)人: | 沈馮立;李福生;趙彥春;唐榮江 | 申請(專利權(quán))人: | 電子科技大學長三角研究院(湖州) |
| 主分類號: | G06V10/30 | 分類號: | G06V10/30;G06V10/764;G06V10/774 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 唐莉梅 |
| 地址: | 313000 浙江省湖州*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 學習 鳥類 細粒度 識別 方法 | ||
1.一種基于去噪學習的鳥類細粒度識別方法,其特征在于,所述基于去噪學習的鳥類細粒度識別方法包括以下步驟:
步驟一,收集不同鳥類的圖片數(shù)據(jù),包括有標注的圖片數(shù)據(jù)和無標注的圖片數(shù)據(jù),將其整合成細粒度鳥類數(shù)據(jù)集;
步驟二,對步驟一中收集到的無標注圖片數(shù)據(jù)進行人工標注,獲得全部帶標注的細粒度鳥類數(shù)據(jù)集;
步驟三,對步驟二中得到的細粒度鳥類數(shù)據(jù)集進行數(shù)據(jù)增廣,獲得增廣后的細粒度鳥類數(shù)據(jù)集;
步驟四,利用步驟三中得到的增廣細粒度鳥類數(shù)據(jù)集訓練一個細粒度鳥類分類器;
步驟五,利用步驟四中訓練完成的細粒度鳥類分類器對步驟三中獲得的增廣數(shù)據(jù)集進行打分,并且根據(jù)數(shù)據(jù)得分篩選出部分可信的數(shù)據(jù),將其重新組合成新的鳥類細粒度數(shù)據(jù)集;
步驟六,重復步驟四和步驟五,直到步驟四中分類器的損失保持穩(wěn)定;
步驟七,將步驟六中訓練得到的穩(wěn)定的鳥類細粒度圖片分類器部署到樹莓派中;
步驟八,給樹莓派配備攝像頭后,對采集得到的視頻幀進行顯著性檢測后得到鳥類在圖片中的具體位置,截取對應位置的圖片區(qū)域輸入到分類網(wǎng)絡進行圖片分類,輸出識別結(jié)果。
2.如權(quán)利要求1所述基于去噪學習的鳥類細粒度識別方法,其特征在于,所述步驟三中對圖像數(shù)據(jù)先進行了以下幾種數(shù)據(jù)增廣:
1)隨機的剪裁圖片,取圖像的部分作為一份數(shù)據(jù);
2)隨機的水平、豎直、斜對角的翻轉(zhuǎn)圖片;
3)隨機的擦除圖片部分區(qū)域,用黑色填充;
4)隨機的進行圖片顏色、明暗、對比度和飽和度的調(diào)節(jié);
并且最后還對圖片進行了歸一化,將每個像素點的值轉(zhuǎn)化成為零一之間的數(shù)值。
3.如權(quán)利要求1所述基于去噪學習的鳥類細粒度識別方法,其特征在于,所述步驟四中采用的是Inceptionv4模型,Inceptionv4模型的輸入是224×224的彩色圖像。訓練使用的是Adam優(yōu)化器,模型的學習率是0.0001。分類的損失函數(shù)采用帶權(quán)重的交叉熵損失函數(shù),具體公式如下:
其中ki表示的是前一個迭代的分類模型預測圖片i的分類得分,yi表示圖片i的真實標簽,Pi表示當前迭代模型預測圖片的分類得分;第一輪迭代時,所有的k都為0,損失函數(shù)也轉(zhuǎn)化成普通的交叉熵損失函數(shù)。
4.如權(quán)利要求1所述基于去噪學習的鳥類細粒度識別方法,其特征在于,所述步驟五中的篩選方式先對步驟三中得到的全部數(shù)據(jù)進行分類,然后篩選出其中最高分類得分高于0.9的正確數(shù)據(jù),和其中最高得分低于0.5的錯誤數(shù)據(jù)將數(shù)據(jù)進行重新整合后得到篩選后的數(shù)據(jù)。
5.如權(quán)利要求1所述基于去噪學習的鳥類細粒度識別方法,其特征在于,所述步驟六中在前后兩次迭代的分類器的分類正確率相差小于0.001時停止迭代。
6.如權(quán)利要求1所述基于去噪學習的鳥類細粒度識別方法,其特征在于,所述步驟八中采用的顯著性檢測算法為Histogram-based Contrast算法(Cheng,Ming-Ming,et al.Global contrast based salient region detection.IEEE transactions on patternanalysis and machine intelligence 37.3(2014):569-582),先通過該算法得到圖片的顯著性區(qū)域后,根據(jù)最大外接矩陣的方法得到鳥類在圖片中的矩形位置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學長三角研究院(湖州),未經(jīng)電子科技大學長三角研究院(湖州)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211438076.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





