[發明專利]一種基于通道剪裁和定位分類子網絡的細粒度圖像分類方法及系統在審
| 申請號: | 202011000935.1 | 申請日: | 2020-09-22 |
| 公開(公告)號: | CN112149729A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 柯逍;黃艷艷;林心茹 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/32;G06N3/04;G06N3/08 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 錢莉;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 通道 剪裁 定位 分類 網絡 細粒度 圖像 方法 系統 | ||
本發明涉及一種基于通道剪裁和定位分類子網絡的細粒度圖像分類方法及系統,包括以下步驟:獲取細粒度圖像分類數據集,構建定位分類子網絡;對構建的定位分類子網絡進行聯合訓練,得到訓練好的模型;對訓練好的模型進行剪裁,得到新的更小的模型后,再進行微調以恢復精度,最后得到最終模型;采用最終模型對細粒度圖像進行分類。本發明能夠有效地對圖像進行細粒度的分類。
技術領域
本發明涉及計算機視覺技術領域,特別是一種基于通道剪裁和定位分類子網絡的細粒度圖像分類方法及系統。
背景技術
隨著互聯網與大數據的發展,網絡上的圖片與視頻信息呈爆炸式增長,使得對圖片和視頻的處理備受關注。圖像分類是計算機視覺中最基礎的一個任務,已經取得了很好的水平,而細粒度圖像分類的精度卻差強人意。
細粒度圖像分類是對粗粒度的大類別進行更加細致的子類劃分。例如:給定一張鳥的圖片,我們不僅想知道圖片里的是一只鳥,而且還想知道鳥的品種是什么。細粒度圖像的類別精度更加細致,類間差異更加細微,往往只能借助于微小的局部差異才能區分出不同的類別。細粒度圖像分類無論在工業界還是學術界都有著廣泛的研究需求與應用場景。與之相關的研究課題主要包括識別不同種類的鳥、狗、花、車、飛機等。
發明內容
有鑒于此,本發明的目的是提出一種基于通道剪裁和定位分類子網絡的細粒度圖像分類方法及系統,能夠有效地對圖像進行細粒度的分類。
本發明采用以下方案實現:一種基于通道剪裁和定位分類子網絡的細粒度圖像分類方法,具體包括以下步驟:
獲取細粒度圖像分類數據集,構建定位分類子網絡;
對構建的定位分類子網絡進行聯合訓練,得到訓練好的模型;
對訓練好的模型進行剪裁,得到新的更小的模型后,再進行微調以恢復精度,最后得到最終模型;
采用最終模型對細粒度圖像進行分類。
進一步地,所述構建定位分類子網絡具體為:
所述構建的定位分類子網絡包括三個協作的子網絡,分別為定位子網絡、教師子網絡和分類子網絡;各個子網絡中的特征提取器共享權重;
所述定位子網絡用于輸出輸入圖片的一系列關鍵區域和區域所包含的信息量;
所述教師子網絡將定位子網絡輸出的每個區域映射為一個數值并將其作為該區域的置信度;
所述分類子網絡將定位子網絡的輸出調整為預定義大小,再經過特征提取器提取特征,然后將提取的特征與輸入圖片的特征連接起來,最后通過完全連接層得出分類結果。
進一步地,所述對構建的定位分類子網絡進行聯合訓練,得到訓練好的模型具體為:
構建定位分類子網絡的總體損失函數Ltotal如下:
Ltotal=LI+λ·LS+μ·LC;
式中,LI為定位子網絡的損失函數,LS為分類子網絡的損失函數,LC為教師子網絡的損失函數,λ與μ為超參數;
采用隨機梯度下降的方法來優化總體損失函數Ltotal,訓練模型直至收斂,得到訓練好的模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011000935.1/2.html,轉載請聲明來源鉆瓜專利網。





