[發明專利]基于對比學習的自監督圖像分類方法有效
| 申請號: | 202011134658.3 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112381116B | 公開(公告)日: | 2022-10-28 |
| 發明(設計)人: | 林志賢;彭祎祺;周雄圖;張永愛;林珊玲 | 申請(專利權)人: | 福州大學;閩都創新實驗室 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 陳明鑫;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 對比 學習 監督 圖像 分類 方法 | ||
本發明涉及一種基于對比學習的自監督圖像分類方法,包括以下步驟:步驟S1:獲取無標簽數據,并進行隨機增強生成不同視圖;步驟S2:對視圖進行特征提取,無監督對比計算損失,得到無監督分類模型C1;步驟S3:對無標簽數據中部分進行人工標注,作為訓練驗證集;步驟S4:將C1作為預訓練模型,根據訓練驗證集進行微調;步驟S5:提取訓練驗證集的特征,有監督對比計算損失,得到C2;步驟S6:根據C2對無標簽數據預測標簽,并篩選置信度高于預設值的數據作為訓練樣本;步驟S7:基于訓練樣本,將C2作為預訓練模型,選取小網絡進行訓練微調,將驗證輸出準確率最高的作為最佳分類模型C3。本發明能夠有效利用無標簽數據訓練泛化的圖像分類模型,解決多類圖像分類問題。
技術領域
本發明屬于計算機視覺技術領域,具體涉及一種基于對比學習的自監督圖像分類方法。
背景技術
隨著信息時代的降臨,大量圖像數據涌入我們的生活。這些圖像來自互聯網、智能手機等社交工具,人工處理海量的圖片十分耗費時間,圖像檢測分類顯得非常重要。
傳統的圖像分類問題主要依賴人工根據以往經驗去判斷,這樣處理容易受人工主觀的影響,導致和效率精度不高。近年來,人們對神經網絡的不斷研究,使得計算機視覺在工業領域應用越來越廣泛。基于深度學習的圖像分類算法表現出良好的性能,想要訓練一個魯棒性強性能好的模型主要依賴于純凈類別平衡的標注數據集,而現實的數據常常難以人工標注類別或進行人工類別標注的成本太高,每個類別的數據量都各有不同。大部分圖片是沒有標簽的,如何將這些無標簽的寶貴數據加入模型訓練中,并且提升模型準確率,是目前的關鍵技術問題。
發明內容
有鑒于此,本發明的目的在于提供一種基于對比學習的自監督圖像分類方法,能夠有效利用無標簽數據訓練泛化的圖像分類模型,解決多類圖像分類問題。
為實現上述目的,本發明采用如下技術方案:
一種基于對比學習的自監督圖像分類方法,包括以下步驟:
步驟S1:獲取無標簽數據,并進行隨機增強生成不同視圖;
步驟S2:對視圖進行特征提取,無監督對比計算損失,得到無監督分類模型C1;
步驟S3:對無標簽數據中部分進行人工標注,作為訓練驗證集;
步驟S4:將C1作為預訓練模型,根據訓練驗證集進行微調;
步驟S5:提取訓練驗證集的特征,有監督對比計算損失,得到最佳微調模型C2;
步驟S6:根據最佳微調模型C2對無標簽數據預測標簽,并篩選置信度高于預設值的數據作為訓練樣本;
步驟S7:基于訓練樣本,將最佳微調模型C2作為預訓練模型,選取小網絡進行訓練微調,將驗證輸出準確率最高的作為最佳分類模型C3。
進一步的,所述隨機增強包括0.5概率的圖像翻轉,隨機高斯模糊和顏色失真。
進一步的,所述步驟S2具體為:
步驟S21:將視圖輸入不含線性全連接層的卷積殘差網絡Resnet50中,獲得特征向量;
步驟S22:將特征向量作為輸入多層感知器MLP映射到對比損失空間;
步驟S23:使用矩陣相似對比計算損失函數
其中是一個批次中數據總量,yi是圖像i的標簽;
步驟S24:直到closs值最小,選擇該無監督訓練模型C1。
進一步的,所述MLP采用基礎的三層結構,輸入層,一層隱藏層和輸出層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學;閩都創新實驗室,未經福州大學;閩都創新實驗室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011134658.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種低成本冷軋低碳搪瓷鋼及其制造方法
- 下一篇:一種智能止血帶裝置





