[發(fā)明專利]基于半監(jiān)督深度學(xué)習(xí)的圖像分類方法、裝置和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201810132654.8 | 申請日: | 2018-02-07 |
| 公開(公告)號: | CN108416370B | 公開(公告)日: | 2022-03-22 |
| 發(fā)明(設(shè)計)人: | 楊猛;陳林;于仕琪;朱英 | 申請(專利權(quán))人: | 深圳大學(xué) |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市世紀恒程知識產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 胡海國 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 監(jiān)督 深度 學(xué)習(xí) 圖像 分類 方法 裝置 存儲 介質(zhì) | ||
本發(fā)明公開了一種基于半監(jiān)督深度學(xué)習(xí)的圖像分類方法、裝置和存儲介質(zhì),其方法包括:獲取標簽訓(xùn)練圖像樣本和非標簽訓(xùn)練圖像樣本,得到標簽訓(xùn)練集;結(jié)合深度學(xué)習(xí)以及半監(jiān)督學(xué)習(xí)對標簽訓(xùn)練集進行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,建立統(tǒng)一的半監(jiān)督深度學(xué)習(xí)和未標注樣本類別估計的模型;基于半監(jiān)督深度學(xué)習(xí)和未標注樣本類別估計的模型進行圖像識別分類。本發(fā)明能利用隱藏在非標簽訓(xùn)練數(shù)據(jù)中的鑒別信息,同時也能利用當前深度特征的高度可分性,可以更有效、準確地利用未標注樣本,從而獲得更好的圖像識別性能。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,尤其涉及一種基于半監(jiān)督深度學(xué)習(xí)的圖像分類方法、裝置和存儲介質(zhì)。
背景技術(shù)
近幾年來,基于深度學(xué)習(xí)(Deep Learning)的技術(shù)在計算機視覺領(lǐng)域取得了很好的成效,比如,人臉識別和目標分類,其中代表性的深度學(xué)習(xí)方法有CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(遞歸神經(jīng)網(wǎng)絡(luò))、Autoencoder,GAN(生成式對抗網(wǎng)絡(luò)),等等。
然而,在實際應(yīng)用中,由于給樣本進行標注需要耗費大量的時間和人力,因此,在現(xiàn)實生活中,通常有大量的未進行標注的樣本,利用這些未進行標注的樣本來提高最后的識別效果的方法稱為半監(jiān)督學(xué)習(xí)。
為了能更好地利用非標簽訓(xùn)練數(shù)據(jù)的鑒別信息,以及深度特征的高鑒別性,基于深度半監(jiān)督學(xué)習(xí)的工作已經(jīng)得到了科研工作者的深入研究。比如,目前有通過整合卷積神經(jīng)網(wǎng)絡(luò)和高斯概率模型進行半監(jiān)督深度核學(xué)習(xí)的方法、通過同時最小化監(jiān)督和無監(jiān)督函數(shù)的損失來訓(xùn)練半監(jiān)督深度學(xué)習(xí)模型,等等。雖然半監(jiān)督深度學(xué)習(xí)的方法能夠?qū)W習(xí)高水平的表示特征,但是它忽略了如何更有效地利用非標簽樣本的高鑒別性。
發(fā)明內(nèi)容
本發(fā)明提供一種基于半監(jiān)督深度學(xué)習(xí)的圖像分類方法、裝置和存儲介質(zhì),旨在建立一個統(tǒng)一的半監(jiān)督深度學(xué)習(xí)和未標注樣本類別估計的模型,可以更有效、準確地利用未標注樣本,提高圖像識別效果。
為實現(xiàn)上述目的,本發(fā)明提供一種基于半監(jiān)督深度學(xué)習(xí)的圖像分類方法,包括以下步驟:
獲取標簽訓(xùn)練圖像樣本和非標簽訓(xùn)練圖像樣本,得到標簽訓(xùn)練集;
結(jié)合深度學(xué)習(xí)以及半監(jiān)督學(xué)習(xí)對所述標簽訓(xùn)練集進行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,建立統(tǒng)一的半監(jiān)督深度學(xué)習(xí)和未標注樣本類別估計的模型;
基于所述半監(jiān)督深度學(xué)習(xí)和未標注樣本類別估計的模型進行圖像識別分類。
可選地,所述結(jié)合深度學(xué)習(xí)以及半監(jiān)督學(xué)習(xí)進行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,建立統(tǒng)一的半監(jiān)督深度學(xué)習(xí)和未標注樣本類別估計的模型的步驟包括:
將所述標簽訓(xùn)練集輸入并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型,提取所述標簽訓(xùn)練圖像樣本和非標簽訓(xùn)練圖像樣本的深度特征;
對提取深度特征后的非標簽圖像樣本進行類別估計,得到類別估計結(jié)果;
根據(jù)所述類別估計結(jié)果,將可信度滿足預(yù)設(shè)條件的非標簽圖像樣本再次加入到卷積神經(jīng)網(wǎng)絡(luò)重新進行訓(xùn)練,得到半監(jiān)督深度學(xué)習(xí)和未標注樣本類別估計的模型。
可選地,所述基于所述半監(jiān)督深度學(xué)習(xí)和未標注樣本類別估計的模型進行圖像識別分類的步驟包括:
基于所述半監(jiān)督深度學(xué)習(xí)和未標注樣本類別估計的模型進行圖像字符識別和圖像目標分類。
可選地,所述獲取標簽訓(xùn)練圖像樣本和非標簽訓(xùn)練圖像樣本,得到標簽訓(xùn)練集的步驟之后還包括:
初始化所述標簽訓(xùn)練圖像樣本和非標簽訓(xùn)練圖像樣本數(shù)據(jù)。
可選地,所述初始化所述標簽訓(xùn)練圖像樣本和非標簽訓(xùn)練圖像樣本數(shù)據(jù)的步驟包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳大學(xué),未經(jīng)深圳大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810132654.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 在即時通信中提供即時監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對象尋址方法、電子設(shè)備及存儲介質(zhì)
- 一種機器人表情調(diào)用方法和家用機器人
- 計算機視覺訓(xùn)練系統(tǒng)和用于訓(xùn)練計算機視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





