[發(fā)明專利]一種基于深度學(xué)習(xí)的小樣本圖像識別方法有效
| 申請?zhí)枺?/td> | 201910065984.4 | 申請日: | 2019-01-24 |
| 公開(公告)號: | CN109800811B | 公開(公告)日: | 2022-09-06 |
| 發(fā)明(設(shè)計(jì))人: | 李玲;劉婉瑩;劉丹;楊秀華;黃玉蘭;張海蓉;李志軍;佟宇琪;戴思達(dá);渠云龍;顧琳;李林;楊泰;梁楫坤 | 申請(專利權(quán))人: | 吉林大學(xué) |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82 |
| 代理公司: | 長春吉大專利代理有限責(zé)任公司 22201 | 代理人: | 王淑秋 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 樣本 圖像 識別 方法 | ||
本發(fā)明涉及一種基于深度學(xué)習(xí)的小樣本圖像識別方法,該方法包括下述步驟:一、劃分訓(xùn)練集;二、生成噪聲圖像;三、預(yù)訓(xùn)練原型空間判別網(wǎng)絡(luò);四、訓(xùn)練欺騙圖像生成網(wǎng)絡(luò);五、訓(xùn)練原型空間判別網(wǎng)絡(luò);六、重復(fù)步驟四和步驟五進(jìn)行交叉迭代訓(xùn)練,直到達(dá)到預(yù)先設(shè)定的迭代次數(shù)或準(zhǔn)確率不再提升;七、圖像類別識別。本發(fā)明在不改變已經(jīng)訓(xùn)練好的模型的前提下,借助每類少數(shù)幾個(gè)標(biāo)注樣本,通過泛化這些罕見的類別,識別訓(xùn)練過程中有從未見過的新類,而不需要額外的訓(xùn)練,圖像識別準(zhǔn)確率高。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像識別技術(shù)領(lǐng)域,涉及一種基于深度學(xué)習(xí)的小樣本圖像識別方法,更具體地說,本發(fā)明涉及一種基于生成對抗網(wǎng)絡(luò)和原型思想的深度學(xué)習(xí)小樣本圖像識別方法。
背景技術(shù)
深度學(xué)習(xí)已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域,解決各類問題,例如在圖像識別問題上,往往可以達(dá)到很高的準(zhǔn)確率。然而,深度學(xué)習(xí)是一種“數(shù)據(jù)饑餓型”的技術(shù),需要大量的標(biāo)注樣本才能發(fā)揮作用。可是在現(xiàn)實(shí)中,很多問題是沒有這么多標(biāo)注圖像的,獲取標(biāo)注圖像的成本也非常大,例如在醫(yī)療領(lǐng)域,安全領(lǐng)域等。隨著更多應(yīng)用場景的涌現(xiàn),我們越來越面臨著樣本數(shù)量不足的問題。因此,當(dāng)標(biāo)注數(shù)據(jù)量比較少時(shí),如何通過舉一反三的方式進(jìn)行小樣本圖像學(xué)習(xí),成為了一個(gè)重要的研究方向。目前小樣本問題的場景也就是小樣本問題面臨的問題是:不改變已經(jīng)訓(xùn)練好的模型的前提下,只能借助每類少數(shù)幾個(gè)標(biāo)注樣本,泛化這些罕見的類別,識別訓(xùn)練過程中有從未見過的新類,而不需要額外的訓(xùn)練。
圖像原型思想來源于原型網(wǎng)絡(luò),通過計(jì)算樣本圖片和每個(gè)類別的原型表達(dá)的距離來進(jìn)行分類。它假設(shè)每個(gè)類別都存在一個(gè)聚在某單個(gè)原型表達(dá)周圍的嵌入(embedding),該類的原型是支持集(support set)在嵌入空間中的均值。然后,分類問題變成在嵌入空間中的最近鄰。該方法思想十分簡單高效,效果也非常好。原型網(wǎng)絡(luò)本身就是一種小樣本學(xué)習(xí)方法,實(shí)驗(yàn)表明歐幾里得(squared Euclidean)距離比余弦(cosine)距離要好14到17個(gè)百分點(diǎn)。目前,利用原型網(wǎng)絡(luò)進(jìn)行小樣本學(xué)習(xí),在miniImageNet數(shù)據(jù)集上,支持集中每類圖像只有1個(gè)標(biāo)注樣本的情況下(one-shot-learning),查詢圖像識別準(zhǔn)確率僅達(dá)到49.2±0.78%,支持集中每類圖像有5個(gè)標(biāo)注樣本的情況下(five-shot-learning),查詢圖像識別準(zhǔn)確率達(dá)到僅68.20±0.66%。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種基于深度學(xué)習(xí)的小樣本圖像識別方法,該方法借助每類少數(shù)幾個(gè)標(biāo)注樣本,通過泛化這些罕見的類別,即可識別新圖像的類別,而不需要額外的訓(xùn)練,圖像識別準(zhǔn)確率高。
為解決上述技術(shù)問題,本發(fā)明的基于深度學(xué)習(xí)的小樣本圖像識別方法包括下述步驟:
一、劃分訓(xùn)練集
將訓(xùn)練集中的樣本圖像隨機(jī)劃分到支持集S和查詢集Q,訓(xùn)練集中每個(gè)類別樣本圖像的數(shù)目一般不少于600個(gè);其中支持集表示支持集S中包含了n個(gè)類別的樣本圖像,其中為支持集S中屬于類別k的樣本圖像的集合,是支持集S中屬于類別k的第m個(gè)樣本;查詢集同樣包含了n個(gè)類別的樣本圖像;其中,為查詢集Q中屬于類別k的樣本圖像的集合,是查詢集Q中屬于類別k的第l個(gè)樣本;
二.生成噪聲圖像
隨機(jī)生成噪聲圖像集合N,N中噪聲圖像數(shù)量是訓(xùn)練集圖像類別數(shù),噪聲圖像形狀與訓(xùn)練集中圖像相同;
三、預(yù)訓(xùn)練原型空間判別網(wǎng)絡(luò)Dφ
1.將支持集S中各類別樣本圖像子集{S1,S2,...Sk...Sn},輸入原型空間判別網(wǎng)絡(luò)Dφ,得到支持集S各類別樣本圖像原型{c1,c2,...ck...cn};
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吉林大學(xué),未經(jīng)吉林大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910065984.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





