[發明專利]一種基于自編碼器的零樣本圖像識別算法及系統在審
| 申請號: | 202010534066.4 | 申請日: | 2020-06-12 |
| 公開(公告)號: | CN111680757A | 公開(公告)日: | 2020-09-18 |
| 發明(設計)人: | 汪金玲 | 申請(專利權)人: | 汪金玲 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 湖南省長沙市高新開發*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 編碼器 樣本 圖像 識別 算法 系統 | ||
本發明涉及一種圖像識別的技術領域,揭露了一種基于自編碼器的零樣本圖像識別算法及系統,算法包括:使用預訓練的Arc?SENet網絡提取源域中已知類樣本的特征向量;利用預設的自編碼器在源域中學習出源域的投影矩陣和解碼投影矩陣;在目標域使用預設的自編碼器將未知樣本的屬性投影到特征空間;將源域的自編碼器和目標域的編碼器關聯起來,通過迭代計算得到目標域中未知類樣本的屬性矩陣和特征矩陣;分別利用正向標簽預測和反向標簽預測兩種方式對未知樣本進行標簽預測,若兩種方式得到標簽結果相同,則所得標簽即為圖像樣本識別結果。本發明還提出一種基于自編碼器的零樣本圖像識別算法的系統。本發明實現了對圖像的識別。
技術領域
本發明涉及圖像識別的技術領域,尤其涉及一種基于自編碼器的零樣本圖像識別算法及系統。
背景技術
圖像識別作為人工智能主要的研究方向之一,隨著人工智能的蓬勃發展,圖像識別已經廣泛應用于缺陷檢測、無人駕駛、醫學診斷等人工智能領域。當前圖像識別的研究主要針對圖像的分類問題,但隨著社交網絡和社會標簽系統的飛速發展,新的標簽和概念不斷涌現,隨之而來的是人們使用這些新標簽對圖像進行標記的需求。而已有的監督學習方法需要大量標記信息才能進行有效分類,因此不能適用于這種沒有標記信息的情況,而無監督的方法雖然可行,但卻不能充分利用已有的相關領域中的信息來提高目標領域中的分類性能,針對上述情況,相關研究者提出了零樣本學習。
在零樣本學習中,源領域和目標領域含有不同的標簽集,并且對于目標領域含有不同的標簽集,沒有存在標簽的訓練樣本可用。因此,零樣本學習的目標主要是將從有充足訓練樣本的源領域中的已知類中學到的知識有效地遷移到目標領域中,以此來為在訓練過程中沒有出現過的新類構建有效的分類模型。零樣本學習的過程可以看做是圖像與視覺屬性之間的映射,利用既有的特征提取模型來提取圖像的特征,提取出的特征又被稱為特征空間,而人工標定的屬性被稱為屬性空間,因此零樣本學習的過程又可以看做是特征空間與屬性空間之間的映射。
現有零樣本學習技術一般采用基于投影的方法,這類方法首先在標簽已知的源域中訓練出從樣本特征到語義屬性空間的投影矩陣,然后將訓練得到的投影矩陣應用到目標域中得出未知類樣本的屬性,最后通過近鄰準則等方法得到目標域樣本的標簽,然而源域中樣本的類別和目標域中樣本的類別不相交,這些類的潛在數據分布可能也不同的。因此,如果將源域中學習得到的投影矩陣直接應用到目標域,則可能會導致未知類樣本的屬性預測不準確的問題。
鑒于此,在從源域中訓練出有效樣本特征的同時,如何利用源域樣本特征準確預測未知類樣本的屬性,從而根據預測出的樣本屬性進行圖像識別,成為本領域技術人員亟待解決的問題。
發明內容
本發明提供一種基于自編碼器的零樣本圖像識別算法及系統,在從源域中訓練出有效樣本特征的同時,如何利用源域樣本特征準確預測未知類樣本的屬性,從而根據預測出的樣本屬性進行圖像識別。
為實現上述目的,本發明提供的一種基于自編碼器的零樣本圖像識別算法,包括:
使用預訓練的Arc-SENet網絡提取源域中已知類樣本的特征向量;
將所述多個已知類樣本的特征向量拼接為已知類樣本的特征矩陣,利用預設的自編碼器在源域中學習出源域的投影矩陣和解碼投影矩陣;
在目標域通過最小化自編碼器的目標函數,將未知樣本的屬性投影到特征空間;
將源域的自編碼器和目標域的編碼器關聯起來,得到結合源域和目標域的自編碼器目標函數;
通過對目標函數進行迭代計算,得到目標域中未知類樣本的屬性矩陣和特征矩陣;
根據所述目標域中未知類樣本的屬性矩陣和特征矩陣,分別利用正向標簽預測和反向標簽預測兩種方式對未知樣本進行標簽預測,若兩種方式得到標簽結果相同,則所得標簽即為圖像樣本識別結果,否則則將未知類樣本重新輸入自編碼進行樣本空間投影計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于汪金玲,未經汪金玲許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010534066.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種帶注意力機制的目標密度估計方法
- 下一篇:一種可折疊集裝箱式活動房
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





