[發明專利]基于主動學習和變分自編碼器的廣義零樣本目標分類方法有效
| 申請號: | 202110459763.2 | 申請日: | 2021-04-27 |
| 公開(公告)號: | CN113177587B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 李曉;翟之博 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06V10/778;G06N3/0455;G06N3/0464;G06N3/091;G06N3/0895 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 陳宏社;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 主動 學習 編碼器 廣義 樣本 目標 分類 方法 | ||
1.一種基于主動學習和變分自編碼器的廣義零樣本目標分類方法,其特征在于,包括如下步驟:
(1)獲取訓練樣本集Ptrain和測試樣本集Ptest:
將從零樣本圖像集O中獲取的包含ns個已知目標類別的n1幅圖像以及每幅已知類別圖像的目標類別標簽組成的已知類訓練樣本集Ptrains,和從O中獲取的包含nu個未知目標類別的n2幅圖像組成未知類訓練樣本集Ptrainu,組成訓練樣本集Ptrain,同時將從O中獲取的包含nu個未知目標類別的m幅圖像組成測試樣本集Ptest,其中,ns≥10,n1≥1000,nu≥10,n2≥1000,m≥1000,且n1+n2>m;
(2)構建基于變分自編碼器的廣義零樣本分類模型H:
(2a)構建基于變分自編碼器的廣義零樣本分類模型H的結構:
構建包括變分自編碼器f和非線性分類器fclassifier的廣義零樣本分類模型的結構,其中變分自編碼器由并行連接的第一變分自編碼器VAE和第二變分自編編碼器CVAE組成,VAE由順次連接的第一編碼器f1encoder和第一解碼器f1decoder組成,CVAE由順次連接的第二編碼器f2encoder和第二解碼器f2decoder組成,非線性分類器fclassifier的輸入與第一編碼器f1encoder的輸出相連;
(2b)定義廣義零樣本分類模型H的損失函數:
定義廣義零樣本分類模型H中變分自編碼器f的損失函數為L,非線性分類器fclassifier的損失函數LClassifier:
L=LVAE+LCVAE+λLDA
其中,LVAE表示第一變分自編碼器VAE的損失函數,LCVAE表示第二變分自編編碼器CVAE的損失函數,λ表示權重系數,λ∈(0,1),LDA表示VAE和CVAE的對齊損失函數,μ1和μ2分別表示VAE和CVAE輸出的隱含分布的均值,σ12和σ22分別表示VAE和CVAE輸出的方差,||·||2表示向量二范數,||·||Frob表示矩陣的Frobenius范數,LClassifier表示非線性分類器fclassifier的損失函數,KL(·)為概率分布間的Kullback-Leibler散度,N(μ1,σ12)表示均值為μ1方差為σ12的正態分布,N(μ2,σ22)表示均值為μ2方差為σ22的正態分布,和分別表示VAE和CVAE的重建損失函數,xi表示第i個已知類圖像特征,和分別表示VAE和CVAE對xi的重建結果,Σ表示求和操作,yj表示訓練樣本集Ptrain中第j類樣本的標簽,pj表示xi被分類為yj的概率;
(3)對基于變分自編碼器的廣義零樣本分類模型H中的變分自編碼器f和非線性分類器fclassifier進行迭代訓練:
(3a)將訓練樣本集Ptrain作為殘差網絡模型的輸入進行特征提取,得到已知類訓練樣本集Ptrains對應的圖像特征集和未知類訓練樣本集Ptrainu對應的圖像特征集
(3b)初始化迭代次數為q,最大迭代次數為Q,Q≥30,并令q=1;
(3c)將圖像特征集P'trains作為廣義零樣本分類模型H的輸入,變分自編碼器f中的第一變分自編碼器VAE所包含的第一編碼器f1encoder對每個已知類圖像特征xi進行編碼,得到隱含分布的均值和方差非線性分類器fclassifier對進行分類,得到已知類圖像特征xi所屬各類的概率CVAE所包含的第二編碼器f2encoder對每個已知類圖像特征xi和特征標簽yi進行編碼,得到隱含分布的均值和方差
(3d)第一解碼器f1decoder對隱含變量進行解碼,得到第一圖像重建特征同時第二解碼器f2decoder對隱含變量進行解碼,得到第二圖像重建特征其中,z1和z2表示從隨機高斯分布z~N(0,1)中采樣得到的高斯噪聲;
(3e)采用變分自編碼器f的損失函數為L,并通過第一編碼器f1encoder編碼的和第二編碼器f2encoder編碼的和以及第一解碼器f1decoder解碼的和第二解碼器f2decoder解碼的計算變分自編碼器的損失值L*,同時采用非線性分類器fclassifier的損失函數LClassifier,并通過非線性分類器fclassifier的分類結果計算非線性分類器的損失值(3f)采用反向傳播法,并通過L*計算L的梯度同時通過計算LClassifier的梯度然后采用梯度下降法,通過和分別對變分自編碼器f和非線性分類器fclassifier的權值參數進行更新;
(3g)將圖像樣本特征集P'trainu作為第一變分自編碼器VAE的輸入,第一編碼器f1encoder對每個未知類圖像特征uj進行編碼,采用非線性分類器fclassifier對編碼結果進行分類,得到uj所屬各類的概率
(3h)通過中概率的最大值和次大值計算的不確定性并將ui、和組合為三元組集合的計算公式為:
(3i)對三元組集合S1進行聚類,并對聚類獲取的nu個類別中的三元組中的不確定性按照由小到大的順序進行排列,然后選取每個類別對應的不確定性集合中前nadd個未知類圖像特征uj,組成待標注樣本集S2,其中nadd>0;
(3j)對S2中的未知類圖像特征uj添加標注信息后加入P'trains中,同時從P'trainu中刪除S2中的uj,并判斷q>Q是否成立,若是,得到訓練好的廣義零樣本分類模型H*,否則,令q=q+1,并執行步驟(3c);
(4)獲取廣義零樣本的目標分類結果:
(4a)將測試樣本集Ptest作為殘差網絡模型的輸入進行特征提取,得到未知類測試樣本集Ptest的圖像特征集P'test={t1,…,tk,…,tm},其中tk為P'test中第k個樣本,m為P'test中的樣本個數;
(4b)將P'test作為訓練好的廣義零樣本分類模型H*的輸入,第一編碼器f1encoder對每個未知類圖像特征tk進行編碼,得到隱含分布的均值非線性分類器fclassifier對進行分類,得到m個測試樣本的分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110459763.2/1.html,轉載請聲明來源鉆瓜專利網。





