[發明專利]一種基于半監督變分自編碼器的主動眾包圖像學習方法有效
| 申請號: | 202110531443.3 | 申請日: | 2021-05-17 |
| 公開(公告)號: | CN112990385B | 公開(公告)日: | 2021-09-21 |
| 發明(設計)人: | 李紹園;侍野;黃圣君 | 申請(專利權)人: | 南京航空航天大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 姜慧勤 |
| 地址: | 210016 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 編碼器 主動 圖像 學習方法 | ||
1.一種基于半監督變分自編碼器的主動眾包圖像學習方法,其特征在于,包括如下步驟:
步驟1,獲取圖像集X,將圖像集X按照預設比例隨機劃分為第一圖像集Xsup和第二圖像集Xunsup,將第一圖像集Xsup分發給網絡上的標注者進行標注,獲得相應的眾包標記Ycrowd;
步驟2,搭建半監督眾包學習網絡模型,所述半監督眾包學習網絡模型包括半監督變分自編碼器、眾包映射層和主動學習框架;
步驟3,將第一圖像集Xsup、第二圖像集Xunsup、眾包標記Ycrowd、第三圖像集X*和真實標記集Y*作為訓練集,輸入半監督眾包學習網絡模型,基于訓練集和網絡參數構造變分下界損失函數;第一次迭代時,X*和Y*均為空集;
所述變分下界損失函數的構造方法為:
對于x∈Xsup,其變分下界構造過程如下所示:
其中,x表示第一圖像集Xsup中的圖像,y表示x的真實標記,z表示隱變量,pθ(x,y)表示x與y的似然函數,表示期望,pθ(y)表示y的先驗分布,p(z)表示z的先驗分布,pθ(x|y,z)表示x的后驗分布,qφ(z|x,y)表示對p(z)的近似分布,表示x和y的損失函數,θ表示分布參數,φ為變分參數;
對于x′∈Xunsup,其變分下界構造過程如下所示:
其中,x′表示第二圖像集Xunsup的圖像,pθ(x′)表示關于x′的似然函數,pθ(x′|y,z)表示x′的后驗分布,qφ(y|x′)表示近似的pθ(y),qφ(y,z|x′)是對p(y,z)的近似分布,而p(y,z)是關于y,z的先驗聯合分布,表示關于x′和y的損失函數,表示qφ(y|x′)的熵,表示關于x′的損失函數;
最終的變分下界損失函數為:
當第一次迭代時,損失函數的第四項為0;
其中,表示變分下界損失函數,α、β均表示超參數,表示第一圖像集的分布,表示第二圖像集的分布,表示第三圖像集的分布,x*,y*分別表示第三圖像集的單張圖像和其真實標記,Wr表示第r個眾包映射層,y表示真實標記,表示由經過眾包映射層反向映射得到的目標標記,表示代入了的qφ(y|x);
步驟4,基于隨機梯度下降方法,端到端地對半監督眾包學習網絡模型進行訓練,得到訓練好的半監督眾包學習網絡模型;
步驟5,利用訓練好的半監督眾包學習網絡模型對第二圖像集Xunsup中每幅圖像的真實標記概率進行預測,從第二圖像集Xunsup中選擇真實標記概率預測值的熵最大的圖像Xs,獲取圖像Xs的真實標記Ys;
步驟6,將圖像Xs加入第三圖像集X*,將真實標記Ys加入真實標記集Y*,返回步驟3,直到當前迭代次數達到閾值為止,得到最終的半監督眾包學習網絡模型;
步驟7,對最終的半監督眾包學習網絡模型,刪掉重構部分和眾包映射層部分,將剩余部分作為眾包圖像分類器;
步驟8,利用眾包圖像分類器對待標注圖像進行標注,得到眾包學習標記。
2.根據權利要求1所述基于半監督變分自編碼器的主動眾包圖像學習方法,其特征在于,步驟2所述眾包映射層,具體形式如下:
其中,表示第r個標注者的眾包標記,Wr表示第r個眾包映射層,y表示真實標記,r=1,…,R,R為標注者的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學,未經南京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110531443.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于微生物核酸樣本的采集與保護裝置
- 下一篇:一種小型中藥烘干裝置





