[發明專利]基于主動學習和變分自編碼器的廣義零樣本目標分類方法有效
| 申請號: | 202110459763.2 | 申請日: | 2021-04-27 |
| 公開(公告)號: | CN113177587B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 李曉;翟之博 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06V10/778;G06N3/0455;G06N3/0464;G06N3/091;G06N3/0895 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 陳宏社;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 主動 學習 編碼器 廣義 樣本 目標 分類 方法 | ||
本發明提出了一種基于主動學習和變分自編碼器的廣義零樣本目標分類方法,用于解決現有技術中存在的由于未知類監督信息丟失導致的偏置問題和從高維特征到低維空間投影所導致的低維特征聚集問題,有效地提高了分類準確率,實現步驟為:獲取訓練樣本集Psubgt;train/subgt;和測試樣本集Psubgt;test/subgt;;構建基于變分自編碼器的廣義零樣本分類模型H;對基于變分自編碼器的廣義零樣本分類模型H中的變分自編碼器f和非線性分類器fsubgt;classifier/subgt;進行迭代訓練;獲取廣義零樣本的目標分類結果。本發明可以實現對缺乏訓練數據的稀有物種分類、生物醫學圖像識別等領域。
技術領域
本發明屬于零樣本圖像分類技術領域,涉及一種廣義零樣本目標分類方法,具體涉及一種基于主動學習和變分自編碼器的廣義零樣本目標分類方法,可用于稀有物種分類、生物醫學圖像識別等領域。
背景技術
目標分類作為人工智能主要的研究方向之一,隨著人工智能的蓬勃發展,目標分類已經廣泛應用于缺陷檢測、無人駕駛、醫學診斷等人工智能領城。當前目標分類的研究主要針對圖像的分類問題。但隨著社交網絡和社會標簽系統的快速發展,新的標簽和概念不斷涌現,隨之而來的是人們如何使用這些新標簽對圖像進行標記的問題,即廣義零樣本目標分類問題。在廣義零樣本目標分類問題中,已知類樣本集和未知類樣本集屬于不同的目標類別,并且對于未知類樣本集中樣本沒有帶標記的訓練樣本可用,其目的是實現一個從已知類樣本或未知類樣本到已知類和未知類所屬類別的分類。
現有的目標分類學習方法大多是監督學習方法,需要大量標記信息才能進行有效分類,因此不能適用于這種沒有標記信息的情況,而無監督的方法雖然可行但卻不能充分利用己有的相關領域中的信息,來提高目標領城中的分類準確率。針對上述情況,研究者提出了半監督學習,半監督學習一種是將監督學習和無監督學習相結合的學習方法,主要考慮的是如何利用少量的標注樣本和大量的未標注樣本進行訓練和分類的問題。
現有的廣義零樣本目標分類方法大多采用的是半監督的方法,通過建立視覺特征和監督信息之間的聯系來實現新目標的分類,由于未知類缺失有效的監督信息,導致現有的廣義零樣本目標分類方法都存在著較強的偏置問題,即在訓練階段,視覺特征通常被投影到由已知類確定的子空間中的幾個固定的點,這樣就導致了在測試階段中,測試數據集中的新類圖像傾向于被分到已知類當中,除此之外,廣義零樣本學習的方法通常會把視覺特征空間和語義空間投影到一個公共的子空間,通過拉近視覺特征和對應的語義在子空間中投影點的距離來減小兩個空間的結構差異,但這種方式往往使得不同類別樣本在子空間出現聚集的問題,即當將高維向量投影到低維空間時,會出現聚集現象,這樣的投影減小了樣本方差,從而導致投影點聚集成中心點,因而子空間的判別性降低,分類準確率也隨之下降。
例如Edgar?Schonfeld等人發表的名稱為“Generalized?Zero-and?Few-ShotLearning?via?Aligned?Variational?Autoencoders”(Proceedings?of?the?IEEE/CVFConference?on?Computer?Vision?and?Pattern?Recognition.2019:8247-8255)的論文中,提出了一種基于分布對齊和交叉重建對齊的變分自編碼器的廣義零樣本目標分類方法,該方法通過構建兩個變分自編碼器,分別將視覺特征和語義特征投影至相近的子空間。在分類時,先通過編碼器將樣本視覺特征投影至子空間,再用分類器對子空間特征進行分類,但該方法中并沒有解決由于未知類監督信息缺失帶來的偏置問題和從高維特征向低維空間投影所帶來的聚集性問題,即子空間并不具有較強的判別性,因而導致該方法的分類準確率較低。
主動學習方法能夠使得在模型在訓練的過程中主動地采樣出“難”分類的樣本數據,通過人為地對樣本數據添加標注信息,然后將人工標注得到的數據再次使用半監督學習模型進行訓練,這種主動采樣并添加標注信息的操作可以有效消除廣義零樣本問題中由于未知類監督信息丟失帶來的偏置問題。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110459763.2/2.html,轉載請聲明來源鉆瓜專利網。





