[發明專利]一種基于證據理論的半監督圖像分類方法在審
| 申請號: | 202211533219.9 | 申請日: | 2022-12-02 |
| 公開(公告)號: | CN116051942A | 公開(公告)日: | 2023-05-02 |
| 發明(設計)人: | 張長青;王凱 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06V10/80 | 分類號: | G06V10/80 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 證據 理論 監督 圖像 分類 方法 | ||
本發明公開了一種基于證據理論的半監督圖像分類方法,包括:對半監督學習使用的圖像數據集進行處理,分別從每個類別中隨機抽出相同數量的少量樣本,并保留少量樣本的標簽組成訓練中使用的有標簽數據集;通過數據增強技術對原始圖像添加不同程度的擾動;對帶標簽的樣本進行弱增強,利用弱增強之后的樣本以有監督學習的方式訓練模型;對無標簽的樣本分別進行弱增強和強增強,將弱增強版本的無標簽樣本送入每個子網絡以生成證據,通過狄利克雷分布建模可獲得每個子網絡的不確定性,利用證據理論融合得到的證據和不確定性得到融合后的證據,基于融合后的證據可得到更可靠的分類結果和偽標簽;利用無標簽樣本及其偽標簽訓練網絡,繼續訓練后的網絡對圖像進行分類。
技術領域
本發明涉及圖像分類領域,尤其涉及一種基于證據理論的半監督圖像分類方法。
背景技術
近年來,隨著深度神經網絡的發展和大規模數據的收集,機器學習領域取得了巨大的成就。傳統的機器學習可以分為有監督學習、無監督學習和半監督學習。其中有監督學習是一種自然的學習模式的方法,它是在帶有標簽的數據集上訓練模型,標簽可以提供監督信息。有監督學習可以在大量標記數據的情況下獲得良好的性能和泛化能力。無監督學習是在不帶標簽的數據集上進行訓練,其直接從原始數據中學習,發掘數據中隱含的有價值的信息。無監督學習的任務通常有無監督特征學習、概率密度估計和聚類等,其也經常被用來做一些預訓練的任務。在實際應用中,雖然可以容易地獲取大量的數據,但是有監督學習所需的高質量標記數據仍然昂貴,需要花費大量的人力物力,因此許多數據集是由少量的高質量的有標簽數據和大量的無標簽數據組成的。有標簽數據帶有十分珍貴的標簽信息,無標簽數據也含有待挖掘的豐富信息,因此開發相對豐富的未標記數據是非常重要的,并且已經引起了越來越多的關注。對由小部分標簽數據和大量無標簽數據組成的數據的學習稱為半監督學習(Semi-Supervised?Learning),其目的是通過充分利用大量未標記數據來減少對標記數據的需求。半監督學習的重點是在于如何充分有效地利用大量無標簽數據。
在實際應用領域,通常有大量的未標記數據以及一小部分可用的高質量標記數據。對這些數據的學習被稱為半監督學習,其目的是通過充分利用大規模未標記數據來減少對標記數據的需求。最近,在圖像分類中,包括:偽標記和一致性正則化在內的代表性半監督學習技術已顯示出有效性和魯棒性。偽標記模型首先在標記數據上訓練,然后使用對未標記數據的預測作為連續訓練的監督。一致性正則化方法假設小擾動不會改變其模式,因此應用增強技術并約束其預測一致。半監督學習已成功地用于各種現實任務(例如:圖像分類、對象檢測和語義分割)以處理標記數據的缺乏。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211533219.9/2.html,轉載請聲明來源鉆瓜專利網。





