[發明專利]一種基于可靠權重最優傳輸的圖像分類方法在審
| 申請號: | 202010645952.4 | 申請日: | 2020-07-07 |
| 公開(公告)號: | CN111814871A | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 徐仁軍;劉偉明;林九鳴;錢昕玥;胡曉玥;趙胤;何京城;朱子航;何旭;孫誠博;周翔 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 劉靜 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 可靠 權重 最優 傳輸 圖像 分類 方法 | ||
本發明公開了一種基于可靠權重最優傳輸的圖像分類方法,首先對源域數據進行預處理,使得深度神經網絡擬合源域樣本圖像的樣本標簽;然后進行圖片標注,給目標域數據樣本打上偽標簽,再進行節點配對,實現源域和目標域中的相關聯的圖片的配對,最后通過特征提取器和自適應判別器實現自動分析,對圖像進行分類。本發明提出了一種利用空間原型信息和域內結構動態測量樣本域間差異的子空間可靠性方法。該方法可作為現有領域自適應技術的預處理步驟,大大提高了效率。本發明將收縮子空間可靠性與最優運輸策略相結合,可以使深度特征更加明顯,增強模型的魯棒性和有效性。本發明的深度神經網絡在各種數據集上工作穩定,性能優于現有方法。
技術領域
本發明涉及圖像分類領域,尤其涉及一種基于可靠權重最優傳輸的圖像分類方法。
背景技術
深度學習是計算機視覺領域中的重要方法,通過訓練學習樣本數據的內在規律和表示層次,在圖像分類,目標檢測和語義分割等領域被廣泛使用。傳統監督學習需要大量人工標注數據,非常費時費力。為避免機械重復的貼標簽工作,無監督領域自適應(Unsupervised Domain Adaptation,UDA)方法旨在將某個領域學習好的知識或模式應用到到新的不同但相關的領域中,用擁有豐富的監督信息的源域(Source Domain)來提升無標簽或者只有少量標簽的目標域(Target Domain)模型的性能。其中,最優傳輸(OptimalTransport)是一種較好的實現域間特征對齊的方法。但是,大多數基于最佳運輸的現有工程都忽略了域內結構,僅實現粗略的成對匹配,很容易將分布在聚類邊緣或遠離對應類中心的目標樣本誤分類。
對于無監督的領域自適應(UDA),傳統方法是利用域中不變特征訓練的方法進行域遷移,相關的域不變特征度量方法有:
a)最大均值差異Maximum Mean Discrepancy(MMD)
最大均值差異(MMD)是目前使用最廣泛的一種損失函數,主要用來度量兩個不同但相關的分布的距離。兩個分布的距離定義為:
H表示這個距離是由φ()將數據映射到再生希爾伯特空間(RKHS)中進行度量的。
b)Correlation Alignment(CORAL)
CORAL的方法,通過對source domain和target domain進行線性變換來將他們各自的的二階統計量對齊(對齊均值與協方差矩陣)。
表示第j維度下source(target)domain數據中的第i個樣本。用CS(CT)表示特征的協方差矩陣。|| ||F為矩陣的Frobenius范數,d為數據維度。
c)相對熵Kullback-Leibler_divergence(KL)
相對熵,又被稱為KL散度,是用來衡量兩個概率分布之間的不同程度。設P(x),Q(x)是兩個概率分布
利用對抗訓練(adversarial training)的方法進行域遷移
d)域對抗神經網絡Domain-Adversarial Neural Networks(DANN)
DANN提出的體系結構包括一個特征提取器(綠色)和一個標簽預測器(藍色),它們共同構成一個標準的前饋神經網絡。在基于反向傳播的訓練過程中,通過梯度反轉層將梯度乘以一定的負常數,將一個域分類器(紅色)連接到特征提取器,實現無監督域自適應。梯度反轉確保了兩個域上的特征分布是相似的(對于域分類器來說,盡可能難以區分),從而產生域不變的特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010645952.4/2.html,轉載請聲明來源鉆瓜專利網。





