[發明專利]一種用于解決災難性遺忘問題的終生學習方法有效
| 申請號: | 202011141948.0 | 申請日: | 2020-10-22 |
| 公開(公告)號: | CN112257864B | 公開(公告)日: | 2022-08-16 |
| 發明(設計)人: | 于元隆;劉子夜 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 陳明鑫;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 解決 災難性 遺忘 問題 終生 學習方法 | ||
1.一種用于解決災難性遺忘問題的終生學習方法,其特征在于,包括如下步驟:
步驟S1:將生成器更新前后的生成數據輸入求解器編碼部分,得到模型更新前后的新舊特征,并計算對應特征均值向量;
步驟S2;對特征均值向量進行重組,并依據重組特征均值向量構造白化的變換矩陣,得到模型更新前后的正交特征;所述步驟S2具體包括:
步驟S21:利用生成模型更新前的特征均值向量μt-1,構造對應變換矩陣進行白化,獲得模型更新前的正交特征;
步驟S22:將新舊特征均值向量μt、μt-1進行線性組合,可得t時刻穩定的特征均值向量:μt=k1μt-1+k2μt;
步驟S23:基于步驟S22獲得的特征均值向量,構造對應轉換矩陣進行白化,獲得生成模型更新后的正交特征;
步驟S3:基于正交特征獲得生成模型更新前后的正交風格信息;
步驟S4:融合正交風格一致性的損失項來更新生成模型,生成可以代表舊任務的偽數據;
所述步驟S3中基于正交特征獲得生成模型更新前后的正交風格信息以及步驟S4中融合正交風格一致性的損失項來更新生成模型的具體實現方式如下:
在得到更新前后圖像的正交特征后,依據風格遷移算法,利用Gram矩陣得到在卷積層l下,更新前后圖像的正交特征各自的正交風格表示形式Gl(x′t-1)和Gl(x′t),同時可得卷積層l對總正交風格損失的貢獻為:
并且總的正交風格損失為:
其中是每個層對第t個任務中總損失的貢獻的加權因子,L為求解器中卷積層的總數;
具有Nl個不同過濾器的網絡層l具有Nl個特征圖,每個特征圖的大小為Ml,其中Ml是特征圖的高度乘以寬度;網絡層l中的正交風格信息存儲在矩陣中,其中是第l層中的第i個過濾器的位置j的激活值;
在特征圖中,每個數字都來自在相應位置處卷積的相應過濾器;特征相關性由中的Gram矩陣Gl給出,其中是矢量化特征圖i和j之間的內積;Gram矩陣的非對角元素表示兩個濾波輸出特征之間的相關性,對角元素反映每個出現在圖像中的濾波輸出特征的值;通過利用構建在網絡不同層上的正交風格特征空間捕獲正交樣式信息,獲得圖像的多尺度風格表示;
第t個任務下生成器的損失為生成模型的損失與正交風格損失的和,使得生成模型在更新的過程中保留圖像穩定的正交風格信息;
其中,為生成對抗模型的損失,γ是正交風格損失的權重;
步驟S5:基于知識蒸餾算法訓練求解器與生成的偽數據配對來代表舊任務,與新數據混洗用于求解器的更新;所述步驟S5具體包括:
訓練求解器solver:
在任務t時刻中,讓在任務增量步驟t-1中的求解器St-1作為教師模型;以教師模型St-1來指導學生模型St的學習,使得學生模型St在學習新任務同時維持已知任務的性能;任務t時刻的知識蒸餾損失:
其中y和是任務增量步驟t時刻St-1和St的預測矢量,N為St-1中類別數,是記錄的概率和當前概率的修改版本:
T是溫度;
通過在訓練新任務時增加蒸餾損失來減輕先前任務的遺忘,在t時刻處求解器更新的損失為:
其中是當前任務的分類損失,β是蒸餾損失的權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011141948.0/1.html,轉載請聲明來源鉆瓜專利網。





