[發明專利]一種用于解決災難性遺忘問題的終生學習方法有效
| 申請號: | 202011141948.0 | 申請日: | 2020-10-22 |
| 公開(公告)號: | CN112257864B | 公開(公告)日: | 2022-08-16 |
| 發明(設計)人: | 于元隆;劉子夜 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 陳明鑫;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 解決 災難性 遺忘 問題 終生 學習方法 | ||
本發明涉及一種用于解決災難性遺忘問題的的終生學習方法。該方法包括:(1)借助舊求解器的編碼網絡,獲得生成模型更新前后的特征信息;(2)對更新前的特征進行白化,并通過新舊特征的線性組合來獲得魯棒特征,用于構造變換矩陣對新特征白化,從而獲得更新前后的正交特征信息;(3)依據風格遷移算法,利用Gram矩陣得到生成模型更新前后的正交風格信息,并通過融合正交風格一致性的損失項來更新生成模型;(4)基于知識蒸餾算法訓練求解器與生成的偽數據配對來代表舊任務,與新數據混洗用于求解器的更新。本發明能夠減輕生成模型中隨著任務增加造成的生成模型的遺忘以及由于求解器獨立訓練造成的分類信息丟失的問題,從而達到解決神經網絡以及人工智能(AI)系統開發存在的終生學習中的災難性遺忘問題。
技術領域
本發明涉及人工智能技術領域,具體為一種用于解決災難性遺忘問題的的終生學習方法。
背景技術
現實世界中運行的計算系統往往會遇到連續的信息流,或者由于存儲限制或隱私問題而只能臨時使用數據的情景,此時需要從動態數據分布中學習和記住多個任務,不斷更新模型來適應新任務。但是,機器學習所建立的是無法隨時間適應或擴展其行為的靜態模型,當處理新任務時,需要對整個模型進行重新訓練,此時更新后的模型不再適用于舊任務的處理。終生學習(lifelong learning)試圖去模擬人類的行為,使得針對序列任務,模型不僅可以很好的處理當前任務,也要保留處理舊任務的能力,有記憶的保留之前學到的知識,并逐漸擴展用于未來任務的學習。但是通過隨機梯度下降訓練的深度神經網絡模型從非平穩數據分布中獲取增量可用信息通常會導致災難性的遺忘或干擾,即:隨著新任務或領域的增加,先前學習的任務或領域的性能不應(顯著)隨時間降低。終生學習中的災難性遺忘問題對神經網絡以及人工智能(AI) 系統的開發提出了長期的挑戰。
現今試圖去解決災難性遺忘的方法中,具有最理想效果的主流方法是基于數據重現的方法。主要是通過儲存少部分樣本或壓縮樣本到生成模型中,與新任務數據混洗用于新模型的訓練。最值得注意的是Rebuffi等人的工作,該方法依據類別存儲舊任務中每個類的樣例子集,計算新舊任務各自特征向量,通過最近均值分類算法取其類別標簽。但是這個方法受到聯合訓練的限制。D.Lopez-Paz等人提出用約束優化來解決這個問題,為后向/向前傳輸留出了更多空間,該方法提出限制新任務的更新,使其不干擾先前的任務。R.Aljundi等人將此方法擴展到了沒有任務界限的在線的連續學習環境。然而,這些方法需要存儲樣本,隨著任務的增加而造成存儲容量的爆炸。
近年來,生成模型已經顯示出生成高質量圖像的能力,為建模數據生成分布和對生成的示例進行再訓練提供了可能性。因此,Hanul Shin等人為了解決以上問題,提出generative replay(GR)的方法,在生成對抗網絡(GAN)框架中訓練了一個深度生成模型,以模仿過去的數據。然后將生成的數據與過去任務求解器的配對來表示舊任務。生成器-求解器對可以根據需要生成大量偽數據對,與新數據混洗來更新模型。該框架可用于涉及隱私問題的各種實際情況。但是基于生成模型的重現算法,需要生成模型的不斷更新,性能極大的依賴于生成模型的質量。其存在的主要難點有:
(1)生成模型的遺忘
通過使用隨機梯度下降技術訓練的生成模型,隨著任務序列的增加,在生成模型中壓縮舊任務的數據,將慢慢忘記以前記住的分布。即遺忘發生在生成模型中,導致生成的數據不能表示先前任務的數據分布,這使得試圖模擬聯合訓練的重現的方法不能很好的解決終生學習中的災難性遺忘問題。
(2)求解器的誤差傳遞
不同任務的求解器是獨立訓練的,因此新求解器無法保留先前學習的分類知識。另外,由生成器-求解器對產生的偽標簽是one-hot形式,丟失了類別之間的分布信息。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011141948.0/2.html,轉載請聲明來源鉆瓜專利網。





