[發(fā)明專利]一種基于大腦神經(jīng)突觸記憶機制的面向開放世界連續(xù)學習方法在審
| 申請?zhí)枺?/td> | 201811532220.3 | 申請日: | 2018-12-14 |
| 公開(公告)號: | CN109657791A | 公開(公告)日: | 2019-04-19 |
| 發(fā)明(設(shè)計)人: | 李海峰;彭劍;蔣浩;李卓 | 申請(專利權(quán))人: | 中南大學 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04 |
| 代理公司: | 北京潤平知識產(chǎn)權(quán)代理有限公司 11283 | 代理人: | 黃志興;趙東方 |
| 地址: | 410083 *** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 突觸 大腦神經(jīng) 記憶機制 修剪 學習 視覺 卷積神經(jīng)網(wǎng)絡(luò) 感知模塊 強化學習 任務參數(shù) 任務數(shù)據(jù) 任務學習 網(wǎng)絡(luò)重組 重新組織 重組模塊 最大響應 災難性 可塑性 構(gòu)建 遺忘 網(wǎng)絡(luò) 開放 保留 更新 保證 | ||
本發(fā)明公開了一種基于大腦神經(jīng)突觸記憶機制的面向開放世界連續(xù)學習方法,首先利用深度卷積神經(jīng)網(wǎng)絡(luò)建立感知模塊,對當前視覺任務進行學習;其次,構(gòu)建網(wǎng)絡(luò)重組模塊,在已訓練好的模型上進行突觸的修剪和強化,從而減少突觸的連接和強化學習到的知識;最后,在學習新的視覺任務時對前面記憶進行鞏固,通過其保護新任務的信息對前面任務的干擾。本發(fā)明在一個任務數(shù)據(jù)上訓練完成后,重組模塊會重新組織網(wǎng)絡(luò),修剪掉不重要的參數(shù),提升參數(shù)的可塑性,同時為了保證當前任務的性能,通過強化重要的參數(shù)來鞏固當前的知識,并更新網(wǎng)絡(luò);在學習新的任務時,通過保留原任務參數(shù)空間下的最大響應圖來指導新任務學習,從而避免災難性遺忘。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于大腦神經(jīng)突觸記憶機制的面向開放世界連續(xù)學習方法,屬于人工智能領(lǐng)域。
背景技術(shù)
人類從嬰兒開始就不斷感知周圍環(huán)境并逐步地學習,掌握各種技能。例如,先學會走路,然后學會跑步,騎車,這種逐步獲取和微調(diào)已有知識,以及融合新的知識的同時仍能夠保留之前學習到的經(jīng)歷,稱為連續(xù)學習,是通往智能的關(guān)鍵。
人工智能的快速發(fā)展離不開深度學習技術(shù)的突破。近年來,深度學習在各個領(lǐng)域取得了令人矚目的成就,從語音識別到計算機視覺,以及與強化學習算法結(jié)合后的“AlphaGo”,在很多項目上開始碾壓人類。
然而,現(xiàn)有的深度模型基于封閉性假設(shè),主要包括:
首先是樣本空間封閉假設(shè),深度學習方法通常首先需要預先構(gòu)建海量的、封閉的訓練庫,然后從訓練庫中學習特征。數(shù)據(jù)空間的不完備性和封閉性存在一個根本問題:測試會嚴重依賴于訓練庫覆蓋能力,模型的泛化能力會受到極大的影響。
其次是任務的封閉性。深度學習的方法主要面向單一特定任務,構(gòu)建特定模型。基于每一個任務和每一個數(shù)據(jù)集來建立模型。
然而,現(xiàn)實世界中運行的計算系統(tǒng)接觸到的信息流是連續(xù)的,需要從動態(tài)的數(shù)據(jù)分布中學習和記住多個任務。例如,在agent與周圍環(huán)境交互的過程中需要其能夠從過去的經(jīng)驗中學習,再或者agent從數(shù)據(jù)流中學習各個類,數(shù)據(jù)被逐步引入到模型中,需要算法連續(xù)地從序列數(shù)據(jù)流中學習新的類。
盡管傳統(tǒng)的一些方法可以一定程度解決這個問題,但是仍然存在很多局限。而且,在某些場景下,例如自動駕駛,需要模型在學習過程中快速地做出反應,傳統(tǒng)的一些方法過于低效,而且會影響新任務的學習。
人類基于突觸可塑性的連續(xù)學習機制啟發(fā)我們:一是大腦神經(jīng)元的連接是過參數(shù)化的,較少的連接就能學習某一任務,這是大腦保持連續(xù)學習的充分條件;二是大腦通過突觸的可塑性來處理新舊任務的沖突,可塑性越弱說明神經(jīng)元間的連接對當前任務越重要。已有的研究也表明不同的參數(shù)配置神經(jīng)網(wǎng)絡(luò)能夠得到相當?shù)谋憩F(xiàn),證實了模型過參數(shù)化問題。基于這一研究,如何將大腦神經(jīng)元突觸可塑性機制引入神經(jīng)網(wǎng)絡(luò)中克服災難性遺忘具有重要的意義。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于大腦神經(jīng)突觸記憶機制的面向開放世界連續(xù)學習方法,以基于深度學習技術(shù)構(gòu)建快速、靈活的學習系統(tǒng),適應開放真實環(huán)境下的人工智能應用需要。
為了實現(xiàn)上述目的,本發(fā)明提供一種基于大腦神經(jīng)突觸記憶機制的面向開放世界連續(xù)學習方法,包括如下步驟:
(1)利用深度卷積神經(jīng)網(wǎng)絡(luò)建立感知模塊,對當前視覺任務進行學習;
(2)構(gòu)建網(wǎng)絡(luò)重組模塊,在已訓練好的模型上進行突觸的修剪和強化,從而減少突觸的連接和強化學習到的知識;
(3)在學習新的任務時,通過保留原任務參數(shù)空間下的最大響應圖來指導新任務學習,從而避免災難性遺忘。
進一步地,所述步驟(1)包括以下步驟:
(11)根據(jù)當前任務類型和數(shù)據(jù),構(gòu)建基于深度卷積神經(jīng)網(wǎng)絡(luò)識別模型,包括基礎(chǔ)網(wǎng)絡(luò)和分類器;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中南大學,未經(jīng)中南大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811532220.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多權(quán)值突觸的神經(jīng)元構(gòu)造方法
- 使用記憶切換元件的具有尖峰-時間依賴塑性的電子學習突觸
- 強化學習的電子突觸
- 可塑性突觸管理
- 三值神經(jīng)網(wǎng)絡(luò)突觸陣列及利用其的神經(jīng)形態(tài)計算網(wǎng)絡(luò)系統(tǒng)
- 用于存儲和生成連接性信息的神經(jīng)形態(tài)電路
- 一種硬件脈沖神經(jīng)網(wǎng)絡(luò)系統(tǒng)
- 可變精度神經(jīng)形態(tài)學結(jié)構(gòu)
- 一種基于形狀記憶合金驅(qū)動的自適應式散熱突觸結(jié)構(gòu)
- 一種基于柔性材料的脈沖神經(jīng)網(wǎng)絡(luò)電路





