[發(fā)明專利]一種基于元學(xué)習(xí)的快速適應(yīng)DRBM方法在審
| 申請?zhí)枺?/td> | 202110134999.9 | 申請日: | 2021-01-29 |
| 公開(公告)號: | CN112862094A | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設(shè)計)人: | 張新禹;劉子衿;任祖煜;霍凱;劉振;張雙輝;劉永祥;姜衛(wèi)東;黎湘;盧哲俊 | 申請(專利權(quán))人: | 中國人民解放軍國防科技大學(xué) |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04;G06F17/18 |
| 代理公司: | 湖南企企衛(wèi)知識產(chǎn)權(quán)代理有限公司 43257 | 代理人: | 任合明 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 學(xué)習(xí) 快速 適應(yīng) drbm 方法 | ||
本發(fā)明屬于機器學(xué)習(xí)領(lǐng)域,具體涉及一種基于元學(xué)習(xí)的DRBM方法,通過改進網(wǎng)絡(luò)的訓(xùn)練?測試算法,將算法分為元學(xué)習(xí)和模型學(xué)習(xí)兩個階段。在元學(xué)習(xí)階段利用訓(xùn)練任務(wù)更新網(wǎng)絡(luò)參數(shù),并將更新后的網(wǎng)絡(luò)參數(shù)作為模型學(xué)習(xí)階段的網(wǎng)絡(luò)參數(shù)初始值,使網(wǎng)絡(luò)參數(shù)初始值能夠使網(wǎng)絡(luò)訓(xùn)練的損失函數(shù)下降更快并且更容易達到全局最優(yōu),在模型學(xué)習(xí)階段利用測試任務(wù)更新網(wǎng)絡(luò)參數(shù)并進行測試。該算法引入元學(xué)習(xí)的方法對DRBM的訓(xùn)練過程進行改進,使網(wǎng)絡(luò)參數(shù)的元學(xué)習(xí)階段梯度下降方向為向“最適應(yīng)”點下降,使得網(wǎng)絡(luò)能夠快速適應(yīng)到一個新的任務(wù)中。
技術(shù)領(lǐng)域
本發(fā)明屬于機器學(xué)習(xí)領(lǐng)域,具體涉及一種基于元學(xué)習(xí)(Meta Learning)的快速適應(yīng)判別式受限玻爾茲曼機(Discriminative restricted Boltzmann machine,DRBM)方法。
背景技術(shù)
受限玻爾茲曼機(restricted Boltzmann machine,RBM)網(wǎng)絡(luò)是機器學(xué)習(xí)中最流行的基礎(chǔ)模型之一,也是深度神經(jīng)網(wǎng)絡(luò)中最為常用的基本組件。RBM可以利用其隱藏單元進行特征提取和學(xué)習(xí)數(shù)據(jù)概率分布并利用學(xué)習(xí)得到的概率分布生成新的樣本,一直受到目標(biāo)識別和概率模型等領(lǐng)域?qū)W者們的廣泛研究。DRBM是RBM的一種拓展形式,其核心思想是在一定數(shù)量的樣本集合中構(gòu)建一個判別函數(shù),將特征向量和標(biāo)簽一起作為RBM的輸入進行訓(xùn)練,使RBM 具有分類的功能。
DRBM最早是由Hugo Larochelle和Yoshua Bengio于2008年提出的(LarochelleH,Bengio Y.Classification using discriminative restricted Boltzmann machines[C]//Proceedings of the 25th international conference on Machinelearning.ACM,2008:536-543.),經(jīng)過十余年的發(fā)展,對其進行過多次優(yōu)化,已經(jīng)有較為成熟的網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練算法。
對于DRBM網(wǎng)絡(luò)的改進和優(yōu)化主要可以分為學(xué)習(xí)算法優(yōu)化和模型結(jié)構(gòu)優(yōu)化,元學(xué)習(xí)的快速適應(yīng)DRBM網(wǎng)絡(luò)屬于學(xué)習(xí)算法上的優(yōu)化。這種元學(xué)習(xí)方法使得經(jīng)過DRBM網(wǎng)絡(luò)訓(xùn)練得到的網(wǎng)絡(luò)參數(shù)θ不再追求在特定訓(xùn)練集上表現(xiàn)最佳,而是追求在所有訓(xùn)練任務(wù)中的網(wǎng)絡(luò)參數(shù)初始值θ0都能夠只通過幾步就快速收斂到最優(yōu)解。
基于元學(xué)習(xí)的快速適應(yīng)DRBM算法的提出受到MAML(Model-Agnostic Meta-Learning, MAML)算法的啟發(fā)。MAML算法由Chelsea Finn、Pieter Abbeel和Sergey Levine于2017年提出,是一種與模型無關(guān)的快速適應(yīng)元學(xué)習(xí)算法,適用于任何一種基于梯度下降進行訓(xùn)練的模型,并且適用于各種學(xué)習(xí)問題,如分類、回歸和強化學(xué)習(xí)。該方法在兩種少樣本(few-shot) 圖像分類數(shù)據(jù)集(Omniglot和MiniImagenet)上取得了較好的性能,在少樣本回歸上取得了較好的效果,并利用神經(jīng)網(wǎng)絡(luò)策略加速了策略梯度強化學(xué)習(xí)的微調(diào)。
發(fā)明內(nèi)容
本發(fā)明的目的是要解決小樣本條件下DRBM網(wǎng)絡(luò)欠擬合以及網(wǎng)絡(luò)參數(shù)初始值無法使網(wǎng)絡(luò)經(jīng)過訓(xùn)練后達到全局最優(yōu)的問題。
本發(fā)明的思路是通過改進網(wǎng)絡(luò)的訓(xùn)練-測試算法,將算法分為元學(xué)習(xí)和模型學(xué)習(xí)兩個階段。在元學(xué)習(xí)階段利用訓(xùn)練任務(wù)更新網(wǎng)絡(luò)參數(shù),并將更新后的網(wǎng)絡(luò)參數(shù)作為模型學(xué)習(xí)階段的網(wǎng)絡(luò)參數(shù)初始值,使網(wǎng)絡(luò)參數(shù)初始值能夠使網(wǎng)絡(luò)訓(xùn)練的損失函數(shù)下降更快并且更容易達到全局最優(yōu),在模型學(xué)習(xí)階段利用測試任務(wù)更新網(wǎng)絡(luò)參數(shù)并進行測試。該算法引入元學(xué)習(xí)的方法對DRBM的訓(xùn)練過程進行改進,使網(wǎng)絡(luò)參數(shù)的元學(xué)習(xí)階段梯度下降方向為向“最適應(yīng)”點下降,使得網(wǎng)絡(luò)能夠快速適應(yīng)到一個新的任務(wù)中。
本發(fā)明解決其技術(shù)問題所采取的技術(shù)方案是:一種基于元學(xué)習(xí)的快速適應(yīng)DRBM方法,分為以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科技大學(xué),未經(jīng)中國人民解放軍國防科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110134999.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 適應(yīng)速度和適應(yīng)病人的假膝
- 帶寬適應(yīng)
- 自適應(yīng)均衡電路和自適應(yīng)均衡方法
- 適應(yīng)均衡裝置和適應(yīng)均衡方法
- 標(biāo)準(zhǔn)模式適應(yīng)裝置、標(biāo)準(zhǔn)模式適應(yīng)方法和標(biāo)準(zhǔn)模式適應(yīng)程序
- 攝像模組自適應(yīng)系統(tǒng)及其自適應(yīng)方法
- 彎頭自適應(yīng)耳塞及自適應(yīng)耳機
- 算法自適應(yīng)裝置和算法自適應(yīng)方法
- 域適應(yīng)
- 自適應(yīng)辨識系統(tǒng)、自適應(yīng)辨識裝置及自適應(yīng)辨識方法





