[發(fā)明專利]一種基于元學(xué)習(xí)的快速適應(yīng)DRBM方法在審
| 申請?zhí)枺?/td> | 202110134999.9 | 申請日: | 2021-01-29 |
| 公開(公告)號: | CN112862094A | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設(shè)計(jì))人: | 張新禹;劉子衿;任祖煜;霍凱;劉振;張雙輝;劉永祥;姜衛(wèi)東;黎湘;盧哲俊 | 申請(專利權(quán))人: | 中國人民解放軍國防科技大學(xué) |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04;G06F17/18 |
| 代理公司: | 湖南企企衛(wèi)知識產(chǎn)權(quán)代理有限公司 43257 | 代理人: | 任合明 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 學(xué)習(xí) 快速 適應(yīng) drbm 方法 | ||
1.一種基于元學(xué)習(xí)的快速適應(yīng)DRBM方法,其特征在于,該方法分為以下步驟:
S1.建立DRBM網(wǎng)絡(luò)結(jié)構(gòu):DRBM的網(wǎng)絡(luò)結(jié)構(gòu)可以分為三層——可見層、隱藏層和分類層,每層包含若干個(gè)神經(jīng)元,神經(jīng)元的連接方式是同一層內(nèi)部的節(jié)點(diǎn)之間沒有任何連接,而層與層之間的節(jié)點(diǎn)互相以全連接的方式相互連接在一起;每個(gè)神經(jīng)元的狀態(tài)均為1或者0的二元取值,1表示激活,0表示未激活,激活意味著該神經(jīng)元所代表的節(jié)點(diǎn)對數(shù)據(jù)進(jìn)行了處理;DRBM的分布由神經(jīng)元的值確定,其中可見層用于表示輸入數(shù)據(jù),可見層節(jié)點(diǎn)個(gè)數(shù)由輸入數(shù)據(jù)維度決定,可見層節(jié)點(diǎn)取值為輸入數(shù)據(jù)各維的取值;隱藏層按照最優(yōu)化的方式獲取觀察數(shù)據(jù)的某種統(tǒng)計(jì)意義上的特征,隱藏層節(jié)點(diǎn)個(gè)數(shù)根據(jù)數(shù)據(jù)和任務(wù)不同人為進(jìn)行調(diào)整;分類層單元根據(jù)隱藏層單元提取出的數(shù)據(jù)特征進(jìn)行類別判定,分類層節(jié)點(diǎn)個(gè)數(shù)由數(shù)據(jù)類別數(shù)量決定;
DRBM網(wǎng)絡(luò)由網(wǎng)絡(luò)參數(shù)進(jìn)行描述;假設(shè)可見層節(jié)點(diǎn)個(gè)數(shù)為l,隱藏層節(jié)點(diǎn)個(gè)數(shù)為m,分類層節(jié)點(diǎn)個(gè)數(shù)為n,可見層偏置向量為b,b為1行l(wèi)列向量、隱藏層偏置向量為c,c為1行m列向量、分類層偏置向量為d,d為1行n列向量,輸入層和隱藏層的權(quán)重矩陣為W,W為l行m列矩陣、分類層和隱藏層的權(quán)重矩陣為U,U為n行m列矩陣;設(shè)向量θ=(W,U,b,c,d),則訓(xùn)練DRBM網(wǎng)絡(luò)的目的就是尋找最佳的θ值,來通過網(wǎng)絡(luò)預(yù)測數(shù)據(jù)類別;
DRBM是一種基于能量函數(shù)確定的模型,其能量函數(shù)可以被定義為:
E(y,x,h)=-hWTxT-bxT-chT-deyT-hUTyT (1)
其中x表示可見層的狀態(tài)向量,x為1行l(wèi)列向量、h表示隱藏層單元的狀態(tài)向量,h為1行m列向量、y表示分類層的狀態(tài)向量,y為1行n列向量,y是標(biāo)簽的“獨(dú)熱”型表示,即所有節(jié)點(diǎn)中只有一個(gè)節(jié)點(diǎn)為1,其余節(jié)點(diǎn)均為0;x、h、y的聯(lián)合概率分布為:
其中稱為配分函數(shù);
S2元學(xué)習(xí)階段:
S2.1網(wǎng)絡(luò)參數(shù)初始化:
初始化可見層的偏置向量b為1行l(wèi)列的零矩陣、隱藏層的偏置向量c為1行m列的零矩陣、分類層的偏置向量d為1行n列的零矩陣,以及對應(yīng)的梯度Δb為1行l(wèi)列的零矩陣、Δc為1行m列的零矩陣、Δd為1行n列的零矩陣,可見層與隱藏層的偏置矩陣W為l行m列的零矩陣和分類層與隱藏層的偏置矩陣U為n行m列的零矩陣,以及對應(yīng)的梯度ΔW為l行m列的零矩陣、ΔU為n行m列的零矩陣,網(wǎng)絡(luò)參數(shù)θ初始值記作θ0;設(shè)置內(nèi)部學(xué)習(xí)率α為0.01~0.5、外部學(xué)習(xí)率β為0.005~0.05、動(dòng)量學(xué)習(xí)率m=0.5和懲罰系數(shù)p=10-4;
S2.2完成一個(gè)任務(wù)的訓(xùn)練:
元學(xué)習(xí)階段的訓(xùn)練以一個(gè)任務(wù)為基本單元,每個(gè)任務(wù)包含兩個(gè)部分——支撐集和質(zhì)詢集;利用支撐集進(jìn)行訓(xùn)練的過程稱為內(nèi)部學(xué)習(xí),利用質(zhì)詢集進(jìn)行訓(xùn)練的過程稱為外部學(xué)習(xí);每個(gè)任務(wù)的數(shù)據(jù)類別與其他任務(wù)可以相同也可以不同;元學(xué)習(xí)階段的所有任務(wù)共同組成了訓(xùn)練任務(wù);訓(xùn)練任務(wù)中的所有樣本都既含有數(shù)據(jù)信息也含有標(biāo)簽信息;具體步驟如下:
S2.2.1將支撐集作為網(wǎng)絡(luò)輸入,θ0作為網(wǎng)絡(luò)參數(shù)初始值,完成一次訓(xùn)練:
S2.2.1.1計(jì)算隱藏層的概率分布函數(shù):
p(h|y,x)=sigmoid(x(0)W+y(0)U+c) (3)
其中x(0)為輸入數(shù)據(jù),y(0)為獨(dú)熱形式的輸入數(shù)據(jù)標(biāo)簽,
S2.2.1.2得到隱藏層概率分布函數(shù)后,利用Gibbs采樣得到隱藏層節(jié)點(diǎn)取值;
S2.2.1.3根據(jù)隱藏層節(jié)點(diǎn)取值重構(gòu)可見層和分類層,分別計(jì)算可見層和分類層的概率分布函數(shù):
其中c′表示c的所有可能取值;
S2.2.1.4求得可見層和分類層概率分布函數(shù)后,利用Gibbs采樣x(1)~p(x|h)和y(1)~p(y|h)得到可見層和分類層的節(jié)點(diǎn)取值x(1)、y(1);
S2.2.1.5根據(jù)可見層和分類層的節(jié)點(diǎn)取值x(1)、y(1)再次計(jì)算隱藏層概率分布函數(shù):
p(h|y,x)=sigmoid(x(1)W+y(1)U+c) (5)
并通過Gibbs采樣得到h(1)~p(h|y,x);
S2.2.1.6根據(jù)x(0)、y(0)、x(1)、y(1)、h(0)、h(1),求得網(wǎng)絡(luò)參數(shù)θ的更新梯度:
S2.2.1.7輸入訓(xùn)練任務(wù)集中的任務(wù),根據(jù)內(nèi)部學(xué)習(xí)率α、動(dòng)量學(xué)習(xí)率m和懲罰系數(shù)p對梯度進(jìn)行修正:
其中i∈[1,ns],ns為支撐集中的樣本數(shù)量;
S2.2.1.8根據(jù)梯度對網(wǎng)絡(luò)參數(shù)θ進(jìn)行更新:
輸入支撐集數(shù)據(jù)進(jìn)行訓(xùn)練更新后的網(wǎng)絡(luò)參數(shù)記為θns;
S2.2.2將質(zhì)詢集作為網(wǎng)絡(luò)輸入,θs作為網(wǎng)絡(luò)參數(shù)初始值,完成一次訓(xùn)練:
按照公式(3)、(4)、(5)、(6),依次完成概率分布函數(shù)計(jì)算、節(jié)點(diǎn)分布采樣以及網(wǎng)絡(luò)參數(shù)更新梯度計(jì)算,根據(jù)公式(9)對修正梯度進(jìn)行計(jì)算:
其中β為外部學(xué)習(xí)率,i∈[1,nq],nq為質(zhì)詢集中的樣本數(shù)量;最后根據(jù)公式(8)完成網(wǎng)絡(luò)參數(shù)更新,得到的網(wǎng)絡(luò)參數(shù)記為θnq;
在完成一個(gè)任務(wù)的訓(xùn)練后,對網(wǎng)絡(luò)參數(shù)進(jìn)行一次更新,并且更新只保留外部學(xué)習(xí)部分,即:
θt+1=θt+(θnq-θns) (10)
其中,t∈[1,nt],t表示第t個(gè)訓(xùn)練任務(wù),nt表示訓(xùn)練任務(wù)數(shù)量,保存網(wǎng)絡(luò)參數(shù)θt+1,作為下一個(gè)任務(wù)的網(wǎng)絡(luò)參數(shù)初始值,一個(gè)任務(wù)的訓(xùn)練結(jié)束;
S2.3完成所有遍歷:
每一次遍歷需要訓(xùn)練若干個(gè)任務(wù),任務(wù)個(gè)數(shù)根據(jù)數(shù)據(jù)集大小決定;當(dāng)完成一個(gè)任務(wù)的訓(xùn)練后,將更新后的網(wǎng)絡(luò)參數(shù)初始值作為下一個(gè)任務(wù)的網(wǎng)絡(luò)參數(shù)初始值,依次重復(fù)S2.2的過程,直至所有任務(wù)完成一次訓(xùn)練,這就是一次遍歷;完成一次遍歷后,將更新后的網(wǎng)絡(luò)參數(shù)作為下一次遍歷的網(wǎng)絡(luò)參數(shù)初始值,直至完成所有遍歷,最終得到的網(wǎng)絡(luò)參數(shù)記為θnt;
S3模型學(xué)習(xí)階段:
S3.1將支撐集作為網(wǎng)絡(luò)輸入,θnt作為網(wǎng)絡(luò)參數(shù)初始值,完成一次訓(xùn)練:
按照公式(3)、(4)、(5)、(6),依次完成概率分布函數(shù)計(jì)算、節(jié)點(diǎn)分布采樣以及網(wǎng)絡(luò)參數(shù)更新梯度的計(jì)算,再按照公式(11)對修正梯度進(jìn)行計(jì)算:
其中i∈[1,ts],ts為測試任務(wù)的支撐集中的樣本數(shù)量,最后根據(jù)公式(8)完成網(wǎng)絡(luò)參數(shù)更新;
S3.2完成所有遍歷:
每一次遍歷就是對測試任務(wù)中的支撐集完成一次訓(xùn)練,完成一次遍歷后,將更新后的網(wǎng)絡(luò)參數(shù)作為下一次遍歷的網(wǎng)絡(luò)參數(shù)初始值,直至完成所有遍歷,最終得到的網(wǎng)絡(luò)參數(shù)記為θt;
S3.3將質(zhì)詢集中的數(shù)據(jù)輸入網(wǎng)絡(luò),θt作為網(wǎng)絡(luò)參數(shù),依次計(jì)算出第i個(gè)類別的預(yù)測概率:
prediction(i)=repeat(d(i),tq)+log(exp(x(0)·W+T(i)·U+c)+1) (12)
其中T為tq行,nc列的矩陣,tq為質(zhì)詢集樣本數(shù)量,nc為總類別數(shù),T(i)表示偏置向量T除第i列為1外其余列全為0;d(i)表示偏置向量d除第i列為1外其余列全為0;repeat(d(i),tq)表示將偏置向量d(i)重復(fù)tq次,變?yōu)閠q行,n列的矩陣;
計(jì)算完nc個(gè)類別的預(yù)測概率后,取其中最大值所在列,作為類別預(yù)測結(jié)果,完成目標(biāo)分類。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科技大學(xué),未經(jīng)中國人民解放軍國防科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110134999.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 適應(yīng)速度和適應(yīng)病人的假膝
- 帶寬適應(yīng)
- 自適應(yīng)均衡電路和自適應(yīng)均衡方法
- 適應(yīng)均衡裝置和適應(yīng)均衡方法
- 標(biāo)準(zhǔn)模式適應(yīng)裝置、標(biāo)準(zhǔn)模式適應(yīng)方法和標(biāo)準(zhǔn)模式適應(yīng)程序
- 攝像模組自適應(yīng)系統(tǒng)及其自適應(yīng)方法
- 彎頭自適應(yīng)耳塞及自適應(yīng)耳機(jī)
- 算法自適應(yīng)裝置和算法自適應(yīng)方法
- 域適應(yīng)
- 自適應(yīng)辨識系統(tǒng)、自適應(yīng)辨識裝置及自適應(yīng)辨識方法





