[發(fā)明專利]一種基于隨機(jī)反饋的限制玻爾茲曼機(jī)學(xué)習(xí)方法與裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201710028131.4 | 申請(qǐng)日: | 2017-01-13 |
| 公開(公告)號(hào): | CN106779094A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計(jì))人: | 譚文學(xué);郭國(guó)強(qiáng);汪永琳;王細(xì)萍;彭易波;劉亮 | 申請(qǐng)(專利權(quán))人: | 湖南文理學(xué)院 |
| 主分類號(hào): | G06N99/00 | 分類號(hào): | G06N99/00 |
| 代理公司: | 北京風(fēng)雅頌專利代理有限公司11403 | 代理人: | 李弘 |
| 地址: | 415000 湖*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 隨機(jī) 反饋 限制 玻爾茲曼機(jī) 學(xué)習(xí)方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,特別地,涉及一種基于隨機(jī)反饋的限制玻爾茲曼機(jī)學(xué)習(xí)方法與裝置。
背景技術(shù)
限制玻爾茲曼機(jī)(Restricted Boltzmann Machine,RBM)學(xué)習(xí)是人工智能研究較為年輕的分支,自21世紀(jì)以來(lái),在生物特征提取、智能搜索引擎、醫(yī)學(xué)機(jī)器診斷、自動(dòng)檢測(cè)信用卡欺詐、證券市場(chǎng)決策分析、DNA序列測(cè)序、語(yǔ)音和手跡識(shí)別等方面有著成功的應(yīng)用。在這些應(yīng)用背后,執(zhí)行一個(gè)高效的機(jī)器學(xué)習(xí)過(guò)程變得十分關(guān)鍵,期待機(jī)器完成任務(wù)越復(fù)雜,這個(gè)過(guò)程也就越困難,持續(xù)時(shí)間就越長(zhǎng),直接制約了模型應(yīng)用的可行性和實(shí)用性。RBM在無(wú)監(jiān)督機(jī)器學(xué)習(xí)領(lǐng)域得到人們的廣泛關(guān)注,在非結(jié)構(gòu)化模式降維和特征化中得以普遍應(yīng)用。人們對(duì)于特征的“價(jià)值取向”是因任務(wù)而異的,降維和特征提取方法不能一成不變。如何改進(jìn)RBM學(xué)習(xí)方法,更快地訓(xùn)練得到收斂性更高的機(jī)器模型成為一個(gè)期待解決的先要問(wèn)題。
限制玻爾茲曼機(jī)的訓(xùn)練過(guò)程目標(biāo)是“求樣本分布參數(shù)的極大似然估計(jì)”,即使得目標(biāo)參數(shù)要盡量滿足現(xiàn)有樣本集合有極大發(fā)生概率。這就意味著通過(guò)采樣函數(shù)得到的單個(gè)樣本也應(yīng)該有極大概率,至少是局部極大值點(diǎn),這樣才能保障在此條件下求得的參數(shù)可能是極大似然估計(jì)。然而,已有文獻(xiàn)上的k階梯對(duì)比散度方法及其變體均對(duì)于k次反向采樣得到的樣本缺乏評(píng)價(jià),將其直接參與梯度上升學(xué)習(xí)過(guò)程,這樣導(dǎo)致了2個(gè)缺點(diǎn):一,對(duì)任何訓(xùn)練樣本統(tǒng)統(tǒng)執(zhí)行k次采樣,在k>1時(shí),需要執(zhí)行固定數(shù)量的采樣,學(xué)習(xí)效率低下,也常常導(dǎo)致一個(gè)較長(zhǎng)時(shí)間的學(xué)習(xí)過(guò)程;二,對(duì)于反向采樣的樣本缺乏評(píng)價(jià)和比較,無(wú)法保證參與參數(shù)梯度學(xué)習(xí)樣本的局部最優(yōu)性,學(xué)習(xí)機(jī)目標(biāo)函數(shù)實(shí)現(xiàn)不了有效和平穩(wěn)收斂,直接影響了降維模型的重構(gòu)性能。
針對(duì)現(xiàn)有技術(shù)中限制玻爾茲曼機(jī)學(xué)習(xí)效率低下、不能有效平穩(wěn)收斂的問(wèn)題,目前尚未有有效的解決方案。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提出一種基于隨機(jī)反饋的限制玻爾茲曼機(jī)學(xué)習(xí)方法與裝置,能夠提高限制玻爾茲曼機(jī)的學(xué)習(xí)效率并有效平穩(wěn)收斂到極大似然估計(jì)。
基于上述目的,本發(fā)明提供的技術(shù)方案如下:
根據(jù)本發(fā)明的一個(gè)方面,提供了一種基于隨機(jī)反饋的限制玻爾茲曼機(jī)學(xué)習(xí)方法,包括:
獲取所有訓(xùn)練樣本并初始化限制玻爾茲曼機(jī)的模型參數(shù);
選取訓(xùn)練樣本使用限制玻爾茲曼機(jī)進(jìn)行反饋采樣,獲得局部最優(yōu)的重構(gòu)樣本;
根據(jù)局部最優(yōu)的重構(gòu)樣本修正模型參數(shù),并選取下一訓(xùn)練樣本進(jìn)行反饋采樣;
對(duì)所有訓(xùn)練樣本執(zhí)行反饋采樣與模型參數(shù)修正,輸出模型參數(shù)的極大似然估計(jì)。
在一些實(shí)施方式中,所述限制玻爾茲曼機(jī)的模型參數(shù)包括可見層偏置的梯度矢量、隱藏層偏置的梯度矢量與連接矩陣偏置的梯度矩陣。
在一些實(shí)施方式中,所述選取訓(xùn)練樣本使用限制玻爾茲曼機(jī)進(jìn)行反饋采樣,獲得局部最優(yōu)的重構(gòu)樣本包括:
選取訓(xùn)練樣本作為當(dāng)前樣本,同時(shí)初始化誤差2-范數(shù)與采樣計(jì)數(shù)器;
使用限制玻爾茲曼機(jī)對(duì)當(dāng)前樣本先后進(jìn)行正向采樣和反向采樣,獲得更新樣本;
計(jì)算更新樣本與訓(xùn)練樣本的誤差2-范數(shù),并累加采樣計(jì)數(shù)器;
將更新樣本作為當(dāng)前樣本迭代進(jìn)行正向采樣和反向采樣直到達(dá)到局部最優(yōu)。
在一些實(shí)施方式中,所述將更新樣本作為當(dāng)前樣本迭代進(jìn)行正向采樣和反向采樣直到達(dá)到局部最優(yōu)為:將更新樣本作為當(dāng)前樣本迭代進(jìn)行正向采樣和反向采樣,直到更新樣本與訓(xùn)練樣本的誤差2-范數(shù)大于當(dāng)前樣本與訓(xùn)練樣本的誤差2-范數(shù),且當(dāng)前樣本與訓(xùn)練樣本的誤差2-范數(shù)不為零時(shí)終止;并將當(dāng)前樣本作為局部最優(yōu)的重構(gòu)樣本。
在一些實(shí)施方式中,所述根據(jù)局部最優(yōu)的重構(gòu)樣本修正模型參數(shù)包括可見層偏置的各個(gè)分量、隱藏層偏置的各個(gè)分量與連接矩陣偏置的梯度矩陣分量。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種基于隨機(jī)反饋的限制玻爾茲曼機(jī)學(xué)習(xí)裝置,包括:
啟動(dòng)模塊,用于獲取所有訓(xùn)練樣本并初始化限制玻爾茲曼機(jī)的模型參數(shù);
采樣模塊,用于選取訓(xùn)練樣本使用限制玻爾茲曼機(jī)進(jìn)行反饋采樣,獲得局部最優(yōu)的重構(gòu)樣本;
修正模塊,用于根據(jù)局部最優(yōu)的重構(gòu)樣本修正模型參數(shù),并選取下一訓(xùn)練樣本進(jìn)行反饋采樣;
循環(huán)模塊,連接至采樣模塊與修正模塊,用于對(duì)所有訓(xùn)練樣本執(zhí)行反饋采樣與模型參數(shù)修正,輸出模型參數(shù)的極大似然估計(jì)。
在一些實(shí)施方式中,所述限制玻爾茲曼機(jī)的模型參數(shù)包括可見層偏置的梯度矢量、隱藏層偏置的梯度矢量與連接矩陣偏置的梯度矩陣。
在一些實(shí)施方式中,所述采樣模塊包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖南文理學(xué)院,未經(jīng)湖南文理學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710028131.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 隨機(jī)數(shù)生成設(shè)備及控制方法、存儲(chǔ)器存取控制設(shè)備及通信設(shè)備
- 隨機(jī)接入方法、用戶設(shè)備、基站及系統(tǒng)
- 真隨機(jī)數(shù)檢測(cè)裝置及方法
- 隨機(jī)元素生成方法及隨機(jī)元素生成裝置
- 數(shù)據(jù)交互方法、裝置、服務(wù)器和電子設(shè)備
- 一種隨機(jī)數(shù)發(fā)生器的多隨機(jī)源管理方法
- 用于彩票行業(yè)的隨機(jī)數(shù)獲取方法及系統(tǒng)
- 隨機(jī)接入方法、裝置及存儲(chǔ)介質(zhì)
- 偽隨機(jī)方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 模型訓(xùn)練方法、裝置和計(jì)算設(shè)備





