[發(fā)明專利]一種自適應(yīng)學(xué)習(xí)率計算方法有效
| 申請?zhí)枺?/td> | 201911056211.6 | 申請日: | 2019-10-31 |
| 公開(公告)號: | CN110866608B | 公開(公告)日: | 2022-06-07 |
| 發(fā)明(設(shè)計)人: | 楊愷;張春炯 | 申請(專利權(quán))人: | 同濟大學(xué) |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06N3/08 |
| 代理公司: | 上海科盛知識產(chǎn)權(quán)代理有限公司 31225 | 代理人: | 宣慧蘭 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 自適應(yīng) 學(xué)習(xí) 計算方法 | ||
本發(fā)明涉及一種自適應(yīng)學(xué)習(xí)率計算方法,包括以下步驟:步驟S1:基于初始批處理數(shù)量和初始最優(yōu)網(wǎng)絡(luò)參數(shù)組合,得到二次批處理數(shù)量;步驟S2:基于二次批處理數(shù)量,得到當(dāng)前的最優(yōu)網(wǎng)絡(luò)參數(shù)組合;步驟S3:基于當(dāng)前的最優(yōu)網(wǎng)絡(luò)參數(shù)組合、當(dāng)前的損失函數(shù)和訓(xùn)練數(shù)據(jù)量,得到當(dāng)前的批處理數(shù)量;步驟S4:基于當(dāng)前的批處理數(shù)量,得到當(dāng)前的學(xué)習(xí)率;步驟S5:當(dāng)前的批處理數(shù)量代替二次批處理數(shù)量,重復(fù)步驟S2?步驟S5,直至訓(xùn)練模型權(quán)重收斂。與現(xiàn)有技術(shù)相比,避免產(chǎn)生劣質(zhì)訓(xùn)練模型權(quán)重,保證所生成的訓(xùn)練模型權(quán)重是最優(yōu)的,在圍棋對弈時增加棋力,減少訓(xùn)練模型權(quán)重訓(xùn)練時間和GPU等硬件的超能損耗。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學(xué)習(xí)領(lǐng)域,尤其是涉及一種自適應(yīng)學(xué)習(xí)率計算方法。
背景技術(shù)
人工智能(Artificial Intelligence,AI)隨著人類現(xiàn)實場景的諸多應(yīng)用得到大力的發(fā)展,圍棋方面的人工智能進展也取得巨大的成果。訓(xùn)練模型權(quán)重是圍棋AI對弈時棋力表現(xiàn)的關(guān)鍵依據(jù),是圍棋AI通過殘差網(wǎng)絡(luò)訓(xùn)練生成的棋力信息。
學(xué)習(xí)率是神經(jīng)網(wǎng)絡(luò)經(jīng)典超參數(shù),也是困擾神經(jīng)網(wǎng)絡(luò)訓(xùn)練的問題之一,因為參數(shù)不能通過常規(guī)方法學(xué)習(xí)獲得。現(xiàn)今眾多圍棋AI的殘差網(wǎng)絡(luò)中訓(xùn)練模型權(quán)重訓(xùn)練的學(xué)習(xí)率是固定值,對網(wǎng)絡(luò)訓(xùn)練不能根據(jù)圍棋AI的環(huán)境需要(權(quán)值初始化、網(wǎng)絡(luò)層數(shù)、殘差塊、批處理、訓(xùn)練循環(huán)次數(shù)等)而自動調(diào)整,然而學(xué)習(xí)率太大收斂快,導(dǎo)致訓(xùn)練模型權(quán)重訓(xùn)練網(wǎng)絡(luò)的梯度出現(xiàn)爆炸現(xiàn)象,使得訓(xùn)練模型權(quán)重在最優(yōu)值附近徘徊而無法收斂。學(xué)習(xí)率太小,會造成參數(shù)更新極其緩慢,收斂也相應(yīng)的十分緩慢,導(dǎo)致訓(xùn)練時間變長。關(guān)鍵是固定值的學(xué)習(xí)率嚴重影響殘差網(wǎng)絡(luò)的訓(xùn)練,進而導(dǎo)致殘差網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)生成劣質(zhì)的圍棋訓(xùn)練模型權(quán)重規(guī)模擴大,直至導(dǎo)致圍棋AI對弈時的棋力迅速下降,所以學(xué)習(xí)率對于殘差網(wǎng)絡(luò)訓(xùn)練訓(xùn)練模型權(quán)重性能的表現(xiàn)至關(guān)重要。
一般在網(wǎng)絡(luò)訓(xùn)練的初期,往往設(shè)置為較大的學(xué)習(xí)率較好,因為訓(xùn)練模型權(quán)重距離最優(yōu)值比較遠,較大的學(xué)習(xí)速率可以快速靠近最優(yōu)值;而訓(xùn)練后期,由于已經(jīng)靠近最優(yōu)值,此時,采用較小的學(xué)習(xí)率較好,較大的學(xué)習(xí)率,容易導(dǎo)致在真實最優(yōu)值附近來回波動,就是無法抵達最優(yōu)值。而由訓(xùn)練數(shù)據(jù)生成的劣質(zhì)訓(xùn)練模型權(quán)重,會使得圍棋AI在對弈時存在許多盲點,其棋力會大打折扣,而且非自適應(yīng)學(xué)習(xí)率會耗費大量的訓(xùn)練模型權(quán)重訓(xùn)練時間,以及造成GPU等硬件的超能損耗。
因此,需要一種針對圍棋AI訓(xùn)練模型權(quán)重的自適應(yīng)學(xué)習(xí)率計算方法來彌補殘差網(wǎng)絡(luò)中固定學(xué)習(xí)率這一嚴重不足。
發(fā)明內(nèi)容
本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種自適應(yīng)學(xué)習(xí)率計算方法。
本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):
一種自適應(yīng)學(xué)習(xí)率計算方法,該方法包括以下步驟:
步驟S1:基于初始批處理數(shù)量和初始最優(yōu)網(wǎng)絡(luò)參數(shù)組合,得到二次批處理數(shù)量;
步驟S2:基于二次批處理數(shù)量,得到當(dāng)前的最優(yōu)網(wǎng)絡(luò)參數(shù)組合;
步驟S3:基于當(dāng)前的最優(yōu)網(wǎng)絡(luò)參數(shù)組合、當(dāng)前的損失函數(shù)和訓(xùn)練數(shù)據(jù)量,得到當(dāng)前的批處理數(shù)量;
步驟S4:基于當(dāng)前的批處理數(shù)量,得到當(dāng)前的學(xué)習(xí)率;
步驟S5:當(dāng)前的批處理數(shù)量代替二次批處理數(shù)量,重復(fù)步驟S2-步驟S5,直至訓(xùn)練模型權(quán)重收斂。
所述的步驟S2包括:
步驟S21:基于二次批處理數(shù)量,通過Kolmogorov定理得到網(wǎng)絡(luò)層個數(shù)和殘差塊個數(shù);
步驟S22:基于網(wǎng)絡(luò)層個數(shù)和殘差塊個數(shù),利用隨機采樣交叉驗證方法得到當(dāng)前的最優(yōu)網(wǎng)絡(luò)參數(shù)組合。
所述的通過Kolmogorov定理得到網(wǎng)絡(luò)層個數(shù)N的公式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于同濟大學(xué),未經(jīng)同濟大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911056211.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 使用后向自適應(yīng)規(guī)則進行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺
- 采用自適應(yīng)機匣和自適應(yīng)風(fēng)扇的智能發(fā)動機
- 一種自適應(yīng)樹木自動涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動機燃氣自適應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





