[發(fā)明專利]一種用于執(zhí)行Hessian-Free訓(xùn)練算法的裝置和方法有效
| 申請?zhí)枺?/td> | 201610283885.X | 申請日: | 2016-04-29 |
| 公開(公告)號: | CN107341540B | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計)人: | 張士錦;郭崎;陳天石;陳云霽 | 申請(專利權(quán))人: | 中科寒武紀(jì)科技股份有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N3/08 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 任巖 |
| 地址: | 100190 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 執(zhí)行 hessian free 訓(xùn)練 算法 裝置 方法 | ||
1.一種用于執(zhí)行Hessian-Free訓(xùn)練算法的計算裝置,所述計算裝置用于執(zhí)行神經(jīng)網(wǎng)絡(luò)運算;所述計算裝置包括控制器單元和數(shù)據(jù)處理單元,其特征在于:
控制器單元,用于將讀取的指令譯碼為控制所述數(shù)據(jù)處理單元的微指令,并將所述微指令發(fā)送至所述數(shù)據(jù)處理單元;
數(shù)據(jù)處理單元,用于依據(jù)所述微指令對輸入數(shù)據(jù)執(zhí)行計算得到計算指令的結(jié)果;其中,所述數(shù)據(jù)處理單元包括運算控制子模塊和基本運算子模塊,以及梯度運算子模塊、阻尼項運算子模塊、高斯-牛頓矩陣運算子模塊和共軛梯度法運算子模塊;
數(shù)據(jù)緩存單元,用于存儲運算過程中的中間變量,并對所述中間變量執(zhí)行初始化及更新操作;其中,所述數(shù)據(jù)緩存單元在裝置初始化時初始化f(θ)的二階估計在第n次待更新參數(shù)向量θn的更新開始前,將讀出到數(shù)據(jù)處理單元中,并在所述數(shù)據(jù)處理單元中得到更新向量后將再次寫入;其中,θ為待更新參數(shù)向量,θn為第n次待更新參數(shù)向量,f(θ)為誤差函數(shù),即衡量結(jié)果的實際值與預(yù)測值偏離的函數(shù);δn是更新向量,且θn+1=θn+δn。
2.如權(quán)利要求1所述的計算裝置,其特征在于,所述基本運算子模塊進行矩陣和/或向量之間的加、乘基礎(chǔ)運算。
3.如權(quán)利要求1所述的計算裝置,其特征在于,所述梯度運算子模塊、阻尼項運算子模塊、高斯-牛頓矩陣運算子模塊、共軛梯度法運算子模塊均能夠調(diào)用所述基本運算子模塊,且根據(jù)情況所述梯度運算子模塊、阻尼項運算子模塊、高斯-牛頓矩陣運算子模塊、共軛梯度法運算子模塊之間允許互相調(diào)用。
4.如權(quán)利要求1所述的計算裝置,其特征在于,
所述數(shù)據(jù)處理單元在所述控制器單元的控制下執(zhí)行運算操作時將中間變量存儲于所述數(shù)據(jù)緩存單元中。
5.如權(quán)利要求1所述的計算裝置,其特征在于,所述數(shù)據(jù)緩存單元在初始化的步驟中,初始化其中的梯度高斯-牛頓矩陣Gf、阻尼系數(shù)λ和阻尼函數(shù)其中,所述梯度指f在θn處的梯度值,Gf是f在θn處的高斯-牛頓矩陣;阻尼函數(shù)是根據(jù)訓(xùn)練模型預(yù)先確定好的函數(shù)在θn處的值;阻尼系數(shù)λ通過LM式啟發(fā)式方法求得;
所述數(shù)據(jù)處理單元從所述數(shù)據(jù)緩存單元中讀取從外部指定空間中讀取待更新參數(shù)向量θn;在模塊內(nèi)得到更新向量δn,將θn更新為θn+1,對應(yīng)的更新為然后將寫入至所述數(shù)據(jù)緩存單元,將θn+1寫入到外部指定空間中;其中,θn+1為第n+1次待更新參數(shù)向量,為f(θ+1)的二階估計。
6.一種用于執(zhí)行Hessian-Free訓(xùn)練算法的計算方法,所述計算方法用于執(zhí)行神經(jīng)網(wǎng)絡(luò)運算,其特征在于,所述計算方法包括以下步驟:
控制器單元將讀取的指令譯碼為控制數(shù)據(jù)處理單元的微指令,并將所述微指令發(fā)送至所述數(shù)據(jù)處理單元;
數(shù)據(jù)處理單元依據(jù)所述微指令對輸入數(shù)據(jù)執(zhí)行計算得到計算指令的結(jié)果;其中,所述數(shù)據(jù)處理單元包括運算控制子模塊和基本運算子模塊,以及梯度運算子模塊、阻尼項運算子模塊、高斯-牛頓矩陣運算子模塊和共軛梯度法運算子模塊中;
數(shù)據(jù)緩存單元存儲運算過程中生成的中間變量,并對所述中間變量執(zhí)行初始化及更新操作,其中,所述數(shù)據(jù)緩存單元在裝置初始化時初始化f(θ)的二階估計在第n次待更新參數(shù)向量θn的更新開始前,將讀出到數(shù)據(jù)處理單元中,并在所述數(shù)據(jù)處理單元中得到更新向量后將再次寫入;其中,θ為待更新參數(shù)向量,θn為第n次待更新參數(shù)向量,f(θ)為誤差函數(shù),即衡量結(jié)果的實際值與預(yù)測值偏離的函數(shù);δn是更新向量,且θn+1=θn+δn。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中科寒武紀(jì)科技股份有限公司,未經(jīng)中科寒武紀(jì)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610283885.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 以注射方式執(zhí)行死刑的自動執(zhí)行車的執(zhí)行床
- 過程執(zhí)行裝置、過程執(zhí)行方法以及過程執(zhí)行程序
- 用以執(zhí)行跳舞電子游戲的執(zhí)行系統(tǒng)及其執(zhí)行方法
- 策略執(zhí)行系統(tǒng)及其執(zhí)行方法
- 腳本執(zhí)行系統(tǒng)和腳本執(zhí)行方法
- 命令執(zhí)行設(shè)備、命令執(zhí)行系統(tǒng)、命令執(zhí)行方法以及命令執(zhí)行程序
- 程序執(zhí)行裝置、程序執(zhí)行系統(tǒng)以及程序執(zhí)行方法
- 處理執(zhí)行設(shè)備和由該處理執(zhí)行設(shè)備執(zhí)行的方法
- 有序任務(wù)的執(zhí)行方法、執(zhí)行裝置和執(zhí)行系統(tǒng)
- 執(zhí)行器(閥門執(zhí)行器)
- 基于Hessian結(jié)構(gòu)分析的道路裂縫增強方法
- 一種提高短波紅外衛(wèi)星數(shù)據(jù)二氧化碳反演魯棒性的方法
- 一種基于貝塞爾控制點搜索的曲線識別方法
- 一種基于Hessian服務(wù)的OSGi分布式部署方法
- 一種基于多視角譜聚類的圖像識別方法
- 一種基于hessian矩陣和區(qū)域增長相結(jié)合的視網(wǎng)膜血管分割系統(tǒng)
- 無功優(yōu)化的高效內(nèi)點求解方法
- 一種基于機器視覺的軟包裝表面質(zhì)量檢測方法
- 一種基于Hessian矩陣的視網(wǎng)膜圖像血管提取方法
- 一種基于Hessian矩陣的改進ORB特征點匹配方法
- 將電梯轎廂分配成目標(biāo)呼叫控制組的方法
- 信息記錄和重放裝置、方法和程序
- 游離β人絨毛膜促性腺激素化學(xué)發(fā)光免疫定量檢測試劑盒及其制備方法
- 一種多波束配置下的grant free發(fā)送功率控制方法及設(shè)備
- 杯子(free)
- 母血清標(biāo)志物對胎兒尿道下裂的預(yù)測風(fēng)險模型建立方法
- 面向分布式共享SPM的批量數(shù)據(jù)傳輸方法
- 一種基于空洞卷積的anchor-free交通標(biāo)志識別方法
- Double Free漏洞檢測方法、終端及存儲介質(zhì)
- 一種單臺服務(wù)器實現(xiàn)備份的方法、系統(tǒng)及存儲介質(zhì)





