[發(fā)明專利]訓(xùn)練機(jī)器學(xué)習(xí)模型在審
| 申請?zhí)枺?/td> | 201780030921.4 | 申請日: | 2017-05-19 |
| 公開(公告)號: | CN109313721A | 公開(公告)日: | 2019-02-05 |
| 發(fā)明(設(shè)計(jì))人: | 米沙·萬·雷·德尼爾;湯姆·紹爾;馬爾欽·安德里霍維奇;若昂·費(fèi)迪南多·戈梅斯·德弗雷塔斯;塞爾吉奧·戈梅斯·科梅納雷霍;馬修·威廉·霍夫曼;戴維·本杰明·普福 | 申請(專利權(quán))人: | 淵慧科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 李寶泉;周亞榮 |
| 地址: | 英國*** | 國省代碼: | 英國;GB |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型參數(shù) 訓(xùn)練機(jī)器 機(jī)器學(xué)習(xí)模型 更新規(guī)則 時(shí)步 計(jì)算機(jī)存儲(chǔ)介質(zhì) 遞歸神經(jīng)網(wǎng)絡(luò) 優(yōu)化目標(biāo)函數(shù) 計(jì)算機(jī)程序 學(xué)習(xí) 應(yīng)用 | ||
1.一種由一個(gè)或者多個(gè)計(jì)算機(jī)實(shí)現(xiàn)的方法,包括:
獲得機(jī)器學(xué)習(xí)模型,其中(i)所述機(jī)器學(xué)習(xí)模型包括一個(gè)或多個(gè)模型參數(shù),并且(ii)使用梯度下降技術(shù)來訓(xùn)練所述機(jī)器學(xué)習(xí)模型以優(yōu)化目標(biāo)函數(shù);
對于多個(gè)時(shí)步中的每個(gè)時(shí)步:
使用遞歸神經(jīng)網(wǎng)絡(luò)RNN確定針對該時(shí)步的用于所述模型參數(shù)的更新規(guī)則,包括:
向所述RNN提供所述目標(biāo)函數(shù)相對于用于該時(shí)步的所述模型參數(shù)的梯度作為輸入;
從針對該時(shí)步提供的輸入生成相應(yīng)的RNN輸出,其中所述RNN輸出包括取決于一個(gè)或多個(gè)RNN參數(shù)的用于在該時(shí)步的所述模型參數(shù)的更新規(guī)則;
使用生成的輸出和取決于所述多個(gè)時(shí)步中的每個(gè)先前時(shí)步的RNN目標(biāo)函數(shù)來訓(xùn)練所述RNN,包括使用梯度下降技術(shù)來確定對于該時(shí)步使所述RNN目標(biāo)函數(shù)最小化的RNN參數(shù);
基于確定的RNN參數(shù),確定對于該時(shí)步使所述目標(biāo)函數(shù)最小化的用于所述模型參數(shù)的更新規(guī)則;以及
將確定的針對該時(shí)步的更新規(guī)則應(yīng)用于所述模型參數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其中,將針對所述多個(gè)時(shí)步中的最終時(shí)步的確定的更新規(guī)則應(yīng)用于所述模型參數(shù)生成訓(xùn)練的模型參數(shù)。
3.根據(jù)權(quán)利要求1或者2所述的方法,其中,所述機(jī)器學(xué)習(xí)模型包括神經(jīng)網(wǎng)絡(luò)。
4.根據(jù)權(quán)利要求1、2或者3所述的方法,其中,通過給出使所述目標(biāo)函數(shù)最小化的用于所述模型參數(shù)的確定的更新規(guī)則,其中θt表示在時(shí)間t處的模型參數(shù),表示目標(biāo)函數(shù)f的梯度,φ表示RNN參數(shù),并且gt表示在時(shí)步t處的RNN輸出。
5.根據(jù)任意前述權(quán)利要求所述的方法,其中,所述RNN在所述目標(biāo)函數(shù)參數(shù)上以坐標(biāo)方式操作。
6.根據(jù)任意前述權(quán)利要求所述的方法,其中,所述RNN為每個(gè)模型參數(shù)實(shí)現(xiàn)單獨(dú)的激活。
7.根據(jù)任意前述權(quán)利要求所述的方法,其中,將針對所述時(shí)步的確定的更新規(guī)則應(yīng)用于所述模型參數(shù)包括使用長短期記憶LSTM神經(jīng)網(wǎng)絡(luò)。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述LSTM神經(jīng)網(wǎng)絡(luò)包括兩個(gè)LSTM層。
9.根據(jù)權(quán)利要求7或者8所述的方法,其中,所述LSTM神經(jīng)網(wǎng)絡(luò)跨目標(biāo)函數(shù)的不同坐標(biāo)共享參數(shù)。
10.根據(jù)權(quán)利要求7、8或者9所述的方法,其中,每個(gè)LSTM層中的元胞的子集包括全局平均單元,其中全局平均單元是其更新包括下述步驟的單元,跨越不同坐標(biāo)方式的LSTM在每個(gè)步驟全局地對單元的激活取平均。
11.根據(jù)任意前述權(quán)利要求所述的方法,其中,在每個(gè)坐標(biāo)上獨(dú)立地應(yīng)用相同的更新規(guī)則。
12.根據(jù)任意前述權(quán)利要求所述的方法,其中,所述RNN對于所述模型參數(shù)的順序是不變的。
13.根據(jù)任意前述權(quán)利要求所述的方法,還包括:對于所述時(shí)步,向所述RNN提供所述RNN的先前隱藏狀態(tài)作為輸入。
14.根據(jù)任意前述權(quán)利要求所述的方法,其中,針對所述時(shí)步使所述目標(biāo)函數(shù)最小化的用于所述模型參數(shù)的確定的更新規(guī)則取決于用于所述時(shí)步的所述RNN的隱藏狀態(tài)。
15.根據(jù)任意前述權(quán)利要求所述的方法,其中,通過給出所述RNN目標(biāo)函數(shù),其中θt+1=θt+gt,φ表示所述RNN參數(shù),f(θt)表示取決于在時(shí)間t的機(jī)器學(xué)習(xí)模型參數(shù)θ的機(jī)器學(xué)習(xí)模型目標(biāo)函數(shù),表示與每個(gè)時(shí)步t相關(guān)聯(lián)的權(quán)重,gt表示時(shí)間t的RNN輸出,ht表示在時(shí)間t的RNN的隱藏狀態(tài),m表示所述RNN,并且
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于淵慧科技有限公司,未經(jīng)淵慧科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780030921.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 神經(jīng)網(wǎng)絡(luò)模型壓縮方法及裝置
- 一種工業(yè)服務(wù)參數(shù)化配置搜索算法
- 一種聯(lián)邦學(xué)習(xí)的模型參數(shù)更新方法及裝置
- 一種模型訓(xùn)練方法及裝置
- 廣告流量預(yù)測方法及裝置
- 基于FM模型的信息推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 聯(lián)邦學(xué)習(xí)模型訓(xùn)練方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于人工智能的模型訓(xùn)練方法、裝置、服務(wù)器及介質(zhì)
- 一種超參數(shù)確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 泊松回歸模型的訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于多機(jī)集群的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法及系統(tǒng)
- 獎(jiǎng)勵(lì)增強(qiáng)模型訓(xùn)練
- 機(jī)器識(shí)別模型的訓(xùn)練及機(jī)器識(shí)別方法、裝置、電子設(shè)備
- 用于訓(xùn)練機(jī)器學(xué)習(xí)模型的方法及系統(tǒng)
- 一種機(jī)器學(xué)習(xí)模型的實(shí)現(xiàn)方法及裝置
- 用于機(jī)器學(xué)習(xí)模型的并行化坐標(biāo)下降法
- 一種機(jī)器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)選擇方法
- 機(jī)器學(xué)習(xí)方法、計(jì)算機(jī)可讀記錄介質(zhì)以及機(jī)器學(xué)習(xí)設(shè)備
- 機(jī)器學(xué)習(xí)模型的訓(xùn)練方法、裝置、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 機(jī)器翻譯模型的訓(xùn)練方法、裝置和電子設(shè)備
- 機(jī)器學(xué)習(xí)模型之間進(jìn)行轉(zhuǎn)換的方法與設(shè)備
- 在多個(gè)機(jī)器學(xué)習(xí)任務(wù)上訓(xùn)練機(jī)器學(xué)習(xí)模型
- 用于訓(xùn)練機(jī)器學(xué)習(xí)模型的方法及系統(tǒng)
- 機(jī)器學(xué)習(xí)模型解釋方法以及裝置
- 用于機(jī)器學(xué)習(xí)模型的并行化坐標(biāo)下降法
- 一種機(jī)器學(xué)習(xí)模型的生成方法、裝置
- 模型配置方法、裝置、電子設(shè)備及可讀取存儲(chǔ)介質(zhì)
- 基于區(qū)塊鏈網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)模型處理方法及節(jié)點(diǎn)
- 模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及服務(wù)器
- 管理應(yīng)用的方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 流表更新方法和流表更新裝置
- VPN網(wǎng)關(guān)的密鑰的更新方法及系統(tǒng)
- 服務(wù)器的防火墻更新方法和裝置
- 一種定時(shí)更新頁面內(nèi)容的方法及裝置
- 應(yīng)用程序更新方法及系統(tǒng)
- 一種數(shù)據(jù)庫表監(jiān)控方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于DAG的區(qū)塊鏈系統(tǒng)認(rèn)證門限的更新方法
- 規(guī)則包更新方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 規(guī)則文件加載方法、裝置、服務(wù)器及介質(zhì)
- 一種更新規(guī)則的方法、裝置、存儲(chǔ)介質(zhì)以及電子設(shè)備





