[發明專利]訓練機器學習模型在審
| 申請號: | 201780030921.4 | 申請日: | 2017-05-19 |
| 公開(公告)號: | CN109313721A | 公開(公告)日: | 2019-02-05 |
| 發明(設計)人: | 米沙·萬·雷·德尼爾;湯姆·紹爾;馬爾欽·安德里霍維奇;若昂·費迪南多·戈梅斯·德弗雷塔斯;塞爾吉奧·戈梅斯·科梅納雷霍;馬修·威廉·霍夫曼;戴維·本杰明·普福 | 申請(專利權)人: | 淵慧科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 李寶泉;周亞榮 |
| 地址: | 英國*** | 國省代碼: | 英國;GB |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型參數 訓練機器 機器學習模型 更新規則 時步 計算機存儲介質 遞歸神經網絡 優化目標函數 計算機程序 學習 應用 | ||
用于訓練機器學習模型的方法、系統和裝置,包括在計算機存儲介質上編碼的計算機程序。一種方法包括獲得機器學習模型,其中機器學習模型包括一個或多個模型參數,并且使用梯度下降技術來訓練機器學習模型以優化目標函數;使用遞歸神經網絡(RNN)確定模型參數的更新規則;以及將用于多個時步序列中的最終時步的確定的更新規則應用于模型參數。
技術領域
本說明書涉及神經網絡。
背景技術
背神經網絡是機器學習模型,其采用一層或多層非線性單元以針對接收到的輸入預測輸出。除了輸出層之外,一些神經網絡還包括一個或多個隱藏層。每個隱藏層的輸出用作網絡中下一層(即,下一個隱藏層或輸出層)的輸入。網絡的每個層根據相應參數集的當前值從接收的輸入生成輸出。
發明內容
本說明書描述在一個或多個位置中的一個或多個計算機上實現為計算機程序的系統能夠如何用可訓練的深度遞歸神經網絡替換硬編碼的參數優化算法,例如,梯度下降優化算法。針對機器學習模型的參數的手工設計的更新規則被替換成學習更新規則。
通常,本說明書中描述的主題的一個創新方面能夠體現在包括獲得機器學習模型的方法中,其中(i)機器學習模型包括一個或多個模型參數,并且(ii)使用梯度下降技術來訓練機器學習模型以優化目標函數;對于多個時步中的每個時步:使用遞歸神經網絡(RNN)確定針對時步的用于模型參數的更新規則,包括:向RNN提供目標函數相對于用于時步的模型參數的梯度作為輸入;從針對時步提供的輸入生成相應的RNN輸出,其中RNN輸出包括取決于一個或多個RNN參數的針對時步的用于模型參數的更新規則;使用所生成的輸出和取決于多個時步中的每個先前時步的RNN目標函數訓練RNN,包括使用梯度下降技術確定針對時步使RNN目標函數最小化的RNN參數;基于所確定的RNN參數,確定針對時步使目標函數最小化的模型參數的更新規則;以及將確定的用于時步的更新規則應用于模型參數。
此方面的其他實施例包括記錄在一個或多個計算機存儲設備上的相應的計算機系統、裝置和計算機程序,每個計算機系統、裝置和計算機程序被配置成執行方法的動作。一個或多個計算機的系統能夠被配置成借助于安裝在系統上的在操作中可以使系統執行動作的軟件、固件、硬件或其任何組合來執行特定操作或動作。一個或多個計算機程序能夠被配置成借助于包括當由數據處理裝置執行時使裝置執行動作的指令來執行特定操作或動作。
前述和其他實施例能夠均可選地包括一個或多個下述特征,單獨或組合。在一些實施方式中,將針對多個時步中的最終時步的所確定的更新規則應用于模型參數,生成訓練的模型參數。
在一些實施方式中,機器學習模型包括神經網絡。
在一些實施方式中,通過下述給出針對最小化目標函數的模型參數的被確定的更新規則
其中θt表示在時間t處的模型參數,表示目標函數f的梯度,φ表示RNN參數并且gt表示在時步t處的RNN輸出。
在一些實施方式中,RNN在目標函數參數上以坐標方式操作。
在一些實施方式中,RNN為每個模型參數實現單獨的激活。
在一些實施方式中,將針對時步的被確定的更新規則應用于模型參數包括使用長短期記憶(LSTM)神經網絡。
在一些實施方式中,LSTM神經網絡包括兩個LSTM層。
在一些實施方式中,LSTM神經網絡跨目標函數的不同坐標共享參數。
在一些實施方式中,每個LSTM層中的元胞的子集包括全局平均單元,其中全局平均單元是其更新包括跨越不同坐標方式的LSTM在每個步驟全局地對單元的激活取平均的步驟的單元。
在一些實施方式中,在每個坐標上獨立地應用相同的更新規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于淵慧科技有限公司,未經淵慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780030921.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:使用神經網絡生成文本段的依存性解析
- 下一篇:存儲器高效的基于時間的反向傳播





