[發(fā)明專(zhuān)利]機(jī)器學(xué)習(xí)模型的異步訓(xùn)練有效
| 申請(qǐng)?zhí)枺?/td> | 201610730381.8 | 申請(qǐng)日: | 2016-08-25 |
| 公開(kāi)(公告)號(hào): | CN107784364B | 公開(kāi)(公告)日: | 2021-06-15 |
| 發(fā)明(設(shè)計(jì))人: | 王太峰;陳薇;劉鐵巖;高飛;葉啟威 | 申請(qǐng)(專(zhuān)利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類(lèi)號(hào): | G06N20/00 | 分類(lèi)號(hào): | G06N20/00;G06N3/02 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 王茂華 |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 機(jī)器 學(xué)習(xí) 模型 異步 訓(xùn)練 | ||
1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括:
在保持機(jī)器學(xué)習(xí)模型的副本的服務(wù)器處:
從各自具有自身訓(xùn)練數(shù)據(jù)并布置為在本地計(jì)算通過(guò)基于自身訓(xùn)練數(shù)據(jù)以及從所述服務(wù)器接收的所述機(jī)器學(xué)習(xí)模型的參數(shù)集的先前值對(duì)所述機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練而生成的反饋數(shù)據(jù)的多個(gè)工作機(jī)中的至少一個(gè)工作機(jī),接收與所述參數(shù)集的所述先前值相關(guān)聯(lián)的所述反饋數(shù)據(jù);
確定所述先前值與所述參數(shù)集的當(dāng)前值之間的差異;以及
基于所述反饋數(shù)據(jù)和所述差異,更新所述當(dāng)前值以獲得所述參數(shù)集的更新值,
其中所述更新包括:執(zhí)行異步隨機(jī)梯度下降更新,每個(gè)異步隨機(jī)梯度下降更新由從所述多個(gè)工作機(jī)中的一個(gè)工作機(jī)接收到所述反饋數(shù)據(jù)而被觸發(fā),
其中所述反饋數(shù)據(jù)指示所述機(jī)器學(xué)習(xí)模型的優(yōu)化目標(biāo)相對(duì)于所述參數(shù)集的所述先前值的顯著變化趨勢(shì),其中所述顯著變化趨勢(shì)由所述優(yōu)化目標(biāo)相對(duì)于所述參數(shù)集的所述先前值的梯度來(lái)表示,以及
其中基于所述反饋數(shù)據(jù)和所述差異,更新所述當(dāng)前值以獲得所述參數(shù)集的更新值包括:以更新量來(lái)更新所述參數(shù),所述更新量由優(yōu)化目標(biāo)的梯度、所述先前值與所述當(dāng)前值之間的差異、學(xué)習(xí)率以及用于所述梯度的任何延遲的補(bǔ)償項(xiàng)來(lái)確定,其中所述補(bǔ)償項(xiàng)根據(jù)由所述梯度中的每個(gè)元素的絕對(duì)值的平方形成的向量以及所述學(xué)習(xí)率和控制參數(shù)的乘積來(lái)確定。
2.根據(jù)權(quán)利要求1所述的方法,其中更新所述當(dāng)前值包括:
基于所述顯著變化趨勢(shì)來(lái)確定變換的系數(shù);以及
通過(guò)向所述差異應(yīng)用所述變換來(lái)確定所述當(dāng)前值與所述更新值之間的差量。
3.根據(jù)權(quán)利要求2所述的方法,其中所述變換是線性變換,所述系數(shù)是線性變化率。
4.根據(jù)權(quán)利要求3所述的方法,其中確定所述變換的系數(shù)包括:
計(jì)算所述梯度的張量積作為對(duì)所述線性變化率的無(wú)偏估計(jì)。
5.根據(jù)權(quán)利要求3所述的方法,其中確定所述變換的系數(shù)包括:
基于所述梯度確定所述優(yōu)化目標(biāo)相對(duì)于所述參數(shù)集中各個(gè)參數(shù)的變化率的量值;以及
基于所述變化率的量值來(lái)確定所述線性變化率。
6.根據(jù)權(quán)利要求5所述的方法,其中基于所述變化率的量值來(lái)確定所述線性變化率包括:
計(jì)算所述變化率的量值的平方;以及
基于所述變化率的量值的平方來(lái)確定所述線性變化率。
7.根據(jù)權(quán)利要求1所述的方法,還包括:
從所述工作機(jī)接收針對(duì)所述參數(shù)集的請(qǐng)求;以及
響應(yīng)于所述請(qǐng)求,向所述工作機(jī)發(fā)送所述參數(shù)集的所述更新值。
8.根據(jù)權(quán)利要求1所述的方法,其中所述機(jī)器學(xué)習(xí)模型包括神經(jīng)網(wǎng)絡(luò)模型,并且所述優(yōu)化目標(biāo)由交叉熵?fù)p失函數(shù)表示。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610730381.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





