[發(fā)明專利]學(xué)習(xí)數(shù)據(jù)增強(qiáng)策略在審

申請?zhí)枺?/td>	201980014733.1	申請日：	2019-05-20
公開（公告）號：	CN111758105A	公開（公告）日：	2020-10-09
發(fā)明（設(shè)計(jì)）人：	維賈伊·瓦蘇德萬;巴雷特·佐福;埃金·多烏什·丘布克;國·V·勒	申請（專利權(quán)）人：	谷歌有限責(zé)任公司
主分類號：	G06N3/04	分類號：	G06N3/04;G06N3/08;G06N3/00;G06N3/12;G06N5/00;G06N20/10;G06N20/20
代理公司：	中原信達(dá)知識產(chǎn)權(quán)代理有限責(zé)任公司 11219	代理人：	周亞榮;鄧聰惠
地址：	美國加利***	國省代碼：	暫無信息
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	學(xué)習(xí) 數(shù)據(jù) 增強(qiáng) 策略
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種方法，包括：

接收用于訓(xùn)練機(jī)器學(xué)習(xí)模型以執(zhí)行特定機(jī)器學(xué)習(xí)任務(wù)的訓(xùn)練數(shù)據(jù)，所述訓(xùn)練數(shù)據(jù)包括多個(gè)訓(xùn)練輸入；

確定多個(gè)數(shù)據(jù)增強(qiáng)策略，其中，每個(gè)數(shù)據(jù)增強(qiáng)策略都具有多個(gè)數(shù)據(jù)增強(qiáng)策略參數(shù)，所述多個(gè)數(shù)據(jù)增強(qiáng)策略參數(shù)定義了在訓(xùn)練輸入被用來訓(xùn)練機(jī)器學(xué)習(xí)模型之前變換所述訓(xùn)練輸入的過程，所述確定包括，在多個(gè)時(shí)間步長的每一個(gè)處：

基于在先前時(shí)間步長生成的數(shù)據(jù)增強(qiáng)策略的質(zhì)量度量來生成當(dāng)前數(shù)據(jù)增強(qiáng)策略，其中，數(shù)據(jù)增強(qiáng)策略的質(zhì)量度量表示作為使用所述數(shù)據(jù)增強(qiáng)策略訓(xùn)練所述機(jī)器學(xué)習(xí)模型的結(jié)果的、對特定機(jī)器學(xué)習(xí)任務(wù)的機(jī)器學(xué)習(xí)模型的性能；

使用所述當(dāng)前數(shù)據(jù)增強(qiáng)策略，在所述訓(xùn)練數(shù)據(jù)上訓(xùn)練機(jī)器學(xué)習(xí)模型，其中，使用數(shù)據(jù)增強(qiáng)策略訓(xùn)練機(jī)器學(xué)習(xí)模型包括：

選擇一批訓(xùn)練數(shù)據(jù)；

根據(jù)所述數(shù)據(jù)增強(qiáng)策略，通過對所述一批訓(xùn)練數(shù)據(jù)中的訓(xùn)練輸入進(jìn)行變換，確定增強(qiáng)后的一批訓(xùn)練數(shù)據(jù)；以及

基于所述增強(qiáng)后的一批訓(xùn)練數(shù)據(jù)，調(diào)整機(jī)器學(xué)習(xí)模型參數(shù)的當(dāng)前值；以及

在使用所述當(dāng)前數(shù)據(jù)增強(qiáng)策略對所述機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練之后，使用所述機(jī)器學(xué)習(xí)模型確定所述當(dāng)前數(shù)據(jù)增強(qiáng)策略的質(zhì)量度量；

基于所確定的數(shù)據(jù)增強(qiáng)策略的質(zhì)量度量，選擇最終數(shù)據(jù)增強(qiáng)策略；以及

通過使用所述最終數(shù)據(jù)增強(qiáng)策略訓(xùn)練最終機(jī)器學(xué)習(xí)模型來生成最終訓(xùn)練過的機(jī)器學(xué)習(xí)模型。

2.根據(jù)權(quán)利要求1所述的方法，其中，所述特定機(jī)器學(xué)習(xí)任務(wù)是包括分類或回歸的圖像處理任務(wù)。

3.根據(jù)權(quán)利要求1至2中的任一項(xiàng)所述的方法，其中：

每個(gè)數(shù)據(jù)增強(qiáng)策略包括一個(gè)或多個(gè)子策略；

每個(gè)子策略包括一個(gè)或多個(gè)變換元組的序列，其中，對于每個(gè)變換元組，所述數(shù)據(jù)增強(qiáng)策略參數(shù)定義：(i)變換操作，和(ii)所述變換操作的大小；以及

根據(jù)所述數(shù)據(jù)增強(qiáng)策略對所述一批訓(xùn)練數(shù)據(jù)中的訓(xùn)練輸入進(jìn)行變換包括，對于每個(gè)訓(xùn)練輸入：

識別所述數(shù)據(jù)增強(qiáng)策略中包括的子策略；以及

通過將所識別的子策略中包括的每個(gè)變換元組依次地應(yīng)用于所述訓(xùn)練輸入，來根據(jù)所識別的子策略來變換所述訓(xùn)練輸入。

4.根據(jù)權(quán)利要求3所述的方法，其中，為所述訓(xùn)練輸入識別在所述數(shù)據(jù)增強(qiáng)策略中包括的子策略包括隨機(jī)地采樣在所述數(shù)據(jù)增強(qiáng)策略中包括的子策略。

5.根據(jù)權(quán)利要求3至4中的任一項(xiàng)所述的方法，其中，將變換元組應(yīng)用于所述訓(xùn)練輸入包括：

將所述變換元組中的所述變換操作以所述變換元組中的所述變換操作大小來應(yīng)用于所述訓(xùn)練輸入。

6.根據(jù)權(quán)利要求3至4中的任一項(xiàng)所述的方法，其中：

對于每個(gè)變換元組，所述數(shù)據(jù)增強(qiáng)策略參數(shù)進(jìn)一步定義應(yīng)用所述變換操作的概率；以及

將變換元組應(yīng)用于所述訓(xùn)練輸入包括：

以所述變換元組中的所述變換概率，將所述變換元組中的所述變換操作以所述變換元組中的所述變換操作大小來應(yīng)用于所述訓(xùn)練輸入。

7.根據(jù)權(quán)利要求1至6中的任一項(xiàng)所述的方法，其中，所述機(jī)器學(xué)習(xí)模型是神經(jīng)網(wǎng)絡(luò)，以及基于所述增強(qiáng)后的一批訓(xùn)練數(shù)據(jù)來調(diào)整所述機(jī)器學(xué)習(xí)模型參數(shù)的當(dāng)前值包括：

使用所述增強(qiáng)后的一批訓(xùn)練數(shù)據(jù)確定損失函數(shù)的梯度：以及

使用所述梯度來調(diào)整所述機(jī)器學(xué)習(xí)模型參數(shù)的當(dāng)前值。

8.根據(jù)權(quán)利要求1至7中的任一項(xiàng)所述的方法，其中：

基于在先前時(shí)間步長所生成的數(shù)據(jù)增強(qiáng)策略的質(zhì)量度量來生成所述當(dāng)前數(shù)據(jù)增強(qiáng)策略包括：根據(jù)策略神經(jīng)網(wǎng)絡(luò)參數(shù)的當(dāng)前值，使用策略神經(jīng)網(wǎng)絡(luò)生成所述當(dāng)前數(shù)據(jù)增強(qiáng)策略；以及

所述策略神經(jīng)網(wǎng)絡(luò)是通過強(qiáng)化學(xué)習(xí)技術(shù)來訓(xùn)練的，并且在每個(gè)時(shí)間步長，所述強(qiáng)化學(xué)習(xí)獎勵(lì)信號是基于在該時(shí)間步長的當(dāng)前數(shù)據(jù)增強(qiáng)策略的質(zhì)量度量的。

9.根據(jù)權(quán)利要求8所述的方法，其中，對于每個(gè)數(shù)據(jù)增強(qiáng)策略參數(shù)，所述策略網(wǎng)絡(luò)輸出定義所述數(shù)據(jù)增強(qiáng)策略參數(shù)的可能值的得分分布。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司，未經(jīng)谷歌有限責(zé)任公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201980014733.1/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：制備液體家用護(hù)理組合物的方法
下一篇：用于窄型同步激光塑料焊接的波導(dǎo)

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06N 基于特定計(jì)算模型的計(jì)算機(jī)系統(tǒng)
G06N3-00 基于生物學(xué)模型的計(jì)算機(jī)系統(tǒng)
G06N3-02 .采用神經(jīng)網(wǎng)絡(luò)模型
G06N3-12 .采用遺傳模型
G06N3-06 ..物理實(shí)現(xiàn)，即神經(jīng)網(wǎng)絡(luò)、神經(jīng)元或神經(jīng)元部分的硬件實(shí)現(xiàn)
G06N3-08 ..學(xué)習(xí)方法

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】