[發(fā)明專利]一種模型訓(xùn)練中的數(shù)據(jù)更新方法、裝置及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201811331869.9 | 申請(qǐng)日: | 2018-11-09 |
| 公開(公告)號(hào): | CN109359120A | 公開(公告)日: | 2019-02-19 |
| 發(fā)明(設(shè)計(jì))人: | 宋孟楠 | 申請(qǐng)(專利權(quán))人: | 阿里巴巴集團(tuán)控股有限公司 |
| 主分類號(hào): | G06F16/23 | 分類號(hào): | G06F16/23;G06N3/08 |
| 代理公司: | 北京國昊天誠知識(shí)產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 許振新;朱文杰 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)絡(luò)模型 模型訓(xùn)練 目標(biāo)網(wǎng)絡(luò) 裝置及設(shè)備 輸出結(jié)果 數(shù)據(jù)更新 更新 模型參數(shù) 網(wǎng)絡(luò)層 | ||
本說明書實(shí)施例公開了一種模型訓(xùn)練中的數(shù)據(jù)更新方法、裝置及設(shè)備,所述方法包括:獲取進(jìn)行模型訓(xùn)練的目標(biāo)深度網(wǎng)絡(luò)模型;將預(yù)定的輸入數(shù)據(jù)輸入到所述目標(biāo)深度網(wǎng)絡(luò)模型中得到相應(yīng)的輸出結(jié)果,并確定所述輸出結(jié)果對(duì)應(yīng)的誤差;如果所述誤差大于預(yù)定的誤差閾值,則根據(jù)所述目標(biāo)深度網(wǎng)絡(luò)模型的模型參數(shù)和模型訓(xùn)練信息,確定所述目標(biāo)深度網(wǎng)絡(luò)模型中待更新權(quán)值的目標(biāo)網(wǎng)絡(luò)層;停止更新所述目標(biāo)深度網(wǎng)絡(luò)模型中除所述目標(biāo)網(wǎng)絡(luò)層外的其它網(wǎng)絡(luò)層的權(quán)值,并更新所述目標(biāo)網(wǎng)絡(luò)層的權(quán)值。
技術(shù)領(lǐng)域
本說明書涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種模型訓(xùn)練中的數(shù)據(jù)更新方法、裝置及設(shè)備。
背景技術(shù)
機(jī)器學(xué)習(xí)是人工智能的中心,以人類的學(xué)習(xí)方式為基礎(chǔ),構(gòu)建能夠模仿、完成人類學(xué)習(xí)行為的計(jì)算智能體,以期智能體能夠通過學(xué)習(xí)獲取新的常識(shí)或技能。作為機(jī)器學(xué)習(xí)中的一個(gè)新的領(lǐng)域,深度學(xué)習(xí)引起了廣泛關(guān)注,對(duì)于人工智能技術(shù)的發(fā)展擁有前所未有的重要性。
深度學(xué)習(xí)方法通過網(wǎng)絡(luò)建立深層次的非線性結(jié)構(gòu),通過對(duì)海量樣本集數(shù)據(jù)多層特征的學(xué)習(xí),以提高分類和預(yù)測的準(zhǔn)確性。當(dāng)前,深度學(xué)習(xí)的理論在各個(gè)場景落地開花,將人工智能推向高潮,深度學(xué)習(xí)的方法也在多個(gè)領(lǐng)域的各個(gè)業(yè)務(wù)線上得到了廣泛的應(yīng)用。但是,深度學(xué)習(xí)的成果是建立在大數(shù)據(jù)和充足的計(jì)算資源的基礎(chǔ)上的,其復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)耗費(fèi)著大量時(shí)間成本和計(jì)算成本,甚至制約了在一些場景上的應(yīng)用和推廣。深度學(xué)習(xí)的效率主要制約在模型訓(xùn)練階段,通常,對(duì)深度網(wǎng)絡(luò)模型的訓(xùn)練是通過對(duì)整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)采用全局訓(xùn)練參數(shù)進(jìn)行模型訓(xùn)練,但是,這種方式會(huì)存在大量的冗余計(jì)算,極大的耗費(fèi)了時(shí)間和計(jì)算成本,為此,需要提供一種能夠使得深度網(wǎng)絡(luò)模型訓(xùn)練的方法更加優(yōu)化,深度網(wǎng)絡(luò)模型的訓(xùn)練效率更高的技術(shù)方案。
發(fā)明內(nèi)容
本說明書實(shí)施例的目的是提供一種能夠使得深度網(wǎng)絡(luò)模型訓(xùn)練的方法更加優(yōu)化,深度網(wǎng)絡(luò)模型的訓(xùn)練效率更高的技術(shù)方案。
為了實(shí)現(xiàn)上述技術(shù)方案,本說明書實(shí)施例是這樣實(shí)現(xiàn)的:
本說明書實(shí)施例提供的一種模型訓(xùn)練中的數(shù)據(jù)更新方法,所述方法包括:
獲取進(jìn)行模型訓(xùn)練的目標(biāo)深度網(wǎng)絡(luò)模型;
將預(yù)定的輸入數(shù)據(jù)輸入到所述目標(biāo)深度網(wǎng)絡(luò)模型中得到相應(yīng)的輸出結(jié)果,并確定所述輸出結(jié)果對(duì)應(yīng)的誤差;
如果所述誤差大于預(yù)定的誤差閾值,則根據(jù)所述目標(biāo)深度網(wǎng)絡(luò)模型的模型參數(shù)和模型訓(xùn)練信息,確定所述目標(biāo)深度網(wǎng)絡(luò)模型中待更新權(quán)值的目標(biāo)網(wǎng)絡(luò)層;
停止更新所述目標(biāo)深度網(wǎng)絡(luò)模型中除所述目標(biāo)網(wǎng)絡(luò)層外的其它網(wǎng)絡(luò)層的權(quán)值,并更新所述目標(biāo)網(wǎng)絡(luò)層的權(quán)值。
可選地,所述根據(jù)所述目標(biāo)深度網(wǎng)絡(luò)模型的模型參數(shù)和模型訓(xùn)練信息,確定所述目標(biāo)深度網(wǎng)絡(luò)模型中待更新權(quán)值的目標(biāo)網(wǎng)絡(luò)層,包括:
根據(jù)所述目標(biāo)深度網(wǎng)絡(luò)模型的模型參數(shù)和模型訓(xùn)練信息,確定所述目標(biāo)深度網(wǎng)絡(luò)模型中每個(gè)網(wǎng)絡(luò)層的目標(biāo)參數(shù)數(shù)值,所述目標(biāo)參數(shù)數(shù)值用于表征所述網(wǎng)絡(luò)層的權(quán)值是否需要更新;
獲取所述目標(biāo)參數(shù)數(shù)值大于預(yù)定的參數(shù)閾值的網(wǎng)絡(luò)層,并將獲取的所述網(wǎng)絡(luò)層作為待更新權(quán)值的目標(biāo)網(wǎng)絡(luò)層。
可選地,所述方法還包括:
將更新所述目標(biāo)網(wǎng)絡(luò)層的權(quán)值后的目標(biāo)深度網(wǎng)絡(luò)模型作為獲取的進(jìn)行模型訓(xùn)練的目標(biāo)深度網(wǎng)絡(luò)模型。
可選地,所述模型參數(shù)至少包括所述目標(biāo)深度網(wǎng)絡(luò)模型中包含的網(wǎng)絡(luò)層的數(shù)量和全局迭代的步數(shù),所述模型訓(xùn)練信息至少包括當(dāng)前進(jìn)行模型訓(xùn)練所處的迭代步數(shù)。
可選地,所述方法還包括:
如果所述誤差小于預(yù)定的誤差閾值,則停止對(duì)所述目標(biāo)深度網(wǎng)絡(luò)模型的模型訓(xùn)練。
可選地,所述目標(biāo)深度網(wǎng)絡(luò)模型為包含多個(gè)隱含網(wǎng)絡(luò)層的模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團(tuán)控股有限公司,未經(jīng)阿里巴巴集團(tuán)控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811331869.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 腦網(wǎng)絡(luò)模型建立方法
- 弱光圖像增強(qiáng)方法及裝置
- 模型訓(xùn)練方法及裝置
- 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型搜索方法、裝置及存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型搜索方法、裝置以及電子設(shè)備
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 多視角的網(wǎng)絡(luò)攻防仿真系統(tǒng)
- 一種多模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 一種神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 自動(dòng)化的模型訓(xùn)練方法、裝置、設(shè)備及介質(zhì)
- 變換模型訓(xùn)練方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 信息處理裝置和方法以及利用模型分類的裝置
- 一種模型訓(xùn)練的方法和裝置
- 模型訓(xùn)練方法、模型訓(xùn)練裝置和實(shí)體抽取方法
- 選擇模型訓(xùn)練方法、模型選擇方法、裝置及電子設(shè)備
- 模型訓(xùn)練方法及裝置
- 模型的訓(xùn)練方法、模型的預(yù)測方法以及模型的控制系統(tǒng)
- 一種模型生成及電池劣化推測裝置、方法、介質(zhì)及設(shè)備
- 模型訓(xùn)練方法、模型訓(xùn)練平臺(tái)、電子設(shè)備和存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)質(zhì)量探測方法和裝置
- 一種網(wǎng)絡(luò)切換方法及終端設(shè)備
- 一種網(wǎng)絡(luò)問題的確定方法及裝置
- 一種無線網(wǎng)絡(luò)的切換方法、裝置和設(shè)備
- 一種基于灰色模型預(yù)測目標(biāo)網(wǎng)絡(luò)參數(shù)的方法和裝置
- 策略的推送方法、策略的執(zhí)行方法、裝置、設(shè)備及介質(zhì)
- 一種目標(biāo)域檢測網(wǎng)絡(luò)的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 目標(biāo)檢測網(wǎng)絡(luò)優(yōu)化方法和裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 神經(jīng)網(wǎng)絡(luò)生成方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 深度學(xué)習(xí)網(wǎng)絡(luò)確定方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





