[發(fā)明專利]增量訓(xùn)練方法和相關(guān)產(chǎn)品在審
| 申請(qǐng)?zhí)枺?/td> | 202110218116.2 | 申請(qǐng)日: | 2021-02-26 |
| 公開(公告)號(hào): | CN112766501A | 公開(公告)日: | 2021-05-07 |
| 發(fā)明(設(shè)計(jì))人: | 費(fèi)馳;朱烽;趙瑞 | 申請(qǐng)(專利權(quán))人: | 上海商湯智能科技有限公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06N3/04 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 熊永強(qiáng);董文俊 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 增量 訓(xùn)練 方法 相關(guān) 產(chǎn)品 | ||
本申請(qǐng)實(shí)施例公開了一種增量訓(xùn)練方法和相關(guān)產(chǎn)品,應(yīng)用于兩輪或兩輪以上的增量訓(xùn)練場(chǎng)景,該方法包括:獲取第N輪記憶數(shù)據(jù);所述第N輪記憶數(shù)據(jù)基于第(N?1)輪增量訓(xùn)練采用的第(N?1)增量數(shù)據(jù)和第(N?1)輪記憶數(shù)據(jù)得到,或者,所述第N輪記憶數(shù)據(jù)基于所述第(N?1)增量數(shù)據(jù)得到,所述N為大于2的整數(shù);使用第N增量數(shù)據(jù)以及所述第N輪記憶數(shù)據(jù)對(duì)第(N?1)神經(jīng)網(wǎng)絡(luò)進(jìn)行第N輪增量訓(xùn)練,得到第N神經(jīng)網(wǎng)絡(luò);所述第(N?1)神經(jīng)網(wǎng)絡(luò)為使用所述第(N?1)增量數(shù)據(jù)以及所述第(N?1)輪記憶數(shù)據(jù)進(jìn)行第(N?1)輪增量訓(xùn)練得到;既能充分利用新的訓(xùn)練數(shù)據(jù),又能保留之前的部分訓(xùn)練成果,并提升訓(xùn)練效果。
技術(shù)領(lǐng)域
本申請(qǐng)涉及模型訓(xùn)練領(lǐng)域,尤其涉及一種增量訓(xùn)練方法和相關(guān)產(chǎn)品。
背景技術(shù)
隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展,人工智能已經(jīng)成為了計(jì)算機(jī)視覺領(lǐng)域被研究的最多的方向之一,具有重大的研究?jī)r(jià)值和非常廣闊的應(yīng)用前景。目前人工智能技術(shù)(例如人臉識(shí)別技術(shù))被廣泛地用于安防、醫(yī)療、金融等諸多領(lǐng)域,為平安城市的建設(shè)起到了積極的促進(jìn)作用。
人工智能技術(shù)的應(yīng)用通常需要使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)來執(zhí)行各種預(yù)測(cè)處理任務(wù),例如目標(biāo)檢測(cè)任務(wù)、人臉識(shí)別任務(wù)等。因此,高效地訓(xùn)練得到性能較好的各種神經(jīng)網(wǎng)絡(luò)是目前急需解決的問題。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例公開了一種增量訓(xùn)練方法和相關(guān)產(chǎn)品,能夠高效地訓(xùn)練得到性能較好的各種神經(jīng)網(wǎng)絡(luò)。
第一方面,本申請(qǐng)實(shí)施例提供的一種增量訓(xùn)練方法,該方法包括:獲取第N輪記憶數(shù)據(jù);所述第N輪記憶數(shù)據(jù)基于第(N-1)輪增量訓(xùn)練采用的第(N-1)增量數(shù)據(jù)和第(N-1)輪記憶數(shù)據(jù)得到,或者,所述第N輪記憶數(shù)據(jù)基于所述第(N-1)增量數(shù)據(jù)得到,所述N為大于2的整數(shù);使用第N增量數(shù)據(jù)以及所述第N輪記憶數(shù)據(jù)對(duì)第(N-1)神經(jīng)網(wǎng)絡(luò)進(jìn)行第N輪增量訓(xùn)練,得到第N神經(jīng)網(wǎng)絡(luò);所述第(N-1)神經(jīng)網(wǎng)絡(luò)為使用所述第(N-1)增量數(shù)據(jù)以及所述第(N-1)輪記憶數(shù)據(jù)進(jìn)行第(N-1)輪增量訓(xùn)練得到,所述第N增量數(shù)據(jù)和所述第(N-1)增量數(shù)據(jù)不同。
本申請(qǐng)實(shí)施例的執(zhí)行主體為訓(xùn)練裝置,該訓(xùn)練裝置可以是臺(tái)式電腦、筆記本電腦等具備數(shù)據(jù)處理能力的終端設(shè)備,也可以是服務(wù)器。所述第N輪記憶數(shù)據(jù)、所述第(N-1)增量數(shù)據(jù)以及所述第(N-1)輪記憶數(shù)據(jù)均可以為圖像數(shù)據(jù),例如抓拍照?qǐng)D像。一種可能的訓(xùn)練流程如下:采用第一增量數(shù)據(jù)對(duì)原始神經(jīng)網(wǎng)絡(luò)進(jìn)行第一輪增量訓(xùn)練,得到第一神經(jīng)網(wǎng)絡(luò);采用第二增量數(shù)據(jù)以及第二輪記憶數(shù)據(jù)對(duì)第一神經(jīng)網(wǎng)絡(luò)進(jìn)行第二輪增量訓(xùn)練,得到第二神經(jīng)網(wǎng)絡(luò),其中,該第二輪記憶數(shù)據(jù)包含于第一增量數(shù)據(jù);采用第三增量數(shù)據(jù)以及第三輪記憶數(shù)據(jù)對(duì)第二神經(jīng)網(wǎng)絡(luò)進(jìn)行第三輪增量訓(xùn)練,得到第三神經(jīng)網(wǎng)絡(luò),其中,該第三輪記憶數(shù)據(jù)包含于第二增量數(shù)據(jù)或者該第三輪記憶數(shù)據(jù)的一部分包含于第二增量數(shù)據(jù),另一部分包含于第二輪記憶數(shù)據(jù);以此類推。本申請(qǐng)中,第(N-1)增量數(shù)據(jù)是指第(N-1)輪增量訓(xùn)練時(shí)新增的數(shù)據(jù),第N增量數(shù)據(jù)是指第N輪增量訓(xùn)練時(shí)新增的數(shù)據(jù);第N輪記憶數(shù)據(jù)可以是從第(N-1)增量數(shù)據(jù)和第(N-1)輪記憶數(shù)據(jù)的數(shù)據(jù)集合中篩選出的數(shù)據(jù),也可以是從第(N-1)增量數(shù)據(jù)中篩選出的數(shù)據(jù)。
在實(shí)際應(yīng)用中,訓(xùn)練數(shù)據(jù)的采集往往是一個(gè)逐漸累積的過程,如果等到所有的數(shù)據(jù)都收集完成才進(jìn)行模型的訓(xùn)練無疑會(huì)帶來時(shí)間的浪費(fèi)。本申請(qǐng)實(shí)施例中,通過多輪增量訓(xùn)練的方式可以減少時(shí)間的浪費(fèi)。第N增量數(shù)據(jù)是指第N輪增量訓(xùn)練時(shí)新增的數(shù)據(jù),第N輪記憶數(shù)據(jù)可理解為從已參與過訓(xùn)練的數(shù)據(jù)中篩選出的數(shù)據(jù),使用這兩種數(shù)據(jù)獨(dú)立的對(duì)第(N-1)神經(jīng)網(wǎng)絡(luò)進(jìn)行第N輪增量訓(xùn)練,既能充分利用新的訓(xùn)練數(shù)據(jù),又能保留之前的部分訓(xùn)練成果,并提升訓(xùn)練效果。
本申請(qǐng)實(shí)施例中,使用第N增量數(shù)據(jù)以及第N輪記憶數(shù)據(jù)對(duì)第(N-1)神經(jīng)網(wǎng)絡(luò)進(jìn)行第N輪增量訓(xùn)練,既能充分利用新的訓(xùn)練數(shù)據(jù),又能保留之前的部分訓(xùn)練成果,并提升訓(xùn)練效果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海商湯智能科技有限公司,未經(jīng)上海商湯智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110218116.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于FTP協(xié)議的行業(yè)數(shù)據(jù)庫數(shù)據(jù)實(shí)時(shí)同步系統(tǒng)
- 一種基于國家基礎(chǔ)地理信息數(shù)據(jù)的增量式地圖更新方法
- 一種遠(yuǎn)程復(fù)制多快照間增量去重的實(shí)現(xiàn)方法及裝置
- 一種增量數(shù)據(jù)獲取方法及裝置
- 一種增量包生成方法、版本升級(jí)方法、裝置以及系統(tǒng)
- 礦物增量劑連續(xù)研磨裝置
- 一種增量升級(jí)包生成、增量更新方法及裝置
- 一種增量索引更新方法及系統(tǒng)
- 一種高分辨率的增量碼道檢測(cè)方法
- 一種圖譜的增量更新方法、裝置及系統(tǒng)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





