[發明專利]模型的訓練方法、裝置、電子設備及存儲介質有效
| 申請號: | 202011107097.8 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112405521B | 公開(公告)日: | 2022-02-25 |
| 發明(設計)人: | 王凡;田浩;方曉敏;何徑舟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張大威 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了模型的訓練方法、裝置、電子設備及存儲介質,涉及深度學習技術領域。具體實現方案為:根據已獲取到的元模型集合,生成衍生模型,并將多個衍生模型作為元模型添加至元模型集合中,增加元模型集合中的模型數量,以備后續對元模型集合進行元訓練;之后,根據經過訓練的元模型的性能參數,對元模型集合中的元模型進行篩選,從而得到性能良好的元模型進行目標任務的適配訓練。由于本申請提供的方案中,采用了對元模型進行豐富后再篩選的方式,從而使得篩選保留的元模型性能得到提升,可使適配訓練結果不需要反向傳遞至元訓練過程,也能達到較優的訓練結果,有效地提高了訓練效率。
技術領域
本申請涉及人工智能技術領域,具體涉及深度學習技術領域,尤其涉及模型的訓練方法、裝置、電子設備及存儲介質。
背景技術
目前,如何讓機器人適應一系列廣泛的任務是進一步提升人工智能的重要因素之一,由于傳統機器學習或者強化學習技術,僅僅能讓機器人訓練出某一個特定的任務。比如,可以讓機器人用幾何參數一定的兩條腿,以及適應特定的電機來走路。但一旦切換了腿的參數,例如腿長,模型就無法繼續利用,而需要重新訓練。這嚴重限制了當今人工智能的應用能力。
相關技術中,通過“元學習”和“適配學習”相結合的方式,提高人工智能的應用能力,然而,在“元學習”過程中,即元模型訓練過程中,需要從具體適配的任務進行梯度回傳,當適配過程較長時,元模型訓練存在較大的負擔,使得訓練效率迅速降低。
發明內容
提供了一種模型的訓練方法、裝置、電子設備及存儲介質。
根據第一方面,提供了一種模型的訓練方法,通過將多個衍生模型添加到元模型集合中,使元模型集合數量擴大,并且根據元模型的性能參數對元模型進行篩選,篩選出性能較佳的元模型進行目標任務的適配訓練,從而使適配訓練結果不需要反向傳遞至元訓練過程,也能達到較優的訓練結果,有效地提高了訓練效率。
本申請第二方面提出了一種模型的訓練裝置。
本申請第三方面提出了一種電子設備。
本申請第四方面提出了一種存儲有計算機指令的非瞬時計算機可讀存儲介質。
本申請第五方面提出了一種計算機程序產品。
本申請第一方面實施例提出了一種模型的訓練方法,包括:獲取元模型集合;根據所述元模型集合,生成衍生模型,并將所述衍生模型作為元模型添加至所述元模型集合中;對所述元模型集合進行元訓練,以確定所述元模型集合中經過訓練的每一元模型的性能參數;根據所述性能參數,對所述元模型集合中的元模型進行篩選,以將篩選保留的元模型進行目標任務的適配訓練,得到用以執行所述目標任務的適配模型。
本申請實施例的模型的訓練方法,通過獲取元模型集合;根據所述元模型集合,生成衍生模型,并將所述衍生模型作為元模型添加至所述元模型集合中;對所述元模型集合進行元訓練,以確定所述元模型集合中經過訓練的每一元模型的性能參數;根據所述性能參數,對所述元模型集合中的元模型進行篩選,以將篩選保留的元模型進行目標任務的適配訓練,得到用以執行所述目標任務的適配模型。該方法通過將多個衍生模型添加到元模型集合中,使元模型集合數量擴大,并且根據元模型的性能參數對元模型進行篩選,篩選出性能較佳的元模型進行目標任務的適配訓練,從而使適配訓練結果不需要反向傳遞至元訓練過程,也能達到較優的訓練結果,有效地提高了訓練效率。
本申請第二方面實施例提出了一種模型的訓練裝置,包括:獲取模塊,用于獲取元模型集合;生成模塊,用于根據所述元模型集合,生成衍生模型,并將所述衍生模型作為元模型添加至所述元模型集合中;訓練模塊,用于對所述元模型集合進行元訓練,以確定所述元模型集合中經過訓練的每一元模型的性能參數;篩選模塊,用于根據所述性能參數,對所述元模型集合中的元模型進行篩選,以將篩選保留的元模型進行目標任務的適配訓練,得到用以執行所述目標任務的適配模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011107097.8/2.html,轉載請聲明來源鉆瓜專利網。





