[發明專利]模型訓練方法及相關裝置、可讀存儲介質在審
| 申請號: | 202110224930.5 | 申請日: | 2021-03-01 |
| 公開(公告)號: | CN112884640A | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 王鑫宇;劉志遠;楊國基;劉炫鵬;陳瀧翔 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G06T3/00 | 分類號: | G06T3/00;G06N5/04;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王學強 |
| 地址: | 518000 廣東省深圳市南山區粵海街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 相關 裝置 可讀 存儲 介質 | ||
1.一種模型訓練方法,其特征在于,所述方法包括:
采用第一數據和第二數據對原始圖像翻譯模型中的GAN網絡中的原始生成模型進行訓練,以得到當前幀的第一生成圖片,所述第一數據包括當前幀的輪廓線數據和前兩幀的輪廓線數據,所述第二數據包括當前幀的原始圖片和前兩幀的原始圖片;
對所述原始生成模型執行fine-tune微調操作,直至得到一代生成模型,所述微調操作包括根據預設的損失函數,計算所述當前幀的原始圖片與所述當前幀的第一生成圖片之間的第一損失,根據所述第一損失及反向傳播算法,對所述原始生成模型中卷積層的權重進行梯度更新,其中,所述一代生成模型為一代圖像翻譯模型中的GAN網絡中的生成模型,且所述一代生成模型的圖像生成質量不大于預設的FID值。
2.根據權利要求1所述的模型訓練方法,其特征在于,所述方法還包括:
在對所述原始生成模型中卷積層的權重進行梯度更新的過程中,減少對所述原始生成模型中卷積層的學習率。
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
采用第三數據和第四數據對所述一代生成模型進行訓練,以得到當前幀的第二生成圖片,所述第三數據包括當前幀的輪廓線數據和前一幀的輪廓線數據,所述第四數據包括當前幀的原始圖片和前一幀的原始圖片;
對所述一代生成模型執行fine-tune微調操作,直至得到二代生成模型,所述微調操作包括根據所述預設的損失函數,計算所述當前幀的原始圖片與所述當前幀的第二生成圖片之間的第二損失,根據所述第二損失及所述反向傳播算法,對所述一代生成模型中卷積層的權重進行梯度更新,其中,所述二代生成模型為二代圖像翻譯模型中的GAN網絡中的生成模型,且所述二代生成模型的圖像生成質量不大于所述預設的FID值。
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
在對所述一代生成模型中卷積層的權重進行梯度更新的過程中,減少對所述一代生成模型中卷積層的學習率。
5.根據權利要求4所述的方法,其特征在于,所述方法還包括:
采用第五數據和第六數據對所述二代生成模型進行訓練,以得到當前幀的第三生成圖片,所述第五數據包括當前幀的輪廓線數據和第一幀的輪廓線數據,所述第六數據包括當前幀的原始圖片和第一幀的原始圖片;
對所述二代生成模型執行fine-tune微調操作,直至得到三代生成模型,所述微調操作包括根據所述預設的損失函數,計算所述當前幀的原始圖片與所述當前幀的第三生成圖片之間的第三損失,根據所述第三損失及所述反向傳播算法,對所述二代生成模型中卷積層的權重進行梯度更新,其中,所述三代生成模型為三代圖像翻譯模型中的GAN網絡中的生成模型,且所述三代生成模型的圖像生成質量不大于所述預設的FID值。
6.根據權利要求5所述的方法,其特征在于,所述方法還包括:
在對所述二代生成模型中卷積層的權重進行梯度更新的過程中,減少對所述二代生成模型中卷積層的學習率。
7.根據權利要求6所述的方法,其特征在于,所述方法還包括:
采用所述第五數據和第七數據對所述三代生成模型進行訓練,以得到當前幀的第四生成圖片,所述第五數據包括當前幀的輪廓線數據和第一幀的輪廓線數據,所述第七數據包括當前幀的原始圖片,及降低像素后的第一幀的圖片;
對所述三代生成模型執行fine-tune微調操作,直至得到四代生成模型,所述微調操作包括根據所述預設的損失函數,計算所述當前幀的原始圖片與所述當前幀的第四生成圖片之間的第四損失,根據所述第四損失及所述反向傳播算法,對所述三代生成模型中卷積層的權重進行梯度更新,其中,所述四代生成模型為四代圖像翻譯模型中的GAN網絡中的生成模型,且所述四代生成模型的圖像生成質量不大于所述預設的FID值。
8.根據權利要求1至7中任一項所述的模型訓練方法,其特征在于,所述圖像翻譯模型包括頭部姿態翻譯模型、身體姿態翻譯模型和街景圖像翻譯模型中的任一種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110224930.5/1.html,轉載請聲明來源鉆瓜專利網。





