[發(fā)明專利]神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、生成圖像及視頻的方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202110602135.5 | 申請(qǐng)日: | 2021-05-31 |
| 公開(kāi)(公告)號(hào): | CN113326934A | 公開(kāi)(公告)日: | 2021-08-31 |
| 發(fā)明(設(shè)計(jì))人: | 魯超 | 申請(qǐng)(專利權(quán))人: | 上海嗶哩嗶哩科技有限公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06T5/00 |
| 代理公司: | 北京市漢坤律師事務(wù)所 11602 | 代理人: | 魏小薇;吳麗麗 |
| 地址: | 200433 上海市*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 神經(jīng)網(wǎng)絡(luò) 訓(xùn)練 方法 生成 圖像 視頻 裝置 | ||
1.一種由計(jì)算機(jī)實(shí)現(xiàn)的神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法,其中,所述神經(jīng)網(wǎng)絡(luò)包括圖像生成網(wǎng)絡(luò)和圖像修復(fù)網(wǎng)絡(luò),所述方法包括:
獲取樣本源圖像和樣本參考圖像,其中,所述樣本源圖像中包括樣本源對(duì)象,所述樣本參考圖像中包括樣本參考對(duì)象;
將所述樣本源圖像和所述樣本參考圖像輸入所述圖像生成網(wǎng)絡(luò),獲得所述圖像生成網(wǎng)絡(luò)輸出的預(yù)測(cè)生成圖像,其中,所述預(yù)測(cè)生成圖像中包括所述樣本源對(duì)象,并且所述預(yù)測(cè)生成圖像中的所述樣本源對(duì)象的姿態(tài)與所述樣本參考圖像中的所述樣本參考對(duì)象的姿態(tài)一致;
將所述預(yù)測(cè)生成圖像輸入所述圖像修復(fù)網(wǎng)絡(luò),獲得所述圖像修復(fù)網(wǎng)絡(luò)輸出的針對(duì)所述預(yù)測(cè)生成圖像的預(yù)測(cè)修復(fù)圖像;
基于所述樣本參考圖像和所述預(yù)測(cè)修復(fù)圖像來(lái)確定損失值;以及
基于所述損失值來(lái)調(diào)整所述圖像修復(fù)網(wǎng)絡(luò)的參數(shù)。
2.如權(quán)利要求1所述的方法,其中,所述樣本源圖像和所述樣本參考圖像為針對(duì)同一個(gè)對(duì)象的視頻中的不同圖像幀。
3.如權(quán)利要求1所述的方法,還包括:構(gòu)建樣本視頻集合,所述樣本視頻集合包括多個(gè)樣本視頻,每一個(gè)樣本視頻對(duì)應(yīng)于一個(gè)對(duì)象;
其中,所述樣本源圖像和所述樣本參考圖像為所述樣本視頻集合中的針對(duì)同一個(gè)對(duì)象的樣本視頻中的不同圖像幀。
4.如權(quán)利要求3所述的方法,其中,所述構(gòu)建樣本視頻集合包括:
獲取多個(gè)原始視頻;
對(duì)于所述多個(gè)原始視頻中的每一個(gè)原始視頻,執(zhí)行以下操作:
對(duì)該原始視頻中的每個(gè)圖像幀進(jìn)行對(duì)象檢測(cè);以及
去除該原始視頻中的不包括對(duì)象的圖像幀,以得到樣本視頻。
5.如權(quán)利要求3或4所述的方法,其中,所述構(gòu)建樣本視頻集合還包括:將所述樣本視頻的時(shí)長(zhǎng)調(diào)整為預(yù)設(shè)時(shí)長(zhǎng)。
6.如權(quán)利要求3-5中任一項(xiàng)所述的方法,其中,所述構(gòu)建樣本視頻集合還包括:將所述樣本視頻的圖像幀的尺寸調(diào)整為預(yù)設(shè)尺寸。
7.如權(quán)利要求1-6中任一項(xiàng)所述的方法,其中,所述圖像生成網(wǎng)絡(luò)和所述圖像修復(fù)網(wǎng)絡(luò)中的至少一個(gè)包括生成對(duì)抗網(wǎng)絡(luò)。
8.如權(quán)利要求1-7中任一項(xiàng)所述的方法,其中,所述圖像生成網(wǎng)絡(luò)采用樣本生成源圖像和樣本生成參考圖像訓(xùn)練得到,所述樣本生成源圖像和所述樣本生成參考圖像為針對(duì)同一個(gè)對(duì)象的視頻中的不同圖像幀。
9.一種利用神經(jīng)網(wǎng)絡(luò)生成圖像的方法,其中,所述神經(jīng)網(wǎng)絡(luò)為根據(jù)權(quán)利要求1-8中任一項(xiàng)所述的訓(xùn)練方法進(jìn)行訓(xùn)練來(lái)得到,所述神經(jīng)網(wǎng)絡(luò)包括圖像生成網(wǎng)絡(luò)和圖像修復(fù)網(wǎng)絡(luò),所述方法包括:
將源圖像和參考圖像輸入所述圖像生成網(wǎng)絡(luò),獲得所述圖像生成網(wǎng)絡(luò)輸出的生成圖像,其中,所述源圖像中包括源對(duì)象,所述參考圖像中包括參考對(duì)象,所述生成圖像中包括所述源對(duì)象,并且所述生成圖像中的所述源對(duì)象的姿態(tài)與所述參考圖像中的所述參考對(duì)象的姿態(tài)一致;
將所述生成圖像輸入所述圖像修復(fù)網(wǎng)絡(luò),獲得所述圖像修復(fù)網(wǎng)絡(luò)輸出的針對(duì)所述生成圖像的修復(fù)圖像;以及
將所述修復(fù)圖像作為結(jié)果圖像。
10.一種利用神經(jīng)網(wǎng)絡(luò)生成視頻的方法,其中,所述神經(jīng)網(wǎng)絡(luò)為根據(jù)權(quán)利要求1-8中任一項(xiàng)所述的訓(xùn)練方法進(jìn)行訓(xùn)練來(lái)得到,所述神經(jīng)網(wǎng)絡(luò)包括圖像生成網(wǎng)絡(luò)和圖像修復(fù)網(wǎng)絡(luò),所述方法包括:
獲取源圖像和參考視頻,其中,所述源圖像中包括源對(duì)象,所述參考視頻包括多個(gè)參考圖像幀,每個(gè)參考圖像幀中包括參考對(duì)象;
對(duì)于所述多個(gè)參考圖像幀中的每一個(gè)參考圖像幀,執(zhí)行以下操作:
將所述源圖像和該參考圖像幀輸入所述圖像生成網(wǎng)絡(luò),獲得所述圖像生成網(wǎng)絡(luò)輸出的生成圖像,其中,所述生成圖像中包括所述源對(duì)象,并且所述生成圖像中的所述源對(duì)象的姿態(tài)與所述參考圖像幀中的所述參考對(duì)象的姿態(tài)一致;以及
將所述生成圖像輸入所述圖像修復(fù)網(wǎng)絡(luò),獲得所述圖像修復(fù)網(wǎng)絡(luò)輸出的針對(duì)所述生成圖像的修復(fù)圖像;以及
將所述多個(gè)參考圖像幀各自對(duì)應(yīng)的多個(gè)修復(fù)圖像進(jìn)行拼接,生成結(jié)果視頻。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海嗶哩嗶哩科技有限公司,未經(jīng)上海嗶哩嗶哩科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110602135.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





