[發(fā)明專利]基于神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)人體自由視點(diǎn)視頻的生成方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110310140.9 | 申請(qǐng)日: | 2021-03-23 |
| 公開(kāi)(公告)號(hào): | CN113096144B | 公開(kāi)(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 劉燁斌;李哲;于濤 | 申請(qǐng)(專利權(quán))人: | 清華大學(xué) |
| 主分類號(hào): | G06T7/13 | 分類號(hào): | G06T7/13;G06T7/181;G06T7/90;G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 韓海花 |
| 地址: | 10008*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 神經(jīng)網(wǎng)絡(luò) 動(dòng)態(tài) 人體 自由 視點(diǎn) 視頻 生成 方法 裝置 | ||
1.一種基于神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)人體自由視點(diǎn)視頻的生成方法,其特征在于,包括:
重建單個(gè)人體的預(yù)掃描模型;
通過(guò)多個(gè)RGB相機(jī)對(duì)所述單個(gè)人體拍攝,獲取RGB圖像序列;
對(duì)所述預(yù)掃描模型使進(jìn)行變形,使得變形后的所述預(yù)掃描模型與每幀RGB圖像匹配;
對(duì)所述預(yù)掃描模型采樣,并在每一個(gè)采樣點(diǎn)處定義一個(gè)隱碼,并基于神經(jīng)網(wǎng)絡(luò)聯(lián)合優(yōu)化隱碼與網(wǎng)絡(luò)參數(shù);
獲取任意渲染視角,基于所述任意渲染視角生成自由視點(diǎn)視頻;
所述對(duì)所述預(yù)掃描模型使進(jìn)行變形,使得變形后的所述預(yù)掃描模型與每幀RGB圖像匹配,包括:
基于所述預(yù)掃描模型對(duì)所述每幀RGB圖像進(jìn)行運(yùn)動(dòng)跟蹤,獲取所述每幀RGB圖像對(duì)應(yīng)的同拓?fù)淠P停?/p>
建立能量函數(shù)(1),通過(guò)最優(yōu)化求解出所述預(yù)掃描模型的非剛性變形參數(shù);
E=Ecolor+Esilhouette+λsmoothEsmooth (1)
其中,是顏色項(xiàng),其中,M是所述預(yù)掃描模型的頂點(diǎn)集合,v是其中一個(gè)頂點(diǎn),是經(jīng)過(guò)非剛性變形后的頂點(diǎn)位置,cv是頂點(diǎn)顏色,π(·)表示投影函數(shù),ColorImg(·)代表在彩色圖像上采樣獲得相應(yīng)的RGB值;是輪廓項(xiàng),其中,Boundary(M)表示M中靠近圖像輪廓的頂點(diǎn)集合,DtImg是對(duì)輸入輪廓做距離變換得到的圖像;Esmooth為正則項(xiàng);
獲取所有幀RGB圖像下同拓?fù)涞乃鲱A(yù)掃描模型。
2.如權(quán)利要求1所述的方法,其特征在于,所述重建單個(gè)人體的預(yù)掃描模型,包括:
使用多相機(jī)系統(tǒng)或掃描儀重建出所述單個(gè)人體的預(yù)掃描模型。
3.如權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述預(yù)掃描模型采樣,并在每一個(gè)采樣點(diǎn)處定義一個(gè)隱碼,并基于神經(jīng)網(wǎng)絡(luò)聯(lián)合優(yōu)化隱碼與網(wǎng)絡(luò)參數(shù),包括:
對(duì)所述預(yù)掃描模型進(jìn)行采樣,獲取系列采樣點(diǎn)對(duì)于每個(gè)采樣點(diǎn)定義一個(gè)隱碼
定義fd(·)和fc(·)為設(shè)計(jì)好的神經(jīng)網(wǎng)絡(luò),對(duì)于所述每幀RGB圖像的所有空間點(diǎn),對(duì)于任意空間點(diǎn)體密度公式為:σ=fd(z);顏色公式為:c=fc(z,x,d);其中,z表示x所在位置的隱碼,由插值得到,表示渲染視角;
輸入多相機(jī)采集視角,通過(guò)體渲染獲取渲染圖像與真實(shí)采集圖像構(gòu)建誤差函數(shù)
基于公式(2)聯(lián)合訓(xùn)練隱碼與網(wǎng)絡(luò)參數(shù)。
4.如權(quán)利要求1所述的方法,其特征在于,所述基于所述任意渲染視角生成自由視點(diǎn)視頻,包括:
獲取所述任意渲染視角對(duì)應(yīng)的輸入網(wǎng)絡(luò)參數(shù);
基于所述輸入網(wǎng)絡(luò)參數(shù)生成所述自由視點(diǎn)視頻。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110310140.9/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 動(dòng)態(tài)矢量譯碼方法和動(dòng)態(tài)矢量譯碼裝置
- 動(dòng)態(tài)口令的顯示方法及動(dòng)態(tài)令牌
- 動(dòng)態(tài)庫(kù)管理方法和裝置
- 動(dòng)態(tài)令牌的身份認(rèn)證方法及裝置
- 令牌、動(dòng)態(tài)口令生成方法、動(dòng)態(tài)口令認(rèn)證方法及系統(tǒng)
- 一種動(dòng)態(tài)模糊控制系統(tǒng)
- 一種基于動(dòng)態(tài)信號(hào)的POS機(jī)和安全保護(hù)方法
- 圖像動(dòng)態(tài)展示的方法、裝置、系統(tǒng)及介質(zhì)
- 一種基于POS機(jī)聚合碼功能分離顯示動(dòng)態(tài)聚合碼的系統(tǒng)
- 基于動(dòng)態(tài)口令的身份認(rèn)證方法、裝置和動(dòng)態(tài)令牌





