[發(fā)明專利]一種自監(jiān)督單視圖三維發(fā)絲模型重建方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110453009.8 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN113129347A | 公開(公告)日: | 2021-07-16 |
| 發(fā)明(設(shè)計)人: | 于耀;潘霄禹;周余;都思丹 | 申請(專利權(quán))人: | 南京大學(xué) |
| 主分類號: | G06T7/521 | 分類號: | G06T7/521;G06T7/11;G06T15/00;G06T17/10;G06N3/04;G06N3/08 |
| 代理公司: | 北京高沃律師事務(wù)所 11569 | 代理人: | 杜陽陽 |
| 地址: | 210046 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 監(jiān)督 視圖 三維 發(fā)絲 模型 重建 方法 系統(tǒng) | ||
本發(fā)明涉及一種自監(jiān)督單視圖三維發(fā)絲模型重建方法及系統(tǒng),獲取肖像圖像樣本的發(fā)型區(qū)域占用圖、發(fā)絲紋理方向圖和投影視角,構(gòu)建初始的單視圖3D發(fā)型重建網(wǎng)絡(luò),以發(fā)型區(qū)域占用圖和2D占用圖的對應(yīng)像素的差值以及發(fā)絲紋理方向圖和2D方向圖的對應(yīng)像素的差值構(gòu)建損失函數(shù),對初始的單視圖3D發(fā)型重建網(wǎng)絡(luò)進行訓(xùn)練,最后將待重建肖像圖像輸入訓(xùn)練好的單視圖3D發(fā)型重建網(wǎng)絡(luò),獲得3D數(shù)字化發(fā)型。本發(fā)明在網(wǎng)絡(luò)訓(xùn)練時無需2D到3D的真實數(shù)據(jù)對做監(jiān)督,而是利用單張照片作為輸入,借助可微分體積場重投影,將三維數(shù)據(jù)映射回二維,以輸入本身作為約束,完成自監(jiān)督,利用訓(xùn)練好的單視圖3D發(fā)型重建網(wǎng)絡(luò)實現(xiàn)了一種端到端的三維發(fā)型重建,讓用戶快速獲取發(fā)型重建結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機視覺與計算機圖形學(xué)技術(shù)領(lǐng)域,特別是涉及一種自監(jiān)督單視圖三維發(fā)絲模型重建方法及系統(tǒng)。
背景技術(shù)
單視圖3D頭發(fā)數(shù)字化的最新進展為給用戶提供可訪問的高質(zhì)量CG(ComputerGraphics,計算機動畫)角色提供了可能,從而幫助實現(xiàn)新形式的個性化VR和游戲體驗。
在建模CG角色時,創(chuàng)建高質(zhì)量的3D頭發(fā)模型是最耗時的任務(wù)之一。盡管有各種設(shè)計工具如XGen等商業(yè)解決方案,但為英雄角色制作單個3D頭發(fā)模型仍需要耗費藝術(shù)家數(shù)小時甚至數(shù)天才能達到令人滿意的結(jié)果。因此,已有很多工作致力于引入了毛發(fā)數(shù)字化技術(shù)以試圖減少和消除3D頭發(fā)建模的費力和手動性。
在基于多視圖的建模方案中,大部分要借助昂貴的硬件設(shè)備,受控的捕獲設(shè)置和專業(yè)的手動清理,如使用全方位可控光源的頭發(fā)捕捉系統(tǒng)、使用Kinect掃描得到RGB-D的圖像數(shù)據(jù)。而一種使用四視圖的建模方法,使用的雖然也是RGB的圖片,但對“前后左右”四張視圖的視角有較嚴(yán)格的要求,這也不是用戶可以獨自獲取的。
單視圖頭發(fā)建模解決方案在消費者友好的3D頭像數(shù)字化的背景下變得越來越重要。一種數(shù)據(jù)驅(qū)動方法,可以從單個輸入照片和一些用戶交互中生成整個發(fā)型,并非全自動方案。后來提出了一個全自動變體,使用增強的3D發(fā)型數(shù)據(jù)庫和深度卷積神經(jīng)網(wǎng)絡(luò)來分割頭發(fā)區(qū)域。有方法通過引入基于深度學(xué)習(xí)的頭發(fā)屬性分類器進一步提高了檢索性能,這增加了對難以提取局部定向字段的挑戰(zhàn)性輸入圖像的魯棒性。然而,這些數(shù)據(jù)驅(qū)動的方法依賴于數(shù)據(jù)庫的質(zhì)量和多樣性,以及輸入圖像的成功預(yù)處理和分析。特別是,如果數(shù)據(jù)庫中沒有具有可識別相似性的3D頭發(fā)模型,則重建的頭發(fā)模型可能會失敗。此外,隨著頭發(fā)模型的多樣性或數(shù)量的增加,手工設(shè)定的描述變得難以優(yōu)化。
將深度學(xué)習(xí)應(yīng)用于3D數(shù)據(jù)的研究也越來越多。深度神經(jīng)網(wǎng)絡(luò)用于諸如分類和回歸之類任務(wù)的成功,可以通過它們將數(shù)據(jù)轉(zhuǎn)換成高維特征表示的有效性來解釋。因為卷積神經(jīng)網(wǎng)絡(luò)被設(shè)計用于處理圖像,所以3D形狀通常被轉(zhuǎn)換成規(guī)則網(wǎng)格表示以實現(xiàn)卷積。有方法將3D點云或網(wǎng)格渲染到深度貼圖中,然后將2D卷積應(yīng)用于它們。也有方法直接將3D卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于變分自動編碼器。
綜上,現(xiàn)有方法主要存在以下問題:普通用戶難以獲取數(shù)據(jù)、非全自動、非端到端、算法耗時長。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種自監(jiān)督單視圖三維發(fā)絲模型重建方法及系統(tǒng),以實現(xiàn)一種端到端的三維發(fā)型重建系統(tǒng),讓用戶快速獲取發(fā)型重建結(jié)果。
為實現(xiàn)上述目的,本發(fā)明提供了如下方案:
一種自監(jiān)督單視圖三維發(fā)絲模型重建方法,所述方法包括:
獲取肖像圖像樣本的發(fā)型區(qū)域占用圖和發(fā)絲紋理方向圖;
根據(jù)所述肖像圖像樣本,利用Ray-casting光線投射投影方式,獲得所述肖像圖像樣本的投影視角;
根據(jù)圖像編碼器和訓(xùn)練好的VAE網(wǎng)絡(luò)中的體積解碼器,構(gòu)建初始的單視圖3D發(fā)型重建網(wǎng)絡(luò);
將所述肖像圖像樣本輸入初始的單視圖3D發(fā)型重建網(wǎng)絡(luò),獲得所述肖像圖像樣本的重建體積模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué),未經(jīng)南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110453009.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 在即時通信中提供即時監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對象尋址方法、電子設(shè)備及存儲介質(zhì)
- 一種機器人表情調(diào)用方法和家用機器人
- 計算機視覺訓(xùn)練系統(tǒng)和用于訓(xùn)練計算機視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 一種三維彩色物品制作方法
- 三維內(nèi)容顯示的方法、裝置和系統(tǒng)
- 三維對象搜索方法、裝置及系統(tǒng)
- 三維會話數(shù)據(jù)展示方法、裝置、存儲介質(zhì)和計算機設(shè)備
- 一種三維模型處理方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 用于基于分布式賬本技術(shù)的三維打印的去中心化供應(yīng)鏈
- 標(biāo)記數(shù)據(jù)的獲取方法及裝置、訓(xùn)練方法及裝置、醫(yī)療設(shè)備
- 一種基于5G網(wǎng)絡(luò)的光場三維浸入式體驗信息傳輸方法及系統(tǒng)
- 用于機器人生產(chǎn)系統(tǒng)仿真的三維場景管理與文件存儲方法
- 基于三維形狀知識圖譜的三維模型檢索方法及裝置





