[發明專利]三維人臉模型重建方法及裝置在審
| 申請號: | 201810690747.2 | 申請日: | 2018-06-28 |
| 公開(公告)號: | CN109035388A | 公開(公告)日: | 2018-12-18 |
| 發明(設計)人: | 戶磊 | 申請(專利權)人: | 北京的盧深視科技有限公司 |
| 主分類號: | G06T17/00 | 分類號: | G06T17/00;G06T15/04 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩;李相雨 |
| 地址: | 100000 北京市海淀區學院*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 三維人臉模型 人臉 彩色圖 參數化 重建 法線方向 深度圖 網格點 偏移 圖片輸入 系數確定 系數和 網絡 學習 轉化 圖片 | ||
1.一種三維人臉模型重建方法,其特征在于,包括:
S1、獲取待處理的人臉深度圖和人臉彩色圖,將所述待處理的人臉深度圖和人臉彩色圖輸入預先訓練好的粗學習網絡,得到參數化三維人臉模型系數,根據所述參數化三維人臉模型系數確定初始的三維人臉模型;
S2、將所述初始的三維人臉模型和人臉彩色圖上的亮度值轉化成4通道的UV圖片,將所述UV圖片輸入預先訓練好的細學習網絡,得到待重建的三維人臉模型的各個網格點在各自法線方向上的偏移;
S3、根據所述參數化三維人臉模型系數和所述各個網格點在各自法線方向上的偏移重建三維人臉模型。
2.根據權利要求1所述的方法,其特征在于,在所述S1之前,還包括:
訓練所述粗學習網絡,其中,所述粗學習網絡的loss函數為:
上式中wcol,wlan,wreg,wflo,wsam用來調節各項的權重,
Egeo(χ)=wpp×Epp(χ)+wps×Eps(χ),
χ={αid,αexp,αalb,z,pitch,yaw,roll,t,γ}表示參數化三維人臉模型系數,其中,αid指身份基系數,αexp指表情基系數,αalb指反射率基系數,pitch代表圍繞X軸旋轉的歐拉角,yaw代表圍繞Y軸旋轉的歐拉角,roll代表圍繞Z軸旋轉的歐拉角,t=(tx,ty,tz)指平移向量,tx、ty和tz分別表示X軸、Y軸和Z軸上的平移量,γ=(γr,γg,γb),γr、γg和γb分別表示圖片在r、g和b通道上的光照系數,
wpp和wps用于調節權重,
F表示由三維模型投影到圖片上后確定的人臉區域,psyn(m)是像素點m對應的三維網格點坐標,preal(m′)是點云上距離psyn(m)最近一個點的三維坐標,m′表示該點在深度圖上的位置,是深度圖上m′處的單位法向量,
Isyn(m)表示像素點m處的合成紋理,Ireal(m)表示彩色圖上像素點m處的實際紋理,
L表示所有當前可見關鍵點編號的集合,qi表示彩色圖上檢測到的第i個關鍵點的圖像坐標,pi表示重建模型上對應qi的三維關鍵點的三維坐標,R為旋轉矩陣,∏表示透視投影,
αid,j和σid,j分別為第j個身份基的系數、第j個身份基的特征值,J為身份基的個數,αalb,k和σalb,k分別為第k個反射率基的系數、第k個反射率基的特征值,K為反射率基的個數,αexp,m和σexp,m分別為第j個表情基的系數、第j個表情基的特征值,M為表情基的個數,
p表示了像素點m對應三維點在三維模型上的相對位置信息,Projn(p)是根據第n幀參數化模型系數χn里的(αid,αexp,z)計算出三維模型形狀后,再根據第n幀參數化模型系數χn里的姿態信息(pitch,yaw,roll,t)投影后計算出來的在圖像平面里的位置,f(m)是像素點m從第n-1幀圖片上的位置移動到第n幀圖片上的位置的光流。
這里χn1,χn2分別表示同一個人第n1幀照片、第n2幀照片對應的參數化模型系數,
αid,n1,αid,n2分別表示同一個人第n1幀照片、第n2幀照片對應的身份基系數,αalb,n1,αalb,n2分別表示同一個人第n1幀照片、第n2幀照片對應的反射率基系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京的盧深視科技有限公司,未經北京的盧深視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810690747.2/1.html,轉載請聲明來源鉆瓜專利網。





