[發(fā)明專利]基于空洞卷積神經(jīng)網(wǎng)絡(luò)的人臉深度和表面法向量預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710889248.1 | 申請(qǐng)日: | 2017-09-27 |
| 公開(公告)號(hào): | CN107679477B | 公開(公告)日: | 2021-02-02 |
| 發(fā)明(設(shè)計(jì))人: | 王好謙;章書豪;方璐;戴瓊海 | 申請(qǐng)(專利權(quán))人: | 深圳市未來媒體技術(shù)研究院;清華大學(xué)深圳研究生院 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06N3/04 |
| 代理公司: | 深圳新創(chuàng)友知識(shí)產(chǎn)權(quán)代理有限公司 44223 | 代理人: | 徐羅艷 |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 空洞 卷積 神經(jīng)網(wǎng)絡(luò) 深度 表面 向量 預(yù)測(cè) 方法 | ||
1.一種基于空洞卷積神經(jīng)網(wǎng)絡(luò)的人臉深度和表面法向量預(yù)測(cè)方法,包括訓(xùn)練空洞卷積神經(jīng)網(wǎng)絡(luò)的步驟,所述訓(xùn)練空洞卷積神經(jīng)網(wǎng)絡(luò)的步驟包括:
S1、搭建一空洞卷積神經(jīng)網(wǎng)絡(luò),所述空洞卷積神經(jīng)網(wǎng)絡(luò)包括依次連接的多個(gè)卷積層、多個(gè)空洞卷積層和多個(gè)反卷積層,其中,每個(gè)所述卷積層均連接有一規(guī)范化操作和一激勵(lì)操作;
S2、初始化所述空洞卷積神經(jīng)網(wǎng)絡(luò)的權(quán)重值;
S3、將預(yù)先建立的人臉訓(xùn)練集中的人臉圖片輸入經(jīng)步驟S2初始化后的空洞卷積神經(jīng)網(wǎng)絡(luò)中,以最小化代價(jià)函數(shù)為目標(biāo)對(duì)所述空洞卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行迭代訓(xùn)練;其中,每迭代一次則更新一次所述權(quán)重值;所述代價(jià)函數(shù)包括深度估計(jì)代價(jià)函數(shù)和表面法向量估計(jì)代價(jià)函數(shù),所述表面法向量估計(jì)代價(jià)函數(shù)為:
其中,Ni和分別為所述人臉訓(xùn)練集中的第i張人臉圖片經(jīng)過所述空洞卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練后得到的像素法向量值、像素法向量ground truth值,m表示所述人臉訓(xùn)練集中的每張人臉圖片中具有法向量信息的像素點(diǎn)個(gè)數(shù);
S4、將預(yù)先建立的人臉測(cè)試集中的人臉圖片輸入經(jīng)步驟S3訓(xùn)練得到的空洞卷積神經(jīng)網(wǎng)絡(luò)中,輸出對(duì)應(yīng)的人臉深度圖和人臉表面法向量圖;其中,所述人臉訓(xùn)練集和所述人臉測(cè)試集中的人臉圖片至少部分不同;所述人臉表面法向量圖是通過所述深度圖獲得像素的點(diǎn)云數(shù)據(jù),并采用最小二乘平面擬合而得到;
S5、根據(jù)步驟S4輸出的人臉深度圖和人臉表面法向量圖,判斷步驟S3訓(xùn)練得到的空洞卷積神經(jīng)網(wǎng)絡(luò)對(duì)人臉深度和人臉表面法向量的預(yù)測(cè)精度是否符合預(yù)設(shè)要求:若符合,則結(jié)束訓(xùn)練;若不符合,則返回步驟S3繼續(xù)訓(xùn)練直至訓(xùn)練得到符合預(yù)設(shè)要求的空洞卷積神經(jīng)網(wǎng)絡(luò)。
2.如權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于:步驟S1搭建的空洞卷積神經(jīng)網(wǎng)絡(luò)中,多個(gè)卷積層依次串聯(lián),并且每個(gè)卷積層的輸出端依次串聯(lián)所述規(guī)范化操作和激勵(lì)操作;所述空洞卷積層串聯(lián)于所述多個(gè)卷積層之后;所述多個(gè)反卷積層依次串聯(lián)于所述空洞卷積層之后。
3.如權(quán)利要求2所述的預(yù)測(cè)方法,其特征在于:所述規(guī)范化操作為BatchNormalization操作,所述激勵(lì)操作為L(zhǎng)eaky ReLU激勵(lì)操作。
4.如權(quán)利要求2所述的預(yù)測(cè)方法,其特征在于:所述空洞卷積神經(jīng)網(wǎng)絡(luò)包括四個(gè)空洞卷積層,所述四個(gè)空洞卷積層的空洞系數(shù)分別為1,2,2,4。
5.如權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于:所述深度估計(jì)代價(jià)函數(shù)由損失項(xiàng)和正則項(xiàng)構(gòu)成,如下:
其中,為正則項(xiàng),為損失項(xiàng);yi、yi*分別表示人臉訓(xùn)練集中的第i張人臉圖片經(jīng)過所述空洞卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練后所得到的像素深度值、像素ground truth值,n表示所述人臉訓(xùn)練集中的每張人臉圖片中具有深度信息的像素點(diǎn)個(gè)數(shù),λ表示損失項(xiàng)的正則系數(shù)。
6.如權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于:步驟S2中通過隨機(jī)高斯分布生成初始化的權(quán)重值;步驟S3中采用AdamOptimizer方法來最小化代價(jià)函數(shù)。
7.如權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于:步驟S4中,判斷步驟S3訓(xùn)練得到的空洞卷積神經(jīng)網(wǎng)絡(luò)對(duì)人臉深度和人臉表面法向量的預(yù)測(cè)精度是否符合預(yù)設(shè)要求具體包括:
對(duì)輸出的人臉深度圖,計(jì)算其對(duì)應(yīng)的平均絕對(duì)相關(guān)誤差rel、均方根誤差rms以及l(fā)og10誤差三個(gè)參數(shù),并判斷所述三個(gè)參數(shù)的值是否符合對(duì)應(yīng)的預(yù)設(shè)閾值;
對(duì)輸出的人臉表面法向量圖,計(jì)算其對(duì)應(yīng)的角度誤差,并判斷計(jì)算出的角度誤差的值是否符合對(duì)應(yīng)的預(yù)設(shè)閾值。
8.如權(quán)利要求5所述的預(yù)測(cè)方法,其特征在于:所述損失項(xiàng)的正則系數(shù)λ=0.5。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市未來媒體技術(shù)研究院;清華大學(xué)深圳研究生院,未經(jīng)深圳市未來媒體技術(shù)研究院;清華大學(xué)深圳研究生院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710889248.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于頻譜空洞不均勻性的頻譜接入方法及系統(tǒng)
- 一種上層文件系統(tǒng)對(duì)空洞文件快速讀取的方法及系統(tǒng)
- 用于產(chǎn)生多視圖的渲染設(shè)備和方法
- 基于面數(shù)據(jù)的空洞填補(bǔ)方法及系統(tǒng)
- 一種光盤外包裝紙袋的手工制作模板
- 同步磁阻型旋轉(zhuǎn)電機(jī)
- 一種深度圖像的空洞修復(fù)方法以及圖像處理裝置
- 深度圖像空洞填充方法、裝置、電子設(shè)備及其存儲(chǔ)介質(zhì)
- 用于工業(yè)分揀流水線的大面積深度圖像空洞自動(dòng)填充方法
- 一種盾構(gòu)隧道襯砌背后空洞的演化預(yù)測(cè)方法
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





