[發(fā)明專(zhuān)利]一種基于知識(shí)蒸餾的人臉姿態(tài)估計(jì)方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110418010.7 | 申請(qǐng)日: | 2021-04-19 |
| 公開(kāi)(公告)號(hào): | CN112818969B | 公開(kāi)(公告)日: | 2021-07-06 |
| 發(fā)明(設(shè)計(jì))人: | 李華蓉;蔡娜娜;鄭鵬;李峰岳;王康 | 申請(qǐng)(專(zhuān)利權(quán))人: | 南京烽火星空通信發(fā)展有限公司 |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 南京經(jīng)緯專(zhuān)利商標(biāo)代理有限公司 32200 | 代理人: | 陸志斌 |
| 地址: | 210019 江蘇省南京市建*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 知識(shí) 蒸餾 姿態(tài) 估計(jì) 方法 系統(tǒng) | ||
1.一種基于知識(shí)蒸餾的人臉姿態(tài)估計(jì)方法,用于實(shí)現(xiàn)目標(biāo)分類(lèi)網(wǎng)絡(luò)對(duì)圖像人臉姿態(tài)的估計(jì),其特征在于:針對(duì)目標(biāo)分類(lèi)網(wǎng)絡(luò)中最后全連接層,替換為三個(gè)分別對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的分支全連接層,各分支全連接層的輸入端共同對(duì)接目標(biāo)分類(lèi)網(wǎng)絡(luò)中最后一級(jí)特征提取模塊的輸出端,并且各分支全連接層分別對(duì)接一個(gè)分支分類(lèi)層,構(gòu)建學(xué)生分類(lèi)網(wǎng)絡(luò);
基于學(xué)生分類(lèi)網(wǎng)絡(luò),執(zhí)行如下步驟A至步驟E,獲得人臉姿態(tài)估計(jì)模型;以及應(yīng)用人臉姿態(tài)估計(jì)模型,執(zhí)行步驟i至步驟ii,針對(duì)目標(biāo)人臉圖像中的人臉姿態(tài)實(shí)現(xiàn)估計(jì);
步驟A.收集預(yù)設(shè)數(shù)量的人臉姿態(tài)樣本圖像,并確定各幅人臉姿態(tài)樣本圖像中人臉?lè)謩e對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的真實(shí)角度值,然后進(jìn)入步驟B;
步驟B.選擇結(jié)構(gòu)大于學(xué)生分類(lèi)網(wǎng)絡(luò)結(jié)構(gòu)的教師初始分類(lèi)網(wǎng)絡(luò);然后以人臉姿態(tài)樣本圖像為輸入,人臉姿態(tài)樣本圖像中人臉?lè)謩e對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向上預(yù)設(shè)所劃分各角度區(qū)間的概率為輸出,針對(duì)教師初始分類(lèi)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲得教師分類(lèi)網(wǎng)絡(luò),然后進(jìn)入步驟C;
步驟C.以學(xué)生分類(lèi)網(wǎng)絡(luò)中各級(jí)特征提取模塊中最后歸一化層輸出特征分別與教師分類(lèi)網(wǎng)絡(luò)中對(duì)應(yīng)特征提取模塊中最后歸一化層輸出特征之間特征距離構(gòu)建特征蒸餾損失函數(shù)lossD;并且以學(xué)生分類(lèi)網(wǎng)絡(luò)中各分支全連接層的輸出,結(jié)合人臉姿態(tài)樣本圖像中人臉?lè)謩e對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的真實(shí)角度值所對(duì)應(yīng)的角度區(qū)間,構(gòu)建角度分類(lèi)損失lossCE;以及基于學(xué)生分類(lèi)網(wǎng)絡(luò)輸出人臉?lè)謩e對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向上預(yù)設(shè)所劃分各角度區(qū)間的概率,通過(guò)各角度區(qū)間類(lèi)別概率計(jì)算數(shù)學(xué)期望,獲得各方向上對(duì)應(yīng)角度連續(xù)值作為預(yù)測(cè)角度,構(gòu)建角度回歸損失lossMSE;然后進(jìn)入步驟D,其中,1≤i≤I,I表示學(xué)生分類(lèi)網(wǎng)絡(luò)中特征提取模塊的數(shù)量;
步驟D.按如下公式:
lossyaw=lossCE(logityaw,yyaw)+αlossMSE(yawp,yaw)+βlossD;
losspitch=lossCE(logitpitch,ypitch)+αlossMSE(pitchp,pitch)+βlossD;
lossroll=lossCE(logitroll,yroll)+αlossMSE(rollp,roll)+βlossD;
構(gòu)建分別對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的損失函數(shù)lossyaw、losspitch、lossroll,然后進(jìn)入步驟E;其中,α和β分別為預(yù)設(shè)損失權(quán)重系數(shù),logityaw、logitpitch、logitroll分別為學(xué)生分類(lèi)網(wǎng)絡(luò)中分別對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的分支全連接層的輸出值,yyaw、ypitch、yroll分別為人臉姿態(tài)分別對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的真實(shí)角度所對(duì)應(yīng)的區(qū)間類(lèi)別,yawp、pitchp、rollp分別為基于學(xué)生分類(lèi)網(wǎng)絡(luò)所獲對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的預(yù)測(cè)角度連續(xù)值,yaw、pitch、roll分別為人臉姿態(tài)對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的真實(shí)角度值;
步驟E.以人臉姿態(tài)樣本圖像同時(shí)輸入教師分類(lèi)網(wǎng)絡(luò)與學(xué)生分類(lèi)網(wǎng)絡(luò),人臉姿態(tài)樣本圖像中人臉?lè)謩e對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向上預(yù)設(shè)所劃分各角度區(qū)間的概率為輸出,結(jié)合分別對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的損失函數(shù)lossyaw、losspitch、lossroll,針對(duì)學(xué)生分類(lèi)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲得人臉姿態(tài)估計(jì)模型;
步驟i.應(yīng)用人臉姿態(tài)估計(jì)模型,針對(duì)目標(biāo)人臉圖像進(jìn)行處理,獲得目標(biāo)人臉圖像中人臉姿態(tài)分別對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向上預(yù)設(shè)所劃分各角度區(qū)間的概率,然后進(jìn)入步驟ii;
步驟ii.根據(jù)目標(biāo)人臉圖像中人臉姿態(tài)分別對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向上預(yù)設(shè)所劃分各角度區(qū)間的概率,通過(guò)各角度區(qū)間類(lèi)別概率計(jì)算數(shù)學(xué)期望,獲得各方向上對(duì)應(yīng)角度連續(xù)值作為預(yù)測(cè)角度,即目標(biāo)人臉圖像中人臉姿態(tài)分別對(duì)應(yīng)偏航角方向、俯仰角方向、翻滾角方向的預(yù)測(cè)角度,實(shí)現(xiàn)對(duì)圖像人臉姿態(tài)中人臉姿態(tài)的估計(jì)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于南京烽火星空通信發(fā)展有限公司,未經(jīng)南京烽火星空通信發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110418010.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 一種敏捷衛(wèi)星姿態(tài)機(jī)動(dòng)確定系統(tǒng)
- 座椅自動(dòng)調(diào)節(jié)方法、裝置及終端
- 調(diào)整智能交互機(jī)器人姿態(tài)的方法及智能交互機(jī)器人
- 一種用于同步軌道SAR衛(wèi)星的姿態(tài)機(jī)動(dòng)軌跡計(jì)算方法
- 面部姿態(tài)調(diào)整方法、裝置和終端
- 孕婦姿態(tài)實(shí)時(shí)監(jiān)測(cè)系統(tǒng)
- 具有電磁位置跟蹤的混合姿態(tài)跟蹤系統(tǒng)
- 一種姿態(tài)估計(jì)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于姿態(tài)質(zhì)量評(píng)估的自適應(yīng)人體姿態(tài)優(yōu)化方法
- 一種機(jī)器人姿態(tài)調(diào)整控制系統(tǒng)





