[發(fā)明專利]一種基于全局注意力的人臉特征點定位方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010886980.5 | 申請日: | 2020-08-28 |
| 公開(公告)號: | CN112084911B | 公開(公告)日: | 2023-03-07 |
| 發(fā)明(設(shè)計)人: | 張卡;何佳;戴亮亮;尼秀明 | 申請(專利權(quán))人: | 安徽清新互聯(lián)信息科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/82;G06V10/80;G06N3/045;G06N3/0464;G06N3/047;G06N3/048;G06N3/08 |
| 代理公司: | 合肥天明專利事務(wù)所(普通合伙) 34115 | 代理人: | 苗娟 |
| 地址: | 230088 安徽省合肥市高新區(qū)創(chuàng)新*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 全局 注意力 特征 定位 方法 系統(tǒng) | ||
本發(fā)明的一種基于全局注意力的人臉特征點定位方法及系統(tǒng),包括:獲取人臉局部圖像;把獲取到的圖像輸入事先訓(xùn)練好的基于全局注意力的人臉特征點定位模型,對于輸入的人臉局部圖像,經(jīng)過基于全局注意力的人臉特征點定位模型前向運算后,直接輸出人臉特征點位置;本發(fā)明的基于全局注意力的人臉特征點定位方法及系統(tǒng),基于深度學(xué)習(xí)技術(shù),利用殘差網(wǎng)絡(luò)機制和全局注意力融合機制,獲取人臉圖像的具有全局語義信息和局部語義信息的融合特征,使得深度神經(jīng)網(wǎng)絡(luò)模型能夠兼顧人臉圖像的全局信息和局部信息,精準(zhǔn)的計算出人臉特征點位置,人臉特征點定位更加精準(zhǔn),魯棒性更高。
技術(shù)領(lǐng)域
本發(fā)明涉及人臉識別技術(shù)領(lǐng)域,具體涉及一種基于全局注意力的人臉特征點定位方法及系統(tǒng)。
背景技術(shù)
人臉特征點定位是指在人臉圖像上,通過機器視覺技術(shù)精確的定位出臉部的關(guān)鍵特征點位置,關(guān)鍵特征點包括嘴角、眼角、鼻尖等器官位置以及臉部輪廓等位置。人臉特征點定位是人臉識別系統(tǒng)、表情識別系統(tǒng)和人臉屬性分析系統(tǒng)等應(yīng)用領(lǐng)域的技術(shù)基礎(chǔ),人臉特征點定位的質(zhì)量好壞會直接影響到后續(xù)工作的可靠性和精準(zhǔn)度。
近20年來,人臉特征點定位算法一直是機器視覺領(lǐng)域的研究熱點,涌現(xiàn)出很多經(jīng)典算法,具體算法可以分為以下幾類:
(1)基于傳統(tǒng)技術(shù)的人臉特征點定位算法,該類算法主要基于人臉的統(tǒng)計形狀模型方法和級聯(lián)回歸的方法,如經(jīng)典的算法:ASM、AAM、SDM、LBF等。該類算法的特點是利用人臉器官的幾何位置關(guān)系,采用統(tǒng)計方法和級聯(lián)優(yōu)化的方法獲取最終的人臉特征點位置,由于算法提取人臉特征的表達(dá)能力有限,并且對人臉特征點之間的形狀約束并沒有考慮,該類算法的特征點定位精準(zhǔn)度誤差較大。
(2)基于深度學(xué)習(xí)的人臉特征點定位算法,近年來,深度學(xué)習(xí)技術(shù)憑借著可以模擬人類大腦神經(jīng)網(wǎng)絡(luò),能夠進(jìn)行精確的非線性預(yù)測,各個領(lǐng)域都得到了廣泛的關(guān)注和應(yīng)用,出現(xiàn)了一批經(jīng)典的人臉特征點定位網(wǎng)絡(luò)框架,如MDM(Mnemonic Descent Method)、PFLD(PFLD:A Practical Facial Landmark Detectordensenet),TCDCN(Facial LandmarkDetection by Deep Multi-task Learning)等。該類算法的特點是利用卷積神經(jīng)網(wǎng)絡(luò)模型抓取人臉的深層語義特征,利用這些深層語義特征,或基于多分支任務(wù)訓(xùn)練模式,或基于級聯(lián)多個神經(jīng)網(wǎng)絡(luò)模型迭代優(yōu)化訓(xùn)練模式,獲取最終的人臉特征點位置。該類算法相對于傳統(tǒng)技術(shù)的人臉特征點定位算法,人臉特征點定位精準(zhǔn)度有很大的提升,但是特征點定位主要利用的是人臉的局部語義信息,而局部語義信息無法綜合利用人臉器官的整體幾何信息,導(dǎo)致人臉特征點的定位存在一定的誤差。
發(fā)明內(nèi)容
本發(fā)明提出的一種基于全局注意力的人臉特征點定位方法及系統(tǒng),可解決上述背景技術(shù)中的問題。
為實現(xiàn)上述目的,本發(fā)明采用了以下技術(shù)方案:
一種基于全局注意力的人臉特征點定位方法,包括:
獲取人臉局部圖像;
把獲取到的圖像輸入事先訓(xùn)練好的基于全局注意力的人臉特征點定位模型,對于輸入的人臉局部圖像,經(jīng)過基于全局注意力的人臉特征點定位模型前向運算后,直接輸出人臉特征點位置;
其中,
所述基于全局注意力的人臉特征點定位模型的網(wǎng)絡(luò)結(jié)構(gòu)包括:
conv0層是一個核尺寸為7×7,跨度為2×2的卷積層;
maxpool0層是一個核尺寸為2×2,跨度為2×2的最大值池化層;
conv0層和maxpool0層共同組成了一個特征圖分辨率快速下降網(wǎng)絡(luò);
resblock0、resblock1、resblock2、resblock3均是resnet網(wǎng)絡(luò)的resblock殘差模塊;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽清新互聯(lián)信息科技有限公司,未經(jīng)安徽清新互聯(lián)信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010886980.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于靈活柵格光網(wǎng)絡(luò)全局優(yōu)化的系統(tǒng)架構(gòu)及其全局優(yōu)化方法
- 一種基于多數(shù)據(jù)庫類型的SQL執(zhí)行方法和裝置
- 用于移動AdHoc網(wǎng)絡(luò)的路由入侵檢測系統(tǒng)
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 全局資源分配方法和裝置
- 一種通信方法及裝置
- 一種高效分布式全局鎖協(xié)調(diào)方法
- 一種帶上下文信息編碼的語義分割卷積神經(jīng)網(wǎng)絡(luò)
- 一種批量腳本的全局參數(shù)替換方法及裝置
- 一種基于全局變量的家居參數(shù)化模型建模系統(tǒng)及方法





