[發(fā)明專利]一種基于級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)的人臉關(guān)鍵點(diǎn)檢測方法在審
| 申請?zhí)枺?/td> | 201410053321.8 | 申請日: | 2014-02-17 |
| 公開(公告)號(hào): | CN103824049A | 公開(公告)日: | 2014-05-28 |
| 發(fā)明(設(shè)計(jì))人: | 姜宇寧;印奇;曹志敏 | 申請(專利權(quán))人: | 北京曠視科技有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/66;G06N3/02 |
| 代理公司: | 北京君尚知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11200 | 代理人: | 余長江 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 級(jí)聯(lián) 神經(jīng)網(wǎng)絡(luò) 關(guān)鍵 檢測 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)字圖像處理及人臉識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)的人臉關(guān)鍵點(diǎn)檢測方法。
背景技術(shù)
人臉關(guān)鍵點(diǎn)檢測(facial?landmark?detection),即給定一張人臉圖片,要從中準(zhǔn)確定位出一系列關(guān)鍵點(diǎn)(如瞳孔,眼角,眉角,嘴角,唇沿等等)的位置。人臉關(guān)鍵點(diǎn)檢測作為人臉對齊前最重要的一步,它將很大程度影響到人臉識(shí)別/分析/搜索系統(tǒng)的整體性能。
傳統(tǒng)的人臉關(guān)鍵點(diǎn)檢測算法主要可以分為兩類:第一類將每個(gè)關(guān)鍵點(diǎn)作為獨(dú)立的部分,每一個(gè)關(guān)鍵點(diǎn)根據(jù)其局部特征單獨(dú)訓(xùn)練檢測器;第二類將所有關(guān)鍵點(diǎn)放在一起訓(xùn)練,重點(diǎn)考慮關(guān)鍵點(diǎn)之間的相對位置關(guān)系,最后得到一個(gè)全局最優(yōu)解。然而在實(shí)際應(yīng)用中,這兩類算法都有著自己極大的缺陷:1)對第一類算法,由于每個(gè)關(guān)鍵點(diǎn)被單獨(dú)檢測,人臉的全局幾何信息被完全忽略了,這使得其對細(xì)微擾動(dòng)非常敏感,對光照變化、姿態(tài)變化等都不夠魯邦。此外,該算法的時(shí)間復(fù)雜程度和關(guān)鍵點(diǎn)的個(gè)數(shù)成正比,待檢測的關(guān)鍵點(diǎn)越多,所需的檢測器就越多,這使得其在較密(60點(diǎn)+)關(guān)鍵點(diǎn)的應(yīng)用中很難實(shí)施;2)而對第二類算法,由于人臉不同關(guān)鍵點(diǎn)的檢測難度不同(例如,眼睛附近的關(guān)鍵點(diǎn)要遠(yuǎn)比人臉輪廓上的關(guān)鍵點(diǎn)簡單,因?yàn)檠劬Ω浇卣髅黠@且不易受姿態(tài)變化影響),用一個(gè)模型去求解所有關(guān)鍵點(diǎn)的位置往往會(huì)得出一個(gè)折中的結(jié)果,即那些比較容易的關(guān)鍵點(diǎn)被比較難的點(diǎn)所“拖累”,而其實(shí)它們單獨(dú)做本可以做的更好。同時(shí),這類算法使用了大量的冗余信息,就像用嘴和鼻子附近的特征去檢測眼睛的關(guān)鍵點(diǎn),這其實(shí)浪費(fèi)了許多計(jì)算資源。
發(fā)明內(nèi)容
本發(fā)明針對上述問題,提供一種基于級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)的人臉關(guān)鍵點(diǎn)檢測方法,能夠有效地提高人臉關(guān)鍵點(diǎn)檢測,尤其是密集人臉關(guān)鍵點(diǎn)檢測的準(zhǔn)確性和實(shí)時(shí)性。
為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
一種基于級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)的人臉關(guān)鍵點(diǎn)檢測方法,其步驟包括:
a)建立訓(xùn)練用人臉圖像集,對其中每一張人臉標(biāo)注需要檢測的關(guān)鍵點(diǎn)位置;
b)構(gòu)建第一層深度神經(jīng)網(wǎng)絡(luò)并訓(xùn)練人臉區(qū)域估計(jì)模型,此模型中任一張人臉被分為內(nèi)臉區(qū)域與外臉區(qū)域兩部分;
c)構(gòu)建第二層深度神經(jīng)網(wǎng)絡(luò),對步驟b)中輸出的內(nèi)臉區(qū)域和外臉區(qū)域分別做獨(dú)立的人臉關(guān)鍵點(diǎn)初步檢測;
d)根據(jù)步驟c)的初步檢測結(jié)果,對內(nèi)臉區(qū)域繼續(xù)做局部區(qū)域劃分;
e)對步驟d)得到的每個(gè)局部區(qū)域分別構(gòu)建第三層深度神經(jīng)網(wǎng)絡(luò),用來訓(xùn)練針對該局部區(qū)域的人臉關(guān)鍵點(diǎn)檢測器;
f)根據(jù)步驟e)的人臉關(guān)鍵點(diǎn)檢測器的關(guān)鍵點(diǎn)輸出結(jié)果,對每個(gè)局部區(qū)域估計(jì)其旋轉(zhuǎn)角度;
g)將每個(gè)局部區(qū)域按照其估計(jì)的旋轉(zhuǎn)角度做矯正,將矯正的圖片收集作為新的訓(xùn)練集合;
h)對步驟g)中生成的每個(gè)局部區(qū)域的矯正數(shù)據(jù)集構(gòu)建第四層深度神經(jīng)網(wǎng)絡(luò),用來訓(xùn)練人臉關(guān)鍵點(diǎn)檢測器;
i)任給一張新的人臉圖像,采用經(jīng)過上述步驟生成的四層深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行關(guān)鍵點(diǎn)檢測,并將最終生成的內(nèi)臉區(qū)域、外臉區(qū)域、及各個(gè)局部區(qū)域的關(guān)鍵點(diǎn)結(jié)合輸出,即為最終人臉關(guān)鍵點(diǎn)檢測結(jié)果。
進(jìn)一步地,步驟b)所述內(nèi)臉區(qū)域包括眉、眼、鼻、嘴,所述外臉區(qū)域包括完整人臉輪廓;步驟d)對內(nèi)臉區(qū)域做局部區(qū)域劃分時(shí),劃分成為眉、眼、鼻、嘴四個(gè)局部區(qū)域。
進(jìn)一步地,每一層深度神經(jīng)網(wǎng)絡(luò)內(nèi)部由三部分組成:卷積層,最大采樣層及全連接層,對輸入圖像做多輪的卷積和采樣,最終經(jīng)過全連接層輸出人臉區(qū)域或人臉關(guān)鍵點(diǎn)的坐標(biāo)。
進(jìn)一步地,步驟f)對每個(gè)局部區(qū)域采用最小二乘法估計(jì)其旋轉(zhuǎn)角度:
其中M為旋轉(zhuǎn)矩陣,X’i為對正模版的關(guān)鍵點(diǎn)坐標(biāo),Xi為步驟e)中獲得的關(guān)鍵點(diǎn)坐標(biāo)。
進(jìn)一步地,步驟g)將每個(gè)局部區(qū)域按照其估計(jì)的旋轉(zhuǎn)角度做矯正的方法為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京曠視科技有限公司,未經(jīng)北京曠視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410053321.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種LED芯片級(jí)聯(lián)信號(hào)的單線傳輸方法
- 圖像信號(hào)處理器,圖像信號(hào)處理系統(tǒng)和圖像傳輸級(jí)聯(lián)器
- 一種業(yè)務(wù)管理系統(tǒng)級(jí)聯(lián)操作的處理方法和裝置
- 級(jí)聯(lián)式LED驅(qū)動(dòng)器
- 處理器級(jí)聯(lián)方法和系統(tǒng)
- 一種MCU級(jí)聯(lián)結(jié)構(gòu)及其控制方法和控制系統(tǒng)
- 一種框式設(shè)備內(nèi)部級(jí)聯(lián)口故障檢查方法及裝置
- 刀箱、刀箱級(jí)聯(lián)管理方法及裝置
- 一種級(jí)聯(lián)裝置、籠車及籠車組件
- 一種多功能級(jí)聯(lián)的離線燒錄方法和系統(tǒng)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





