[發(fā)明專利]一種人臉關(guān)鍵點識別檢測的方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010804930.8 | 申請日: | 2020-08-12 |
| 公開(公告)號: | CN114140836A | 公開(公告)日: | 2022-03-04 |
| 發(fā)明(設(shè)計)人: | 鄧裕強;朱志;廖吉平 | 申請(專利權(quán))人: | 廣州久邦世紀(jì)科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/25;G06V10/774;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510055 廣東省廣州市越秀區(qū)中山三路33號A塔1601、1701房(自編)中華國際中心A*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 關(guān)鍵 識別 檢測 方法 系統(tǒng) | ||
本發(fā)明提出一種人臉關(guān)鍵點識別檢測的方法和系統(tǒng),基于深度學(xué)習(xí)網(wǎng)絡(luò)的精簡設(shè)計,對于檢測網(wǎng)絡(luò),將SSD網(wǎng)絡(luò)中的Conv操作改成Depthwise Conv,另外將模型通道數(shù)減少為原來的的50%,降低模型參數(shù)量和提升推斷速度。
技術(shù)領(lǐng)域
本發(fā)明涉及人臉圖像技術(shù)識別檢測領(lǐng)域,尤其涉及一種人臉關(guān)鍵點識別檢測的方法和系統(tǒng)。
背景技術(shù)
人臉關(guān)鍵點檢測是指從給定的人臉圖像中檢測諸如眼球中心、眼角、鼻尖、嘴角、人臉輪廓等部位的關(guān)鍵點,在現(xiàn)有的技術(shù)中,諸如MTCNN等二維人臉圖像的人臉關(guān)鍵點檢測,都是成熟的技術(shù)和算法。耗時較長,終端應(yīng)用場景下,精度不高,識別使用會帶來諸多不變。
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明提供一種人臉關(guān)鍵點識別檢測的方法和系統(tǒng),以實現(xiàn)上述缺陷,所述方法包括:
步驟S1:構(gòu)建人臉圖片集訓(xùn)練人臉檢測SSD網(wǎng)絡(luò)和MobileNet-V3回歸網(wǎng)絡(luò),修改輸出模型為tflite格式。
步驟S2:輸入含人臉圖片,調(diào)節(jié)圖片尺寸和轉(zhuǎn)換格式為RGB格式,并把RGB數(shù)據(jù)歸一化到[-1,1],其中,圖片尺寸縮放到160×160。
步驟S3:加載所述tflite格式的兩個模型,并初始化。
步驟S4:將所述歸一化后的圖片數(shù)據(jù)組輸入至人臉檢測SSD網(wǎng)絡(luò),檢測圖片各個人臉的方框位置。
步驟S5:按照所述各個人臉方框位置截取人臉,獲取各個人臉區(qū)域圖片。
步驟S6:將所述各個人臉區(qū)域圖片輸入精簡版MobileNet-V3回歸網(wǎng)絡(luò),識別檢測獲取對應(yīng)的人臉關(guān)鍵點。
本發(fā)明提供一種人臉關(guān)鍵點識別檢測的系統(tǒng),所述系統(tǒng)包括:
識別網(wǎng)絡(luò)模塊:構(gòu)建人臉圖片集訓(xùn)練人臉檢測SSD網(wǎng)絡(luò)和MobileNet-V3回歸網(wǎng)絡(luò),修改輸出模型為tflite格式。
調(diào)節(jié)模塊:輸入含人臉圖片,調(diào)節(jié)圖片尺寸和轉(zhuǎn)換格式為RGB格式,并把RGB數(shù)據(jù)歸一化到[-1,1],其中,圖片尺寸縮放到160×160。
初始化模塊:加載所述tflite格式的兩個模型,并初始化。
檢測模塊:將所述歸一化后的圖片數(shù)據(jù)組輸入至人臉檢測SSD網(wǎng)絡(luò),檢測圖片各個人臉的方框位置。
截取模塊:按照所述各個人臉方框位置截取人臉,獲取各個人臉區(qū)域圖片。
獲取模塊:將所述各個人臉區(qū)域圖片輸入精簡版MobileNet-V3回歸網(wǎng)絡(luò),識別檢測獲取對應(yīng)的人臉關(guān)鍵點。
本發(fā)明提出一種人臉關(guān)鍵點識別檢測的方法和系統(tǒng),基于深度學(xué)習(xí)網(wǎng)絡(luò)的精簡設(shè)計,對于檢測網(wǎng)絡(luò),將SSD網(wǎng)絡(luò)中的Conv操作改成Depthwise Conv,另外將模型通道數(shù)減少為原來的的50%,降低模型參數(shù)量和提升推斷速度。為盡量降低精度的損失,采用知識蒸餾的方法改進訓(xùn)練過程。對于關(guān)鍵點回歸網(wǎng)絡(luò),同樣為了降低參數(shù)量和計算量,從MobileNet-V3模型的中段導(dǎo)出特征圖,并采用Average Pooling壓縮特征圖的大小,緊跟著1x1 Conv降低通道數(shù),輸入全連接網(wǎng)絡(luò),計算關(guān)鍵點的位置,在應(yīng)用場景下(主要是在手機端),通過兩個精簡版模型的結(jié)合,能在損失約30%精度的代價下,將速度提升80%。
附圖說明
圖1示出了本發(fā)明的一種人臉關(guān)鍵點識別檢測的方法流程圖。
圖2示出了本發(fā)明的一種人臉關(guān)鍵點識別檢測的系統(tǒng)流程圖。
具體實施方式
參照圖1,本發(fā)明提供一種人臉關(guān)鍵點識別檢測的方法,所述方法包括:
步驟S1:構(gòu)建人臉圖片集訓(xùn)練人臉檢測SSD網(wǎng)絡(luò)和MobileNet-V3回歸網(wǎng)絡(luò),修改輸出模型為tflite格式。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州久邦世紀(jì)科技有限公司,未經(jīng)廣州久邦世紀(jì)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010804930.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





