[發(fā)明專利]基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法、裝置及介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110441009.6 | 申請(qǐng)日: | 2021-04-23 |
| 公開(公告)號(hào): | CN113205122A | 公開(公告)日: | 2021-08-03 |
| 發(fā)明(設(shè)計(jì))人: | 黃珀彬;黃沛杰 | 申請(qǐng)(專利權(quán))人: | 微馬科技有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04 |
| 代理公司: | 廣東普羅米修律師事務(wù)所 44615 | 代理人: | 齊則琳 |
| 地址: | 中國(guó)香港新界沙田區(qū)香港科*** | 國(guó)省代碼: | 香港;81 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 低成本 運(yùn)算 平臺(tái) 檢測(cè) 方法 裝置 介質(zhì) | ||
本發(fā)明適用于計(jì)算機(jī)領(lǐng)域,提供了一種基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)的方法、裝置及介質(zhì),包括前置處理、微調(diào)及回歸處理;前置處理包括:對(duì)輸入的圖片使用神經(jīng)網(wǎng)絡(luò)框架進(jìn)行特征提取,得到若干人臉預(yù)選框;微調(diào)用于對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行微調(diào),包括:通過多個(gè)微型的卷積核以及可配置的網(wǎng)絡(luò)結(jié)構(gòu)的自定義組合,其中每個(gè)卷積核設(shè)置有對(duì)應(yīng)的步長(zhǎng)參數(shù),卷積核用于神經(jīng)網(wǎng)絡(luò)的卷積及池化;回歸處理包括:基于人臉預(yù)選框的平均關(guān)鍵點(diǎn)執(zhí)行回歸過濾處理,得到人臉框有效位置及人臉關(guān)鍵點(diǎn)的位置。可以在保證機(jī)器學(xué)習(xí)的精度時(shí),減少對(duì)算力的要求,同時(shí)在具有低算力的硬件系統(tǒng)中也能夠完成人臉檢測(cè)的多個(gè)任務(wù)。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)領(lǐng)域,尤其涉及一種基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法、裝置及介質(zhì)。
背景技術(shù)
近年來,作為機(jī)器學(xué)習(xí)領(lǐng)域標(biāo)志技術(shù)的深度學(xué)習(xí),在計(jì)算機(jī)視覺方面取得了很多標(biāo)志性的進(jìn)展,特別是人臉相關(guān)的諸多任務(wù)中,不過深度學(xué)習(xí)特有的多層的網(wǎng)絡(luò)以及數(shù)目繁多神經(jīng)元特性,使其對(duì)與計(jì)算機(jī)硬件算力的要求十分嚴(yán)苛,諸多經(jīng)典的網(wǎng)絡(luò)結(jié)構(gòu)難以真正的應(yīng)用于實(shí)際場(chǎng)景,特別是在一些Edge端,例如嵌入式系統(tǒng)、NUC及手機(jī)等等。因此,需要一種解決深度學(xué)習(xí)在這些低算力硬件系統(tǒng)中無法進(jìn)行人臉檢測(cè)的技術(shù)方案。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法、裝置及介質(zhì),通過人臉檢測(cè)連同人臉關(guān)鍵點(diǎn)定位法,在保證機(jī)器學(xué)習(xí)的精度時(shí),減少對(duì)算力的要求,同時(shí)在具有低算力的硬件系統(tǒng)中也能夠完成人臉檢測(cè)的多個(gè)任務(wù)。
本發(fā)明是這樣實(shí)現(xiàn)的,包括一種基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法,其特征在于:包括前置處理、微調(diào)及回歸處理;所述前置處理包括:對(duì)輸入的圖片使用神經(jīng)網(wǎng)絡(luò)框架進(jìn)行特征提取,得到若干人臉預(yù)選框;所述微調(diào)用于對(duì)所述神經(jīng)網(wǎng)絡(luò)進(jìn)行微調(diào),包括:通過多個(gè)微型的卷積核以及可配置的網(wǎng)絡(luò)結(jié)構(gòu)的自定義組合,其中每個(gè)所述卷積核設(shè)置有對(duì)應(yīng)的步長(zhǎng)參數(shù),所述卷積核用于神經(jīng)網(wǎng)絡(luò)的卷積及池化;所述回歸處理包括:基于所述人臉預(yù)選框的平均關(guān)鍵點(diǎn)執(zhí)行回歸過濾處理,得到人臉框有效位置及人臉關(guān)鍵點(diǎn)的位置。
如所述的基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法,其中對(duì)輸入的圖片使用神經(jīng)網(wǎng)絡(luò)框架進(jìn)行特征提取包括:輸入所述圖片中的每個(gè)像素點(diǎn),計(jì)算對(duì)應(yīng)一個(gè)人臉框的預(yù)測(cè)值以及置信。
如所述的基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法,其中圖片可自定設(shè)置,根據(jù)輸入的所述圖片的類型的不同,配置所述神經(jīng)網(wǎng)絡(luò)框架最后一層神經(jīng)網(wǎng)絡(luò)的神經(jīng)元數(shù)量及訓(xùn)練方式,所述圖片類型包括但不限于人臉。
如所述的基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法,其中通過多個(gè)卷積核級(jí)聯(lián)執(zhí)行卷積運(yùn)算包括:根據(jù)卷積層為線性運(yùn)算公式將所述神經(jīng)網(wǎng)絡(luò)框架中的卷積核配置為多個(gè)小的級(jí)聯(lián)卷積核,其中A代表了輸入神經(jīng)元,m代表了當(dāng)前神經(jīng)元的層數(shù),w和b分表代表這權(quán)重和偏置,g代表了激活函數(shù),k則代表了感受野,以保持感受野不變的情況下,采用微型聯(lián)卷積核執(zhí)行卷積運(yùn)算。
如所述的基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法,其中配置的網(wǎng)絡(luò)結(jié)構(gòu)包括具有不同步長(zhǎng)的所述卷積核和全連接層組合,具體地,根據(jù)卷積層為線性運(yùn)算公式其輸出維度為(W-F+2P)/S+1,其中W代表輸入圖像的維度,F(xiàn)代表卷積核或者濾波矩陣的大小,P為填充的維度,S為步長(zhǎng)的大小;根據(jù)輸入的圖像維度,采用不同大小的卷積核,同時(shí)對(duì)應(yīng)地?cái)U(kuò)大S的值;以及根據(jù)輸出神經(jīng)層的維度與輸入神經(jīng)層的關(guān)系(W-F+2P)/S+1,執(zhí)行S的自定義設(shè)置,以確定所述神經(jīng)網(wǎng)絡(luò)框架的自定義配置。
如所述的基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法,其中神經(jīng)網(wǎng)絡(luò)框架包括但不限于resnet50、resnet18或darknet53。
如所述的基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法,其中回歸處理包括:在所述全連接層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)后添加特定數(shù)量的神經(jīng)元,設(shè)置人臉臉部及人臉預(yù)選框?qū)?yīng)的損失函數(shù)。
如所述的基于低成本運(yùn)算平臺(tái)的人臉檢測(cè)方法,其中臉部、所述預(yù)選框及所述回歸樹對(duì)應(yīng)的損失函數(shù)分別配置為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微馬科技有限公司,未經(jīng)微馬科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110441009.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





