[發(fā)明專利]基于深度可分離卷積的輕量化人臉識(shí)別方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201810921647.6 | 申請(qǐng)日: | 2018-08-14 |
| 公開(kāi)(公告)號(hào): | CN109063666A | 公開(kāi)(公告)日: | 2018-12-21 |
| 發(fā)明(設(shè)計(jì))人: | 程建;劉濟(jì)樾;劉三元;蘇炎洲;李月男 | 申請(qǐng)(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 成都弘毅天承知識(shí)產(chǎn)權(quán)代理有限公司 51230 | 代理人: | 鄒敏菲 |
| 地址: | 611731 四川省成*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卷積神經(jīng)網(wǎng)絡(luò) 可分離 卷積 人臉識(shí)別 層級(jí)聯(lián) 權(quán)重系數(shù) 輕量化 待識(shí)別人臉圖像 輸出預(yù)處理 圖像預(yù)處理 壓縮 計(jì)算量 圖像 | ||
本發(fā)明公開(kāi)了一種基于深度可分離卷積的輕量化人臉識(shí)別方法及系統(tǒng),該人臉識(shí)別方法包括:對(duì)三層級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到訓(xùn)練好的三層級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò);對(duì)深度可分離卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型;對(duì)深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型中的卷積層的權(quán)重系數(shù)進(jìn)行壓縮,得到訓(xùn)練好的深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型;輸入待識(shí)別人臉圖像至訓(xùn)練好的三層級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像預(yù)處理,然后輸出預(yù)處理圖像至訓(xùn)練好的深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行人臉識(shí)別。本發(fā)明通過(guò)采用深度可分離卷積減少計(jì)算量,降低模型大小,并進(jìn)一步對(duì)深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型中的卷積層的權(quán)重系數(shù)進(jìn)行壓縮,使得模型縮小35到49倍。
技術(shù)領(lǐng)域
本發(fā)明涉及人臉識(shí)別和深度學(xué)習(xí)領(lǐng)域,特別涉及于基于深度可分離卷積的輕量化人臉識(shí)別方法及系統(tǒng)。
背景技術(shù)
人臉識(shí)別是利用人類面部特征信息進(jìn)行身份認(rèn)證的一種技術(shù)。當(dāng)前的人臉識(shí)別技術(shù)主要被應(yīng)用到了以下方面:海口,機(jī)場(chǎng),火車站等場(chǎng)合的證件驗(yàn)證;罪犯照片的存檔管理和刑偵破案;視頻監(jiān)控中的人臉檢測(cè),跟蹤和識(shí)別等等,此外,人臉識(shí)別技術(shù)在醫(yī)學(xué)、人機(jī)交互、通道控制等領(lǐng)域也具有廣闊的應(yīng)用前景。
傳統(tǒng)人臉識(shí)別算法所產(chǎn)生并且使用的特征可以被認(rèn)為屬于淺層特征,而且不能從原始圖像中獲取更加深入的高語(yǔ)義特征以及其深度特征,若要獲得好的識(shí)別效果,這些傳統(tǒng)人臉識(shí)別算法必須結(jié)合人造特征的幫助,而人為設(shè)定的特征在特征提取和識(shí)別過(guò)程中通常會(huì)帶來(lái)不可期望的人為因素和誤差;并且,在沒(méi)有人為的干預(yù)下,傳統(tǒng)人臉識(shí)別算法往往不能自動(dòng)地從原始圖像中提取有用的識(shí)別特征,從而使得傳統(tǒng)人臉識(shí)別方法識(shí)別率較低。
因此,近年來(lái),絕大多數(shù)當(dāng)前最佳的人臉識(shí)別方法都是基于卷積神經(jīng)網(wǎng)絡(luò)的,卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)到優(yōu)于傳統(tǒng)手工特征的具有區(qū)分性的特征,從而具有優(yōu)于傳統(tǒng)的人臉識(shí)別方法的識(shí)別率。但是,卷積神經(jīng)網(wǎng)絡(luò)為層次結(jié)構(gòu),為了獲得好的識(shí)別效果,網(wǎng)絡(luò)層數(shù)很深,其中又包括多個(gè)卷積層,每個(gè)卷積層又包含多個(gè)卷積核,所以權(quán)重參數(shù)也很多,一般都是百萬(wàn)級(jí)別的,從而造成卷積神經(jīng)網(wǎng)絡(luò)模型很大,識(shí)別慢,進(jìn)一步導(dǎo)致其無(wú)法廣泛地應(yīng)用于移動(dòng)端。
發(fā)明內(nèi)容
本發(fā)明的目的在于:針對(duì)現(xiàn)有的人臉識(shí)別方法中,模型過(guò)大而識(shí)別速度慢的問(wèn)題,提供一種基于深度可分離卷積的輕量化人臉識(shí)別方法和系統(tǒng),通過(guò)訓(xùn)練基于AM-Softmax損失函數(shù)的深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型,進(jìn)行人臉識(shí)別的方法,并對(duì)深度可分離卷積神經(jīng)網(wǎng)絡(luò)的權(quán)重系數(shù)進(jìn)行壓縮,從而降低模型大小,同時(shí)提高識(shí)別率和準(zhǔn)確率。
本發(fā)明采用的技術(shù)方案如下:
一種基于深度可分離卷積的輕量化人臉識(shí)別方法,具體包括:
S1、構(gòu)建三層級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò),并輸入第一人臉圖像數(shù)據(jù)集的圖像金字塔,對(duì)所述三層級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到訓(xùn)練好的三層級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò);
S2、構(gòu)建基于AM-Softmax損失函數(shù)的深度可分離卷積神經(jīng)網(wǎng)絡(luò),并輸入第二人臉圖像數(shù)據(jù)集,對(duì)所述深度可分離卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型;
S3、對(duì)深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型中的卷積層的權(quán)重系數(shù)進(jìn)行壓縮,得到訓(xùn)練好的深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型;
S4、輸入待識(shí)別人臉圖像的圖像金字塔至訓(xùn)練好的三層級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像預(yù)處理,然后輸出預(yù)處理圖像至訓(xùn)練好的深度可分離卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行人臉識(shí)別。
進(jìn)一步地,步驟S2中基于AM-Softmax損失函數(shù)的深度可分離卷積神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)包括:17個(gè)卷積模塊;
第一個(gè)卷積模塊是一個(gè)3x3的普通卷積層;
第二個(gè)卷積模塊至第十四個(gè)卷積模塊是深度可分離卷積模塊;
第十五個(gè)卷積模塊是一個(gè)7x7的平均池化層;
第十六個(gè)卷積模塊是一個(gè)全連接層;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810921647.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計(jì)方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測(cè)方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法及檢測(cè)裝置
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種人臉識(shí)別方法及裝置
- 多角度人臉識(shí)別交互系統(tǒng)
- 人臉識(shí)別方法及裝置
- 人臉識(shí)別方法及裝置
- 一種基于人臉識(shí)別技術(shù)的軌跡跟蹤系統(tǒng)
- 一種多角度人臉識(shí)別交互系統(tǒng)
- 一種面向移動(dòng)終端的人臉識(shí)別支付系統(tǒng)
- 人臉識(shí)別數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 人臉識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 基于復(fù)雜場(chǎng)景下的人臉表情識(shí)別方法、裝置及電子設(shè)備





