[發(fā)明專利]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法及裝置在審
| 申請?zhí)枺?/td> | 201710856524.4 | 申請日: | 2017-09-21 |
| 公開(公告)號: | CN107633229A | 公開(公告)日: | 2018-01-26 |
| 發(fā)明(設(shè)計(jì))人: | 謝靜;王正;李志國;曾建平 | 申請(專利權(quán))人: | 北京智芯原動(dòng)科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06T7/194;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100101 北京市朝陽區(qū)北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 卷積 神經(jīng)網(wǎng)絡(luò) 檢測 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理、視頻監(jiān)控以及安防領(lǐng)域,特別涉及人臉檢測方法及裝 置。
背景技術(shù)
近年來,由于人臉識別的廣泛應(yīng)用和其較高的市場期望,人臉識別一直是模 式識別中的一個(gè)熱門方向。
人臉檢測作為人臉識別系統(tǒng)中的關(guān)鍵環(huán)節(jié),占用了大部分的系統(tǒng)資源,并且 其檢測性能直接影響最終的識別精度,因此顯得十分重要。
目前,常見的基于視頻圖像的人臉檢測方法有模板匹配法、膚色模型法、神 經(jīng)網(wǎng)絡(luò)法、SVM分類器法、Adaboost分類器法等。但這些方法檢測準(zhǔn)確率較低, 難以適應(yīng)復(fù)雜的環(huán)境。
近年來,隨著人工智能的快速發(fā)展,深度學(xué)習(xí)被越來越多地引入到人臉識別 領(lǐng)域中,其通過組合底層特征形成高層特征,受環(huán)境變化的影響較小。卷積神經(jīng) 網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是深度學(xué)習(xí)的一種模型結(jié)構(gòu), 其通過卷積層和子采樣層的相關(guān)運(yùn)算來處理圖像信息,對平移、縮放、傾斜和旋 轉(zhuǎn)等變形的敏感度低,更加適用于無約束環(huán)境的圖像人臉檢測。
然而,現(xiàn)有的基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測方法一般采用較多的網(wǎng)絡(luò)層實(shí) 現(xiàn),其運(yùn)算復(fù)雜度較高。
綜上所述,需要提出一種運(yùn)算復(fù)雜度低且檢測準(zhǔn)確率高的人臉檢測方法。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于快速的實(shí)現(xiàn)人臉檢測,且檢測準(zhǔn)確率高。
為達(dá)到上述目的,按照本發(fā)明的第一個(gè)方面,提供了基于卷積神經(jīng)網(wǎng)絡(luò)的人 臉檢測方法,該方法包括:
第一步驟,輸入待處理圖像;
第二步驟,采用雙膚色分割法,從待處理圖像中提取前景區(qū)域;
第三步驟,根據(jù)前景區(qū)域的前景點(diǎn)所占比值和寬高比,從前景區(qū)域中篩選出 候選區(qū)域;
第四步驟,選取標(biāo)注人臉的圖像為正樣本圖像,標(biāo)注非人臉的圖像為負(fù)樣本 圖像,根據(jù)正樣本圖像和負(fù)樣本圖像對卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行反復(fù)訓(xùn)練,獲取訓(xùn)練好 的人臉檢測模型;以及
第五步驟,采用訓(xùn)練好的人臉檢測模型對候選區(qū)域進(jìn)行人臉檢測,輸出檢測 結(jié)果。
進(jìn)一步地,所述第二步驟包括:
YIQ前景分割步驟,將待處理圖像從RGB顏色空間轉(zhuǎn)換到Y(jié)IQ顏色空間, 統(tǒng)計(jì)待處理圖像中像素點(diǎn)(x,y)的I分量值I(x,y),若ITh1≤I(x,y)≤ITH2,則 認(rèn)為像素點(diǎn)(x,y)為前景點(diǎn),否則認(rèn)為像素點(diǎn)(x,y)為背景點(diǎn),生成由前景點(diǎn)與背 景點(diǎn)構(gòu)成的二值圖像,對二值圖像進(jìn)行中值濾波處理,以獲取YIQ二值圖像;
YCbCr前景分割步驟,將待處理圖像從RGB顏色空間轉(zhuǎn)換到Y(jié)CbCr顏色空 間,統(tǒng)計(jì)待處理圖像中像素點(diǎn)(x,y)的Cb分量值Cb(x,y)和Cr分量值Cr(x,y), 若CbTh1≤Cb(x,y)≤CbTh2并且CrTh1≤Cr(x,y)≤CrTh2,則認(rèn)為像素點(diǎn)(x,y) 為前景點(diǎn),否則認(rèn)為像素點(diǎn)(x,y)為背景點(diǎn),生成由前景點(diǎn)與背景點(diǎn)構(gòu)成的二值 圖像,對二值圖像進(jìn)行中值濾波處理,以獲取YCbCr二值圖像;
雙膚色二值圖像獲取步驟,YIQ二值圖像與YCbCr二值圖像做與操作,獲 取雙膚色二值圖像;
前景區(qū)域獲取步驟,采用連通區(qū)域法對雙膚色二值圖像進(jìn)行連通區(qū)域標(biāo)記, 統(tǒng)計(jì)標(biāo)記連通區(qū)域CRi的標(biāo)記點(diǎn)的個(gè)數(shù)SRi,若SRi≥STh,則在待處理圖像中獲 取對應(yīng)標(biāo)記連通區(qū)域的外接矩形區(qū)域作為前景區(qū)域,其中CRi為標(biāo)記的第i個(gè)連 通區(qū)域。
進(jìn)一步地,所述第三步驟包括:
區(qū)域?qū)捀弑扔?jì)算步驟,統(tǒng)計(jì)第j個(gè)前景區(qū)域的寬度FAWj和高度FAHj,計(jì) 算寬度與高度的比值
前景點(diǎn)比值計(jì)算步驟,統(tǒng)計(jì)第j個(gè)前景區(qū)域內(nèi)前景點(diǎn)數(shù)量FSumj,計(jì)算前景 點(diǎn)所占的比值
候選區(qū)域篩選步驟,若RTh1≤WHRj≤RTh2并且FRj≥RTh3,則認(rèn)為第j個(gè) 前景區(qū)域?yàn)楹蜻x區(qū)域,否則將第j個(gè)前景區(qū)域內(nèi)的所有前景點(diǎn)設(shè)置為背景點(diǎn)。
進(jìn)一步地,所述第四步驟包括:
訓(xùn)練樣本選取步驟,選取多樣式的標(biāo)注人臉圖像為正樣本圖像,選取多樣式 的標(biāo)注非人臉圖像為負(fù)樣本圖像;
樣本初步訓(xùn)練步驟,將正樣本圖像和負(fù)樣本圖像進(jìn)行灰度化處理,并將其縮 放到固定寬度和固定高度,采用卷積神經(jīng)網(wǎng)絡(luò)對經(jīng)過灰度化和縮放處理的正樣本 圖像和負(fù)樣本圖像進(jìn)行訓(xùn)練,獲得初步訓(xùn)練的人臉檢測模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京智芯原動(dòng)科技有限公司,未經(jīng)北京智芯原動(dòng)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710856524.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





