[發(fā)明專利]一種人臉檢測方法及裝置在審
| 申請?zhí)枺?/td> | 201610848895.3 | 申請日: | 2016-09-23 |
| 公開(公告)號: | CN107871134A | 公開(公告)日: | 2018-04-03 |
| 發(fā)明(設(shè)計)人: | 段旭;宋麗;張祥德 | 申請(專利權(quán))人: | 北京眼神科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司11319 | 代理人: | 蘇培華 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 檢測 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明實施例涉及人工智能領(lǐng)域,尤其涉及一種人臉檢測方法及裝置。
背景技術(shù)
人臉檢測是指從輸入?yún)^(qū)域中確定所有人臉的位置和大小的過程。作為人臉信息處理中的一項關(guān)鍵技術(shù),人臉檢測是許多自動人臉圖像分析應(yīng)用的前提和基礎(chǔ),如人臉識別、人臉配準、人臉追蹤、人臉屬性識別等,也是現(xiàn)代人機交互系統(tǒng)的第一步。不僅如此,目前大多數(shù)的數(shù)碼相機都嵌入了人臉檢測技術(shù)來自動對焦,許多社交網(wǎng)絡(luò)如FaceBook等利用人臉檢測技術(shù)來實現(xiàn)圖像標注。
隨著人工智能的發(fā)展,人臉檢測方法也得到了一定的發(fā)展,但仍存在一些不足。如基于提升級聯(lián)的方法,雖然采用單一的積分圖特征的級聯(lián)檢測器計算速度較快,但僅能夠處理正面人臉圖像,對于姿態(tài)變化、部分遮擋和光照等復(fù)雜條件下的人臉檢測性能較差;基于可變部件模型技術(shù)的方法,雖然檢測性能較好,能夠在人臉部分被遮擋的情況下檢測到人臉,但由于需要訓練一個隱支持向量機分類器來找到這些部件以及部件之間的幾何關(guān)系,計算成本較高,導致計算比較耗時。
因此,如何在保證計算速度的同時提升人臉檢測的檢測性能,是目前亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種人臉檢測方法,以解決現(xiàn)有技術(shù)中人臉檢測的檢測性能和計算速度無法同時滿足用戶需求的問題。
為了解決上述問題,本發(fā)明公開了一種人臉檢測方法,包括:
采用預(yù)先訓練的第一卷積神經(jīng)網(wǎng)絡(luò)模型對待測圖像進行分類處理,確定所述待測圖像中各輸入?yún)^(qū)域的第一人臉置信度,根據(jù)所述第一人臉置信度從所述輸入?yún)^(qū)域中篩選出至少一個候選區(qū)域,所述第一卷積神經(jīng)網(wǎng)絡(luò)包括m層卷積層;
采用預(yù)先訓練的第二卷積神經(jīng)網(wǎng)絡(luò)模型分別對所述候選區(qū)域進行分類處理,確定所述候選區(qū)域的第二人臉置信度,根據(jù)所述第二人臉置信度篩選出至少一個選中區(qū)域,所述第二卷積神經(jīng)網(wǎng)絡(luò)包括k層卷積層,其中,k和m均為正整數(shù)且k大于m;
根據(jù)所選出的至少一個選中區(qū)域,進行檢測框消除和聚合,以得到人臉檢測結(jié)果。
其中,采用預(yù)先訓練的第一卷積神經(jīng)網(wǎng)絡(luò)模型對待測圖像進行分類處理之前,還包括:當采用圖像金字塔方法從所述待測圖像中獲取輸入?yún)^(qū)域時,將預(yù)先訓練的第一卷積神經(jīng)網(wǎng)絡(luò)模型和第二卷積神經(jīng)網(wǎng)絡(luò)模型中網(wǎng)絡(luò)結(jié)構(gòu)的全連接層轉(zhuǎn)換為全卷積層。
根據(jù)所選出的至少一個選中區(qū)域,進行檢測框消除和聚合,以得到人臉檢測結(jié)果之前,還包括:采用所述第二卷積神經(jīng)網(wǎng)絡(luò)模型,對各選中區(qū)域分別進行邊界框回歸處理。
優(yōu)選的,根據(jù)所選出的至少一個選中區(qū)域,進行檢測框消除和聚合,以得到人臉檢測結(jié)果,包括:對所述選中區(qū)域進行置信度排序,獲得置信度最高的檢測框;以所述置信度最高的檢測框為中心,將周圍大于第一重疊程度的檢測框進行消除;以所述置信度最高的檢測框為中心,將周圍大于第二重疊程度的檢測框聚合為一個人臉檢測框,并將最高置信度作為該聚合結(jié)果的置信度,以得到所述人臉檢測結(jié)果。
優(yōu)選的,所述方法還包括訓練卷積神經(jīng)網(wǎng)絡(luò)的圖像分類任務(wù)的步驟,其中所述卷積神經(jīng)網(wǎng)絡(luò)包括所述第一卷積神經(jīng)網(wǎng)絡(luò)和/或所述第二卷積神經(jīng)網(wǎng)絡(luò):選用包含人臉標注的人臉數(shù)據(jù)集作為訓練樣本,對所述訓練樣本中的訓練圖像進行剪裁;根據(jù)剪裁得到的圖像與真實人臉標注的重疊程度,選取正樣本和負樣本;通過所述卷積層對所述正樣本和負樣本圖像進行過濾處理,獲得所述訓練圖像的特征圖,并通過所述池化層對經(jīng)過所述卷積層過濾處理的圖像進行池化,降低所述卷積層輸出的特征向量;將所述特征圖全連接成一個向量,通過激活函數(shù)將所述向量的特征映射出來,獲得圖像分類結(jié)果,所述圖像分類結(jié)果包括人臉圖像類別和非人臉圖像類別;將所述圖像分類結(jié)果通過圖像分類任務(wù)的損失函數(shù)進行迭代。
優(yōu)選的,所述方法還包括訓練第二卷積神經(jīng)網(wǎng)絡(luò)的邊界框回歸任務(wù)的步驟:通過將剪裁得到的所述正樣本的坐標與真實標注的坐標進行比較,獲得訓練邊界框回歸任務(wù)的正樣本輸出標簽;將所述正樣本輸出標簽和預(yù)先設(shè)定的負樣本輸出標簽,通過邊界框回歸任務(wù)損失函數(shù)和分類任務(wù)損失函數(shù)的加權(quán)運算進行迭代。
本發(fā)明還提供了一種人臉檢測裝置,包括:
預(yù)分類模塊,用于采用預(yù)先訓練的第一卷積神經(jīng)網(wǎng)絡(luò)模型對待測圖像進行分類處理,確定所述待測圖像中各輸入?yún)^(qū)域的第一人臉置信度,根據(jù)所述第一人臉置信度從所述輸入?yún)^(qū)域中篩選出至少一個候選區(qū)域,所述第一卷積神經(jīng)網(wǎng)絡(luò)包括m層卷積層;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京眼神科技有限公司,未經(jīng)北京眼神科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610848895.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:圖像處理
- 下一篇:避免辨識結(jié)果混淆的影像辨識方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





