[發明專利]基于級聯深度卷積神經網絡的人臉檢測方法在審
| 申請號: | 201811326169.0 | 申請日: | 2018-11-08 |
| 公開(公告)號: | CN109614866A | 公開(公告)日: | 2019-04-12 |
| 發明(設計)人: | 溫峻峰;江志偉;李鑫;杜海江;夏歡;謝巍;張浪文;翁冠碧 | 申請(專利權)人: | 中科天網(廣東)科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京聯瑞聯豐知識產權代理事務所(普通合伙) 11411 | 代理人: | 張清彥 |
| 地址: | 510070 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人臉檢測 損失函數 卷積 卷積神經網絡 訓練樣本 特征圖 級聯 卷積運算 質量評價 高維 人臉 向量 圖像質量評價 人臉圖像 輸出 串行化 連接層 填充 重復 更新 網絡 | ||
1.一種基于級聯深度卷積神經網絡的人臉檢測方法,其特征在于,包括如下步驟:
A)建立n級深度卷積網絡;所述n級深度卷積網絡包括n個卷積層、一個全連接層、一個人臉框輸出層和一個人臉質量評價輸出層,每個所述卷積層中含有多個正方形卷積核和長方形卷積核,所述人臉框輸出層設有多個節點,所述人臉質量評價輸出層設有多個節點,所述n為整數且n≥1;
B)選取若干個輸入圖像作為訓練樣本,對當前訓練樣本的邊緣處進行行數和列數的填充,得到填充圖像,并將所述填充圖像分別與第一層所述卷積層中的每個卷積核進行卷積運算,得到多個特征圖;
C)將所述特征圖中的部分或全部特征圖作為下一層所述卷積層的輸入,并將其分別與下一層所述卷積層中的每個卷積核進行卷積運算,得到多個對應的特征圖;
D)重復上述步驟C)直至到第n+1層所述卷積層;
E)將第n+1層所述卷積層輸出的特征圖串行化得到高維向量,將所述高維向量與所述全連接層的節點進行全連接;
F)通過所述人臉框輸出層輸出人臉框坐標,通過所述人臉質量評價輸出層輸出人臉質量評價得分;
G)根據所述人臉框坐標,計算出包圍框坐標偏移量,得到人臉檢測損失函數;
H)用Softmax loss函數來表示圖像質量評價損失函數;
I)對所述人臉檢測損失函數和圖像質量評價損失函數進行加權疊加后得到當前所述訓練樣本的損失函數;
J)對每個訓練樣本的損失函數進行求和,得到總損失函數;
K)當其中一級深度卷積網絡訓練結束后,用訓練好的深度卷積網絡計算出每個訓練樣本的損失函數,將損失函數大的訓練樣本的權值進行增大,將損失函數小的訓練樣本的權值進行減小,完成對每個所述訓練樣本的權值的更新;
L)通過所述步驟A)至步驟K)的學習方式,將多級深度卷積網絡串起來訓練出級聯深度卷積神經網絡,采用所述級聯深度卷積神經網絡進行人臉檢測,去除非人臉窗口。
2.根據權利要求1所述的基于級聯深度卷積神經網絡的人臉檢測方法,其特征在于,在所述第n級深度卷積網絡中,所述全連接層的節點數為64x2(n-1),從所述全連接層往左算起,第m個卷積層的卷積核的大小分別為(1+2m)×(1+2m)、(3+2m)×(1+2m)和(1+2m)×(3+2m),通道數均為16×2(n-m),所述m為整數且0<m<n+2。
3.根據權利要求2所述的基于級聯深度卷積神經網絡的人臉檢測方法,其特征在于,在所述步驟B)中,令所述當前訓練樣本的大小為Iy×Ix,卷積核的大小為ky×kx,在所述當前訓練樣本的邊緣處用0填充的行數和列數分別為和輸出的特征圖的大小為Fy×Fx,存在如下關系:
Fy=Iy+2*Py-ky+1=Iy
Fx=Ix+2*Px-kx+1=Ix
其中,Iy表示當前訓練樣本的行數,Ix表示當前訓練樣本的列數,ky為卷積核的行數,kx為卷積核的列數,ky和kx均為奇數,Fy表示特征圖的行數,Fx表示特征圖的列數。
4.根據權利要求3所述的基于級聯深度卷積神經網絡的人臉檢測方法,其特征在于,所述高維向量的長度為3*16×2(n-1)×Fy×Fx,所述高維向量與所述全連接層的節點全連接的連接數為3*16×2(n-1)×Fy×Fx×64×2(n-1)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科天網(廣東)科技有限公司,未經中科天網(廣東)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811326169.0/1.html,轉載請聲明來源鉆瓜專利網。





