[發明專利]基于正交實驗分析的深度學習人臉圖像擴充方法在審
| 申請號: | 201810346925.X | 申請日: | 2018-04-18 |
| 公開(公告)號: | CN108573284A | 公開(公告)日: | 2018-09-25 |
| 發明(設計)人: | 裴炤;徐航;馬苗;彭亞麗;武杰;曹文飛 | 申請(專利權)人: | 陜西師范大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00;G06N3/08 |
| 代理公司: | 西安永生專利代理有限責任公司 61201 | 代理人: | 申忠才 |
| 地址: | 710062 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人臉圖像 正交 卷積神經網絡 實驗分析 人臉識別 人臉圖像數據 人臉采集 識別率 耗時 應用 學習 優化 | ||
1.一種基于正交實驗分析的深度學習人臉圖像擴充方法,其特征在于由下述步驟組成:
(1)擴充人臉圖像
建立原始人臉圖像數據庫I為:
I={Ik|k∈[1,N]} (1)
其中N是初始人臉圖像的總數量為有限的正整數,Ik為一幅人臉圖像,k為原始人臉圖像數據庫I中圖像的編號;
使用不同的數據擴充方法對原始人臉圖像數據庫I進行擴充,數據擴充方法采用現有的圖像處理方法,包括圖像旋轉、圖像放大、圖像平移、亮度增強、均值濾波、中值濾波、高斯濾波、雙邊濾波,得到擴充后的人臉數據集:
式中為平移后的圖像,為旋轉后的圖像,為縮放后的圖像,為亮度增強后的圖像,為經過均值濾波處理后的圖像,為經過中值濾波處理后的圖像,為經過高斯濾波處理后的圖像,為經過雙邊濾波處理后的圖像;
經擴充后的人臉數據集作為訓練集如下:
D={(I′i,Ti)|i∈[1,U]} (3)
式中I′i為待訓練的人臉圖像,Ti為I′i相應的人臉標簽,U是D中圖片的總數量為有限的正整數,i為D中圖像的編號;
(2)訓練深度卷積神經網絡
卷積神經網絡包括輸入層(1)、13個卷積層(2),5個池化層(3)、3個全連接層(4)、輸出層(5),連接關系如下:
輸入層(1)是大小為224×224的人臉圖像,輸入層(1)后依次連接2個含有64個特征圖的卷積層(2),含有64個特征圖的卷積層(2)后連接含有64個特征圖的池化層(3),含有64個特征圖的池化層(3)后依次連接2個含有128個特征圖的卷積層(2),含有128個特征圖的卷積層(2)后連接含有128個特征圖的池化層(3),含有128個特征圖的池化層(3)后依次連接3個含有256個特征圖的卷積層(2),含有256個特征圖的卷積層(2)后連接含有256個特征圖的池化層(3),含有256個特征圖的池化層(3)后依次連接3個含有512個特征圖的卷積層(2),含有512個特征圖的卷積層(2)后連接含有512個特征圖的池化層(3),含有512個特征圖的池化層(3)后依次連接3個含有512個特征圖的卷積層(2),含有512個特征圖的卷積層(2)后連接含有512個特征圖的池化層(3),含有512個特征圖的池化層(3)后依次連接全連接層(4)和輸出層(5),構建成深度卷積神經網絡;
將擴充后的人臉圖像數據集作為訓練數據輸入到深度卷積神經網絡中進行訓練,訓練過程如下:
式中W(m,n)是卷積層(2)中卷積核的元素,m、n分別為卷積核的第m行、第n列,C(x,y)是巻積操作后的輸出矩陣在第x行第y列的元素,s為卷積核的大小,b為卷積層的偏置值;用公式(5)對卷積層得到的特征圖進行下采樣操作:
P(x,y)=max(C(x+m′,y+n′)) (5)
式中P(x,y)是池化層輸出矩陣的元素,m′、n′是下采樣操作所采取的步長為有限的正整數;用公式(6)得到全連接層(4)的輸出:
式中,Fq表示在神經元q處的輸出,W′為全連接層的權重矩陣,s′為權重矩陣的大小,b′為全連接層的偏置值;
用公式(7)作為網絡的損失函數,使用小批量梯度下降算法來訓練深度卷積神經網絡:
式中M是一個批次中訓練圖片的數量為有限的正整數,J為輸出層(5)神經元的數量,q和Z為神經元的編號;
在訓練過程中使用反向傳播方法更新深度卷積神經網絡的權重w′t如下:
式中μ為動量,Δvt-1為迭代次數為t-1時更新的權重變化量,α是學習率為0.0005~0.005,wt是迭代次數為t時的權重;
(3)正交實驗
用圖像旋轉、圖像放大、圖像平移、亮度增強、均值濾波、中值濾波、高斯濾波、雙邊濾波作為不同因素,不同水平組合的數據擴充方法對原始人臉圖像數據庫I進行擴充,并進行正交實驗,訓練深度卷積神經網絡,確定相應的人臉識別率,用極差分析法對正交實驗的結果進行分析,確定最佳的人臉數據擴充方法,對原始人臉圖像數據庫進行擴充,重新訓練深度卷積神經網絡;
(4)優化深度卷積神經網絡
調整深度卷積神經網絡的層數、學習率、每層網絡的卷積核個數和大小,重復實驗,選擇人臉識別率最高的模型,對參數及訓練好的模型保存。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西師范大學,未經陜西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810346925.X/1.html,轉載請聲明來源鉆瓜專利網。





