[發(fā)明專利]一種基于近紅外人臉圖像的Hog和Gabor特征高效融合快速人臉識別方法在審
| 申請?zhí)枺?/td> | 201811311715.3 | 申請日: | 2018-11-06 |
| 公開(公告)號: | CN109376680A | 公開(公告)日: | 2019-02-22 |
| 發(fā)明(設(shè)計)人: | 劉惠;吳佳霖;張怡然;王金柯 | 申請(專利權(quán))人: | 大連理工大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 大連理工大學(xué)專利中心 21200 | 代理人: | 梅洪玉;劉秋彤 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 降維 紅外人臉 人臉識別 高效融合 特征矩陣 訓(xùn)練樣本 模式識別和圖像處理 投影變換矩陣 線性判別分析 圖像 最近鄰算法 測試樣本 非負矩陣 分類識別 特征表征 特征融合 特征向量 特征信息 圖像樣本 分解法 全面性 融合 算法 耗時 存儲 保證 | ||
1.一種基于近紅外人臉圖像的Hog和Gabor特征高效融合快速人臉識別方法,其特征在于,步驟如下:
步驟1:對近紅外人臉圖像訓(xùn)練樣本分別進行Hog特征提取和Gabor特征提取,獲得兩類特征矩陣;具體為:
(1.1)對近紅外人臉圖像訓(xùn)練樣本進行Hog特征提取:
首先,對近紅外人臉圖像訓(xùn)練樣本進行圖像灰度化和顏色空間歸一化處理,所述顏色空間歸一化處理的公式為:L(x1,y1)=E(x1,y1)γ,其中,L(x1,y1)為經(jīng)過顏色空間歸一化處理后的圖像在像素點(x1,y1)處的像素值,E(x1,y1)為圖像在像素點(x1,y1)處的灰度值,取值
然后,計算像素點(x1,y1)的水平方向梯度Gx(x1,y1)和垂直方向梯度Gy(x1,y1):
Gx(x1,y1)=L(x1+1,y1)-L(x1-1,y1)
Gy(x1,y1)=L(x1,y1+1)-L(x1,y1-1)
進而,計算出像素點的梯度大小G(x1,y1)和梯度方向θ(x1,y1)分別為:
之后,將圖像劃分為大小相同的單元,為每一個單元構(gòu)建梯度直方圖,并將相鄰的單元組合成塊,進行梯度強度歸一化;
最后,把所有塊內(nèi)的直方圖向量組合起來,即形成Hog特征向量,組合所有訓(xùn)練樣本圖像的Hog特征向量構(gòu)成訓(xùn)練樣本Hog特征矩陣Vm×n;其中,n為訓(xùn)練樣本圖像數(shù),m為Hog特征提取后圖像的維度,Vm×n的每個列向量都是一幅m維的圖像;
(1.2)對近紅外人臉圖像訓(xùn)練樣本進行Gabor特征提取:
首先,構(gòu)建具有8個方向,5個尺度的40組Gabor核函數(shù):
其中,x,y分別為圖像中某一點像素的橫縱坐標值,u,v分別為空間方向和空間尺度調(diào)整系數(shù);μ∈{0,…,7}對應(yīng)8個不同空間方向,ν∈{0,…,4}對應(yīng)5個不同空間尺度,取值δ=2π;i為虛數(shù)單位;
然后,利用Gabor核函數(shù)分別與訓(xùn)練樣本圖像進行卷積運算,每張人臉圖像得到40個Gabor特征圖;所述卷積運算的公式為:
Oμ,ν(x,y)=I(x,y)*Gμ,v(x,y),其中,I(x,y)為輸入的樣本圖像,Oμ,ν(x,y)為Gabor濾波后得到的Gabor特征圖;
之后,對同一空間方向不同空間尺度的Gabor特征圖進行融合,得到8個Gabor特征圖,將8個Gabor特征圖串聯(lián)組合起來形成Gabor特征向量;所述的融合公式為:
其中,Bμ(x,y)為融合后Gabor特征圖;
最后,組合所有訓(xùn)練樣本圖像的Gabor特征向量構(gòu)成訓(xùn)練樣本Gabor特征矩陣其中,n為訓(xùn)練樣本圖像數(shù),m1為Gabor特征提取后圖像的維度,的每個列向量都是一幅m1維的圖像;
步驟2:利用非負矩陣分解法NMF分別對兩類特征矩陣進行一次降維,獲得兩個一次投影變換矩陣;具體為:
(2.1)Hog特征矩陣Vm×n的一次降維:
首先,利用NMF方法分解Hog特征矩陣Vm×n:Vm×n=Wm×k×Hk×n,其中,Wm×k為基矩陣,Hk×n為系數(shù)矩陣;
那么,非負矩陣分解問題化為:
其中,E(W,H)為V與WH的歐氏距離;h為矩陣行標號;j為矩陣列標號;
迭代規(guī)則為:
其中,Whk為基矩陣Wm×k的第h行k列的元素值;Hkj為系數(shù)矩陣Hk×n的第k行j列的元素值;
經(jīng)非負矩陣分解過程得到的矩陣Wm×k,即為一次投影變換矩陣;
然后,將Hog特征矩陣Vm×n投影于Wm×k空間上:
其中,V′k×n為一次降維后的訓(xùn)練樣本Hog特征矩陣,圖像維度由m維降維至k維,完成訓(xùn)練樣本Hog特征矩陣Vm×n的一次降維;
(2.2)與步驟(2.1)相同,完成訓(xùn)練樣本Gabor特征矩陣的一次降維,得到Gabor一次投影變換矩陣及一次降維后的訓(xùn)練樣本Gabor特征矩陣U′k×n;
步驟3:利用兩個一次投影變換矩陣,將降維后的Hog特征與Gabor特征進行串行特征融合,獲取融合特征矩陣;所述融合特征矩陣的計算公式為:
步驟4:利用線性判別分析法LDA對融合特征矩陣進行二次降維,獲得二次投影變換矩陣和二次降維后訓(xùn)練樣本的特征向量;具體為:
(4.1)利用LDA方法計算確定最優(yōu)投影矩陣:
首先,計算類內(nèi)散布矩陣Sw和類間散布矩陣Sb:
其中,μp表示第p類樣本均值,μa表示所有樣本均值,圖像樣本中共C類人,每個人N張人臉圖像;x(p,q)代表第p類人的第q張人臉圖像的特征向量;
然后;利用類內(nèi)散布矩陣Sw和類間散布矩陣Sb,通過Fisher準則函數(shù)獲得最優(yōu)投影矩陣WLDA:WLDA=[w1,w2,...,wr];
其中,F(xiàn)isher準則函數(shù)為:
r為所需投影維數(shù);w=[w1,w2,...]用于構(gòu)造Fisher投影矩陣,使得JLDA(w)最大,根據(jù)需求從w中選出r個特征值最大的特征向量組成矩陣WLDA;
(4.2)將步驟3得到的融合特征矩陣M2k×n投影于r維的WLDA空間上:得到二次降維后的訓(xùn)練樣本特征向量Rr×n,保證投影后的樣本在新的空間有最大類間距離和最小類內(nèi)距離,從而實現(xiàn)二次降維;
步驟5:對待檢測近紅外人臉圖像測試樣本提取Hog特征和Gabor特征;利用步驟2中獲取的兩個一次投影變換矩陣,分別對測試樣本Hog特征和Gabor特征進行一次降維;利用步驟3的方法獲得測試樣本的融合特征矩陣;再利用步驟4中獲取的二次投影變換矩陣對測試樣本的融合特征矩陣進行二次降維,得到待檢測人臉圖像的二次降維特征向量;具體為:
(5.1)利用步驟(1.1)和(1.2)的方法得到測試樣本Hog特征矩陣和測試樣本Gabor特征矩陣其中n1為測試樣本圖像數(shù),m為Hog特征提取后圖像的維度,m1為Gabor特征提取后圖像的維度;
(5.2)利用步驟(2.1)和(2.2)中獲取的兩個一次投影變換矩陣Wm×k和分別對測試樣本Hog特征矩陣和Gabor特征矩陣進行一次降維,得到一次降維后的測試樣本Hog特征矩陣以及一次降維后的測試樣本Gabor特征矩陣
(5.3)利用步驟3的方法獲得測試樣本的融合特征矩陣
(5.4)再利用步驟4中獲取的二次投影變換矩陣WLDA對測試樣本的融合特征矩陣進行二次降維:
得到待檢測人臉圖像的二次降維特征向量
步驟6:利用最近鄰算法KNN基于訓(xùn)練樣本的分布情況,對測試樣本的二次降維特征向量進行分類識別;具體為:
(6.1)設(shè)二次降維測試樣本特征向量的第z個列向量為αz,αz代表了二次降維測試樣本中第z個個體的特征數(shù)據(jù),計算αz與二次降維訓(xùn)練樣本特征向量Rr×n的每一個列向量β1,β2,...,βn間的歐氏距離Ds(αz):
Ds(αz)=||αz-βs||2,其中s∈{1,…,n};
(6.2)查找與αz距離最小的二次降維訓(xùn)練樣本個體特征數(shù)據(jù),通過訓(xùn)練樣本的分布得到該二次降維訓(xùn)練樣本個體標簽,即為二次降維測試樣本中第z個個體的所屬類別;
(6.3)對于二次降維測試樣本特征向量的每一個列向量,均采用(6.1)至(6.2)的方法,獲得二次降維測試樣本中每個個體的所屬類別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連理工大學(xué),未經(jīng)大連理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811311715.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種用于個體識別的特征空間降維方法
- 一種監(jiān)督鄰域保持嵌入人臉識別方法和系統(tǒng)及人臉識別器
- 一種基于web服務(wù)平臺的高維數(shù)據(jù)降維方法及系統(tǒng)
- 一種提高機載雷達雜波抑制性能的方法及系統(tǒng)
- 基于人工智能的降維模型訓(xùn)練方法、檢索方法及裝置
- 一種基于局部線性嵌入和模式積的張量降維算法
- 高維數(shù)據(jù)處理方法及裝置
- 一種基于深度神經(jīng)網(wǎng)絡(luò)的擴展LargeVis圖像特征降維方法
- 時間序列數(shù)據(jù)的降維方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 基于大數(shù)據(jù)的數(shù)據(jù)降維方法、系統(tǒng)及云平臺





