[發明專利]一種基于最小歸一化距離學習的視頻人臉識別方法有效
| 申請號: | 201810617583.0 | 申請日: | 2018-06-15 |
| 公開(公告)號: | CN108985168B | 公開(公告)日: | 2022-05-24 |
| 發明(設計)人: | 陳瑩;余拓;化春鍵 | 申請(專利權)人: | 江南大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/40 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 張勇 |
| 地址: | 214000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 最小 歸一化 距離 學習 視頻 識別 方法 | ||
1.一種基于最小歸一化距離學習的視頻人臉識別方法,其特征在于,包括以下步驟:
S01、讀入訓練數據并提取人臉特征:讀入N名個體的單幅靜態圖像和包含Ni幅視頻圖像的視頻Vi,對每幅靜態圖像提取人臉特征,將靜態圖像的人臉特征記為其標簽記為同樣對所述視頻Vi中的每幅視頻圖像提取人臉特征,將所述視頻Vi的人臉特征記為其中其標簽記為
其中,指視頻Vi中的第p幅圖像的人臉特征,p=1、2、...Ni;
S02、訓練距離模型:構建損失函數并求取梯度,使用隨機梯度下降法對損失函數進行優化,得到最小歸一化距離度量矩陣M;
S03、進行人臉識別:在識別過程中,對于組成目標集的N′幅靜態圖像提取人臉特征,記為其標簽記為記包含L幅視頻圖像且標簽未知的視頻為Vb,對其中包含的L幅視頻圖像提取人臉特征,并將所述標簽未知的視頻Vb的人臉特征記為其中,指所述標簽未知的視頻中的第m幅圖像的人臉特征;利用訓練得到的度量矩陣M,計算每一個目標圖像的人臉特征與所述標簽未知的視頻Vb的人臉特征之間的最小歸一化距離并最終得到識別結果gc,其中
所述步驟S02包括:
(1)定義最小歸一化距離其中為最小歸一化約束,是馬氏距離,M是度量矩陣,是和之間差值的外積,K=N÷20;其中,是視頻Vi中的第p幅圖像的人臉特征,1≤p≤Ni;表示與其特征距離最小的K個靜態圖像的人臉特征之間的特征距離之和;
(2)初始化參數,令迭代次數t=0,度量矩陣M初值為單位矩陣M0=I,損失函數初值為f(M)0=0,步進λ0=1×10-3;
(3)對于每段視頻Vi,找到其最小的類內最小歸一化距離和最小的類間最小歸一化距離其中i、j和k滿足yj=zi且yk≠zi,1≤u≤Ni,1≤v≤Ni,1≤k≤N;
其中,是視頻Vi中的第u幀圖像的人臉特征;
(4)使用和對應的人臉特征的索引構建觸發集,當時,將(i,j,k,u,v)加入觸發集
其中,0≤t≤500;
(5)計算損失函數α是權衡損失函數中兩項的系數,0≤α≤1;
(6)計算梯度
(7)更新度量矩陣Mt+1=Mt-λtGt,并更新步進,當f(M)t+1>f(M)t時,令λt+1=λt-1×10-3,否則令λt+1=λt+2×10-3;
(8)通過在特征分解后取出負特征值的方法來保持Mt+1為半正定矩陣;
(9)如果t≥500或|f(M)t+1-f(M)t|<0.1,則算法中止,得到優化后的度量矩陣M=Mt,否則返回(3)。
2.根據權利要求1所述的一種基于最小歸一化距離學習的視頻人臉識別方法,其特征在于,所述步驟S03包括:
a、計算目標集中的靜態圖像的人臉特征與所述標簽未知的視頻Vb的人臉特征之間的最小歸一化距離其中
b、得到查詢視頻的識別結果gc,其中
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江南大學,未經江南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810617583.0/1.html,轉載請聲明來源鉆瓜專利網。





