[發(fā)明專利]一種用于行人識別的方法有效
| 申請?zhí)枺?/td> | 201810103970.2 | 申請日: | 2018-02-01 |
| 公開(公告)號: | CN108229435B | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設計)人: | 張師林;喬治;于航濱 | 申請(專利權(quán))人: | 北方工業(yè)大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04 |
| 代理公司: | 北京德崇智捷知識產(chǎn)權(quán)代理有限公司 11467 | 代理人: | 衛(wèi)麟 |
| 地址: | 100144 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 行人 識別 方法 | ||
1.一種用于行人識別的方法,其特征在于,該方法依次包含如下步驟:
步驟1:構(gòu)建殘差卷積神經(jīng)網(wǎng)絡
所述殘差卷積神經(jīng)網(wǎng)絡包括行人圖像輸入層、模型層、分類層和損失層;其中損失層包括Softmax損失函數(shù)和中心損失函數(shù),
所述Softmax損失函數(shù)為:
其中,xi∈Rd表示第i個行人圖像的卷積神經(jīng)網(wǎng)絡特征,隸屬于第yi個行人,d是該特征的維度;Wj∈Rd是網(wǎng)絡最后一層全連接層權(quán)重矩陣W∈Rd×n的第j列,n表示矩陣W的列數(shù),m表示行人標識的個數(shù);中心損失函數(shù)為:
其中,cyi表示所有標識為yi的行人的特征平均值;
步驟2:模型訓練
利用預設的行人標注圖像,對所述殘差卷積神經(jīng)網(wǎng)絡進行訓練,采用隨機梯度下降的方法,確定殘差網(wǎng)絡所有參數(shù)的取值,使分類層的損失達到損失最小,訓練完成后,網(wǎng)絡結(jié)構(gòu)去除分類層和損失層,剩余部分作為行人圖像特征提取的工具,得到最終的行人圖像特征提取模型M;
步驟3:建立待識別行人圖像數(shù)據(jù)庫
利用步驟2中得到的模型M提取每個行人的圖像特征,并形成行人特征數(shù)據(jù)庫D;對于通過相機新采集的行人圖像,使用模型M獲取特征x,依次計算x和行人特征數(shù)據(jù)庫D中第i個行人圖像的卷積神經(jīng)網(wǎng)絡特征xi的相似度d(x,xi):
步驟4:檢索與重排序
按照相似度數(shù)值從小到大的順序,得到相似度最近的N個匹配行人,并將這個檢索集合記為A,對于這N個匹配出來的行人xi,每一個行人特征再分別作為檢索圖像x,再依次從行人特征數(shù)據(jù)庫中檢索并得到N個匹配行人集合,記為B,如果A∩B的元素個數(shù)大于N的2/3,則xi成為最終檢索出來的行人;對于初次檢索所得到的結(jié)果集合A,分別將A中的所有候選行人分別作為待檢索行人,繼續(xù)在行人特征數(shù)據(jù)集D中檢索,將所得到的每一個集合B,計算B和A的交集個數(shù),如果這個數(shù)量大于N的2/3倍,則保留A中的待檢索行人作為檢索結(jié)果,否則在A中去除候選行人。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北方工業(yè)大學,未經(jīng)北方工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810103970.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





