[發(fā)明專利]行人重識別方法、模型構(gòu)建方法、裝置、設備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910514458.1 | 申請日: | 2019-06-14 |
| 公開(公告)號: | CN110399789B | 公開(公告)日: | 2021-04-20 |
| 發(fā)明(設計)人: | 李德紘;張睿;劉偉;馮焱一 | 申請(專利權(quán))人: | 佳都新太科技股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京澤方譽航專利代理事務所(普通合伙) 11884 | 代理人: | 陳照輝 |
| 地址: | 511400 廣東省廣州市番禺區(qū)東環(huán)街迎賓*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行人 識別 方法 模型 構(gòu)建 裝置 設備 存儲 介質(zhì) | ||
1.一種行人重識別方法,其特征在于,包括:
輸入第一預設幀數(shù)的第一類型的連續(xù)幀圖像至第一通道,輸入第二預設幀數(shù)的第二類型的連續(xù)幀圖像至第二通道,其中,第一類型的連續(xù)幀圖像為多通道圖像,第二類型的連續(xù)幀圖像為單通道圖像,所述第一通道由預先構(gòu)建的第一殘差神經(jīng)網(wǎng)絡模型構(gòu)成,所述第二通道由預先構(gòu)建的第二殘差神經(jīng)網(wǎng)絡模型構(gòu)成,所述第一殘差神經(jīng)網(wǎng)絡模型包括P3D-ResNet127模型,所述第二殘差神經(jīng)網(wǎng)絡模型包括通道數(shù)縮減的所述P3D-ResNet127模型;
針對每個殘差卷積層,將第一通道中的殘差卷積層的輸出結(jié)果與對應的第二通道中的殘差卷積層的輸出結(jié)果,按照預設側(cè)向連接方式進行融合,將融合后的結(jié)果分別輸入至下一殘差卷積層,其中,每個殘差卷積層包含的歸一化模塊的輸出,根據(jù)第一可學習參數(shù)和第二可學習參數(shù),應用各個圖像通道的平均值和標準差確定,所述第一可學習參數(shù)和所述第二可學習參數(shù)的更新包括將第二預設幀數(shù)的第二類型的連續(xù)幀圖像輸入至構(gòu)建的部件親和域預測器;
分別提取所述第一殘差神經(jīng)網(wǎng)絡模型輸出的空間級特征和第二殘差神經(jīng)網(wǎng)絡模型輸出的時序級特征;
根據(jù)所述空間級特征和所述時序級特征來共同訓練所述預先構(gòu)建的第一殘差神經(jīng)網(wǎng)絡模型和所述預先構(gòu)建的第二殘差神經(jīng)網(wǎng)絡模型;
應用訓練好的第一殘差神經(jīng)網(wǎng)絡模型和所述第二殘差神經(jīng)網(wǎng)絡模型進行行人重識別。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述多通道圖像為RGB三通道圖像,所述單通道圖像為灰度圖像。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一殘差神經(jīng)網(wǎng)絡模型和所述第二殘差神經(jīng)網(wǎng)絡模型的生成包括:
基于獲取的拓撲結(jié)構(gòu)信息和配置參數(shù)信息,構(gòu)建形成初始網(wǎng)絡模型,其中,所述拓撲結(jié)構(gòu)信息包括:殘差卷積層信息、最大池化層信息、平均池化層信息、跨連接層信息和各層之間的拓撲連接順序;所述配置參數(shù)信息包括每個殘差卷積層中的殘差模塊的參數(shù)信息;
根據(jù)獲取的訓練學習信息,迭代訓練所述初始網(wǎng)絡模型,構(gòu)建第一殘差神經(jīng)網(wǎng)絡模型和第二殘差神經(jīng)網(wǎng)絡模型。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,每層殘差卷積層包括至少一個殘差模塊,每個殘差模塊包括:卷積模塊、歸一化模塊和激活函數(shù)模塊。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:更新所述歸一化模塊,相應的,所述更新所述歸一化模塊包括:
構(gòu)建置信圖預測器和部件親和域預測器;
將第一預設幀數(shù)的第二類型的連續(xù)幀圖像輸入至所述置信圖預測器,以獲取人體的部件置信圖,并確定所述人體的部件的相對位置信息,根據(jù)所述相對位置信息更新所述第一殘差神經(jīng)網(wǎng)絡模型的歸一化模塊中的第一可學習參數(shù)和第二可學習參數(shù),以更新所述歸一化模塊;
將第二預設幀數(shù)的第二類型的連續(xù)幀圖像輸入至所述部件親和域預測器,以獲取人體關鍵點在空間上的位置信息和方向信息,根據(jù)所述位置信息和方向信息更新所述第二殘差神經(jīng)網(wǎng)絡模型的歸一化模塊中的第一可學習參數(shù)和第二可學習參數(shù),以更新所述歸一化模塊;
其中,所述第二類型的連續(xù)幀圖像為單通道圖像。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,針對第一殘差神經(jīng)網(wǎng)絡模型:
卷積模塊的卷積核的大小為1*7*7*3*64,卷積步長為(1,2,2),填充參數(shù)為(0,3,3);最大池化層的核形狀為1*3*3,卷積步長為(1,2,2),填充參數(shù)為(0,1,1);各個殘差卷積層的輸入通道數(shù)分別為64、256、512、1024,對應的輸出通道數(shù)分別為256、512、1024和2048。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,針對第二殘差神經(jīng)網(wǎng)絡模型:
卷積模塊的卷積核的大小為5*7*7*3*64*β,卷積步長為(1,2,2),填充參數(shù)為(0,3,3);最大池化層的核形狀為1*3*3,卷積步長為(1,2,2),填充參數(shù)為(0,1,1);各個殘差卷積層的輸入通道數(shù)分別為64*β、256*β、512*β、1024*β,對應的輸出通道數(shù)分別為256*β、512*β、1024*β和2048*β,其中β為大于零且小于1的自然數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于佳都新太科技股份有限公司,未經(jīng)佳都新太科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910514458.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





