[發(fā)明專利]一種基于位姿嵌入的多尺度卷積特征融合行人重識別方法在審
| 申請?zhí)枺?/td> | 202110667913.9 | 申請日: | 2021-06-16 |
| 公開(公告)號: | CN113378729A | 公開(公告)日: | 2021-09-10 |
| 發(fā)明(設計)人: | 廖開陽;雷浩;鄭元林;章明珠;范冰;黃港 | 申請(專利權)人: | 西安理工大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 西安弘理專利事務所 61214 | 代理人: | 王丹 |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 嵌入 尺度 卷積 特征 融合 行人 識別 方法 | ||
本發(fā)明公開了一種基于位姿嵌入的多尺度卷積特征融合行人重識別方法,包括:采用隨機擦除的方式對原始行人圖像進行預處理得到行人圖像,并對Resnet?50網絡模型進行基線網絡優(yōu)化,提取深度卷積特征;對原始行人圖像提取顯著性人體圖像;先對人體顯著性圖像進行姿態(tài)提取,再對身體部位圖像提取局部語義特征;將深度卷積特征和局部語義特征進行加權融合,對加權融合特征進行進行距離度量,生成初始度量列表;根據重排序算法對初始度量列表中的圖像進行重新排序,得到圖像正確匹配排名,輸出行人匹配圖像識別特定行人。能夠大幅度提高識別和定位的精度。
技術領域
本發(fā)明屬于圖像處理方法技術領域,涉及一種基于位姿嵌入的多尺度卷積特征融合行人重識別方法。
背景技術
近年來,人工智能作為現在科技發(fā)展的重要進步點,在我們使用的各項技術中獨占鰲頭。它在智能監(jiān)控范疇中的使用也變得極其重要。隨著城市的擴張,監(jiān)控系統進一步的普及,每個城市都有成千上萬的攝像頭遍布在街頭巷尾。攝像頭的使用不斷增多,而單單依靠人為去監(jiān)控的代價是極為昂貴的,并且無法在同一時間監(jiān)控如此多的畫面。因此行人重識別技術就引起了研究人員的重視。它能夠幫助人們進行實行的監(jiān)控、跟蹤、和識別行人。由于人類主要是通過視覺技術來接收和感知到外界的各種信息,而且人類所擁有的這種視覺技術能夠從繁瑣的圖像中直接獲得到所需要的信息。研究人員也希望能夠仿照人的視覺系統來讓攝像機有效的、迅速的捕捉環(huán)境中的物體。這種技術最終衍生成為我們現在的行人重識別技術。行人重識別這一項技術的使用非常的廣泛,例如智能監(jiān)控系統就需要使用到行人重識別技術。這項技術借用計算機強大的能力來處理數據,例如視頻監(jiān)控系統可以自動的過濾掉一些無用信息并且主動的來識別人體,從而達到有效的進行全方位的監(jiān)控,并且可以做到事先預警、過后取證的24小時監(jiān)控體系。同樣使用這項技術的還有行人流量統計。它同樣借用計算機強大的能力來處理數據,自動的過濾掉一些無用信息,并且自動識別行人并計數。同時在不同地區(qū)出現多次的行人并不會被重復統計,因此可以做到有效、準確的統計行人流量。
影響行人重識別精度的一個關鍵的因素就是行人的錯位,這種錯位帶來的行人身體各部件之間相互遮擋和姿態(tài)的不斷變化對于行人重識別研究是一個很大的挑戰(zhàn)。首先,行人在運動的過程中姿態(tài)是不斷發(fā)生改變的,行人不可避免的會變化各種姿態(tài),而這種姿態(tài)變化意味著身體的局部變化在邊界框中是不可預測的。例如,行人在運動過程種可能將手放在背后或者頭頂上,造成了錯位帶來的局部遮擋,這對提取的特征具有很大的影響。其次,當行人排列不規(guī)則時進行檢測對行人重識別研究的準確度會帶來影響。在行人重識別領域常用的一個方法是將邊界框劃分為水平條紋,然而這種方法只能建立在有輕微的垂直偏差下。當垂直偏差失準時,身體和頭部的檢測可能會與背景進行匹配,導致行人重識別任務的錯誤識別。因此水平條紋的方法在嚴重錯位時的情況并不理想。在行人不斷變化姿態(tài)的情況下,背景也在隨之不斷產生變化,導致背景可能會被卷積神經網絡錯誤的加權從而影響識別精度。因此如何解決行人姿態(tài)變化帶來的錯位和背景變化的影響是提高行人重識別精度的關鍵。
發(fā)明內容
本發(fā)明的目的是提供一種基于位姿嵌入的多尺度卷積特征融合行人重識別方法,解決了現有技術中存在的行人姿態(tài)變化帶來的錯位和背景變化導致行人重識別精度較低的問題。
本發(fā)明所采用的技術方案是,一種基于位姿嵌入的多尺度卷積特征融合行人重識別方法,包括以下步驟:
步驟1、采用隨機擦除的方式對原始行人圖像進行預處理得到行人圖像,并對Resnet-50網絡模型進行基線網絡優(yōu)化,將行人圖像輸入優(yōu)化后的Resnet-50網絡模型得到深度卷積特征;
步驟2、將原始行人圖像作為輸入圖像進行特征提取,得到顯著性人體圖像;
步驟3、先采用姿態(tài)卷積器對人體顯著性圖像進行姿態(tài)提取,得到身體部位圖像,再將身體部位圖像輸入ResNet-50網絡中提取局部語義特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安理工大學,未經西安理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110667913.9/2.html,轉載請聲明來源鉆瓜專利網。





