[發(fā)明專利]一種基于卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)中心模型的行人重識別方法在審
| 申請?zhí)枺?/td> | 201711212317.1 | 申請日: | 2017-11-28 |
| 公開(公告)號: | CN107944399A | 公開(公告)日: | 2018-04-20 |
| 發(fā)明(設(shè)計)人: | 楊釗;劉國明 | 申請(專利權(quán))人: | 廣州大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 廣州市華學(xué)知識產(chǎn)權(quán)代理有限公司44245 | 代理人: | 裘暉,林梅繁 |
| 地址: | 510006 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 卷積 神經(jīng)網(wǎng)絡(luò) 目標(biāo) 中心 模型 行人 識別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種行人重識別方法,尤其是一種基于卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)中心模型的行人重識別方法。
背景技術(shù)
行人重識別是指給定一個待查詢的目標(biāo)行人圖像,需要在另外一個監(jiān)控中查找出該行人的相關(guān)圖像。由于監(jiān)控攝像頭的低分辨率和不確定的視角導(dǎo)致了技術(shù)相對成熟的人臉識別技術(shù)無法應(yīng)用于行人重識別中。另外,同一行人在不同的攝像頭下存在姿態(tài)、視角和光照的差異。即使在同一規(guī)格的攝像機(jī)下,人的外觀也可能隨光照、姿態(tài)、遮擋等因素而產(chǎn)生變化。所有這些問題使得行人重識別的研究工作變得具有挑戰(zhàn)性。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)所存在的問題,本發(fā)明提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)中心模型的行人重識別方法,本方法有效降低圖像背景、噪聲等無關(guān)變量對相似性判別的影響,從而提高行人重識別準(zhǔn)確率。
本發(fā)明采用如下技術(shù)方案來實(shí)現(xiàn):一種基于卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)中心模型的行人重識別方法,包括以下步驟:
S1、從不同攝像頭的視頻流中獲取行人圖像,所述行人圖像包括目標(biāo)行人圖像和參考行人圖像;
S2、利用反向傳播算法訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò);
S3、利用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)分割行人圖像的前景區(qū)域和背景區(qū)域,從而得到目標(biāo)中心;
S4、提取行人圖像特征;
S5、建立相似性度量函數(shù),判別不同攝像頭的行人圖像是否屬于同一個人。
優(yōu)選地,所述步驟S2的訓(xùn)練過程為:首先,隨機(jī)初始化卷積神經(jīng)網(wǎng)絡(luò)的卷積核和偏置;將目標(biāo)行人圖像和參考行人圖像分成M×N塊,把每一塊區(qū)域輸入所述卷積神經(jīng)網(wǎng)絡(luò),進(jìn)行前向傳播,輸出結(jié)果;通過輸出結(jié)果與實(shí)際值之間的誤差建立代價函數(shù),并利用反向傳播算法求代價函數(shù)關(guān)于卷積核和偏置的梯度;利用梯度下降法更新卷積核和偏置的值;通過迭代上述過程,求取使代價函數(shù)最小化時所對應(yīng)的卷積核和偏置。
優(yōu)選地,所述步驟S3的分割過程為:首先歸一化目標(biāo)行人圖像和參考行人圖像,然后將目標(biāo)行人圖像和參考行人圖像分塊,得到行人圖像的塊區(qū)域,對塊區(qū)域進(jìn)行加零值填充,填充后的塊區(qū)域每個像素點(diǎn)作為一個神經(jīng)元;把每一塊區(qū)域輸入所述卷積神經(jīng)網(wǎng)絡(luò),進(jìn)行前向傳播從而獲得該塊區(qū)域的類別;將目標(biāo)行人圖像中類別為前景區(qū)域的塊區(qū)域連接起來,得到目標(biāo)行人圖像的前景區(qū)域;將目標(biāo)行人圖像中類別為背景區(qū)域的塊區(qū)域連接起來,得到目標(biāo)行人圖像的背景區(qū)域;將參考行人圖像中類別為前景區(qū)域的塊區(qū)域連接起來,得到參考行人圖像的前景區(qū)域;將參考行人圖像中類別為背景區(qū)域的塊區(qū)域連接起來,得到參考行人圖像的背景區(qū)域。
優(yōu)選地,所述卷積神經(jīng)網(wǎng)絡(luò)包括:輸入層、多個卷積層、多個池化層、全連接層及輸出層;其中:
所述輸入層指行人圖像的塊區(qū)域;對所述的塊區(qū)域進(jìn)行加零值填充,使得卷積層的特征映射圖大小和輸入特征圖像大小一致;填充后的塊區(qū)域每個像素點(diǎn)作為一個神經(jīng)元;
所述卷積層由多個特征映射圖組成,每個特征映射圖由多個獨(dú)立的神經(jīng)元組成;所述卷積層的運(yùn)算包括:利用多個卷積核在塊區(qū)域的局部區(qū)域滑動,計算塊區(qū)域的局部區(qū)域和卷積核對應(yīng)位置神經(jīng)元的乘積,把相乘的結(jié)果相加得到卷積特征圖;卷積特征圖加上偏置,通過激活函數(shù)輸出,得到卷積層的特征映射圖;
所述池化層由多個特征映射圖組成,每個特征映射圖由多個獨(dú)立的神經(jīng)元組成;池化運(yùn)算包括:利用濾波器在卷積層的特征映射圖滑動,尋找每個區(qū)域的最大值作為池化層的特征映射圖神經(jīng)元的值;
所述全連接層利用一維向量連接上一層輸出的特征映射圖;所述一維向量的每個元素代表一個神經(jīng)元,該一維向量每個神經(jīng)元都與上一層輸出的特征映射圖的每個神經(jīng)元連接;
所述輸出層將最后一層池化層的特征映射圖進(jìn)行向量化,利用sigmoid函數(shù)對全連接層的一維向量進(jìn)行分類,分別對應(yīng)前景區(qū)域和背景區(qū)域;將行人圖像中類別為前景區(qū)域的塊區(qū)域連接起來,得到行人圖像的前景區(qū)域;將行人圖像中類別為背景區(qū)域的塊區(qū)域連接起來,得到行人圖像的背景區(qū)域。
優(yōu)選地,所述步驟S4的過程為:
S41、將目標(biāo)行人圖像的背景區(qū)域進(jìn)行白色填充,收集進(jìn)行填充后的目標(biāo)行人圖像,得到目標(biāo)行人圖像集合A;
S42、將參考行人圖像的背景區(qū)域進(jìn)行白色填充,收集進(jìn)行填充后的參考行人圖像,得到參考行人圖像集合B;
S43、利用顏色特征描述子和紋理特征描述子分別對集合A、B中的每張行人圖像進(jìn)行處理;統(tǒng)計處理后的特征向量,得到對應(yīng)的特征直方圖;
S44、通過融合多種特征,并進(jìn)行降維處理得到行人圖像的一維特征向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州大學(xué),未經(jīng)廣州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711212317.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





