[發明專利]一種基于卷積神經網絡目標中心模型的行人重識別方法在審
| 申請號: | 201711212317.1 | 申請日: | 2017-11-28 |
| 公開(公告)號: | CN107944399A | 公開(公告)日: | 2018-04-20 |
| 發明(設計)人: | 楊釗;劉國明 | 申請(專利權)人: | 廣州大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 廣州市華學知識產權代理有限公司44245 | 代理人: | 裘暉,林梅繁 |
| 地址: | 510006 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 目標 中心 模型 行人 識別 方法 | ||
1.一種基于卷積神經網絡目標中心模型的行人重識別方法,其特征在于,包括以下步驟:
S1、從不同攝像頭的視頻流中獲取行人圖像,所述行人圖像包括目標行人圖像和參考行人圖像;
S2、利用反向傳播算法訓練卷積神經網絡;
S3、利用訓練好的卷積神經網絡分割行人圖像的前景區域和背景區域,從而得到目標中心;
S4、提取行人圖像特征;
S5、建立相似性度量函數,判別不同攝像頭的行人圖像是否屬于同一個人。
2.根據權利要求1所述的基于卷積神經網絡目標中心模型的行人重識別方法,其特征在于,所述步驟S2的訓練過程為:首先,隨機初始化卷積神經網絡的卷積核和偏置;將目標行人圖像和參考行人圖像分成M×N塊,把每一塊區域輸入所述卷積神經網絡,進行前向傳播,輸出結果;通過輸出結果與實際值之間的誤差建立代價函數,并利用反向傳播算法求代價函數關于卷積核和偏置的梯度;利用梯度下降法更新卷積核和偏置的值;通過迭代上述過程,求取使代價函數最小化時所對應的卷積核和偏置。
3.根據權利要求1所述的基于卷積神經網絡目標中心模型的行人重識別方法,其特征在于,所述步驟S3的分割過程為:首先歸一化目標行人圖像和參考行人圖像,然后將目標行人圖像和參考行人圖像分塊,得到行人圖像的塊區域,對塊區域進行加零值填充,填充后的塊區域每個像素點作為一個神經元;把每一塊區域輸入所述卷積神經網絡,進行前向傳播從而獲得該塊區域的類別;將目標行人圖像中類別為前景區域的塊區域連接起來,得到目標行人圖像的前景區域;將目標行人圖像中類別為背景區域的塊區域連接起來,得到目標行人圖像的背景區域;將參考行人圖像中類別為前景區域的塊區域連接起來,得到參考行人圖像的前景區域;將參考行人圖像中類別為背景區域的塊區域連接起來,得到參考行人圖像的背景區域。
4.根據權利要求3所述的基于卷積神經網絡目標中心模型的行人重識別方法,其特征在于,所述卷積神經網絡包括:輸入層、多個卷積層、多個池化層、全連接層及輸出層;其中:
所述輸入層指行人圖像的塊區域;對所述的塊區域進行加零值填充,使得卷積層的特征映射圖大小和輸入特征圖像大小一致;填充后的塊區域每個像素點作為一個神經元;
所述卷積層由多個特征映射圖組成,每個特征映射圖由多個獨立的神經元組成;所述卷積層的運算包括:利用多個卷積核在塊區域的局部區域滑動,計算塊區域的局部區域和卷積核對應位置神經元的乘積,把相乘的結果相加得到卷積特征圖;卷積特征圖加上偏置,通過激活函數輸出,得到卷積層的特征映射圖;
所述池化層由多個特征映射圖組成,每個特征映射圖由多個獨立的神經元組成;池化運算包括:利用濾波器在卷積層的特征映射圖滑動,尋找每個區域的最大值作為池化層的特征映射圖神經元的值;
所述全連接層利用一維向量連接上一層輸出的特征映射圖;所述一維向量的每個元素代表一個神經元,該一維向量每個神經元都與上一層輸出的特征映射圖的每個神經元連接;
所述輸出層將最后一層池化層的特征映射圖進行向量化,利用sigmoid函數對全連接層的一維向量進行分類,分別對應前景區域和背景區域;將行人圖像中類別為前景區域的塊區域連接起來,得到行人圖像的前景區域;將行人圖像中類別為背景區域的塊區域連接起來,得到行人圖像的背景區域。
5.根據權利要求1所述的基于卷積神經網絡目標中心模型的行人重識別方法,其特征在于,所述步驟S4的過程為:
S41、將目標行人圖像的背景區域進行白色填充,收集進行填充后的目標行人圖像,得到目標行人圖像集合A;
S42、將參考行人圖像的背景區域進行白色填充,收集進行填充后的參考行人圖像,得到參考行人圖像集合B;
S43、利用顏色特征描述子和紋理特征描述子分別對集合A、B中的每張行人圖像進行處理;統計處理后的特征向量,得到對應的特征直方圖;
S44、通過融合多種特征,并進行降維處理得到行人圖像的一維特征向量。
6.根據權利要求1所述的基于卷積神經網絡目標中心模型的行人重識別方法,其特征在于,步驟S5所述相似性度量函數,指充分利用已標記的先驗信息來學習距離模型,使得相似圖像之間的距離小于不相似圖像之間的距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州大學,未經廣州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711212317.1/1.html,轉載請聲明來源鉆瓜專利網。





