[發明專利]一種基于深度余弦度量學習的行人重識別方法在審
| 申請號: | 201811621891.7 | 申請日: | 2018-12-28 |
| 公開(公告)號: | CN109829377A | 公開(公告)日: | 2019-05-31 |
| 發明(設計)人: | 王敏;單純;蔡鑫鑫 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 唐紅 |
| 地址: | 210000 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 余弦度量 度量 分類 余弦相似度 動態分類 相似度量 學習目標 直接編碼 參量化 參數化 分類器 卷積 余弦 學習 剝離 鄰近 測試 查詢 重復 網絡 | ||
1.一種基于深度余弦度量學習的行人重識別方法,其特征在于:先調整輸入圖像的尺寸,將圖像呈現到RGB空間的網絡中,然后通過一系列的卷積層調整feature map的尺寸,接著提取總體特征向量進行歸一化以后,將特征投射到應用cosine softmax分類器的單位球面上,最后分類器通過最大可能性來選擇類;
包括以下步驟:
步驟1:將輸入圖像調整到對應尺寸并呈現到RGB網絡中,且RGB網絡包含若干遵循預激活排列的殘差塊;
步驟2:通過對應卷積層將feature map的尺寸減小到對應大?。?/p>
步驟3:將上述結果放入dense層中,并提取總體特征向量;
步驟4:使用l2normalization對特征向量進行歸一化;
步驟5:將歸一化后的特征投射到應用cosine softmax分類器的單位球面上;
步驟6:分類器通過最大可能性來選擇類。
2.根據權利要求1所述的基于深度余弦度量學習的行人重識別方法,其特征在于:所述步驟2的具體內容為:首先將調整后圖像依次放入兩個卷積核和步長相同的卷積層,得到輸出結果;然后將輸出結果放入池化層,采用最大值池化的方式得到輸出結果,把池化后的輸出結果放入6個按照預激活排列的殘差塊中,每個殘差塊均包含2個卷積層,并且最大池化被步幅為2的卷積層替代,得到對應的輸出結果。
3.根據權利要求1所述的基于深度余弦度量學習的行人重識別方法,其特征在于:所述步驟3和步驟4中通過兩個卷積層以及6個殘差網絡塊提取特征向量后,將提取到的特征向量傳入dense層中提取總體特征向量;要實現總體特征向量x(x1,x2,....,xn)歸一化到單位l2范數,建立一個從x到x′的映射,使得x′的l2范數為1,從而得到其中
4.根據權利要求1所述的基于深度余弦度量學習的行人重識別方法,其特征在于:所述步驟5的具體內容為:
步驟501:將權值歸一化為單位長度;
步驟502:cosine softmax分類器表示為
其中yi表示類標號;r=f(x),r∈Rd參數網絡編碼器的潛在特征表示;κ為自由比例縮放參數;表示第k個類的權值向量,通過權向量的長度與其方向耦合的方法來加速隨機梯度下降的收斂性;且對數概率與訓練樣本和參數化類平均方向的余弦相似度成正比。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811621891.7/1.html,轉載請聲明來源鉆瓜專利網。





