[發明專利]一種基于可微圖學習的行人重識別模型的弱監督訓練方法在審
| 申請號: | 202011303629.5 | 申請日: | 2020-11-19 |
| 公開(公告)號: | CN112395997A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 張吉祺;林倞;聶琳;王廣潤;王廣聰 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 510260 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 可微圖 學習 行人 識別 模型 監督 訓練 方法 | ||
1.一種基于可微圖學習的行人重識別模型的弱監督訓練方法,其特征在于,包括以下步驟:
S1:將行人圖片按拍攝時間段分組成袋并分配袋類別標簽;
S2:捕獲每一個袋中所有圖片之間的依賴關系,來為該類別的袋中每張圖片生成可靠的偽行人類別標簽,作為行人重識別模型訓練的監督信息;
S3:進行行人重識別模型和圖模型的一體訓練;
S4:將圖模型損失和重識別損失的線性組合作為總損失函數,利用反向傳播算法更新網絡所有層的參數。
2.根據權利要求1所述的基于可微圖學習的行人重識別模型的弱監督訓練方法,其特征在于,所述步驟S1的具體過程是:
用b表示包含p張圖片的一個袋,即b=x1,x2,…,xj,…,xp,y=y1,y2,…,yj,…,yp為行人類別標簽,用l表示袋類別標簽。
3.根據權利要求2所述的權利要求1所述的基于可微圖學習的行人重識別模型的弱監督訓練方法,其特征在于,所述步驟S2的過程是:
若弱監督行人重識別只有袋類別標簽l可用,需要先為每張圖片估計一個偽行人類別標簽,用一個概率向量Y表示;假設l類別標簽下的袋中包含n個行人類別,整個訓練集共有m個行人類別,用袋類別標簽限制Y,則每張圖片xj的行人類別標簽的概率向量為:
4.根據權利要求3所述的基于可微圖學習的行人重識別模型的弱監督訓練方法,其特征在于,所述步驟S3的過程是:
定義一個有向圖,每個節點代表一個袋中的一張圖片xi,每條邊代表圖片之間的關系,在圖上為節點x分配行人類別標簽y的能量函數為:
其中U和V分別表示節點和邊,Φ(yi|xi)是計算為圖片xi分配標簽yi的代價的一元項,Ψ(yi,yj|xi;xj)是計算為圖片對(xi,xj)分配標簽的懲罰的成對項,公式(2)消除了弱監督學習生成的錯誤的偽標簽;
公式(2)中的一元項定義為:
其中Pi是神經網絡為圖片xi計算的行人類別標簽的概率,Yi是公式(1)表示的袋限制,⊙表示逐元素乘積,[·]表示向量索引;
由于不同圖片的一元項輸出相互獨立,一元項不穩定,需要用成對項平滑:
其中用一個基于RGB顏色的高斯核計算外表相似度,超參數σ控制高斯核的尺寸,限制外表相似的圖片有相同的標簽;標簽兼容度ζ(yi,yj)用玻茨模型表示:
5.根據權利要求4所述的基于可微圖學習的行人重識別模型的弱監督訓練方法,其特征在于,袋類別標簽含有額外信息改善偽標簽的生成:將估計的偽標簽糾正為袋中預測分數最高的行人分類;促使部分圖片被分配到沒有被預測的行人類別。
6.根據權利要求5所述的基于可微圖學習的行人重識別模型的弱監督訓練方法,通過最小化公式(2)可以得到每張圖片的偽行人類別標簽:
其中{1,2,3,…,m}表示訓練集中所有的行人類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011303629.5/1.html,轉載請聲明來源鉆瓜專利網。





