[發明專利]基于深度序分布回歸的步態年齡估計方法有效
| 申請號: | 201811255447.8 | 申請日: | 2018-10-26 |
| 公開(公告)號: | CN109543546B | 公開(公告)日: | 2022-12-20 |
| 發明(設計)人: | 朱海平;張軍平 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/764 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;陸尤 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 分布 回歸 步態 年齡 估計 方法 | ||
1.一種基于深度序分布回歸的步態年齡估計方法,其特征在于,具體步驟為:
(1)步態視頻序列預處理
先做行人檢測與對齊,接著做目標與背景的分割,然后將預處理好的視頻序列拍成步態能量圖,該步態能量圖記為GEI;并將GEI分割成不重疊的頭部、上身部、下半身部三個部分;
(2)序回歸方法的數據劃分
對于有序的K分類問題,將K分類問題轉換成一系列二分類問題,也就是訓練K-1個二分類器;
(3)用全局與局部卷積神經網絡提取特征
用一個全局網絡和三個子網絡分別提取全局步態特征和三個局部步態特征,三個局部步態特征即為頭部、上身部、下半身部的步態特征;
(4)利用序分布損失函數訓練網絡模型
損失函數的設計,既考慮交叉熵損失,也考慮分布損失:
(a)交叉熵損失函數為:
其中,N是樣本數量,K是類別數量,表示第i個樣本的第k個二分類的真實值,是對應的預測值;
(b)EMD分布損失函數為:
其中,CDF是累積分布函數;
(c)總的損失函數為:
表示總的損失函數,表示交叉熵損失函數,表示分布損失函數,λ是超參數,用于平衡分布損失的影響;
步驟(2)中,對第k個二分類器,將訓練集D重新劃分成兩個子集:樣本年齡標簽大于或等于rk的為正樣本,小于rk的為負樣本,即
這里rk是第k個分類器的等級劃分參數,總共有K-1個等級劃分;在K-1個二分類器訓練完,給定測試樣本xi,對應的預測年齡計算如下:
其中,fk(xi)是第k個二分類的輸出結果,范圍在(0,1),[.]表示真假運算,里面條件成立則為1,否則為0。
2.根據權利要求1所述的基于深度序分布回歸的步態年齡估計方法,其特征在于,步驟(1)中,在輸入網絡之前,將GEI圖像調整成128×88統一尺寸大小;分割的不重疊的頭部、上身部、下半身部圖像的大小分別為(22×88)、(48×88)、(58×88)。
3.根據權利要求1所述的基于深度序分布回歸的步態年齡估計方法,其特征在于,步驟(3)中,全局與局部卷積神經網絡提取特征的流程為:
像素大小為128×88×1的GEI圖片作為全局網絡的輸入;將GEI切割成像素大小分別為(22×88)、(48×88)、(58×88)的頭部、上身部和下半身部,作為三個子網絡的輸入;
其中,全局特征網絡為兩層,卷積核大小分別為(7,7),(7,7);三個子網絡有兩層,且三個子網絡卷積核大小相同,分別為(7,7),(5,7);三個子網絡經過兩層卷積后,在高維度上將三個特征圖拼接,然后再與全局網絡輸出的特征圖在通道維度上拼接;后面在接一層卷基層和三個全連接層,最后輸出K-1維二分類結果;其中,最后一層卷基層的卷積核大小為(5,5),前兩個全連接層的維度是1024,最后一層全連接層輸出為K-1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811255447.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:快速人臉檢測方法及裝置
- 下一篇:人臉圖像識別方法、裝置、設備及存儲介質





