[發明專利]一種基于殘差聚合圖網絡的群體活動識別方法及系統有效
| 申請號: | 202210236706.2 | 申請日: | 2022-03-10 |
| 公開(公告)號: | CN114863356B | 公開(公告)日: | 2023-02-03 |
| 發明(設計)人: | 李威;吳曉;楊添朝;張基 | 申請(專利權)人: | 西南交通大學 |
| 主分類號: | G06V20/52 | 分類號: | G06V20/52;G06V10/44;G06V10/80;G06V10/764;G06V10/82;G06F18/25;G06F18/24;G06F18/2415;G06N3/0464;G06N3/047;G06N3/048;G06N3/084 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 黎飛 |
| 地址: | 611756 四川省*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聚合 網絡 群體 活動 識別 方法 系統 | ||
1.一種基于殘差聚合圖網絡的群體活動識別方法,其特征在于,包括以下步驟:
S1,外觀特征提取:利用給定的視頻片段的關鍵幀和相應每個個體的邊界框,得到待識別群體的個體級的外觀特征X,xi∈RD,其中,T表示視頻片段關鍵幀的幀數,N表示視頻片段中每個關鍵幀的個體數;i表示視頻片段關鍵幀中個體的編號,i=1,2,…,T×N;xi表示視頻片段中編號為i的個體的外觀特征,R表示實數域上的一個線性空間,D表示線性空間R的外觀特征維度;
S2,雙分支推理:將外觀特征進行基于殘差聚合的差異關系推理得到差異特征以及,將外觀特征分別進行基于圖神經網絡的相似關系推理得到關系特征X′;
S3,加權融合:將外觀特征、差異特征、關系特征在通道方向進行加權融合,得到加權特征
S4,群體活動預測:將加權特征進行池化操作,得到代表整個視頻片段的全局表示,然后進一步處理得到每一幀對于群體活動類別的置信度,用每一幀各類別置信度的平均值來對群體活動類別進行預測;
步驟S2中,將外觀特征進行基于殘差聚合的差異關系推理得到差異特征的公式為:
其中,j表示視頻片段中個體的編號,j=1,2,…,T×N;表示第j個個體的差異特征,是差異特征的一個元素,ri(xj)表示個體j和個體i之間的殘差關系,表示個體j和個體i之間的空間位置相關性,xj-xi表示不同時空中的個體j和個體i之間的外觀特征差異;
步驟S3包括以下步驟,
S31,將外觀特征、差異特征、關系特征的元素相加得到整合后的特征,計算方式為:
其中,F表示整合后的特征,F∈RT×N×D,b為分支編號;Nb表示分支數目,以上公式中Nb為3,Xl表示外觀特征、差異特征或關系特征,分別表示不同語義特征X、和X′;
S32,在通道方向使用全局平均池化和全連接層來嵌入全局信息,以生成通道統計信息,計算方式為:
其中,s表示通道統計信息,Ws表示可學習的用于將池化后的特征進行線性變換的參數,F(n,t,:)表示F中第t幀第n個個體在通道方向上的特征;
S33,通過全連接層和softmax操作得到通道方向上不同分支特征的權重,計算方式為:
Wb=softmax(wbS);
其中,Wb為分支為b的特征的權重向量,wb為對于分支b的將通道統計信息S映射為權重向量的可學的線性變換參數,
S34,計算對于加權融合的后的特征的通道方向上每一維特征,計算方式為:
其中,表示加權特征的第c個通道的值,表示第b分支的第c個通道維度上的特征的權重,為Wb第c個元素的值;表示第b分支的第c的通道維度上的特征的值,為Xb第c個元素的值。
2.根據權利要求1所述的一種基于殘差聚合圖網絡的群體活動識別方法,其特征在于,ri(xj)的計算公式為:
其中,wj表示將以個體j為中心的兩個體之間的外觀差異映射為標量的權重、bj表示將以個體j為中心的兩個體之間的外觀差異映射的標量進行偏移的偏置值,wj∈RD,bj∈R1。
3.根據權利要求2所述的一種基于殘差聚合圖網絡的群體活動識別方法,其特征在于,的計算公式為:
其中,Π(·)表示指示函數,表示個體j與個體i之間的歐式距離,μ表示空間限制因子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南交通大學,未經西南交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210236706.2/1.html,轉載請聲明來源鉆瓜專利網。





