[發(fā)明專利]基于排序池化融合空間特征的視頻動作識別方法有效
| 申請?zhí)枺?/td> | 201810177015.3 | 申請日: | 2018-03-04 |
| 公開(公告)號: | CN108416795B | 公開(公告)日: | 2022-03-18 |
| 發(fā)明(設計)人: | 項欣光;趙恒穎 | 申請(專利權(quán))人: | 南京理工大學 |
| 主分類號: | G06T7/215 | 分類號: | G06T7/215;G06T7/246;G06T7/269 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 朱寶慶 |
| 地址: | 210094 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 排序 融合 空間 特征 視頻 動作 識別 方法 | ||
本發(fā)明提供了一種基于排序池化融合空間特征的視頻動作識別方法,包括:采用視頻局部特征描述子算法對每個視頻提取基本視覺特征向量集;對每個視頻每幀圖像的二維空間進行多尺度分割,構(gòu)建二維空間金字塔模型;對金字塔模型中每個子空間內(nèi)的視頻基本特征向量集按照幀序列時間順序排列;對每個子空間內(nèi)的有序基本特征向量序列單獨進行smooth操作;對每個子空間內(nèi)經(jīng)smooth操作后的有序特征向量序列單獨運用排序池化算法,學習得到屬于該子空間的模型參數(shù);將金字塔模型中所有子空間得到的模型參數(shù)進行串聯(lián),得到的特征向量作為視頻最終特征向量;通過使用分類器對該視頻特征向量進行分類,識別出該視頻的動作類別。
技術領域
本發(fā)明涉及一種視頻識別技術,特別是一種基于排序池化融合空間特征的視頻動作識別方法。
背景技術
當今視頻動作識別技術已經(jīng)廣泛應用于多媒體內(nèi)容分析、人機交互、智能實時監(jiān)控等領域中,該技術可以通過對視頻進行特征提取生成特征向量,用分類器對特征向量進行分類的方法來實現(xiàn)。傳統(tǒng)的視頻動作識別方法中通常將視頻三維時空域作為一個整體來捕捉視頻動態(tài)變化特征,這種做法存在片面性,會導致丟失大量屬于二維圖像空間域或一維時序域特有的變化特性,因此,視頻動作識別技術需要對視頻時間、空間結(jié)構(gòu)分開處理以便更加全面地捕捉視頻動態(tài)變化中的時空特征信息,本文提出了一種基于排序池化融合空間特征的視頻動作識別方法。
發(fā)明內(nèi)容
本發(fā)明提供一種基于排序池化融合空間特征的視頻動作識別方法,該方法通過使用分類器對時空特征提取方法所得到的視頻特征向量進行分類的視頻動作識別。
實現(xiàn)本發(fā)明目的的技術方案為:一種基于排序池化融合空間特征的視頻動作識別方法,其特征在于,包括以下步驟:
步驟1,采用視頻局部特征描述子算法對每個視頻提取基本視覺特征向量集;
步驟2,對每個視頻每幀圖像的二維空間進行多尺度分割,構(gòu)建二維空間金字塔模型;
步驟3,對金字塔模型中每個子空間內(nèi)的視頻基本特征向量集按照幀序列時間順序排列;
步驟4,對每個子空間內(nèi)的有序基本特征向量序列單獨進行smooth操作;
步驟5,對每個子空間內(nèi)經(jīng)smooth操作后的有序特征向量序列單獨運用排序池化算法,學習得到屬于該子空間的模型參數(shù);
步驟6,將金字塔模型中所有子空間得到的模型參數(shù)進行串聯(lián),得到的特征向量作為視頻最終特征向量;
步驟7,通過使用分類器對該視頻特征向量進行分類,識別出該視頻的動作類別。
本發(fā)明將二維圖像空間特征融入排序池化算法中,既繼承了排序池化算法可以捕捉豐富的視頻時序變化特征的優(yōu)點,又彌補了其缺乏二維圖像空間結(jié)構(gòu)特征的缺點,不僅能夠捕捉視頻整體運動信息,還能更詳細地捕捉到視頻一維時序域、二維圖像空間域的各自維度特有特征信息,補充視頻特征描述子更豐富的動作動態(tài)變化信息,使得視頻最終的特征向量包含更多屬于該視頻自身的動態(tài)變化特征,擁有更高的描述性能,進而提高視頻動作的識別精確度。
下面結(jié)合說明書附圖對本發(fā)明做進一步描述。
附圖說明
圖1是視頻幀序列每幀圖像二維空間多尺度分割示意圖。
圖2是本發(fā)明基于排序池化融合空間特征的視頻動作識別方法流程圖。
具體實施方式
結(jié)合圖2,一種基于排序池化融合空間特征的視頻動作識別方法,包括以下步驟:
步驟1,采用視頻局部特征描述子算法對每個視頻提取基本視覺特征向量集;
步驟2,對每個視頻每幀圖像的二維空間進行多尺度分割,構(gòu)建二維空間金字塔模型;
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京理工大學,未經(jīng)南京理工大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810177015.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





