[發明專利]基于歸一化類谷歌量度矩陣的人體運動識別方法在審
| 申請號: | 201310385267.2 | 申請日: | 2013-08-29 |
| 公開(公告)號: | CN103413154A | 公開(公告)日: | 2013-11-27 |
| 發明(設計)人: | 劉宏;孫倩茹 | 申請(專利權)人: | 北京大學深圳研究生院 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙) 11200 | 代理人: | 余長江 |
| 地址: | 518055 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 歸一化 類谷歌 量度 矩陣 人體 運動 識別 方法 | ||
技術領域
本發明涉及一種魯棒的視頻運動信息挖掘技術,特別是一種用來應對復雜視頻拍攝環境的魯棒的視頻運動信息挖掘技術。具體涉及到一種挖掘局部運動特征子塊間“共生”關系的中層運動描述方法,屬于與運動執行者無關的視頻人體運動識別技術領域。
背景技術
視頻中的人體運動分析是計算機視覺研究領域的重要課題,同時也是近年來備受關注的前沿研究方向之一。它在智能監控、人機交互、虛擬現實、基于內容的視頻檢索與編碼等領域具有重要的理論研究意義和應用前景。其主要內容就是通過對視頻數據中包含的人體運動信息進行特征提取和模式識別來理解所包含的運動類別和意圖,它涵蓋圖像處理、計算機視覺、模式識別與人工智能等多個學科。視頻人體運動分析的基礎是對視頻中的人體運動信息進行合理有效的描述。目前較為前沿和主流的方法主要是基于局部運動特征的詞袋方法,其優點在于其利用的時候大量局部特征的統計特性,高效并且在一定情況下的抗干擾能力強;缺點是大部分詞袋方法忽略了視頻中原有的局部特征間的位置相關信息,使得其對復雜運動的區分度和識別精度出現了較強的局限性。
其次,在低噪聲環境下獲取的視頻中進行運動檢測和識別已經可以達到較高的識別效率,但是針對實際環境中的視頻,人體運動描述和識別仍然面臨很多難題,如人體遮擋、視頻模糊、拍攝視角變化等,所需要解決的問題就變得更加復雜。這就更加要求特征提取和建立的方法本身具有強大的運動信息表征能力。
發明內容
本發明的目的是通過分析、提取局部運動特征之間的“共生”關系,計算將歸一化類谷歌量度矩陣(可參考Qianru?Sun,Hong?Liu.Action?Disambiguation?Analysis?Using?Normalized?Google-Like?Distance?Correlogram.In?Proc.of?Asian?Computer?Vision?Conference2012,Part?III,LNCS7726,pages425-437,2013.)在時間軸上進行拓展,在原有的特征分布關系的基礎上進行描述向量的擴充,從而增強描述子在復雜視頻環境下的運動表征能力和類間區分度。最終使用得到的描述特征向量訓練人體運動分類器,獲得較為魯棒的視頻中的運動識別效果。在與傳統的詞袋方法得到的統計直方圖結合的過程中,采用雙通道非線性支持向量機分類器。
本發明的技術內容:基于歸一化類谷歌量度矩陣的人體運動識別方法,其步驟包括:
1)提取人體運動視頻中的興趣點,基于3D時空坐標對每個興趣點的周圍局部區域進行局部描述,得到所述興趣點子塊的3D-SIFT局部運動特征值;
2)根據所述3D-SIFT局部運動特征值對所述子塊進行特征聚類得到不同類特征;
3)根據所述不同類特征進行空間歸一化類谷歌量度和時間歸一化類谷歌量度計算,并配組得到歸一化類谷歌量度關系矩陣;
4)將所述歸一化類谷歌量度關系矩陣和詞袋法局部特征統計直方圖訓練得到分類器,對人體運動進行識別。
更進一步,通過時空濾波器組得到視頻中的興趣點。
更進一步,所述3D時空坐標表示興趣點的空間橫縱坐標和時間點,3D-SIFT局部運動特征值按照如下方法獲得:
1)在任意一個檢測到的興趣點p(x,y,t)周圍取2*2*2的像素模塊,對其梯度極坐標進行計算:
θ(x,y,t)=tan-1(Ly/Lx)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學深圳研究生院,未經北京大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310385267.2/2.html,轉載請聲明來源鉆瓜專利網。





