[發明專利]一種動作識別方法有效
| 申請號: | 201910362475.8 | 申請日: | 2019-04-30 | 
| 公開(公告)號: | CN110084211B | 公開(公告)日: | 2020-12-18 | 
| 發明(設計)人: | 楊劍宇;黃瑤;朱晨 | 申請(專利權)人: | 蘇州大學 | 
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 | 
| 代理公司: | 北京金宏來專利代理事務所(特殊普通合伙) 11641 | 代理人: | 杜正國;陸華 | 
| 地址: | 215131 *** | 國省代碼: | 江蘇;32 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 一種 動作 識別 方法 | ||
本發明提出一種動作識別方法,包括獲取目標的三維骨骼關節點信息;設計跨層連接神經網絡對訓練集中動作序列的每幀骨骼關節點三維坐標提取特征,得到該幀的特征向量;將訓練集中所有特征向量聚類成K個簇;計算每個簇對各個動作類別的支持度;定義姿態子組,從訓練集中抽取姿態子組,組成姿態子組集合;學習得到Z個層級分類器;用跨層連接神經網絡獲取測試動作序列每幀的特征向量并將其劃分給與其距離最近的簇;分別計算Z個層級分類器對測試樣本的分類結果;選取Z個層級分類器分類結果中出現次數最多的類別作為測試動作序列的類別。本發明減小了動作的類內差異對動作識別效果的影響,不受動作發生速率影響,能夠處理任意時間長度的動作序列。
技術領域
本發明涉及一種動作識別方法,屬于人體動作識別技術領域。
背景技術
人體動作識別是計算機視覺領域的一個研究熱點,廣泛應用于人機交互、視頻監控、虛擬現實等領域。隨著深度相機的發展,人們可以便捷地獲取人體骨骼關節點的三維位置,其中包含了大量的運動信息。因此,基于骨骼關節點的動作識別已經引起越來越多研究者的關注。利用骨骼關節點數據進行動作識別研究,不易受照明變化、攝像機視角變化等因素的影響。但是由于動作的類內差異、骨骼關節點的遮擋等其他因素的影響,對人體動作的準確識別仍然是一項非常具有挑戰性的任務。
大多數現有的研究工作使用隱馬爾可夫模型、條件隨機場或者時間金字塔來構建骨骼關節點序列的時間動態模型,這些研究工作提取了人體骨骼關節點空間結構的各種特征,例如成對骨骼關節點相對位置、骨骼關節點角度、骨骼關節點運動幅度。這些提取的特征的有效性依賴于原始骨骼關節點坐標以及整個動作序列的信息的準確性,容易受到個別不準確數據的影響,且在時間尺度變化較大、骨骼關節點空間結構較為復雜的情況下,利用這些特征難以有效識別動作。有必要設計一種算法,減少對原始關節點坐標準確性的依賴,并且基于動作序列中的關鍵幀進行動作識別。
發明內容
本發明是為解決現有技術中的問題而提出的,技術方案如下,
一種動作識別方法,包括如下步驟:
步驟一、利用深度傳感器獲取目標的三維骨骼關節點信息,得到人體各個骨骼關節點的三維坐標,將得到的動作序列分為訓練集和測試集;
步驟二、設計跨層連接神經網絡模型,對訓練集中的動作序列的每一幀骨骼關節點的三維坐標提取特征,得到該幀的特征向量;
步驟三、將訓練集中的所有幀的特征向量聚類成K個簇;
步驟四、計算每個簇的權重和每個簇對各個動作類別的支持度;
步驟五、定義“姿態子組”,并從訓練集中抽取姿態子組,組成姿態子組集合;
步驟六、定義姿態子組對應第c類動作的分類器,c∈[1,C],C表示訓練集中的動作類別總數;
步驟七、學習得到Z個層級分類器;
步驟八、使用跨層連接神經網絡模型獲取測試動作序列每一幀的特征向量并將其劃分給與其距離最近的簇;
步驟九、分別計算Z個層級分類器對測試動作序列的分類結果;
步驟十、選取Z個層級分類器分類結果中出現次數最多的類別作為測試動作序列的類別。
優選的,所述步驟二中的跨層連接神經網絡模型包括第一隱層、第二隱層、第三隱層和第四隱層,所述第一隱層的輸出通過relu激活模塊進入第二隱層,第二隱層的輸出通過tanh激活模塊進入第三隱層,所述第三隱層的輸出通過relu激活模塊進入第四隱層,所述第四隱層的輸出與第一隱層的輸出相似計算模塊的輸出q相加后輸入tanh激活模塊,進行非線性映射,跨層連接神經網絡模型的輸出層輸出該幀的特征向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910362475.8/2.html,轉載請聲明來源鉆瓜專利網。





