[發(fā)明專利]一種基于注意力感知和樹形骨架點結(jié)構(gòu)的人體行為識別方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201811366233.8 | 申請日: | 2018-11-16 |
| 公開(公告)號: | CN109614874B | 公開(公告)日: | 2023-06-30 |
| 發(fā)明(設(shè)計)人: | 丁潤偉;劉暢 | 申請(專利權(quán))人: | 深圳市感動智能科技有限公司;北京大學深圳研究生院 |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06V10/774 |
| 代理公司: | 北京君尚知識產(chǎn)權(quán)代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 518000 廣東省深圳市南山區(qū)*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 注意力 感知 樹形 骨架 結(jié)構(gòu) 人體 行為 識別 方法 系統(tǒng) | ||
本發(fā)明公開一種基于注意力感知和樹形骨架點結(jié)構(gòu)的人體行為識別方法和系統(tǒng)。該方法包括:1)輸入訓練集中所有行為樣本的骨架點信息;2)通過添零補幀使各樣本幀數(shù)一致;3)使用三向樹狀遍歷法則對無序的骨架點進行重構(gòu);4)對重構(gòu)后得到的特征圖的拉普拉斯矩陣進行歸一化處理;5)構(gòu)建注意力感知網(wǎng)絡(luò)和主體網(wǎng)絡(luò);6)將注意力感知網(wǎng)絡(luò)和主體網(wǎng)絡(luò)分層級連接;7)將重構(gòu)的特征圖分別輸入主體網(wǎng)絡(luò)和注意力感知網(wǎng)絡(luò),訓練行為識別網(wǎng)絡(luò)模型;8)利用訓練好的行為識別網(wǎng)絡(luò)模型進行行為識別。本發(fā)明能夠顯著提高行為識別的精度和效率。
技術(shù)領(lǐng)域
本發(fā)明屬于機器人視覺技術(shù)和人機交互領(lǐng)域,具體涉及一種基于注意力感知和樹形骨架點結(jié)構(gòu)的人體行為識別方法和系統(tǒng);通過對無序的骨架點進行樹形重構(gòu)來更好的描述表達行為模式,并利用注意力網(wǎng)絡(luò)對不同骨架點的重要性進行描述,為人體行為的分類提供合適的先驗條件,可近一步減少人體行為識別的分類處理時間和提高后期行為識別的精度。
背景技術(shù)
行為識別是隸屬于行為分析這一領(lǐng)域,針對給定包含某種運動的視頻序列,按運動的類別給該視頻序列加標簽,可以被應(yīng)用于人機交互、智能監(jiān)控和視頻分析等方面。然而,基于RGB的視頻序列的人體行為識別算法性能仍然受限,人體遮擋、相機晃動、視角變換等都會帶來很大的干擾和噪聲。因此,選用骨架序列等深度數(shù)據(jù)可以避免這些問題,提高行為識別的精度和速度。
現(xiàn)有的一類方法(Sijie?Yan,Yuanjun?Xiong,and?Dahua?Lin.“Spatialtemporal?graph?convolutional?networks?for?skeleton-based?action?recognition,”in?Association?for?the?Advance?of?Artificial?Intelligence(AAAI),2018.)的基礎(chǔ)是時空圖結(jié)構(gòu),從骨架關(guān)鍵點序列構(gòu)建時空圖,在按照既定規(guī)則得到的時空圖保留了骨架關(guān)鍵點的空間信息,并使得關(guān)鍵點的運動軌跡以時序邊的形式得到表現(xiàn)。但是該方法默認所有的骨架點具有同樣的重要性,這并不符合人類在區(qū)分不同行為時的經(jīng)驗認知。另一種方式(S.Song,C.Lan,J.Xing,W.Zeng,and?J.Liu.“An?end-to-end?spatio-temporalattention?model?for?human?action?recognition?from?skeleton?data.”inAssociation?for?the?Advance?of?Artificial?Intelligence(AAAI),2017.)使用了LSTM作為注意力網(wǎng)絡(luò),獲取不同骨架點的關(guān)鍵性信息。然而基于LSTM結(jié)構(gòu)的網(wǎng)絡(luò)復(fù)雜度較高,加上該注意力機制后的網(wǎng)絡(luò)雖然檢測精度有所提升,但是其算法效率低,不便之后的維護改進,也不適合應(yīng)用于實際的場景。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)存在的技術(shù)問題,本發(fā)明的目的是提供一種基于注意力感知和樹形骨架點結(jié)構(gòu)的人體行為識別方法和系統(tǒng),首先對無序的骨架點進行樹形重構(gòu),然后利用注意力網(wǎng)絡(luò)對不同骨架點的重要性進行描述,可以進一步提高行為識別的精度和速度。
本發(fā)明采用的技術(shù)方案如下:
一種基于注意力感知和樹形骨架點結(jié)構(gòu)的人體行為識別方法,包括以下步驟:
1)輸入訓練集中所有行為樣本的骨架點信息(三維坐標);
2)進行數(shù)據(jù)預(yù)處理,通過添零補幀使各樣本的幀數(shù)一致;
3)基于三向樹狀遍歷法則對無序的骨架點進行重構(gòu),重構(gòu)后得到的特征圖作為新的數(shù)據(jù)源;
4)對構(gòu)建的特征圖的拉普拉斯矩陣進行歸一化處理;
5)構(gòu)建注意力感知網(wǎng)絡(luò)和主體網(wǎng)絡(luò);
6)將注意力感知網(wǎng)絡(luò)和主體網(wǎng)絡(luò)分層級連接;
7)將重構(gòu)的特征圖分別輸入主體網(wǎng)絡(luò)和注意力感知網(wǎng)絡(luò),并進行訓練,得到訓練好的行為識別網(wǎng)絡(luò)模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市感動智能科技有限公司;北京大學深圳研究生院,未經(jīng)深圳市感動智能科技有限公司;北京大學深圳研究生院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811366233.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點和感知節(jié)點
- 感知無線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點和匯聚中心
- 感知無線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫
- 基于認知數(shù)據(jù)庫和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置
- 具有過濾樹形路徑功能的可擴展標記語言處理器、過濾樹形路徑的方法及其記錄介質(zhì)
- 一種實現(xiàn)樹形結(jié)構(gòu)的方法及裝置
- 一種樹形數(shù)據(jù)輸出坐標獲取方法、裝置及系統(tǒng)
- 一種樹形數(shù)據(jù)繪制輸出位置獲取方法、裝置及ERP系統(tǒng)
- 一種樹形結(jié)構(gòu)文件的對比方法及裝置
- 一種樹形結(jié)構(gòu)查詢方法及裝置
- 一種基于Flash技術(shù)的帶復(fù)選框樹形結(jié)構(gòu)目錄構(gòu)建方法及裝置
- 基于樹形結(jié)構(gòu)的過濾方法與裝置
- 多表頭樹形列表控件的創(chuàng)建方法和裝置
- 用于檢索樹形數(shù)據(jù)的方法、裝置、服務(wù)器和介質(zhì)





