[發明專利]基于壓縮視頻的動作識別方法、裝置及計算機設備在審
| 申請號: | 202110012575.5 | 申請日: | 2021-01-06 |
| 公開(公告)號: | CN112686193A | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 顏云輝;王森;宋克臣;張勁風 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京中強智尚知識產權代理有限公司 11448 | 代理人: | 黃耀威 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 壓縮 視頻 動作 識別 方法 裝置 計算機 設備 | ||
本申請公開了一種基于壓縮視頻的動作識別方法、裝置及計算機設備,涉及神經網絡動作識別技術領域,可以解決在基于深度學習神經網絡進行視頻中的動作識別時,計算量較大的技術問題。其中方法包括:對樣本集進行預處理,確定所述樣本集中各個樣本壓縮視頻對應的融合特征,所述融合特征至少包括空間特征、運動特征;利用所述融合特征訓練動作識別模型;若判定所述動作識別模型符合預設訓練標準,則利用所述動作識別模型對目標壓縮視頻進行動作識別,獲取動作識別結果。本申請適用于對壓縮視頻的動作識別。
技術領域
本申請涉及神經網絡動作識別技術領域,尤其涉及到一種基于壓縮視頻的動作識別方法、裝置及計算機設備。
背景技術
計算機視覺中的動作識別任務主要探究如何感知在一段連續的視頻流中某一目標乃至多個目標的動作變化,進而由對連續動作的總結上升為對行為的判斷。深度學習方法經過近幾年的迅速發展,已經在視覺相關的很多領域取得了很好的效果,基于深度學習的動作識別算法具有識別種類多,準確率高,魯棒性好等優點,在同樣的識別場景下,使用深度學習神經網絡進行動作識別可以有效抵抗顏色、紋理、光照等干擾條件。
雖然深度學習神經網絡具有諸多優點,但將基于深度學習的動作識別算法部署至移動機器人平臺中仍存在不少問題。深度學習方法由于其方法性質使得其對硬件的計算能力具有較高的要求,尤其在處理圖像任務時需要大量的GPU圖形運算,如何在保證算法速度精度的前提下減小運算量并將算法移植到家用服務機器人平臺是仍是一大挑戰。
綜上,需要設計一個更加緊湊的動作識別模型,使得模型在保證動作識別準確率的基礎上,還能在計算性能有限的嵌入式設備上運行。
發明內容
有鑒于此,本申請提供了一種基于壓縮視頻的動作識別方法、裝置及計算機設備,用于解決在基于深度學習神經網絡進行視頻中的動作識別時,計算量較大的技術問題。
根據本申請的一個方面,提供了一種基于壓縮視頻的動作識別方法,該方法包括:
對樣本集進行預處理,確定所述樣本集中各個樣本壓縮視頻對應的融合特征,所述融合特征至少包括空間特征、運動特征;
利用所述融合特征訓練動作識別模型;
若判定所述動作識別模型符合預設訓練標準,則利用所述動作識別模型對目標壓縮視頻進行動作識別,獲取動作識別結果。
優選地,所述對樣本集進行預處理,確定所述樣本集中各個樣本壓縮視頻對應的融合特征,具體包括:
對樣本集中的各個樣本壓縮視頻進行編解碼處理,提取各個所述樣本壓縮視頻中的I幀數據、P幀數據;
根據所述I幀數據提取空間特征;
基于所述P幀數據提取運動特征;
將所述空間特征和所述運動特征進行特征融合,確定所述融合特征。
優選地,所述根據所述I幀數據提取空間特征,具體包括:
按照預設幀數對所述I幀數據進行分組處理;
抽取各個分組中預設位置處的I幀數據,并構建新的有序I幀集合;
基于ResNet-50網絡提取所述有序I幀集合中的空間特征;
所述基于所述P幀數據提取運動特征,具體包括:
提取所述P幀數據中的運動矢量;
基于ResNet-18網絡確定所述運動矢量對應的運動特征。
優選地,所述將所述空間特征和所述運動相關特征進行特征融合,確定所述融合特征,具體包括:
基于預設權重配比,計算所述空間特征和所述運動特征對應的加權平均值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110012575.5/2.html,轉載請聲明來源鉆瓜專利網。





