[發明專利]動作識別方法、人機交互方法、裝置及存儲介質有效
| 申請號: | 201910345010.1 | 申請日: | 2019-04-26 |
| 公開(公告)號: | CN110059661B | 公開(公告)日: | 2022-11-22 |
| 發明(設計)人: | 羅鏡民;喬亮;朱曉龍 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06V20/40 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 張所明 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 動作 識別 方法 人機交互 裝置 存儲 介質 | ||
本發明公開了一種動作識別方法、人機交互方法、裝置及存儲介質,屬于計算機技術領域。方法包括:從目標視頻中提取多個目標窗口;得到每個目標窗口的第一動作特征信息;當獲取到多個第一動作特征信息與預設特征信息之間的多個相似度中最大的第一相似度大于第一預設閾值,第一相似度與第二相似度之間的差值大于第二預設閾值時,確定第一相似度對應的第一目標窗口包含的動態動作為預設動態動作。本發明實施例提供了一種識別預設動態動作的方案,對目標窗口中的視頻幀進行動作識別,避免相鄰目標窗口之間的影響而造成識別錯誤的問題,識別目標窗口中包含的預設動態動作,突破了相關技術中只能識別靜態動作的限制,擴展了應用范圍,提高了靈活性。
技術領域
本發明涉及計算機技術領域,特別涉及一種動作識別方法、人機交互方法、裝置及存儲介質。
背景技術
動作識別技術是對動作圖像進行分析處理,從而理解動作圖像中所包含動作的技術,隨著計算機技術的發展,動作識別技術廣泛應用于視頻監控、體感游戲、虛擬現實、互聯網醫療等多種領域,已成為一種熱門的研究方向。
相關技術中,用戶在電子設備的拍攝范圍內做出某種動作,電子設備對用戶進行拍攝,得到動作圖像,提取該動作圖像中的身體關鍵點,如手腕關鍵點、肘部關鍵點或肩部關鍵點等,根據提取的身體關鍵點的分布情況,確定任兩個身體部位之間的角度。獲取預設角度范圍,該預設角度范圍為在做出預設動作時指定的兩個身體部位之間的角度所屬的角度范圍。當確定該動作圖像中指定的兩個身體部位之間的角度屬于該預設角度范圍時,確定該動作圖像中的動作為預設動作,也即是識別出用戶做出了預設動作。
發明人認為,上述方案中僅可以根據靜態的動作圖像識別出靜態動作,因此應用范圍較為局限。
發明內容
本發明實施例提供了一種動作識別方法、人機交互方法、裝置及存儲介質,解決了相關技術存在的問題。所述技術方案如下:
一方面,提供了一種動作識別方法,所述方法包括:
從目標視頻中提取多個目標窗口,所述多個目標窗口中的每個目標窗口包括第一預設數量的連續視頻幀;
對所述每個目標窗口中的視頻幀進行動作識別,得到所述每個目標窗口的第一動作特征信息,所述第一動作特征信息用于描述所述目標窗口包含的動態動作;
獲取所述每個目標窗口的第一動作特征信息與預設特征信息之間的相似度,所述預設特征信息用于描述預設動態動作;
當獲取到的多個相似度中最大的第一相似度大于第一預設閾值,且所述第一相似度與第二相似度之間的差值大于第二預設閾值時,確定所述第一相似度對應的第一目標窗口包含的動態動作為所述預設動態動作,所述第二相似度為與所述第一目標窗口相鄰的目標窗口對應的相似度。
可選地,所述從目標視頻中提取多個目標窗口,包括:
從所述目標視頻中提取多個視頻幀;
以所述第一預設數量作為每個目標窗口中的視頻幀數量,以第二預設數量作為任兩個相鄰的目標窗口包含的相同視頻幀的數量,對所述多個視頻幀進行劃分,得到所述多個目標窗口。
可選地,所述對所述每個目標窗口中的視頻幀進行動作識別,得到所述每個目標窗口的第一動作特征信息,包括:
對于所述每個目標窗口中的每個視頻幀,提取所述視頻幀中的多個身體關鍵點;
根據所述多個身體關鍵點的分布情況,對所述視頻幀進行動作識別,得到所述視頻幀的第二動作特征信息,所述第二動作特征信息用于描述所述視頻幀包含的靜態動作;
分別將所述每個目標窗口中的視頻幀的第二動作特征信息進行組合,得到所述每個目標窗口的第一動作特征信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910345010.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:檢測方法及指紋感測裝置
- 下一篇:一種深度視頻行為識別方法及系統





