[發明專利]一種基于詞袋模型的人體動作識別方法在審
| 申請號: | 202110451802.4 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN113392697A | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 黃慧;李愈;馬燕 | 申請(專利權)人: | 上海師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 上海宛林專利代理事務所(普通合伙) 31361 | 代理人: | 張明 |
| 地址: | 200234 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模型 人體 動作 識別 方法 | ||
本發明提供了一種基于詞袋模型的人體動作識別方法,包括以下步驟:采集人體關節點信息,對采集到的所述人體關節點信息進行預處理;根據預處理的關節點信息,提取動作序列空間特征、時間特征,并將數據集劃分為訓練集與測試集;對訓練集的時間特征、空間特征分別編碼,統計編碼結果,最終獲得訓練集的聯合頻率直方圖;然后利用所述訓練集對分類器進行訓練,利用所述測試集對所述分類器進行測試,獲得動作類型的自動識別。本發明公開了一種基于詞袋模型的人體動作識別方法,將時間特性嵌入動作描述中,將動作的時間特征、空間特征分開考慮,單獨描述,并提出穩定的編碼方法構建了穩定的時間詞袋與空間詞袋。
技術領域
本發明涉及動作識別領域,尤其涉及一種基于詞袋模型的人體動作識別方法。
背景技術
詞袋模型方法最初用于文本分類中,后逐漸應用于動作識別領域。在進行動作識別時,利用傳統的視覺詞袋進行動作識別時,主要分為以下幾個步驟:
首先進行數據預處理,檢測運動目標;
然后對動作進行特征提??;
最后基于視覺詞袋建立的標準動作圖像庫,實現動作的分類識別。
上述利用傳統的視覺詞袋進行動作識別時會存在以下問題:1、傳統詞袋模型忽略動作的時間特性,將直方圖作為動作的描述向量只能體現動作中各靜態姿勢的相似情況,無法體現靜態姿勢執行的先后順序,對倒序動作識別效果不佳。2、K-means聚類初始聚類中心選擇隨機,聚類效果不穩定,導致視覺詞典效果不穩定,需要多次實驗以得到準確效果。
發明內容
有鑒于現有技術的上述缺陷,本發明所要解決的技術問題是傳統詞袋模型忽略動作時間特性,對倒序動作識別不佳,并且算法識別效果不穩定。本發明提供了一種基于詞袋模型的人體動作識別方法,提出一種新的時間特征描述子,將時間特性嵌入動作描述中。并且將動作的時間特征、空間特征分開考慮,單獨描述,進一步提出穩定的編碼方法,改進了現有聚類方法構建的視覺詞典不穩定的問題。最后對分類器進行改進,用不同的分類器區分差異較大的動作和差異較小的動作。
為實現上述目的,本發明提供了一種基于詞袋模型的人體動作識別方法,包括以下步驟:
采集人體關節點信息,對采集到的人體關節點信息進行預處理;
根據預處理的關節點信息,提取動作序列空間特征、時間特征,并將數據集劃分為訓練集與測試集;
對訓練集數據進行對稱擴充;
對訓練集的時間特征、空間特征分別編碼,根據編碼結果統計訓練集的時間特征直方圖和空間特征直方圖;
對所述測試集的時間特征、空間特征分別編碼,根據編碼結果統計測試集的時間特征直方圖和空間特征直方圖;
根據所述訓練集的時間特征直方圖、空間特征直方圖,獲得訓練集的聯合頻率直方圖,根據測試集的時間特征直方圖、所述測試集的空間特征直方圖,獲得測試集的聯合頻率直方圖;
然后利用所述訓練集對分類器進行訓練,利用所述測試集對所述分類器進行測試,獲得動作類型的自動識別。
進一步地,采集人體關節點信息,對采集到的人體關節點信息進行預處理,具體包括:
利用Kinect設備采集的人體關節點信息;
對采集到的人體關節點信息,依次進行原點歸一化、方向歸一化、尺度歸一化操作。
進一步地,將處理后的關節點三維坐標數作為空間特征描述子;
對每一幀提取人體關節的28個空間角度,計算28個角度與前一幀的幀間差值,將關節點的肢體關鍵角度的幀間差值作為時間特征描述子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海師范大學,未經上海師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110451802.4/2.html,轉載請聲明來源鉆瓜專利網。





