[發明專利]一種人體動作識別訓練系統的實現方法在審
| 申請號: | 201310428277.X | 申請日: | 2013-09-18 |
| 公開(公告)號: | CN103489000A | 公開(公告)日: | 2014-01-01 |
| 發明(設計)人: | 覃祖茂;劉為;袁增偉;杜怡曼;何佳;李東娥;劉曉;黃益農;黃華峰 | 申請(專利權)人: | 柳州市博源環科科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 廣西南寧匯博專利代理有限公司 45114 | 代理人: | 鄧曉安 |
| 地址: | 545006 廣西壯族自治區柳*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 人體 動作 識別 訓練 系統 實現 方法 | ||
技術領域
本發明屬于計算機工程技術領域,涉及了一種基于機器學習的、用于長產生特定人體動作識別器的訓練系統的實現方法。
背景技術
動作識別是近年來非常熱門的研究領域,通過圖像捕捉設備,在較短的時間內完成對人體動作的識別過程,并轉換為計算機等設備的操作指令;從而被作為一種有效的輸入手段被應用到游戲、電影制作等廣泛的應用領域中。
動作識別首先要解決的問題是找到人體動作的部位,人體動作的部位是動作識別的依據,一般稱為“關注位置”。因為通常關注位置為人臉、手等裸露的部位,其顏色跟環境、衣服有比較大的區別,所以可以從顏色上把關注位置與非關注位置區分開,對于關注位置的確定,一般采用基于顏色分布統計的色彩直方圖為依據,具體來說,是將人體動作捕捉為靜態的待識別圖像,根據圖像不同區域(兩區域中心位置、大小有任意一項不同則這兩個區域為不同區域)的顏色統計出色彩直方圖,然后把各區域的統計直方圖與預設的直方圖做比較,尋找最相似的區域作為最后的關注位置。
但這種方法對顏色要求很高,人穿著與膚色相近的衣服、周圍環境與膚色相近、環境光色調單一等等因素都會導致識別率大幅下降,且該方法只能獲得所關注位置在圖像的哪個位置,而無法獲得關注位置的具體表達含義。
為消除顏色對圖像識別的影響,現有的識別技術通常先把待識別圖像轉化為灰度圖,然后對得到的灰度圖進行識別。待識別圖像被轉化為灰度圖后,需要用經過神經網絡等人工智能技術訓練的識別系統從整體中根據輪廓線條走向、各部分位置關系等特征尋找到關注位置,例如從人的全身像里找到臉或者手。
目前,在開源計算機視覺庫項目中,采用了一種基于簡單特征級聯的圖像識別算法,采用該算法的動作識別過程大致可分為兩部分,首先要通過訓練過程生成特征文件,之后通過識別過程根據生成的特征文件對捕獲的圖像進行識別,得到識別結果。該算法取得了較好的效果,但是其還是存在著一些不足,如特征文件的計算量比較大、識別速度比較慢等。因此,市場上仍需一種計算量少、識別速度快的圖像訓練識別算法。
發明內容
本發明的目的在于針對現有技術的不足,提供了一種降精度離散化坐標算法以簡化運動信息表示和減少特征提取算法的計算量,同時采用多層次特征匹配算法以加快識別速度的人體動作識別訓練系統的實現方法。
為了實現上述目的,本發明采用了以下技術方案:
一種人體動作識別訓練系統的實現方法,包括以下步驟:
(1)訓練信息的采集:
通過深度探測攝像頭及第三方SDK采集需要被識別的各種動作樣本,并且在將采集到的樣本數據進行存儲時,其存儲格式包括以下字段:動作ID(Action?ID:?Int32)、動作名稱(Action?Name:?String)、動作信息幀的對數(Frame?Count:?Integer)、深度信息幀(Depth?Frame?#n:?Integer?Array)和骨骼信息幀(Skeleton?Frame?#n:?Integer?Array);
(2)樣本數據正則化處理:
a.統一坐標系,即對每幀的深度信息數據和骨骼信息數據進行坐標變換,將它們統一到同一世界坐標系中;
b.離散化骨骼點坐標,即對當前幀中每個骨骼信息數據點坐標進行離散化處理,離散化的步驟為:
i)根據前后相鄰的各一幀中的同一骨骼點坐標,計算該骨骼點的運動向量;
ii)查找該骨骼點對應的目標離散坐標系中的單位立方體;
iii)把該骨骼點的運動向量合成到單位立方體的當前運動向量中;
c.離散化深度信息數據坐標,即在離散化骨骼點坐標時,如果該骨骼點為手部點,則將該骨骼點附近的深度數據點也進行離散化,離散化后的對應于深度信息數據的單位立方體擁有與該骨骼點相同的運動向量;
d.對每一幀重復上述a、b、c步驟,對每一個待識別動作生成一個對應的樣本三維向量集;
(3)特征三維向量集的提取:
通過訓練樣本數據結構中的動作ID,獲知正則化后的樣本三維向量集所對應的人體動作,對于該動作所有的訓練樣本生成的所有三維向量集,都將作為該動作對應的樣本三維向量集;對樣本三維向量集進行特征提取,獲取該動作的特征三維向量集,具體提取算法如下:
a.計算每個三維坐標點在全部三維向量集中出現的次數;
b.根據其出現次數計算其特征系數,即,特征系數?=?三維坐標點出現次數?/?該動作三維向量集的個數;
c.如果特征系數大于50%,則認為該點的三維向量集屬于特征三維向量集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于柳州市博源環科科技有限公司,未經柳州市博源環科科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310428277.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:RFID防沖突讀寫裝置及其控制方法
- 下一篇:應用程序安全控制方法及系統





