[發(fā)明專利]一種人體動作識別方法及設(shè)備、計算機可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201710682779.3 | 申請日: | 2017-08-10 |
| 公開(公告)號: | CN107704799A | 公開(公告)日: | 2018-02-16 |
| 發(fā)明(設(shè)計)人: | 李臣陽 | 申請(專利權(quán))人: | 深圳市金立通信設(shè)備有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 深圳市精英專利事務(wù)所44242 | 代理人: | 林燕云 |
| 地址: | 518000 廣東省深圳市福田區(qū)深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 人體 動作 識別 方法 設(shè)備 計算機 可讀 存儲 介質(zhì) | ||
1.一種人體動作識別方法,其特征在于,包括:
獲取深度視頻圖像,其中,所述深度視頻圖像包括多幀深度圖像;
將多幀所述深度圖像分別向空間坐標(biāo)系投影以獲得多類深度子圖像組;
將每類所述深度子圖像組中的多幀深度子圖像按照預(yù)設(shè)劃分規(guī)則劃分成多個子動作;
根據(jù)預(yù)設(shè)幀間差分法計算每個所述子動作對應(yīng)的時間深度動態(tài)模型;
通過空間金字塔方向梯度直方圖對所述時間深度動態(tài)模型進(jìn)行編碼以生成特征描述符;
通過分類算法建立所述特征描述符與運動類別之間的對應(yīng)關(guān)系以識別人體動作。
2.根據(jù)權(quán)利要求1所述的人體動作識別方法,其特征在于,所述將每類所述深度子圖像組中的多幀深度子圖像按照預(yù)設(shè)劃分規(guī)則劃分成多個子動作,包括:
將每類所述深度子圖像組中的多幀深度子圖像按照幀索引平均劃分成N個子動作,其中,N為正整數(shù);以及
將每類所述深度子圖像組中的多幀深度子圖像劃分為第N+1個子動作。
3.根據(jù)權(quán)利要求1所述的人體動作識別方法,其特征在于,所述根據(jù)預(yù)設(shè)幀間差分法計算每個所述子動作對應(yīng)的時間深度動態(tài)模型,包括:
計算每個所述子動作中相鄰兩幀所述深度子圖像中相應(yīng)位置處像素差值的絕對值,并對所述絕對值進(jìn)行累加以獲得每個所述子動作對應(yīng)的準(zhǔn)時間深度動態(tài)模型;
提取所述準(zhǔn)時間深度動態(tài)模型中的有效區(qū)域作為所述時間深度動態(tài)模型。
4.根據(jù)權(quán)利要求1所述的人體動作識別方法,其特征在于,所述通過空間金字塔方向梯度直方圖對所述時間深度動態(tài)模型進(jìn)行編碼以生成特征描述符,包括:
計算所述時間深度動態(tài)模型中每個像素點的梯度幅值和梯度方向;
將所述時間深度動態(tài)模型分別放在空間金字塔的多層中的每一層,并將每層中的所述時間深度動態(tài)模型劃分成多個網(wǎng)格,其中,不同層中所述時間深度動態(tài)模型劃分的網(wǎng)格尺寸不同;
根據(jù)所述梯度幅值和梯度方向?qū)γ總€所述網(wǎng)格進(jìn)行方向梯度直方圖計算以獲得每個所述網(wǎng)格對應(yīng)的網(wǎng)格特征向量;
根據(jù)所有所述時間深度動態(tài)模型在每層中的網(wǎng)格特征向量生成特征描述符。
5.根據(jù)權(quán)利要求1所述的人體動作識別方法,其特征在于,所述通過分類算法建立所述特征描述符與運動類別之間的對應(yīng)關(guān)系以識別人體動作,包括:
對所述特征描述符進(jìn)行降維以生成特征向量;
通過分類算法建立所述特征向量與運動類別之間的對應(yīng)關(guān)系以識別人體動作。
6.一種人體動作識別設(shè)備,其特征在于,包括:
獲取單元,用于獲取深度視頻圖像,其中,所述深度視頻圖像包括多幀深度圖像;
投影獲取單元,用于將多幀所述深度圖像分別向空間坐標(biāo)系投影以獲得多類深度子圖像組;
劃分單元,用于將每類所述深度子圖像組中的多幀深度子圖像按照預(yù)設(shè)劃分規(guī)則分成多個子動作;
模型計算單元,用于根據(jù)預(yù)設(shè)幀間差分法計算每個所述子動作對應(yīng)的時間深度動態(tài)模型;
生成單元,用于通過空間金字塔方向梯度直方圖對所述時間深度動態(tài)模型進(jìn)行編碼以生成特征描述符;
識別單元,用于通過分類算法建立所述特征描述符與運動類別之間的對應(yīng)關(guān)系以識別人體動作。
7.根據(jù)權(quán)利要求6所述的人體動作識別設(shè)備,其特征在于,所述劃分單元具體用于將每類所述深度子圖像組中的多幀深度子圖像按照幀索引平均劃分成N個子動作,其中,N為正整數(shù);將每類所述深度子圖像組中的多幀深度子圖像劃分為第N+1個子動作。
8.根據(jù)權(quán)利要求6所述的人體動作識別設(shè)備,其特征在于,所述模型計算單元包括:
計算單元,用于計算每個所述子動作中相鄰兩幀所述深度子圖像中相應(yīng)位置處像素差值的絕對值,并對所述絕對值進(jìn)行累加以獲得每個所述子動作對應(yīng)的準(zhǔn)時間深度動態(tài)模型;
提取單元,用于提取所述準(zhǔn)時間深度動態(tài)模型中的有效區(qū)域作為所述時間深度動態(tài)模型。
9.一種人體動作識別設(shè)備,其特征在于,包括處理器、輸入設(shè)備、輸出設(shè)備和存儲器,所述處理器、輸入設(shè)備、輸出設(shè)備和存儲器相互連接,其中,所述存儲器用于存儲程序代碼,所述處理器被配置用于運行所述程序代碼,執(zhí)行如權(quán)利要求1-5任一項所述的人體動作識別方法。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機存儲介質(zhì)存儲有計算機程序,所述計算機程序包括程序指令,所述程序指令當(dāng)被處理器執(zhí)行時使所述處理器執(zhí)行如權(quán)利要求1-5任一項所述的人體動作識別方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市金立通信設(shè)備有限公司,未經(jīng)深圳市金立通信設(shè)備有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710682779.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





