[發明專利]基于稀疏表示的動態手勢識別方法在審
| 申請號: | 201410079781.8 | 申請日: | 2014-03-06 |
| 公開(公告)號: | CN103824063A | 公開(公告)日: | 2014-05-28 |
| 發明(設計)人: | 韓紅;洪漢梯;陳建;李楠;劉三軍;史媛媛;曹賽 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 田文英;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 稀疏 表示 動態 手勢 識別 方法 | ||
1.一種基于稀疏表示的動態手勢識別方法,包括如下步驟:
(1)建立數據庫:
(1a)拍攝九種手勢,其中每種手勢包括15個視頻,將拍攝的135個視頻組成訓練數據庫;
(1b)拍攝與組成訓練數據庫相同的九種手勢,其中每種手勢包括10個視頻,將拍攝的90個視頻作為測試數據庫;
(2)提取時空興趣點:
(2a)對訓練數據庫和測試數據庫中每一個視頻進行時域伽柏Gabor濾波和空域高斯Gaussian濾波,獲得每個視頻的每幀圖像像素點處的響應值R;
(2b)將每個視頻中每幀圖像像素點響應值R大于等于閾值的像素點定義為時空興趣點;
(3)構建立方體:
(3a)在時空興趣點所在圖像上,截取一個以時空興趣點為中心,以40個像素點為邊長的正方形圖像塊;
(3b)將時空興趣點所在的圖像選為中心幀圖像,沿著每一個視頻的時域方向在中心幀圖像的前和后取相同數量幀的多幀圖像;
(3c)從除中心幀圖象以外的其它多幀圖象上,選取與中心幀圖象位置相同的正方形圖像塊,將所提取的正方形圖像塊,按照每幀圖象在視頻中的先后順序排列組成一個圖像塊的立方體;
(4)提取三維SIFT特征:
(4a)按照下式,求得圖像塊立方體中每個像素點的空域方向值和時域方向值:
θ=arctan(L2/L1)
其中,θ表示圖像塊立方體中每個像素點的空域方向值,L1和L2分別表示圖像塊立方體中每個像素點在空間域橫軸和縱軸上的梯度分量值,表示圖像塊立方體中每個像素點的時域方向值,L3表示圖像塊立方體中每個像素點在時間軸上的梯度分量值;
(4b)將每一個圖像塊的立方體均分成8個大小相等的立方體,將每個立方體中每個像素點的空域方向作為x軸,將每個立方體中每個像素點的時域方向作為y軸,將立方體中像素點的個數作為z軸,構造8個三維梯度直方圖,將圖像塊立方體中提取的8個三維梯度直方圖級聯,形成三維尺度不變特征變換SIFT特征;
(5)訓練字典:
(5a)將訓練數據庫中所有視頻里提取的三維尺度不變特征變換SIFT特征作為字典訓練集;
(5b)采用稀疏表示的字典設計KSVD法,對字典訓練集進行字典訓練,獲得超完備字典;
(6)稀疏表示:
(6a)利用超完備字典,計算訓練數據庫和測試數據庫中每個視頻的所有三維SIFT特征的稀疏表示系數向量;
(6b)對稀疏表示系數向量進行極大池max?pooling操作,得到訓練數據庫中所有視頻和測試數據庫中所有視頻的稀疏表示系數向量;
(7)訓練支持向量機分類器:
用訓練數據庫中所有視頻的稀疏表示系數向量對支持向量機分類器進行訓練,得到訓練好的分類器;
(8)分類:
用訓練好的分類器對測試數據庫中所有視頻的稀疏表示系數向量進行分類,得到最終分類結果。
2.根據權利要求1所述的基于稀疏表示的動態手勢識別方法,其特征在于:步驟(2a)所述的時域伽柏Gabor濾波和空域高斯Gaussian濾波,按下式操作:
R=(I*g*h1)2+(I*g*h2)2
其中,R表示對視頻進行時域伽柏Gabor濾波和空域高斯Gaussian濾波后的響應,I表示視頻,g表示空域的高斯Gaussian濾波器,h1和h2分別表示時域偶和時域奇的一維伽柏Gabor濾波器,*表示卷積操作。
3.根據權利要求1所述的基于稀疏表示的動態手勢識別方法,其特征在于:步驟(2b)所述閾值的取值為2×10-4。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410079781.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙層路邊無避讓停車裝置
- 下一篇:自動吸水發電節能減排機械裝置





