[發明專利]基于稀疏表示的動態手勢識別方法在審
| 申請號: | 201410079781.8 | 申請日: | 2014-03-06 |
| 公開(公告)號: | CN103824063A | 公開(公告)日: | 2014-05-28 |
| 發明(設計)人: | 韓紅;洪漢梯;陳建;李楠;劉三軍;史媛媛;曹賽 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 田文英;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 稀疏 表示 動態 手勢 識別 方法 | ||
技術領域
本發明屬于圖像處理技術領域,更進一步涉及視頻圖像處理技術領域中的一種處理基于稀疏表示的動態手勢識別方法。本發明利用圖像特征提取,字典訓練,稀疏表達方法對動態手勢進行識別,確認出不同手勢所代表的意義以實現人機交互中的實際應用。
背景技術
手勢識別技術在虛擬現實、人機交互、視覺監控等領域均有著廣泛的應用前景,基于視覺的手勢跟蹤和識別就是其重要內容。由于手勢本身具有的多樣性、多義性以及時間和空間上的差異性等特點,加上人手是復雜的變形體和視覺本身的不適定性,因此找到一種優秀的手勢識別方法一個多學科交叉且富有挑戰性的技術問題。
已經有各種手勢識別的方法被提出,特別是目前使用很廣泛的基于HMM的,DTW的手勢識別方法。它們將手勢識別的過程進行特征提取,再通過數學建模,由最終得到的概率來給出識別的結果。但由于這些方法提取出的特征不能有效表示手勢的意義,過程復雜,計算量太大,識別率不高,容易受到背景的影響,而且對于較復雜的手勢,識別的結果往往不能盡如人意。所以需要新的研究方法的提出。
近年來,隨著稀疏表示、字典學習研究的發展,基于超完備字典的稀疏表示因其具有稀疏性、特征保持性、可分性等特點而被廣泛應用于圖像處理領域。
電子科技大學申請的專利“一種3D手勢識別方法”(專利申請號:201310168123.1,公開號:CN103294996A)中提出了一種基于手輪廓特征的手勢識別方法。該專利技術在空間上利用圖像形態學處理來獲得視頻幀的手勢輪廓中指尖位置及手指連接點位置,在手勢時間序列曲線的對應位置上進行曲線的分割。并對手指的時間序列曲線進行特定的組合來識別手勢。該方法雖然操作簡單,但識別效果容易受背景環境的影響,只適應于某些特定的環境中特定的手勢,適用性不不強。
Mahmoud?Elmezain,Ayoub?Al-Hamadi,Bernd?Michaelis在論文“hand?trajectory-based?gesture?spotting?and?recognition?using?HMM.ICIP2009pp.3577-3590”中提出了一種基于HMM的手勢識別方法。該方法先通過圖像的顏色信息和三維深度信息組合提取出手勢部分的圖像,再根據手勢部分的圖像提取出手勢軌跡的方向特征,利用HMM對方向特征進行建模來識別手勢。該方法雖然識別率高,但提取的特征對圖像的旋轉,縮放保持不變性,而且需要復雜的數學建模過程,計算量大,實現過程復雜。
發明內容
本發明的目的是針對上述現有技術的不足,提出了一種基于稀疏表示的動態手勢識別方法。本發明與現有技術中其他手勢識別技術相比計算量小,準確度高,適應性強。
本發明實現的具體步驟包括如下:
(1)建立數據庫:
(1a)拍攝九種手勢,其中每種手勢包括15個視頻,將拍攝的135個視頻組成訓練數據庫;
(1b)拍攝與組成訓練數據庫相同的九種手勢,其中每種手勢包括10個視頻,將拍攝的90個視頻作為測試數據庫。
(2)提取時空興趣點:
(2a)對訓練數據庫和測試數據庫中每一個視頻進行時域伽柏Gabor濾波和空域高斯Gaussian濾波,獲得每個視頻的每幀圖像像素點處的響應值R;
(2b)將每個視頻中每幀圖像像素點響應值R大于等于閾值的像素點定義為時空興趣點。
(3)構建立方體:
(3a)在時空興趣點所在圖像上,截取一個以時空興趣點為中心,以40個像素點為邊長的正方形圖像塊;
(3b)將時空興趣點所在的圖像選為中心幀圖像,沿著每一個視頻的時域方向在中心幀圖像的前和后取相同數量幀的多幀圖像;
(3c)從除中心幀圖象以外的其它多幀圖象上,選取與中心幀圖象位置相同的正方形圖像塊,將所提取的正方形圖像塊,按照每幀圖象在視頻中的先后順序排列組成一個圖像塊的立方體。
(4)提取三維SIFT特征:
(4a)按照下式,求得圖像塊立方體中每個像素點的空域方向值和時域方向值:
θ=arctan(L2/L1)
其中,θ表示圖像塊立方體中每個像素點的空域方向值,L1和L2分別表示圖像塊立方體中每個像素點在空間域橫軸和縱軸上的梯度分量值,表示圖像塊立方體中每個像素點的時域方向值,L3表示圖像塊立方體中每個像素點在時間軸上的梯度分量值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410079781.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙層路邊無避讓停車裝置
- 下一篇:自動吸水發電節能減排機械裝置





