[發明專利]一種基于HOG特征的多旋轉方向SVM模型的手勢跟蹤方法有效
| 申請號: | 201510079498.X | 申請日: | 2015-02-13 |
| 公開(公告)號: | CN104731323B | 公開(公告)日: | 2017-07-04 |
| 發明(設計)人: | 牛建偉;趙曉軻;蘇一鳴 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F3/01 | 分類號: | G06F3/01;G06K9/00 |
| 代理公司: | 北京永創新實專利事務所11121 | 代理人: | 祗志潔 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 hog 特征 旋轉 方向 svm 模型 手勢 跟蹤 方法 | ||
技術領域
本發明涉及一種基于HOG特征的多旋轉方向SVM模型的手勢跟蹤方法,屬于圖像處理以及模式識別技術領域。
背景技術
現如今,計算機的普及和迅速發展使得人們的生活越來越依賴計算機,計算機無處不在。在以往的人和計算機交互技術中,特定的輸入輸出設備,如有鍵盤、鼠標、手寫筆、掃描儀等,被廣泛采用。近幾年,隨著計算機性能的大幅度提高,個人計算機(PC)已具有語音處理、圖形圖像處理等多種通信媒體的能力。為提高計算機的易用性和人機交互的自然性,新型輸入技術已儼然成為一個備受廣大用戶和科研工作者關注的研究熱點領域。人工智能的飛躍發展和新式輸入輸出設備如雨后春筍般的不斷涌現,使得計算機變得越來越智能化,人機交互也變得更加的自然。人機交互技術的研究歷經以計算機為中心的傳統交互,現在已逐步轉移到以人為中心的多種通道、多種媒體的新型交互技術上來。體勢識別、人臉識別、表情識別、頭部跟蹤、眼球跟蹤以及手勢識別等新式技術都是為符合人的習慣而出現的新型人機交互技術。生活中,我們總是使用某些固定手勢來表達某種特定的意圖,例如表示OK,為路人指示方向,表示數字等等。這些現象均說明了手勢操作的頻繁性和直觀自然性,同時也使得人們希望將手勢可以用來與自己的計算機進行交互中。例如,用戶可以定義適當的手勢來對設備進行控制等。
手勢識別作為多模式人機接口技術重要部分,涉及了多個學科的研究領域,例如計算機視覺、人工智能、模式識別等。基于視覺的手勢跟蹤是手勢識別方法的重要環節,特別是動態手勢識別。人手的運動幅度較大、光照條件的變化、背景差異、在圖像中所占區域較小以及形狀不斷改變,這些均為手勢跟蹤帶來了極大的挑戰。此外,手勢跟蹤算法還要求達到實時性和具有低耗性。方向梯度直方圖(Histogram of Oriented Gradient,簡稱HOG)是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子。支持向量機(Support Vector Machine,簡稱SVM)是一種可用作特征空間分類的機器學習方法。
手勢跟蹤的方法可以利用不同的方法實現,主要包括基于輪廓的方法、基于區域的方法、基于模板的方法、基于特征的方法以及基于運動信息的方法等。但這些方法很大一部分不能夠處理復雜背景下手勢的跟蹤任務以及兼顧實時性和準確性。
發明內容
本發明的目的是解決平面內規定手勢旋轉問題,提高利用基于HOG特征的多旋轉方向SVM模型對規定手勢的定位。
本發明提供了一種基于HOG特征的多旋轉方向SVM模型的手勢跟蹤方法,具體是:
步驟1:獲取圖像幀,并進行預處理,具體是:
(1)利用攝像頭實時抓取鏡頭前各個圖像幀,并對當前幀的圖像進行雙線性插值處理以得到設定尺寸的圖像;
(2)加載HOG特征的相關參數、梯度投值空間對應的字典以及基于HOG特征的各個方向子區間的SVM模型。
步驟2:判斷成功定位幀數是否到達預設的幀數閾值T;
設定一個變量x,用于記錄到當前幀前連續成功地檢測或跟蹤到含有手勢的幀數,初始x的值為0。
比較成功定位幀數變量x和預設的幀數閾值T,按如下進行:
(1)如果成功定位幀數變量x未達到預設閾值T,那么,調用基于HOG+Multi-SVM的檢測模塊,進入步驟3執行;
(2)否則,調用基于HOG+Multi-SVM的跟蹤模塊,進入步驟4執行。
步驟3:基于HOG+Multi-SVM的檢測;
對步驟1得到的圖像進行各個尺度空間中的HOG特征提取,利用滑動窗口對所有有效窗口進行遍歷,并與預先訓練的各方向子區間的SVM模型進行匹配,記錄匹配的結果,并在匹配成功時記錄手勢在圖像幀的位置和SVM模型的索引號,然后轉到步驟5執行。
步驟4:基于HOG+Multi-SVM的跟蹤;
對步驟1得到的圖像按照設定的尺度空間遍歷順序對HOG特征進行提取,并利用特定方式進行固定窗口的移動,接著,以一定順序與預先訓練的各方向子區間的SVM模型進行匹配。記錄匹配的結果,并在匹配成功時記錄手勢在圖像幀的位置和SVM模型的索引號。進入步驟5執行。
步驟5:判定既定手勢是否在圖像上,并做出相應處理,具體是:
(1)當未在圖像中定位到既定手勢時,對成功定位的幀數變量x進行清零處理,從而保證下次調用步驟3的檢測子模塊;
(2)否則,將成功定位的幀數變量x的值增1,并記錄既定手勢在圖像中的位置大小和匹配的SVM模型的索引號。
本發明的優點在于:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510079498.X/2.html,轉載請聲明來源鉆瓜專利網。





