[發明專利]棧式降噪自編碼神經網絡手勢圖像的識別方法在審
| 申請號: | 201611180941.3 | 申請日: | 2016-12-20 |
| 公開(公告)號: | CN106803062A | 公開(公告)日: | 2017-06-06 |
| 發明(設計)人: | 馬苗;朱青青;郭敏;武杰 | 申請(專利權)人: | 陜西師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 西安永生專利代理有限責任公司61201 | 代理人: | 申忠才 |
| 地址: | 710062 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 棧式降噪 編碼 神經網絡 手勢 圖像 識別 方法 | ||
技術領域
本發明屬于圖像處理及模式識別技術領域,具體涉及到棧式降噪自編碼神經網絡手勢圖像的識別方法。
背景技術
手勢作為一種新興的人機交互模式,目前已成為計算機視覺領域備受矚目的研究熱點之一。最初研究人員借助數據手套等專用儀器或硬件設備來完成數據的采集,這需要實驗人員在采集過程中始終佩戴這些專用設備,使用不便且不易推廣。近年來,隨著微軟的Kinect等非接觸式的手勢采集產品的產生,人機交互有望做到像人與人之間的信息交互一樣自然、方便和快捷。
現有手勢識別的研究方法分為兩類。一類是把人手區域先從圖像中分割出來,再進行手勢識別,其不足在于可能引入復雜的預處理環節、分割的準確性直接影響后續手勢識別的效果;另一類是從感興趣的手勢區域圖像中人工設計手勢特征,再根據提取的手勢特征識別手勢,該類方法的不足在于人工提取特征會不可避免的丟失信息且帶有一定的主觀性。尋找不受光照、種族、相似顏色干擾和人為主觀因素影響的手勢識別方法,成為一項具有挑戰性的研究課題。
發明內容
本發明所要解決的技術問題在于克服上述手勢識別方法的缺點,提供一種不受光照、種族、相似顏色背景干擾以及人為設計手勢特征的主觀性因素影響的棧式降噪自編碼神經網絡手勢圖像的識別方法。
解決上述技術問題所采用的技術方案它是由訓練步驟和測試步驟組成,訓練步驟為:
(1)對訓練樣本圖像進行預處理
包括彩圖灰度化、大小歸一化步驟。
彩圖灰度化:用(1)式對被訓練的樣本圖像進行灰度化處理,將彩色圖像轉為灰度圖像:
I=Wr×R+Wg×G+Wb×B (1)
式中I為灰度化后的亮度,R為彩色圖像的紅色分量,G為彩色圖像的綠色分量,B為彩色圖像的藍色分量,Wr為彩色圖像的紅色分量的權重,Wg為彩色圖像的綠色分量的權重,Wb為彩色圖像的藍色分量的權重。
大小歸一化:將上述灰度化后的圖像用雙三次插值法或B樣條插值法或拉格朗日插值法,歸一化為32×32的圖像,像素總個數為322。
(2)訓練第一個降噪自動編碼器
第一個降噪自動編碼器結構為:輸入層神經元個數為32×32,隱含層神經元個數為500~700,輸出層神經元個數為32×32,輸入層的每一個神經元分別與隱含層的所有神經元相連接,隱含層的每一個神經元分別與輸出層的所有神經元相連接,設定最大迭代次數,在預處理后的32×32訓練樣本圖像中加入噪聲,即個數為322×0.3像素的灰度值置為0,形成含噪聲的樣本圖像作為輸入層,輸入層與隱含層之間共(1024+1)×(500~700)個訓練參數,經過前向傳播和反向傳播,迭代訓練至最大迭代次數,得到以列序為主序的500~700維的多尺度特征和輸入層與隱含層之間1024×(500~700)維的連接權重。
(3)訓練第二個降噪自動編碼器
第二個降噪自動編碼器結構為:輸入層神經元個數為500~700,隱含層神經元個數為100~300,輸出層神經元個數為500~700,輸入層的每一個神經元分別與隱含層的所有神經元相連接,隱含層的每一個神經元分別與輸出層的所有神經元相連接,設定最大迭代次數,在500~700維的多尺度特征中加入噪聲,即個數為(500~700)×0.3像素的灰度值置為0,形成輸入層,輸入層與隱含層之間共((500~700)+1)×(100~300)個訓練參數,經過前向傳播和反向傳播,迭代訓練至最大迭代次數,得到以列序為主序的100~300維的多尺度特征和輸入層與隱含層之間(500~700)×(100~300)維的連接權重。
(4)訓練用于分類的棧式降噪自編碼神經網絡
用訓練好的第一個降噪自動編碼器中輸入層與隱含層的權重初始化棧式降噪自編碼神經網絡中第一層每一個神經元分別與第二層中所有神經元的連接權重,用訓練好的第二個降噪自動編碼器的權重初始化棧式降噪自編碼神經網絡中第二層的每一個神經元分別與第三層中所有神經元的連接權重,將訓練樣本輸入到棧式降噪自編碼神經網絡中,經前向傳播提取訓練樣本的多尺度特征,把多尺度特征輸入到Softmax分類器中,Softmax分類器按照式(2)進行計算,得到的結果與樣本標簽的誤差值進行反向傳播,調整網絡的權重直至最大迭代次數,得到訓練好的棧式降噪自編碼神經網絡。
式中,x為樣本圖像,k為總類別數,zk為樣本x屬于類別k的概率,w為第三層與Softmax
分類器之間的連接權重矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西師范大學,未經陜西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611180941.3/2.html,轉載請聲明來源鉆瓜專利網。





