[發明專利]棧式降噪自編碼神經網絡手勢圖像的識別方法在審
| 申請號: | 201611180941.3 | 申請日: | 2016-12-20 |
| 公開(公告)號: | CN106803062A | 公開(公告)日: | 2017-06-06 |
| 發明(設計)人: | 馬苗;朱青青;郭敏;武杰 | 申請(專利權)人: | 陜西師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 西安永生專利代理有限責任公司61201 | 代理人: | 申忠才 |
| 地址: | 710062 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 棧式降噪 編碼 神經網絡 手勢 圖像 識別 方法 | ||
1.一種棧式降噪自編碼神經網絡手勢圖像的識別方法,其特征在于它是由訓練步驟和測試步驟組成,所述的訓練步驟為:
(1)對訓練樣本圖像進行預處理
包括彩圖灰度化、大小歸一化步驟;
彩圖灰度化:用(1)式對被訓練的樣本圖像進行灰度化處理,將彩色圖像轉為灰度圖像:
I=Wr×R+Wg×G+Wb×B (1)
式中I為灰度化后的亮度,R為彩色圖像的紅色分量,G為彩色圖像的綠色分量,B為彩色圖像的藍色分量,Wr為彩色圖像的紅色分量的權重,Wg為彩色圖像的綠色分量的權重,Wb為彩色圖像的藍色分量的權重;
大小歸一化:將上述灰度化后的圖像用雙三次插值法或B樣條插值法或拉格朗日插值法,歸一化為32×32的圖像,像素總個數為322;
(2)訓練第一個降噪自動編碼器
第一個降噪自動編碼器結構為:輸入層神經元個數為32×32,隱含層神經元個數為500~700,輸出層神經元個數為32×32,輸入層的每一個神經元分別與隱含層的所有神經元相連接,隱含層的每一個神經元分別與輸出層的所有神經元相連接,設定最大迭代次數,在預處理后的32×32訓練樣本圖像中加入噪聲,即個數為322×0.3像素的灰度值置為0,形成含噪聲的樣本圖像作為輸入層,輸入層與隱含層之間共(1024+1)×(500~700)個訓練參數,經過前向傳播和反向傳播,迭代訓練至最大迭代次數,得到以列序為主序的500~700維的多尺度特征和輸入層與隱含層之間1024×(500~700)維的連接權重;
(3)訓練第二個降噪自動編碼器
第二個降噪自動編碼器結構為:輸入層神經元個數為500~700,隱含層神經元個數為100~300,輸出層神經元個數為500~700,輸入層的每一個神經元分別與隱含層的所有神經元相連接,隱含層的每一個神經元分別與輸出層的所有神經元相連接,設定最大迭代次數,在500~700維的多尺度特征中加入噪聲,即個數為(500~700)×0.3像素的灰度值置為0,形成輸入層,輸入層與隱含層之間共((500~700)+1)×(100~300)個訓練參數,經過前向傳播和反向傳播,迭代訓練至最大迭代次數,得到以列序為主序的100~300維的多尺度特征和輸入層與隱含層之間(500~700)×(100~300)維的連接權重;
(4)訓練用于分類的棧式降噪自編碼神經網絡
用訓練好的第一個降噪自動編碼器中輸入層與隱含層的權重初始化棧式降噪自編碼神經網絡中第一層每一個神經元分別與第二層中所有神經元的連接權重,用訓練好的第二個降噪自動編碼器的權重初始化棧式降噪自編碼神經網絡中第二層的每一個神經元分別與第三層中所有神經元的連接權重,將訓練樣本輸入到棧式降噪自編碼神經網絡中,經前向傳播提取訓練樣本的多尺度特征,把多尺度特征輸入到Softmax分類器中,Softmax分類器按照式(2)進行計算,得到的結果與樣本標簽的誤差值進行反向傳播,調整網絡的權重直至最大迭代次數,得到訓練好的棧式降噪自編碼神經網絡;
式中,x為樣本圖像,k為總類別數,zk為樣本x屬于類別k的概率,w為第三層與Softmax
分類器之間的連接權重矩陣;
所述的測試步驟為:
(1)對測試樣本圖像進行預處理
測試樣本圖像進行預處理與訓練樣本圖像進行預處理步驟(1)相同;
(2)對輸入的測試樣本圖像進行識別
將預處理后的測試樣本輸入到棧式降噪自編碼神經網絡中,經前向傳播提取訓練樣本的多尺度特征,把多尺度特征輸入到Softmax分類器中,計算出該樣本所屬a、b、c、d、e、f、g、h、i、k、l、m、n、o、p、q、r、s、t、u、v、w、x、y共24個英文字母的每個字母的概率,得到一個由概率值組成的24維向量,置概率值最大的位置值為1,其余位置值為0,1所在的位置為所屬的類別,[1 0 0…0]中1所在的位置為第1位,表示該樣本屬于第1類,表示手勢字母a;[0 1 0…0]中1所在的位置為第2位,表示該樣本屬于第2類,表示手勢字母b;…;[0 0 0 0 0 0 0 0 1 0…]中1所在的位置為第9位,表示該樣本屬于第9類,表示手勢字母i;[0 0 0 0 0 0 0 0 0 1 0…]中1所在的位置為第10位,表示該樣本屬于第10類,表示手勢字母k;…;[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1]中1所在的位置為第24位,表示該樣本屬于第24類,表示手勢字母y。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西師范大學,未經陜西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611180941.3/1.html,轉載請聲明來源鉆瓜專利網。





