[發(fā)明專(zhuān)利]一種基于改進(jìn)VGGNet網(wǎng)絡(luò)和PCA的靜態(tài)手勢(shì)識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010532751.3 | 申請(qǐng)日: | 2020-06-12 |
| 公開(kāi)(公告)號(hào): | CN111695507B | 公開(kāi)(公告)日: | 2022-08-16 |
| 發(fā)明(設(shè)計(jì))人: | 謝武;賈清玉;劉滿(mǎn)意;強(qiáng)保華;崔夢(mèng)銀;瞿元昊 | 申請(qǐng)(專(zhuān)利權(quán))人: | 桂林電子科技大學(xué) |
| 主分類(lèi)號(hào): | G06V40/20 | 分類(lèi)號(hào): | G06V40/20;G06V40/10;G06V10/77;G06V10/764;G06V10/82;G06N3/04;G06N3/08;G06F16/51;G06F16/55;G06F16/583 |
| 代理公司: | 桂林市華杰專(zhuān)利商標(biāo)事務(wù)所有限責(zé)任公司 45112 | 代理人: | 陸夢(mèng)云 |
| 地址: | 541004 廣西*** | 國(guó)省代碼: | 廣西;45 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) vggnet 網(wǎng)絡(luò) pca 靜態(tài) 手勢(shì) 識(shí)別 方法 | ||
本發(fā)明公開(kāi)了一種基于改進(jìn)VGGNet網(wǎng)絡(luò)的靜態(tài)手勢(shì)識(shí)別方法,該方法將VGGNet網(wǎng)絡(luò)進(jìn)行改進(jìn),使用不同的分支來(lái)學(xué)習(xí)標(biāo)簽信息,同時(shí)在網(wǎng)絡(luò)中引入哈希層將手勢(shì)圖像的特征投影到漢明空間,通過(guò)計(jì)算漢明距離來(lái)提高處理手勢(shì)的效率。將改進(jìn)后的VGGNet網(wǎng)絡(luò)和傳統(tǒng)的主成分分析方法相結(jié)合來(lái)進(jìn)行手勢(shì)識(shí)別,首先將原始數(shù)據(jù)集和增強(qiáng)后的數(shù)據(jù)集作為輸入數(shù)據(jù)對(duì)VGGNet網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到手勢(shì)圖像的高維特征,然后通過(guò)主成分分析法PCA將高維圖像特征進(jìn)行降維,減小特征向量長(zhǎng)度,縮短圖像之間的相似性度量的計(jì)算時(shí)間,從而提高提高手勢(shì)識(shí)別的精度和效率。
技術(shù)領(lǐng)域
本發(fā)明涉及一種靜態(tài)手勢(shì)識(shí)別方法,具體是一種基于改進(jìn)VGGNet網(wǎng)絡(luò)和PCA的靜態(tài)手勢(shì)識(shí)別方法。
背景技術(shù)
20世紀(jì)90年代,為了解決人工標(biāo)注方式存在的問(wèn)題,研究人員開(kāi)始將特征提取的目光轉(zhuǎn)向圖像內(nèi)容的本身,于是一系列基于內(nèi)容的圖像識(shí)別方法開(kāi)始被提出并廣泛應(yīng)用。為了準(zhǔn)確的描述圖像的特征,早期的CBIR技術(shù)大多數(shù)使用全局視覺(jué)特征來(lái)進(jìn)行圖像的描述。這種特征描述方式比較簡(jiǎn)潔,使用者可以很方便高效的進(jìn)行圖像檢索。但是,由于這種方法提取的是圖像低層視覺(jué)特征,當(dāng)遇到外界因素的干擾,如光照強(qiáng)度、遮擋、形變等惡劣條件時(shí),此時(shí)無(wú)法準(zhǔn)確提取到圖像的有效特征。近年來(lái),隨著CNN在計(jì)算機(jī)視覺(jué)領(lǐng)域獲得巨大成功,基于深度學(xué)習(xí)的圖像特征提取方法開(kāi)始流行起來(lái)。
手勢(shì)識(shí)別作為人機(jī)交互的一種重要的方式,隨著科技的發(fā)展已經(jīng)開(kāi)始步入人類(lèi)的生活并且在一些特殊的場(chǎng)合達(dá)到了比人類(lèi)與機(jī)器通過(guò)鍵盤(pán)鼠標(biāo)交互更好的效果,大大方便了人類(lèi)的生活,提升了生活質(zhì)量。目前人類(lèi)已經(jīng)步入大數(shù)據(jù)時(shí)代,傳統(tǒng)的手勢(shì)識(shí)別方法在面對(duì)海量以及各種外界條件影響的狀態(tài)下識(shí)別往往不盡人意。
發(fā)明內(nèi)容
本發(fā)明的目的是為了提高手勢(shì)識(shí)別的精度和效率,而提供一種基于改進(jìn)VGGNet網(wǎng)絡(luò)和PCA的靜態(tài)手勢(shì)識(shí)別方法。
實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案是:
一種基于改進(jìn)VGGNet網(wǎng)絡(luò)和PCA的靜態(tài)手勢(shì)識(shí)別方法,包括如下步驟:
(1)輸入原始圖像I(x,y);
(2)預(yù)估出每個(gè)位置的噪聲,并剔除;假設(shè)人眼看到的圖像I是圖像光照分量L和反射率分量R的乘積,具體表示如公式1所示:
I(x,y)=R(x,y)·L(x,y) (1)
(3)分離三個(gè)顏色通道空間分量并轉(zhuǎn)化到對(duì)數(shù)域;從所拍攝的圖片I中合理計(jì)算出光照L,保留住物體的固有屬性R,并對(duì)公式1兩邊取對(duì)數(shù),然后令i(x,y)=log(I(x,y)),r(x,y)=log(R(x,y)),l(x,y)=log(L(x,y))可得到公式2:
i(x,y)=r(x,y)+l(x,y) (2)
(4)設(shè)置高斯函數(shù)尺度的個(gè)數(shù)及大小;
(5)高斯函數(shù)對(duì)圖像的三個(gè)通道進(jìn)行濾波,濾波后的圖像就是光照分量,獲取圖像r(x,y);反射分量計(jì)算公式如下:
ri(x,y)=ii(x,y)-ii(x,y)*G(x,y) (3)
其中,ii(x,y)表示第i個(gè)通道的原始圖像,G(x,y)為高斯濾波函數(shù),ri(x,y)表示第i個(gè)通道的反射分量,*代表卷積,σ為尺度參數(shù);
(6)采用多尺度的Retinex算法對(duì)手勢(shì)圖像進(jìn)行數(shù)據(jù)增強(qiáng);
(7)構(gòu)建基于VGGNet網(wǎng)絡(luò)結(jié)構(gòu):采用VGGNet16網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,對(duì)VGGNet16進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)定義及初始化,設(shè)置學(xué)習(xí)率lr、批大小batch和迭代輪次epochs等;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于桂林電子科技大學(xué),未經(jīng)桂林電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010532751.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種基于VGGNet的人數(shù)估計(jì)方法
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的監(jiān)控視頻車(chē)輛檢測(cè)與識(shí)別方法
- 一種基于計(jì)算機(jī)視覺(jué)與機(jī)器學(xué)習(xí)的管道缺陷識(shí)別方法
- 基于改進(jìn)VGGNet的動(dòng)作識(shí)別方法及裝置、存儲(chǔ)介質(zhì)和終端
- 一種基于VGGNet和ResNet的圖像分類(lèi)方法
- 一種圖像處理與深度學(xué)習(xí)的嵌入式遠(yuǎn)紅外行人檢測(cè)方法
- 基于VGGNet-SVM的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法
- 一種基于改進(jìn)VGGNet網(wǎng)絡(luò)和PCA的靜態(tài)手勢(shì)識(shí)別方法
- 一種基于深度學(xué)習(xí)的印刷質(zhì)量分類(lèi)方法
- 一種基于深度學(xué)習(xí)的金屬斷口圖像識(shí)別的方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





