[發(fā)明專(zhuān)利]基于全景3D圖像的微手勢(shì)識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810306498.2 | 申請(qǐng)日: | 2018-04-08 |
| 公開(kāi)(公告)號(hào): | CN108564020B | 公開(kāi)(公告)日: | 2021-07-13 |
| 發(fā)明(設(shè)計(jì))人: | 雷濤;加小紅;張宇嘯;李云彤 | 申請(qǐng)(專(zhuān)利權(quán))人: | 陜西科技大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/34;G06K9/46;G06K9/62 |
| 代理公司: | 西安新思維專(zhuān)利商標(biāo)事務(wù)所有限公司 61114 | 代理人: | 李罡 |
| 地址: | 710021*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 全景 圖像 手勢(shì) 識(shí)別 方法 | ||
本發(fā)明涉及基于全景3D圖像的微手勢(shì)識(shí)別方法,利用形態(tài)學(xué)濾波算法提升HoMG圖像中的水平和豎直線(xiàn)條,增強(qiáng)線(xiàn)條與背景的對(duì)比度,通過(guò)快速模糊C均值聚類(lèi)算法分割濾波圖像,檢測(cè)線(xiàn)條輪廓,根據(jù)形態(tài)學(xué)細(xì)化算法準(zhǔn)確定位線(xiàn)條位置,利用線(xiàn)條間隔的最小方差計(jì)算基準(zhǔn)坐標(biāo),構(gòu)建網(wǎng)格坐標(biāo),利用網(wǎng)格坐標(biāo)重建多張清晰的子圖像,把重建后的子圖像作為CNN模型的輸入數(shù)據(jù),從而完成微手勢(shì)識(shí)別。本發(fā)明主要解決模糊網(wǎng)格導(dǎo)致HoMG圖像識(shí)別精度低的問(wèn)題,能有效提高基于HoMG圖像的微手勢(shì)識(shí)別精度,可廣泛應(yīng)用于人機(jī)交互領(lǐng)域。
技術(shù)領(lǐng)域
本發(fā)明涉及模式識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于全景3D圖像的微手勢(shì)識(shí)別方法。
背景技術(shù)
手勢(shì)識(shí)別是人機(jī)交互的關(guān)鍵步驟,在機(jī)器視覺(jué)和虛擬現(xiàn)實(shí)中有著廣泛的應(yīng)用。目前,基于手勢(shì)識(shí)別的算法大致可分為兩類(lèi):一類(lèi)是手套采集方法;一類(lèi)是視覺(jué)識(shí)別方法;第一類(lèi)方法利用手套上的多個(gè)傳感器來(lái)記錄手勢(shì)數(shù)據(jù),雖然識(shí)別準(zhǔn)確度高,但由于手套上傳感器的限制,導(dǎo)致手勢(shì)內(nèi)容相對(duì)單一,實(shí)用性較差。第二類(lèi)方法則利用Kinect和RGB-D相機(jī)捕捉手勢(shì)的深度信息,通過(guò)挖掘深度信息進(jìn)行手勢(shì)識(shí)別,由于視覺(jué)識(shí)別具有直觀(guān)、方便等特點(diǎn),所以基于視覺(jué)的手勢(shì)識(shí)別算法越來(lái)越受到使用者的青睞。
傳統(tǒng)的手勢(shì)識(shí)別主要由三個(gè)步驟組成,即手勢(shì)分割、特征提取和分類(lèi)器選擇,其中手勢(shì)分割是為了確定手勢(shì)的大致輪廓,減少?gòu)?fù)雜背景對(duì)后續(xù)處理的干擾。特征提取是為了去除冗余信息,利用目標(biāo)特征來(lái)表示原始圖像。最后選擇合適的分類(lèi)器對(duì)特征數(shù)據(jù)進(jìn)行分類(lèi)。特征描述子和分類(lèi)器類(lèi)型較多,需憑借經(jīng)驗(yàn)選擇恰當(dāng)?shù)奶卣髅枋鲎雍头诸?lèi)器類(lèi)型。
由于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)能自動(dòng)學(xué)習(xí)圖像特征,所以CNN模型已廣泛應(yīng)用于圖像分類(lèi)和目標(biāo)檢測(cè)中。近年來(lái),學(xué)者們提出了大量改進(jìn)的CNN模型并將其應(yīng)用于手勢(shì)識(shí)別。其中,Arenas等人提出了基于區(qū)域的CNN手勢(shì)識(shí)別方法,該方法能夠?qū)崿F(xiàn)不同背景下的動(dòng)態(tài)手勢(shì)識(shí)別,但不利于微手勢(shì)的識(shí)別。等人通過(guò)聯(lián)合CNN模型和長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM),提出了CNN+LSTM的手勢(shì)識(shí)別算法,雖然該方法能獲得更高的手勢(shì)識(shí)別結(jié)果,但由于需要兩級(jí)網(wǎng)絡(luò)導(dǎo)致該方法的計(jì)算復(fù)雜度較高。針對(duì)Kinect和RGB-D相機(jī)不能捕獲圖像微小變化的問(wèn)題,Liu等人利用全景3D成像系統(tǒng)創(chuàng)建了全景3D微手勢(shì)圖庫(kù)(Holoscopic 3D Micro-Gesture,HoMG),全景3D成像系統(tǒng)是利用尺寸大小為28×28的微鏡頭陣列來(lái)采集信息,雖然每個(gè)鏡頭有效記錄了手勢(shì)的局部偏差,但也造成了HoMG圖像中模糊網(wǎng)格的出現(xiàn),由于模糊網(wǎng)格的干擾,導(dǎo)致傳統(tǒng)的特征描述子和CNN模型難以有效提取圖像特征,微手勢(shì)識(shí)別精度較低。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于全景3D圖像的微手勢(shì)識(shí)別方法,解決了現(xiàn)有技術(shù)中由于HoMG圖庫(kù)中模糊網(wǎng)格的干擾導(dǎo)致傳統(tǒng)特征描述子和CNN模型不能有效提取圖像特征的技術(shù)缺陷。
本發(fā)明所采用的技術(shù)方案為:
基于全景3D圖像的微手勢(shì)識(shí)別方法,其特征在于:
由以下步驟實(shí)現(xiàn):
首先,利用形態(tài)學(xué)濾波算法提升HoMG圖像中的水平和豎直線(xiàn)條,增強(qiáng)線(xiàn)條與背景的對(duì)比度;
其次,通過(guò)快速模糊C均值聚類(lèi)算法分割濾波圖像,檢測(cè)線(xiàn)條輪廓;
然后,根據(jù)形態(tài)學(xué)細(xì)化算法準(zhǔn)確定位線(xiàn)條位置,利用線(xiàn)條間隔的最小方差計(jì)算基準(zhǔn)坐標(biāo),構(gòu)建網(wǎng)格坐標(biāo);
最后,利用網(wǎng)格坐標(biāo)重建多張清晰的子圖像,把重建后的子圖像作為CNN模型的輸入數(shù)據(jù),從而完成微手勢(shì)識(shí)別。
具體包括以下步驟:
(1)輸入HoMG圖像f;
(2)對(duì)f進(jìn)行水平和豎直形態(tài)學(xué)濾波,得到濾波后的圖像為ξh和ξv;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于陜西科技大學(xué),未經(jīng)陜西科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810306498.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 用于向計(jì)算設(shè)備提供輸入的手勢(shì)
- 一種觸摸屏操作手勢(shì)控制系統(tǒng)
- 電子裝置及手勢(shì)控制電子裝置的方法
- 虛擬手勢(shì)輸入方法和手勢(shì)采集裝置
- 一種手勢(shì)識(shí)別方法、裝置及手勢(shì)學(xué)習(xí)系統(tǒng)
- 手勢(shì)識(shí)別裝置、設(shè)備及手勢(shì)識(shí)別裝置的控制方法
- 跳轉(zhuǎn)、復(fù)選標(biāo)記和刪除手勢(shì)
- 一種基于Kinect的手勢(shì)動(dòng)作識(shí)別方法
- 一種手勢(shì)事件的識(shí)別方法、系統(tǒng)及介質(zhì)
- 一種手勢(shì)識(shí)別方法





