[發(fā)明專利]一種基于改進(jìn)聚合通道特征的手部檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201711077703.4 | 申請(qǐng)日: | 2017-11-06 |
| 公開(公告)號(hào): | CN107977604B | 公開(公告)日: | 2021-01-05 |
| 發(fā)明(設(shè)計(jì))人: | 簡(jiǎn)琤峰;張美玉 | 申請(qǐng)(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/46;G06K9/62;G06F3/01 |
| 代理公司: | 杭州賽科專利代理事務(wù)所(普通合伙) 33230 | 代理人: | 郭薇 |
| 地址: | 310014 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) 聚合 通道 特征 檢測(cè) 方法 | ||
本發(fā)明涉及一種基于改進(jìn)聚合通道特征的手部檢測(cè)方法,通過(guò)采集到的若干圖像構(gòu)建數(shù)據(jù)集,改進(jìn)聚合通道特征,訓(xùn)練并輸出Xgboost模型,作為檢測(cè)模塊;采集待檢測(cè)圖像后,基于改進(jìn)的聚合通道特征和訓(xùn)練得到的Xgboost模型,對(duì)圖像進(jìn)行檢測(cè),得到其中的手部圖像。本發(fā)明作為基于計(jì)算機(jī)視覺(jué)的手部檢測(cè),具有更好的推廣潛力和價(jià)值,成本低、更為便利,同時(shí)結(jié)合了改進(jìn)ACF、色彩空間膚色模型、Edge Boxes和Xgboost,從而提高了檢測(cè)系統(tǒng)的準(zhǔn)確率,精度高、檢測(cè)性能好。
技術(shù)領(lǐng)域
本發(fā)明涉及用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置的技術(shù)領(lǐng)域,特別涉及一種有助于人機(jī)交互與計(jì)算機(jī)視覺(jué)領(lǐng)域開發(fā)的基于改進(jìn)聚合通道特征的手部檢測(cè)方法。
背景技術(shù)
在人機(jī)交互領(lǐng)域,人機(jī)交互一般依賴于鍵盤、鼠標(biāo)、觸摸屏等設(shè)備進(jìn)行,與前述設(shè)備相比之下,采用手部檢測(cè)、依靠手部的動(dòng)作來(lái)進(jìn)行人機(jī)交互可以明顯降低計(jì)算機(jī)等智能設(shè)備的使用門檻,且擁有更高的靈活性。
手部檢測(cè)根據(jù)數(shù)據(jù)采集方式可分為兩種,分別是基于數(shù)據(jù)手套和基于計(jì)算機(jī)視覺(jué)。基于數(shù)據(jù)手套利用使用者佩戴的特定設(shè)備采集數(shù)據(jù),可以達(dá)到較高的精度;而基于計(jì)算機(jī)視覺(jué)則是利用攝像頭采集圖像數(shù)據(jù),然后通過(guò)對(duì)圖像數(shù)據(jù)的分析,處理檢測(cè)任務(wù)。從便利性和成本角度考慮,由于數(shù)據(jù)手套等特定設(shè)備往往需要更高的成本,且特定設(shè)備的佩戴可能對(duì)人機(jī)交互的過(guò)程造成不舒適的體驗(yàn),所以綜合來(lái)看,基于計(jì)算機(jī)視覺(jué)的手部檢測(cè)具有更好的推廣潛力和價(jià)值。
除此之外,基于計(jì)算機(jī)視覺(jué)的手部檢測(cè)方法,其根據(jù)處理維度的不同又可以分為三維和二維兩種。三維的手部檢測(cè)方法一般使用多目攝像頭,獲取圖像的深度信息,以此獲得更為豐富的特征信息,然而,此類方法存在建模難度高、計(jì)算量大、硬件成本高的問(wèn)題;而二維的手部檢測(cè)方法只采用單目攝像頭獲取數(shù)據(jù),利用具有高精度、性能的數(shù)據(jù)處理方法,實(shí)現(xiàn)較高的檢測(cè)效果,然而,現(xiàn)有的基于二維計(jì)算機(jī)視覺(jué)的手部檢測(cè)識(shí)別方法存在精度低、性能差的問(wèn)題,尤其是在圖像中存在噪聲及背景中存在類膚色物體的情況下。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于改進(jìn)聚合通道特征的手部檢測(cè)方法。
本發(fā)明的技術(shù)方案為,一種基于改進(jìn)聚合通道特征的手部檢測(cè)方法,所述手部檢測(cè)方法包括以下步驟:
步驟1.1:利用攝像頭采集若干圖像,構(gòu)建數(shù)據(jù)集;
步驟1.2:基于步驟1.1的數(shù)據(jù)集,改進(jìn)聚合通道特征;訓(xùn)練并輸出Xgboost模型;
步驟1.3:利用攝像頭采集待檢測(cè)圖像;
步驟1.4:基于步驟1.2改進(jìn)的聚合通道特征和訓(xùn)練得到的Xgboost模型,檢測(cè)步驟1.3的待檢測(cè)圖像,得到其中的手部圖像,重復(fù)步驟1.3。
優(yōu)選地,所述步驟1.1中,若干圖像為包括手部的圖像。
優(yōu)選地,所述步驟1.1中,若干圖像至少具備以下條件:包含圖像噪聲、圖像背景中存在類膚色像素、光照條件覆蓋光強(qiáng)為大于300LX,手部位置可覆蓋所有圖像的任一像素。
優(yōu)選地,所述步驟1.1中,若干圖像的手部具有可描繪輪廓。
優(yōu)選地,所述步驟1.2中,具體包括以下步驟:
步驟1.2.1:基于步驟1.1的數(shù)據(jù)集,獲取圖像的樣本,通過(guò)計(jì)算交并比值,判斷定義樣本為正樣本或負(fù)樣本;
步驟1.2.2:將數(shù)據(jù)集的圖像轉(zhuǎn)換為YCbCr模式和HSV模式,分別取得Cb-Cr分量平面和H分量;
步驟1.2.3:利用結(jié)構(gòu)化邊緣檢測(cè)算法,獲得數(shù)據(jù)集的圖像的邊緣概率圖,并利用邊緣概率圖得到6個(gè)方向的邊緣概率直方圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711077703.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





