[發(fā)明專利]基于深度學(xué)習(xí)的手勢識別方法及設(shè)備在審
| 申請?zhí)枺?/td> | 201910242356.9 | 申請日: | 2019-03-28 |
| 公開(公告)號: | CN109977875A | 公開(公告)日: | 2019-07-05 |
| 發(fā)明(設(shè)計(jì))人: | 袁飛;華仁紅;馬向軍;孫文鳳 | 申請(專利權(quán))人: | 北京易達(dá)圖靈科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 王慶龍;馬英迪 |
| 地址: | 100013 北京市朝*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 手勢識別 技術(shù)效果 輸出結(jié)果 圖像輸入 圖像樣本 網(wǎng)絡(luò)訓(xùn)練 小目標(biāo) 子圖像 構(gòu)建 漏檢 魯棒 誤檢 學(xué)習(xí) 標(biāo)注 手勢 圖像 | ||
1.一種基于深度學(xué)習(xí)的手勢識別方法,其特征在于,包括:
將待識別圖像輸入預(yù)先構(gòu)建的手勢識別模型;其中,所述手勢識別模型基于預(yù)先標(biāo)注的圖像樣本和YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練獲得;
基于手勢識別模型的輸出結(jié)果,獲得待識別圖像中包含手勢的子圖像。
2.根據(jù)權(quán)利要求1所述的手勢識別方法,其特征在于,將待識別圖像輸入預(yù)先構(gòu)建的手勢識別模型,之前還包括:
獲取第一圖像樣本集,并對第一圖像樣本集進(jìn)行標(biāo)注;
基于標(biāo)注的第一圖像樣本集和YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練獲得手勢識別模型。
3.根據(jù)權(quán)利要求2所述的手勢識別方法,其特征在于,基于標(biāo)注的第一圖像樣本集和YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練獲得手勢識別模型,之前還包括:
調(diào)整YOLOv3網(wǎng)絡(luò)層輸入大小,使網(wǎng)絡(luò)層提取到的手勢特征信息增加;
修改最后一層拼接層route的參數(shù);
修改上采樣層upsampe層的參數(shù)。
4.根據(jù)權(quán)利要求3所述的手勢識別方法,其特征在于,基于標(biāo)注的第一圖像樣本集和YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練獲得手勢識別模型,之前還包括:
在YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)上添加focus loss損失函數(shù)。
5.根據(jù)權(quán)利要求4所述的手勢識別方法,其特征在于,基于標(biāo)注的第一圖像樣本集和YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練獲得手勢識別模型,包括:
基于標(biāo)注的第一圖像樣本集和YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練獲得手勢識別模型,直至loss不再下降為止。
6.根據(jù)權(quán)利要求5所述的手勢識別方法,其特征在于,基于標(biāo)注的第一圖像樣本集和YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練獲得手勢識別模型,之后還包括:
獲取真實(shí)場景中的圖像樣本,作為第二圖像樣本集;
對第二圖像樣本集進(jìn)行標(biāo)注;
基于標(biāo)注后的第二圖像樣本集,對手勢識別模型進(jìn)行調(diào)整訓(xùn)練。
7.根據(jù)權(quán)利要求5所述的手勢識別方法,其特征在于,基于標(biāo)注的第一圖像樣本集和YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練獲得手勢識別模型,之后還包括:
基于手勢識別模型的識別準(zhǔn)確率和速度,對手勢識別模型的輸入大小進(jìn)行調(diào)整。
8.根據(jù)權(quán)利要求2所述的手勢識別方法,其特征在于,第一圖像樣本集包括攝像設(shè)備采集的圖片、網(wǎng)上下載的公共圖片和經(jīng)過圖像處理技術(shù)擴(kuò)充的圖片。
9.一種基于深度學(xué)習(xí)的手勢識別設(shè)備,其特征在于,包括:
輸入模塊,用于將待識別圖像輸入預(yù)先構(gòu)建的手勢識別模型;其中,所述手勢識別模型基于預(yù)先標(biāo)注的圖像樣本和YOLOv3深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練獲得;
獲取模塊,用于基于手勢識別模型的輸出結(jié)果,獲得待識別圖像中包含手勢的子圖像。
10.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至8任一項(xiàng)所述手勢識別方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京易達(dá)圖靈科技有限公司,未經(jīng)北京易達(dá)圖靈科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910242356.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 手勢識別方法、裝置和系統(tǒng)
- 一種結(jié)合二進(jìn)制編碼和類-Hausdorff距離的手勢識別方法
- 手勢識別裝置、設(shè)備及手勢識別裝置的控制方法
- 用于使用手勢識別器處理輸入的設(shè)備和方法
- 基于手勢識別手套的手勢識別方法、系統(tǒng)及手勢識別手套
- 手勢識別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)手勢識別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種手勢識別方法及終端設(shè)備
- 一種手勢識別方法以及相關(guān)裝置
- 手勢識別方法、系統(tǒng)、介質(zhì)及設(shè)備





