[發(fā)明專利]手勢(shì)識(shí)別方法、系統(tǒng)、介質(zhì)及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202110485424.1 | 申請(qǐng)日: | 2021-04-30 |
| 公開(公告)號(hào): | CN113011403A | 公開(公告)日: | 2021-06-22 |
| 發(fā)明(設(shè)計(jì))人: | 韋天健;王忱 | 申請(qǐng)(專利權(quán))人: | 恒睿(重慶)人工智能技術(shù)研究院有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06T7/13 |
| 代理公司: | 北京瀚仁知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11482 | 代理人: | 屠曉旭;宋寶庫 |
| 地址: | 401121 重慶市渝北*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 手勢(shì) 識(shí)別 方法 系統(tǒng) 介質(zhì) 設(shè)備 | ||
1.一種手勢(shì)識(shí)別方法,其特征在于,所述方法包括:
獲取在不同場(chǎng)景下不同類別手勢(shì)的視頻;
針對(duì)每類手勢(shì),從每類手勢(shì)對(duì)應(yīng)的每個(gè)場(chǎng)景下的視頻中分別采集多幀圖像,根據(jù)每幀所述圖像中關(guān)于手勢(shì)的圖像特征與所述手勢(shì)的類別生成每幀所述圖像的圖像標(biāo)簽,以及根據(jù)每幀所述圖像以及相應(yīng)的圖像標(biāo)簽構(gòu)建每類手勢(shì)的手勢(shì)識(shí)別訓(xùn)練集;
采用每類手勢(shì)的手勢(shì)識(shí)別訓(xùn)練集對(duì)分類識(shí)別模型進(jìn)行訓(xùn)練,以獲取手勢(shì)分類識(shí)別模型;
采用所述手勢(shì)分類識(shí)別模型對(duì)待檢測(cè)圖像進(jìn)行手勢(shì)識(shí)別。
2.根據(jù)權(quán)利要求1所述的手勢(shì)識(shí)別方法,其特征在于,在“根據(jù)每幀所述圖像中關(guān)于手勢(shì)的圖像特征與所述手勢(shì)的類別生成每幀所述圖像的圖像標(biāo)簽”的步驟之前,所述手勢(shì)識(shí)別方法還包括:
將所述采集的多幀圖像輸入至手部關(guān)鍵點(diǎn)檢測(cè)模型,分別獲得每幀所述圖像中每個(gè)手部的手部關(guān)鍵點(diǎn)的位置信息;
將所述手部關(guān)鍵點(diǎn)的位置信息作為所述關(guān)于手勢(shì)的圖像特征;
或者,
在“根據(jù)每幀所述圖像中關(guān)于手勢(shì)的圖像特征與所述手勢(shì)的類別生成每幀所述圖像的圖像標(biāo)簽”的步驟之前,所述方法還包括:
采用手部形狀檢測(cè)模型分別對(duì)每幀所述圖像中的每個(gè)手部進(jìn)行手部邊緣檢測(cè),以獲取每個(gè)手部的形狀特征;
將所述手部的形狀特征作為所述關(guān)于手勢(shì)的圖像特征。
3.根據(jù)權(quán)利要求1所述的手勢(shì)識(shí)別方法,其特征在于,“從每類手勢(shì)對(duì)應(yīng)的每個(gè)場(chǎng)景下的視頻中分別采集多幀圖像”的步驟具體為:
按照預(yù)設(shè)的時(shí)間間隔對(duì)每個(gè)場(chǎng)景下的視頻分別進(jìn)行多次圖像采集,獲得每個(gè)場(chǎng)景下的視頻對(duì)應(yīng)的多幀圖像。
4.根據(jù)權(quán)利要求2所述的手勢(shì)識(shí)別方法,其特征在于,所述手勢(shì)分類識(shí)別模型為基于YOLO模型構(gòu)建的分類識(shí)別模型或者所述手勢(shì)分類識(shí)別模型為基于SSD模型構(gòu)建的分類識(shí)別模型或者所述手勢(shì)分類識(shí)別模型為基于Faster-RCNN模型構(gòu)建的分類識(shí)別模型;
并且/或者,
所述手部關(guān)鍵點(diǎn)檢測(cè)模型為基于SRHandNet構(gòu)建的檢測(cè)模型或者所述手部關(guān)鍵點(diǎn)檢測(cè)模型為基于openPose模型構(gòu)建的檢測(cè)模型。
5.一種手勢(shì)識(shí)別系統(tǒng),其特征在于,所述系統(tǒng)包括:
視頻獲取模塊,其用于獲取在不同場(chǎng)景下不同類別手勢(shì)的視頻;
訓(xùn)練集獲取模塊,其用于針對(duì)每類手勢(shì),從每類手勢(shì)對(duì)應(yīng)的每個(gè)場(chǎng)景下的視頻中分別采集多幀圖像,根據(jù)每幀所述圖像中關(guān)于手勢(shì)的圖像特征與所述手勢(shì)的類別生成每幀所述圖像的圖像標(biāo)簽,以及根據(jù)每幀所述圖像以及相應(yīng)的圖像標(biāo)簽構(gòu)建每類手勢(shì)的手勢(shì)識(shí)別訓(xùn)練集;
模型訓(xùn)練模塊,其用于采用每類手勢(shì)的手勢(shì)識(shí)別訓(xùn)練集對(duì)分類識(shí)別模型進(jìn)行訓(xùn)練,以獲取手勢(shì)分類識(shí)別模型;
手勢(shì)識(shí)別模塊,其用于采用所述手勢(shì)分類識(shí)別模型對(duì)待檢測(cè)圖像進(jìn)行手勢(shì)識(shí)別。
6.根據(jù)權(quán)利要求5所述的手勢(shì)識(shí)別系統(tǒng),其特征在于,所述訓(xùn)練集獲取模塊包括第一圖像特征獲取子模塊和/或第二圖像特征獲取子模塊;
所述第一圖像特征獲取子模塊包括:
關(guān)鍵點(diǎn)獲取單元,其用于將所述采集的多幀圖像輸入至手部關(guān)鍵點(diǎn)檢測(cè)模型,分別獲得每幀所述圖像中每個(gè)手部的手部關(guān)鍵點(diǎn)的位置信息;
圖像特征獲取單元,其用于將所述手部關(guān)鍵點(diǎn)的位置信息作為所述關(guān)于手勢(shì)的圖像特征;
所述第二圖像特征獲取子模塊包括:
手部形狀檢測(cè)單元,其用于采用手部形狀檢測(cè)模型分別對(duì)每幀所述圖像中的每個(gè)手部進(jìn)行手部邊緣檢測(cè),以獲取每個(gè)手部的形狀特征;
圖像特征獲取單元,其用于將所述手部的形狀特征作為所述關(guān)于手勢(shì)的圖像特征。
7.根據(jù)權(quán)利要求5所述的手勢(shì)識(shí)別系統(tǒng),其特征在于,所述訓(xùn)練集獲取模塊包括圖像采集子模塊,所述圖像采集子模塊用于按照預(yù)設(shè)的時(shí)間間隔對(duì)每個(gè)場(chǎng)景下的視頻分別進(jìn)行多次圖像采集,獲得每個(gè)場(chǎng)景下的視頻對(duì)應(yīng)的多幀圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于恒睿(重慶)人工智能技術(shù)研究院有限公司,未經(jīng)恒睿(重慶)人工智能技術(shù)研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110485424.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于向計(jì)算設(shè)備提供輸入的手勢(shì)
- 一種觸摸屏操作手勢(shì)控制系統(tǒng)
- 電子裝置及手勢(shì)控制電子裝置的方法
- 虛擬手勢(shì)輸入方法和手勢(shì)采集裝置
- 一種手勢(shì)識(shí)別方法、裝置及手勢(shì)學(xué)習(xí)系統(tǒng)
- 手勢(shì)識(shí)別裝置、設(shè)備及手勢(shì)識(shí)別裝置的控制方法
- 跳轉(zhuǎn)、復(fù)選標(biāo)記和刪除手勢(shì)
- 一種基于Kinect的手勢(shì)動(dòng)作識(shí)別方法
- 一種手勢(shì)事件的識(shí)別方法、系統(tǒng)及介質(zhì)
- 一種手勢(shì)識(shí)別方法
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





