[發(fā)明專利]一種基于神經(jīng)網(wǎng)絡(luò)的三維手部姿態(tài)估計方法有效
| 申請?zhí)枺?/td> | 202110052293.8 | 申請日: | 2021-01-15 |
| 公開(公告)號: | CN112836594B | 公開(公告)日: | 2023-08-08 |
| 發(fā)明(設(shè)計)人: | 李斌;劉宇馨;彭進業(yè);范建平;張薇;樂明楠;李紅穎 | 申請(專利權(quán))人: | 西北大學(xué) |
| 主分類號: | G06V20/64 | 分類號: | G06V20/64;G06V40/20;G06V10/46;G06V10/774;G06V10/82;G06N3/0464 |
| 代理公司: | 西安恒泰知識產(chǎn)權(quán)代理事務(wù)所 61216 | 代理人: | 李鄭建 |
| 地址: | 710069 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 神經(jīng)網(wǎng)絡(luò) 三維 姿態(tài) 估計 方法 | ||
1.一種基于神經(jīng)網(wǎng)絡(luò)的三維手部姿態(tài)估計方法,其特征在于,按下列步驟進行:
步驟一,數(shù)據(jù)預(yù)處理:首先將數(shù)據(jù)集中所需要的手部位置信息、二維關(guān)鍵點坐標、三維關(guān)鍵點坐標等信息用matlab處理成二值化信息,以便于后續(xù)減少后續(xù)網(wǎng)絡(luò)計算量與訓(xùn)練時間、運算成本;
步驟二,為了更好的估計圖像中的手的三維姿態(tài),需要先獲得手部在圖像中的位置信息,用VGG16網(wǎng)絡(luò)前十層提取圖像特征;
所述手部在圖像中的位置信息的獲得方法是:
1)HandScore網(wǎng)絡(luò)首先通過VGG-16網(wǎng)絡(luò)的前十層提取圖像特征其中的信息包括圖像的顏色、紋理、形狀和空間關(guān)系的特征;
2)將編碼層提取到空間大小為W*H*512的信息進行上采樣;通過一兩通道步長為1的卷積層,得到圖像手的熱力圖信息ScoremapW*H*2,其中通道一為背景信息得分圖,通道二為手的位置信息;
步驟三,將提取的圖像上采樣至原圖大小,網(wǎng)絡(luò)用softmax+crossentropy的損失函數(shù)優(yōu)化位置信息提取手部位置信息,即Scoremap;
步驟四,為了降低圖像背景對后續(xù)姿態(tài)估計任務(wù)性能的影響,將原始圖像信息與Scoremap信息融合,以一定程度模糊去除圖像背景;
步驟五,將步驟四的結(jié)果輸入實例分割網(wǎng)絡(luò)中,以數(shù)據(jù)集中二維關(guān)鍵點為作為其真實值,得到其關(guān)鍵點的置信圖;
步驟六,將置信圖使用argmax處理后得到其二維關(guān)鍵點坐標,輸入后續(xù)二維到三維映射網(wǎng)絡(luò)中,用堆疊的方法映射出關(guān)鍵點在三維場景下的姿態(tài)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北大學(xué),未經(jīng)西北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110052293.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 一種三維彩色物品制作方法
- 三維內(nèi)容顯示的方法、裝置和系統(tǒng)
- 三維對象搜索方法、裝置及系統(tǒng)
- 三維會話數(shù)據(jù)展示方法、裝置、存儲介質(zhì)和計算機設(shè)備
- 一種三維模型處理方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 用于基于分布式賬本技術(shù)的三維打印的去中心化供應(yīng)鏈
- 標記數(shù)據(jù)的獲取方法及裝置、訓(xùn)練方法及裝置、醫(yī)療設(shè)備
- 一種基于5G網(wǎng)絡(luò)的光場三維浸入式體驗信息傳輸方法及系統(tǒng)
- 用于機器人生產(chǎn)系統(tǒng)仿真的三維場景管理與文件存儲方法
- 基于三維形狀知識圖譜的三維模型檢索方法及裝置
- 一種敏捷衛(wèi)星姿態(tài)機動確定系統(tǒng)
- 座椅自動調(diào)節(jié)方法、裝置及終端
- 調(diào)整智能交互機器人姿態(tài)的方法及智能交互機器人
- 一種用于同步軌道SAR衛(wèi)星的姿態(tài)機動軌跡計算方法
- 面部姿態(tài)調(diào)整方法、裝置和終端
- 孕婦姿態(tài)實時監(jiān)測系統(tǒng)
- 具有電磁位置跟蹤的混合姿態(tài)跟蹤系統(tǒng)
- 一種姿態(tài)估計方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種基于姿態(tài)質(zhì)量評估的自適應(yīng)人體姿態(tài)優(yōu)化方法
- 一種機器人姿態(tài)調(diào)整控制系統(tǒng)





