[發(fā)明專利]姿態(tài)估計(jì)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010176868.2 | 申請(qǐng)日: | 2020-03-13 |
| 公開(kāi)(公告)號(hào): | CN111401230A | 公開(kāi)(公告)日: | 2020-07-10 |
| 發(fā)明(設(shè)計(jì))人: | 王靖博;林達(dá)華;顏思捷;熊元俊 | 申請(qǐng)(專利權(quán))人: | 深圳市商湯科技有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京林達(dá)劉知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 518054 廣東省深圳市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 姿態(tài) 估計(jì) 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本公開(kāi)涉及一種姿態(tài)估計(jì)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì),所述方法包括:對(duì)待處理圖像幀序列在時(shí)間維度上進(jìn)行降維,確定不同時(shí)間尺度的多個(gè)第一特征圖序列;根據(jù)所述不同時(shí)間尺度的多個(gè)第一特征圖序列,確定所述待處理圖像幀序列中各待處理圖像幀對(duì)應(yīng)的姿態(tài)特征;對(duì)所述各待處理圖像幀對(duì)應(yīng)的姿態(tài)特征進(jìn)行數(shù)據(jù)處理,確定各待處理圖像幀對(duì)應(yīng)的預(yù)測(cè)三維姿態(tài)。本公開(kāi)實(shí)施例可以輸出更加平滑的預(yù)測(cè)三維姿態(tài)。
技術(shù)領(lǐng)域
本公開(kāi)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種姿態(tài)估計(jì)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù)
姿態(tài)估計(jì)是指從輸入的圖像或者視頻中,估計(jì)出骨架關(guān)節(jié)點(diǎn)的坐標(biāo)。因其廣泛的應(yīng)用場(chǎng)景,越來(lái)越受到學(xué)術(shù)界和工業(yè)界的關(guān)注,例如,智能安防,行為識(shí)別,虛擬現(xiàn)實(shí),游戲建模等場(chǎng)景都需要用到姿態(tài)估計(jì)技術(shù)。但是,由于單目傳感器采集的二維圖像中缺少景深信息,以及存在遮擋等問(wèn)題,導(dǎo)致三維姿態(tài)估計(jì)的輸出結(jié)果的動(dòng)作連貫性和準(zhǔn)確性較低。
發(fā)明內(nèi)容
本公開(kāi)提出了一種姿態(tài)估計(jì)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)的技術(shù)方案。
根據(jù)本公開(kāi)的第一方面,提供了一種姿態(tài)估計(jì)方法方法,包括:對(duì)待處理圖像幀序列在時(shí)間維度上進(jìn)行降維,確定不同時(shí)間尺度的多個(gè)第一特征圖序列;根據(jù)所述不同時(shí)間尺度的多個(gè)第一特征圖序列,確定所述待處理圖像幀序列中各待處理圖像幀對(duì)應(yīng)的姿態(tài)特征;對(duì)所述各待處理圖像幀對(duì)應(yīng)的姿態(tài)特征進(jìn)行數(shù)據(jù)處理,確定各待處理圖像幀對(duì)應(yīng)的預(yù)測(cè)三維姿態(tài)。
利用待處理圖像幀序列在時(shí)間維度上降維得到的不同時(shí)間尺度的多個(gè)第一特征圖序列來(lái)確定姿態(tài)特征,使得可以通過(guò)考慮時(shí)間維度的冗余性來(lái)提高姿態(tài)特征的準(zhǔn)確性,進(jìn)而根據(jù)姿態(tài)特征進(jìn)行三維姿態(tài)估計(jì)時(shí),可以輸出更加平滑的預(yù)測(cè)三維姿態(tài)。
在一種可能的實(shí)現(xiàn)方式中,所述對(duì)待處理圖像幀序列在時(shí)間維度上進(jìn)行降維,確定不同時(shí)間尺度的多個(gè)第一特征圖序列,包括:利用二維姿態(tài)估計(jì)算法對(duì)所述待處理圖像幀序列進(jìn)行數(shù)據(jù)處理,確定所述待處理圖像幀序列對(duì)應(yīng)的二維姿態(tài)數(shù)據(jù);對(duì)所述二維姿態(tài)數(shù)據(jù)在時(shí)間維度上進(jìn)行降維,確定所述不同時(shí)間尺度的多個(gè)第一特征圖序列。
通過(guò)確定待處理圖像幀序列對(duì)應(yīng)的二維姿態(tài)數(shù)據(jù),使得為后續(xù)在時(shí)間維度上確定不同時(shí)間尺度的多個(gè)第一特征圖序列做好了準(zhǔn)備工作。
在一種可能的實(shí)現(xiàn)方式中,所述對(duì)所述二維姿態(tài)數(shù)據(jù)在時(shí)間維度上進(jìn)行降維,確定所述不同時(shí)間尺度的多個(gè)第一特征圖序列,包括:根據(jù)所述二維姿態(tài)數(shù)據(jù),通過(guò)在時(shí)間維度上執(zhí)行多次下采樣操作,確定所述不同時(shí)間尺度的多個(gè)第一特征圖序列。
通過(guò)對(duì)待處理圖像幀序列在時(shí)間維度進(jìn)行壓縮,從而可以降低計(jì)算量,提高三維姿態(tài)估計(jì)的效率。
在一種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述不同時(shí)間尺度的多個(gè)第一特征圖序列,確定所述待處理圖像幀序列中各待處理圖像幀對(duì)應(yīng)的姿態(tài)特征,包括:根據(jù)所述不同時(shí)間尺度的多個(gè)第一特征圖序列,確定目標(biāo)時(shí)間尺度下的多個(gè)第二特征圖序列,其中,所述目標(biāo)時(shí)間尺度為所述待處理圖像幀序列對(duì)應(yīng)的時(shí)間尺度;將所述目標(biāo)時(shí)間尺度下的多個(gè)第二特征圖序列進(jìn)行特征融合,確定所述各待處理圖像幀對(duì)應(yīng)的姿態(tài)特征。
將不同時(shí)間尺度的多個(gè)第一特征圖序列均恢復(fù)到目標(biāo)時(shí)間尺度,進(jìn)而再將目標(biāo)時(shí)間尺度下的多個(gè)第二特征圖序列進(jìn)行特征融合,使得融合后的特征具有時(shí)間維度的冗余性,進(jìn)而可以得到準(zhǔn)確度較高的各待處理圖像幀對(duì)應(yīng)的姿態(tài)特征。
在一種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述不同時(shí)間尺度的多個(gè)第一特征圖序列,確定目標(biāo)時(shí)間尺度下的多個(gè)第二特征圖序列,包括:根據(jù)所述不同時(shí)間尺度的多個(gè)第一特征圖序列,通過(guò)在時(shí)間維度上執(zhí)行多次上采樣操作,確定不同時(shí)間尺度的多個(gè)第三特征圖序列;針對(duì)任一時(shí)間尺度,將該時(shí)間尺度下的第一特征圖序列和第三特征圖序列進(jìn)行特征融合,確定該時(shí)間尺度下的第四特征圖序列;針對(duì)不同時(shí)間尺度下的第四特征圖序列執(zhí)行上采樣操作,確定所述目標(biāo)時(shí)間尺度下的多個(gè)第二特征圖序列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市商湯科技有限公司,未經(jīng)深圳市商湯科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010176868.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種敏捷衛(wèi)星姿態(tài)機(jī)動(dòng)確定系統(tǒng)
- 座椅自動(dòng)調(diào)節(jié)方法、裝置及終端
- 調(diào)整智能交互機(jī)器人姿態(tài)的方法及智能交互機(jī)器人
- 一種用于同步軌道SAR衛(wèi)星的姿態(tài)機(jī)動(dòng)軌跡計(jì)算方法
- 面部姿態(tài)調(diào)整方法、裝置和終端
- 孕婦姿態(tài)實(shí)時(shí)監(jiān)測(cè)系統(tǒng)
- 具有電磁位置跟蹤的混合姿態(tài)跟蹤系統(tǒng)
- 一種姿態(tài)估計(jì)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于姿態(tài)質(zhì)量評(píng)估的自適應(yīng)人體姿態(tài)優(yōu)化方法
- 一種機(jī)器人姿態(tài)調(diào)整控制系統(tǒng)
- 一種信道估計(jì)方法和裝置
- 基于時(shí)頻聯(lián)合的載波頻偏估計(jì)方法
- 基于改進(jìn)卡爾曼濾波的變參數(shù)迭代估計(jì)方法
- 電機(jī)驅(qū)動(dòng)系統(tǒng)以及電機(jī)控制裝置
- 意圖估計(jì)裝置和意圖估計(jì)方法
- 分布式驅(qū)動(dòng)電動(dòng)汽車路面自適應(yīng)縱向車速估計(jì)系統(tǒng)及方法
- 一種分布式驅(qū)動(dòng)電動(dòng)汽車路面附著系數(shù)估計(jì)系統(tǒng)
- 視線估計(jì)方法、終端及存儲(chǔ)介質(zhì)
- 一種SNR估計(jì)方法及其估計(jì)系統(tǒng)
- 估計(jì)車輛載荷的方法
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





