[發(fā)明專(zhuān)利]估計(jì)物體姿態(tài)的方法和裝置、電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202011503824.2 | 申請(qǐng)日: | 2020-12-18 |
| 公開(kāi)(公告)號(hào): | CN114723809A | 公開(kāi)(公告)日: | 2022-07-08 |
| 發(fā)明(設(shè)計(jì))人: | 汪昊;李煒明;劉洋;考月英;王強(qiáng);金知姸;張現(xiàn)盛;洪性勳 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社 |
| 主分類(lèi)號(hào): | G06T7/70 | 分類(lèi)號(hào): | G06T7/70;G06T7/136;G06V10/44;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京銘碩知識(shí)產(chǎn)權(quán)代理有限公司 11286 | 代理人: | 張軍;曾世驍 |
| 地址: | 100028 北京市朝*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 估計(jì) 物體 姿態(tài) 方法 裝置 電子設(shè)備 | ||
本公開(kāi)提供了一種估計(jì)物體姿態(tài)的方法和裝置、電子設(shè)備,所述方法包括:通過(guò)利用單階段深度神經(jīng)網(wǎng)絡(luò)對(duì)輸入的單幀圖像進(jìn)行處理來(lái)獲得實(shí)例分割圖像和標(biāo)準(zhǔn)化物體坐標(biāo)空間NOCS圖;根據(jù)NOCS圖和實(shí)例分割圖像來(lái)獲得2D?3D映射關(guān)系;根據(jù)所述2D?3D映射關(guān)系來(lái)確定所述單幀圖像中的物體實(shí)例的姿態(tài)。同時(shí),可以使用人工智能模型來(lái)執(zhí)行上述方法。
技術(shù)領(lǐng)域
本申請(qǐng)總體說(shuō)來(lái)涉及增強(qiáng)顯示技術(shù)領(lǐng)域,更具體地講,涉及基于單階段深度神經(jīng)網(wǎng)絡(luò)估計(jì)物體的姿態(tài)的方法和裝置、電子設(shè)備。
背景技術(shù)
增強(qiáng)現(xiàn)實(shí)技術(shù)通過(guò)在用戶面前的現(xiàn)實(shí)場(chǎng)景中添加虛擬內(nèi)容來(lái)為用戶提供真實(shí)的信息體驗(yàn)。在三維(3D)空間中,增強(qiáng)現(xiàn)實(shí)技術(shù)需要對(duì)周?chē)矬w的3D狀態(tài)具有高精度的實(shí)時(shí)處理和理解,以在用戶面前呈現(xiàn)出高質(zhì)量的虛實(shí)融合效果。
為了更準(zhǔn)確地構(gòu)建3D空間中的物體實(shí)例,需要準(zhǔn)確且實(shí)時(shí)地估計(jì)物體實(shí)例的6自由度姿態(tài)和尺寸,現(xiàn)有技術(shù)中提出了諸多估計(jì)方法,例如早期提出的基于RGB-D(RGB-Depth)圖像的未知物體6自由度姿態(tài)和尺寸估計(jì)方法,該方法通過(guò)基于Mask R-CNN(Region-CNN)框架的深度網(wǎng)絡(luò)模型的輸出以及深度圖像,利用姿態(tài)擬合方法估算對(duì)象的6自由度姿態(tài)和尺寸,但是,該方法利用二階段網(wǎng)絡(luò)結(jié)構(gòu)來(lái)預(yù)測(cè)對(duì)象級(jí)的標(biāo)準(zhǔn)化物體坐標(biāo)空間(Normalized Object Coordinate Space(NOCS))圖,因此執(zhí)行速度較慢進(jìn)而難以滿足實(shí)時(shí)需求。另外,該方法依賴(lài)于RGB-D圖像輸入,在深度數(shù)據(jù)缺失或者存在噪聲時(shí)無(wú)法估計(jì)出物體實(shí)例的姿態(tài)和尺寸。為了滿足實(shí)時(shí)需求,現(xiàn)有技術(shù)提出了另一種能夠在移動(dòng)設(shè)備上實(shí)時(shí)運(yùn)行的未知物體的6自由度姿態(tài)估計(jì)方法,該方法采用了對(duì)移動(dòng)設(shè)備友好的兩個(gè)深度網(wǎng)絡(luò)模型,然而,該方法由于設(shè)計(jì)原理而只使用單幀RGB圖像,無(wú)法估計(jì)未知物體的尺寸,只能估計(jì)出尺度意義下的物體姿態(tài)。另外,現(xiàn)有技術(shù)提出了一種能夠解決實(shí)例級(jí)的物體姿態(tài)估計(jì)問(wèn)題的方法,但是該方法要求物體已知無(wú)紋理CAD模型,且該方法依賴(lài)于2D檢測(cè)模型結(jié)果,無(wú)法滿足增強(qiáng)現(xiàn)實(shí)技術(shù)應(yīng)用中實(shí)時(shí)性的需求。
因此,需要一種能夠準(zhǔn)確且實(shí)時(shí)地估計(jì)未知物體的姿態(tài)的方法和裝置。
發(fā)明內(nèi)容
為了至少解決現(xiàn)有技術(shù)中存在的上述問(wèn)題,本發(fā)明提供了一種基于單階段深度神經(jīng)網(wǎng)絡(luò)估計(jì)物體姿態(tài)的方法和裝置、電子設(shè)備。
本發(fā)明的一方面在于提供一種估計(jì)物體姿態(tài)的方法,包括:通過(guò)利用單階段深度神經(jīng)網(wǎng)絡(luò)對(duì)輸入的單幀圖像進(jìn)行處理來(lái)獲得實(shí)例分割圖像和標(biāo)準(zhǔn)化物體坐標(biāo)空間NOCS圖;根據(jù)NOCS圖和實(shí)例分割圖像來(lái)獲得2D-3D映射關(guān)系;根據(jù)所述2D-3D映射關(guān)系來(lái)確定所述單幀圖像中的物體實(shí)例的姿態(tài)。
所述方法還可包括:利用單階段深度神經(jīng)網(wǎng)絡(luò)對(duì)所述單幀圖像進(jìn)行處理來(lái)獲得像素坐標(biāo)誤差圖,其中,獲得2D-3D映射關(guān)系的步驟包括:通過(guò)利用NOCS圖和實(shí)例分割圖像來(lái)獲得在所述單幀圖像中的所述物體實(shí)例內(nèi)部的像素點(diǎn)和所述像素點(diǎn)的NOCS點(diǎn)以建立所述物體實(shí)例的初步2D-3D映射關(guān)系;以及利用像素坐標(biāo)誤差圖去除所述初步2D-3D映射關(guān)系中的異常2D-3D映射來(lái)獲得所述2D-3D映射關(guān)系。
像素坐標(biāo)誤差圖中的每個(gè)誤差值可表示針對(duì)所述單幀圖像中的每個(gè)像素點(diǎn)預(yù)測(cè)的NOCS坐標(biāo)值與真實(shí)的NOCS坐標(biāo)值之間的差異。
利用像素坐標(biāo)誤差圖去除所述初步2D-3D映射關(guān)系中的異常2D-3D映射來(lái)獲得所述2D-3D映射關(guān)系的步驟可包括:確定像素坐標(biāo)誤差圖中比預(yù)定閾值大的誤差值;從所述初步2D-3D映射關(guān)系中去除對(duì)應(yīng)于與比所述預(yù)定閾值大的誤差值相應(yīng)的NOCS點(diǎn)的2D-3D映射以獲得所述2D-3D映射關(guān)系。
利用單階段深度神經(jīng)網(wǎng)絡(luò)對(duì)輸入的單幀圖像進(jìn)行處理的步驟可包括:利用單階段深度神經(jīng)網(wǎng)絡(luò)中的特征提取模塊對(duì)所述單幀圖像進(jìn)行特征提取處理來(lái)獲得多個(gè)尺度下的圖像特征。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社,未經(jīng)北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011503824.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種信道估計(jì)方法和裝置
- 基于時(shí)頻聯(lián)合的載波頻偏估計(jì)方法
- 基于改進(jìn)卡爾曼濾波的變參數(shù)迭代估計(jì)方法
- 電機(jī)驅(qū)動(dòng)系統(tǒng)以及電機(jī)控制裝置
- 意圖估計(jì)裝置和意圖估計(jì)方法
- 分布式驅(qū)動(dòng)電動(dòng)汽車(chē)路面自適應(yīng)縱向車(chē)速估計(jì)系統(tǒng)及方法
- 一種分布式驅(qū)動(dòng)電動(dòng)汽車(chē)路面附著系數(shù)估計(jì)系統(tǒng)
- 視線估計(jì)方法、終端及存儲(chǔ)介質(zhì)
- 一種SNR估計(jì)方法及其估計(jì)系統(tǒng)
- 估計(jì)車(chē)輛載荷的方法
- 一種敏捷衛(wèi)星姿態(tài)機(jī)動(dòng)確定系統(tǒng)
- 座椅自動(dòng)調(diào)節(jié)方法、裝置及終端
- 調(diào)整智能交互機(jī)器人姿態(tài)的方法及智能交互機(jī)器人
- 一種用于同步軌道SAR衛(wèi)星的姿態(tài)機(jī)動(dòng)軌跡計(jì)算方法
- 面部姿態(tài)調(diào)整方法、裝置和終端
- 孕婦姿態(tài)實(shí)時(shí)監(jiān)測(cè)系統(tǒng)
- 具有電磁位置跟蹤的混合姿態(tài)跟蹤系統(tǒng)
- 一種姿態(tài)估計(jì)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于姿態(tài)質(zhì)量評(píng)估的自適應(yīng)人體姿態(tài)優(yōu)化方法
- 一種機(jī)器人姿態(tài)調(diào)整控制系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





