[發(fā)明專利]一種多模態(tài)位姿優(yōu)化的語義三維重建方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202310181777.1 | 申請(qǐng)日: | 2023-02-21 |
| 公開(公告)號(hào): | CN116342800B | 公開(公告)日: | 2023-10-24 |
| 發(fā)明(設(shè)計(jì))人: | 孫慶偉;晁建剛;陳煒;林萬洪;許振瑛;胡福超 | 申請(qǐng)(專利權(quán))人: | 中國航天員科研訓(xùn)練中心;中國人民解放軍戰(zhàn)略支援部隊(duì)航天工程大學(xué) |
| 主分類號(hào): | G06T17/00 | 分類號(hào): | G06T17/00 |
| 代理公司: | 北京安博達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11271 | 代理人: | 徐國文 |
| 地址: | 100094 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多模態(tài)位姿 優(yōu)化 語義 三維重建 方法 系統(tǒng) | ||
本發(fā)明屬于語義三維重建技術(shù)領(lǐng)域,具體涉及一種多模態(tài)位姿優(yōu)化的語義三維重建方法及系統(tǒng),該方法包括:采集目標(biāo)區(qū)域的RGB圖像和深度圖像;對(duì)RGB圖像進(jìn)行語義分割,獲取RGB圖像的最終掩碼圖;利用RGB圖像、深度圖像和最終掩碼圖,獲取RGB圖像的全局位姿;根據(jù)深度圖像和RGB圖像的全局位姿獲取全局語義三維點(diǎn)云。本申請(qǐng)?zhí)峁┑募夹g(shù)方案,不僅對(duì)算力要求較低,適用性廣,而且提高了語義三維重建的實(shí)時(shí)性和效率。
技術(shù)領(lǐng)域
本發(fā)明屬于語義三維重建技術(shù)領(lǐng)域,具體涉及一種多模態(tài)位姿優(yōu)化的語義三維重建方法及系統(tǒng)。
背景技術(shù)
語義三維重建是對(duì)三維重建模型進(jìn)行語義標(biāo)注,將具有不同類別屬性的結(jié)構(gòu)從整體模型中分割,方便下游任務(wù)使用。決定語義三維重建質(zhì)量的重要因素之一是相機(jī)位姿的計(jì)算,關(guān)系到重建模型的優(yōu)劣和語義信息的分布。目前算法中的定位采用純幾何特征,需要設(shè)計(jì)復(fù)雜的篩選機(jī)制確定匹配點(diǎn)。語義三維重建可以劃分為語義分割、三維重建、語義映射三個(gè)部分,其中三維重建包括位姿計(jì)算和建圖。
現(xiàn)有算法中各部分相對(duì)獨(dú)立,通過松耦合的方式進(jìn)行數(shù)據(jù)通信,如語義三維重建多采用基于GPU的稠密ICP算法計(jì)算相機(jī)位姿,同時(shí)語義分割也需要占用GPU資源,不得不在運(yùn)行效率上做出妥協(xié),整個(gè)框架過于繁重,全局優(yōu)化的規(guī)模較大。因此,目前的語義三維重建算法采用的語義分割和重建方法實(shí)時(shí)性不好,對(duì)算力要求較高,對(duì)算法整體運(yùn)行造成較大負(fù)擔(dān),需要高性能計(jì)算機(jī)才能順暢運(yùn)行。
發(fā)明內(nèi)容
為至少在一定程度上克服相關(guān)技術(shù)中存在的問題,本申請(qǐng)?zhí)峁┮环N多模態(tài)位姿優(yōu)化的語義三維重建方法及系統(tǒng)。
根據(jù)本申請(qǐng)實(shí)施例的第一方面,提供一種多模態(tài)位姿優(yōu)化的語義三維重建方法,所述方法包括:
采集目標(biāo)區(qū)域的RGB圖像和深度圖像;
對(duì)RGB圖像進(jìn)行語義分割,獲取所述RGB圖像的最終掩碼圖;
利用所述RGB圖像、所述深度圖像和所述最終掩碼圖,獲取RGB圖像的全局位姿;
根據(jù)所述深度圖像和所述RGB圖像的全局位姿獲取全局語義三維點(diǎn)云。
優(yōu)選的,所述對(duì)RGB圖像進(jìn)行語義分割,獲取所述RGB圖像的最終掩碼圖,包括:
利用基于深度學(xué)習(xí)的STDC網(wǎng)絡(luò),對(duì)RGB圖像進(jìn)行語義分割,得到RGB圖像中各像素點(diǎn)的語義類別概率;
令各像素點(diǎn)的語義類別概率中概率最大的類別對(duì)應(yīng)的類別編碼為各像素點(diǎn)的掩碼,得到RGB圖像的初始掩碼圖;
利用超像素分割方法gSLICr對(duì)所述RGB圖像的初始掩碼圖進(jìn)行邊緣優(yōu)化,得到RGB圖像的最終掩碼圖。
優(yōu)選的,所述利用所述RGB圖像、所述深度圖像和所述最終掩碼圖,獲取RGB圖像的全局位姿,包括:
提取所述RGB圖像的ORB特征點(diǎn);
獲取所述ORB特征點(diǎn)在所述深度圖像中的深度值,并利用所述ORB特征點(diǎn)在所述深度圖像中的深度值,對(duì)所述ORB特征點(diǎn)的二維坐標(biāo)進(jìn)行投影坐標(biāo)轉(zhuǎn)換,得到所述ORB特征點(diǎn)在三維空間中的坐標(biāo);
基于所述ORB特征點(diǎn)在三維空間中的坐標(biāo)和所述最終掩碼圖,利用稀疏SLAM方法獲取RGB圖像的全局位姿。
優(yōu)選的,所述基于所述ORB特征點(diǎn)在三維空間中的坐標(biāo)和所述最終掩碼圖,利用稀疏SLAM方法獲取RGB圖像的全局位姿,包括:
提取相鄰的兩幀RGB圖像中BRIEF描述子相同的ORB特征點(diǎn);
利用所述最終掩碼圖,剔除相鄰的兩幀RGB圖像中BRIEF描述子相同的ORB特征點(diǎn)中的外點(diǎn),并令剔除外點(diǎn)后的相鄰的兩幀RGB圖像中BRIEF描述子相同的ORB特征點(diǎn)為匹配點(diǎn);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國航天員科研訓(xùn)練中心;中國人民解放軍戰(zhàn)略支援部隊(duì)航天工程大學(xué),未經(jīng)中國航天員科研訓(xùn)練中心;中國人民解放軍戰(zhàn)略支援部隊(duì)航天工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310181777.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種手術(shù)器械的定位方法、系統(tǒng)及裝置
- 監(jiān)測(cè)建模裝置及森林應(yīng)急消防監(jiān)測(cè)系統(tǒng)
- 基于幾何約束協(xié)同注意力網(wǎng)絡(luò)的6D位姿估計(jì)方法和裝置
- 一種基于多模態(tài)融合特征的抓取位姿檢測(cè)方法
- 多機(jī)器人交互的三維視覺位姿感知方法及系統(tǒng)
- 一種用于復(fù)雜氣道多模態(tài)氣管插管機(jī)器人的主從控制系統(tǒng)
- 一種基于多模態(tài)輸入與注意力機(jī)制的單視圖位姿估計(jì)方法及其系統(tǒng)
- 機(jī)器人銑削加工的刀尖動(dòng)態(tài)分析與穩(wěn)定性預(yù)測(cè)方法及系統(tǒng)
- 一種基于多模態(tài)感知的雙側(cè)協(xié)同康復(fù)系統(tǒng)
- 一種基于多模態(tài)特征關(guān)聯(lián)的后端優(yōu)化方法
- 面向語義Web服務(wù)程序設(shè)計(jì)的語義數(shù)據(jù)表示和處理方法
- 一種基于語義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語義匹配方法和系統(tǒng)
- 遠(yuǎn)程語義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語義表征和語義計(jì)算的信號(hào)語義識(shí)別方法
- 語義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備





