[發(fā)明專利]一種基于位姿解耦估計的無監(jiān)督單目視覺里程計方法在審
| 申請?zhí)枺?/td> | 202011151965.2 | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112308918A | 公開(公告)日: | 2021-02-02 |
| 發(fā)明(設(shè)計)人: | 周文暉;王威盛;孫煨;張樺;戴國駿 | 申請(專利權(quán))人: | 杭州電子科技大學 |
| 主分類號: | G06T7/73 | 分類號: | G06T7/73;G06T7/77;G06N3/04;G06N3/08;G06F7/523;G06F17/16 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 位姿解耦 估計 監(jiān)督 目視 里程計 方法 | ||
1.一種基于位姿解耦估計的無監(jiān)督單目視覺里程計方法,其特征在于包括如下步驟:
步驟S1:準備KITTI數(shù)據(jù)集并進行預處理;
步驟S2:基于位姿解耦估計公式,設(shè)計位姿解耦估計網(wǎng)絡;
步驟S3:設(shè)計基于位姿解耦估計的無監(jiān)督單目視覺里程計;
步驟S4:定義基于位姿解耦估計的無監(jiān)督單目視覺里程計的損失函數(shù);
步驟S5:使用KITTI數(shù)據(jù)集中的訓練集訓練基于位姿解耦估計的無監(jiān)督單目視覺里程計。
2.根據(jù)權(quán)利要求1所述的一種基于位姿解耦估計的無監(jiān)督單目視覺里程計方法,其特征在于所述步驟S2具體實現(xiàn)包括:
步驟S2-1:所述的位姿解耦估計公式是將兩幀間的相機位姿矩陣分解為解耦平移矩陣和解耦旋轉(zhuǎn)矩陣的級聯(lián)相乘,從而將相機位姿估計分解為解耦平移矩陣和解耦旋轉(zhuǎn)矩陣的級聯(lián)估計;具體表述為:
對于相鄰兩幀圖像It和Is,場景點在圖像It上的投影像素點為gt,在圖像Is上的投影像素點為gs,根據(jù)相機內(nèi)參矩陣K、相機位姿矩陣Pt→s、像素點gt在相機坐標系下的深度值zt和像素點gs在相機坐標系下的深度值zs,像素點gt和像素點gs滿足剛性運動的投影公式,具體為:
其中Pt→s為相機從第t幀到第s幀的相機位姿矩陣,包含了一個3×3的旋轉(zhuǎn)矩陣R和一個3×1的平移矩陣T;采用四元數(shù)表示旋轉(zhuǎn)矩陣R,即旋轉(zhuǎn)矩陣R由一個四元素(q0,q1,q2,q3)表示,所述四元數(shù)表示旋轉(zhuǎn)矩陣為成熟技術(shù);平移矩陣T包含了3個平移量,分別是相機坐標系下x、y、z坐標的平移量Tx、Ty和Tz;根據(jù)矩陣乘法,相機位姿矩陣Pt→s可表示為解耦平移矩陣和解耦旋轉(zhuǎn)矩陣的級聯(lián)相乘,具體為:
其中PT為4×4的解耦平移矩陣,PR為4×4的解耦旋轉(zhuǎn)矩陣,E3×3為3×3的單位矩陣;
將公式(2)代入公式(1)中,有:
根據(jù)公式(3),可進一步將像素點gt和像素點gs的投影公式分解為兩個投影公式的級聯(lián)相乘,具體為:
其中公式(4)的第一行為解耦平移矩陣PT的投影公式,公式(4)的第二行為解耦旋轉(zhuǎn)矩陣PR的投影公式;公式(4)稱為位姿解耦估計公式,將相機位姿矩陣Pt→s估計分解為解耦平移矩陣PT和解耦旋轉(zhuǎn)矩陣PR的級聯(lián)估計;
步驟S2-2:所述的位姿解耦估計網(wǎng)絡包含了一個平移估計網(wǎng)絡T-Net和一個旋轉(zhuǎn)估計網(wǎng)絡R-Net;平移估計網(wǎng)絡T-Net實現(xiàn)解耦平移矩陣PT中三個平移量Tx、Ty和Tz估計,旋轉(zhuǎn)估計網(wǎng)絡R-Net實現(xiàn)解耦旋轉(zhuǎn)矩陣PR中四元素(q0,q1,q2,q3)估計。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學,未經(jīng)杭州電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011151965.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 在即時通信中提供即時監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學習的標簽比例學習模型的訓練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對象尋址方法、電子設(shè)備及存儲介質(zhì)
- 一種機器人表情調(diào)用方法和家用機器人
- 計算機視覺訓練系統(tǒng)和用于訓練計算機視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法





