[發(fā)明專利]一種基于單目視覺的無監(jiān)督深度估計(jì)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011275547.4 | 申請(qǐng)日: | 2020-11-16 |
| 公開(公告)號(hào): | CN112465888A | 公開(公告)日: | 2021-03-09 |
| 發(fā)明(設(shè)計(jì))人: | 賈海濤;陳昀;何慶東;許文波;毛晨;李曉溪;劉崢;周子雄 | 申請(qǐng)(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號(hào): | G06T7/55 | 分類號(hào): | G06T7/55 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 611731 四川省成*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 目視 監(jiān)督 深度 估計(jì) 方法 | ||
1.一種基于無監(jiān)督學(xué)習(xí)的單目視覺圖像深度估計(jì)的方法,其特征在于,包括下列步驟:
步驟1:將幾何關(guān)系已知的包含源圖像和目標(biāo)圖像的圖像對(duì)分別輸入編碼器和解碼器;
步驟2:編碼器端接收到源圖像后通過深度預(yù)測(cè)網(wǎng)絡(luò)對(duì)圖像的深度進(jìn)行估計(jì),并輸出一個(gè)深度預(yù)測(cè)矩陣;
步驟3:解碼器端接收到目標(biāo)圖像和對(duì)應(yīng)源圖像的深度估計(jì)矩陣,根據(jù)這兩項(xiàng)輸入對(duì)源圖像進(jìn)行重建,得出重建圖像;
其中圖像重建階段的具體步驟為:
步驟301:首先根據(jù)立體幾何關(guān)系建立圖像對(duì)位置關(guān)系與真實(shí)物體位置點(diǎn)關(guān);
步驟302:求得視差公式;
步驟303:然后用估計(jì)距離代替真實(shí)距離,將真實(shí)視差轉(zhuǎn)化為估計(jì)視差;
步驟303:最后根據(jù)估計(jì)出的視差將目標(biāo)圖像的像素點(diǎn)平移到相應(yīng)位置,全部移動(dòng)完成后得到重建圖像;
步驟4:得到重建圖像后與源圖像進(jìn)行像素差平方值計(jì)算,得到網(wǎng)絡(luò)損失函數(shù);
步驟5:采用L2正則化方法來約束預(yù)測(cè)的深度圖像的梯度;
步驟6:最后根據(jù)修正后的誤差對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
2.如權(quán)利要求1所述的方法,其特征在于,系統(tǒng)的最終結(jié)果是作為一種中間值輸出的,而不是系統(tǒng)的最后輸出結(jié)果作為最終結(jié)果。
3.如權(quán)利要求1所述的方法,其特征在于,為保證輸出深度矩陣的分辨率與原圖匹配,將網(wǎng)絡(luò)中的全連接層改為全卷積層。
4.如權(quán)利要求1所述的方法,其特征在于,為保證輸出深度矩陣的細(xì)節(jié)完整,在網(wǎng)絡(luò)中加入跳躍結(jié)構(gòu),是的淺層的細(xì)節(jié)能夠傳遞到反卷積層的結(jié)果當(dāng)中。
5.如權(quán)利要求4所述的方法,其特征在于,加入跳躍式結(jié)構(gòu)的網(wǎng)絡(luò)層為第2層和第10層之間以及第4層和第8層之間。
6.如權(quán)利要求1所述的方法,其特征在于,重建圖像的計(jì)算。
7.如權(quán)利要求3所述的方法,其特征在于,焦距f和相機(jī)水平間距B都是固定值,可以在不同場(chǎng)景根據(jù)需求設(shè)置。
8.如權(quán)利要求1所述的方法,其特征在于,L2正則化的強(qiáng)度γ設(shè)置為0.01。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011275547.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法





