[發(fā)明專利]光場(chǎng)相機(jī)的場(chǎng)景深度估計(jì)方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202210447419.6 | 申請(qǐng)日: | 2022-04-26 |
| 公開(公告)號(hào): | CN114757984A | 公開(公告)日: | 2022-07-15 |
| 發(fā)明(設(shè)計(jì))人: | 溫建偉;李營;其他發(fā)明人請(qǐng)求不公開姓名 | 申請(qǐng)(專利權(quán))人: | 北京拙河科技有限公司 |
| 主分類號(hào): | G06T7/557 | 分類號(hào): | G06T7/557;G06T7/70;G06N3/04;G06N3/08 |
| 代理公司: | 北京君莫知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11715 | 代理人: | 王凝 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 相機(jī) 場(chǎng)景 深度 估計(jì) 方法 裝置 | ||
1.一種光場(chǎng)相機(jī)的場(chǎng)景深度估計(jì)方法,其特征在于,包括:
獲取訓(xùn)練圖像;
將所訓(xùn)練圖像輸入預(yù)先構(gòu)建的深度預(yù)測(cè)模型中進(jìn)行訓(xùn)練,所述深度預(yù)測(cè)模型包括深度預(yù)測(cè)單元、卷積-反卷積單元、位姿識(shí)別單元和特征融合單元,得到對(duì)應(yīng)的預(yù)測(cè)深度圖;
將所得到的預(yù)測(cè)深度圖與對(duì)應(yīng)的第一損失函數(shù)和第二損失函數(shù)的聯(lián)合損失函數(shù)進(jìn)行聯(lián)合損失計(jì)算,得到對(duì)應(yīng)的真實(shí)深度估計(jì)圖,所述聯(lián)合損失函數(shù)為:
2.根據(jù)權(quán)利要求1所述的光場(chǎng)相機(jī)的場(chǎng)景深度估計(jì)方法,其特征在于,在將所獲取的訓(xùn)練圖像輸入預(yù)先構(gòu)建的深度預(yù)測(cè)模型中進(jìn)行訓(xùn)練之前,還包括:
將所述訓(xùn)練圖像進(jìn)行擴(kuò)充,將所述訓(xùn)練圖像進(jìn)行縮放、旋轉(zhuǎn)和隨機(jī)水平翻轉(zhuǎn)處理中至少一項(xiàng)操作,得到第一訓(xùn)練圖像;
將擴(kuò)充后的訓(xùn)練圖像調(diào)整至分辨率得到第二訓(xùn)練圖像,并將所述第二訓(xùn)練圖像進(jìn)行歸一化處理,得到預(yù)處理后的訓(xùn)練圖像;
對(duì)于每個(gè)所述訓(xùn)練圖像,獲取所述訓(xùn)練圖像的前幀圖像和后幀圖像,并在以上三張圖像中均確認(rèn)出一個(gè)同名點(diǎn)位,所述同名點(diǎn)位用于表征所述三張圖像中相同目標(biāo)的位置。
3.根據(jù)權(quán)利要求2所述的光場(chǎng)相機(jī)的場(chǎng)景深度估計(jì)方法,其特征在于,所述將所獲取的訓(xùn)練圖像輸入預(yù)先構(gòu)建的深度預(yù)測(cè)模型中進(jìn)行訓(xùn)練,包括:
將所述訓(xùn)練圖像輸入至所述卷積-反卷積單元,生成當(dāng)前反卷積特征圖像;
將所述訓(xùn)練圖像、所述前幀圖像和所述后幀圖像輸入至位姿識(shí)別單元,得到相機(jī)在所述訓(xùn)練圖像、所述前幀圖像和所述后幀圖像拍攝時(shí)刻下與所述同名點(diǎn)位的相對(duì)位姿;
將所述當(dāng)前反卷積特征圖像和所述相對(duì)位姿輸入至特征融合單元,得到特征融合圖像;
將所述特征融合圖像輸入至所述深度預(yù)測(cè)單元,得到所述預(yù)測(cè)深度圖。
4.根據(jù)權(quán)利要求3所述的光場(chǎng)相機(jī)的場(chǎng)景深度估計(jì)方法,其特征在于,所述將所述訓(xùn)練圖像輸入至所述卷積-反卷積單元,生成當(dāng)前反卷積特征圖像,包括:
對(duì)所述訓(xùn)練圖像進(jìn)行下采樣,生成分辨率依次下降的多個(gè)特定層特征圖像,所述特定層特征圖像的數(shù)量為4個(gè)。
5.根據(jù)權(quán)利要求1所述的光場(chǎng)相機(jī)的場(chǎng)景深度估計(jì)方法,其特征在于,所述真實(shí)深度圖利用flownet2.0獲得雙目圖像的光流的水平分量。
6.根據(jù)權(quán)利要求1所述的光場(chǎng)相機(jī)的場(chǎng)景深度估計(jì)方法,其特征在于,在所述聯(lián)合損失函數(shù)中,所述第一損失函數(shù)包括Lrank、Lms-ssim、Lgrad,所述第二損失函數(shù)包括和Lrank表示基于隨機(jī)采樣的排序損失,Lms-ssim表示多尺度結(jié)構(gòu)相似損失函數(shù),Lgrad表示多尺度不變梯度匹配損失函數(shù),vs為視圖合成損失;λs與λe為調(diào)節(jié)參數(shù);為掩模;m為不同的圖像尺度。
7.一種光場(chǎng)相機(jī)的場(chǎng)景深度估計(jì)裝置,其特征在于,包括:
訓(xùn)練圖像獲取模塊,用于獲取訓(xùn)練圖像;
訓(xùn)練模塊,用于將所訓(xùn)練圖像輸入預(yù)先構(gòu)建的深度預(yù)測(cè)模型中進(jìn)行訓(xùn)練,所述深度預(yù)測(cè)模型包括深度預(yù)測(cè)單元、卷積-反卷積單元、位姿識(shí)別單元和特征融合單元,得到對(duì)應(yīng)的預(yù)測(cè)深度圖;
真實(shí)深度估計(jì)圖獲取模塊,用于將所得到的預(yù)測(cè)深度圖與對(duì)應(yīng)的第一損失函數(shù)和第二損失函數(shù)的聯(lián)合損失函數(shù)進(jìn)行聯(lián)合損失計(jì)算,得到對(duì)應(yīng)的真實(shí)深度估計(jì)圖,所述聯(lián)合損失函數(shù)為:
8.如權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括:
第一訓(xùn)練圖像獲取模塊,將所述訓(xùn)練圖像進(jìn)行擴(kuò)充,將所述訓(xùn)練圖像進(jìn)行縮放、旋轉(zhuǎn)和隨機(jī)水平翻轉(zhuǎn)處理中至少一項(xiàng)操作,得到第一訓(xùn)練圖像;
第一預(yù)處理模塊,將擴(kuò)充后的訓(xùn)練圖像調(diào)整至分辨率得到第二訓(xùn)練圖像,并將所述第二訓(xùn)練圖像進(jìn)行歸一化處理,得到預(yù)處理后的訓(xùn)練圖像;
第二預(yù)處理模塊,對(duì)于每個(gè)所述訓(xùn)練圖像,獲取所述訓(xùn)練圖像的前幀圖像和后幀圖像,并在以上三張圖像中均確認(rèn)出一個(gè)同名點(diǎn)位,所述同名點(diǎn)位用于表征所述三張圖像中相同目標(biāo)的位置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京拙河科技有限公司,未經(jīng)北京拙河科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210447419.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種基于多相機(jī)的產(chǎn)品全方位觀察和測(cè)量方法及裝置
- 一種基于多相機(jī)的產(chǎn)品全方位觀察和測(cè)量裝置
- 車載相機(jī)校正裝置、圖像生成裝置、車載相機(jī)校正方法、圖像生成方法
- 帶有3D特征圖像的測(cè)試裝置
- 雙目相機(jī)
- 一種相機(jī)同步方法及裝置、雙目相機(jī)
- kinect深度相機(jī)與熱紅外相機(jī)的信息融合方法
- 一種應(yīng)用于OCT光譜儀相機(jī)的對(duì)中調(diào)節(jié)裝置及其工作方法
- 一種應(yīng)用于OCT光譜儀相機(jī)的對(duì)中調(diào)節(jié)裝置
- 監(jiān)控相機(jī)的聯(lián)動(dòng)方法及系統(tǒng)
- 電視場(chǎng)景切換的方法及電視
- 視頻場(chǎng)景控制系統(tǒng)及方法
- 場(chǎng)景開關(guān)及其場(chǎng)景開關(guān)構(gòu)件和場(chǎng)景圖標(biāo)卡組件
- 場(chǎng)景聯(lián)動(dòng)方法及場(chǎng)景聯(lián)動(dòng)系統(tǒng)
- 一種視頻場(chǎng)景分類方法、裝置、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種Unity3D引擎的場(chǎng)景切換方法和系統(tǒng)
- 一種自動(dòng)駕駛場(chǎng)景分類識(shí)別系統(tǒng)及方法
- 一種虛擬場(chǎng)景生成方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種汽車圖像場(chǎng)景庫數(shù)據(jù)復(fù)雜度度量方法
- 場(chǎng)景識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種信道估計(jì)方法和裝置
- 基于時(shí)頻聯(lián)合的載波頻偏估計(jì)方法
- 基于改進(jìn)卡爾曼濾波的變參數(shù)迭代估計(jì)方法
- 電機(jī)驅(qū)動(dòng)系統(tǒng)以及電機(jī)控制裝置
- 意圖估計(jì)裝置和意圖估計(jì)方法
- 分布式驅(qū)動(dòng)電動(dòng)汽車路面自適應(yīng)縱向車速估計(jì)系統(tǒng)及方法
- 一種分布式驅(qū)動(dòng)電動(dòng)汽車路面附著系數(shù)估計(jì)系統(tǒng)
- 視線估計(jì)方法、終端及存儲(chǔ)介質(zhì)
- 一種SNR估計(jì)方法及其估計(jì)系統(tǒng)
- 估計(jì)車輛載荷的方法





