[發明專利]視差圖獲取方法、裝置、存儲介質及設備有效
| 申請號: | 201910243260.4 | 申請日: | 2019-03-28 |
| 公開(公告)號: | CN109978936B | 公開(公告)日: | 2022-12-30 |
| 發明(設計)人: | 揭澤群 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06T7/55 | 分類號: | G06T7/55;G06N3/04;G06T7/33 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 張所明 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視差 獲取 方法 裝置 存儲 介質 設備 | ||
本申請公開了一種視差圖獲取方法、裝置、存儲介質及設備,屬于機器學習技術領域。方法包括:獲取目標空間區域的多張視點圖像;對于多張視點圖像中的任意一個圖像對,基于第一網絡分別對圖像對中的左圖像和右圖像逐層進行特征提取,第一網絡包括多個非空洞卷積層,獲取多個非空洞卷積層輸出的左特征圖和右特征圖;基于第一網絡的第M個非空洞卷積層輸出的第一左特征圖和第一右特征圖,獲取第一視差圖,M為正整數;獲取第M?1個非空洞卷積層輸出的第二左特征圖和第二右特征圖;根據第一視差圖、第二左特征圖和第二右特征圖,采用第二網絡獲取第二視差圖,第二網絡包括具有不同空洞倍率的多個空洞卷積層。本申請能夠獲取到精確的視差圖。
技術領域
本申請涉及機器學習技術領域,特別涉及一種視差圖獲取方法、裝置、存儲介質及設備。
背景技術
立體視覺是機器視覺的一種重要形式,以BSV(Binocular Stereo Vision,雙目立體視覺)為例,BSV是一種基于視差原理并利用攝像頭拍攝同一空間物體的左右兩張視點圖像,通過計算左右兩張視點圖像的對應點(Correspondence)之間的位置偏移量,來獲取該空間物體的三維幾何信息的方法。
繼續以BSV為例,其中,上述位置偏移量即為視差(disparity),假設該空間物體上的任意一點M在左右兩張視點圖像上的投影點分別為ML和MR,則ML和MR被稱為對應點,而求取左右兩張視點圖像的對應點的過程即為立體匹配。換一種表達方式,運用立體匹配算法能夠獲取視差圖。其中,視差圖是以左右兩張視點圖像中的任意一張視點圖像為基準,且尺寸大小等同于基準圖像、元素值為視差值的圖像。
相關技術在獲取視差圖時,往往利用基于前向傳播的神經網絡實現。該種方式無法有效地捕捉像素的背景信息,導致獲取到的視差圖精確性欠佳,進而在諸如基于視差圖對空間物體進行深度估計時會存在不夠精準的缺陷。為此,如何獲取精確的視差圖,成為了本領域技術人員亟待解決的一個問題。
發明內容
本申請實施例提供了一種視差圖獲取方法、裝置、存儲介質及設備,解決了相關技術獲取到的視差圖不夠精確的問題。所述技術方案如下:
一方面,提供了一種視差圖獲取方法,所述方法包括:
獲取目標空間區域的多張視點圖像;
對于所述多張視點圖像中的任意一個圖像對,基于第一網絡分別對所述圖像對中的左圖像和右圖像逐層進行特征提取,所述第一網絡包括多個非空洞卷積層,獲取所述多個非空洞卷積層輸出的左特征圖和右特征圖;
基于所述第一網絡的第M個非空洞卷積層輸出的第一左特征圖和第一右特征圖,獲取第一視差圖,M為正整數;
獲取第M-1個非空洞卷積層輸出的第二左特征圖和第二右特征圖;
根據所述第一視差圖、所述第二左特征圖和所述第二右特征圖,采用第二網絡獲取第二視差圖,所述第二網絡包括具有不同空洞倍率的多個空洞卷積層。
另一方面,提供了一種視差圖獲取裝置,所述裝置包括:
第一獲取模塊,用于獲取目標空間區域的多張視點圖像;
提取模塊,用于對于所述多張視點圖像中的任意一個圖像對,基于第一網絡分別對所述圖像對中的左圖像和右圖像逐層進行特征提取,所述第一網絡包括多個非空洞卷積層;
第二獲取模塊,用于獲取所述多個非空洞卷積層輸出的左特征圖和右特征圖;
所述第二獲取模塊,還用于基于所述第一網絡的第M個非空洞卷積層輸出的第一左特征圖和第一右特征圖,獲取第一視差圖,M為正整數;
所述第二獲取模塊,還用于獲取第M-1個非空洞卷積層輸出的第二左特征圖和第二右特征圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910243260.4/2.html,轉載請聲明來源鉆瓜專利網。





