[發明專利]雙目立體匹配的方法、裝置、設備以及存儲介質在審
| 申請號: | 202211297482.2 | 申請日: | 2022-10-22 |
| 公開(公告)號: | CN115908992A | 公開(公告)日: | 2023-04-04 |
| 發明(設計)人: | 沈哲倫;張良俊 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V10/80 | 分類號: | G06V10/80;G06V10/74;G06T5/50;G06T7/00;G06N3/0464;G06N3/08 |
| 代理公司: | 北京易光知識產權代理有限公司 11596 | 代理人: | 王姍姍;武晨燕 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 雙目 立體 匹配 方法 裝置 設備 以及 存儲 介質 | ||
本公開提供了一種雙目立體匹配的方法、裝置、設備以及存儲介質。涉及人工智能技術領域,尤其涉及深度學習、計算機視覺技術等領域。具體實現方案為:對通過雙目攝像頭采集同一場景得到的第一圖像和第二圖像進行多尺度特征提取,得到多尺度的第一子圖像特征和多尺度的第二子圖像特征;對該多尺度的第一子圖像特征和該多尺度的第二子圖像特征采用預設維度的代價卷進行多尺度特征融合,以構建金字塔型代價卷;根據該金字塔型代價卷進行雙目立體匹配處理,得到初始的第一視差圖。采用本公開,提高了雙目立體匹配的精度和泛化性。
技術領域
本公開涉及人工智能技術領域,尤其涉及深度學習、計算機視覺技術等領域。
背景技術
隨著技術的發展,可以通過人工智能改善硬件性能,所適用的應用場景多種多樣,比如涉及雙目立體匹配、單目標深度估計、單目標跟蹤、圖像處理、視頻處理等與計算機視覺相關的應用場景的硬件設計中,都可以采用人工智能技術,即:將訓練好的模型部署于硬件中,以提高硬件的處理速度及處理準確率。
其中,雙目立體匹配作為計算機視覺領域的一項核心任務,由于真實環境的復雜性、目標對象本身的不穩定性以及目標對象本身分辨率等原因導致雙目立體匹配的精度不高,即便可以在特定數據集上滿足精度要求,但是對于除特定數據集之外的其他數據集而言,泛化性差,因此,在實際應用中如何提高雙目立體匹配的精度和泛化性是要解決的問題。
發明內容
本公開提供了一種雙目立體匹配的方法、裝置、設備以及存儲介質。
根據本公開的一方面,提供了一種雙目立體匹配的方法,包括:
對通過雙目攝像頭采集同一場景得到的第一圖像和第二圖像進行多尺度特征提取,得到多尺度的第一子圖像特征和多尺度的第二子圖像特征;
對該多尺度的第一子圖像特征和該多尺度的第二子圖像特征采用預設維度的代價卷進行多尺度特征融合,以構建金字塔型代價卷;
根據該金字塔型代價卷進行雙目立體匹配處理,得到初始的第一視差圖。
根據本公開的另一方面,提供了一種雙目立體匹配的裝置,包括:
提取模塊,用于對通過雙目攝像頭采集同一場景得到的第一圖像和第二圖像進行多尺度特征提取,得到多尺度的第一子圖像特征和多尺度的第二子圖像特征;
構建模塊,用于對該多尺度的第一子圖像特征和該多尺度的第二子圖像特征采用預設維度的代價卷進行多尺度特征融合,以構建金字塔型代價卷;
雙目立體匹配模塊,用于根據該金字塔型代價卷進行雙目立體匹配處理,得到初始的第一視差圖。
根據本公開的另一方面,提供了一種電子設備,包括:
至少一個處理器;以及
與該至少一個處理器通信連接的存儲器;其中,
該存儲器存儲有可被該至少一個處理器執行的指令,該指令被該至少一個處理器執行,以使該至少一個處理器能夠執行本公開中任一實施例的方法。
根據本公開的另一方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,該計算機指令用于使該計算機執行根據本公開中任一實施例的方法。
根據本公開的另一方面,提供了一種計算機程序產品,包括計算機程序,該計算機程序在被處理器執行時實現根據本公開中任一實施例的方法。
采用本公開,提高了雙目立體匹配的精度和泛化性。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211297482.2/2.html,轉載請聲明來源鉆瓜專利網。





