[發明專利]一種基于交叉蒸餾的單目深度估計模型訓練方法在審
| 申請號: | 202310115401.0 | 申請日: | 2023-02-15 |
| 公開(公告)號: | CN116188904A | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 陳偉海;邵樹威;裴忠才;劉中;吳星明 | 申請(專利權)人: | 北京航空航天大學杭州創新研究院;北京航空航天大學 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/30;G06V20/10 |
| 代理公司: | 北京睿智保誠專利代理事務所(普通合伙) 11732 | 代理人: | 韓迎之 |
| 地址: | 310051 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 交叉 蒸餾 深度 估計 模型 訓練 方法 | ||
1.一種基于交叉蒸餾的單目深度估計模型訓練方法,其特征在于,包括以下步驟:
將城市RGB圖像輸入到單目深度估計模型中;
所述單目深度估計模型對城市RGB圖像生成第一深度預測和第二深度預測;
將第一深度預測和第二深度預測用作偽標簽,并對偽標簽降噪;
利用降噪后的偽標簽對單目深度估計模型完成優化。
2.根據權利要求1所述的一種基于交叉蒸餾的單目深度估計模型訓練方法,其特征在于,所述第一深度預測和所述第二深度預測的表達式分別為:
其中,表示來自Transformer分支的預測、表示來自CNN分支的預測,p表示像素點,rn(p)表示城市RGB圖像。
3.根據權利要求1所述的一種基于交叉蒸餾的單目深度估計模型訓練方法,其特征在于,采用基于不確定性的交叉蒸餾損失對偽標簽降噪,所述交叉蒸餾損失的定義式如下:
其中,-是梯度停止操作,是逐元素乘法,是來自Transformer分支的不確定性映射,是來自CNN分支的不確定性映射,p表示像素點。
4.根據權利要求1所述的一種基于交叉蒸餾的單目深度估計模型訓練方法,其特征在于,對于不確定圖進行建模,建模公式如下:
其中,dn(p)代表預測的深度圖,表示真值深度圖,b是一個控制誤差容限的系數,T表示具有有效真值深度的像素集合,p表示像素點。
5.根據權利要求4所述的一種基于交叉蒸餾的單目深度估計模型訓練方法,其特征在于,應用Lu來預測不確定性以近似
其中,代表Transformer分支預測的不確定圖,代表CNN分支預測的不確定圖,代表Transformer分支不確定圖的真值,代表CNN分支不確定圖的真值,p表示像素點。
6.根據權利要求1所述的一種基于交叉蒸餾的單目深度估計模型訓練方法,其特征在于,對單目深度估計模型完成優化的公式如下:
Ltotal=Lsl+λ1Lurcd+λ2Lu,
其中,Lsl是silog損失,λ1,λ2,κ,η是超參數,用于平衡損失中每一項的權重,|T|代表有值的像素點的個數,dn(p)代表預測的深度圖,表示真值深度圖,表示Transformer分支在log空間的深度誤差,表示CNN分支在log空間的深度誤差。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學杭州創新研究院;北京航空航天大學,未經北京航空航天大學杭州創新研究院;北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310115401.0/1.html,轉載請聲明來源鉆瓜專利網。





