[發明專利]避障模型的訓練方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110963071.1 | 申請日: | 2021-08-20 |
| 公開(公告)號: | CN113780101A | 公開(公告)日: | 2021-12-10 |
| 發明(設計)人: | 張寶豐 | 申請(專利權)人: | 京東鯤鵬(江蘇)科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 侯軍洋 |
| 地址: | 215500 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 裝置 電子設備 存儲 介質 | ||
1.一種避障模型的訓練方法,其特征在于,包括:
根據與待訓練避障訓練模型相對應的目標損失函數,更新與所述待訓練避障模型相對應的可學習配置參數;其中,所述目標損失函數是根據與所述待訓練避障模型相對應的懲罰函數和預設損失函數確定的;
根據所述可學習配置參數,更新所述待訓練避障模型的主干網各項指標的目標候選值,得到待更新避障訓練模型;其中,所述主干網包括卷積層,所述卷積層中包括至少一個卷積,每個卷積中包括至少一項指標;
將訓練偽圖像輸入至所述待更新避障訓練模型中,得到與所述訓練偽圖像相對應的實際輸出數據;
如果與所述待更新避障訓練模型相對應的目標損失函數收斂,則將所述待更新避障訓練模型作為目標避障模型。
2.根據權利要求1所述的方法,其特征在于,還包括:
獲取基于激光雷達處理得到的三維點云;
采用預設算法對所述三維點云進行處理,得到用于訓練所述待訓練避障模型的訓練偽圖像。
3.根據權利要求1所述的方法,其特征在于,所述根據與待訓練避障訓練模型相對應的目標損失函數,更新與所述待訓練避障模型相對應的可學習配置參數,包括:
根據所述待訓練避障模型中主干網中各項指標所使用的候選值,確定與所述待訓練避障模型相對應的懲罰函數;
根據所述懲罰函數和所述預設損失函數,確定所述目標損失函數,并根據所述目標損失函數對所述待訓練避障模型對前一訓練樣本的實際輸出結果和理論輸出結果進行處理,得到所述可學習配置參數,以基于所述可學習配置參數更新所述待訓練避障模型中各項指標所對應的目標候選值,得到所述待更新避障訓練模型。
4.根據權利要求1所述的方法,其特征在于,所述根據所述可學習配置參數,更新所述待訓練避障模型的主干網各項指標的目標候選值,得到待更新避障訓練模型,包括:
基于歸一化指數函數對所述可學習配置參數進行處理,得到所述待訓練避障模型主干網中每項指標所對應的權重矩陣;其中,所述權重矩陣的數量與指標的數量相一致,所述權重矩陣的行數與所述主干網中卷積的數量相對應,列數與每項指標的可選候選值的數量相對應;
基于各項指標的權重矩陣,確定每個卷積所對應的至少一項指標的目標候選值;
基于各目標候選值確定所述待訓練避障模型的模型結構,得到所述待更新避障訓練模型。
5.根據權利要求4所述的方法,其特征在于,所述基于各項指標的權重矩陣,確定每個卷積所對應的至少一項指標的目標候選值,包括:
針對各指標的權重矩陣,根據與當前指標所對應的權重矩陣的每行權重值,確定卷積層中每個卷積所對應的目標權重值;其中,所述權重值用于表征各可選候選值被選中的概率;
根據各目標權重值所對應的可選候選值,確定所述目標候選值。
6.根據權利要求5所述的方法,其特征在于,所述根據與當前指標所對應的權重矩陣的每行權重值,確定卷積層中每個卷積所對應的目標權重值,包括:
確定當前權重矩陣中每行的最大權重值,并將最大權重值確定為當前指標在各卷積的目標權重值;
相應的,所述根據各目標權重值所對應的可選候選值,確定所述目標候選值,包括:
確定各目標權重值所對應的可選候選值,并將所述可選候選值作為目標候選值。
7.根據權利要求4所述的方法,其特征在于,所述基于各目標候選值確定所述待訓練避障模型的模型結構,得到所述待更新避障訓練模型,包括:
根據各目標候選值,更新每個卷積中每個指標的已使用目標候選值,得到所述待更新避障訓練模型;
其中,所述卷積中的指標包括步長、通道數、卷積核尺寸以及卷積核類型中的至少一項。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東鯤鵬(江蘇)科技有限公司,未經京東鯤鵬(江蘇)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110963071.1/1.html,轉載請聲明來源鉆瓜專利網。





