[發明專利]無人駕駛行為決策及模型訓練的方法、裝置及電子設備有效
| 申請號: | 201811062839.2 | 申請日: | 2018-09-12 |
| 公開(公告)號: | CN109299732B | 公開(公告)日: | 2020-05-05 |
| 發明(設計)人: | 丁曙光;韓勤;任冬淳;付圣;錢德恒 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京曼威知識產權代理有限公司 11709 | 代理人: | 方志煒 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 無人駕駛 行為 決策 模型 訓練 方法 裝置 電子設備 | ||
1.一種無人駕駛決策模型的訓練方法,其特征在于,所述方法包括:
獲取用于無人駕駛行為決策的樣本數據,所述樣本數據包括樣本圖像;
提取所述樣本數據對應的樣本特征向量;其中,采用流形降維的方式提取所述樣本圖像的特征向量;
基于所述樣本特征向量,采用半監督學習的方式訓練得到目標決策模型;所述目標決策模型用于決策分類;所述決策分類至少包括:向前行進、向后退、向左拐彎、向右拐彎、勻速行駛、停止、跟隨目標物;
其中,所述基于所述樣本特征向量,采用半監督學習的方式訓練得到目標決策模型,包括:
迭代執行以下步驟:利用當前的生成器生成第一虛擬特征向量;
基于所述第一虛擬特征向量更新當前的生成器;
利用更新后的生成器生成第二虛擬特征向量;
基于所述樣本特征向量及所述第二虛擬特征向量更新當前的決策模型;
當確定滿足停止條件時,停止迭代,將經過迭代更新之后的決策模型作為目標決策模型。
2.根據權利要求1所述的方法,其特征在于,所述基于所述第一虛擬特征向量更新當前的生成器,包括:
將所述第一虛擬特征向量輸入當前的決策模型,得到第一輸出內容;所述第一輸出內容包括對所述第一虛擬特征向量的真偽屬性進行判定的第一結果;
根據所述第一輸出內容調整當前的生成器的參數,以更新當前的生成器。
3.根據權利要求2所述的方法,其特征在于,所述根據所述第一輸出內容調整當前的生成器的參數,包括:
根據所述第一輸出內容確定第一指標,所述第一指標為所述第一結果是錯誤結果的數學期望值;
利用所述第一指標調整當前的生成器的參數。
4.根據權利要求1所述的方法,其特征在于,所述基于所述樣本特征向量及所述第二虛擬特征向量更新當前的決策模型,包括:
將所述樣本特征向量及所述第二虛擬特征向量輸入當前的決策模型,得到第二輸出內容;所述第二輸出內容包括對所述第二虛擬特征向量的真偽屬性進行判定的第二結果、對所述樣本特征向量的真偽屬性進行判定的第三結果以及對所述樣本特征向量進行決策分類的第四結果;
根據所述第二輸出內容調整當前的決策模型的參數,以更新當前的決策模型。
5.根據權利要求4所述的方法,其特征在于,所述根據所述第二輸出內容調整當前的決策模型的參數,包括:
根據所述第二輸出內容確定第二指標和第三指標,所述第二指標為所述第二結果是錯誤結果的數學期望值與所述第三結果為正確結果的數學期望值之和;所述第三指標為所述第四結果為正確結果的數學期望值;
利用所述第二指標和第三指標調整當前的決策模型的參數。
6.根據權利要求1-5中任一所述的方法,其特征在于,當確定損失函數收斂時,確定滿足停止條件;
其中,所述損失函數為第一函數、第二函數和第三函數的加權和;
其中,所述第一函數為當前的決策模型對所述第二虛擬特征向量的真偽屬性進行判定的結果是錯誤結果的數學期望函數;所述第二函數為所述當前的決策模型對所述樣本特征向量的真偽屬性進行判定的結果是正確結果的數學期望函數;所述第三函數為所述當前的決策模型對所述樣本特征向量進行決策分類的結果是正確結果的數學期望函數。
7.一種使用如權利要求1-6中任一項所述的目標決策模型進行無人駕駛行為決策的方法,其特征在于,所述方法包括:
獲取當前采集到的用于無人駕駛行為決策的目標數據,所述目標數據包括目標圖像;
提取所述目標數據對應的目標特征向量;其中,采用流形降維的方式提取所述目標圖像的特征向量;
將所述目標特征向量輸入所述目標決策模型,得到目標決策結果;所述目標決策結果至少包括:向前行進、向后退、向左拐彎、向右拐彎、勻速行駛、停止、跟隨目標物。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811062839.2/1.html,轉載請聲明來源鉆瓜專利網。





