[發明專利]無人駕駛行為決策及模型訓練的方法、裝置及電子設備有效
| 申請號: | 201811062839.2 | 申請日: | 2018-09-12 |
| 公開(公告)號: | CN109299732B | 公開(公告)日: | 2020-05-05 |
| 發明(設計)人: | 丁曙光;韓勤;任冬淳;付圣;錢德恒 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京曼威知識產權代理有限公司 11709 | 代理人: | 方志煒 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 無人駕駛 行為 決策 模型 訓練 方法 裝置 電子設備 | ||
本申請提供一種無人駕駛行為決策及模型訓練的方法、裝置及電子設備,所述方法的一具體實施方式包括:獲取樣本數據,所述樣本數據包括樣本圖像;提取所述樣本數據對應的樣本特征向量;其中,采用流形降維的方式提取所述樣本圖像的特征向量;基于所述樣本特征向量,采用半監督學習的方式訓練得到目標決策模型;所述目標決策模型用于決策分類。該實施方式無需采集大量的樣本數據,也無需對大量的樣本數據進行標簽的標注,因此,節省了人力資源,提高了模型訓練的效率。同時,也使得訓練得到的模型在進行行為決策時,所得的決策結果更加準確。
技術領域
本申請涉及無人駕駛技術領域,特別涉及一種無人駕駛行為決策及模型訓練的方法、裝置及電子設備。
背景技術
隨著無人駕駛技術以及人工智能技術的不斷發展,人工智能技術已經深入地應用到無人駕駛技術領域。目前來說,通常采用有監督學習的方式進行無人駕駛行為決策的模型訓練,但是,采用有監督學習的方式進行模型訓練時,需要采集大量的樣本數據,并對大量的樣本數據進行標簽的標注。而大量樣本數據的采集以及對樣本數據進行標簽的標注所耗費的人力資源巨大,因此,模型訓練的效率低下。而且,由于樣本數據難以得到擴充,訓練得到的模型在進行行為決策時的精確度較低。
發明內容
為了解決上述技術問題之一,本申請提供一種無人駕駛行為決策及模型訓練的方法、裝置及電子設備。
根據本申請實施例的第一方面,提供一種無人駕駛決策模型的訓練方法,包括:
獲取樣本數據,所述樣本數據包括樣本圖像;
提取所述樣本數據對應的樣本特征向量;其中,采用流形降維的方式提取所述樣本圖像的特征向量;
基于所述樣本特征向量,采用半監督學習的方式訓練得到目標決策模型;所述目標決策模型用于決策分類。
可選的,所述基于所述樣本特征向量,采用半監督學習的方式訓練得到目標決策模型,包括:
迭代執行以下步驟:利用當前的生成器生成第一虛擬特征向量;
基于所述第一虛擬特征向量更新當前的生成器;
利用更新后的生成器生成第二虛擬特征向量;
基于所述樣本特征向量及所述第二虛擬特征向量更新當前的決策模型;
當確定滿足停止條件時,停止迭代,將經過迭代更新之后的決策模型作為目標決策模型。
可選的,所述基于所述第一虛擬特征向量更新當前的生成器,包括:
將所述第一虛擬特征向量輸入當前的決策模型,得到第一輸出內容;所述第一輸出內容包括對所述第一虛擬特征向量的真偽屬性進行判定的第一結果;
根據所述第一輸出內容調整當前的生成器的參數,以更新當前的生成器。
可選的,所述根據所述第一輸出內容調整當前的生成器的參數,包括:
根據所述第一輸出內容確定第一指標,所述第一指標為所述第一結果是錯誤結果的數學期望值;
利用所述第一指標調整當前的生成器的參數。
可選的,所述基于所述樣本特征向量及所述第二虛擬特征向量更新當前的決策模型,包括:
將所述樣本特征向量及所述第二虛擬特征向量輸入當前的決策模型,得到第二輸出內容;所述第二輸出內容包括對所述第二虛擬特征向量的真偽屬性進行判定的第二結果、對所述樣本特征向量的真偽屬性進行判定的第三結果以及對所述樣本特征向量進行決策分類的第四結果;
根據所述第二輸出內容調整當前的決策模型的參數,以更新當前的決策模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811062839.2/2.html,轉載請聲明來源鉆瓜專利網。





