[發明專利]在動態系統中訓練和選擇最優解決方案的系統和方法在審

申請號：	202010180401.5	申請日：	2020-03-16
公開（公告）號：	CN111754015A	公開（公告）日：	2020-10-09
發明（設計）人：	R.斯科西奧尼;R.巴特查里亞	申請（專利權）人：	通用汽車環球科技運作有限責任公司
主分類號：	G06Q10/04	分類號：	G06Q10/04;G06Q50/30
代理公司：	北京市柳沈律師事務所 11105	代理人：	賀紫秋
地址：	美國密***	國省代碼：	暫無信息
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	動態系統訓練選擇最優解決方案方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種操作自主車輛的方法，包括:

在假設解析器處接收用于動因的未來狀態的多個解決方案；

在假設解析器處接收環境狀態；

基于環境狀態和與每個解決方案相關聯的回報，從多個解決方案中選擇一解決方案，該回報表明針對該環境狀態的該解決方案的置信度水平；和

基于所選擇的解決方案來對自主車輛導航。

2.根據權利要求1所述的方法，還包括在訓練模式期間訓練所述假設解析器，以針對所選擇的環境狀態將回報與每個解決方案相關聯。

3.根據權利要求2所述的方法，還包括，在所述訓練模式期間通過以下方式訓練所述假設解析器：針對解決方案和所接收的環境狀態，預測所述動因在一選擇的未來時間的狀態，測量所述動因在所選擇的未來時間的實際狀態，基于所預測的狀態和所述實際狀態確定用于所述解決方案的誤差，以及基于所述誤差將所述回報分配給所述解決方案。

4.根據權利要求3所述的方法，其中所述回報與所述誤差成反比。

5.根據權利要求3所述的方法，還包括調整解決方案的回報以避免解決方案與環境狀態過擬合。

6.一種用于操作自主車輛的系統，包括:

多個解決方案模塊，其每一個為動因的未來狀態提供解決方案；

狀態模塊，其提供環境狀態；

假設解析器，其接收環境狀態和多個解決方案，基于環境狀態從多個解決方案中選擇一解決方案，并確定用于該解決方案的回報，該回報表明針對該環境狀態的該解決方案的置信度水平；和

導航模塊，用于基于所選擇的解決方案來對自主車輛導航。

7.根據權利要求6所述的系統，還包括神經網絡，其用于在訓練模式期間訓練假設解析器，以將回報與用于所選擇環境狀態的多個解決方案中的每一個相關聯。

8.根據權利要求7所述的系統，其中，所述神經網絡在所述訓練模式期間通過以下方式訓練所述假設解析器：針對解決方案和所接收的環境狀態，預測所述動因在一選擇的未來時間的狀態，測量所述動因在所選擇的未來時間的實際狀態，基于所預測的狀態和所述實際狀態確定用于所述解決方案的誤差，以及基于所述誤差將所述回報分配給所述解決方案。

9.根據權利要求8所述的系統，其中所述回報與所述誤差成反比。

10.根據權利要求8所述的系統，其中所述假設解析器調整解決方案的回報，以避免解決方案與環境狀態過擬合。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于通用汽車環球科技運作有限責任公司，未經通用汽車環球科技運作有限責任公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010180401.5/1.html，轉載請聲明來源鉆瓜專利網。