[發明專利]一種融合Q算法和模糊化狀態劃分的自適應巡航決策方法在審
| 申請號: | 202310438432.X | 申請日: | 2023-04-23 |
| 公開(公告)號: | CN116279466A | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 尚靖皓;馮建偉;陳豪 | 申請(專利權)人: | 中國人民武裝警察部隊工程大學 |
| 主分類號: | B60W30/14 | 分類號: | B60W30/14;B60W50/00 |
| 代理公司: | 西安賽博睿納專利代理事務所(普通合伙) 61236 | 代理人: | 孟學英 |
| 地址: | 710000 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 算法 模糊 狀態 劃分 自適應 巡航 決策 方法 | ||
1.一種融合Q算法和模糊化狀態劃分的自適應巡航決策方法,其特征在于,包括以下步驟:
步驟1,建立離散化的狀態變量模型;
步驟2,建立狀態和動作的模糊化變量模型;
步驟3,根據步驟2建立的模糊化變量模型,初始化Q矩陣中的值,并設定學習率α,衰減率γ和獎勵值r;
其中,其中,a為加速度,s為二維狀態量;
步驟4,計算適應度μi(s),并選取具有最大適應度μk(s)的狀態;
其中,
步驟5,從步驟3的Q矩陣中的第k行選擇待執行的動作b;
步驟6,執行動作b,得到下一時刻狀態s′和獎勵值r;
步驟7,計算置信度ωj,并更新Q值;
其中,
Q(sk,al)=Q(sk,al)+α(r+γωQ′(sk′,al′)),sk←sk′;其中,a為加速度,s為二維狀態量;
步驟8,將離散動作連續化,以獲得自適應巡航任務的完成情況;
步驟9,根據步驟8的自適應巡航任務的完成情況,判斷是否滿足自適應巡航任務的停止條件,若滿足則自適應巡航任務截止,若不滿足則再次進入步驟4的計算適應度步驟。
2.根據權利要求1所述的融合Q算法和模糊化狀態劃分的自適應巡航決策方法,其特征在于,步驟1中,離散化的狀態變量模型如下:
其中,vpre為第一輛車速度,為第一輛車速度的離散狀態量;
其中,vhost為第二輛車速度,為第二輛車速度的離散狀態量;
其中,xreal為兩車實際距離,為兩車實際距離的離散狀態量;
其中,S3為組合而成的三維狀態量,S1為將S3經過映射而成的一維狀態量。
3.根據權利要求2所述的融合Q算法和模糊化狀態劃分的自適應巡航決策方法,其特征在于,步驟2中,建立狀態和動作的模糊化變量模型之前,先將三維狀態量S3轉變為二維狀態量s*:
s*=(xe,ve)
xe=(xreal-xsafe)/xsafe
ve=vhost-vpre;
其中,xreal為兩車實際距離;xsafe為兩車安全距離;vhost為第二輛車速度,vpre為第一輛車速度。
4.根據權利要求3所述的融合Q算法和模糊化狀態劃分的自適應巡航決策方法,其特征在于,步驟2中,模糊化變量模型包括距離相對誤差xe的模糊化變量模型、速度誤差ve的模糊化變量模型和加速度a的模糊化變量模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民武裝警察部隊工程大學,未經中國人民武裝警察部隊工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310438432.X/1.html,轉載請聲明來源鉆瓜專利網。





