[發(fā)明專利]一種非完全信息非合作博弈人機(jī)共駕控制方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110694150.7 | 申請(qǐng)日: | 2021-06-22 |
| 公開(公告)號(hào): | CN113200056B | 公開(公告)日: | 2022-04-08 |
| 發(fā)明(設(shè)計(jì))人: | 常宇鵬;鄭宏宇;何睿;郭中陽(yáng);宋娟娟;王劍波;吳竟啟;束琦 | 申請(qǐng)(專利權(quán))人: | 吉林大學(xué);江蘇超力電器有限公司 |
| 主分類號(hào): | B60W60/00 | 分類號(hào): | B60W60/00;B60W50/00 |
| 代理公司: | 長(zhǎng)春市恒譽(yù)專利代理事務(wù)所(普通合伙) 22212 | 代理人: | 李榮武 |
| 地址: | 130012 吉*** | 國(guó)省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 完全 信息 合作 博弈 人機(jī) 控制 方法 | ||
1.一種非完全信息非合作博弈人機(jī)共駕控制方法,其特征在于,其包括以下步驟:
步驟S1建立人車操縱博弈模型,首先建立車輛操縱動(dòng)力學(xué)模型
U=δd+δc
其中,系統(tǒng)狀態(tài)X=[v ω y yint ψ]T,v為車輛橫向車速,ω為車輛橫擺角速度,y為車輛橫向位移,yint為橫向位移積分,ψ為車輛橫擺角,A、B為系統(tǒng)狀態(tài)矩陣,U為輸入矩陣,其代表駕駛員方向盤輸入轉(zhuǎn)角δd和線控轉(zhuǎn)向系統(tǒng)方向盤輸入轉(zhuǎn)角δc,對(duì)車輛操縱動(dòng)力學(xué)模型離散化,再建立可以描述駕駛員和車輛目標(biāo)路徑的預(yù)覽模型;在實(shí)際行駛中,利用車載攝像頭采集車輛前進(jìn)方向圖像,判斷車輛當(dāng)前行駛路徑,并與預(yù)覽模型中的期望路徑對(duì)比,規(guī)劃下一步行駛路徑,最終將離散車輛操縱動(dòng)力學(xué)模型中橫向位移變量與橫向位移積分變量擴(kuò)展添加預(yù)覽路徑描述向量,此模型中轉(zhuǎn)向系統(tǒng)為線控轉(zhuǎn)向系統(tǒng),線控轉(zhuǎn)向系統(tǒng)根據(jù)駕駛員操縱輸入與控制器疊加的操縱輸入之和控制汽車前輪轉(zhuǎn)角;
步驟S2建立非完全信息模式下人車信息博弈數(shù)學(xué)表達(dá)形式,在所述非完全信息模式下,量化駕駛員和車輛信息掌握的途徑和信息掌握數(shù)量不同,建立車輛與駕駛員所掌握系統(tǒng)狀態(tài)與系統(tǒng)真實(shí)狀態(tài)的線性關(guān)系,車輛通過(guò)車載攝像頭和傳感器獲取信息準(zhǔn)確度高,駕駛員通過(guò)駕駛經(jīng)驗(yàn)以及視野接收信息準(zhǔn)確程度低且受干擾,駕駛員只知道車輛的初始狀態(tài),而不知道行駛中的中間狀態(tài),而車輛可通過(guò)車載傳感器和攝像頭了解車輛當(dāng)前狀態(tài)信息,駕駛員不知道系統(tǒng)的狀態(tài),且不知道車輛對(duì)系統(tǒng)狀態(tài)的估計(jì),駕駛員和車輛對(duì)系統(tǒng)狀態(tài)的掌握數(shù)學(xué)模型表示如下:
Z1=H1Z+W1
Z2=H2Z+W2
其中Z1和Z2分別表示車輛和駕駛員對(duì)系統(tǒng)狀態(tài)的估計(jì),Z(k)為車輛真實(shí)狀態(tài),H1、H2為狀態(tài)估計(jì)矩陣,W1、W2為隨機(jī)干擾;
步驟S3建立人車行駛收益博弈模型,根據(jù)駕駛員和車輛操作輸入以及非完全信息下的駕駛員和車輛對(duì)系統(tǒng)狀態(tài)掌握特點(diǎn)設(shè)計(jì)系統(tǒng)收益函數(shù),駕駛員只能根據(jù)車輛對(duì)方向盤轉(zhuǎn)角輸入、依據(jù)先驗(yàn)知識(shí)估計(jì)的車輛狀態(tài)以及對(duì)自身目標(biāo)路徑的預(yù)覽來(lái)判斷自身最優(yōu)決策,而車輛要根據(jù)當(dāng)前車輛狀態(tài),駕駛員對(duì)方向盤轉(zhuǎn)角輸入、駕駛員對(duì)車輛狀態(tài)估計(jì)與真實(shí)狀態(tài)的偏差以及對(duì)自身目標(biāo)路徑的預(yù)覽來(lái)判斷當(dāng)前應(yīng)采取的策略,收益函數(shù)值的大小設(shè)計(jì)與三個(gè)因素相關(guān),一個(gè)是駕駛員和車輛操作輸入,一個(gè)是駕駛員和車輛操作輸入相關(guān)的權(quán)重系數(shù),還有一個(gè)是路徑可預(yù)覽范圍最遠(yuǎn)處的系統(tǒng)狀態(tài),實(shí)現(xiàn)人車行駛收益博弈,在非完全信息條件下,沒(méi)有將不能完全掌握的系統(tǒng)狀態(tài)設(shè)為人車博弈收益函數(shù)的一部分,收益函數(shù)設(shè)計(jì)如下:
其中,Jd、Jc分別為駕駛員和車輛收益函數(shù)其值都為J,Q1、Q2分別為駕駛員和車輛的收益函數(shù)加權(quán)矩陣,u(k)為車輛輸入向量,v(k)為駕駛員方向盤轉(zhuǎn)角輸入向量,CTC為車輛狀態(tài)加權(quán)矩陣,Z(T)為車輛可預(yù)覽的最終狀態(tài)收益加權(quán)矩陣;
步驟S4是求解控制策略,針對(duì)上述設(shè)計(jì)的人車操縱博弈模型和所設(shè)計(jì)的收益函數(shù)特點(diǎn),以及利用非完全信息狀態(tài)下駕駛員和車輛對(duì)系統(tǒng)狀態(tài)掌握的信息不對(duì)稱的特點(diǎn),在非完全信息情況下,車輛所掌握系統(tǒng)狀態(tài)Z1(k)近似等于車輛真實(shí)狀態(tài)Z(k),駕駛員只能獲得自身估計(jì)的系統(tǒng)狀態(tài)Z2(k);
在非完全信息模式下,車輛根據(jù)掌握的系統(tǒng)狀態(tài)Z1(k)和駕駛員估計(jì)系統(tǒng)狀態(tài)Z2(k)與實(shí)際值Z(k)的偏差這兩個(gè)因素來(lái)制定自身決策,而駕駛員根據(jù)自身對(duì)系統(tǒng)狀態(tài)的估計(jì)Z2(k)來(lái)判斷自身決策,則設(shè)駕駛員估計(jì)系統(tǒng)狀態(tài)與實(shí)際值的偏差車輛方向盤轉(zhuǎn)角輸入u(k)和駕駛員方向盤轉(zhuǎn)角輸入v(k)為如下形式:
v(k)=CdZ2(k)
其中,Cc、Cd、Dc為變量,求解駕駛員和車輛隨對(duì)方操作輸入以及實(shí)時(shí)估計(jì)狀態(tài)變化的方向盤轉(zhuǎn)角策略與方向盤轉(zhuǎn)角疊加策略,其中駕駛員操縱輸入由傳感器測(cè)得和軟件估計(jì)方法得到,并將測(cè)得和估計(jì)得到的數(shù)據(jù)傳輸給控制器進(jìn)行比對(duì)分析,控制器計(jì)算當(dāng)前車輛非完全信息狀態(tài)下的非合作博弈最優(yōu)方向盤轉(zhuǎn)角疊加策略;
步驟S5迭代求解參數(shù),根據(jù)上述S4中推導(dǎo)的最優(yōu)控制策略求解公式,推導(dǎo)迭代求解控制策略中變化的參數(shù)的實(shí)時(shí)迭代求解方法,求解u(k)和v(k),然后將求得的均衡解u(k)和v(k)作用于人車操縱博弈模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吉林大學(xué);江蘇超力電器有限公司,未經(jīng)吉林大學(xué);江蘇超力電器有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110694150.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 博弈數(shù)據(jù)分析方法及裝置
- 一種在即時(shí)通訊工具中實(shí)現(xiàn)博弈活動(dòng)的方法
- 面向多智能體同步博弈的建模方法及動(dòng)作預(yù)測(cè)系統(tǒng)
- 一種多主體博弈的增量配電網(wǎng)源網(wǎng)荷協(xié)同規(guī)劃方法
- 一種基于三方演化博弈的配電網(wǎng)決策方法、裝置和設(shè)備
- 對(duì)抗環(huán)境下多無(wú)人機(jī)協(xié)同目標(biāo)分配方法及系統(tǒng)
- 目標(biāo)均衡博弈的處理方法和裝置
- 一種業(yè)務(wù)執(zhí)行方法、裝置及其相關(guān)設(shè)備
- 用于云原生應(yīng)用資源調(diào)度的博弈優(yōu)化方法及其系統(tǒng)
- 一種機(jī)器博弈輔助決策方法及系統(tǒng)





