[發(fā)明專利]訓(xùn)練調(diào)度模型的方法、裝置、實現(xiàn)協(xié)同駕駛的方法及裝置有效
| 申請?zhí)枺?/td> | 202210187529.3 | 申請日: | 2022-02-28 |
| 公開(公告)號: | CN114566045B | 公開(公告)日: | 2023-01-17 |
| 發(fā)明(設(shè)計)人: | 李力;張嘉瑋;常成;彭心宇 | 申請(專利權(quán))人: | 清華大學(xué) |
| 主分類號: | G08G1/01 | 分類號: | G08G1/01;G06F18/214 |
| 代理公司: | 北京安信方達(dá)知識產(chǎn)權(quán)代理有限公司 11262 | 代理人: | 蔣冬梅;栗若木 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 訓(xùn)練 調(diào)度 模型 方法 裝置 實現(xiàn) 協(xié)同 駕駛 | ||
1.一種訓(xùn)練調(diào)度模型的方法,包括:
待訓(xùn)練的調(diào)度模型對輸入的每一輛待通過無信號交叉口的第一車輛的樣本車輛狀態(tài)信息進(jìn)行嵌入處理,獲得各第一車輛相應(yīng)的高維狀態(tài)向量;其中,所述高維狀態(tài)向量的維度為預(yù)設(shè)維度;
對獲得的高維狀態(tài)向量進(jìn)行處理,獲得每一輛第一車輛的關(guān)聯(lián)關(guān)系信息;其中,所述關(guān)聯(lián)關(guān)系信息包括每一輛第一車輛的:高維狀態(tài)向量和該第一車輛與其他第一車輛的沖突和耦合關(guān)系信息,其他第一車輛為該第一車輛自身以外的其他車輛;
根據(jù)獲得的關(guān)聯(lián)關(guān)系信息確定第一車輛的通行順序信息;
根據(jù)獲得的通行順序信息計算所有待通過無信號交叉口的第一車輛均通過無信號交叉口的延遲總和;
根據(jù)計算出的延遲總和確定待訓(xùn)練的調(diào)度模型的參數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對獲得的高維狀態(tài)向量進(jìn)行處理,包括:
對獲得的高維狀態(tài)向量通過預(yù)設(shè)的第一循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行處理。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)獲得的關(guān)聯(lián)關(guān)系信息確定第一車輛的通行順序信息,包括:
將所述關(guān)聯(lián)關(guān)系信息輸入至預(yù)設(shè)的第二循環(huán)神經(jīng)網(wǎng)絡(luò),通過所述第二循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練獲得所述第一車輛的通行順序信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述樣本車輛狀態(tài)信息包括所述第一車輛的以下一項或任意組合信息:
位置、優(yōu)先級、速度、轉(zhuǎn)向和路線。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)獲得的通行順序信息計算所有待通過無信號交叉口的第一車輛均通過無信號交叉口的延遲總和,包括通過以下目標(biāo)函數(shù)計算所述延遲總和:
;
其中,表示所述待通過無信號交叉口的第一車輛i按照所述通行順序信息通過所述無信號交叉口時的延遲,N表示所述待通過無信號交叉口的第一車輛的數(shù)目,J表示所述延遲總和。
6.根據(jù)權(quán)利要求1~5任一項所述的方法,其特征在于,所述根據(jù)計算出的延遲總和確定待訓(xùn)練的調(diào)度模型的參數(shù),包括:
通過策略梯度調(diào)整所述調(diào)度模型的參數(shù),以使根據(jù)參數(shù)調(diào)整后的調(diào)度模型計算出的延遲總和收斂;
所述調(diào)度模型計算出的延遲總和收斂時,保持所述調(diào)度模型的參數(shù)不變。
7.一種實現(xiàn)協(xié)同駕駛的方法,包括:
接收路測設(shè)備實時獲取的待通過無信號交叉口的第二車輛的車輛實時狀態(tài)信息;
將接收到的車輛實時狀態(tài)信息輸入預(yù)設(shè)的調(diào)度模型,獲得第二車輛的通行順序信息;
根據(jù)獲得的第二車輛的通行順序信息對第二車輛進(jìn)行行駛控制;
其中,通過如權(quán)利要求1~6中任一項所述的訓(xùn)練調(diào)度模型的方法訓(xùn)練的所述調(diào)度模型。
8.一種計算機存儲介質(zhì),所述計算機存儲介質(zhì)中存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1~6中任一項所述的訓(xùn)練調(diào)度模型的方法,或如權(quán)利要求7所述的實現(xiàn)協(xié)同駕駛的方法。
9.一種終端,包括:存儲器和處理器,所述存儲器中保存有計算機程序;其中,
處理器被配置為執(zhí)行存儲器中的計算機程序;
所述計算機程序被所述處理器執(zhí)行時實現(xiàn)如權(quán)利要求1~6中任一項所述的訓(xùn)練調(diào)度模型的方法,或如權(quán)利要求7所述的實現(xiàn)協(xié)同駕駛的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210187529.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 旅游車輛調(diào)度監(jiān)控方法及其系統(tǒng)
- 一種用戶隊列調(diào)度的方法和裝置
- 一種資源調(diào)度的方法、裝置和過濾式調(diào)度器
- 一種調(diào)度方法和裝置
- 一種調(diào)度終端動態(tài)切換調(diào)度組歸屬關(guān)系的方法及裝置
- 用戶調(diào)度方法、裝置、基站和存儲介質(zhì)
- 一種食材的調(diào)度系統(tǒng)和方法
- 一種資源調(diào)度的方法、裝置和過濾式調(diào)度器
- 任務(wù)調(diào)度方法、裝置、設(shè)備及存儲介質(zhì)
- 一種自動化調(diào)度系統(tǒng)和調(diào)度方法





