[發明專利]一種網聯車系統的調度方法在審
| 申請號: | 202210492491.0 | 申請日: | 2022-04-29 |
| 公開(公告)號: | CN114781902A | 公開(公告)日: | 2022-07-22 |
| 發明(設計)人: | 王強;劉天驕;徐琛 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q30/02;G06Q50/30;H04L67/12 |
| 代理公司: | 北京永創新實專利事務所 11121 | 代理人: | 易卜 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網聯車 系統 調度 方法 | ||
1.一種網聯車系統的調度方法,其特征在于,具體步驟如下:
首先、針對當前時刻,實時獲取待調度區域及相鄰區域的服務方和服務對象的數量,作為供需信息;
然后、利用樣本訓練神經網絡,并將供需信息輸入至訓練好的神經網絡中,輸出每個區域所有定價因子的價值估計值;并利用ε-greedy策略,為各區域選擇各自的唯一定價因子;
最后、將各區域的服務對象數量和唯一定價因子輸入至調節函數,計算各區域中接受定價的服務對象數量,隨機選擇等數量的服務方進行服務;
針對區域Zi,接受定價的服務對象數量的計算公式為:
其中表示區域Zi的服務對象請求數,表示接受定價的服務對象數量與定價因子成負線性相關的調節函數;
同時,將各區域沒有接受定價的剩余服務方,輸入至已學習的網絡流調度模型,輸出對各服務方的調度策略并執行。
2.如權利要求1所述的一種網聯車系統的調度方法,其特征在于,所述訓練神經網絡的步驟如下:
首先,將各個歷史時刻的供需信息,區域的定價因子存儲到樣本池;對樣本池進行有放回采樣,得到經驗樣本,將各區域當前歷史時刻的經驗樣本輸入估計Q網絡中,輸出對應區域定價因子的價值估計值;
然后,將各區域下一歷史時刻的經驗樣本輸入目標Q網絡中,輸出對應區域定價因子的價值目標值;
最后,針對同一個區域的價值估計值與價值目標值,基于最小化差值為訓練目標,構建損失函數,通過隨機梯度下降最小化損失函數,更新估計Q網絡的參數;并每隔固定迭代次數,更新目標Q網絡;直至達到最大迭代次數,將估計Q網絡確定為訓練完的神經網絡模型。
3.如權利要求2所述的一種網聯車系統的調度方法,其特征在于,所述損失函數如下:
其中,θ是估計Q網絡的參數,θ-是目標Q網絡的參數,指區域Zi當前歷史時刻t的供需信息,指區域Zi當前歷史時刻t的定價因子,γ為超參數,作為即時回報和未來價值的權重;
rti指區域Zi當前歷史時刻t選擇定價因子得到的回報值,計算如下:
其中是服務方能夠滿足服務的對象數量,是由各區域的訂單距離和行程時間得到的固定價格,是區域Zi當前歷史時刻t對應的服務方數量;是區域Zi當前歷史時刻t對應的服務對象數量;pently是預設的數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210492491.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種空調制冷熱用可變轉換閥
- 下一篇:一種水質自動調節系統及水質自動調節方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





