[發明專利]一種網聯車系統的調度方法在審

申請號：	202210492491.0	申請日：	2022-04-29
公開（公告）號：	CN114781902A	公開（公告）日：	2022-07-22
發明（設計）人：	王強;劉天驕;徐琛	申請（專利權）人：	北京郵電大學
主分類號：	G06Q10/06	分類號：	G06Q10/06;G06Q30/02;G06Q50/30;H04L67/12
代理公司：	北京永創新實專利事務所 11121	代理人：	易卜
地址：	100876 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種網聯車系統調度方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種網聯車系統的調度方法，其特征在于，具體步驟如下：

首先、針對當前時刻，實時獲取待調度區域及相鄰區域的服務方和服務對象的數量，作為供需信息；

然后、利用樣本訓練神經網絡，并將供需信息輸入至訓練好的神經網絡中，輸出每個區域所有定價因子的價值估計值；并利用ε-greedy策略，為各區域選擇各自的唯一定價因子；

最后、將各區域的服務對象數量和唯一定價因子輸入至調節函數，計算各區域中接受定價的服務對象數量，隨機選擇等數量的服務方進行服務；

針對區域Z_i，接受定價的服務對象數量的計算公式為：

其中表示區域Z_i的服務對象請求數，表示接受定價的服務對象數量與定價因子成負線性相關的調節函數；

同時，將各區域沒有接受定價的剩余服務方，輸入至已學習的網絡流調度模型，輸出對各服務方的調度策略并執行。

2.如權利要求1所述的一種網聯車系統的調度方法，其特征在于，所述訓練神經網絡的步驟如下：

首先，將各個歷史時刻的供需信息，區域的定價因子存儲到樣本池；對樣本池進行有放回采樣，得到經驗樣本，將各區域當前歷史時刻的經驗樣本輸入估計Q網絡中，輸出對應區域定價因子的價值估計值；

然后，將各區域下一歷史時刻的經驗樣本輸入目標Q網絡中，輸出對應區域定價因子的價值目標值；

最后，針對同一個區域的價值估計值與價值目標值，基于最小化差值為訓練目標，構建損失函數，通過隨機梯度下降最小化損失函數，更新估計Q網絡的參數；并每隔固定迭代次數，更新目標Q網絡；直至達到最大迭代次數，將估計Q網絡確定為訓練完的神經網絡模型。

3.如權利要求2所述的一種網聯車系統的調度方法，其特征在于，所述損失函數如下：

其中，θ是估計Q網絡的參數，θ^-是目標Q網絡的參數，指區域Z_i當前歷史時刻t的供需信息，指區域Z_i當前歷史時刻t的定價因子，γ為超參數，作為即時回報和未來價值的權重；

r_tⁱ指區域Z_i當前歷史時刻t選擇定價因子得到的回報值，計算如下：

其中是服務方能夠滿足服務的對象數量，是由各區域的訂單距離和行程時間得到的固定價格，是區域Z_i當前歷史時刻t對應的服務方數量；是區域Z_i當前歷史時刻t對應的服務對象數量；pently是預設的數值。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學，未經北京郵電大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210492491.0/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】