[發明專利]邊緣計算任務的在線分派調度方法和系統有效
| 申請號: | 202110348337.1 | 申請日: | 2021-03-31 |
| 公開(公告)號: | CN112799823B | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 郭得科;袁昊;鄭龍;魏超;羅來龍;吳亞輝;唐國明 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F9/48 | 分類號: | G06F9/48;G06F9/50 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 曾志鵬 |
| 地址: | 410003 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 邊緣 計算 任務 在線 分派 調度 方法 系統 | ||
1.一種邊緣計算任務的在線分派調度方法,應用于邊緣計算任務的在線分派調度系統,所述在線分派調度系統包括:
用戶終端,接入點和邊緣服務器;
所述邊緣計算任務的在線分派調度方法包括:
所述用戶終端將任務發送給所述接入點;
所述接入點根據最優分派策略從若干所述邊緣服務器選擇目標邊緣服務器,并將所述任務分派到所述目標邊緣服務器;其中,所述最優分派策略由多臂老虎機模型生成;其中,所述接入點根據最優分派策略從若干所述邊緣服務器選擇目標邊緣服務器,具體包括:
對于每個所述邊緣服務器,計算其置信區間上界;所述置信區間上界的計算公式為:;其中,為邊緣服務器
其中,為邊緣服務器在i時刻獲得的獎勵;
將所述置信區間上界最大的所述邊緣服務器確定為所述目標邊緣服務器;
所述目標邊緣服務器根據多隊列加權循環調度模型對所述任務進行處理,并將處理后的所述任務反饋給所述接入點;其中,所述多隊列加權循環調度模型包括:調度器、任務緩沖區和處理池;
所述獎勵包括外部獎勵與加權后的內部獎勵,在
其中,為權重,為外部獎勵,為內部獎勵;
所述外部獎勵為:
其中,為所述任務從所述接入點到所述邊緣服務器
所述內部獎勵為:
;
其中,為所述任務在所述處理池中的處理時延,為內部時延,,為所述任務在所述任務緩沖區的等待時延;
所述目標邊緣服務器根據多隊列加權循環調度模型對所述任務進行處理,包括:
所述目標邊緣服務器將所述任務存儲至所述任務緩沖區等待處理;
所述目標邊緣服務器將結束等待后的所述任務送入所述處理池;
所述目標邊緣服務器通過最優調度策略對所述處理池中的所述任務進行處理;其中,所述最優調度策略由基于DQN模型的所述調度器產生;
所述接入點將所述處理后的所述任務發送給所述用戶終端。
2.根據權利要求1所述的邊緣計算任務的在線分派調度方法,其中,所述DQN模型包括主網絡和目標網絡;
所述DQN模型的損失函數為:
其中為所述主網絡的參數,為所述主網絡生成的評估當前環境狀態和動作的當前Q值,為所述目標網絡生成的目標Q值,其計算公式為:
其中為所述目標網絡的參數, 是折扣累計因子,為下一時刻環境狀態和下一時刻動作的Q值,是獎勵。
3.根據權利要求2所述的邊緣計算任務的在線分派調度方法,其中,所述最優調度策略通過以下方法生成:
所述調度器獲取存儲在所述處理池和所述任務緩沖區的任務的基本信息;
所述調度器從所述基本信息中實時獲取環境狀態;
所述調度器根據當前時刻的所述環境狀態,以方法執行Q值最大的動作,生成所述最優調度策略;
所述調度器根據獎勵函數獲得所述動作的獎勵;
所述調度器根據所述獎勵使用經驗回放法更新所述主網絡,得到更新后的所述主網絡;
所述調度器根據所述更新后的所述主網絡使用隨機梯度下降法更新所述目標網絡。
4.根據權利要求3所述的一種邊緣計算任務的在線分派調度方法,其中,所述獎勵函數,定義如下:
其中為權重,s(t)為某一時刻的環境狀態,a(t)為某一時刻的動作;
表示所述任務緩沖區中任務的平均等待時間;表示所述處理池中任務的平均處理時間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110348337.1/1.html,轉載請聲明來源鉆瓜專利網。





