[發明專利]一種基于強化學習的多用戶移動邊緣計算遷移方法在審
| 申請號: | 201911020449.3 | 申請日: | 2019-10-25 |
| 公開(公告)號: | CN110830560A | 公開(公告)日: | 2020-02-21 |
| 發明(設計)人: | 張光林;王璐瑤;沈至榕;張文倩;王琳 | 申請(專利權)人: | 東華大學 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08;G06N20/00 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 徐俊;柏子雵 |
| 地址: | 201600 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 強化 學習 多用戶 移動 邊緣 計算 遷移 方法 | ||
1.一種基于強化學習的多用戶移動邊緣計算遷移方法,其特征在于,包括以下步驟:
S1、系統初始化參數,確定移動設備的個數N;將電池的最大容量設定為默認值,且默認電池初始電量為0;設置:移動設備的靜態功耗、標準化的電池單位損耗成本ω、備用電源成本系數初始化方法參數,初始化Q值均為零,設置加權過去值和新獎賞的學習率α,設置決定未來獎賞重要性的折合因子γ,進入下一步開始迭代;
S2、t時刻的移動設備觀察狀態s(t),使用∈-貪婪算法決定t時刻的最佳的動作a(t);
S3、進行上一步確定的動作a(t),到達下一個狀態;
S4、根據獎賞函數求獎賞r;
S5、更新狀態動作值矩陣Q(s,a),并設置下一個狀態作為當前狀態;
S6、判斷是否滿足迭代終止條件,若滿足,則計算整個方法執行后移動設備的總成本;若不滿足,則跳轉至步驟S2。
2.如權利要求1所述的一種基于強化學習的多用戶移動邊緣計算遷移方法,其特征在于,步驟S4中,所述獎賞r為t時刻前的平均成本與當前時刻成本的差。
3.如權利要求1所述的一種基于強化學習的多用戶移動邊緣計算遷移方法,其特征在于,步驟S6中,移動設備的總成本為時間延遲成本與電池損耗成本之和。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學,未經東華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911020449.3/1.html,轉載請聲明來源鉆瓜專利網。





