[發明專利]基于多智能體的邊緣云可擴展任務卸載方法在審
| 申請號: | 202110462090.6 | 申請日: | 2021-04-27 |
| 公開(公告)號: | CN113064671A | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 孫立峰;姜麗麗;黃天馳;張睿霄 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F9/445 | 分類號: | G06F9/445;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 徐章偉 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 智能 邊緣 擴展 任務 卸載 方法 | ||
1.一種基于多智能體的邊緣云可擴展任務卸載方法,其特征在于,包括以下步驟:
在創建環境并初始化多個智能體的模型參數后,初始化每個Agent的網絡結構,定義狀態S,行為A和獎勵函數R,定義目標值函數Q,每個Agent根據自己觀測的狀態與移動邊緣網絡環境進行交互,將輸入狀態與輸出行為保存至經驗回放池;
每個智能體對所述經驗回放池中的數據進行采樣,訓練自己的actor和critic網絡并優化參數;以及
在模型收斂至滿足迭代條件后生成卸載策略,并根據所述卸載策略進行卸載決策。
2.根據權利要求1所述的方法,其特征在于,還包括:
檢測是否加入新設備
在檢測到加入所述新設備后,重置環境,設置新的智能體網絡參數,以使得所述每個智能體進行采樣和進行卸載決策。
3.根據權利要求1所述的方法,其特征在于,還包括:
根據由智能體網絡結構、交互環境和多用戶設備間的關系生成的多任務-多用戶-邊緣云模式構建系統模型。
4.根據權利要求1所述的方法,其特征在于,所述將輸入狀態與輸出行為保存至經驗回放池,包括:
每個actor根據自己觀測的狀態與移動邊緣網絡環境進行交互,并基于critic的值函數指導下一步行為;
根據預先設置的經驗回放池大小,收集所述輸入狀態與輸出行為,存放到所述經驗回放池。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110462090.6/1.html,轉載請聲明來源鉆瓜專利網。





