[發明專利]一種基于深度強化學習的MPTCP動態編碼調度方法和系統有效
| 申請號: | 202110783870.0 | 申請日: | 2021-07-12 |
| 公開(公告)號: | CN113595684B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 廖彬彬;劉文;張廣興;李振宇 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | H04L1/00 | 分類號: | H04L1/00;H04L69/04;G06V10/82 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 強化 學習 mptcp 動態 編碼 調度 方法 系統 | ||
1.一種網絡動態編碼調度系統,所述網絡包括多條子流,所述系統包括編碼器、調度器和深度多路徑編碼調度裝置,所述深度多路徑編碼調度裝置包括DDPG深度神經網絡和Transformer深度神經網絡,其中,
所述Transformer深度神經網絡用于對所述子流的網絡狀態空間進行轉換,輸入到所述DDPG深度神經網絡,得到用于數據包的編碼率和分配比率,
編碼器用于根據輸入的編碼率進行編碼,
調度器用于根據輸入的分配比率將編碼后的數據包分配給各子流;
其中,所述深度多路徑編碼調度裝置是通過訓練得到的,所述訓練包括將多子流實時狀態的網絡狀態空間輸入轉化為當前狀態下的數據包編碼率和分配比率,最大化接收端的OQS定義的反饋函數,以及通過梯度下降的方法訓練直到收斂;其中,對于時刻t:
Transformer深度神經網絡的狀態空間為
DDPG的動作空間
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110783870.0/1.html,轉載請聲明來源鉆瓜專利網。





