[發明專利]基于深度強化學習的AI智慧節能動態控制方法有效
| 申請號: | 202110037945.0 | 申請日: | 2021-01-12 |
| 公開(公告)號: | CN112866021B | 公開(公告)日: | 2021-11-09 |
| 發明(設計)人: | 郭洋;王倩;華奇兵 | 申請(專利權)人: | 中移(成都)信息通信科技有限公司;東聯信息技術有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04W52/02;G06N3/08;G06N3/04 |
| 代理公司: | 成都虹橋專利事務所(普通合伙) 51124 | 代理人: | 吳中偉 |
| 地址: | 610041 四川省成都市中國(四川)*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 強化 學習 ai 智慧 節能 動態控制 方法 | ||
1.基于深度強化學習的AI智慧節能動態控制方法,其特征在于,包括:
步驟(1)、獲取環境狀態信息,所述環境狀態信息包括4G狀態指標、5G狀態指標、話務量數據信息以及投訴萬投比;4G狀態指標包括接入性指標,5G狀態指標包括5G在服比;
步驟(2)、根據環境狀態信息建立環境模型,包括:將節能控制問題建模為馬爾科夫決策過程模型,并定義其中的狀態,動作以及獎賞函數;
所述定義狀態的具體方法包括:
選擇投訴萬投比、接入性指標、5G在服比指標以及話務量數據信息為環境狀態信息;
設t時刻,投訴萬投比為Mt、接入性指標為Mj、5G在服比指標為Mz,此時話務量數據信息為Mh,則狀態St=(Mt,Mj,Mz,Mh);
步驟(3)、在環境模型中加入雙網絡DQN算法,通過雙網絡DQN算法獲取節能控制策略;
步驟(4)、通過節能控制策略生成對應的節能控制指令,并通過節能控制指令進行節能動態控制。
2.根據權利要求1所述的基于深度強化學習的AI智慧節能動態控制方法,其特征在于,在步驟(1)中,所述4G狀態指標包括:MR指標,保持性指標,業務量遷移比,資源利用率指標以及信令連接比指標。
3.根據權利要求2所述的基于深度強化學習的AI智慧節能動態控制方法,其特征在于,在步驟(1)中,所述5G狀態指標包括:雙連接用戶數,雙連接終端數,雙連接添加嘗試次數,5G KPI達標率、以及業務量遷移比。
4.根據權利要求3所述的基于深度強化學習的AI智慧節能動態控制方法,其特征在于,在步驟(1)中,所述環境狀態信息還包括:外部氣象因素。
5.根據權利要求4所述的基于深度強化學習的AI智慧節能動態控制方法,其特征在于,所述定義動作的具體方法包括:
設置4G增容層業務量權重值為θZ、4G覆蓋層業務量權重值為θf、4G轉5G預測業務量權重值為θC、5G SA預測業務量權重值為θS、5G NSA預測業務量權重值為θN以及4G峰值業務量權重值為θm;
若t時刻采取的動作為調高或調低業務量的權重值,則其動作a的集合為,a={[θZ0,θf0,θC0,θS0,θN0,θm0],[θZ1,θf1,θC1,θS1,θN1,θm1],...,[θZn,θfn,θCn,θSn,θNn,θmn]}。
6.根據權利要求5所述的基于深度強化學習的AI智慧節能動態控制方法,其特征在于,所述定義獎賞函數的具體方法包括:
選擇5G KPI達標率K以及投訴萬投比T作為評測指標;
若K<90%或者T>100,則設置獎賞函數r=-1;
若K>90%,并且T<100,則獎賞函數r=W1(E_reward)+W2(K_reward)+W3(T_reward),W1、W2以及W3分別表示權重參數,E_reward表示節能獎勵參數,K_reward表示KPI獎勵參數,T_reward表示投訴比獎勵參數,Emax表示基站站點最大能耗,Et表示t時刻基站站點能耗。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中移(成都)信息通信科技有限公司;東聯信息技術有限公司,未經中移(成都)信息通信科技有限公司;東聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110037945.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種抗酸耐堿混凝土養護方法
- 下一篇:一種家具制造生產線





