[發(fā)明專利]基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心能耗優(yōu)化控制方法在審

申請(qǐng)?zhí)枺?/td>	202210052986.1	申請(qǐng)日：	2022-01-18
公開（公告）號(hào)：	CN114511208A	公開（公告）日：	2022-05-17
發(fā)明（設(shè)計(jì)）人：	馮炫;王為源;嚴(yán)寧;潘冬;蘭巍	申請(qǐng)（專利權(quán)）人：	陜西智引科技有限公司
主分類號(hào)：	G06Q10/06	分類號(hào)：	G06Q10/06;G06Q10/04;G06Q50/06;G06N3/08;G06N3/04;G06K9/62
代理公司：	濟(jì)南譽(yù)琨知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 37278	代理人：	袁彤彤
地址：	710000 陜***	國省代碼：	陜西;61
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于深度強(qiáng)化學(xué)習(xí) 數(shù)據(jù)中心能耗優(yōu)化控制方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心能耗優(yōu)化控制方法，其特征在于，包括以下有效步驟：

a、建立深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)：所述深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)包括策略網(wǎng)絡(luò)Actor，評(píng)估網(wǎng)絡(luò)Critic1，評(píng)估網(wǎng)絡(luò)Critic2以及對(duì)應(yīng)的3個(gè)目標(biāo)網(wǎng)絡(luò)Actor-Target、Critic1-Target和Critic2-Target，其中，所述Actor網(wǎng)絡(luò)和Actor-Target網(wǎng)絡(luò)之間，Critic1網(wǎng)絡(luò)、Critic2網(wǎng)絡(luò)、Critic1-Target網(wǎng)絡(luò)和Critic2-Target網(wǎng)絡(luò)之間有相同的網(wǎng)絡(luò)結(jié)構(gòu)相同、參數(shù)不同；

b、確定深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)的狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì)函數(shù)計(jì)算方法；

c、深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)初始化：通過隨機(jī)參數(shù)初始化策略網(wǎng)絡(luò)Actor網(wǎng)絡(luò)，評(píng)估網(wǎng)絡(luò)Critic1網(wǎng)絡(luò)，評(píng)估網(wǎng)絡(luò)Critic2網(wǎng)絡(luò)的參數(shù)θ₁，θ₂；以及目標(biāo)網(wǎng)絡(luò)Actor-target網(wǎng)絡(luò)，Critic1-target網(wǎng)絡(luò)，Critic2-target網(wǎng)絡(luò)的參數(shù)θ_1-，θ_2-；初始化經(jīng)驗(yàn)回放內(nèi)容大小M；

d、深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練：對(duì)于每次訓(xùn)練，根據(jù)當(dāng)前策略和噪音選擇負(fù)載分配和冷卻點(diǎn)溫度選擇動(dòng)作，然后執(zhí)行該動(dòng)作獲得下一狀態(tài)和獎(jiǎng)勵(lì)，并將該存儲(chǔ)狀態(tài)轉(zhuǎn)移值放到經(jīng)驗(yàn)回放內(nèi)存M中，當(dāng)M滿時(shí)，從經(jīng)驗(yàn)回放中隨機(jī)采樣，獲得N個(gè)狀態(tài)轉(zhuǎn)移值，并得到Critic1-target網(wǎng)絡(luò)和Critic2-target網(wǎng)絡(luò)中的和并得到最小target值：然后計(jì)算td_error，最后使用td_error更新Critic1網(wǎng)絡(luò)和Critic2網(wǎng)絡(luò)，其中，td_error的計(jì)算方法如下：

其中，λ為獎(jiǎng)勵(lì)函數(shù)值；γ為折扣因子；θ₁為評(píng)估網(wǎng)絡(luò)1的目標(biāo)網(wǎng)絡(luò)Critic1_Target的網(wǎng)絡(luò)參數(shù)，θ₂為評(píng)估網(wǎng)絡(luò)2的目標(biāo)網(wǎng)絡(luò)Critic2_Target的網(wǎng)絡(luò)參數(shù)，2個(gè)目標(biāo)網(wǎng)絡(luò)初始值不同，計(jì)算目標(biāo)Q值不同；

e、重復(fù)執(zhí)行d步驟完成深度強(qiáng)化模型的訓(xùn)練，得到關(guān)于負(fù)載分配和冷卻系統(tǒng)控制的最優(yōu)策略網(wǎng)絡(luò)模型。

2.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心能耗優(yōu)化控制方法，其特征在于，所述b步驟中，狀態(tài)函數(shù)的計(jì)算方法為：狀態(tài)向量為天氣溫度T_outdoor(t)和數(shù)據(jù)中心總的負(fù)載量J(t)組成的元組：[天氣溫度T_outdoor(t)，數(shù)據(jù)中心總的負(fù)載量J(t)]。

3.根據(jù)權(quán)利要求2所述的基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心能耗優(yōu)化控制方法，其特征在于，所述b步驟中，動(dòng)作函數(shù)的計(jì)算方法為：動(dòng)作向量為數(shù)據(jù)中心每個(gè)區(qū)域的負(fù)載量j_i(t)和每個(gè)區(qū)域的冷卻點(diǎn)溫度組成的元組，動(dòng)作的個(gè)數(shù)由數(shù)據(jù)中心的區(qū)域個(gè)數(shù)決定，動(dòng)作向量包括以下2*n個(gè)動(dòng)作：[數(shù)據(jù)中心第i個(gè)區(qū)域的冷卻系統(tǒng)冷卻點(diǎn)溫度數(shù)據(jù)中心第i個(gè)區(qū)域的負(fù)載情況j_i(t)]。

4.根據(jù)權(quán)利要求3所述的基于深度強(qiáng)化學(xué)習(xí)的數(shù)據(jù)中心能耗優(yōu)化控制方法，其特征在于，所述b步驟中，獎(jiǎng)勵(lì)函數(shù)的計(jì)算方法為：獎(jiǎng)勵(lì)函數(shù)計(jì)算如下：其中m為動(dòng)作考慮延遲的時(shí)間步步數(shù)，k_j是當(dāng)前L_t值在r_t中所占的權(quán)重，r_t指的是當(dāng)前函數(shù)值，L_t是未來時(shí)間步的函數(shù)值，然后利用未來時(shí)間步占比當(dāng)前函數(shù)值的權(quán)重以及所延遲的時(shí)間步步數(shù)計(jì)算。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于陜西智引科技有限公司，未經(jīng)陜西智引科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210052986.1/1.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：一種藥學(xué)用藥品存放設(shè)備
下一篇：巡檢用無人機(jī)的臨時(shí)停靠站

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法；其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政；管理
G06Q10-02 .預(yù)定，例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化，例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理，例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源；企業(yè)規(guī)劃；組織模型
G06Q10-08 .物流，例如倉儲(chǔ)、裝貨、配送或運(yùn)輸；存貨或庫存管理，例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動(dòng)化，例如電子郵件或群件的計(jì)算機(jī)輔助管理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】