[發(fā)明專利]用于操作空調(diào)系統(tǒng)的控制器和空調(diào)系統(tǒng)的控制方法在審
| 申請?zhí)枺?/td> | 201780061463.0 | 申請日: | 2017-08-10 |
| 公開(公告)號: | CN109804206A | 公開(公告)日: | 2019-05-24 |
| 發(fā)明(設(shè)計)人: | A-M·法拉赫曼德;S·納比;P·格羅弗;丹尼爾·N·尼科夫斯基 | 申請(專利權(quán))人: | 三菱電機株式會社 |
| 主分類號: | F24F11/64 | 分類號: | F24F11/64 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 師瑋;黃綸偉 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 空調(diào)系統(tǒng) 處理器 存儲器 控制命令 狀態(tài)數(shù)據(jù) 控制器 強化學(xué)習(xí)算法 數(shù)據(jù)輸出部 數(shù)據(jù)輸入部 發(fā)送控制 價值函數(shù) 接收空間 接收控制 控制調(diào)節(jié) 控制信號 室內(nèi)空間 致動器 獎勵 耦接 存儲 關(guān)聯(lián) 輸出 積累 應(yīng)用 | ||
1.一種用于操作對室內(nèi)空間進行調(diào)節(jié)的空調(diào)系統(tǒng)的控制器,該控制器包括:
數(shù)據(jù)輸入部,該數(shù)據(jù)輸入部用于接收空間中多個點處的空間的狀態(tài)數(shù)據(jù);
存儲器,該存儲器用于存儲強化學(xué)習(xí)算法的代碼,以及所述狀態(tài)數(shù)據(jù)的歷史和已經(jīng)應(yīng)用至所述空調(diào)系統(tǒng)的控制命令的歷史,其中,所述控制命令的歷史與獎勵的歷史和所述狀態(tài)數(shù)據(jù)相關(guān)聯(lián);
處理器,該處理器耦接至所述存儲器,利用所述強化學(xué)習(xí)算法來確定輸出所述獎勵的積累價值的價值函數(shù),并發(fā)送控制命令,其中,所述強化學(xué)習(xí)算法處理所述狀態(tài)數(shù)據(jù)的歷史、所述控制命令的歷史以及所述獎勵數(shù)據(jù)的歷史,并且發(fā)送控制命令;
數(shù)據(jù)輸出部,該數(shù)據(jù)輸出部用于從所述處理器接收所述控制命令并向所述空調(diào)系統(tǒng)發(fā)送控制信號,其中,所述控制信號根據(jù)所述控制命令控制所述空調(diào)系統(tǒng)的至少一個致動器。
2.根據(jù)權(quán)利要求1所述的控制器,其中,每個點處的最新狀態(tài)數(shù)據(jù)包括該點處的溫度、氣流以及濕度的測量值中的一項或組合。
3.根據(jù)權(quán)利要求1所述的控制器,其中,所述傳感器是測量所述空間中的物體的表面上的溫度的紅外IR傳感器。
4.根據(jù)權(quán)利要求1所述的控制器,其中,所述物體是形成所述空間的墻壁。
5.根據(jù)權(quán)利要求1所述的控制器,其中,所述強化學(xué)習(xí)算法基于所述最新狀態(tài)數(shù)據(jù)與所述狀態(tài)數(shù)據(jù)的歷史中的先前狀態(tài)數(shù)據(jù)之間的距離來確定所述價值函數(shù)。
6.根據(jù)權(quán)利要求5所述的控制器,其中,所述距離由核函數(shù)利用對應(yīng)于兩個圖像的兩個狀態(tài)來確定。
7.根據(jù)權(quán)利要求1所述的控制器,其中,所述強化學(xué)習(xí)算法是基于正則化擬合Q迭代RFQI算法來執(zhí)行的。
8.根據(jù)權(quán)利要求1所述的控制器,其中,每個所述狀態(tài)數(shù)據(jù)是指示所述空間中的溫度分布的IR圖像。
9.根據(jù)權(quán)利要求1所述的控制器,其中,每個所述狀態(tài)數(shù)據(jù)由通過所述至少一個傳感器測量的IR圖像的像素數(shù)據(jù)形成。
10.根據(jù)權(quán)利要求1所述的控制器,其中,所述至少一個傳感器包括麥克風(fēng)和語音識別系統(tǒng)。
11.一種調(diào)節(jié)室內(nèi)空間的空調(diào)系統(tǒng)的控制方法,該方法包括以下步驟:
利用至少一個傳感器測量空間中多個點處的空間的狀態(tài)數(shù)據(jù);
存儲所述狀態(tài)數(shù)據(jù)的歷史和已經(jīng)應(yīng)用至所述空調(diào)系統(tǒng)的控制命令的歷史,其中,所述控制命令的歷史與獎勵的歷史和所述狀態(tài)數(shù)據(jù)相關(guān)聯(lián);
確定輸出所述獎勵的積累價值的價值函數(shù),其中,確定所述價值函數(shù)的步驟是利用強化學(xué)習(xí)算法來執(zhí)行的,該強化學(xué)習(xí)算法處理所述狀態(tài)數(shù)據(jù)的歷史、所述控制命令的歷史以及所述獎勵數(shù)據(jù)的歷史,并且發(fā)送控制命令;
基于所述價值函數(shù),利用最新狀態(tài)數(shù)據(jù)和所述狀態(tài)數(shù)據(jù)的歷史來確定控制命令;以及
根據(jù)所述控制命令,利用至少一個致動器來控制所述空調(diào)系統(tǒng)。
12.根據(jù)權(quán)利要求11所述的控制方法,其中,每個點處的最新狀態(tài)數(shù)據(jù)包括該點處的溫度、氣流以及濕度的測量值中的一項或組合。
13.根據(jù)權(quán)利要求11所述的控制方法,其中,所述至少一個傳感器是測量所述空間中的物體的表面上的溫度的紅外IR傳感器。
14.根據(jù)權(quán)利要求11所述的控制方法,其中,所述物體是形成所述空間的墻壁。
15.根據(jù)權(quán)利要求11所述的控制方法,其中,所述強化學(xué)習(xí)算法基于所述最新狀態(tài)數(shù)據(jù)與狀態(tài)數(shù)據(jù)的歷史之間的距離來確定所述價值函數(shù)。
16.根據(jù)權(quán)利要求15所述的控制方法,其中,所述距離由與兩個狀態(tài)的狀態(tài)變量所形成的兩個圖像對應(yīng)的、這兩個狀態(tài)之間的核函數(shù)確定。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于三菱電機株式會社,未經(jīng)三菱電機株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780061463.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:空調(diào)用遙控器
- 下一篇:管道用阻尼器





