[發明專利]閘門控制方法和裝置、電子設備及存儲介質有效
| 申請號: | 202110272117.5 | 申請日: | 2021-03-12 |
| 公開(公告)號: | CN113050565B | 公開(公告)日: | 2022-05-20 |
| 發明(設計)人: | 馬曼曼;豆淵博;李青鋒;段春青;馬丹丹;張衛紅;高帆;喬雨;杜東峰 | 申請(專利權)人: | 北京航空航天大學杭州創新研究院 |
| 主分類號: | G05B19/418 | 分類號: | G05B19/418;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張欣欣 |
| 地址: | 310000 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 閘門 控制 方法 裝置 電子設備 存儲 介質 | ||
1.一種閘門控制方法,其特征在于,包括:
獲取待處理閘門的狀態參數集合;
將所述狀態參數集合輸入預設控制模型,得到所述待處理閘門的控制數據;
根據所述控制數據對所述待處理閘門進行控制;
其中,所述閘門控制方法還包括訓練初始模型得到預設控制模型的步驟,所述初始模型包括深度網絡和獎勵網絡,該步驟包括:
獲取訓練數據,其中,所述訓練數據包括訓練閘門的當前狀態參數集合和當前控制組合;
將所述當前狀態參數集合輸入所述深度網絡,得到所述訓練閘門的當前高級特征和下一控制組合,以根據所述下一控制組合對所述訓練閘門進行控制得到下一狀態參數集合;
將所述當前狀態參數集合、當前高級特征和當前控制組合輸入所述獎勵網絡,得到所述訓練閘門的總獎勵;
根據所述總獎勵對所述初始模型進行訓練,得到所述預設控制模型;
所述獎勵網絡存儲有狀態參數集合與安全獎勵和速度獎勵的第一對應關系、控制組合與效率獎勵的第二對應關系,所述獎勵網絡包括獎勵全連接層,所述將所述當前狀態參數集合、當前高級特征和當前控制組合輸入所述獎勵網絡,得到所述訓練閘門的總獎勵的步驟,包括:
根據所述當前狀態參數集合和第一對應關系處理得到所述訓練閘門的安全獎勵和速度獎勵;
根據所述當前控制組合和第二對應關系處理得到所述訓練閘門的效率獎勵;
將所述安全獎勵、速度獎勵、效率獎勵和當前高級特征輸入所述獎勵全連接層,得到所述訓練閘門的總獎勵。
2.如權利要求1所述的閘門控制方法,其特征在于,所述控制數據包括至少一個控制組合和各所述控制組合對應的期望值,所述根據所述控制數據對所述待處理閘門進行控制的步驟,包括:
根據所述期望值從所述至少一個控制組合中選取目標控制組合;
根據所述目標控制組合對所述待處理閘門進行控制。
3.如權利要求2所述的閘門控制方法,其特征在于,所述根據所述期望值從所述至少一個控制組合中選取目標控制組合的步驟,包括:
對各個所述控制組合對應的期望值進行排序處理,將期望值最大的控制組合作為目標控制組合。
4.如權利要求1所述的閘門控制方法,其特征在于,所述將所述安全獎勵、速度獎勵、效率獎勵和當前高級特征輸入所述獎勵全連接層,得到所述訓練閘門的總獎勵的步驟,包括:
將所述安全獎勵、速度獎勵、效率獎勵和當前高級特征輸入所述獎勵全連接層,處理得到輸出獎勵;
將所述安全獎勵、速度獎勵、效率獎勵和輸出獎勵進行剪切處理,得到所述訓練閘門的總獎勵。
5.如權利要求1所述的閘門控制方法,其特征在于,所述深度網絡包括六個深度全連接層,所述將所述當前狀態參數集合輸入所述深度網絡,得到所述訓練閘門的當前高級特征和下一控制組合的步驟,包括:
將所述當前狀態參數集合輸入第一個深度全連接層,得到第一結果,將所述第一結果輸入第二個深度全連接層,得到第二結果,將所述第二結果輸入第三個深度全連接層,得到第三結果,將所述第三結果輸入第四個深度全連接層,得到第四結果,將所述第四結果輸入第五個深度全連接層,得到所述訓練閘門的當前高級特征;
將所述當前高級特征輸入第六個深度全連接層,得到下一控制組合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學杭州創新研究院,未經北京航空航天大學杭州創新研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110272117.5/1.html,轉載請聲明來源鉆瓜專利網。





