[發明專利]虛擬對象控制、模型訓練方法、裝置和計算機設備有效
| 申請號: | 202110251267.8 | 申請日: | 2021-03-08 |
| 公開(公告)號: | CN112933605B | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 季興;紀曉龍;許壯;李賜興;朱曉龍;湯善敏;張正生;劉永升 | 申請(專利權)人: | 超參數科技(深圳)有限公司 |
| 主分類號: | A63F13/67 | 分類號: | A63F13/67;A63F13/822 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 唐彩琴 |
| 地址: | 518000 廣東省深圳市南山區粵海街道高*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 虛擬 對象 控制 模型 訓練 方法 裝置 計算機 設備 | ||
1.一種虛擬對象控制方法,其特征在于,所述方法包括:
獲取當前虛擬環境的配置信息,根據所述配置信息確定目標虛擬對象及所述目標虛擬對象對應的目標觀察變量類型;
獲取所述目標虛擬對象對應的當前觀察變量;
將所述當前觀察變量映射成預設維度的特征向量,得到第一特征向量;預設維度由觀察變量類型集合的數量決定;所述觀察變量類型集合包括當前虛擬環境對應的所有虛擬對象的觀察變量類型;
將所述目標觀察變量類型按照預設的順序分別與所述觀察變量類型集合中的各個觀察變量類型進行匹配;在匹配的過程中,根據匹配成功的觀察變量類型確定第一特征數值,根據匹配失敗的觀察變量類型確定第二特征數值;將第一特征數值和第二特征數值按照所述預設的順序組合得到第二特征向量;
組合所述第一特征向量及所述第二特征向量,得到所述目標虛擬對象對應的目標特征向量;
將所述目標特征向量輸入已訓練的控制模型中,基于所述控制模型的輸出結果控制所述目標虛擬對象執行對應的目標動作。
2.根據權利要求1所述的方法,其特征在于,所述將所述目標特征向量輸入已訓練的控制模型中,基于所述控制模型的輸出結果控制所述目標虛擬對象執行對應的目標動作包括:
將所述目標特征向量輸入已訓練的控制模型中,基于所述控制模型將所述目標特征向量分類至預設的動作類別集合中至少一類;
根據分類得到的至少一類動作控制所述目標虛擬對象執行對應的目標動作。
3.根據權利要求1所述的方法,其特征在于,所述第一特征數值為1;所述第二特征數值為0。
4.根據權利要求3所述的方法,其特征在于,所述將所述目標特征向量輸入已訓練的控制模型中,基于所述控制模型的輸出結果控制所述目標虛擬對象執行對應的目標動作包括:
將所述目標特征向量輸入已訓練的控制模型中,根據所述目標特征向量中的第二特征向量確定所述控制模型中所述目標虛擬對象對應的目標子圖,通過所述目標子圖并基于所述目標特征向量中的第一特征向量得到所述輸出結果。
5.一種模型訓練方法,其特征在于,所述方法包括:
獲取訓練虛擬環境對應的訓練配置信息,根據所述訓練配置信息確定訓練虛擬對象及訓練虛擬對象對應的目標訓練觀察變量類型;
獲取所述訓練虛擬對象對應的當前訓練觀察變量及當前動作標簽;
將所述當前訓練觀察變量映射成預設維度的特征向量,得到第一訓練特征向量;預設維度由觀察變量類型集合的數量決定;所述觀察變量類型集合包括訓練虛擬環境對應的所有虛擬對象的觀察變量類型;
將所述目標訓練觀察變量類型按照預設的順序分別與所述觀察變量類型集合中的各個觀察變量類型進行匹配;在匹配的過程中,根據匹配成功的觀察變量類型確定第一特征數值,根據匹配失敗的觀察變量類型確定第二特征數值;將第一特征數值和第二特征數值按照所述預設的順序組合得到第二訓練特征向量;
組合所述第一訓練特征向量及所述第二訓練特征向量,得到所述訓練虛擬對象對應的目標訓練特征向量;
將所述目標訓練特征向量輸入控制模型中,得到所述控制模型的實際輸出結果;
基于所述實際輸出結果和所述動作標簽的差異,訓練所述控制模型,直至滿足訓練停止條件時,得到已訓練的控制模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于超參數科技(深圳)有限公司,未經超參數科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110251267.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種毛細管移液裝置
- 下一篇:一種基于人工智能的垃圾分類方法





