[發(fā)明專利]一種模型訓練方法、游戲測試方法、模擬操作方法及裝置有效
| 申請?zhí)枺?/td> | 202010419220.3 | 申請日: | 2020-05-18 |
| 公開(公告)號: | CN111598169B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設計)人: | 黃超 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F18/2415 | 分類號: | G06F18/2415;G06F18/25;G06F18/214 |
| 代理公司: | 深圳市深佳知識產(chǎn)權代理事務所(普通合伙) 44285 | 代理人: | 聶秀娜 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 方法 游戲 測試 模擬 操作方法 裝置 | ||
1.一種模型訓練方法,其特征在于,包括:
從游戲視頻樣本中獲取第一地圖樣本、第二地圖樣本以及M個地圖樣本,其中,所述游戲視頻樣本至少包括三幀游戲圖像,每幀游戲圖像包括一個地圖樣本,所述第一地圖樣本與所述第二地圖樣本之間間隔所述M個地圖樣本,所述M為大于或等于1的整數(shù);
基于所述第一地圖樣本,通過待訓練多任務深度模型所包括的待訓練主任務網(wǎng)絡獲取動作類別概率,其中,所述第一地圖樣本對應于目標動作類別;
基于所述第一地圖樣本以及M個動作類別,通過所述待訓練多任務深度模型所包括的待訓練輔助任務網(wǎng)絡獲取預測地圖,其中,所述M個動作類別與所述M個地圖樣本具有對應關系;
根據(jù)所述動作類別概率、所述目標動作類別、所述預測地圖以及所述第二地圖樣本,對所述待訓練多任務深度模型進行訓練,得到多任務深度模型,其中,所述多任務深度模型包括主任務網(wǎng)絡以及輔助任務網(wǎng)絡。
2.根據(jù)權利要求1所述的模型訓練方法,其特征在于,所述從游戲視頻樣本中獲取第一地圖樣本、第二地圖樣本以及M個地圖樣本,包括:
獲取所述游戲視頻樣本;
從所述游戲視頻樣本中獲取第一游戲圖像以及第二游戲圖像,其中,所述第一游戲圖像與所述第二游戲圖像之間間隔M個游戲圖像;
根據(jù)所述第一游戲圖像獲取所述第一地圖樣本;
根據(jù)所述第二游戲圖像獲取所述第二地圖樣本。
3.根據(jù)權利要求1所述的模型訓練方法,其特征在于,所述基于所述第一地圖樣本,通過待訓練多任務深度模型所包括的待訓練主任務網(wǎng)絡獲取動作類別概率,包括:
基于所述第一地圖樣本,通過所述待訓練多任務深度模型所包括的至少一個卷積層,獲取圖像卷積特征;
基于所述圖像卷積特征,通過所述待訓練主任務網(wǎng)絡所包括的至少一個全連接層,獲取所述動作類別概率。
4.根據(jù)權利要求1所述的模型訓練方法,其特征在于,所述基于所述第一地圖樣本以及M個動作類別,通過所述待訓練多任務深度模型所包括的待訓練輔助任務網(wǎng)絡獲取預測地圖,包括:
獲取所述M個動作類別;
基于所述第一地圖樣本,通過所述待訓練多任務深度模型所包括的至少一個卷積層,獲取圖像卷積特征;
基于所述圖像卷積特征,通過所述待訓練輔助任務網(wǎng)絡所包括的第一全連接層,獲取第一特征向量;
基于所述M個動作類別,通過所述待訓練輔助任務網(wǎng)絡所包括的第二全連接層,獲取第二特征向量;
基于所述第一特征向量以及所述第二特征向量,通過所述待訓練輔助任務網(wǎng)絡所包括的第三全連接層獲取第三特征向量;
基于所述第三特征向量,通過所述待訓練輔助任務網(wǎng)絡所包括的轉換層獲取特征矩陣;
基于所述特征矩陣,通過所述待訓練輔助任務網(wǎng)絡所包括的至少一個上采樣層,獲取所述預測地圖。
5.根據(jù)權利要求4所述的模型訓練方法,其特征在于,所述基于所述第一地圖樣本,通過所述待訓練多任務深度模型所包括的至少一個卷積層,獲取圖像卷積特征,包括:
基于所述第一地圖樣本,通過所述待訓練多任務深度模型所包括的第一卷積層,獲取第一圖像卷積特征;
基于所述第一圖像卷積特征,通過所述待訓練多任務深度模型所包括的第二卷積層,獲取第二圖像卷積特征;
基于所述第二圖像卷積特征,通過所述待訓練多任務深度模型所包括的第三卷積層,獲取圖像卷積特征;
所述基于所述特征矩陣,通過所述待訓練輔助任務網(wǎng)絡所包括的至少一個上采樣層,獲取所述預測地圖,包括:
基于所述特征矩陣,通過所述待訓練輔助任務網(wǎng)絡所包括的第一上采樣層,獲取第一圖像特征;
基于所述第一圖像特征以及所述第二圖像卷積特征,通過所述待訓練輔助任務網(wǎng)絡所包括的第二上采樣層,獲取第二圖像特征;
基于所述第二圖像特征以及所述第一圖像卷積特征,通過所述待訓練輔助任務網(wǎng)絡所包括的第三上采樣層,獲取所述預測地圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010419220.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





