[發明專利]一種游戲模型訓練方法、裝置、電子設備及介質有效
| 申請號: | 202010172706.1 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111389011B | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 陳柯;陳贏峰;范長杰;胡志鵬 | 申請(專利權)人: | 網易(杭州)網絡有限公司 |
| 主分類號: | A63F13/67 | 分類號: | A63F13/67 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 吳迪 |
| 地址: | 310052 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 游戲 模型 訓練 方法 裝置 電子設備 介質 | ||
1.一種游戲模型訓練方法,其特征在于,包括:
針對每個訓練完成的角色模型,將預設的第一環境信息輸入到該角色模型中,以確定該角色模型針對第一環境信息所輸出的第一響應信息;
針對每個訓練完成的角色模型,根據該角色模型的角色類型、第一環境信息和第一響應信息,生成該角色模型的第一訓練樣本;
分別使用每個角色模型的第一訓練樣本對綜合模型進行訓練;所述綜合模型是未經過訓練,或者是未訓練完成的模型;綜合模型所占用的空間小于角色模型所占用的空間;所述綜合模型用于在進行決策時替代每個角色模型進行決策。
2.根據權利要求1所述的游戲模型訓練方法,其特征在于,按照如下方式訓練角色模型:
針對每個角色模型,將預設的第二環境信息輸入到該角色模型中,以確定該角色模型針對第二環境信息所輸出的第二響應信息;
針對每個角色模型,根據該角色模型所對應的第二環境信息和第二響應信息生成第二訓練樣本;
針對每個角色模型,使用該角色模型所對應的第二訓練樣本對該角色模型進行訓練。
3.根據權利要求2所述的游戲模型訓練方法,其特征在于,針對每個角色模型,使用該角色模型所對應的第二訓練樣本對該角色模型進行訓練,包括:
針對每個角色模型,分別計算該角色模型的每個第二訓練樣本所對應的擬合誤差;
針對每個角色模型,根據該角色模型的每個第二訓練樣本所對應的擬合誤差,從第二訓練樣本中選擇出目標第二訓練樣本;
針對每個角色模型,根據該角色模型所對應的目標第二訓練樣本對該角色模型進行訓練。
4.根據權利要求1所述的游戲模型訓練方法,其特征在于,分別使用每個角色模型的第一訓練樣本對綜合模型進行訓練,包括:
根據每個第一訓練樣本的角色類型和第一響應信息,對第一訓練樣本進行分組,以確定多組樣本集合;每組樣本集合中的第一訓練樣本的角色類型和第一響應信息均是相同的;
針對每組樣本集合,根據該組樣本集合中的第一訓練樣本的數量,對該組樣本集合中的第一訓練樣本的數量進行調整;
分別使用所述調整后的每組樣本集合中的第一訓練樣本對綜合模型進行訓練。
5.根據權利要求4所述的游戲模型訓練方法,其特征在于,針對每組樣本集合,根據該組樣本集合中的第一訓練樣本的數量,對該組樣本集合中的第一訓練樣本的數量進行調整,包括:
針對每組樣本集合,若該組樣本集合中的第一訓練樣本的數量超過預設數量閾值,則對該組樣本集合中的第一訓練樣本進行下采樣處理,以調整該組樣本集合中的第一訓練樣本的數量;
針對每組樣本集合,若該組樣本集合中的第一訓練樣本的數量低于預設數量閾值,則對該組樣本集合中的第一訓練樣本進行上采樣處理,以調整該組樣本集合中的第一訓練樣本的數量。
6.根據權利要求5所述的游戲模型訓練方法,其特征在于,針對每組樣本集合,若該組樣本集合中的第一訓練樣本的數量超過預設數量閾值,則對該組樣本集合中的第一訓練樣本進行下采樣處理,以調整該組樣本集合中的第一訓練樣本的數量,包括:
針對每組樣本集合,若該組樣本集合中的第一訓練樣本的數量高于預設數量閾值,則根據該組樣本集合中第一訓練樣本的第一環境信息的分布情況,確定需要刪除的目標第一訓練樣本;
針對每組樣本集合,將該組樣本集合中的目標第一訓練樣本進行刪除,以調整該組樣本集合中的第一訓練樣本的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于網易(杭州)網絡有限公司,未經網易(杭州)網絡有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010172706.1/1.html,轉載請聲明來源鉆瓜專利網。





