[發明專利]使用云游戲網絡的人工智能(AI)模型訓練有效
| 申請號: | 201980086869.3 | 申請日: | 2019-08-30 |
| 公開(公告)號: | CN113365706B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | J.V.貝爾特蘭;D.巴特勒;K.克雷根布林克 | 申請(專利權)人: | 索尼互動娛樂有限責任公司 |
| 主分類號: | A63F13/67 | 分類號: | A63F13/67;A63F13/44;A63F13/355 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 張曉明 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 云游 網絡 人工智能 ai 模型 訓練 | ||
1.一種用于處理游戲應用程序的人工智能(AI)模型的方法,其包括:
使用從所述游戲應用程序的情境的多個玩游戲過程中收集的訓練狀態數據和所述多個玩游戲過程中的每一者的相關聯成功準則來從所述情境的所述多個玩游戲過程中訓練所述AI模型;
在所述情境的第一玩游戲過程期間接收第一輸入狀態數據;
將所述第一輸入狀態數據應用于所述AI模型以生成指示所述情境的針對所述第一玩游戲過程的成功程度的輸出;
基于預定義目標來執行所述輸出的分析;以及
基于所分析的所述輸出來執行動作以實現所述預定義目標。
2.根據權利要求1所述的方法,其中所述訓練AI模型包括:
在多個服務器處執行所述游戲應用程序的支持所述多個玩游戲過程的多個實例;
在所述多個服務器處收集與所述情境的對應玩游戲過程相關聯的所述訓練狀態數據;
定義所述成功準則;以及
向深度學習引擎提供所述訓練狀態數據和所述成功準則。
3.根據權利要求2所述的方法,其中所述多個玩游戲過程由多個玩家經由多個客戶端裝置來控制。
4.根據權利要求2所述的方法,其中所述執行動作包括:
其中所述預定義目標是自動訓練所述AI模型,
其中所述多個玩游戲過程在訓練期間由所述AI模型控制,
其中所述第一輸入狀態數據由所述AI模型生成作為在訓練期間采取的先前動作,并且
作為所述分析確定在所述第一輸入狀態數據之后要玩的所述第一玩游戲過程的多組控制器輸入;
選擇第一組控制器輸入,所述第一組控制器輸入被預測為滿足所述成功準則并且被預測為在所述多組控制器輸入中具有最高的成功程度;以及
將所述第一組控制器輸入作為所述動作遞送給所述游戲應用程序的對應實例以供執行。
5.根據權利要求2所述的方法,其中所述執行動作包括:
其中所述預定義目標是自動測試所述游戲應用程序,
其中所述第一輸入狀態數據由所述AI模型生成作為在訓練期間的先前動作,
作為所述分析確定響應所述第一輸入狀態數據的不同排列,每一排列包括要采取的唯一一組控制器輸入;以及
作為所述動作執行所述不同的排列,以發現玩所述游戲應用程序時的任何異常。
6.根據權利要求2所述的方法,
其中所述游戲應用程序的所述多個玩游戲過程由第一玩家通過一個或多個客戶端裝置來控制,
其中被訓練的AI模型是模擬所述第一玩家的虛擬玩家。
7.根據權利要求1所述的方法,其還包括:
其中所述預定義目標是提供游戲支持,
基于所分析的所述輸出確定所述第一輸入狀態數據不滿足所述成功準則;
基于所分析的所述輸出和所述第一輸入狀態數據確定控制所述第一玩游戲過程的第一玩家的第一用戶配置文件;以及
將關于如何玩所述情境的推薦作為所述動作提供給所述第一玩家的客戶端裝置,所述推薦基于所述第一用戶配置文件反映所述第一玩家的技能。
8.根據權利要求1所述的方法,其中執行所述輸出的分析包括:
其中所述預定義目標是提供指導,
通過確定所述第一輸入狀態數據具有低于平均的成功程度來識別控制所述第一玩游戲過程的第一玩家的弱點;以及
作為所述動作執行對應于所述弱點的訓練會話以遞送給所述第一玩家的客戶端裝置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼互動娛樂有限責任公司,未經索尼互動娛樂有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980086869.3/1.html,轉載請聲明來源鉆瓜專利網。





