[發明專利]一種數據處理的方法以及相關裝置有效
| 申請號: | 201910865634.6 | 申請日: | 2019-09-12 |
| 公開(公告)號: | CN110555529B | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 呂有為;鐘濤;毛建博 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06N5/04 | 分類號: | G06N5/04 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 吳磊 |
| 地址: | 518064 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 以及 相關 裝置 | ||
1.一種數據處理的方法,其特征在于,包括:
獲取第一玩家的第一手牌數據;
基于所述第一手牌數據確定所述第一玩家的至少一個出牌動作;
當所述至少一個出牌動作與預設麻將博弈樹中的決策節點重合時,確定第二玩家、第三玩家以及第四玩家在分別接收所述第一玩家的至少一個出牌動作所對應的牌后的第一狀態值、第二狀態值以及第三狀態值,所述第一狀態值、第二狀態值以及第三狀態值均用于表示所述第一玩家在執行所述至少一個出牌動作后得到的效益值;
所述預設麻將博弈樹是基于博弈論得到的包括與麻將規則相符的猜牌結果的樹狀結構,所述猜牌結果為針對所述第一玩家的第一手牌數據對其余玩家的手牌數據進行猜牌后得到;
所述第一狀態值是通過第二玩家在接收所述第一玩家的至少一個出牌動作所對應的牌后的第一出牌動作所能夠帶來的對于所述第一玩家的效益值;
所述第二狀態值是通過第三玩家在接收所述第一玩家的至少一個出牌動作所對應的牌后的第二出牌動作所能夠帶來的對于所述第一玩家的效益值;
所述第三狀態值是通過第四玩家在接收所述第一玩家的至少一個出牌動作所對應的牌后的第三出牌動作所能夠帶來的對于所述第一玩家的效益值;
基于所述第一狀態值、第二狀態值以及所述第三狀態值,確定所述第一玩家在執行所述至少一個出牌動作后得到的效益值中的最大效益值;
將所述最大效益值所對應的第一玩家出牌動作確定為所述第一玩家的目標出牌路徑。
2.根據權利要求1所述的方法,其特征在于,所述決策節點包括玩家決策狀態節點,當所述至少一個出牌動作與預設麻將博弈樹中的決策節點重合時,確定第二玩家、第三玩家以及第四玩家在分別接收所述第一玩家的至少一個出牌動作所對應的牌后的第一狀態值、第二狀態值以及第三狀態值,包括:
當所述至少一個出牌動作與所述玩家決策狀態節點重合時,確定所述第二玩家、所述第三玩家、所述第四玩家在分別接收所述第一玩家的至少一個出牌動作所對應的牌后的第一出牌動作、第二出牌動作以及第三出牌動作;
計算所述第一出牌動作的第一分值、所述第二出牌動作的第二分值以及所述第三出牌動作的第三分值;
確定所述第一分值為所述第一狀態值、所述第二分值為所述第二狀態值以及所述第三分值為所述第三狀態值。
3.根據權利要求1所述的方法,其特征在于,所述決策節點包括規則決策節點,當所述至少一個出牌動作與預設麻將博弈樹中的決策節點重合時,確定第二玩家、第三玩家以及第四玩家在分別接收所述第一玩家的至少一個出牌動作所對應的牌后的第一狀態值、第二狀態值以及第三狀態值,包括:
當所述至少一個出牌動作與所述規則決策節點重合時,確定所述第二玩家、所述第三玩家、所述第四玩家在分別接收所述第一玩家的至少一個出牌動作所對應的牌后的第四出牌動作、第五出牌動作以及第六出牌動作;
計算所述第四出牌動作的第四分值、所述第五出牌動作的第五分值以及所述第六出牌動作的第六分值;
將所述第四出牌動作與所述第四分值確定為所述第一狀態值、將所述第五出牌動作與所述第五分值確定為所述第二狀態值以及將所述第六出牌動作與所述第六分值確定為所述第三狀態值。
4.根據權利要求2所述的方法,其特征在于,所述將所述最大效益值所對應的第一玩家出牌動作確定為所述第一玩家的目標出牌路徑之后,所述方法還包括:
根據預設訓練模型對所述第一手牌數據進行訓練,以得到第一訓練結果,所述第一訓練結果用于標識所述第一玩家、所述第二玩家、所述第三玩家以及所述第四玩家的效益值;
根據所述第一訓練結果對所述第一狀態值、所述第二狀態值以及所述第三狀態值進行更新。
5.根據權利要求3所述的方法,其特征在于,所述將所述最大效益值所對應的第一玩家出牌動作確定為所述第一玩家的目標出牌路徑之后,所述方法還包括:
根據預設訓練模型對所述第一手牌數據進行訓練,以得到第二訓練結果,所述第二訓練結果用于標識所述第一玩家、所述第二玩家、所述第三玩家以及所述第四玩家的效益值;
當將所述第二訓練結果沿著所述目標出牌路徑回傳至所述規則決策節點時,根據所述第二訓練結果對所述第一狀態值、所述第二狀態值以及所述第三狀態值進行更新。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910865634.6/1.html,轉載請聲明來源鉆瓜專利網。





