[發明專利]計算機博弈策略的制定方法及裝置在審
| 申請號: | 201710471723.3 | 申請日: | 2017-06-20 |
| 公開(公告)號: | CN107292389A | 公開(公告)日: | 2017-10-24 |
| 發明(設計)人: | 袁文學 | 申請(專利權)人: | 競技世界(北京)網絡技術有限公司 |
| 主分類號: | G06N5/04 | 分類號: | G06N5/04 |
| 代理公司: | 北京冠和權律師事務所11399 | 代理人: | 朱健,陳國軍 |
| 地址: | 100085 北京市懷*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機 博弈 策略 制定 方法 裝置 | ||
技術領域
本發明涉及計算機游戲技術領域,特別涉及一種計算機博弈策略的制定方法及裝置。
背景技術
隨著個人計算機和互聯網的普及,越來越多的博弈學術者和棋牌愛好者通過PC、互聯網對博弈行為進行研究或參與多人競技活動。單機或線上博弈活動,在有用戶離開或掉線等無法進行博弈行為時,從用戶主觀意愿出發,往往希望博弈能夠繼續正常進行,也即,存在接替該玩家繼續博弈的需求,從而產生了智能博弈,可以使得用戶能夠繼續進行博弈,保證了游戲的持續性,智能博弈對用戶研究、體驗以及博弈系統都極為重要。
計算機博弈,也稱機器博弈,是一個極具挑戰與發展前景的計算機研究領域。現有的很多重要理論和技術方法諸如各類搜索算法及智能方法,最初的提出都是為了解決存在于棋類博弈中的某些問題。對于計算機博弈的研究最早可以追溯到半個世紀以前,在過去的五六十年里,人工智能的學者們嘔心瀝血地研究了計算機博弈中的包括奧賽羅、國際象棋、跳棋、五子棋、圍棋等,取得了大量傲人的成果。
棋類博弈的規則特點是博弈方的局勢很明朗,博弈數據元集合公開化。與棋類游戲相比較,以牌類博弈規則舉例,對其他博弈方的博弈數據元集并不可知的博弈規則,有以下很明顯的特點:
首先,棋類游戲各博弈方對局勢的發展都是可預測的,博弈數據元集公開;而牌類游戲則大多是在固定博弈數據元總集合的前提下,對其他博弈方博弈數據元集并不可知的情況下進行;
其次,棋類博弈方一般為2人,牌類博弈則存在搭檔和多人參與的概念,使得博弈策略的制定需要考慮更多的因素,需要更精準的預判;
最后,由于牌類博弈中其他博弈方數據元并不公開化,直接計算得出的策略空間非常巨大,即時間復雜度和空間復雜度都很大,因此,對博弈方法的設計要求很高。
現有技術中,提供了一種采用類似遺傳算法來解決自動博弈的技術方案,解決的問題是:如何篩選出合理的博弈策略。通過計算機玩家在博弈活動中的身份采取不同的博弈策略,借助遺傳算法在博弈過程中不斷演化,產生更加智能的博弈策略。但是,由于該方法存在較大的局限性,無法達到學術研究和商用目的。該方法存在的主要問題如下:
1、該方法需要對牌局演化很多遍才能達到收斂效果,并不能快速制定出合理的博弈策略,學習速度過于緩慢;
2、該方法的前提是對同一牌局的演化,即要求該牌局必須固定,然后再進行很多遍策略基因雜交進化。而在實際博弈過程中,每次博弈開始時的牌局是千變萬化的,所以該方法無法在新牌局開始時起到智能博弈的效果;
3、該方法生成各博弈方基因庫和隨機策略基因的前提是將其他博弈方不可知的博弈數據元集合公開給己方,即通過作弊的方式將各博弈方數據元集告知己方后再進行計算。
現有技術中提供的方案,實質上通過作弊的方式將各方博弈數據元集合公開化進行計算,并不存在對不可知數據元集合的估算,也即,該方式實質上是將數據元不可知的博弈規則當作數據元公開化的博弈規則來處理,這種違背博弈規則的做法,無論在學術研究還是商業運作上都是不允許的,不具有實際使用價值。
發明內容
本發明實施例提供一種計算機博弈策略的制定方法及裝置,科學程度高、針對性強,智能化程度高,能夠有效提升己方的勝算概率。
一方面,本發明實施例提供一種計算機博弈策略的制定方法,包括:
獲取博弈數據元全集和參與博弈的已方數據元集;
根據所述博弈數據元全集和己方數據元集,估算已方之外的每個參與方的數據元集,所述己方之外的每個參與方的數據元集之和為所述己方數據元集的補集;
根據所述已方數據元集和估算的每個所述參與方的數據元集,確定所有數據項集;
根據預設的博弈規則和所述所有數據項集,構建博弈樹;
采用所述博弈樹制定針對當前博弈局面的博弈策略。
可選的,在構建所述博弈樹之前,所述方法還包括:
從預設博弈心理庫中查找是否存在與當前博弈局面匹配的博弈策略,所述預設心理庫中的博弈策略包括手動輸入的針對當前博弈局面的博弈策略和針對歷史上每個博弈局面所制定的博弈策略;
如果存在,則確定所述與當前博弈局面匹配的博弈策略作為制定的博弈策略;
如果不存在,則在采用所述博弈樹制定博弈策略后,將所述博弈策略更新存儲至所述博弈心理庫。
可選的,采用所述博弈樹制定博弈策略,包括:
根據所述已方數據元集和估算的每個所述參與方的數據元集,計算所述博弈樹的每個有效分支的存在置信度;
獲取置信度閾值和目標收益;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于競技世界(北京)網絡技術有限公司,未經競技世界(北京)網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710471723.3/2.html,轉載請聲明來源鉆瓜專利網。





