[發(fā)明專(zhuān)利]愛(ài)恩斯坦棋博弈系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201710735661.2 | 申請(qǐng)日: | 2017-08-24 |
| 公開(kāi)(公告)號(hào): | CN107684714A | 公開(kāi)(公告)日: | 2018-02-13 |
| 發(fā)明(設(shè)計(jì))人: | 李學(xué)俊;王春;陸夢(mèng)軒 | 申請(qǐng)(專(zhuān)利權(quán))人: | 安徽大學(xué) |
| 主分類(lèi)號(hào): | A63F3/00 | 分類(lèi)號(hào): | A63F3/00 |
| 代理公司: | 南京知識(shí)律師事務(wù)所32207 | 代理人: | 高玲玲 |
| 地址: | 230039*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 斯坦 博弈 系統(tǒng) | ||
1.一種愛(ài)恩斯坦棋博弈系統(tǒng),其特征在于包括:輸入裝置、外部顯示裝置和內(nèi)部處理單元;其中所述輸入裝置用于用戶設(shè)置參數(shù)和對(duì)弈過(guò)程中的策略選擇,并且與內(nèi)部處理單元建立通訊,進(jìn)行游戲或者選擇自動(dòng)測(cè)試;
所述外部顯示裝置用于和內(nèi)部處理單元建立通訊,實(shí)時(shí)顯示棋盤(pán)上的狀態(tài)信息和對(duì)弈過(guò)程;內(nèi)部處理單元用于采用了智能博弈技術(shù)實(shí)現(xiàn)了愛(ài)恩斯坦棋的智能化,實(shí)現(xiàn)智能博弈技術(shù)之間的自動(dòng)對(duì)弈,以及人與智能博弈技術(shù)之間的對(duì)弈。
2.根據(jù)權(quán)利要求1所述的愛(ài)恩斯坦棋博弈系統(tǒng),其特征在于:所述內(nèi)部處理單元包括:
搜索模塊,采用UCT算法,利用蒙特卡洛方法對(duì)當(dāng)前棋盤(pán)信息進(jìn)行搜索和模擬,并根據(jù)UCB公式進(jìn)行節(jié)點(diǎn)的選擇,選擇出最優(yōu)的落子方式;
存儲(chǔ)模塊:將棋盤(pán)上的信息利用5×5的數(shù)組進(jìn)行存儲(chǔ),當(dāng)棋盤(pán)上棋子發(fā)生變化時(shí),通過(guò)改變對(duì)應(yīng)數(shù)組的數(shù)據(jù)值實(shí)現(xiàn)對(duì)棋盤(pán)信息的更新;
信息交互模塊:用于實(shí)現(xiàn)輸入裝置、外部顯示裝置和內(nèi)部處理單元之間的數(shù)據(jù)傳輸,并對(duì)愛(ài)恩斯坦棋系統(tǒng)進(jìn)行控制;
互動(dòng)模塊:通過(guò)在外部顯示裝置彈出選擇對(duì)話框來(lái)讓用戶進(jìn)行游戲模式選擇,用于人人對(duì)弈、人機(jī)對(duì)弈與機(jī)機(jī)對(duì)弈的選擇入口。
3.根據(jù)權(quán)利要求2所述的愛(ài)恩斯坦棋博弈系統(tǒng),其特征在于:所述基于UCT算法的搜索和模擬包括以下步驟:
(1)選擇節(jié)點(diǎn):對(duì)愛(ài)恩斯坦棋模擬產(chǎn)生的博弈樹(shù),從根節(jié)點(diǎn)開(kāi)始選擇UCB值最大的子節(jié)點(diǎn),一直到葉子節(jié)點(diǎn);
(2)展開(kāi)節(jié)點(diǎn):父節(jié)點(diǎn)在選擇子節(jié)點(diǎn)時(shí),如果當(dāng)前子節(jié)點(diǎn)沒(méi)有葉節(jié)點(diǎn),對(duì)當(dāng)前子節(jié)點(diǎn)的模擬,達(dá)到了設(shè)定的次數(shù),那么為該節(jié)點(diǎn)的拓展子節(jié)點(diǎn);
(3)模擬棋局:對(duì)所有的拓展節(jié)點(diǎn)采取同樣的方式,進(jìn)行棋盤(pán)的模擬下棋,直到結(jié)束為止,然后統(tǒng)計(jì)節(jié)點(diǎn)的數(shù)據(jù);
(4)回饋更新:根據(jù)模擬棋局得到的數(shù)據(jù),計(jì)算博弈樹(shù)中節(jié)點(diǎn)的值,將模擬棋局的勝負(fù)結(jié)果和訪問(wèn)次數(shù)沿著父節(jié)點(diǎn)反饋更新整個(gè)搜索樹(shù)。
4.根據(jù)權(quán)利要求3所述的愛(ài)恩斯坦棋博弈系統(tǒng),其特征在于:所述步驟1中節(jié)點(diǎn)的選擇,采用以下步驟:
(1)在節(jié)點(diǎn)中加一變量‘dice’,初值為0;
(2)選擇骰子時(shí)dice+1作為選中的骰子值,隨后dice=(dice+1)mod6;
(3)確定骰子后,根據(jù)UCB公式選擇棋子;
(4)確定棋子后根據(jù)UCB公式選擇移動(dòng)方向,以確定子節(jié)點(diǎn)。
5.根據(jù)權(quán)利要求4所述的愛(ài)恩斯坦棋博弈系統(tǒng),其特征在于:所述UCB公式如下:
其中:vi是以節(jié)點(diǎn)ni為根節(jié)點(diǎn)的所有子節(jié)點(diǎn)仿真結(jié)果的平均值;Ti表示的是節(jié)點(diǎn)ni被選擇的次數(shù);∑iTi是節(jié)點(diǎn)n的訪問(wèn)次數(shù);c是一個(gè)手工設(shè)定的常數(shù),兼顧當(dāng)前局面模擬的充分程度和局面好壞。
6.根據(jù)權(quán)利要求3所述的愛(ài)恩斯坦棋博弈系統(tǒng),其特征在于:所述步驟2中對(duì)于差棋,不對(duì)其進(jìn)行拓展節(jié)點(diǎn)。
7.根據(jù)權(quán)利要求3所述的愛(ài)恩斯坦棋系統(tǒng),其特征在于:所述步驟3中對(duì)于葉節(jié)點(diǎn)模擬下棋采用5局3勝制。
8.根據(jù)權(quán)利要求2所述的愛(ài)恩斯坦棋系統(tǒng),其特征在于:所述最優(yōu)的落子方式是UCB值最大的節(jié)點(diǎn)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于安徽大學(xué),未經(jīng)安徽大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710735661.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 博弈數(shù)據(jù)分析方法及裝置
- 一種在即時(shí)通訊工具中實(shí)現(xiàn)博弈活動(dòng)的方法
- 面向多智能體同步博弈的建模方法及動(dòng)作預(yù)測(cè)系統(tǒng)
- 一種多主體博弈的增量配電網(wǎng)源網(wǎng)荷協(xié)同規(guī)劃方法
- 一種基于三方演化博弈的配電網(wǎng)決策方法、裝置和設(shè)備
- 對(duì)抗環(huán)境下多無(wú)人機(jī)協(xié)同目標(biāo)分配方法及系統(tǒng)
- 目標(biāo)均衡博弈的處理方法和裝置
- 一種業(yè)務(wù)執(zhí)行方法、裝置及其相關(guān)設(shè)備
- 用于云原生應(yīng)用資源調(diào)度的博弈優(yōu)化方法及其系統(tǒng)
- 一種機(jī)器博弈輔助決策方法及系統(tǒng)





