[發(fā)明專利]一種圍棋上的搜索博弈樹的策略改進方法有效

申請?zhí)枺?/td>	202110760145.1	申請日：	2021-07-06
公開（公告）號：	CN113377779B	公開（公告）日：	2023-10-20
發(fā)明（設(shè)計）人：	寧義明;楊木潤;趙闖	申請（專利權(quán)）人：	沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司
主分類號：	G06F16/22	分類號：	G06F16/22;G06F16/2457;G06F16/248
代理公司：	沈陽新科知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 21117	代理人：	李曉光
地址：	110004 遼寧省沈陽市***	國省代碼：	遼寧;21
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種圍棋搜索博弈策略改進方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種圍棋上的搜索博弈樹的策略改進方法，其特征在于包括以下步驟：

1)以當(dāng)前狀態(tài)為根節(jié)點建立搜索樹，樹建立完成，其它所有節(jié)點隱式給出；

2)選擇根節(jié)點的一個孩子節(jié)點進行模擬，如果有孩子節(jié)點還沒有被模擬過，那么從根節(jié)點的孩子節(jié)點里面隨機選擇一個孩子進行模擬；如果所有孩子節(jié)點都被模擬過至少一次，那么選擇UCB分樹最高的孩子節(jié)點；

3)從選中的孩子節(jié)點開始模擬一直到葉子節(jié)點結(jié)束；模擬策略結(jié)合均勻采樣和極小極大策略；

4)將模擬最后的結(jié)果反向傳播到根節(jié)點，路徑上所有葉子的動作價值函數(shù)Q值和N值被更新；

5)重復(fù)步驟1)-4)多次，最后選擇的結(jié)果為UCB中利用項分?jǐn)?shù)最高的節(jié)點。

2.根據(jù)權(quán)利要求1所述的圍棋上的搜索博弈樹的策略改進方法，其特征在于步驟2)中選擇UCB分?jǐn)?shù)最高的孩子節(jié)點是計算UCB并返回的孩子偽代碼，具體如下：

第一項稱為利用項，和過去的模擬情況有關(guān)，Q值取模擬結(jié)果為勝減模擬結(jié)果為負的差值；第二項稱為探索項，和每個節(jié)點模擬的次數(shù)有關(guān)，博弈時動作被選中的次數(shù)越少，對應(yīng)節(jié)點探索項的分?jǐn)?shù)就越高；c為常數(shù)項；

上述公式平衡利用項和探索項之間的關(guān)系，即使最開始獎勵值比較低的節(jié)點在足夠的時間之后也可能被選中。

3.根據(jù)權(quán)利要求2所述的圍棋上的搜索博弈樹的策略改進方法，其特征在于：更新路徑上節(jié)點的Q值和N值時使用虛擬的win值初始化Q，每個節(jié)點從較高的Q值，經(jīng)模擬完成后下降，偏向于選擇其它節(jié)點進行模擬，增加探索的幾率，最終收斂到真實的Q值。

4.根據(jù)權(quán)利要求3所述的圍棋上的搜索博弈樹的策略改進方法，其特征在于：初始Q值可根據(jù)先驗知識人工設(shè)置。

5.根據(jù)權(quán)利要求1所述的圍棋上的搜索博弈樹的策略改進方法，其特征在于：步驟3)中，每次搜索會涉及到多次模擬過程，當(dāng)模擬次數(shù)足夠多時，選擇次優(yōu)節(jié)點的概率收斂到0；將極小極大策略結(jié)合在一起，在己方行動時采用均勻采樣，而在對方行動時采用極小極大算法有效避免陷阱狀態(tài)。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司，未經(jīng)沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110760145.1/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種呼吸面罩用體征檢測組件及檢測系統(tǒng)
下一篇：一種便于方向調(diào)節(jié)的光伏發(fā)電裝置

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】