[發(fā)明專利]對弈方法、對弈裝置、顯示裝置及存儲裝置有效
| 申請?zhí)枺?/td> | 202210947782.4 | 申請日: | 2022-08-08 |
| 公開(公告)號: | CN115025486B | 公開(公告)日: | 2023-02-24 |
| 發(fā)明(設(shè)計)人: | 黃潔;孫萍;劉佳麗;蘇曉蕓;王凱;王旭;謝小環(huán);鄭偉偉;李玉笛;支洪平 | 申請(專利權(quán))人: | 科大訊飛(蘇州)科技有限公司 |
| 主分類號: | A63F3/02 | 分類號: | A63F3/02;A63F3/00 |
| 代理公司: | 深圳市威世博知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44280 | 代理人: | 柳芳 |
| 地址: | 215000 江蘇省蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 對弈 方法 裝置 顯示裝置 存儲 | ||
本申請公開了一種對弈方法、對弈裝置、顯示裝置及存儲裝置,該對弈方法包括:基于對方當前步的實際落點和預測的對方當前步的第一落點序列,獲得實際落點在第一落點序列中的實際順位;其中,第一落點序列包含多個落子候選點,且每個落子候選點具有相應的順位,順位的數(shù)值表征落子候選點的優(yōu)劣;基于實際順位以及對方當前步之前的預定個數(shù)的歷史步的歷史落點的歷史順位獲得歸一化加權(quán)后的平均值;其中,越靠近當前步,對應的加權(quán)系數(shù)越大;基于平均值從預測的己方下一步的第二落點序列中選擇一個落子候選點作為己方下一步的落點。通過上述方式,本申請能夠基于對方最近幾步的水平及時調(diào)整其落點位置,以使得AI的棋力能夠在對弈過程中自動調(diào)節(jié)。
技術(shù)領(lǐng)域
本申請屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種對弈方法、對弈裝置、顯示裝置及存儲裝置。
背景技術(shù)
圍棋作為一種策略性兩人棋類游戲,使用矩形格狀棋盤及黑白二色圓形棋子進行對弈,正規(guī)棋盤上有縱橫各19條線段,361個交叉點,棋子必須走在空格非禁著點的交叉點上,雙方交替行棋,落子后不能移動或悔棋,以目數(shù)多者為勝。圍棋具有簡明的規(guī)則,但其解空間極其巨大,近似無窮。
直到2016年,人工智能(AI)AlphaGo以4:1的總比分擊敗圍棋世界冠軍、職業(yè)九段棋手李世石,才打破了人工智能與圍棋之間的壁壘。如今,各種圍棋AI以及人機對弈平臺層出不窮,其訓練方法也不斷迭代升級,從學習人類棋譜到根據(jù)規(guī)則自行探索,棋力不斷取得突破。
隨著圍棋AI棋力的提升,人類棋手在與AI全力對弈中,幾乎均以失敗告終。這種實力懸殊的對弈對人類棋手的棋力提升引導啟發(fā)作用甚微,且人類棋手體驗感不佳。而若對AI棋力等級進行劃分,選擇相應的AI棋力等級進行對弈的話,則要求人類棋手對自己棋力有較為準確的認知,且在同一局中,AI的棋力始終保持不變,較為機械生硬。
發(fā)明內(nèi)容
本申請?zhí)峁┮环N對弈方法、對弈裝置、顯示裝置及存儲裝置,能夠基于對方最近幾步的水平及時調(diào)整其落點位置,以使得AI的棋力能夠在對弈過程中自動調(diào)節(jié),提升用戶對弈興趣。
為解決上述技術(shù)問題,本申請采用的一個技術(shù)方案是:提供一種對弈方法,包括:基于對方當前步的實際落點和預測的對方當前步的第一落點序列,獲得所述實際落點在所述第一落點序列中的實際順位;其中,所述第一落點序列包含多個落子候選點,且每個所述落子候選點具有相應的順位,所述順位的數(shù)值表征所述落子候選點的優(yōu)劣;基于所述實際順位以及對方當前步之前的預定個數(shù)的歷史步的歷史落點的歷史順位獲得歸一化加權(quán)后的平均值;其中,越靠近當前步,對應的加權(quán)系數(shù)越大;基于所述平均值從預測的己方下一步的第二落點序列中選擇一個落子候選點作為己方下一步的落點。
為解決上述技術(shù)問題,本申請采用的另一個技術(shù)方案是:提供一種對弈裝置,包括:第一獲得模塊,用于基于對方當前步的實際落點和預測的對方當前步的第一落點序列,獲得所述實際落點在所述第一落點序列中的實際順位;其中,所述第一落點序列包含多個落子候選點,且每個所述落子候選點具有相應的順位,所述順位的數(shù)值表征所述落子候選點的優(yōu)劣;第二獲得模塊,與所述第一獲得模塊連接,用于基于所述實際順位以及對方當前步之前的預定個數(shù)的歷史步的歷史落點的歷史順位獲得歸一化加權(quán)后的平均值;其中,越靠近當前步,對應的加權(quán)系數(shù)越大;選擇模塊,與所述第二獲得模塊連接,用于基于所述平均值從預測的己方下一步的第二落點序列中選擇一個落子候選點作為己方下一步的落點。
為解決上述技術(shù)問題,本申請采用的另一個技術(shù)方案是:提供一種顯示裝置,包括:顯示屏以及與所述顯示屏耦接的處理器,所述處理器用于執(zhí)行上述任一實施例中所述的對弈方法。
為解決上述技術(shù)問題,本申請采用的另一個技術(shù)方案是:提供一種存儲裝置,存儲有能夠被處理器運行的程序指令,所述程序指令用于實現(xiàn)上述任一實施例中所述的對弈方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大訊飛(蘇州)科技有限公司,未經(jīng)科大訊飛(蘇州)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210947782.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





