[發明專利]可解釋性競爭對手建模方法有效
| 申請號: | 201811273002.2 | 申請日: | 2018-10-29 |
| 公開(公告)號: | CN109472363B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 潘穎慧;曾一鋒;唐靜 | 申請(專利權)人: | 潘穎慧;曾一鋒;唐靜 |
| 主分類號: | G06N5/04 | 分類號: | G06N5/04 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 韓國強 |
| 地址: | 330000 江西省南昌市*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 解釋性 競爭對手 建模 方法 | ||
1.一種可解釋性競爭對手建模方法,其特征在于,包括:
建立可解釋性競爭對手決策模型,所述可解釋性競爭對手決策模型包括主體智能體決策模型和競爭對手候選模型;利用游戲重放數據生成競爭對手決策模型,在實時策略游戲平臺上驗證算法的實際效用;
學習所述可解釋性競爭對手決策模型;
搜索所述主體智能體決策模型的失敗原因,包括:通過重要性抽樣方法估計出候選的競爭對手系列動作;
從所述候選的競爭對手系列動作中選取最相關的競爭對手行為;
根據所述最相關的競爭對手行為確定所述主體智能體決策模型的失敗原因;
根據所述失敗原因修正所述競爭對手候選模型,包括:
根據所述候選的競爭對手系列動作生成第一候選模型空間;
通過求解所述第一候選模型獲取競爭對手系列動作;
從所述第一候選模型中抽樣出一個或一組競爭對手系列動作為候選的競爭對手真實的系列動作;
依據所述候選的競爭對手真實的系列動作生成第二候選模型;
依據所述修正后的競爭對手候選模型更新所述可解釋性競爭對手決策模型。
2.根據權利要求1所述的可解釋性競爭對手建模方法,其特征在于,所述建立可解釋性競爭對手決策模型,包括:建立基于交互式動態影響圖決策框架的可解釋性競爭對手決策模型。
3.根據權利要求1所述的可解釋性競爭對手建模方法,其特征在于,所述學習所述可解釋性競爭對手決策模型,包括:基于和積最大網絡算法學習所述可解釋性競爭對手決策模型,并建立相應的動態基于和積最大網絡模型。
4.根據權利要求3所述的可解釋性競爭對手建模方法,其特征在于,所述學習所述可解釋性競爭對手決策模型還包括遷移學習算法,所述遷移學習算法通過分解復雜環境變量及智能體決策,優化所述動態基于和積最大網絡模型。
5.根據權利要求1所述的可解釋性競爭對手建模方法,其特征在于,所述生成第二候選模型,包括:
開發基于神經元計算的演化操作算子;
通過所述演化操作算子選擇性地對所述第一候選模型進行有想象力的更新和修改,生成第二候選模型。
6.根據權利要求5所述的可解釋性競爭對手建模方法,其特征在于,還包括:基于值等價原理判斷所述第二候選模型性能,從理論上對主體智能體的決策質量做一個預判,保證所述第二候選模型不損害主體智能體的決策質量。
7.根據權利要求1所述的可解釋性競爭對手建模方法,其特征在于,所述從所述第一候選模型中抽樣出一個或一組競爭對手系列動作為候選的競爭對手真實的系列動作,包括:采用漸進學習模型從所述第一候選模型中抽樣出一個或一組競爭對手系列動作為候選的競爭對手真實的系列動作,以生成第二候選模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于潘穎慧;曾一鋒;唐靜,未經潘穎慧;曾一鋒;唐靜許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811273002.2/1.html,轉載請聲明來源鉆瓜專利網。





