日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于Deep Q-Network改進(jìn)的俄羅斯方塊智能Agent學(xué)習(xí)方法在審

專利信息
申請(qǐng)?zhí)枺?/td> 202011118911.6 申請(qǐng)日: 2020-10-19
公開(公告)號(hào): CN112206538A 公開(公告)日: 2021-01-12
發(fā)明(設(shè)計(jì))人: 曹寬;唐存琛;畢翔 申請(qǐng)(專利權(quán))人: 武漢大學(xué)
主分類號(hào): A63F13/67 分類號(hào): A63F13/67;A63F13/46;G06N3/04
代理公司: 湖北武漢永嘉專利代理有限公司 42102 代理人: 李丹
地址: 430072 湖*** 國省代碼: 湖北;42
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 deep network 改進(jìn) 俄羅斯方塊 智能 agent 學(xué)習(xí)方法
【說明書】:

發(fā)明公開了一種基于Deep Q?Network改進(jìn)的俄羅斯方塊智能Agent學(xué)習(xí)方法,包括以下步驟:1)獲取當(dāng)前游戲狀態(tài)下方塊的統(tǒng)計(jì)特征,根據(jù)游戲畫面采集游戲畫面每幀的統(tǒng)計(jì)特征序列;2)通過深度神經(jīng)網(wǎng)絡(luò)來進(jìn)行俄羅斯方塊智能Agent Q值的估計(jì),所述Q值為俄羅斯方塊agent在采取某個(gè)action后的表現(xiàn)對(duì)應(yīng)的獎(jiǎng)勵(lì)分?jǐn)?shù);3)在Q值估計(jì)中,使用均方誤差定義目標(biāo)函數(shù);4)計(jì)算參數(shù)W關(guān)于損失函數(shù)的梯度:5)計(jì)算出上面的梯度后,使用SGD算法來更新參數(shù),從而得到最優(yōu)的Q值,即獲得每次交互選取使得Q值最大的動(dòng)作a。本發(fā)明方法利用預(yù)定義的方塊統(tǒng)計(jì)特征改進(jìn)了DQN網(wǎng)絡(luò)訓(xùn)練Agent玩俄羅斯方塊的性能。

技術(shù)領(lǐng)域

本發(fā)明涉及人工智能技術(shù),尤其涉及一種基于Deep Q-Network改進(jìn)的俄羅斯方塊智能Agent學(xué)習(xí)方法。

背景技術(shù)

人工智能(Artificial Intelligence,AI)它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它旨在了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究主要是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、包括自然語言處理、計(jì)算機(jī)視覺、感知、認(rèn)知與決策等。

強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)任務(wù)通常使用馬爾可夫決策過程(Markov Decision Process,MDP)來描述,具體而言:機(jī)器處在一個(gè)環(huán)境中,每個(gè)狀態(tài)為機(jī)器對(duì)當(dāng)前環(huán)境的感知;機(jī)器只能通過動(dòng)作來影響環(huán)境,當(dāng)機(jī)器執(zhí)行一個(gè)動(dòng)作后,會(huì)使得環(huán)境按某種概率轉(zhuǎn)移到另一個(gè)狀態(tài);同時(shí),環(huán)境會(huì)根據(jù)潛在的獎(jiǎng)賞函數(shù)反饋給機(jī)器一個(gè)獎(jiǎng)賞。綜合而言,強(qiáng)化學(xué)習(xí)主要包含四個(gè)要素:狀態(tài)、動(dòng)作、轉(zhuǎn)移概率以及獎(jiǎng)賞函數(shù)。智能體agent在進(jìn)行某個(gè)任務(wù)時(shí),首先與environment進(jìn)行交互,產(chǎn)生新的state,同時(shí)環(huán)境給出reward,如此循環(huán)下去,agent和environment不斷交互產(chǎn)生更多新的數(shù)據(jù)。強(qiáng)化學(xué)習(xí)算法就是通過一系列動(dòng)作策略與環(huán)境交互,產(chǎn)生新的數(shù)據(jù),再利用新的數(shù)據(jù)去修改自身的動(dòng)作策略,經(jīng)過數(shù)次迭代后,agent就會(huì)學(xué)習(xí)到完成任務(wù)所需要的動(dòng)作策略。

近年來,深度學(xué)習(xí)快速崛起,已經(jīng)在圖像識(shí)別、語音識(shí)別、推薦系統(tǒng)等各方面取得了突出的進(jìn)步,其通過多層網(wǎng)絡(luò)結(jié)構(gòu)和激活函數(shù),將特征一層層抽象,形成易于表述和區(qū)分的高層特征,深度強(qiáng)化學(xué)習(xí)的發(fā)展得益于深度學(xué)習(xí)的快速發(fā)展,與傳統(tǒng)強(qiáng)化學(xué)習(xí)的差別是估值函數(shù)變成了深度神經(jīng)網(wǎng)絡(luò),這一改變使得對(duì)特征的提取更為豐富準(zhǔn)確,也讓端到端學(xué)習(xí)變成了可能。

俄羅斯方塊是一款經(jīng)典的益智型游戲,如何在游戲中實(shí)現(xiàn)智能旋轉(zhuǎn)、下落并且擺放到合適的位置上,是人工智能領(lǐng)域的一個(gè)熱門研究課題,國外很多學(xué)者已經(jīng)做了相關(guān)研究,其中比較有名的是Pierre Dellacherie算法,但在我國,相關(guān)研究較少。

正如許多問題可以利用強(qiáng)化學(xué)習(xí)來解決,比如無人機(jī)飛行,一個(gè)連續(xù)的問題,需要時(shí)時(shí)刻刻來引導(dǎo)它作出決策,對(duì)它每次一動(dòng)作給予相應(yīng)的回報(bào),表現(xiàn)較差的動(dòng)作用需要用負(fù)回報(bào)來糾正,合理的動(dòng)作用正回報(bào)來鼓勵(lì),智能體通過學(xué)習(xí)從而改進(jìn)自身的行為策略。那么是否能通過強(qiáng)化學(xué)習(xí)來訓(xùn)練一個(gè)智能Agent來玩俄羅斯方塊呢?本發(fā)明就是結(jié)合Deep Q-Network(DQN)和預(yù)定義方塊的統(tǒng)計(jì)特征實(shí)現(xiàn)了一種穩(wěn)健、自學(xué)習(xí)式的俄羅斯方塊智能Agent學(xué)習(xí)方法。

發(fā)明內(nèi)容

本發(fā)明要解決的技術(shù)問題在于用傳統(tǒng)的DQN算法實(shí)現(xiàn)的俄羅斯方塊AI表現(xiàn)較差,,本發(fā)明結(jié)合DQN和預(yù)定義的統(tǒng)計(jì)特征設(shè)計(jì)了一種新的網(wǎng)絡(luò)結(jié)構(gòu),從而增強(qiáng)了DQN算法在俄羅斯方塊游戲AI上的游戲性能。

本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案是:一種基于Deep Q-Network改進(jìn)的俄羅斯方塊智能Agent學(xué)習(xí)方法,包括以下步驟:

(1)獲取當(dāng)前游戲狀態(tài)下方塊的統(tǒng)計(jì)特征,根據(jù)游戲畫面采集游戲畫面每幀的統(tǒng)計(jì)特征序列,其中,統(tǒng)計(jì)特征序列包括:空洞數(shù)、板塊高度、消行數(shù)、列井深和、顛簸、列高和;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學(xué),未經(jīng)武漢大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011118911.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 欧美黑人巨大久久久精品一区 | 国产又色又爽无遮挡免费动态图| 国产精品一区在线观看你懂的| 免费观看xxxx9999片| 在线视频国产一区二区| 午夜毛片影院| 色一情一乱一乱一区99av白浆| 久久久久久久久亚洲精品| 久久国产欧美一区二区三区免费| 国产一区二区电影在线观看| 国产婷婷色一区二区三区在线| 99国产精品9| 中文字幕一二三四五区| 亚洲日本国产精品| 国产精品日韩高清伦字幕搜索| 国产69精品久久久久孕妇不能看| 欧美亚洲视频二区| 精品国产一区二| 91精品色| 香蕉av一区| 丰满岳乱妇在线观看中字 | 国产欧美日韩精品一区二区图片| 久精品国产| 国产一级片自拍| 欧美hdxxxx| 精品国产一级| 午夜特级片| 亚洲日韩欧美综合| 国产清纯白嫩初高生在线播放性色| xxxxhd欧美| 国产一区二区午夜| 久久午夜鲁丝片| 88国产精品视频一区二区三区| 国产精品久久免费视频在线| 欧美日韩精品中文字幕| 狠狠色很很在鲁视频| 久久精品一区二区三区电影| 久久精品色欧美aⅴ一区二区| 久久久久久久久久国产精品| 91精品视频一区二区| 欧美精品日韩精品| 国产一区亚洲一区| 精品国产乱码久久久久久久久| 九九视频69精品视频秋欲浓| 日韩一级免费视频| 欧美日韩乱码| 国产理论片午午午伦夜理片2021| 91麻豆精品国产91久久| 久久人人爽爽| 国产二区精品视频| 国产suv精品一区二区4| 国产一区二区在线免费| 日本一区二区三区电影免费观看| 国产另类一区| 国产精品99在线播放| 日韩久久精品一区二区| 四虎影视亚洲精品国产原创优播| 国产99久久久久久免费看| 日日夜夜精品免费看| 中文字幕欧美一区二区三区| 国产精品视频二区三区| 97精品国产97久久久久久粉红| 91免费看国产| 国久久久久久| 欧美一区二区三区视频在线观看| 国产999精品视频| 激情久久综合网| 国产精欧美一区二区三区久久久| 日韩国产欧美中文字幕| 国产精品久久久久久久新郎| 国产二区免费| 韩日av一区二区| 国产一区二区三区四| 日韩精品午夜视频| 天堂av一区二区| 国产91久久久久久久免费 | 精品久久久影院| 欧美日韩三区二区| 99久久久久久国产精品| 午夜毛片在线观看| 精品国产1区2区| 国产精品第157页| 欧美精品免费一区二区| 国产第一区在线观看| 午夜天堂在线| 国产乱人伦精品一区二区| 久久久精品观看| 国产一区二区三区在线电影| 亚洲国产精品女主播| 性欧美激情日韩精品七区| 国产在线精品一区| 日韩精品一二区| 久久久久久中文字幕| 国产一卡在线| 亚洲精品www久久久久久广东| 综合久久国产九一剧情麻豆| 97久久精品人人做人人爽| 国产足控福利视频一区| 国产精品色在线网站| 国产一区二区三区色噜噜小说| 国产三级国产精品国产专区50| 国产在线播放一区二区| 日本看片一区二区三区高清| 久久99精品一区二区三区| 国产人澡人澡澡澡人碰视| 国产一级片网站| 日韩av三区| 国内偷拍一区| 男女午夜爽爽| 日韩精品一区二区三区中文字幕| 欧美日韩国产午夜| 国产精品电影一区| 国产精品美女久久久另类人妖| 国产999在线观看| 国内久久久| 欧美精品日韩精品| 精品国产1区2区| 亚洲欧美日韩在线| 国产真实乱偷精品视频免| 久久久久亚洲精品视频| 日本午夜一区二区| 在线观看v国产乱人精品一区二区| 国产精品欧美一区二区视频| 91黄在线看| 国产精品国精产品一二三区| 国产精品欧美一区二区三区| 国产69精品久久久久9999不卡免费 | 精品一区在线观看视频| 亚洲欧洲日韩在线| 亚洲欧美v国产一区二区| 国产一区二区资源| 97人人模人人爽人人喊小说| 久久99国产精品久久99| 欧美一区二区三区免费看| 国产偷亚洲偷欧美偷精品| 欧美激情综合在线| 亚洲精品91久久久久久| 91精品啪在线观看国产手机| 国产高清在线一区| 欧美日本三级少妇三级久久| 国产精一区二区三区| 国产日韩一区二区三区| 国产91久| 国产精品久久久区三区天天噜| 久久久久亚洲精品视频| 91久久国产露脸精品| 日本一区二区在线电影| 久久亚洲精品国产一区最新章节| 国产精品入口麻豆九色| 国产欧美日韩二区| 国产在线一区不卡| 国产精品一区二区中文字幕| 国产国产精品久久久久| 91片在线观看| 国产男女乱淫视频高清免费 | 国产在线观看二区| 精品国产一区二区在线| 精品一区二区三区视频?| 国产偷久久一区精品69| 国产日产高清欧美一区二区三区| 野花国产精品入口| 年轻bbwbbw高潮| 欧美日韩国产精品一区二区亚洲| 91黄在线看| 国产一区二区三区精品在线| 国产乱码一区二区| 久久久久久久国产| 97精品超碰一区二区三区| 九一国产精品| 欧美一区久久| 欧美资源一区| 国偷自产中文字幕亚洲手机在线 | 国产香蕉97碰碰久久人人| 国产全肉乱妇杂乱视频在线观看| 国产一区二区二| 91久久国产露脸精品| 96精品国产| 国产精品一区在线播放| 国产精品一区二区免费| 欧美一区二区精品久久| 91精品福利在线| 日日狠狠久久8888偷色| 日韩精品久久久久久久酒店| 精品国产一区二区在线| 久久精品国产综合| 精品国产一区二区三区在线| 在线视频国产一区二区| 国产偷自视频区视频一区二区| xxxx在线视频| 国产一级大片| 国产清纯白嫩初高生在线观看性色| 李采潭伦理bd播放| 国产99视频精品免视看芒果| 欧美一区二区三区在线视频播放| 国产乱码精品一区二区三区中文| 欧美在线免费观看一区| 最新日韩一区| 国产不卡一二三区| 香港三日三级少妇三级99| 韩国女主播一区二区| 国产1区2| av午夜在线| 国产精品亚洲精品| 国产一区二区在| 国产第一区二区三区| 精品国产乱码一区二区三区在线| 国产欧美精品久久| 日韩欧美精品一区二区| 久久精品国产99| 国产天堂一区二区三区| freexxxxxxx| 欧美激情视频一区二区三区| 丰满岳乱妇在线观看中字| 99久久国产综合精品尤物酒店| 亚洲精品一品区二品区三品区| 欧美日韩一区二区三区69堂| 狠狠色噜噜狠狠狠888奇米| 午夜一级电影| 国产品久久久久久噜噜噜狼狼| 国产一级片一区| 欧美极品少妇| 国产精自产拍久久久久久蜜 | 国产videosfree性另类| 日韩一区高清| 欧美一区二三区| 国产黄色网址大全| 日本精品一二区| 久久久久国产一区二区三区不卡| 高清国产一区二区 | 岛国黄色av| 在线国产精品一区二区| 亚洲精品www久久久久久广东 | 久久久久国产亚洲| 久久er精品视频| 91视频国产九色| 91麻豆精品国产91久久久无限制版| 国产白丝一区二区三区| 国产aⅴ一区二区| 国产理论片午午午伦夜理片2021| 国内少妇偷人精品视频免费| 久久中文一区| 91国产一区二区| 91精品系列| 国产日韩欧美在线影视| 91一区二区三区久久国产乱| 韩日av一区二区三区|