[發(fā)明專利]基于分層決策機(jī)制的多機(jī)器人協(xié)作方法有效
| 申請?zhí)枺?/td> | 201410274560.6 | 申請日: | 2014-06-18 |
| 公開(公告)號(hào): | CN104063541B | 公開(公告)日: | 2017-12-01 |
| 發(fā)明(設(shè)計(jì))人: | 梁志偉;沈萍;劉娟 | 申請(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號(hào): | G06F17/50 | 分類號(hào): | G06F17/50 |
| 代理公司: | 南京正聯(lián)知識(shí)產(chǎn)權(quán)代理有限公司32243 | 代理人: | 王素琴 |
| 地址: | 210023 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 分層 決策 機(jī)制 機(jī)器人 協(xié)作 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于分層決策機(jī)制的多機(jī)器人協(xié)作方法。
背景技術(shù)
現(xiàn)今國際上最具影響力的FIRA(Federation of International Robot-soccer Association,國際機(jī)器人足球聯(lián)合會(huì))和RoboCup兩大機(jī)器世界杯人足球賽,兩者最大的區(qū)別是FIRA是允許一支球隊(duì)采用傳統(tǒng)的集中控制方式,相當(dāng)于一支球隊(duì)中的全體隊(duì)友受同一個(gè)大腦的控制。而RoboCup則必須要求采用分布式控制方式,相當(dāng)于每個(gè)隊(duì)員有自己的大腦,因而是一個(gè)獨(dú)立的“主體”。這就需要對MAS進(jìn)行深入地研究,讓多個(gè)智能體規(guī)劃以合作和競爭的方式去完成一定的目標(biāo)任務(wù),使用演化算法和群體智慧以達(dá)到一個(gè)整體的突破性行為目標(biāo)。
在RoboCup3D仿真比賽中,要想贏得一場足球比賽,單靠個(gè)人能力是不可能的,必須有全部隊(duì)員的相互配合與協(xié)作,而且RoboCup3D仿真比賽主要是體現(xiàn)多智能體在復(fù)雜動(dòng)態(tài)的環(huán)境下如何實(shí)現(xiàn)高效地協(xié)作和頑強(qiáng)地對抗。RoboCup3D仿真環(huán)境的球員人數(shù)從2010年的6個(gè)智能體變化至2011年的9個(gè)人到至今的11個(gè)智能體,這對于多智能體的配合提出了更高的要求。
關(guān)于多機(jī)器人的協(xié)作機(jī)制問題,最近幾年國內(nèi)外都已開始不同程度的探究。例如葡萄牙的FC Portugal針對球員角色分配問題,采用重復(fù)性最優(yōu)分配(IOA,Iterated Optimal Assignment)方法,是基于著名的貪婪算法下尋求受限的最優(yōu)值,并結(jié)合角色交換機(jī)制;觀察人類的足球運(yùn)動(dòng),有人提出希望通過建立模仿學(xué)習(xí)機(jī)制,統(tǒng)和人類復(fù)雜行為與機(jī)器人動(dòng)作,然而鑒于模仿學(xué)習(xí)的基礎(chǔ)框架的未知性,交互接口也很難獲得;美國UT Austin Villa隊(duì)伍應(yīng)用子任務(wù)集優(yōu)化方法完成目標(biāo)框架的設(shè)計(jì),使用動(dòng)態(tài)角色分配算法協(xié)調(diào)整體隊(duì)伍的占位配合;英國BoldHearts隊(duì)伍使用聯(lián)盟算法,旨在構(gòu)建一個(gè)強(qiáng)大的聯(lián)盟團(tuán)隊(duì)滿足外界環(huán)境的要求,能夠按照算法優(yōu)化其動(dòng)作參數(shù),同時(shí)采用無梯度的Infotaxis策略搜索算法,局部最大化信息增益的速率值;美國的Robocanes隊(duì)采用基于時(shí)空模型匹配方法,以建立相關(guān)的運(yùn)動(dòng)模型和其內(nèi)部狀態(tài),同時(shí)參照德國B-Human隊(duì)伍的行走引擎機(jī)制,并用遺傳算法和SARSA學(xué)習(xí)算法優(yōu)化不同行為動(dòng)作參數(shù)配置。
上述方法都需要一定的優(yōu)化機(jī)制和學(xué)習(xí)方法,針對角色分配問題,其計(jì)算量大,更新速度慢。上述問題是在多機(jī)器人協(xié)作過程中應(yīng)當(dāng)予以考慮并解決的問題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于分層決策機(jī)制的多機(jī)器人協(xié)作方法,實(shí)現(xiàn)整個(gè)多機(jī)器人團(tuán)隊(duì)的有效協(xié)作,依次實(shí)現(xiàn)前鋒持球者的選擇和其它所有球員角色的分配,同時(shí)針對前鋒持球者帶球決策模塊建立DOBMP模型,最后采用動(dòng)態(tài)規(guī)劃算法優(yōu)化角色函數(shù)所帶來的高維數(shù)計(jì)算量的問題,保證基于足球位置不斷變化下的角色輪換的流暢性。
本發(fā)明的技術(shù)解決方案是:
一種基于分層決策機(jī)制的多機(jī)器人協(xié)作方法,
球員依據(jù)球的位置判斷進(jìn)行陣型選擇去應(yīng)對比賽;
接著所有球員投票選出自己認(rèn)為此時(shí)最佳的持球者前鋒持球者,再進(jìn)行其它角色分配;
判斷是否為前鋒持球者,如果是前鋒持球者,則行走至球處,帶球行走,使用理想行為預(yù)測模型對對手速度進(jìn)行數(shù)學(xué)建模用于前鋒持球者行走踢球決策模塊,即是將球踢至目標(biāo)點(diǎn)還是行走帶球至目標(biāo)點(diǎn);
如果不是前鋒持球者,則進(jìn)行其他角色分配后,行走至位置點(diǎn),進(jìn)行陣型選擇。
進(jìn)一步地,使用理想行為預(yù)測模型對對手速度進(jìn)行數(shù)學(xué)建模用于前鋒持球者行走踢球決策模塊,具體為:
由對手的平均速度和其當(dāng)前所在的位置,計(jì)算出對手到達(dá)球位置所需要花費(fèi)的時(shí)間T;同時(shí)知道我方球員執(zhí)行踢球動(dòng)作所花費(fèi)的時(shí)間,設(shè)定閾值以預(yù)測我方機(jī)器人能否成功將球踢至目標(biāo)點(diǎn);
假設(shè)對手可以在t時(shí)間內(nèi)阻止我方踢球,當(dāng)T-t值越小,我方成功完成踢球任務(wù)的可能性越大;
當(dāng)T-t的值小于設(shè)定的閾值時(shí),就認(rèn)為踢球任務(wù)可以成功完成,此時(shí)采取將球踢至目標(biāo)點(diǎn)。
進(jìn)一步地,在做出決策后對手仍可以阻止我方踢球,更改建立的對手的瞬時(shí)速度表,也就是,如果我方未能完成踢球任務(wù)就要對速度表設(shè)置懲罰值p:
其中,Verr是對手的真實(shí)速度與平均速度之差,n是采樣的瞬時(shí)速度的個(gè)數(shù)。
進(jìn)一步地,使用動(dòng)態(tài)規(guī)劃函數(shù)優(yōu)化算法來減少計(jì)算量:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410274560.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種防摔水杯
- 下一篇:一種新型半導(dǎo)體元器件拆卸治具
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 決策協(xié)調(diào)方法、執(zhí)行裝置和決策協(xié)調(diào)器
- 一種基于循環(huán)更新模式的決策樹構(gòu)建方法
- 一種基于群決策的建筑項(xiàng)目決策系統(tǒng)及決策方法
- 一種基于反射弧的智慧大腦決策系統(tǒng)及決策方法
- 一種三維消防指揮決策輔助系統(tǒng)
- 一種決策方法、系統(tǒng)以及電子設(shè)備
- 基于決策引擎和模型平臺(tái)的業(yè)務(wù)決策邏輯更新方法
- 一種雙層優(yōu)先級決策系統(tǒng)
- 一種應(yīng)用程序的業(yè)務(wù)執(zhí)行方法、裝置及電子設(shè)備
- 基于區(qū)塊鏈的決策方法及裝置和電子設(shè)備
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)





