[發(fā)明專利]模型構(gòu)建方法、任務(wù)分配方法、裝置、設(shè)備及介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110302078.9 | 申請(qǐng)日: | 2021-03-22 |
| 公開(公告)號(hào): | CN113032904B | 公開(公告)日: | 2021-11-23 |
| 發(fā)明(設(shè)計(jì))人: | 任濤;胡哲源;谷寧波;牛建偉;杜東峰;豆淵博;李青鋒 | 申請(qǐng)(專利權(quán))人: | 北京航空航天大學(xué)杭州創(chuàng)新研究院 |
| 主分類號(hào): | G06F30/15 | 分類號(hào): | G06F30/15;G06F30/20;G06F9/445;G06F9/48;G06F9/50;G06F119/12 |
| 代理公司: | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463 | 代理人: | 董艷芳 |
| 地址: | 310000 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型 構(gòu)建 方法 任務(wù) 分配 裝置 設(shè)備 介質(zhì) | ||
本申請(qǐng)?zhí)峁┑哪P蜆?gòu)建方法、任務(wù)分配方法、裝置、設(shè)備及介質(zhì)中,訓(xùn)練設(shè)備將無人機(jī)輔助移動(dòng)邊緣計(jì)算的調(diào)度策略拆分成無人機(jī)位置優(yōu)化與任務(wù)計(jì)算卸載優(yōu)化兩個(gè)層級(jí)的子問題,使用層次強(qiáng)化學(xué)習(xí)交替優(yōu)化對(duì)應(yīng)位置模型以及任務(wù)模型,以達(dá)到降低了每個(gè)子問題的復(fù)雜度,并且提高了整體系統(tǒng)的學(xué)習(xí)效率與收斂效率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種模型構(gòu)建方法、任務(wù)分配方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù)
由于無人機(jī)(Unmanned Aerial Vehicles,UAVs)具有的高機(jī)動(dòng)性和靈活性,近年來研究人員提出了使用無人機(jī)在多種應(yīng)用場景下輔助移動(dòng)邊緣計(jì)算(Mobile EdgeComputing,MEC)的技術(shù)。在無人機(jī)輔助的移動(dòng)邊緣計(jì)算領(lǐng)域,需要對(duì)無人機(jī)的運(yùn)動(dòng)軌跡和無人機(jī)與移動(dòng)終端之間任務(wù)進(jìn)行適當(dāng)?shù)恼{(diào)度以獲得理想的性能。其中,在對(duì)任務(wù)調(diào)度表示將同一計(jì)算任務(wù)分配給無人機(jī)或者移動(dòng)終端(下面簡稱任務(wù)卸載)。目前,出現(xiàn)了基于強(qiáng)化學(xué)習(xí)的方法實(shí)現(xiàn)動(dòng)態(tài)場景下無人機(jī)輔助移動(dòng)邊緣計(jì)算的調(diào)度策略。
發(fā)明人研究發(fā)現(xiàn),隨著無人機(jī)與移動(dòng)終端數(shù)量的增加,使用強(qiáng)化學(xué)習(xí)算法的系統(tǒng)狀態(tài)空間與動(dòng)作空間會(huì)呈指數(shù)級(jí)別增長,這大大降低了算法的收斂效率。因此,對(duì)于大規(guī)模的無人機(jī)輔助的移動(dòng)邊緣計(jì)算網(wǎng)絡(luò),很難獲得易收斂的調(diào)度策略。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)中的至少一個(gè)不足,第一方面,本申請(qǐng)實(shí)施例提供一種模型構(gòu)建方法,應(yīng)用于訓(xùn)練設(shè)備,所述訓(xùn)練設(shè)備配置有待訓(xùn)練的位置模型以及任務(wù)分配模型,所述方法包括:
初始化所述位置模型、所述任務(wù)分配模型、第一無人機(jī)的狀態(tài)以及第一移動(dòng)終端的狀態(tài),其中,所述第一無人機(jī)用于為所述第一移動(dòng)終端提供邊緣計(jì)算服務(wù);
將所述位置模型以及任務(wù)分配模型進(jìn)行以下迭代,直到滿足預(yù)設(shè)的迭代條件:
根據(jù)所述第一移動(dòng)終端與所述第一無人機(jī)之間當(dāng)前時(shí)刻的第一狀態(tài),通過所述位置模型獲得所述第一無人機(jī)下一時(shí)刻的預(yù)測位置;
根據(jù)所述預(yù)測位置更新所述位置模型的模型參數(shù);
根據(jù)所述預(yù)測位置確定所述第一無人機(jī)與所述第一移動(dòng)終端之間當(dāng)前時(shí)刻的第二狀態(tài);
根據(jù)所述第二狀態(tài),通過所述任務(wù)分配模型確定所述第一無人機(jī)與所述第一移動(dòng)終端之間下一時(shí)刻的任務(wù)分配結(jié)果;
根據(jù)所述任務(wù)分配結(jié)果,更新所述任務(wù)分配模型的模型參數(shù)。
第二方面,本申請(qǐng)實(shí)施例提供一種任務(wù)分配方法,應(yīng)用于執(zhí)行設(shè)備,所述執(zhí)行設(shè)備配置有預(yù)訓(xùn)練的位置模型以及任務(wù)分配模型,所述預(yù)訓(xùn)練的位置模型以及任務(wù)分配模型由所述的模型構(gòu)建方法進(jìn)行訓(xùn)練獲得,所述方法包括:
獲取第二無人機(jī)當(dāng)前時(shí)刻的第三狀態(tài);
根據(jù)所述第三狀態(tài),通過所述位置模型確定所述第二無人機(jī)在下一時(shí)刻的預(yù)測位置;
根據(jù)所述第二無人機(jī)在下一時(shí)刻的預(yù)測位置,確定所述第二無人機(jī)與第二移動(dòng)終端之間的第四狀態(tài);
根據(jù)所述第四狀態(tài),通過所述任務(wù)分配模型確定所述第二無人機(jī)與所述第二移動(dòng)終端之間的任務(wù)分配結(jié)果。
第三方面,本申請(qǐng)實(shí)施例提供一種模型構(gòu)建裝置,所述模型構(gòu)建裝置應(yīng)用于訓(xùn)練設(shè)備,所述訓(xùn)練設(shè)備配置有待訓(xùn)練的位置模型以及任務(wù)分配模型,所述模型構(gòu)建裝置包括:
模型初始模塊,用于將所述位置模型、所述任務(wù)分配模型、第一無人機(jī)的狀態(tài)以及第一移動(dòng)終端的狀態(tài)進(jìn)行初始化,其中,所述第一無人機(jī)用于為所述第一移動(dòng)終端提供邊緣計(jì)算服務(wù);
模型初始模塊,用于初始化所述位置模型、所述任務(wù)分配模型、第一無人機(jī)的狀態(tài)以及第一移動(dòng)終端的狀態(tài),其中,所述第一無人機(jī)用于為所述第一移動(dòng)終端提供邊緣計(jì)算服務(wù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué)杭州創(chuàng)新研究院,未經(jīng)北京航空航天大學(xué)杭州創(chuàng)新研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110302078.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 任務(wù)協(xié)作裝置及方法
- 用于量化任務(wù)價(jià)值的任務(wù)管理方法及裝置
- 用于運(yùn)行任務(wù)的系統(tǒng)、方法和裝置
- 一種分布式任務(wù)調(diào)度系統(tǒng)及方法
- 任務(wù)信息處理方法
- 一種同步任務(wù)異步執(zhí)行的方法和調(diào)度系統(tǒng)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種自動(dòng)分配和推送的任務(wù)管理平臺(tái)及方法
- 程序執(zhí)行控制的裝置及方法、終端和存儲(chǔ)介質(zhì)
- 基于會(huì)話的任務(wù)待辦方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)





