[發(fā)明專利]一種基于嵌入式的分布式深度學(xué)習(xí)模型資源彈性調(diào)度方法在審
| 申請?zhí)枺?/td> | 202210524307.6 | 申請日: | 2022-05-13 |
| 公開(公告)號: | CN115016932A | 公開(公告)日: | 2022-09-06 |
| 發(fā)明(設(shè)計)人: | 殷光強;王治國;米爾卡米力江·亞森;李超;丁玉峰 | 申請(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06N7/00;G06V10/96;G06V10/94;G06V10/82;G06V10/774;G06N3/10;G06N3/08;G06N3/04 |
| 代理公司: | 成都天嘉專利事務(wù)所(普通合伙) 51211 | 代理人: | 彭紅艷 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 嵌入式 分布式 深度 學(xué)習(xí) 模型 資源 彈性 調(diào)度 方法 | ||
本發(fā)明涉及嵌入式模型資源調(diào)度技術(shù)領(lǐng)域,特別是涉及一種基于嵌入式的分布式深度學(xué)習(xí)模型資源彈性調(diào)度方法,包括構(gòu)建計算精度和計算延遲的復(fù)合獎勵模型、構(gòu)建非受限馬爾可夫決策過程以及利用深度確定性策略算法動態(tài)求解最優(yōu)彈性調(diào)度策略;分布式深度學(xué)習(xí)技術(shù)完成深度學(xué)習(xí)任務(wù)的動態(tài)分配,構(gòu)建以計算服務(wù)延遲和模型精度為核心的參量,并采用馬爾可夫決策過程對問題建模,使用Lyapunov優(yōu)化將其轉(zhuǎn)化為無約束的馬爾可夫獎勵過程之后,通過強化學(xué)習(xí)中的深度確定性策略梯度算法實現(xiàn)深度學(xué)習(xí)任務(wù)的動態(tài)分配過程。通過本調(diào)度方法,能有效解決大規(guī)模深度學(xué)習(xí)算法在單個嵌入式設(shè)備中部署困難的問題,保證深度學(xué)習(xí)算法在嵌入式設(shè)備中的快速運行。
技術(shù)領(lǐng)域
本發(fā)明涉及嵌入式模型資源調(diào)度技術(shù)領(lǐng)域,特別是涉及一種基于嵌入式的分布式深度學(xué)習(xí)模型資源彈性調(diào)度方法。
背景技術(shù)
深度學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域中一種應(yīng)用較廣的技術(shù),該技術(shù)通過模仿、擴展人的思考和行為,使計算機擁有或超過人在某一方面的智能,從而幫助人類完成繁雜的工作。隨著深度學(xué)習(xí)技術(shù)在圖像識別領(lǐng)域的發(fā)展,深度神經(jīng)網(wǎng)絡(luò)被廣泛部署于嵌入式設(shè)備當中。由于深度學(xué)習(xí)推理需要大量計算資源,而單一嵌入式設(shè)備執(zhí)行推斷任務(wù)時難以保證實時性,往往需要將任務(wù)卸載至計算資源豐富的計算節(jié)點。
現(xiàn)有嵌入式圖像識別平臺常采用純邊緣計算方法,將大量的圖像數(shù)據(jù)通過網(wǎng)絡(luò)傳輸至計算資源豐富的云端服務(wù)器,嵌入式平臺只是用來獲取攝像頭的原始數(shù)據(jù),而卷積神經(jīng)網(wǎng)絡(luò)的推理過程在云端服務(wù)器上完成。然而由于網(wǎng)絡(luò)信道的時變性,云計算方案的延遲穩(wěn)定性通常難以保證。
最理想的方法時將所有的圖像識別過程全部在本地執(zhí)行?,F(xiàn)有的方法是對深度神經(jīng)網(wǎng)絡(luò)進行輕量化壓縮處理,在嵌入式平臺上使用深度學(xué)習(xí)框架部署運行輕量化的神經(jīng)網(wǎng)絡(luò),但是這些訓(xùn)練框架沒有針對嵌入式平臺進行專門的優(yōu)化,導(dǎo)致其部署后運行效率低下。壓縮雖然能使計算任務(wù)大幅減小,但也會導(dǎo)致網(wǎng)絡(luò)計算精度降低的問題。
發(fā)明內(nèi)容
為解決上述技術(shù)問題,本發(fā)明提出了一種基于嵌入式的分布式深度學(xué)習(xí)模型資源彈性調(diào)度方法,能有效解決大規(guī)模深度學(xué)習(xí)算法在單個嵌入式設(shè)備中部署困難的問題,保證深度學(xué)習(xí)算法在嵌入式設(shè)備中的快速運行。
本發(fā)明是通過采用下述技術(shù)方案實現(xiàn)的:
一種基于嵌入式的分布式深度學(xué)習(xí)模型資源彈性調(diào)度方法,其特征在于:包括構(gòu)建計算精度和計算延遲的復(fù)合獎勵模型、構(gòu)建非受限馬爾可夫決策過程以及利用深度確定性策略算法動態(tài)求解最優(yōu)彈性調(diào)度策略;
其中,構(gòu)建計算精度和計算延遲的復(fù)合獎勵模型指:通過對本地計算和任務(wù)卸載時的精度和延時參數(shù)建立模型,從而構(gòu)建馬爾可夫決策過程中的獎勵函數(shù);
所述構(gòu)建非受限馬爾可夫決策過程指:將采樣率、任務(wù)卸載和邊緣計算位置作為行動,將本地計算隊列和邊緣計算隊列的積壓量、信道狀態(tài)以及原始數(shù)據(jù)大小作為狀態(tài),將最小化計算服務(wù)延遲作為獎勵,構(gòu)建受限馬爾可夫決策過程,并采用Lyapunov優(yōu)化方法進行轉(zhuǎn)化,構(gòu)建準確性隊列來形容計算服務(wù)精度的長期表現(xiàn),引導(dǎo)深度強化學(xué)習(xí)網(wǎng)絡(luò)傾向于滿足長期的精度約束,得到轉(zhuǎn)化后的非受限馬爾可夫決策過程,即:
行動:包括采樣率的選擇,任務(wù)卸載和邊緣計算資源的分配,描述為:
狀態(tài):包括本地計算時隊列中積壓的任務(wù)邊緣計算設(shè)備中積壓的任務(wù)信道狀態(tài)計算任務(wù)中的原始數(shù)據(jù)大小描述為:
獎勵:最小化計算服務(wù)的延遲,描述為:
概率轉(zhuǎn)移函數(shù):
非受限馬爾科夫決策過程P1為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210524307.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





