[發明專利]邊緣計算場景下多用戶深度神經網絡模型分割與資源分配優化方法在審
| 申請號: | 202011638611.0 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112822701A | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 陳旭;唐歆;曾烈康;周知 | 申請(專利權)人: | 中山大學 |
| 主分類號: | H04W24/02 | 分類號: | H04W24/02;H04W24/06;G06N3/08 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 王曉玲 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 邊緣 計算 場景 多用戶 深度 神經網絡 模型 分割 資源 分配 優化 方法 | ||
1.一種邊緣計算場景下多用戶深度神經網絡模型分割與資源分配優化方法,其特征在于,包括以下步驟:
S1.深度神經網絡模型分割建模步驟:定義包含若干深度神經網絡概念層的邏輯層,以邏輯層為最小分割單元將深度神經網絡模型抽象為包含若干連續串聯任務的計算圖模型;
S2.邊緣計算多用戶環境下資源分配與深度神經網絡模型分割決策建模步驟:在多用戶環境下,用啟發式方法擬合估計深度神經網絡模型分割的計算時延,并將問題建模為一個非線性整數規劃問題;
S3.用戶響應時延優化問題求解步驟:利用迭代式交替優化算法求解S2中建模得到的問題,并根據求得的解在邊緣服務器上部署深度神經網絡模型。
2.根據權利要求1所述的邊緣計算場景下多用戶深度神經網絡模型分割與資源分配優化方法,其特征在于,所述的步驟S1具體包括:將深度神經網絡模型中的多個并行概念層和帶捷徑連接的概念層抽象為一個單獨的邏輯層,進而將深度神經網絡模型抽象為一個由邏輯層順序連接而成的計算圖;對于設備i部署的深度神經網絡模型共由ki個邏輯層順序連接組成,用一個整型變量si表示模型在第i個邏輯層后被分割;分割決策si∈{0,1,2,…,ki};用表示分割點之前的神經網絡的計算量,用表示分割點之后的神經網絡的計算量。
3.根據權利要求2所述的邊緣計算場景下多用戶深度神經網絡模型分割與資源分配優化方法,其特征在于,所述的步驟S2具體包括:
S21.對邊緣服務器算力分割進行建模:將最小可分配的計算資源單元簡稱MCRU的計算能力記為Cmin;用β表示邊緣服務器上總共的MCRU的數量,用fi表示每個用戶i所分配到的MCRU的數量;自然地,有∑i∈Nfi≤β;
S22.對設備本地執行時延建模:
公式(1)中,表示設備i的計算能力;
S23.對設備卸載到邊緣服務器上的神經網絡部分計算時延的建模:
其中,θ是單位階躍函數,其表達式為:
γ是一個通過現實數據擬合出的近似映射,表示fi份計算資源實際達到計算能力Cmin的倍數;
S24.對中間結果傳輸時延的建模:
其中,表示用戶設備i在切分點si需要傳輸的中間結果的大小,表示用戶設備i的上行帶寬;
S25.對最終結果回傳的傳輸時延建模:
其中,表示用戶設備i的下行帶寬;
S26.對單用戶設備的深度神經網絡分割模型推斷總時延建模:
結合步驟S22、步驟S23、步驟S24、步驟S25中對各個子步驟的執行時延建模(1)、(2)、(3)、(4),得到用戶設備進行深度神經網絡分割模型推斷總時延為:
S27.對多用戶設備的全局時延最小化的建模:
其中公式(7)表示邊緣服務器總資源數有限,公式(8)表示切割決策必然小于總邏輯層數,且當邊緣服務器不分配計算資源給用戶設備i時(fi=0),必有si=ki,即所有計算任務在本地完成執行;公式(9)中N表示自然數集合,fi和si的取值都是非負整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011638611.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多功能自動壓面機
- 下一篇:一種無人機載船舶燃油硫含量自吸式探測裝置





