[發(fā)明專利]基于中心化的異構(gòu)算力聯(lián)邦系統(tǒng)及組網(wǎng)和執(zhí)行方法有效
| 申請(qǐng)?zhí)枺?/td> | 202211149183.4 | 申請(qǐng)日: | 2022-09-21 |
| 公開(公告)號(hào): | CN115242660B | 公開(公告)日: | 2022-12-13 |
| 發(fā)明(設(shè)計(jì))人: | 朱世強(qiáng);潘愛民;林露;高翔 | 申請(qǐng)(專利權(quán))人: | 之江實(shí)驗(yàn)室 |
| 主分類號(hào): | H04L41/14 | 分類號(hào): | H04L41/14;H04L41/02;G06F9/50 |
| 代理公司: | 北京志霖恒遠(yuǎn)知識(shí)產(chǎn)權(quán)代理有限公司 11435 | 代理人: | 戴莉 |
| 地址: | 311121 浙江*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 中心 異構(gòu)算力 聯(lián)邦 系統(tǒng) 組網(wǎng) 執(zhí)行 方法 | ||
1.一種基于中心化的異構(gòu)算力聯(lián)邦系統(tǒng),其特征在于:包括視圖層和資源層,所述視圖層內(nèi)設(shè)有異構(gòu)算力聯(lián)邦服務(wù)模塊和異構(gòu)算力聯(lián)邦控制模塊;
所述異構(gòu)算力聯(lián)邦服務(wù)模塊基于異構(gòu)算力聯(lián)邦控制模塊存儲(chǔ)的異構(gòu)算力集群資源描述模型,對(duì)外提供統(tǒng)一的異構(gòu)算力使用接口;所述異構(gòu)算力集群資源描述模型包含異構(gòu)算力集群元數(shù)據(jù),異構(gòu)算力集群資源數(shù)據(jù)和異構(gòu)算力集群狀態(tài)數(shù)據(jù);
所述異構(gòu)算力聯(lián)邦控制模塊接收來自異構(gòu)算力聯(lián)邦探針模塊的信息推送,填充異構(gòu)算力集群資源描述模型,形成異構(gòu)算力資源的統(tǒng)一視圖;接收來自異構(gòu)算力聯(lián)邦服務(wù)模塊的異構(gòu)算力使用請(qǐng)求,并根據(jù)異構(gòu)算力資源的統(tǒng)一視圖將異構(gòu)算力使用請(qǐng)求轉(zhuǎn)發(fā)到異構(gòu)算力聯(lián)邦探針模塊;
所述資源層內(nèi)設(shè)有異構(gòu)算力聯(lián)邦探針模塊和異構(gòu)算力集群管理模塊;
所述異構(gòu)算力聯(lián)邦探針模塊基于從異構(gòu)算力管理模塊獲取的異構(gòu)算力集群資源信息,并將其轉(zhuǎn)換為異構(gòu)算力集群資源描述模型的屬性,最后將異構(gòu)算力集群資源描述模型上報(bào)給異構(gòu)算力聯(lián)邦控制模塊;
所述異構(gòu)算力集群管理模塊由異構(gòu)算力集群自行定義,針對(duì)不同的異構(gòu)算力集群存在不同類型的異構(gòu)算力集群管理模塊,不同的異構(gòu)算力集群管理模塊之間的差異性由異構(gòu)算力聯(lián)邦探針模塊分別適配解決。
2.如權(quán)利要求1所述的一種基于中心化的異構(gòu)算力聯(lián)邦系統(tǒng),其特征在于:所述異構(gòu)算力聯(lián)邦服務(wù)模塊以API業(yè)務(wù)網(wǎng)關(guān)的方式對(duì)外提供HTTP接口。
3.如權(quán)利要求1所述的一種基于中心化的異構(gòu)算力聯(lián)邦系統(tǒng),其特征在于:所述異構(gòu)算力聯(lián)邦控制模塊包括計(jì)算架構(gòu)和存儲(chǔ)架構(gòu),所述計(jì)算架構(gòu)采用SpringMVC技術(shù)提供HTTP接口,包括作業(yè)創(chuàng)建接口、查詢作業(yè)列表接口、查詢作業(yè)詳情接口、刪除作業(yè)接口、申請(qǐng)集群資源接口、釋放集群資源接口、添加集群信息接口、更新集群信息接口和刪除集群信息接口;所述存儲(chǔ)架構(gòu)采用MySQL數(shù)據(jù)庫(kù)以表的形式存儲(chǔ),包括作業(yè)表、集群資源表和集群資源使用記錄表。
4.一種應(yīng)用如權(quán)利要求1-3任一項(xiàng)所述的聯(lián)邦系統(tǒng)的組網(wǎng)方法,其特征在于,具體包括如下步驟:
S1、在異構(gòu)算力集群管理模塊中部署適配該異構(gòu)算力集群管理模塊的異構(gòu)算力聯(lián)邦探針模塊,使異構(gòu)算力聯(lián)邦探針模塊與異構(gòu)算力集群管理模塊進(jìn)行通信,獲取該異構(gòu)算力集群的資源信息;
S2、在異構(gòu)算力聯(lián)邦控制模塊創(chuàng)建異構(gòu)算力集群資源描述模型,所述異構(gòu)算力集群資源描述模型包含異構(gòu)算力集群元數(shù)據(jù),異構(gòu)算力集群資源數(shù)據(jù)和異構(gòu)算力集群狀態(tài)數(shù)據(jù);
S3、異構(gòu)算力聯(lián)邦探針模塊從異構(gòu)算力集群管理模塊獲取異構(gòu)算力集群資源信息,將異構(gòu)算力集群資源信息轉(zhuǎn)換為異構(gòu)算力集群資源描述模型的屬性,最后將該異構(gòu)算力集群資源描述模型的數(shù)據(jù)上報(bào)給異構(gòu)算力聯(lián)邦控制模塊;異構(gòu)算力聯(lián)邦探針模塊能夠與異構(gòu)算力聯(lián)邦控制模塊進(jìn)行通信;
S4、異構(gòu)算力聯(lián)邦控制模塊接收到異構(gòu)算力聯(lián)邦探針模塊周期性上報(bào)的異構(gòu)算力集群資源描述模型的數(shù)據(jù)后,首先更新存儲(chǔ)在異構(gòu)算力聯(lián)邦控制模塊的異構(gòu)算力集群資源描述模型,最后再重構(gòu)異構(gòu)算力資源的統(tǒng)一視圖。
5.如權(quán)利要求4所述的聯(lián)邦系統(tǒng)的組網(wǎng)方法,其特征在于,所述異構(gòu)算力集群元數(shù)據(jù)包括異構(gòu)算力集群名稱、異構(gòu)算力集群創(chuàng)建時(shí)間、異構(gòu)算力集群失效時(shí)間、異構(gòu)算力集群標(biāo)簽和異構(gòu)算力集群注解;所述異構(gòu)算力集群資源數(shù)據(jù)包括異構(gòu)算力集群唯一標(biāo)識(shí)、異構(gòu)算力聯(lián)邦探針類型、異構(gòu)算力集群管理接口、異構(gòu)算力集群地域、異構(gòu)算力集群分組、異構(gòu)算力集群總CPU核數(shù)、異構(gòu)算力集群總GPU卡數(shù)、異構(gòu)算力集群總內(nèi)存大小和異構(gòu)算力集群節(jié)點(diǎn)數(shù);所述異構(gòu)算力集群狀態(tài)數(shù)據(jù)包括異構(gòu)算力集群管理模塊版本、異構(gòu)算力集群已使用CPU核數(shù)、異構(gòu)算力集群已使用GPU卡數(shù)、異構(gòu)算力集群已使用內(nèi)存大小和異構(gòu)算力集群已使用節(jié)點(diǎn)數(shù)。
6.一種應(yīng)用如權(quán)利要求1-3任一項(xiàng)所述的聯(lián)邦系統(tǒng)的執(zhí)行方法,其特征在于,具體包括如下步驟:
A1、算力需求方通過異構(gòu)算力聯(lián)邦服務(wù)模塊提供的統(tǒng)一的異構(gòu)算力使用接口提交計(jì)算任務(wù);
A2、異構(gòu)算力聯(lián)邦服務(wù)模塊將收到的計(jì)算任務(wù)提交到異構(gòu)算力聯(lián)邦控制模塊,異構(gòu)算力聯(lián)邦控制模塊根據(jù)計(jì)算任務(wù)的計(jì)算資源需求查詢異構(gòu)算力資源的統(tǒng)一視圖,獲取一個(gè)異構(gòu)算力集群資源描述模型;
A3、異構(gòu)算力聯(lián)邦服務(wù)模塊根據(jù)該異構(gòu)算力集群資源描述模型將計(jì)算任務(wù)轉(zhuǎn)發(fā)到該異構(gòu)算力集群的異構(gòu)算力聯(lián)邦探針模塊;
A4、異構(gòu)算力聯(lián)邦探針模塊將收到的計(jì)算任務(wù)提交到異構(gòu)算力集群管理模塊,由異構(gòu)算力集群管理模塊將該計(jì)算任務(wù)分配到該異構(gòu)算力集群的節(jié)點(diǎn)上執(zhí)行該計(jì)算任務(wù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于之江實(shí)驗(yàn)室,未經(jīng)之江實(shí)驗(yàn)室許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211149183.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種面向異構(gòu)環(huán)境下的微小算力調(diào)度系統(tǒng)
- 一種面向異構(gòu)環(huán)境下的微小算力調(diào)度系統(tǒng)
- 一種部署異構(gòu)超算平臺(tái)的方法及裝置
- 一種區(qū)塊鏈異構(gòu)系統(tǒng)及人工智能算力網(wǎng)絡(luò)
- 用于算子服務(wù)的處理方法、裝置、智能工作站和電子設(shè)備
- 一種基于可擴(kuò)展小芯片架構(gòu)的超級(jí)異構(gòu)計(jì)算方法
- 一種基于混合云資源的異構(gòu)計(jì)算平臺(tái)及模型訓(xùn)練方法
- 城市大腦AI計(jì)算中心分布式異構(gòu)算力的調(diào)度方法及系統(tǒng)
- 調(diào)度方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)及軟件產(chǎn)品
- 一種天基網(wǎng)絡(luò)異構(gòu)算力資源的協(xié)同處理方法及存儲(chǔ)介質(zhì)
- 一種Agent聯(lián)邦快速設(shè)計(jì)流程建模方法
- 基于聯(lián)邦模式的動(dòng)態(tài)產(chǎn)品協(xié)同開發(fā)平臺(tái)及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動(dòng)態(tài)部署分配方法
- 聯(lián)邦學(xué)習(xí)方法、系統(tǒng)、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種混合聯(lián)邦學(xué)習(xí)方法及架構(gòu)
- 聯(lián)邦學(xué)習(xí)的沙盒機(jī)制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種應(yīng)用于異構(gòu)計(jì)算設(shè)備的聯(lián)邦學(xué)習(xí)系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置





