[發(fā)明專(zhuān)利]一種RDMA通信加速集合通信的方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110874526.2 | 申請(qǐng)日: | 2021-07-30 |
| 公開(kāi)(公告)號(hào): | CN113553279B | 公開(kāi)(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計(jì))人: | 譚光明;馬瀟瀟;朱泓睿;王展;元國(guó)軍;安學(xué)軍 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中科計(jì)算技術(shù)西部研究院 |
| 主分類(lèi)號(hào): | G06F13/28 | 分類(lèi)號(hào): | G06F13/28;G06F9/445 |
| 代理公司: | 重慶強(qiáng)大凱創(chuàng)專(zhuān)利代理事務(wù)所(普通合伙) 50217 | 代理人: | 黃書(shū)凱 |
| 地址: | 401120 重*** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 rdma 通信 加速 集合 方法 系統(tǒng) | ||
1.一種RDMA通信加速集合通信的方法,其特征在于:包括如下步驟:
S3,網(wǎng)絡(luò)設(shè)備獲取工作請(qǐng)求或網(wǎng)絡(luò)配置包的通信元數(shù)據(jù),判斷工作請(qǐng)求或網(wǎng)絡(luò)配置包是否為集合通信卸載通信,若是,則執(zhí)行步驟S4;
S4,網(wǎng)絡(luò)設(shè)備獲取網(wǎng)絡(luò)數(shù)據(jù),在網(wǎng)絡(luò)設(shè)備上采用細(xì)粒度的緩沖區(qū)管理機(jī)制進(jìn)行集合通信的卸載任務(wù)處理;其中網(wǎng)絡(luò)設(shè)備獲取的是工作請(qǐng)求,在獲取網(wǎng)絡(luò)數(shù)據(jù)前,網(wǎng)絡(luò)設(shè)備會(huì)進(jìn)行集合通信卸載的配置;
所述S4,具體包括:
S401,解析集合通信卸載的配置信息:
S402,發(fā)起本地?cái)?shù)據(jù)讀請(qǐng)求或等待接收外部數(shù)據(jù);
S403,獲取包含網(wǎng)絡(luò)數(shù)據(jù)的數(shù)據(jù)包,對(duì)數(shù)據(jù)包進(jìn)行解析,判斷數(shù)據(jù)包類(lèi)型,若是集合通信卸載的最終計(jì)算結(jié)果,則執(zhí)行S404;若是待計(jì)算的集合通信卸載的數(shù)據(jù),則執(zhí)行S405;
S404,將集合通信卸載的最終計(jì)算結(jié)果廣播到本主機(jī)節(jié)點(diǎn)內(nèi)與此次集合通信相關(guān)的各個(gè)計(jì)算通信實(shí)體中;
S405,對(duì)待計(jì)算的數(shù)據(jù)進(jìn)行分塊計(jì)算;
S406,判斷該主機(jī)節(jié)點(diǎn)內(nèi)與此次集合通信相關(guān)的所有計(jì)算通信實(shí)體的數(shù)據(jù)是否均完成計(jì)算,若計(jì)算完成,則執(zhí)行S407;若計(jì)算未完成,則執(zhí)行S402;
S407,若此次集合通信涉及的所有計(jì)算通信實(shí)體均在本主機(jī)節(jié)點(diǎn)內(nèi),則直接對(duì)計(jì)算結(jié)果進(jìn)行主機(jī)節(jié)點(diǎn)內(nèi)廣播;若否,則將本主機(jī)節(jié)點(diǎn)內(nèi)完成集合通信計(jì)算的數(shù)據(jù)進(jìn)行封裝,并發(fā)往下一主機(jī)節(jié)點(diǎn)與其他主機(jī)節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行進(jìn)一步的計(jì)算;
S408,檢查集合通信卸載完成狀態(tài),若為完成或出現(xiàn)異常,則執(zhí)行S6;若否,則執(zhí)行S402;
S6,若本次任務(wù)完成、應(yīng)用下發(fā)查詢(xún)請(qǐng)求或任務(wù)出現(xiàn)異常,則網(wǎng)絡(luò)設(shè)備將工作請(qǐng)求或網(wǎng)絡(luò)配置包對(duì)應(yīng)的完成隊(duì)列單元反饋給主機(jī)或應(yīng)用。
2.根據(jù)權(quán)利要求1所述的RDMA通信加速集合通信的方法,其特征在于:所述S3,還包括:若否,則執(zhí)行S5;
S5,網(wǎng)絡(luò)設(shè)備獲取網(wǎng)絡(luò)數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行普通的網(wǎng)絡(luò)通信處理;
所述S3之前,還包括:
S1,應(yīng)用中進(jìn)行RDMA通信操作,產(chǎn)生數(shù)據(jù)通信需求;
S2,應(yīng)用向網(wǎng)絡(luò)設(shè)備下發(fā)包含通信元數(shù)據(jù)的工作請(qǐng)求或網(wǎng)絡(luò)配置包,其中通信元數(shù)據(jù)包含操作類(lèi)型、門(mén)鈴信息、請(qǐng)求隊(duì)列虛擬地址和長(zhǎng)度;
所述S6之后,還包括:
S7,檢查此次通信所包含的所有通信操作是否執(zhí)行完成,若執(zhí)行完成,則執(zhí)行S8;若執(zhí)行未完成,則執(zhí)行S2;
S8,通信任務(wù)執(zhí)行結(jié)束。
3.根據(jù)權(quán)利要求1所述的RDMA通信加速集合通信的方法,其特征在于:所述配置信息包括:重要控制信息;所述重要控制信息包括:Op字段、JID字段、MID字段、SID字段、主機(jī)節(jié)點(diǎn)字段、計(jì)算通信實(shí)體字段、Seg字段、數(shù)據(jù)分塊長(zhǎng)度字段、集合通信執(zhí)行狀態(tài)字段、地址鏈表字段、路由信息字段;
Op字段,用于表示集合通信中使用到的計(jì)算操作類(lèi)型;
JID字段,用于任務(wù)號(hào)的標(biāo)志;
MID字段,用于消息號(hào)的標(biāo)志;
SID字段,用于同一消息中數(shù)據(jù)序列號(hào)的標(biāo)志;
Node字段,用于一次集合通信中涉及到的節(jié)點(diǎn)號(hào)的標(biāo)志;
Rank字段,用于一次集合通信中涉及到的Rank號(hào)的標(biāo)志;
Seg字段,用于一次集合通信中指定的Seg緩存單元號(hào)的標(biāo)志;
數(shù)據(jù)分塊長(zhǎng)度字段,用于表明一個(gè)消息的數(shù)據(jù)按多大的數(shù)據(jù)塊分割進(jìn)行流水處理;
集合通信執(zhí)行狀態(tài)字段,用于表明一次集合通信中執(zhí)行狀態(tài);
地址鏈表字段,用于存儲(chǔ)網(wǎng)絡(luò)設(shè)備上獲取各個(gè)Rank數(shù)據(jù)的地址鏈表;
路由信息字段,用于存儲(chǔ)網(wǎng)絡(luò)設(shè)備進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā)的路由信息。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中科計(jì)算技術(shù)西部研究院,未經(jīng)中科計(jì)算技術(shù)西部研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110874526.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 將RDMA語(yǔ)義映射到高速存儲(chǔ)
- 一種基于RDMA的數(shù)據(jù)傳輸方法及RDMA網(wǎng)卡
- RDMA資源泄漏檢測(cè)和報(bào)告
- 一種數(shù)據(jù)訪問(wèn)方法以及相關(guān)裝置
- 內(nèi)存訪問(wèn)方法和裝置
- 一種虛擬硬盤(pán)的映射方法、設(shè)備和云計(jì)算平臺(tái)
- 基于流量負(fù)載預(yù)測(cè)的RDMA緩沖區(qū)動(dòng)態(tài)分配方法
- 基于迭代逼近的RDMA緩沖區(qū)動(dòng)態(tài)分配方法
- 面向分布式文件系統(tǒng)的RDMA通信地址交換方法
- 基于InfiniBand的通信方法、設(shè)備及存儲(chǔ)介質(zhì)
- 通信裝置、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信設(shè)備、通信方法、通信電路、通信系統(tǒng)
- 通信設(shè)備、通信系統(tǒng)、通信方法、通信程序、通信電路
- 通信終端、通信系統(tǒng)、通信方法以及通信程序
- 通信終端、通信方法、通信裝備和通信系統(tǒng)
- 通信裝置、通信程序、通信方法以及通信系統(tǒng)
- 通信裝置、通信系統(tǒng)、通信方法及計(jì)算機(jī)可讀取的記錄介質(zhì)





