[發(fā)明專利]為RDMA提供多租賃支持的方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010412762.8 | 申請(qǐng)日: | 2015-12-28 |
| 公開(kāi)(公告)號(hào): | CN111400237A | 公開(kāi)(公告)日: | 2020-07-10 |
| 發(fā)明(設(shè)計(jì))人: | S·切里恩;T·因加萊;R·S·納拉哈里·萬(wàn)卡塔 | 申請(qǐng)(專利權(quán))人: | NICIRA股份有限公司 |
| 主分類號(hào): | G06F15/167 | 分類號(hào): | G06F15/167;H04L12/24;H04L12/715;H04L12/741;H04L29/06;H04L29/08 |
| 代理公司: | 中國(guó)國(guó)際貿(mào)易促進(jìn)委員會(huì)專利商標(biāo)事務(wù)所 11038 | 代理人: | 鮑進(jìn) |
| 地址: | 美國(guó)加*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | rdma 提供 租賃 支持 方法 | ||
本公開(kāi)涉及為RDMA提供多租賃支持的方法。公開(kāi)了一種用于在包括多個(gè)物理主機(jī)的系統(tǒng)中為RDMA提供多租賃支持的方法。每個(gè)物理主機(jī)托管一組數(shù)據(jù)計(jì)算節(jié)點(diǎn)(DCN)。該方法在第一主機(jī)的RDMA協(xié)議棧處接收包括來(lái)自在第一主機(jī)上托管的第一DCN的、對(duì)從在第二主機(jī)上托管的第二DCN進(jìn)行RDMA數(shù)據(jù)傳輸?shù)恼?qǐng)求的分組。該方法將與第一DCN相關(guān)聯(lián)的覆蓋網(wǎng)絡(luò)的一組參數(shù)發(fā)送到第一主機(jī)的RDMA物理網(wǎng)絡(luò)接口控制器。該組參數(shù)由RDMA物理NIC使用來(lái)利用RDMA數(shù)據(jù)傳輸報(bào)頭和使用覆蓋網(wǎng)絡(luò)的這組參數(shù)的覆蓋網(wǎng)絡(luò)報(bào)頭封裝分組,以使用覆蓋網(wǎng)絡(luò)將封裝后的分組傳輸?shù)降诙锢碇鳈C(jī)。
本申請(qǐng)是申請(qǐng)日為2015年12月28日、申請(qǐng)?zhí)枮?01580068388.1、發(fā)明名稱為“為RDMA提供多租賃支持的方法”的發(fā)明專利申請(qǐng)的分案申請(qǐng)。
技術(shù)領(lǐng)域
本發(fā)明公開(kāi)涉及為RDMA提供多租賃支持。
背景技術(shù)
遠(yuǎn)程直接存儲(chǔ)器存取(RDMA)直接在兩個(gè)應(yīng)用之間提供讀和寫(xiě)服務(wù),并使得數(shù)據(jù)直接傳輸?shù)綉?yīng)用緩沖區(qū)而無(wú)需中間數(shù)據(jù)拷貝。RDMA使得存儲(chǔ)器數(shù)據(jù)傳輸能夠繞過(guò)操作系統(tǒng)和內(nèi)核。
目前存在若干種通過(guò)網(wǎng)絡(luò)傳輸RDMA分組的協(xié)議。RDMA傳輸協(xié)議的示例是融合以太網(wǎng)上的RDMA(RDMA over Converged Ethernet,RoCE)和互聯(lián)網(wǎng)廣域RDMA協(xié)議(InternetWide Area RDMA Protocol,iWARP)。RoCE是開(kāi)放系統(tǒng)互連(OSI)模型第二層網(wǎng)絡(luò)技術(shù),其通過(guò)繞過(guò)CPU或內(nèi)核實(shí)現(xiàn)同一以太網(wǎng)上兩個(gè)主機(jī)之間的直接數(shù)據(jù)傳輸。
目前,RoCE版本1不支持互聯(lián)網(wǎng)協(xié)議(IP)層路由,并且在多租戶域中不可用。RoCE版本2確實(shí)支持IP層路由,但是在多租戶域中不可用。
目前沒(méi)有機(jī)制利用在軟件定義數(shù)據(jù)中心中支持多租賃的覆蓋網(wǎng)絡(luò)來(lái)使用RDMA數(shù)據(jù)傳輸協(xié)議(諸如RoCE或iWARP)。
當(dāng)今,源自VM的覆蓋網(wǎng)絡(luò)L2幀的封裝用軟件處理。這涉及在覆蓋網(wǎng)絡(luò)軟件部分上的重要工作,以維護(hù)和查找覆蓋網(wǎng)絡(luò)地址映射表,并且在分組被發(fā)出到線路上之前用包含相關(guān)覆蓋網(wǎng)絡(luò)、UDP、IP和以太網(wǎng)信息的外部報(bào)頭封裝傳送分組。
類似地,對(duì)于接收到的分組,外部報(bào)頭解封裝的相反處理也是軟件負(fù)責(zé)。用軟件進(jìn)行的每次映射表查找和分組的封裝/解封裝都會(huì)導(dǎo)致顯著的CPU成本并影響性能。
發(fā)明內(nèi)容
一些實(shí)施例提供用于在虛擬L3網(wǎng)絡(luò)上的多租戶云計(jì)算環(huán)境中經(jīng)由作為L(zhǎng)2技術(shù)的RDMA數(shù)據(jù)傳輸協(xié)議(諸如RoCE)使得能夠進(jìn)行RDMA傳輸?shù)姆椒ā_@使得能夠使用軟件定義網(wǎng)絡(luò)(Software Defined Network,SDN)方法來(lái)利用RDMA技術(shù)的能力并實(shí)現(xiàn)多個(gè)物理和虛擬網(wǎng)絡(luò)之間的無(wú)縫連接的目標(biāo)。
覆蓋網(wǎng)絡(luò)是在云計(jì)算環(huán)境中實(shí)現(xiàn)多租賃的網(wǎng)絡(luò)虛擬化技術(shù)。一些實(shí)施例利用覆蓋網(wǎng)絡(luò)來(lái)提供L3可路由性并使得能夠在多租戶環(huán)境中進(jìn)行RDMA傳輸。這些實(shí)施例通過(guò)用覆蓋網(wǎng)絡(luò)路由報(bào)頭封裝RDMA數(shù)據(jù)傳輸協(xié)議(諸如RoCE或iWARP)分組使得能夠在覆蓋網(wǎng)絡(luò)上進(jìn)行RDMA數(shù)據(jù)傳輸。
覆蓋網(wǎng)絡(luò)軟件負(fù)責(zé)維護(hù)覆蓋網(wǎng)絡(luò)映射表,以包括到隧道端點(diǎn)IP的VM媒體訪問(wèn)控制(MAC)地址和其它地址映射。這些實(shí)施例中的一些實(shí)施例還用特定于每個(gè)RDMA連接的覆蓋網(wǎng)絡(luò)地址映射信息對(duì)覆蓋網(wǎng)絡(luò)接口控制器(NIC)進(jìn)行編程,以便將利用覆蓋網(wǎng)絡(luò)報(bào)頭對(duì)RDMA分組的封裝卸載到硬件。
前面的發(fā)明內(nèi)容旨在用作對(duì)本發(fā)明的一些實(shí)施例的簡(jiǎn)要介紹。它并不意味著是對(duì)本文檔中公開(kāi)的所有發(fā)明性主題的介紹或概述。以下的具體實(shí)施方式和在具體實(shí)施方式中提及的附圖將進(jìn)一步描述在本發(fā)明內(nèi)容中描述的實(shí)施例以及其它實(shí)施例。相應(yīng)地,為了理解本文檔描述的所有實(shí)施例,需要對(duì)發(fā)明內(nèi)容、具體實(shí)施方式和附圖進(jìn)行全面地審查。此外,所要求保護(hù)的主題不受發(fā)明內(nèi)容、具體實(shí)施方式和附圖中的說(shuō)明性細(xì)節(jié)的限制。
附圖說(shuō)明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于NICIRA股份有限公司,未經(jīng)NICIRA股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010412762.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F15-00 通用數(shù)字計(jì)算機(jī)
G06F15-02 .通過(guò)鍵盤(pán)輸入的手動(dòng)操作,以及應(yīng)用機(jī)內(nèi)程序的計(jì)算,例如,袖珍計(jì)算器
G06F15-04 .在引入被處理的數(shù)據(jù)的同時(shí),進(jìn)行編制程序的,例如,在同一記錄載體上
G06F15-08 .應(yīng)用插接板編制程序的
G06F15-16 .兩個(gè)或多個(gè)數(shù)字計(jì)算機(jī)的組合,其中每臺(tái)至少具有一個(gè)運(yùn)算器、一個(gè)程序器及一個(gè)寄存器,例如,用于數(shù)個(gè)程序的同時(shí)處理
G06F15-18 .其中,根據(jù)計(jì)算機(jī)本身在一個(gè)完整的運(yùn)行期間內(nèi)所取得的經(jīng)驗(yàn)來(lái)改變程序的;學(xué)習(xí)機(jī)器
- 將RDMA語(yǔ)義映射到高速存儲(chǔ)
- 一種基于RDMA的數(shù)據(jù)傳輸方法及RDMA網(wǎng)卡
- RDMA資源泄漏檢測(cè)和報(bào)告
- 一種數(shù)據(jù)訪問(wèn)方法以及相關(guān)裝置
- 內(nèi)存訪問(wèn)方法和裝置
- 一種虛擬硬盤(pán)的映射方法、設(shè)備和云計(jì)算平臺(tái)
- 基于流量負(fù)載預(yù)測(cè)的RDMA緩沖區(qū)動(dòng)態(tài)分配方法
- 基于迭代逼近的RDMA緩沖區(qū)動(dòng)態(tài)分配方法
- 面向分布式文件系統(tǒng)的RDMA通信地址交換方法
- 基于InfiniBand的通信方法、設(shè)備及存儲(chǔ)介質(zhì)
- 信息提供系統(tǒng)、信息提供方法、信息提供設(shè)備
- 信息提供裝置、信息提供系統(tǒng)
- 游戲提供系統(tǒng)、游戲提供程序和游戲提供方法
- 游戲提供系統(tǒng)、游戲提供程序和游戲提供方法
- 信息提供方法、信息提供裝置、信息提供系統(tǒng)及信息提供程序
- 動(dòng)作信息提供裝置、提供系統(tǒng)以及提供方法
- 提供裝置、提供方法、提供系統(tǒng)以及存儲(chǔ)介質(zhì)
- 提供裝置、提供方法、存儲(chǔ)介質(zhì)以及提供系統(tǒng)
- 提供裝置、提供方法、存儲(chǔ)介質(zhì)以及提供系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法以及內(nèi)容提供系統(tǒng)





