[發(fā)明專利]具有觸發(fā)操作的GPU遠(yuǎn)程通信有效

申請(qǐng)?zhí)枺?/td>	201780056487.7	申請(qǐng)日：	2017-09-19
公開（公告）號(hào)：	CN109690512B	公開（公告）日：	2023-07-18
發(fā)明（設(shè)計(jì)）人：	邁克爾·W·萊貝恩;史蒂文·K·萊因哈特	申請(qǐng)（專利權(quán)）人：	超威半導(dǎo)體公司
主分類號(hào)：	G06F13/38	分類號(hào)：	G06F13/38;G06T1/20
代理公司：	上海勝康律師事務(wù)所 31263	代理人：	樊英如;張靜
地址：	美國加利***	國省代碼：	暫無信息
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	具有觸發(fā) 操作 gpu 遠(yuǎn)程通信
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

公開了用于通過計(jì)算機(jī)通信網(wǎng)絡(luò)來發(fā)射數(shù)據(jù)的方法、裝置和系統(tǒng)。可以使用中央處理單元(CPU)預(yù)先生成通信命令隊(duì)列并將其存儲(chǔ)在網(wǎng)絡(luò)接口控制器(NIC)的裝置存儲(chǔ)器中。此后，如果圖形處理單元(GPU)有數(shù)據(jù)要傳送到遠(yuǎn)程GPU，那么它可以將所述數(shù)據(jù)存儲(chǔ)在發(fā)送緩沖器中，其中在所述緩沖器中的位置由預(yù)先生成的命令指向。所述GPU隨后可以用信號(hào)向所述接口裝置通知所述命令已就緒，從而觸發(fā)所述預(yù)先生成的命令的執(zhí)行以發(fā)送所述數(shù)據(jù)。

相關(guān)申請(qǐng)的交叉引用

本申請(qǐng)要求2016年10月18日提交的美國非臨時(shí)專利申請(qǐng)?zhí)?5/297,079的權(quán)益，該專利申請(qǐng)的內(nèi)容通過引用并入本文。

政府權(quán)利

本發(fā)明是在政府支持下根據(jù)由美國能源部資助的勞倫斯伯克利國家實(shí)驗(yàn)室設(shè)計(jì)先鋒2系統(tǒng)集成項(xiàng)目(主合同號(hào)DE-AC02-05CH11231，分包合同號(hào)7216338)進(jìn)行的。政府享有本發(fā)明的某些權(quán)利。

背景技術(shù)

直接存儲(chǔ)器存取(DMA)是計(jì)算機(jī)系統(tǒng)的主存儲(chǔ)器可以被某些外圍硬件直接存取而無需由中央處理單元(CPU)執(zhí)行單獨(dú)讀/寫操作的技術(shù)。此類外圍硬件可以包括圖形處理器(GPU)、網(wǎng)絡(luò)接口控制器(NIC)或其他裝置，諸如其他種類的輸入/輸出(I/O)裝置。

遠(yuǎn)程直接存儲(chǔ)器存取(RDMA)是一個(gè)計(jì)算機(jī)或處理裝置可以通過網(wǎng)絡(luò)存取另一計(jì)算機(jī)或處理裝置的主存儲(chǔ)器而不涉及任一計(jì)算機(jī)的CPU或操作系統(tǒng)的技術(shù)。DMA和RDMA兩者都可以具有允許CPU在主存儲(chǔ)器與硬件子系統(tǒng)之間或在兩個(gè)計(jì)算機(jī)系統(tǒng)的主存儲(chǔ)器之間的數(shù)據(jù)傳送期間執(zhí)行其他功能的優(yōu)點(diǎn)。DMA和RDMA兩者還可以具有比需要來自CPU的更多介入的技術(shù)提高數(shù)據(jù)傳送速率的優(yōu)點(diǎn)，并且可以減少或消除緩沖。

GPU通常無法控制網(wǎng)絡(luò)裝置。基于CPU的通信庫或在CPU上運(yùn)行的其他軟件可以被要求在分布式GPU之間通信。使用GPU構(gòu)建諸如讀和寫請(qǐng)求包或者put和get命令等通信網(wǎng)絡(luò)命令導(dǎo)致性能較差，因?yàn)檫@個(gè)操作本質(zhì)上是串行的并且無法在GPU上有效地并行化。

附圖說明

可以從結(jié)合附圖以舉例的方式給出的以下描述中獲得更詳細(xì)的理解，在附圖中：

圖1是可以實(shí)現(xiàn)一個(gè)或多個(gè)公開的實(shí)施方案的示例性裝置的框圖；

圖2是示出示例性拓?fù)涞南到y(tǒng)圖；

圖3是示出可以使用圖2的示例性拓?fù)浜?或圖1的示例性裝置來采用的示例性方法的流程圖；

圖4是示出可以使用圖2的示例性拓?fù)浜?或圖1的示例性裝置中的GPU來采用的示例性方法的流程圖；

圖5是示出可以使用圖2的示例性拓?fù)浜?或圖1的示例性裝置中的NIC來采用的示例性方法的流程圖；以及

圖6是示出可以使用圖2的示例性拓?fù)浜?或圖1的示例性裝置中的CPU來采用的示例性方法的流程圖。

具體實(shí)施方式

多節(jié)點(diǎn)GPU集群是計(jì)算機(jī)集群，其中連接的計(jì)算機(jī)中的每一者包括一個(gè)或多個(gè)GPU。GPU集群的各種操作可能需要集群中的一個(gè)GPU的輸出的RDMA通信，以便由集群的不同節(jié)點(diǎn)中的GPU消耗。GPU當(dāng)前在沒有在CPU上運(yùn)行的關(guān)鍵路徑軟件的幫助下無法發(fā)起RDMA通信，并且無法有效地生成通信網(wǎng)絡(luò)命令。因此，GPU-GPU?RDMA通常低效，并且通常需要CPU來開始通信。這可能是不合期望的，因?yàn)镽DMA的一個(gè)潛在優(yōu)點(diǎn)就是釋放CPU以用于其他任務(wù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于超威半導(dǎo)體公司，未經(jīng)超威半導(dǎo)體公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201780056487.7/2.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F13-00 信息或其他信號(hào)在存儲(chǔ)器、輸入/輸出設(shè)備或者中央處理機(jī)之間的互連或傳送
G06F13-10 .對(duì)外部設(shè)備的程序控制
G06F13-14 .對(duì)互連或傳送請(qǐng)求的處理
G06F13-38 .信息傳送，例如，在總線上進(jìn)行的
G06F13-40 ..總線結(jié)構(gòu)
G06F13-42 ..總線傳送協(xié)議，例如，信號(hào)的交接過程；同步

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】