[發(fā)明專利]具有觸發(fā)操作的GPU遠(yuǎn)程通信有效
| 申請(qǐng)?zhí)枺?/td> | 201780056487.7 | 申請(qǐng)日: | 2017-09-19 |
| 公開(公告)號(hào): | CN109690512B | 公開(公告)日: | 2023-07-18 |
| 發(fā)明(設(shè)計(jì))人: | 邁克爾·W·萊貝恩;史蒂文·K·萊因哈特 | 申請(qǐng)(專利權(quán))人: | 超威半導(dǎo)體公司 |
| 主分類號(hào): | G06F13/38 | 分類號(hào): | G06F13/38;G06T1/20 |
| 代理公司: | 上海勝康律師事務(wù)所 31263 | 代理人: | 樊英如;張靜 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 具有 觸發(fā) 操作 gpu 遠(yuǎn)程 通信 | ||
公開了用于通過計(jì)算機(jī)通信網(wǎng)絡(luò)來發(fā)射數(shù)據(jù)的方法、裝置和系統(tǒng)。可以使用中央處理單元(CPU)預(yù)先生成通信命令隊(duì)列并將其存儲(chǔ)在網(wǎng)絡(luò)接口控制器(NIC)的裝置存儲(chǔ)器中。此后,如果圖形處理單元(GPU)有數(shù)據(jù)要傳送到遠(yuǎn)程GPU,那么它可以將所述數(shù)據(jù)存儲(chǔ)在發(fā)送緩沖器中,其中在所述緩沖器中的位置由預(yù)先生成的命令指向。所述GPU隨后可以用信號(hào)向所述接口裝置通知所述命令已就緒,從而觸發(fā)所述預(yù)先生成的命令的執(zhí)行以發(fā)送所述數(shù)據(jù)。
相關(guān)申請(qǐng)的交叉引用
本申請(qǐng)要求2016年10月18日提交的美國非臨時(shí)專利申請(qǐng)?zhí)?5/297,079的權(quán)益,該專利申請(qǐng)的內(nèi)容通過引用并入本文。
政府權(quán)利
本發(fā)明是在政府支持下根據(jù)由美國能源部資助的勞倫斯伯克利國家實(shí)驗(yàn)室設(shè)計(jì)先鋒2系統(tǒng)集成項(xiàng)目(主合同號(hào)DE-AC02-05CH11231,分包合同號(hào)7216338)進(jìn)行的。政府享有本發(fā)明的某些權(quán)利。
背景技術(shù)
直接存儲(chǔ)器存取(DMA)是計(jì)算機(jī)系統(tǒng)的主存儲(chǔ)器可以被某些外圍硬件直接存取而無需由中央處理單元(CPU)執(zhí)行單獨(dú)讀/寫操作的技術(shù)。此類外圍硬件可以包括圖形處理器(GPU)、網(wǎng)絡(luò)接口控制器(NIC)或其他裝置,諸如其他種類的輸入/輸出(I/O)裝置。
遠(yuǎn)程直接存儲(chǔ)器存取(RDMA)是一個(gè)計(jì)算機(jī)或處理裝置可以通過網(wǎng)絡(luò)存取另一計(jì)算機(jī)或處理裝置的主存儲(chǔ)器而不涉及任一計(jì)算機(jī)的CPU或操作系統(tǒng)的技術(shù)。DMA和RDMA兩者都可以具有允許CPU在主存儲(chǔ)器與硬件子系統(tǒng)之間或在兩個(gè)計(jì)算機(jī)系統(tǒng)的主存儲(chǔ)器之間的數(shù)據(jù)傳送期間執(zhí)行其他功能的優(yōu)點(diǎn)。DMA和RDMA兩者還可以具有比需要來自CPU的更多介入的技術(shù)提高數(shù)據(jù)傳送速率的優(yōu)點(diǎn),并且可以減少或消除緩沖。
GPU通常無法控制網(wǎng)絡(luò)裝置。基于CPU的通信庫或在CPU上運(yùn)行的其他軟件可以被要求在分布式GPU之間通信。使用GPU構(gòu)建諸如讀和寫請(qǐng)求包或者put和get命令等通信網(wǎng)絡(luò)命令導(dǎo)致性能較差,因?yàn)檫@個(gè)操作本質(zhì)上是串行的并且無法在GPU上有效地并行化。
附圖說明
可以從結(jié)合附圖以舉例的方式給出的以下描述中獲得更詳細(xì)的理解,在附圖中:
圖1是可以實(shí)現(xiàn)一個(gè)或多個(gè)公開的實(shí)施方案的示例性裝置的框圖;
圖2是示出示例性拓?fù)涞南到y(tǒng)圖;
圖3是示出可以使用圖2的示例性拓?fù)浜?或圖1的示例性裝置來采用的示例性方法的流程圖;
圖4是示出可以使用圖2的示例性拓?fù)浜?或圖1的示例性裝置中的GPU來采用的示例性方法的流程圖;
圖5是示出可以使用圖2的示例性拓?fù)浜?或圖1的示例性裝置中的NIC來采用的示例性方法的流程圖;以及
圖6是示出可以使用圖2的示例性拓?fù)浜?或圖1的示例性裝置中的CPU來采用的示例性方法的流程圖。
具體實(shí)施方式
多節(jié)點(diǎn)GPU集群是計(jì)算機(jī)集群,其中連接的計(jì)算機(jī)中的每一者包括一個(gè)或多個(gè)GPU。GPU集群的各種操作可能需要集群中的一個(gè)GPU的輸出的RDMA通信,以便由集群的不同節(jié)點(diǎn)中的GPU消耗。GPU當(dāng)前在沒有在CPU上運(yùn)行的關(guān)鍵路徑軟件的幫助下無法發(fā)起RDMA通信,并且無法有效地生成通信網(wǎng)絡(luò)命令。因此,GPU-GPU?RDMA通常低效,并且通常需要CPU來開始通信。這可能是不合期望的,因?yàn)镽DMA的一個(gè)潛在優(yōu)點(diǎn)就是釋放CPU以用于其他任務(wù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于超威半導(dǎo)體公司,未經(jīng)超威半導(dǎo)體公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780056487.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲(chǔ)介質(zhì)及設(shè)備





