[發明專利]一種FPGA云平臺加速資源的分配方法與系統有效
| 申請號: | 201910895899.0 | 申請日: | 2019-09-21 |
| 公開(公告)號: | CN110618871B | 公開(公告)日: | 2022-07-22 |
| 發明(設計)人: | 任智新;樊嘉恒 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50 |
| 代理公司: | 濟南誠智商標專利事務所有限公司 37105 | 代理人: | 李修杰 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 fpga 平臺 加速 資源 分配 方法 系統 | ||
本發明提供了一種FPGA云平臺加速資源的分配方法與系統,本發明根據用戶主機與部署在各網段的FPGA加速卡之間的延時來進行加速卡資源的分配與協調,當用戶申請使用FPGA時,將FPGA資源池內與主機延時最小的FPGA加速卡分配給用戶,從而實現FPGA云平臺加速資源的分配;云監控管理平臺可根據FPGA資源池中每塊FPGA板卡的地理位置的不同,得到與虛擬機網絡之間的傳輸延時,將延時最小的板卡分配各用戶使用,另外可有效防止未被授權的用戶隨意訪問資源池中的加速資源,保護了資源池所有者的有效權益。通過本發明,既有效地保護了未授權給用戶使用的FPGA加速卡,又能保證分配給用戶的板卡的網絡延時最小,達到最優的加速效果,提升用戶體驗。
技術領域
本發明涉及數據中心技術領域,特別是一種FPGA云平臺加速資源的分配方法與系統。
背景技術
隨著“云數智”的快速發展,數據體量的急劇膨脹,數據中心對計算的需求也在迅猛上漲。諸如深度學習在視頻轉碼、圖片壓縮解壓縮以及基因檢測等各類應用對計算的需求已遠遠超出了傳統CPU處理器的能力所及。
為了彌補需求和性能之間的缺口,業界開始通過硬件加速,也就是采用專用協處理器的異構計算方式來提升處理性能。而隨著FPGA處理能力的不斷增強,越來越多的數據中心開始使用FPGA進行加速,如微軟、亞馬遜、BAT等公司的數據中心都大規模部署了FPGA計算卡,以同時提高強大的計算能力和足夠的靈活性。為了管理這些數量和種類越來越多的FPGA加速卡,FPGA云平臺應用而生,以期解決當前企業面臨的FPGA加速卡部署、維護和管理難的問題。在云平臺的管理下,將復雜的計算任務分配給FPGA資源池中的某一個或者某幾個FPGA中進行加速,加速卡之間通過以太網進行數據傳輸。
在目前的技術中,對于單機單卡或者單機多卡的使用場景(每臺服務器配一塊或者多塊FPGA加速卡),不存在資源管理和調度的問題,CPU的加速任務直接卸載給加速卡即可。而目前正在興起的FPGA云平臺場景,是在一個FPGA盤柜內部署多張板卡,資源管理平臺根據當前FPGA資源的使用和占用情況,按需分配即可。
現有的解決方案在目前FPGA加速卡的規模不大以及所有資源都在一個機柜內或者都是通過一個網絡交換機進行數據交換的場景下是合適的。但是隨著FPGA加速卡數量的不斷增加以及數據中心地理位置的改變,成千上萬塊的板卡部署在不同的盤柜,不同的機房會有不同程度的網絡延時,使用FPGA進行加速就是期望能更快的得到計算結果,如果在計算能力相同的情況下,用戶肯定希望能選擇網絡傳輸延時最小的加速卡進行加速任務,以得到最好的加速效果。
發明內容
本發明的目的是提供一種FPGA云平臺加速資源的分配方法與系統,旨在解決現有技術中FPGA加速卡數量眾多造成網絡延時不一,導致加速效果差的問題,實現保證分配給用戶的板卡的網絡延時最小,達到最優的加速效果,提升用戶體驗。
為達到上述技術目的,本發明提供了一種FPGA云平臺加速資源的分配方法,所述方法包括以下步驟:
S1、用戶請求使用FPGA加速卡,向云監控管理平臺發起分配資源的請求;
S2、云監控管理平臺通知虛擬機以廣播的方式發送只用于測試延時的數據包;
S3、資源池內的FPGA加速卡識別該數據包,并反饋FPGA標識信息至發起廣播數據包的虛擬機;
S4、虛擬機將反饋的FPGA標識信息按順序寫入內存緩存中,將最先回應的反饋數據包保存至隊列的第一個位置,并將其反饋給云監控管理平臺;
S5、云監控管理平臺按照協議解析該反饋數據包,獲取與虛擬機網絡延時最小的FPGA板卡信息,并將其生成授權文件發送給用戶,用戶根據授權文件操作該FPGA板卡。
優選地,所述FPGA標識信息包括虛擬ID以及虛擬物理地址。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910895899.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種深度學習訓練任務的工作方法及裝置
- 下一篇:混合內存動態調度方法及系統





