[發明專利]基于數據流的硬件加速方法及系統有效
| 申請號: | 201710016921.0 | 申請日: | 2017-01-11 |
| 公開(公告)號: | CN106776044B | 公開(公告)日: | 2020-02-04 |
| 發明(設計)人: | 牛昕宇 | 申請(專利權)人: | 深圳鯤云信息科技有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50 |
| 代理公司: | 31219 上海光華專利事務所(普通合伙) | 代理人: | 徐秋平 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 硬件加速 方法 系統 硬件 加速器 執行 | ||
1.一種基于數據流的硬件加速方法,其特征在于,所述硬件包括多個通信連接的硬件計算節點,每個所述硬件計算節點的計算任務由至少一個計算模塊完成,所述方法包括:
實時監控各個所述硬件計算節點的使用情況;
當監測到出現資源空閑的硬件計算節點時,利用性能模型估測拓展重構成本以及重構后獲得性能收益;所述性能模型為:
其中,rtb(r,v)表示從狀態r拓展至狀態v的性能提升,在狀態r,讀取目標計算節點的計算結果,形成重構的硬件計算節點,轉換至狀態v;表示由于計算資源的提升所帶來的計算時間的降低,pi為節點i中可支持的并行計算模塊;dpi為每個計算模塊的內部并行度;freqi為計算模塊的時鐘頻率;rc(r,v)表示估算的拓展重構成本;wli(r)為在狀態r分配的計算量,wli(v)為在狀態v分配的計算量;
如果性能提升rtb(r,v)大于零,則進行計算擴展,從而將目標計算節點拓展到資源空閑的硬件計算節點;所述計算擴展的實現過程包括:
獲取每個所述硬件計算節點的計算任務量,及其含有的計算模塊的并行計算信息,據以計算每個所述硬件計算節點完成各自的計算任務量的計算時間;
按照每個所述硬件計算節點在各自的約束條件下計算時間最短的原則,將每個所述硬件計算節點優化成各定制硬件模塊,其中,各自的所述約束條件由硬件計算節點的資源配置確定;
當檢測到存在資源空閑的硬件計算節點時,將一所述定制硬件模塊的相關配置信息載入其中,從而形成重構的硬件計算節點,所述重構的硬件計算節點通過其接口將計算結果傳遞至其他硬件計算節點來完成計算拓展。
2.根據權利要求1所述的基于數據流的硬件加速方法,其特征在于,重構的硬件計算節點之間采用異步通信的方式進行數據交互。
3.根據權利要求2所述的基于數據流的硬件加速方法,其特征在于,所述計算任務包括循環計算,且在重構后為每個硬件計算節點重新分配wli的計算任務量,所述異步通信的方式通過以下數學模型實現:
其中,tai→j表示硬件計算節點i傳輸到硬件計算節點j的數據抵達時間,tcj為硬件計算節點j本地的調度延時,pj*dpj為硬件計算節點j的計算速度,為硬件計算節點j使用上個循環使用硬件計算節點i傳輸計算結果的時間,為硬件計算節點j下個循環需要硬件計算節點i傳輸的計算結果的時間;tdi為數據抵達目標節點后數據更新延時;pj為節點j中可支持的并行計算模塊;dpj為每個計算模塊的內部并行度。
4.根據權利要求3所述的基于數據流的硬件加速方法,其特征在于,還包括:
根據下個循環所需要的最晚傳輸結果時間調節各硬件計算節點的本地調度延時;
根據上個循環所需要的最早傳輸結果時間調節各硬件計算節點的本地調度td。
5.根據權利要求1所述的基于數據流的硬件加速方法,其特征在于,所述約束條件包括以下方式中的一種或多種組合:
方式1)每個時鐘處理數據所消耗的邏輯資源和接口消耗的邏輯資源之和不超過所述硬件計算節點所含有的總邏輯資源;
方式2)每個時鐘處理數據所消耗的存儲資源和接口消耗的存儲資源之和不超過所述硬件計算節點所含有的總存儲資源;
方式3)所述硬件計算節點在計算過程中所消耗的帶寬資源不大于預設值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳鯤云信息科技有限公司,未經深圳鯤云信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710016921.0/1.html,轉載請聲明來源鉆瓜專利網。





