[發明專利]面向GPDSP的大規模高性能Linpack測試基準實現的方法有效
| 申請號: | 201510062079.5 | 申請日: | 2015-02-06 |
| 公開(公告)號: | CN104615516B | 公開(公告)日: | 2019-01-29 |
| 發明(設計)人: | 劉仲;陳書明;郭陽;陳海燕;萬江華;陳磊;田希;孫永節;彭元喜;扈嘯;王耀華;馬勝;陳虎;張軍陽;魯慶男 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06F11/22 | 分類號: | G06F11/22;G06F17/12 |
| 代理公司: | 湖南兆弘專利事務所(普通合伙) 43008 | 代理人: | 周長清 |
| 地址: | 410073 湖南省長沙市硯瓦池正*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 gpdsp 大規模 性能 linpack 測試 基準 實現 方法 | ||
本發明公開了一種面向GPDSP的大規模高性能Linpack測試基準實現的方法,采用分塊的方式來求解稠密線性方程組:較小的串行任務和小矩陣求逆和三角方程求解任務,由GPDSP中的CPU核負責;規整的計算任務由GPDSP中的DSP核負責。本發明具有原理簡單、操作方便、能充分利用GPDSP中DSP核向量處理陣列的強大向量并行計算和高帶寬向量數據加載能力、由CPU核和DSP核協同高效的實現大規模Linpack測試基準計算的優點。
技術領域
本發明主要涉及通用計算數字信號處理器(General-Purpose Digital SignalProcessor,簡稱GPDSP),特指一種適用于GPDSP的大規模高性能Linpack測試基準實現的方法。
背景技術
Linpack測試基準是高性能計算中最廣泛使用的性能測試基準,是TOP500最重要的測試基準。Linpack基準通過求解稠密線性代數方程組,以測試和評價高性能計算機系統的浮點性能。Linpack測試標準包括三個不同數據規模的測試:100×100,1000×1000和n×n,其中前兩個測試所使用的測試基準程序是可以從網站(例如:http://www.netlib.org/benchmark/)下載,編譯運行程序后,該程序會給出相應機器的性能,這種測試不允許對測試程序進行任何修改。n×n數據規模的測試要求是Linpack測試標準中最為寬松的,用戶可以對任意大小的問題規模,使用任意個數的CPU,使用基于高斯消去法的各種優化方法來執行該測試程序,尋求最佳的性能測試結果。HPL(High Performance Linpack)是第一個標準的公開發布的并行Linpack測試軟件包,是n×n測試的MPI實現,可移植于多種體系結構的計算機系統,目前廣泛用于TOP500測試,該測試主要針對分布式存儲的大規模并行計算系統而設計。
在專利申請號為201310725118.6的文獻(處于實審階段)中提供了一種通用計算數字信號處理器(General-Purpose Digital Signal Processor,簡稱GPDSP),它包含CPU核單元和DSP核單元,CPU核單元主要用于包括存儲管理、文件控制、進程調度、中斷管理任務在內的通用事務管理以及提供對通用操作系統的完整支持;DSP核單元包含若干強大計算能力的64位向量處理陣列,用于支持高密集運算任務的解算。由于GPDSP是包含CPU核和DSP核的異構多核處理器,包括寄存器文件、片內向量陣列存儲器、片內共享存儲陣列、片外DDR存儲器等多層次存儲架構,簡單的移植HPL或采用傳統的方法實現的Linpack測試基準,不能夠取得GPDSP最佳的性能測試結果。
發明內容
本發明要解決的技術問題就在于:針對現有技術存在的技術問題,本發明提供一種原理簡單、操作方便、能充分利用GPDSP中DSP核向量處理陣列的強大向量并行計算和高帶寬向量數據加載能力,由CPU核和DSP核協同高效的實現大規模Linpack測試基準計算的方法。
為解決上述技術問題,本發明采用以下技術方案:
一種面向GPDSP的大規模高性能Linpack測試基準實現的方法,采用分塊的方式來求解稠密線性方程組:較小的串行任務和小矩陣求逆和三角方程求解任務,由GPDSP中的CPU核負責;規整的計算任務由GPDSP中的DSP核負責。
作為本發明的進一步改進:具體步驟為:
S1:根據GPDSP的體系結構特征確定最佳的Linpack測試基準的矩陣規模n值和分塊大小NB值;Linpack測試基準求解的稠密線性方程組為Ax=b,其中A為n×n階的非奇異矩陣,x,b為n×1階的向量;
S2:根據上述n值,由GPDSP的CPU核在片外DDR存儲器為矩陣A和向量x,b分配空間,并生成初始化數據;記Linpack計算量為計算GPDSP的峰值性能為F0,記CPU核的當前系統時間為t0;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510062079.5/2.html,轉載請聲明來源鉆瓜專利網。





