[發明專利]一種提高CPU+GPU異構裝置計算性能的方法有效
| 申請號: | 201310028325.6 | 申請日: | 2013-01-24 |
| 公開(公告)號: | CN103049241A | 公開(公告)日: | 2013-04-17 |
| 發明(設計)人: | 李清都;胡明;楊芳艷;唐宋;馮鑫;胡詩沂;徐桂蘭 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06F7/523 | 分類號: | G06F7/523;G06F9/38;G06F17/14 |
| 代理公司: | 重慶華科專利事務所 50123 | 代理人: | 康海燕 |
| 地址: | 400065 *** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提高 cpu gpu 裝置 計算 性能 方法 | ||
技術領域
本發明涉及計算機高性能計算領域,是一種提高CPU+GPU異構裝置計算精度的方法。
背景技術
在數據加密解密、建筑仿真驗證、科研可靠計算等領域,常常用到大規模的多精度數值計算。由于涉及的數值位數,遠大于目前計算機處理器CPU硬件精度(最高只有64bit或128bit),因此需要在硬件精度的基礎上進行擴展。傳統的解決方案主要依靠CPU的串行處理,在計算速度方面受到處理發展的制約,有較大的局限性,已經不能滿足日益增大的計算需求。
因此,利用GPU配合CPU進行大規模數據處理也逐漸出現,如:2012年5月30日授權的中國發明專利申請第200910088372.3所提出的基于GPU眾核平臺的矩陣并行轉置方法,其基本思路是根據矩陣轉置后的模型建立的索引,利用GPU多個線程并行工作,對二維矩陣每個元素同時轉置,降低了傳統遍歷整個矩陣轉置的時間。2011年9月28日授權的中國發明專利申請第201010107317.7所提出的實現GPU運算提高DR圖像處理速度的方法,其基本思想是讀取原始醫學圖像數據,用圖像邊緣像素對原始醫學圖像進行擴展和補齊,通過CUDA函數庫對擴展和補齊的原始醫學圖像數據以及卷積核進行FFT變換和變換后矩陣乘法加速,提出了一種簡易、低成本的醫學影像處理方法。2012年3月21日授權的中國發明專利申請200910226769.4所提出的利用CPU和GPU協同工作對三角線性方程組求解的加速方法,技術方案是根據三角線性方程組A×X=α×B,為了提高A-1×B求解速度,將B矩陣按照切割比例K切割成B1和B2,使CPU和GPU分別并行計算A-1×B1和A-1×B2,實現CPU和GPU重疊計算,達到良好的負載平衡效果。
綜上所述,CPU+GPU協作處理,可大幅度提高工作速度,是未來的計算設備的發展趨勢。本專利所解決的問題是提高CPU+GPU異構裝置計算精度,加速海量數據的多精度乘法運算,而這些研究目前未見到相關文獻報道。
發明內容
本發明要解決的問題在于:針對現有技術平臺計算速度等問題,本發明提出一種基于CPU+GPU異構裝置,實現計算單元與相關存儲器的合理分配與調度,解決大規模乘法計算精度和高效并行地處理最終結果的問題。
本發明解決上述技術問題的技術方案是,提出一種提高CPU+GPU異構裝置計算精度的方法,發明內容如下:
CPU端接收M對N位被乘數和乘數輸入并保存,M個被乘數分別標識為A1、A2……AM,M個乘數分別標識為B1、B2……BM;在CPU端控制流程包括GPU端空間分配、線程塊模型設定、數據傳輸、啟動和停止:⑴根據CPU端被乘數和乘數大小設定GPU端接收被乘數和乘數空間DA和DB;⑵根據乘法運算的個數設置線程塊的個數和維數,根據被乘數和乘數位數設置線程個數和位數,在此我們設定線程塊個數等于乘法運算的個數M,線程數等于被乘數和乘數位數N;⑶同時,為了提高運行速度,使用GPU端線程塊的共享存儲器,即在CPU端為GPU端每個線程開辟原始數據大小2倍的復數組共享存儲區域;⑷CPU將所有的乘數與被乘數通過PCI總線分批異步傳輸至GPU全局存儲器;⑸準備完成,啟動GPU端,使GPU完成乘法對運算;啟動GPU端后,GPU作為處理器,在GPU中,每個線程塊負責一對乘法運算,同時每個線程塊對單個乘法運算執行并行處理,GPU將并行處理獲得的數據寫回全局存儲器;最后CPU端將全局存儲器中的結果分批異步傳輸至CPU內存。因為每個線程塊獨立完成一個乘法運算,通過大量的線程塊并行工作,就能實現大規模乘法運算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310028325.6/2.html,轉載請聲明來源鉆瓜專利網。





