[發(fā)明專利]一種提高CPU+GPU異構(gòu)裝置計算性能的方法有效
| 申請?zhí)枺?/td> | 201310028325.6 | 申請日: | 2013-01-24 |
| 公開(公告)號: | CN103049241A | 公開(公告)日: | 2013-04-17 |
| 發(fā)明(設(shè)計)人: | 李清都;胡明;楊芳艷;唐宋;馮鑫;胡詩沂;徐桂蘭 | 申請(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號: | G06F7/523 | 分類號: | G06F7/523;G06F9/38;G06F17/14 |
| 代理公司: | 重慶華科專利事務(wù)所 50123 | 代理人: | 康海燕 |
| 地址: | 400065 *** | 國省代碼: | 重慶;85 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 提高 cpu gpu 裝置 計算 性能 方法 | ||
1.一種提高CPU+GPU異構(gòu)裝置計算性能的方法,其特征在于,包括步驟:CPU端接收輸入的M對N位被乘數(shù)和乘數(shù),將所有被乘數(shù)和乘數(shù)按照順序分別組成一個一維數(shù)組,保存并標識被乘數(shù)和乘數(shù);CPU端作為控制器為GPU端分配全局存儲器空間和線程塊共享存儲空間,為GPU端設(shè)定網(wǎng)格結(jié)構(gòu),即線程塊位數(shù)和線程位數(shù),以及將所有的乘數(shù)與被乘數(shù)分批異步傳輸至GPU全局存儲器;啟動GPU,GPU端作為處理器:在GPU中,將全局存儲器中的每對被乘數(shù)和乘數(shù)分別拷貝到每個線程塊,每個線程塊對每對乘法運算執(zhí)行并行處理,得到M對乘法的乘積,GPU將并行處理獲得的乘積寫回全局存儲器;CPU端控制將全局存儲器存儲的數(shù)據(jù)分批異步傳輸至CPU內(nèi)存。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述每個線程塊對每對乘法運算并行處理具體為:將GPU端全局存儲器中的被乘數(shù)和乘數(shù)以原始數(shù)據(jù)位數(shù)分段進行切割,將切割的一對被乘數(shù)和乘數(shù)放入一個線程塊共享存儲器上,在每個線程塊內(nèi)部,對共享存儲器上的被乘數(shù)和乘數(shù)進行擴展后FFT變換;對同一線程塊變換后的乘數(shù)和被乘數(shù),各子線程將乘數(shù)和被乘數(shù)對應(yīng)元素相乘,得到的乘積存放于共享存儲器,共享存儲器中的乘積分別在各自的線程塊內(nèi)進行IFFT變換;將IFFT變換后的數(shù)據(jù)進行并行進位處理。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,為GPU端設(shè)定網(wǎng)格結(jié)構(gòu)包括:根據(jù)乘法運算的個數(shù)設(shè)置線程塊的維數(shù)和個數(shù),如線程塊設(shè)置為一維,個數(shù)等于乘法對個數(shù)M;根據(jù)被乘數(shù)和乘數(shù)位數(shù)設(shè)置線程維數(shù)和個數(shù),如線程維數(shù)設(shè)置為一維,線程個數(shù)等于被乘數(shù)和乘數(shù)位數(shù)N。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述進位處理具體為:將取整后的結(jié)果按Ns分段,其中,Ns滿足顯卡線程束的整數(shù)倍,每一段由一個線程負責(zé)進位,每一個線程從各段首元素開始循環(huán)執(zhí)行:保留當(dāng)前元素對所選進制X的余數(shù)并將其倍數(shù)加到下一個元素,令下一個元素為當(dāng)前元素;直到當(dāng)前元素小于X并且循環(huán)次數(shù)不小于每段元素個數(shù)為止。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310028325.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓撲分區(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲介質(zhì)及設(shè)備





