[發明專利]一種基于CUDA的Gridding算法優化方法及裝置在審
| 申請號: | 201910344869.0 | 申請日: | 2019-04-26 |
| 公開(公告)號: | CN110187962A | 公開(公告)日: | 2019-08-30 |
| 發明(設計)人: | 胡馨藝;趙亞群;趙志誠 | 申請(專利權)人: | 中國人民解放軍戰略支援部隊信息工程大學 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06T1/20 |
| 代理公司: | 鄭州大通專利商標代理有限公司 41111 | 代理人: | 陳勇 |
| 地址: | 450000 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 算法優化 并行化 算法 矩陣 輸入輸出數據 并行化處理 比較模塊 函數調用 運行效率 矢量化 調用 運算 | ||
1.一種基于CUDA的Gridding算法優化方法,其特征在于,包括:
步驟1:根據Gridding算法中函數調用次數,得出調用次數最高的前M個函數;
步驟2:通過矩陣矢量化方法,在CUDA中對所述M個函數進行GPU并行化處理。
2.根據權利要求1所述的一種基于CUDA的Gridding算法優化方法,其特征在于,在所述步驟1之后,還包括:
在CUDA中實現基于GPU的Gridding算法,替換ARL算法庫中的Gridding算法。
3.根據權利要求1所述的一種基于CUDA的Gridding算法優化方法,其特征在于,所述步驟2包括:
步驟2.1:對需要進行GPU并行化處理的所述M個函數,在顯存上分配數組;
步驟2.2:將需處理的數據從內存傳輸到顯存;
步驟2.3:劃分塊和線程,確定線程結構;
步驟2.4:執行核函數,所述核函數包括初始化GCF函數和GPU下的Gridding算法;
步驟2.5:將執行結果從顯存復制回內存。
4.一種基于CUDA的Gridding算法優化裝置,其特征在于,包括:
比較模塊,用于根據Gridding算法中函數調用次數,得出調用次數最高的前M個函數;
并行化模塊,用于在CUDA中對所述M個函數進行GPU并行化處理。
5.根據權利要求4所述的一種基于CUDA的Gridding算法優化裝置,其特征在于,還包括:
替換模塊,用于在CUDA中實現基于GPU的Gridding算法,替換ARL算法庫中的Gridding算法。
6.根據權利要求4所述的一種基于CUDA的Gridding算法優化裝置,其特征在于,所述并行化模塊包括:
分配子模塊,用于對需要進行GPU并行化處理的所述M個函數,在顯存上分配數組;
傳輸子模塊,用于將需處理的數據從內存傳輸到顯存;
劃分子模塊,用于劃分塊和線程,確定線程結構;
執行子模塊,用于執行核函數,所述核函數包括初始化GCF函數和GPU下的Gridding算法;
復制子模塊,用于將執行結果從顯存復制回內存。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍戰略支援部隊信息工程大學,未經中國人民解放軍戰略支援部隊信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910344869.0/1.html,轉載請聲明來源鉆瓜專利網。





