[發(fā)明專利]一種基于CUDA的Gridding算法優(yōu)化方法及裝置在審
| 申請?zhí)枺?/td> | 201910344869.0 | 申請日: | 2019-04-26 |
| 公開(公告)號(hào): | CN110187962A | 公開(公告)日: | 2019-08-30 |
| 發(fā)明(設(shè)計(jì))人: | 胡馨藝;趙亞群;趙志誠 | 申請(專利權(quán))人: | 中國人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué) |
| 主分類號(hào): | G06F9/50 | 分類號(hào): | G06F9/50;G06T1/20 |
| 代理公司: | 鄭州大通專利商標(biāo)代理有限公司 41111 | 代理人: | 陳勇 |
| 地址: | 450000 河*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 算法優(yōu)化 并行化 算法 矩陣 輸入輸出數(shù)據(jù) 并行化處理 比較模塊 函數(shù)調(diào)用 運(yùn)行效率 矢量化 調(diào)用 運(yùn)算 | ||
本發(fā)明涉及并行化技術(shù)領(lǐng)域,公開一種基于CUDA的Gridding算法優(yōu)化方法,包括:步驟1:根據(jù)Gridding算法中函數(shù)調(diào)用次數(shù),得出調(diào)用次數(shù)最高的前M個(gè)函數(shù);步驟2:通過矩陣矢量化方法,在CUDA中對所述M個(gè)函數(shù)進(jìn)行GPU并行化處理。本發(fā)明還公開一種基于CUDA的Gridding算法優(yōu)化裝置,包括:比較模塊和并行化模塊。本發(fā)明縮短了Gridding算法整體的運(yùn)算時(shí)間,提高了運(yùn)行效率,且不影響輸入輸出數(shù)據(jù)的格式和大小。
技術(shù)領(lǐng)域
本發(fā)明涉及并行化技術(shù)領(lǐng)域,特別涉及一種基于CUDA的Gridding算法優(yōu)化方法及裝置。
背景技術(shù)
天文學(xué)數(shù)據(jù)不管是在數(shù)據(jù)量,數(shù)據(jù)的復(fù)雜度還是數(shù)據(jù)增長的速度上都在以非常驚人的速度增長。在過去的幾十年里,研發(fā)的射電望遠(yuǎn)鏡在靈敏度、數(shù)據(jù)的質(zhì)量以及圖像分辨率方面都有很大的提升,望遠(yuǎn)鏡采集數(shù)據(jù)的速率非常大。SKA作為世界上最大綜合孔徑射電望遠(yuǎn)鏡,每秒采集的數(shù)據(jù)量計(jì)劃大于12Tb,相當(dāng)于2013年底中國互聯(lián)網(wǎng)國際出口帶寬的3.5倍,相當(dāng)于谷歌每年數(shù)據(jù)量的30倍。這樣的科學(xué)數(shù)據(jù)處理需要百億億次級(jí)別的超級(jí)計(jì)算機(jī)來完成,這個(gè)處理速度相當(dāng)于目前全球最快超級(jí)計(jì)算機(jī)天河2號(hào)性能的52倍,由于其本身對實(shí)時(shí)性有嚴(yán)格的要求,所以計(jì)算能力方面將面臨一個(gè)巨大的挑戰(zhàn)。就目前來說對計(jì)算能力以及處理速度在不斷地提高,通過傳統(tǒng)的提高CPU主頻來提高處理能力上受到集成電路的種種限制,在這種情況下,多核處理器應(yīng)運(yùn)而生并逐漸成為主流。目前,新集群采用多核解決面臨的計(jì)算問題。因此多核的CPU和多核加速器(如GPU、Cell/BE等)成為解決大量時(shí)效性數(shù)據(jù)的趨勢。
在天文成像過程中,網(wǎng)格化(Gridding)和去網(wǎng)格化(Degridding)是最耗時(shí)的兩個(gè)操作。如果處理的數(shù)據(jù)是EB量級(jí)或以上時(shí),消耗的時(shí)間非常多不能通過調(diào)整計(jì)算機(jī)的性能來緩和。目前來說并行化算法是提高計(jì)算速度的一個(gè)重要途徑,也是射電天文數(shù)據(jù)處理的主要方式。傳統(tǒng)的網(wǎng)格化一般都是在CPU上運(yùn)行,使得加速器在每一個(gè)浮點(diǎn)上的帶寬變得很小,應(yīng)用的時(shí)效性降低。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有的網(wǎng)格化算法應(yīng)用時(shí)效性低的問題,提出了一種基于CUDA的Gridding算法優(yōu)化方法及裝置。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
一種基于CUDA的Gridding算法優(yōu)化方法,包括:
步驟1:根據(jù)Gridding算法中函數(shù)調(diào)用次數(shù),得出調(diào)用次數(shù)最高的前M個(gè)函數(shù);
步驟2:通過矩陣矢量化方法,在CUDA中對所述M個(gè)函數(shù)進(jìn)行GPU并行化處理。
進(jìn)一步地,在所述步驟1之后,還包括:
在CUDA中實(shí)現(xiàn)基于GPU的Gridding算法,替換ARL算法庫中的Gridding算法。
進(jìn)一步地,所述步驟2包括:
步驟2.1:對需要進(jìn)行GPU并行化處理的所述M個(gè)函數(shù),在顯存上分配數(shù)組;
步驟2.2:將需處理的數(shù)據(jù)從內(nèi)存?zhèn)鬏數(shù)斤@存;
步驟2.3:劃分塊和線程,確定線程結(jié)構(gòu);
步驟2.4:執(zhí)行核函數(shù),所述核函數(shù)包括初始化GCF函數(shù)和GPU下的Gridding算法;
步驟2.5:將執(zhí)行結(jié)果從顯存復(fù)制回內(nèi)存。
一種基于CUDA的Gridding算法優(yōu)化裝置,包括:
比較模塊,用于根據(jù)Gridding算法中函數(shù)調(diào)用次數(shù),得出調(diào)用次數(shù)最高的前M個(gè)函數(shù);
并行化模塊,用于在CUDA中對所述M個(gè)函數(shù)進(jìn)行GPU并行化處理。
進(jìn)一步地,還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué),未經(jīng)中國人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910344869.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 無線網(wǎng)絡(luò)切換優(yōu)化系統(tǒng)及方法
- 一種微電網(wǎng)調(diào)度決策方法及系統(tǒng)
- 一種生產(chǎn)線的快速定制設(shè)計(jì)服務(wù)系統(tǒng)
- 一種基于繁殖粒子群算法的火電廠負(fù)荷優(yōu)化分配方法
- 一種優(yōu)化算法的通用建模方法及系統(tǒng)
- 一種基于頭腦風(fēng)暴優(yōu)化算法的中文網(wǎng)頁分類方法
- 一種配電網(wǎng)自優(yōu)化自學(xué)習(xí)無功優(yōu)化控制方法
- 電網(wǎng)無功優(yōu)化方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種船舶內(nèi)殼板材優(yōu)化設(shè)計(jì)方法
- 圖像優(yōu)化方法及裝置、攝像終端
- 用戶指導(dǎo)的程序半自動(dòng)并行化方法
- 面向遙感圖像處理算法的快速并行化編程模板方法
- 自動(dòng)并行化多級(jí)并行代價(jià)評(píng)估方法
- 一種基于FPGA的雷達(dá)成像并行化方法
- 基于嵌入式GPU系統(tǒng)的并行化語音識(shí)別系統(tǒng)及方法
- 基于SIMD擴(kuò)展部件的嵌套循環(huán)向量并行的實(shí)現(xiàn)方法及其裝置
- 一種適用于指導(dǎo)關(guān)聯(lián)算法并行化的分析方法、系統(tǒng)及裝置
- 多棒燃料元件并行性能分析方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 一種基于圖像處理器加速的符號(hào)執(zhí)行方法及系統(tǒng)
- 一種分布式模型搜索方法及系統(tǒng)
- 在集成電路器件中求解線性矩陣
- 矩陣計(jì)算裝置、矩陣計(jì)算方法
- 一種數(shù)據(jù)聚類的方法、裝置及Spark大數(shù)據(jù)平臺(tái)
- 適用于黑白圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 矩陣
- 矩陣/密鑰生成裝置、矩陣/密鑰生成系統(tǒng)、矩陣結(jié)合裝置、矩陣/密鑰生成方法、程序
- 矩陣運(yùn)算電路、矩陣運(yùn)算裝置及矩陣運(yùn)算方法
- 矩陣乘法計(jì)算方法和裝置
- 數(shù)據(jù)讀取方法、裝置、介質(zhì)和計(jì)算設(shè)備





