[發(fā)明專利]基于GPU的GRAPES系統(tǒng)優(yōu)化方法、系統(tǒng)、介質(zhì)及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202011279755.1 | 申請(qǐng)日: | 2020-11-16 |
| 公開(kāi)(公告)號(hào): | CN112486671A | 公開(kāi)(公告)日: | 2021-03-12 |
| 發(fā)明(設(shè)計(jì))人: | 賈金芳;張琨;嚴(yán)文昕;黃建強(qiáng);王曉英 | 申請(qǐng)(專利權(quán))人: | 青海大學(xué) |
| 主分類號(hào): | G06F9/50 | 分類號(hào): | G06F9/50;G01W1/00 |
| 代理公司: | 北京輕創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 11212 | 代理人: | 厲洋洋 |
| 地址: | 810016 青*** | 國(guó)省代碼: | 青海;63 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 gpu grapes 系統(tǒng) 優(yōu)化 方法 介質(zhì) 設(shè)備 | ||
本發(fā)明涉及一種基于GPU的GRAPES系統(tǒng)優(yōu)化方法、系統(tǒng)、介質(zhì)及設(shè)備。方法包括:進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換以及存儲(chǔ)空間開(kāi)辟的數(shù)據(jù)初始化;利用CUDA將所述廣義共軛余差法的計(jì)算流程進(jìn)行GPU移植,對(duì)于計(jì)算流程中能進(jìn)行并行處理的,在GPU中采用多線程并行處理,計(jì)算過(guò)程中利用顯存進(jìn)行通信,且中間變量均保存在GPU上;對(duì)于計(jì)算流程中不能并行處理的,將前置數(shù)據(jù)拷回CPU端進(jìn)行計(jì)算,再將計(jì)算結(jié)果拷回GPU端。本發(fā)明實(shí)施例將計(jì)算流程進(jìn)行GPU移植,能進(jìn)行并行處理的,在GPU中采用多線程并行處理,計(jì)算過(guò)程中利用顯存進(jìn)行通信,且中間變量均保存在GPU上,避免了和CPU端進(jìn)行頻繁的數(shù)據(jù)傳輸,減少了GPU與CPU之間的數(shù)據(jù)傳輸開(kāi)銷,提升了程序的整體性能。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)信息技術(shù)領(lǐng)域,尤其涉及一種基于GPU的GRAPES系統(tǒng)優(yōu)化方法、系統(tǒng)、介質(zhì)及設(shè)備。
背景技術(shù)
二十一世紀(jì)初期,我國(guó)氣象學(xué)家為改善天氣預(yù)報(bào)模式的性能和滿足人民日益增加的對(duì)天氣預(yù)報(bào)精度的需求,開(kāi)始對(duì)我國(guó)新一代數(shù)值天氣預(yù)報(bào)系統(tǒng)(GRAPES)進(jìn)行自主研究。GRAPES動(dòng)力框架的計(jì)算核心是赫姆霍茲方程的求解,該方程是原始大氣方程組經(jīng)過(guò)一系列離散化處理之后形成的大規(guī)模稀疏線性方程組。目前對(duì)線性方程組的求解方法主要有兩種,分別是直接法和迭代法。由于計(jì)算機(jī)硬件條件的限制使用直接法并不能完成有效求解。而迭代法具有硬件存儲(chǔ)空間要求較小,原始矩陣在計(jì)算過(guò)程中保持不變等優(yōu)點(diǎn),所以在求解大規(guī)模稀疏線性方程組的方法選擇上主要采用迭代法。GRAPES數(shù)值天氣預(yù)報(bào)系統(tǒng)目前采用的迭代法為廣義共軛余差法(GCR)。
當(dāng)前赫姆霍茲方程的求解優(yōu)化工作在CPU方面較多。CPU并行技術(shù)主要采用MPI和OpenMP。MPI是消息傳遞模型,多用于多節(jié)點(diǎn)設(shè)備,MPI在求解赫姆霍茲方程中的運(yùn)用主要通過(guò)將算法的不同計(jì)算任務(wù)劃分至不同進(jìn)程中,不同進(jìn)程并行執(zhí)行任務(wù)。廣義共軛余差算法的計(jì)算內(nèi)容主要有稀疏矩陣向量乘、向量?jī)?nèi)積、向量數(shù)乘。這些計(jì)算核心分布在不同的迭代過(guò)程中,且都具有一定的并行度,所以可以較好地進(jìn)行MPI進(jìn)程任務(wù)分配。MPI并行優(yōu)化的缺陷主要在通信開(kāi)銷部分,隨著進(jìn)程數(shù)量的增加,進(jìn)程之間的通信開(kāi)銷也會(huì)隨之增加,從而限制MPI并行優(yōu)化的整體性能。OpenMP并行技術(shù)屬于共享內(nèi)存模型,與MPI程序相比,OpenMP主要利用共享內(nèi)存進(jìn)行數(shù)據(jù)通信,可以減少一部分通信開(kāi)銷。MPI+OpenMP混合并行技術(shù)雖然能夠提升一定的求解速度,但計(jì)算性能仍然有待提高。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是針對(duì)現(xiàn)有技術(shù)存在的問(wèn)題,提供一種基于GPU的GRAPES系統(tǒng)優(yōu)化方法、系統(tǒng)、介質(zhì)及設(shè)備。
為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供一種基于GPU的GRAPES系統(tǒng)優(yōu)化方法,其中,基于廣義共軛余差法求解赫姆霍茲方程的優(yōu)化過(guò)程包括:
進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換以及存儲(chǔ)空間開(kāi)辟的數(shù)據(jù)初始化;
利用CUDA將所述廣義共軛余差法的計(jì)算流程進(jìn)行GPU移植;
對(duì)于計(jì)算流程中能進(jìn)行并行處理的,在GPU中采用多線程并行處理,計(jì)算過(guò)程中利用顯存進(jìn)行通信,且中間變量均保存在GPU上;
對(duì)于計(jì)算流程中不能并行處理的,將前置數(shù)據(jù)拷回CPU端進(jìn)行計(jì)算,再將計(jì)算結(jié)果拷回GPU端。
為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例還提供一種基于GPU的GRAPES系統(tǒng)優(yōu)化系統(tǒng),所述系統(tǒng)包括:
數(shù)據(jù)初始化模塊,用于進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換以及存儲(chǔ)空間開(kāi)辟的數(shù)據(jù)初始化;
GPU移植模塊,用于利用CUDA將所述廣義共軛余差法的計(jì)算流程進(jìn)行GPU移植;
GPU計(jì)算模塊,對(duì)于計(jì)算流程中能進(jìn)行并行處理的,在GPU中采用多線程并行處理,計(jì)算過(guò)程中利用顯存進(jìn)行通信,且中間變量均保存在GPU上;
CPU計(jì)算模塊,對(duì)于不能并行處理的,將前置數(shù)據(jù)拷回CPU端進(jìn)行計(jì)算,再將計(jì)算結(jié)果拷回GPU端。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青海大學(xué),未經(jīng)青海大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011279755.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲(chǔ)介質(zhì)及設(shè)備
- 基于蓄水容量曲線和TOPMODEL的流域水文模型的設(shè)計(jì)方法
- 一種基于北斗定位的單點(diǎn)氣象要素確定方法
- 基于并行超算網(wǎng)格云平臺(tái)的GRAPES系統(tǒng)優(yōu)化方法
- 一種地面觀測(cè)站氣壓要素的數(shù)據(jù)質(zhì)量評(píng)估方法和系統(tǒng)
- 一種地面觀測(cè)站氣溫要素的數(shù)據(jù)質(zhì)量評(píng)估方法和系統(tǒng)
- 基于多模式集成的降水預(yù)報(bào)方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)
- 全球中期數(shù)值預(yù)報(bào)GRAPES_GFS方法
- 一種GRAPES區(qū)域集合預(yù)報(bào)檢驗(yàn)顯示系統(tǒng)及顯示方法
- 基于GPU的GRAPES系統(tǒng)優(yōu)化方法、系統(tǒng)、介質(zhì)及設(shè)備
- 一種雷暴短臨預(yù)報(bào)方法、系統(tǒng)及終端





