[發(fā)明專利]基于GPU的GRAPES系統(tǒng)優(yōu)化方法、系統(tǒng)、介質(zhì)及設(shè)備在審
| 申請?zhí)枺?/td> | 202011279755.1 | 申請日: | 2020-11-16 |
| 公開(公告)號: | CN112486671A | 公開(公告)日: | 2021-03-12 |
| 發(fā)明(設(shè)計(jì))人: | 賈金芳;張琨;嚴(yán)文昕;黃建強(qiáng);王曉英 | 申請(專利權(quán))人: | 青海大學(xué) |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G01W1/00 |
| 代理公司: | 北京輕創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 11212 | 代理人: | 厲洋洋 |
| 地址: | 810016 青*** | 國省代碼: | 青海;63 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 gpu grapes 系統(tǒng) 優(yōu)化 方法 介質(zhì) 設(shè)備 | ||
1.一種基于GPU的GRAPES系統(tǒng)優(yōu)化方法,其特征在于,其中,基于廣義共軛余差法求解赫姆霍茲方程的優(yōu)化過程包括:
進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換以及存儲(chǔ)空間開辟的數(shù)據(jù)初始化;
利用CUDA將所述廣義共軛余差法的計(jì)算流程進(jìn)行GPU移植;
對于計(jì)算流程中能進(jìn)行并行處理的,在GPU中采用多線程并行處理,計(jì)算過程中利用顯存進(jìn)行通信,且中間變量均保存在GPU上;
對于計(jì)算流程中不能并行處理的,將前置數(shù)據(jù)拷回CPU端進(jìn)行計(jì)算,再將計(jì)算結(jié)果拷回GPU端。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換以及存儲(chǔ)空間開辟的數(shù)據(jù)初始化,包括:
將待求解模型Ax=b中的系數(shù)矩陣A由原始的三維格式轉(zhuǎn)換為二維格式,其中,初始數(shù)據(jù)包括系數(shù)矩陣A、初始解向量x0和右端向量b;
為廣義共軛余差法中的矩陣數(shù)據(jù)、向量數(shù)據(jù)和常量數(shù)據(jù)在CPU端及GPU端分配內(nèi)存空間。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將求解模型Ax=b中的系數(shù)矩陣A由原始的三維格式轉(zhuǎn)換為二維格式,包括:
邊界條件使用循環(huán)和軸對稱方式處理,經(jīng)度方向?yàn)檠h(huán)方式,緯度方向?yàn)檩S對稱方式,垂直方向不處理。
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,所述對于計(jì)算流程中能進(jìn)行并行處理的,在GPU中采用多線程并行處理時(shí),在進(jìn)行收斂情況判斷時(shí)將需要判斷的數(shù)據(jù)傳輸給CPU,在數(shù)據(jù)傳輸時(shí)為數(shù)據(jù)交換頻率大于預(yù)設(shè)頻率的變量分配頁鎖定內(nèi)存。
5.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,所述對于計(jì)算流程中能進(jìn)行并行處理的,在GPU中采用多線程并行處理時(shí),還包括:GPU訪存優(yōu)化和/或GPU存儲(chǔ)器優(yōu)化;
所述GPU訪存優(yōu)化包括:利用CSR格式存儲(chǔ)矩陣數(shù)據(jù),利用CUDA進(jìn)行線程塊間及線程塊內(nèi)兩級并行訪問;
所述GPU存儲(chǔ)器優(yōu)化包括:對于只需要一個(gè)線程塊中的線程訪問的數(shù)據(jù),在線程塊內(nèi)部利用共享存儲(chǔ)器進(jìn)行保存。
6.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,所述利用CUDA將所述廣義共軛余差法的計(jì)算流程進(jìn)行GPU移植之前,還包括:通過構(gòu)建預(yù)條件子對所述系數(shù)矩陣A進(jìn)行分解預(yù)處理。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述通過構(gòu)建預(yù)條件子對所述系數(shù)矩陣A進(jìn)行分解預(yù)處理,包括:
通過ILU預(yù)處理操作將原始系數(shù)矩陣A分解為一個(gè)下三角矩陣L和上三角矩陣U,分解出來的三角矩陣直接保存在待分解的矩陣空間內(nèi)。
8.一種基于GPU的GRAPES系統(tǒng)優(yōu)化系統(tǒng),其特征在于,實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的基于GPU的GRAPES系統(tǒng)優(yōu)化方法,所述系統(tǒng)包括:
數(shù)據(jù)初始化模塊,用于進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換以及存儲(chǔ)空間開辟的數(shù)據(jù)初始化;
GPU移植模塊,用于利用CUDA將所述廣義共軛余差法的計(jì)算流程進(jìn)行GPU移植;
GPU計(jì)算模塊,對于計(jì)算流程中能進(jìn)行并行處理的,在GPU中采用多線程并行處理,計(jì)算過程中利用顯存進(jìn)行通信,且中間變量均保存在GPU上;
CPU計(jì)算模塊,對于計(jì)算流程中不能并行處理的,將前置數(shù)據(jù)拷回CPU端進(jìn)行計(jì)算,再將計(jì)算結(jié)果拷回GPU端。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括指令,其特征在于,當(dāng)所述指令在計(jì)算機(jī)上運(yùn)行時(shí),使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1至7任一項(xiàng)所述的基于GPU的GRAPES系統(tǒng)優(yōu)化方法。
10.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、CPU、GPU及存儲(chǔ)在所述存儲(chǔ)器上的并可在所述CPU和GPU上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述CPU和GPU執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的基于GPU的GRAPES系統(tǒng)優(yōu)化方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青海大學(xué),未經(jīng)青海大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011279755.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲(chǔ)介質(zhì)及設(shè)備
- 基于蓄水容量曲線和TOPMODEL的流域水文模型的設(shè)計(jì)方法
- 一種基于北斗定位的單點(diǎn)氣象要素確定方法
- 基于并行超算網(wǎng)格云平臺(tái)的GRAPES系統(tǒng)優(yōu)化方法
- 一種地面觀測站氣壓要素的數(shù)據(jù)質(zhì)量評估方法和系統(tǒng)
- 一種地面觀測站氣溫要素的數(shù)據(jù)質(zhì)量評估方法和系統(tǒng)
- 基于多模式集成的降水預(yù)報(bào)方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)
- 全球中期數(shù)值預(yù)報(bào)GRAPES_GFS方法
- 一種GRAPES區(qū)域集合預(yù)報(bào)檢驗(yàn)顯示系統(tǒng)及顯示方法
- 基于GPU的GRAPES系統(tǒng)優(yōu)化方法、系統(tǒng)、介質(zhì)及設(shè)備
- 一種雷暴短臨預(yù)報(bào)方法、系統(tǒng)及終端





