[發(fā)明專利]基于GPU的GRAPES系統(tǒng)優(yōu)化方法、系統(tǒng)、介質(zhì)及設(shè)備在審

申請?zhí)枺?/td>	202011279755.1	申請日：	2020-11-16
公開（公告）號：	CN112486671A	公開（公告）日：	2021-03-12
發(fā)明（設(shè)計(jì)）人：	賈金芳;張琨;嚴(yán)文昕;黃建強(qiáng);王曉英	申請（專利權(quán)）人：	青海大學(xué)
主分類號：	G06F9/50	分類號：	G06F9/50;G01W1/00
代理公司：	北京輕創(chuàng)知識(shí)產(chǎn)權(quán)代理有限公司 11212	代理人：	厲洋洋
地址：	810016 青***	國省代碼：	青海;63
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于 gpu grapes 系統(tǒng) 優(yōu)化方法介質(zhì) 設(shè)備
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種基于GPU的GRAPES系統(tǒng)優(yōu)化方法，其特征在于，其中，基于廣義共軛余差法求解赫姆霍茲方程的優(yōu)化過程包括：

進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換以及存儲(chǔ)空間開辟的數(shù)據(jù)初始化；

利用CUDA將所述廣義共軛余差法的計(jì)算流程進(jìn)行GPU移植；

對于計(jì)算流程中能進(jìn)行并行處理的，在GPU中采用多線程并行處理，計(jì)算過程中利用顯存進(jìn)行通信，且中間變量均保存在GPU上；

對于計(jì)算流程中不能并行處理的，將前置數(shù)據(jù)拷回CPU端進(jìn)行計(jì)算，再將計(jì)算結(jié)果拷回GPU端。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換以及存儲(chǔ)空間開辟的數(shù)據(jù)初始化，包括：

將待求解模型Ax＝b中的系數(shù)矩陣A由原始的三維格式轉(zhuǎn)換為二維格式，其中，初始數(shù)據(jù)包括系數(shù)矩陣A、初始解向量x₀和右端向量b；

為廣義共軛余差法中的矩陣數(shù)據(jù)、向量數(shù)據(jù)和常量數(shù)據(jù)在CPU端及GPU端分配內(nèi)存空間。

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述將求解模型Ax＝b中的系數(shù)矩陣A由原始的三維格式轉(zhuǎn)換為二維格式，包括：

邊界條件使用循環(huán)和軸對稱方式處理，經(jīng)度方向?yàn)檠h(huán)方式，緯度方向?yàn)檩S對稱方式，垂直方向不處理。

4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法，其特征在于，所述對于計(jì)算流程中能進(jìn)行并行處理的，在GPU中采用多線程并行處理時(shí)，在進(jìn)行收斂情況判斷時(shí)將需要判斷的數(shù)據(jù)傳輸給CPU，在數(shù)據(jù)傳輸時(shí)為數(shù)據(jù)交換頻率大于預(yù)設(shè)頻率的變量分配頁鎖定內(nèi)存。

5.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法，其特征在于，所述對于計(jì)算流程中能進(jìn)行并行處理的，在GPU中采用多線程并行處理時(shí)，還包括：GPU訪存優(yōu)化和/或GPU存儲(chǔ)器優(yōu)化；

所述GPU訪存優(yōu)化包括：利用CSR格式存儲(chǔ)矩陣數(shù)據(jù)，利用CUDA進(jìn)行線程塊間及線程塊內(nèi)兩級并行訪問；

所述GPU存儲(chǔ)器優(yōu)化包括：對于只需要一個(gè)線程塊中的線程訪問的數(shù)據(jù)，在線程塊內(nèi)部利用共享存儲(chǔ)器進(jìn)行保存。

6.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法，其特征在于，所述利用CUDA將所述廣義共軛余差法的計(jì)算流程進(jìn)行GPU移植之前，還包括：通過構(gòu)建預(yù)條件子對所述系數(shù)矩陣A進(jìn)行分解預(yù)處理。

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述通過構(gòu)建預(yù)條件子對所述系數(shù)矩陣A進(jìn)行分解預(yù)處理，包括：

通過ILU預(yù)處理操作將原始系數(shù)矩陣A分解為一個(gè)下三角矩陣L和上三角矩陣U，分解出來的三角矩陣直接保存在待分解的矩陣空間內(nèi)。

8.一種基于GPU的GRAPES系統(tǒng)優(yōu)化系統(tǒng)，其特征在于，實(shí)現(xiàn)權(quán)利要求1至7任一項(xiàng)所述的基于GPU的GRAPES系統(tǒng)優(yōu)化方法，所述系統(tǒng)包括：

數(shù)據(jù)初始化模塊，用于進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換以及存儲(chǔ)空間開辟的數(shù)據(jù)初始化；

GPU移植模塊，用于利用CUDA將所述廣義共軛余差法的計(jì)算流程進(jìn)行GPU移植；

GPU計(jì)算模塊，對于計(jì)算流程中能進(jìn)行并行處理的，在GPU中采用多線程并行處理，計(jì)算過程中利用顯存進(jìn)行通信，且中間變量均保存在GPU上；

CPU計(jì)算模塊，對于計(jì)算流程中不能并行處理的，將前置數(shù)據(jù)拷回CPU端進(jìn)行計(jì)算，再將計(jì)算結(jié)果拷回GPU端。

9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，包括指令，其特征在于，當(dāng)所述指令在計(jì)算機(jī)上運(yùn)行時(shí)，使所述計(jì)算機(jī)執(zhí)行根據(jù)權(quán)利要求1至7任一項(xiàng)所述的基于GPU的GRAPES系統(tǒng)優(yōu)化方法。

10.一種計(jì)算機(jī)設(shè)備，包括存儲(chǔ)器、CPU、GPU及存儲(chǔ)在所述存儲(chǔ)器上的并可在所述CPU和GPU上運(yùn)行的計(jì)算機(jī)程序，其特征在于，所述CPU和GPU執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的基于GPU的GRAPES系統(tǒng)優(yōu)化方法。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青海大學(xué)，未經(jīng)青海大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011279755.1/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種用于船舶制造T型鋼的矯正裝置及其使用方法
下一篇：一種四氧化三鈷納米顆粒的制備方法

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F9-00 程序控制裝置，例如，控制器
G06F9-02 .應(yīng)用有線連接的，例如，插頭板
G06F9-04 .應(yīng)用僅含程序指令的記錄載體的
G06F9-06 .應(yīng)用存入的程序的，即應(yīng)用處理設(shè)備的內(nèi)部存儲(chǔ)來接收程序并保持程序的
G06F9-22 ..微控制或微程序裝置
G06F9-30 ..執(zhí)行機(jī)器指令的裝置，例如指令譯碼

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】