[發(fā)明專利]一種自動(dòng)配置GPU擴(kuò)展箱的方法在審

申請?zhí)枺?/td>	202110020022.4	申請日：	2021-01-07
公開（公告）號：	CN112651162A	公開（公告）日：	2021-04-13
發(fā)明（設(shè)計(jì)）人：	黃永	申請（專利權(quán)）人：	中天恒星（上海）科技有限公司
主分類號：	G06F30/23	分類號：	G06F30/23;G06F16/2455;G06F9/50
代理公司：	深圳知幫辦專利代理有限公司 44682	代理人：	顏為華
地址：	200050 上海***	國省代碼：	上海;31
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種自動(dòng) 配置 gpu 擴(kuò)展方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明涉及配置GPU擴(kuò)展箱技術(shù)領(lǐng)域，具體地說，涉及一種自動(dòng)配置GPU擴(kuò)展箱的方法。其方法步驟如下：數(shù)據(jù)流挖掘：采用CUDA計(jì)算模型對數(shù)據(jù)流進(jìn)行挖掘，拓?fù)鋬?yōu)化：采用BESO算法軟刪除的方式實(shí)現(xiàn)單元的增減，并行計(jì)算：在預(yù)處理階段進(jìn)行顯存空間分配，并將計(jì)算模型信息從主機(jī)復(fù)制到設(shè)備，然后采用異步執(zhí)行的方式進(jìn)行數(shù)據(jù)傳輸，數(shù)值檢測：采用二維和三維結(jié)構(gòu)優(yōu)化檢測試精度和計(jì)算效率，本發(fā)明可以在對GPU擴(kuò)展箱與CPU之間配置時(shí)，可以在保證計(jì)算精度的前提下，極大的提高二維和三維拓?fù)鋬?yōu)化問題的計(jì)算效率，配置的準(zhǔn)確性和配置效率高。

技術(shù)領(lǐng)域

本發(fā)明涉及配置GPU擴(kuò)展箱技術(shù)領(lǐng)域，具體地說，涉及一種自動(dòng)配置GPU擴(kuò)展箱的方法。

背景技術(shù)

將多個(gè)GPU集成到一個(gè)擴(kuò)展箱內(nèi)，形成GPU擴(kuò)展箱，從而實(shí)現(xiàn)GPU資源的池化，便于GPU資源的調(diào)度，GPU和CPU之間通過PCIE接口連接的方式就是GPU擴(kuò)展箱的連接拓?fù)洌瑢?shí)際應(yīng)用中，在進(jìn)行GPU配置時(shí)，多GPU設(shè)計(jì)就是會(huì)使服務(wù)器變得比較龐大，而且和其他標(biāo)卡設(shè)計(jì)兼容性不好，同樣這樣PCIE結(jié)構(gòu)就會(huì)成為GPU之間數(shù)據(jù)交換處理的瓶頸，嚴(yán)重影響多GPU架構(gòu)下多GPU的性能發(fā)揮，但是，傳統(tǒng)的并行計(jì)算方法的硬件昂貴，編程和軟件操作也需要專業(yè)化的技能，不利于推廣使用，同時(shí)配置容易出現(xiàn)GPU擴(kuò)展箱配置誤差，配置的準(zhǔn)確性和配置效率不夠高，從而影響計(jì)算機(jī)的性能，隨著圖形處理器( GPU)技術(shù)的快速發(fā)展，當(dāng)前GPU已經(jīng)發(fā)展成為具有極高并行計(jì)算能力的通用并行處理器，這使得基于GPU的通用計(jì)算技術(shù)( GPGPU)硬件成本且實(shí)現(xiàn)容易，逐步成為了近幾年的一個(gè)研究熱點(diǎn)，但是這導(dǎo)致大規(guī)模的拓?fù)鋬?yōu)化問題會(huì)產(chǎn)生龐大的計(jì)算量，常規(guī)的計(jì)算將十分耗時(shí)，極大的限制了拓?fù)鋬?yōu)化方法，鑒于此，我們提出一種自動(dòng)配置GPU擴(kuò)展箱的方法。

發(fā)明內(nèi)容

本發(fā)明的目的在于提供一種自動(dòng)配置GPU擴(kuò)展箱的方法，以解決上述背景技術(shù)中提出的問題。

為實(shí)現(xiàn)上述目的，本發(fā)明提供一種自動(dòng)配置GPU擴(kuò)展箱的方法，其方法步驟如下：

S1、數(shù)據(jù)流挖掘：采用CUDA計(jì)算模型對數(shù)據(jù)流進(jìn)行挖掘；

S2、拓?fù)鋬?yōu)化：采用BESO算法軟刪除的方式實(shí)現(xiàn)單元的增減，不會(huì)真正的刪除單元，保證了迭代過程中有限元模型的統(tǒng)一性，具有很好的并行性；

S3、并行計(jì)算：在預(yù)處理階段進(jìn)行顯存空間分配，并將計(jì)算模型信息從主機(jī)復(fù)制到設(shè)備，然后采用異步執(zhí)行的方式進(jìn)行數(shù)據(jù)傳輸配置，有利于減少中間結(jié)果數(shù)據(jù)輸出對程序執(zhí)行效率的影響；

S4、數(shù)值檢測：采用二維和三維結(jié)構(gòu)優(yōu)化檢測試精度和計(jì)算效率。

作為本技術(shù)方案的進(jìn)一步改進(jìn)，所述S1中的CUDA計(jì)算模型采用數(shù)據(jù)流分位數(shù)并行算法。

作為本技術(shù)方案的進(jìn)一步改進(jìn)，所述數(shù)據(jù)流分位數(shù)并行算法包括以下步驟：

①、初始化，分配主機(jī)緩沖區(qū)和設(shè)備內(nèi)存；

②、從數(shù)據(jù)流源中獲取并向設(shè)備交換一塊數(shù)據(jù)；

③、啟動(dòng)設(shè)備內(nèi)核，執(zhí)行數(shù)據(jù)流分位數(shù)并行計(jì)算子算法GPUQuantilesHistogram；

代碼如下：FOR elements in block B

IFB[i]maxorB[i]min

Normalize B[ i]into [ min, max] ENDIF

intj = GpuHash( B[ i])

SynopsisHist[j] ++;

④、更新基本窗口、刪除過期基本窗口；

⑤、如果接到On-time查詢請求，執(zhí)行數(shù)據(jù)流分位數(shù)并行查詢子算法GPUQuantilesQuery；

代碼如下：sharedMem[ tid] = source[ index]

int tid = threadldx. x//對于塊內(nèi)每個(gè)線程

for(len1; len0;len =1){ //b len次迭代完成求和

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中天恒星（上海）科技有限公司，未經(jīng)中天恒星（上海）科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110020022.4/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種耐磨輥面磨損在線均化機(jī)構(gòu)
下一篇：一種基于電纜組件的全自動(dòng)精準(zhǔn)熱縮系統(tǒng)

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】