[發(fā)明專利]一種自動(dòng)配置GPU擴(kuò)展箱的方法在審
| 申請?zhí)枺?/td> | 202110020022.4 | 申請日: | 2021-01-07 |
| 公開(公告)號: | CN112651162A | 公開(公告)日: | 2021-04-13 |
| 發(fā)明(設(shè)計(jì))人: | 黃永 | 申請(專利權(quán))人: | 中天恒星(上海)科技有限公司 |
| 主分類號: | G06F30/23 | 分類號: | G06F30/23;G06F16/2455;G06F9/50 |
| 代理公司: | 深圳知幫辦專利代理有限公司 44682 | 代理人: | 顏為華 |
| 地址: | 200050 上海*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 自動(dòng) 配置 gpu 擴(kuò)展 方法 | ||
本發(fā)明涉及配置GPU擴(kuò)展箱技術(shù)領(lǐng)域,具體地說,涉及一種自動(dòng)配置GPU擴(kuò)展箱的方法。其方法步驟如下:數(shù)據(jù)流挖掘:采用CUDA計(jì)算模型對數(shù)據(jù)流進(jìn)行挖掘,拓?fù)鋬?yōu)化:采用BESO算法軟刪除的方式實(shí)現(xiàn)單元的增減,并行計(jì)算:在預(yù)處理階段進(jìn)行顯存空間分配,并將計(jì)算模型信息從主機(jī)復(fù)制到設(shè)備,然后采用異步執(zhí)行的方式進(jìn)行數(shù)據(jù)傳輸,數(shù)值檢測:采用二維和三維結(jié)構(gòu)優(yōu)化檢測試精度和計(jì)算效率,本發(fā)明可以在對GPU擴(kuò)展箱與CPU之間配置時(shí),可以在保證計(jì)算精度的前提下,極大的提高二維和三維拓?fù)鋬?yōu)化問題的計(jì)算效率,配置的準(zhǔn)確性和配置效率高。
技術(shù)領(lǐng)域
本發(fā)明涉及配置GPU擴(kuò)展箱技術(shù)領(lǐng)域,具體地說,涉及一種自動(dòng)配置GPU擴(kuò)展箱的方法。
背景技術(shù)
將多個(gè)GPU集成到一個(gè)擴(kuò)展箱內(nèi),形成GPU擴(kuò)展箱,從而實(shí)現(xiàn)GPU資源的池化,便于GPU資源的調(diào)度,GPU和CPU之間通過PCIE接口連接的方式就是GPU擴(kuò)展箱的連接拓?fù)洌瑢?shí)際應(yīng)用中,在進(jìn)行GPU配置時(shí),多GPU設(shè)計(jì)就是會(huì)使服務(wù)器變得比較龐大,而且和其他標(biāo)卡設(shè)計(jì)兼容性不好,同樣這樣PCIE結(jié)構(gòu)就會(huì)成為GPU之間數(shù)據(jù)交換處理的瓶頸,嚴(yán)重影響多GPU架構(gòu)下多GPU的性能發(fā)揮,但是,傳統(tǒng)的并行計(jì)算方法的硬件昂貴,編程和軟件操作也需要專業(yè)化的技能,不利于推廣使用,同時(shí)配置容易出現(xiàn)GPU擴(kuò)展箱配置誤差,配置的準(zhǔn)確性和配置效率不夠高,從而影響計(jì)算機(jī)的性能,隨著圖形處理器( GPU)技術(shù)的快速發(fā)展,當(dāng)前GPU已經(jīng)發(fā)展成為具有極高并行計(jì)算能力的通用并行處理器,這使得基于GPU的通用計(jì)算技術(shù)( GPGPU)硬件成本且實(shí)現(xiàn)容易,逐步成為了近幾年的一個(gè)研究熱點(diǎn),但是這導(dǎo)致大規(guī)模的拓?fù)鋬?yōu)化問題會(huì)產(chǎn)生龐大的計(jì)算量,常規(guī)的計(jì)算將十分耗時(shí),極大的限制了拓?fù)鋬?yōu)化方法,鑒于此,我們提出一種自動(dòng)配置GPU擴(kuò)展箱的方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種自動(dòng)配置GPU擴(kuò)展箱的方法,以解決上述背景技術(shù)中提出的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種自動(dòng)配置GPU擴(kuò)展箱的方法,其方法步驟如下:
S1、數(shù)據(jù)流挖掘:采用CUDA計(jì)算模型對數(shù)據(jù)流進(jìn)行挖掘;
S2、拓?fù)鋬?yōu)化:采用BESO算法軟刪除的方式實(shí)現(xiàn)單元的增減,不會(huì)真正的刪除單元,保證了迭代過程中有限元模型的統(tǒng)一性,具有很好的并行性;
S3、并行計(jì)算:在預(yù)處理階段進(jìn)行顯存空間分配,并將計(jì)算模型信息從主機(jī)復(fù)制到設(shè)備,然后采用異步執(zhí)行的方式進(jìn)行數(shù)據(jù)傳輸配置,有利于減少中間結(jié)果數(shù)據(jù)輸出對程序執(zhí)行效率的影響;
S4、數(shù)值檢測:采用二維和三維結(jié)構(gòu)優(yōu)化檢測試精度和計(jì)算效率。
作為本技術(shù)方案的進(jìn)一步改進(jìn),所述S1中的CUDA計(jì)算模型采用數(shù)據(jù)流分位數(shù)并行算法。
作為本技術(shù)方案的進(jìn)一步改進(jìn),所述數(shù)據(jù)流分位數(shù)并行算法包括以下步驟:
①、初始化,分配主機(jī)緩沖區(qū)和設(shè)備內(nèi)存;
②、從數(shù)據(jù)流源中獲取并向設(shè)備交換一塊數(shù)據(jù);
③、啟動(dòng)設(shè)備內(nèi)核,執(zhí)行數(shù)據(jù)流分位數(shù)并行計(jì)算子算法GPUQuantilesHistogram;
代碼如下:FOR elements in block B
IFB[i]maxorB[i]min
Normalize B[ i]into [ min, max] ENDIF
intj = GpuHash( B[ i])
SynopsisHist[j] ++;
④、更新基本窗口、刪除過期基本窗口;
⑤、如果接到On-time查詢請求,執(zhí)行數(shù)據(jù)流分位數(shù)并行查詢子算法GPUQuantilesQuery;
代碼如下:sharedMem[ tid] = source[ index]
int tid = threadldx. x//對于塊內(nèi)每個(gè)線程
for(len1; len0;len =1){ //b len次迭代完成求和
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中天恒星(上海)科技有限公司,未經(jīng)中天恒星(上海)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110020022.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲(chǔ)介質(zhì)及設(shè)備





