[發(fā)明專利]一種基于異構(gòu)眾核的LBM并行優(yōu)化方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110440081.7 | 申請(qǐng)日: | 2021-04-23 |
| 公開(公告)號(hào): | CN113127200A | 公開(公告)日: | 2021-07-16 |
| 發(fā)明(設(shè)計(jì))人: | 張武;張曉瀟;其他發(fā)明人請(qǐng)求不公開姓名 | 申請(qǐng)(專利權(quán))人: | 蘇州流場(chǎng)信息技術(shù)有限公司 |
| 主分類號(hào): | G06F9/50 | 分類號(hào): | G06F9/50;G06F13/28;G06F9/38;G06F9/30;G06F30/28 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 215300 江蘇省蘇州市昆山開發(fā)區(qū)*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 異構(gòu)眾核 lbm 并行 優(yōu)化 方法 | ||
1.一種基于異構(gòu)眾核的LBM并行優(yōu)化方法,其特征在于,其包括以下步驟:
步驟一,根據(jù)LBM并行運(yùn)算特性對(duì)“神威·太湖之光”的單核組進(jìn)行數(shù)據(jù)儲(chǔ)存、循環(huán)運(yùn)算、通信方式上進(jìn)行優(yōu)化;
步驟二,在LDM上,采取雙緩沖模式讓LBM并行計(jì)算更加高效,同時(shí)采取了新的數(shù)據(jù)塊格式;
步驟三,在進(jìn)程任務(wù)劃分上,根據(jù)并行度和算法難易,采取二維劃分策略,同時(shí)根據(jù)LBM并行運(yùn)算特性進(jìn)行了計(jì)算結(jié)構(gòu)的優(yōu)化。
2.根據(jù)權(quán)利要求1所述的基于異構(gòu)眾核的LBM并行優(yōu)化方法,其特征在于,所述步驟一包括:
步驟十一,優(yōu)化后的數(shù)據(jù)存儲(chǔ)格式,存儲(chǔ)格式為數(shù)組結(jié)構(gòu)體結(jié)構(gòu)體(Structure ofArray)結(jié)構(gòu)。按照格點(diǎn)信息類別分別存儲(chǔ)格點(diǎn)的類型信息、格點(diǎn)的鄰居信息和格點(diǎn)的分布函數(shù)(包括碰撞后和遷移后的分布函數(shù)),但是化后的格點(diǎn)碰撞過(guò)程仍然需要其18個(gè)鄰居的分布函數(shù)信息,但是由于其所有鄰居的分布函數(shù)存儲(chǔ)在內(nèi)存連續(xù)的區(qū)域,因此計(jì)算過(guò)程在讀取過(guò)程沒有過(guò)多消耗;
步驟十二,LBM并行程序中存在大量循環(huán)迭代計(jì)算,通過(guò)對(duì)這些循環(huán)迭代過(guò)程進(jìn)行展開、指令重排能夠提高對(duì)寄存器的利用效率,避免過(guò)多不必要的讀寫操作,提高程序的訪存效率,加快程序的執(zhí)行效率;
步驟十三,為了充分減少通信帶來(lái)的時(shí)間消耗,啟動(dòng)從核之間的寄存器通信,該通信方式速度遠(yuǎn)超過(guò)直接訪問(wèn)主存方式。這個(gè)過(guò)程需要將64個(gè)計(jì)算核心的數(shù)據(jù)規(guī)約到0號(hào)核心。因?yàn)閺暮酥g的寄存器通信只能進(jìn)行行與行或者列與列之間的通信,為了加快該規(guī)約過(guò)程的速度,程序規(guī)約過(guò)程。首先,對(duì)于每一行,0、2、4、6號(hào)核心分別接收1、3、5、7號(hào)核心的結(jié)果。然后,0號(hào)和4號(hào)核心分別接收2、6號(hào)核心的結(jié)果。最后0號(hào)核心得到每行最終的結(jié)果。
3.根據(jù)權(quán)利要求1所述的基于異構(gòu)眾核的LBM并行優(yōu)化方法,其特征在于,所述步驟二LDM優(yōu)化包括:
申威26010處理器中每個(gè)計(jì)算核心有64KB大小的LDM,從核可以通過(guò)DMA方式與主存進(jìn)行數(shù)據(jù)通信,為了提高“申威26010”處理器的加速性能,降低從核間的通信開銷是一個(gè)關(guān)鍵步驟。雙緩沖模式是在需要多次DMA讀寫操作的碰撞遷移計(jì)算過(guò)程中,在從核的局部存儲(chǔ)空間上申請(qǐng)大小為通信數(shù)據(jù)2倍的內(nèi)存空間,用來(lái)存放兩份同樣大小且互為對(duì)方的緩沖數(shù)據(jù)。通過(guò)程序控制來(lái)實(shí)現(xiàn)雙緩沖模式,除了第一次和最后一次的數(shù)據(jù)通信過(guò)程,每次從核進(jìn)行計(jì)算的同時(shí),進(jìn)行下一次計(jì)算的讀取(或存儲(chǔ))數(shù)據(jù)的通信。同時(shí)提出新的數(shù)據(jù)塊格式,以適合雙緩沖模式的數(shù)據(jù)塊傳遞。
4.根據(jù)權(quán)利要求1所述的基于異構(gòu)眾核的LBM并行優(yōu)化方法,其特征在于,所述步驟三包括:
二維劃分策略需要跟上下左右四個(gè)面交換面上的數(shù)據(jù),跟右上、左上、左下和右下交換邊的數(shù)據(jù)。這種策略能夠保證并行度和通信復(fù)雜度都能得到均衡,為算法的可擴(kuò)展性提供了很好的基礎(chǔ);計(jì)算結(jié)構(gòu)上,計(jì)算核心陣列負(fù)責(zé)算法中碰撞與遷移部分的計(jì)算,這部分也是算法中計(jì)算最密集的部分,能夠充分利用計(jì)算核心資源。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州流場(chǎng)信息技術(shù)有限公司,未經(jīng)蘇州流場(chǎng)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110440081.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 眾核處理器及其空間訪問(wèn)的方法、主核
- 一種用于異構(gòu)眾核系統(tǒng)下的應(yīng)用程序線程數(shù)動(dòng)態(tài)調(diào)整方法
- 一種面向異構(gòu)眾核芯片的量化功耗控制方法
- 一種代碼生成方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 異構(gòu)眾核架構(gòu)下的運(yùn)算核作業(yè)遷移方法
- 基于異構(gòu)眾核處理器的卷積加速方法
- 基于異構(gòu)眾核處理器的卷積計(jì)算數(shù)據(jù)重用方法
- 面向異構(gòu)眾核處理器的輕量級(jí)軟件調(diào)試方法
- 面向申威眾核架構(gòu)的稀疏矩陣存儲(chǔ)方法
- 一種基于異構(gòu)眾核架構(gòu)的并行海洋藥物篩選方法
- 一種基于歐拉?拉格朗日耦合方法的流體仿真方法
- 一種基于離散格子Boltzmann雙分布模型的熱流體仿真方法
- 加熱爐內(nèi)導(dǎo)熱流體仿真方法
- 一種基于LES/LBM的離心泵內(nèi)流動(dòng)誘導(dǎo)噪聲數(shù)值計(jì)算方法
- 一種具有計(jì)算負(fù)載均衡的多層網(wǎng)格LBM并行方法
- 一種基于LBM-LES的航母尾流數(shù)值模擬方法
- 多孔介質(zhì)LBM計(jì)算網(wǎng)格生成方法
- 基于多層網(wǎng)格的LBM并行優(yōu)化方法
- 一種基于異構(gòu)眾核的LBM并行優(yōu)化方法
- 一種基于LBM-DDA耦合的堆積體滲流侵蝕破壞模擬計(jì)算方法
- 簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議設(shè)備的數(shù)據(jù)并行采集歸并方法及系統(tǒng)
- 減少EMI的并行數(shù)據(jù)傳輸方法
- 一種多媒體數(shù)據(jù)并行處理系統(tǒng)及方法
- 一種高速并行OQPSK解調(diào)時(shí)鐘的恢復(fù)系統(tǒng)
- 一種海量地震數(shù)據(jù)并行抽道集方法
- 3G協(xié)議的turbo碼并行譯碼方法及裝置
- 并行擴(kuò)展輸入輸出的教學(xué)裝置
- 數(shù)據(jù)的并行處理
- 并行式插件機(jī)
- 一種SPI總線與并行總線的橋接方法、設(shè)備、系統(tǒng)及介質(zhì)





