[發(fā)明專利]浸沒式邊界高精度統(tǒng)計(jì)動(dòng)力學(xué)流體仿真的GPU優(yōu)化方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010106728.8 | 申請(qǐng)日: | 2020-02-19 |
| 公開(公告)號(hào): | CN111353261A | 公開(公告)日: | 2020-06-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉曉培;范睿;陳懿欣;李偉 | 申請(qǐng)(專利權(quán))人: | 上海科技大學(xué) |
| 主分類號(hào): | G06F30/28 | 分類號(hào): | G06F30/28 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 徐俊 |
| 地址: | 201210 上*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 浸沒 邊界 高精度 統(tǒng)計(jì) 動(dòng)力學(xué) 流體 仿真 gpu 優(yōu)化 方法 | ||
1.一種浸沒式邊界高精度統(tǒng)計(jì)動(dòng)力學(xué)流體仿真的GPU優(yōu)化方法,其特征在于,包括以下步驟:
步驟1、在GPU平臺(tái)上進(jìn)行算法基本實(shí)現(xiàn)
根據(jù)浸沒式邊界-統(tǒng)計(jì)動(dòng)力學(xué)方法算法,按步驟流程進(jìn)行GPU并行實(shí)現(xiàn),其中,浸沒式邊界-統(tǒng)計(jì)動(dòng)力學(xué)方法算法包括以下步驟:
步驟101、初始化
將微觀速度c離散成多個(gè)格子速度,ci表示第i個(gè)格子速度,每個(gè)格子速度對(duì)應(yīng)一個(gè)速度分布函數(shù),則第i個(gè)格子速度對(duì)應(yīng)格子離散速度分布方程fi,在仿真之前,分配內(nèi)存來存儲(chǔ)格子離散速度分布方程fi,以及密度ρ、速度u和外力g,對(duì)于向量場(chǎng),被存儲(chǔ)為向量的線性陣列,表示為一個(gè)結(jié)構(gòu)體,所有這些結(jié)構(gòu)體數(shù)組都存儲(chǔ)在GPU全局內(nèi)存中;
步驟102、流處理
從時(shí)間t時(shí)刻開始,將流體網(wǎng)格節(jié)點(diǎn)作為并行對(duì)象,通過訪問GPU全局內(nèi)存將每個(gè)流體網(wǎng)格節(jié)點(diǎn)不同方向的格子離散速度分布方程fi從附近對(duì)應(yīng)流體網(wǎng)格節(jié)點(diǎn)并行平流輸送到當(dāng)前流體網(wǎng)格節(jié)點(diǎn);
步驟103、計(jì)算物理宏觀量
經(jīng)過流處理后,將流體網(wǎng)格節(jié)點(diǎn)作為并行對(duì)象,利用各流體網(wǎng)格節(jié)點(diǎn)流處理后的格子離散速度分布方程fi計(jì)算得到該流體網(wǎng)格節(jié)點(diǎn)的宏觀物理量——密度ρ和速度u:
ρ=∑ifi,
步驟104、剛體邊界處理
采用浸沒式邊界方法進(jìn)行剛體邊界條件處理,當(dāng)計(jì)算剛體采樣點(diǎn)的受力時(shí),并行對(duì)象是這些剛體采樣點(diǎn),每個(gè)線程分別訪問該剛體采樣點(diǎn)附近一定區(qū)域內(nèi)的流體網(wǎng)格節(jié)點(diǎn);當(dāng)傳播力時(shí),并行對(duì)象是剛體的包圍盒中的流體網(wǎng)格節(jié)點(diǎn),每個(gè)線程分別計(jì)算該流體網(wǎng)格節(jié)點(diǎn)所受反作用力,訪問該流體網(wǎng)格節(jié)點(diǎn)周圍一定區(qū)域內(nèi)的全部剛體采樣點(diǎn);
步驟105、碰撞處理
經(jīng)過剛體邊界處理后,用流處理后的格子離散速度分布方程fi計(jì)算得到的宏觀物理量密度ρ和速度u和剛體邊界處理計(jì)算得到合力項(xiàng)Gi進(jìn)行碰撞過程Ωi計(jì)算;
步驟106、更新過程
根據(jù)計(jì)算得到的碰撞過程Ωi來更新得到每個(gè)流體網(wǎng)格節(jié)點(diǎn)在時(shí)間t+1時(shí)刻的格子離散速度分布方程fi,通過并行流體網(wǎng)格節(jié)點(diǎn)來實(shí)現(xiàn);
步驟107、區(qū)域邊界處理
采用回彈方法對(duì)區(qū)域邊界條件進(jìn)行處理
步驟2、在單GPU系統(tǒng)上,針對(duì)算法本身通過單GPU優(yōu)化技術(shù),以顯著提高湍流及流固耦合仿真的性能,其中,該單GPU優(yōu)化技術(shù)包括:基于內(nèi)存訪問連續(xù)性原則的參數(shù)化內(nèi)存數(shù)據(jù)布局模型,以提高浸沒式邊界-統(tǒng)計(jì)動(dòng)力學(xué)求解器的內(nèi)存訪問性能;使用浸沒式邊界方法來進(jìn)行剛體邊界條件處理,并且以剛體采樣點(diǎn)作為并行對(duì)象進(jìn)行實(shí)現(xiàn),在處理整個(gè)仿真區(qū)域的邊界時(shí),采用回彈方法,以改善數(shù)據(jù)負(fù)載不平衡和判斷帶來的多支路發(fā)散;進(jìn)一步簡(jiǎn)化自適應(yīng)中心矩多弛豫時(shí)間模型,以減少每個(gè)線程的寄存器使用量,從而提高GPU占用率以提高運(yùn)算性能;
在多節(jié)點(diǎn)多GPU的大規(guī)模擴(kuò)展平臺(tái)系統(tǒng)上,首先將單GPU優(yōu)化技術(shù)應(yīng)用于多GPU系統(tǒng),同時(shí)根據(jù)多GPU特征,進(jìn)行多節(jié)點(diǎn)多GPU平臺(tái)實(shí)現(xiàn)優(yōu)化。
2.如權(quán)利要求1所述的一種浸沒式邊界高精度統(tǒng)計(jì)動(dòng)力學(xué)流體仿真的GPU優(yōu)化方法,其特征在于,步驟105中,進(jìn)行碰撞過程Ωi計(jì)算所用的松弛模型基于自適應(yīng)中心矩多弛豫時(shí)間模型。
3.如權(quán)利要求1所述的一種浸沒式邊界高精度統(tǒng)計(jì)動(dòng)力學(xué)流體仿真的GPU優(yōu)化方法,其特征在于,步驟2中,所述單GPU優(yōu)化技術(shù)進(jìn)一步包括優(yōu)化GPU線程分配:當(dāng)流體網(wǎng)格節(jié)點(diǎn)被并行化處理時(shí),在GPU塊中分配三維線程組,其中線程組的x維度是線程束warp大小的倍數(shù),y和z維度根據(jù)正在使用的GPU的類型進(jìn)行調(diào)節(jié)的,以實(shí)現(xiàn)對(duì)應(yīng)GPU最佳并行性能;當(dāng)剛體采樣點(diǎn)被并行化時(shí),使用一維線程組,進(jìn)而每個(gè)線程通過初始化時(shí)剛體采樣點(diǎn)存儲(chǔ)順序的索引分配訪問,通過合理分配各線程塊的線程數(shù)目,有效平衡資源利用,提升GPU運(yùn)行效率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海科技大學(xué),未經(jīng)上海科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010106728.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 統(tǒng)計(jì)系統(tǒng)、統(tǒng)計(jì)裝置和統(tǒng)計(jì)方法
- 人數(shù)統(tǒng)計(jì)方法和人數(shù)統(tǒng)計(jì)系統(tǒng)
- 統(tǒng)計(jì)物體數(shù)量的統(tǒng)計(jì)系統(tǒng)
- 網(wǎng)絡(luò)處理器的統(tǒng)計(jì)計(jì)數(shù)方法
- 統(tǒng)計(jì)信息上報(bào)方法及裝置
- 稿件統(tǒng)計(jì)方法和稿件統(tǒng)計(jì)系統(tǒng)
- 數(shù)據(jù)統(tǒng)計(jì)方法及裝置
- 獲取數(shù)據(jù)的統(tǒng)計(jì)狀態(tài)的方法及裝置
- 信息統(tǒng)計(jì)方法和信息統(tǒng)計(jì)裝置
- 電量統(tǒng)計(jì)系統(tǒng)及電量統(tǒng)計(jì)方法





