[發明專利]基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法在審
| 申請號: | 201410536002.2 | 申請日: | 2014-10-11 |
| 公開(公告)號: | CN104317655A | 公開(公告)日: | 2015-01-28 |
| 發明(設計)人: | 駱清銘;鄧勇;羅召洋;江旭 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06F19/00 |
| 代理公司: | 武漢開元知識產權代理有限公司 42104 | 代理人: | 唐正玉 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 集群 gpu 加速 多源全 路徑 蒙特卡羅 模擬 方法 | ||
1.一種基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,所述方法包括:
步驟1:基于MPI消息傳遞通信協議,Host節點向各Client節點進行計算任務的一次分配,并完成相應的數據交互;
步驟2:基于被分配的計算任務,各Client節點向本節點內的各GPU設備進行計算任務的二次分配,并完成相應的數據交互;
步驟3:基于被分配的計算任務,各GPU設備向其各block進行計算任務的三次分配,并完成相應的數據交互;
步驟4:各Client節點對被分配的相應光子的傳輸過程進行追蹤。
2.根據權利要求1所述的基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,所述步驟1為:
步驟1.1:各Client節點獲取本節點的GPU設備的數量信息;
步驟1.2:各Client節點向其他節點廣播本節點GPU設備的數量信息;
步驟1.3:Host節點接收各Client節點的廣播信息,并獲得各節點GPU設備的數量信息;
步驟1.4:Host節點根據各Client節點的GPU設備的數量以及與光源的光子數量相關的計算任務量,向各Client節點分配平均到每個GPU的計算任務。
3.根據權利要求2所述的基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,所述步驟2為:
步驟2.1:各Client節點CPU的主進程根據本節點GPU設備的數目開辟相應數目的子進程,每個子進程對應一個本節點的GPU設備;
步驟2.2:各Client節點CPU的主進程將計算任務分配給子線程進行執行。
4.根據權利要求3所述的基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,在所述步驟2.2中,各Client節點的子進程在本節點多核CPU的不同的核上并行運行。
5.根據權利要求3所述的基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,在所述步驟2.2中,各Client節點的子進程在本節點單核CPU的單核上串行運行。
6.根據權利要求3所述的基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,所述步驟3為:
步驟3.1:各Client節點確定本節點各GPU設備SM上的可用資源;
步驟3.2:各Client節點根據本節點GPU設備中各block使用資源,確定active?block數量和active?warp數量;
步驟3.3:各Client節點根據本節點GPU設備中各block使用資源,確定各block的尺寸和維度;
步驟3.4:按照計算任務的規模,各Client節點確定本節點各GPU設備grid中的block數量;
步驟3.5:各Client節點中的各GPU設備將計算任務分配給本設備的每個block。
7.根據權利要求6所述的基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,所述步驟4為:
步驟4.1:啟動cuda,各Client節點CPU對內存空間、顯存空間進行分配,并將要計算的數據從內存復制到顯存上;
步驟4.2:將入射光源表征為設定數目光子的集合,將入射光源位置和入射光方向賦給每個光子作為其初始位置和方向;
步驟4.3:追蹤每個光子的傳輸過程;
步驟4.4:CPU分配內存,用于存放GPU輸出數據,并將計算后顯存上的數據復制到內存上,并將本節點的運行信息返回給host節點。
8.根據權利要求7所述的基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,所述方法還包括:
步驟5:光子追蹤結束后,Host節點輸出光吸收矩陣和所有逸出光子信息及光子傳播所經各體素的路徑信息。
9.根據權利要求8所述的基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,所述光子傳播所經各體素的路徑信息,由追蹤每個光子傳輸過程中記錄的每個光子所經體素的索引值及經過該體素光子所走的路徑長度得到。
10.根據權利要求8所述的基于集群式GPU加速的多源全路徑蒙特卡羅模擬方法,其特征在于,所述方法還包括:
步驟6:對步驟5的結果進行統計,轉換為其它所需獲取的傳輸特性,包括:將光吸收量矩陣中各元素除以其對應體素的吸收系數,得到通量分布;將光吸收量矩陣所有元素的值相加,然后除以光子數目得到光吸收量;將所有在光源同側逸出的光子當前能量相加,然后除以光子數目得到總透射量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410536002.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:冰箱
- 下一篇:抽屜式門體組件及其冰箱





