[發明專利]一種柵元少群參數計算模塊程序的優化方法、系統、終端有效
| 申請號: | 202110160576.4 | 申請日: | 2021-02-05 |
| 公開(公告)號: | CN112783511B | 公開(公告)日: | 2023-04-11 |
| 發明(設計)人: | 楊昊;毛波;何琴;何金徽 | 申請(專利權)人: | 成都信息工程大學 |
| 主分類號: | G06F8/41 | 分類號: | G06F8/41 |
| 代理公司: | 北京輕創知識產權代理有限公司 11212 | 代理人: | 劉紅陽 |
| 地址: | 610225 四川省成都*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 柵元少群 參數 計算 模塊 程序 優化 方法 系統 終端 | ||
本發明屬于熱中子反應堆數據處理技術領域,公開了一種柵元少群參數計算模塊程序的優化方法、系統、終端,編譯級優化,調整程序的編譯選項,并使用英特爾編譯器提供的優化選項?自動向量化對程序進行優化。串行程序優化,使程序選用盡量小的數據類型,并使程序中的結構體對齊,盡量大數據類型在前,小數據類型在后,以更好地滿足處理器的對齊要求。使用MPI技術對程序的熱點模塊?柵元計算模塊進行并行優化。本發明在柵元少群參數計算模塊程序優化的應用中,極大的提升了程序的計算效率。針對千萬網格規模算例,可以實現多節點的40核,80核和120核的并行計算,且并行效率都不低于50%。
技術領域
本發明屬于熱中子反應堆數據處理技術領域,尤其涉及一種柵元少群參數計算模塊程序的優化方法、系統、終端,具體涉及一種基于MPI的柵元少群參數計算模塊程序的優化方法。
背景技術
目前,柵元計算程序的優化,一般先從硬件入手,提升CPU的運算性能,并檢查硬件設置,優化程序的內存訪問。然后從運行環境上調整,通過監控整個系統的性能及各項指標看問題所在,然后看能不能通過一些運行參數的調整,降低系統消耗。最后是編譯器級調優,使用編譯器的優化選項或者引入自動向量化的方式對程序進行優化。綜合來講,現有的技術方案分為四個步驟層次,首先是硬件級的優化,使用性能更高的計算機硬件來運行程序;然后是運行級優化,從運行環境上調整,通過一些運行參數的調整,提升程序的運行性能;其次是編譯器級優化,通過使用編譯器提供的優化選項或引入自動向量化編譯指令,深度優化,性能剖析指導的優化(PGO)等方式獲得程序的性能提高;最后是引入OpenMP進行線程級并行優化,充分利用多核的處理性能,提升程序的運行性能。
通過上述分析,現有技術存在的問題及缺陷為:
(1)對于熱中子反應堆物理計算中的柵元少群參數計算模塊程序的優化,可以先從硬件下手,簡單粗暴直接換掉性能低的硬件,比如網卡從千兆換到萬兆的,硬盤從機械的換成SSD等等。優化硬件設備一直是最快速有效的手段,但也是經濟成本花費最高的手段。在萬不得已的情況下,一般不會采用此技術手段。
(2)使用編譯器的優化選項,有時候也能獲得巨大的性能提高。該方法如果柵元少群參數計算模塊程序的網格算例規模不大,且對程序性能的提升要求不高時,還是會產生一些相應的效果。但是在計算千萬網格規模的算例時,如何優化柵元少群參數計算模塊程序,使其能夠在高性能集群上運行性能效果顯著提升,是一個較為困難的問題。這也是該方法的缺陷所在,即程序優化的性能提升效果容易存在瓶頸。
(3)引入OpenMP進行線程級別的并行化,充分利用多核,多線程的并行處理能力。但是本發明在使用這種技術的時候,尤其要防止數據競爭,死鎖,餓死,內存偽共享等問題。所謂數據競爭就是在多個線程訪問相同數據時,由于同步等原因,需要讓步等待其他線程訪問結束,導致性能降低。所謂偽共享,是多個線程讀寫數據映射在一個cache線上時,如果一個線程更改了數據,那么其他線程對該數據的緩存就失效,如果線程頻繁的更改數據,硬件就需要不停的更新cache線,這使得性能從獨享cache降低到共享cache或者內存的水平。同時,當問題規模超過單節點處理能力時,會達到性能提升的瓶頸,無法充分利用多節點多核的處理性能。
(4)現有技術方案在當程序計算千萬網格規模算例規時,程序運行的性能提升效果不顯著,無法達到規定的性能提升要求。不僅實現成本偏高,而且對技術人員要求很高,需要對整個系統非常熟且十分熟悉編譯的使用,優化過程的理解。對集群多處理機的運行環境來說,性能提升效果有限,往往無法滿足實際生產的要求。
解決以上問題及缺陷的難度為:
如何使優化后的程序能夠在計算千萬網格規模算例,獲得顯著的性能提升,是需要著重考慮的一個問題。此時問題規模已超過單節點的處理能力,要使程序能在多節點多核的環境下運行,現有的技術方法無法實現,只能使用MPI技術實現節點間的通信。隨之而來就會出現一個新的問題,即數據通信的開銷會影響到程序的運行性能。如何選取最優的數據劃分方式,盡可能的降低通信的時間開銷,是一個比較難的問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都信息工程大學,未經成都信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110160576.4/2.html,轉載請聲明來源鉆瓜專利網。





