[發明專利]基于循環段的眾核程序重構方法有效
| 申請號: | 201910910103.4 | 申請日: | 2019-09-25 |
| 公開(公告)號: | CN112559032B | 公開(公告)日: | 2023-06-13 |
| 發明(設計)人: | 徐金秀;何香;陳鑫;劉鑫;李芳;孫唯哲;郭恒;徐占;趙朋朋 | 申請(專利權)人: | 無錫江南計算技術研究所 |
| 主分類號: | G06F8/72 | 分類號: | G06F8/72;G06F8/41;G06F8/76;G06F9/30;G06F9/448 |
| 代理公司: | 蘇州科旭知識產權代理事務所(普通合伙) 32697 | 代理人: | 王健 |
| 地址: | 214083 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 循環 程序 方法 | ||
本發明公開一種基于循環段的眾核程序重構方法,包括基于循環段拆分的重構算法和基于循環段合并的重構算法,其中,所述基于循環段拆分的重構算法包括基于主從協同任務的循環段拆分和基于空間壓縮的循環段拆分,所述基于循環段合并的重構算法包括基于相似結構的循環段合并和基于增加循環量的循環段合并。本發明根據異構系統的結構特點和性能指標,優化循環段的層次結構和順序,充分發揮系統的性能優勢,從而最大程序提高應用軟件的計算性能。
技術領域
本發明涉及一種基于循環段的眾核程序重構方法,屬于計算機技術領域。
背景技術
近十年異構眾核技術迅速發展,為了充分利用各種異構系統的性能優勢,各應用領域應用軟件也發生了相應的結構變化。
在高性能科學計算中,數值求解過程和通信過程是核心計算的重要組成,其中數值求解過程包含了條件判斷過程和大量的數學基本運算,條件判斷過程的位置、數學運算的循環層次和循環結構對計算性能影響較大。為了提高應用軟件核心求解過程中的計算性能,最大限度發揮異構眾核系統性能優勢,需要根據異構眾核系統的結構特點,對應用軟件核心計算的程序結構做重構處理。
目前,大多數應用軟件為了在異構眾核系統上提高計算效率,基本采用直接在源程序添加編譯指示的方式,該方式操作方便,但是多數應用軟件不能獲得好的加速性能,有些甚至出現倒加速效果或者內存異常等錯誤現象。
發明內容
本發明的目的是提供一種基于循環段的眾核程序重構方法,該基于循環段的眾核程序重構方法根據異構系統的結構特點和性能指標,優化循環段的層次結構和順序,充分發揮系統的性能優勢,從而最大程序提高應用軟件的計算性能。
為達到上述目的,本發明采用的技術方案是:一種基于循環段的眾核程序重構方法,包括基于循環段拆分的重構方法和基于循環段合并的重構方法,其中,所述基于循環段拆分的重構方法包括基于主從協同任務的循環段拆分和基于空間壓縮的循環段拆分,所述基于循環段合并的重構方法包括基于相似結構的循環段合并和基于增加循環量的循環段合并;
基于主從協同任務的循環段拆分的眾核程序重構方法包括以下步驟:
S11、利用性能分析工具或打印輸出信息,分析程序運行時的多個時間熱點函數,找出各個時間熱點函數中最耗時循環段;
S12、對于S11中找出的各個循環段,若同時滿足條件1:即循環邊界起始條件為1,終止條件為end和條件2:即循環段內計算根據循環控制變量的不同取值分別調用循環段內相互獨立的子任務sub_a、sub_b、sub_c,則執行S13;若不滿足條件2,則循環段任務由從核完成,執行S15;
S13、對各子任務特性和相關性進行分析,若子任務sub_a、sub_c的計算量小、輸出量大、通信量大,而子任務sub_b計算量大、輸出信息少、通信量少,同時3個子任務不具有相關性,則將循環段按照各個子任務的循環邊界取值范圍進行拆分,拆分為3個新的循環段;若子任務相互之間具有相關性,循環段不進行拆分,循環段任務由從核完成,執行S15;
S14、針對S13中新拆分的循環段,含子任務sub_a、sub_c的循環段直接由主核完成;含子任務sub_b循環段由從核完成;
S15、針對從核完成任務的循環段,直接使用編譯指示進行眾核加速并行。
基于空間壓縮的循環段拆分的眾核程序重構方法包括以下步驟:
S21、利用性能分析工具或打印輸出信息,分析程序運行時的多個時間熱點函數,找出各個時間熱點函數中最耗時循環段;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫江南計算技術研究所,未經無錫江南計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910910103.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于數據結構的眾核程序重構方法
- 下一篇:一種專用搜索空間的配置方法及裝置





