[發明專利]運算任務的計算方法及超算系統無效
| 申請號: | 201210365552.3 | 申請日: | 2012-09-26 |
| 公開(公告)號: | CN103279445A | 公開(公告)日: | 2013-09-04 |
| 發明(設計)人: | 伊露;宋應文;范志剛;張嘉璐 | 申請(專利權)人: | 上海中科高等研究院 |
| 主分類號: | G06F15/16 | 分類號: | G06F15/16;G06F9/38 |
| 代理公司: | 上海光華專利事務所 31219 | 代理人: | 李儀萍 |
| 地址: | 201210 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 運算 任務 計算方法 系統 | ||
1.一種運算任務的計算方法,所述計算由一超算系統來執行,所述超算系統包括多個網絡連接的超算裝置,所述每個超算裝置包括多個CPU模塊和多個GPU模塊,所述超算系統的操作系統根據CPU的空閑情況確定運行運算任務的本地CPU模塊,所述本地CPU模塊將所述運算任務按照預設的規則分割成多個計算任務并分配到多個CPU模塊中,其特征在于:
所述每個CPU模塊將所述每個計算任務按預設的規則進行本地分割,并分配到該CPU模塊對應的本地多個GPU模塊進行并行計算,后將所述本地多個GPU模塊計算結果進行合并操作;最后,所述本地CPU模塊再將所述每個CPU模塊的計算結果進行合并操作,完成所述運算任務。
2.如權利要求1所述的計算方法,其特征在于:參與運算任務的CPU模塊的個數和GPU模塊的個數由用戶預自定義。
3.如權利要求1所述的計算方法,其特征在于:所述每個計算任務在被編譯之前,需要增加頭文件;并在程序中增加與GPU相關的變量,同時所述程序中有需要并行執行的語句。
4.如權利要求1至3中任一項所述的計算方法,其特征在于:所述本地CPU模塊采用MPI工具進行所述運算任務的分割和分配。
5.如權利4所述的計算方法,其特征在于:所述每個CPU模塊本地分割和分配具體為:先以單進程方式啟動所述計算任務,直到發現并行區域時,所述每個CPU模塊按所述GPU模塊的個數創建一個線程組,接著所述線程組中的GPU模塊將分配到的數據進行計算,直到所述線程組中的并行區域結束,所述每個CPU模塊進行合并操作。
6.如權利要求5所述的計算方法,其特征在于:所述運算任務完成后,所述GPU模塊占用的內存被釋放。
7.如權利要求1至4中任一項所述的計算方法,其特征在于:所述本地多個GPU模塊共享同一內存,并通過所共享的內容進行數據交換。
8.如權利要求6中任一項所述的計算方法,其特征在于:所述本地多個GPU模塊共享同一內存,并通過所共享的內容進行數據交換。
9.如權利要求1至4中任一項所述的計算方法,其特征在于:所述多個CPU模塊通過高速串行總線連接。
10.一種超算系統,其包括多個網絡連接的超算裝置,所述每個超算裝置包括多個相互通訊的CPU模塊和多個GPU模塊,所述超算系統的操作系統根據所述CPU的空閑情況確定運行運算任務的本地CPU模塊,其特征在于:
所述每個CPU模塊將所述每個計算認為按預設規則進行本地分割,并分配到該CPU模塊對應的本地多個GPU模塊進行并行計算,后將所述本地多個GPU模塊的計算結果進行合并操作;最后,所述本地CPU模塊再將所述每個CPU模塊的計算結果進行合并操作,完成所述運算任務。
11.如權利要求10所述的超算系統,其特征在于:參與運算任務的CPU模塊的個數和GPU模塊的個數由用戶預自定義。
12.如權利要求10所述的超算系統,其特征在于:所述每個計算任務被編譯之前,需要增加頭文件;并在定義程序中增加與GPU相關的變量,同時所述程序中有需要并行執行的語句。
13.如權利要求10至12中任一項所述的超算系統,其特征在于:所述本地CPU模塊采用MPI工具進行所述運算任務的分割和分配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海中科高等研究院,未經上海中科高等研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210365552.3/1.html,轉載請聲明來源鉆瓜專利網。





