[發明專利]一種構建slurm調度并行計算集群的方法有效
| 申請號: | 202210383566.1 | 申請日: | 2022-04-12 |
| 公開(公告)號: | CN114745385B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 王建 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | H04L67/10 | 分類號: | H04L67/10;H04L67/1001;H04L67/1095;H04L67/60;H04L9/40 |
| 代理公司: | 成都宏田知識產權代理事務所(普通合伙) 51337 | 代理人: | 鐘隆輝 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 構建 slurm 調度 并行 計算 集群 方法 | ||
1.一種構建slurm調度并行計算集群的方法,其特征在于,計算集群的構建方法如下:
步驟一:硬件準備;需要兩臺或者兩臺以上的計算設備,上限取決于交換機端口數,需要給每臺機器安裝完畢系統,正確連接交換機,通過以下四個核心模塊實現集群搭建:setup_hpc模塊作為集群系統正常運轉的核心樞紐,承擔用戶鑒權認證,基于openSSH密鑰做鑒權,基于scp+rsync下發配置并同步指令;os_setup_all.sh模塊為科學計算方向的Linux系統調優設定;prepare.sh和slurm_all.sh模塊相互依賴,自動從網絡獲取slurm源碼并自動構建適用于科學計算平臺的調度器二進制文件和相適應的配置設定;
步驟二:開機后,按照實際要求,修改hostname并設定實際的IP址并記錄網絡信息,包括:依次開啟master,nodeXX機器,使用nmtui指令,設定hostname和IP地址,所有機器運行同樣版本的Linux系統,所有機器的root用戶具有相同的默認登錄密碼;
在微軟機器新建記事本,錄入網絡信息,一行一個條目,網絡地址末尾和英文之間,用一個或者多個空格均可,保存文件為cluster-net.txt;
步驟三:選取其中一個為master主機,登錄master節點,其中一個接入集群專屬交換機,另外一個負載用戶登錄,具體包括:登錄master機器,將cluster-net.txt文件全部內容粘貼到master機器上/etc/hosts文件最后面,并保存修改;上傳hpc4youtoolkit到master機器,依照手冊或按照順序和屏幕提示,運行對應模塊;
步驟四:組網成功即并行計算集群組建成功。
2.根據權利要求1所述的一種構建slurm調度并行計算集群的方法,其特征在于,所述的步驟三標注為master的主機至少具備兩個網卡。
3.根據權利要求2所述的一種構建slurm調度并行計算集群的方法,其特征在于,所述的步驟三標注為master的主機可以訪問互聯網。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210383566.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種五金產品制造用板材沖壓成型裝置
- 下一篇:一種鋼表面涂層的檢測方法及系統





