Slurm 基本概念
Slurm 是一个开源的集群资源管理及作业调度系统,在现今的超算上被广泛使用。
Slurm 基本用法
用户使用集群时,通常会涉及以下操作:
提交 OpenMP/MPI 作业
这一小节,我们用几个实例来演示如何提交 OpenMP、MPI 以及 MPI+OpenMP 作业,以及如何设置简单的绑定/亲和性。要注意的是,计算资源的单位(CPU、核、内存)是与机器和 Slurm 配置相关的,下面例子中的方式不一定适用于其他集群,应该具体问题具体分析。
Slurm 高级用法
向SLURM提交作业时,可使用的参数非常多。使用sbatch提交脚本时,脚本本身也是用shell语言写的(如bash),我们可以多利用shell语言的语法来完成自己的目标。