slurm-gpu集群搭建详细步骤初衷1、参考文档2、搭建步骤3、启动步骤 4、测试任务分配步骤
初衷 首先,slurm搭建的初衷是为了将我多个GPU机器连接起来,从来利用多台机器的计算能力,提高计算效率,之前使用过deepops去搭建,结果最后好像deepops对GPU的卡有要求,我的每台机器卡都不一样,所以后面就开始研究slurm集群的方式了。1、参考文档 之前参考过诸多文档,中间会出现各种奇怪的错误,后来还是通过docker的方式去装才成功,不通过docker的还在探索中,以后成功会出新视频。(1)官网文档slurm官网(2)git上docke...