一个简易的超算集群(我也没弄过超大集群)通常由一个管理节点和一些计算节点组成。大部分的软件和库都安装在管理节点上,而计算节点一般只需要安装基本的软件就好了。
一般我们将管理节点上的某个文件夹通过nfs服务分享给计算节点,这里假定为/opt
文件夹。(nfs服务的配置就不赘述了,网上有很多资料。)注意计算节点挂载这个共享文件夹的路径也要是/opt
,这样才好统一配置。
我们的目标是把所有的软件和库都安装在管理节点的/opt
文件夹下,从而计算节点也自动获取了这些软件和库。所以,超算上的软件最好是源代码安装,不要用包管理器。不过,各个系统最好还是统一系统,并用包管理器统一安装一次gcc
,毕竟连gcc
都没有实在寸步难行。
这样安装的好处除了方便,不用做重复劳动之外,还避免了不同的节点安装的软件配置有差别,可能会出问题。