引言

Torque是一个开源的作业队列系统,它允许用户将大型作业提交到服务器集群中执行。CentOS作为Linux发行版之一,因其稳定性和易用性而受到广泛欢迎。本文将指导您如何在CentOS上安装和配置Torque作业队列系统,让您轻松上手。

安装前准备

在开始安装之前,请确保您的CentOS系统满足以下要求:

  1. 集群RSH配通:确保所有节点之间可以通过RSH(远程shell)进行通信。
  2. NFS共享目录:在集群中创建一个NFS共享目录,用于放置Torque源包。

假设您已经满足了上述条件,以下是在CentOS上安装Torque作业队列系统的步骤。

1. 在管理节点上的安装

1.1 下载安装包

首先,从Torque官方网站下载最新版本的Torque安装包。例如,下载torque-6.2.0.tar.gz

wget https://www.adaptivecomputing.com/products/torque/download/6.2.0/torque-6.2.0.tar.gz

1.2 解压安装包

将下载的安装包解压到NFS共享目录。

tar -xzvf torque-6.2.0.tar.gz -C /public/sourcecode/

1.3 编译安装

进入解压后的目录,编译并安装Torque。

cd /public/sourcecode/torque-6.2.0
./configure --prefix=/usr/local/torque
make
make install

2. 配置Torque

2.1 配置Torque服务

编辑/usr/local/torque/etc/torque/torque.cfg文件,配置以下参数:

  • PBS_SERVER:设置为管理节点的IP地址。
  • PBS_SOCK:设置为管理节点的IP地址。
  • PBS_HOME:设置为Torque的安装目录。
  • PBS_MOM_PATH:设置为Torque的安装目录。

2.2 配置PBS服务器

编辑/usr/local/torque/etc/pbs_server/server_config.xml文件,配置以下参数:

  • server:设置管理节点的IP地址。
  • admin:设置管理节点的IP地址。

2.3 配置PBS妈妈进程

编辑每个计算节点的/usr/local/torque/etc/pbs_mom/mom_config.xml文件,配置以下参数:

  • server:设置为管理节点的IP地址。

2.4 启动Torque服务

在管理节点上,启动Torque服务。

service pbs_server start
service pbs_mom start

在计算节点上,启动PBS妈妈进程。

service pbs_mom start

3. 测试Torque

在管理节点上,运行以下命令测试Torque服务。

qstat

如果一切正常,您应该能看到一些状态信息。

总结

通过以上步骤,您已经在CentOS上成功安装和配置了Torque作业队列系统。现在,您可以开始提交作业并在集群中执行了。希望这篇文章能帮助您轻松上手Torque。