关于集群作业管理系统 Maui,PBS和Torque

Maui集群调度器是Moab集群套件前身,是一个开放源码的集群和超级计算机作业调度器(scheduler)。 PBS是一个用于作业分配的调度器(scheduler),其主要任务是分配批作业计算任务到现有的计算资源上。 以下版本的PBS系统目前可用: OpenPBS:没有技术支持的原始开源版本; PBSPro(PBS专业版):由Altair Engineering发行和支持的商业版本; Torque:衍生的OpenPBS,由Cluster Resources Inc.发展,支持和维护

2009年6月19日星期五

资源调度软件Condor介绍

Condor是一个专门用于计算密集型作业的负载管理系统。像其他功能齐全的批处理系统一样,Condor提供了作业排队机制,调度策略,优先计划,资源监测和资源管理。用户提交他们的串行或并行工作给Condor,Condor把他们放到一个队列中,根据某种策略选择时间和地点来执行作业,仔细监测其进展情况,并最终通知用户完成。

除了提供类似于传统的批处理排队系统功能,Condor新颖的架构使它能够在传统的调度系统无法获得成功的地方取得成功。Condor可以用来管理包含专用计算节点的管理群集(如“Beowulf”集群)。(mauichina.blgospot.com上有beowulf集群介绍)除此此外,Condor独特的机制,使其可以有效地利用其他闲置台式工作站CPU处理能力。例如,Condor可以配置为只使用键盘和鼠标是闲置的台式机。如果Condor检测到一台机器不再可用(如通过按键检测),在许多情况下COndor能够透明的产生一个check point和并把作业迁移到其他闲置的机器上。Condor不要求机器间的共享文件系统-如果没有共享文件系统,Condor可以为用户传送数据文件,或Condor可以透明地重定向所有工作的I / O请求回到提交机。因此,Condor用于无缝结合一个组织的所有的计算能力成一个资源。

没有评论: