在计算节点配置好之后,会安装操作系统(OS)分布、Platform LSF套件(工作负载管理代理、监控和资源管理代理)、Platform MPI套件以及其他定制软件(用户定义)。这个计算节点中可以有一些本地磁盘用于操作系统和临时存储运行应用。也可以配置操作系统在无盘系统上启动,以提高I/O性能(使用无状态配置)。
计算节点还加载NFS,或者可以配置GPFS实现共享存储。这些计算节点可以协同工作使用MPI解决问题。这是由连接到高速互连网络实现的。一些应用在模拟过程中不要求每个计算节点上必须有大磁盘存储空间。不过,大型模型可能不适合可用的内存空间,必须在核心外解决,然后从强大的本地存储中受益。
可视化节点
可视化节点和计算节点一样,但它包含一个或者多个图形处理单元(GPU)以渲染3D图形、计算机辅助工程(CAE)设计、产品部件动态模拟验证、或者单个组件上的应力分析。每个GPU是否可以支持多个并发的互动片段取决于应用。
预处理和后处理应用大多是连续的,因此,这个节点中应该有足够的处理器资源来应对计算要求。可视化节点通常有一些本地磁盘空间用于操作系统和运行应用的临时存储。可视化节点还加载NFS或者GPFS文件系统实现共享存储。
登录节点
登录节点的功能是作为到集群的网关。当用户希望通过公共网络访问集群的时候,他们必须在可以登录到其他集群节点之前首先登录到登录节点。一般情况下,我们建议使用这个方法作为防止管理节点未授权访问的最佳实践。
集群网络
PHPC集群中使用了多个网络。每个集群可能都有一个专门的网络,或者与其他集群共享一个公共网络。
公共网络
公共网络将PHPC集群连接到公司网络。
配置网络
配置网络(专有网络)是一个内部网络,配置和管理集群节点。公共网络上的节点不能访问配置网络,配置网络通常是千兆以太网。一般情况下,配置网络有以下用途:
-集群管理和监控
-工作负载管理和监控
-消息传递
通常的做法是使用一个高速低延迟的互连网络来传递消息。
管理网络
管理网络(BMC网络)是一个提供了带外部访问集群节点以管理硬件的网络。这个网络提供了对每个集群节点的CMM和IMM的访问。公共网络上的节点不能访问管理网络。(如果需要公共访问,可配置切换到公共网络以实现公共网络和管理网络之间的路由。)
应用网络
这个网络(计算网络)主要是被应用(例如MPI应用)用来跨多个节点的一个应用内不同任务间有效共享数据的。这个网络通常用于应用访问共享存储的一个数据路径。应用网络使用了一个高速互连,例如10Gb/40Gb以太网或者QDR/FDR InfiniBand。
如果PHPC集群包括一个可视化节点,那就必须有一个从外部网络到计算网络的路由。如果系统是只针对批量工作安装的话就没有必要使用这个路由了(除了管理节点)。可能使用虚拟本地局域网络(VLAN)将这些网络结合起来。
|