Descripción 

hyades.upv.es

Hyades.upv.es, el Cluster IBM 1350 está constituido por un conjunto de 60 servidores biprocesador Intel Xeon y sistema operativo Linux RedHat. Está compuesto de 57 nodos destinados a servicios de cálculo y tres nodos que realizan tareas fundamentales para el funcionamiento del cluster.

El cluster esta compuesto por:

57 nodos de computación.

Constituyen la parte central de computación dentro del cluster. El cluster está constituido por un conjunto de servidores Intel optimizados para rack. Son 57 servidores xSeries x335 de 2U, con dos procesadores Intel Xeon cada uno:

  • x335 2.40GHz/100MHz/512KB L2, 512MB Memory, 331W, HS Open bay
  • x335 Processor 2.4GHz/512KB Upgrade
  • 1GB PC2100 CL2.5 ECC DDR SDRAM RDIMM
  • 18.2GB 10K-RPM ULTRA 160 SCSI Hot-Swap SL HDD
  • Remote Supervisor Adaptor

2 nodos de almacenamiento.

Son dos nodos especializados, directamente conectados mediante conexiones de fibra óptica al servidor de discos de EMC2. Son 2 servidores xSeries x345 con estas caracteristicas.

  • x345 2.4GHz/512K MB, 256MB DDR Memory, Open Bay.
  • x345 Processor 2.4GHz/512KB Upgrade.
  • 1GB PC2100 CL2.5 ECC DDR SDRAM RDIMM
  • 18.2GB 10K-RPM ULTRA 160 SCSI Hot-Swap SL HDD
  • x345 Redundant Hot Swap Power Supply, 350W
  • Remote Supervisor Adaptor
  • FAStT200 Host Adapter (1GB/s)
  • ServeRAID-5i PCI SCSI Controller

1 nodo de gestión.

También conocido como nodo maestro o consola. Su función principal es controlar el cluster. Tiene un interfaz de red dedicado que se utiliza conectado a un red local privada para realizar las tareas propias de administración del conjunto. Es un servidor xSeries x345, cuyas principales características son:

  • x345 2.4GHz/512K MB, 256MB DDR Memory, Open Bay
  • x345 Processor 2.4GHz/512KB Upgrade
  • 1GB PC2100 CL2.5 ECC DDR SDRAM RDIMM
  • ServeRAID-5i Controller 7 (Ultra 320 or 160) (PCI Slot 2 only)
  • Remote Supervisor Adaptor
  • 36.4GB 10K-4 Ultra160 SCSI Hot-Swap SL HDD
  • x345 Redundant Hot Swap Power Supply, 350W
  • NetXtreme 1000 SX Fibre Ethernet adapter

Otros componentes del cluster

El cluster está alojado en dos racks estándar de 42U, uno primario y otro de expansión. El rack primario alberga la infraestructura hardware principal del cluster, nodo de gestión, nodos de almacenamiento, KVM switch, teclado, monitor y el switch de la Myrinet (red de alta velocidad), así como un conjunto de nodos de computación. Ambos racks albergan switches de Ethernet y servidores de terminales que proporcionan conectividad a todos los nodos incluidos en dicho rack.

Tarjetas RSA

El cluster está alojado en dos racks estándar de 42U, uno primario y otro de expansión. El rack primario alberga la infraestructura hardware principal del cluster, nodo de gestión, nodos de almacenamiento, KVM switch, teclado, monitor y el switch de la Myrinet (red de alta velocidad), así como un conjunto de nodos de computación. Ambos racks albergan switches de Ethernet y servidores de terminales que proporcionan conectividad a todos los nodos incluidos en dicho rack.

Cada nodo x335 lleva incorporado un procesador de servicio denominado Integrated Systems Management Processor encargado de monitorizar las condiciones del nodo (temperatura, velocidad del ventilador, voltaje ...), así como de permitir la gestión remota del nodo, generación de informes, arranque y parada remota ...etc.

El acceso a este procesador de servicio se realiza a través de un bus RS-845 formando varias conexiones en cadena. Un nodo en cada cadena está unido a un RSA. Esta tarjeta PCI está dotada de una fuente de alimentación externa y está conectada a la red de gestión del cluster por medio de su puerto Ethernet. Esta tarjeta permite realizar control remoto y detección de fallos en los nodos conectados a la red de gestión. En caso de que el nodo en el cual está instalada no tenga alimentación, su propia fuente de alimentación se la proporcionara. Cara adaptador RSA es capaz de manejar 24 nodos x335.

Almacenamiento externo

Los nodos de almacenamiento han sido configurados para acceder al dispositivo de almacenamiento proporcionado por la UPV y distribuido por EMC.

Red de Gestión

Todos los nodos del cluster están conectados a una red Ethernet 10/100 interna de gestión. Esta red se utiliza para gestionar el software, administrar y monitorizar los nodos y realizar instalaciones remotas. Como el cluster está constituido por dos racks, ambos están conectados por un switch gigabit localizado en el rack primario.

Myrinet

Los trabajos de computación paralela requieren la capacidad de transferir altos volúmenes de datos entre los nodos participantes sin que exista demora. Esta funcionalidad es proporcionada por la red Myrinet. Esta red funciona sobre conexiones de fibra óptica y proporciona velocidades de 2Gb, full-duplex. Un switch Myrinet en el rack primario conecta todos los nodos de computación y almacenamiento.

General Paralllel File System (GPFS)

El sistema de archivos GPFS proporciona a un gran número de nodos dentro de un cluster acceso fiable, en paralelo y a alta velocidad a un dispositivo de almacenamiento. Con ello se posibilita que varios nodos ejecutando Linux como sistema operativo puedan acceder al mismo sistema de archivos, incluso simultáneamente.

Cuando alguno de los nodos de computación necesita acceder a uno de estos discos el GPFS transfiere la petición al nodo primario (o al secundario según la situación) que será el encargado de realizar la operación de lectura o escritura en el disco.

El trafico de datos GPFS se lleva a cabo por medio de la red Mirynet.

Actualizado :  16 - Junio - 2004