En la feria internacional de supercomputadoras (ISC 2022), HPE demostró sistemas blade que impulsarán dos supercomputadoras a exaescala programadas para entrar en funcionamiento este año: Frontier y Aurora. Desafortunadamente, HPE tuvo que usar hardware sofisticado que consume mucha energía para lograr un rendimiento informático sin precedentes. Por lo tanto, ambas máquinas usan refrigeración líquida, pero incluso los bloques de agua masivos no pueden ocultar algunas peculiaridades de diseño interesantes que presentan las aspas.
Las supercomputadoras Frontier y Aurora están construidas por HPE utilizando su arquitectura Cray EX. Si bien las máquinas han aprovechado el hardware AMD e Intel, respectivamente, utilizan CPU x86 de alto rendimiento para ejecutar tareas generales y aceleradores de cómputo basados en GPU para ejecutar cargas de trabajo de IA y supercomputación altamente paralelas.
La supercomputadora Frontier se basa en HPE Nodos Cray EX235a (Se abre en una pestaña nueva) impulsado por dos procesadores AMD EPYC ‘Trento’ de 64 núcleos, con la microarquitectura Zen 3 de la compañía mejorada con 3D V-Cache y optimizada para altas frecuencias. Frontier Blades también viene con ocho de los aceleradores Instinct MI250X de AMD (se abre en una pestaña nueva) con 14,080 procesadores de flujo y 128 GB de memoria HBM2E. Cada nodo ofrece un rendimiento máximo de vector FP64/FP32 de aproximadamente 383 TFLOPS y un rendimiento máximo de matriz FP64/FP32 de 765 aproximadamente 765 TFLOPS. Tanto las CPU como las GPU de cómputo utilizadas por Frontier Blade de HPE utilizan un sistema de refrigeración líquida unificado con dos boquillas en la parte frontal del nodo.
O Aurora Blade (se abre en una pestaña nueva) actualmente se llama así, lleva una insignia de Intel y todavía no tiene el número de modelo de HPE Cray Ex, posiblemente porque todavía necesita un poco de pulido. Los HPE Aurora Blades utilizan dos procesadores Intel Xeon Scalable ‘Sapphire Rapids’ con más de 40 núcleos y 64 GB de memoria HBM2E por zócalo (además de la memoria DDR5). Los nodos también cuentan con los seis aceleradores Ponte Vecchio de Intel (se abre en una pestaña nueva), pero Intel no habla sobre las especificaciones exactas de estas bestias que contienen más de 100 mil millones de transistores cada una (se abre en una pestaña nueva).
Una cosa que se destaca con el juego de cuchillas Aurora para usar con las 2 supercomputadoras ExaFLOPS Aurora (se abre en una nueva pestaña) son las misteriosas cajas negras con un letrero triangular de «superficie caliente» ubicadas junto a las CPU Sapphire Rapids y la computación Ponte Vecchio. No sabemos qué son, pero pueden ser sofisticados circuitos modulares de suministro de energía para mayor flexibilidad. Después de todo, en el pasado, los VRM eran extraíbles (opens in a new tab), por lo que usarlos para componentes que consumen mucha energía aún podría tener sentido hoy (suponiendo que se cumplan las tolerancias de voltaje correctas), especialmente con hardware preconstruido. -producción .
(Crédito de la imagen: Intel)
Nuevamente, la hoja Aurora usa refrigeración líquida para sus CPU y GPU, aunque este sistema de enfriamiento es completamente diferente al que usan las hojas Frontier. Curiosamente, parece que las GPU de cómputo Ponte Vecchio en el blade Aurora usan bloques de agua diferentes a los que mostró Intel (se abre en una pestaña nueva) hace unas semanas, aunque solo podemos preguntarnos cuáles son las posibles razones de esto.
Curiosamente, los módulos de memoria DDR5 que usan los blades basados en Intel vienen con disipadores de calor bastante formidables que se sienten más grandes que los que se usan en los módulos de memoria para entusiastas. Teniendo en cuenta que los DDR5 RDIMM también cuentan con un IC de administración de energía y un módulo regulador de voltaje, naturalmente necesitan una mejor refrigeración que los módulos DDR4, especialmente en entornos con limitaciones de espacio, como los servidores blade.