Tachyum ha creado uno de los procesadores más potentes del mundo: el procesador universal Prodigy T16128. El Prodigy T16128 cuenta con 128 núcleos de CPU de 64 bits que funcionan a hasta 5,7 GHz, 16 controladores de memoria DDR5 y 64 carriles PCIe 5.0 y puede manejar computación de propósito general, computación de alto rendimiento (HPC) e IA, todo en un solo chip.
Tachyum llama a Prodigy el primer «procesador universal» del mundo y dice que fue diseñado desde cero para ser una CPU todo en uno capaz de ejecutar una multitud de las aplicaciones más intensivas en computación del mundo. Prodigy no solo maneja todas estas tareas diferentes en un solo chip, sino que lo hace con un presupuesto de energía 10 veces menor que el hardware tradicional, y a un tercio del costo.
Tachyum afirma audazmente que el chip de supercomputadora Prodigy ofrece cuatro veces el rendimiento del Xeon más rápido de Intel en el mercado y triplica el rendimiento bruto del H100 de Nvidia en aplicaciones informáticas de alto rendimiento. Todo esto siendo 10 veces más eficiente energéticamente.
Para crear un rendimiento tan impresionante en una arquitectura de un solo núcleo, Tachyum dice que construyó Prodigy con capacidades de procesamiento vectorial y de matriz desde cero, en lugar de convertirlas en una ocurrencia tardía. Prodigy admite una variedad de tipos de datos, incluidos FP64, FP32, TF32, BF16, Int8, FP8 y TAI, todos desde sus propios núcleos de CPU individuales.
Los procesadores Prodigy podrían cambiar el juego cuando lleguen en 2023. El último hardware de servidor de AMD, Intel y Nvidia se basa en piezas de hardware individuales, incluso dentro de una sola CPU o GPU, para ejecutar estas diferentes cargas de trabajo. Un ejemplo de esto son las GPU de la serie RTX de Nvidia, que requieren núcleos Tensor de aprendizaje automático dedicados para que la IA funcione y núcleos RT dedicados para aplicaciones de trazado de rayos.
Prodigy, por otro lado, podrá ejecutar aplicaciones de trazado de rayos e inteligencia artificial en núcleos individuales y no necesitará desviar datos a otro chip dentro del microprocesador.
Ejecutar todas estas diferentes cargas de trabajo de HPC en un solo chip podría cambiar drásticamente el panorama de los servidores: las empresas podrían empaquetar muchos más chips en una granja de servidores con menores requisitos de energía y menos refrigeración.
El Prodigy T16128 funciona con tecnología de proceso de 5 nm de origen desconocido y funciona dentro de un paquete FCLGA muy pequeño (para la potencia que proporciona) de 64 mm x 84 mm FCLGA. Tachyum dice que el chip es capaz de ejecutar 12 PetaFLOPS AI y 90 TeraFLOPS cuando se trata de cargas de trabajo de HPC. El chip Prodigy también puede ejecutar binarios para x86, ARM, RISC-V e ISA. Desde cierta perspectiva, una sola Nvidia A100 solo es capaz de 5 PetaFLOPS AI.
Cada núcleo es específicamente capaz de 2 unidades vectoriales de 1024 bits, operaciones de matriz de 4096 bits y 4 instrucciones fuera de orden por reloj. También se admiten la virtualización y RAS avanzado. El chip también incluye más de 128 MB de caché L2+L3 con capacidades de corrección de errores. Para alimentar todos sus núcleos, el chip viene con 16 controladores de memoria DDR5 clasificados para hasta 7200 MT/s con una capacidad máxima de 8 TB por socket.
El T16128 es el modelo insignia de la línea Prodigy de Tachyum, con el T864 de 64 núcleos y el T832 de 32 núcleos ocupando las ranuras media y base, respectivamente, en la pila de productos. La producción comienza en 2023, por lo que deberíamos ver puntos de referencia reales de estos chips el próximo año.






