El superchip Grace Blackwell de Nvidia brilló con especificaciones brutas en su presentación. Ahora también tenemos una idea aproximada de lo grande que será
El superchip GB200 Grace Blackwell representa el último hito de Nvidia en el campo de la inteligencia artificial.
El sistema combina una CPU Grace con 72 núcleos ARM Neoverse V2 y dos GPU Blackwell en una sola placa. También dispone de memoria suficiente:GB200 Grace Blackwellpuede equiparse con hasta 372 GByte de memoria HBM3e a un ancho de banda de 16 TB/s.
Esta arquitectura se desarrolló especialmente para el entrenamiento y la inferencia de grandes modelos lingüísticos (LLM) con billones de parámetros. Sin embargo, es difícil comprender las dimensiones del superchip a partir de estos datos clave. Aquí es donde el Dr. Moritz Lehmann, que trabaja como ingeniero de software de GPU en Intel y también es conocido en Reddit con el seudónimo de «ProjectPhysX», aporta claridad.
Hands-on with the real big GPUs: GB200 NVL72 – Grace CPU + 2x B200 180GB on each node, connected by 130TB/s NVLink spine
poru/ProjectPhysX ennvidia
☻
- Aquí no hay medidas exactas, pero se puede ver (presumiblemente) la mano de Lehmann con un elegante saludo Vulcano, lo que da una comparación aproximada con el tamaño del monstruo GB200.
- Según Lehmann, un rack NVL72 con 18 de estos nodos cuesta la friolera de tres millones de dólares estadounidenses.
Grace Blackwell: la «columna vertebral» también lo tiene todo
También incluida en la galería de imágenes: La espina dorsal NVLink, que conecta todos los nodos entre sí. Sólo este elemento pesa unos 32 kilogramos. El peso no es casual: NVLink utiliza unos 5.000 cables con una longitud total de unos tres kilómetros
- Aquí se utiliza un ancho de banda de 130 terabytes por segundo. Según el consejero delegado de Nvidia, Jensen Huang, esto es suficiente para «mover más tráfico que todo Internet».
- El rendimiento es, en consecuencia, desorbitado. En términos de ancho de banda de la VRAM, un solo chip B200 ya es tres veces más rápido que la Geforce RTX 5090, por lo que el rack completo con sus 36 chips B200 tiene 36 veces más ancho de banda.
El superchip Grace Blackwell seguirá fallando en Crysis: faltan unidades de renderizado y trazado de rayos, por lo que el renderizado de juegos clásicos no es posible en absoluto.