O superchip Grace Blackwell da Nvidia brilhou na sua apresentação com especificações impressionantes. Agora já temos uma ideia aproximada do tamanho da peça.
O superchip GB200 Grace Blackwell representa o mais recente marco da Nvidia no campo da inteligência artificial.
O sistema combina uma CPU Grace com 72 núcleos ARM Neoverse V2 e duas GPUs Blackwell numa única placa. Também há memória suficiente: o GB200 Grace Blackwell pode ser equipado com até 372 GB de memória HBM3e com uma largura de banda de 16 TB/s.
Esta arquitetura foi desenvolvida especificamente para o treino e a inferência de modelos de linguagem grande (LLMs) com trilhões de parâmetros. No entanto, é difícil compreender a dimensão do superchip a partir destes dados básicos. O Dr. Moritz Lehmann, engenheiro de software de GPU da Intel e conhecido no Reddit pelo pseudónimo «ProjectPhysX», esclarece esta questão.
Experiência prática com as verdadeiras GPUs de grande dimensão: GB200 NVL72 – Grace CPU + 2x B200 180 GB em cada nó, conectados por 130 TB/s NVLink spine
poru/ProjectPhysX emnvidia
☻
- Não há medidas exatas aqui, mas (presumivelmente) é possível ver a mão de Lehmann com o típico cumprimento vulcano, o que dá uma comparação aproximada do tamanho do monstro GB200.
- Segundo Lehmann, um rack NVL72 com 18 desses nós custa nada menos que três milhões de dólares americanos.
Grace Blackwell: A «coluna vertebral» também tem o seu quinhão
Também incluído na galeria de imagens: o NVLink-Spine, que conecta todos os nós entre si. Só este elemento pesa cerca de 32 quilos. O peso não é por acaso: o NVLink utiliza cerca de 5.000 cabos, com um comprimento total de cerca de três quilómetros.
- Aqui é utilizada uma largura de banda de 130 terabytes por segundo. De acordo com o CEO da Nvidia, Jensen Huang, isso é suficiente para «movimentar mais tráfego do que toda a Internet».
- O desempenho é, portanto, exorbitante. Um único chip B200 é, no contexto da largura de banda VRAM, já três vezes mais rápido que a Geforce RTX 5090 – o rack completo, com seus 36 chips B200, atinge assim 36 vezes a largura de banda.
No Crysis, o Grace Blackwell Superchip ainda assim falhará: faltam unidades de renderização e ray tracing, de modo que a renderização clássica de jogos não é possível.