3 kilometry kabli, ponad 30 kilogramów wagi i 3 miliony dolarów: tak wygląda nowy superchip Nvidii wraz z NVLink.

0
7

Superchip Grace Blackwell firmy Nvidia zachwycił podczas premiery imponującymi parametrami technicznymi. Teraz znane są już przybliżone wymiary tego urządzenia.

Superchip GB200 Grace Blackwell stanowi najnowszy kamień milowy firmy Nvidia w dziedzinie sztucznej inteligencji.

System łączy procesor Grace z 72 rdzeniami ARM Neoverse V2 i dwoma procesorami graficznymi Blackwell na jednej płytce. Zapewniono również wystarczającą ilość pamięci: GB200 Grace Blackwell można wyposażyć w nawet 372 GB pamięci HBM3e o przepustowości 16 TB/s.

Architektura ta została opracowana specjalnie do szkolenia i wnioskowania w przypadku dużych modeli językowych (LLM) z bilionami parametrów. Na podstawie tych danych trudno jednak ogarnąć rozmiar superchipa. Wyjaśnia to dr Moritz Lehmann, inżynier oprogramowania GPU w firmie Intel, znany na Reddicie pod pseudonimem „ProjectPhysX”.

Praktyczne doświadczenia z naprawdę dużymi procesorami graficznymi: GB200 NVL72 – procesor Grace + 2x B200 180 GB na każdym węźle, połączone magistralą NVLink o przepustowości 130 TB/s
autor:u/ProjectPhysX wnvidia

  • Nie ma tu dokładnych wymiarów, ale (prawdopodobnie) widać dłoń Lehmanna z charakterystycznym pozdrowieniem Vulkan, co pozwala na przybliżone porównanie wielkości potwora GB200.
  • Według Lehmanna, stojak NVL72 z 18 takimi węzłami kosztuje aż trzy miliony dolarów.

Grace Blackwell: „kręgosłup” również ma w sobie coś wyjątkowego

Również na zdjęciach: NVLink-Spine, który łączy wszystkie węzły. Sam ten element waży około 32 kilogramy. Waga ta nie jest przypadkowa: NVLink wykorzystuje około 5000 kabli o łącznej długości około trzech kilometrów.

  • Wykorzystywana jest tu przepustowość 130 terabajtów na sekundę. Według prezesa Nvidii, Jensena Huanga, wystarczy to do „przesłania większego ruchu niż cały Internet”.
  • Wydajność jest odpowiednio ogromna. Pojedynczy układ B200 jest już trzy razy szybszy niż Geforce RTX 5090 pod względem przepustowości VRAM – cała szafa z 36 układami B200 osiąga więc 36-krotną przepustowość.

Grace Blackwell Superchip nie poradzi sobie jednak z grą Crysis: brakuje jednostek renderujących i ray tracingu, więc klasyczne renderowanie gier nie jest możliwe.