Суперчип Grace Blackwell от Nvidia блеснул при презентации своими впечатляющими характеристиками. Теперь появилось примерное представление о размерах этого устройства.
Суперчип GB200 Grace Blackwell представляет собой новейшее достижение Nvidia в области искусственного интеллекта.
Система сочетает в себе процессор Grace с 72 ядрами ARM Neoverse V2 и два графических процессора Blackwell на одной плате. Достаточный объем памяти также обеспечен: GB200 Grace Blackwell может быть оснащен до 372 ГБ памяти HBM3e с пропускной способностью 16 ТБ/с.
Эта архитектура была специально разработана для обучения и инференции больших языковых моделей (LLM) с триллионами параметров. Однако на основе этих основных данных трудно представить себе размеры суперчипа. Здесь проясняет ситуацию доктор Мориц Леманн, инженер по программному обеспечению GPU в Intel, известный на Reddit под псевдонимом «ProjectPhysX».
Практический опыт работы с действительно большими графическими процессорами: GB200 NVL72 — процессор Grace + 2x B200 180 ГБ на каждом узле, соединенные магистралью NVLink со скоростью 130 ТБ/с
byu/ProjectPhysX вnvidia
☻
- Точных размеров здесь нет, но (предположительно) можно разглядеть руку Лемана со стильным приветствием вулкани, что дает примерное представление о размерах монстра GB200.
- По словам Леманна, стойка NVL72 с 18 такими узлами стоит целых три миллиона долларов США.
Грейс Блэквелл: «Позвоночник» тоже имеет свои особенности
Также в фотогалерее: NVLink-Spine, который соединяет все узлы между собой. Один только этот элемент весит около 32 килограммов. Вес не случаен: NVLink использует около 5000 кабелей, общая длина которых составляет около трех километров.
- Здесь используется пропускная способность 130 терабайт в секунду. По словам генерального директора Nvidia Дженсена Хуанга, этого достаточно, чтобы «переместить больше трафика, чем весь Интернет».
- Соответственно, производительность получается заоблачной. Один чип B200 в контексте пропускной способности VRAM уже в три раза быстрее, чем Geforce RTX 5090, а весь рэк с 36 чипами B200 имеет пропускную способность в 36 раз больше.
Тем не менее, Grace Blackwell Superchip не справится с Crysis: в нем отсутствуют модули рендеринга и трассировки лучей, поэтому классический игровой рендеринг невозможен.