Nvidia的Grace Blackwell超级芯片在发布会上以惊人的规格参数大放异彩。现在,人们对这款芯片的具体尺寸也有了大致了解。
GB200 Grace Blackwell 超级芯片是 Nvidia 在人工智能领域的新里程碑。
该系统将 Grace CPU 与 72 个 ARM Neoverse-V2 核心和两个 Blackwell GPU 整合到一块电路板上。存储空间也足够:GB200 Grace Blackwell 可配备高达 372 GB 的 HBM3e 存储器,带宽为 16 TB/s。
该架构专为训练和推断具有数万亿参数的大语言模型 (LLM) 而设计。但仅凭这些基本数据,很难理解这款超级芯片的尺寸。英特尔 GPU 软件工程师 Moritz Lehmann 博士(在 Reddit 上以“ProjectPhysX”为笔名)对此进行了详细解释。
亲身体验真正的大型 GPU: GB200 NVL72 – Grace CPU + 每个节点 2x B200 180GB,通过 130TB/s NVLink 脊柱连接
作者:u/ProjectPhysX 在nvidia
☻
- 虽然这里没有具体的尺寸数据,但(据推测)可以看到莱曼的手以典型的火神敬礼姿势,可以大致对比一下 GB200 怪兽的大小。
- 据莱曼称,一个配备 18 个此类节点的 NVL72 机架售价高达 300 万美元。
格蕾丝·布莱克韦尔: “脊柱”也非同小可
图片中还有:将所有节点连接在一起的 NVLink 脊柱。仅这个部件就重达 32 公斤。重量并非无故:NVLink 使用约 5,000 条电缆,总长度约为 3 公里。
- 这里使用的是每秒 130 太字节的带宽。据 Nvidia 首席执行官 Jensen Huang 称,这足以“处理超过整个互联网的流量”。
- 性能也相应地非常出色。就 VRAM 带宽而言,单个 B200 芯片的速度已经是 Geforce RTX 5090 的三倍——因此,整个机架配备 36 个 B200 芯片,带宽达到 36 倍。
然而,Grace Blackwell 超级芯片在《孤岛危机》中仍将失败:由于缺少渲染和光线追踪单元,经典游戏渲染根本无法实现。