3公里长的电缆,重量超过30公斤,价值300万美元:这就是Nvidia新款超级芯片连同NVLink的模样

0
7

Nvidia的Grace Blackwell超级芯片在发布会上以惊人的规格参数大放异彩。现在,人们对这款芯片的具体尺寸也有了大致了解。

GB200 Grace Blackwell 超级芯片是 Nvidia 在人工智能领域的新里程碑。

该系统将 Grace CPU 与 72 个 ARM Neoverse-V2 核心和两个 Blackwell GPU 整合到一块电路板上。存储空间也足够:GB200 Grace Blackwell 可配备高达 372 GB 的 HBM3e 存储器,带宽为 16 TB/s。

该架构专为训练和推断具有数万亿参数的大语言模型 (LLM) 而设计。但仅凭这些基本数据,很难理解这款超级芯片的尺寸。英特尔 GPU 软件工程师 Moritz Lehmann 博士(在 Reddit 上以“ProjectPhysX”为笔名)对此进行了详细解释。

亲身体验真正的大型 GPU: GB200 NVL72 – Grace CPU + 每个节点 2x B200 180GB,通过 130TB/s NVLink 脊柱连接
作者:u/ProjectPhysXnvidia

  • 虽然这里没有具体的尺寸数据,但(据推测)可以看到莱曼的手以典型的火神敬礼姿势,可以大致对比一下 GB200 怪兽的大小。
  • 据莱曼称,一个配备 18 个此类节点的 NVL72 机架售价高达 300 万美元。

格蕾丝·布莱克韦尔: “脊柱”也非同小可

图片中还有:将所有节点连接在一起的 NVLink 脊柱。仅这个部件就重达 32 公斤。重量并非无故:NVLink 使用约 5,000 条电缆,总长度约为 3 公里。

  • 这里使用的是每秒 130 太字节的带宽。据 Nvidia 首席执行官 Jensen Huang 称,这足以“处理超过整个互联网的流量”。
  • 性能也相应地非常出色。就 VRAM 带宽而言,单个 B200 芯片的速度已经是 Geforce RTX 5090 的三倍——因此,整个机架配备 36 个 B200 芯片,带宽达到 36 倍。

然而,Grace Blackwell 超级芯片在《孤岛危机》中仍将失败:由于缺少渲染和光线追踪单元,经典游戏渲染根本无法实现。