NvidiaのGrace Blackwellスーパーチップは、発表時に圧倒的な仕様で注目を集めました。現在、そのサイズのおおよその目安も明らかになりました。
GB200 Grace Blackwell スーパーチップは、Nvidia の人工知能分野における最新の成果です。
このシステムは、72 個の ARM Neoverse-V2 コアを搭載した Grace CPU と 2 個の Blackwell GPU を 1 枚の基板に組み込んでいます。十分なメモリも確保されています。GB200 Grace Blackwell は、最大 372 GB の HBM3e メモリと 16 TB/s の帯域幅を搭載可能です。
このアーキテクチャは、兆単位のパラメータを持つ大規模言語モデル(LLM)のトレーニングと推論のために特別に設計されています。しかし、これらの基本データだけでは、このスーパーチップの規模を把握することは困難です。ここで、Intel の GPU ソフトウェアエンジニアであり、Reddit では「ProjectPhysX」というハンドルネームで知られる Moritz Lehmann 博士が、その全容を明らかにしています。
実際の大型 GPU を体験: GB200 NVL72 – Grace CPU + 2x B200 180GBを各ノードに搭載、130TB/s NVLinkスパインで接続
byu/ProjectPhysX innvidia
☻
- 正確な寸法は不明ですが、おそらくレマンの手がスタイル通りのボルカン式挨拶をしているのが見え、GB200モンスターの大きさの目安になります。
- レマンによると、18個のノードを搭載したNVL72ラックの価格は、驚きの300万米ドルです。
グレイス・ブラックウェル:脊椎部分にも驚きの構造
画像ギャラリーにも含まれているのは、すべてのノードを接続するNVLinkスパインです。この部品だけで約32キログラムの重量があります。この重量は偶然ではありません:NVLinkは、総延長約3キロメートルの約5,000本のケーブルを使用しています。
- ここでは、1秒あたり130テラバイトの帯域幅が使用されています。NvidiaのCEOであるジェンセン・フアン氏によると、これは「インターネット全体のトラフィックよりも多くのデータを処理できる」十分な容量です。
- パフォーマンスはそれに応じて驚異的です。単一のB200チップは、VRAM帯域幅の観点から既にGeForce RTX 5090の3倍の速度を誇り、36個のB200チップを搭載した全体ラックは36倍の帯域幅を実現しています。
しかし、Grace Blackwell SuperchipはCrysisでは失敗するでしょう:レンダリングとレイトレーシングユニットが欠如しているため、伝統的なゲームレンダリングは不可能だからです。