
Hot Chips 2024トレードショーの開始に先立ち、NvidiaはBlackwellプラットフォームのより多くの要素を披露しました。サーバーの設置と構成の様子も含まれています。これは、Blackwellが遅延を気にすることなく、まだ登場することを示唆する、控えめな表現と言えるでしょう。また、既存のHopper H200ソリューションについても紹介し、新しいQuasar Quantization Systemを使用したFP4 LLM最適化を実演しました。さらに、データセンター向けの温水液体冷却について説明し、AIを活用してAI向けにさらに優れたチップを開発することについても言及しました。Blackwellは単なるGPUではなく、プラットフォームとエコシステム全体であることを改めて強調しました。
Hot Chips 2024でNvidiaが発表する内容の多くは既に明らかになっています。例えば、データセンターとAIのロードマップでは、Blackwell Ultraが来年、Vera CPUとRubin GPUが2026年に、そしてVera Ultraが2027年に登場することが示されています。Nvidiaはこれらの詳細を6月のComputexで初めて発表しました。しかし、AIは依然として大きな話題であり、NvidiaはAIへの取り組みを積極的に推進していくつもりです。
画像
1
の
9

Blackwellの発売は3ヶ月遅れると報じられましたが、Nvidiaはその情報を肯定も否定もせず、Blackwellシステムの設置画像や、Blackwell GB200ラックとNVLinkスイッチの内部ハードウェアの詳細を示す写真やレンダリング画像を公開しました。このハードウェアは消費電力が大きく、かなり強力な冷却システムを備えているように見える以外、特筆すべき点はありません。また、非常に高価にも見えます。
NVIDIAは、既存のH200をNVSwitchの有無で動作させた場合のパフォーマンス結果も公開しました。推論ワークロードでは、ポイントツーポイント設計(Llama 3.1 70Bパラメータモデルを使用)と比較して、最大1.5倍のパフォーマンス向上が見込めるとしています。BlackwellはNVLink帯域幅を2倍にすることでさらなる性能向上を実現し、NVLinkスイッチトレイは合計14.4TB/sの帯域幅を提供します。
データセンターの電力需要が増加し続けているため、NVIDIAはパートナー企業と協力してパフォーマンスと効率性の向上に取り組んでいます。有望な成果の一つは温水冷却です。温水を循環させて加熱することでコストをさらに削減できる可能性があります。NVIDIAは、この技術によりデータセンターの電力使用量が最大28%削減されたと主張しており、その大部分は常温以下の冷却ハードウェアの削減によるものです。
画像
1
の
12

上記はNVIDIAのプレゼンテーションのスライド全文です。他にもいくつか注目すべき点があります。
ネイティブFP4サポートを追加し、パフォーマンスをさらに向上させたBlackwellに備え、NVIDIAは最新ソフトウェアが精度を犠牲にすることなく新しいハードウェア機能のメリットを活用できるように取り組んできました。Quasar Quantization Systemを用いてワークロードの結果を調整した結果、NVIDIAはFP16とほぼ同等の品質を、4分の1の帯域幅で実現しています。生成された2つのウサギの画像には若干の違いがありますが、これはStable Diffusionのようなテキスト画像変換ツールではよくあることです。
NVIDIAは、AIツールを活用してより優れたチップを設計することについても言及しました。AIがAIを構築する、まさに「亀の巣」のような状況です。NVIDIAは社内向けにLLM(ローカライズ・レベル・モデリング)を開発し、設計、デバッグ、解析、最適化のスピードアップに貢献しています。このLLMは回路記述に使用されるVerilog言語と連携し、2080億トランジスタを搭載したBlackwell B200 GPUの開発において重要な役割を果たしました。このLLMは、NVIDIAが次世代Rubin GPUやそれ以降のGPUの開発に活用できるよう、より優れたモデルの開発に活用される予定です。[この辺りで、スカイネットに関するジョークを自由に挿入してください。]
最後に、NVIDIAの今後数年間のAIロードマップについて、より鮮明な画像が得られました。このロードマップでは、スイッチとインターリンクを統合した「Rubinプラットフォーム」が改めて定義されています。NVIDIAは来週開催されるHot Chipsカンファレンスで、Blackwellアーキテクチャ、コンピューター支援エンジニアリング(CAE)における生成AIの活用、そして液体冷却について、より詳細な情報を発表する予定です。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
ジャレッド・ウォルトンは、Tom's Hardwareのシニアエディターで、GPU全般を専門としています。2004年からテクノロジージャーナリストとして活躍し、AnandTech、Maximum PC、PC Gamerなどで執筆活動を行っています。初代S3 Virgeの「3Dデセラレータ」から最新のGPUまで、ジャレッドは最新のグラフィックストレンドを常に把握しており、ゲームパフォーマンスに関する質問は彼にお任せください。