60
TensorWaveは北米最大のAMD GPUトレーニングクラスターを導入しました。直接液体冷却で制御された8,192個のMI325X AIアクセラレーターを備えています。
TensorWaveのAI GPUスーパークラスターは、8,192個のMI325Xアクセラレーターを搭載しています。
(画像提供:TensorWave)

AIインフラ企業TensorWaveは、AMDの最新Instinct MI325Xアクセラレータを搭載した8,192基のGPUを搭載した大規模クラスターの導入を発表しました。これは北米におけるAMDベースのAIトレーニングシステムとしては最大規模となる見込みです。このシステムは直接水冷方式を採用しており、この規模のシステムとしては初の公開導入となります。Xで発表されたTensorWaveは、鮮やかなオレンジ色の冷却ループを備えた高密度ラックの写真を公開し、システムが現在完全に稼働していることを確認しました。

8,192基の液冷式MI325X GPU。北米最大のAMD GPUトレーニングクラスター。TensorWaveによって構築。次なる展開に備えよ🌊 pic.twitter.com/RlFY4v2JDu 2025年7月12日

このGPUは、NvidiaのH200と比べてはるかに安価でありながら、堂々とその地位を築いています。しかし、その代償として、Green Teamの72基に対して8基というクラスター数制限という形で、他の部分でその代償を支払っています。これがTensorWaveがなかなか普及しなかった主な理由の一つであり、まさにTensorWaveのアプローチを非常に興味深いものにしているのです。TensorWaveは、ノードあたりのスケールで競合するのではなく、ラックあたりの熱ヘッドルームと密度に重点を置きました。クラスター全体は、独自のチップ直結型液体冷却ループを中心に構築されており、鮮やかなオレンジ色(時には黄色?)のチューブを使って、各MI325Xに直接取り付けられたコールドプレートを通して冷却液を循環させています。

GPU 1基あたり1,000ワットの電力を消費するため、このハードウェアのほんの一部を動かすだけでも高度なエンジニアリングが必要です。ありがたいことに、16ピン電源コネクタは見当たりません。いずれにせよ、合計8,192基のGPUは、2ペタバイト/秒を超えるメモリ帯域幅と、推定21エクサフロップスのFP8スループットを実現します。ただし、持続的なパフォーマンスは、モデルの並列性(AIモデルを複数のGPUに分割すること)と相互接続設計に大きく依存します。TensorWaveのビジネスモデルはクラウド容量のレンタルであるため、モデルのスケーリングという真の課題はテナント自身に委ねられています。

AMD Instinct MI355Xの発表とMI325Xの発売

(画像提供:AMD)

今回の導入は、AMD VenturesとMagnetarが主導した、TensorWaveが5月に実施した1億ドルのシリーズAラウンドに続くものです。NVIDIAハードウェアを主力とする多くのクラウドベンダーとは異なり、TensorWaveはAMDに全面的に注力しています。これは価格の柔軟性だけでなく、ROCmが本格的なモデルトレーニングに十分な成熟度に達していると考えているためです。もちろん、NVIDIAは依然として市場を支配しています。同社のB100およびH200アクセラレーターはAWSからCoreWeaveまであらゆる場所で利用されており、AIブーム全体がNVIDIAによって支えられているように見えますが、今回の展開はAMDのAI分野における足場にとって明るい兆しを示しています。

そのため、TensorWaveの導入は一度限りのものではありません。チームによると、これはより大規模な展開の第1段階であり、今年後半にはAMDのMI350Xを統合する予定です。CDNA 4をベースにしたこのチップは、FP4およびFP6の精度サポート、より高い帯域幅の上限、そしてチップあたり最大1,400Wに達する可能性のあるより消費電力の高い設計を導入しています。これは空冷だけでは制御できないレベルであるため、TensorWaveはすでに正しい方向に進んでいるように見えます。ROCmスタックにはまだ改善の余地がありますが、既に8,192基のMI325X GPUが液冷下で稼働していることから、AMDはついに同等の地位を確立したと言えるでしょう。

Google ニュースで Tom's Hardware をフォローすると、最新のニュース、分析、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ハッサム・ナシルは、長年の技術編集者兼ライターとしての経験を持つ、熱狂的なハードウェア愛好家です。CPUの詳細な比較やハードウェア全般のニュースを専門としています。仕事以外の時間は、常に進化を続けるカスタム水冷式ゲーミングマシンのためにチューブを曲げたり、趣味で最新のCPUやGPUのベンチマークテストを行ったりしています。