70
Huawei が Atlas 950 SuperCluster を発表 — 1 ZettaFLOPS の FP4 パフォーマンスを約束し、数十万の…
ファーウェイ
(画像提供:Huawei)

ファーウェイは木曜日に開催されたカンファレンス「Huawei Connect 2025」において、AI推論で1FP4ゼタフロップス、AIトレーニングで524FP8エクサフロップスを実現する次世代データセンター規模のAIソリューションを発表しました。この新しいSuperCluster 950システムは、同社のAscend 950DTニューラル・プロセッシング・ユニット(NPU)を数十万基搭載し、世界で最も強力なAI向けスーパーコンピュータの一つとなることが期待されています。ファーウェイは、SuperClusterが2026年後半にNVIDIAのRubinベース・システムと競合するようになることを期待しています。

大規模なパフォーマンス

このスーパーコンピュータは、AIトレーニング用に最大524 FP8エクサフロップス、AI推論(MXFP4)用に最大1 FP4ゼタフロップスを提供するとされており、これは、昨年発表された131,072基のB200 GPUを搭載し、推論用に最大2.4 FP4ゼタフロップスのピーク性能を提供するOracleのOCI Superclusterなどの最先端のAIスーパーコンピュータにわずかに劣る性能です。ただし、これらの数値はピーク性能に関するものであり、実際に実現可能かどうかはまだ不明です。

このSuperClusterは、RoCE(Remote Direct Memory Access over Converged Ethernet)とHuawei独自のUBoE(UnifiedBus over Ethernet)プロトコルの両方をサポートするように設計されていますが、後者がどれほど急速に普及するかはまだ分かりません。Huaweiによると、UBoEはアイドル状態のレイテンシが低く、ハードウェアの信頼性が高く、従来のRoCE構成よりもスイッチと光モジュールの数が少なくて済むとのことです。

ファーウェイは、Atlas 950 SuperClusterを、数千億から数十兆のパラメータを持つAIモデルの学習および推論ワークロードをサポートするプラットフォームとして位置付けています。ファーウェイは、このプラットフォームが、コンピューティングスループット、相互接続帯域幅、そしてシステムの安定性を兼ね備えていることから、次世代の大規模高密度モデルおよびスパースモデルに最適であると考えています。ただし、その規模を考えると、このシステムを導入できる企業がどれだけあるかは不透明です。

巨大な足跡

Huaweiは、パフォーマンスの面でNvidiaのGPUに匹敵するプロセッサを開発できないことを認めています。そのため、Atlas 950 SuperClusterで1ZettaFLOPSを達成するには、数十万個のAIアクセラレータを活用した総当たり方式を採用し、2026年から2027年にかけてNvidiaのRubinベースのクラスターに対抗する予定です。

Huawei の Atlas 950 SuperCluster の共通構成要素は、8,192 個の Ascend 950DT チップを統合した Atlas 950 SuperPoD です。これは、Atlas 900 A3 SuperPoD (CloudMatrix 384 とも呼ばれる) と比較して処理ユニットが 20 倍に増加し、コンピューティング性能が 8 FP8 ExaFLOPS と 16 FP4 ExaFLOPS と大幅に向上しています。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Atlas 950 SuperClusterの性能は、理論上では実に印象的で、同社が比較対象としているNvidiaのVera Rubin NVL144(1.2 FP8 ExaFLOPS、3.6 NVFP4 ExaFLOPS)と比べても大幅に優れていると言われています。しかし、その性能にはサイズという代償が伴います。Atlas 950 SuperClusterのセットアップには、計算用に128台、通信用に32台の計160台のキャビネットが含まれ、バスケットボールコート2面分に相当する1,000平方メートルのスペースに広がっています。一方、NvidiaのVera Rubin NVL144は、1台の計算ラックと1台のケーブルおよびスイッチラックで構成されるラックスケールソリューションで、必要なスペースはわずか数平方メートルです。

HuaweiのAtlas 950 SuperClusterは、64台のAtlas 950 SuperPoDで構成され、約64,000平方メートルの広さを予定しています。その広さはバスケットボールコート150面、またはサッカー場9面分に相当します。ただし、実際のキャンパスでは、電源室、チラー/冷却塔、バッテリー/UPSシステム、サポートオフィスのための追加スペースが必要になる可能性が高いため、総敷地面積は64,000平方メートルを大幅に上回る可能性がある点に留意してください。

今後の道

サーバーハードウェアの販売において、顧客は常に今後の展開を知りたがります。そのため、優れた製品を提供することに加えて、ロードマップを用意することが不可欠です。そこでHuawei Connectにおいて、同社はAtlas 960 SuperPoDと並行して、Atlas 960 SuperClusterを2027年第4四半期に発売する計画を発表しました。

この次世代システムは、100万基以上のAscend 960 NPUを搭載し、FP8で2 ZettaFLOPS、MXFP4で4 ZettaFLOPSの性能を提供します。また、UBoEとRoCEの両方をサポートし、UBoEはイーサネットへの依存を維持しながら、レイテンシと稼働率の向上が期待されます。

Tom's HardwareをGoogleニュースでフォローするか、お気に入りの情報源として追加して、最新のニュース、分析、レビューをフィードで受信しましょう。「フォロー」ボタンを忘れずにクリックしてください!

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。