66
ペガトロン、128基のAMD MI350X GPUを搭載した1,177PFLOPのAIラックを準備
AMDとPegatronの128 GPU MI350Xシステム
(画像提供:Tom's Hardware)

Pegatronは、Computexにおいて、高パフォーマンスが要求されるAI推論およびトレーニングアプリケーション向けに設計された、AMDの次世代Instinct MI350Xアクセラレータ128​​基を搭載した独自のラックスケールソリューションを披露しました。このシステムはAMDが自社設計したラックスケールソリューションよりも1世代先行しており、Pegatronにとってこのシステムは、約1年後にリリース予定のラックスケールAMD Instinct MI450XベースのIF64およびIF128ソリューションを構築するためのトレーニングツールとして活用されます。

Pegatron AS501-4A1/AS500-4A1ラックスケールシステムは、8つの5Uコンピュートトレイを搭載し、各トレイにはAMD EPYC 9005シリーズプロセッサ1基と、AIおよびHPC向けのAMD Instinct MI350X AI/HPCアクセラレータ4基が搭載されています。CPUとアクセラレータは水冷式で、高負荷時でも最大かつ予測可能なパフォーマンスを確保します。このマシンは51OU ORV3フォームファクタで提供され、OCP標準(Meta)に準拠したクラウドデータセンターに最適です。

AMDとPegatronの128 GPU MI350Xシステム

(画像提供:Tom's Hardware)

AMDにはInfinity Fabric接続用の独自スイッチがないため、このマシンは400GbEを使用して異なるシャーシに配置されたGPUを接続します(いずれにせよ、AMD Instinctのスケールアップ可能な最大ワールドサイズは現在8プロセッサです)。これは、NVIDIAのGB200/GB300 NVL72プラットフォームとは対照的です。このプラットフォームは、同社の超高速NVLink接続で72基のGPUを相互接続しています。そのため、Instinct MI350Xシステムは、スケーラビリティの点でGB200/GB300 NVL72にほとんど匹敵しません。

この新しいマシンは、OCP導入企業が直近のワークロードに利用するだけでなく、ハードウェアとソフトウェアの両面から、多数のGPUを搭載したAMD Instinctベースのシステムをより適切に構築する方法を学ぶためにも活用されます。Pegatronのマシンは、ラックスケールAIソリューションにおけるNVIDIAの優位性に挑戦するための基盤を築くなど、複数の理由から過大評価することはできません。

Pegatronの128ウェイAMD Instinct MI350Xシステム用インターコネクト

(画像提供:Tom's Hardware)

AMDのInstinct MI350Xに関する知見を踏まえると、これらのユニットをベースとしたPegatronの128 GPUラックスケールシステムは、ほぼ線形のスケーラビリティを前提とした場合、推論用FP4コンピューティングにおいて理論上最大1,177 PFLOPS(ペガトロンの128 GPU搭載ラックスケールシステム)の性能を提供します。各MI350Xは最大288GBのHBM3Eをサポートし、システムは36.8TBの高速メモリを搭載することで、NVIDIAの現行BlackwellベースGPUの容量を超える大規模なAIモデルのサポートを可能にします。

AMDとPegatronの128 GPU MI350Xシステム

(画像提供:Tom's Hardware)

しかし、GPU間通信にイーサネットに依存しているため、システムのスケーラビリティは制限されます。最大8基のGPUまでスケールアップ可能なこのシステムは、NVIDIAのNVL72システムが得意とする緊密に同期されたLLMトレーニングではなく、推論ワークロードやマルチインスタンストレーニング向けに構築されていると考えられます。それでもなお、このシステムは現時点で高性能でメモリ容量に優れたソリューションであり、AMDの次世代Instinct MI400シリーズソリューションの先駆けとなっています。

Google ニュースで Tom's Hardware をフォローすると、最新のニュース、分析、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。