
AMDとローレンス・リバモア国立研究所(LLNL)は本日、AMD搭載のEl Capitanが1.742エクサフロップスの性能を記録し、世界最速のスーパーコンピュータとして半年ごとに発表されるTop500リストで首位を獲得したと発表しました。El Capitanはリストに初登場で首位に立ち、これまでの首位だった1.3エクサフロップスのFrontierを一気に追い抜きました。Intel搭載のAuroraシステムは3位に後退しました。このシステムは新たなベンチマークテストを提出していないため、一部稼働中のこのシステムは依然として多くの面で障害に見舞われていることが示唆されます(詳細は後述)。
El Capitan の規模は計り知れない。11,136 ノードに 44,544 基の AMD MI300A APU、5.4 ペタバイトのメインメモリ、そして非常に高性能な「Rabbit」ニアノード・ストレージ・サブシステム(詳細は後述)が搭載されている。El Capitan はベンチマークで 1.742 京回/秒(エクサフロップス)の性能を達成した。これは 540 億年にわたって毎秒 1 回の計算を実行するのに等しいが、El Capitan は毎秒 1 回の計算を実行している。これは、リストで 2 番目に高速なシステムよりも 45% 高速である。
スワイプして水平にスクロールします
システム | コア | Rmax (PFlop/s) | Rpeak (PFlop/s) | 電力(kW) |
El Capitan - HPE Cray EX255a、AMD 第4世代 EPYC 24C 1.8GHz、AMD Instinct MI300A、Slingshot-11 | 11,039,616 | 1,742 | 2,746 | 29,581 |
Frontier - HPE Cray EX235a、AMDカスタム第3世代EPYC 64C 2GHz、AMD Instinct MI250X | 8,699,904 | 1,353 | 2.055 | 22,786 |
Aurora - HPE Cray EX - Xeon CPU Max 9470 52C 2.4GHz、Intel データセンター GPU | 9,264,128 | 1,012 | 1,980 | 38,698 |
El Capitan は理論上のピーク性能(Rpeak)2.746 エクサフロップスを誇ります。しかし、この数値はシステムコンポーネント全体がピーク速度で動作し、パフォーマンスが完全に線形にスケーリングされている状態で計算されたものであり、現実世界では到底実現不可能です。
エル・キャピタンのRmaxは、トップクラスのスーパーコンピュータの基準となる高性能Linpack(HPL)ベンチマークにおける実世界性能測定で、実使用時に1.742エクサフロップスに達しました。Rmaxは今後、システムチューニングによってさらに向上する可能性があり、連邦情報機関はエル・キャピタンを機密ネットワークに移管する前に、さらに本格的なHPLベンチマークを実施する予定です。
HPLにおけるスーパーコンピュータシステムのパフォーマンスは、完全な倍精度FP64で測定されていることにも留意が必要です。一方、AI中心のスーパーコンピュータは、より小さなデータ型で測定され、より高い「AIエクサフロップス」評価を実現しますが、これらはTop500リストのランキングと直接比較することはできません。
El Capitan はフル稼働時に 35 メガワットを超える電力を消費し、58.89 ギガフロップス/ワットの性能を発揮し、最も効率的なスーパーコンピューターの Green500 ランキングで 18 位を獲得しました。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
画像
1
の
13

El Capitanは、44,544基のAMD MI300Aプロセッサに、合計11,039,616基もの演算コア(CPU+GPU)を搭載しています。これらのAPUは、CPUコアとGPUコアを同一の物理パッケージに統合しています。各MI300Aチップは13個のチップレットで構成され、その多くは3Dスタック構造となっています。これにより、24基のZen 4 CPUコア、CDNA 3グラフィックエンジン、そして合計128GBのHBM3メモリを8スタック搭載したシングルチップパッケージが実現しています。
MI300Aチップは全体で1460億個のトランジスタを搭載し、AMDが量産したチップの中で最大規模となります。5nmプロセスによるCPUとGPUを組み合わせた9個の演算ダイは、メモリやI/Oトラフィックなどの機能を処理するアクティブインターポーザーである4個の6nmプロセスベースダイ上に3D積層されています。El Capitanのトポロジーの詳細は、こちらでご覧いただけます。このアーキテクチャは、キャッシュコヒーレントメモリを採用することで、CPUとGPU間のデータ移動を削減します。このデータ移動は、演算処理自体よりも多くの電力を消費することが多く、レイテンシの削減とパフォーマンスおよび電力効率の向上につながります。また、古いコードの移植と新しいコードの作成の両方が大幅に簡素化されます。
HPEは、高密度液冷式EX4000キャビネットとEX225aアクセラレータブレードをSlingshot-11ネットワークインターコネクトで接続したShastaアーキテクチャを採用したEl Capitanシステムを構築しています。このプラットフォームは、米国エネルギー省(DOE)の他の2つのエクサスケール・スーパーコンピュータ、すなわちこれまで世界最速のスーパーコンピュータであったFrontierと、度々遅延が発生しているIntel製シリコンを搭載したAuroraに搭載されています。これにより、HPEはTop500リストで1位、2位、3位を獲得し、これら3つはいずれもリストに載る最初の、そして唯一のエクサスケールクラスのシステムです。
比較すると、El CapitanはTop500リストで2番目に高速なスーパーコンピュータであるFrontierよりも45%高速です。AMDチップを搭載したFrontierはTop500リストで2位となり、AMDに新たな栄誉をもたらしました。AMDのシリコンは世界最速のスーパーコンピュータ2台に搭載されているからです。興味深いことに、Frontierスーパーコンピュータは今回のリストで新たなベンチマーク結果も発表しました。1.353エクサフロップスという数値は、前回の1.194エクサフロップスから向上しています。Rpeakも1.714エクサフロップスから2.055エクサフロップスに向上しました。
El Capitanは現在、世界最速のスーパーコンピュータとして知られていますが、中国が独自のエクサスケールクラスのマシンを複数保有していることを言及しないのは不誠実です。これらは秘密に包まれており、米国の制裁による報復を恐れてTop500リストには掲載されていません。
DOEがIntelのAuroraの新たなベンチマークを提出しなかったのは、非常に意外なことです。6か月前、Auroraの提出により、同システムはTop500で2位にランクインしましたが、当時はまだシステムが完全に稼働していたわけではありませんでした。ベンチマーク実行は、システムのアクティブ状態の87%のみで行われました。当時、IntelはAuroraがハードウェアおよび冷却システムの故障、運用エラー、ネットワークの不安定性など、多数のハードウェア問題を抱えていたと発表していました。新たな提出がなかったことは、これらのエラーがまだ完全に修正されていないことを示唆しています。Auroraは依然としてAI中心のHPL-MxP混合精度ベンチマークでトップを走っており、10.6 AIエクサフロップスの性能を誇る世界最速のAIスーパーコンピュータとなっています。
実際、最速スーパーコンピューター上位10台のうち5台はAMD製で、Intelは3台、Nvidiaは1台、そして日本のカスタムメイドのArm製「富岳」も依然として上位にランクされています。LLNLはまた、このシステムは「同規模に近い」システムの中では群を抜いて最も費用対効果の高いシステムであるとコメントしており、El Capitanが世界最速であるだけでなく、最先端技術において最も経済的なシステムでもあることを示しています。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。