本日、オークリッジ・リーダーシップ・コンピューティング・ファシリティ(OLCF)は、6億ドル規模のFrontierスーパーコンピュータの小型版であるCrusherがオンラインとなり、目覚ましい成果を上げていることを発表しました。Crusherは、米国初のエクサスケールマシンとなる予定です。192基のHPE Cray EXブレードを1.5台のキャビネットに搭載しており、従来の4,352平方フィート(約435平方メートル)のTitanスーパーコンピュータの100分の1のスペースを占めるに過ぎません。しかし、新システムは全体的なパフォーマンスを向上しています。
Crusherの新しいハードウェアがTitanスーパーコンピュータを上回る性能を示したことは驚くべきことではありません。この広大な旧式スーパーコンピュータは2013年に稼働を開始し、200台のキャビネットに18,688基のAMD Opteron 6274 16コアCPU、18,688基のNvidia Tesla K20X GPU、そしてGeminiインターコネクトを搭載し、合計8.2MWの電力を消費していました。システムは4,352平方フィート(約435平方メートル)に広がり、Linpackで17.6ペタFLOPSの持続性能、理論ピーク性能は27ペタFLOPSを実現しました。
対照的に、Crusherは1.5台のキャビネットにまたがり、1台は128ノード、もう1台は64ノードを搭載し、合計192ノードで44平方フィートのスペースを占めます。各水冷ノードには、64コアのカスタムZen 3チップ「Trento」EPYC 7A53が搭載されています。AMDはこのチップについて多くの詳細を明らかにしていませんが、EPYC Milanの派生製品であることは分かっています。このチップのI/Oダイは、GPUとのコヒーレントなメモリインターフェースを実現するために、Infinity Fabric 3.0を採用すると噂されています。
Trentoチップは、512GBのDDR4メモリ(205GB/秒)と4基のAMD MI250Xアクセラレータを搭載しています。各アクセラレータには、CDNA2アーキテクチャを採用し、200GB/秒のバスを介して通信する約790mm²のグラフィックス・コンピュート・ダイ(GCD)が2基搭載されています。実質的に、これら4基の550W GPUは、各ノードで8基のGPUに相当する役割を果たします。
各Trento CPUは4つのNUMAドメインに分割されています。各ドメイン(および関連する2バンクのL3キャッシュ)は、Infinity Fabricを介して36+36 GB/秒のコヒーレントメモリインターフェースで2つのGCD(1つのGPU)に接続され、ノード内の8つのGCD間で合計288 GB/秒のCPU-GPU帯域幅を実現します。
一方、各MI250X GPUには、HPE Slingshot 200GBps(25GB/秒)イーサネットNIC(PCIeルートコンプレックス経由)が搭載され、HPE Slingshotネットワークに接続することで、ノードあたり100GB/秒のネットワーク帯域幅を実現します。このコンピューティングパワーはすべて、ピーク時2.5TB/秒のスループットを提供し、IBM Spectrum Scaleファイルシステムを使用する250PBのストレージアプライアンスに接続されています。
OLCFは、Crusherシステムの消費電力やLinpackでのピーク性能をまだ公表していません。しかし、768基のMI250Xはピーク時で53TFLOPSの倍精度演算性能を発揮することが分かっており、理論上のピーク性能は約40ペタFLOPS(線形スケーリングを想定)となります。
Frontierは米国初のエクサスケール級スーパーコンピュータとなるが、これは度々延期されてきたIntel搭載のAuroraスーパーコンピュータが2023年まで再び延期されたためである。しかし、IntelはSapphire RapidsとPonte Vecchio搭載のAuroraのピーク性能予測を、当初の1.5エクサフロップスから2エクサフロップスに変更した。これにより、少なくともピーク性能に関してはFrontierをリードすることになる。また、2023年に稼働予定のAMD搭載2エクサフロップスのEl Capitanシステムと並ぶとも言われている。
つまり、米国のエクサスケールクラスのシステム 3 つすべてが、中国の 2 つの新しいエクサスケール システムである Sunway Ocealite と Tianhe-3 スーパーコンピュータよりも高速になるということになる。両システムとも約 1 エクサフロップスの性能に達したとされているが、政治的な理由でトップ 500 にはランクされていない。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
HPEとAMDはFrontierを2021年に予定通り納入しましたが、システムはまだ統合とテスト段階にあり、導入に技術的な課題があったとの主張が浮上しています。納入スケジュールについては議論があり、エネルギー省はシステムは予定通りであると主張していますが、これは単に言葉の問題(「承認」と「利用可能」の使い分け)に過ぎない可能性があります。いずれにせよ、米国エネルギー省はFrontierが2023年1月に研究者向けに利用可能になる予定であると発表しています。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。