80
AMD 搭載の Frontier スーパーコンピュータがエクサスケールの壁を突破し、世界最速に

AMD 搭載の Frontier スーパーコンピュータは、持続的な Linpack 実行で 1.102 ExaFlop/s を超え、世界で初めて公式に認められたエクサスケール スーパーコンピュータとなりました。これは、新たに発表された世界最速スーパーコンピュータ Top500 リストで第 1 位であり、今年はリストに掲載された AMD 搭載システムの数が大幅に増えています。Frontier は、これまでのトップであった日本の富岳を追い越しただけでなく、それを圧倒しています。実際、Frontier はリストに載っている次の 7 台のスーパーコンピュータの合計よりも高速です。特筆すべきは、Frontier が持続的な Linpack FP64 ベンチマークで 1.1 ExaFlops を達成した一方で、このシステムはピーク性能で最大 1.69 ExaFlops を実現し、さらにチューニングすれば 2 ExaFlops に到達できる余地があるということです。ちなみに、1 ExaFlop は1 秒あたり1 京回の浮動小数点演算に相当します。  

Frontierは現在、世界最速のAIシステムにもランクインしており、HPL-AIベンチマークで6.88エクサフロップスの混合精度演算性能を達成しました。これは、脳内の860億個のニューロンそれぞれに対して毎秒6800万命令を実行できることに相当し、その圧倒的な計算能力を物語っています。このシステムは、NVIDIAのArmベースGrace CPUスーパーチップを搭載した、最近発表されたAI特化型スーパーコンピュータと、AI分野でのリーダーシップを競うことになりそうです。

さらに、Frontier Test and Development(Crusher)システムもGreen500で1位を獲得しました。これは、Frontierのアーキテクチャが世界で最も電力効率の高いスーパーコンピューティング・アーキテクチャでもあることを示しています(FrontierのプライマリシステムはTop500で2位です)。システム全体では、予選ベンチマーク実行中に52.23 GFlops/Wの性能を発揮し、21.1 MW(メガワット)の電力を消費しました。ピーク使用時には、Frontierの消費電力は29 MWでした。 

画像

1

3

トップ500
(画像提供:Top500)

Frontierスーパーコンピューターの規模は息を呑むほどですが、これは今年のTop500リストにおけるAMDの多くの功績の1つに過ぎません。AMD EPYC搭載システムは現在、世界トップ10スーパーコンピューターのうち5台、トップ20のうち10台を占めています。実際、AMDのEPYCは現在、世界トップ500スーパーコンピューターのうち94台に搭載されており、2021年11月にリストされた73システム、2021年6月にリストされた49システムから着実に増加しています。AMDはまた、今年のリストに載った新しいシステムの半数以上に登場しています。上のアルバムでわかるように、Top500のほとんどのシステムは依然としてIntel CPUで占められており、Nvidia GPUも主要なアクセラレーターとしての地位を維持しています。 

しかし、電力効率の点では、AMD が最新の Green500 リストで最高の地位を占めています。同社は世界で最も効率的な 4 つのシステムに電力を供給しており、上位 10 位のうち 8 位、上位 20 位のうち 17 位を占めています。 

画像

1

10

フロンティア
(画像提供:ORNL)

FrontierスーパーコンピュータはHPE社によって開発され、テネシー州にある米国エネルギー省(DOE)オークリッジ国立研究所(ORNL)に設置されています。このシステムは9,408個の計算ノードで構成され、各ノードには64コアのAMD「Trento」CPU 1基と512GBのDDR4メモリ、そしてAMD Radeon Instinct MI250X GPU 4基が搭載されています。これらのノードは、重量8,000ポンド(約3,400kg)のHPE Cray EXキャビネット74台に分散配置されています。システム全体では、602,112個のCPUコアと4.6ペタバイトのDDR4メモリが搭載されています。

さらに、37,888基のAMD MI250X GPUは、8,138,240個のコアと4.6ペタバイトのHBMメモリ(GPUあたり128GB)を搭載しています。CPUとGPUは、イーサネットベースのHPE Cray Slingshot-11ネットワークファブリックによって接続されています。システム全体は直接水冷方式で熱を抑制し、350馬力のポンプで6,000ガロン(約2,700リットル)の水をシステム全体に循環させます。これらのポンプは、オリンピックサイズのプールを30分で満たすことができます。システム内の水は85℃(摂氏約27度)という快適な温度で稼働しており、水温を下げるためのチラーを使用しないため、電力効率が向上します。

システム全体は、700ペタバイトの容量、75TB/秒のスループット、150億IOPSのパフォーマンスを誇る、驚異的なパフォーマンスを誇るストレージサブシステムに接続されています。メタデータ層は480台のNVMe SSDに分散され、全体の容量の10PBを占めています。また、プライマリ高速ストレージ層には5,400台のNVMe SSDが11.5PBの容量を供給しています。さらに、47,700台のPMRハードドライブが679PBの容量を供給しています。 

画像

1

7

オークランド国立研究所
(画像提供:ORNL)

Frontierの組み立てはそれ自体が困難を極めました。ORNLはシステム構築のために685種類の部品番号を持つ6,000万点の部品を調達する必要があったからです。製造中にチップ不足が発生し、そのうち167種類の部品番号が影響を受けたため、ORNLは200万点の部品不足に陥りました。AMDもMI200 GPUの15種類の部品番号が不足するという問題に直面しました。不足を回避するため、ORNLはASCRと協力し、これらの部品について国防優先順位割当システム(DPAS)の格付けを取得しました。これは、Frontierが国防上の重要性を鑑み、米国政府が国防法に基づいて部品を調達することを意味します。

フロンティア

(画像提供:ORNL)

システムのピーク電力は現在29MWですが、フロンティアの機械設備は最大40MWの計算能力(米国の住宅3万世帯分に相当)を冷却できます。この設備は最大70MWまで拡張可能で、将来の拡張にも余裕があります。 

Frontierは世界初の公式エクサスケール・スーパーコンピュータとして認められていますが、中国には1年前にエクサスケールの壁を破ったTianhe-3とOceanLightという2つのエクサスケール・スーパーコンピュータがあると広く考えられています。残念ながら、これらのシステムは米中間の政治的緊張によりTop500委員会に提出されていません。しかし、Top500への公式提出がない(Gordon Bellの提出が代理として提出された)ことから、少なくともFP64ワークロードで測定した場合、これらのシステムが真のエクサスケール・システムであるかどうか疑問視されています。

現時点では、Frontierが公式に世界最速のスーパーコンピュータであり、エクサスケールの壁を破った最初のスーパーコンピュータです。ほぼ神話的な存在であり、しばしば遅延されてきたIntelベースのAuroraは、最大2エクサフロップスの性能を備え、今年後半または来年初めに稼働開始が予定されており、Frontierとスーパーコンピュータランキングのトップを争うことになります。

AMDの次のターゲットは? 2023年に登場が予定されていた2エクサフロップス超のマシン、El Capitanだ。完成すれば、このZen 4搭載スーパーコンピューターは、Intel搭載のAuroraとTop500最速スーパーコンピューターの座を争うことになるだろう。  

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。