国際スーパーコンピュータ見本市(ISC 2022)において、HPEは今年稼働予定の2つのエクサスケール・スーパーコンピュータ(FrontierとAurora)に搭載されるブレードシステムを実演しました。しかしながら、HPEは前例のない演算性能を実現するために、高度で消費電力の大きいハードウェアを採用せざるを得ませんでした。そのため、どちらのマシンも水冷システムを採用していますが、巨大なウォーターブロックを搭載していても、ブレードに見られる興味深い設計上の特徴は隠せません。
画像
1
の
2

Frontierスーパーコンピュータは、HPEのCray EX235aノードをベースに構築されており、AMDの64コアEPYC「Trento」プロセッサ2基を搭載しています。AMDのZen 3マイクロアーキテクチャは3D V-Cacheで強化され、高クロック向けに最適化されています。Frontierブレードには、14,080基のストリームプロセッサと128GBのHBM2Eメモリを搭載したAMDのInstinct MI250Xアクセラレータも8基搭載されています。各ノードは、ピーク時のFP64/FP32ベクター性能で約383 TFLOPS、ピーク時のFP64/FP32マトリックス性能で約765 TFLOPSを実現します。HPEのFrontierブレードで使用されるCPUとコンピューティングGPUはどちらも、ノード前面に2つのノズルを備えた統合型水冷システムを採用しています。
画像
1
の
3

Auroraブレードは現在、まさにその名前で呼ばれ、Intelのバッジが付いていますが、HPEのCray Exモデル番号はまだ付いていません。これはおそらく、まだ改良の余地があるためでしょう。HPEのAuroraブレードは、40コア以上、ソケットあたり64GBのHBM2Eメモリ(DDR5メモリに加えて)を備えたIntel Xeonスケーラブル「Sapphire Rapids」プロセッサーを2基搭載しています。ノードにはIntelのPonte Vecchioアクセラレータも6基搭載されていますが、1基あたり1000億個以上のトランジスタを搭載したこれらの強力なアクセラレータの正確な仕様についてはIntelは公表していません。
2エクサフロップスのAuroraスーパーコンピュータで使用される予定のAuroraブレードで目を引くのは、Sapphire Rapids CPUとPonte Vecchio GPUの隣に設置された、三角形の「高温面」マークが付いた謎の黒い箱です。これが一体何なのかは不明ですが、柔軟性を高めるためのモジュール式の高度な電源回路なのかもしれません。そもそも、かつてはVRMは取り外し可能だったため、電力消費量の多いコンポーネントにVRMを使用することは、特に試作段階のハードウェアでは、今日でもある程度理にかなっているかもしれません(適切な電圧許容範囲が満たされていることを前提としています)。
繰り返しになりますが、AuroraブレードはCPUとGPUに水冷システムを採用していますが、この冷却システムはFrontierブレードとは全く異なります。興味深いことに、AuroraブレードのPonte VecchioコンピュートGPUは、Intelが数週間前にデモを行ったものとは異なるウォーターブロックを使用しているようですが、その理由は想像に難くありません。
興味深いことに、Intelベースのブレードサーバーが使用するDDR5メモリモジュールには、エンスージアスト向けメモリモジュールに使用されているものよりも大型で、かなり強力なヒートスプレッダーが搭載されています。DDR5 RDIMMには電源管理ICと電圧調整モジュールも搭載されているため、特にブレードサーバーのようなスペースが限られた環境では、DDR4メモリよりも優れた冷却性能が求められます。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。