2エクサフロップスの性能を誇るインテル搭載スーパーコンピュータ「Aurora」は、現在世界最速のAMD搭載スーパーコンピュータ「Frontier」を破り、最速スーパーコンピュータのトップ500リストで首位に立つと予想されています。しかし、インテルのハードウェア納入の遅延が続いているため、Auroraはまだトップ500委員会にベンチマークを提出しておらず、本日発表されたリストには含まれていませんでした。インテルは本日、システムに関する新たな詳細を発表し、ISCカンファレンスでAuroraスーパーコンピュータ向けに1万台を超える稼働ブレードを納入したことを発表しました。ただし、これらは完全な導入に必要なブレード数ではないという但し書き付きです。詳細は以下で解説します。
しかし、インテルは、このシステムは今年後半に完全に稼働すると述べ、Aurora と AMD および Nvidia 搭載スーパーコンピューターを直接比較したベンチマーク結果を共有し、AMD の MI250X GPU に対して 2 倍の性能優位性、Nvidia の H100 GPU に対して 20% の性能向上が達成されたと主張している。
画像
1
の
2

インテルは、第4世代Sapphire Rapids XeonチップとPonte Vecchio GPUの両方を含む1万台以上のブレード用のシリコンをアルゴンヌ・リーダーシップ・コンピューティング・ファシリティ(ALCF)に納入したと発表した。
しかし、AuroraはIntelのHBM搭載Sapphire Rapids「Xeon Max」チップで動作するように設計されており、このチップは絶えず遅延しています。この遅延により、Intelは当初、ALCF向けにHBM非搭載のSapphire Rapidsチップの出荷を開始し、当面の対策として、標準のHBM非搭載Sapphire RapidsチップをAuroraに搭載し始めました。
Intelは現在、ALCFに高速なHBM搭載Xeon Maxチップを提供していますが、ALCFが納入済みと宣伝している1万台のブレードの全てにMaxチップが搭載されているわけではありません。Intelに問い合わせたところ、同社の担当者は、全てのブレードに最終版Xeon Maxシリコンが搭載されているわけではないことを確認しました。同社によると、ブレードの約75%に最終版Xeon Maxシリコンが搭載されているとのことです。おそらくこれが、システムがTop500リストのベンチマークを提出できないボトルネックとなっているのでしょう。
このシステムは、ラックあたり 64 枚のブレードを備えた 166 個のラックで構成されており、合計 10,624 枚のブレードがあるため、配送された 10,000 枚を超えるブレードは、システムを運用するには十分であると考えられますが、完全なパフォーマンスには達しません。
IntelはAuroraスーパーコンピュータの詳細な仕様も公開しました。詳細な仕様は上記のスライドをご覧ください。21,248個のCPUと63,744個のPonte Vecchio GPUを搭載したAuroraは、年末までに完全稼働を開始した時点で2エクサフロップス以上の性能を発揮する予定です。また、このシステムは10.9ペタバイト(PB)のDDR5メモリ、CPUに接続された1.36PBのHBM、8.16PBのGPUメモリ、そして31TB/秒の帯域幅を実現する230PBのストレージ容量を備えています(その他の興味深い詳細は上記のスライドをご覧ください)。
インテルはまた、Auroraが様々なワークロード上で生成AIワークロードの実行を開始することも発表しました。「Aurora GPT」大規模言語モデルは科学指向で、MegatronとDeepSpeedを基盤とし、1兆個のパラメータを備えています。インテルはこのプロジェクトについて、以下のように要約しています。
これらの科学向け生成AIモデルは、一般的なテキスト、コード、科学論文、そして生物学、化学、材料科学、物理学、医学などの分野から得られた構造化された科学データを用いて学習されます。生成されたモデル(最大1兆個のパラメータを持つ)は、分子や材料の設計から、数百万もの情報源からの知識の統合まで、様々な科学アプリケーションで活用され、システム生物学、高分子化学、エネルギー材料、気候科学、宇宙論といった分野における新しく興味深い実験の提案に活用されます。また、このモデルは、がんなどの疾患に関連する生物学的プロセスの特定を加速し、医薬品設計のターゲットを提案するためにも活用されます。
画像
1
の
4

Intelは、Auroraの小型版であるラック2基、合計128ノードのSunspotシステムのベンチマーク結果もいくつか公開しました。IntelはSunspotのパフォーマンスを、Nvidia A100 GPUを搭載した「同規模」のPolarisスーパーコンピューター、およびAMD MI250X GPUを搭載したCrusherスーパーコンピューターの推定値と比較しました。残念ながら、Intelはこれらの構成に関するテスト結果や詳細を提供していないため、結果は鵜呑みにしないようご注意ください。
原子炉予測ワークロードにおける単一ノードのテストにおいて、Intel社は自社システムがNVIDIA社製競合製品よりも45%、AMD社製システムよりも12%高速であると主張している。スケーラビリティ指標について言えば、テストシステムで使用されるGPUの総数を96基に正規化することで(AMD社とNVIDIA社製ノードはそれぞれ4基のGPUを搭載しているのに対し、Intel社製システムはノードあたり6基)、SunspotはモンテカルロワークロードにおいてAMD社とNVIDIA社製システムの2倍以上のパフォーマンスを実現したとIntel社は主張している。NWChemExワークロードの90ノードでは、Intel社は90ノードのNVIDIA社製Solarisシステムよりも72%高速であると主張している。
Auroraスーパーコンピュータは2015年に初めて発表され、完成予定は2018年とされていました。当時、このシステムはKnights Hillプロセッサを搭載するように設計されていましたが、これは後にキャンセルされました。その後、システムは何度も再設計とスケジュール変更が行われ、2019年には1エクサフロップスの性能を持つ新しいAuroraが発表され、2021年には1エクサフロップスの性能を実現する予定でした。さらに2021年後半に行われた再スケジュールでは、完成時には2エクサフロップスの性能を実現すると発表され、現在では今年後半に予定されています。
長く曲がりくねった道のりは続きますが、ようやく終わりが見えてきたようです。Intelは、Xeon Maxプロセッサを全て出荷し、システムをまもなく完成させると発表しました。システムは年末までに完成し、最初のTop 500ベンチマークを提出する予定です。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。