28
NvidiaとAMD搭載Polarisスーパーコンピュータ:Intelの遅延したAuroraに備える

米国エネルギー省のアルゴンヌ国立研究所は、新設のスーパーコンピュータ「Polaris」にNVIDIAのA100 GPUとAMDのCPUを採用した。これは、Intel搭載のスーパーコンピュータ「Aurora」の遅延により、必然的な導入と考えられていた。Auroraは、IntelのSapphire Rapidsサーバーチップの製造上の問題により、開発が停滞していた。

Polarisは、ノードあたり4基のNVIDIA A100と2基のAMD CPUを搭載し、合計2,240基のNVIDIA GPUが560ノードに分散配置されます。Polarisは最大44ペタフロップスのFP64性能を発揮しますが、これは2022年から2023年にかけて登場予定の、最大1エクサフロップスの持続性能を発揮するエクサスケール・スーパーコンピュータ「Aurora」に比べると、はるかに性能が低いマシンとなります。

対照的に、Polarisは最大1.4「AIエクサフロップス」の性能を達成しますが、これはスーパーコンピュータの性能を定量化するために用いられる標準的なFP64ワークロードでは測定されません。つまり、Polarisはエクサスケールクラスのマシンではありません。この水準に達する計画中のNvidia搭載スーパーコンピュータはまだ見られません。しかしながら、Polarisの44ペタフロップスの性能は、世界最速スーパーコンピュータのトップ500リストのトップ10に入る資格を満たしています。

プレスリリースによれば、Polaris は今後登場する Aurora のコード開発に利用される予定だ。

このシステムは、がん治療の進歩、クリーンエネルギーの探究、物理学への新たなアプローチの発見につながる粒子衝突研究の推進など、変革をもたらす科学探究を加速します。 また、研究者がアルゴンヌ国立研究所の次期エクサスケールシステムであるAuroraに向けて科学的研究のワークロードを更新できるようにすることで、ALCFをエクサスケールAIの時代へと導くでしょう。

スーパーコンピュータ Aurora Polaris

(画像提供:ASCR)

画像

1

2

ポラリススーパーコンピュータ
(画像提供:Nvidia)

Auroraエクサスケールシステムの遅延は、Intelの近年のHPCへの取り組みにとって新たな痛手です。実際、Auroraは当初、2018年にデビュー予定の180ペタフロップスというはるかに小型のマシンとして計画されていましたが、IntelのXeon Phiプロセッサの遅延により、最終的には開発中止となりました。その結果、AuroraシステムはIntelのPonte Vecchio GPUとSapphire Rapids GPUを搭載したエクサスケールシステムへと全面的に再設計されました。実際、Intelは最近、Ponte Vecchio GPUの重要な部分であるXeタイルを開発したと発表しました。これは、クラスター化されたコンピューティング要素間の通信を高速化するもので、特に米国エネルギー省(DoE)のAurora向け要請を受けて開発されました。この開発には1年を要しました。

米国エネルギー省は、Auroraの第2版が当初の2021年の発売予定から延期されたことを確認しました。これは、IntelがSapphire Rapidsプロセッサに使用されている10nm Enhanced SuperFinノード(現在はIntel 7に改名)の稼働に苦戦していることを考えると、驚くべきことではありません。その結果、Auroraは2022~2023年頃に導入される予定となり、世界初のエクサスケール・スーパーコンピュータの称号はAMD搭載のFrontierに譲ることになりました。AMDのマシンは最速となる予定で、開発は順調に進められています。 

一方、ポラリス衛星はすでに設置の最終段階にあり、2022年初頭に最初の研究作業の準備が整い、2022年第2四半期には研究コミュニティへの提供範囲が拡大される予定です。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。