83
DOEが世界最速スーパーコンピュータ「El Capitan」を発表、1.5エクサフロップスを達成

クレジット: DOE

(画像提供:DOE)

新たな核兵器の開発、米国の核兵器備蓄の維持、核テロの防止、米軍の原子力潜水艦と航空母艦への動力供給は、国家核安全保障局(NNSA)の管轄だが、核不拡散法、そして環境への懸念から、1992年に実際の核実験(爆発)はさらなる研究を行う選択肢から除外された。

米国エネルギー省は現在、核弾頭と運搬システムの老朽化に伴い、あらゆる構成部品の再設計を進めており、スーパーコンピュータが唯一の解決策となっています。この再設計には、2023年に稼働開始予定のエクサフロップス(エクサスケール)スーパーコンピュータ「El Capitan」という、かつてないレベルの計算能力が求められます。完成すれば、El Capitanは世界トップ100のスーパーコンピュータの性能を合わせたよりも高速になります。

米国エネルギー省(DOE)とNNSA(アメリカ国家安全保障局)は本日、クレイ社のShastaスーパーコンピューティング・プラットフォームがEl Capitanの基幹システムとなることを発表しました。米国が誇る新たなスーパーコンピュータの演算能力は最大1.5エクサFLOPS(1秒あたり15京回)に達します。1京回とは1秒あたり10兆回の演算を意味し、El Capitanは既存のどのスーパーコンピュータよりも10倍高速です。

El Capitan は、人工知能と機械学習を使用して、前例のない規模と速度で 3D シミュレーションを実行します。また、最大で約 400 ペタフロップスの性能に達し、持続的な性能は 200 ペタフロップスの範囲である既存のスーパーコンピュータではほとんど不可能な解像度で実行します。

もちろん、最初の疑問は、世界最速10台のスーパーコンピュータのうち4台を保有するDOEが、新システムにどのハードウェアを採用するのかということです。DOEは本日、現在HPEに買収されているCray社に6億ドルの契約を授与し、同社のShastaアーキテクチャ、Slingshotインターコネクト、そしてソフトウェアプラットフォームを用いたシステム構築を依頼したことを発表しました。これは、DOEが所有する他のエクサスケール・スーパーコンピュータであるAuroraとFrontierの両方に搭載されているものと同じプラットフォームです。

1エクサフロップスのAuroraは、未発表の「将来」のIntel Xeonプロセッサ、未発表のXeグラフィックスアーキテクチャ、そしてOptane Persistent DIMMを搭載しています。一方、1.5エクサフロップスのFrontierは、次世代AMD EPYCプロセッサとRadeon Instinct GPUを搭載しています。どちらのシステムにも、長らくスーパーコンピュータの主力製品であったNVIDIA GPUは搭載されていないことにお気づきでしょう。

El CapitanにNvidiaが登場するかどうかも不明です。米国エネルギー省(DOE)は、システムに使用するプロセッサについてまだ最終決定を下していません。既にパフォーマンス予測があり、設計が最終段階にあることを考えると、これは奇妙なことです。しかし、アーキテクチャはShastaアーキテクチャの標準的なGPUとCPUの組み合わせに従うことは分かっています。Shastaアーキテクチャは現在、Intel、AMD、NvidiaのCPU/アクセラレータのみをサポートしているため、IBMのPOWERやARMプロセッサの様々なバリエーションのいずれかは除外されるようです。Crayは、El Capitanの具体的なCPUとGPUについては後日発表するとしています。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

クレジット: DOE

(画像提供:DOE)

驚異的な計算能力は常に素晴らしいものですが、スーパーコンピューティングにおいては電力効率も重要です。最終的な消費電力は明らかにされていませんが、エネルギー省(DOE)が使用するプロセッサとGPUをまだ決定していないため、これは当然のことです。同省によると、El Capitanの消費電力は約40メガワットで、DOEが現在所有する最速スーパーコンピュータであるSierraの4倍の効率性を実現します。この効率性の向上は、主にネットワーク、水冷、そしてソフトウェアの最適化(AI/ML)による副産物です。 

エルキャピタンの建設

昨年のスーパーコンピュータ会議で、Shastaプラットフォームを間近で見る機会がありました。エネルギー省(DOE)はEl Capitanが何台のキャビネットを使用するかを明らかにしていませんが、ブレードを端から端まで並べると、ヨセミテにある標高3,600フィートのエルキャピタンの山頂の3倍の高さになるとしています。ただし、Shastaは前述の通り、標準的なラックベースのShastaアーキテクチャを採用していることは分かっています。

クレジット: Tom's Hardware

(画像提供:Tom's Hardware)

El Capitanは4ノード構成のShastaコンピューティングブレードを採用します。各ノードには現在、最大8つのコンピューティングソケットと、フル装備のDIMMメモリ、そしてネットワークが搭載されています。Crayは、現行世代のShasta CPU、GPU、そしてネットワークブレード(上記画像)はFrontierでは使用しないと明言しています。代わりに、未公開の新しいバリアントが稼働する予定です。El Capitanに搭載されるのが現行世代か次世代モデルのどちらなのかは不明です。

クレジット: Tom's Hardware

(画像提供:Tom's Hardware)

現世代のブレードと同様に、Crayは独自のSlingshotファブリックを使用して、ノードを統合型トップオブラックスイッチに接続します。このスイッチには、Cray設計のASICが搭載されており、スイッチポートあたり200Gbpsの転送速度を実現します。このネットワークファブリックは、輻輳を緩和するインテリジェントなルーティングメカニズムを含む、強化された低遅延プロトコルを採用しています。このインターコネクトは光リンクもサポートしていますが、主に低コストの銅線をサポートするように設計されています。このシステムは、CrayのCluserStorストレージの将来バージョンと組み合わせられる予定です。

Crayは、エル・キャピタンの完成後すぐに導入できる新しいソフトウェアスタックも開発します。そのため、Crayは関係機関と協力し、センター・オブ・エクセレンスを設立して、2023年にエル・キャピタンが完全に稼働する際に既存のソフトウェアコードを最適化します。

El CapitanはCrayにとってまたしても大きな勝利となり、Shastaの受注残高は15億ドルに達しました。しかも、これは筐体1台も出荷していない状態です。El Capitan、Aurora、Frontierを合わせると、世界トップ500のスーパーコンピューターを合わせたよりも高速になると予想されており、Crayはスーパーコンピューティング競争において明確なリードを築いています。Shastaプラットフォームは標準的なデータセンターやHPCにも利用可能であるため、近いうちにあなたの近所のデータセンターにも同様のシステムが導入されるでしょう。

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。