85
ローマを超えて:AMDのEPYCとRadeonが世界最速のエクサスケール・スーパーコンピュータを駆動

AMDは本日、2021年に稼働開始予定の世界最速エクサスケール級スーパーコンピュータ「Frontier」の搭載機種に選定されたことを発表しました。CrayのShastaスーパーコンピュータブレードを搭載するこの新しいスーパーコンピュータは、米国エネルギー省(DOE)とオークリッジ国立研究所(OAK)の6億ドルの契約に基づき、Crayが開発を進めています。このスーパーコンピュータは、世界トップクラスのスーパーコンピュータ160台を合わせた速度よりも高速になると予測されています。 

新型Frontierスーパーコンピューターは、先日「Ryze of EPYC」特集で取り上げたように、スーパーコンピューティング市場におけるAMDの存在感の高まりを基盤としています。注目すべきは、Frontierが、長らくスーパーコンピューター市場を席巻してきたNVIDIAのGPUを搭載しない2番目のエクサスケールクラスシステムである点です。

EPYCとRadeonの融合

クレジット: AMD

(画像提供:AMD)

AMD は、このシステムを動かす GPU と CPU の具体的な世代については明らかにしなかったが、CEO の Lisa Su 氏は、両方のコンポーネントがこの展開向けにカスタマイズされていると発表した。

AMDは、AIおよびスーパーコンピューティングのワークロードに最適なパフォーマンスを提供する新しい命令をサポートすることで、カスタムEPYCプロセッサを最適化しました。「これはZenアーキテクチャの将来バージョンです。Romeに搭載されているものを超えたものと考えてください」とスー氏は述べています。

これは、AMDがこのタスクに次々世代のEPYC Milanプロセッサのカスタム版を使用する可能性を示唆している可能性がありますが、まだ確定ではありません。これらのプロセッサは、DOEのPerlmutterスーパーコンピュータにも既に採用されており、このスーパーコンピュータもCrayのShastaビルディングブロックで構築される予定です。この設計については、こちらで詳しく取り上げています。

クレジット: AMD

(画像提供:AMD)

これらのCPUは、スー氏によると、広範な混合精度演算能力と高帯域幅メモリ(HBM)を備えた高性能Radeon GPUアクセラレータと組み合わせられる。スー氏は、このGPUが将来的に市場に登場することを明言したが、カスタム設計されたEPYCプロセッサの将来については詳細を明かさなかった。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

無限の布がそれを結びつける

AMDは、各EPYC CPUを、高帯域幅・低レイテンシのカスタムコヒーレントInfinity Fabricを介して4基のRadeon Instinct GPUに接続します。これは、AMDが現在プロセッサ内部のCPUとGPUダイを連携させるために使用している基盤技術Infinity Fabricの進化形ですが、AMDはこれをPCIeバス経由で動作するように拡張しました。

AMDは以前、MI60 7nm Radeon Instinctアクセラレータ向けにこの新機能を発表していました。この拡張プロトコルバージョンは、PCIe 4.0バス経由で最大100GB/秒のCPU-GPU帯域幅を提供しますが、Frontierスーパーコンピュータが将来世代のこの技術を採用するかどうかは不明です。

CrayはFrontierにAMDのオープンソースプログラミング環境ROCmの拡張版を採用します。これはAMDのプログラミングツールスイートにとって重要な前進となります。NVIDIAのCUDAは、GPUアクセラレータのプログラミング環境として事実上の標準となっています。この確固たる地位は、並列コンピューティング市場におけるNVIDIAの優位性を確立しており、AMDのこの分野における前進は、より広範なエコシステムにおいてもAMDの強みとなるでしょう。

フロンティアビルディングブロック

FrontierはShastaスーパーコンピュータブレードを100台搭載したキャビネットで構成され、各キャビネットは最大300kWの電力を消費します。システム全体の消費電力は40MWで、7,300平方フィート(バスケットボールコート約2面分)をカバーする予定です。また、システムには90マイル(約144キロメートル)を超えるケーブルが敷設され、冷却には毎分5,900ガロン(約2,400リットル)の水が必要になります。

クレジット: Tom's Hardware

(画像提供:Tom's Hardware)

先日、スーパーコンピューティング2018カンファレンスでCrayの最新Shastaブレードのラインナップを視察しました。Frontierは、現在最大8つのコンピューティングソケットとフル装備のDIMMメモリ、そしてネットワーク機能を備えたShastaコンピューティングブレードを採用する予定です。Crayは、現行世代のShastaブレード(上の画像)はFrontierには使用せず、代わりに未公開の新しい派生モデルを導入すると明言しています。現在、ShastaブレードはCPU、GPU、そしてネットワークブレードで構成されていますが、Frontierでもこの設計思想が踏襲されるかどうかは不明です。

クレジット: Tom's Hardware

(画像提供:Tom's Hardware)

現行世代のブレードと同様に、Crayは独自のSlingshotファブリックを使用してノードを統合型トップオブラックスイッチに接続します。このネットワークファブリックは、輻輳を緩和するインテリジェントなルーティングメカニズムを含む、強化された低レイテンシプロトコルを採用しています。この相互接続は光リンクをサポートしますが、主に低コストの銅線をサポートするように設計されています。

物事を客観的に見る

Frontierは、オークリッジ国立研究所が長年にわたり世界最高性能のスーパーコンピュータを数多く保有してきた実績を基盤としています。その中には、過去のタイトル保持者であるJaguarとTitan(後者は17.6ペタフロップスの性能を誇ります)が含まれます。また、同研究所は、現在世界最高性能の143.5ペタフロップスを誇るSummitも保有しています。Frontierは理論上、これらの7倍以上の性能を発揮します。

Frontierの性能を概観すると、このスーパーコンピュータは1秒あたり最大15京回の演算処理が可能で、これは毎秒15京回の数学問題を解くことに相当します。Crayはまた、同社のネットワークソリューションの性能を、家庭用最速インターネット接続の2400万倍の帯域幅、つまり1秒間にフルHD映画10万本をダウンロードできる能力と謳っています。

このシステムは2021年に稼働開始予定ですが、具体的な日付は発表されていません。AMDのCEO、リサ・スー氏は「納期、スケジュール、そしてパフォーマンスを厳守して提供する」とコメントしました。これは、遅延に悩まされる可能性のあるスーパーコンピュータ業界において重要な特徴です。Auroraのスケジュールも、Xeon Phi Knight's Hillアクセラレータの問題により、何度も延期され、その後、IntelのXeアーキテクチャを使用するように完全に再設計されました。奇妙な偶然ですが、Intelは本日、Xeグラフィックス搭載の未来を見据え、Xeon Phiラインナップの最後のモデルを廃止すると発表しました。

AMD と Intel の両社がスーパーコンピューティングの分野で前進を続け、新しいスーパーコンピューターにおいては Nvidia の存在感が薄れつつあることから、今後数年間は確立された序列に根本的な変化が生じる可能性がある。

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。