アルゴンヌ国立研究所のAuroraは、Linpackベンチマークで1エクサフロップスを超える持続的な性能を実現する初のスーパーコンピュータとなる予定でしたが、開発が遅れたため、Frontierスーパーコンピュータがその座を譲ることとなりました。しかし、インテル社によると、Auroraは予想を上回る性能を誇るPonte VecchioコンピューティングGPUのおかげで、業界初の2エクサフロップス・スーパーコンピュータとなる予定です。また、Ponte Vecchioは欧州初のエクサスケール・システムにも搭載されます。さらに、インテル社は2027年までにゼタフロップス・マシン向けの技術を提供すると発表しています。
Aurora: 世界初の2エクサフロップス・スーパーコンピュータ
IntelのSapphire Rapids CPUとPonte Vecchio GPUの発売が近づくにつれ、同社はこれらのCPUとGPUの性能をより深く理解するようになりました。そのため、Auroraの性能目標を約1エクサFLOPSから2 FP64エクサFLOPS(Rpeak)に引き上げました。Auroraは突如、2023年に2エクサFLOPSのスループットを達成する予定のローレンス・リバモア国立研究所のスーパーコンピュータEl Capitanのライバルとなるのです。
Auroraスーパーコンピュータには、紆余曲折の歴史がある。このシステムは2015年に初めて発表され、IntelのXeon Phiアクセラレータを搭載し、2018年には約180ペタフロップスの演算性能を実現する予定だった。しかし、IntelはXeon Phiを廃止してコンピューティングGPUに切り替え、アルゴンヌ国立研究所との契約再交渉を経て、2021年にエクサフロップスのシステムを提供することになった。その後、7nm(現在はIntel 4と呼ばれる)製造プロセスの遅延と、Ponte Vecchioのコンピューティングタイルを社内(現在はIntel 4と呼ばれるものを使用)と社外(TSMCのN5ノードを使用)の両方で製造する必要があったため、システムの納入は再び延期された。
インテルの7nmプロセス技術は、欠陥密度と歩留まりの目標を達成するために再設計を余儀なくされました。インテルは今年初め、改良版の7nmプロセスでは極端紫外線(EUV)リソグラフィーを積極的に採用し、マルチパターニング(4回以上の露光)の必要性を排除することで製造工程を簡素化し、欠陥数を削減すると発表しました。
IntelがPonte Vecchioについて当初予測したパフォーマンスには、別のノードで作成されるはずだった計算タイルが含まれていたため、これらの予測はもはや有効ではありません。TSMCのN5(および後にIntel 4)を使用して作成された計算タイルを使用することで、Ponte Vecchioは当初のバージョンよりも大幅に高いパフォーマンスを実現できるようです。これは、計算タイルのクロック周波数の向上、タイル内のアクティブなEU数の増加、GPU数の増加など、いくつかの要因によって左右されます。
「2エクサフロップスと1エクサフロップスの比較では、マシンの中核であるPonte Vecchioが当初の契約マイルストーンを大幅に上回っています」と、Intelの責任者であるパット・ゲルシンガー氏はNextPlatformの取材に対し述べています。「つまり、特定の数のプロセッサを搭載するように設定したとき(2エクサフロップスがどれくらいか計算してみてください)、1エクサフロップスを余裕で超えるために必要なソケット数を実質的に超過したのです。現在、Ponte Vecchioはこれらのパフォーマンス目標をはるかに上回っており、契約上のワークロードの一部では、2エクサフロップスを余裕で超えています。ですから、1エクサフロップスから2エクサフロップスへかなり速いペースで到達できると、当時は非常に興奮していました。」
ポンテ・ヴェッキオ、欧州のエクサスケール・スーパーコンピュータを稼働
Intel の Ponte Vecchio コンピューティング GPU は、まず Aurora スーパーコンピューターに使用されますが、最終的には他の高性能コンピューティング (HPC) システムにも使用される予定です。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
欧州初のスーパーコンピュータは、欧州プロセッサ・イニシアチブ(EPI)の下、特別に設計されたSiPearlのRheaシステムオンチップ(SoC)を採用する予定です。このチップは、メッシュネットワークで相互接続された最大72個のArm Neoverse Zeusコアを搭載する予定ですが、性能目標を達成するにはHPCアクセラレータが必要になります。
SiPearl は、システムの HPC ノード内で Intel の Ponte Vecchio GPU を使用することを決定し、そのために Intel の oneAPI をソフトウェア スタックに採用する予定です。
ZettaScale: レースは始まった
業界がペタスケールからエクサスケールのスーパーコンピューティングへと大きく進化するには12年以上かかりました。これは、業界がこの新たなマイルストーンに到達するまでに、幾度もの移行を経なければならなかったためです。最初のペタスケール・システムであるIBM Roadrunnerは、AMDのデュアルコアOpteronプロセッサーとIBMのヘテロジニアスなPowerXCell 8iアクセラレーターを搭載していました。2008年以降、業界ではGPUまたは専用アクセラレーターを搭載したヘテロジニアス・スーパーコンピューターが広く採用されるようになりました。これらのHPCアクセラレーターはHBMメモリを使用し、現在では業界で最も複雑なチップの一つとなっています。プロセス技術の進化が鈍化しているため、エクサスケール・システム向けのHPCアクセラレーターは現在、マルチチップレット設計を採用しています。
インテルは、コンピューティングアーキテクチャ、システムアーキテクチャ、パッケージング技術、そしてソフトウェアの進歩により、ゼタスケールシステムへの道のりが大幅に短縮されると考えています。同社は、2027年までに5年でゼタスケールに到達するという目標を掲げています。このチップ大手は、HPCソリューションの性能を5年で1000倍に向上させる具体的な方法については明らかにしていませんが、何らかの計画を持っているようです。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。