69
米政府のAuroraスーパーコンピュータ、Intelの7nmプロセス遅れで遅延

インテルが今年初めに7nmプロセス技術の遅延を発表したことで、インテルベースの初のエクサスケール・スーパーコンピュータであるAuroraに影響が及んだ。7月時点では明確な回答はなかったが、米国エネルギー省(DoE)科学局の担当者は今週、システムの遅延を確認した。 

HPCwire の報道によると、エネルギー省は、オーロラの運営機関であるアルゴンヌ国立研究所が緊急時対応計画を整備していることを指摘し、これを大きな問題とは考えていない。

オーロラ・スーパーコンピュータの遅延

「はい、オーロラシステムの遅延の兆候はあります」と、エネルギー省科学局先端科学計算研究(ASCR)担当副局長のバーブ・ヘランド氏は述べた。同氏はさらに、アルゴンヌ国立研究所はインテルと協力して「アルゴンヌ国立研究所だけでなく、エクサスケール・コンピューティング・プロジェクト、そして米国の高性能コンピューティング利用者への影響を軽減する」と付け加えた。

(画像提供:Intel)

「世界最先端のスーパーコンピューターの契約を、導入の4~5年前に締結するとなると、スケジュールに多少の遅延が生じるのは当然のことです」とヘランド氏は述べた。「そのため、コストとスケジュールの両方の予備費をプロジェクト予算に組み込んでいます。」

Aurora スーパーコンピュータは、Golden Cove マイクロアーキテクチャを実行する、コード名 Sapphire Rapids の Intel 次世代 Xeon プロセッサと、Xe 高性能コンピューティング (HPC) アーキテクチャを搭載した、コード名 Ponte Vecchio の同社初のデータセンター GPU をベースにしています。  

Sapphire Rapidsは、2021年に量産開始が見込まれるIntelの10nm Enhanced SuperFinプロセス技術を用いて製造されています。一方、IntelのXe-HPC Ponte Vecchio GPUは、Intelの10nm SuperFin製造技術を用いて製造されたベースタイル、ファウンドリで製造されたXe-Link I/Oタイル、10nm Enhanced SuperFinプロセスで製造されたRambo Cacheタイル、そして約6ヶ月遅れていたIntelの7nmノードを使用する予定だったComputeタイルを使用したマルチタイルチップレット設計です。先月、IntelはComputeタイルが社内だけでなく外部ファウンドリでも製造できることを明らかにしました。

(画像提供:Intel)

Intelは、Ponte Vecchioを様々なソースからタイルを調達するマルチチップレット製品として常に構想してきたと述べています。主要なタイルを外部ファウンドリーで製造すること自体は問題ではありませんが、設計の熱、電圧、パッケージングを他の部品に合わせて調整するには時間がかかります。IntelのPonte VecchioはAurora以外で使用されるため、Intelが最終的に主要なコンピュートタイルを自社工場で製造するのは理にかなっています。しかし、これはXe-HPC Ponte Vecchio GPUに2つのバージョンが存在することを意味します。 

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

各Auroraブレードには、2基のIntel Xeonスケーラブル「Sapphire Rapids」プロセッサーと6基のIntel Xe-HPC「Ponte Vecchio」GPUが搭載されています。つまり、Auroraの実現には、Intelのデータセンター向けグラフィックスチップの量産が不可欠となります。 

最初のエクサスケールスーパーコンピュータ

これまでに、米国エネルギー省はエクサスケール級スーパーコンピュータを3台公開しています。アルゴンヌ国立研究所のAuroraは2019年3月に発表された最初のシステムであり、1エクサフロップスを超える性能を発揮すると期待されています。 

AMDのEpyc「Milan」プロセッサとRadeon Instinct MI200グラフィックスを搭載したオークリッジ国立研究所のFrontierスーパーコンピュータは、2019年5月に発表され、2021年には1.5エクサフロップスのパフォーマンスを実現する予定です。 

今年 3 月、米国エネルギー省は、AMD の Epyc「Genoa」CPU と AMD CDNA GPU を使用して 2023 年に 2 エクサフロップスを達成する予定のローレンス リバモア研究所の El Capitan システムを発表しました。

これら3つのシステムはすべてHP EnterpriseのCray EXアーキテクチャを採用しているため、多くの共通点があります。Auroraは3つのシステムの中で唯一Intelベースのスーパーコンピューターです。

しかし、Auroraがいつ登場するかは不明で、このスーパーコンピュータはすでに大きな挫折に直面しています。このシステムは2015年に初めて発表され、Intel Xeon Phi「Knights Hill」を搭載した180テラフロップスのスーパーコンピュータとして2018年に発売予定とされていました。しかし、Intelが2017年にKnights Hillを中止したため、当初のAuroraプロジェクトも延期されました。

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。