7
DOEの原子力スーパーコンピュータの歴史:MANIACからAMDのEPYC Milanまで

ビッグブルーのブルージーン/L

ビッグブルーのブルージーン/L

このスーパーコンピュータは、単一のASICとDRAMメモリチップを搭載した計算カードを搭載していました。各ASICには2基のPowerPC 440組み込みプロセッサが搭載され、計算カード1枚あたり最大5.6ギガフロップスの性能を発揮しました。IBMが比較的低速な組み込みプロセッサを採用したのは、超並列設計の利点を活かしつつ消費電力を抑えたいという思いからでした。

上の写真では、16枚のコンピューティングカードが1つのノードにスロットインされています。追加の2枚のカードはI/O処理を担当します。この高密度設計により、19インチのサーバーラック1台に最大1,024台のコンピューティングノードを収容できます。Blue Gene/Lは最大65,536ノードまで拡張可能です。

クレイのレッドストーム

クレイのレッドストーム

著名なスーパーコンピュータメーカーであるCrayは、2005年に「Red Storm」を開発しました。現代のスーパーコンピューティングはデータ移動が中心であり、この設計は3Dメッシュネットワークトポロジと、ルーターとNICを同一チップ上に統合したカスタムSeaStarチップが最も注目されています。この設計には、クロック周波数3.0GHzの市販AMD OpteronシングルコアCPUが10,880個使用されていました。

当初の140キャビネットシステムは、3,000平方フィートの床面積を占有し、ピーク性能は36.19テラフロップスでした。その後、Red Stormはより高速な2.4GHzデュアルコアAMD Opteronプロセッサを搭載し、さらにキャビネット列を追加することでスケールアウトし、1台のマシンに合計26,000個のプロセッシングコアを搭載するようになりました。これによりピーク性能は101.4テラフロップスに達しましたが、その後クアッドコアOpteronプロセッサとコアあたり2GBのメモリへのアップグレードにより、ピーク性能は204.2テラフロップスまで向上しました。

Red Storm (Cray XT3) は、2006 年から 2008 年まで TOP500 リストのトップ 10 を占めました。

ホッパー

ホッパー

CrayのXE6「Hooper」には、12,768個のAMD Magny-Coursチップが搭載されていました。各チップには12個のコアが搭載され、合計153,408コアのスーパーコンピュータとなりました。Hopperは、米国エネルギー省科学局が保有する初のペタフロップス・スーパーコンピュータでした。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

このシステムには、上図に示すノードが6,384個搭載されており、各ノードにはAMD Magny-Coursプロセッサが2基と64GBのDDR3 SDRAMメモリが搭載されています。1つの筐体に最大3,072個のコアが収容されています。Red Stormとは異なり、このマシンはSeaStarネットワークチップから新しいGeminiルーターASICに移行しました。

Hopper は、ピーク速度 1.05 petaFLOPS で、2010 年 11 月の TOP500 リストの 5 位にランクされました。

ブルージーン/Qセコイア

ブルージーン/Qセコイア

IBMは、96ラック構成のBlue Gene/Q「Sequoia」システムに1,572,864個のコアを搭載しています。このシステムは、98,304個の計算ノードに1.6ペタバイトのメモリを分散配置しています。このシステムは、2.3GHzで動作するIBMの16コアA2プロセッサを搭載しています。各A2コアは4つのスレッドを同時に実行するため、SMT4プロセッサと呼ばれます。

ASC Sequoiaノード全体に張り巡らされた銅管からわかるように、このシステムは水冷に大きく依存しています。Blue Gene/QはGreen500リストに名を連ねており、当時最も電力効率の高いスーパーコンピューターの一つでした。このシステムは、前のスライドで紹介したBlue Gene/Lよりも桁違いに高速であるにもかかわらず、電力効率は17倍も優れています。

2013年、このシステムは毎秒5040億イベント処理という記録を樹立し、それまでの毎秒122億イベントという記録をはるかに上回りました。この数字を分かりやすくするために、セコイアを擁するローレンス・リバモア国立研究所は、このスーパーコンピュータの1時間の処理能力は、地球上の67億人全員が電卓を使い、1日24時間、1年365日、320年間働いた場合の計算に匹敵すると見積もっています。

Blue Gene/Q は、2012 年に 17.17 ペタフロップスのパフォーマンスで世界最速のスーパーコンピュータの称号を獲得しました。

頂上に到達 - 世界最速スーパーコンピュータ

頂上に到達 - 世界最速スーパーコンピュータ

アクセラレータの時代が到来しました。あるいは、私たちがGPUと呼ぶ時代です。今日のスーパーコンピュータに追加された新たな計算能力の大部分はGPUによるもので、CPUはもはやホストとしての役割を担うようになっています。

こちらはオークリッジ国立研究所のSummitスーパーコンピュータで使用されているNVIDIA Volta GV100 GPUです。この4,600ノードのスーパーコンピュータは、昨年、米国が中国からスーパーコンピューティングの首位奪還に貢献し、現在世界最速のスーパーコンピュータとなっています。2,282,544個の計算コアを搭載し、最大187,659テラフロップスの演算性能を発揮します。

Summitスーパーコンピュータノードについては、こちらで詳しく解説しているので、ここでは詳細は割愛します。27,000基のNvidia Volta GPUと9,000基のIBM Power9 CPUを搭載し、ネイティブNVLink接続を介してノードレベルで相互接続されています。また、PCIe 4.0や永続メモリといった最先端技術も搭載しています。 

これって一体何ですか?

これが何なのかは定かではありませんが、Intelが開発中止となったKnights Hillをベースにしたプロトタイプノードである可能性があります。この10nmプロセッサは、米国エネルギー省(DOE)のスーパーコンピュータAuroraに搭載される予定でしたが、Intelは大々的な宣伝もなく開発を中止しました。DOEは後に、Auroraは機械学習向けの「先進的なアーキテクチャ」を搭載すると発表したものの、詳細は明らかにしていません。

インテルのXeonスケーラブル・プロセッサと同様に、Knight's Millはチップに直接接続されたケーブルと接続する統合型Omni-Pathコネクタを搭載していました。そのため、この名前のないノードに見られるようなオープンエンドのソケットが必要でした。この謎のノードについてDOEの担当者に問い合わせましたが、回答は得られませんでした。これは、統合型Omni-Pathコントローラと6チャネルメモリも搭載可能なインテルのXeonスケーラブル・プロセッサを搭載するために設計されたLGA 3647ソケット・システムである可能性もありますが、もしかしたらそれ以上の何かかもしれません。

Astra - 初のペタスケール ARM スーパーコンピュータ

Astra - 初のペタスケール ARM スーパーコンピュータ

DOEは、ペタスケール級ARMベースのスーパーコンピュータとしては初となる、新しいAstraスーパーコンピュータの構築をほぼ完了させました。このスーパーコンピュータは、ラックあたり18台のクアッドノードHPE Apollo 70シャーシを搭載した36台の計算ラックを搭載しています。これは合計2,592台の計算ノードに相当します。

各ノードには、2.0GHzで動作する28コアのCavium Thunder-X2 ARM SoCが2基搭載されており、合計5,184個のCPUと145,152個のコアを備えています。各ソケットは8つのメモリチャネルをサポートし、ノードあたり合計128GBのメモリを搭載しています。これにより、合計容量は332TB、帯域幅は885TB/秒となります。

未完成のシステムではすでに1.5ペタFLOPSの壁を突破しており、完成すれば2.3ペタFLOPS以上に達すると予測されています。その他の注目すべき機能としては、送信データトラフィックを吸収する高価で複雑なバーストバッファを不要にする、244GB/秒のオールフラッシュストレージシステムがあります。

ARMベースのシステムでは当然のことながら、低消費電力が重要な考慮事項です。システムは36台のコンピューティングラックで1.2MWを消費しますが、高度な液体ベースのサーモサイフォンクーラーハイブリッドシステムにより、わずか12個のファンコイルで冷却します。

AMDのMilanがPerlmutterに電力を供給する

AMDのMilanがPerlmutterに電力を供給する

CrayのShastaスーパーコンピュータ(詳細はこちら)に注目するのに、それほど時間はかかりませんでした。この新しいシステムには、AMDの未発表EPYC Milanプロセッサが搭載されています。これはAMDの次世代データセンタープロセッサです。この新しいスーパーコンピュータは、NVIDIAの「Volta-Next」GPUも搭載し、この2つを組み合わせることでエクサスケールクラスのマシンが実現し、世界最速のスーパーコンピュータの一つとなるでしょう。

米国エネルギー省が開発中のPerlmutterスーパーコンピュータは、CPUノードとGPUノードの両方を搭載し、ここにはCPUノードが示されています。この水冷式筐体には、8基のAMD Milan CPUが搭載されています。Milanプロセッサを覆う4つの銅製ウォーターブロックに加え、DIMMスロット間のPCB上にさらに4基のプロセッサが逆さまに搭載されています。このシステムは究極のパフォーマンス密度を実現するように設計されているため、すべてのDIMMも水冷式です。

インテル、初のエクサスケール・スーパーコンピュータ「Aurora」に搭載

インテル、初のエクサスケール・スーパーコンピュータ「Aurora」に搭載

インテルと米国エネルギー省(DOE)は、持続的なエクサスケールコンピューティングが可能な世界初のスーパーコンピュータ「Aurora」を2021年にアルゴンヌ国立研究所に納入すると発表した。驚くべきことに、この発表には、インテルのまだリリースされていないXeグラフィックスアーキテクチャが、インテルのOptane Persistent DIMMや将来の世代のXeonプロセッサとともに、新システムの主要コンポーネントになるというニュースも含まれている。

インテルとパートナー企業のクレイは、毎秒100京回の演算(持続的)処理能力という比類のない性能を持つシステムを構築します。これは1兆兆回の演算に相当し、今日のハイエンドデスクトップPCの100万倍の速度に相当します。この新システムは、クレイのShastaシステム200台と「Slingshot」ネットワークファブリックで構成されています。

さらに重要なのは、このシステムがIntelのXeグラフィックス・アーキテクチャを採用していることです。Intelは発表の中で、Xeはコンピューティング機能に利用されると述べており、これは主にAIコンピューティングに利用されることを意味します。Auroraは、ストレージとしてもメモリとしても使用できる3D XPointを採用したIntelの「次世代」Optane DCパーシステント・メモリを搭載しています。これは、スーパーコンピュータクラスのシステムにIntelの新しいメモリが実装された初の事例となります。

DOE によると、新しいシステムは 2021 年初頭に「立ち上げ」られ、その年の終わりまでにエクサスケールの計算能力で完全にオンラインになる予定だという。

未来はエクサスケール

未来はエクサスケール

米国エネルギー省は、複数の施設で将来のスーパーコンピュータの導入を強力に計画しています。こちらに次世代スーパーコンピュータへのリンクを記載したリストがあります。

  • 2019年:NRELイーグル
  • 2020年: NERSC パールムッター
  • 2021年:ANLオーロラ
  • 2021年:LANL/サンディア・クロスロード
  • 2022年:ORNLフロンティア
  • 2023年:LLNLエルキャピタン

現在のページ: ページ 2

前のページ ページ 1

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。