27
スーパーコンピュータの23年間の進化

2003年6月: ASCI QとAlpha EV6

侵入者:システムX、別名ビッグマック

2003年の夏、バージニア工科大学は公共のコンピュータを用いて「低価格」スーパーコンピュータを構築することを決定しました。System X(当時はBig Macと呼ばれていました)は、1100台のApple PowerMac G5システムで構成され、各システムは2.3GHzのPowerPC 970 CPUを2基搭載し、単一のシステムとして動作していました。Big Macの構築にはわずか3ヶ月かかり、費用は520万ドルでした。これは、4億ドルの地球シミュレータよりもはるかに安価でした。2003年11月、Big MacはTOP500で3番目に高速なスーパーコンピュータにランクインし、Linpackで10.3 TFlopsの処理能力を実証しました。Big Macは2004年にPowerMacをXserveに交換し、処理能力は12.25 TFlopsに向上しました。


詳細: 最高のCPU


詳細: すべてのCPUコンテンツ

2004年11月:ブルージーン/L

2004年9月、地球シミュレータはついにIBMのBlueGene/Lに敗北しました。BlueGene/Lは開発中に36TFlopsの性能を達成していましたが、2004年11月に完成すると70.7TFlopsとなり、地球シミュレータの2倍の性能となりました。2005年6月、BlueGene/Lは拡張され、Linpackで136.8TFlopsという驚異的な性能を達成しました。これは地球シミュレータのほぼ4倍に相当します。BlueGene/Lは、100TFlopsの壁を突破した最初のスーパーコンピュータとなりました。

この記録を達成するために、IBMは700MHzのクロックで動作するPowerPC 440プロセッサを65,536個使用しました。使用されたプロセッサは比較的高性能とは言えませんでしたが、小型で消費電力が比較的少なかったため、IBMは2つのプロセッサを小型カード(上図)にまとめて搭載し、ラック内のマザーボードに差し込むことができました。BlueGene/Lは優れた性能を示し、Linpackで理論上の電力の75%に達しました。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

2006年6月: BlueGene/L 2.0

2005年後半、ローレンス・リバモア国立研究所のBlue Gene/Lはプロセッサ数を倍増させ、131,072基に増強しました。その結果、BlueGene/L 2.0はTOP500で圧倒的な1位を獲得しました。Linpack環境では、BlueGene/Lは280.6 TFLOPSの性能を記録しました。IBMが採用した小型で省電力なチップのおかげで、この構成のBlueGene/Lの消費電力はわずか1.2 MWでした。

当時、100TFlopsを超えたスーパーコンピュータはBlueGene/Lのみで、TOP500で2位だったマシンは91.3TFlopsを記録しました。また、2006年6月には、フランスのスーパーコンピュータTera 10がLinpackで42.9TFlopsを記録し、6位にランクインしたことにも注目してください。

2007年6月:ジャガー

Blue Gene/Lはその後2年間、最速スーパーコンピュータの座を維持しました。他のシステムはBlue Gene/Lの性能に匹敵するものはありませんでしたが、他のスーパーコンピュータは徐々にその性能に近づき、100TFlopsの大台を突破しました。2007年6月には、Jaguar(第2位)とRe Storm(第3位)がともに100TFlopsを突破しました。2005年から継続的にアップデートされてきたJaguarは、Cray XT3およびXT4サーバーで構成されていました。これらのシステムはOpteronデュアルコア2.6GHzプロセッサを搭載していたため、AMDがビッグリーグに参入したことになります。当時、Jaguarは合計23,016個のコアを搭載し、Linpackで101.7TFlopsを達成しました。

2008年6月: ロードランナー

ビープ!ビープ!2008年6月、IBMはBlueGene/Lの後継機としてIBM Roadrunnerを発表しました。このスーパーコンピュータは、ペタフロップスの閾値を突破した史上初のスーパーコンピュータであり、その愛称にふさわしいものでした。また、2つの大きく異なるプロセッサアーキテクチャを活用した初のハイブリッドスーパーコンピュータとして、技術的なブレークスルーも達成しました。

ロードランナーには、IBMとAMDのプロセッサに分割された合計122,400個のコアが搭載されていました。6,562個のAMD64 Opteronデュアルコアプロセッサは1.8GHzで動作し、従来のx86ソフトウェアを処理できました。各Opteronコアは、1つのPPEと8つのSPEで構成される、3.2GHzで動作するPowerXCell 8i 3200コア1個とペアになっていました。これらのIBMプロセッサは、Xbox 360やPlayStation 3に使用されているプロセッサと関連しています。この構成では、PowerXCell 8iプロセッサはコプロセッサとして使用され、Opteronコアはこれを利用して追加の処理能力を得ることができました。ロードランナーの理論上の累積処理能力は1.38PFlopsでした。Linpackによるパフォーマンスは1.03PFlopsに達し、TOP500でトップにランクインしました。

ハイブリッドアーキテクチャの利点の一つは、優れたエネルギー効率でした。Roadrunnerの消費電力はわずか2.35MWで、437MFLOPS/Wの性能を発揮しました。システムの重量は227トンで、ロスアラモス研究所の483平方メートルの設置面積を占めました。

2009年6月: ロードランナー

先行するASCI RedやBlueGene/Lと同様に、Roadrunnerは数ヶ月にわたりTOP500の首位を維持し、その後もアップデートを重ねて計算能力を向上させました。2008年11月には、コンピューティングコアの総数が129,600に増加し、Linpackによるパフォーマンスは1.1PFlopsにまで飛躍しました。

このわずかな性能向上は、Roadrunnerが世界最速スーパーコンピュータの座を維持するのに十分でした。次点は、旧型のXT3およびXT4システムの代わりにCray XT5サーバーを搭載した改良版Jaguarで、Linpackで1.059PFlopsを達成していました。1ペタフロップスを超える計算能力を持つスーパーコンピュータは、JaguarとRoadrunnerの2つだけでした。

2010年6月:ジャガー3.0

2009年11月、JaguarはついにRoadrunnerを追い抜き、世界最速スーパーコンピュータの座に就きました。このスーパーコンピュータは、Crayサーバーの2つの「パーティション」で構成されていました。旧セクションは7,832台のCray XT4サーバーで構成され、各サーバーには2.1GHzのクアッドコアOpteron 1354 Budapestプロセッサが搭載されていました。新セクションは18,868台のCray XT5サーバーで構成され、各サーバーには2.6GHzのヘキサコアOpteron 2435 Istanbulプロセッサが搭載されていました。

理論上の消費電力は2.33 PFlopsと推定され、Linpackでは1.76 PFlopsという結果でした。Roadrunnerとは異なり、Jaguarは特にエネルギー効率が高くなく、消費電力は約7 MW(253 MFlops/W)でした。

2010年:中国がGPUパワーで競争に参入

2010年、中国は2台のスーパーコンピュータで世界最速を目指して競争に参入しました。2010年6月、NebulaeはTOP500スーパーコンピュータの中で最高の理論性能(推定2.98PFlops)を誇りましたが、Linpackを用いた実世界性能はJaguarを下回りました。その後、2010年11月、Tianhe-1AがJaguarとNebulaeの両方を追い抜き、理論性能とLinpack性能の両方でトップに躍り出ました。

このシステムは理論上 4.7 PFlops の性能を発揮できましたが、Linpack では 2.57 PFlops にしか達しませんでした。

Tianhe-1AとNebulaeはどちらも、汎用処理用のGPUの利用により、その処理能力の大部分を獲得しています。Roadrunnerと同様に、これらのシステムはx86 Intel Xeon X5600プロセッサ(NebulaeはX5650、Tianhe-1AはX5670)とNVIDIA Tesla GPU(NebulaeはC2050、Tianhe-1AはM2050)を組み合わせているため、ハイブリッド・スーパーコンピュータとみなされています。これにより、GPGPUの認知度が高まりました。

このハイブリッド構成の結果、これらの中国製スーパーコンピュータは優れた効率性を示しました。天河1Aはわずか4MWの消費電力で、ワットあたり640MFlopsの性能を達成しました。

2011年6月: 京コンピュータ

2011年6月、日本は理化学研究所計算科学研究所に設置された富士通の「京」コンピュータによって性能の王座を獲得しました。

富士通の「京」コンピュータは、理論上の性能に比較的近い実世界性能を示した数少ないマシンの一つです。このシステムは、68,544基のSPARC64 VIIIfxオクタコアプロセッサで構成され、合計548,352個のコアを備えています。天河1Aとは異なり、GPGPUにGPUは依存していません。8.16PFLOPSの計算能力を発揮しました。

京スーパーコンピュータは天河1Aよりも大幅に高速でしたが、消費電力も大幅に増加し、天河1Aの4,000kWに対して9,899kWでした。そのため、効率は天河1Aよりも著しく悪く、富士通がコア数を増やして京コンピュータのコア数を705,024にまで増やしても、消費電力は12,650kWを超え、問題は改善されませんでした。

2011 年 6 月は、TOP500 にとってもう一つの重大な出来事の月となりました。初めて、世界のトップ 10 のスーパーコンピュータが 1 ペタフロップスを超える計算能力を獲得したのです。

マイケル・ジャスティン・アレン・セクストンは、Tom's Hardware USの寄稿ライターです。CPUとマザーボードを専門に、ハードウェアコンポーネントのニュースを執筆しています。