98
HawkスーパーコンピュータにGPUインジェクションが導入される

近年、科学研究における高性能コンピューティング(HPC)の広範な導入により、かつてないスピードで科学が進歩しました。スーパーコンピュータは、科学者が現実世界で実験するよりもはるかに高速に様々なプロセスをシミュレーションしたり、実験不可能なプロセスを再現したりすることができます。しかし、シミュレーションは科学研究における唯一の効率的な方法ではなく、人工知能とディープラーニングによって大幅に強化することができます。そのため、シュトゥットガルトにある高性能コンピューティングセンターの科学者たちは、CPUのみを搭載したHawkスーパーコンピュータを今後数ヶ月以内にNVIDIAのA100 GPUにアップグレードする予定です。

シミュレーションを支援するディープラーニング

AIとDLアルゴリズムはシミュレーションの精度を提供するものではなく、シミュレーションに取って代わるものでもありません。しかし、大規模なデータセット内のパターンを迅速に特定し、実際の動作を近似する計算モデルを作成することは可能です。場合によっては、AIとDLを用いることで、科学的に正確でありながら何の成果も生まないシミュレーションを排除することができ、研究を大幅に加速させることができます。実際、多くの科学者は、AI/DLとシミュレーションを組み合わせることがスーパーコンピューティングの未来だと考えています。

HSLRのHawkがGPUを搭載へ

他の学術研究者と同様に、スーパーコンピュータセンターであるシュトゥットガルト高性能計算センター(HLRS)は、CPUベースのマシンによるHPCシミュレーションに依存してきました。今年は、AMD EPYC 7742を搭載したスーパーコンピュータ「Hawk」を導入しました。このスーパーコンピュータは、698,800コア、1,397,760GBのメモリを搭載し、Rmax Linpack性能で19,334 TFLOPSを達成しています。さらに、研究者たちは2019年からGPUベースのAIスーパーコンピュータの研究も行っており、60基のNVIDIA GPUを搭載したCray CS-Stormシステムを導入しました。 

鷹

(画像提供:シュトゥットガルトの高性能コンピューティングセンター)

どうやら HLRS の調査結果はかなり有望だったようで、今週、HLRS、Hewlett Packard Enterprise、および Nvidia は、HLRS が主要な Hawk スーパーコンピューターを 192 基の Nvidia A100 GPU を搭載した 24 台の HPE Apollo 6500 Gen10 Plus システムにアップグレードすると発表した。 

「HLRSにおける私たちの使命は、主に計算工学に重点を置く主要ユーザーコミュニティの最も重要なニーズに応えるシステムを提供することです」と、HLRS所長のマイケル・レッシュ工学博士は述べています。「長年にわたり、私たちの主力システムはCPUをベースに構築され、計算集約型のシミュレーションで使用されるコードをサポートしてきました。しかし近年、ディープラーニングや人工知能への関心が高まっており、これらはGPUでより効率的に動作します。Hawkのアーキテクチャにこの2つ目の主要プロセッサを追加することで、計算研究の最前線で研究に携わる学界や産業界の科学者をより一層サポートできるようになります。」 

HLRS 発表の重要な部分は、24 台の HPE Apollo 6500 Gen10 Plus システムを Hawk スーパーコンピューターと統合して、1 つのファイルシステムを持つハイブリッド マシンを構築し、Nvidia GPU で AI/DL アルゴリズムの両方を実行し、AMD の 64 コア CPU で従来の高精度シミュレーションを実行できるようにすることです。  

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

「HawkにNVIDIAのGPUが統合されれば、HPCとAIを組み合わせたハイブリッドワークフローの効率が大幅に向上します」と、HLRSで人工知能(AI)運用を率いるデニス・ホッペ氏は述べています。「データ転送やワークフローの異なる部分を別々の段階で実行する必要があることによる時間ロスは、実質的になくなります。ユーザーは、現在使用しているコンピューティングコアをそのまま使い、AIアルゴリズムを実行し、その結果を即座に統合できるようになります。」 

さらに、HLRS の Hawk のユーザーは、AI、DL、HPC ワークロード向けの GPU に最適化されたプログラムの Nvidia の NGC カタログにアクセスできるようになり、HLRS のクライアント間で GPU の使用が大幅に普及します。 

明日のスーパーコンピュータを今日

HPC対応シミュレーションは今後も衰えることはありません。なぜなら、実際の製品を開発したり、何かを非常に正確にモデル化したりする必要がある場合、現時点ではFP64計算に代わるものはないからです。NvidiaのA100やAMDのInstinct MI100などのGPUも、FP64精度でHPCワークロードを実行できるように設計されていますが、CPU向けに最適化されたアルゴリズムが既に多数存在するため、特に科学研究者にとって、GPUが汎用プロセッサを完全に置き換えることは当分ないでしょう。 

しかし、AIとディープラーニングをHPCシミュレーションの支援や高度化に活用することは、スーパーコンピューティングの世界における新たなトレンドになりつつあります。Hawkはヨーロッパ初のハイブリッド・スーパーコンピュータの一つとなるでしょうが、最終的にはこのようなシステムは大幅に普及するでしょう。 

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。