65
Nvidia Armスーパーチップ、バルセロナの1億6000万ドル規模のスーパーコンピューターに搭載

NVIDIAのGraceスーパーチップは、今年初めに発表された際に大きな話題を呼びました。同社は、高性能コンピューティング(HPC)分野におけるIntelとAMDのx86優位に挑むことができる、強化されたArmベースの製品を約束していました。そして今、HPC Wireの報道によると、同社はEuroHPCのスーパーコンピューティング・プロジェクトの一つに、スーパーコンピューティング・ハードウェアの頭脳と性能を提供するため、1億6000万ドル(約1億5100万ユーロ)の契約を獲得しました。MareNostrum 5(MareNostrumは「私たちの海」と大まかに訳されます)は、スペインのバルセロナ・スーパーコンピューティング・センター(BSC)に設置され、早ければ2023年に稼働開始予定です。

Mare Nostrum 5はEuroHPC JUプロジェクトの一環として構築されており、CPUアクセラレータとGPUアクセラレータの両方で314ペタフロップスのFP64演算能力のピーク性能を提供する予定です。また、アクセス中のワークロード用に200ペタバイトのストレージと、さらに400ペタバイトのコールドストレージを備えています。EuroHPCプロジェクト全体のHPCアーキテクチャ設計やその他のプロジェクトのトレンドに従い、200ペタバイトのノードは高速なNANDベースのストレージサブシステムに保持され、コールドストレージノード(アクティブストレージとも呼ばれ、重要だが頻繁にアクセスされないデータを指す)には、よりコスト効率の高い従来のHDDトポロジが使用される見込みです。

エヌビディア・グレース

NvidiaのデュアルGraceスーパーチップボード設計。TSMCの5nm製造プロセスをベースにしたGraceは、PCIe Gen 5.0、DDR5、HBM3、CCIX 2.0、CXL 2.0といった最新の接続技術をすべてサポートしています。(画像提供: Nvidia)

このシステムは、NVIDIAの144コアArmベースGrace「スーパーチップ」をデュアルチップ構成で採用し、同社のH100(Hopper)ディスクリートGPUアクセラレータ(800億個のトランジスタを搭載し、80GBのHBM3メモリと3.2TB/秒の帯域幅を誇ります)と組み合わせます。その結果、MareNostrum 5は18エクサフロップス以上のAIアクセラレーション(通常はFP8 8ビット浮動小数点演算)を実現すると予測されており、欧州連合(EU)最速のAIスーパーコンピュータとなります。NVIDIAのチップ技術に加え、同社のQuantum-2(別名NDR)InfiniBandソフトウェア定義ネットワークは、同社のBlueFieldデータ処理ユニット(DPU)を活用し、すべてのコンポーネントを低遅延で400GB/秒の高スループットで通信させます。これは、CrayのSlingshotインターコネクトが達成するパフォーマンスに匹敵します。

The Next Platformの推測によると、MareNostrum 5は最大4,500個の「Hopper」H100アクセラレータを搭載し、チップのTensorコアにより約270ペタフロップスのFP64性能を実現するとされています。残りの44ペタフロップスのFP64性能は、デュアルGrace CPUシステムから得られると予想されており、同誌はGraceチップ1個あたり3.84テラフロップスと推定しています。つまり、デュアルGraceモジュールは合計約5,730個になると考えられます。

MareNostrum 5は、特に医学研究、化学シミュレーション、医薬品開発を対象としており、気候科学や環境工学などのアプリケーションもサポートしています。NVIDIAのOmniverseソフトウェアパッケージは、これらのアプリケーション向けのデジタルツインの開発を加速させ、産業規模の資産やプロセスの大規模かつ物理的に正確なシミュレーションを可能にします。このデジタルツイン技術は、自律システムと現実世界のリアルタイムデータストリームの統合を可能にし、シミュレーション、出力、そしてシミュレーションモデルのオンザフライ更新という循環的なフィードバックシステムを実現します。

「MareNostrum 5の買収により、デジタルツインの構築など、世界を変えるような科学的ブレークスルーが実現し、気候変動や精密医療の進歩といった地球規模の課題の解決に貢献するでしょう」と、 BSCのディレクターであるマテオ・バレロ氏は述べています。「さらに、BSCは、次世代スーパーコンピュータに使用される欧州製ハードウェアの開発と、EU加盟国の技術主権の確立に貢献することに尽力しています。」

さらに、ヨーロッパ全土に設置されている最新世代のスーパーコンピューターと同様に、MareNostrum 5 は完全に再生可能エネルギーで稼働し、余剰熱は、行き先もなくただ排出されるのではなく、再利用されます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

現時点では、余剰熱がどのように(そしてどの程度の割合で)再利用されるのかは不明です。おそらく、ヨーロッパのスーパーコンピューティング分野のリーダーである、フィンランドのカヤーニに設置され、AMDのプロセッサのみを搭載したLUMIスーパーコンピュータと同じ設計原理に従うと思われます。LUMIは、廃熱の20%を周辺の民間地区に再利用することで、暖房のためのエネルギー消費をさらに削減しています。

Francisco Pires 氏は、Tom's Hardware のフリーランス ニュース ライターであり、量子コンピューティングに関心を持っています。