エヌビディアは本日、69億ドルでのメラノックス買収が中国の独占禁止当局による最終難関をクリアし、4月27日までにこのネットワーク大手の経営権を掌握する道が開かれたと発表した。データセンターにおけるGPU駆動型AIおよびコンピューティングワークロードでは圧倒的な市場プレゼンスを誇るものの、目立ったエクサスケールの新規契約を獲得できていないエヌビディアにとって、今回の買収はHPCおよびスーパーコンピュータ分野におけるプレゼンス強化につながる可能性がある。一方、インテルとAMDは、米国エネルギー省(DoE)が開発する次世代の世界をリードするスーパーコンピュータに選定されている。
Mellanox は、データセンター向け Ethernet および InfiniBand 製品で圧倒的な存在感を示していることで知られているため、今回の買収によって Nvidia のポートフォリオが多様化するのは明らかですが、表面上に見える以上の相乗効果も生み出されます。
GPU などのアクセラレータを、膨大な数のスーパーコンピュータ ノードにまたがる 1 つのシームレスなアーキテクチャに結び付けることは、許容可能な電力しきい値と物理的フットプリント内でエクサスケール クラスのパフォーマンス レベルを達成するための必勝法ですが、AMD と Intel がこれらの相互接続された設計の戦いに勝利しているようです。
AMDとIntelは、CPUとGPUの両方を自社で製造しているため、専用設計により、Nvidiaよりもはるかに洗練された方法でCPUとGPUを連携させることができます。AMDは米国エネルギー省(DoE)とのエクサスケール契約3件のうち2件を獲得していますが、Frontierシステムは2021年に最初に導入される予定です。この1.5エクサフロップスのシステムは、AMDのEPYC Rome CPUとRadeon Instinct GPUを搭載しますが、最近、CPUとGPUはInfinity Fabricを介してメモリコヒーレンスをサポートすることが明らかになりました。
CPUとGPU間のメモリコヒーレンスにより、データ移動が削減され、パフォーマンスが向上し、レイテンシが低減し、ワット当たりの性能が向上します。また、プログラミング要件も緩和されます。繰り返しになりますが、NVIDIAはプロセッサを設計していないため、この機能を現時点では提供していません。ただし、NVIDIAはCXL仕様を採用しており、将来のリビジョンではこの機能が採用される予定です。ただし、この仕様はPCIe 5.0が市場に登場するまで実現しません。
しかし、もう一つ興味深い情報があります。HPE傘下のCrayは、すべてのエクサスケール・スーパーコンピューターのシャーシとSlingshotネットワークファブリックを設計しており、最先端のシステムとネットワーク設計により、HPC市場をほぼリードしています。Crayは、先日開催されたRice Oil and Gas HPC Summitでのプレゼンテーションで、以下のスライドに示すような興味深い情報を明らかにしました。
左下隅のブロックは、Nvidiaの次期スーパーコンピュータ設計を表しています。Perlmutterスーパーコンピュータには、CrayのShastaブレードとSlingshotネットワークが採用されています。ここでは、2021年春に稼働予定のこのプレエクサスケールシステムを動かすNvidia Volta Next GPUが確認できます。つまり、これはNvidiaの最新の設計です。GPUはEPYC Rome CPUに接続されたファブリック上に配置されていますが、上部の「To Slingshot」マークは、ネットワークトラフィックがCPUに送られ、そこからGPUに送られることを示しています。Slingshotは、Crayが高度にスケーラブルなスーパーコンピュータ開発で成功を収めた鍵となる、イーサネットベースのファブリックです。スーパーコンピュータ内で驚異的な速度で送受信されるネットワークデータは、Nvidia GPUに到達する前にCPUを通過する必要があります。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
対照的に、右下隅はFrontierスーパーコンピューターを支えるAMDの次世代アーキテクチャを表しています。ここでは、SlingshotネットワークファブリックがEPYC Milan CPUに一切触れず、GPUに直接接続されていることがわかります。つまり、これらのアクセラレータは、EPYCプロセッサとのメモリコヒーレンスを提供するファブリックを占有することなく、より高いスループットとネットワークへの低レイテンシを実現します。
RDMAのようなネットワーク技術はCPUを介さずに演算コアを介さずに直接メモリアクセスを提供しますが、NVIDIAの設計では、データは依然としてセカンダリファブリックを経由して流れる必要があります。高帯域幅ネットワーク接続をGPUに直接接続することで実現される機能に代わるものはなく、少なくとも概念的にはAMDの実装の方が優れていると言えるでしょう。AMDの設計が1.5エクサフロップスまでスケールアップするのに対し、PerlmutterのNVIDIAの設計が100ペタフロップスに達するのは、おそらく偶然ではないでしょう。
そのため、Nvidiaが豊富なIP資金を持つネットワークリーダーであるMellanoxを買収することで、Nvidiaは今回のようなより緊密な統合を実現するための技術にアクセスできるようになる可能性があります。確かに、Nvidiaは自社のNVSwitchという優れたスイッチング技術を有しており、同社が「世界最大のGPU」と呼ぶものを動かしていますが、このインターフェースは主にGPU間の転送を目的として設計されています。言うまでもなく、Mellanoxの長年にわたるネットワークとトポロジーに関する経験は、NVSwitchの将来のバージョンアップにも役立つでしょう。
しかし、AMDとIntelも黙って見ているわけではありません。AMDの次世代EPYC Genoa CPUとRadeon Instinct CPUは、世界最速スーパーコンピューターとなる2エクサフロップスのEl Capitanの基盤となり、さらに洗練された第3世代Infinityアーキテクチャを搭載しています。ここでも、CPUとGPUの驚異的な統合が不可欠です。図には、メッシュ/トーラス型のトポロジで接続された8つのGPUがCPUに接続されています。このアーキテクチャが8つのGPUそれぞれに直接ネットワーク接続されたら、どれほどの可能性が生まれるか想像してみてください。
画像
1
の
2

Intelも同じ道を歩んでいます。Intelのまだ実証されていないPonte Vecchio GPUは、新しいXEメモリファブリックと「Rambo Cache」を組み合わせた、相互接続された新しいノード設計を採用しており、CPUとGPUを単一のコヒーレントなメモリ空間に統合します。この設計は、1エクサフロップスのAuroraスーパーコンピュータの基盤となります。
一方、NVIDIAはCPUとGPUの両方を製造していないため、スーパーコンピュータ分野で苦戦する可能性がある。そのため、CPUとGPUの両方を製造しておらず、同等のレベルの統合を実現できないからだ。許容できる電力範囲でエクサスケールクラスの性能を達成するには、この種のアーキテクチャとその基盤となる統合プログラミングモデルが必要なのだろうか?これは未解決の問題だが、AMDとIntelは共に米国エネルギー省のエクサスケールクラス・スーパーコンピュータ向けに非常に重要な契約を獲得している(より広範なサーバーエコシステムでは、勝利したHPC技術がしばしば採用されている)。しかし、NVIDIAはHPCおよびデータセンター分野におけるGPUアクセラレーションコンピューティングで圧倒的な地位を占めているにもかかわらず、こうした契約獲得について何ら発表していない。
そのため、NVIDIAはGPUコンピューティングにおける優位性を補完するため、より包括的なラックレベルアーキテクチャへの展開を進めると予想されます。Mellanoxは、開発中のチップレットベースのSpectrum-3シリーズなど、有望な新製品を多数保有しています。また、NVIDIAによる最近のSwiftStackの買収(買収額は非公開)は、大規模AIシステムを実現する補完的なストレージソフトウェアの可能性を切り開きます。このオブジェクトベースストレージ企業は、AIワークロードに使用される大規模なネットワーク接続型データリポジトリに関する豊富な経験を有しており、これはNVIDIAの急成長中のポートフォリオと非常によく合致しています。
業界では、NVIDIA に残された唯一の選択肢は自社製 CPU を展開することだという憶測が飛び交っています。ARM はどうでしょうか?
Nvidiaは4月27日にMellanoxを買収する予定だ。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。