IntelはHot Chips 34で、同社のPonte Vecchio Xe-HPC GPUの詳細を発表しました。提供されたベンチマークによると、Ponte VecchioはNvidia A100と比較して最大2.5倍の性能を発揮するとされています。しかし、ベンダーが提供するベンチマーク結果は鵜呑みにしないようにしましょう。
Ponte Vecchioは、Intelが選定した複数のベンチマークにおいて、A100を大幅に上回る性能を示しました。Intelのこの高性能CPUは、miniBUDEで2倍、ExaSMRで1.5倍の差をつけて記録しました。Ponte Vecchioはまだ発売されていないのに、A100(Ampere)は2020年から市場に出回っていることを考えると、これは興味深い比較です。さらに、AMDのInstinct MI250X(Aldebaran)はA100の3倍の速度があると報告されていることも忘れてはなりません。つまり、IntelはAMDとNvidiaの次世代HPC製品を警戒すべきでしょう。
Intelの発表が正確であれば、Ponte VecchioはNvidiaの次世代H100(Hopper)の潜在的競合となる可能性があります。現時点で判明している仕様に基づくと、H100はA100の少なくとも2倍の速度を発揮するはずです。さらに注目すべきは、AMDのInstinct MI300です。Zen 4 CPUとCDNA 3 GPUチップレットを1つの製品に統合しています。世界初のデータセンターAPUと称されるInstinct MI300は、Instinct MI250Xと比較してAIトレーニング性能が8倍向上するとAMDは主張しています。
画像
1
の
4

Ponte Vecchioは、OAM、Xeリンク搭載x4サブシステム、そしてデュアルソケットSapphire Rapidsプラットフォーム上のXeリンク搭載x4サブシステムの3種類で提供されます。残念ながら、Sapphire Rapidsは度重なる遅延に見舞われ、もはや笑い事ではありません。さらなる遅延がなければ、一部のSapphire Rapids製品は10月にようやく発売される可能性があります。ただし、量産チップの登場は2023年2月になるかもしれません。
OAMフォームファクタのPonte Vecchioは、4GPUプラットフォームと8GPUプラットフォームの両方をサポートします。2スタック構成のPonte Vecchioは、FP32とFP64でそれぞれ52TFLOPSの性能を発揮します。比較のために、H100 SXM5モジュール1台では、FP32で60TFLOPS、FP64で30TFLOPSの性能を発揮します。
Ponte Vecchioは64MBのレジスタファイルを搭載し、最大419TBpsの帯域幅を出力します。L1キャッシュとL2キャッシュはそれぞれ64MBと408MBです。Ponte Vecchioの大容量L2キャッシュは、2D-FFTやDNNといった特定のワークロードにメリットをもたらします。プレゼンテーションでは、Intelの実験結果から、どちらのシナリオにおいても80MBから408MBへの変更で大幅なパフォーマンス向上が明らかになりました。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Zhiye Liuは、Tom's Hardwareのニュース編集者、メモリレビュアー、そしてSSDテスターです。ハードウェア全般を愛していますが、特にCPU、GPU、そしてRAMには強いこだわりを持っています。